特表2022-516446 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ バイオブロックスエイビーの特許一覧 ▶ ハーゲマン－イェンゼン，マイケルの特許一覧 ▶ ファリダニ，オミッドの特許一覧

特表2022-516446相補的ＤＮＡを調製するための方法およびキット

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
2
3
4
5
6
7
8
9a
9b
9c
9d
9e
9f
9g
9h
10
11
12
13a
13b
13c
13d
13e
13f
13g
13h
13i
13j
13k
14
15
16
17a
17b
17c
17d
17e
17f
17g
17h
17i
17j
18a
18b
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-02-28

(54)【発明の名称】相補的ＤＮＡを調製するための方法およびキット

(51)【国際特許分類】

C12Q 1/6806 20180101AFI20220218BHJP

C12Q 1/6844 20180101ALI20220218BHJP

C12Q 1/6869 20180101ALI20220218BHJP

C12Q 1/6876 20180101ALI20220218BHJP

C12N 15/11 20060101ALN20220218BHJP

【ＦＩ】

C12Q1/6806 Z ZNA

C12Q1/6844 Z

C12Q1/6869 Z

C12Q1/6876 Z

C12N15/11 Z

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2021536408

(86)(22)【出願日】2019-12-27

(85)【翻訳文提出日】2021-06-21

(86)【国際出願番号】 IB2019001386

(87)【国際公開番号】W WO2020136438

(87)【国際公開日】2020-07-02

(31)【優先権主張番号】1851672-4

(32)【優先日】2018-12-28

(33)【優先権主張国・地域又は機関】SE

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＴＷＥＥＮ

(71)【出願人】

【識別番号】521271657

【氏名又は名称】バイオブロックスエイビー

(71)【出願人】

【識別番号】521271668

【氏名又は名称】ハーゲマン－イェンゼン，マイケル

(71)【出願人】

【識別番号】521271679

【氏名又は名称】ファリダニ，オミッド

(74)【代理人】

【識別番号】100114557

【弁理士】

【氏名又は名称】河野英仁

(74)【代理人】

【識別番号】100078868

【弁理士】

【氏名又は名称】河野登夫

(72)【発明者】

【氏名】ハーゲマン－イェンゼン，マイケル

(72)【発明者】

【氏名】ファリダニ，オミッド

(72)【発明者】

【氏名】サンドベリ，リカード

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA13

4B063QQ42

4B063QQ52

4B063QR08

4B063QR32

4B063QR55

4B063QR62

4B063QS25

4B063QS28

4B063QX02

(57)【要約】

ｃＤＮＡは、ｃＤＮＡ合成プライマーをＲＮＡ分子にハイブリダイズし、ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖を合成して、ＲＮＡ－ｃＤＮＡ中間体を形成することによって調製される。テンプレートスイッチング反応は、テンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）をテンプレートとして使用してｃＤＮＡ鎖の伸長に適した条件下でＲＮＡ－ｃＤＮＡ中間体をＴＳＯと接触させることにより実行し、ＲＮＡ分子およびＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成する。ＴＳＯは、増幅プライマー部位、識別タグ、ＵＭＩ、および複数の事前定義ヌクレオチドを含む。

【特許請求の範囲】

【請求項1】

相補的デオキシリボ核酸（ｃＤＮＡ）を調製するための方法であって、
ｃＤＮＡ合成プライマーをリボ核酸（ＲＮＡ）分子にハイブリダイズし、前記ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖を合成して、ＲＮＡ－ｃＤＮＡ中間体を形成すること、および
テンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）をテンプレートとして使用して前記ｃＤＮＡ鎖の伸長に適した条件下で前記ＲＮＡ－ｃＤＮＡ中間体を前記ＴＳＯと接触させることによりテンプレートスイッチング反応を実行し、前記ＲＮＡ分子および前記ＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成することであって、前記ＴＳＯは、増幅プライマー部位、識別タグ、固有分子識別子（ＵＭＩ）、および複数の事前定義ヌクレオチドを含む、形成すること
を含む、方法。

【請求項2】

前記ｃＤＮＡ合成プライマーをハイブリダイズすることは、前記ｃＤＮＡ合成プライマーを前記ＲＮＡ分子にハイブリダイズし、逆転写によって前記ｃＤＮＡ鎖を合成して、前記ＲＮＡ－ｃＤＮＡ中間体を形成することを含み、
前記テンプレートスイッチング反応を実行することは、逆転写による前記ｃＤＮＡ鎖の伸長に適した条件下で前記ＲＮＡ－ｃＤＮＡ中間体を前記ＴＳＯと接触させて前記伸長ｃＤＮＡ鎖を形成することによって、前記テンプレートスイッチング反応を実行することを含む、請求項１に記載の方法。

【請求項3】

前記逆転写は、リボヌクレオチド、好ましくはグアニンリボヌクレオチドの存在下で、０．０５ｍＭから１０ｍＭの間隔内、好ましくは０．１ｍＭから３ｍＭの間隔内で選択される濃度で行われる、請求項２に記載の方法。

【請求項4】

前記逆転写は、ｄＡＴＰ、ｄＧＴＰ、ｄＴＴＰおよびｄＣＴＰの混合物の存在下で行われ、
前記混合物は、同じ濃度のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰと、前記同じ濃度のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰよりもＸｍＭ高い濃度のｄＣＴＰとを含み、
前記ＸｍＭは、０．０５ｍＭから１０ｍＭの間隔内、好ましくは０．１ｍＭから３ｍＭの間隔内で選択される、請求項２または３に記載の方法。

【請求項5】

前記逆転写は、０．１ｍＭから２０ｍＭの間隔内、好ましくは１ｍＭから１０ｍＭの間隔内、より好ましくは２ｍＭから５ｍＭの間隔内で選択される濃度のマグネシウム塩の存在下で行われる、請求項２から４のいずれかに記載の方法。

【請求項6】

前記逆転写は、塩化ナトリウム（ＮａＣｌ）、塩化セシウム（ＣｓＣｌ）、およびそれらの混合物からなる群から選択される塩化物塩の存在下で行われ、少なくとも減量された塩化カリウム（ＫＣｌ）で行われる、請求項２から５のいずれかに記載の方法。

【請求項7】

前記逆転写は、３００Ｄａから１００，０００Ｄａの間隔内、好ましくは１，０００から２５，０００Ｄａの間隔内、より好ましくは８０００Ｄａなどの７，０００Ｄａから９，０００Ｄａの間隔内で選択された平均分子量を有するポリエチレングリコール（ＰＥＧ）の存在下で行われる、請求項２から６のいずれかに記載の方法。

【請求項8】

前記増幅プライマー部位は、トランスポザーゼ５（Ｔｎ５）モチーフ配列の一部、好ましくはＡＧＡＧＡＣＡＧを含む、請求項１から７のいずれかに記載の方法。

【請求項9】

前記識別タグは、前記ＲＮＡ分子が由来する細胞のトランスクリプトームに存在しないヌクレオチド配列、好ましくはＡＴＴＧＣＧＣＡＡＴＧ（ＳＥＱＩＤＮＯ：３）を含む、請求項１から８のいずれかに記載の方法。

【請求項10】

前記複数のヌクレオチドは、３つのリボヌクレオチド、好ましくは３つのグアニンリボヌクレオチドである、請求項１から９のいずれかに記載の方法。

【請求項11】

前記ｃＤＮＡ合成プライマーは、オリゴｄＴプライマー、好ましくは固定されたオリゴｄＴプライマーであり、より好ましくは５’末端から３’末端まで、プライマー部位、Ｔ_ｐ、Ｖ、およびＮを含み、ここで、Ｖは、Ａ、ＣおよびＧからなる群から選択され、Ｎは、Ａ、Ｃ、ＧおよびＴからなる群から選択され、ｐは、１０から５０、好ましくは１５から４５、より好ましくは３０などの２０から４０の間隔内で選択される正の数である、請求項１から１０のいずれかに記載の方法。

【請求項12】

前記プライマー部位は、前記ＲＮＡ分子が由来する細胞のトランスクリプトームに存在しないヌクレオチド配列を含み、好ましくは、ＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡ（ＳＥＱＩＤＮＯ：５）を含む、請求項１１に記載の方法。

【請求項13】

前記ｃＤＮＡ合成プライマーをハイブリダイズすることは、複数のＲＮＡ分子の各ＲＮＡ分子について、前記ｃＤＮＡ合成プライマーを前記ＲＮＡ分子にハイブリダイズし、前記ＲＮＡ分子の少なくとも一部に相補的なそれぞれのｃＤＮＡ鎖を合成して、それぞれのＲＮＡ－ｃＤＮＡ中間体を形成することを含み、
前記テンプレートスイッチング反応を実行することは、それぞれのＴＳＯをテンプレートとして使用して前記それぞれのｃＤＮＡ鎖の伸長に適した条件下で前記それぞれのＲＮＡ－ｃＤＮＡ中間体を前記それぞれのＴＳＯと接触させて、前記ＲＮＡ分子および前記それぞれのＴＳＯの少なくとも一部に相補的なそれぞれの伸長ｃＤＮＡ鎖を形成することによって前記テンプレートスイッチング反応を実行することを含み、各ＴＳＯは、前記増幅プライマー部位、前記識別タグ、ＵＭＩおよび前記複数の事前定義ヌクレオチドを含み、各ＴＳＯは前記ＴＳＯに固有で他のＴＳＯのＵＭＩとは異なるＵＭＩを含む、請求項１から１２のいずれかに記載の方法。

【請求項14】

順方向プライマーおよび逆方向プライマーを使用して前記伸長ｃＤＮＡ鎖を増幅することをさらに含み、
前記順方向プライマーは、好ましくは前記増幅プライマー部位および前記識別タグを含み、より好ましくは５’末端から３’末端まで、トランスポザーゼ５（Ｔｎ５）モチーフ配列および前記識別タグを含み、例えば、ＴＣＧＴＣＧＧＣＡＧＣＧＴＣＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧＡＴＴＧＣＧＣＡＡＴＧ（ＳＥＱＩＤＮＯ：６）を含み、
前記逆方向プライマーは、好ましくはＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡ（ＳＥＱＩＤＮＯ：５）を含む、請求項１から１３のいずれかに記載の方法。

【請求項15】

前記伸長ｃＤＮＡ鎖の増幅は、前記逆転写およびテンプレートスイッチング反応として同時に行われる、請求項１４に記載の方法。

【請求項16】

トランスポザーゼおよび少なくとも１つのタグ付けアダプターを使用してタグ付けされたｃＤＮＡフラグメントを形成するタグ付けプロセスにおいて、前記伸長ｃＤＮＡ鎖またはその増幅バージョンをフラグメント化およびタグ付けすることをさらに含む、請求項１から１５のいずれかに記載の方法。

【請求項17】

順増幅プライマーおよび逆増幅プライマーの存在下で、前記タグ付けされたｃＤＮＡフラグメントを増幅することをさらに含む、請求項１６に記載の方法。

【請求項18】

少なくとも１つのシーケンシングプライマーの追加によって、前記増幅されたタグ付きｃＤＮＡフラグメントをシーケンシングすることをさらに含む、請求項１７に記載の方法。

【請求項19】

請求項１６から１８のいずれかに記載の、好ましくは単一細胞の、ＲＮＡ分子からタグ付きｃＤＮＡフラグメントを調製すること、および
前記伸長ｃＤＮＡ鎖の５’末端部分に対応する前記タグ付きｃＤＮＡフラグメントのパーセンテージを調整すること
を含む、ｃＤＮＡライブラリを調製するための方法。

【請求項20】

前記パーセンテージを調整することは、
請求項１６から１８のいずれかに記載の前記タグ付けプロセスに存在するトランスポザーゼの量を制御すること、
請求項１６から１８のいずれかに記載の前記タグ付けプロセスに存在する前記伸長ｃＤＮＡ鎖またはその増幅バージョンの量を制御すること、および／または
請求項１６から１８のいずれかに記載の前記タグ付けプロセスの反応時間を制御すること
を含む、請求項１９に記載の方法。

【請求項21】

相補的デオキシリボ核酸（ｃＤＮＡ）を調製するためのキットであって、
リボ核酸（ＲＮＡ）分子にハイブリダイズして、前記ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖の合成を可能にして、ＲＮＡ－ｃＤＮＡ中間体を形成するように構成されたｃＤＮＡ合成プライマー、および
増幅プライマー部位、識別タグ、固有分子識別子（ＵＭＩ）、および複数の事前定義ヌクレオチドを含むテンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）
を含み、
前記ＴＳＯは、前記ｃＤＮＡ鎖の伸長を含むテンプレートスイッチング反応においてテンプレートとして機能して、前記ＲＮＡ分子および前記ＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成するように構成される、キット。

【請求項22】

核酸フラグメントを調製するための方法であって、
ｃＤＮＡ合成プライマーをリボ核酸（ＲＮＡ）分子にハイブリダイズし、前記ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖を合成して、ＲＮＡ－ｃＤＮＡ中間体を形成すること、
テンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）をテンプレートとして使用して前記ｃＤＮＡ鎖の伸長に適した条件下で前記ＲＮＡ－ｃＤＮＡ中間体を前記ＴＳＯと接触させることによりテンプレートスイッチング反応を実行し、前記ＲＮＡ分子および前記ＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成することであって、前記ＴＳＯは、増幅プライマー部位、識別タグ、固有分子識別子（ＵＭＩ）、および複数の事前定義ヌクレオチドを含む、形成すること、
前記伸長ｃＤＮＡ鎖から二本鎖ｃＤＮＡを生成すること、および
前記二本鎖ｃＤＮＡをフラグメント化して、５’ＵＭＩ含有フラグメントの第１の集団および内部フラグメントの第２の集団を含む核酸フラグメントを生成すること
を含む方法。

【請求項23】

前記ｃＤＮＡ合成プライマーは、逆増幅プライマー部位を含む、請求項２２に記載の方法。

【請求項24】

前記ｃＤＮＡ合成プライマーは、オリゴｄＴＲＮＡ結合部位または遺伝子特異的ＲＮＡ結合部位を含む、請求項２２または２３に記載の方法。

【請求項25】

二本鎖ｃＤＮＡを生成することは、増幅することを含む、請求項２２から２４のいずれかに記載の方法。

【請求項26】

前記増幅することは、前記ＴＳＯ増幅プライマー部位にハイブリダイズする順方向プライマーを採用することを含み、前記ｃＤＮＡ合成プライマーをハイブリダイズする逆方向プライマーは、逆増幅プライマー部位を含む、請求項２５に記載の方法。

【請求項27】

フラグメント化することは、タグ付けされたフラグメントを生成するためにタグ付けすることを含む、請求項１から２６のいずれかに記載の方法。

【請求項28】

前記増幅プライマー部位は、前記タグ付けすることにて使用される前記トランスポザーゼのトランスポザーゼモチーフ配列の一部を含む、請求項２７に記載の方法。

【請求項29】

前記トランスポザーゼモチーフは、Ｔｎ５である、請求項２８に記載の方法。

【請求項30】

前記フラグメント化することは、剪断、超音波処理、または酵素的フラグメント化を含む、請求項２２から２６のいずれかに記載の方法。

【請求項31】

５’ＵＭＩ含有フラグメントの第１の集団および内部フラグメントの第２の集団をタグ付けアダプターでタグ付けすることをさらに含む、請求項３０に記載の方法。

【請求項32】

前記タグ付けアダプターは、リード１シーケンシングプライマー部位を含む第１のタグ付けアダプターと、リード２シーケンシングプライマー部位を含む第２のタグ付けアダプターとを含む、請求項３１に記載の方法。

【請求項33】

前記ｃＤＮＡ合成プライマーをハイブリダイズすることは、複数のＲＮＡ分子の各ＲＮＡ分子について、前記ｃＤＮＡ合成プライマーを前記ＲＮＡ分子にハイブリダイズし、前記ＲＮＡ分子の少なくとも一部に相補的なそれぞれのｃＤＮＡ鎖を合成して、それぞれのＲＮＡ－ｃＤＮＡ中間体を形成することを含み、
前記テンプレートスイッチング反応を実行することは、それぞれのＴＳＯをテンプレートとして使用して、前記それぞれのｃＤＮＡ鎖の伸長に適した条件下で前記それぞれのＲＮＡ－ｃＤＮＡ中間体を前記それぞれのＴＳＯと接触させて、前記ＲＮＡ分子および前記それぞれのＴＳＯの少なくとも一部に相補的なそれぞれの伸長ｃＤＮＡ鎖を形成することによって、前記テンプレートスイッチング反応を実行することを含み、各ＴＳＯは、前記増幅プライマー部位、前記識別タグ、ＵＭＩおよび前記複数の事前定義ヌクレオチドを含み、各ＴＳＯは前記ＴＳＯに固有で他のＴＳＯのＵＭＩとは異なるＵＭＩを含む、請求項２２から３２のいずれかに記載の方法。

【請求項34】

前記複数のＲＮＡ分子は、単一細胞に由来する、請求項３３に記載の方法。

【請求項35】

前記複数のＲＮＡ分子は、複数の細胞に由来する、請求項３３に記載の方法。

【請求項36】

５’ＵＭＩ含有フラグメントの第１の集団および内部フラグメントの第２の集団をシーケンシングすることをさらに含む、請求項１から３５のいずれかに記載の方法。

【請求項37】

前記識別タグ配列の前記存在によって、５’ＵＭＩ含有フラグメントの第１の集団のシーケンシングリードを前記内部フラグメントのシーケンシングリードから区別することをさらに含む、請求項３６に記載の方法。

【請求項38】

前記５’ＵＭＩ含有フラグメントおよび内部フラグメントの両方のシーケンシングリードから前記ＲＮＡの前記完全長配列を構築することをさらに含む、請求項３７に記載の方法。

【請求項39】

前記構築することは、前記５’ＵＭＩ含有フラグメントが生成されたのと同じＲＮＡから生成された内部フラグメントのシーケンシングリードを採用することを含む、請求項３８に記載の方法。

【請求項40】

アイソフォームを前記ＲＮＡに割り当てることをさらに含む、請求項３８または３９に記載の方法。

【請求項41】

前記ＲＮＡの少なくとも第１のＳＮＰを識別することをさらに含む、請求項３８から４０のいずれかに記載の方法。

【請求項42】

前記ＲＮＡの少なくとも第２のＳＮＰを識別することをさらに含む、請求項４１に記載の方法。

【請求項43】

前記第１および第２のＳＮＰの位相関係を設定することをさらに含む、請求項４２に記載の方法。

【請求項44】

前記ＲＮＡを遺伝子融合の産物として識別することをさらに含む、請求項３８または３９に記載の方法。

【請求項45】

前記ｃＤＮＡ合成プライマーをハイブリダイズすることは、前記ｃＤＮＡ合成プライマーを前記ＲＮＡ分子にハイブリダイズし、逆転写によって前記ｃＤＮＡ鎖を合成して、前記ＲＮＡ－ｃＤＮＡ中間体を形成することを含み、
前記テンプレートスイッチング反応を実行することは、逆転写による前記ｃＤＮＡ鎖の伸長に適した条件下で前記ＲＮＡ－ｃＤＮＡ中間体を前記ＴＳＯと接触させて、前記伸長ｃＤＮＡ鎖を形成することによって前記テンプレートスイッチング反応を実行することを含む、請求項２２から４４のいずれかに記載の方法。

【請求項46】

前記逆転写は、リボヌクレオチド、好ましくはグアニンリボヌクレオチドの存在下で、０．０５ｍＭから１０ｍＭの間隔内、好ましくは０．１ｍＭから３ｍＭの間隔内で選択される濃度で行われる、請求項４５に記載の方法。

【請求項47】

前記逆転写は、ｄＡＴＰ、ｄＧＴＰ、ｄＴＴＰ、およびｄＣＴＰの混合物の存在下で行われ、
前記混合物は、同じ濃度のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰと、前記同じ濃度のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰよりもＸｍＭ高い濃度のｄＣＴＰとを含み、
前記ＸｍＭは、０．０５ｍＭから１０ｍＭの間隔内、好ましくは０．１ｍＭから３ｍＭの間隔内で選択される、請求項４５または４６に記載の方法。

【請求項48】

前記逆転写は、０．１ｍＭから２０ｍＭの間隔内、好ましくは１ｍＭから１０ｍＭの間隔内、より好ましくは２ｍＭから５ｍＭの間隔内で選択される濃度のマグネシウム塩の存在下で行われる、請求項４５から４７のいずれかに記載の方法。

【請求項49】

前記逆転写は、塩化ナトリウム（ＮａＣｌ）、塩化セシウム（ＣｓＣｌ）、およびそれらの混合物からなる群から選択される塩化物塩の存在下で行われ、少なくとも減量された塩化カリウム（ＫＣｌ）で行われる、請求項４５から４８のいずれかに記載の方法。

【請求項50】

前記逆転写は、３００Ｄａから１００，０００Ｄａの間隔内、好ましくは１，０００から２５，０００Ｄａの間隔内、より好ましくは８０００Ｄａなどの７，０００Ｄａから９，０００Ｄａの間隔内で選択された平均分子量を有するポリエチレングリコール（ＰＥＧ）の存在下で行われる、請求項４５から４９のいずれかに記載の方法。

【請求項51】

核酸フラグメントを調製するためのキットであって、
リボ核酸（ＲＮＡ）分子にハイブリダイズして、前記ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖の合成を可能にして、ＲＮＡ－ｃＤＮＡ中間体を形成するように構成され、逆増幅プライマー部位を含むｃＤＮＡ合成プライマー、および
増幅プライマー部位、識別タグ、固有分子識別子（ＵＭＩ）、および複数の事前定義ヌクレオチドを含むテンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）
を含み、
前記ＴＳＯは、前記ｃＤＮＡ鎖の伸長を含むテンプレートスイッチング反応においてテンプレートとして機能して、前記ＲＮＡ分子および前記ＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成するように構成される、キット。

【請求項52】

前記ｃＤＮＡ合成プライマーは、オリゴｄＴＲＮＡ結合部位を含む、請求項５１に記載のキット。

【請求項53】

前記ｃＤＮＡ合成プライマーは、遺伝子特異的ＲＮＡ結合部位を含む、請求項５１に記載のキット。

【請求項54】

前記増幅プライマー部位は、トランスポザーゼモチーフ配列の一部を含む、請求項５１から５３のいずれかに記載のキット。

【請求項55】

前記トランスポザーゼモチーフは、Ｔｎ５である、請求項５４に記載のキット。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、概して、相補的デオキシリボ核酸（ｃＤＮＡ）合成、特にシーケンシングに適したｃＤＮＡを調製するための方法およびキットに関する。

【背景技術】

【0002】

シングルセルリボ核酸シーケンシング（ｓｃＲＮＡ－ｓｅｑ）は、例えば、細胞タイプ、サブタイプ、細胞状態、および、さまざまなシグナルに対する異質反応を、識別および列挙するために、多数の細胞を分子プロファイルする能力を劇的に改善した。本質的にすべてのｓｃＲＮＡ－ｓｅｑ方法は、ポリＡテールを含むＲＮＡ分子、例えばメッセンジャーＲＮＡ（ｍＲＮＡ）分子をプロファイルし、概して２つの主要な方法に分けることができる。

【0003】

第１の主要な方法は、ｍＲＮＡ分子の５’末端または３’末端のいずれかにある塩基の小さなストレッチを高い細胞スループットでプロファイルする。これらの方法には、シングルセルタグ付き逆転写シーケンシング（ＳＴＲＴ－ｓｅｑ）［１］、シングルセルシーケンシング（ＣＥＬ－ｓｅｑ）［２］、大規模並列シングルセルＲＮＡシーケンシング（ＭＡＲＳ－ｓｅｑ）［３］、１０×ＧｅｎｏｍｉｃｓシングルセルＲＮＡシーケンシング［４］、スプリットプールライゲーションベースのトランスクリプトームシーケンシング（ＳＰＬｉＴ－ｓｅｑ）［５］、シングルセルコンビナトリアルインデクシングＲＮＡシーケンシング（ｓｃｉ－ＲＮＡ－ｓｅｑ）［６］が含まれる。これらの方法はすべて、オリゴｄＴプライマーまたはテンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）に存在する固有分子識別子（ＵＭＩ）を利用する。ＵＭＩは、ポリメラーゼ連鎖反応（ＰＣＲ）の偏った増幅効果を取り除くために使用される。これらの方法によって、それにより、増幅前に存在するｍＲＮＡ分子をカウントすることができる。

【0004】

第２の主要な方法は、完全なｍＲＮＡ分子に由来するｃＤＮＡフラグメントのその後のキャプチャのためにｃＤＮＡ分子をフラグメント化し、したがって、完全長までの転写産物カバレッジを提供する。特に、方法にはＳｍａｒｔ－ｓｅｑ［７］およびＳｍａｒｔ－ｓｅｑ２［８、１０、１１］が含まれ、これらは、シングルセルトランスクリプトームの最も感度が高い情報を提供する、つまり、細胞内に存在するＲＮＡの最大フラクションをキャプチャする。ただし、これらの方法はＵＭＩと互換性がなく、そのため、シングルセル内のｍＲＮＡ分子をカウントすることができない。

【0005】

ＲＮＡシーケンシング、特にｓｃＲＮＡ－ｓｅｑの分野では、依然として改善の必要がある。

【発明の概要】

【0006】

シーケンシングに適したｃＤＮＡを調製することが、概括的な目的である。

【0007】

この目的および他の目的は、本明細書で定義される実施形態によって満たされる。

【0008】

本発明は、独立請求項に定義されているように、ｃＤＮＡを調製するための方法およびキットに関する。本発明のさらなる実施形態は、従属請求項に定義されている。

【0009】

ｃＤＮＡを調製するための方法は、ｃＤＮＡ合成プライマーをＲＮＡ分子にハイブリダイズし、ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖を合成して、ＲＮＡ－ｃＤＮＡ中間体を形成することを含む。方法はまた、ＴＳＯをテンプレートとして使用してｃＤＮＡ鎖の伸長に適した条件下でＲＮＡ－ｃＤＮＡ中間体をＴＳＯと接触させることによりテンプレートスイッチング反応を実行し、ＲＮＡ分子およびＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成することを含む。本発明によれば、ＴＳＯは、増幅プライマー部位、識別タグ、ＵＭＩ、および、複数の事前定義ヌクレオチドを含む。

【0010】

ｃＤＮＡを調製するためのキットは、ＲＮＡ分子にハイブリダイズして、ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖の合成を可能にして、ＲＮＡ－ｃＤＮＡ中間体を形成するように構成されたｃＤＮＡ合成プライマーを含む。キットはまた、増幅プライマー部位、識別タグ、ＵＭＩ、および、複数の事前定義ヌクレオチドを含むＴＳＯを含む。ＴＳＯは、ＤＮＡ鎖の伸長を含むテンプレートスイッチング反応においてテンプレートとして機能して、ＲＮＡ分子およびＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成するように構成される。

【0011】

本発明は、ＵＭＩの使用を可能にし、したがって、増幅バイアスを除去し、それでも、完全長までの転写産物カバレッジを提供する。これは、ＵＭＩを伸長ｃＤＮＡ鎖に導入する本発明のＴＳＯの使用によって可能である。

【0012】

実施形態は、さらなる目的およびその利点とともに、添付の図面とともに採られた以下の説明を参照することによって最もよく理解され得る。

【図面の簡単な説明】

【0013】

【図1A】組み合わされた完全長転写産物カバレッジおよびＵＭＩについてのシングルセルＲＮＡシーケンシングライブラリの構築を示す。個々の細胞を、個々の反応容器（例えば、個々の管、マルチウェルプレート、ナノウェルもしくはマイクロウェルのウェル、またはマイクロ流体デバイスもしくはドロップレットのチャンバー）で溶解し、逆転写およびテンプレートスイッチングに供した。結果として得られた第１鎖ｃＤＮＡを事前増幅し、その間に完全なＮｅｘｔｅｒａＰ５アダプター配列を５’末端に挿入した。二本鎖ｃＤＮＡを、タグ付け、ＰＣＲを介したインデクシング、およびＩＬＬＵＭＩＮＡ（登録商標）シーケンシングに供した。

【図1B】組み合わされた完全長転写産物カバレッジおよびＵＭＩについてのシングルセルＲＮＡシーケンシングライブラリの構築を示す。個々の細胞を、個々の反応容器（例えば、個々の管、マルチウェルプレート、ナノウェルもしくはマイクロウェルのウェル、またはマイクロ流体デバイスもしくはドロップレットのチャンバー）で溶解し、逆転写およびテンプレートスイッチングに供した。結果として得られた第１鎖ｃＤＮＡを事前増幅し、その間に完全なＮｅｘｔｅｒａＰ５アダプター配列を５’末端に挿入した。二本鎖ｃＤＮＡを、タグ付け、ＰＣＲを介したインデクシング、およびＩＬＬＵＭＩＮＡ（登録商標）シーケンシングに供した。

【図2】本発明による改善された遺伝子検出を示す箱ひげ図を示す。

【図3】パネルＡおよびＢは、本発明および従来技術のＳｍａｒｔ－ｓｅｑ２を用いた詳細なＲＮＡバイオタイプ検出を示す。

【図4】５’末端リードおよび内部リードのレベルのコントロールを示す。

【図5】パネルＡからＣは、異なるタグ付きｃＤＮＡのｃＤＮＡ長分布を示す。

【図6】パネルＡからＣは、反応条件および実験添加物を変更することによる遺伝子検出の増加を示す。

【図7】パネルＡおよびＢは、それぞれ内部リードおよびＵＭＩ含有５’末端リードについてのＲＮＡ分子にわたるリードカバレッジを示す。

【図8】実施形態によるｃＤＮＡの調製方法を示すフローチャートである。

【図9a】Ｓｍａｒｔ－ｓｅｑ３と呼ばれる本発明の実施形態についてのライブラリ戦略を示す。ＰｏｌｙＡ＋ＲＮＡ分子は逆転写され、テンプレートスイッチングは５’末端で行われる。ＰＣＲの事前増幅後、Ｔｎ５を介したタグ付けにより、ｃＤＮＡにほぼランダムなカットが導入され、５’ＵＭＩタグ付きフラグメントと遺伝子本体全体にまたがる内部フラグメントとが生成される。

【図9b】Ｓｍａｒｔ－ｓｅｑ３プロトコルでシーケンシングされたＨＥＫ２９３ＦＴ（ｎ＝９６）細胞全体で平均された遺伝子本体カバレッジを示す。示されているのは、標準偏差でシェーディングされたＵＭＩリード（緑）および内部リード（青）の平均カバレッジである。

【図9c】ＵＭＩ含有リードのフラクションに対するタグ付け条件の影響（条件ごとに１６個のＨＥＫ２９３ＦＴ細胞）を示す。左のパネル：一定の２００ｐｇのｃＤＮＡ入力でＴｎ５を変化させる。右パネル：一定の０．５ｕｌのＴｎ５でｃＤＮＡ入力を変化させる。

【図9d】Ｓｍａｒｔ－ｓｅｑ２（４４個の細胞）およびＳｍａｒｔ－ｓｅｑ３（８８個の細胞）の遺伝子検出感度、ＨＥＫ２９３ＦＴ細胞あたり１００万の生のリードにダウンサンプルされている。示されているのは、０または１のＲＰＫＭで検出された遺伝子の数である。Ｐ値は両側ｔ検定として計算された。

【図9e】ＲＰＫＭおよびＵＭＩレベルでのＳｍａｒｔ－ｓｅｑ２（４４個の細胞）およびＳｍａｒｔ－ｓｅｑ３（８８個の細胞）についてのＨＥＫＦ２９３ＦＴ細胞にわたる遺伝子発現定量化における再現性を示す。示されているのは、細胞あたり１００万回のリードにダウンサンプルされたライブラリにおけるすべてのペアごとの細胞間線形モデル適合についての調整ｒ^２である。

【図9f】固有のエラー修正ＵＭＩ配列の数とＨＥＫ２９３ＦＴ細胞ごとに検出された遺伝子とを要約することによって示されるＳｍａｒｔ－ｓｅｑ３のＲＮＡ分子を検出する感度を示す。色は、１０，０００（ｎ＝２４個の細胞）から７５０，０００（ｎ＝１６個の細胞）のＵＭＩ含有シーケンシングリードの範囲の細胞ごとのダウンサンプル深度を示す。

【図9g】Ｓｍａｒｔ－ｓｅｑ２－ＵＭＩ、Ｓｍａｒｔ－ｓｅｑ３を使用し、４つのＸ染色体遺伝子（Ｈｄａｃ６、Ｉｇｂｐ１、Ｍｐｐ１、およびＭｓｌ３）についてｓｍＲＮＡ－ＦＩＳＨを使用して、細胞ごとに検出された分子の数を要約したバイオリン図である。

【図9h】Ｓｍａｒｔ－ｓｅｑ２－ＵＭＩおよびＳｍａｒｔ－ｓｅｑ３を使用して、細胞内で検出されたｓｍＲＮＡ－ＦＩＳＨ分子のパーセントを推定する。示されているのは、平均と９５％信頼区間とである。

【図10】Ｓｍａｒｔ－ｓｅｑ３のシーケンス条件と反復との概要を示す。各行は、テストされた反応条件と、１Ｍの生のｆａｓｔｑリードで個々のＨＥＫ２９３ＦＴ細胞で検出された遺伝子の数とを示す。条件ごとに少なくとも１００万のシーケンシングされたリードを含む個々のセルの数が、右側にリストされている。この図には、Ｓｍａｒｔ－ｓｅｑ３ケミストリーの要素を備えたＳｍａｒｔ－ｓｅｑ２のいくつかの以前のバージョンが「Ｓｍａｒｔ－ｓｅｑ２．５」として含まれている。行ごとの正確な反応条件が表４にリストされている。

【図11】Ｓｍａｒｔ－ｓｅｑ３逆転写に対する塩、ＰＥＧおよび添加物の影響を示す。Ａはさまざまな反応条件でのＭａｘｉｍａＨＭｉｎｕｓ逆転写反応の性能のテストを示す。各条件について、１Ｍの生のｆａｓｔｑリードで個々のＨＥＫ２９３ＦＴ細胞で検出された固有ＵＭＩの数で箱ひげ図を要約した。ＮａＣｌ、ＣｓＣｌ、または標準のＫＣｌベースのバッファーを使用する文脈にて逆転写をテストした。さらに、５％ＰＥＧまたは１ｍＭのｄＣＴＰ（条件ごとに１６個の細胞）の追加の効果を評価した。Ｂは細胞あたり１００万の生のＵＭＩリードから識別された遺伝子の数に対して要約されたＡにおけるような反応条件（条件あたり１６個の細胞）を示す。Ｃは細胞あたり１００万の生のリード（５’ＵＭＩリードと内部リードとの両方からのサブサンプリング）から識別された遺伝子の数に対して要約されたＡにおけるような反応条件（条件あたり１６個の細胞）を示す。

【図12】Ｓｍａｒｔ－ｓｅｑ３によるタンパク質コーディングおよびノンコーディングＲＮＡの検出の改善を示す。Ａでは、Ｓｍａｒｔ－ｓｅｑ３反応の変形例は、Ｓｍａｒｔ－ｓｅｑ２およびＵＭＩ（ここでは「中間体」と呼ばれる）を使用するＳｍａｒｔ－ｓｅｑ２の以前の実験と比較して、タンパク質コーディング遺伝子、およびまた、ｐｏｌｙ－Ａ＋ｌｉｎｃＲＮＡ、アンチセンスＲＮＡ、処理済み偽遺伝子、処理済み転写産物、ｓｎｏＲＮＡなどのさまざまなバイオタイプの遺伝子の検出が改善されていることを示す。ＢはＵＭＩ（ここでは「中間体」と呼ばれる）を使用するＳｍａｒｔ－ｓｅｑ２およびＳｍａｒｔ－ｓｅｑ３変形例のリードを含むＵＭＩによって類似のＲＮＡバイオタイプが検出された遺伝子を示す。

【図13a】対立遺伝子およびアイソフォーム分解能でのシングルセルＲＮＡカウントを示し、Ｓｍａｒｔ－ｓｅｑ３を使用して対立遺伝子およびアイソフォーム分解情報を取得するための戦略を示す。赤い十字は、対立遺伝子間の遺伝的変異を伴う転写位置を示す。タグ付け後、ＵＭＩフラグメントはペアエンドシーケンシング（緑色で表示）に供され、分子カウント５’末端を、対立遺伝子情報バリアント位置をカバーすることができるさまざまな遺伝子本体フラグメントとリンクし、アイソフォーム情報スプライスジャンクションにまたがり、したがって、アイソフォームと起源の対立遺伝子とのインシリコ再構築を可能にする。

【図13b】３６９個の個々のＣＡＳＴ／ＥｉＪ×Ｃ５７／Ｂｌ６Ｊハイブリッドマウス線維芽細胞から、カバーされたＳＮＰに基づいて対立遺伝子起源に割り当てることができる分子の平均パーセンテージを示す。細胞の＞５％で検出された遺伝子のみが考慮された（ｎ＝１５，１５８個の遺伝子）。

【図13c】（ｃ）ＲＮＡ分子の対立遺伝子割り当てに対する転写産物長とエキソニックＳＮＰ数との影響を示す。示されているのは、起源の対立遺伝子に割り当てられた分子の平均的な遺伝子ごとのパーセンテージによって色付けされた５０個の２Ｄビンにグループ化された遺伝子（ｎ＝１５，１５８）である。挿入図は、視覚化されたビンごとの遺伝子の数を示す。

【図13d】ＲＮＡカウントからの対立遺伝子発現と、分離された発現と内部リードからの対立遺伝子フラクションとに基づく従来の推定値との一致を示す。示されているのは、３６９個のマウス線維芽細胞における１５，１５８個の遺伝子の平均ＣＡＳＴ対立遺伝子フラクションである。ドットは、データポイントの局所密度によって色分けされる。

【図13e】３６９の個々の線維芽細胞のそれぞれにおける、直接対立遺伝子ＲＮＡカウントを対立遺伝子発現の以前のリードベースの推定値と比較した線形モデルからの結果を示す。各細胞（ｎ＝３６９）について、直接再構築分子割り当てと従来のリードベースの推定値との間のＣＡＳＴ対立遺伝子フラクションの線形モデル適合を計算した。示されているのは、細胞ごとに各線形モデルから取得された切片、傾き、およびｒ＾２値の箱ひげ図である。

【図13f】Ｓｍａｒｔ－ｓｅｑ２－ＵＭＩ（ＴＳＯでＵＭＩと組み合わされたＳｍａｒｔ－ｓｅｑ２ケミストリー）と比較して、転写バースト動態を推測するＳｍａｒｔ－ｓｅｑ３の改善された能力を実証する。Ｆ１ＣＡＳＴ／ＥｉＪ×Ｃ５７／Ｂｌ６Ｊマウス線維芽細胞で推論が行われ、バーストサイズと頻度とについて遺伝子にわたるＣＡＳＴおよびＣ５７動態の間のスピアマン相関関係が示されている。さらに、ｘ軸は、バースト動態を確実に推測できる遺伝子の数を示す。

【図13g】異なる長さ（塩基対、ｙ軸における）に再構築されたＲＮＡ分子の数（ｘ軸、ｌｏｇ１０）を要約し、固有の転写産物アイソフォームに追加で割り当てられた分子のみを示す。合計で、１００万個の最長の再構築されたＲＮＡ分子が、３６９個のマウス線維芽細胞を用いた１回の実験から示され、分子は降順で示されている。

【図13h】マウス線維芽細胞（細胞バーコード：ＴＴＣＣＧＴＴＣＧＣＧＡＣＴＡＡ）で観察された、Ｃｏｘ７ａ２ｌの２つの異なる転写産物アイソフォーム（オレンジ色のＥＮＳＭＵＳＴ０００００１６７７４１、および水色のＥＮＳＭＵＳＴ００００００２５０９５）をサポートする２つの再構築されたＲＮＡ転写産物を視覚化する刺身プロットを示す。

【図13i】Ｆ１ＣＡＳＴ／ＥｉＪ×Ｃ５７／Ｂｌ６Ｊマウス線維芽細胞ごとに、特定のＥｎｓｅｍｂｌ転写産物アイソフォームに割り当てることができる検出された分子のパーセンテージを示すバイオリン図である。表されているのは、すべてのＥｎｓｅｍｂｌ遺伝子、または２つ以上の注釈付きアイソフォーム（「マルチアイソフォーム遺伝子」）を持つサブセットの結果である。細胞ごとの割り当てられた分子のパーセンテージの中央値は、すべての遺伝子とマルチアイソフォーム遺伝子とでそれぞれ５２．３７％と４１．０４％とであった。

【図13j】染色体によって着色されたマウス線維芽細胞における有意な系統特異的アイソフォーム発現の視覚化を示す。Ｙ軸は、対立遺伝子起源とアイソフォームとの間の関連を評価する遺伝子ごとに実行された個々のカイ二乗検定からのＢｅｎｊａｍｉｎｉ－Ｈｏｃｈｂｅｒｇ補正ｐ値（－ｌｏｇ１０）を示す。

【図13k】ＣＡＳＴ／ＥｉＪおよびＣ５７／Ｂｌ６Ｊマウス系統におけるＨｃｆｃ１ｒ１の有意な系統特異的アイソフォーム発現の視覚化を示す。バイオリン図は、系統およびアイソフォームごとに分離された、マウス線維芽細胞におけるアイソフォーム発現を示す。上は転写産物のアイソフォーム構造を示す。

【図14】初代線維芽細胞のＣｏｘ７ａ２遺伝子座からの単一転写分子からのリードペアの可視化を示す。Ｃｏｘ７ａ２ｌ遺伝子座からの１つの分子からシーケンシングされたリードペアの視覚化を示す。上は、Ｃｏｘ７ａ２ｌ遺伝子座のエクソンとイントロンとをゲノム座標（ｍｍ１０）で示す。各行は固有のリードペアを示し、オレンジ色のボックスはゲノム遺伝子座への配列のマッピングを示し、点線は配列がリードペアによって接続されていることを示し、実線はエクソン－イントロンジャンクションがシーケンシングされたリードでキャプチャされたことを示す。なお、組み合わされたすべてのリードペアは、本質的に完全な転写産物にまたがり、つまり、この分子については、完全な転写産物を再構築できた。

【図15】Ｓｍａｒｔ－ｓｅｑ２－ＵＭＩおよびＳｍａｒｔ－ｓｅｑ３データに基づくバースト動態推論の詳細な比較を示す。ａは、マウス線維芽細胞の遺伝子についてのＣ５７（ｘ軸）およびＣＡＳＴ（ｙ軸）対立遺伝子について推定されたバースト頻度を示す散布図である。左側のプロットはＳｍａｒｔ－ｓｅｑ３データに基づく結果を示し、右側のパネルはＳｍａｒｔ－ｓｅｑ２－ＵＭＩデータを使用した結果を示す。ｂは、マウス線維芽細胞の遺伝子についてのＣ５７（ｘ軸）およびＣＡＳＴ（ｙ軸）対立遺伝子について推定されたバーストサイズを示す散布図である。左側のプロットはＳｍａｒｔ－ｓｅｑ３データに基づく結果を示し、右側のパネルはＳｍａｒｔ－ｓｅｑ２－ＵＭＩデータを使用した結果を示す。

【図16】Ｓｍａｒｔ－ｓｅｑ３での種の混合とダブレットを示す。ａは、ヒト、マウス、およびイヌの細胞のいずれをも含む複雑なＨＣＡサンプルについて、ヒト（ｘ軸）およびマウス（ｙ軸）に整列させたリードの数を示す散布図である。ｂは、ヒト、マウス、およびイヌの細胞のいずれをも含む複雑なＨＣＡサンプルについて、ヒト（ｘ軸）およびイヌ（ｙ軸）に整列させたリードの数を示す散布図である。複数のゲノムに向けて任意のシグナルを示す細胞はほとんど示されず、ダブレット率が非常に低いことを示す。

【図17a】複雑なヒトサンプルのＳｍａｒｔ－ｓｅｑ３分析を示し、Ｓｍａｒｔ－ｓｅｑ３プロトコルでシーケンシングされ、注釈付き細胞タイプで色分けされた３，８９０個のヒト細胞の次元削減（ＵＭＡＰ）を示す。

【図17b】さまざまな細胞タイプにおけるＳｍａｒｔ－ｓｅｑ２とＳｍａｒｔ－ｓｅｑ３との間の遺伝子を検出する感度の比較を示す。細胞は、細胞ごとに１００ｋの生のリードにダウンサンプルされ、ｔ検定のｐ値に各ペアごとの比較の注釈が付けられる。

【図17c】ナイーブＢ細胞と記憶Ｂ細胞とで統計的に有意に異なるレベルで発現された選択マーカー遺伝子の遺伝子発現を示すヒートマップを示す。カラースケールは、正規化およびスケーリングされた発現値を表す。

【図17d】細胞タイプによって分離された、単一のＥｎｓｅｍｂｌアイソフォームに割り当てることができる再構築されたＲＮＡ分子のパーセンテージを示す。

【図17e】１つまたはＮ個のいずれかのアイソフォームに割り当てることができる再構築分子のフラクションを示すマトリックスであり、分子は最初に、その遺伝子に使用できる注釈付きアイソフォームの数によってグループ化された。

【図17f】（リンクされたＵＭＩなしの内部リードを含む）Ｓａｌｍｏｎで検出可能な発現（ＴＰＭ＞０）を持つそれらのアイソフォームのみへの割り当てをフィルタリングした後、（ｅでのように）１つまたはＮ個のアイソフォームのいずれかに割り当てることができる再構築分子のフラクションを示すマトリックスである。

【図17g】異なるＰＴＰＲＣアイソフォームに割り当てられ、細胞タイプごとに分離され、細胞タイプ内のすべての細胞にわたって集約している分子のフラクションを示すバープロットである。

【図17h】ガンマデルタＴ細胞におけるＰＴＰＲＣのＲ０またはＲＡＢＣアイソフォームのいずれかに割り当てられた再構築分子の刺身プロットを示す。

【図17i】異なるＴＩＭＰ１アイソフォームに割り当てられ、細胞タイプごとに分離し、細胞タイプ内の細胞全体に集約する分子のフラクションを示すバープロットを示す。

【図17j】ＦＣＧＲ３Ａ＋単球における２つのＴＩＭＰ１アイソフォームに割り当てられた再構築分子の刺身プロットを示す。

【図18a】使用されているＳｍａｒｔ－ｓｅｑ２およびＳｍａｒｔ－ｓｅｑ３ライブラリのマッピング統計を表し、マッピングされていないリードペア、ならびにエキソニック、イントロニック、および遺伝子間領域に整列したリードペアのパーセンテージを示す。プロトコル（Ｓｍａｒｔ－ｓｅｑ２およびＳｍａｒｔ－ｓｅｑ３）および実験（ＨＥＫ２９３ＦＴ、マウス線維芽細胞、ＨＣＡ細胞）ごとに分離されている。

【図18b】使用されているＳｍａｒｔ－ｓｅｑ２およびＳｍａｒｔ－ｓｅｑ３ライブラリのマッピング統計を表し、Ｓｍａｒｔ－ｓｅｑ３の５’ＵＭＩ含有リードペアのマッピング統計を示す。マッピングされていないリードペア、ならびにエキソニック、イントロニック、および遺伝子間領域に整列したリードペアのパーセンテージを示す。実験ごとに分離されている（ＨＥＫ２９３ＦＴ、マウス線維芽細胞、ＨＣＡ細胞）。

【図19】本発明の実施形態による、５’ＵＭＩリードおよび内部リードを生成し、その後、そこからＲＮＡの完全長配列を構築する方法を示す。

【発明を実施するための形態】

【0014】

バーコードは、核酸の識別子として機能する領域である。バーコードは様々であり得、その例には、例えばセルバーコード、ホストバーコードなどのＲＮＡソースバーコード、プレートまたはウェルバーコードなどのコンテナバーコード、インラインバーコード、インデクシングバーコードなどが含まれる。

【0015】

固有分子識別子（つまり、ＵＭＩ）は、さまざまな長さのランダマーであり、例えば、長さが６～１２ｎｔの範囲にあり、所与分子種の個々の分子をカウントするために使用できる。カウントは、ＵＭＩを、ＵＭＩの多様なプールから対象ターゲットの個々の分子へと付着させて、それにより、それぞれの個々の分子が固有のＵＭＩを受け取るようにすることで実現される。個々の転写産物分子をカウントすることにより、ＮＧＳライブラリの調製中にＰＣＲバイアスを減らすことができ、サンプル集団のより定量的な理解を達成することができる。例えば、米国特許第８，８３５，３５８号、Ｆｕｅｔａｌ．、「分子インデクシングは定量的標的化ＲＮＡシーケンシングを可能にし、標準ライブラリ調製における不十分な効率を明らかにする」、ＰＮＡＳ（２０１４）５：１８９１－１８９６、および、Ｆｕｅｔａｌ．、「単一分子カウントによる正確で絶対的な遺伝子発現測定を可能にする細胞ｍＲＮＡのデジタルエンコーディング」、Ａｎａｌ．Ｃｈｅｍ（２０１４）８６：２８６７－２８７０を参照。

【0016】

本明細書で使用される「相補的」という用語は、標的核酸のすべてまたは領域（例えば、テンプレートＲＮＡまたは二本鎖産物核酸の他の領域）への非共有結合によって塩基対を形成するヌクレオチド配列を指す。標準的なワトソン－クリック塩基対形成では、ＤＮＡのグアニン（Ｇ）とシトシン（Ｃ）がそうであるように、アデニン（Ａ）はチミン（Ｔ）と塩基対を形成する。ＲＮＡでは、チミンはウラシル（Ｕ）に置き換えられる。そのため、ＡはＴに相補的であり、ＧはＣに相補的である。ＲＮＡでは、ＡはＵに相補的であり、その逆も同様である。典型的には、「相補的」は、少なくとも部分的に相補的であるヌクレオチド配列を指す。「相補的」という用語はまた、一方の鎖のすべてのヌクレオチドが対応する位置で他方の鎖のすべてのヌクレオチドに相補的であるように完全に相補的である二重鎖を含み得る。特定の場合において、ヌクレオチド配列は、標的に対して部分的に相補的であり得、すべてのヌクレオチドが、すべての対応する位置において標的核酸中のすべてのヌクレオチドに対して相補的であるとは限らない。例えば、プライマーは、標的核酸に対して完全に（すなわち、１００％）相補的であり得るか、またはプライマーおよび標的核酸は、完全よりは低い（例えば、７０％、７５％、８５％、９０％、９５％、９９％）ある程度の相補性を共有し得る。２つのヌクレオチド配列のパーセント同一性は、最適な比較目的のために配列を整列させることによって決定することができる（例えば、ギャップは、最適な整列のために第１の配列内の配列に導入することができる）。そして、対応する位置のヌクレオチドが比較され、２つの配列間のパーセント同一性は、配列によって共有される同一位置の数の関数である（すなわち、％同一性＝同一位置の数／位置の総数×１００）。一方の配列の位置がもう一方の配列の対応する位置と同じヌクレオチドで占められている場合、分子はその位置で同一である。そのような数学的アルゴリズムの非限定的な例は、Ｋａｒｌｉｎｅｔａｌ．、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９０：５８７３－５８７７（１９９３）に記載されている。このようなアルゴリズムは、Ａｌｔｓｃｈｕｌｅｔａｌ．、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２５：３８９－３４０２（１９９７）に記載されているように、ＮＢＬＡＳＴおよびＸＢＬＡＳＴプログラム（バージョン２．０）に組み込まれている。ＢＬＡＳＴおよびギャップ付きＢＬＡＳＴプログラムを利用する場合、それぞれのプログラム（例えば、ＮＢＬＡＳＴ）のデフォルトパラメータを使用することができる。一態様では、配列比較のためのパラメータは、スコア＝１００、ワード長＝１２と設定することができ、または変更することができる（例えば、ワード長＝５またはワード長＝２０）。

【0017】

本明細書で使用される場合、「ハイブリダイゼーション条件」という用語は、プライマーが標的核酸の領域（例えば、テンプレートＲＮＡまたは二本鎖産物核酸の他の領域）に特異的にハイブリダイズする条件を意味する。プライマーが標的核酸に特異的にハイブリダイズするか否かは、ポリマーと標的核酸との間の相補性の程度、および、プライマーの融解温度（Ｔ_Ｍ）により分かり得るハイブリダイゼーションが起こる温度などの要因によって決定される。融解温度は、プライマー－標的核酸二本鎖の半分がハイブリダイズしたままであり、二本鎖の半分が一本鎖に解離する温度を指す。二本鎖のＴ_ｍは、次の式Ｔ_ｍ＝８１．５＋１６．６（ｌｏｇ１０［Ｎａ^＋］）＋０．４１（フラクションＧ＋Ｃ）－（６０／Ｎ）を使用して実験的に決定または予測され得、Ｎは鎖長、［Ｎａ^＋］は１Ｍ未満である。ＳａｍｂｒｏｏｋおよびＲｕｓｓｅｌｌ（２００１；分子クローニング：研究室マニュアル、３^ｒｄｅｄ．、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｕｒＰｒｅｓｓ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｕｒＮ.Ｙ.、Ｃｈ.１０）参照。さまざまなパラメータに依存する他のより高度なモデルもまた、さまざまなハイブリダイゼーション条件に応じて、プライマー／標的二重鎖のＴ_ｍを予測するために使用され得る。特定の核酸ハイブリダイゼーションを達成するためのアプローチは、例えば、Ｔｉｊｓｓｅｎ、生化学および分子生物学における実験技術－核酸プローブによるハイブリダイゼーション、パートＩ、第２章、「ハイブリダイゼーションの原理の概要および核酸プローブアッセイの戦略」、Ｅｌｓｅｖｉｅｒ（１９９３）に見出され得る。

【0018】

次世代シーケンシング（ＮＧＳ）ライブラリは、対象のシーケンシングプラットフォームを使用したシーケンシングに役立つ、それらの末端における部分的または完全なシーケンシングプラットフォームアダプター配列がその核酸メンバーに含まれているライブラリである。対象となるシーケンシングプラットフォームには、Ｉｌｌｕｍｉｎａ（登録商標）のＨｉＳｅｑ（商標）、ＭｉＳｅｑ（商標）およびＧｅｎｏｍｅＡｎａｌｙｚｅｒ（商標）シーケンシングシステム、ＩｏｎＴｏｒｒｅｎｔ（商標）のＩｏｎＰＧＭ（商標）およびＩｏｎＰｒｏｔｏｎ（商標）シーケンシングシステム、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓのＰＡＣＢＩＯＲＳＩＩＳｅｑｕｅｌシステム、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（商標）のＳＯＬｉＤシーケンシングシステム、Ｒｏｃｈｅの４５４ＧＳＦＬＸ＋およびＧＳＪｕｎｉｏｒシーケンシングシステム、ＯｘｆｏｒｄＮａｎｏｐｏｒｅのＭｉｎＩＯＮ（商標）システム、または任意の他の対象シーケンシングプラットフォームが含まれるが、これらに限定されない。

【0019】

「ｃＤＮＡの伸長に適した条件下で」とは、テンプレートＲＮＡにハイブリダイズされた第１鎖ｃＤＮＡプライマーの３’末端のポリメラーゼ媒介伸長、ポリメラーゼのテンプレートスイッチオリゴヌクレオチド（ＴＳＯ）へのテンプレートスイッチング、およびテンプレートスイッチオリゴヌクレオチドをテンプレートとして使用する伸長反応の継続を可能にする反応条件を意味する。適切な反応条件を達成することは、ポリメラーゼが活性であり、反応中の関連する核酸が所望の方法で互いに相互作用する（例えば、ハイブリダイズする）環境を作り出すために、反応混合物成分、それらの濃度、および反応温度を選択することを含み得る。例えば、テンプレートＲＮＡ、ポリメラーゼ、第１鎖ｃＤＮＡプライマー、テンプレートスイッチオリゴヌクレオチドおよびｄＮＴＰに加えて、反応混合物は、伸長反応およびテンプレートスイッチングが起こるための、適切なｐＨ、塩濃度（例えば、ＫＣｌ濃度）、金属補因子濃度（例えば、Ｍｇ^２＋またはＭｎ^２＋濃度）などを確立するバッファー成分を含み得る。１つまたは複数のヌクレアーゼ阻害剤（例えば、ＲＮａｓｅ阻害剤および／またはＤＮａｓｅ阻害剤）、ＧＣリッチ配列の増幅／複製を促進するための１つまたは複数の添加剤（例えば、ＧＣ－Ｍｅｌｔ（商標）試薬（ＴａｋａｒａＢｉｏＵＳＡ、Ｉｎｃ．（ＭｏｕｎｔａｉｎＶｉｅｗ、ＣＡ））、ベタイン、ＤＭＳＯ、エチレングリコール、１，２－プロパンジオール、またはそれらの組み合わせ）、１つまたは複数の分子クラウディング剤（例えば、ポリエチレングリコール、フィコル、デキストランなど）、１つまたは複数の酵素安定化成分（例えば、１～１０ｍＭ（例えば、５ｍＭ）の範囲の最終濃度で存在する、ＤＴＴ、またはＴＣＥＰ）、および／またはポリメラーゼ媒介伸長反応とテンプレートスイッチングとを促進するために有用な任意の他の反応混合物成分などの、他の成分が含まれ得る。

【0020】

反応混合物は、プライマー伸長反応およびテンプレートスイッチングに適したｐＨを有することができる。特定の実施形態において、反応混合物のｐＨは、７から９などの、５から９の範囲であり、８から９、例えば、８から８．５を含む。場合によっては、反応混合物は、ｐＨ調整剤を含む。対象となるｐＨ調整剤には、水酸化ナトリウム、塩酸、リン酸緩衝液、クエン酸緩衝液などが含まれるが、これらに限定されない。例えば、反応混合物のｐＨは、適切な量のｐＨ調整剤を加えることによって所望の範囲に調整することができる。

【0021】

ｃＤＮＡの伸長に適した温度範囲は、採用される特定のポリメラーゼ、採用される任意の任意選択的プライマーの融解温度などの要因に従って変化し得る。一実施形態によれば、反応混合物条件は、反応混合物を、１６℃から７０℃などの４℃から７２℃の範囲、例えば、４２℃を含む４０℃から４５℃などの３７℃から５０℃の温度にすることを含む。

【0022】

ＲＮＡサンプル内のテンプレートリボ核酸（ＲＮＡ）分子は、リボヌクレオチドで構成される任意の長さ、例えば、１０ｎｔ以上、２０ｎｔ以上、５０ｎｔ以上、１００ｎｔ以上、５００ｎｔ以上、１０００ｎｔ以上、２０００ｎｔ以上、３０００ｎｔ以上、４０００ｎｔ以上、５０００ｎｔ以上またはそれ以上のｎｔのポリマーであり得る。特定の態様において、テンプレートリボ核酸（ＲＮＡ）は、リボヌクレオチド、例えば、１０ｎｔ以下、２０ｎｔ以下、５０ｎｔ以下、１００ｎｔ以下、５００ｎｔ以下、１０００ｎｔ以下、２０００ｎｔ以下、３０００ｎｔ以下、４０００ｎｔ以下、または５０００ｎｔ以下、１０，０００ｎｔ以下、２５，０００ｎｔ以下、５０，０００ｎｔ以下、７５，０００ｎｔ以下、１００，０００ｎｔ以下で構成されるポリマーであり得る。テンプレートＲＮＡは、メッセンジャーＲＮＡ（ｍＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、低分子干渉ＲＮＡ（ｓｉＲＮＡ）、トランス作動性低分子干渉ＲＮＡ（ｔａ－ｓｉＲＮＡ）、天然低分子干渉ＲＮＡ（ｎａｔ－ｓｉＲＮＡ）、リボソームＲＮＡ（ｒＲＮＡ）、トランスファーＲＮＡ（ｔＲＮＡ）、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、核内低分子ＲＮＡ（ｓｎＲＮＡ）、長鎖ノンコーディングＲＮＡ（ｌｎｃＲＮＡ）、ノンコーディングＲＮＡ（ｎｃＲＮＡ）、トランスファーメッセンジャーＲＮＡ（ｔｍＲＮＡ）、前駆体メッセンジャーＲＮＡ（ｐｒｅ－ｍＲＮＡ）、低分子カハール体特異的ＲＮＡ（ｓｃａＲＮＡ）、ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、エンドリボヌクレアーゼ調製ｓｉＲＮＡ（ｅｓｉＲＮＡ）、低分子テンポラルＲＮＡ（ｓｔＲＮＡ）、シグナル認識ＲＮＡ、テロメアＲＮＡ、リボザイム、ウイルスＲＮＡ、または、それらのＲＮＡタイプもしくはそのサブタイプの任意の組み合わせを含むがこれらに限定されない任意のタイプのＲＮＡ（またはそのサブタイプ）であり得る。

【0023】

テンプレートＲＮＡを含むＲＮＡサンプルは、産物核酸を生成するために十分な量で反応混合物に組み合わされ得る。一実施形態によれば、ＲＮＡサンプルは、反応混合物中のＲＮＡの最終濃度が、１ｐｇ／μＬから５μｇ／μＬなど、０．００１μｇ／μＬから２．５μｇ／μＬなど、０．００５μｇ／μＬから１μｇ／μＬなど、０．１μｇ／μＬから０．２５μｇ／μＬを含む０．０１μｇ／μＬから０．５μｇ／μＬなど、１ｆｇ／μＬから１０μｇ／μＬとなるように反応混合物に組み合わされる。特定の態様では、テンプレートＲＮＡを含むＲＮＡサンプルは、単一細胞から単離される。他の態様では、テンプレートＲＮＡを含むＲＮＡサンプルは、２、３、４、５、６、７、８、９、１０個以上、２０個以上、５０個以上、１００個以上、または５００個以上の細胞、７５０個以上の細胞、１，０００個以上の細胞、２，０００個以上の細胞、５，０００個以上を含む細胞から単離される。場合によっては、ＲＮＡサンプルは組織サンプルから調製され得る。特定の実施形態によれば、テンプレートＲＮＡを含むＲＮＡサンプルは、５００個以下、１００個以下、５０個以下、２０個以下、１０個以下、９、８、７、６、５、４、３または２個の細胞から単離される。

【0024】

テンプレートＲＮＡは、単一細胞、複数の細胞（例えば、培養細胞）、組織、器官、または生物（例えば、細菌、酵母、または、植物、マウス、もしくはワームなどの高等真核生物）から単離された核酸サンプルを含むがこれらに限定されない、対象の任意の核酸サンプルに存在し得る。特定の態様において、核酸サンプルは、胚、胚盤胞、胚培養もしくは他の細胞からの使用済み培地、組織、または器官培養培地を含むがこれらに限定されない、細胞（複数可）、組織、器官および／または同様のものから単離される。他の態様において、サンプルは、血液、尿、唾液、血小板、微小胞、エクソソーム、血清、または他の体液など、診断に使用するために適した体の区画から単離され得る。いくつかの態様において、最初の核酸サンプルは、哺乳動物（例えば、ヒト、げっ歯類（例えば、マウス）、または対象の任意の他の哺乳動物）から得られる。他の態様において、核酸サンプルは、哺乳動物以外のソース、例えば、細菌、酵母、昆虫（例えば、ショウジョウバエ）、両生類（例えば、カエル（例えば、ゼノプス））、ウイルス、植物、または任意の他の非哺乳動物の核酸サンプルソースから単離される。そのようなソースからＲＮＡを単離するためのアプローチ、試薬、およびキットは当技術分野で知られている。例えば、ＣｌｏｎｔｅｃｈＬａｂｏｒａｔｏｒｉｅｓ、Ｉｎｃ．（ＭｏｕｎｔａｉｎＶｉｅｗ、ＣＡ）のＮｕｃｌｅｏＳｐｉｎ（登録商標）、ＮｕｃｌｅｏＭａｇ（登録商標）、およびＮｕｃｌｅｏＢｏｎｄ（登録商標）ＲＮＡ分離キットなどの、対象のソースからＲＮＡを分離するためのキットは市販されている。特定の態様において、ＲＮＡは、固定された生物学的サンプル、例えば、ホルマリン固定、パラフィン包埋（ＦＦＰＥ）組織から単離される。ＦＦＰＥ組織からのＲＮＡは、ＣｌｏｎｔｅｃｈＬａｂｏｒａｔｏｒｉｅｓ、Ｉｎｃ．（ＭｏｕｎｔａｉｎＶｉｅｗ、ＣＡ）のＮｕｃｌｅｏＳｐｉｎ（登録商標）ＦＦＰＥＲＮＡキットなどの市販のキットを使用して単離され得る。

【0025】

主題の方法を実施する場合、さまざまなポリメラーゼを採用し得る。テンプレートスイッチング反応で反応混合物に組み合わされるポリメラーゼは、テンプレートスイッチングが可能であり、ポリメラーゼは、重合のためのテンプレートとして第１の核酸鎖を使用し、そして、同じ重合反応を継続するために第２の「アクセプター」テンプレート核酸鎖の３’末端に切り替わる（例えば、テンプレートスイッチング）。特定の態様において、反応混合物に組み合わされるポリメラーゼは、逆転写酵素（ＲＴ）である。方法の実践への使用が見出されるテンプレートスイッチングが可能な逆転写酵素には、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、レトロプラスミド逆転写酵素、レトロン逆転写酵素、細菌逆転写酵素、グループＩＩイントロン由来逆転写酵素、およびその突然変異体、変異体、誘導体、または機能的フラグメント、例えば、ＲＮａｓｅＨＭｉｎｕｓまたはＲＮａｓｅＨ還元酵素（例えば、ＳｕｐｅｒｓｃｒｉｐｔＲＴまたはＭａｘｉｍａＨＭｉｎｕｓＲＴ（ＴｈｅｒｍｏＦｉｓｈｅｒ））が含まれるが、これらに限定されない。例えば、逆転写酵素は、モロニーマウス白血病ウイルス逆転写酵素（ＭＭＬＶＲＴ）またはカイコ逆転写酵素（例えば、カイコＲ２非ＬＴＲ要素逆転写酵素）であり得る。主題の方法の実施への使用が見出されるテンプレートスイッチングが可能なポリメラーゼは市販されており、ＴａｋａｒａＢｉｏＵＳＡ、Ｉｎｃ．（ＭｏｕｎｔａｉｎＶｉｅｗ、ＣＡ）から入手可能なＳＭＡＲＴＳｃｒｉｂｅ（商標）逆転写酵素が含まれる。特定の態様では、２つ以上の異なるポリメラーゼのミックスが、例えば、改善された処理能力、校正および／または同様のもののために、反応混合物に追加される。場合によっては、ポリマーは、テンプレートまたはそのソースに対して異種のものである。ポリメラーゼは、ポリメラーゼの最終濃度が所望量の産物核酸を生成するために十分であるように、反応混合物に組み合わされる。特定の態様では、ポリメラーゼ（例えば、ＭＭＬＶＲＴまたはカイコＲＴなどの逆転写酵素）は、反応混合物中に、０．１から２００ユニット／μＬ（Ｕ／μＬ）、例えば０．５～１００Ｕ／μＬ、例えば１～５０Ｕ／μＬ、例えば２０Ｕ／μＬを含む５～２５Ｕ／μＬの最終濃度で存在する。

【0026】

テンプレートスイッチング能力に加えて、反応混合物に組み合わされたポリメラーゼは、産物核酸の生成を容易にするための他の有用な機能を含み得る。例えば、ポリメラーゼは末端トランスフェラーゼ活性を有し得、当ポリメラーゼは、ＤＮＡ分子の３’ヒドロキシル末端へのデオキシリボヌクレオチドのテンプレート非依存性付加を触媒することができる。特定の態様では、ポリメラーゼがテンプレートＲＮＡの５’末端に到達すると、ポリメラーゼは、テンプレートによってコードされていない新生鎖の３’末端に１つまたは複数の追加のヌクレオチドを組み込むことができる。例えば、ポリメラーゼが末端トランスフェラーゼ活性を有する場合、ポリメラーゼは、新生ＤＮＡ鎖の３’末端に１、２、３、４、５、６、７、８、９、１０またはそれ以上の追加のヌクレオチドを組み込むことができ得る。特定の態様において、末端トランスフェラーゼ活性を有するポリメラーゼは、新生ＤＮＡ鎖の３’末端に１０以下、例えば５以下（例えば、３）の追加のヌクレオチドを組み込む。すべてのヌクレオチドが同じである場合もあれば（例えば、新生鎖の３’末端にホモヌクレオチドストレッチを作成）、ヌクレオチドの少なくとも１つが他のもの（複数可）と異なる場合もある。特定の態様において、ポリメラーゼの末端トランスフェラーゼ活性は、２、３、４、５、６、７、８、９、１０またはそれ以上の同じヌクレオチド（例えば、すべてのｄＣＴＰ、すべてのｄＧＴＰ、すべてのｄＡＴＰ、またはすべてのｄＴＴＰ）のホモヌクレオチドストレッチの付加をもたらす。特定の実施形態によれば、ポリメラーゼの末端トランスフェラーゼ活性は、１０以下、例えば、９、８、７、６、５、４、３、または２（例えば、３）の同じヌクレオチドのホモヌクレオチドストレッチの付加をもたらす。例えば、一実施形態によれば、ポリメラーゼは、ＭＭＬＶ逆転写酵素（ＭＭＬＶＲＴ）である。ＭＭＬＶＲＴは、新生ＤＮＡ鎖の３’末端に追加のヌクレオチド（主にｄＣＴＰ、例えば３つのｄＣＴＰ）を組み込んでいる。本明細書の他の場所でより詳細に記載されるように、これらの追加のヌクレオチドは、例えば、テンプレートＲＮＡからテンプレートスイッチオリゴヌクレオチドへのポリメラーゼによるテンプレートスイッチングを容易にするために、テンプレートスイッチオリゴヌクレオチドの３’末端と新生ＤＮＡ鎖の３’末端との間のハイブリダイゼーションを可能にするために有用であり得る。例えば、ホモヌクレオチドストレッチが新生ｃＤＮＡ鎖に付加される場合、テンプレートスイッチオリゴヌクレオチドは、ホモヌクレオチドストレッチに相補的な３’ハイブリダイゼーションドメインを有して、テンプレートスイッチオリゴヌクレオチドの３’末端と新生ｃＤＮＡ鎖の３’末端との間のハイブリダイゼーションを可能にし得る。同様に、ヘテロヌクレオチドストレッチが新生ｃＤＮＡ鎖に付加される場合、テンプレートスイッチオリゴヌクレオチドは、ヘテロヌクレオチドストレッチに相補的な３’ハイブリダイゼーションドメインを有して、テンプレートスイッチオリゴヌクレオチドの３’末端と新生ｃＤＮＡ鎖の３’末端との間のハイブリダイゼーションを可能にし得る。

【0027】

ｃＤＮＡ合成プライマーは、ＲＮＡをテンプレートとして使用して第１鎖ｃＤＮＡの合成を開始するプライマーである。特定の実施形態によれば、ｃＤＮＡ合成プライマーは２つ以上のドメインを含む。例えば、プライマーは、テンプレートＲＮＡにハイブリダイズする第１の（例えば、３’）ドメインおよびテンプレートＲＮＡにハイブリダイズしない第２の（例えば、５’）ドメインを含み得る。第１および第２のドメインの配列は、独立して定義され得るか、または任意であり得る。特定の態様では、第１のドメインは、定義された配列（例えば、オリゴｄＴ配列またはＲＮＡ特異的配列）または任意の配列（例えば、ランダム六量体配列などのランダム配列）を有し、第２のドメインの配列は、定義された、例えば、ＰＣＲプライマー部位などの増幅プライマー部位、例えば、逆増幅プライマー部位である。実施形態において、増幅プライマー部位は、テンプレートスイッチオリゴヌクレオチドの増幅プライマー部位と同じであっても異なっていてもよい。

【0028】

「シーケンシングプラットフォームアダプター構築物」とは、以下によって提供されるシーケンシングプラットフォームなどの対象のシーケンシングプラットフォームによって利用される核酸ドメイン（例えば、シーケンシングプラットフォームアダプター核酸配列）の少なくとも一部を含む核酸構築物を意味する：Ｉｌｌｕｍｉｎａ（登録商標）（例えば、ＨｉＳｅｑ（商標）、ＭｉＳｅｑ（商標）および／またはＧｅｎｏｍｅＡｎａｌｙｚｅｒ（商標）シーケンシングシステム）；ＩｏｎＴｏｒｒｅｎｔ（商標）（例えば：ＩｏｎＰＧＭ（商標）および／またはＩｏｎＰｒｏｔｏｎ（商標）シーケンシングシステム）；ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ（例えば：ＰＡＣＢＩＯＲＳＩＩシーケンシングシステム）；ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（商標）（例えば、ＳＯＬｉＤシーケンシングシステム）；Ｒｏｃｈｅ（例えば、４５４ＧＳＦＬＸ＋および／またはＧＳＪｕｎｉｏｒシーケンシングシステム）；または対象の任意の他のシーケンシングプラットフォーム。特定の態様において、シーケンシングプラットフォームアダプター構築物は、以下から選択される１つ以上の核酸ドメインを含む：表面に付着したシーケンシングプラットフォームオリゴヌクレオチド（例えば、Ｉｌｌｕｍｉｎａ（登録商標）シーケンシングシステムのフローセルの表面に付着したＰ５またはＰ７オリゴヌクレオチド）に特異的に結合したドメイン（例えば、「キャプチャ部位」または「キャプチャ配列」）；シーケンシングプライマー結合ドメイン（例えば、Ｉｌｌｕｍｉｎａ（登録商標）プラットフォームのリード１またはリード２プライマーが結合し得るドメイン）；バーコードドメイン（例えば、特定のバーコードまたは「タグ」で所与サンプルからすべての分子をマーキングすることにより、サンプル多重化を可能にするために、シーケンシングされる核酸のサンプルソースを固有に識別するドメイン）；バーコードシーケンシングプライマー結合ドメイン（バーコードのシーケンシングに使用されるプライマーが結合するドメイン）；対象の分子を固有にマーキングして、固有のタグがシーケンシングされるインスタンスの数に基づいて発現レベルを決定するための分子識別ドメイン（例えば、４、６、または他の数のヌクレオチドのランダム化タグなどの分子インデックスタグ）；またはそのようなドメインの任意の組み合わせ。特定の態様では、バーコードドメイン（例えば、サンプルインデックスタグ）および分子識別ドメイン（例えば、分子インデックスタグ）は、同じ核酸に含まれ得る。シーケンシングプラットフォームアダプタードメインは、存在する場合、対象のシーケンシングプラットフォームに適した任意の長さおよび配列の１つまたは複数の核酸ドメインを含み得る。特定の態様において、核酸ドメインは、４から２００ｎｔの長さである。例えば、核酸ドメインは、長さが４～１００ｎｔ、例えば、６～７５、８～５０、または１０～４０ｎｔの長さであり得る。特定の実施形態によれば、シーケンシングプラットフォームアダプター構築物は、長さが２から８ヌクレオチド、例えば、９から１５、１６から２２、２３から２９、または３０から３６ｎｔの長さの核酸ドメインを含む。

【0029】

核酸ドメインは、例えば、核酸ドメインに隣接するｃＤＮＡインサートの合成による固相増幅および／またはシーケンシングのために、対象のシーケンシングプラットフォームによって採用されるポリヌクレオチド（例えば、オリゴヌクレオチド）が核酸ドメインに特異的に結合することを可能にする長さおよび配列を有し得る。核酸ドメインの例には、Ｉｌｌｕｍｉｎａ（登録商標）ベースのシーケンシングプラットフォームで採用される、Ｐ５（５’－ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡ－３’）（ＳＥＱＩＤＮＯ：０１）、Ｐ７（５’－ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡＧＡＴ－３’）（ＳＥＱＩＤＮＯ：０２）、リード１プライマー（５’－ＡＣＡＣＴＣＴＴＴＣＣＣＴＡＣＡＣＧＡＣＧＣＴＣＴＴＣＣＧＡＴＣＴ－３’）（ＳＥＱＩＤＮＯ：０３）およびリード２プライマー（５’－ＧＴＧＡＣＴＧＧＡＧＴＴＣＡＧＡＣＧＴＧＴＧＣＴＣＴＴＣＣＧＡＴＣＴ－３’）（ＳＥＱＩＤＮＯ：０４）ドメインが含まれる。他の例示的な核酸ドメインには、ＩｏｎＴｏｒｒｅｎｔ（商標）ベースのシーケンシングプラットフォームで採用される、Ａアダプター（５’－ＣＣＡＴＣＴＣＡＴＣＣＣＴＧＣＧＴＧＴＣＴＣＣＧＡＣＴＣＡＧ－３’）（ＳＥＱＩＤＮＯ：０５）およびＰ１アダプター（５’－ＣＣＴＣＴＣＴＡＴＧＧＧＣＡＧＴＣＧＧＴＧＡＴ－３’）（ＳＥＱＩＤＮＯ：０６）ドメインが含まれる。対象のシーケンシングプラットフォームでのシーケンシングに有用な核酸ドメインのヌクレオチド配列は、時間とともに変化および／または変異し得る。アダプター配列は典型的には、シーケンシングプラットフォームの製造業者によって提供される（例えば、シーケンシングシステムとともに提供される技術文書にて、および／または製造業者のＷｅｂサイトで入手可能）。そのような情報に基づいて、テンプレートスイッチオリゴヌクレオチド、第１鎖ｃＤＮＡプライマー、増幅プライマーおよび／または同様のものの任意のシーケンシングプラットフォームアダプタードメインの配列は、対象のプラットフォーム上で核酸インサート（テンプレートＲＮＡに対応）のシーケンシングを可能にする構成で、１つ以上の核酸ドメインの全部または一部を含むように設計され得る。

【0030】

ｃＤＮＡ合成プライマーは、修飾されているか、さもなければ天然に発生しない、１つまたは複数のヌクレオチド（またはその類似体）を含み得る。例えば、プライマーは、１つまたは複数のヌクレオチド類似体（例えば、ＬＮＡ、ＦＡＮＡ、２’－Ｏ－ＭｅＲＮＡ、２’－フルオロＲＮＡなど）、結合修飾（例えば、ホスホロチオエート、３’－３’および５’－５’逆結合）、５’および／または３’末端修飾（例えば、５’および／または３’アミノ、ビオチン、ＤＩＧ、リン酸、チオール、染料、クエンチャーなど）、１つまたは複数の蛍光標識ヌクレオチド、またはｃＤＮＡ合成をプライミングするプライマーに望ましい機能を提供する任意の他の特徴を含み得る。

【0031】

実施形態では、二本鎖産物核酸をテンプレートとして使用するいかなるその後の伸長反応も、プライマーに対応する二本鎖産物核酸の領域内の特定の位置を超えて伸長するのを防ぐことが望ましい場合がある。例えば、特定の実施形態によれば、第１鎖ｃＤＮＡプライマーは、プライマーに対応する領域をテンプレートとして使用するポリメラーゼが、修飾を超えて新生鎖を重合すことを防ぐポリメラーゼブロッキング修飾を含む。有用な修飾には、脱塩基病変（例えば、テトラヒドロフラン誘導体）、ヌクレオチド付加物、イソヌクレオチド塩基（例えば、イソシトシン、イソグアニンおよび／または同様のもの）、およびそれらの任意の組み合わせが含まれるが、これらに限定されない。そのようなブロッキング修飾は、第１鎖ｃＤＮＡプライマー、テンプレートスイッチオリゴヌクレオチド、産物二本鎖ｃＤＮＡを生成するための第１鎖ｃＤＮＡの増幅に使用される第１および第２の増幅、例えばＰＣＲ、プライマー、タグ付け産物のＰＣＲ増幅に使用される増幅プライマー、および、それらの任意の組み合わせを含む、本開示の方法を実施するときに使用される核酸試薬のいずれかに含まれ得る。場合によっては、増幅、例えばＰＣＲ、プライマーなどの本発明の方法で使用されるプライマーは、ライゲーションブロックを含む。必要に応じて、所与のプライマーに存在し得る対象のライゲーションブロックには、アミン、逆Ｔ、およびビオチン－ＴＥＧが含まれるが、これらに限定されない。

【0032】

「テンプレートスイッチオリゴヌクレオチド」とは、核酸重合反応中にポリメラーゼが最初のテンプレート（例えば、テンプレートＲＮＡ）から切り替わるオリゴヌクレオチドテンプレートを意味する。これに関して、テンプレートＲＮＡは「ドナーテンプレート」と呼ばれ得、テンプレートスイッチオリゴヌクレオチドは「アクセプターテンプレート」と呼ばれ得る。本明細書で使用される場合、「オリゴヌクレオチド」は、２～５００ｎｔ、例えば、２～２００ｎｔのヌクレオチドの一本鎖多量体を指すことができる。オリゴヌクレオチドは、合成であってもよく、酵素的に作製されてもよく、いくつかの実施形態では、長さが１０から５０ｎｔである。オリゴヌクレオチドは、リボヌクレオチドモノマー（すなわち、オリゴリボヌクレオチドまたは「ＲＮＡオリゴヌクレオチド」であり得る）またはデオキシリボヌクレオチドモノマー（すなわち、オリゴデオキシリボヌクレオチドまたは「ＤＮＡオリゴヌクレオチド」であり得る）を含み得る。オリゴヌクレオチドは、例えば、１０～２０ｎｔ、２１～３０ｎｔ、３１～４０ｎｔ、４１～５０ｎｔ、５１～６０ｎｔ、６１～７０ｎｔ、７１～８０ｎｔ、８０～１００ｎｔ、１００～１５０ｎｔまたは１５０～２００ｎｔ、最大５００ｎｔまたはそれ以上の長さであり得る。採用される場合、場合によっては、テンプレートスイッチオリゴヌクレオチドは、０．０１から１００μＭ、例えば、０．１から１０μＭ、例えば、２から３μＭを含む０．５から５μＭの最終濃度で反応混合物に追加され得る。

【0033】

テンプレートスイッチオリゴヌクレオチドは、修飾されているか、さもなければ天然に発生しない１つまたは複数のｎｔ（またはその類似体）を含み得る。例えば、テンプレートスイッチオリゴヌクレオチドは、１つ以上のヌクレオチド類似体（例えば、ＬＮＡ、ＦＡＮＡ、２’－Ｏ－ＭｅＲＮＡ、２’－フルオロＲＮＡなど）、結合修飾（例えば、ホスホロチオエート、３’－３’および５’－５’逆結合）、５’および／または３’末端修飾（例えば、５’および／または３’アミノ、ビオチン、ＤＩＧ、ホスフェート、チオール、染料、クエンチャーなど）、１つ以上の蛍光標識されたｎｔ、またはテンプレートスイッチオリゴヌクレオチドに望ましい機能を提供する任意の他の特徴を含み得る。任意の所望のヌクレオチド類似体、結合修飾および／または末端修飾は、本開示の方法を実施するときに使用される核酸試薬のいずれかに含まれ得る。

【0034】

テンプレートスイッチオリゴヌクレオチドは、３’ハイブリダイゼーションドメインおよび５’増幅プライマー部位を含み得る。３’ハイブリダイゼーションドメインは長さが異なり得、場合によっては、長さが３～７ｎｔなど、長さが２～１０ｎｔの範囲になる。３’ハイブリダイゼーションドメイン、すなわちテンプレートスイッチドメインの配列は、任意の便利な配列、例えば、任意の配列、ヘテロポリマー配列（例えば、ヘテロトリヌクレオチド）またはホモポリマー配列（例えば、Ｇ－Ｇ－Ｇなどのホモトリヌクレオチド）などであり得る。３’ハイブリダイゼーションドメインおよびテンプレートスイッチオリゴヌクレオチドの例は、米国特許第５，９６２，２７２号および公開されたＰＣＴ出願公開番号ＷＯ２０１５０２７１３５にさらに記載され、その開示は参照により本明細書に組み込まれる。

【0035】

特定の実施形態によれば、テンプレートスイッチオリゴヌクレオチドは、テンプレートスイッチオリゴヌクレオチドの５’末端の補体（例えば、テンプレートスイッチオリゴヌクレオチドの５’アダプター配列）を合成した後、ポリメラーゼがテンプレートスイッチオリゴヌクレオチドから異なるテンプレート核酸に切り替わることを防ぐ修飾を含む。有用な修飾には、脱塩基障害（例えば、テトラヒドロフラン誘導体）、ヌクレオチド付加物、イソヌクレオチド塩基（例えば、イソシトシン、イソグアニンおよび／または同様のもの）、およびそれらの任意の組み合わせが含まれるが、これらに限定されない。

【0036】

上記の成分に加えて、テンプレートスイッチオリゴヌクレオチドは、これらに限られないが、バーコードドメイン、固有分子識別子ドメイン、シーケンシングプラットフォームアダプター構築ドメインなど、上記の５’ドメインと３’ドメインとの間に位置するいくつかの追加の成分またはドメインをさらに含み得、これらのドメインは、上記のとおりであり得る。

【0037】

フラグメント化とは、核酸分子がより短いフラグメントに破壊される任意のプロトコルを指す。フラグメント化プロトコルには、マイクロピペットチップまたはファインゲージニードルを介したＲＮＡサンプルの１回以上の移動、サンプルの噴霧、サンプルの超音波処理（例えば、Ｃｏｖａｒｉｓ、Ｉｎｃ．（Ｗｏｂｕｒｎ、ＭＡ）による集束超音波処理機の使用）、ビーズ媒介剪断、酵素剪断（例えば、１つまたは複数のＲＮＡ剪断酵素を使用して、または酵素消化による、例えば、対象のポリヌクレオチドに適切な制限酵素または他のエンドヌクレアーゼによる）、化学物質ベースのフラグメント化、例えば、二価カチオン、フラグメント化バッファー（熱と組み合わせて使用され得る）の使用、または前駆体ＲＮＡを剪断／フラグメント化してより短いテンプレートＲＮＡを生成するための任意の他の適切なアプローチの使用が含まれるが、これらに限られない。特定の態様において、開始核酸サンプルのフラグメント化によって生成された核酸フラグメントは、例えば、選択したシーケンシングプラットフォームに応じて、１０～２０ｎｔ、２０～３０ｎｔ、３０～４０ｎｔ、４０～５０ｎｔ、５０～６０ｎｔ、６０～７０ｎｔ、７０～８０ｎｔ、８０～９０ｎｔ、９０～１００ｎｔ、１００～１５０ｎｔ、１５０～２００ｎｔの長さ、または２００～２５０ｎｔ、または２００～１０００ｎｔまたは１０００～１０，０００ｎｔでさえある長さを有する。

【0038】

場合によっては、フラグメント化は、タグ付け、すなわち、トランスポソーム媒介フラグメント化を含む。トランスポソーム媒介フラグメント化（タグ付け）では、トランスポソームはＤＮＡで調製され、後で切断されるため、転位イベントにより、（挿入ではなく）アダプターでフラグメント化ＤＮＡが生成される。本開示の方法で採用されるトランスポソームは、他のドメインの中でもトランスポゾン末端ドメインを含み得るトランスポザーゼおよびトランスポゾン核酸を含む。任意のドメインは機能的に定義されているため、必要に応じて、同じシーケンス内のものであっても、異なるシーケンスであってもよい。ドメインが重複する場合もある。

【0039】

「トランスポザーゼ」は、トランスポゾン末端ドメイン含有組成物（例えば、トランスポゾン、トランスポゾン末端、トランスポゾン末端組成物）と機能的複合体を形成し、トランスポゾン末端含有組成物の、それがインビトロ転位反応でインキュベートされる二重鎖標的ＤＮＡへの挿入または転位を触媒することができる酵素を意味する。本開示の方法を実施する際に使用が見出されるトランスポザーゼには、Ｔｎ５トランスポザーゼ、Ｔｎ７トランスポザーゼ、およびＭｕトランスポザーゼが含まれるが、これらに限定されない。トランスポザーゼは野生型トランスポザーゼであり得る。他の態様において、トランスポザーゼは、トランスポザーゼの特性を改善するために、例えば、トランスポザーゼの活性を増強するために、１つ以上の修飾（例えば、アミノ酸置換）を含む。例えば、Ｔｎ５タンパク質に置換変異を有するＴｎ５トランスポザーゼの高活性変異体（例えば、Ｅ５４Ｋ、Ｍ５６ＡおよびＬ３７２Ｐ）が開発されており、例えば、Ｐｉｃｅｌｌｉｅｔａｌ．（２０１３）ＧｅｎｏｍｅＲｅｓｅａｒｃｈ２４：２０３３－２０４０に記載されている。追加のＴｎ５置換変異には、Ｙ４１Ｈ；Ｔ４７Ｐ；Ｅ５４Ｖ、Ｅ１１０Ｋ、Ｐ２４２Ａ、Ｅ３４４ＡおよびＥ３４５Ａが含まれるが、これらに限定されない。所与のＴｎ５変異体は、１つまたは複数の置換を含み得、存在し得る置換の組み合わせには、Ｔ４７Ｐ、Ｍ５６ＡおよびＬ３７２Ｐ；ＴＴ４７Ｐ、Ｍ５６Ａ、Ｐ２４２ＡおよびＬ３７２Ｐ；ならびにＭ５６Ａ、Ｅ３４４ＡおよびＬ３７２Ｐが含まれるが、これらに限定されない。

【0040】

「トランスポゾン末端ドメイン」という用語は、インビトロ転位反応において機能するトランスポザーゼまたはインテグラーゼ酵素との複合体を形成するために必要なヌクレオチド配列（「トランスポゾン末端配列」）を含む二本鎖ＤＮＡを意味する。トランスポゾン末端ドメインは、トランスポゾン末端ドメインを認識してそれに結合するトランスポザーゼまたはインテグラーゼと「複合体」または「シナプス複合体」または「トランスポソーム複合体」または「トランスポソーム組成物」を形成し、その複合体がトランスポゾン末端ドメインを、それがインビトロ転位反応でインキュベートされる標的ＤＮＡに挿入または転移させることができる。トランスポゾン末端ドメインは、「転移トランスポゾン末端配列」または「転移鎖」と「非転移トランスポゾン末端配列」または「非転移鎖」からなる２つの相補的配列を示す。例えば、インビトロ転位反応にて活性である高活性Ｔｎ５トランスポザーゼ（例えば、ＥＺ－Ｔｎ５トランスポザーゼ、ＥＰＩＣＥＮＴＲＥＢｉｏｔｅｃｈｎｏｌｏｇｉｅｓ、Ｍａｄｉｓｏｎ、Ｗｉｓ、ＵＳＡ）と複合体を形成する１つのトランスポゾン末端ドメインは、５’ＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ３’（ＳＥＱＩＤＮＯ：０７）のように「転移トランスポゾン末端配列」を示す転移鎖、および、５’ＣＴＧＴＣＴＣＴＴＡＴＡＣＡＣＡＴＣＴ３’（ＳＥＱＩＤＮＯ：８）のように「非転移トランスポゾン末端配列」を示す非転移鎖を含む。転移鎖の３’末端は、インビトロ転位反応で標的ＤＮＡに結合または転移される。転移トランスポゾン末端配列に相補的なトランスポゾン末端配列を示す非転移鎖は、インビトロ転位反応において標的ＤＮＡに結合または転移されない。本開示の方法を実施するときに採用される特定のトランスポゾン末端ドメインの配列は、採用される特定のトランスポザーゼに応じてさまざまである。例えば、Ｔｎ５トランスポゾン末端ドメインは、Ｔｎ５トランスポザーゼと組み合わせて使用される場合、トランスポゾン核酸に含まれ得る。

【0041】

トランスポゾン末端ドメインに加えて、トランスポゾン核酸はまた、タグ付け後増幅プライマー部位などの１つまたは複数の追加ドメインを含み得る。場合によっては、タグ付け後の増幅プライマー部位は、例えば上記のように、シーケンシングプラットフォームアダプター構築物ドメインを含む。このドメインは、表面に付着したシーケンシングプラットフォームオリゴヌクレオチド（例えば、Ｉｌｌｕｍｉｎａ（登録商標）シーケンシングシステムのフローセルの表面に付着したＰ５またはＰ７オリゴヌクレオチド）に特異的に結合するドメイン（例えば、「キャプチャ部位」または「キャプチャ配列」）、シーケンシングプライマー結合ドメイン（例えば、Ｉｌｌｕｍｉｎａ（登録商標）プラットフォームのリード１またはリード２プライマーが結合し得るドメイン）、バーコードドメイン（例えば、特定のバーコードまたは「タグ」で所与サンプルからのすべての分子をマーキングすることによってサンプルの多重化を可能にするためにシーケンシングされる核酸のサンプルソースを固有に識別するドメイン）、バーコードシーケンシングプライマー結合ドメイン（バーコードのシーケンシングに使用されるプライマーが結合するドメイン）、分子識別ドメイン、またはそのようなドメインの任意の組み合わせから選択される核酸ドメインであり得る。

【0042】

タグ付けステップのためにトランスポソームを調製することが望ましい場合、任意の適切なトランスポソーム調製アプローチを使用し得、そのようなアプローチは、例えば、採用される特定のトランスポザーゼおよびトランスポゾン核酸に応じて変化し得る。例えば、トランスポゾン核酸およびトランスポザーゼは、適切なバッファー中で適切なモル比（例えば、２：１のモル比、１：１のモル比、１：２のモル比など）で一緒にインキュベートされ得る。一実施形態によれば、トランスポザーゼがＴｎ５トランスポザーゼである場合、トランスポソームの調製は、トランスポザーゼおよびトランスポゾン核酸を２×Ｔｎ５透析バッファー中で１：１のモル比で十分な時間、例えば１時間、インキュベートすることを含み得る。

【0043】

タグ付けには、タグ付け条件下で二本鎖核酸をトランスポソームと接触させることが含まれる。そのような条件は、採用される特定のトランスポザーゼに応じて変化し得る。場合によっては、条件は、トランスポソームおよびタグ付き伸長産物を、ｐＨ７．５などのｐＨ７から８の緩衝反応混合物（例えば、トリスアセテートなどで緩衝された反応混合物）中でインキュベートすることを含む。トランスポソームは、タグ付けされた伸長産物と比較して、トランスポゾンの約１モル当量またはモル過剰が存在するように提供され得る。適切な温度には、３７℃などの３２℃から４２℃が含まれる。反応は、５分から３時間などの十分な時間の間、進行させられる。反応は、反応を終結させるために適した量のＳＤＳおよび／または他のトランスポザーゼ反応終結試薬を含み得る溶液（例えば、「停止」溶液）を加えることによって終結させ得る。トランスポソームを使用して核酸のフラグメント化を達成するためのプロトコルおよび材料が利用可能であり、例えば、ＥＰＩＣＥＮＴＲＥＢｉｏｔｅｃｈｎｏｌｏｇｉｅｓ（Ｍａｄｉｓｏｎ、Ｗｉｓ、ＵＳＡ）から入手可能なＥＺ－Ｔｎ５（商標）転置キットで提供されるものが含まれる。

【0044】

本発明のいくつかの態様において、本方法は、単一細胞を取得するステップを含む。単一細胞の取得は、任意の便利なプロトコルに従って行われ得る。単一細胞懸濁液は、例えば、トリプシンまたはパパインを酵素的に使用して組織サンプル中の細胞を接続するタンパク質を消化するか、培養中の付着細胞を放出するか、またはサンプル中の細胞を機械的に分離することを含む、当技術分野で知られる標準的な方法を使用して取得することができる。単一細胞は、単一細胞を個別に処理できる任意の適切な反応容器に入れることができる。例えば、９６ウェルプレート、３８４ウェルプレート、または２０００、４０００、６０００、１００００以上などの任意の数のウェルを備えたプレートである。マルチウェルプレートは、チップおよび／またはデバイスの一部にすることができる。本開示は、マルチウェルプレート内のウェルの数によって制限されない。さまざまな実施形態において、プレート上のウェルの総数は、１００から２００，０００、または５０００から１０，０００である。他の実施形態では、プレートは、それぞれが５０００から２０，０００のウェルを含む、より小さなチップを含む。例えば、正方形のチップは、直径が０．１ｍｍの１２５×１２５のナノウェルを含み得る。マルチウェルプレートのウェル（例えば、ナノウェル）は、任意の便利なサイズ、形状、または容積で製造され得る。ウェルは、長さが１００μｍから１ｍｍ、幅が１００μｍから１ｍｍ、および深さが１００μｍから１ｍｍであり得る。さまざまな実施形態において、各ナノウェルは、１から４のアスペクト比（深さ対幅の比）を有する。一実施形態では、各ナノウェルは２のアスペクト比を有する。横方向断面領域は、円形、楕円形、長円形、円錐形、長方形、三角形、多面体、または任意の他の形状であり得る。ウェルの任意の所与の深さでの横方向領域も、サイズと形状とが様々であり得る。特定の実施形態では、ウェルは、０．１ｎｌから１μｌの容積を有する。ナノウェルは、５００ｎｌ以下などの１μｌ以下の容積を有し得る。容積は、１００ｎｌ以下などの２００ｎｌ以下であり得る。一実施形態では、ナノウェルの容積は１００ｎｌである。必要に応じて、ナノウェルを、表面積と容積との比率を増加させるように製造して、それによってユニットを介した熱伝達を促進し、熱サイクルのランプタイムを短縮することができる。各ウェル（例えば、ナノウェル）のキャビティは、さまざまな構成を採り得る。例えば、ウェル内のキャビティは、直線状または湾曲した壁によって分割されて、別個であるが隣接する区画を形成し得るか、または円形の壁によって分割されて、内側および外側の環状区画を形成し得る。ウェルは、単一ウェルが単一細胞を含むように設計することができる。個々の細胞はまた、任意の他の適切な容器、例えば、マイクロ流体チャンバー、ドロップレット、ナノウェル、管などで単離され得る。単一細胞を操作するための任意の便利な方法が採用され得、このような方法には、蛍光活性化セルソーティング（ＦＡＣＳ）、ロボット装置注入、重力流、またはマイクロマニピュレーション、および半自動セルピッカー使用（例えば、ＳｔｏｅｌｔｉｎｇＣｏ．のＱｕｉｘｅｌｌ（商標）セルトランスファーシステム）などが含まれる。場合によっては、単一細胞をポアソン統計に従ってプレートのウェルに沈着させることができる（例えば、ウェルの約１０％、２０％、３０％、または４０％またはそれ以上に単一細胞が含まれるようにであるが、その数は、容器に分注される所与単位容積の流体内の細胞数を調整することで定義できる）。場合によっては、適切な反応容器は、ドロップレット（例えば、マイクロドロップレット）を含む。個々の細胞は、例えば、位置、形態、レポーター遺伝子発現、抗体標識、ＦＩＳＨ、細胞内ＲＮＡ標識、またはｑＰＣＲなどの、顕微鏡観察によって検出可能な特徴に基づいて個別に選択することができる。

【0045】

例えば上記のように単一細胞を得た後、細胞を溶解することによりｍＲＮＡを細胞から放出することができる。溶解は、例えば、細胞の加熱または凍結融解によって、または洗浄剤または他の化学的方法の使用によって、またはこれらの組み合わせによって達成することができる。しかし、任意の適切な溶解方法を使用することができる。穏やかな溶解手順を有利に使用して、核クロマチンの放出を防ぎ、それによってｃＤＮＡライブラリのゲノム汚染を回避し、ｍＲＮＡの分解を最小限に抑えることができる。例えば、Ｔｗｅｅｎ－２０の存在下で７２oＣで２分間、細胞を加熱すれば、細胞を溶解するために十分であるが、核クロマチンからのゲノム汚染は検出されない。あるいは、細胞を水中で６５oＣで１０分間（Ｅｓｕｍｉｅｔａｌ．、ＮｅｕｒｏｓｃｉＲｅｓ６０（４）：４３９－５１（２００８））；または、０．５％ＮＰ－４０を添加したＰＣＲバッファーＩＩ（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）で７０oＣで９０秒間（Ｋｕｒｉｍｏｔｏｅｔａｌ．、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３４（５）：ｅ４２（２００６））、加熱することもできる。または、溶解は、プロテイナーゼＫなどのプロテアーゼを使用するか、またはグアニジンイソチオシアネートなどのカオトロピック塩を使用することによって達成することができる（米国公開番号２００７／０２８１３１３）。

【0046】

本明細書に記載の方法の特定の実施形態では、細胞は対象の組織から得られ、単一細胞懸濁液が得られる。単一細胞は、マルチウェルプレートの１つのウェル、またはマイクロ流体チャンバーまたは管などの他の適切な容器に配置される。細胞を溶解し、逆転写反応ミックスを、追加精製せずにライセートに直接、追加する。細胞が溶解されると、コンテナ容器に逆転写試薬が含まれる可能性もある。本開示の方法に従って生成されたＮＧＳライブラリは、所望の複雑さ（例えば、高い複雑さ）を示し得る。ＮＧＳライブラリの「複雑さ」は、ライブラリのシーケンシング時に得られる余分なシーケンシングリード（例えば、同一開始部位の共有）の割合に関連している。複雑さは、余分なシーケンシングリードの割合とは逆関係である。複雑さが低いライブラリでは、特定のターゲット配列が大きな比率を占めるが、他のターゲット（例えば、低レベルで発現されるｍＲＮＡ）は、カバレッジがほとんどまたはまったくない。複雑さが高いライブラリでは、シーケンシングリードは、開始核酸サンプル内のターゲット核酸の既知の分布をより厳密に追跡し、例えば、開始サンプル中に比較的低レベルで存在することが知られているターゲット（例えば、低レベルで発現するｍＲＮＡ）についてのカバレッジを含む。特定の実施形態によれば、本開示の方法に従って生成されるＮＧＳライブラリの複雑さは、シーケンシングリードが開始核酸サンプル（例えば、ＲＮＡサンプル）中の異なる種の標的核酸（例えば、異なる種のｍＲＮＡ）の７０％以上、７５％以上、８０％以上、８５％以上、９０％以上、９５％以上、９６％以上、９７％以上、９８％以上、または９９％以上で生成されるようなものである。ライブラリの複雑さは、シーケンシングリードをリファレンスゲノムまたはトランスクリプトームにマッピングすることで決定され得る（例えば、特定の細胞タイプについて）。シーケンシングライブラリの複雑さを決定するための特定のアプローチが開発されており、Ｄａｌｅｙｅｔａｌ．（２０１３）ＮａｔｕｒｅＭｅｔｈｏｄｓ１０（４）：３２５－３２７に記載のアプローチを含む。

【0047】

特定の態様では、本開示の方法は、ＮＧＳライブラリをＮＧＳプロトコルに供することをさらに含む。プロトコルは、任意の適切なＮＧＳシーケンシングプラットフォームで実行され得る。対象のＮＧＳシーケンシングプラットフォームには、Ｉｌｌｕｍｉｎａ（登録商標）が提供するシーケンシングプラットフォーム（例えば、ＨｉＳｅｑ（商標）、ＭｉＳｅｑ（商標）、および／またはＮｅｘｔＳｅｑ（商標）シーケンシングシステム）；ＩｏｎＴｏｒｒｅｎｔ（商標）（例えば、ＩｏｎＰＧＭ（商標）および／またはＩｏｎＰｒｏｔｏｎ（商標）シーケンシングシステム）；ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ（例えば、ＰＡＣＢＩＯＲＳＩＩＳｅｑｕｅｌシーケンシングシステム）；ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（商標）（例えば、ＳＯＬｉＤシーケンシングシステム）；Ｒｏｃｈｅ（例えば、４５４ＧＳＦＬＸ＋および／またはＧＳＪｕｎｉｏｒシーケンシングシステム）；または任意の他の対象のシーケンシングプラットフォームが含まれるが、これらに限定されない。ＮＧＳプロトコルは、採用される特定のＮＧＳシーケンシングシステムによって異なる。例えば、さらなる増幅（例えば、固相増幅）、アンプリコンのシーケンシング、およびシーケンシングデータの分析を含み得る、ＮＧＳライブラリをシーケンシングするための詳細なプロトコルは、採用されるＮＧＳシーケンシングシステムの製造業者から入手可能である。

【0048】

特定の実施形態では、主題の方法を使用して、対象のシーケンシングプラットフォーム（例えば、Ｉｌｌｕｍｉｎａ（登録商標）、ＩｏｎＴｏｒｒｅｎｔ（商標）、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（商標）、Ｒｏｃｈｅなどによって提供されるシーケンシングプラットフォーム）での下流シーケンシングのためのｍＲＮＡに対応するＮＧＳライブラリが生成され得る。特定の実施形態によれば、主題の方法を使用して、対象のシーケンシングプラットフォームでの下流シーケンシングのための非ポリアデニル化ＲＮＡに対応するＮＧＳライブラリが生成され得る。例えば、マイクロＲＮＡは、ポリアデニル化され、そして、本明細書の他の場所に記載されているように、テンプレートスイッチ重合反応においてテンプレートとして使用され得る。研究者の目的に応じて、ランダムまたは遺伝子特異的プライミングも使用され得る。ライブラリは、コントロールライブラリ（例えば、Ｉｌｌｕｍｉｎａ（登録商標）のＰｈｉＸコントロールライブラリ）と５０：５０で混合され、シーケンシングプラットフォーム（例えば、Ｉｌｌｕｍｉｎａ（登録商標）シーケンシングシステム）でシーケンスされ得る。コントロールライブラリ配列を除去し、残りの配列をｍＲＮＡのソース（例えば、ヒト、マウス、または任意の他のｍＲＮＡソース）のトランスクリプトームにマッピングし得る。

【0049】

本発明がより詳細に説明される前に、本発明は、説明された特定の実施形態に限定されず、それ自体、もちろん様々であり得ることを理解されたい。本発明の範囲は添付の特許請求の範囲によってのみ限定されるので、本明細書で使用される用語は特定の実施形態を説明することのみを目的としており、限定することを意図しないことも理解されたい。

【0050】

値の範囲が提供される場合、文脈が明確に別段の指示をしない限り、下限の単位の１０分の１までの、その範囲の上限と下限との間における各介在値、および、その記載範囲における別様記載のまたは介在する値は、本発明に含まれる。これらのより小さな範囲の上限および下限は、独立してより小さな範囲に含まれ得、また、記載範囲において特に除外された任意の限界を条件として、本発明に含まれる。記載範囲が一方または両方の限界を含む場合、それらの含まれる限界のいずれかまたは両方を除外する範囲も、本発明に含まれる。

【0051】

本明細書では、特定の範囲が示され、数値の前に「約」という用語が付いている。「約」という用語は、本明細書では、それが先行する正確な数、ならびにその用語が先行する数に近いかまたはほぼその数に対する文字通りのサポートを提供するために使用される。数が、具体的に記載された数に近いかまたはほぼ等しい否かを決定する際に、近いかまたは近似する不記載の数は、それが提示される文脈において、具体的に記載された数についての実質的均等をもたらす数であり得る。

【0052】

別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、この発明が属する技術の当業者によって共通して理解されるものと同じ意味を有する。本明細書に記載されたものと類似または均等の任意の方法および材料もまた、本発明の実施または試験に使用することができるが、代表的な例示的方法および材料がここに記載されている。

【0053】

この明細書で引用されるすべての刊行物および特許は、各個々の刊行物または特許が参照により組み込まれることが具体的かつ個別に示されているかのように参照により本明細書に組み込まれ、出版物が関連して引用されている方法および／または材料を記述または記載するために参照により本明細書に組み込まれる。任意の刊行物の引用は、出願日より前のその開示についてであり、本発明が先行発明のためにそのような刊行物に先行する権利がないことを認めるものと解釈されるべきではない。さらに、提供される発行日は、個別に確認する必要があり得る実際の発行日とは異なり得る。

【0054】

本明細書および添付の特許請求の範囲で使用される場合、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈が明確に別段の指示をしない限り、複数の指示対象を含むことに留意されたい。特許請求の範囲は、任意の任意選択的要素を除外するために起草され得ることにさらに留意されたい。したがって、この記述は、特許請求の範囲の要素の列挙に関連して「単独」、「のみ」などの排他的な用語を使用する、または「否定的な」制限を使用するための先行する基礎として機能することを目的としている。

【0055】

この開示を読むと当業者には明らかであるように、本明細書に記載および図示された個々の実施形態のそれぞれは、本発明の範囲または精神から離れることなく他のいくつかの実施形態のいずれかの特徴から容易に分離または組み合わされ得る別個の構成要素および特徴を有する。列挙された任意の方法は、列挙されたイベントの順序で、または論理的に可能な任意の他の順序で実行することができる。

【0056】

装置および方法は、機能的な説明を伴って文法的流動性のために説明されているか、または説明されるが、３５Ｕ．Ｓ．Ｃ．§１１２の下で明示的に定式化されていない限り、特許請求の範囲は、「手段」または「ステップ」の制限の構築によっていかなる場合であっても必ずしも制限されると解釈されるべきではなく、均等法論の下で特許請求の範囲によって提供される定義の意味および均等物の全範囲を与えられるべきであり、特許請求の範囲が３５Ｕ．Ｓ．Ｃ．§１１２に基づいて明示的に定式化されている場合には、３５Ｕ．Ｓ．Ｃ．§１１２に基づく完全な法定均等物が付与されると明示的に理解されるべきである。

【0057】

【0058】

本発明の実施形態は、シーケンシングに適しており、場合によっては、シングルセルリボ核酸シーケンシング（ｓｃＲＮＡ－ｓｅｑ）方法において有用である、ｃＤＮＡ分子を調製する。本発明の実施形態は、従来技術のｓｃＲＮＡ－ｓｅｑ方法とは明らかに対照的に、いずれもの主要な方法の利点を達成し、すなわち、それらは、偏った増幅効果を除去するために使用される固有分子識別子（ＵＭＩ）と互換性があり、それによって増幅前に存在するＲＮＡ分子のカウントを可能にし、完全長までの転写産物カバレッジを提供し、細胞内に存在するＲＮＡ分子の大きなフラクションをキャプチャする。Ｓｍａｒｔ－ｓｅｑおよびＳｍａｒｔ－ｓｅｑ２を含む従来技術の第２の主要な方法は、シングルセルトランスクリプトームの最も感度が高い情報を提供するが、ＵＭＩと互換性がないため、単一細胞内のＲＮＡ分子をカウントするために使用できない。

【0059】

したがって、本発明の実施形態は、同時のＲＮＡ分子のカウントおよび単一細胞におけるトランスクリプトームの完全長カバレッジを可能にする。重要なことに、本発明の実施形態を使用して、ＲＮＡ分子のカウントのためのＵＭＩ、ならびに完全転写産物リードカバレッジの両方を含む単一細胞ｃＤＮＡを生成することができる。本発明の実施形態はまた、内部フラグメントおよび５’末端フラグメントの両方のペアエンドシーケンシングを可能にし、したがって、フラグメントのより良いマッピング、および、転写産物アイソフォーム、ＳＮＰフェージングなどのフラグメントが由来するテンプレートＲＮＡの構造のより詳細な評価を可能にする。本発明の実施形態はさらに、最終シーケンシングライブラリ内のＵＭＩ含有５’リードのパーセンテージを生化学的に微調整することを可能にする。この能力により、本明細書ではスマートｓｅｑ３とも呼ばれる本発明の実施形態は、これまでで最も感度が高い方法であるだけでなく、柔軟であり、異なる実験ニーズに適応可能である。

【0060】

実施形態では、本方法は、逆増幅プライマー部位などのプライマー部位を有するオリゴｄＴの、ＲＮＡ分子のポリＡテール、例えば、ＲＮＡサンプルのｍＲＮＡへのハイブリダイゼーションに基づいている。逆トランスクリプターゼ（ＲＴ）酵素は、ＲＮＡ分子の完全長をテンプレートとして使用してｃＤＮＡを重合する。ＲＴがＲＮＡ分子の末端に達したとき、ｃＤＮＡ鎖の３’末端に数ヌクレオチドを付加することにより、いかなるテンプレートもなしで重合を依然として継続することが好ましい。部分的なＴＮ５モチーフプライマー部位、新規の識別タグ、ＵＭＩ、および３つのｒＧなどの別のプライマー部位を含むテンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）は、ｃＤＮＡ鎖の３’末端にある非テンプレート化ヌクレオチドにハイブリダイズする。ＲＴは、ＴＳＯを新しいテンプレートとして使用して重合を継続し、両端にそれぞれのプライマー部位を持つ伸長ｃＤＮＡ鎖を取得する。いくつかの実施形態において、追加の遊離リボヌクレオチド、ｄＣＴＰまたはＰＥＧの使用は、キャプチャされた遺伝子に関してテンプレートスイッチング反応の効率の増加を可能にする。

【0061】

実施形態では、伸長ｃＤＮＡ鎖は、ＰＣＲ反応において２つのプライマーを使用して増幅され、増幅産物は、場合によっては、例えば、ＩＬＬＵＭＩＮＡ（登録商標）プラットフォームによるシーケンシングのために調製されるＩＬＬＵＭＩＮＡ（登録商標）ＮｅｘｔｅｒａＸＴキットを使用してフラグメント化される。ＴＳＯにおける識別タグおよびＵＭＩは、ＩＬＬＵＭＩＮＡ（登録商標）Ｎｅｘｔｅｒａキットにおけるタグ付けおよびフラグメント化反応とは関係なく、ＩＬＬＵＭＩＮＡ（登録商標）シーケンサーによって読み取られるように設計されている。したがって、シーケンシング後、ＲＮＡ分子の５’末端に属するリードは、識別タグの認識によってキャプチャされることができ、観察された固有のＲＮＡ分子の数を計算するためにＵＭＩに基づいて定量化されることができる。同時に、残りの内部リードを使用して、エクソン、イントロン、および、ゲノムの転写部分内の遺伝的変異を含む、完全長転写産物特徴をマッピングできる。

【0062】

本発明は、ＵＭＩベースのＲＮＡカウントを完全長転写産物カバレッジおよびペアエンドシーケンシングと組み合わせる独自の能力を有する。本明細書に提示される実験データは、本発明が単一細胞からのＲＮＡ分子の最も感度が高いプロファイリングを提供すること、すなわち、生成されたシーケンシングライブラリが、以前のすべての方法よりも細胞内のＲＮＡのより大きなフラクションからのフラグメントを含むことを示す。

【0063】

本発明は、同じシーケンシングライブラリ内で５’タグ付きおよび完全長ＲＮＡフラグメントの構築を可能にするテンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）を使用する。ＴＳＯは、ＰＣＲ増幅用のプライマー部位、複雑な混合物からの５’リードを識別できる固有識別タグ、ＵＭＩ、およびｃＤＮＡ鎖上の伸長された非テンプレート塩基にアニーリングするための３つのｒＧなどの複数の事前定義ヌクレオチドを含むように設計されている。

【0064】

したがって、本発明の一態様は、図８を参照した、ｃＤＮＡを調製するための方法に関する。本方法は、ステップＳ１において、ｃＤＮＡ合成プライマーをＲＮＡ分子にハイブリダイズし、ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖を合成して、時にはＲＮＡ－ｃＤＮＡ二重鎖とも呼ばれるＲＮＡ－ｃＤＮＡ中間体を形成することを含む。本方法はまた、ステップＳ２を含み、それは、テンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）をテンプレートとして使用して、ｃＤＮＡ鎖の伸長に適した条件下でＲＮＡ－ｃＤＮＡ中間体をＴＳＯと接触させることによりテンプレートスイッチング反応を実行し、伸長ｃＤＮＡ鎖を形成することを含む。伸長ｃＤＮＡ鎖は、ＲＮＡ分子およびＴＳＯの少なくとも一部に相補的である。本発明によれば、ＴＳＯは、増幅プライマー部位、識別タグ、ＵＭＩ、および複数の事前定義ヌクレオチドを含む。

【0065】

図８の２つのステップＳ１およびＳ２は、連続して、すなわち、ステップＳ１に続いてステップＳ２が実行され得る。そのような場合、ＴＳＯはステップＳ２にて、ステップＳ１からの反応混合物に追加される。しかし、代替的に、単一の反応ステップで２つのステップＳ１およびＳ２を一緒に実行することも可能である。そのような場合、ＴＳＯおよびｃＤＮＡ合成プライマーはＲＮＡ分子と一緒に反応混合物中に存在し、ｃＤＮＡ鎖を合成してＲＮＡ－ｃＤＮＡ中間体を形成し、ｃＤＮＡ鎖を伸長ｃＤＮＡ鎖に伸長する。

【0066】

したがって、図８に示される方法ステップＳ１およびＳ２の産物は、伸長ｃＤＮＡ鎖である。この伸長ｃＤＮＡ鎖は、完全なＲＮＡ分子などのＲＮＡ分子の少なくとも一部に相補的であり、ＴＳＯにも相補的である。これは、伸長ｃＤＮＡ鎖が、ＲＮＡ分子の少なくとも一部に相補的なＤＮＡ配列と、ＴＳＯに相補的なＤＮＡ配列とを含むことを意味する。したがって、この後者の相補的ＤＮＡ配列は、ＴＳＯの増幅プライマー部位に相補的である第１の部分配列、識別タグに相補的である第２の部分配列、ＵＭＩに相補的である第３の部分配列、および、複数の、すなわち１つ超の事前定義ヌクレオチドに相補的である第４の部分配列を含む。

【0067】

実施形態では、図８のステップＳ１は、ｃＤＮＡ合成プライマーをＲＮＡ分子にハイブリダイズし、逆転写によってｃＤＮＡ鎖を合成して、ＲＮＡ－ｃＤＮＡ中間体を形成することを含む。この実施形態では、ステップＳ２は、逆転写によるｃＤＮＡ鎖の伸長に適した条件下でＲＮＡ－ｃＤＮＡ中間体をＴＳＯと接触させて伸長ｃＤＮＡ鎖を形成することによって、テンプレートスイッチング反応を実行することを含む。

【0068】

したがって、逆転写は、好ましくは、ステップＳ１でｃＤＮＡ鎖を合成するために使用され、また、ステップＳ２で、ｃＤＮＡ鎖を伸長ｃＤＮＡ鎖に伸長するために使用される。実施形態では、同じ逆転写酵素を、ステップＳ２におけるのと同様に、ステップＳ１の逆転写反応にて使用することができる。ただし、ステップＳ１で第１の逆転写酵素を使用し、そしてステップＳ２で第２の逆転写酵素を使用することも可能である。

【0069】

上記で概説したように、実施形態に従って使用できる逆転写酵素の例示的であるが非限定的な例には、ヒト免疫不全ウイルス１型（ＨＩＶ－１）逆転写酵素、モロニーマウス白血病ウイルス（Ｍ－ＭＬＶ）逆転写酵素、トリ骨髄芽球症ウイルス（ＡＭＶ）逆転写酵素、テロメラーゼ逆転写酵素、およびそれらの変異型または遺伝子操作バージョンが含まれる。例えば、逆転写酵素は、好ましくはＭ－ＭＬＶ逆転写酵素であり、より好ましくは、ＳｕｐｅｒＳｃｒｉｐｔ（商標）ＩＩ逆転写酵素、ＳｕｐｅｒＳｃｒｉｐｔ（商標）ＩＩＩ逆転写酵素、ＳｕｐｅｒＳｃｒｉｐｔ（商標）ＩＶ逆転写酵素、ＲｅｖｅｒｔＡｉｄＨＭｉｎｕｓ逆転写酵素、ＰｒｏｔｏＳｃｒｉｐｔ（登録商標）ＩＩ逆転写酵素、ＭａｘｉｍａＨＭｉｎｕｓ逆転写酵素およびＥｐｉＳｃｒｉｐｔ（商標）逆転写酵素からなる群から選択される。特定の実施形態では、ステップＳ１およびＳ２で使用される逆転写酵素は、ＭａｘｉｍａＨＭｉｎｕｓ逆転写酵素である。ＭａｘｉｍａＨＭｉｎｕｓ逆転写酵素は熱安定性があり、高い処理能力を持っている。したがって、この特定の逆転写酵素は、高温、すなわち３７℃以上で、より短い反応時間中に逆転写を行うことを可能にする。

【0070】

実施形態では、ステップＳ１およびＳ２における逆転写は、グアニンリボヌクレオチドを含むリボヌクレオチドの存在下で行われる。そのような実施形態では、リボヌクレオチドは、０．０５ｍＭから１０ｍＭの間隔内で、好ましくは約１ｍＭなどの０．１ｍＭから３ｍＭの間隔内で選択される濃度で存在する。テンプレートスイッチング反応への相補的リボヌクレオチドの追加は、逆転写酵素が、テンプレートとして機能するＲＮＡ分子の５’末端に到達したときに、Ｍ－ＭＬＶ逆転写酵素の文脈で、より長くより安定した非テンプレート化Ｃテールを促進する。そのような相補的リボヌクレオチドは、テンプレートスイッチング反応の効率を微調整するためにも使用できる。本明細書に提示される実験データは、グアニンリボヌクレオチドの追加を使用して、遺伝子キャプチャを制御し、結果として得られたシーケンシングライブラリにおける５’リードのフラクションを制御できることを示す。

【0071】

実施形態では、逆転写は、ｄＡＴＰ、ｄＧＴＰ、ｄＴＴＰおよびｄＣＴＰの混合物の存在下で行われる。混合物は、好ましくは、同じ濃度のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰを含み、ｄＣＴＰの濃度は、同じ濃度のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰよりもＸｍＭ高い。したがって、混合物中のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰのそれぞれの濃度がＹｍＭである場合、混合物中のｄＣＴＰの濃度は、好ましくはＸ＋ＹｍＭである。実施形態では、Ｘは、０．０５ｍＭから１０ｍＭの間隔内で、好ましくは約１ｍＭなどの０．１ｍＭから３ｍＭの間隔内で選択される。実施形態では、Ｙは、０．０５ｍＭから１０ｍＭの間隔内で、好ましくは約０．５ｍＭなどの０．１ｍＭから３ｍＭの間隔内で選択される。

【0072】

デオキシヌクレオチド（ｄＮＴＰ）は、ｃＤＮＡ鎖を合成および伸長するために逆転写に使用される。逆転写およびテンプレートスイッチング反応に追加のｄＣＴＰを追加して、ｃＤＮＡ鎖の３’末端にあるヌクレオチドの非テンプレート化ストレッチへのＣの取り込みを増やすことが好ましい。したがって、合成されたｃＤＮＡ鎖の３’末端は、図１Ａに概略的に示されているように、Ｃのストレッチを含むことが好ましい。そのような場合、複数の事前定義ヌクレオチドは、好ましくは、グアニンリボヌクレオチド（ｒＧ）、グアニンデオキシヌクレオチド（ｄＧ）、ロック核酸（ＬＮＡ）グアニン（ＬＮＡ－Ｇ）、２’－フルオロ－グアニン（ｆＧ）およびそれらの任意の組み合わせなどのグアニンヌクレオチドである。したがって、ＴＳＯの複数の事前定義ヌクレオチドは、好ましくは、ステップＳ１で実行される逆転写においてｃＤＮＡ鎖の３’末端に付加されたヌクレオチドの非テンプレート化ストレッチに相補的である。

【0073】

逆転写に存在する特定のリボヌクレオチドは、好ましくは、ＴＳＯの複数の事前定義ヌクレオチドと同じ核酸塩基である。さらに、逆転写に存在する追加のヌクレオチドは、好ましくは、この核酸塩基に相補的である。これは、ＧおよびＣ以外の核酸塩基の組み合わせが使用できることを意味する。例えば、複数の事前定義ヌクレオチドは、複数のグアニンヌクレオチド、複数のシトシンヌクレオチド、複数のアデニンヌクレオチド、または複数のチミジンヌクレオチドとすることができる。追加されたリボヌクレオチドはそして、グアニンリボヌクレオチド、シトシンリボヌクレオチド、アデニンリボヌクレオチドまたはウラシルリボヌクレオチドであり、追加のヌクレオチドは、ｄＣＴＰ、ｄＧＴＰ、ｄＴＴＰまたはｄＡＴＰである。

【0074】

実施形態では、逆転写は、０．１ｍＭから２０ｍＭの間隔内、好ましくは１ｍＭから１０ｍＭの間隔内、より好ましくは約３ｍＭなどの２ｍＭから５ｍＭまでの間隔内で選択される濃度のマグネシウム塩の存在下で行われる。実施形態では、マグネシウム塩は、ＭｇＣｌ_２、ＭｇＯＡｃおよびＭｇＳＯ_２からなる群から選択される。好ましい実施形態では、マグネシウム塩はＭｇＣｌ_２である。逆転写におけるマグネシウム塩の濃度が比較的低いと、逆転写酵素の忠実度が低下する。

【0075】

実施形態では、逆転写は、塩化ナトリウム（ＮａＣｌ）、塩化セシウム（ＣｓＣｌ）、およびそれらの混合物からなる群から選択される塩化物塩の存在下で行われる。塩化物塩は、好ましくは５ｍＭから５００ｍＭの間隔内で、好ましくは１５ｍＭから２５０ｍＭの間隔内で、より好ましくは、５０ｍＭから１００ｍＭ、または約７５ｍＭなどの２５ｍＭから１５０ｍＭの間隔内で選択される濃度で存在する。

【0076】

実施形態では、逆転写は、塩化カリウム（ＫＣｌ）が存在しないとは言わないまでも、少なくとも減少した量で行われる。ＫＣｌは、分子内または分子間でｒＧヌクレオチドのストレッチがある場合、ＲＮＡ分子の４本鎖構造を促進する。本構造はＧ四重鎖と呼ばれ、逆転写反応を阻害する。ＫＣｌ以外の塩化物塩を使用すると、逆転写反応が改善され、Ｇ四重鎖ＲＮＡ二次構造の外観が低下する可能性がある。ＮａＣｌおよびＣｓＣｌの両方が、ＭａｘｉｍａＨＭｉｎｕｓ逆転写酵素を伴うＫＣｌと比較して、より高い逆転写効率をもたらす。

【0077】

実施形態では、少なくとも１つの逆転写および／または増幅エンハンサーを追加して、逆転写および／または増幅反応の酵素反応速度を促進する。非限定的であるが例示的なそのような増強の例には、ベタイン、ウシ血清アルブミン（ＢＳＡ）、グリセロール、ポリエチレングリコール（ＰＥＧ）、グリコーゲン、１，２－プロパンジオール、ジメチルスルホキシド（ＤＭＳＯ）、ジメチルホルムアミド（ＤＭＦ）、ポリソルベート２０、ポリソルベート４０および／またはポリソルベート８０などのポリオキシエチレンソルビタンモノラウレート、Ｔ４遺伝子３２タンパク質およびジチオスレイトール（ＤＴＴ）が含まれる。

【0078】

実施形態では、逆転写は、３００Ｄａから１００，０００Ｄａの間隔内、好ましくは１，０００Ｄａから２５，０００Ｄａの間隔内、より好ましくは、８０００Ｄａなどの７，０００Ｄａから９，０００Ｄａの間隔内で選択される平均分子量を有するＰＥＧの存在下で行われる。ＰＥＧ８０００などのＰＥＧは、クラウディング剤として作用し、有効反応量を減少させる。これにより、酵素反応率が増加する。したがって、ＰＥＧを追加すると、方法の感度が向上し得る。

【0079】

いくつかの実施形態において、ＴＳＯは、５’末端から３’末端まで、増幅プライマー部位、識別タグ、ＵＭＩ、および複数の事前定義ヌクレオチドを含む。いくつかの実施形態において、識別タグは、ＴＳＯが新規の識別タグ、ＵＭＩおよび複数の事前定義ヌクレオチドを含むように、増幅プライマー部位として機能し得る（すなわち、識別が、識別タグおよび増幅プライマー部位の両方として採用される）。そのような場合、ＴＳＯには別個の増幅プライマー部位は含まれない。そのため、場合によっては、ＴＳＯは、複雑な混合物からの５’リードを識別できる固有識別タグ、ＵＭＩ、および３つのｒＧなどの複数の事前定義ヌクレオチドを含み、固有識別タグはＰＣＲ増幅のプライマー部位としても機能する。

【0080】

実施形態では、ＴＳＯの増幅プライマー部位は、トランスポザーゼ５（Ｔｎ５）モチーフ配列などのトランスポザーゼモチーフ配列の一部を含む。Ｔｎ５トランスポザーゼはＤＮＡ分子を切断し、各ＤＮＡフラグメントの両端に次の配列を追加する。
５’－ＴＣＧＴＣＧＧＣＡＧＣＧＴＣＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ－３’（ＳＥＱＩＤＮＯ：９）
５’－ＧＴＣＴＣＧＴＧＧＧＣＴＣＧＧＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ－３’（ＳＥＱＩＤＮＯ：１０）

【0081】

それにより、Ｔｎ５モチーフ配列の一部は、上記の２つの配列のいずれかの一部を構成する。例えば、Ｔｎ５モチーフ配列の部分は、好ましくは、上記の２つの配列のいずれかの３’部分である。したがって、実施形態では、Ｔｎ５モチーフ配列の部分は、５’－ＡＧＡＧＡＣＡＧ－３’を含み、好ましくはそれからなる。この特定の増幅プライマー部位は、ＩＬＬＵＭＩＮＡ（登録商標）ＮｅｘｔｅｒａＰ５インデックスプライマーと互換性がある。

【0082】

実施形態では、ＴＳＯの識別タグは、ＲＮＡ分子が由来する細胞または他のＲＮＡソースのトランスクリプトームに存在しないヌクレオチド配列を含む。したがって、識別タグはそれにより固有であり、ソース材料、例えば、ＲＮＡ分子が由来するソース細胞のトランスクリプトームには存在しない。それにより、この共通の識別タグを使用して、核酸分子の複雑な混合物からの５’リードを識別することができる。

【0083】

実施形態では、識別タグは、５’－ＡＴＴＧＣＧＣＡＡＴＧ－３’（ＳＥＱＩＤＮＯ：１１）を含み、好ましくはそれからなる。この識別タグは、ヒトトランスクリプトームにもマウストランスクリプトームにも存在しない。

【0084】

実施形態では、ＴＳＯのＵＭＩは、ランダムなｎ_１ｎ_２ｎ_３…ｎ_ｋ配列であり、ここで、ｎ_ｉ、ｉ＝１…ｋは、アデニン（Ａ）、チミジン（Ｔ）、シトシン（Ｃ）およびグアニン（Ｇ）のうちの１つである。実施形態では、ｋは４から１２まで、好ましくは、８などの、６から１０までである。ｋ＝８の場合、ヌクレオチドＡ、Ｔ、ＣおよびＧを使用して６５，５５３６個の固有のＵＭＩが可能である。ＵＭＩは、増幅によって導入される定量的バイアスを減らすように機能する。

【0085】

実施形態では、ＴＳＯの複数の事前定義ヌクレオチドは、３つのリボヌクレオチド、好ましくは３つのグアニンリボヌクレオチド、すなわちｒＧｒＧｒＧである。代替の実施形態において、複数の事前定義ヌクレオチドは、グアニンリボヌクレオチド以外のリボヌクレオチド、例えば、ｒＣ、ｒＡまたはｒＵ、例えば、３つのリボヌクレオチドの場合、ｒＣｒＣｒＣ、ｒＡｒＡｒＡまたはｒＵｒＵｒＵである。さらなる代替の実施形態では、グアニンリボヌクレオチド以外のグアニンヌクレオチドが、前述のように複数の事前定義ヌクレオチドとして使用される。例えば、少なくとも１つの複数の事前定義ヌクレオチドは、ＬＮＡとすることができる。

【0086】

特定の実施形態では、それによりＴＳＯは、以下の配列５’－ＡＧＡＧＡＣＡＧＡＴＴＧＣＧＣＡＡＴＧＮＮＮＮＮＮＮＮＲＧｒＧｒＧ－３’（ＳＥＱＩＤＮＯ：１２）を含み、好ましくはそれからなる。

【0087】

実施形態では、ｃＤＮＡ合成プライマーは、オリゴｄＴプライマーであり、すなわち、複数のｄＴを含む。特定の実施形態では、オリゴｄＴプライマーは、固定されたオリゴｄＴプライマーである。

【0088】

オリゴｄＴプライマー、好ましくは固定されたオリゴｄＴプライマーは、ＲＮＡ分子のポリＡテールに相補的であり、そこにハイブリダイズすることができる。固定されたオリゴｄＴプライマーの場合、オリゴｄＴプライマーは少なくとも１つの追加の選択的ヌクレオチドを含む。当技術分野でよく知られているように、真核生物のｍＲＮＡは典型的には、５’末端から３’末端まで、キャップ、５’非翻訳領域（ＵＴＲ）、コーディング配列（ＣＤＳ）、３’ＵＴＲおよびポリＡテールを含む。これは、固定されたオリゴｄＴプライマーが、３’ＵＴＲの最後のヌクレオチド（複数可）に、またはｍＲＮＡ分子が３’ＵＴＲを欠いている場合にはＣＤＲの最後のヌクレオチド（複数可）に相補的な少なくとも１つのヌクレオチドを、ポリＡテールに加えて含むことが好ましいことを意味する。

【0089】

実施形態では、オリゴｄＴプライマーである代わりに、ｃＤＮＡ合成プライマーは、遺伝子特異的プライマーであり、それにより、上記のオリゴｄＴドメインは、遺伝子特異的配列、すなわち、対象の遺伝子における既知の配列にハイブリダイズする配列によって置き換えられる。

【0090】

実施形態では、ｃＤＮＡ合成、例えばオリゴｄＴ、プライマーは、５’末端から３’末端まで、プライマー部位、（Ｔ）_ｐ、Ｖ、およびＮを含む。Ｖは、Ａ、ＣおよびＧからなる群から選択され、Ｎは、Ａ、Ｃ、ＧおよびＴからなる群から選択され、ｐは、１０から５０、好ましくは１５から４５、より好ましくは３０などの２０から４０の間で選択される正の数である。

【0091】

実施形態では、プライマー部位は、ＲＮＡ分子が由来する細胞または他のソースのトランスクリプトームに存在しないヌクレオチド配列を含む。特定の実施形態では、プライマー部位は、５’－ＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡ－３’（ＳＥＱＩＤＮＯ：１３）を含み、好ましくはそれからなる。このプライマー部位は、ヒトトランスクリプトームにもマウストランスクリプトームにも存在しない。

【0092】

特定の実施形態において、ｃＤＮＡ合成プライマーは、配列５’－ＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡ（Ｔ）_ｐＶＮ－３’（ＳＥＱＩＤＮＯ：１４）を含み、好ましくはそれからなる。

【0093】

固定されたｃＤＮＡ合成、例えばオリゴｄＴ、プライマーのＶＮの目的は、ポリＡテールでのランダムで複数のポリＴプライミングを回避することである。結果として、固定されたオリゴｄＴプライマーは、それが３’ＵＴＲの３’末端またはＲＮＡ分子のＣＤＳの３’末端に相補的なヌクレオチドを少なくとも１つ含むため、ポリＡテールの５’末端部分に結合する。

【0094】

実施形態では、図８のステップＳ１は、複数のＲＮＡ分子の各ＲＮＡ分子について、ｃＤＮＡ合成プライマーをＲＮＡ分子にハイブリダイズし、ＲＮＡ分子の少なくとも一部に相補的なそれぞれのｃＤＮＡ鎖を合成して、それぞれのＲＮＡ－ｃＤＮＡ中間体を形成することを含む。この実施形態では、ステップＳ２は、それぞれのＴＳＯをテンプレートとして使用してそれぞれのｃＤＮＡ鎖の伸長に適した条件下でそれぞれのＲＮＡ－ｃＤＮＡ中間体をそれぞれのＴＳＯと接触させて、ＲＮＡ分子およびそれぞれのＴＳＯの少なくとも一部に相補的なそれぞれの伸長ｃＤＮＡ鎖を形成することによってテンプレートスイッチング反応を実行することを含む。この実施形態では、各ＴＳＯは、増幅プライマー部位、識別タグ、ＵＭＩ、および複数の事前定義ヌクレオチドを含む。各ＴＳＯは、ＴＳＯに固有で他のＴＳＯのＵＭＩとは異なるＵＭＩを含む。これらの実施形態では、異なるＵＭＩを有するＴＳＯの総数は変動し得、ＵＭＩ変動ＴＳＯのコレクションは、場合によっては１００から２５０，０００、例えば、１，０００から７５，０００を含む、１０００から１００，０００の範囲である。所与のサンプルに採用されるＵＭＩの数はさまざまであり得、サンプルの複雑さに関して選択され得る。例えば、より複雑でないサンプルではより少ないＵＭＩを採用し得、より複雑なサンプルではより多くのＵＭＩを採用し得る。

【0095】

したがって、本発明は、複数の異なるＲＮＡ分子の混合物からｃＤＮＡ分子を調製するために使用することができる。そのような場合、同一のｃＤＮＡ合成プライマーが好ましくは使用され、一方で、使用されるＴＳＯは異なるＵＭＩを有するが、好ましくは同じ増幅プライマー部位、同じ共通の識別タグおよび同じ複数の事前定義ヌクレオチドを有する。例えば、異なるＵＭＩを持つ６５，５３６個の固有のＴＳＯのセットは、８ヌクレオチドのＵＭＩ長で取得できる。

【0096】

実施形態では、本方法はまた、図１Ａに示されるように、（例えば、上記のように）細胞を溶解してＲＮＡ分子を放出することを含む。ＲＮＡ分子は、好ましくは、ｍＲＮＡ分子などのＲＮＡ分子を含むポリ（Ａ）であり、典型的には、溶解された細胞の細胞質に存在し、そこから放出される。任意の既知の細胞溶解方法を使用して、細胞からＲＮＡ分子を放出することができる。溶解方法は、酵素、洗浄剤および／またはカオトロピック剤の使用を含み得る。あるいは、またはさらに、凍結および解凍ならびに／または超音波処理を繰り返すことによってなど、細胞膜の機械的破壊を使用することができる。例えば、ＴｒｉｔｏｎＸ－１００は、細胞を溶解する際の洗浄剤として使用できる。

【0097】

図１Ａは、図８のステップＳ１およびＳ２の逆転写およびテンプレートスイッチング反応を示す。実施形態では、本方法は、順方向プライマー（本明細書では第１の順方向プライマーまたは第１の順増幅プライマーとも呼ばれる）および逆方向プライマー（本明細書では第１の逆方向プライマーまたは第１の逆増幅プライマーとも呼ばれる）を使用して伸長ｃＤＮＡ鎖を増幅することも含み、図１ＡにＰＣＲ事前増幅として概略的に示されている。

【0098】

伸長ｃＤＮＡ鎖の増幅は、ステップＳ１およびＳ２に関して、すなわち、伸長ｃＤＮＡ鎖の形成後に連続的に使用されることができる。別の実施形態において、伸長ｃＤＮＡ鎖の増幅は、逆転写反応およびテンプレートスイッチング反応と同じ反応混合物において、および／または同時に行われる。

【0099】

実施形態では、順方向プライマーは、増幅プライマー部位および識別タグを含む。実施形態では、順方向プライマーは、５’末端から３’末端まで、Ｔｎ５モチーフ配列および識別タグを含む。特定の実施形態において、順方向プライマーは、５’－ＴＣＧＴＣＧＧＣＡＧＣＧＴＣＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧＡＴＴＧＣＧＣＡＡＴＧ－３’（ＳＥＱＩＤＮＯ：１５）を含み、好ましくはそれからなる。

【0100】

実施形態では、逆方向プライマーは、ｃＤＮＡ合成、例えばオリゴｄＴ、プライマーのプライマー部位、またはその少なくとも一部を含む。したがって、実施形態では、逆方向プライマーは、５’－ＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡ－３’（ＳＥＱＩＤＮＯ：１６）を含み、好ましくはそれからなる。

【0101】

増幅ステップは、好ましくは、ＴａｑポリメラーゼまたはＰｈｕポリメラーゼまたは他のＤＮＡポリメラーゼなどのポリメラーゼを使用するＰＣＲベースの増幅である。ＰＣＲベースの増幅に使用できるポリメラーゼの非限定的であるが例示的な例には、ＰｈｕｓｉｏｎＨｉｇｈＦｉｄｅｌｉｔｙＤＮＡポリメラーゼ、ＰｌａｔｉｎｕｍＳｕｐｅｒＦｉＤＮＡポリメラーゼ、Ｑ５ＨｉｇｈＦｉｄｅｌｉｔｙＤＮＡポリメラーゼ、ＫＡＰＡＨｉＦｉＨｏｔＳｔａｒｔＤＮＡポリメラーゼ、およびＴＥＲＲＡ（商標）ＰＣＲＤｉｒｅｃｔポリメラーゼが含まれる。

【0102】

実施形態では、本方法はまた、図１Ｂを参照して、例えば、上記のようなフラグメント化プロトコルを使用して、結果として得られた増幅ｃＤＮＡ分子をフラグメント化し、続いて、例えば、ＮＧＳのために、結果として得られたフラグメントにタグを付けることを含む。場合によっては、伸長ｃＤＮＡ鎖またはその増幅バージョンのフラグメント化およびタグ付けは、トランスポザーゼおよび少なくとも１つのタグ付けアダプターを使用してタグ付けされたｃＤＮＡフラグメントを形成するタグ付けプロセスで達成される。

【0103】

特定の実施形態では、このフラグメント化およびタグ付けステップは、Ｔｎ５、ならびに、リード１シーケンシングプライマー部位および増幅プライマー部位を含む第１のタグ付けアダプター、ならびに、リード２シーケンシングプライマー部位および増幅プライマー部位を含む第２のタグ付けアダプターを使用するタグ付けプロセスにおいて、伸長ｃＤＮＡ鎖またはその増幅バージョンをフラグメント化およびタグ付けすることを含む。特定の実施形態では、第１のタグ付けアダプターは、好ましくは５’－ＴＣＧＴＣＧＧＣＡＧＣＧＴＣＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ－３’（ＳＥＱＩＤＮＯ：１７）を含み、好ましくはそれからなり、第２のタグ付けアダプターは、好ましくは５’－ＧＴＣＴＣＧＴＧＧＧＣＴＣＧＧＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ－３’（ＳＥＱＩＤＮＯ：１８）を含み、好ましくはそれからなる。

【0104】

トランスポザーゼ（ＥＣ２．７．７）は、トランスポゾンの末端に結合し、カットアンドペーストメカニズムまたは複製転位メカニズムによってゲノムの別の部分へのトランスポゾンの移動を触媒する酵素である。Ｔｎ５は、タグ付けおよびフラグメント化の特性を同時に持つトランスポザーゼである。したがって、ｃＤＮＡ分子にタグを付けることに加えて、そのようなトランスポザーゼは、ｃＤＮＡ分子の長さをさらに短縮して、ｃＤＮＡ分子のその後のシーケンシングについてより適した長さを達成することができる。例えば、ＭｕトランスポザーゼおよびＴｎ７トランスポザーゼを含む、Ｔｎ５以外の他のトランスポザーゼを使用することができる。

【0105】

そして、タグ付けされたｃＤＮＡフラグメントは、順増幅プライマー（本明細書では第２の順方向プライマーまたは第２の順増幅プライマーとも呼ばれる）および逆増幅プライマー（本明細書では第２の逆方向プライマーまたは第２の逆増幅プライマーとも呼ばれる）の存在下で、図１Ｂに示されるように増幅され得る。

【0106】

実施形態では、第２の順増幅プライマーは、５’末端から３’末端まで、Ｐ５配列５’－ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡ－３’（ＳＥＱＩＤＮＯ：１９）、ｉ５インデックス、およびリード１シーケンシングプライマー部位の一部を含む。特定の実施形態では、ｉ５インデックスは、好ましくは、Ｎ５０１：ＴＡＧＡＴＣＧＣ、Ｎ５０２：ＣＴＣＴＣＴＡＴ、Ｎ５０３：ＴＡＴＣＣＴＣＴ、Ｎ５０４：ＡＧＡＧＴＡＧＡ、Ｎ５０５：ＧＴＡＡＧＧＡＧ、Ｎ５０６：ＡＣＴＧＣＡＴＡ、Ｎ５０７：ＡＡＧＧＡＧＴＡおよびＮ５０８：ＣＴＡＡＧＣＣＴからなる群から選択される。したがって、第２の順増幅プライマーは、好ましくは、配列５’－ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡＮＮＮＮＮＮＮＮＴＣＧＴＣＧＧＣＡＧＣＧＴＣ－３’（ＳＥＱＩＤＮＯ：２０）を含むか、またはそれからなり、ここで、ＮＮＮＮＮＮＮＮは、ｉ５インデックスを表す。

【0107】

第２の逆増幅プライマーは、好ましくは、５’末端から３’末端まで、Ｐ７配列５’－ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡＧＡＴ－３’（ＳＥＱＩＤＮＯ：２１）、ｉ７インデックス、およびリード２シーケンシングプライマー部位の一部を含む。特定の実施形態では、ｉ７インデックスは、好ましくは、Ｎ７０１：ＴＡＡＧＧＣＧＡ、Ｎ７０２：ＣＧＴＡＣＴＡＧ、Ｎ７０３：ＡＧＧＣＡＧＡＡ、Ｎ７０４：ＴＣＣＴＧＡＧＣ、Ｎ７０５：ＧＧＡＣＴＣＣＴ、Ｎ７０６：ＴＡＧＧＣＡＴＧ、Ｎ７０７：ＣＴＣＴＣＴＡＣ、Ｎ７０８：ＣＡＧＡＧＡＧＧ、Ｎ７０９：ＧＣＴＡＣＧＣＴ、Ｎ７１０：ＣＧＡＧＧＣＴＧ、Ｎ７１１：ＡＡＧＡＧＧＣＡ、Ｎ７１２：ＧＴＡＧＡＧＧＡからなる群から選択される。したがって、第２の逆増幅プライマーは、好ましくは、配列５’－ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡＧＡＴＮＮＮＮＮＮＮＮＧＴＣＴＣＧＴＧＧＧＣＴＣＧＧ－３’（ＳＥＱＩＤＮＯ：２２）を含むか、またはそれからなり、ここで、ＮＮＮＮＮＮＮＮは、ｉ７インデックスを表す。

【0108】

そして、増幅されたタグ付きｃＤＮＡフラグメントは、少なくとも１つのシーケンシングプライマーを追加することにより、図１Ｂに示されるようにシーケンシングされ得る。少なくとも１つのシーケンシングプライマーは、好ましくは、少なくとも１つのタグ付けアダプターの少なくとも一部に対応するか、またはそれに相補的な配列を有する。

【0109】

実施形態では、少なくとも１つのシーケンシングプライマーが、ＩＬＬＵＭＩＮＡ（登録商標）シーケンシング技術で使用でき、特にＮｅｘｔｅｒａＤＮＡライブラリ調製キットで調製されたＤＮＡ配列のＩＬＬＵＭＩＮＡ（登録商標）シーケンシング技術で使用できるシーケンシングプライマーから選択される。そのようなシーケンシングプライマーの例には、ＩＬＬＵＭＩＮＡ（登録商標）ＢＰ１０－リード１プライマー、ＩＬＬＵＭＩＮＡ（登録商標）ＢＰ１１－リード２プライマー、および、ＩＬＬＵＭＩＮＡ（登録商標）ＢＰ１４－インデックス１プライマーおよびインデックス２プライマーが含まれる。

【0110】

実施形態では、ＩＬＬＵＭＩＮＡ（登録商標）シーケンシング技術を使用して、増幅されたタグ付きｃＤＮＡフラグメントの少なくとも一部を合成によってシーケンシングすることができる。合成による配列（ＳＢＳ）は、４つの蛍光標識ヌクレオチドを使用して、フローセル表面上の増幅されたタグ付きｃＤＮＡフラグメントを並行してシーケンシングする。各シーケンシングサイクル中に、単一の標識デオキシヌクレオシド三リン酸（ｄＮＴＰ）が核酸鎖に追加される。ヌクレオチド標識は重合のターミネーターとして機能するため、各ｄＮＴＰの取り込み後、蛍光色素を画像化して塩基を特定し、そして酵素的に切断して次のヌクレオチドの取り込みを可能にする。ＩＬＬＵＭＩＮＡ（登録商標）シーケンシング技術のより多くの情報については、ＴｅｃｈｎｏｌｏｇｙＳｐｏｔｌｉｇｈｔ：ＩＬＬＵＭＩＮＡ（登録商標）Ｓｅｑｕｅｎｃｉｎｇ［９］に見出すことができる。

【0111】

本発明の別の態様は、ｃＤＮＡライブラリを調製するための方法に関する。本方法は、前述のように、また図１Ａおよび図１Ｂに示されるように、好ましくは単一細胞の、ＲＮＡ分子からタグ付きｃＤＮＡフラグメントを調製することを含む。この方法はまた、伸長ｃＤＮＡ鎖の５’末端部分に対応するタグ付きｃＤＮＡフラグメントのパーセンテージを調整することを含む。

【0112】

したがって、伸長ｃＤＮＡ鎖の５’末端部分に対応し、それによってそれぞれのＵＭＩおよび識別タグを含むタグ付きｃＤＮＡフラグメントのパーセンテージが調整される。言い換えれば、伸長ｃＤＮＡ鎖の５’末端部分に対応するタグ付きｃＤＮＡフラグメントの数と、タグ付きｃＤＮＡフラグメントの総数との間の比率を調整または制御することができる。

【0113】

本明細書に提示される実験データ（図４参照）は、フラグメント化およびタグ付けステップに存在するＴｎ５トランスポザーゼの量を制御または選択することによって、フラグメント化およびタグ付けステップで入力ｃＤＮＡの量を制御または選択することによって、および／または、フラグメント化およびタグ付けステップで反応時間を制御または選択することによってなど、タグ付け効率を制御または調整することによって、調整を実行できることを示す。例えば、Ｔｎ５とｃＤＮＡとの比率を制御または選択して、タグ付け効率を制御または調整することができる。

【0114】

さまざまなアプリケーションが、ＵＭＩに対する内部リードのさまざまな範囲を使用し得るため、５’末端リードのパーセンテージを制御する能力は有利な特徴である。例えば、遺伝子発現を定量化するために本発明の高感度を利用するアプリケーションは、５’末端フラグメントの可能な限り高いパーセンテージを達成したいが、例えば、対立遺伝子転写の分析は、遺伝子定量化のためにＵＭＩと組み合わされた対立遺伝子間の遺伝子変動をキャプチャするために両方の内部リードを必要とする。したがって、５’末端リードのパーセンテージを制御することができる能力は、本発明の有利な特徴である。

【0115】

代替の実施形態において、５’末端フラグメントと内部フラグメントとの間のバランスは、順方向プライマー（本明細書において第１の順方向プライマーまたは第１の順増幅プライマーとも呼ばれる）および逆方向プライマー（本明細書において第１の逆方向プライマーまたは第１の逆増幅プライマーとも呼ばれる）を使用して伸長ｃＤＮＡ鎖を増幅することによって調整され得、順方向プライマーは、ビオチンまたは他のキャプチャ部分を含む。そして、結果として得られた５’末端フラグメントは、例えばストレプトアビジンビーズ上のビオチン含有フラグメントのキャプチャによって内部フラグメントから分離され得る。そして、シーケンシング用のライブラリを、ビーズ上にキャプチャされた５’末端フラグメント、およびビーズに結合していないままの内部フラグメントについて、本明細書に記載の方法を使用して別個に調製し得る。そして、別個のライブラリを対象の任意の適切な比率でプールして、５’末端フラグメントと内部フラグメントとの比率を調整し得る。

【0116】

本発明のさらなる態様は、核酸フラグメントを調製するための方法に関する。そのような態様の実施形態では、方法は、例えば上記のように、ｃＤＮＡ合成プライマーをリボ核酸（ＲＮＡ）分子にハイブリダイズし、ＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖を合成して、ＲＮＡ－ｃＤＮＡ中間体を形成すること；例えば上記のように、テンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）をテンプレートとして使用してｃＤＮＡ鎖の伸長に適した条件下でＲＮＡ－ｃＤＮＡ中間体をＴＳＯと接触させることによりテンプレートスイッチング反応を実行し、ＲＮＡ分子およびＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成することであって、ＴＳＯは増幅プライマー部位、識別タグ、固有分子識別子（ＵＭＩ）、および複数の事前定義ヌクレオチドを含む、形成すること、例えば上記のように、伸長ｃＤＮＡ鎖から例えばＰＣＲ増幅を介して二本鎖ｃＤＮＡを生成すること、ならびに、例えば上記のように、二本鎖ｃＤＮＡをフラグメント化して、５’ＵＭＩ含有フラグメントの第１の集団および内部フラグメントの第２の集団を含む核酸フラグメントを生成することを含む。フラグメント化がタグ付けを介して達成される場合、５’ＵＭＩ含有フラグメントの結果として生じる第１の集団および内部フラグメントの第２の集団は、タグ付けステップ中にフラグメントの末端に追加されるタグ付けアダプターを含み得る。フラグメント化が他のプロトコルを介して、例えば上記のように達成される場合、方法は、例えば、ライゲーションプロトコル、非ライゲーションプロトコルなどを介して、５’ＵＭＩ含有フラグメントの第１の集団および内部フラグメントの第２の集団をタグ付けアダプターでタグ付けすることを含み得る。これらの態様の方法は、単一細胞のｍＲＮＡなどの、ＲＮＡサンプルの複数の別個のＲＮＡから核酸フラグメントを同時に生成することを含み得る。

【0117】

いくつかの実施形態では、フラグメントを含む得られた５’ＵＭＩおよび内部フラグメントの第２の集団は、例えば、上記のようにシーケンシングされ得る。そのような場合、方法は、識別タグ配列の存在によって、５’ＵＭＩ含有フラグメントの第１の集団のシーケンシングリードを、内部フラグメントのシーケンシングリードから区別することを含み得る。言い換えれば、識別タグ配列を含むフラグメントから得られたリードは、５’ＵＭＩ含有フラグメントから生じるものとして識別され得、識別タグ配列を欠くフラグメントから得られたリードは、内部フラグメントから生じるものとして識別され得る。

【0118】

いくつかの実施形態において、方法は、５’ＵＭＩ含有フラグメントおよび内部フラグメントの両方のシーケンシングリードからＲＮＡの完全長配列を構築することをさらに含む。そのような場合、方法は、５’ＵＭＩ含有リードを、その５’末端が５’ＵＭＩ含有リードの３’末端と整列する第１の内部フラグメントからの第１のリードとペアリングすることを含み得る。そして、結果として得られる複合リードは、その５’末端が第１の内部フラグメントからのリードの３’末端と整列する第２の内部フラグメントからの第２のリードとペアリングされ得る。本プロセスは、ＲＮＡの配列の完全なリードが得られるまで続けられ得る。もちろん、そのような場合に採用される内部リードは、５’ＵＭＩ含有フラグメントが生成されたものと同じＲＮＡから生成された内部フラグメントのシーケンシングリードである。

【0119】

上記の方法の実施形態が図１９に示されている。図１９に示されるように、第１鎖ｃＤＮＡは、第１鎖プライマーと、プライマー部位、固有タグ、およびＵＭＩを含むＴｎ５モチーフを含むＴＳＯとを使用し、例えば上記のように逆転写およびテンプレートスイッチングを実行して、初期ｍＲＮＡから生成される。ＰＣＲ増幅に続いて、結果として得られた二本鎖ｃＤＮＡをタグ付けステップに供して、５’ＵＭＩ含有フラグメントの第１の集団および内部フラグメントの第２の集団を生成する。そして、結果として得られたフラグメントをシーケンシングして、すべて同じＲＮＡから５’ＵＭＩリードと内部リードとを取得する。そして、５’ＵＭＩリードと内部リードとを整列させてＲＮＡの完全な配列を構築する。図１９に示すように、ＵＭＩのために５’フラグメントが固有であり、それにより、タグ付けを介して生成される異なる３’末端を持つ、これらのフラグメントのペアエンドリードの組み合わせを使用して、それらが転写産物モデルを構築するために使用できるだけでなく、トランスポゾンによる元の完全長ｃＤＮＡの切断点それ自体が固有であるため、切断点が、追加の「ＵＭＩ」として機能し、５’フラグメントの固有のセットを内部リードの固有のセットに本質的にリンクできる。そして、この特徴は、この第１の内部フラグメントの３’側の切断と同様に伸長できるため、第１および同様のものの内部フラグメントの３’の次のセットを追加して、基本的に転写産物を５’末端から３’末端まで最後までたどることができる。図１９に示すように、タグ付けを使用してフラグメントを生成する場合、タグ付けのメカニズムにより、ＤＮＡに千鳥状の切断が生じ、それにより、フラグメント化点の９塩基が、切断点の両側から来るフラグメントペアで繰り返される。この９塩基シグネチャーは、元々同じ分子に由来する、隣接フラグメントのペアを識別することを助けるために、本発明の方法を実施する際に採用され得る。

【0120】

例えば、上記のように、シーケンシングリードの取得に続いて、方法は、シーケンシングリードを採用する１つまたは複数の追加のステップをさらに含み得る。例えば、方法の実施形態は、アイソフォームをＲＮＡに割り当てることをさらに含む。したがって、方法は、所与の配列がいくつかの潜在的なアイソフォームのどれに属するかを決定することを含み得る。したがって、方法は、同じ遺伝子座から生成されるが、それらの転写開始部位（ＴＳＳ）、タンパク質コーディングＤＮＡ配列（ＣＤＳ）および／または非翻訳領域（ＵＴＲ）が異なるｍＲＮＡを区別することを含み得る。

【0121】

実施形態において、方法は、ＲＮＡの少なくとも第１の一塩基多型（ＳＮＰ）を識別することをさらに含む。そのような場合、方法は、ＲＮＡの２番目以降のＳＮＰを識別することを含み得る。そのような場合、本方法は、第１および第２のＳＮＰの位相関係を設定することを含む。例えば、本発明の方法を使用して、同じリンクされたリードで見られる２つのＳＮＰが同じ元の分子からのものであることを確実に決定することができる。そのため、ＳＮＰは定義上、同じ染色体上にある必要がある。したがって、互いにそれらの位相関係を設定することができる。この能力は、特定の遺伝子が母体と父体との両方の染色体で変異しているか否か（つまり、ヌルホモ接合変異を生成しているか否か）または１つのみであるのか（ヘテロ接合変異体／野生型）を知りたい場合がある、遺伝性遺伝子疾患、例えば癌または他の遺伝性遺伝子疾患の評価にて採用され得る。そのような方法は、臨床応用、例えば、診断および／または治療に採用され得る。

【0122】

実施形態では、方法は、ＲＮＡを遺伝子融合の産物、すなわち、転座、間質性欠失、または染色体反転の結果として形成され得るような、２つの以前は別個の遺伝子から形成されたハイブリッド遺伝子の産物として識別することを含む。

【0123】

方法の実施形態は、フラグメントの集団を正規化することを含み得る。正規化は、多重化のためにＤＮＡライブラリ濃度を均等化するプロセスと見なされ得、所与の多重化された構成におけるライブラリの過剰表現または過少表現の問題に対処する。所与の多重ＮＧＳワークフローでは、入力ＤＮＡ／ＲＮＡの濃度の正規化、ライブラリフラグメントのサイズ分布、ならびに、プール前のライブラリ調製濃度の正規化など、さまざまな段階で正規化を採用し得る。場合によっては、２０１９年１２月４日に出願されたＰＣＴ出願シリアル番号ＰＣＴ／ＵＳ２０１９／０６４４７７に記載されている正規化プロトコルが採用され、その開示は参照により本明細書に組み込まれる。

【0124】

本発明のさらなる態様は、ｃＤＮＡを調製するためのキットに関する。キットは、ＲＮＡ分子にハイブリダイズしてＲＮＡ分子の少なくとも一部に相補的なｃＤＮＡ鎖の合成を可能にしてＲＮＡ－ｃＤＮＡ中間体を形成するように構成されたｃＤＮＡ合成プライマーを含む。本キットには、増幅プライマー部位、識別タグ、ＵＭＩ、および複数の事前定義ヌクレオチドを含むＴＳＯも含まれている。

【0125】

実施形態では、ＴＳＯは、ｃＤＮＡ鎖の伸長を含むテンプレートスイッチング反応においてテンプレートとして作用して、ＲＮＡ分子およびＴＳＯの少なくとも一部に相補的な伸長ｃＤＮＡ鎖を形成するように構成される。

【0126】

実施形態では、キットは、例えば上記のように、ＵＭＩによって互いに異なる一組のＴＳＯを含む。

【0127】

実施形態では、キットは逆転写酵素も含む。逆転写酵素は、好ましくは、前述の逆転写酵素の例の中から選択される。

【0128】

実施形態では、キットは、０．０５ｍＭから１０ｍＭの間隔内、好ましくは０．１ｍＭから３ｍＭの間隔内で選択される濃度のリボヌクレオチド、好ましくはグアニンリボヌクレオチドを含む。

【0129】

実施形態では、キットは、ｄＡＴＰ、ｄＧＴＰ、ｄＴＴＰおよびｄＣＴＰの混合物を含む。混合物は、好ましくは、同じ濃度のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰと、同じ濃度のｄＡＴＰ、ｄＧＴＰおよびｄＴＴＰよりもＸｍＭ高い濃度のｄＣＴＰとを含む。実施形態では、Ｘは、０．０５ｍＭから１０ｍＭの間隔内で、好ましくは０．１ｍＭから３ｍＭの間隔内で選択される。

【0130】

実施形態では、キットは、０．１ｍＭから２０ｍＭの間隔内、好ましくは１ｍＭから１０ｍＭの間隔内、より好ましくは２ｍＭから５ｍＭの間隔内で選択される濃度のマグネシウム塩を含む。マグネシウム塩は、好ましくは、前述のマグネシウム塩の例の中から選択される。

【0131】

実施形態では、キットは、ＮａＣｌ、ＣｓＣｌ、およびそれらの混合物からなる群から選択される塩化物塩を含む。実施形態では、キットは、いかなるＫＣｌも含まない。

【0132】

実施形態では、キットは、少なくとも１つの逆転写および／または増幅エンハンサーを含む。少なくとも１つのそのようなエンハンサーは、好ましくは、前述のエンハンサーの例の中から選択される。実施形態では、キットは、３００Ｄａから１００，０００Ｄａの間隔内、好ましくは１，０００Ｄａから２５，０００Ｄａの間隔内、より好ましくは、８０００Ｄａなどの７，０００Ｄａから９，０００Ｄａの間隔内で選択される平均分子量を有するＰＥＧを含む。

【0133】

実施形態では、キットは、伸長ｃＤＮＡ鎖を増幅するための順方向プライマーおよび逆方向プライマーを含む。

【0134】

実施形態では、キットは、タグ付けプロセスにおいて伸長ｃＤＮＡ鎖またはその増幅バージョンをフラグメント化およびタグ付けして、タグ付けされたｃＤＮＡフラグメントを形成するためのトランスポザーゼおよび少なくとも１つのタグ付けアダプターを含む。

【0135】

実施形態では、キットは、タグ付けされたｃＤＮＡフラグメントを増幅するための順増幅プライマーおよび逆増幅プライマーを含む。

【0136】

実施形態では、キットは、少なくとも１つのシーケンシングプライマーを含み、好ましくは、増幅されたタグ付きｃＤＮＡフラグメントをシーケンシングするための少なくとも１つのタグ付けアダプターの少なくとも一部に対応するかまたは相補的な配列を有する。

【0137】

キットは、本発明によるｃＤＮＡを調製するための方法において有利に使用することができる。

【0138】

上記の構成要素に加えて、主題のキットは、例えば、上記の主題の方法を実施するために、キットの構成要素を使用するための説明書をさらに含み得る。さらに、キットは、例えば、固有の分子種のカウントなどを含む、結果の分析のためのプログラミングをさらに含み得る。説明書および／または分析プログラミングは、適切な記録媒体に記録され得る。説明書および／またはプログラミングは、紙またはプラスチックなどの基板上に印刷され得る。したがって、説明書は、キットの容器またはその構成要素のラベリングにて（すなわち、パッケージングまたはサブパッケージングと関連付けられて）など、パッケージインサートとしてキットに存在し得る。他の実施形態では、命令は、例えば、ＣＤ－ＲＯＭ、ディスケット、ハードディスクドライブ（ＨＤＤ）などの適切なコンピュータ可読記憶媒体上に存在する電子記憶データファイルとして存在する。さらに他の実施形態では、実際の説明書はキットに存在しないが、例えば、インターネット経由でリモートソースから説明書を取得するための手段が提供される。この実施形態の例は、説明書を見ることができる、および／または説明書をダウンロードすることができるウェブアドレスを含むキットである。説明書と同様に、説明書を入手するためのこの手段は、適切な基板に記録されている。

【0139】

以下の実施例は、限定ではなく説明のために提供されている。

【0140】

Ｉ．実施例１
Ａ．材料および方法
細胞培養
ＨＥＫ２９３ＦＴ細胞（Ｉｎｖｉｔｒｏｇｅｎ）は、１０％ウシ胎児血清（ＦＢＳ）、０．１ｍＭＭＥＭ非必須アミノ酸（Ｇｉｂｃｏ）、１ｍＭピルビン酸ナトリウム（Ｇｉｂｃｏ）および１００μｇ／ｍＬペニシリン／ストレプトマイシン（Ｇｉｂｃｏ）を添加した、グルコースおよびグルタミン（Ｇｉｂｃｏ）を含む完全ダルベッコ改変イーグル培地（ＤＭＥＭ）で培養した。ＴｒｙｐＬＥｅｘｐｒｅｓｓ（Ｇｉｂｃｏ）を使用して細胞を継代した。

【0141】

単一細胞の分離および溶解
単一細胞懸濁液は、リン酸緩衝生理食塩水（ＰＢＳ）に再懸濁してヨウ化プロピジウム（ＰＩ）で染色したＴｒｙｐＬＥＥｘｐｒｅｓｓを使用してＨＥＫ２９３ＦＴ細胞を解離し、生細胞と死細胞とを区別することによって調製した。単一細胞は、３μＬの溶解バッファーを含むＢＤＦＡＣＳＭｅｌｏｄｙ１００μｍノズル（ＢＤＢｉｏｓｃｉｅｎｃｅ）を使用して、９６または３８４ウェルプレートに分類された。溶解バッファーは、１Ｕ／μＬの組換えＲＮａｓｅ阻害剤（ＲＲＩ）（Ｔａｋａｒａ）、０．１５％ＴｒｉｔｏｎＸ－１００（Ｓｉｇｍａ）、０．５ｍＭｄＮＴＰ／各（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）、１μＭＳｍａｒｔｓｅｑ３ＯｌｉｇｏｄＴプライマー（５’－ビオチン－ＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡＴ_３０ＶＮ－３’（ＳＥＱＩＤＮＯ：１１）；ＩＤＴ）、および０．０５μＬの１：４０．０００希釈外部ＲＮＡコントロールコンソーシアム（ＥＲＣＣ）スパイクインミックス１（Ａｍｂｉｏｎ）からなる。選別後すぐに、プレートをスピンダウンしてから－８０℃で保存した。

【0142】

Ｓｍａｒｔ－ｓｅｑ２ライブラリの生成
Ｓｍａｒｔ－ｓｅｑ２ｃＤＮＡライブラリは、公開されているプロトコル［１０－１１］に従って生成された。タグ付けは、以下に説明するＳｍａｒｔｓｅｑ３と同様のｃＤＮＡ入力および容積で実行された。

【0143】

逆転写
ＲＮＡの溶解および変性を促進するために、細胞のプレートを７２℃で１０分間インキュベートし、その後すぐに氷上に置いた。次に、５０ｍＭＴｒｉｓ－ＨＣｌｐＨ８．３（Ｓｉｇｍａ）、７５ｍＭＮａＣｌ（Ａｍｂｉｏｎ）またはＣｓＣｌ（Ｓｉｇｍａ）、１ｍＭＧＴＰ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）、３ｍＭＭｇＣｌ_２（Ａｍｂｉｏｎ）、１０ｍＭＤＴＴ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）、５％ＰＥＧ（Ｓｉｇｍａ）、１Ｕ／μＬＲＲＩ（Ｔａｋａｒａ）、２μＭＳｍａｒｔｓｅｑ３テンプレートスイッチングオリゴ（ＴＳＯ）（５’－ビオチン－ＡＧＡＧＡＣＡＧＡＴＴＧＣＧＣＡＡＴＧＮＮＮＮＮＮＮＮｒＧｒＧｒＧ－３’（ＳＥＱＩＤＮＯ：２３）；ＩＤＴ）および２Ｕ／μＬＭａｘｉｍａＨ－ｍｉｎｕｓ逆トランスクリプターゼ酵素（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）を含む５μＬの逆転写ミックスを各サンプルに追加した。ＰＥＧを使用しないプロトコルの他の変形例では、逆転写ミックスにも１ｍＭｄＣＴＰ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）が含まれていた。逆転写およびテンプレートスイッチングは、４２℃で９０分間、続いて５０℃で２分間および４２℃で２分間の１０サイクルで実行された。８５℃で５分間、インキュベートすることにより反応を停止させた。

【0144】

ＰＣＲ事前増幅
ＰＣＲ事前増幅は、逆転写の直後に、２×ＫＡＰＡＨｉＦＩＨｏｔＳｔａｒｔＲｅａｄｙｍｉｘ（０．５ＵＤＮＡポリメラーゼ、０．３ｍＭｄＮＴＰ、２．５ｍＭＭｇＣｌ_２、２５μＬ反応で１×）（Ｒｏｃｈｅ）、０．１μＭＳｍａｒｔｓｅｑ３順方向ＰＣＲプライマー（５’－ＴＣＧＴＣＧＧＣＡＧＣＧＴＣＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧＡＴＴＧＣＧＣＡＡＴＧ－３’（ＳＥＱＩＤＮＯ：２４）；ＩＤＴ）、０．１μＭＳｍａｒｔｓｅｑ３逆方向ＰＣＲプライマー（５’－ＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡ－３’（ＳＥＱＩＤＮＯ：２５）；ＩＤＴ）からなる１７μＬのＰＣＲミックスを追加して行った。ＰＣＲは次のようにサイクルさせた。すなわち、初期変性について９８℃で３分、９８℃で２０秒、６５℃で３０秒、７２℃で６分の２０サイクルとした。最終伸長は７２℃で５分間行った。

【0145】

ライブラリ調製およびシーケンシング
ＰＣＲ事前増幅に続いて、すべてのサンプルをＡＭｐｕｒｅＸＰビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）で１：０．８のサンプル対ビーズ比で精製した。最終溶出は１５μＬのＨ_２Ｏ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）で行った。ライブラリのサイズ分布は高感度ＤＮＡチップ（ＡｇｉｌｅｎｔＢｉｏａｎａｌｙｚｅｒ）でチェックし、ｃＤＮＡはＱｕａｎｔ－ｉＴＰｉｃｏＧｒｅｅｎｄｓＤＮＡアッセイキット（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）を使用して定量した。ＮｅｘｔｅｒａＸＴＤＮＡサンプル調製キット（Ｉｌｌｕｍｉｎａ）を使用して、製造業者のプロトコルに従って１／５の容積で、２００ｐｇの事前増幅ｃＤＮＡをタグ付けに使用した。タグ付け後、サンプルをプールし、プールをＡｍｐｕｒｅＸＰビーズで１：０．６の比率で精製した。すべてのライブラリは、ＩＬＬＵＭＩＮＡ（登録商標）ＮｅｘｔＳｅｑ５００機器を使用して、高出力フローセルで１×７６ｂｐシングルエンドでシーケンシングされた。

【0146】

リード整列および遺伝子発現推定
生の非逆多重化ｆａｓｔｑファイルは、ＳＴＡＲを備えたｚＵＭＩ２．０を使用して処理され、ＵＭＩを含む５’末端と完全長の非ＵＭＩデータとの両方の発現プロファイルが生成された。ＵＭＩを抽出するために、ｚＵＭＩｆｉｎｄ＿ｐａｔｔｅｒｎ：ＡＴＴＧＣＧＣＡＡＴＧ（ＳＥＱＩＤＮＯ：２６）における特有のリードが、ファイル１に指定され、ならびに、ｂａｓｅ＿ｄｅｆｉｎｉｔｉｏｎ：ｃＤＮＡ（２３～７５）およびＵＭＩ（１２～１９）がＹＡＭＬファイルに指定された。ＵＭＩは、ＵＭＩを折りたたむために１のハミング距離を使用してカウントされた。ｚＵＭＩで完全長プロファイルを取得するために、ＹＡＭＬファイルのｂａｓｅ＿ｄｅｆｉｎｉｔｏｎがファイル１のｃＤＮＡ（１～７５）に設定された。ＨＥＫ２９３ＦＴ細胞を含む実験は、ＥＮＳＥＭＢＬＧＲＣｈ３８．９１からの遺伝子注釈を使用して、ヒトゲノム（ｈｇ３８）に整列およびマッピングされた。

【0147】

Ｓｍａｒｔｓｅｑ３用にテストされた試薬および条件
溶解条件濃度
ＴＸ－１０００．１％、０．１５％、０．２％
グアニジン－ＨＣｌ１００ｍＭ、２５０ｍＭ、３００ｍＭ、３５０ｍＭ
、４００ｍＭ、４５０ｍＭ、５００ｍＭ、７５０ｍ
Ｍ、１Ｍ、１．２５Ｍ、１．５Ｍ、２Ｍ
ウシ血清アルブミン（ＢＳＡ）０．０１ｍｇ／ｍｌ、０．０２５ｍｇ／ｍｌ、０．
０５ｍｇ／ｍｌ、０．１ｍｇ／ｍｌ、０．２５ｍｇ
／ｍｌ、０．５ｍｇ／ｍｌ、１．０ｍｇ／ｍｌ、２
．０ｍｇ／ｍｌ
ＲＮＡｓｅ阻害剤０．５Ｕ／μＬ、１．０Ｕ／μＬ、１．３Ｕ／μＬ
ＰＥＧ８０００Ｋ（Ｌｙｓｉｓ２％、２．５％、４％、５％、６％、７．５％、９
＋ＲＴｖｏｌによるパーセント）％、１０％
オリゴｄＴ（表１）０．１μＭ、０．２μＭ、０．２５μＭ、０．４μ
Ｍ、０．５μＭ、０．７５μＭ、１μＭ、１．２５
μＭ、２μＭ、４μＭ
プロテイナーゼＫ０．０１～１．２５μｇ／μＬ
ｄＮＴＰ（ｍＭ／各）０．０５ｍＭ、０．１ｍＭ、０．２５ｍＭ、０．３
ｍＭ、０．４ｍＭ、０．５ｍＭ、０．７５ｍＭ、０
．８ｍＭ、１ｍＭ、１．２５ｍＭ、１．５ｍＭ、１
．７５ｍＭ、２ｍＭ

【0148】

溶解温度
３７℃で３０分間
７２℃で１分間
７２℃で３分間
７２℃で１０分間
７２℃で２０分間
５０℃で１０分間、８０℃で１０分間

【0149】

ＲＴ緩衝液濃度
トリス－ＨＣｌｐＨ７．０５０ｍＭ
トリス－ＨＣｌｐＨ７．５５０ｍＭ
トリス－ＨＣｌｐＨ８．０２０ｍＭ、２５ｍＭ、３０ｍＭ、３５ｍＭ、４０
ｍＭ、５０ｍＭ、６５ｍＭ、
トリス－ＨＣｌｐＨ８．３２０ｍＭ、２５ｍＭ、３０ｍＭ、３５ｍＭ、４０
ｍＭ、５０ｍＭ、６５ｍＭ、
トリス－アセテートｐＨ７．５５０ｍＭ
ＴＡＰＳ－ＮａＯＨｐＨ８．４５０ｍＭ
ＴＡＰＳ－ＫＯＨｐＨ８．４５０ｍＭ

【0150】

アルカリ性塩化物および塩濃度
ＫＣｌ７５ｍＭ
ＮａＣｌ２５ｍＭ、５０ｍＭ、７５ｍＭ、１００ｍＭ、１２５ｍＭ
、１５０ｍＭ
ＣｓＣｌ７５ｍＭ
ＬｉＣｌ７５ｍＭ
硫酸アンモニウム１０ｍＭ、２０ｍＭ、３０ｍＭ

【0151】

Ｍｇ／Ｍｎソース濃度
ＭｇＣｌ_２２ｍＭ、２．５ｍＭ、３ｍＭ、３．５ｍＭ、４ｍＭ、４．５ｍＭ、５ｍ
Ｍ、６ｍＭ、９ｍＭ、１０ｍＭ、１２ｍＭ
ＭｇＯＡｃ２ｍＭ、２．５ｍＭ、３ｍＭ、３．５ｍＭ、４ｍＭ、４．５ｍＭ、５
ｍＭ、６ｍＭ、９ｍＭ
ＭｇＳＯ_２２ｍＭ、２．５ｍＭ、３ｍＭ、３．５ｍＭ、４ｍＭ、４．５ｍＭ、５ｍ
Ｍ、６ｍＭ、９ｍＭ
ＭｎＣｌ_２０．１ｍＭ、０．２５ｍＭ、０．５ｍＭ、０．７５ｍＭ、１ｍＭ、２ｍ
Ｍ、３ｍＭ、６ｍＭ

【0152】

ＲＴのｄＮＴＰ／ＮＴＰ添加剤濃度
ＧＴＰ０～４ｍＭ
ｄＧＴＰ０～４ｍＭ
ＧＭＰ０～４ｍＭ
ｄＧＭＰ０～４ｍＭ
ｄＣＴＰ０～４ｍＭ
ＣＴＰ０～４ｍＭ
ＣＭＰ０～４ｍＭ
ｄＣＭＰ０～４ｍＭ

【0153】

ＲＴ／ＰＣＲエンハンサー濃度
ベタイン０．３５Ｍ、０．５Ｍ、１Ｍ、１．２Ｍ、１．３Ｍ
、１．５Ｍ、２Ｍ
ウシ血清アルブミン（ＢＳＡ）０．０１ｍｇ／ｍｌ、０．０２５ｍｇ／ｍｌ、０．
０５ｍｇ／ｍｌ、０．１ｍｇ／ｍｌ、０．２５ｍｇ
／ｍｌ、０．５ｍｇ／ｍｌ
グリセロール２％、５％、７％、１０％
ＰＥＧ３００１～１０％
ＰＥＧ４００１～１０％
ＰＥＧ８０００１～１０％
グリコーゲン５％
１，２プロパンジオール５％
ＤＭＳＯ１～５％
ＤＭＦ１～１０％
Ｔｗｅｅｎ－２００．０１～０．５％
Ｔ４遺伝子３２タンパク質０．０１～１μｇ／μＬ
ジチオスレイトール（ＤＴＴ）５ｍＭ、７．５ｍＭ、１０ｍＭ、１２．５ｍＭ、１
５ｍＭ

【0154】

逆転写酵素濃度
ＳｕｐｅｒｓｃｒｉｐｔＩＩ２～１０Ｕ／μＬ
ＳｕｐｅｒｓｃｒｉｐｔＩＩＩ１０Ｕ／μＬ
ＳｕｐｅｒｓｃｒｉｐｔＩＶ１０Ｕ／μＬ
ＲｅｖｅｒｔＡｉｄＨ－ｍｉｎｕｓ２～１０Ｕ／μＬ
ＰｒｏｔｏｓｃｒｉｐｔＩＩ１０Ｕ／μＬ
ＭａｘｉｍａＨ－ｍｉｎｕｓ２～１０Ｕ／μＬ
ＥｐｉＳｃｒｉｐｔ１０Ｕ／μＬ

【0155】

ＲＮＡｓｅ阻害剤濃度
組換えＲＮＡｓｅ阻害剤（ＲＲＩ）０．５Ｕ／μＬ、１Ｕ／μＬ
ＲＮＡｓｅＯＵＴ０．５Ｕ／μＬ、１Ｕ／Ｌ

【0156】

ＴＳＯ（表２）濃度
０．５μＭ、０．７５μＭ、１μＭ、１．５μＭ、２μＭ、４μＭ
、８μＭ、１２μＭ、１６μＭ

【0157】

ＲＴ温度
４２℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、７０℃で１５分間
５０℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
４８℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
４５℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
４２℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
４２℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）
４２℃で６０分間、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
４２℃で４５分間、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
４２℃で３０分間、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
４２℃で１５分間、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
５０℃で３０分間、１０×（３５℃で２分間、５５℃で２分間）、８５℃で５分間
１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
１０×（５０℃で３分間、４２℃で２分間）、８５℃で５分間
１０×（５０℃で２分間、４２℃で４分間）、８５℃で５分間
１０×（４２℃で３分間、５５℃で２分間、３７℃で１分間）、８５℃で５分間
２５℃で９０分間、１０×（５０℃で２分間、２５℃で２分間）、８５℃で５分間
４２℃で９０分間、８５℃で５分間
４５℃で９０分間、８５℃で５分間
４８℃で９０分間、８５℃で５分間
５０℃で６０分間、８５℃で５分間
５０℃で９０分間、８５℃で５分間
５３℃で９０分間、８５℃で５分間
５５℃で９０分間、８５℃で５分間
１０×（４２℃で１０分、１５℃で２分間）、１０×（５０℃で２分、４２℃で２分間）、８５℃で５分
１０×（４２℃で７分間、１５℃で２分間）、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
１０×（５５℃で７分間、１５℃で２分間）、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
１０×（５０℃で３分間、６５℃で３分間、４５℃で３分間、４２℃で３分間）、８５℃で５分間
１０×（５０℃で３分間、４５℃で３分間、４２℃で３分間、３７℃で３分間）、８５℃で５分間
１０×（４２℃で１０分間、３７℃で２分間）、１０×（５０℃で２分間、４２℃で２分間）、８５℃で５分間
５０℃で１０分間、３×（８℃で１５秒間、１５℃で４５秒間、２０℃で４５秒間、３０℃で３０秒間、４２℃で２分間、５０℃で３分間）、５０℃で５分間、８５℃で５分間

【0158】

ＲＴ－ＰＣＲ温度
４２℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、９８℃で３分間２０×（９８℃で２０秒、６３℃で３０秒、７２℃で６分間）、７２℃で５分間
４５℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、９８℃で３分間２０×（９８℃で２０秒、６３℃で３０秒、７２℃で６分間）、７２℃で５分間
４２℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、９８℃で３分間２０×（９８℃で２０秒、６５℃で３０秒、７２℃で６分間）、７２℃で５分間
４５℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、９８℃で３分間２０×（９８℃で２０秒、６５℃で３０秒、７２℃で６分間）、７２℃で５分間
４２℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、９８℃で３分間２０×（９８℃で２０秒、６７℃で３０秒、７２℃で６分間）、７２℃で５分間
４５℃で９０分間、１０×（５０℃で２分間、４２℃で２分間）、９８℃で３分間２０×（９８℃で２０秒、６７℃で３０秒、７２℃で６分間）、７２℃で５分間

【0159】

ＰＣＲキットおよびポリメラーゼ濃度
ＫＡＰＡＨｉＦｉＨｏｔＳｔａｒｔＰＣＲキット
ＴｅｒｒａＰＣＲダイレクトポリメラーゼキット
ＫＡＰＡＨｉＦｉＰＣＲキット
Ｑ５ＨｉｇｈＦｉｄｅｌｉｔｙＤＮＡポリメラーゼ
ＰｌａｔｉｎｕｍＳｕｐｅｒＦｉＤＮＡポリメラーゼ
ＰｈｕｓｉｏｎＨｉｇｈＦｉｄｅｌｉｔｙＤＮＡポリメラーゼ
ＰＣＲプライマー（表３）０．０５μＭ、０．０８μＭ、０．１μＭ

【0160】

ＰＣＲ温度
９８℃で３分間２０×（９８℃で２０秒間、６５℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間１８×（９８℃で２０秒間、６５℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６０℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６１℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６２℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６３℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６４℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６５℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６６℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６７℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６８℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６９℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、７０℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、７１℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、７２℃で３０秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６０℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６１℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６２℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６３℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６４℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６５℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６６℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６７℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６８℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、６９℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、７０℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、７１℃で１５秒間、７２℃で６分間）、７２℃で５分間
９８℃で３分間２０×（９８℃で２０秒間、７２℃で１５秒間、７２℃で６分間）、７２℃で５分間

【0161】

【表1】

【0162】

【表2-1】

【0163】

【表2-2】

【0164】

【表3】

【0165】

【表4-1】

【0166】

【表4-2】

【0167】

【表4-3】

【0168】

【表4-4】

【0169】

【表4-5】

【0170】

【表4-6】

【0171】

【表4-7】

【0172】

【表4-8】

【0173】

【表4-9】

【0174】

【表4-10】

【0175】

【表4-11】

【0176】

【表4-12】

【0177】

【表4-13】

【0178】

【表4-14】

【0179】

【表4-15】

【0180】

【表4-16】

【0181】

【表4-17】

【0182】

Ｂ．結果および考察
ＲＮＡ分子定量化のための完全長トランスクリプトーム情報とＵＭＩとの両方のシングルセルＲＮＡシーケンシングを可能にするために、Ｓｍａｒｔ－ｓｅｑ２を出発点として新しいシングルセルＲＮＡシーケンシングアッセイが設計された。最初に、逆転写、テンプレートスイッチング、および事前増幅用の新しいオリゴヌクレオチドが設計された（図１Ａ～図１Ｂ）。この目的のために、最初に、部分的なＮｅｘｔｅｒａＰ５アダプター配列、固有識別タグ配列、および国際純正・応用化学連合（ＩＵＰＡＣ）により定義されたＮｓまたはＨｓヌクレオチドからなるＵＭＩを含むように修飾されたテンプレートスイッチングオリゴヌクレオチド（ＴＳＯ）で実験した。オリゴｄＴオリゴヌクレオチドは、Ｔストレッチの長さと末端修飾との観点から修飾された。事前増幅ＰＣＲプライマーは、キャプチャされたｃＤＮＡの５’末端に残りのＮｅｘｔｅｒａＰ５アダプター配列を組み込むように修飾された。これにより、固有識別タグとＵＭＩとを保持する５’末端ｃＤＮＡフラグメント、ならびに、完全長転写産物のフラグメントの両方のシーケンシングが可能になった（図７Ａ～図７Ｂ）。完全なワークフローを図１Ａ～図１Ｂに示す。

【0183】

この全般的な設計に基づいて、多数のＴＳＯ（表２）、オリゴｄＴオリゴヌクレオチド（表１）、およびＰＣＲオリゴヌクレオチド（表３）が実験的にテストされた。新しいオリゴヌクレオチドの設計は、９６または３８４ウェルプレートに個別に分類されたＨＥＫ３９３Ｔ細胞からＲＮＡをキャプチャしてｃＤＮＡを増幅するそれらの能力に基づいて評価された。高い増幅ｃＤＮＡ収量および長さをもたらしたオリゴヌクレオチド設計のｃＤＮＡ産物は、タグ付けされ、シーケンシングのために調製され、その後の実験で使用された。ＲＮＡのキャプチャとｃＤＮＡへの変換を増加させるそれらの能力について、多数の反応条件と添加剤とが体系的に調査された。ＩＬＬＵＭＩＮＡ（登録商標）ＮｅｘｔＳｅｑ５００シーケンシングシステムを使用して、細胞ごとにキャプチャされて細胞ごとの検出遺伝子数と細胞ごとの検出固有ＵＭＩ数とで定量化されたトランスクリプトームの複雑さを監視した（シーケンシングエラーによるＵＭＩ配列と別のＵＭＩの１ハミング距離以内のものとを除外した後）。Ｓｍａｒｔ－ｓｅｑ２を含む既存のシングルセルＲＮＡシーケンシングアッセイと比較して、大幅に改善された感度が得られた。いくつかの逆転写酵素は、ＳｕｐｅｒｓｃｒｉｐｔＩＩよりも処理能力と耐熱性とを改善した。例えば、逆転写酵素ＭａｘｉｍａＨｍｉｎｕｓは、大幅に削減されたコストで遺伝子キャプチャと感度とをともに向上させる新しい反応緩衝液で使用された。逆転写酵素反応では、ｄＮＴＰの量（０．１ｍＭ／各～０．８ｍＭ／各）とＭｇＣｌ_２の範囲（２～４ｍＭ）とが減少し、ＭａｘｉｍａＨＭｉｎｕｓの文脈で、全体の収量および感度が向上した。パフォーマンスを体系的に評価するために、さまざまな添加剤を使用した実験に加えて、この全般的な逆転写およびテンプレートスイッチング反応の６５種の異なるバリエーションをテストした（以下を参照）。６５種の異なる条件で細胞あたりに検出された遺伝子の数を図２に示す。Ｓｍａｒｔ－ｓｅｑ２と比較して大幅に改善された遺伝子検出が、多くの異なる条件で観察された。感度の向上により、より多くのポリアデニル化されたノンコーディングＲＮＡ、特に最たるものとして長鎖遺伝子間ノンコーディングＲＮＡ（ｌｉｎｃＲＮＡ）が検出される結果となった（図３）。

【0184】

さらに、ＲＮＡからのｃＤＮＡ変換は、増強添加剤、特に、単独および組み合わせの両方で０．１～２ｍＭの範囲のｄＣＴＰおよびＧＴＰ、ならびに２～９％の範囲の分子クラウディング剤ＰＥＧの追加によって改善された。ｄＣＴＰをさらに追加すると、合成されたｃＤＮＡ鎖の３’末端にある逆転写酵素によって作成されたＣテールにおけるＣの取り込み率を増加させることができた。さらに、テンプレートスイッチング反応への相補的リボヌクレオチドの追加により、モロニーマウス白血病ウイルス逆転写酵素（ＭＭＬＶ－ＲＴ）の文脈においてそれがＲＮＡテンプレートの５’末端に達したときに、より長くまたはより安定した非テンプレート化Ｃテールを促進することが示されている。相補的リボヌクレオチド（ＧＴＰ）の投与は、シングルセルＲＮＡシーケンシングのテンプレートスイッチング反応の効率を高めるために使用できると仮定された。本明細書に示されているように、ｄＣＴＰおよびＧＴＰの追加は、結果として得られたシングルセルＲＮＡシーケンシングライブラリにてキャプチャされた遺伝子に影響を与えた。クラウディング剤ＰＥＧは、有効反応容積を減らすことにより、酵素反応速度と効率とを高めると考えられている。クラウディング剤ＰＥＧは、単一の添加剤としてまたは他の添加剤と一緒にＧＴＰとしての両方で感度を大幅に向上させた（図２）。

【0185】

シングルセルＲＮＡシーケンシングライブラリの構築に必要な総ハンズオン時間を短縮し、その高スループット組み込みを容易にするために、逆転写およびＰＣＲ事前増幅を２段階の反応としてではなく１段階の反応で実行する可能性も示した（図２）。

【0186】

さまざまな生物学的アプリケーションでは、最終的なシーケンシングライブラリにＵＭＩ含有５’リードのフラクションを高くしたり低くしたりすることが望ましい場合がある。例えば、トランスクリプトームのゲノム変異を利用する実験では、より高い数の内部リードが必要になるが、ＲＮＡをカウントする実験では、ＲＮＡの５’末端にわたってより高いカバレッジが必要になる。タグ付け効率を調節または調整することにより、シーケンシングライブラリ内のＵＭＩ含有５’リードのパーセンテージを実験的に制御することができた。この調節または調整は、Ｔｎ５とｃＤＮＡとの比率を変更することによって、および／または反応時間を短縮して、それによりシーケンシングライブラリ内のＵＭＩ含有５’リードのパーセンテージを増減することによって実行できた（図４）。概して、シーケンシングライブラリの長さの分布は、シーケンシングライブラリ内のＵＭＩ含有５’リードのフラクションの強力な指標であり（図５）、これは、フラグメントが長いほど５’末端が含まれる可能性がより高いためであった。シーケンシングライブラリにおけるそれらの相対的な存在量を制御するための実験的戦略と組み合わされた、５’末端および内部ＲＮＡフラグメントの両方でＵＭＩをキャプチャする独自の能力は、本発明の重要な利点である。

【0187】

ＲＮＡの二次構造には重要な機能があり、ＲＮＡをｃＤＮＡに逆転写する能力にも影響を及ぼす。シングルセルＲＮＡシーケンシングアプリケーションでは、ＫＣｌの代わりにＮａＣｌまたはＣｓＣｌを使用すると、シングルセルＲＮＡシーケンシング反応の感度の向上につながった（図６）。ＫＣｌは、分子内または分子間のいずれかでｒＧヌクレオチドを含むＲＮＡ分子の４本鎖構造を促進し、観察された改善は、より効率的にｃＤＮＡに逆転写されて、それにより結果として得られたライブラリのシーケンシングでキャプチャされた構造化ＲＮＡの減少によるものと思われる。なお、ＬｉＣｌの使用は標準のＫＣｌの使用よりも悪かった（データは示していない）。

【0188】

図２は、表４にリストされた６５種の異なるテスト実験条件のそれぞれについて、細胞ごとに検出された遺伝子の数を示す箱ひげ図を示す。条件６５は既存のＳｍａｒｔ－ｓｅｑ２ライブラリである。本発明を使用する多種多様な新しい反応条件は、Ｓｍａｒｔ－ｓｅｑ２と比較して、細胞あたり有意に多数の遺伝子を検出する。条件ごとに分析された固有細胞の数は、箱ひげ図の右側に表示される。箱ひげ図にはデフォルトのレイアウトがあり、つまり、ヒンジは１番目と３番目の四分位数を示し、ひげは四分位範囲（ＩＱＲ）の１．５×を示す。

【0189】

図３Ａおよび図３Ｂは、テスト実験条件の代表的なサブセット（表４参照）について細胞ごとに検出され、遺伝子バイオタイプによって分類された遺伝子の数を示す箱ひげ図を示す。タンパク質コーディングＲＮＡの検出が有意に増加することに加えて、本発明は、Ｓｍａｒｔ－ｓｅｑ２と比較して、ｌｉｎｃＲＮＡを含む有意により多くのノンコーディングＲＮＡも検出することに留意されたい。図３Ａおよび図３ＢのｓｎｏＲＮＡは、核小体低分子ＲＮＡを示す。

【0190】

図４は、さまざまなタグ付け反応条件の条件１１（表４参照）のシーケンシングライブラリ内のＵＭＩを伴う５’末端リードのパーセンテージを示す箱ひげ図を示す。反応に存在するＴｎ５トランスポザーゼの量を減らすと、タグ付けの効率が低下し、それにより、ＵＭＩを伴う５’末端含有リードの増加につながる。さらに、入力ｃＤＮＡの量を減らすか、または、タグ付け反応時間を増やすと、タグ付け効率が高くなり、シーケンシングライブラリでのＵＭＩ含有リードが少なくなる結果となった。開始ｃＤＮＡは、さまざまなｃＤＮＡ入力の条件を除いて、図４に示すすべての条件で同一であった。

【0191】

したがって、内部リードに対するＵＭＩを伴う５’リードの比率は、Ｔｎ５トランスポザーゼの量の制御、入力ｃＤＮＡの量の制御、および／またはタグ付け反応時間の制御によってなど、タグ付け効率を制御または調整することによって制御または調整できる。

【0192】

図５Ａから図５Ｃは、示差的にタグ付けされたｃＤＮＡのｃＤＮＡ長さ分布を示す。図面は、図４に示すライブラリのＡｇｉｌｅｎｔＢｉｏＡｎａｌｙｚｅｒトレースを示す。図面に示す結果は、シーケンシングライブラリのフラグメント長を制御することでシーケンシングライブラリのＵＭＩのレベルを制御できることを検証している。

【0193】

図６Ａから図６Ｃは、反応塩および実験添加物を変更することによって遺伝子検出を増加させることができることを示す。図６Ａは、細胞ごとに検出された固有ＵＭＩの数を示す箱ひげ図を示し、図６Ｂは、細胞ごとのＵＭＩ含有リードによって検出された遺伝子の数を示す箱ひげ図を示し、図６Ｃは、細胞ごとのすべてのリードによって検出された遺伝子の数を示す箱ひげ図を示す。箱ひげ図の下に示すように、３種類の塩をＮａＣｌ、ＣｓＣｌ、およびＫＣｌでテストした。箱ひげ図の下に示すように、添加剤５％ＰＥＧ、ｄＣＴＰ、およびＧＴＰを反応に追加した。

【0194】

図７Ａおよび図７Ｂは、それぞれ、内部リードおよびＵＭＩ含有５’末端リードについてのＲＮＡ分子にわたるリードカバレッジを示す。図面に示されているように、内部リードはＲＮＡ分子をカバーするが、ＵＭＩ含有５’末端リードは正確にＲＮＡ分子の５’末端に大きく偏っている。

【0195】

Ｂ．実施例１および仕様の参照
［１］Ｉｓｌａｍｅｔａｌ．、高度に多重化されたＲＮＡ－ｓｅｑによるシングルセル転写ランドスケープの特性評価、ＧｅｎｏｍｅＲｅｓｅａｒｃｈ（２０１１）２１：１１６０－１１６７
［２］Ｈａｓｈｉｍｓｈｏｎｙｅｔａｌ．、ＣＥＬ－Ｓｅｑ：多重化線形増幅によるシングルセルＲＮＡ－Ｓｅｑ、ＣｅｌｌＲｅｐｏｒｔｓ（２０１２）、２（３）：６６６－６７３
［３］Ｊａｉｔｉｎｅｔａｌ．、組織の細胞タイプへのマーカーフリー分解のための超並列シングルセルＲＮＡ－Ｓｅｑ、Ｓｃｉｅｎｃｅ（２０１４）３４３（６１７２）：７７６－７７９
［４］ｈｔｔｐｓ：／／ｗｗｗ．１０ｘｇｅｎｏｍｉｃｓ．ｃｏｍ／ｓｉｎｇｌｅ－ｃｅｌｌ－ｔｅｃｈｎｏｌｏｇｙ／
［５］Ｒｏｓｅｎｂｅｒｇｅｔａｌ．、スプリットプールバーコーディングによる発達中のマウスの脳と脊髄のシングルセルプロファイリング、Ｓｃｉｅｎｃｅ（２０１８）、３６０（６３８５）：１７６－１８２
［６］Ｃａｏｅｔａｌ．、多細胞生物の包括的なシングルセル転写プロファイリング、Ｓｃｉｅｎｃｅ（２０１７）、３５７（６３５２）：６６１－６６７
［７］Ｒａｍｓｋoｌｄｅｔａｌ．、ＲＮＡのシングルセルレベルおよび個々の循環腫瘍細胞からの完全長ｍＲＮＡ－Ｓｅｑ、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ（２０１２）、３０：７７７－７８２
［８］ＷＯ２０１５／０２７１３
［９］技術スポットライト：ＩＬＬＵＭＩＮＡ（登録商標）シーケンシングｈｔｔｐｓ：／／ｗｗｗ．ｉｌｌｕｍｉｎａ．ｃｏｍ／ｄｏｃｕｍｅｎｔｓ／ｐｒｏｄｕｃｔｓ／ｔｅｃｈｓｐｏｔｌｉｇｈｔｓ／ｔｅｃｈｓｐｏｔｌｉｇｈｔ＿ｓｅｑｕｅｎｃｉｎｇ．ｐｄｆ（２０１８年１２月２０日取得）
［１０］Ｐｉｃｅｌｌｉｅｔａｌ．、単一細胞における高感度の完全長トランスクリプトームプロファイリングのためのＳｍａｒｔ－ｓｅｑ２、ＮａｔｕｒｅＭｅｔｈｏｄｓ（２０１３）、１０（１１）：１０９６－１０９８
［１１］Ｐｉｃｅｌｌｉ、Ｓｍａｒｔ－ｓｅｑ２を使用した単一細胞からの完全長ＲＮＡ－ｓｅｑ、ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ（２０１４）、９（１）：１７１－１８１

【0196】

ＩＩ．実施例２－Ｓｍａｒｔ－ｓｅｑ３を使用した対立遺伝子およびアイソフォーム分解能でのシングルセルＲＮＡカウント
Ａ．導入
個々の細胞からのＲＮＡの大規模シーケンシングにより、細胞の種類および状態にわたる遺伝子、アイソフォームおよび対立遺伝子の発現のパターンを明らかにすることができる^１。ただし、現在のシングルセルＲＮＡシーケンシング（ｓｃＲＮＡ－ｓｅｑ）方法では、対立遺伝子およびアイソフォームの分解能でＲＮＡをカウントする能力が制限されており、ロングリードシーケンシング技術では、細胞にわたる大規模アプリケーションに必要な深度が不足している^２，３。ここでは、完全長トランスクリプトームカバレッジと５’固有分子識別子（ＵＭＩ）ＲＮＡカウント戦略を組み合わせたＳｍａｒｔ－ｓｅｑ３を導入し、これにより、細胞あたり数千のＲＮＡ分子のインシリコ再構築が可能になった。重要なことに、カウントおよび再構築されたＲＮＡ分子の大部分は、特定のアイソフォームおよび対立遺伝子起源に直接、割り当てられることができ、マウス系統およびヒト細胞タイプにおける有意な転写産物アイソフォーム調節を認めた。さらに、Ｓｍａｒｔ－ｓｅｑ３は感度の劇的な増加を示し、典型的には、Ｓｍａｒｔ－ｓｅｑ２よりも細胞あたり数千ものより多くの遺伝子を検出した。全体として、組織および生物にわたる細胞タイプおよび状態の大規模な特性評価に適用できる、アイソフォームおよび対立遺伝子分解能でのシングルセルＲＮＡカウントのためのショートリードシーケンシング戦略を開発した。

【0197】

ほとんどのｓｃＲＮＡ－ｓｅｑ方法は、ＵＭＩをＲＮＡの短い部分（５’または３’末端のいずれかから）と一緒にシーケンシングすることによってＲＮＡをカウントする^４。これらのＲＮＡ末端カウント戦略は、ＰＣＲ増幅バイアスを制御しながら、多数の細胞にわたる遺伝子発現を推定するために効果的であったが、ＲＮＡ末端シーケンシングは転写産物アイソフォーム発現または転写された遺伝的変異に関する情報をほとんど提供していない。さらに、多くの超並列方法には、感度がかなり低い（つまり、細胞内に存在するＲＮＡのごくわずかなフラクションしかキャプチャしない）という問題がある^５。対照的に、Ｓｍａｒｔ－ｓｅｑ２は、より高い感度と完全長カバレッジとを組み合わせており^６、これは例えば、対立遺伝子分解発現解析を可能にしたが^７、スループットが低く、コストが高く、ＵＭＩを組み込まなかった。ロングリードシーケンシング技術を使用した完全長転写産物のシーケンシングは、対立遺伝子およびアイソフォームレベルの発現を直接、定量化できるが、それらの現在の深度は、細胞、組織、および生物にわたるそれらの幅広いアプリケーションを妨げる^２，３。これらの欠点を克服するために、ＲＮＡカウントパラダイムを拡大して、個々のＲＮＡ分子を単一細胞のアイソフォームおよび対立遺伝子起源に直接、割り当てる高感度のショートリードシーケンシング方法の開発を試みた。

【0198】

Ｂ．材料および方法
細胞培養
ＨＥＫ２９３ＦＴ細胞（Ｉｎｖｉｔｒｏｇｅｎ）を、４．５ｇ／Ｌグルコースと６ｍＭＬ－グルタミン（Ｇｉｂｃｏ）とを含み、１０％ウシ胎児血清（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ）、０．１ｍＭＭＥＭ非必須アミノ酸（Ｇｉｂｃｏ）、１ｍＭピルビン酸ナトリウム（Ｇｉｂｃｏ）および１００μｇ／ｍＬペニシリン／ストレプトマイシン（Ｇｉｂｃｏ）を添加した完全ＤＭＥＭ培地で培養した。細胞を、ＴｒｙｐＬＥｅｘｐｒｅｓｓ（Ｇｉｂｃｏ）を使用して分離し、ヨウ化プロピジウムで染色して死細胞を排除した後、ＢＤＦＡＣＳＭｅｌｏｄｙ１００μｍノズル（ＢＤＢｉｏｓｃｉｅｎｃｅ）を使用して３μＬの溶解バッファーを含む９６または３８４ウェルプレートに分配した。Ｓｍａｒｔ－ｓｅｑ３溶解バッファーは、０．５ユニット／μＬの組換えＲＮａｓｅ阻害剤（ＲＲＩ）（Ｔａｋａｒａ）、０．１５％ＴｒｉｔｏｎＸ－１００（Ｓｉｇｍａ）、０．５ｍＭｄＮＴＰ／各（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）、１μＭのＳｍａｒｔ－ｓｅｑ３オリゴｄＴプライマー（５’－ビオチン－ＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡＴ_３０ＶＮ－３’（ＳＥＱＩＤＮＯ：７７）；ＩＤＴ）、５％ＰＥＧ（Ｓｉｇｍａ）および０．０５μＬの１：４０．０００希釈ＥＲＣＣスパイクインミックス１（ＨＥＫ２９３ＦＴ細胞用）からなる。選別後すぐにプレートをスピンダウンし、－８０℃で保存した。

【0199】

初代マウス線維芽細胞は、ＣＡＳＴ／ＥｉＪ×Ｃ５７／Ｂｌ６Ｊ由来の成体マウスの尾外植片から得られた（スウェーデン農業委員会、Ｊｏｒｄｂｒｕｋｓｖｅｒｋｅｔ：Ｎ３４３／１２からの倫理的承認を得て）。細胞を培養し、（ＤＭＥＭ高グルコース（Ｉｎｖｉｔｒｏｇｅｎ）、１０％ＥＳ細胞ＦＢＳ（Ｇｉｂｃｏ）、１％ペニシリン／ストレプトマイシン（Ｉｎｖｉｔｒｏｇｅｎ）、１％非必須アミノ酸（Ｉｎｖｉｔｒｏｇｅｎ）、１％ピルビン酸ナトリウム（Ｉｎｖｉｔｒｏｇｅｎ）、０．１ｍＭｂ－メルカプトエタノール（Ｓｉｇｍａ）で２回、継代し、その後、ヨウ化プロピジウムで染色し、３μＬのＳｍａｒｔ－ｓｅｑ３溶解バッファーを含む３８４ウェルプレートにて選別した。再度、プレートをスピンダウンし、選別直後に－８０℃で保存した。

【0200】

ヒトＰＢＭＣ、マウス結腸、ならびに蛍光標識細胞系統ＨＥＫ－２９３－ＲＦＰ、ＮｉＨ３Ｔ３－ＧＦＰ、およびＭＤＣＫ－Ｔｕｒｂｏ６５０のミックスからなるＨｕｍａｎＣｅｌｌＡｔｌａｓ（ＨＣＡ）参照サンプルを、指定された指示に従って解凍した^４。細胞は、Ｌｉｖｅ／Ｄｅａｄ固定可能ＧｒｅｅｎＤｅａｄ細胞染色キット（Ｉｎｖｉｔｒｏｇｅｎ）で染色され、これは、死細胞ならびにＮＩＨ３Ｔ３－ＧＦＰ細胞の除外を容易にした。さらに、破片とダブレットとの両方がゲーティングにて除外された。１００μｍノズルのＢＤＦＡＣＳＭｅｌｏｄｙソーター（ＢＤＢｉｏｓｃｉｅｎｃｅ）を使用して、３μＬのＳｍａｒｔ－ｓｅｑ３溶解バッファーを含む３８４ウェルプレートに細胞をインデックスソートした。

【0201】

Ｓｍａｒｔ－ｓｅｑ２ライブラリの生成
Ｓｍａｒｔ－ｓｅｑ２ｃＤＮＡライブラリは、公開されているプロトコルに従って生成された^２２。Ｓｍａｒｔ－ｓｅｑ２－ＵＭＩの場合、ｃＤＮＡライブラリは以前に公開されたように生成された^１２。他の「中間」Ｓｍａｒｔ－ｓｅｑ２反応のレシピは表４に見出される。タグ付けは、以下に説明するＳｍａｒｔ－ｓｅｑ３と同様のｃＤＮＡ入力と容積とで実行された。

【0202】

Ｓｍａｒｔ－ｓｅｑ３ライブラリの生成
細胞溶解とＲＮＡの変性とを促進するために、プレートを７２℃で１０分間、インキュベートし、その後すぐに氷上に置いた。次に、２５ｍＭＴｒｉｓ－ＨＣＬｐＨ８．３（Ｓｉｇｍａ）、３０ｍＭＮａＣｌ（Ａｍｂｉｏｎ）、１ｍＭＧＴＰ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）、２．５ｍＭＭｇＣｌ２（Ａｍｂｉｏｎ）、８ｍＭＤＴＴ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）、０．５ｕ／μＬＲＲＩ（Ｔａｋａｒａ）、２μＭの異なるＳｍａｒｔ－ｓｅｑ３テンプレートスイッチングオリゴ（ＴＳＯ）（評価されたＴＳＯのリストについては追加の表を参照；５’－ビオチン－ＡＧＡＧＡＣＡＧＡＴＴＧＣＧＣＡＡＴＧＮＮＮＮＮＮＮＮｒＧｒＧｒＧ－３’（ＳＥＱＩＤＮＯ：７８）；ＩＤＴ）および２ｕ／μＬＭａｘｉｍａＨＭｉｎｕｓ逆転写酵素（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）を含む１μＬの逆転写ミックスを、各サンプルに追加した。逆転写およびテンプレートスイッチングは、４２℃で９０分間、続いて５０℃で２分間および４２℃で２分間の１０サイクルで実行された。８５℃で５分間、インキュベートすることにより反応を停止させた。ＰＣＲ事前増幅は、６μＬのＰＣＲミックスを追加し、反応濃度を１×ＫＡＰＡＨｉＦｉＰＣＲ緩衝液（１×での２ｍＭのＭｇＣｌ_２を含む）（Ｒｏｃｈｅ）、０．０２ｕ／μｌＤＮＡポリメラーゼ（Ｒｏｃｈｅ）、０．３ｍＭｄＮＴＰ、０．１μＭＳｍａｒｔｓｅｑ３順方向ＰＣＲプライマー（５’－ＴＣＧＴＣＧＧＣＡＧＣＧＴＣＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧＡＴＴＧＣＧＣＡＡＴＧ－３’（ＳＥＱＩＤＮＯ：７９）；ＩＤＴ）、０．１μＭＳｍａｒｔｓｅｑ３逆方向ＰＣＲプライマー（５’－ＡＣＧＡＧＣＡＴＣＡＧＣＡＧＣＡＴＡＣＧＡ－３’（ＳＥＱＩＤＮＯ：８０）；ＩＤＴ）とすることにより、逆転写後に直接、行った。ＰＣＲは次のようにサイクルされた。すなわち、初期変性のために９８℃で３分と、９８℃で２０秒、６５℃で３０秒、７２℃で６分の２０～２４サイクルとした。最終伸長は７２℃で５分間行った。さまざまな反復および最適化条件については、ライブラリ調製に対する特定の条件付き変更についての情報の補足の表１を参照のこと。

【0203】

配列ライブラリ調製
ＰＣＲ事前増幅後、使用したプロトコルに関係なく、すべてのサンプルをＡＭｐｕｒｅＸＰビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）または自家製２２％ＰＥＧビーズ（ｐｒｏｔｏｃｏｌｓ．ｉｏのｐｒｏｔｏｃｏｌｄｏｉ：１０．１７５０４／ｐｒｏｔｏｃｏｌｓ．ｉｏ．ｐ９ｋｄｒ４ｗのステップ２７を参照）で精製した。ライブラリサイズの分布を高感度ＤＮＡチップ（ＡｇｉｌｅｎｔＢｉｏａｎａｌｙｚｅｒ）でチェックし、Ｑｕａｎｔ－ｉＴＰｉｃｏＧｒｅｅｎｄｓＤＮＡアッセイキット（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）を使用してすべてのｃＤＮＡ濃度を定量化した。続いてｃＤＮＡを１００～２００ｐｇ／ｕＬに希釈した。タグ付けは、１×タグ付け緩衝液（１０ｍＭＴｒｉｓｐＨ７．５、５ｍＭＭｇＣｌ_２、５％ＤＭＦ）、０．０８～０．１ｕＬＡＴＭ（ＩｌｌｕｍｉｎａＸＴＤＮＡサンプル調製キット）またはＴＤＥ１（ＩｌｌｕｍｉｎａＤＮＡサンプル調製キット）、１ｕＬｃＤＮＡおよびＨ_２Ｏからなる２ｕＬで行った。プレートを５５℃で１０分間、インキュベートした後、０．５ｕＬの０．２％ＳＤＳを追加してＤＮＡからＴｎ５を放出した。タグ付けされたサンプルのライブラリ増幅は、１．５ｕＬのＮｅｘｔｅｒａＸＴインデックスプライマー（Ｉｌｌｕｍｉｎａ）、または、８もしくは１０ｂｐインデックスを含む１．５ｕＬのカスタム設計されたＮｅｘｔｅｒａインデックスプライマーのいずれか（それぞれ０．１ｕＭ）を使用して実行され、任意の２つのインデックス間において２の最小レーベンシュタイン距離で異なった。３ｕＬＰＣＲミックス（１×ＰｈｕｓｉｏｎＢｕｆｆｅｒ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）、０．０１Ｕ／ｕＬＰｈｕｓｉｏｎＤＮＡポリメラーゼ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）、０．２ｍＭｄＮＴＰ／各）を各ウェルに加え、３分、７２℃；３０秒、９５℃；（１０秒、９５℃；３０秒、５５℃；３０秒、７２℃）の１２サイクル；５分、７２℃で；サーマルサイクラーでインキュベートした。ＵＭＩフラグメント条件を最適化する実験について、タグ付け手順へのその後の変更（ｃＤＮＡ入力、ＡＴＭの量、５５℃での時間）を図９ｃに示す。タグ付け後、サンプルをプールし、プールをＡｍｐｕｒｅＸＰビーズまたは２２％自家製ＰＥＧビーズで１：０．６の比率で精製した。ライブラリは、ＩｌｌｕｍｉｎａＮｅｘｔＳｅｑ５００機器を使用した高出力フローセル上で７５ｂｐシングルエンドもしくは１５０ｂｐペアエンドで、またはＮｏｖａＳｅｑＳ４フローセル上で１５０ｂｐペアエンドで、シーケンシングされた。

【0204】

ゲル切断パイロット
さらに、マウス線維芽細胞のシーケンシングを行う前に、特定の長さのライブラリを選択して実験を行った。２０ｕＬの精製配列レディライブラリを使用し、２％アガロースＥ－ＧｅｌＥＸにそれをロードし、ゲルを１２分間、ランさせた。５５０～２０００ｂｐに対応する領域でゲルを手動で切断し、製造業者のプロトコルに従ってＱｉａｇｅｎＱｉａＱｕｉｃｋゲル抽出キットを使用してライブラリを再精製した。適度な改善が見られたが、より長いフラグメントを選択すると、再構成の長さが改善される可能性がある。

【0205】

リード整列および遺伝子発現推定
生の非逆多重化ｆａｓｔｑファイルは、ＳＴＡＲ（ｖ２．５．４ｂ）でｚＵＭＩ（バージョン２．４．１以降）を使用して処理され、ＵＭＩを含む５’末端ならびに完全長およびＵＭＩデータの組み合わせの両方についての発現プロファイルが生成された。ｚＵＭＩでＵＭＩ含有リードを抽出して識別するために、ファイル１についてｆｉｎｄ＿ｐａｔｔｅｒｎ：ＡＴＴＧＣＧＣＡＡＴＧ（ＳＥＱＩＤＮＯ：８１）を指定し、ならびに、ＹＡＭＬファイルにてｂａｓｅ＿ｄｅｆｉｎｉｔｉｏｎ：ｃＤＮＡ（２３～７５；シングルエンド）、（２３～１５０ｂｐ、ペアエンド）およびＵＭＩ（１２～１９）を指定した。ＵＭＩは、ハミング距離１を使用して折りたたまれた。ヒト細胞はｈｇ３８ゲノムにマッピングされ、マウス線維芽細胞はｍｍ１０ゲノムに対してマッピングされ、マッピングバイアスを回避するためにＣＡＳＴＳＮＰがＮでマスクされ、両方に追加のＳＴＡＲパラメータ「－－ｌｉｍｉｔＳｊｄｂＩｎｓｅｒｔＮｓｊ２００００００－－ｏｕｔＦｉｌｔｅｒＩｎｔｒｏｎＭｏｔｉｆｓ－－ＲｅｍｏｖｅＮｏｎｃａｎｏｎｉｃａｌＵｎａｎｎｏｔａｔｅｄ－－ｃｌｉｐ３ｐＡｄａｐｔｅｒＳｅｑＣＴＧＴＣＴＣＴＴＡＴＡＣＡＣＡＴＣＴ」（ＳＥＱＩＤＮＯ：８２）が添加された。ＨＥＫ２９３ＦＴ細胞を含む実験は、ＥｎｓｅｍｂｌＧＲＣｈ３８．９１からの遺伝子注釈を使用して定量化された。マウスの一次線維芽細胞データは、ＥｎｓｅｍｂｌＧＲＣｍ３８．９１からの遺伝子注釈を使用して定量化された。

【0206】

Ｆ１マウス分子の対立遺伝子呼び出し
ＣＡＳＴ／ＥｉＪ系統特異的ＳＮＰは、マウスゲノムプロジェクト^２３ｄｂＳＮＰ１４２から取得され、既存のＣＡＳＴ／ＥｉＪ×Ｃ５７／Ｂｌ６ＪＦ１データで明確に観察されたバリアントについてフィルタリングされ、１，８８２，８６０の高品質ＳＮＰ位置が得られた。固有にマッピングされたリードペアが抽出され、ＧｅｎｏｍｉｃＡｌｉｇｎｍｅｎｔｓパッケージを使用してＣＩＧＡＲ値が解析された^２４。既知の高品質ＳＮＰをカバーするリードは保持され、ＵＭＩシーケンスによってグループ化された。ＣＡＳＴもＣ５７対立遺伝子も示さないＳＮＰ位置に＞３３％の塩基を持つ分子は破棄され、割り当てを行うために２つの対立遺伝子の１つを示すには、＞６６％のＳＮＰ塩基が分子内で観察される必要があった。

【0207】

転写バースト動態の推論
対立遺伝子分解ＵＭＩカウントを使用して、前述のようにｓｃＲＮＡ－ｓｅｑデータからバースト動態の最尤推定を生成した^１２。推論スクリプトはｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｓａｎｄｂｅｒｇ－ｌａｂ／ｔｘｂｕｒｓｔで入手できる。この研究で生成されたデータとの公正な比較を確実にするために、ｚＵＭＩおよび上記と同じＳＮＰセットを使用して、欧州ヌクレオチドアーカイブアクセッションＥ－ＭＴＡＢ－７０９８に寄託されたＳｍａｒｔ－ｓｅｑ２データを再処理した。

【0208】

混合種ベンチマークサンプルの一次データ処理
完全なデータセットは、ヒト（ｈｇ３８）、マウス（ｍｍ１０）、およびイヌ（ＣａｎＦａｍ３．１）についての組み合わせたリファレンスゲノムに対してマッピングされた。マウスまたはイヌに明確（＞７５％リード）にマッピングされている細胞が削除された。ＨＥＫ２９３、ＰＢＭＣ、および潜在的な低品質ライブラリを表す残りの細胞は、ｚＵＭＩ（バージョン２．５．５）を使用して処理され、ヒトゲノムに対してのみマッピングされた。

【0209】

ヒトＨＣＡベンチマークサンプルの分析
まず細胞を、＞１０，０００の生リードを必要とする低品質ライブラリ、ゲノムにマッピングされた＞７５％のリード、および＞２５％のエキソニックフラクションについてフィルタリングした。検出された＞５００の遺伝子を伴う細胞を保持しつつ、Ｓｅｕｒａｔ^２５のｖ３．１内でさらなる分析が行われた（イントロン＋エクソンの定量化）。データは正規化され（「ＬｏｇＮｏｒｍａｌｉｚｅ」）、１０，０００にスケーリングされ、細胞ごとのカウントの総数が回帰された。上位２，０００のさまざまな遺伝子は、「ｖｓｔ」法を使用して見出され、ＰＣＡ次元削減に使用された。最初の２０主成分は、ＳＮＮ近傍構築ならびにＵＭＡＰ次元削減の両方に使用された。最後に、ルーバンクラスタリングを適用して（分解能＝０．７）、細胞のグルーピングを見つけた。主要な細胞タイプは、一般的なマーカー遺伝子によって容易に識別できた：ＣＤ４＋Ｔ細胞（ＣＤ４、ＩＬ７Ｒ、ＣＤ３Ｄ、ＣＤ３Ｅ、ＣＤ３Ｇ）、ＣＤ８＋Ｔ細胞（ＣＤ８Ａ、ＣＤ８Ｂ）、ＣＤ１４＋単球（ＣＤ４、ＣＤ１４、Ｓ１００Ａ１２）、ＦＣＧＲ３Ａ＋単球（ＦＣＧＲ３Ａ）、Ｂ細胞（ＭＳ４Ａ１、ＣＤ１９、ＣＤ７９Ａ）、ＮＫ細胞（ＮＫＧ７、ＬＹＺ、ＮＣＡＭ１）およびＨＥＫ細胞（検出された多数の遺伝子）。ナイーブＴ細胞は、ＣＣＲ７、ＳＥＬＬ、ＣＤ２７、ＩＬ７Ｒと、ＦＡＳ、ＴＩＧＩＴ、ＣＤ６９の欠如とによって、活性化から分離された。γδＴ細胞は、ＴＲＧＣ１、ＴＲＧＣ２、ＴＲＤＣと、ＴＲＡＣ、ＴＲＢＣ１、ＴＲＢＣ２の欠如とによって、他のＴ細胞から分離された。

【0210】

Ｓｍａｒｔ－ｓｅｑ３からのＵＭＩリンクフラグメントのアイソフォーム再構築
５’ＵＭＩ含有リードと、同じフラグメントからのそれらのペアリードとのゲノム整列は、ＵＭＩおよびセルバーコードエラー訂正でｚＵＭＩ（バージョン２．４．１以降）によって生成された。エキソニック領域にマッピングされた同じ分子からの固有でマルチマッピングされたリードが、アイソフォーム再構築に使用された。各アイソフォームからのエクソンのゲノム位置は、マウス線維芽細胞データの場合はＥｎｓｅｍｂｌＧＲＣｍ３８．９１から、ヒトＨＣＡデータの場合はＥｎｓｅｍｂｌＧＲＣｈ３８．９５からのリファレンス遺伝子注釈に基づいていた。同じ分子へのリードマッピングは、注釈付きの転写産物構造と比較され、リードペアとジャンクション（「１」）およびエクソンの除外をサポートするジャンクション（「０」）とで、どのエクソンが見つかったかを示すブール文字列として表された。リードでカバーされていないエクソンの場合、「Ｎ」は欠如していることを示すために使用された。再構築分子からのブール文字列は、同じ遺伝子の各参照アイソフォームに対応する文字列と照合され、各分子の互換性があるアイソフォーム（複数可）が返された。分子アイソフォームの割り当ては、異なるアイソフォームからの重複するエクソンの代替の５’および３’スプライス部位に整列するリードに基づいてさらに修正された。

【0211】

非ＵＭＩリードを統合することによるアイソフォーム割り当て
ｚＵＭＩを使用して生成されたトランスクリプトームｂａｍファイルは細胞ごとに逆多重化され、アイソフォームの存在量はＳａｌｍｏｎ^１５（ｖ０．１４．０）ｑｕａｎｔコマンドを使用し、次の設定「－－ｆｌｄＭｅａｎ７００－－ｆｌｄＳＤ１００－－ｆｌｄＭａｘ２０００－－ｍｉｎＡｓｓｉｇｎｅｄＦｒａｇｓ１－－ｄｕｍｐＥｑＷｅｉｇｈｔｓ」を使用して定量化された。すべてのリードが、同じ同等クラスに属する多くの可能なアイソフォームのうちの１つに割り当てられた場合のＳａｌｍｏｎ出力を修正した。各セルについて、ｓａｌｍｏｎからのＴＰＭ＞０のアイソフォームが、発現していると見なされ、再構築分子の互換性があるアイソフォームをフィルタリングするために使用された。複数のアイソフォームが再構築分子と互換性がある場合（Ｓａｌｍｏｎフィルタリング後）、互換性がある各アイソフォームは部分的な分子カウントを取得した（１／Ｎ互換性アイソフォーム）。

【0212】

マウス線維芽細胞における系統特異的アイソフォーム発現
マウス系統特異的アイソフォーム発現を調べるために、割り当てられた対立遺伝子と、割り当てられた固有アイソフォームのみとの両方を伴うすべての分子を使用した。２つ以上のアイソフォームと両方の対立遺伝子からの発現とを検出した遺伝子のみを検討した。各遺伝子について、各対立遺伝子およびアイソフォームに割り当てられた分子のカウントに基づいて分割表を作成した。有意性はカイ二乗検定を使用してテストされ、結果のｐ値はＢｅｎｊａｍｉｎｉ－Ｈｏｃｈｂｅｒｇ手順を使用して複数の検定について補正された。さらに、有意な系統－アイソフォーム相互作用を精査した（調整されたｐ値＜０．０５で）。有意な遺伝子ごとに、すべての分子の対立遺伝子およびアイソフォームラベルの千回の独立ランダム化を実行し、各順列でカイ二乗検定を計算し、さらに、得られた実際のｐ値が、ランダム化からの５％最低ｐ値未満であることを必要とした。

【0213】

Ｃ．結果
Ｓｍａｒｔ－ｓｅｑ２^６と比較して、感度、つまり細胞あたりに検出されたＲＮＡ分子の数を改善できる逆転写酵素と反応条件とを体系的に評価した。我々の取り組みは、完全長転写産物カバレッジを保持するＳｍａｒｔ－ｓｅｑ２のようなアッセイの改善に焦点を当てており、したがって、オリゴｄＴプライミング、逆転写とそれに続くテンプレートスイッチング、ＰＣＲを使用した完全なｃＤＮＡ増幅、ならびに、最後にＴｎ５ベースのタグ付けおよびライブラリ構築からなる（図９ａ）。ＨＥＫ２９３Ｔ細胞で数百の異なる反応条件を評価した後、最も注目すべき条件をシーケンシングし（図１０および表４）、最近の研究^８に沿って、ＭａｘｉｍａＨ－Ｍｉｎｕｓ逆転写酵素（以下、Ｍａｘｉｍａと呼ぶ）を使用して最高の感度が得られた。逆転写中にＫＣｌからＮａＣｌまたはＣｓＣｌに塩を切り替えると、標準のＫＣｌ条件と比較してＭａｘｉｍａベースのシングルセル反応の感度が向上したことに留意されたく（図１１）、これはおそらくＲＮＡの二次構造が減少したためである^９。さらに、５％ＰＥＧで逆転写を実行すると、最近、実証されたように^８、収量が向上し、テンプレートスイッチング反応を安定化または促進するためにＧＴＰ^１０またはｄＣＴＰを追加した（図１１）。多くのＤＮＡポリメラーゼ酵素をテストしたが、ＫＡＰＡＨｉＦｉＨｏｔ－Ｓｔａｒｔポリメラーゼは反応化学との互換性が最も高いままであり、最高の感度が得られた。重要なことに、部分的なＴｎ５モチーフ^１１と新規の１１ｂｐタグ配列、続いて８ｂｐＵＭＩ配列と３つのリボグアノシンからなるプライマー部位を含むテンプレートスイッチングオリゴ（ＴＳＯ）を構築し、後者は、一本鎖ｃＤＮＡの末端にオーバーハングする非テンプレート化ヌクレオチドにハイブリダイズする。シーケンシング後、１１ｂｐタグを使用して、５’ＵＭＩ含有リードと内部リードとを明確に区別できる（図９ａ）。したがって、同じシーケンシング反応で、ＵＭＩを含まないフル転写産物にまたがるストランド固有５’ＵＭＩ含有リードと非ストランド化内部リードとを取得する（図９ｂ）。内部リードに対する５’の比率は、Ｔｎ５ベースのタグ付け反応を変更することで調整できた（図９ｃ）。最終プロトコルをＳｍａｒｔ－ｓｅｑ３と名付け、それは、ＨＥＫ２９３ＦＴ細胞におけるｐｏｌｙＡ＋タンパク質コーディング（図９ｄ）およびノンコーディングＲＮＡ（図１２）の検出を大幅に改善した。Ｓｍａｒｔ－ｓｅｑ２と比較して、遺伝子発現プロファイルの細胞間相関はＳｍａｒｔ－ｓｅｑ３で大幅に改善され（図９ｅ）、最大１５０，０００の固有分子が検出されたＨＥＫ２９３Ｔ細胞トランスクリプトームにおける顕著な複雑さが明らかにされた（図９ｆ）。驚くべきことに、Ｓｍａｒｔ－ｓｅｑ３を単一分子ＲＮＡ－ＦＩＳＨと比較すると、Ｓｍａｒｔ－ｓｅｑ３は細胞あたりｓｍＲＮＡ－ＦＩＳＨによって検出された分子の最大８０％を検出し^１２、テストした４つの遺伝子にわたって平均６９％のｓｍＲＮＡ－ＦＩＳＨ分子を検出したことが明らかになった（図９ｇ、ｈ）。全体として、これは、Ｓｍａｒｔ－ｓｅｑ３がＳｍａｒｔ－ｓｅｑ２と比較して感度を大幅に向上させ、ｓｍＲＮＡ－ＦＩＳＨの感度にさえ近づいていることを示す。

【0214】

次に、ＲＮＡ分子のインシリコ再構築のための戦略を開発した。重要なことに、Ｓｍａｒｔ－ｓｅｑ３での完全長ｃＤＮＡのＰＣＲ事前増幅の後にＴｎ５タグ付けが行われるため、同じＵＭＩを持つ同じｃＤＮＡ分子のコピーは、特定の転写産物の異なる部分にマッピングされる可変３’末端を取得する（図１３ａ）。したがって、これらのライブラリのペアエンドシーケンシングにより、最初のｃＤＮＡ分子の異なる部分にまたがる３’末端配列が得られ、それを５’ＵＭＩ配列に基づいて特定の分子に計算でリンクできるため、ＲＮＡ分子の並列再構築が可能になる（図１３ａ）。ＲＮＡ分子の再構築を実験的に調査するために、３６９個の個々の初代マウス線維芽細胞（ＣＡＳＴ／ＥｉＪおよびＣ５７／Ｂｌ６Ｊ系統のＦ１子孫）からＳｍａｒｔ－ｓｅｑ３ライブラリを作成し、ペアエンドシーケンシングを行った。整列およびＵＭＩエラー訂正されたリードペア^１３が調査され、それらのＵＭＩおよび整列開始座標によって分子にリンクされた。単一の線維芽細胞のＣｏｘ７ａ２ｌ遺伝子座から転写された特定の分子に由来するリードペアの例を図１４に示す。そして、ＲＮＡ分子の再構築部分が系統特異的な一塩基多型（ＳＮＰ）をカバーする頻度を調べた。驚くべきことに、ＵＭＩにリンクされたリードでＳＮＰを直接シーケンシングすることによる対立遺伝子起源の明確な識別が、検出されたすべての分子の６１％で観察され（図１３ｂ）、転写産物内のＳＮＰ密度の増加とともに割り当てパーセンテージが増加した（図１３ｃ）。以前の単一細胞研究では、ＲＮＡ定量化の産物（分子またはＲＰＫＭにおける）、および、各対立遺伝子をサポートするフラクションＳＮＰ含有リードとして対立遺伝子発現を推定し^{７，１２，１４}、次に我々は、直接対立遺伝子ＲＮＡカウントと比較されたこれらの推定値が、Ｓｍａｒｔ－ｓｅｑ３でいかに可能になったかを調査した。心強いことに、対立遺伝子発現の推定値と直接対立遺伝子ＲＮＡカウントとは、細胞全体で集約したときに全体的に良好な相関関係を示した（図１３ｄ）。さらに、線形モデルを使用して細胞内の遺伝子にわたる２つの測定値の一致を定量化すると、いかなる明らかなバイアスもなく（切片＝０．０６±０．０３）、強い相関（スピアマンｒｈｏ＝０．８２±０．０８および勾配＝０．８８±０．０６）が明らかになった（図１３ｅ）。したがって、直接対立遺伝子ＲＮＡカウントは、単一細胞で実行可能であり、分離された発現から対立遺伝子発現を推定するための以前の取り組みと単一細胞での対立遺伝子推定とを検証する^{７，１２，１４}。

【0215】

対立遺伝子分解ｓｃＲＮＡ－ｓｅｑを使用して、転写に特徴的な遺伝子発現のバースト動態を推測できることを以前に示した^１２。驚くべきことに、Ｓｍａｒｔ－ｓｅｑ３ベースの分析により、５’ＵＭＩを伴ってＳｍａｒｔ－ｓｅｑ２を単独で使用するよりも数千も多くの遺伝子の動態推論が可能になり（Ｓｍａｒｔ－ｓｅｑ３を使用して１１，７６６、Ｓｍａｒｔ－ｓｅｑ２－ＵＭＩを使用して８，４６４）、ＣＡＳＴとＣ５７対立遺伝子との間の相関が大幅に改善された（それぞれバースト頻度およびサイズについて、Ｓｍａｒｔ－ｓｅｑ３では０．９４と０．７５、Ｓｍａｒｔ－ｓｅｑ２－ＵＭＩでは０．７９と０．６８）（図１３ｆおよび図１５）。Ｓｍａｒｔ－ｓｅｑ３は、単一細胞にわたる転写バースト動態のより感度が高い再構築を可能にすることが結論付けられる。

【0216】

再構築したＲＮＡの長さについて、転写産物のアイソフォーム構造に関する情報がどの程度、それらに含まれているかを調査した。３６９個の細胞を使った実験では、合計２２，１９６個の分子が１．５ｋｂ以上の長さに再構築され、約２００，０００個の分子が１ｋｂ以上の長さに再構築されたことが観察された（図１３ｇ）。細胞あたり、８，７１０個の分子が５００ｂｐ以上の長さに再構築された。重要なことに、再構築分子は特定の転写産物アイソフォームに割り当てられることがよくあり、ここでは、Ｃｏｘ７ａ２ｌ遺伝子からの２つの再構築分子の刺身プロット（図１３ｈ）で例示されており、これは、エクソンおよびスプライスジャンクションに重なる再構築配列が分子をどのように転写産物アイソフォームに割り当てるかを示す。興味深いことに、すべての再構築分子の５３％は、マルチアイソフォーム遺伝子から検出されたすべての分子の４１％を含め、単一の注釈付きＥｎｓｅｍｂｌアイソフォームに割り当てることができ（図１３ｉ）、したがってアイソフォーム分解能でＲＮＡをカウントできる。

【0217】

従来の単一細胞または集団レベルのＲＮＡシーケンシングでは、系統特異的ＳＮＰの定量化と、同じＲＮＡでのスプライシング結果とを同時に行うことはできなかったため、系統特異的転写産物アイソフォームの調節を研究することはこれまで困難であった。インシリコで再構築分子を対立遺伝子起源と転写産物アイソフォーム構造との両方に割り当てたところ、２，１７２個の遺伝子の転写産物アイソフォームの統計的に有意な系統特異的（ＣＡＳＴまたはＣ５７）発現が明らかになった（調整済みｐ値＜０．０５、Ｂｅｎｊａｍｉｎｉ－Ｈｏｃｈｂｅｒｇ補正を使用したカイ二乗検定；およびｐ値＜０．０５、遺伝子特異的順列検定）（図１３ｊ）。例えば、Ｈｃｆｃ１ｒ１についての転写産物は、コーディング配列（１２ｂｐの代替３’スプライス部位使用からの３アミノ酸欠失）と５’非翻訳領域スプライシングとの両方が異なる２つのアイソフォーム（ＥＮＳＭＵＳＴ００００００２４６９７およびＥＮＳＭＵＳＴ０００００１７９９２８）に処理された。驚くべきことに、２つのアイソフォームは、系統間で有意な相互排他的発現パターンを示した（調整済みｐ値＜１０^－２０８、Ｂｅｎｊａｍｉｎｉ－Ｈｏｃｈｂｅｒｇ補正を使用したカイ二乗検定）（図１３ｋ）。したがって、Ｓｍａｒｔ－ｓｅｑ３は、遺伝子型とスプライシング結果とを同時に定量化でき、ここでは、マウスの系統固有スプライシングパターンによって例示されている。

【0218】

次に、多くの異なるタイプの細胞からなる、より複雑なサンプルでＳｍａｒｔ－ｓｅｑ３のベンチマークを行った。この目的のために、ＨＣＡベンチマークサンプル^４から５，３７６個の個々の細胞をシーケンシングし、凍結保存された複雑な細胞サンプルは、ヒト末梢血単核細胞（ＰＢＭＣ）、初代マウス結腸細胞、およびヒトＨＥＫ２９３Ｔ、マウスＮＩＨ３Ｔ３およびイヌＭＤＣＫ細胞の細胞系統スパイクインで構成される。Ｓｍａｒｔ－ｓｅｑ３細胞は、種（図１６）および細胞タイプ（図１７ａ）に従って明確に分離され、細胞の７７％が品質フィルタリングに合格し、これは、利用可能なプロトコル^４について表された２９％から６３％よりも大幅に高いパーセンテージであり、Ｓｍａｒｔ－ｓｅｑ３の堅牢性を示す（図１８）。

【0219】

ＦＡＣＳセルソーティングおよびＳｍａｒｔ－ｓｅｑ３プロファイリングよりも前の１年間の冷凍庫保管に対してより脆弱であり得るＣＤ１４＋単球を除いて、遺伝子検出感度は、すでに浅いシーケンシング深度にあるＳｍａｒｔ－ｓｅｑ２と比較して、すべての細胞タイプで有意に高かった（図１７ｂ）。検出された遺伝子数のこの改善は、Ｔ細胞およびＢ細胞など、ｍＲＮＡ含有量が少ない従来は困難であった細胞タイプにまで拡大し、典型的には、細胞あたり１０００ほどより多くの遺伝子が観察された。興味深いことに、既存の方法から単一細胞データで分離されなかったＢ細胞の２つの異なるクラスター（図１７ａ）を検出した^４。Ｂ細胞集団間の示差的発現は、ナイーブおよび記憶Ｂ細胞のいくつかの既知のマーカー遺伝子を含む、有意な発現差を伴う２７９個の遺伝子を表した（図１７ｃ）。これは、既存の方法と比較して、生物学的に意味がある細胞のクラスターを分離するＳｍａｒｔ－ｓｅｑ３の能力が向上していることを示す。

【0220】

ヒト細胞タイプにわたるＲＮＡ分子再構築性能を調査すると、検出されたすべての分子の３６～４１％が、細胞タイプにわたって特定アイソフォームに割り当てられることができたことが明らかになった（図１７ｄ）。アイソフォームの割り当てをより詳細に調査するために、各再構築ＲＮＡ分子の互換性アイソフォームの数を視覚化し、注釈付きアイソフォームの数で遺伝子をビン分割した。多くの追加の分子を、転写産物アイソフォームの小さなセットに割り当てることができた（図１７ｅ）。さらに、Ｓｍａｒｔ－ｓｅｑ３の内部リードにより、アイソフォームの発現に関するより多くの情報が提供される可能性があると推論した。この目的のために、Ｓｍａｒｔ－ｓｅｑ３からのすべてのリードでＳａｌｍｏｎ^１５を使用してアイソフォーム発現を計算し、Ｓａｌｍｏｎで検出可能な発現（ＴＰＭ＞０）を持つそれらのアイソフォームのみへの分子の直接ＲＮＡ再構築ベース割り当てをフィルタリングした。この戦略により、分子の固有アイソフォームへの割り当てがさらに増加し（すべての分子の４２％）（図１７ｆ）、残りの研究についてはＳａｌｍｏｎフィルタリングされたアイソフォーム発現レベルを使用した。

【0221】

次に、細胞タイプにわたるアイソフォーム発現のパターンを調査した。驚くべきことに、２，１８６個の遺伝子が細胞タイプにわたってアイソフォーム発現の統計的に有意なパターンを有していた（調整済みｐ値＜０．０５；Ｋｒｕｓｋａｌ－Ｗａｌｌｉｓ検定およびＢｅｎｊａｍｉｎｉ－Ｈｏｃｈｂｅｒｇ補正）。重要な遺伝子の１つはＰＴＰＲＣ（ＣＤ４５としても知られる）であり、これは、完全長アイソフォーム（ＲＡＢＣと呼ばれる）および３つの連続エクソンを除外したもの（ＲＯと呼ばれる）を含むいくつかの異なるアイソフォーム^１６に転写後処理することができる。レベルは大きく異なるが、ヒト免疫細胞タイプにわたってこれら２つのアイソフォームを主に観察した（図１７ｇ）。ガンマデルタＴ細胞でこれら２つのアイソフォームをサポートするリードを集約すると（図１７ｈ）、再構築分子が３つの連続エクソンの包含またはスキップをどのように分離したかがさらにわかる。他の特定のアイソフォームパターンは、特定の細胞タイプで共有されていた。例えば、ＣＤ１４＋およびＦＣＧＲ３Ａ＋の両方の単球は、ＴＩＭＰ１遺伝子の特定のアイソフォームを発現した（図１７ｉ、ｊ）。両方の単球集団は、ＴＩＭＰ１遺伝子のより短いアイソフォームを特異的に発現したが、長い完全長アイソフォームは他の細胞タイプにわたって優勢であり（図１７ｉ）、再構築分子によって再びサポートされた（図１７ｊ）。全体として、これらの結果は、Ｓｍａｒｔ－ｓｅｑ３を使用してアイソフォームの発現と細胞タイプにわたる調節とを照会する新しい独自の機能を浮き彫りにしている。

【0222】

Ｄ．考察
哺乳類の遺伝子は典型的には、各遺伝子から複数の転写産物アイソフォームを生成し^１７、ＲＮＡおよびタンパク質の機能に頻繁に影響を及ぼす。ショートリードシーケンシング技術を使用した転写産物アイソフォーム発現（単一細胞でまたは細胞集団で）の分析では、多くの場合、個々のスプライシングイベント（例えば、スキップされたエクソン）に焦点を当て、または、共有および固有のアイソフォーム領域のリードカバレッジを使用して、最も可能性が高いアイソフォーム発現を推測した^{１８，１９}。これは、遠位スプライシング結果間の相互作用を評価するために十分な情報をほとんど持っていない、または、転写された遺伝的変異からの対立遺伝子発現と組み合わされた、ペアのショートリードによるものである。ロングリードシーケンシング技術を使用して、単一細胞の転写産物アイソフォームを直接、シーケンシングできる^２，３。ただし、これらの戦略では、細胞スループットおよび深度が制限されている。例えば、マンダロリオンアプローチは７つの細胞の包括的なアイソフォームデータを提供したが^２、ｓｃＩＳＯｒ－ｓｅｑは細胞あたり２６０分子の平均深度で数千の細胞におけるアイソフォーム発現を調査した^３。対照的に、細胞あたり平均８，７１０個の再構築分子（５００ｂｐ以上）が得られた。さらに、ｓｃＩＳＯｒ－ｓｅｑでは、事前増幅ｃＤＮＡがショートリードシーケンサーおよびロングリードシーケンサーの両方で並行してシーケンシングされ、細胞タイプおよびサブタイプが特徴付けられ、アイソフォームレベルのシーケンシングデータはクラスターに従って細胞全体で主に集約された^３。個々の細胞からの同じ事前増幅ｃＤＮＡに対して２つの並列ライブラリ構築方法およびシーケンシング技術を使用すると、コストおよび労力が大幅に増加する。

【0223】

Ｓｍａｒｔ－ｓｅｑ３を、高感度にし、したがって、細胞のタイプおよび状態を識別する機能を向上させ、かつ、アイソフォーム特有にし、細胞にわたって数百万の部分転写産物を同時に再構築できるように開発した。したがって、Ｓｍａｒｔ－ｓｅｑ３は、複数のライブラリ調製技術およびシーケンシングプラットフォームの並行使用に関連する追加のコストおよび労力を排除する。既知の転写産物アイソフォーム注釈と比較して、これらの部分的な転写産物再構築は、検出された分子の４０～５０％を特定のアイソフォームに割り当てるために十分であり、系統および細胞タイプの特定のアイソフォーム調節がさらに明らかになった。興奮することに、この再構築は、スプライシングの結果と転写ＳＮＰとの両方を今や直接、定量化できるため、スプライシングの量的形質遺伝子座マッピングを実行する能力を向上させるはずである。完全なＳｍａｒｔ－ｓｅｑ３プロトコルは、ｐｒｏｔｏｃｏｌｓ．ｉｏ（ｄｘ．ｄｏｉ．ｏｒｇ／１０．１７５０４／ｐｒｏｔｏｃｏｌｓ．ｉｏ．７ｄｎｈｉ５ｅ）に寄託されており、特別な機器を必要とせずに分子生物学研究所で簡単に実装できる。

【0224】

いくつかの大規模プロジェクトは、ヒト組織にわたる細胞アトラスとモデル生物の細胞アトラスとを体系的に構築することを目的としている^２０。これらの取り組みは、細胞タイプおよび組織にわたるアイソフォーム発現パターンに関する情報をほとんど提供しない、注釈付きの遺伝子末端（例えば、１０×ゲノミクス）に向かってＲＮＡをカウントするｓｃＲＮＡ－ｓｅｑ方法にますます依存している。さらに、疾患のメカニズムおよび結果を特定するために、疾患の体系的な分析（例えば、ＬｉｆｅＴｉｍｅプロジェクト）にシングルセルゲノミクスを使用する大規模な取り組みも浮上している。転写後の遺伝子調節は疾患と密接に関連しているため^２１、そのような努力やアトラスの機会を逃してしまって、アイソフォームレベルの発現パターンを軽視することになる。ロングリードシーケンシングの取り組みとは対照的に、Ｓｍａｒｔ－ｓｅｑ３は、同じアッセイ内で、細胞タイプにわたる費用効果が高い遺伝子発現プロファイリングとアイソフォーム分解ＲＮＡカウントとを同時に提供する。これは現在、約０．５～１ＥＵＲのシーケンス対応セルライブラリあたりのコストで達成されている。さらに、現在の実装では３８４ウェルプレートを使用しているため、インデプスシーケンシングおよび転写産物アイソフォーム再構築について、最初にすべての細胞を浅くシーケンシングし、後でまれな細胞集団の細胞を選択することもできる（細胞増幅されたｃＤＮＡは個々のウェルに長期間、保持できるため）。全体として、細胞タイプを特徴づけ、遺伝子、アイソフォームおよび対立遺伝子発現のレベルで細胞アトラスに注釈を付けるために適用可能なｓｃＲＮＡ－ｓｅｑ方法を導入した。

【0225】

Ｅ．実施例２の参照
１．Ｓａｎｄｂｅｒｇ，Ｒ．生物学および医学における単一細胞転写学の時代への突入．Ｎａｔ．Ｍｅｔｈｏｄｓ１１，２２－２４（２０１４）。
２．Ｂｙｒｎｅ，Ａ．ナノポアのロングリードＲＮＡｓｅｑは、個々のＢ細胞の表面受容体間の広範な転写変異を明らかにする．Ｎａｔ．Ｃｏｍｍｕｎ．（２０１７）。
３．Ｇｕｐｔａ，Ｉ．ｅｔａｌ．シングルセルアイソフォームＲＮＡシーケンシングは、数千の小脳細胞のアイソフォームを特徴づける．ＮａｔＢｉｏｔｅｃｈｎｏｌ．（２０１８）ｄｏｉ：１０．１０３８／ｎｂｔ．４２５９。
４．Ｍｅｒｅｕ，Ｅ．ｅｔａｌ．細胞アトラスプロジェクトのシングルセルＲＮＡシーケンシングプロトコルのベンチマーク付け．ｂｉｏＲｘｉｖ６３００８７（２０１９）ｄｏｉ：１０．１１０１／６３００８７。
５．Ｚｉｅｇｅｎｈａｉｎ，Ｃ．ｅｔａｌ．シングルセルＲＮＡシーケンシング方法の比較分析．Ｍｏｌ．Ｃｅｌｌ６５，６３１－６４３．ｅ４（２０１７）。
６．Ｐｉｃｅｌｌｉ，Ｓ．ｅｔａｌ．単一細胞における高感度の完全長トランスクリプトームプロファイリングのためのＳｍａｒｔ－ｓｅｑ２．Ｎａｔ．Ｍｅｔｈｏｄｓ１０，１０９６－１０９８（２０１３）。
７．Ｄｅｎｇ，Ｑ．、Ｒａｍｓｋoｌｄ，Ｄ．、Ｒｅｉｎｉｕｓ，Ｂ．＆Ｓａｎｄｂｅｒｇ，Ｒ．シングルセルＲＮＡ－ｓｅｑは、哺乳類細胞における動的でランダムなモノアレリック遺伝子発現を明らかにする．Ｓｃｉｅｎｃｅ３４３，１９３－１９６（２０１４）。
８．Ｂａｇｎｏｌｉ，Ｊ．Ｗ．ｅｔａｌ．ｍｃＳＣＲＢ－ｓｅｑを使用した高感度で強力なシングルセルＲＮＡシーケンシング．Ｎａｔ．Ｃｏｍｍｕｎ．９，２９３７（２０１８）。
９．Ｇｕｏ，Ｊ．Ｕ．＆Ｂａｒｔｅｌ，Ｄ．Ｐ．ＲＮＡＧ－四重鎖は真核細胞でグローバルに展開され、細菌が枯渇する．Ｓｃｉｅｎｃｅ３５３，（２０１６）。
１０．Ｏｈｔｓｕｂｏ，Ｙ．，Ｎａｇａｔａ，Ｙ．＆Ｔｓｕｄａ，Ｍ．モロニーマウス白血病ウイルス逆転写酵素のテーリング活性を増強する化合物．Ｓｃｉ．Ｒｅｐ．７，６５２０（２０１７）。
１１．Ｃｏｌｅ，Ｃ．、Ｂｙｒｎｅ，Ａ．、Ｂｅａｕｄｉｎ，Ａ．Ｅ．、Ｆｏｒｓｂｅｒｇ，Ｅ．Ｃ．＆Ｖｏｌｌｍｅｒｓ，Ｃ．Ｔｎ５プライム、シングルセルＲＮＡ－ｓｅｑ用のＴｎ５ベースの５’キャプチャ方法．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．４６，ｅ６２（２０１８）。
１２．Ｌａｒｓｓｏｎ，Ａ．Ｊ．Ｍ．ｅｔａｌ．転写バースト動態のゲノムエンコーディング．Ｎａｔｕｒｅ５６５，２５１－２５４（２０１９）。
１３．Ｐａｒｅｋｈ，Ｓ．、Ｚｉｅｇｅｎｈａｉｎ，Ｃ．、Ｖｉｅｔｈ，Ｂ．、Ｅｎａｒｄ，Ｗ．＆Ｈｅｌｌｍａｎｎ，Ｉ．ｚＵＭＩ－ＵＭＩを使用してＲＮＡシーケンシングデータを処理するための高速で柔軟なパイプライン．ＧｉｇａＳｃｉｅｎｃｅ７，（２０１８）。
１４．Ｒｅｉｎｉｕｓ，Ｂ．ｅｔａｌ．シングルセルＲＮＡ－ｓｅｑによるクローン体細胞における対立遺伝子発現パターンの分析．ＮａｔＧｅｎｅｔ．４８、１４３０－１４３５（２０１６）。
１５．Ｐａｔｒｏ，Ｒ．、Ｄｕｇｇａｌ，Ｇ．、Ｌｏｖｅ，Ｍ．Ｉ．、Ｉｒｉｚａｒｒｙ，Ｒ．Ａ．＆Ｋｉｎｇｓｆｏｒｄ，Ｃ．Ｓａｌｍｏｎは、転写産物発現の高速でバイアスを意識した定量化を提供する．Ｎａｔ．Ｍｅｔｈｏｄｓ１４，４１７－４１９（２０１７）。
１６．Ｍａｒｔｉｎｅｚ，Ｎ．Ｍ．＆Ｌｙｎｃｈ，Ｋ．Ｗ．免疫応答における選択的スプライシングの制御：多くの調節因子、多くの予測、まだ学ぶべきことがたくさんある．Ｉｍｍｕｎｏｌ．Ｒｅｖ．２５３，２１６－２３６（２０１３）。
１７．Ｗａｎｇ，Ｅ．Ｔ．ｅｔａｌ．ヒト組織トランスクリプトームにおける代替アイソフォーム調節．Ｎａｔｕｒｅ４５６、４７０－４７６（２００８）。
１８．Ｋａｔｚ，Ｙ．、Ｗａｎｇ，Ｅ．Ｔ．、Ａｉｒｏｌｄｉ，Ｅ．Ｍ．＆Ｂｕｒｇｅ，Ｃ．Ｂ．アイソフォーム調節を識別するためのＲＮＡシーケンシング実験の分析と設計．Ｎａｔ．Ｍｅｔｈｏｄｓ７，１００９－１０１５（２０１０）。
１９．Ｔｒａｐｎｅｌｌ，Ｃ．ｅｔａｌ．ＲＮＡ－ｓｅｑを用いた転写産物分解能での遺伝子調節の示差的分析．Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３１，４６－５３（２０１３）。
２０．Ｒｅｇｅｖ，Ａ．ｅｔａｌ．ヒト細胞アトラス．ｅＬｉｆｅ６，（２０１７）。
２１．Ｓｃｏｔｔｉ，Ｍ．Ｍ．＆Ｓｗａｎｓｏｎ，Ｍ．Ｓ．疾患におけるＲＮＡのスプライシング誤り．Ｎａｔ．Ｒｅｖ．Ｇｅｎｅｔ．１７，１９－３２（２０１６）。
２２．Ｐｉｃｅｌｌｉ，Ｓ．ｅｔａｌ．Ｓｍａｒｔ－ｓｅｑ２を使用した単一細胞からの完全長ＲＮＡ－ｓｅｑ．Ｎａｔ．Ｐｒｏｔｏｃ．９、１７１－１８１（２０１４）。
２３．Ｋｅａｎｅ，Ｔ．Ｍ．ｅｔａｌ．マウスのゲノム変異と表現型および遺伝子調節へのその影響．Ｎａｔｕｒｅ４７７，２８９－２９４（２０１１）。
２４．Ｌａｗｒｅｎｃｅ，Ｍ．ｅｔａｌ．ゲノム範囲を計算して注釈を付けるためのソフトウェア．ＰＬｏＳＣｏｍｐｕｔ．Ｂｉｏｌ．９，ｅ１００３１１８（２０１３）。
２５．Ｓｔｕａｒｔ，Ｔ．ｅｔａｌ．単一細胞データの包括的統合．Ｃｅｌｌ１７７，１８８８－１９０２．ｅ２１（２０１９）。

【0226】

実施例３：メタゲノムサンプルの分析を改善するための方法の使用
メタゲノムサンプルは、例えば細菌などのさまざまな微生物種の幅広いコレクションからの核酸を含むことができる。サンプル中に存在する種を識別するための当技術分野における一般的な方法は、ｒＲＮＡ遺伝子のセグメントのアンプリコンベースのＮＧＳライブラリシーケンシングを行うことである。例えば、ｈｔｔｐｓ：／／ｇｅｎｏｈｕｂ．ｃｏｍ／ｓｈｏｔｇｕｎ－ｍｅｔａｇｅｎｏｍｉｃｓ－ｓｅｑｕｅｎｃｉｎｇ／を参照。この方法は、ｒＲＮＡ遺伝子が概して種間で非常に保存されているという事実に依存しているため、アンプリコンシーケンシングについてのプライマーは、保存された（「一定の」）領域にハイブリダイズし、起源の種を識別するために機能するそれらの間の可変セグメントを増幅することにより、多くの異なる種を認識するように設計できる。現在の技術における問題は、リード長のシーケンシングは概して、一度に１つの可変領域の分析しか行えず、したがって、密接に関連する種を区別する能力が制限され得ることである。複数の可変領域を含むように、ｒＲＮＡ遺伝子のより長いストレッチをシーケンシングできる方法を持つことは、コミュニティに利益をもたらす。この実施例では、本発明の方法はメタゲノムサンプルに適用され、ここで、定常領域の１つにハイブリダイズする遺伝子特異的プライマーを使用してｒＲＮＡがｃＤＮＡに変換され、それにより、ｃＤＮＡが生成され、ｒＲＮＡの可変領域のいくつか、好ましくはすべてを包含し、ＴＳＯのコピーを含む。そして、このｃＤＮＡを本発明の方法に従って増幅し、フラグメント化し、内部および５’末端フラグメントを増幅して、本明細書に記載のライブラリを作成する。そして、ライブラリがシーケンシングされる。本発明の方法に記載されるように、ペアの末端リードおよび５’末端リードと内部リードとを区別する能力を使用することにより、同じ元のｒＲＮＡ分子に属する複数の可変領域を識別することが可能であり、したがって、ＲＮＡが由来するメタゲノムサンプルに存在する種の識別の改善が可能となる。

【0227】

上記の実施形態は、本発明のいくつかの例示的な例として理解されるべきである。当業者には、本発明の範囲から逸脱することなく、実施形態に対してさまざまな修正、組み合わせ、および変更を行い得ることが理解される。特に、異なる実施形態における異なる部分解決策は、技術的に可能な場合、他の構成で組み合わせることができる。しかし、本発明の範囲は、添付の特許請求の範囲によって定義される。

【0228】

関連出願への相互参照
３５Ｕ．Ｓ．Ｃ．§１１９（ｅ）に準拠して、この出願は、２０１８年１２月２８日に提出されたスウェーデン仮特許出願シリアル番号１８５１６７２－４の出願日の優先権を主張し、その出願の開示が参照により本明細書に組み込まれる。

【図1A】