(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023017047
(43)【公開日】2023-02-02
(54)【発明の名称】RNAシークエンシング法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20230126BHJP
C12N 15/09 20060101ALN20230126BHJP
C12Q 1/6876 20180101ALN20230126BHJP
【FI】
C12Q1/6869 Z
C12N15/09
C12Q1/6876 Z
【審査請求】有
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022196991
(22)【出願日】2022-12-09
(62)【分割の表示】P 2022500891の分割
【原出願日】2020-07-10
(31)【優先権主張番号】62/872,558
(32)【優先日】2019-07-10
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】521480341
【氏名又は名称】ウルティマ ジェノミクス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】フロリアン オーバーストラス
(72)【発明者】
【氏名】ギラッド アルモジー
(57)【要約】
【課題】mRNA分子由来の目的の領域の配列を決定するための方法を提供すること。
【解決手段】シークエンシングされたポリヌクレオチドは、バーコード領域、ホモポリマー領域(例えば、ポリA領域)、およびmRNA分子に関連する標的領域を含むことができる。一部の方法によれば、バーコード領域はホモポリマー領域中に存在する同じ塩基を除外する。一部の方法によれば、シークエンシングのために使用されるプライマーの伸長は、ホモポリマー領域内で失速する。一部の方法によれば、シークエンシングフローサイクルおよびポリヌクレオチドの異なるバーコード領域は、プライマーがホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたるバーコード領域の末端まで伸長されるように構成される。一部の方法によれば、2つのプライマーまたは切断可能なプライマーはバーコード領域および標的領域を別個にシークエンシングするために使用される。
【選択図】なし
【特許請求の範囲】
【請求項1】
mRNA分子由来の目的の領域の配列を決定する方法であって、
mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、前記ポリヌクレオチドが、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、前記標的領域が、前記バーコード領域に固有に関連付けられる、ステップ;
複数の所定のサイクルで標識ヌクレオチドを使用して、前記バーコード領域の配列を決定するステップであって、前記プライマーが、前記ホモポリマー領域中に伸長される前に、前記複数のポリヌクレオチドにわたって前記バーコード領域の末端まで伸長されるように、前記所定のサイクルおよび前記ポリヌクレオチドの前記バーコード領域が構成されている、ステップ;
非標識ヌクレオチドを使用して、前記プライマーを前記ホモポリマー領域内で伸長するステップ;ならびに
標識ヌクレオチドを使用して、前記標的領域の配列を決定するステップ
を含む方法。
【請求項2】
前記バーコード領域の配列を決定するために使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、請求項1に記載の方法。
【請求項3】
前記プライマーを前記ホモポリマー領域内で伸長するために使用される前記非標識ヌクレオチドが、非終結非標識ヌクレオチドを含む、請求項1に記載の方法。
【請求項4】
前記バーコード領域の配列を決定するために使用される前記標識ヌクレオチドが、前記同じ塩基の非標識ヌクレオチドと混合される、請求項1に記載の方法。
【請求項5】
前記プライマーが前記ホモポリマー領域の末端まで伸長されるまで、非標識ヌクレオチドを使用して前記プライマーを前記ホモポリマー領域内で前記伸長するステップを1または複数回反復することをさらに含み、取り込まれていないヌクレオチドが、前記伸長するステップを反復する前に除去される、請求項1に記載の方法。
【請求項6】
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、請求項1に記載の方法。
【請求項7】
前記ポリヌクレオチドの前記ホモポリマー領域中の前記塩基が、アデニンまたはチミン塩基である、請求項1に記載の方法。
【請求項8】
前記ポリヌクレオチドの前記ホモポリマー領域が、少なくとも8つの連続する同一の塩基を含む、請求項1に記載の方法。
【請求項9】
前記ポリヌクレオチドが、cDNA分子である、請求項1に記載の方法。
【請求項10】
前記mRNA分子の前記目的の領域が、コード領域を含む、請求項1に記載の方法。
【請求項11】
前記標的領域の配列を決定するのに使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、請求項1に記載の方法。
【請求項12】
前記バーコード領域の配列を決定するのにまたは前記標的領域の配列を決定するのに使用される前記ヌクレオチドの50%またはそれ未満が、標識されている、請求項1に記載の方法。
【請求項13】
前記プライマーを前記ホモポリマー領域内で伸長するのに使用される前記ヌクレオチドの0.1%またはそれ未満が、標識されている、請求項1に記載の方法。
【請求項14】
前記プライマーを前記ホモポリマー領域内で伸長するのに使用される前記ヌクレオチドのすべてが、標識されていない、請求項1に記載の方法。
【請求項15】
前記バーコード領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、請求項1に記載の方法。
【請求項16】
前記ポリヌクレオチドの前記ホモポリマー領域が、少なくとも50の連続する同一の塩基を含む、請求項1に記載の方法。
【請求項17】
前記バーコード領域が、試料バーコードを含む、請求項1に記載の方法。
【請求項18】
前記バーコード領域の決定された配列を、同じ標的核酸分子由来のmRNAコード領域に関連する決定された配列に関連付けるステップをさらに含む、請求項10に記載の方法。
【請求項19】
前記mRNA分子の前記目的の領域が、前記mRNA分子の3’-非翻訳領域または5’-非翻訳領域を含む、請求項1に記載の方法。
【請求項20】
前記標的領域の配列を決定するために使用される前記標識ヌクレオチドが、同じ塩基の非標識ヌクレオチドと混合されている、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、2019年7月10日に出願された米国仮出願第62/872,558号に基づく優先権の利益を主張しており、前記仮出願は、すべての目的のために、参照により本明細書に援用される。
【0002】
発明の分野
mRNA分子内の目的の領域をシークエンシングするための方法が、本明細書に記載される。
【背景技術】
【0003】
背景
メッセンジャーRNA(mRNA)シークエンシングは、リアルタイム遺伝子発現、異なる組織中の遺伝子発現プロファイル、および遺伝子発現のレベルについての情報を提供することができる。特定の遺伝子の発現レベルにおける変動は、環境刺激に応答して、異なる発達段階の間に、または原因であるか結果であるかについての疾患との関係において、変動し得る。
【0004】
直接mRNAシークエンシングは困難であり、標的となるmRNA分子は、典型的には、逆転写酵素を使用して相補的DNA(cDNA)分子に逆転写される。次いで、cDNA分子をシークエンシングして、元のmRNA分子についてのシークエンシング情報を提供する。真核生物のmRNAは、一般に、mRNA分子の3’末端にポリ(A)テイルを含み、これは、cDNA分子の5’末端のポリ(T)領域に反映される。必要に応じて、cDNA分子に対する相補的DNA鎖が合成され、その結果、DNA分子の3’末端にポリ(A)テイルが得られる。
ある特定の非常に効率的なシークエンシング法は、核酸分子をシークエンシングするために非終結ヌクレオチドを用いる。これらのシークエンシング法は、「フローシークエンシング」、「自然な合成によるシークエンシング」または「非終結型の合成によるシークエンシング」法と呼ばれることがある(例えば、その全体が参照により本明細書に取り込まれる米国特許第8,772,473号を参照されたい)。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【課題を解決するための手段】
【0006】
発明の簡単な要旨
mRNA分子由来の目的の領域の配列を決定する方法が、本明細書に記載される。
【0007】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、バーコード領域は、ホモポリマー領域中に存在する同じ塩基を除外する、ステップ;(b)ホモポリマー領域中に存在する同じ塩基の相補的塩基を欠く標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップ;(c)ホモポリマー領域中に存在する塩基に相補的なヌクレオチドを使用して、プライマーをホモポリマー領域内で伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。一部の実施形態では、ステップ(b)で使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(c)で使用されるヌクレオチドは、非終結ヌクレオチドを含む。一部の実施形態では、ステップ(d)で使用されるヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(b)で使用される標識ヌクレオチドは、同じ塩基の非標識ヌクレオチドと混合される。一部の実施形態では、ホモポリマー領域中に存在する塩基に相補的なヌクレオチドは、非標識ヌクレオチドを含む。一部の実施形態では、標的領域の配列は、非標識ヌクレオチドおよび標識ヌクレオチドの混合物を使用して決定される。一部の実施形態では、標的領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、バーコード領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、各ポリヌクレオチドの標的領域は、固有のバーコード領域に関連付けられる。一部の実施形態では、ステップ(b)、ステップ(c)またはステップ(d)で使用される全ヌクレオチドの50%以下は、標識されている。一部の実施形態では、ステップ(c)で使用される全ヌクレオチドの0.1%以下は、標識されている。一部の実施形態では、方法は、プライマーがホモポリマー領域の末端まで伸長されるまで、ステップ(c)を1または複数回反復することをさらに含み、取り込まれていないヌクレオチドは、反復ステップの間で除去される。
【0008】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)標識ヌクレオチドおよび非標識ヌクレオチドを、標識ヌクレオチドの全ヌクレオチドに対する第1の割合で使用して、バーコード領域の配列を決定するステップ;(c)ホモポリマー領域中に存在する塩基に相補的な標識ヌクレオチドを、標識ヌクレオチドの全ヌクレオチドに対する第2の割合で使用して、プライマーを伸長するステップであって、第2の割合は、第1の割合よりも大きく、プライマー伸長は、ホモポリマー領域内で失速する、ステップ;(d)ホモポリマー領域中に存在する塩基に相補的な非標識ヌクレオチドを使用して、プライマーをホモポリマー領域の末端まで伸長するステップ;ならびに(e)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。一部の実施形態では、ステップ(b)で使用される標識ヌクレオチドおよび非標識ヌクレオチドは、非終結標識ヌクレオチドおよび非終結非標識ヌクレオチドを含む。一部の実施形態では、ステップ(c)で使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(d)で使用される非標識ヌクレオチドは、非終結非標識ヌクレオチドを含む。一部の実施形態では、ステップ(e)で使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、標的領域の配列は、標識ヌクレオチドおよび非標識ヌクレオチドを使用して決定される。一部の実施形態では、ステップ(b)または(e)で使用されるヌクレオチドの50%またはそれ未満は、標識されている。一部の実施形態では、ステップ(c)で使用されるヌクレオチドの50%より多くは、標識されている。一部の実施形態では、ステップ(d)で使用されるヌクレオチドの0.1%またはそれ未満は、標識されている。一部の実施形態では、ステップ(d)で使用されるヌクレオチドのすべては、標識されていない。一部の実施形態では、ステップ(d)は、プライマーがホモポリマー領域の末端まで伸長されるまで、1または複数回、反復して、取り込まれていないヌクレオチドを除去すること、および新鮮なヌクレオチドを添加することを含む。一部の実施形態では、各ポリヌクレオチドの標的領域は、固有のバーコード領域に関連付けられる。一部の実施形態では、標的領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、バーコード領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。
【0009】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、標的領域は、固有のバーコード領域に関連付けられる、ステップ;(b)複数の所定のサイクルで標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップであって、プライマーは、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように、所定のサイクルおよびポリヌクレオチドのバーコード領域が構成されている、ステップ;(c)非標識ヌクレオチドを使用して、プライマーをホモポリマー領域内で伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。一部の実施形態では、ステップ(b)で使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(c)で使用される非標識ヌクレオチドは、非終結非標識ヌクレオチドを含む。一部の実施形態では、ステップ(d)で使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(b)またはステップ(d)で使用される標識ヌクレオチドは、同じ塩基の非標識ヌクレオチドと混合される。一部の実施形態では、ステップ(b)またはステップ(d)で使用されるヌクレオチドの50%またはそれ未満は、標識されている。一部の実施形態では、ステップ(c)で使用されるヌクレオチドの0.1%またはそれ未満は、標識されている。一部の実施形態では、ステップ(c)で使用されるヌクレオチドのすべては、標識されていない。一部の実施形態では、プライマーがホモポリマー領域の末端まで伸長されるまで、ステップ(c)を1または複数回反復することをさらに含み、取り込まれていないヌクレオチドは、ステップ(c)を反復する前に除去される。一部の実施形態では、標的領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、標的領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、各ポリヌクレオチドの標的領域は、固有のバーコード領域に関連付けられる。
【0010】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドを第1のプライマーとハイブリダイズして、第1の複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップ;(c)複数のポリヌクレオチドを第2のプライマーとハイブリダイズして、第2の複数のハイブリダイズされた鋳型を形成するステップであって、第2のプライマーは、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の連続しかつ同一の塩基を含むホモポリマー領域を含む、ステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。一部の実施形態では、ステップ(b)で使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(d)で使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(b)またはステップ(d)で使用される標識ヌクレオチドは、同じ塩基の非標識ヌクレオチドと混合される。一部の実施形態では、ステップ(c)およびステップ(d)は、ステップ(a)およびステップ(b)の前に実行される。一部の実施形態では、ステップ(a)およびステップ(b)は、ステップ(c)およびステップ(d)の前に実行される。一部の実施形態では、方法は、ステップ(b)の後に第1のプライマーを、またはステップ(d)の後に第2のプライマーを除去するステップを含む。一部の実施形態では、第2のプライマーは、プライマーの3’末端に3’アンカーを含み、3’アンカーは、第2のプライマーのホモポリマー領域中に存在する塩基以外の塩基を含む。一部の実施形態では、第2のプライマーは、プライマーの5’末端に5’アンカーを含み、アンカーは、リンカーを介して第2のプライマーのホモポリマー領域に共有結合されている。一部の実施形態では、5’アンカーは、第1のプライマーの少なくとも一部と同一の配列を含む核酸セグメントを含む。一部の実施形態では、リンカーは、1つまたは複数の核酸を含む。一部の実施形態では、リンカーは、PEGホスホルアミダイトリンカーである。一部の実施形態では、方法は、ヌクレオチドを使用して、第2のプライマーをホモポリマー領域内で伸長するステップをさらに含む。一部の実施形態では、ホモポリマー領域内の第2のプライマーを伸長するために使用されるヌクレオチドは、非終結ヌクレオチドを含む。一部の実施形態では、ホモポリマー領域内の第2のプライマーを伸長するために使用されるヌクレオチドは、非標識ヌクレオチドを含む。一部の実施形態では、標的領域またはバーコード領域の配列は、非標識ヌクレオチドおよび標識ヌクレオチドの混合物を使用して決定される。一部の実施形態では、標的領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、標的領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、各ポリヌクレオチドの標的領域は、固有のバーコード領域に関連付けられる。
【0011】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、プライマーは、第1のプライマーセグメント、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の塩基を含むホモポリマー領域を含む第2のプライマーセグメント、および第1のプライマーセグメントおよび第2のプライマーセグメントの間に切断可能なリンカーを含む、ステップ;(b)標識ヌクレオチドを使用して、標的領域の配列を決定するステップ;(c)切断可能なリンカーでプライマーを切断するステップ;ならびに(d)標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップを含む。一部の実施形態では、ステップ(b)で標的領域の配列を決定するために使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(d)でバーコード領域の配列を決定するために使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(b)またはステップ(d)で使用される標識ヌクレオチドは、同じ塩基の非標識ヌクレオチドと混合される。一部の実施形態では、切断可能なリンカーは、1つまたは複数の核酸を含む。一部の実施形態では、切断可能なリンカーは、ウラシル塩基を含み、プライマーは、プライマーをウラシル特異的切断酵素と接触させることにより切断される。一部の実施形態では、方法は、ヌクレオチドを使用して、第2のプライマーセグメントをホモポリマー領域内で伸長するステップをさらに含む。一部の実施形態では、第2のプライマーセグメントをホモポリマー領域内で伸長するために使用されるヌクレオチドは、非終結ヌクレオチドを含む。一部の実施形態では、第2のプライマーセグメントをホモポリマー領域内で伸長するために使用されるヌクレオチドは、非標識ヌクレオチドを含む。一部の実施形態では、標的領域またはバーコード領域の配列は、非標識ヌクレオチドおよび標識ヌクレオチドの混合物を使用して決定される。一部の実施形態では、標的領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、標的領域を決定するために使用される標識ヌクレオチドの異なる塩基は、別々に使用される。一部の実施形態では、各ポリヌクレオチドの標的領域は、固有のバーコード領域に関連付けられる。
【0012】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)同じ塩基のヌクレオチドを使用して、プライマーをホモポリマー領域中に伸長するステップであって、プライマーは、ホモポリマー領域内で失速し、取り込まれていないヌクレオチドを除去する、ステップ;(c)ステップ(b)を1または複数回反復して、プライマーがホモポリマー領域にわたって伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。一部の実施形態では、ステップ(b)でプライマーを伸長するために使用されるヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(d)で標的領域の配列を決定するために使用される標識ヌクレオチドは、非終結標識ヌクレオチドを含む。一部の実施形態では、ステップ(b)で使用されるヌクレオチドは、標識ヌクレオチドを含む。一部の実施形態では、ステップ(b)で使用されるヌクレオチドは、非標識ヌクレオチドを含む。一部の実施形態では、標的領域の配列は、非標識ヌクレオチドおよび標識ヌクレオチドの混合物を使用して決定される。一部の実施形態では、ポリヌクレオチドは、バーコード領域をさらに含み、標的領域は、固有のバーコード領域に関連付けられ、方法は、標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップをさらに含む。
【0013】
上記方法のいずれかの一部の実施形態では、ポリヌクレオチドのホモポリマー領域中の塩基は、アデニンまたはチミン塩基である。
【0014】
上記方法のいずれかの一部の実施形態では、ポリヌクレオチドのホモポリマー領域は、少なくとも8つの連続する同一の塩基を含む。一部の実施形態では、ポリヌクレオチドのホモポリマー領域は、少なくとも50の連続する同一の塩基を含む。
【0015】
上記方法のいずれかの一部の実施形態では、バーコード領域は、試料バーコードを含む。
【0016】
上記方法のいずれかの一部の実施形態では、方法は、バーコード領域の決定された配列を、同じ標的核酸分子由来のmRNAコード領域に関連する決定された配列に関連付けるステップをさらに含む。
【0017】
上記方法のいずれかの一部の実施形態では、ポリヌクレオチドは、cDNA分子である。
【0018】
上記方法のいずれかの一部の実施形態では、mRNA分子の目的の領域は、mRNA分子のコード領域を含む。
【0019】
上記方法のいずれかの一部の実施形態では、mRNA分子の目的の領域は、mRNA分子の3’-非翻訳領域または5’-非翻訳領域を含む。
本発明の実施形態において、例えば以下の項目が提供される。
(項目1)
mRNA分子由来の目的の領域の配列を決定する方法であって、
(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、前記ポリヌクレオチドが、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、前記バーコード領域が、前記ホモポリマー領域中に存在する同じ塩基を除外する、ステップ;
(b)前記ホモポリマー領域中に存在する同じ塩基の相補的塩基を欠く標識ヌクレオチドを使用して、前記バーコード領域の配列を決定するステップ;
(c)前記ホモポリマー領域中に存在する前記塩基に相補的なヌクレオチドを使用して、前記プライマーを前記ホモポリマー領域内で伸長するステップ;ならびに
(d)標識ヌクレオチドを使用して、前記標的領域の配列を決定するステップ
を含む方法。
(項目2)
ステップ(b)で使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目1に記載の方法。
(項目3)
ステップ(c)で使用される前記ヌクレオチドが、非終結ヌクレオチドを含む、項目1または2に記載の方法。
(項目4)
ステップ(d)で使用される前記ヌクレオチドが、非終結標識ヌクレオチドを含む、項目1から3のいずれか一項に記載の方法。
(項目5)
ステップ(b)で使用される前記標識ヌクレオチドが、前記同じ塩基の非標識ヌクレオチドと混合される、項目1から4のいずれか一項に記載の方法。
(項目6)
前記ホモポリマー領域中に存在する塩基に相補的な前記ヌクレオチドが、非標識ヌクレオチドを含む、項目1から5のいずれか一項に記載の方法。
(項目7)
前記標的領域の配列が、非標識ヌクレオチドおよび前記標識ヌクレオチドの混合物を使用して決定される、項目1から6のいずれか一項に記載の方法。
(項目8)
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目1から7のいずれか一項に記載の方法。
(項目9)
前記バーコード領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目1から8のいずれか一項に記載の方法。
(項目10)
各ポリヌクレオチドの前記標的領域が、固有のバーコード領域に関連付けられる、項目1から9のいずれか一項に記載の方法。
(項目11)
ステップ(b)、ステップ(c)またはステップ(d)で使用される全ヌクレオチドの50%以下が、標識されている、項目1から10のいずれか一項に記載の方法。
(項目12)
ステップ(c)で使用される全ヌクレオチドの0.1%以下が、標識されている、項目1から11のいずれか一項に記載の方法。
(項目13)
前記プライマーが前記ホモポリマー領域の末端まで伸長されるまで、ステップ(c)を1または複数回反復することをさらに含み、取り込まれていないヌクレオチドが、反復ステップの間で除去される、項目1から12のいずれか一項に記載の方法。
(項目14)
mRNA分子由来の目的の領域の配列を決定する方法であって、
(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、前記ポリヌクレオチドが、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;
(b)標識ヌクレオチドおよび非標識ヌクレオチドを、標識ヌクレオチドの全ヌクレオチドに対する第1の割合で使用して、前記バーコード領域の配列を決定するステップ;
(c)前記ホモポリマー領域中に存在する前記塩基に相補的な標識ヌクレオチドを、標識ヌクレオチドの全ヌクレオチドに対する第2の割合で使用して、前記プライマーを伸長するステップであって、前記第2の割合が、前記第1の割合よりも大きく、プライマー伸長が、前記ホモポリマー領域内で失速する、ステップ;
(d)前記ホモポリマー領域中に存在する前記塩基に相補的な非標識ヌクレオチドを使用して、前記プライマーを前記ホモポリマー領域の末端まで伸長するステップ;ならびに
(e)標識ヌクレオチドを使用して、前記標的領域の配列を決定するステップ
を含む方法。
(項目15)
ステップ(b)で使用される前記標識ヌクレオチドおよび非標識ヌクレオチドが、非終結標識ヌクレオチドおよび非終結非標識ヌクレオチドを含む、項目14に記載の方法。
(項目16)
ステップ(c)で使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目14または15に記載の方法。
(項目17)
ステップ(d)で使用される前記非標識ヌクレオチドが、非終結非標識ヌクレオチドを含む、項目14から16のいずれか一項に記載の方法。
(項目18)
ステップ(e)で使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目14から17のいずれか一項に記載の方法。
(項目19)
前記標的領域の配列が、標識ヌクレオチドおよび非標識ヌクレオチドを使用して決定される、項目14から18のいずれか一項に記載の方法。
(項目20)
ステップ(b)または(e)で使用される前記ヌクレオチドの50%またはそれ未満が、標識されている、項目14から19のいずれか一項に記載の方法。
(項目21)
ステップ(c)で使用される前記ヌクレオチドの50%より多くが、標識されている、項目14から20のいずれか一項に記載の方法。
(項目22)
ステップ(d)で使用される前記ヌクレオチドの0.1%またはそれ未満が、標識されている、項目14から21のいずれか一項に記載の方法。
(項目23)
ステップ(d)で使用される前記ヌクレオチドのすべてが、標識されていない、項目14から22のいずれか一項に記載の方法。
(項目24)
ステップ(d)が、前記プライマーが前記ホモポリマー領域の末端まで伸長されるまで、1または複数回、反復して、取り込まれていないヌクレオチドを除去すること、および新鮮なヌクレオチドを添加することを含む、項目14から23のいずれか一項に記載の方法。
(項目25)
各ポリヌクレオチドの前記標的領域が、固有のバーコード領域に関連付けられる、項目14から24のいずれか一項に記載の方法。
(項目26)
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目14から25のいずれか一項に記載の方法。
(項目27)
前記バーコード領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目14から26のいずれか一項に記載の方法。
(項目28)
mRNA分子由来の目的の領域の配列を決定する方法であって、
(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、前記ポリヌクレオチドが、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、前記標的領域が、固有のバーコード領域に関連付けられる、ステップ;
(b)複数の所定のサイクルで標識ヌクレオチドを使用して、前記バーコード領域の配列を決定するステップであって、前記プライマーが、前記ホモポリマー領域中に伸長される前に、前記複数のポリヌクレオチドにわたって前記バーコード領域の末端まで伸長されるように、前記所定のサイクルおよび前記ポリヌクレオチドの前記バーコード領域が構成されている、ステップ;
(c)非標識ヌクレオチドを使用して、前記プライマーを前記ホモポリマー領域内で伸長するステップ;ならびに
(d)標識ヌクレオチドを使用して、前記標的領域の配列を決定するステップ
を含む方法。
(項目29)
ステップ(b)で使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目28に記載の方法。
(項目30)
ステップ(c)で使用される前記非標識ヌクレオチドが、非終結非標識ヌクレオチドを含む、項目28または29に記載の方法。
(項目31)
ステップ(d)で使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目28から30のいずれか一項に記載の方法。
(項目32)
ステップ(b)またはステップ(d)で使用される前記標識ヌクレオチドが、前記同じ塩基の非標識ヌクレオチドと混合される、項目28から31のいずれか一項に記載の方法。
(項目33)
ステップ(b)またはステップ(d)で使用される前記ヌクレオチドの50%またはそれ未満が、標識されている、項目28から32のいずれか一項に記載の方法。
(項目34)
ステップ(c)で使用される前記ヌクレオチドの0.1%またはそれ未満が、標識されている、項目28から33のいずれか一項に記載の方法。
(項目35)
ステップ(c)で使用される前記ヌクレオチドのすべてが、標識されていない、項目28から34のいずれか一項に記載の方法。
(項目36)
前記プライマーが前記ホモポリマー領域の末端まで伸長されるまで、ステップ(c)を1または複数回反復することをさらに含み、取り込まれていないヌクレオチドが、ステップ(c)を反復する前に除去される、項目26から35のいずれか一項に記載の方法。
(項目37)
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目26から36のいずれか一項に記載の方法。
(項目38)
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目26から37のいずれか一項に記載の方法。
(項目39)
各ポリヌクレオチドの前記標的領域が、固有のバーコード領域に関連付けられる、項目26から38のいずれか一項に記載の方法。
(項目40)
mRNA分子由来の目的の領域の配列を決定する方法であって、
(a)mRNAに由来する複数のポリヌクレオチドを第1のプライマーとハイブリダイズして、第1の複数のハイブリダイズされた鋳型を形成するステップであって、前記ポリヌクレオチドが、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;
(b)標識ヌクレオチドを使用して、前記バーコード領域の配列を決定するステップ;
(c)前記複数のポリヌクレオチドを第2のプライマーとハイブリダイズして、第2の複数のハイブリダイズされた鋳型を形成するステップであって、前記第2のプライマーが、前記ポリヌクレオチドの前記ホモポリマー領域中の前記塩基に相補的な複数の連続しかつ同一の塩基を含むホモポリマー領域を含む、ステップ;ならびに
(d)標識ヌクレオチドを使用して、前記標的領域の配列を決定するステップ
を含む方法。
(項目41)
ステップ(b)で使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目40に記載の方法。
(項目42)
ステップ(d)で使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目40または41に記載の方法。
(項目43)
ステップ(b)またはステップ(d)で使用される前記標識ヌクレオチドが、前記同じ塩基の非標識ヌクレオチドと混合される、項目40から42のいずれか一項に記載の方法。
(項目44)
ステップ(c)およびステップ(d)が、ステップ(a)およびステップ(b)の前に実行される、項目40から43のいずれか一項に記載の方法。
(項目45)
ステップ(a)およびステップ(b)が、ステップ(c)およびステップ(d)の前に実行される、項目40から43のいずれか一項に記載の方法。
(項目46)
ステップ(b)の後に前記第1のプライマーを、またはステップ(d)の後に前記第2のプライマーを除去するステップを含む、項目40から45のいずれか一項に記載の方法。
(項目47)
前記第2のプライマーが、前記プライマーの3’末端に3’アンカーを含み、前記3’アンカーが、前記第2のプライマーの前記ホモポリマー領域中に存在する前記塩基以外の塩基を含む、項目40から46のいずれか一項に記載の方法。
(項目48)
前記第2のプライマーが、前記プライマーの5’末端に5’アンカーを含み、前記アンカーが、リンカーを介して前記第2のプライマーの前記ホモポリマー領域に共有結合されている、項目40から47のいずれか一項に記載の方法。
(項目49)
前記5’アンカーが、前記第1のプライマーの少なくとも一部と同一の配列を含む核酸セグメントを含む、項目48に記載の方法。
(項目50)
前記リンカーが、1つまたは複数の核酸を含む、項目48または49に記載の方法。
(項目51)
前記リンカーが、PEGホスホルアミダイトリンカーである、項目48から50のいずれか一項に記載の方法。
(項目52)
ヌクレオチドを使用して、前記第2のプライマーを前記ホモポリマー領域内で伸長するステップをさらに含む、項目40から51のいずれか一項に記載の方法。
(項目53)
前記ホモポリマー領域内の前記第2のプライマーを伸長するために使用される前記ヌクレオチドが、非終結ヌクレオチドを含む、項目52に記載の方法。
(項目54)
前記ホモポリマー領域内の前記第2のプライマーを伸長するために使用される前記ヌクレオチドが、非標識ヌクレオチドを含む、項目52または53に記載の方法。
(項目55)
前記標的領域または前記バーコード領域の配列が、非標識ヌクレオチドおよび前記標識ヌクレオチドの混合物を使用して決定される、項目40から54のいずれか一項に記載の方法。
(項目56)
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目40から55のいずれか一項に記載の方法。
(項目57)
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目40から56のいずれか一項に記載の方法。
(項目58)
各ポリヌクレオチドの前記標的領域が、固有のバーコード領域に関連付けられる、項目40から57のいずれか一項に記載の方法。
(項目59)
mRNA分子由来の目的の領域の配列を決定する方法であって、
(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドが、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、前記プライマーが、第1のプライマーセグメント、前記ポリヌクレオチドの前記ホモポリマー領域中の前記塩基に相補的な複数の塩基を含むホモポリマー領域を含む第2のプライマーセグメント、および前記第1のプライマーセグメントおよび前記第2のプライマーセグメントの間に切断可能なリンカーを含む、ステップ;
(b)標識ヌクレオチドを使用して、前記標的領域の配列を決定するステップ;
(c)前記切断可能なリンカーで前記プライマーを切断するステップ;ならびに
(d)標識ヌクレオチドを使用して、前記バーコード領域の配列を決定するステップ
を含む方法。
(項目60)
ステップ(b)で前記標的領域の配列を決定するために使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目59に記載の方法。
(項目61)
ステップ(d)で前記バーコード領域の配列を決定するために使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目59または60に記載の方法。
(項目62)
ステップ(b)またはステップ(d)で使用される前記標識ヌクレオチドが、前記同じ塩基の非標識ヌクレオチドと混合される、項目59から61のいずれか一項に記載の方法。
(項目63)
前記切断可能なリンカーが、1つまたは複数の核酸を含む、項目59から62のいずれか一項に記載の方法。
(項目64)
前記切断可能なリンカーが、ウラシル塩基を含み、前記プライマーが、前記プライマーをウラシル特異的切断酵素と接触させることにより切断される、項目59から63のいずれか一項に記載の方法。
(項目65)
ヌクレオチドを使用して、前記第2のプライマーセグメントを前記ホモポリマー領域内で伸長するステップをさらに含む、項目59から64のいずれか一項に記載の方法。
(項目66)
前記第2のプライマーセグメントを前記ホモポリマー領域内で伸長するために使用される前記ヌクレオチドが、非終結ヌクレオチドを含む、項目65に記載の方法。
(項目67)
前記第2のプライマーセグメントを前記ホモポリマー領域内で伸長するために使用される前記ヌクレオチドが、非標識ヌクレオチドを含む、項目65または66に記載の方法。(項目68)
前記標的領域または前記バーコード領域の配列が、非標識ヌクレオチドおよび前記標識ヌクレオチドの混合物を使用して決定される、項目59から67のいずれか一項に記載の方法。
(項目69)
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目59から68のいずれか一項に記載の方法。
(項目70)
前記標的領域を決定するために使用される前記標識ヌクレオチドの異なる塩基が、別々に使用される、項目59から69のいずれか一項に記載の方法。
(項目71)
各ポリヌクレオチドの前記標的領域が、固有のバーコード領域に関連付けられる、項目59から70のいずれか一項に記載の方法。
(項目72)
mRNA分子由来の目的の領域の配列を決定する方法であって、
(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、前記ポリヌクレオチドが、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;
(b)前記同じ塩基のヌクレオチドを使用して、前記プライマーを前記ホモポリマー領域中に伸長するステップであって、前記プライマーが、前記ホモポリマー領域内で失速し、取り込まれていないヌクレオチドを除去する、ステップ;
(c)ステップ(b)を1または複数回反復して、前記プライマーが前記ホモポリマー領域にわたって伸長するステップ;ならびに
(d)標識ヌクレオチドを使用して、前記標的領域の配列を決定するステップ
を含む方法。
(項目73)
ステップ(b)で前記プライマーを伸長するために使用される前記ヌクレオチドが、非終結標識ヌクレオチドを含む、項目72に記載の方法。
(項目74)
ステップ(d)で前記標的領域の配列を決定するために使用される前記標識ヌクレオチドが、非終結標識ヌクレオチドを含む、項目72または73に記載の方法。
(項目75)
ステップ(b)で使用される前記ヌクレオチドが、標識ヌクレオチドを含む、項目72から74のいずれか一項に記載の方法。
(項目76)
ステップ(b)で使用される前記ヌクレオチドが、非標識ヌクレオチドを含む、項目72から75のいずれか一項に記載の方法。
(項目77)
前記標的領域の配列が、非標識ヌクレオチドおよび前記標識ヌクレオチドの混合物を使用して決定される、項目72から76のいずれか一項に記載の方法。
(項目78)
前記ポリヌクレオチドが、バーコード領域をさらに含み、前記標的領域が、固有のバーコード領域に関連付けられ、前記方法が、標識ヌクレオチドを使用して、前記バーコード領域の配列を決定するステップをさらに含む、項目72から77のいずれか一項に記載の方法。
(項目79)
前記ポリヌクレオチドの前記ホモポリマー領域中の前記塩基が、アデニンまたはチミン塩基である、項目1から78のいずれか一項に記載の方法。
(項目80)
前記ポリヌクレオチドの前記ホモポリマー領域が、少なくとも8つの連続する同一の塩基を含む、項目1から79のいずれか一項に記載の方法。
(項目81)
前記ポリヌクレオチドの前記ホモポリマー領域が、少なくとも50の連続する同一の塩基を含む、項目1から80のいずれか一項に記載の方法。
(項目82)
前記バーコード領域が、試料バーコードを含む、項目1から71および78から81のいずれか一項に記載の方法。
(項目83)
前記バーコード領域の決定された配列を、同じ標的核酸分子由来のmRNAコード領域に関連する決定された配列に関連付けるステップをさらに含む、項目1から71および78から82のいずれか一項に記載の方法。
(項目84)
前記ポリヌクレオチドが、cDNA分子である、項目1から83のいずれか一項に記載の方法。
(項目85)
前記mRNA分子の前記目的の領域が、前記mRNA分子のコード領域を含む、項目1から84のいずれか一項に記載の方法。
(項目86)
前記mRNA分子の前記目的の領域が、前記mRNA分子の3’-非翻訳領域または5’-非翻訳領域を含む、項目1から85のいずれか一項に記載の方法。
【図面の簡単な説明】
【0020】
【
図1】
図1は、本明細書に記載される方法を使用してシークエンシングすることができるポリヌクレオチドを得るための例示的方法を説明する。
【0021】
【
図2A】
図2Aは、バーコード領域がホモポリマー領域中に存在する同じ塩基を除外する、mRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
【0022】
【
図2B】
図2Bは、グラフ形式で、バーコード領域がホモポリマー領域中に存在する同じ塩基を除外する、mRNA分子由来の目的の領域の配列を決定するための例示的方法を示す。
【0023】
【
図3A】
図3Aは、プライマー伸長がホモポリマー領域内で失速する、mRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
【0024】
【
図3B】
図3Bは、グラフ形式で、プライマー伸長がホモポリマー領域内で失速する、mRNA分子由来の目的の領域の配列を決定するための例示的方法を示す。
【0025】
【
図4A】
図4Aは、フローサイクルおよびポリヌクレオチドの異なるバーコード領域が、プライマーが、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように構成される、mRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
【0026】
【
図4B】
図4Bは、グラフ形式で、異なるバーコード領域の配列を有するが同じフロー長さである複数のポリヌクレオチドによる、mRNA分子由来の目的の領域の配列を決定するための例示的方法を示す。
【0027】
【
図5A】
図5Aは、2つのプライマーを使用するmRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
【0028】
【
図5B】
図5Bは、グラフ形式で、2つのプライマーを使用するmRNA分子由来の目的の領域の配列を決定するための例示的方法を示す。
【0029】
【
図5C】
図5Cは、ポリヌクレオチドとハイブリダイズされる2つのプライマーの配列が、
図5Aに示されている例示的方法と比較して逆である、2つのプライマーを使用するmRNA分子由来の目的の領域の配列を決定するための別の例示的方法のフローチャートを示す。
【0030】
【
図5D】
図5Dは、グラフ形式で、ポリヌクレオチドとハイブリダイズされる2つのプライマーの配列が、
図5Aに示されている例示的方法と比較して逆である、2つのプライマーを使用するmRNA分子由来の目的の領域の配列を決定するための例示的方法を示す。
【0031】
【
図6A】
図6Aは、切断可能なプライマーを使用するmRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
【0032】
【
図6B】
図6Bは、グラフ形式で、切断可能なプライマーを使用するmRNA分子由来の目的の領域の配列を決定するための例示的方法を示す。
【0033】
【
図7A】
図7Aは、プライマー伸長がポリヌクレオチドのホモポリマー領域内で失速および再開する、mRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
【0034】
【
図7B】
図7Bは、グラフ形式で、プライマー伸長がポリヌクレオチドのホモポリマー領域内で失速および再開する、mRNA分子由来の目的の領域の配列を決定するための例示的方法を示す。
【0035】
【
図8】
図8は、バーコード領域、ホモポリマー領域および目的の領域を含む、3つの例示的配列についてのシークエンシングフローマトリックスおよびシグナルトレースを示す。
【発明を実施するための形態】
【0036】
発明の詳細な説明
mRNA分子内の目的の領域(例えば、コード領域、3’非翻訳領域(3’-UTR)および/または5’非翻訳領域(5’-UTR))の配列を決定する方法が、本明細書に記載される。この方法により、ホモポリマー領域(例えば、ポリA領域またはその相補体、ポリT領域)の全部または実質的に一部のシークエンシングを回避しながら、mRNA分子内の目的の領域をシークエンシングすることが可能になる。mRNA分子のポリA領域は、一般に、それがmRNA配列または遺伝子発現レベルについての重大な情報を提供しないので、関心をひかない、および有益な情報をもたらさないと考えられる。したがって、ポリヌクレオチドのより情報価値のある領域に達するように、ホモポリマー領域をわたってシークエンシングプライマーが伸長するために必要なコストおよび時間の低減において実質的な利益が存在する。例えば、コストは、非標識ヌクレオチド対応物よりも実質的に費用がかかる標識ヌクレオチドの使用を低減または排除しながら、シークエンシングプライマーを伸長することによって、低減することができる。さらに、シークエンシングプライマーの伸長時間は、取り込まれた各塩基に対する検出ステップをスキップすること、およびプライマーがホモポリマー領域をわたって連続的に伸長するのを可能にすることによって、低減することができる。
【0037】
シークエンシングされたポリヌクレオチドは、バーコード領域を含み得、これは、例えば、試料バーコードおよび/または固有分子識別子(UMI)を含むことができる。ホモポリマー領域は、バーコード領域およびmRNA分子中の目的の領域の間のポリヌクレオチドに位置することができる。これは、配列の知識が所望される2つの領域(すなわち、バーコード領域およびmRNA分子由来の目的の配列)が、関心をひかない領域(ホモポリマー領域)により分離される状況を生じる。一部の本明細書に記載される方法により、ホモポリマー領域の存在により引き起こされる破壊を最小化しながら、バーコード領域および目的のmRNA領域の両方をシークエンシングすることが可能になる。
【0038】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、バーコード領域は、ホモポリマー領域中に存在する同じ塩基を除外する、ステップ;(b)ホモポリマー領域中に存在する同じ塩基の相補的塩基を欠く標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップ;(c)ホモポリマー領域中に存在する塩基に相補的なヌクレオチドを使用して、プライマーをホモポリマー領域内で伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。必要に応じて、ヌクレオチドは非終結非標識ヌクレオチドである。
【0039】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)標識ヌクレオチドおよび非標識ヌクレオチドを、標識ヌクレオチドの全ヌクレオチドに対する第1の割合で使用して、バーコード領域の配列を決定するステップ;(c)ホモポリマー領域中に存在する塩基に相補的な標識ヌクレオチドを、標識ヌクレオチドの全ヌクレオチドに対する第2の割合で使用して、プライマーを伸長するステップであって、第2の割合は、第1の割合よりも大きく、プライマー伸長は、ホモポリマー領域内で失速する、ステップ;(d)ホモポリマー領域中に存在する塩基に相補的な非標識ヌクレオチドを使用して、プライマーをホモポリマー領域の末端まで伸長するステップ;ならびに(e)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。必要に応じて、ヌクレオチドは非終結非標識ヌクレオチドである。
【0040】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、標的領域は、固有のバーコード領域に関連付けられる、ステップ;(b)複数の所定のサイクルで標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップであって、プライマーは、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように、所定のサイクルおよびポリヌクレオチドのバーコード領域が構成されている、ステップ;(c)非標識ヌクレオチドを使用して、プライマーをホモポリマー領域内で伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。必要に応じて、ヌクレオチドは非終結非標識ヌクレオチドである。
【0041】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドを第1のプライマーとハイブリダイズして、第1の複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップ;(c)複数のポリヌクレオチドを第2のプライマーとハイブリダイズして、第2の複数のハイブリダイズされた鋳型を形成するステップであって、第2のプライマーは、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の連続しかつ同一の塩基を含むホモポリマー領域を含む、ステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。必要に応じて、ヌクレオチドは非終結非標識ヌクレオチドである。
【0042】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、プライマーは、第1のプライマーセグメント、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の塩基を含むホモポリマー領域を含む第2のプライマーセグメント、および第1のプライマーセグメントおよび第2のプライマーセグメントの間に切断可能なリンカーを含む、ステップ;(b)標識ヌクレオチドを使用して、標的領域の配列を決定するステップ;(c)切断可能なリンカーでプライマーを切断するステップ;ならびに(d)標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップを含む。必要に応じて、ヌクレオチドは非終結非標識ヌクレオチドである。
【0043】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)同じ塩基のヌクレオチドを使用して、プライマーをホモポリマー領域中に伸長するステップであって、プライマーは、ホモポリマー領域内で失速し、取り込まれていないヌクレオチドを除去する、ステップ;(c)ステップ(b)を1または複数回反復して、プライマーがホモポリマー領域にわたって伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。必要に応じて、ヌクレオチドは非終結非標識ヌクレオチドである。
定義
【0044】
本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈による別段の明白な指示がない限り、複数形の言及対象を含む。
【0045】
本明細書での「約」ある値またはパラメーターへの言及は、その値またはパラメーター自体に関する変動を含む(および記載する)。例えば、「約X」に言及する記載は、「X」の記載を含む。
【0046】
用語「個体」、「患者」および「対象」は、同義語として使用され、ヒトを含む動物を指す。
【0047】
用語「標識」は、本明細書で使用される場合、別の部分、例えばヌクレオチドまたはヌクレオチドアナログ、とカップリングされる、またはカップリングされ得る、検出可能な部分を指す。標識は、標識に送達されたシグナルを放出することまたはシグナルを変更することができ、したがって、標識の存在または非存在を検出することができる。一部のケースでは、カップリングは、リンカーを介してのカップリングであり得、リンカーは、切断可能、例えば、光切断可能(例えば、紫外線下で切断可能)、化学的に切断可能(例えば、ジチオトレイトール(DTT)、トリス(2-カルボキシエチル)ホスフィン(TCEP)などの、還元剤によって)、または酵素的に切断可能(例えば、エステラーゼ、リパーゼ、ペプチダーゼもしくはプロテアーゼによって)であり得る。
【0048】
「非終結ヌクレオチド」は、ポリメラーゼまたはトランスクリプターゼを使用してポリヌクレオチドの3’末端に結合させることができる、およびポリメラーゼまたはトランスクリプターゼを使用してそれに結合された別の非終結核酸を有することができ、そのヌクレオチドから保護基または可逆的ターミネーターを除去する必要がない、核酸部分である。天然に存在する核酸は、非終結核酸の一種である。非終結核酸は、標識されていることがあり、または未標識であることもある。
【0049】
本明細書に記載される本発明の態様および変形形態が、態様および変形形態「からなること」および/または「から本質的になること」を含むことは理解されよう。
【0050】
値の範囲が提供される場合、その範囲の上限値と下限値の間に介在する各々の値、およびその述べられている範囲内の、任意の他の述べられているまたは介在する値が、本開示の範囲内に包含されることは、理解されるはずである。述べられている範囲が上限値または下限値を含む場合、これらの含まれる限界値のどちらかを含まない範囲もまた、本開示に含まれる。
【0051】
本明細書で使用される節の見出しは、単に構成のためのものであり、記載される主題を限定するものと解釈すべきでない。この説明は、当業者による本発明の実施および使用を可能にするために提供され、特許出願およびその要件に関連して提供される。記載される実施形態の様々な修飾形態が当業者には容易に分かることになり、本明細書における一般原理を他の実施形態に応用することができる。したがって、本発明は、示される実施形態に限定されるように意図されたものではなく、本発明には、本明細書に記載される原理および特徴に対応する最も広い範囲が与えられる。
【0052】
図1~8は、様々な実施形態によるプロセスを例証する。これらの例示的プロセスでは、一部のブロックは、必要に応じて組み合わせられ、一部のブロックの順序は、必要に応じて変更され、一部のブロックは、必要に応じて割愛される。一部の例では、追加のステップが例示的プロセスと組み合わせて遂行され得る。したがって、例証される(および下記でより詳細に説明される)ような操作は、本質的に例示的なものであり、したがって、限定と見なすべきではない。
【0053】
本明細書で言及されるすべての公表文献、特許および特許出願の開示は、これにより各々その全体が参照により本明細書に取り込まれる。参照により取り込まれるいずれかの参考文献が本開示と矛盾する場合には、本開示が優先されるものとする。
ポリヌクレオチド
【0054】
本明細書に記載される方法で使用されるポリヌクレオチドは、ホモポリマー領域および標的領域を含むことができる。一部の実施形態では、ポリヌクレオチドは、バーコード領域をさらに含む。一般に、ポリヌクレオチドは、例えば、逆転写酵素から相補的DNA(cDNA)分子を生成することにより、mRNAに由来する。一部の実施形態では、ポリヌクレオチドは、cDNA分子の相補体である。複数のポリヌクレオチドは、複数のmRNA分子に由来することができ、異なるポリヌクレオチドは、異なるmRNA分子を反映する配列を含むことができる。異なるmRNA分子は、目的の領域および/または異なるホモポリマー(例えば、ポリA領域)の長さについて異なる配列を含み得るので、同様に、ポリヌクレオチドは、異なる標的領域および/または異なるホモポリマーの長さを含むことができる。
【0055】
ポリヌクレオチドの標的領域は、mRNA分子由来の目的の領域に関連する配列を含む。配列は、例えば、mRNA分子由来の目的の配列と同じまたは相補的であり得る。目的の領域は、mRNA分子由来の、1もしくは複数の3’-UTR、5’-UTRおよび/またはコード領域、あるいはこれらの領域のいずれか1つの一部を含み得る。
【0056】
ポリヌクレオチドは、ホモポリマー領域(例えば、ポリAまたはポリT領域)を含み、これは、mRNA分子中のポリA領域またはその相補体を代表する。一部の実施形態では、ポリヌクレオチドのホモポリマー領域は、長さ約5塩基もしくはそれより長く、長さ約8塩基もしくはそれより長く、長さ約10塩基もしくはそれより長く、長さ約20塩基もしくはそれより長く、長さ約30塩基もしくはそれより長く、長さ約40塩基もしくはそれより長く、長さ約50塩基もしくはそれより長く、長さ約100塩基もしくはそれより長く、または長さ約200塩基もしくはそれより長い。一部の実施形態では、ポリヌクレオチドのホモポリマー領域は、長さ約5塩基~約200塩基、例えば、長さ約5塩基~約8塩基、長さ約8塩基~約10塩基、長さ約10塩基~約20塩基、長さ約20塩基~約30塩基、長さ約30塩基~約40塩基、長さ約40塩基~約50塩基、長さ約50塩基~約100塩基、または長さ約100塩基~約200塩基である。
【0057】
一部の実施形態では、ポリヌクレオチドは、バーコード領域(例えば、試料バーコードおよび/またはUMI)を含む。一部の実施形態では、ポリヌクレオチドは、異なるmRNA分子に由来し、したがって、異なるmRNA分子由来の目的の異なる標的領域を含むことができ、存在する場合、元のmRNA分子を固有に識別するための異なるバーコード領域を含み得る。一部の実施形態では、バーコード領域は、試料バーコードを含む。試料バーコードは、所与の試料に対して固有であり得、したがって、同じ試料(例えば、同じ患者由来、同じ患者の組織、または同じ細胞由来)について使用される捕捉用プライマーにわたって共通し得る。したがって、異なる試料由来のポリヌクレオチドは、多重シークエンシングのために組み合わせることができ、任意の所与のシークエンシングされるポリヌクレオチドの起源は、試料バーコードに基づいて決定することができる。
【0058】
一部の実施形態では、ポリヌクレオチドのホモポリマー領域は、標的領域およびバーコード領域の間に位置する。例えば、一部の実施形態では、ホモポリマー領域の5’末端は、標的領域の3’末端の近位にあり、ホモポリマー領域の3’末端は、バーコード領域の5’末端の近位にある。一部の実施形態では、ホモポリマー領域の3’末端は、標的領域の5’末端の近位にあり、ホモポリマー領域の5’末端は、バーコード領域の3’末端の近位にある。一部の実施形態では、バーコード領域およびホモポリマー領域の間に介在する塩基は存在しない。一部の実施形態では、ホモポリマー領域および標的領域の間に介在する塩基は存在しない。
【0059】
mRNAは、捕捉用プライマー(例えば、DNA捕捉用プライマー)を使用して生体試料(例えば、血液試料、細胞試料、組織試料または他の生物試料に由来する試料)から単離することができる。例えば、生物試料を得るために、血液試料が採取され得るか、または組織試料が生検され得る。一部の実施形態では、生体試料は単一細胞であり、単一細胞由来のmRNAは、共通の試料バーコードで標識することができる(例えば、単一細胞RNAシークエンシングまたは「scRNA-seq」)。一部の実施形態では、捕捉用プライマーは、mRNAの3’末端でポリAテイルとハイブリダイズするポリT配列を含む。捕捉用プライマーは、表面、例えば、ビーズまたは他の結合表面に結合し得、未結合核酸分子または他の生物残屑を除去することができる。一部の実施形態では、捕捉用プライマーは、バーコード領域を含むことができる。バーコード領域は、固有分子識別子(UMI)を含み得、これは、特定の捕捉用プライマーとハイブリダイズされるmRNA分子に関連付けられる。したがって、複数の異なるmRNA分子は、固有のバーコード領域で捕捉することができる。
【0060】
mRNA分子とハイブリダイズされる捕捉用プライマーは、逆転写酵素を使用して伸長されて、cDNA分子が生成し得る。cDNA分子は、バーコードが最終ポリヌクレオチド中に存在する場合、捕捉用プライマーのバーコード領域と一緒に、ポリTホモポリマー領域を含む。一部の実施形態では、cDNA分子の相補体が生成し、cDNA分子および/またはcDNA分子の相補体は、シークエンシングのための鋳型として使用される。一部の実施形態では、捕捉用プローブ中のポリTホモポリマー領域は、長さ約5塩基~長さ約50塩基、例えば、長さ約10~約30塩基、または長さ約20塩基である。
【0061】
図1は、本明細書に記載される方法を使用してシークエンシングすることができるポリヌクレオチドを得るための例示的方法を説明する。mRNA分子102は、標的領域104、および標的領域102の3’末端の近位にあるポリAホモポリマー領域106を含む。標的領域は、3’-UTR108、コード領域110、および5’-UTRを含むことができる。試料から得られるmRNA分子102は、一般に、表面114、例えば、ビーズまたは他の好適な表面と融合された捕捉用プローブ116とハイブリダイズすることができる。捕捉用プローブ116は、捕捉用プローブ116を表面114に結合する連結領域118、バーコード領域120(必要に応じて)、およびポリTホモポリマー領域122を含む。捕捉用プローブのポリTホモポリマー領域122は、mRNA分子のポリAホモポリマー領域106とハイブリダイズする。mRNA分子102とハイブリダイズされた結合した捕捉用プローブ116を含む表面114を洗浄して、捕捉されていないポリヌクレオチドまたは試料由来の他の物質を除去し得る。逆転写酵素124は、鋳型としてmRNA分子102を使用して捕捉用プローブ116を伸長した。これは、mRNA分子102の標的領域に相補的な標的領域128、ポリTホモポリマー領域122、およびバーコード領域120を含むcDNA分子126を生成する。連結領域118は、表面114から切断することができ、それによってcDNA分子126が放出される。アダプター130および132は、cDNA分子126の3’および/または5’末端にライゲートされ得る。cDNA分子126の相補体134を生成することができ、これは、シークエンシングプライマー136とハイブリダイズされて、ハイブリダイズされた鋳型を生成することができる。いずれかの実施形態では、ハイブリダイズされた鋳型は、本明細書に記載されるシークエンシング法のいずれかに進行し得る。
フローシークエンシング法
【0062】
本明細書に記載される方法を使用して、mRNA分子由来の目的の領域の配列を決定することができる。mRNAに由来するポリヌクレオチドは、シークエンシングプライマーとハイブリダイズして、シークエンシングのためのハイブリダイゼーション鋳型を生成する。本明細書に記載される方法は、「自然な合成によるシークエンシング」または「非終結型の合成によるシークエンシング」方法と呼ばれることもあるフローシークエンシング法を使用してポリヌクレオチドをシークエンシングすることを含み得る。例示的な方法は、その全体が参照により本明細書に取り込まれる米国特許第8,772,473号に記載されている。以下の説明は、フローシークエンシング法に関して提供されるが、すべてまたは一部分(例えば、1つまたは複数の領域、例えば、バーコード領域および/または標的領域)をシークエンシングするために他のシークエンシング法が使用され得ることは、理解されよう。フローシークエンシングは、ポリヌクレオチドとハイブリダイズされたプライマーを伸長するためのヌクレオチドの使用を含む。所与の塩基タイプのヌクレオチド(例えば、A、C、G、T、Uなど)をハイブリダイズされた鋳型と混合して、相補的塩基が鋳型鎖内に存在する場合には、プライマーを伸長することができる。ヌクレオチドは、例えば、非終結ヌクレオチドであり得る。ヌクレオチドが、非終結ヌクレオチドであるとき、1つより多くの連続する相補的塩基が鋳型鎖内に存在する場合には、1つより多くの連続する塩基を伸長プライマー鎖に取り込むことができる。非終結ヌクレオチドは、3’可逆的ターミネーターを有するヌクレオチドと対照をなし、一般に、連続ヌクレオチドが結合される前にブロッキング基は除去される。相補的塩基が鋳型鎖内に存在しない場合、鋳型鎖内の次の塩基と相補的であるヌクレオチドが導入されるまで、プライマー伸長は停止する。ヌクレオチドの少なくとも一部分に標識することができ、その結果、取り込みを検出することができる。最も一般的には、単一のヌクレオチドタイプのみが一度に導入される(すなわち、個々に付加される)が、ある特定の実施形態では、2つまたは3つの異なるタイプのヌクレオチドが同時に導入されることもある。この方法論は、あらゆる単一塩基の伸長後、ターミネーターが反転されて次に続く塩基の取り込みが可能になるまで、プライマー伸長が停止される、可逆的ターミネーターを使用するシークエンシング法と対比され得る。
【0063】
ヌクレオチドを決定された順序で導入することができ、この過程をフローサイクルにさらに分けることができる。ヌクレオチドが段階的に付加され、これにより、付加されたヌクレオチドを鋳型鎖内に存在する相補的塩基のシークエンシングプライマーの末端に組み込むことが可能になる。サイクルは、ヌクレオチドの同じ順序および異なる塩基タイプ(すなわち、対称サイクル)の数、またはヌクレオチドの異なる順序、および/または異なる数の異なる塩基タイプ(すなわち、対称サイクル)を有し得る。しかし、いずれの塩基も、同じサイクルで反復されず、異なるサイクルを区別するためのマーカーとなる。単に例として、第1のサイクルの順序は、A-T-G-Cであり得、第2のサイクルの順序は、A-T-C-Gであり得る。さらに、1つまたは複数のサイクルが、1つまたは複数のヌクレオチドを含まないこともある。単に例として、第1のサイクルの順序は、A-T-G-Cであり得、第2のサイクルの順序は、A-T-Cであり得る。代替順序を当業者は容易に企図することができる。異なるヌクレオチドの導入と導入の間に、例えば洗浄液でシークエンシングプラットフォームを洗浄することにより、取り込まれていないヌクレオチドを除去することができる。
【0064】
ポリメラーゼを使用して、1つまたは複数のヌクレオチドをプライマーの末端に鋳型依存的に取り込むことによりシークエンシングプライマーを伸長させることができる。一部の実施形態では、ポリメラーゼは、DNAポリメラーゼである。一部の実施形態では、ポリメラーゼは、RNAポリメラーゼである。ポリメラーゼは、天然に存在するポリメラーゼであることもあり、または合成(例えば、突然変異型)ポリメラーゼであることもある。ポリメラーゼをプライマー伸長の最初のステップで付加させることができるが、補足ポリメラーゼを、必要に応じて、シークエンシング中に、例えば、ヌクレオチドの段階的付加を用いて、またはいくつかのフローサイクル後に、付加させることができる。
【0065】
取り込まれた標識核酸の存在または非存在を検出して配列を決定することができる。標識は、例えば、光学活性標識(例えば、蛍光標識)または放射性標識であることがあり、標識により放出または変更されたシグナルを、検出器を使用して検出することができる。
【0066】
フローグラムを、取り込まれたヌクレオチドの検出およびヌクレオチド導入の順序に基づいて生成することができる。例えば、以下の鋳型配列:CTGおよびCAG、ならびにT-A-C-Gの反復フローサイクルをとる。結果として生じるフローグラムが表1に示され、この表中の1は、導入されたヌクレオチドが組み込まれること示し、0は、導入されたヌクレオチドが組み込まれないことを示す。フローグラムを使用して、鋳型鎖の配列を決定することができる。
【表1】
【0067】
導入されるヌクレオチドは、鋳型鎖の配列を決定する場合、標識ヌクレオチドを含むことができる。標識は、例えば、蛍光標識であり得る。鋳型ポリヌクレオチドとハイブリダイズされたプライマーに取り込まれた標識ヌクレオチドの存在または非存在を検出することができ、このことによって配列の決定が(例えば、フローグラムを生成することにより)可能になる。一部の実施形態では、標識ヌクレオチドは、蛍光部分、発光部分、または他の光出射部分で標識される。一部の実施形態では、標識は、リンカーを介してヌクレオチドに結合される。一部の実施形態では、リンカーは、例えば、光化学的または化学的切断反応によって、切断可能である。例えば、標識を、検出後かつ連続ヌクレオチドの取り込み前に切断することができる。一部の実施形態では、標識(またはリンカー)は、ヌクレオチド塩基に結合されるか、または新生DNA鎖の延長に干渉しないヌクレオチド上の別の部位に結合される。一部の実施形態では、リンカーは、ジスルフィドまたはPEG含有部分を含む。
【0068】
一部の実施形態では、導入されるヌクレオチドは、非標識ヌクレオチドのみを含み、一部の実施形態では、ヌクレオチドは、標識ヌクレオチドと非標識ヌクレオチドの混合物を含む。例えば、一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約90%もしくはそれ未満、約80%もしくはそれ未満、約70%もしくはそれ未満、約60%もしくはそれ未満、約50%もしくはそれ未満、約40%もしくはそれ未満、約30%もしくはそれ未満、約20%もしくはそれ未満、約10%もしくはそれ未満、約5%もしくはそれ未満、約4%もしくはそれ未満、約3%もしくはそれ未満、約2.5%もしくはそれ未満、約2%もしくはそれ未満、約1.5%もしくはそれ未満、約1%もしくはそれ未満、約0.5%もしくはそれ未満、約0.25%もしくはそれ未満、約0.1%もしくはそれ未満、約0.05%もしくはそれ未満、約0.025%もしくはそれ未満、または約0.01%もしくはそれ未満である。一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約50%であるかもしくはそれより多く、約40%であるかもしくはそれより多く、約30%であるかもしくはそれより多く、約20%であるかもしくはそれより多く、約10%であるかもしくはそれより多く、約5%であるかもしくはそれより多く、約4%であるかもしくはそれより多く、約3%であるかもしくはそれより多く、約2.5%であるかもしくはそれより多く、約2%であるかもしくはそれより多く、約1.5%であるかもしくはそれより多く、約1%であるかもしくはそれより多く、約0.5%であるかもしくはそれより多く、約0.25%であるかもしくはそれより多く、約0.1%であるかもしくはそれより多く、約0.05%であるかもしくはそれより多く、約0.025%であるかもしくはそれより多く、または約0.01%であるかまたはそれより多い。一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約0.01%~約100%、例えば、約0.01%~約0.025%、約0.025%~約0.05%、約0.05%~約0.1%、約0.1%~約0.25%、約0.25%~約0.5%、約0.5%~約1%、約1%~約1.5%、約1.5%~約2%、約2%~約2.5%、約2.5%~約3%、約3%~約4%、約4%~約5%、約5%~約10%、約10%~約20%、約20%~約30%、約30%~約40%、約40%~約50%、約50%~約60%、約60%~約70%、約70%~約80%、約80%~約90%、約90%~100%未満、または約90%~約100%である。
【0069】
シークエンシングの前に、ポリヌクレオチドは、固体支持体に固定されたプライマーとハイブリダイズされ得る。プライマーは、ポリヌクレオチドの3’および/または5’末端のアダプター領域とハイブリダイズし得る。ポリヌクレオチドを、ハイブリダイズ後に(例えば、ブリッジ増幅または他の増幅技法により)増幅させて、ポリヌクレオチドシークエンシングコロニーを生成することができる。コロニー形成により、検出器が標識ヌクレオチド取り込みをコロニーごとに正確に検出することができるようなシグナル増幅が可能になる。
【0070】
本明細書に記載される方法に従って使用され得るシークエンシングするためおよび/またはシークエンシングデータを解析するための追加の方法は、米国特許出願第16/864,971号、米国特許出願第16/864,981号およびPCT出願第PCT/US2020/031196号に記載されており、これらの各々の内容は、参照により本明細書に取り込まれる。
バーコード領域設計による制御されたプライマー伸長
【0071】
バーコード領域は、生体試料由来の個々のmRNA分子を標識するために使用される人工構築物である。したがって、一部の実施形態では、バーコード領域は、ホモポリマー領域中に存在する同じ塩基を除外するように設計される。バーコード領域は、例えば、フローシークエンシング法を使用してシークエンシングされ、これにより、シークエンシングプライマーがバーコード領域にわたって伸長することが可能になる。しかし、バーコード領域は、ホモポリマー領域中に存在する塩基(例えば、アデニンまたはチミン塩基)を含まないので、ホモポリマー領域の塩基に相補的な塩基は、フローシークエンシングサイクル順序から除外され得る一方、バーコード領域は、シークエンシングされ、バーコード領域内でプライマーが伸長される。プライマーが、ホモポリマー領域の開始まで伸長されると、プライマーは、ホモポリマー領域中に存在する塩基に相補的なヌクレオチド(例えば、非終結ヌクレオチド)を使用して伸長されて、ホモポリマー領域内でプライマーが伸長し得る。ホモポリマー領域内でプライマーを伸長するために使用されるヌクレオチドは、非標識であることがあり、標識されていることがあり、または標識および非標識ヌクレオチド(例えば、非終結非標識ヌクレオチド)の混合物であることもある。一部の実施形態では、ホモポリマー領域内でプライマーを伸長するために使用されるヌクレオチドは、非標識ヌクレオチド、例えば、非終結非標識ヌクレオチドを含む。一部の実施形態では、ホモポリマー領域内でプライマーを伸長するために使用されるヌクレオチドは、非標識ヌクレオチドおよび標識ヌクレオチド(例えば、非標識非終結ヌクレオチドおよび標識非終結ヌクレオチド)を含み、ポリヌクレオチドのホモポリマー領域内でプライマーを伸長するために使用される総ヌクレオチドと比較した標識ヌクレオチドの割合は、ポリヌクレオチドのバーコード領域および/または標的領域内でプライマーを伸長するために使用される割合よりも低い。
【0072】
一部の実施形態では、ホモポリマー領域は、ポリA領域であり、バーコード領域は、アデニン塩基を除外する。一部の実施形態では、ホモポリマー領域は、ポリT領域であり、バーコード領域は、チミン塩基を除外する。
【0073】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、バーコード領域は、ホモポリマー領域中に存在する同じ塩基を除外する、ステップ;(b)ホモポリマー領域中に存在する同じ塩基の相補的塩基を欠く標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップ;(c)ホモポリマー領域中に存在する塩基に相補的なヌクレオチドを使用して、プライマーをホモポリマー領域内で伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。
【0074】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、バーコード領域は、ホモポリマー領域中に存在する同じ塩基を除外する、ステップ;(b)ホモポリマー領域中に存在する同じ塩基の相補的塩基を欠く標識非終結ヌクレオチドを使用して、バーコード領域の配列を決定するステップ;(c)ホモポリマー領域中に存在する塩基に相補的な非終結ヌクレオチドを使用して、プライマーをホモポリマー領域内で伸長するステップ;ならびに(d)標識非終結ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。
【0075】
シークエンシングプライマーは、mRNAに由来する複数のポリヌクレオチドとハイブリダイズされて、複数のハイブリダイズされた鋳型を形成する。ポリヌクレオチドは、ポリヌクレオチドの3’および/または5’末端にアダプター領域を含むことができ、アダプター領域は、シークエンシングプライマーとハイブリダイズすることができる。
【0076】
ハイブリダイズされた鋳型が形成されると、プライマーは、例えば、フローシークエンシング法を使用して、バーコード領域にわたって伸長することができる。バーコード領域のシークエンシング中に、プライマーは、ハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。しかし、規定された順序は、ホモポリマー領域中に存在する同じ塩基の相補的塩基を除外するが、プライマーは、バーコード領域内で伸長する。ヌクレオチドのタイプ(例えば、A、C、GまたはT、ホモポリマー領域中の塩基に相補的な塩基を除く)は、ハイブリダイズされた鋳型と別々に接触し得る。つまり、ヌクレオチドは、所定の順序で、1つずつ付加される。一部の実施形態では、2つまたは3つの異なるヌクレオチドのタイプが同時に使用される。DNAポリメラーゼを使用して、ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーが伸長する。相補的塩基(つまり、付加されるヌクレオチドに相補的)が新たに取り込まれる塩基の位置の反対の位置の鋳型ポリヌクレオチド鎖中に存在する場合、プライマーの鋳型依存的な伸長が起こる。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。したがって、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、バーコード領域の配列が決定されるまで、ヌクレオチドの順序を使用して繰り返され、ホモポリマー領域中に存在する同じ塩基の相補的塩基は、他のものから除外される。このようにして、プライマーは、バーコード領域にわたって伸長されるが、ホモポリマー領域中には伸長しない。したがって、プライマー伸長は、ホモポリマー領域に相補的な塩基が導入されるまで、ホモポリマー領域の開始の前に失速する。
【0077】
ホモポリマー領域の配列は、一般に、関心をひかないので、プライマーは、例えば、非標識ヌクレオチドを使用することにより、または標識(例えば、蛍光)を検出しないことにより、ヌクレオチドの取り込みの存在または非存在を検出することなく、ホモポリマー領域内で伸長することができる。標識ヌクレオチドは、一般に、より費用がかかり、プライマー伸長が失速するリスクの増加を有し、そのため、標識ヌクレオチドは、ホモポリマー領域にわたるプライマー伸長中において、(バーコード領域の配列を決定するために使用される部分と比較して)全ヌクレオチドに対するより低い割合で含まれ得るか、または排除され得る。プライマー伸長がホモポリマー領域内で失速するようなら、取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより除去することができ、ホモポリマー領域中に存在する塩基に相補的な新鮮なヌクレオチドが添加され得る。
【0078】
一部の実施形態では、プライマーは、非標識ヌクレオチドを使用してホモポリマー領域内で伸長される。一部の実施形態では、プライマーは、標識ヌクレオチドを使用してホモポリマー領域内で伸長される。一部の実施形態では、プライマーは、標識ヌクレオチドおよび非標識ヌクレオチドの両方を使用してホモポリマー領域内で伸長される。例えば、一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約90%もしくはそれ未満、約80%もしくはそれ未満、約70%もしくはそれ未満、約60%もしくはそれ未満、約50%もしくはそれ未満、約40%もしくはそれ未満、約30%もしくはそれ未満、約20%もしくはそれ未満、約10%もしくはそれ未満、約5%もしくはそれ未満、約4%もしくはそれ未満、約3%もしくはそれ未満、約2.5%もしくはそれ未満、約2%もしくはそれ未満、約1.5%もしくはそれ未満、約1%もしくはそれ未満、約0.5%もしくはそれ未満、約0.25%もしくはそれ未満、約0.1%もしくはそれ未満、約0.05%もしくはそれ未満、約0.025%もしくはそれ未満、または約0.01%もしくはそれ未満である。一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約50%であるかもしくはそれより多く、約40%であるかもしくはそれより多く、約30%であるかもしくはそれより多く、約20%であるかもしくはそれより多く、約10%であるかもしくはそれより多く、約5%であるかもしくはそれより多く、約4%であるかもしくはそれより多く、約3%であるかもしくはそれより多く、約2.5%であるかもしくはそれより多く、約2%であるかもしくはそれより多く、約1.5%であるかもしくはそれより多く、約1%であるかもしくはそれより多く、約0.5%であるかもしくはそれより多く、約0.25%であるかもしくはそれより多く、約0.1%であるかもしくはそれより多く、約0.05%であるかもしくはそれより多く、約0.025%であるかもしくはそれより多く、または約0.01%であるかまたはそれより多い。一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約0.01%~約100%、例えば、約0.01%~約0.025%、約0.025%~約0.05%、約0.05%~約0.1%、約0.1%~約0.25%、約0.25%~約0.5%、約0.5%~約1%、約1%~約1.5%、約1.5%~約2%、約2%~約2.5%、約2.5%~約3%、約3%~約4%、約4%~約5%、約5%~約10%、約10%~約20%、約20%~約30%、約30%~約40%、約40%~約50%、約50%~約60%、約60%~約70%、約70%~約80%、約80%~約90%、約90%~100%未満、または約90%~約100%である。
【0079】
バーコード領域のシークエンシングとは対照的に、標的化領域のシークエンシングは、4つすべての塩基が標的領域中に存在し得るので、ホモポリマー領域中に存在する塩基を除外することなく、4つすべての塩基(A、T、G、C)の順序付けされた使用を含むことができる。ポリメラーゼを使用して、標識ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーをホモポリマー領域の末端から標的領域中に伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
【0080】
図2Aは、バーコード領域がホモポリマー領域に存在する同じ塩基を除外する、mRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
図2Bは、グラフ形式で例示的方法を示す。ステップ202で、ホモポリマー領域、バーコード領域、および目的のmRNA領域に関連する(例えば、相補的または同一)配列を含む標的領域を有するポリヌクレオチドは、プライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成する。異なるポリヌクレオチドは、異なるバーコード領域および異なる標的領域を含有し、その結果、ポリヌクレオチドにわたる異なる標的領域は、固有分子識別子に関連付けられる。ポリヌクレオチドの3’末端は、アダプター領域を含むことができ、プライマーは、ポリヌクレオチドのアダプター領域とハイブリダイズすることができる。アダプター領域は、バーコード領域の3’末端の近位である。
図2Bに示されているように、ホモポリマー領域は、標的領域およびバーコード領域の間に位置し、バーコード領域は、ホモポリマー領域の3’末端の近位にある。しかし、バーコード領域は、ホモポリマー領域中に存在する同じ塩基を除外する。例えば、ホモポリマー領域がポリA配列である場合、異なるバーコードは、T、Cおよび/またはGの異なる配列を含有するが、Aを除外する。同様に、ホモポリマー領域がポリT配列である場合、異なるバーコードは、A、Cおよび/またはGの異なる配列を含有する。ポリヌクレオチドは、アダプター領域をさらに含むことができ、プライマーはアダプター領域とハイブリダイズする。したがって、プライマー伸長中に、ポリヌクレオチドは、プライマー鎖の伸長からの鋳型鎖として機能する。
【0081】
図2Aおよび
図2Bのステップ204で、バーコード領域の配列は、ホモポリマー領域中に存在する同じ塩基の相補的塩基を欠くヌクレオチドを使用して決定される。例えば、バーコード領域は、フローシークエンシング法を使用してシークエンシングされ得る。ヌクレオチドの少なくとも一部が標識される。一部の実施形態では、ヌクレオチドは、標識ヌクレオチドおよび非標識ヌクレオチドを含む。
【0082】
図2Aおよび
図2Bのステップ206で、プライマーは、ホモポリマー領域中に存在する塩基に相補的なヌクレオチドを使用してホモポリマー領域内で伸長される。ヌクレオチドは、標識されていることがあり、非標識であることがあり、または標識および非標識ヌクレオチドの両方の混合物であることもある。一部の実施形態では、ホモポリマー領域内のプライマー伸長中のヌクレオチド取り込みの存在または非存在は検出されない。
【0083】
プライマーがホモポリマー領域にわたって伸長されたら、標的領域の配列は、
図2Aおよび
図2B中のステップ208に示されているように、ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、決定される。ヌクレオチドの少なくとも一部が、シークエンシング中に標識される。一部の実施形態では、ヌクレオチドは、標識ヌクレオチドおよび非標識ヌクレオチドを含む。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスにより、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
ホモポリマー領域内で失速するプライマー伸長
【0084】
mRNA分子由来の目的の領域の配列を決定する方法の一部の実施形態では、ホモポリマー領域内のプライマー伸長は、ポリヌクレオチドの他の領域(例えば、バーコード領域および/または標的領域)の配列を決定する場合に使用される標識ヌクレオチドの割合と比較して、標識ヌクレオチドのより高い割合を使用することにより失速する。プライマーを伸長するために使用されるヌクレオチドは、標識ヌクレオチド、または標識および非標識ヌクレオチドの混合物を含むことができる。ヌクレオチドの全量(すなわち、標識および非標識ヌクレオチドの合計)に対する標識ヌクレオチドの割合が増加するにつれて、プライマーを伸長するために使用されるポリメラーゼが失速する可能性が増加する。したがって、プライマー伸長は、標識ヌクレオチドのより高い割合を使用して、ホモポリマー領域内で意図的に失速させることができ、取り込まれていないヌクレオチドを除去することができ、プライマー伸長を、非標識ヌクレオチドを使用して継続することができる。
【0085】
例えば、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)標識ヌクレオチドおよび非標識ヌクレオチドを、標識ヌクレオチドの全ヌクレオチドに対する第1の割合で使用して、バーコード領域の配列を決定するステップ;(c)ホモポリマー領域中に存在する塩基に相補的な標識ヌクレオチドを、標識ヌクレオチドの全ヌクレオチドに対する第2の割合で使用して、プライマーを伸長するステップであって、第2の割合は、第1の割合よりも大きく、プライマー伸長は、ホモポリマー領域内で失速する、ステップ;(d)ホモポリマー領域中に存在する塩基に相補的な非標識ヌクレオチドを使用して、プライマーをホモポリマー領域の末端まで伸長するステップ;ならびに(e)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含み得る。
【0086】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)標識非終結ヌクレオチドおよび非標識非終結ヌクレオチドを、標識非終結ヌクレオチドの全非終結ヌクレオチドに対する第1の割合で使用して、バーコード領域の配列を決定するステップ;(c)ホモポリマー領域中に存在する塩基に相補的な標識非終結ヌクレオチドを、標識非終結ヌクレオチドの全非終結ヌクレオチドに対する第2の割合で使用して、プライマーを伸長するステップであって、第2の割合は、第1の割合よりも大きく、プライマー伸長は、ホモポリマー領域内で失速する、ステップ;(d)ホモポリマー領域中に存在する塩基に相補的な非標識非終結ヌクレオチドを使用して、プライマーをホモポリマー領域の末端まで伸長するステップ;ならびに(e)標識非終結ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。
【0087】
一部の実施形態では、バーコード領域は、ホモポリマー領域の3’末端の近位にある。一部の実施形態では、バーコード領域およびホモポリマー領域の間に介在する塩基は存在しない。したがって、プライマーは、バーコード領域をわたって、必要に応じて標識ヌクレオチドの割合が増加する前にホモポリマー領域中に、伸長することができる。
【0088】
ハイブリダイズされた鋳型が形成されると、プライマーは、例えば、フローシークエンシング法を使用して、バーコード領域にわたって伸長することができる。バーコード領域のシークエンシング中に、プライマーは、ハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。ヌクレオチドのタイプ(例えば、A、C、GまたはT)が、ハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、バーコード領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復される。
【0089】
プライマーがホモポリマー領域まで伸長されたら、プライマーを伸長するために使用される標識ヌクレオチドの割合を増加させて、プライマー伸長を意図的に失速させることができる。標識ヌクレオチドの全ヌクレオチドに対する割合の増加は、ポリメラーゼが失速する可能性を増加させるので、標識ヌクレオチドの全ヌクレオチドに対する割合は、ホモポリマー領域内のプライマー伸長が失速する場合、バーコード領域および標的化領域の配列を決定するために使用される標識ヌクレオチドの割合よりも高い。つまり、標識ヌクレオチドのバーコード領域の配列を決定するために使用される全ヌクレオチドに対する割合は、標識ヌクレオチドのホモポリマー領域内のプライマーを伸長するために使用される全ヌクレオチドに対する割合よりも低く、その結果、プライマー伸長は、ホモポリマー領域内で失速する。
【0090】
ポリメラーゼが失速する可能性は、ポリメラーゼのタイプ、標識ヌクレオチドの構造(例えば、標識、または標識およびヌクレオチドの間のリンカーの構造)、および標識ヌクレオチドのプライマー伸長中に使用される全ヌクレオチドに対する割合に依存する。配列決定中(例えば、バーコード領域または標的領域の配列を決定する時)のポリメラーゼの失速は、一般に、望ましくない。しかし、ホモポリマー領域の配列が、一般に、重要でないので、一部の実施形態では、ポリメラーゼは意図的に失速される。したがって、ホモポリマー領域内でプライマーを伸長するために使用される標識ヌクレオチドの割合は、ポリマー領域内のプライマー伸長を失速させることにより、一般に、配列(例えば、バーコード領域および/または標的領域の配列)を決定する場合に使用される標識ヌクレオチドの割合よりも高い。プライマー伸長の失速を誘導または制限するために使用される標識ヌクレオチドの割合は、当業者によって容易に選択され得る。例えば、一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約90%もしくはそれ未満、約80%もしくはそれ未満、約70%もしくはそれ未満、約60%もしくはそれ未満、約50%もしくはそれ未満、約40%もしくはそれ未満、約30%もしくはそれ未満、約20%もしくはそれ未満、約10%もしくはそれ未満、約5%もしくはそれ未満、約4%もしくはそれ未満、約3%もしくはそれ未満、約2.5%もしくはそれ未満、約2%もしくはそれ未満、約1.5%もしくはそれ未満、約1%もしくはそれ未満、約0.5%もしくはそれ未満、約0.25%もしくはそれ未満、約0.1%もしくはそれ未満、約0.05%もしくはそれ未満、約0.025%もしくはそれ未満、または約0.01%もしくはそれ未満である。一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約50%であるかもしくはそれより多く、約40%であるかもしくはそれより多く、約30%であるかもしくはそれより多く、約20%であるかもしくはそれより多く、約10%であるかもしくはそれより多く、約5%であるかもしくはそれより多く、約4%であるかもしくはそれより多く、約3%であるかもしくはそれより多く、約2.5%であるかもしくはそれより多く、約2%であるかもしくはそれより多く、約1.5%であるかもしくはそれより多く、約1%であるかもしくはそれより多く、約0.5%であるかもしくはそれより多く、約0.25%であるかもしくはそれより多く、約0.1%であるかもしくはそれより多く、約0.05%であるかもしくはそれより多く、約0.025%であるかもしくはそれより多く、または約0.01%であるかまたはそれより多い。一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約0.01%~約100%、例えば、約0.01%~約0.025%、約0.025%~約0.05%、約0.05%~約0.1%、約0.1%~約0.25%、約0.25%~約0.5%、約0.5%~約1%、約1%~約1.5%、約1.5%~約2%、約2%~約2.5%、約2.5%~約3%、約3%~約4%、約4%~約5%、約5%~約10%、約10%~約20%、約20%~約30%、約30%~約40%、約40%~約50%、約50%~約60%、約60%~約70%、約70%~約80%、約80%~約90%、約90%~100%未満、または約90%~約100%である。
【0091】
プライマー伸長がホモポリマー領域内で失速した後、伸長は、ホモポリマー領域中に存在する塩基に相補的な非標識ヌクレオチドを使用して再開することができる。必要に応じて、標識および非標識ヌクレオチドの両方を使用することができるが、プライマー伸長が失速した後にホモポリマー領域内のプライマー伸長を継続するために使用される標識ヌクレオチドの割合は、プライマー伸長が失速する場合に使用される割合よりも低くなければならず、領域(例えば、バーコード領域および/または標的領域)の配列を決定する場合に使用される割合よりもさらに低くあり得る。一部の実施形態では、標識ヌクレオチドは、ホモポリマー領域内のプライマーが失速した後にホモポリマー領域内のプライマーが伸長する場合に使用されない。一部の実施形態では、プライマー伸長が失速した後にホモポリマー領域内のプライマーの伸長を継続するために使用される全ヌクレオチドの約5%未満、約4%未満、約3%未満、約2%未満、約1%未満、約1%未満、約0.5%未満、約0.1%未満、約0.05%未満、または約0.01%未満が、標識ヌクレオチドである。
【0092】
プライマー伸長が失速する可能性は、標識ヌクレオチドの割合を低減または排除することにより低減されるが、プライマー伸長は、プライマー伸長が意図的に失速された場合に含まれる割合に対して標識ヌクレオチドの割合を低減した後も、ホモポリマー領域内で依然として失速し得る。失速後にプライマー伸長を再開するために、取り込まれていないヌクレオチドおよびポリメラーゼを除去することができ(例えば、ハイブリダイズされた鋳型を洗浄することにより)、次いで、ハイブリダイズされた鋳型を、新鮮な非標識ヌクレオチドおよびポリメラーゼと再び接触させる。このプロセスは、プライマーがホモポリマー領域にわたって伸長されるまで、1、2、3、4回またはそれより多くの回数、反復され得る。
【0093】
プライマーは、標的領域に対して非標識ヌクレオチド(または少ない割合の標識ヌクレオチド)を使用して、ホモポリマー領域の末端まで伸長することができる。標的領域が目的のmRNA領域に関連する配列を含むので、シークエンシングは、プライマーが標的領域まで伸長したら、例えば、フローシークエンシング法を使用して、再開される。ポリメラーゼを使用して、標識ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーをホモポリマー領域の末端から標的領域中に伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
【0094】
図3Aは、プライマー伸長がホモポリマー領域内で失速する、mRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
図3Bは、グラフ形式で例示的方法を示す。ステップ302で、ホモポリマー領域、バーコード領域、および目的のmRNA領域に関連する(例えば、相補的または同一)配列を含む標的領域を有するポリヌクレオチドは、プライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成する。異なるポリヌクレオチドは、異なるバーコード領域および異なる標的領域を含有し、その結果、ポリヌクレオチドにわたる異なる標的領域は、固有分子識別子に関連付けられる。ポリヌクレオチドの3’末端は、アダプター領域を含むことができ、プライマーは、ポリヌクレオチドのアダプター領域とハイブリダイズすることができる。アダプター領域は、バーコード領域の3’末端の近位であり得る。
図3Bに示されているように、ホモポリマー領域は、標的領域およびバーコード領域の間に位置し、バーコード領域は、ホモポリマー領域の3’末端の近位にある。
【0095】
図3Aおよび
図3Bのステップ304で、バーコード領域の配列は、標識ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、決定される。一部の実施形態では、標識および非標識ヌクレオチドの両方が使用される。一部の実施形態では、ホモポリマー領域内のプライマー伸長中のヌクレオチド取り込みの存在または非存在は検出されない。
【0096】
図3Aおよび
図3Bのステップ306で、プライマーは、ホモポリマー領域中に存在する塩基に相補的な標識ヌクレオチドを使用して、ホモポリマー領域内で伸長され、それによって、ホモポリマー領域内のプライマー伸長が失速する。一部の実施形態では、両方のヌクレオチドは、標識および非標識ヌクレオチドの両方を含む。標識ヌクレオチドのプライマーを伸長するために使用される全ヌクレオチドに対する割合は、バーコード領域内でプライマーを伸長するために使用される割合よりも高く、したがって、ホモポリマー領域内のプライマー伸長が失速する。
【0097】
図3Aおよび
図3Bのステップ308で、ホモポリマー領域内のプライマー伸長は、プライマー伸長がホモポリマー領域内で失速した後に、ホモポリマー領域中に存在する塩基に相補的な非標識ヌクレオチドを使用して、継続する。必要に応じて、標識ヌクレオチドもホモポリマー領域内でプライマーを伸長するために使用されるが、プライマー伸長が失速した後にホモポリマー領域内のプライマー伸長を継続するために使用される標識ヌクレオチドの割合は、プライマー伸長が失速する場合に使用される割合よりも低くなければならず、領域(例えば、バーコードおよび/または標的領域)の配列を決定する場合に使用される割合よりもさらに低くあり得る。
【0098】
プライマーがホモポリマー領域にわたって伸長されたら、標的領域の配列は、
図3Aおよび
図3B中のステップ310に示されているように、ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、決定される。ヌクレオチドの少なくとも一部が、シークエンシング中に標識される。一部の実施形態では、ヌクレオチドは、標識ヌクレオチドおよび非標識ヌクレオチドを含む。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスにより、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
共通フロー長さを有するバーコード領域
【0099】
ポリヌクレオチドにわたる異なるバーコード領域および異なるバーコード領域をシークエンシングするために使用されるフローシークエンシングサイクルは、プライマーが、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように構成することができる。これは、バーコードが同じ物理的長さ(すなわち、同じ塩基の数)である必要はなく、異なるバーコード領域の、バーコード配列およびサイクル順序によって決定される、フロー長さが同じであるということのみを必要とする。領域のフロー長さは、領域の開始から領域の末端までプライマーが伸長するために必要なサイクルの数である。このようにして、プライマーは、同じフローサイクル内のホモポリマー領域の開始まで伸長し、その結果、ホモポリマー領域内のプライマー伸長は、ポリヌクレオチドにわたって同じ時に開始される。
【0100】
一部の実施形態では、バーコード領域は、ホモポリマー領域の3’末端の近位にある。一部の実施形態では、バーコード領域およびホモポリマー領域の間に介在する塩基は存在しない。バーコード領域中の最後の塩基は、一般に、ホモポリマー領域内の塩基とは異なる。
【0101】
サイクルおよびサイクルの順序は、バーコード領域のシークエンシングの開始前に、予め決定することができる。しかし、バーコード領域のシークエンシング中に使用されるサイクルは、同じ(すなわち、対称サイクル)または異なる(すなわち、非対称サイクル)ことがある。さらに、所与のサイクルは、4つの異なる塩基(すなわち、A、T、C、G)をすべて含む必要はないが、2つ、3つまたは4つの異なる塩基を含むことができる。つまり、サイクルは、対称サイクルまたは非対称サイクルであり得る。しかし、上記で論じられたように、塩基は同じサイクル内で反復されない。
【0102】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、標的領域は、固有のバーコード領域に関連付けられる、ステップ;(b)複数の所定のサイクルで標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップであって、プライマーは、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように、所定のサイクルおよびポリヌクレオチドのバーコード領域が構成されている、ステップ;(c)非標識ヌクレオチドを使用して、プライマーをホモポリマー領域内で伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。
【0103】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法があり、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、標的領域は、固有のバーコード領域に関連付けられる、ステップ;(b)複数の所定のサイクルで標識非終結ヌクレオチドを使用して、バーコード領域の配列を決定するステップであって、プライマーは、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように、所定のサイクルおよびポリヌクレオチドのバーコード領域が構成されている、ステップ;(c)非標識非終結ヌクレオチドを使用して、プライマーをホモポリマー領域内で伸長するステップ;ならびに(d)標識非終結ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。
【0104】
ハイブリダイズされた鋳型が形成されると、プライマーは、例えば、フローシークエンシング法を使用して、バーコード領域にわたって伸長することができる。バーコード領域のシークエンシング中に、プライマーは、ハイブリダイズされた鋳型をヌクレオチド(標識ヌクレオチド、一部の実施形態では、非標識ヌクレオチドを含む)と接触させることによって、伸長される。異なるヌクレオチドのタイプ(例えば、A、C、GまたはT)が、所与のサイクル内でハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。バーコード領域は、複数の所定のサイクルを使用してシークエンシングされる。バーコード領域をシークエンシングするために使用されるサイクルは、ヌクレオチドのタイプの同じ(すなわち、対称)または異なる(すなわち、非対称)の順序を有することができ、これは、必要に応じて別々に使用される。このプロセスは、バーコード領域の配列が決定されるまで、所定のサイクルを反復する。所定のサイクルおよびバーコード領域の配列は、プライマーが、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように構成される。これは、任意の所与のポリヌクレオチドについてのホモポリマー領域中へのプライマーの伸長が、複数のポリヌクレオチドのすべてについて、ホモポリマー領域へのプライマーの伸長なしで起こらないように、プライマー伸長を制御する。
【0105】
プライマーの伸長が、バーコード領域の末端で、プライマーがホモポリマー領域中に伸長する前に制御されるので、ホモポリマー領域内でプライマーを伸長するために使用される標識ヌクレオチドの割合を制御することができる。例えば、ホモポリマー領域内のプライマー伸長は、バーコード領域および/または標的領域内でプライマーを伸長するために使用される割合とは異なる標識ヌクレオチドの割合を使用することができる。一部の実施形態では、非標識ヌクレオチドは、ホモポリマー領域内でプライマーを伸長するために使用される。一部の実施形態では、標識ヌクレオチドは、ホモポリマー領域内でプライマーを伸長するために使用される。一部の実施形態では、標識および非標識ヌクレオチドの両方は、ホモポリマー領域内でプライマーを伸長するために使用される。一部の実施形態では、標識ヌクレオチドは、ホモポリマー領域内のプライマーが失速した後にホモポリマー領域内のプライマーが伸長する場合に使用されない。一部の実施形態では、全ヌクレオチドの約5%未満、約4%未満、約3%未満、約2%未満、約1%未満、約1%未満、約0.5%未満、約0.1%未満、約0.05%未満、または約0.01%未満が、ホモポリマー領域内に伸長するために使用される。
【0106】
プライマー伸長が失速する可能性は、標識ヌクレオチドの割合を低減または排除することにより低減されるが、プライマー伸長は、プライマー伸長が意図的に失速された場合に含まれる割合に対して標識ヌクレオチドの割合を低減した後も、ホモポリマー領域内で依然として失速し得る。失速後にプライマー伸長を再開するために、取り込まれていないヌクレオチドおよびポリメラーゼを除去することができ(例えば、ハイブリダイズされた鋳型を洗浄することにより)、次いで、ハイブリダイズされた鋳型を、新鮮な非標識ヌクレオチドおよびポリメラーゼと再び接触させる。このプロセスは、プライマーがホモポリマー領域にわたって伸長されるまで、1、2、3、4回またはそれより多くの回数、反復され得る。
【0107】
プライマーは、ホモポリマー領域の末端までおよび標的領域の開始まで伸長することができる。標的領域が目的のmRNA領域に関連する配列を含むので、標的領域の配列が、例えば、フローシークエンシング法を使用して、決定される。ポリメラーゼを使用して、標識ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーをホモポリマー領域の末端から標的領域中に伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
【0108】
図4Aは、フローサイクルおよびポリヌクレオチドの異なるバーコード領域が、プライマーが、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように構成される、mRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
図4Bは、グラフ形式で、同じフロー長さであるが異なるバーコード領域の配列を有する複数のポリヌクレオチドによる、例示的方法を示す。ステップ402で、ホモポリマー領域、バーコード領域、および目的のmRNA領域に関連する(例えば、相補的または同一)配列を含む標的領域を有するポリヌクレオチドは、プライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成する。異なるポリヌクレオチドは、異なるバーコード領域および異なる標的領域を含有し、その結果、ポリヌクレオチドにわたる異なる標的領域は、固有分子識別子に関連付けられる。ポリヌクレオチドの3’末端は、アダプター領域を含むことができ、プライマーは、ポリヌクレオチドのアダプター領域とハイブリダイズすることができる。アダプター領域は、バーコード領域の3’末端の近位である。
図4Bの402で示されているように、ホモポリマー領域は、標的領域およびバーコード領域の間に位置し、バーコード領域は、ホモポリマー領域の3’末端の近位にある。
【0109】
図4Aのステップ404で、バーコード領域の配列は、標識ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、決定される。一部の実施形態では、標識および非標識ヌクレオチドの両方が使用される。所定のサイクルおよびポリヌクレオチドの異なるバーコード領域は、プライマーが、ホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたってバーコード領域の末端まで伸長されるように構成される。
【0110】
図4Bを見ると、404aで、ポリヌクレオチドとハイブリダイズされたプライマーは、ハイブリダイズされた鋳型を、必要に応じて別々に使用される異なる標識ヌクレオチドのタイプと接触させることにより、バーコード領域内で伸長される。ポリメラーゼは、相補的塩基が鋳型鎖中に存在する場合、鋳型依存的にプライマーを伸長する。取り込まれていないヌクレオチドは除去され、取り込まれたヌクレオチドの存在または非存在が検出されて、シークエンシング情報が得られる。このプロセスを、所定のサイクルを使用して反復して、プライマーがホモポリマー領域の開始まで伸長されるまで、プライマー伸長を継続する。
図4Bの404bで示されているように、プライマーは、プライマーがホモポリマー領域中に伸長される前に、複数のポリヌクレオチドにわたるバーコード領域にわたって伸長される。
【0111】
プライマーは、プライマーが異なるバーコード領域にわたって伸長されるまで、ポリヌクレオチドにわたるホモポリマー領域内に伸長されない。しかし、プライマーがバーコード領域にわたって伸長されたら、
図4Aおよび
図4Bの406に示されているように、プライマーは、ヌクレオチドを使用してホモポリマー領域内で伸長することができる。ヌクレオチドは、標識されていることがあり、非標識であることがあり、または標識および非標識ヌクレオチドの混合物であることもある。ホモポリマー領域の配列は、一般に、関心をひかないので、プライマーは、例えば、非標識ヌクレオチドを使用することにより、または標識(例えば、蛍光)を検出しないことにより、ヌクレオチドの取り込みの存在または非存在を検出することなく、ホモポリマー領域内で伸長することができる。標識ヌクレオチドは、一般に、より費用がかかり、プライマー伸長が失速するリスクの増加を有し、そのため、標識ヌクレオチドは、ホモポリマー領域にわたるプライマー伸長中において、(バーコード領域の配列を決定するために使用される部分と比較して)全ヌクレオチドに対するより低い割合で含まれ得るか、または排除され得る。プライマー伸長がホモポリマー領域内で失速するようなら、取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより除去することができ、ホモポリマー領域中に存在する塩基に相補的な新鮮なヌクレオチドが添加され得る。
【0112】
プライマーがホモポリマー領域にわたって伸長されたら、標的領域の配列は、
図4Aおよび
図4B中のステップ410に示されているように、ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、決定される。ヌクレオチドの少なくとも一部が、シークエンシング中に標識される。一部の実施形態では、ヌクレオチドは、標識ヌクレオチドおよび非標識ヌクレオチドを含む。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスにより、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
二重プライマーシークエンシング
【0113】
一部の実施形態では、2つのプライマーを使用して、mRNA分子由来の目的の領域の配列を決定し、第1のプライマーは、バーコード領域の配列まで伸長され、第2のプライマーは、標的領域の配列まで伸長される。第2のプライマーは、ポリヌクレオチドのホモポリマー領域内でハイブリダイズして、ホモポリマー領域内のプライマー伸長を回避または制限する。プライマーのハイブリダイゼーションおよび伸長の順序は、可逆的である。つまり、バーコード領域の配列を決定するための第1のプライマーの伸長は、標的領域の配列を決定するための第2のプライマーの伸長の前または後に起こり得る。したがって、下記で提供される「第1のプライマー」および「第2のプライマー」の記載は、明確にするためにのみ提供され、プライマーの配列は逆にすることができる。
【0114】
第2のプライマーは、標的領域を含むポリヌクレオチドのホモポリマー中の塩基に相補的な塩基を含むホモポリマー領域を含む。例えば、標的領域を含むポリヌクレオチドのホモポリマー領域がポリT領域を含む場合、第2のプライマーはポリA領域を含むことができ、または標的領域を含むポリヌクレオチドのホモポリマー領域がポリA領域である場合、第2のプライマーはポリT領域を含むことができる。これにより、第2のプライマーが、ポリヌクレオチドのホモポリマー領域と効率的にハイブリダイズすることが可能になる。プライマーのホモポリマー領域は、ポリヌクレオチドのホモポリマー領域より、長い、短い、またはおよそ同じ長さであり得る。
【0115】
一部の実施形態では、第2のプライマーの3’末端は、複数のポリヌクレオチドにわたる標的領域を含むポリヌクレオチド中のホモポリマー領域の5’末端とハイブリダイズしない。したがって、ホモポリマー領域とハイブリダイズされるプライマーは、ホモポリマー領域内で伸長することができ、それによって、プライマーの3’末端をポリヌクレオチドのホモポリマー領域の5’末端にアラインメントする。プライマーは、標識ヌクレオチド、非標識ヌクレオチドまたは標識ヌクレオチドの混合物を使用して、ホモポリマー領域にわたって伸長することができる。プライマー伸長がホモポリマー領域内で失速するようなら、取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより除去することができ、ホモポリマー領域中に存在する塩基に相補的な新鮮なヌクレオチドが添加され得る。プライマーがポリヌクレオチドのホモポリマー領域にわたって伸長されたら、ポリヌクレオチドの標的領域は、プライマーを標的領域内でさらに伸長することによって、シークエンシングすることができる。
【0116】
一部の実施形態では、第2のプライマーは、標的領域および3’アンカーを含むポリヌクレオチドのホモポリマー中の塩基に相補的な塩基を含むホモポリマー領域を含む。3’アンカーは、第2のプライマーのホモポリマー領域の3’末端がポリヌクレオチドのホモポリマー領域の5’末端とハイブリダイズする可能性を増加させる。3’アンカーは、例えば、第2のプライマーのホモポリマー領域中に存在する塩基以外の塩基を含み得る。したがって、可変塩基は、ポリヌクレオチドのホモポリマー領域の5’末端の後の最初の塩基(すなわち、標的領域の最初の塩基)とハイブリダイズすることができる。例えば、ポリヌクレオチドのホモポリマー領域がポリA配列である場合、第2のプライマーは、5’-(ポリT)-V-3’[ここで、Vは、T以外の任意の塩基(すなわち、G、CまたはA)である]を含み得る。
【0117】
一部の実施形態では、第2のプライマーは、標的領域および5’アンカーを含むポリヌクレオチドのホモポリマー中の塩基に相補的な塩基を含むホモポリマー領域を含む。必要に応じて、第2のプライマーは、3’アンカーおよび5’アンカーの両方を含み得る。5’アンカーは、例えば、ポリヌクレオチドのアダプター配列に相補的なポリヌクレオチド配列(例えば、バーコード領域の3’末端の近位に位置し得る)を含むことができる。5’アンカーにより、第2のプライマーのホモポリマー領域は、ホモポリマー領域の3’末端とより近くでハイブリダイズする可能性がより高くなる。ホモポリマー領域および5’アンカーは、リンカー、例えば、PEGホスホラミダイトリンカーまたは脱塩基デオキシリボースもしくは脱塩基リボースリンカーによって、連結され得る。リンカーの長さは、例えば、バーコード領域とおよそ同じ長さ、バーコード領域より長く、またはバーコード領域よりも短くあり得る。
【0118】
第1のプライマーは、バーコード領域、およびバーコード領域の3’末端の近位の位置で標的領域を含むポリヌクレオチドとハイブリダイズすることができる。例えば、ポリヌクレオチドは、3’アダプター領域を含むことができ、第1のプライマーはアダプター領域とハイブリダイズすることができる。第1のプライマーを、バーコード領域内で伸長して、バーコード領域の配列を決定する。
【0119】
一部の実施形態では、第1のプライマーは、第2のプライマーがポリヌクレオチドとハイブリダイズする前に、ハイブリダイズされた鋳型から除去される。プライマーは、例えば、高pH溶液、例えば、水酸化ナトリウム溶液を使用して、除去することができる。一部の実施形態では、第1のプライマーは、第2のプライマーがポリヌクレオチドとハイブリダイズする前に、ハイブリダイズされた鋳型から除去されない。
【0120】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドを第1のプライマーとハイブリダイズして、第1の複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップ;(c)複数のポリヌクレオチドを第2のプライマーとハイブリダイズして、第2の複数のハイブリダイズされた鋳型を形成するステップであって、第2のプライマーは、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の連続しかつ同一の塩基を含むホモポリマー領域を含む、ステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。一部の実施形態では、第2のプライマーは、ヌクレオチド(標識されていることがあり、非標識であることがあり、またはそれらの混合物であることもある)を使用して、ホモポリマー領域内で伸長される。一部の実施形態では、第1のプライマーは、第2のプライマーがポリヌクレオチドとハイブリダイズされる前に、ポリヌクレオチドとハイブリダイズされる。一部の実施形態では、第2のプライマーは、第1のプライマーがポリヌクレオチドとハイブリダイズされる前に、ポリヌクレオチドとハイブリダイズされる。
【0121】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドを第1のプライマーとハイブリダイズして、第1の複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)標識非終結ヌクレオチドを使用して、バーコード領域の配列を決定するステップ;(c)複数のポリヌクレオチドを第2のプライマーとハイブリダイズして、第2の複数のハイブリダイズされた鋳型を形成するステップであって、第2のプライマーは、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の連続しかつ同一の塩基を含むホモポリマー領域を含む、ステップ;ならびに(d)標識非終結ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。一部の実施形態では、第2のプライマーは、非終結ヌクレオチド(標識されていることがあり、非標識であることがあり、またはそれらの混合物であることもある)を使用して、ホモポリマー領域内で伸長される。一部の実施形態では、第1のプライマーは、第2のプライマーがポリヌクレオチドとハイブリダイズされる前に、ポリヌクレオチドとハイブリダイズされる。一部の実施形態では、第2のプライマーは、第1のプライマーがポリヌクレオチドとハイブリダイズされる前に、ポリヌクレオチドとハイブリダイズされる。
【0122】
図5Aは、2つのプライマーを使用するmRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
図5Bは、グラフ形式で例示的方法を示す。ステップ502で、ホモポリマー領域、バーコード領域、および目的のmRNA領域に関連する(例えば、相補的または同一)配列を含む標的領域を有するポリヌクレオチドは、第1のプライマーとハイブリダイズして、第1のハイブリダイズされた鋳型を形成する。異なるポリヌクレオチドは、異なるバーコード領域および異なる標的領域を含有し、その結果、ポリヌクレオチドにわたる異なる標的領域は、固有分子識別子に関連付けられる。ポリヌクレオチドの3’末端は、アダプター領域を含むことができ、プライマーは、ポリヌクレオチドのアダプター領域とハイブリダイズすることができる。アダプター領域は、バーコード領域の3’末端の近位であり得る。
図5Bに示されているように、ホモポリマー領域は、標的領域およびバーコード領域の間に位置し、バーコード領域は、ホモポリマー領域の3’末端の近位にある。
【0123】
図5Aおよび
図5Bのステップ504で、バーコード領域の配列は、例えば、フローシークエンシング法を使用して、標識ヌクレオチドを使用して第1のプライマーを伸長することにより、決定される。標識ヌクレオチドは、必要に応じて、非標識ヌクレオチドと組み合わされる。バーコード領域のシークエンシング中に、プライマーは、ハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。ヌクレオチドのタイプ(例えば、A、C、GまたはT)が、ハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、バーコード領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復される。
【0124】
図5Aおよび
図5Bのステップ506で、ポリヌクレオチドは、ポリヌクレオチドのホモポリマー領域中に存在する塩基に相補的な塩基を有するホモポリマー領域を含む第2のプライマーとハイブリダイズされ、それによって、第2のハイブリダイズされた鋳型を形成する。必要に応じて、第1のプライマーは、第2のプライマーがポリヌクレオチドとハイブリダイズする前に除去される。一部の実施形態では、第2のプライマーは、ステップ508に示されているように、ホモポリマー領域内で伸長され、その結果、プライマーの3’末端がポリヌクレオチドのホモポリマー領域の5’末端に位置する。これは、例えば、プライマーの鋳型依存的伸長により行われ得る。ホモポリマー領域中に存在する塩基に相補的な非標識および/または標識ヌクレオチドは、第2のハイブリダイズされた鋳型と接触され、例えば、ポリメラーゼを使用して、第2のプライマーの末端に取り込まれることができ、それによって、第2のプライマーが伸長する。第2のプライマーは、プライマーの3’末端が、例えば3’アンカーの使用により、ハイブリダイゼーションにおいてポリヌクレオチドのホモポリマー領域の5’末端に位置するように構成され得るので、ステップ508は常に必要というわけではない。
【0125】
図5Aおよび
図5Bのステップ510で示されているように、第2のプライマーは、標識(および必要に応じて非標識)ヌクレオチドを使用して、例えば、本明細書に記載されるフローシークエンシング法を使用して、標的領域中に伸長され、それにより、標的領域の配列を決定する。バーコード領域のシークエンシング中に、プライマーは、ハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。ヌクレオチドのタイプ(例えば、A、C、GまたはT)が、必要に応じて、第2のハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドを第2のプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、第2のプライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
【0126】
図5Cは、ポリヌクレオチドとハイブリダイズされる2つのプライマーの配列が、
図5Aに示されている例示的方法と比較して逆である、2つのプライマーを使用するmRNA由来の目的の領域の配列を決定するための別の例示的方法のフローチャートを示す。
図5Dは、グラフ形式で例示的方法を示す。
図5Cおよび
図5Dのステップ512で、ホモポリマー領域、バーコード領域、および目的のmRNA領域に関連する(例えば、相補的または同一)配列を含む標的領域を有することにより、第1のプライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成する。第1のプライマーは、ポリヌクレオチドのホモポリマー領域中に存在する塩基に相補的な塩基を有するホモポリマー領域を含む。一部の実施形態では、第2のプライマーは、ステップ514に示されているように、ホモポリマー領域内で伸長され、その結果、プライマーの3’末端がポリヌクレオチドのホモポリマー領域の5’末端に位置する。これは、例えば、プライマーの鋳型依存的伸長により行われ得る。ホモポリマー領域中に存在する塩基に相補的な非標識および/または標識ヌクレオチドは、第2のハイブリダイズされた鋳型と接触され、例えば、ポリメラーゼを使用して、第2のプライマーの末端に取り込まれることができ、それによって、第1のプライマーが伸長する。
【0127】
図5Cおよび
図5Dのステップ516で示されているように、第1のプライマーは、標識(および必要に応じて非標識)ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、標的領域中に伸長され、それにより、標的領域の配列を決定する。標的領域のシークエンシング中に、第1のプライマーは、第1のハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。ヌクレオチドのタイプ(例えば、A、C、GまたはT)が、第1のハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくはそれより多くの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドを第1のプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、第1のプライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
【0128】
図5Cおよび
図5Dのステップ518で、ポリヌクレオチドは、第2のプライマーとハイブリダイズされて、第2のハイブリダイズされた鋳型を形成する。必要に応じて、伸長した第1のプライマーは、第2のプライマーがポリヌクレオチドとハイブリダイズされる前に除去される。異なるポリヌクレオチドは、異なるバーコード領域および異なる標的領域を含有し、その結果、ポリヌクレオチドにわたる異なる標的領域は、固有分子識別子に関連付けられる。ポリヌクレオチドの3’末端は、アダプター領域を含むことができ、プライマーは、ポリヌクレオチドのアダプター領域とハイブリダイズすることができる。アダプター領域は、バーコード領域の3’末端の近位であり得る。
図5Dに示されているように、ホモポリマー領域は、標的領域およびバーコード領域の間に位置し、バーコード領域は、ホモポリマー領域の3’末端の近位にある。
【0129】
図5Cおよび
図5Dのステップ520で、バーコード領域の配列は、例えば、フローシークエンシング法を使用して、標識ヌクレオチドを使用して第1のプライマーを伸長することにより、決定される。標識ヌクレオチドは、必要に応じて、非標識ヌクレオチドと組み合わされる。バーコード領域のシークエンシング中に、第2のプライマーは、第2のハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。ヌクレオチドのタイプ(例えば、A、C、GまたはT)が、ハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、バーコード領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復される。
切断可能なリンカーを有するプライマー
【0130】
一部の実施形態では、切断可能なリンカーを有するプライマーを使用して、mRNA分子由来の目的の領域の配列を決定する。プライマーは、第1のプライマーセグメント、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の塩基を含むホモポリマー領域を含む第2のプライマーセグメント、ならびに第1のプライマーセグメントおよび第2のプライマーセグメントの間の切断可能なリンカーを含む。第1のプライマーセグメントは、プライマーの3’末端の近位にあり、第2のプライマーセグメントは、プライマーの5’末端の近位にある。
【0131】
第2のプライマーセグメントを伸長して、例えば、フローシークエンシング法を使用してポリヌクレオチドの標的領域をシークエンシングすることができる。本明細書中でさらに論じられるように、一部の実施形態では、第2のプライマーセグメントは、プライマーが標的領域中に伸長し、プライマー領域の配列を決定する前に、ポリヌクレオチドのホモポリマー領域の末端まで伸長される。次いで、切断可能なリンカーは切断され得、プライマーの第1のセグメントを伸長して、例えば、フローシークエンシング法を使用してポリヌクレオチドのバーコード領域をシークエンシングすることができる。
【0132】
第2のプライマーセグメントは、標的領域を含むポリヌクレオチドのホモポリマー中の塩基に相補的な塩基を含むホモポリマー領域を含む。例えば、標的領域を含むポリヌクレオチドのホモポリマー領域がポリT領域を含む場合、第2のプライマーはポリA領域を含むことができ、または標的領域を含むポリヌクレオチドのホモポリマー領域がポリA領域である場合、第2のプライマーはポリT領域を含むことができる。これにより、第2のプライマーが、ポリヌクレオチドのホモポリマー領域と効率的にハイブリダイズすることが可能になる。プライマーのホモポリマー領域は、ポリヌクレオチドのホモポリマー領域より、長い、短い、またはおよそ同じ長さであり得る。
【0133】
一部の実施形態では、第2のプライマーセグメントの3’末端は、複数のポリヌクレオチドにわたる標的領域を含むポリヌクレオチド中のホモポリマー領域の5’末端とハイブリダイズしない。第2のプライマーセグメントは、ホモポリマー領域内で伸長することができ、それによって、プライマーの3’末端をポリヌクレオチドのホモポリマー領域の5’末端にアラインメントする。第2のプライマーセグメントは、標識ヌクレオチド、非標識ヌクレオチドまたは標識ヌクレオチドの混合物を使用して、ホモポリマー領域にわたって伸長することができる。プライマー伸長がホモポリマー領域内で失速するようなら、取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより除去することができ、ホモポリマー領域中に存在する塩基に相補的な新鮮なヌクレオチドが添加され得る。第2のプライマーセグメントがポリヌクレオチドのホモポリマー領域にわたって伸長されたら、ポリヌクレオチドの標的領域は、プライマーを標的領域内でさらに伸長することによって、シークエンシングすることができる。
【0134】
一部の実施形態では、第2のプライマーセグメントは、標的領域および3’アンカーを含むポリヌクレオチドのホモポリマー中の塩基に相補的な塩基を含むホモポリマー領域を含む。3’アンカーは、第2のプライマーセグメントのホモポリマー領域の3’末端がポリヌクレオチドのホモポリマー領域の5’末端とハイブリダイズする可能性を増加させる。3’アンカーは、例えば、第2のプライマーセグメントのホモポリマー領域中に存在する塩基以外の塩基を含み得る。したがって、可変塩基は、ポリヌクレオチドのホモポリマー領域の5’末端の後の最初の塩基(すなわち、標的領域の最初の塩基)とハイブリダイズすることができる。例えば、ポリヌクレオチドのホモポリマー領域がポリA配列である場合、第2のプライマーは、5’-(ポリT)-V-3’[ここで、Vは、T以外の任意の塩基(すなわち、G、CまたはA)である]を含み得る。
【0135】
切断可能なリンカーは、切断を制御することができる、第1のプライマーセグメントおよび第2のプライマーセグメントを共有結合的に連結する、任意の好適なリンカーであり得る。一部の実施形態では、切断可能なリンカーは、ウラシル(U)塩基を含むポリヌクレオチド配列を含む。ウラシル塩基は、ウラシル特異的切断酵素(例えば、ウラシル特異的除去試薬(USER(登録商標))酵素、New England BioLabsから入手可能)を使用して、制御可能に切断することができる。ウラシル塩基はRNAに固有であるので、DNAポリヌクレオチドまたはプライマーを切断するリスクはない。
【0136】
第1のプライマーセグメントは、バーコード領域の5’末端の近位にある配列(例えば、アダプター配列)とハイブリダイズするように構成される。プライマーが切断されたら、第1のプライマーセグメントの3’末端を伸長して、例えば、フローシークエンシング法を使用してバーコード領域の配列を決定することができる。
【0137】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、プライマーは、第1のプライマーセグメント、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の塩基を含むホモポリマー領域を含む第2のプライマーセグメント、および第1のプライマーセグメントおよび第2のプライマーセグメントの間に切断可能なリンカーを含む、ステップ;(b)標識ヌクレオチドを使用して、標的領域の配列を決定するステップ;(c)切断可能なリンカーでプライマーを切断するステップ;ならびに(d)標識ヌクレオチドを使用して、バーコード領域の配列を決定するステップを含む。
【0138】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、バーコード領域、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含み、プライマーは、第1のプライマーセグメント、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の塩基を含むホモポリマー領域を含む第2のプライマーセグメント、および第1のプライマーセグメントおよび第2のプライマーセグメントの間に切断可能なリンカーを含む、ステップ;(b)標識非終結ヌクレオチドを使用して、標的領域の配列を決定するステップ;(c)切断可能なリンカーでプライマーを切断するステップ;ならびに(d)標識非終結ヌクレオチドを使用して、バーコード領域の配列を決定するステップを含む。
【0139】
図6Aは、切断可能なプライマーを使用するmRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
図6Bは、グラフ形式で例示的方法を示す。ステップ602で、ホモポリマー領域、バーコード領域、および目的のmRNA領域に関連する(例えば、相補的または同一)配列を含む標的領域を有するポリヌクレオチドは、プライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成する。プライマーは、第1のプライマーセグメント、ポリヌクレオチドのホモポリマー領域中の塩基に相補的な複数の塩基を含むホモポリマー領域を含む第2のプライマーセグメント、ならびに第1のプライマーセグメントおよび第2のプライマーセグメントの間の切断可能なリンカーを含む。異なるポリヌクレオチドは、異なるバーコード領域および異なる標的領域を含有し、その結果、ポリヌクレオチドにわたる異なる標的領域は、固有分子識別子に関連付けられる。ポリヌクレオチドの3’末端は、アダプター領域を含むことができ、第1のプライマーセグメントは、ポリヌクレオチドのアダプター領域とハイブリダイズすることができる。アダプター領域は、バーコード領域の3’末端の近位である。
図6Bに示されているように、ホモポリマー領域は、標的領域およびバーコード領域の間に位置し、バーコード領域は、ホモポリマー領域の3’末端の近位にある。
【0140】
一部の実施形態では、第2のプライマーセグメントは、ステップ604に示されているように、ホモポリマー領域内で伸長され、その結果、プライマーの3’末端がポリヌクレオチドのホモポリマー領域の5’末端に位置する。これは、例えば、プライマーの鋳型依存的伸長により行われ得る。ホモポリマー領域中に存在する塩基に相補的な非標識および/または標識ヌクレオチドは、第2のハイブリダイズされた鋳型と接触され、例えば、ポリメラーゼを使用して、第2のプライマーの末端に取り込まれることができ、それによって、第2のプライマーが伸長する。第2のプライマーは、プライマーの3’末端が、例えば3’アンカーの使用により、ハイブリダイゼーションにおいてポリヌクレオチドのホモポリマー領域の5’末端に位置するように構成され得るので、ステップ504は常に必要というわけではない。
【0141】
図6Aおよび
図6Bのステップ606で示されているように、プライマーは、標識(および必要に応じて非標識)ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、標的領域中に伸長され、それにより、標的領域の配列を決定する。標的領域のシークエンシング中に、プライマーは、ハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。ヌクレオチドのタイプ(例えば、A、C、GまたはT)が、第1のハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドを第1のプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、第1のプライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
【0142】
図6Aおよび
図5Bのステップ608で、プライマーは、切断可能なリンカーで切断される。切断可能なリンカーは、好適な切断試薬と接触させることができ、これは、第1のプライマーセグメントの3’末端を自由にする。必要に応じて、第2のプライマーセグメントは、例えば、高pH溶液(例えば、水酸化ナトリウムを含有する溶液)を使用して除去される。
【0143】
図6Aおよび
図6Bのステップ610で、バーコード領域の配列は、例えば、フローシークエンシング法を使用して、標識ヌクレオチドを使用して第1のプライマーセグメントを伸長することにより、決定される。標識ヌクレオチドは、必要に応じて、非標識ヌクレオチドと組み合わされる。バーコード領域のシークエンシング中に、第2のプライマーは、第2のハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。ヌクレオチドのタイプ(例えば、A、C、GまたはT)が、ハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、バーコード領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復される。
失速したプライマー伸長の再開
【0144】
長いホモポリマー領域内のプライマー伸長は、プライマー伸長の失速を生じ得る。ポリメラーゼが、一般に、ネイティブまたはネイティブに近いヌクレオチドを取り込むためにより良く適合されるので、プライマー伸長の失速の可能性は、標識ヌクレオチドの全ヌクレオチドに対する割合の増加につれて大きくなる。それにもかかわらず、プライマー伸長は、十分に長いホモポリマー領域、例えば、一部のmRNA分子のポリA領域の場合、ネイティブヌクレオチドがプライマー伸長のために使用される場合でさえ失速する傾向がある。
【0145】
取り込まれていないヌクレオチドを除去すること、およびハイブリダイズされた鋳型を新鮮なヌクレオチドと接触させることにより、プライマー伸長を再開することができる。一部のケースでは、ハイブリダイズされた鋳型は、新鮮なヌクレオチドと接触させる。このプロセスは、プライマーがホモポリマー領域をわたって完全に伸長されることを確実にするために、1、2、3、4、5回またはそれより多くの回数、反復され得る。この戦略は、本明細書に記載される他の戦略と組み合わせて利用されてもよく、プライマーの伸長は、ホモポリマー領域内のプライマーの伸長中に失速し得る。例えば、プライマー伸長は、ポリヌクレオチドがバーコード領域(例えば、ホモポリマー領域中に存在する塩基を除外するバーコード領域、複数のポリヌクレオチド中の他のバーコード領域と共通するフロー長さを有するバーコード領域)を有する場合、プライマー伸長が、ホモポリマー領域内で意図的に失速される場合(例えば、プライマーを伸長するために使用される標識ヌクレオチドの割合を増加させることにより)、または二重プライマーもしくは切断可能なプライマー系を使用する場合に、ホモポリマー領域内で失速および再開し得る。
【0146】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)同じ塩基のヌクレオチドを使用して、プライマーをホモポリマー領域中に伸長するステップであって、プライマーは、ホモポリマー領域内で失速し、取り込まれていないヌクレオチドを除去する、ステップ;(c)ステップ(b)を1または複数回反復して、プライマーがホモポリマー領域にわたって伸長するステップ;ならびに(d)標識ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。
【0147】
一部の実施形態では、mRNA分子由来の目的の領域の配列を決定する方法は、(a)mRNAに由来する複数のポリヌクレオチドをプライマーとハイブリダイズして、複数のハイブリダイズされた鋳型を形成するステップであって、ポリヌクレオチドは、複数の連続しかつ同一の塩基を含むホモポリマー領域、およびmRNA分子由来の目的の領域に関連する配列を含む標的領域を含む、ステップ;(b)同じ塩基の非終結ヌクレオチドを使用して、プライマーをホモポリマー領域中に伸長するステップであって、プライマーは、ホモポリマー領域内で失速し、取り込まれていない非終結ヌクレオチドを除去する、ステップ;(c)ステップ(b)を1または複数回反復して、プライマーがホモポリマー領域にわたって伸長するステップ;ならびに(d)標識非終結ヌクレオチドを使用して、標的領域の配列を決定するステップを含む。
【0148】
図7Aは、プライマー伸長がポリヌクレオチドのホモポリマー領域内で失速し、再開される、mRNA分子由来の目的の領域の配列を決定するための例示的方法のフローチャートを示す。
図7Bは、グラフ形式で例示的方法を示す。下記に記載される例示的方法は、ホモポリマー領域および標的領域を有するポリヌクレオチドを参照するが、ポリヌクレオチドは、追加の領域、例えば、ホモポリマー領域の3’末端の近位にあるバーコード領域をさらに含み得る。
【0149】
ステップ702で、ホモポリマー領域、および目的のmRNA領域に関連する(例えば、相補的または同一)配列を含む標的領域(および必要に応じてバーコード領域、これは
図7B中に示されない)を有するポリヌクレオチドは、プライマーとハイブリダイズされて、ハイブリダイズされた鋳型を形成する。ポリヌクレオチドの3’末端は、アダプター領域を含むことができ、プライマーは、ポリヌクレオチドのアダプター領域とハイブリダイズすることができる。アダプター領域は、存在する場合、バーコード領域の3’末端、またはホモポリマー領域の3’末端の近位にあり得る。
【0150】
バーコード領域が存在する場合、バーコード領域の配列は、ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、決定することができる。バーコード領域のシークエンシング中に、プライマーは、ハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。ヌクレオチドのタイプ(例えば、A、C、GまたはT)が、ハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーが伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、バーコード領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復される。
【0151】
図7Aおよび
図7Bのステップ704で、プライマーは、ホモポリマー領域中に存在する塩基に相補的なヌクレオチドを使用してホモポリマー領域内で伸長される。一部の実施形態では、ヌクレオチドは、標識ヌクレオチド、非標識ヌクレオチド、または標識および非標識ヌクレオチドの両方を含む。上記で論じられたように、標識ヌクレオチドの割合が増加するにつれて、プライマー伸長の失速の可能性が増加する。しかし、ヌクレオチドが全体的に非標識である場合でさえ、プライマー伸長は、より長いホモポリマー領域内で伸長する場合に失速し得る。
【0152】
図7Aのステップ706で、取り込まれていないヌクレオチドが除去される。例えば、ハイブリダイズされた鋳型は、洗浄緩衝液を使用して洗浄され得る。このステップは、プライマー伸長が失速後に再開し得るように、ハイブリダイズされた鋳型を効率的に「リセットする」。
【0153】
図7Aおよび
図7Bのステップ708で、ホモポリマー領域内のプライマー伸長は、ステップ704および706を反復することにより再開される。ホモポリマー領域中に存在する塩基に相補的なヌクレオチドを使用して、ホモポリマー領域内でプライマーがさらに伸長される。ヌクレオチドは、非標識であることがあり、標識されていることがあり、または標識および非標識ヌクレオチドの混合物であることもある。一部の実施形態では、標識ヌクレオチドは、ホモポリマー領域内のプライマーが失速した後にホモポリマー領域内のプライマーが伸長する場合に使用されない。一部の実施形態では、プライマー伸長が失速した後にホモポリマー領域内のプライマーの伸長を継続するために使用される全ヌクレオチドの約5%未満、約4%未満、約3%未満、約2%未満、約1%未満、約1%未満、約0.5%未満、約0.1%未満、約0.05%未満、または約0.01%未満が、標識ヌクレオチドである。
【0154】
ステップ704および706は、プライマーがホモポリマー領域にわたって伸長するように、1、2、3、4、5回またはそれより多くの回数、反復され得る。プライマー伸長は、この方法が有効であるために、複数のポリヌクレオチド中のすべてのポリヌクレオチドにおいて、実際に失速しているか、または失速している必要はない。取り込まれていないヌクレオチドは、除去され得、新鮮なヌクレオチドは、失速後にポリメラーゼを再開するため、または先手をとって失速を阻止するために使用され得る。例えば、取り込まれていないヌクレオチドの除去、および新鮮なヌクレオチドを使用するさらなるプライマー伸長は、実際の失速の数に関係なく、定期的または不定期的な間隔で周期的に、例えば、15秒ごと、30秒ごと、60秒ごと、2分ごと、5分ごとなどで、反復することができる。
【0155】
プライマーがホモポリマー領域にわたって伸長されたら、標的領域の配列は、
図7Aおよび
図7B中のステップ710に示されているように、ヌクレオチドを使用して、例えば、フローシークエンシング法を使用して、決定される。ヌクレオチドの少なくとも一部が、シークエンシング中に標識される。一部の実施形態では、ヌクレオチドは、標識ヌクレオチドおよび非標識ヌクレオチドを含む。バーコード領域のシークエンシング中に、プライマーは、ハイブリダイズされた鋳型を規定された順序でヌクレオチド(標識ヌクレオチド、および必要に応じて非標識ヌクレオチドを含む)と接触させることによって、伸長される。異なるヌクレオチドのタイプ(例えば、A、C、GまたはT)が、ハイブリダイズされた鋳型と別々に接触され得るか、または2つもしくは3つの異なるヌクレオチドのタイプが、同時に使用され得る。ポリメラーゼを使用して、ヌクレオチドをプライマーの3’末端に鋳型依存的に取り込むことができ、それによって、プライマーを伸長する。取り込まれていないヌクレオチドは、例えば、ハイブリダイズされた鋳型を洗浄することにより、除去することができる。次いで、取り込まれた標識ヌクレオチドの存在または非存在は、その位置の配列を決定するために検出される。このプロセスは、標的領域の配列が決定されるまで、ヌクレオチドの順序を使用して反復され、それによって、mRNA分子由来の目的の領域の配列を推測することが可能になる。
【0156】
ホモポリマー領域内および非ホモポリマー領域内を含む、失速したシークエンシングプライマー伸長を再開するための追加の方法は、この内容が、すべての目的のために参照により本明細書に取り込まれるPCT出願第PCT/US2020/031196号に記載されている。
【実施例0157】
本願の例示的実施形態として提供する以下の非限定的実施例を参照することにより、本願をよりよく理解することができる。以下の実施例を、実施形態をより十分に説明するために提示するが、いかなる点においても本願の広い範囲を限定するものと解釈すべきでない。本願のある特定の実施形態を本明細書で示し、説明したが、このような実施形態を単なる例として提供することは明らかであろう。本発明の趣旨および範囲から逸脱しない非常に多くの変形形態、変更形態および置換形態に当業者なら想到するであろう。本明細書に記載する実施形態の様々な代替形態を、本明細書に記載する方法を実施する際に利用することができることは、理解されるはずである。
(実施例1)
【0158】
試料細胞を、溶解緩衝液を使用して溶解し、液状溶解物を、遠心分離を使用して分離する。分離した液状溶解物を捕捉用ビーズとともにインキュベートし、各捕捉用ビーズは、10~30の連続したチミン塩基を含有するポリT領域の5’と融合されたバーコード領域(共通の試料バーコードおよびUMIを含有する)を含有するDNAオリゴマーを含有する。液状溶解物中のmRNA分子を、捕捉用ビーズを使用して、捕捉用ビーズを分離および洗浄することにより単離する。mRNA分子を、捕捉用プローブDNAオリゴマーおよび逆転写酵素を使用して逆転写し、cDNAライブラリーを得る。cDNAライブラリー中の各cDNA分子は、試料バーコードおよびUMIを有するバーコード領域、ホモポリマーポリT領域、ならびに目的のmRNA領域に相補的な標的領域(コード領域の少なくとも一部を含む)を含む。バーコード領域は、アデニン塩基を除外するように特異的に設計される。
【0159】
cDNAライブラリーを、アダプター配列をcDNAポリヌクレオチドの5’および3’末端に結合させて、シークエンシングライブラリーを生成することにより、シークエンシングのために調製する。シークエンシングライブラリーを、表面に結合したDNAオリゴヌクレオチドを含有するシークエンシングアレイ表面に付与する。DNAオリゴヌクレオチドは、cDNA分子のアダプター領域とハイブリダイズする配列を含む。シークエンシングコロニーを、cDNA分子のコピーおよびcDNA分子の相補体を生成するブリッジ増幅により形成する。
【0160】
シークエンシングプライマーをシークエンシング表面に付与し、これは、cDNA分子相補体の3’末端でアダプター領域とハイブリダイズする。DNAポリメラーゼもシークエンシング表面に付与し、DNAポリメラーゼはハイブリダイズされた鋳型に結合する。第1のヌクレオチド(例えば、デオキシ-A、デオキシ-G、またはデオキシ-C)、例えば、非終結ヌクレオチドを含有する第1の溶液、およびシークエンシング表面を、洗浄緩衝液を使用して、洗浄して、取り込まれていないヌクレオチドを除去する。ヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。コロニーにわたる塩基取り込みの存在および非存在は、蛍光検出器を使用して検出する。このプロセスを、フローサイクルを完了するために異なる(すなわち、第2および第3の)ヌクレオチドを各々含有する第2の溶液および第3の溶液を使用して完了し、フローサイクルを反復して、バーコード領域をシークエンシングする。第2および第3の溶液中のヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。このプロセス中に、チミン塩基はサイクルに含まれない。蛍光標識を、各イメージングステップ後に、成長するポリヌクレオチドから切断する。
【0161】
シークエンシングプライマーがバーコード領域にわたって伸長されたら、100%の非標識チミジン三リン酸を含有する第4の溶液をシークエンシング表面に付与し、これにより、ホモポリマー領域にわたるプライマーの伸長を開始する。表面を、表面が洗浄緩衝液で洗浄される前の期間、反応させ、プロセスを反復して、失速したプライマー伸長を排除する。これにより、プライマーがポリAホモポリマー領域をわたって、かつcDNA分子相補体の標的領域の開始まで、伸長することが可能になる。
【0162】
チミンヌクレオチド(約2.5%の蛍光標識および約97.5%の非標識)を含有する第5の溶液に加えて、第1、第2および第3の溶液を使用して、標的領域をシークエンシングする。溶液をシークエンシング表面に別々に付与し、表面を洗浄し、塩基取り込みの存在または非存在を検出した後、一連のサイクルのために、サイクルにおける次の溶液を付与する。蛍光標識を、各イメージングステップ後に、成長するポリヌクレオチドから切断する。
(実施例2)
【0163】
試料細胞を、溶解緩衝液を使用して溶解し、液状溶解物を、遠心分離を使用して分離する。分離した液状溶解物を捕捉用ビーズとともにインキュベートし、各捕捉用ビーズは、10~30の連続したチミン塩基を含有するポリT領域の5’と融合されたバーコード領域(共通の試料バーコードおよびUMIを含有する)を含有するDNAオリゴマーを含有する。液状溶解物中のmRNA分子を、捕捉用ビーズを使用して、捕捉用ビーズを分離および洗浄することにより単離する。mRNA分子を、捕捉用プローブDNAオリゴマーおよび逆転写酵素を使用して逆転写し、cDNAライブラリーを得る。cDNAライブラリー中の各cDNA分子は、試料バーコードおよびUMIを有するバーコード領域、ホモポリマーポリT領域、ならびに目的のmRNA領域に相補的な標的領域(コード領域の少なくとも一部を含む)を含む。
【0164】
cDNAライブラリーを、アダプター配列をcDNAポリヌクレオチドの5’および3’末端に結合させて、シークエンシングライブラリーを生成することにより、シークエンシングのために調製する。シークエンシングライブラリーを、表面に結合したDNAオリゴヌクレオチドを含有するシークエンシングアレイ表面に付与する。DNAオリゴヌクレオチドは、cDNA分子のアダプター領域とハイブリダイズする配列を含む。シークエンシングコロニーを、cDNA分子のコピーおよびcDNA分子の相補体を生成するブリッジ増幅により形成する。
【0165】
シークエンシングプライマーをシークエンシング表面に付与し、これは、cDNA分子相補体の3’末端でアダプター領域とハイブリダイズする。DNAポリメラーゼもシークエンシング表面に付与する。第1のヌクレオチド(例えば、デオキシ-A、デオキシ-G、デオキシ-Cまたはデオキシ-T)、例えば、非終結ヌクレオチドを含有する第1の溶液、およびシークエンシング表面を、洗浄緩衝液を使用して、洗浄して、取り込まれていないヌクレオチドを除去する。ヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。コロニーにわたる塩基取り込みの存在および非存在は、蛍光検出器を使用して検出する。このプロセスを、フローサイクルを完了するために異なる(すなわち、第2、第3および第4の)ヌクレオチドを各々含有する第2、第3および第4の溶液を使用して完了し、フローサイクルを反復して、バーコード領域をシークエンシングする。第2および第3の溶液中のヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。蛍光標識を、各イメージングステップ後に、成長するポリヌクレオチドから切断する。
【0166】
シークエンシングプライマーがバーコード領域にわたって伸長されたら、80%の標識チミジン三リン酸を含有する第5の溶液をシークエンシング表面に付与し、これにより、ホモポリマー領域内のプライマーの伸長を、それが迅速に失速する前に、開始する。次いで、シークエンシング表面を洗浄して、取り込まれていないヌクレオチドを除去する。
【0167】
プライマー伸張を失速させた後、100%の非標識チミジン三リン酸を含有する第6の溶液をシークエンシング表面に付与し、これにより、ホモポリマー領域にわたるプライマーの伸長を開始する。表面を、表面が洗浄緩衝液で洗浄される前の期間、反応させ、プロセスを反復して、失速したプライマー伸長を排除する。これにより、プライマーがポリAホモポリマー領域をわたって、かつcDNA分子相補体の標的領域の開始まで、伸長することが可能になる。
【0168】
第1、第2、第3および第4の溶液を使用して、標的領域をシークエンシングする。溶液をシークエンシング表面に別々に付与し、表面を洗浄し、塩基取り込みの存在または非存在を検出した後、一連のサイクルのために、サイクルにおける次の溶液を付与する。蛍光標識を、各イメージングステップ後に、成長するポリヌクレオチドから切断する。
(実施例3)
【0169】
試料細胞を、溶解緩衝液を使用して溶解し、液状溶解物を、遠心分離を使用して分離する。分離した液状溶解物を捕捉用ビーズとともにインキュベートし、各捕捉用ビーズは、10~30の連続したチミン塩基を含有するポリT領域の5’と融合されたバーコード領域(共通の試料バーコードおよびUMIを含有する)を含有するDNAオリゴマーを含有する。液状溶解物中のmRNA分子を、捕捉用ビーズを使用して、捕捉用ビーズを分離および洗浄することにより単離する。mRNA分子を、捕捉用プローブDNAオリゴマーおよび逆転写酵素を使用して逆転写し、cDNAライブラリーを得る。cDNAライブラリー中の各cDNA分子は、試料バーコードおよびUMIを有するバーコード領域、ホモポリマーポリT領域、ならびに目的のmRNA領域に相補的な標的領域(コード領域の少なくとも一部を含む)を含む。
【0170】
バーコード領域は、フローサイクル設計と組み合わせて特異的に設計され、その結果、バーコード領域は、同じフロー長を有する。対応するフローグラムを有する例示的バーコードを表2に示す。4つのバーコードの各々についてのシークエンシングプライマーは、第4のサイクル内でバーコードの末端に達する。
【表2】
【0171】
cDNAライブラリーを、アダプター配列をcDNAポリヌクレオチドの5’および3’末端に結合させて、シークエンシングライブラリーを生成することにより、シークエンシングのために調製する。シークエンシングライブラリーを、表面に結合したDNAオリゴヌクレオチドを含有するシークエンシングアレイ表面に付与する。DNAオリゴヌクレオチドは、cDNA分子のアダプター領域とハイブリダイズする配列を含む。シークエンシングコロニーを、cDNA分子のコピーおよびcDNA分子の相補体を生成するブリッジ増幅により形成する。
【0172】
シークエンシングプライマーをシークエンシング表面に付与し、これは、cDNA分子相補体の3’末端でアダプター領域とハイブリダイズする。バーコード領域は、フローシークエンシング法を使用して、構成された付与されるヌクレオチドの順序で調べられ、その結果、シークエンシングライブラリーにわたるすべてのバーコードは、プライマーがホモポリマー領域中に伸長される前にシークエンシングされる。簡単には、DNAポリメラーゼをシークエンシング表面に付与する。第1のヌクレオチド(例えば、デオキシ-A、デオキシ-G、またはデオキシ-C)、例えば、非終結ヌクレオチドを含有する第1の溶液が付与され、その後、シークエンシング表面を、洗浄緩衝液を使用して、洗浄して、取り込まれていないヌクレオチドを除去する。ヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。コロニーにわたる塩基取り込みの存在および非存在は、蛍光検出器を使用して検出する。このプロセスを、フローサイクルを完了するために異なる(すなわち、第2、第3および第4の)ヌクレオチドを各々含有する第2、第3および第4の溶液を、第1の溶液に加えて使用して完了する。複数のフローサイクルを使用して(対称的であり得る)、バーコード領域をシークエンシングする。第2および第3の溶液中のヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。
【0173】
プライマーは、バーコード領域のシークエンシング中に、ホモポリマー領域まで伸長されるが、バーコード領域および別々に付与されるヌクレオチドの順序は、ホモポリマー領域に達するプライマーのタイミングが制御されるように設計される。シークエンシングプライマーがバーコード領域にわたってホモポリマー領域の開始点まで伸長されたら、100%の非標識チミジン三リン酸を含有する第5の溶液をシークエンシング表面に付与し、これにより、ホモポリマー領域にわたるプライマーの伸長を開始する。表面を、表面が洗浄緩衝液で洗浄される前の期間、反応させ、プロセスを反復して、失速したプライマー伸長を排除する。これにより、プライマーがポリAホモポリマー領域をわたって、かつcDNA分子相補体の標的領域の開始まで、伸長することが可能になる。
【0174】
第1、第2、第3および第4の溶液をその後使用して、標的領域をシークエンシングする。溶液をシークエンシング表面に別々に付与し、表面を洗浄し、塩基取り込みの存在または非存在を検出した後、一連のサイクルのために、サイクルにおける次の溶液を付与する。
(実施例4)
【0175】
試料細胞を、溶解緩衝液を使用して溶解し、液状溶解物を、遠心分離を使用して分離する。分離した液状溶解物を捕捉用ビーズとともにインキュベートし、各捕捉用ビーズは、10~30の連続したチミン塩基を含有するポリT領域の5’末端と融合されたバーコード領域(共通の試料バーコードおよびUMIを含有する)を含有するDNAオリゴマーを含有する。液状溶解物中のmRNA分子を、捕捉用ビーズを使用して、捕捉用ビーズを分離および洗浄することにより単離する。mRNA分子を、捕捉用プローブDNAオリゴマーおよび逆転写酵素を使用して逆転写し、cDNAライブラリーを得る。cDNAライブラリー中の各cDNA分子は、試料バーコードおよびUMIを有するバーコード領域、ホモポリマーポリT領域、ならびに目的のmRNA領域に相補的な標的領域(コード領域の少なくとも一部を含む)を含む。
【0176】
cDNAライブラリーを、アダプター配列をcDNAポリヌクレオチドの5’および3’末端に結合させて、シークエンシングライブラリーを生成することにより、シークエンシングのために調製する。シークエンシングライブラリーを、表面に結合したDNAオリゴヌクレオチドを含有するシークエンシングアレイ表面に付与する。DNAオリゴヌクレオチドは、cDNA分子のアダプター領域とハイブリダイズする配列を含む。シークエンシングコロニーを、cDNA分子のコピーおよびcDNA分子の相補体を生成するブリッジ増幅により形成する。
【0177】
第1のシークエンシングプライマーをシークエンシング表面に付与し、これは、cDNA分子相補体の3’末端でアダプター領域とハイブリダイズする。DNAポリメラーゼをシークエンシング表面に付与する。非終結ヌクレオチドであり得る第1のヌクレオチド(例えば、デオキシ-A、デオキシ-G、デオキシ-C、またはデオキシ-T)を含有する第1の溶液、およびシークエンシング表面を、洗浄緩衝液を使用して、洗浄して、取り込まれていないヌクレオチドを除去する。ヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。コロニーにわたる塩基取り込みの存在および非存在は、蛍光検出器を使用して検出する。このプロセスを、フローサイクルを完了するために異なる(すなわち、第2、第3および第4の)ヌクレオチドを各々含有する第2、第3および第4の溶液を使用して完了し、フローサイクルを反復して、バーコード領域をシークエンシングする。第2および第3の溶液中のヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。
【0178】
第2のシークエンシングプライマーがシークエンシング表面に付与され、これは、ポリTホモポリマー領域、およびチミン以外の可変塩基(すなわち、A、CまたはG)を含有する5’アンカーを含む。つまり、第2のシークエンシングプライマーは、実際には、プライマーの5’末端で可変塩基によってのみ異なって定義される、異なる配列を有する3つの異なるプライマーの混合物である。第2のシークエンシングプライマーは、cDNA相補体のホモポリマー領域とハイブリダイズし、5’アンカーは、標的領域の最初の塩基とハイブリダイズする。第1、第2、第3および第4の溶液を使用して、第2のシークエンシングプライマーを伸長し、cDNA分子相補体の標的領域をシークエンシングする。溶液をシークエンシング表面に別々に付与し、表面を洗浄し、塩基取り込みの存在または非存在を検出した後、一連のサイクルのために、サイクルにおける次の溶液を付与する。
【0179】
バーコード領域および標的領域が別々のプライマーを使用してシークエンシングされるとしても、配列は、シークエンシング表面の空間座標に基づいて関連付けられ得る。
(実施例5)
【0180】
試料細胞を、溶解緩衝液を使用して溶解し、液状溶解物を、遠心分離を使用して分離する。分離した液状溶解物を捕捉用ビーズとともにインキュベートし、各捕捉用ビーズは、10~30の連続したチミン塩基を含有するポリT領域の5’末端と融合されたバーコード領域(共通の試料バーコードおよびUMIを含有する)を含有するDNAオリゴマーを含有する。液状溶解物中のmRNA分子を、捕捉用ビーズを使用して、捕捉用ビーズを分離および洗浄することにより単離する。mRNA分子を、捕捉用プローブDNAオリゴマーおよび逆転写酵素を使用して逆転写し、cDNAライブラリーを得る。cDNAライブラリー中の各cDNA分子は、試料バーコードおよびUMIを有するバーコード領域、ホモポリマーポリT領域、ならびに目的のmRNA領域に相補的な標的領域(コード領域の少なくとも一部を含む)を含む。
【0181】
cDNAライブラリーを、アダプター配列をcDNAポリヌクレオチドの5’および3’末端に結合させて、シークエンシングライブラリーを生成することにより、シークエンシングのために調製する。シークエンシングライブラリーを、表面に結合したDNAオリゴヌクレオチドを含有するシークエンシングアレイ表面に付与する。DNAオリゴヌクレオチドは、cDNA分子のアダプター領域とハイブリダイズする配列を含む。シークエンシングコロニーを、cDNA分子のコピーおよびcDNA分子の相補体を生成するブリッジ増幅により形成する。
【0182】
シークエンシングプライマーをシークエンシング表面に付与し、これは、cDNA分子相補体の3’末端でアダプター領域とハイブリダイズする第1のプライマーセグメント、およびcDNA分子相補体のホモポリマー領域とハイブリダイズする第2のプライマーセグメントを含む。ウラシルRNA部分が、第1のプライマーセグメントと第2のプライマーセグメントとを分離している。100%の非標識チミジン三リン酸を含有する第1の溶液をシークエンシング表面に付与し、これは、第2のプライマーセグメントを、cDNA分子相補体のホモポリマー領域の末端まで伸長する。次いで、取り込まれていないヌクレオチドを、洗浄緩衝液でシークエンシング表面を洗浄することにより除去する。
【0183】
ヌクレオチド(例えば、デオキシ-A、デオキシ-G、またはデオキシ-C)を含有する第2の溶液をシークエンシング表面に付与し、シークエンシング表面を、洗浄緩衝液を使用して、洗浄して、取り込まれていないヌクレオチドを除去する。ヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。コロニーにわたる塩基取り込みの存在および非存在は、蛍光検出器を使用して検出する。このプロセスを、フローサイクルを完了するために異なるヌクレオチドを各々含有する第3、第4および第5の溶液を使用して完了し、フローサイクルを反復して、標的領域をシークエンシングする。第2の溶液はチミンを含有しないが、第3、第4または第5のいずれか1つはチミン塩基を含有し得る。第2および第3の溶液中のヌクレオチドは、約2.5%の蛍光標識ヌクレオチドおよび約97.5%の非標識ヌクレオチドを含有する。
【0184】
プライマーを、第1および第2のプライマーセグメントの間のウラシル部分を特異的に切るウラシル特異的除去試薬(USER(登録商標))酵素(New England BioLabsから入手可能)を含有する第6の溶液を付与することにより切断する。次いで、切断溶液を、洗浄緩衝液を使用して除去する。
【0185】
次いで、第2、第3、第4および第5の溶液を使用して、第1のプライマーセグメントを伸長し、cDNA分子相補体のバーコード領域をシークエンシングする。溶液をシークエンシング表面に別々に付与し、表面を洗浄し、塩基取り込みの存在または非存在を検出した後、一連のサイクルのために、サイクルにおける次の溶液を付与する。
【0186】
バーコード領域および標的領域が別々のプライマーを使用してシークエンシングされるとしても、配列は、シークエンシング表面の空間座標に基づいて関連付けられ得る。
(実施例6)
【0187】
3つの合成試験配列を、非終結型の合成によるシークエンシング法を使用してシークエンシングした。試験cDNA配列は、開始領域、バーコード領域、ホモポリマー領域(C-C)および目的の領域を含んでいた。
図8Aを参照されたい。配列3のバーコード領域は、ホモポリマー(例えば、フロー番号14のT-T-Tホモポリマー、フロー番号16のG-G-Gホモポリマー、フロー番号18のA-A-Aホモポリマー、およびフロー番号30のA-A-A-A-Aホモポリマー)を含んでいたが、これらのホモポリマーは、C-Cホモポリマー領域とは区別される。ヌクレオチドの異なるフロー順序を使用して、(1)開始領域(T-A-C-Gのフロー順序、2サイクルを使用する)、(2)バーコード領域(T-C-Aフロー順序、9サイクルを使用する)、および(3)ホモポリマー領域および目的の領域(G-A-T-Cのフロー順序、2サイクルを使用する)をシークエンシングした。バーコードは、ホモポリマー領域中に含まれたCヌクレオチドを除外するように設計された。したがって、バーコードをシークエンシングするために使用されるフロー順序は、相補的なGヌクレオチドを除外した。さらに、ホモポリマー領域および目的の領域をシークエンシングするために使用されるフロー順序は、目的の領域をシークエンシングする前に、ホモポリマー領域をわたってシークエンシングするためにGヌクレオチドで開始するように設計された。
【0188】
図8は、各フロー位置で3つの配列の各々について得られたシークエンシングデータのフローマトリックスを示す。データは、シークエンシングされた分子のヌクレオチドに相補的であるシークエンシング反応にフローされるヌクレオチドに基づいて提供される。下記のフローマトリックスは、シークエンシングされた各分子についてのシグナルトレースである。いずれかの所与の位置におけるより大きなシグナル強度は、示されたフロー位置で取り込まれたヌクレオチドの数がより多いことを示す。
【0189】
3つの配列すべてのバーコードは、フロー数9~30で、成功裏にシークエンシングされた。バーコードフローサイクルをフロー31~35により継続したが、バーコードは完全にシークエンシングされ、ヌクレオチドはこれらのフロー中に取り込まれなかった。これは、さらに配列3のフロー数30で生じ、これは、5つの連続するTヌクレオチドの取り込みを含んでいた(追加のTヌクレオチドは33位で取り込まれなかった)。フロー36で、Gヌクレオチドが導入され、これにより、ホモポリマー領域(C-C)にわたるシークエンシング鎖の伸長が可能になった。このスキームのさらなる利点は、3つの配列すべてのシークエンシングがフロー36で同期化されたことである。