(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-18
(45)【発行日】2024-03-27
(54)【発明の名称】脂質修飾オリゴヌクレオチドおよびその使用方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240319BHJP
C12Q 1/6876 20180101ALI20240319BHJP
C12Q 1/686 20180101ALI20240319BHJP
C12N 15/11 20060101ALN20240319BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/6876 Z
C12Q1/686 Z
C12N15/11 Z
(21)【出願番号】P 2021500194
(86)(22)【出願日】2019-07-08
(86)【国際出願番号】 US2019040898
(87)【国際公開番号】W WO2020010366
(87)【国際公開日】2020-01-09
【審査請求日】2022-07-08
(32)【優先日】2018-07-06
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-05-14
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】506115514
【氏名又は名称】ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア
【氏名又は名称原語表記】The Regents of the University of California
(74)【代理人】
【識別番号】100102978
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100160923
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】ガートナー ゼブ ジェイ.
(72)【発明者】
【氏名】パターソン デイビッド
(72)【発明者】
【氏名】チョウ エリック ディー.
(72)【発明者】
【氏名】マクギニス クリストファー
(72)【発明者】
【氏名】ウェバー ロバート
【審査官】小林 薫
(56)【参考文献】
【文献】米国特許第09650407(US,B2)
【文献】特開2013-055939(JP,A)
【文献】Biomacromolecules,2014年,Vol.15,pp.4621-4626
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12Q 1/00- 3/00
CAplus/REGISTRY/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
組成物であって、
(a)第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む、第1の脂質抱合DNAオリゴヌクレオチドと、
(b)第2のプライマー領域、バーコード領域、および捕捉配列を含む、第2のDNAオリゴヌクレオチドであって、前記第2のプライマー領域が、前記第1のプライマー領域の逆相補体である、第2のDNAオリゴヌクレオチドと
を含む、組成物。
【請求項2】
以下をさらに含む、請求項1に記載の組成物:
第2のハイブリダイゼーション領域および第2の脂質部分を含む、第3の脂質抱合DNAオリゴヌクレオチドであって、前記第2のハイブリダイゼーション領域が、前記第1のハイブリダイゼーション領域の逆相補体である、第3の脂質抱合DNAオリゴヌクレオチド。
【請求項3】
(a)前記第1の脂質抱合DNAオリゴヌクレオチドが、5’から3’の配向で、前記第1の脂質部分と、前記第1のハイブリダイゼーション領域と、前記第1のプライマー領域と、を含む、
(b)前記第1の脂質抱合DNAオリゴヌクレオチドが、3’から5’の配向で、前記第1の脂質部分と、前記第1のハイブリダイゼーション領域と、前記第1のプライマー領域と、を含む、
(c)前記第2のDNAオリゴヌクレオチドが、5’から3’の配向で、前記第2のプライマー領域と、前記バーコード領域と、前記捕捉配列と、を含む、または
(d)前記第2のDNAオリゴヌクレオチドが、3’から5’の配向で、前記第2のプライマー領域と、前記バーコード領域と、前記捕捉配列と、を含む、
請求項1または2に記載の組成物。
【請求項4】
(a)前記第3の脂質抱合DNAオリゴヌクレオチドが、5’から3’の配向で、前記第2のハイブリダイゼーション領域と、前記第2の脂質部分と、を含む、または
(b)前記第3の脂質抱合DNAオリゴヌクレオチドが、3’から5’の配向で、前記第2のハイブリダイゼーション領域と、前記第2の脂質部分と、を含む、
請求項2に記載の組成物。
【請求項5】
前記第1の脂質部分が
、アルケニル、アルキル、アリール、またはアラルキル
炭素鎖を含む脂肪族鎖を含む、請求項1または2に記載の組成物。
【請求項6】
前記第2の脂質部分が、式IIの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1が、5~25であり、n
2が、0~24であり、Xが、NH、CH
2、O、およびCH-Rからなる群から選択され、ここで、Rが、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである、請求項2に記載の組成物。
【請求項7】
(a)前記第1の脂質抱合DNAオリゴヌクレオチドが、配列番号1の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、
(b)前記第2のDNAオリゴヌクレオチドが、配列番号3の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、および/または
(c)前記第3の脂質抱合DNAオリゴヌクレオチドが、配列番号2の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、
請求項2に記載の組成物。
【請求項8】
前記第1の脂質抱合DNAオリゴヌクレオチド、前記第2のDNAオリゴヌクレオチド、および前記第3の脂質抱合DNAオリゴヌクレオチドのうちの1つ以上が、固体支持体に結合して
いる、請求項2に記載の組成物。
【請求項9】
対象の試料または組織内の核酸発現のパターンの空間位置を特定する方法であって、前記方法が、
(a)前記試料の領域に対応する、前記試料または前記組織からの1つまたは複数の細胞を、複数の容器のうちの1つに分割することと、
(b)前記試料の領域に対応する前記1つまたは複数の細胞を、
(i)第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む、第1の脂質抱合DNAオリゴヌクレオチド、および
(ii)第2のプライマー領域、バーコード領域、および捕捉配列を含む、第2のDNAオリゴヌクレオチドであって、前記第2のプライマー領域が、前記第1のプライマー領域の逆相補体である、第2のDNAオリゴヌクレオチ
ド
で、前記オリゴヌクレオチドを前記1つまたは複数の細胞に組み込むのに十分な時間、曝露することであって、各オリゴヌクレオチドは、1つまたは複数の細胞が曝露される前記複数の容器のうちの1つに固有であり、かつそれに対応する、曝露することと、
(c)前記オリゴヌクレオチドに従って前記1つまたは複数の細胞から核酸を単離することと、
(d)核酸の発現を定量化すること、および/または前記1つもしくは複数の細胞から前記核酸を配列決定することと、
(e)発現プロファイルにおいて前記核酸の発現を正規化することと、
(f)前記1つまたは複数の細胞からの前記発現プロファイルを、前記試料内の、前記組織に対する、または前記組織内の前記細胞の前記空間位置に相関させることと
を含む、方法。
【請求項10】
(g)前記細胞をフローサイトメトリーに曝露することをさらに含む、請求項9に記載の方法。
【請求項11】
ステップ(b)が、前記1つまたは複数の細胞を、(iii)第2のハイブリダイゼーション領域および第2の脂質部分を含む、第3の脂質抱合DNAオリゴヌクレオチドであって、前記第2のハイブリダイゼーション領域が、前記第1のハイブリダイゼーション領域の逆相補体である、第3の脂質抱合DNAオリゴヌクレオチドに曝露することを含む、請求項9に記載の方法。
【請求項12】
対象の試料からの1つまたは複数の細胞から核酸を配列決定する方法であって、
(a)前記試料の領域に対応する前記1つまたは複数の細胞を容器に分割することと、
(b)前記試料の領域に対応する前記1つまたは複数の細胞を、
(i)第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む、第1の脂質抱合DNAオリゴヌクレオチド、および
(ii)第2のプライマー領域、バーコード領域、および捕捉配列を含む、第2のDNAオリゴヌクレオチドであって、前記第2のプライマー領域が、前記第1のプライマー領域の逆相補体である、第2のDNAオリゴヌクレオチ
ド
で標識することと、
(c)前記1つまたは複数の細胞から前記核酸を単離することと、
(d)前記1つまたは複数の細胞から前記核酸を配列決定することと
を含む、方法。
【請求項13】
前記第1の脂質部分および前記第2の脂質部分が、12~28個の炭素を有する脂肪酸を含む、請求項12に記載の方法。
【請求項14】
前記第1の脂質部分が
、アルケニル、アルキル、アリール、またはアラルキル
脂肪族炭素鎖を含む、請求項12に記載の方法。
【請求項15】
前記第2の脂質部分が、式IIの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1が、5~25であり、n
2が、0~24であり、Xが、NH、CH
2、O、およびCH-Rからなる群から選択され、ここで、Rが、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである、請求項12に記載の方法。
【請求項16】
前記第1の脂質部分が、リグノセリン酸およびコレステロールから選択される脂質を含む、請求項12に記載の方法。
【請求項17】
前記第2の脂質部分が、パルミチン酸およびコレステロールから選択される脂質を含む、請求項12に記載の方法。
【請求項18】
前記コレステロールがコレステロール-トリエチレングリコール(TEG)である、請求項16または17に記載の方法。
【請求項19】
前記捕捉配列がポリアデニル化領域である、請求項12に記載の方法。
【請求項20】
(e)前記1つまたは複数の細胞の各々からの配列情報をコンパイルすることをさらに含み
、前記コンパイルするステップが
、
(i)前記試料の領域に対応する前記1つまたは複数の細胞の各々の発現プロファイルを創出することを含む、および/または
(ii)前記核酸の前記配列情報および/または前記発現プロファイルを、前記試料内または前記対象内の前記1つまたは複数の細胞の空間位置に相関させることをさらに含む、
請求項12に記載の方法。
【請求項21】
前記標識するステップが、
(a)前記1つまたは複数の細胞を、1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドに、前記アンカー-脂質修飾オリゴヌクレオチドがそれ自体を前記細胞の細胞膜内に埋め込むのに十分な期間、曝露すること、および/あるいは
(b)前記1つまたは複数の細胞を、前記アンカー-脂質修飾オリゴヌクレオチドに相補的な1つまたは複数の標識オリゴヌクレオチドに、前記アンカー-脂質修飾オリゴヌクレオチドが前記1つまたは複数の標識オリゴヌクレオチドとともに核酸の相補鎖を形成するのに十分な期間、曝露すること、および/あるいは
(c)前記1つまたは複数の標識オリゴヌクレオチドを前記1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドにライゲーションすること、およ
び
(d)前記1つまたは複数の標識オリゴヌクレオチドの存在を、前記1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって、検出すること
を含む、請求項12に記載の方法。
【請求項22】
前記1つまたは複数の細胞の前記核酸を単離するステップが、前記1つまたは複数の細胞を、前記1つまたは複数の標識オリゴヌクレオチドの存在に基づいて単離することを含み、前記1つまたは複数の標識オリゴヌクレオチドの存在が、前記1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって決定される、請求項14に記載の方法。
【請求項23】
前記1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドが、
(a)第1の脂質部分と、第1のハイブリダイゼーション領域と、第1のプライマー領域と、を含む、第1の脂質抱合DNAオリゴヌクレオチド、
(b)第2のハイブリダイゼーション領域と、第2の脂質部分と、を含む、第2の脂質抱合DNAオリゴヌクレオチドであって、前記第2のハイブリダイゼーション領域が、前記第1のハイブリダイゼーション領域の逆相補体である、第2の脂質抱合DNAオリゴヌクレオチド、および
(c)第2のプライマー領域と、バーコード領域と、捕捉配列とを含む、第3のDNAオリゴヌクレオチドであって、前記第2のプライマー領域が、前記第1のプライマー領域の逆相補体である、第3のDNAオリゴヌクレオチド
を含む、請求項21に記載の方法。
【請求項24】
前記1つまたは複数の細胞
から前記核酸を配列決定するステッ
プが、配列決定デバイスにおいて液滴マイクロフルイディクスを行うことを含む、請求項12に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年7月6日に出願された米国仮出願第62/694,970号、および2019年5月14日に出願された米国仮特許出願第62/847,916号の優先権を主張し、これらの各々の内容は、参照によりそれら全体が本明細書に組み込まれる。
【0002】
連邦政府により資金提供された研究に関する記載
本発明は、国立衛生研究所によって授与された助成金番号HD080351の下で政府の支援を受けてなされた。政府は、本発明において一定の権利を有する。
【0003】
分野
本開示は、概して、単一細胞バーコード化の方法および適用、ならびに脂質修飾オリゴヌクレオチドを含む組成物を使用するヌクレオチド配列決定の方法に関する。
【背景技術】
【0004】
背景
単一細胞RNA配列決定は、細胞内の転写変化をマッピングするための強力なツールになった。この技法の主な利点は、試料中の細胞の多様性を調査できることである。すべての単一細胞RNA配列決定プロトコルは、細胞から転写されたRNAがcDNAに変換される共通の初期ステップを共有している。次のステップは、PCRおよびインビトロ転写(IVT)などの方法による増幅である。配列決定で最高潮に達する後続のステップでは、遺伝子産物の発現レベルを定量化することができる。単一細胞からのRNAの分離とバーコード化は、単一細胞RNA-seqの最初の重要な制限ステップである。
【0005】
最近、複雑な生物学的現象を理解するために、単一細胞RNA配列決定と組み合わせた大規模なスクリーニング(shRNAまたはCRISPRを使用した遺伝子摂動)が行われた。これらには、shRNAまたはCRISPR gRNA配列による試料の容易な同定/バーコード化という明確な利点がある。遺伝子摂動技法は、バーコードの導入と直接組み合わせることができるが(すなわち、ポリA+バーコードをgRNAまたはshRNA自体に追加することにより)、遺伝子操作を伴わない化学/薬物/患者のスクリーニングでは、scRNA-seqを介して「読み取る」ことができる様式でバーコード化することができなかった。例えば、Adamson et al.,Cell 167(7):1867-82(2016)(非特許文献1)、Aarts et al.,Genes Dev.31(20):2085-98(2017)(非特許文献2)、Jaitin et al.,Cell 167(7):1883-96(2016)(非特許文献3)を参照されたい。
【0006】
単一細胞RNA配列決定アッセイでは、多重化は、従来、適用に応じて、cDNAフラグメントまたはビーズに分子バーコードを追加することで実現される。これは、液滴マイクロフルイディクスを使用するか、またはマイクロウェルを使用するかのいずれかで細胞を単離した後に行われる。個々の液滴(またはマイクロウェル)で単離された細胞からのcDNAの標識を可能にするために、ビーズは、バーコード(または場合によってはビーズ上のバーコード)も含む逆転写(RT)プライマーとともに使用することができる。したがって、RTおよびバーコード化は、個々の液滴またはウェルで発生する可能性があり得る。現在の方法には、少なくとも次の欠点がある:高コスト、低効率、および低多重化能力。市販の液滴マイクロフルイディクスベースの単一細胞RNA配列決定の現在の試料多重化容量は、細胞エマルジョンおよびmRNA捕捉ビーズとの同時カプセル化に使用される別個のチャネルの数のために8に制限されている。
【先行技術文献】
【非特許文献】
【0007】
【文献】Adamson et al.,Cell 167(7):1867-82(2016)
【文献】Aarts et al.,Genes Dev.31(20):2085-98(2017)
【文献】Jaitin et al.,Cell 167(7):1883-96(2016)
【発明の概要】
【0008】
態様の概要
本開示は、細胞を標識するように特異的に設計されたオリゴヌクレオチドを含む組成物、および異なる試料調製物(例えば、患者、摂動、単一の実験の複製など)に対応する別個の外因性オリゴヌクレオチドバーコードで標識されたプールされた細胞の組成物に関する。脂質修飾外因性オリゴヌクレオチドの形で試料固有の情報を組み込むことにより、試料スループットレベルは、マイクロ流体デバイスの物理的寸法によって定義されることに制限されなくなる。試料の多重化を強化すると、単一細胞RNA配列決定のコストが削減され、バッチ効果から生じる技術的なノイズが制限され、単一細胞トランスクリプトームデータセットがより有益になる。
【0009】
本開示は、単一細胞をバーコード化するため、および脂質修飾オリゴヌクレオチドを使用するRNA配列決定分析のための組成物、ならびにそれらの組成物を使用する方法に関する。本開示はまた、単一細胞を含む液滴を多重化する方法に関する。本開示はまた、細胞ダブレットの交絡アーティファクトなしに、より大量の単一試料を処理する方法に関する。次いで、試料をいくつかのアリコートに分割し、各々に異なるバーコード化脂質修飾オリゴヌクレオチドを加えてプールした後、単一細胞RNA系上で流動させることができる。これにより、処理される単一細胞の総数を増やしながら、細胞ダブレットを計算で除去できるようになる。
【0010】
一態様は、(a)第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む第1の脂質抱合DNAオリゴヌクレオチド、(b)第2のハイブリダイゼーション領域および第2の脂質部分を含む第2の脂質抱合DNAオリゴヌクレオチド(第2のハイブリダイゼーション領域は、第1のハイブリダイゼーション領域の逆相補体である)、ならびに(c)第2のプライマー領域、バーコード領域、および捕捉配列を含む第3のDNAオリゴヌクレオチド(第2のプライマー領域は、第1のプライマー領域の逆相補体である)を含む組成物についてである。あるいは、いくつかの態様では、組成物は、脂質部分、バーコード領域、および捕捉配列を含む脂質抱合DNAオリゴヌクレオチドを含み得る。いくつかの態様では、組成物は、(a)脂質部分および第1のプライマー領域を含む第1の脂質抱合DNAオリゴヌクレオチド、ならびに(b)第2のプライマー領域、バーコード領域、および捕捉配列を含む第2のDNAオリゴヌクレオチド(第2のプライマー領域は、第1のプライマー領域の逆相補体である)を含み得る。
【0011】
別の態様は、前述の組成物を含む膜についてである。
【0012】
さらなる態様は、前述の組成物を含む細胞についてである。
【0013】
追加の態様は、前述の組成物を含むキットについてである。
【0014】
別の態様は、細胞を前述の組成物と接触させることを含むRNA配列決定の方法についてである。
【0015】
さらなる態様は、試料中の少なくとも1つの遺伝子のmRNAレベルを定量化する方法についてであり、この方法は、試料を前述の組成物と接触させることを含む。
【0016】
追加の態様は、試料中のmRNAレベルを定量化する方法についてであり、この方法は、(a)試料からの2つ以上の単一細胞を、少なくとも1つの表面を含む固体支持体上の2つ以上の容器に加えることと(各容器は、試料からの単一細胞を含み、固体支持体の外部の点からアドレス指定可能である)、(b)各細胞が組成物を含み、各細胞が少なくとも2つの細胞間のmRNAレベルの差を測定するために独立してアドレス可能であるように、単一細胞の各々を前述の組成物と接触させることと、を含む。
【0017】
別の態様は、化合物の毒性を決定する方法についてであり、この方法は、1つ以上の化合物を、前述の組成物を含む1つ以上の細胞と接触させることを含む。
【0018】
さらなる態様は、対象における障害を診断する方法についてであり、この方法は、対象から得られた試料中のマーカー遺伝子の発現を測定することを含み、測定することは、試料を前述の組成物と接触させることを含み、マーカー遺伝子の発現の所定レベルからの増加または減少は、対象が障害に罹患していることを示す。
【0019】
追加の態様は、試料中の修飾細胞の数を定量化する方法についてであり、この方法は、試料を前述の組成物と接触させることを含む。
【0020】
別の態様は、細胞発現パターンを決定する方法についてであり、この方法は、(a)細胞を化学化合物と接触させることと、(b)化学化合物と接触していない同等の細胞からの1つ以上の遺伝子の発現と比較した、細胞からの1つ以上の遺伝子の発現を測定することとを含み、測定することは、細胞を前述の組成物と接触させることを含む。
[本発明1001]
組成物であって、
(a)第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む、第1の脂質抱合DNAオリゴヌクレオチドと、
(b)第2のハイブリダイゼーション領域および第2の脂質部分を含む、第2の脂質抱合DNAオリゴヌクレオチドであって、前記第2のハイブリダイゼーション領域が、前記第1のハイブリダイゼーション領域の逆相補体である、第2の脂質抱合DNAオリゴヌクレオチドと、
(c)第2のプライマー領域、バーコード領域、および捕捉配列からなる、第3のDNAオリゴヌクレオチドであって、前記第2のプライマー領域が、前記第1のプライマー領域の逆相補体である、第3のDNAオリゴヌクレオチドと
を含む、組成物。
[本発明1002]
前記第1の脂質抱合DNAオリゴヌクレオチドが、5’から3’の配向で、前記第1の脂質部分と、前記第1のハイブリダイゼーション領域と、前記第1のプライマー領域と、を含む、本発明1001の組成物。
[本発明1003]
前記第1の脂質抱合DNAオリゴヌクレオチドが、3’から5’の配向で、前記第1の脂質部分と、前記第1のハイブリダイゼーション領域と、前記第1のプライマー領域と、を含む、本発明1001の組成物。
[本発明1004]
前記第2の脂質抱合DNAオリゴヌクレオチドが、5’から3’の配向で、前記第2のハイブリダイゼーション領域と、前記第2の脂質部分と、を含む、本発明1001の組成物。
[本発明1005]
前記第2の脂質抱合DNAオリゴヌクレオチドが、3’から5’の配向で、前記第2のハイブリダイゼーション領域と、前記第2の脂質部分と、を含む、本発明1001の組成物。
[本発明1006]
前記第3のDNAオリゴヌクレオチドが、5’から3’の配向で、前記第2のプライマー領域と、前記バーコード領域と、前記捕捉配列と、を含む、本発明1001の組成物。
[本発明1007]
前記第3のDNAオリゴヌクレオチドが、3’から5’の配向で、前記第2のプライマー領域と、前記バーコード領域と、前記捕捉配列と、を含む、本発明1001の組成物。
[本発明1008]
前記第1の脂質部分および前記第2の脂質部分が、12~28個の炭素を有する脂肪酸を含む、本発明1001の組成物。
[本発明1009]
前記第1の脂質部分が、式Iの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1
が、5~25であり、n
2
が、1~25であり、Xが、NH、CH
2
、O、およびCH-Rからなる群から選択され、ここで、Rが、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである、本発明1001の組成物。
[本発明1010]
前記第2の脂質部分が、式IIの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1
が、5~25であり、n
2
が、0~24であり、Xが、NH、CH
2
、O、およびCH-Rからなる群から選択され、ここで、Rが、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである、本発明1001の組成物。
[本発明1011]
前記第1の脂質部分が、リグノセリン酸およびコレステロールから選択される脂質を含む、本発明1001の組成物。
[本発明1012]
前記第2の脂質部分が、パルミチン酸およびコレステロールから選択される脂質を含む、本発明1001の組成物。
[本発明1013]
前記コレステロールがコレステロール-トリエチレングリコール(TEG)である、本発明1010または1011の組成物。
[本発明1014]
前記捕捉配列がポリアデニル化領域である、本発明1001の組成物。
[本発明1015]
前記第1の脂質抱合DNAオリゴヌクレオチドが、配列番号1
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、本発明1001の組成物。
[本発明1016]
前記第2の脂質抱合DNAオリゴヌクレオチドが、配列番号2
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、本発明1001の組成物。
[本発明1017]
前記第3のDNAオリゴヌクレオチドが、配列番号3
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、本発明1001の組成物。
[本発明1018]
前記第1の脂質抱合DNAオリゴヌクレオチド、前記第2の脂質抱合DNAオリゴヌクレオチド、および前記第3の脂質抱合DNAオリゴヌクレオチドのうちの1つ以上が、固体支持体に結合している、本発明1001の組成物。
[本発明1019]
前記固体支持体がビーズである、本発明1018の組成物。
[本発明1020]
前記捕捉配列が、ポリアデニル化領域を含み、前記ビーズが、前記第3のDNAオリゴヌクレオチドの前記ポリアデニル化領域にハイブリダイズするポリ(T)領域を含む、本発明1019の組成物。
[本発明1021]
脂質部分と、バーコード領域と、捕捉配列とを含む脂質抱合DNAオリゴヌクレオチドを含むことができる、組成物。
[本発明1022]
組成物であって、
(a)脂質部分および第1のプライマー領域を含む、第1の脂質抱合DNAオリゴヌクレオチドと、
(b)第2のプライマー領域、バーコード領域、および捕捉配列を含む、第2のDNAオリゴヌクレオチドであって、前記第2のプライマー領域が、前記第1のプライマー領域の逆相補体である、第2のDNAオリゴヌクレオチドと
を含む、組成物。
[本発明1023]
本発明1001~1022のいずれかの組成物を含む、膜。
[本発明1024]
本発明1001~1022のいずれかの組成物を含む、細胞。
[本発明1025]
本発明1001~1022のいずれかの組成物を含む、キット。
[本発明1026]
細胞を本発明1001~1022のいずれかの組成物と接触させることを含む、RNA配列決定の方法。
[本発明1027]
前記細胞内のRNAをcDNAに逆転写することをさらに含む、本発明1026の方法。
[本発明1028]
試料中の少なくとも1つの遺伝子のmRNAレベルを定量化する方法であって、前記試料を本発明1001~1022のいずれかの組成物と接触させることを含む、方法。
[本発明1029]
前記細胞内のRNAをcDNAに逆転写することをさらに含む、本発明1028の方法。
[本発明1030]
前記cDNAを増幅することをさらに含む、本発明1029の方法。
[本発明1031]
前記増幅することが、PCRまたはインビトロ転写(IVT)を含む、本発明1030の方法。
[本発明1032]
前記方法が、複数の容器を有する少なくとも1つの表面を含む多重化固体支持体中で行われ、各容器が、前記固体支持体の外部にある点からアドレス可能である、本発明1028~1031のいずれかの方法。
[本発明1033]
少なくとも1つの容器は、前記容器内で単一細胞を成長させるように構成されるか、または前記容器は、単一の細胞が容器内または容器の近位にある表面から懸濁され得るように構成される、本発明1032の方法。
[本発明1034]
前記試料が、単離された単一細胞、細胞小器官、または膜封入ビヒクルである、本発明1028~1033のいずれかの方法。
[本発明1035]
前記細胞が真核細胞である、本発明1034の方法。
[本発明1036]
前記真核細胞がヒト細胞または哺乳動物細胞である、本発明1035の方法。
[本発明1037]
前記細胞が、形質転換細胞、初代細胞、または過剰増殖性細胞である、本発明1035または1036の方法。
[本発明1038]
試料中のmRNAレベルを定量化する方法であって、
(a)前記試料からの2つ以上の単一細胞を、少なくとも1つの表面を含む固体支持体上の2つ以上の容器に加えることであって、各容器が、前記試料からの単一細胞を含み、前記固体支持体の外部にある点からアドレス可能である、加えることと、
(b)各細胞が前記組成物を含み、かつ各細胞が、前記少なくとも2つの細胞間のmRNAレベルの差を測定するために独立してアドレス可能であるように、前記単一細胞の各々を、本発明1001~1016のいずれかの組成物と接触させることと
を含む、方法。
[本発明1039]
前記細胞内のRNAをcDNAに逆転写することをさらに含む、本発明1038の方法。
[本発明1040]
前記cDNAを増幅することをさらに含む、本発明1038の方法。
[本発明1041]
前記固体支持体が、96、182、384、1536、または3456ウェル細胞培養プレートである、本発明1038の方法。
[本発明1042]
化合物の毒性を決定する方法であって、1つ以上の化合物を、本発明1001~1022のいずれかの組成物を含む1つ以上の細胞と接触させることを含む、方法。
[本発明1043]
前記接触させるステップを行った後、前記1つ以上の細胞における遺伝子の発現を測定することと、
前記化合物と接触した前記1つ以上の細胞における前記遺伝子の発現レベルを、前記化合物と接触していない細胞における前記遺伝子の発現レベルと比較することと
をさらに含む、本発明1042の方法。
[本発明1044]
前記遺伝子が細胞死またはアポトーシスに関連している、本発明1044の方法。
[本発明1045]
対象における障害を診断する方法であって、前記方法が、前記対象から得られた試料中のマーカー遺伝子の発現を測定することを含み、前記測定することが、前記試料を本発明1001~1022のいずれかの組成物と接触させることを含み、前記マーカー遺伝子の発現の所定レベルからの増加または減少は、前記対象が前記障害に罹患していることを示す、方法。
[本発明1046]
前記測定することが、前記細胞内のRNAをcDNAに逆転写することをさらに含む、本発明1045の方法。
[本発明1047]
前記測定することが、前記cDNAを増幅することをさらに含む、本発明1046の方法。
[本発明1048]
前記増幅することが、PCRまたはインビトロ転写(IVT)を含む、本発明1047の方法。
[本発明1049]
試料中の修飾された細胞の数を定量化する方法であって、前記試料を本発明1001~1022のいずれかの組成物と接触させることを含む、方法。
[本発明1050]
前記修飾された細胞が真核細胞である、本発明1049の方法。
[本発明1051]
前記真核細胞がヒト細胞または哺乳動物細胞である、本発明1050の方法。
[本発明1052]
前記修飾された細胞が、形質転換細胞、初代細胞、または過剰増殖性細胞である、本発明1050または1051の方法。
[本発明1053]
前記試料を、前記第1または第2の脂質抱合DNAオリゴヌクレオチドに特異的なプローブと接触させることをさらに含む、本発明1049の方法。
[本発明1054]
前記試料中のプローブの量を定量化することをさらに含む、本発明1053の方法。
[本発明1055]
細胞発現パターンを決定する方法であって、
(a)細胞を化学化合物と接触させることと、
(b)前記細胞からの1つ以上の遺伝子の発現を、前記化学化合物と接触していない同等の細胞からの1つ以上の遺伝子の発現と比較して測定することであって、前記測定することが、前記細胞を、本発明1001~1020のいずれかの組成物と接触させることを含む、測定することと
を含む、方法。
[本発明1056]
細胞を標識する方法、単一細胞から内因性DNAを単離する方法、または単一細胞から核酸配列を配列決定する方法であって、
(a)前記細胞を、本明細書に開示される1つもしくは複数のアンカー-脂質修飾オリゴヌクレオチドまたは本発明1001~1020のいずれかの組成物に、前記アンカー-脂質修飾オリゴヌクレオチドがそれ自体を前記細胞の細胞膜内に埋め込むのに十分な期間、曝露することと、
(b)前記細胞を、前記アンカー-脂質修飾オリゴヌクレオチドに相補的な1つまたは複数の標識オリゴヌクレオチドに、前記アンカー-脂質修飾オリゴヌクレオチドが前記1つまたは複数の標識オリゴヌクレオチドとともに核酸の相補鎖を形成するのに十分な期間、曝露することと、
(c)前記1つまたは複数の標識オリゴヌクレオチドを前記1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドにライゲーションすることと、任意選択で、
(d)前記1つまたは複数の標識オリゴヌクレオチドの存在を、前記1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって、検出すること、および/あるいは
(e)前記細胞を、前記1つまたは複数の標識オリゴヌクレオチドの存在に基づいて単離することであって、前記1つまたは複数の標識オリゴヌクレオチドの存在が、前記1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって決定される、単離すること
を含む、方法。
[本発明1057]
前記細胞膜が、細胞質を前記細胞の外にある点から分断する原形質膜であるか、または前記細胞膜が核膜である、本発明1056の方法。
[本発明1058]
対象の試料からの1つまたは複数の細胞から核酸を配列決定する方法であって、
(a)前記試料の領域に対応する前記1つまたは複数の細胞を容器に分割することと、
(b)前記試料の領域に対応する前記1つまたは複数の細胞を本明細書に開示されるオリゴヌクレオチドで標識することと、
(c)前記1つまたは複数の細胞から前記核酸を単離することと、
(d)前記1つまたは複数の細胞から前記核酸を配列決定することと
を含む、方法。
[本発明1059]
(e)前記1つまたは複数の細胞の各々からの配列情報をコンパイルすることをさらに含む、本発明1058の方法。
[本発明1060]
前記コンパイルするステップが、前記試料の領域に対応する前記1つまたは複数の細胞の各々の発現プロファイルを創出することを含む、本発明1058の方法。
[本発明1061]
前記核酸の前記配列情報および/または前記発現プロファイル配列決定情報を、前記試料内または前記対象内の前記1つまたは複数の細胞の空間位置に相関させることをさらに含む、本発明1059または1060の方法。
[本発明1062]
前記標識するステップが、
(w)前記1つまたは複数の細胞を、1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドに、前記アンカー-脂質修飾オリゴヌクレオチドがそれ自体を前記細胞の細胞膜内に埋め込むのに十分な期間、曝露すること、および/あるいは
(x)前記1つまたは複数の細胞を、前記アンカー-脂質修飾オリゴヌクレオチドに相補的な1つまたは複数の標識オリゴヌクレオチドに、前記アンカー-脂質修飾オリゴヌクレオチドが前記1つまたは複数の標識オリゴヌクレオチドとともに核酸の相補鎖を形成するのに十分な期間、曝露すること、および/あるいは
(y)前記1つまたは複数の標識オリゴヌクレオチドを前記1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドにライゲーションすること、および任意選択で、
(z)前記1つまたは複数の標識オリゴヌクレオチドの存在を、前記1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって、検出すること
を含む、本発明1058~1061のいずれかの方法。
[本発明1063]
前記細胞を単離するステップが、前記細胞を、前記1つまたは複数の標識オリゴヌクレオチドの存在に基づいて単離することを含み、前記1つまたは複数の標識オリゴヌクレオチドの存在が、前記1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって決定される、本発明1062の方法。
[本発明1064]
前記1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドが、
(a)第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む、第1の脂質抱合DNAオリゴヌクレオチドと、
(b)第2のハイブリダイゼーション領域および第2の脂質部分を含む、第2の脂質抱合DNAオリゴヌクレオチドであって、前記第2のハイブリダイゼーション領域が、前記第1のハイブリダイゼーション領域の逆相補体である、第2の脂質抱合DNAオリゴヌクレオチドと、
(c)第2のプライマー領域、バーコード領域、および捕捉配列からなる、第3のDNAオリゴヌクレオチドであって、前記第2のプライマー領域が、前記第1のプライマー領域の逆相補体である、第3のDNAオリゴヌクレオチドと
を含む、本発明1062の方法。
[本発明1065]
前記第1の脂質抱合DNAオリゴヌクレオチドが、5’から3’の配向で、前記第1の脂質部分と、前記第1のハイブリダイゼーション領域と、前記第1のプライマー領域と、を含む、本発明1064の方法。
[本発明1066]
前記第1の脂質抱合DNAオリゴヌクレオチドが、3’から5’の配向で、前記第1の脂質部分と、前記第1のハイブリダイゼーション領域と、前記第1のプライマー領域と、を含む、本発明1064の方法。
[本発明1067]
前記第2の脂質抱合DNAオリゴヌクレオチドが、5’から3’の配向で、前記第2のハイブリダイゼーション領域と、前記第2の脂質部分と、を含む、本発明1064の方法。
[本発明1068]
前記第2の脂質抱合DNAオリゴヌクレオチドが、3’から5’の配向で、前記第2のハイブリダイゼーション領域と、前記第2の脂質部分と、を含む、本発明1064の方法。
[本発明1069]
前記第3のDNAオリゴヌクレオチドが、5’から3’の配向で、前記第2のプライマー領域と、前記バーコード領域と、前記捕捉配列と、を含む、本発明1064の方法。
[本発明1070]
前記第3のDNAオリゴヌクレオチドが、3’から5’の配向で、前記第2のプライマー領域と、前記バーコード領域と、前記捕捉配列と、を含む、本発明1064の方法。
[本発明1071]
前記第1の脂質部分および前記第2の脂質部分が、12~28個の炭素を有する脂肪酸を含む、本発明1064の方法。
[本発明1072]
前記第1の脂質部分が、式Iの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1
が、5~25であり、n
2
が、1~25であり、Xが、NH、CH
2
、O、およびCH-Rからなる群から選択され、ここで、Rが、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである、本発明1064の方法。
[本発明1073]
前記第2の脂質部分が、式IIの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1
が、5~25であり、n
2
が、0~24であり、Xが、NH、CH
2
、O、およびCH-Rからなる群から選択され、ここで、Rが、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである、本発明1064の方法。
[本発明1075]
前記第1の脂質部分が、リグノセリン酸およびコレステロールから選択される脂質を含む、本発明1064または1072の方法。
[本発明1076]
前記第2の脂質部分が、パルミチン酸およびコレステロールから選択される脂質を含む、本発明1064または1073の方法。
[本発明1077]
前記コレステロールがコレステロール-トリエチレングリコール(TEG)である、本発明1075または1076の方法。
[本発明1078]
前記捕捉配列がポリアデニル化領域である、本発明1064、1069、または1070のいずれかの方法。
[本発明1079]
前記第1の脂質抱合DNAオリゴヌクレオチドが、配列番号1:
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、本発明1064~1078のいずれかの方法。
[本発明1080]
前記第2の脂質抱合DNAオリゴヌクレオチドが、配列番号2:
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、本発明1064~1079のいずれかの方法。
[本発明1081]
前記第3のDNAオリゴヌクレオチドが、配列番号3
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含み、Nが任意の核酸である、本発明1064~1080のいずれかの方法。
[本発明1082]
前記第1の脂質抱合DNAオリゴヌクレオチド、前記第2の脂質抱合DNAオリゴヌクレオチド、および前記第3の脂質抱合DNAオリゴヌクレオチドのうちの1つ以上が、固体支持体に結合している、本発明1064~1081のいずれかの方法。
[本発明1083]
前記固体支持体がビーズである、本発明1082の方法。
[本発明1084]
前記捕捉配列が、ポリアデニル化領域を含み、前記ビーズが、前記第3のDNAオリゴヌクレオチドの前記ポリアデニル化領域にハイブリダイズするポリ(T)領域を含む、本発明1083の方法。
[本発明1085]
対象の試料または組織内の核酸発現のパターンの空間位置を特定する方法であって、前記方法が、
(a)前記試料の領域に対応する、前記試料または前記組織からの1つまたは複数の細胞を、複数の容器のうちの1つに分割することと、
(b)前記試料の領域に対応する前記1つまたは複数の細胞を、本明細書に開示される既知のオリゴヌクレオチドで、前記既知のオリゴヌクレオチドを前記1つまたは複数の細胞に組み込むのに十分な時間、曝露することであって、各オリゴヌクレオチドは、1つまたは複数の細胞が曝露される前記複数の容器のうちの1つに固有であり、かつそれに対応する、曝露することと、
(c)前記既知のオリゴヌクレオチドに従って前記1つまたは複数の細胞から核酸を単離することと、
(d)核酸の発現を定量化すること、および/または前記1つもしくは複数の細胞から前記核酸を配列決定することと、
(e)発現プロファイルにおいて前記核酸の発現を正規化することと、
(f)前記1つまたは複数の細胞からの前記発現プロファイルを、前記試料内の、前記組織に対する、または前記組織内の前記細胞の前記空間位置に相関させることと
を含み、
前記複数の容器の各々の中の前記本明細書に開示される既知のオリゴヌクレオチドが、独立して、
(x)第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む、第1の脂質抱合DNAオリゴヌクレオチド、ならびに/または
(y)第2のハイブリダイゼーション領域および第2の脂質部分を含む、第2の脂質抱合DNAオリゴヌクレオチドであって、前記第2のハイブリダイゼーション領域が、前記第1のハイブリダイゼーション領域の逆相補体である、第2の脂質抱合DNAオリゴヌクレオチド、ならびに/または
(z)第2のプライマー領域、バーコード領域、および捕捉配列からなる、第3のDNAオリゴヌクレオチドであって、前記第2のプライマー領域が、前記第1のプライマー領域の逆相補体である、第3のDNAオリゴヌクレオチド
のうちの1つまたは組み合わせから選択される、
方法。
[本発明1086]
(g)前記細胞をフローサイトメトリーに曝露することをさらに含む、本発明1085の方法。
[本発明1087]
前記細胞を単離するステップが、前記細胞をフローサイトメトリーに曝露することを含む、本発明1085の方法。
[本発明1088]
対象の試料からの1つまたは複数の細胞から核酸を配列決定する方法であって、
(a)前記試料の領域に対応する前記1つまたは複数の細胞を容器に分割することと、
(b)前記試料の領域に対応する前記1つまたは複数の細胞を本明細書に開示されるオリゴヌクレオチドで標識することと、
(c)前記1つまたは複数の細胞から前記核酸を単離することと、
(d)前記1つまたは複数の細胞から前記核酸を配列決定することと
を含む、方法。
[本発明1089]
(e)前記1つまたは複数の細胞の各々からの配列情報をコンパイルすることをさらに含む、本発明1001の方法。
[本発明1090]
前記コンパイルするステップが、前記試料の領域に対応する前記1つまたは複数の細胞の各々の発現プロファイルを創出することを含む、本発明1002の方法。
[本発明1091]
前記核酸の前記配列情報および/または前記発現プロファイル配列決定情報を、前記試料内または前記対象内の前記1つまたは複数の細胞の空間位置に相関させることをさらに含む、本発明1089または1090の方法。
[本発明1092]
前記標識するステップが、
(w)前記1つまたは複数の細胞を、1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドに、前記アンカー-脂質修飾オリゴヌクレオチドがそれ自体を前記細胞の細胞膜内に埋め込むのに十分な期間、曝露すること、および/あるいは
(x)前記1つまたは複数の細胞を、前記アンカー-脂質修飾オリゴヌクレオチドに相補的な1つまたは複数の標識オリゴヌクレオチドに、前記アンカー-脂質修飾オリゴヌクレオチドが前記1つまたは複数の標識オリゴヌクレオチドとともに核酸の相補鎖を形成するのに十分な期間、曝露すること、および/あるいは
(y)前記1つまたは複数の標識オリゴヌクレオチドを前記1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドにライゲーションすること、および任意選択で、
(z)前記1つまたは複数の標識オリゴヌクレオチドの存在を、前記1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって、検出すること
を含む、本発明1088~1091のいずれかの方法。
[本発明1093]
前記1つまたは複数の細胞の前記核酸を単離するステップが、前記1つまたは複数の細胞を、前記1つまたは複数の標識オリゴヌクレオチドの存在に基づいて単離することを含み、前記1つまたは複数の標識オリゴヌクレオチドの存在が、前記1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって決定される、本発明1092の方法。
[本発明1094]
前記第1の脂質抱合DNAオリゴヌクレオチドが、5’から3’の配向で、前記第1の脂質部分と、前記第1のハイブリダイゼーション領域と、前記第1のプライマー領域と、を含む、本発明1085~1093のいずれかの方法。
[本発明1095]
前記第1の脂質抱合DNAオリゴヌクレオチドが、3’から5’の配向で、前記第1の脂質部分と、前記第1のハイブリダイゼーション領域と、前記第1のプライマー領域と、を含む、本発明1085~1093のいずれかの方法。
[本発明1096]
前記第2の脂質抱合DNAオリゴヌクレオチドが、5’から3’の配向で、前記第2のハイブリダイゼーション領域と、前記第2の脂質部分と、を含む、本発明1085~1093のいずれかの方法。
[本発明1097]
前記第2の脂質抱合DNAオリゴヌクレオチドが、3’から5’の配向で、前記第2のハイブリダイゼーション領域と、前記第2の脂質部分と、を含む、本発明1085~1093のいずれかの方法。
[本発明1098]
前記第3のDNAオリゴヌクレオチドが、5’から3’の配向で、前記第2のプライマー領域と、前記バーコード領域と、前記捕捉配列と、を含む、本発明1085~1093のいずれかの方法。
[本発明1099]
前記第3のDNAオリゴヌクレオチドが、3’から5’の配向で、前記第2のプライマー領域と、前記バーコード領域と、前記捕捉配列と、を含む、本発明1085~1093のいずれかの方法。
[本発明1100]
前記第1の脂質部分および前記第2の脂質部分が、12~28個の炭素を有する脂肪酸を含む、本発明1085~1099の方法。
[本発明1101]
前記第1の脂質部分が、式Iの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1
が、5~25であり、n
2
が、1~25であり、Xが、NH、CH
2
、O、およびCH-Rからなる群から選択され、ここで、Rが、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである、本発明1085~1100のいずれかの方法。
[本発明1102]
前記第2の脂質部分が、式IIの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1
が、5~25であり、n
2
が、0~24であり、Xが、NH、CH
2
、O、およびCH-Rからなる群から選択され、ここで、Rが、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである、本発明1085~1101のいずれかの方法。
[本発明1103]
前記第1の脂質部分が、リグノセリン酸およびコレステロールから選択される脂質を含む、本発明1085~1102のいずれかの方法。
[本発明1104]
前記第2の脂質部分が、パルミチン酸およびコレステロールから選択される脂質を含む、本発明1085~1103のいずれかの方法。
[本発明1105]
前記コレステロールがコレステロール-トリエチレングリコール(TEG)である、本発明1103または1104の方法。
[本発明1106]
前記捕捉配列がポリアデニル化領域である、本発明1085または1099のいずれかの方法。
[本発明1107]
前記第1の脂質抱合DNAオリゴヌクレオチドが、配列番号1:
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、本発明1085~1106のいずれかの方法。
[本発明1108]
前記第2の脂質抱合DNAオリゴヌクレオチドが、配列番号2:
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含む、本発明1085~1107のいずれかの方法。
[本発明1109]
前記第3のDNAオリゴヌクレオチドが、配列番号3
の核酸配列に対して少なくとも70%の配列同一性を有する核酸配列を含み、Nが任意の核酸である、本発明1085~1108のいずれかの方法。
[本発明1110]
前記1つまたは複数の細胞の核酸発現を配列決定するステップ、または前記1つまたは複数の細胞の前記核酸の発現を定量化するステップが、配列決定デバイスにおいて液滴マイクロフルイディクスを行うことを含む、本発明1058、1085、または1088のいずれかの方法。
[本発明1111]
前記障害が肺癌である、本発明1045の方法。
【図面の簡単な説明】
【0021】
【
図1】LMOおよび/またはCMOで標識されたヒト胎児腎臓細胞(HEK293)、マウス胎児線維芽細胞(NIH3T3)、およびヒト乳腺上皮細胞(HMEC)のフローサイトメトリー分析を示す。
【
図2】標識効率が予測可能であり、HEKの滴定シリーズにわたってスケーリングすることを示す。
【
図3】別個のLMOまたはCMOで標識された混合細胞では、HEKにおいてバーコードスクランブルの程度が無視できることを示す。
【
図4】組織培養皿に付着した状態で細胞を標識し、トリプシン処理後もシグナルが失われなかったことを示す。
【
図5】ハイブリダイゼーション配列およびプライマー領域において含む第1のDNAオリゴヌクレオチド(すなわち、「アンカー」脂質修飾オリゴヌクレオチド)の5’末端に作動可能に連結されたアンカー脂質と、第1のDNAオリゴヌクレオチドのハイブリダイゼーション配列の逆相補体であるハイブリダイゼーション配列を含む、第2のDNAオリゴヌクレオチドの3’末端に作動可能に連結されたコアンカー脂質(すなわち、コアンカー脂質修飾オリゴヌクレオチド)と、第1のDNAオリゴヌクレオチドのプライマー領域の逆相補体であるプライマー領域、バーコード領域、および捕捉配列を含む第3のDNAオリゴヌクレオチド(すなわち、「バーコード」オリゴヌクレオチド)とを含む、脂質修飾オリゴヌクレオチド複合体の概略図を示す。
【
図6】HiSeqデータで検出された単一細胞ごとの試料バーコードの比率の分布を示す。
【
図7】発現ライブラリーデータ内の細胞間の関係を視覚化し、MiSeqデータ内の関連する試料コールによって各細胞に色を付ける。
【
図8】
図8Aは、アンカー/コアンカーLMOおよびCMO足場(黒)とハイブリダイズした試料バーコードオリゴヌクレオチド(赤)の図を示す。LMOおよびCMOは、固有の親油性部分(例えば、リグノセリン酸、パルミチン酸、またはコレステロール)によって区別される。
図8Bは、MULTI-seqを使用した概念実証単一細胞RNA配列決定実験の概略図を示す。3つの試料(TGF-β刺激がある場合とない場合のHEKおよびHMEC)を、LMOまたはCMOのいずれかでバーコード化し、非標識対照と一緒に配列決定した。scRNA-seqの前に細胞を一緒にプールした。次世代配列決定は、遺伝子発現およびバーコードの存在量に対応する2つのUMIカウントマトリックスを産生する。
図8Cは、LMO標識細胞の細胞型アノテーションが、遺伝子発現空間におけるHEK(ピンク)、MEP(シアン)、およびLEP(ダークティール)の分離を実証することを示す(
図12Aを参照)。複数のマーカー遺伝子に陽性の不明瞭な細胞は、灰色で表示される。n=6,186 MULTI-seqバーコード化細胞。
図8Dは、HEK(濃い赤)、刺激されていないHMEC(緑)、およびTGF-βで刺激されたHMEC(青)のMULTI-seq試料分類が、細胞状態アノテーションと一致することを示す。ダブレット(黒)として分類された細胞は、主に不明瞭にアノテーションされた細胞とオーバーラップする。n=6,186 MULTI-seqバーコード化細胞。
図8Eは、TGF-βで刺激されたHMEC(青)が、刺激されていないHMEC(緑)と比較してTGFBI発現の上昇を呈したことを示す。***=ウィルコクソン順位和検定(両側)、p<=10~16。n=1,950 MULTI-seqバーコード化HMEC。データは、平均±SEMとして表される。
図8Fは、遺伝子発現空間でのクラスター化によって同定された各細胞型の単一核MULTI-seq試料分類比率を示す(
図12E~Gを参照)。n=5,894 MULTI-seqバーコード化核。
図8Gは、MULTI-seq試料分類が、イオノマイシンおよびPMAで様々な時間量にわたって活性化した後のJurkat細胞における一時的な遺伝子発現パターンを明らかにすることを示す。遺伝子発現空間の時点重心は、大きな円で示されている。n=3,709 Jurkat核。
図8Hは、Jurkat細胞活性化の異なる段階をマーキングする遺伝子発現のバイオリン図を示す。n=3,709 Jurkat核。
【
図9】
図9Aは、バーコード空間にマッピングされたバーコードUMIの存在量(左)およびダブレット分類(右)を示す。MULTI-seqバーコード#3を代表的な例として使用する。ダブレットは、大規模な試料多重化実験で試料群の周辺に局在する。n=25,166細胞。
図9Bは、細胞状態アノテーションが、遺伝子発現空間におけるMEP(シアン)とLEP(ダークティール)との間の分離を実証することを示す(左、
図15Aを参照)。複数のマーカー遺伝子に陽性の不明瞭な細胞は、灰色で表示される。培養組成物(右)でグループ化されたMULTI-seq分類-例えば、LEP単独(青)、MEP単独(緑)、および両方の細胞型を一緒に(濃い赤)-は、細胞状態アノテーションと一致する。アノテーションされたMEPが、MULTI-seqによってダブレットとして分類される不一致領域は、矢印で示される。n=25,166細胞。
図9Cは、MULTI-seqダブレット分類(左)およびDoubletFinderによって産生された計算予測(右)が、遺伝子発現空間で大きくオーバーラップしていることを示す。DoubletFinder定義のダブレットがMULTI-seqによってシングレットとして分類される不一致領域を矢印で示した。n=25,166細胞。
図9Dは、MEP共培養が、LEP増殖およびTGF-βシグナル伝達を誘導することを示す。休止(黒)および増殖(緑)LEPに対応するクラスターは、遺伝子発現空間で識別可能である(
図15B)。共培養されたLEP(濃い赤、左上)と単独で培養されたLEP(青、右上)の遺伝子発現空間に試料分類密度を投影すると、共培養されたLEPが増殖状態で濃縮されていることを示す(表、左下)。共培養されたLEPはまた、単独で培養されたLEPよりも多くのTGFBIを発現する。各点は、成長因子の状態に従ってグループ化されたLEPの平均を表す。***=ウィルコクソン順位和検定(両側)、p=3.1×10-6。n=32シグナル伝達分子条件群。データは、平均±SEMとして表される。
図9Eは、治療ごとにグループ化された休止LEPの階層的クラスター化およびヒートマップ分析を示す。強調された遺伝子は、既知のEGFRシグナル伝達標的である。RNA UMIの存在量は、各遺伝子について0~1の範囲でスケーリングされる。値は、各シグナル伝達分子治療群内の平均発現に対応する。樹状図ラベル:E=EGF、W=WNT4、A=AREG、I=IGF-1、R=RANKL、C=対照。
【
図10】
図10Aは、PDX実験の概要を示す。
図10Bは、バーコード空間にマッピングされたMULTI-seq試料分類(WT、初期、中期、後期腫瘍進行)を示す。複製組織は、「A」または「B」として示される。n=10,427細胞。
図10Cは、MULTI-seq分類が、低RNAおよび低品質の細胞デコンボリューションを容易にすることを示す。CellRangerは、RNA UMI数が少ない細胞バーコードを破棄する(赤い点線)。分類された低RNA細胞の遺伝子発現プロファイルは、確立された免疫細胞型を反映している(右上、
図16Fを参照)。分類されていない低RNA細胞は、低品質の単一細胞トランスクリプトームに似ている(右下、
図23を参照)。n=2,580(分類済み)、583(未分類)細胞。
図10Dは、遺伝子発現空間における肺免疫細胞の細胞状態アノテーション(上)および腫瘍ステージ(下)を示す。Mono.=単球、C=古典的、NC=非古典的、Mac.=マクロファージ、DC=樹状細胞、pDC=形質細胞様樹状細胞。不明なアノテーションを有する細胞は、灰色で表示される。n=5,965細胞。
図10Eは、WTと比較して、各腫瘍ステージの肺免疫細胞型の比率の統計的に有意な変化を示す。ボンフェローニ多重比較調整を用いた2比率z検定、*=0.05>p>10~10、**=10~10>p>10~20、***=p<10~20。n=44の腫瘍ステージ/細胞型群。統計的に有意でない比率変化は省略されている。
図10Fは、腫瘍ステージに対応する試料分類密度でオーバーレイされたサブセット化された古典的単球の遺伝子発現空間を示す。挿入図は、Thbs1およびCd14の差次的発現を特徴とする後期古典的単球内の不均一性を示す。n=2,496(すべて)、1,087(挿入図)細胞。
【
図11】
図11Aは、生細胞のLMO(金)およびCMO(紫)の標識効率が、アンカーおよびコアンカーのLMO/CMO濃度の滴定曲線全体で予測どおりに変化することを示す。ヒストグラム(上)で示される定性的傾向は、回帰分析(下)によって裏付けられており、技術的な再現性および、LMO/CMO濃度と蛍光量との間の線形関係を示している。n=10,000事象/試料。データは、3回の実験の繰り返しにわたる平均±SEMとして表される。
図11Bは、AF647またはFAM抱合バーコードプローブのいずれかで標識された生細胞集団の混合後のLMOおよびCMO足場の喪失、ならびに氷上での交換の経時的分析を示す。定性的傾向(等高線図、左)は、LMOまたはCMOで標識された細胞が、非標識対照細胞(灰色)よりも経時的に蛍光シグナルを維持する方法を示す。定量分析(右)は、試料間のクロストークが最小限であるにもかかわらず、LMO足場がCMO足場と比較してどのように原形質膜に安定して埋め込まれるかを示している。n=10,000事象/時点。実験は3回繰り返され、同様の結果が得られた。
図11Cは、核を除いて、
図11Aに記載されるものと同じ実験を示す。n=10,000事象/試料。データは、3回の実験の繰り返しにわたる平均±SEMとして表される。
図11Dは、核を除いて、
図11Bに記載されるものと同じ実験を示す。LMOとCMOとの間の膜滞留速度の差異は、核膜の標識中には発生しない。n=10,000事象/時点。
図11Eは、室温を除いて、
図11Cに記載されるものと同じ実験を示す。4℃で示された標識の安定性におけるLMOの利点は、CMO(紫)およびLMO(金)の両方の標識が同様の速度で減少するため、室温で失われる。n=10,000事象/時点。
図11Fは、生細胞を200nMのLMOまたはCMOで標識し、PBS(黒)またはPBS中の1%BSA(赤)で希釈したことを示す。細胞をペレット化し、上清を非標識細胞に移して、残りのLMOまたはCMO標識の標識効率を測定した。BSAで希釈すると、PBS単独での希釈と比較して上清標識の減少につながる。n=10,000事象/試料。データは、3回の実験の繰り返しにわたる平均±SEMとして表される。
【
図12-1】
図12Aは、集約されたLMO、CMO、および非標識対照scRNA-seqデータの細胞状態アノテーションを示す。バイオリン図は、HEK(ピンク)、MEP(シアン)、およびLEP(ダークティール)を定義するために使用されるマーカー遺伝子を示す。n=15,482細胞。
図12Bは、集約された遺伝子発現空間にマッピングされたLMO標識細胞(左)およびCMO標識細胞(右)のMULTI-seq分類を示す。LMO標識と同様に、CMO標識試料の試料分類は、予想される細胞型アノテーションと一致する。n=15,482細胞。
図12Cは、LMO標識(金)、CMO標識(紫)、および非標識対照HEK(黒)の検出されたUMIの数、検出された遺伝子の数、およびミトコンドリア遺伝子発現のパーセンテージを説明するバイオリン図(左)を示す。分布はほぼ同一であり、LMO標識および/またはCMO標識が内因性mRNAの捕捉に悪影響を及ぼさないことを示唆している。この点は、バーコードUMIおよびRNA UMIが、LMO標識細胞およびCMO標識細胞の両方でわずかに正の相関があるという観察によってさらに裏付けられ(右)、試料バーコードが、mRNA捕捉中に内因性転写物を凌駕しないことを示唆している。n=7,888HEK細胞。r=ピアソンの相関。
図12Dは、細胞がLMO標識(金)、CMO標識(紫)、または非標識(黒)のいずれであるかによって色分けされたHEK遺伝子発現空間を示し、CMO標識に特異的な下部構造を明らかにする。遺伝子発現空間における各細胞の100個の最近傍の中でのLMO、CMO、および非標識細胞の比率を定量化すると、CMO特異的下部構造が強調される。非標識細胞およびLMO標識細胞は、同様の近傍を有するが、CMO標識細胞は、遺伝子発現空間に優先的に共局在する。n=7,888HEK細胞。
図12Eは、MULTI-seqを使用した概念実証snRNA-seq実験の概要を示す。核は、LMOバーコード化および配列決定の前に、10個の別個の細胞試料(HEK(濃い赤)、MEF(青)、ならびに8つの異なる時点でイオノマイシンおよびPMAで刺激されたJurkat(緑))から単離された。CMO標識および非標識のHEKおよびMEF核を並行して配列決定した。
【
図12-2】
図12Fは、MULTI-seq分類が、Jurkat細胞(緑)、HEK(濃い赤)、およびMEF(青)の間で種特異性を呈することを示す。n=4,848(ヒト)および1,046(マウス)MULTI-seq標識核。
図12Gは、集約されたLMO、CMO、および非標識対照snRNA-seqデータの細胞状態アノテーションを示す。バイオリン図は、HEK(ピンク)およびJurkat(ダークティール)を定義するために使用されるマーカー遺伝子を示す。n=8,468ヒト核。
図12Hは、snRNA-seqデータについて
図12Cに記載されるものと同じ分析を示す。n=2,113 MEF核。r=ピアソンの相関。
図12Iは、snRNA-seqデータについて
図12Dに記載されるものと同じ分析を示す。生細胞とは異なり、LMOおよびCMO標識細胞の遺伝子発現近傍は、両方とも非標識細胞を反映しており、LMOとCMOの両方が非摂動的な単一核RNA配列決定試料の多重化を可能にすることを示唆している。n=2,113 MEF核。
【
図13】
図13Aは、96-plex HMEC scRNA-seq分析の概要を示す。LEP単独(青)、MEP単独(緑)、または両方の細胞型(濃い赤)からなる96の別個のHMEC培養物を、15の別個のシグナル伝達分子またはシグナル伝達分子の組み合わせ、および1つの対照を補足した培地で成長させた。
図13Bは、各試料バーコード群に割り当てられた細胞の数を示すヒートマップでオーバーレイされた96ウェルプレートの概略図を示す。20試料(主にカラム2から生じる試料)は、試料調製中の技術的エラーのため、元の大規模HMEC実験では表されなかった。
図13Cは、正規化されたバーコードUMIヒートマップを示し、試料群が主に単一のMULTI-seqバーコードに関連付けられていることを示している。
図13Dは、陰性細胞、ダブレット、およびシングレットのバーコードUMI SNRを表すバイオリン図を示す。n=40,009細胞。
図13Eは、96-plex HMEC技術的複製実験を除いて、
図14Aに記載されるものと同じ分析を示す。すべての試料は、技術的複製で分類された。
図13Fは、96-plex HMEC技術的複製実験を除いて、
図14Bに記載されるものと同じ分析を示す。
図13Gは、96-plex HMEC技術的複製実験を除いて、
図14Cに記載されるものと同じ分析を示す。n=48,091細胞。
【
図14】96-plex HMEC実験の結果が、バーコード分類ワークフローの代表的な例として使用されることを示す。半教師あり陰性細胞再分類ワークフローの代表的な例として使用される、96-plexの技術的複製HMEC実験の結果。PDF=確率密度関数。
【
図15】
図15Aは、遺伝子発現空間におけるMEP(KRT14)およびLEP(KRT19)の同定に使用されるマーカー遺伝子発現の分布を示す。n=25,166細胞。
図15Bは、LEP(左)およびMEP(右)の遺伝子発現空間におけるMKI67発現の分布を示す。MKI67濃縮は、増殖性および休止状態のLEPとMEPを区別するためのプロキシとして使用された。n=6,159(LEP)および14,428(MEP)細胞。
図15Cは、LEPと共培養されたMEPが、単一培養で生育されたMEPと比較して増殖するように誘導されないことを示す。休止(黒)および増殖(青)LEPに対応するクラスターは、遺伝子発現空間で同定可能である(
図15B)。共培養されたMEP(赤、左)および単独で培養されたMEP(緑、中央)の遺伝子発現空間に試料分類密度を投影すると、両方の培養組成が等しく増殖することがわかる(表、右)。n=14,428細胞。
図15Dは、LEPと共培養されたMEPが、単一培養で生育されたMEPと比較して、(TGFBI発現によって測定されるように)濃縮されたTGF-βシグナル伝達を呈することを示す。各点は、シグナル伝達分子の処理に従ってグループ化されたMEPの平均を表す。***=ウィルコクソン順位和検定(両側)、p=1.5×10-6。n=32のシグナル伝達分子条件群。データは、平均±SEMとして表される。
図15Eは、シグナル伝達分子治療によってグループ化されたMEPの階層的クラスター化およびヒートマップ分析を示し、EGFおよびAREG治療に特異的なEGFRシグナル伝達転写応答を強調する。樹状図ラベル:E=EGF、W=WNT4、A=AREG、I=IGF-1、R=RANKL、C=対照。
【
図16】
図16Aは、肺組織の代表的な組織学を示し、初期、中期、および後期のPDXマウスにおける転移進行を示す。個々の転移は、黒い矢印で示される。H&E染色は、3回(初期)、4回(中期)、10回(後期)行われ、同じ結果が得られた。
図16Bは、陰性細胞再分類が、試料分類結果を改善することを示す。シングレット(黒)は、バーコード空間のクラスターに局在するが、ダブレット(赤)は、シングレットクラスター間に局在する。陰性細胞は、シングレットまたはダブレットクラスター(青い輪郭、下)と共局在するか、または別々にクラスター化する(赤い輪郭、下)。陰性細胞再分類は、別々にクラスター化する真陰性の影響を受けないが、シングレットとダブレットの間でクラスター化する偽陰性のサブセットをレスキューする。n=12,086細胞。
図16Cは、MULTI-seqバーコード条件の生存率(上)または総細胞数(nCell、下)に従って順序付けられた試料間のバーコードSNR比較を示す。詳細は
図22を参照されたい。データは、平均±SEMとして表される。n=10,427細胞。
図16Dは、組織源に応じて色分けされた遺伝子発現空間のマウス免疫細胞を示す。肺免疫細胞(茶色)は、原発腫瘍免疫細胞(ティール)とは別にクラスター化する。n=8,420細胞。
図16Eは、FACS濃縮中に検出され、最終的な10Xデータセットで検出されたマウス(ピンク)およびヒト(青)細胞の比率を表す棒グラフを示す。L-A肺からのヒトおよびマウス細胞の分類は、試料分類の精度および種の独立を示す。
図16Fは、細胞型アノテーションの定義に利用されるマーカーを記述したマーカー遺伝子ヒートマップを示す。RNA UMIの存在量は、各遺伝子について0~1の範囲でスケーリングされる。値は、各アノテーション群内の平均発現に対応する。表示された遺伝子は、各細胞型の統計的に有意な上位3つの遺伝子を表す(ボンフェローニ多重比較調整による単一細胞遺伝子発現の尤度比検定)。
図16Gは、古典的単球の教師なしクラスター化が、転移進行による細胞間不均一性を再現することを示す(
図10Dに表示)。差次的遺伝子発現解析結果については
図25を参照されたい。n=2,496細胞。
【
図17】バルクHMECをFITC抗EpCAMおよびAPC-Cy7抗CD49fで標識して、LEPおよびMEPを同定および単離したことを示す。LEPは、EpCAM高およびCD49f低として同定され、MEPは、CD49f高およびEpCAM低として同定される。ゲーティング戦略により、最終的に選別された集団にわずかな細胞型不純物が生じる
【
図18】
図18Aは、生きたシングレットをゲーティングした後、hCD298およびmCD45を使用して、解離したヒト転移とマウス免疫細胞を解離したPDXマウスの肺から分離したことを示す。ここでは、代表的な例としてマウス847(試料L-A)が提示される。
図18Bは、生きたシングレットをゲーティングした後、hCD298およびmCD45を使用して、解離したヒト原発腫瘍細胞およびマウス腫瘍関連免疫細胞を分離したことを示す。試料Aは、他のすべての原発腫瘍試料の代表的な例としてここに提示される。
【
図19】
図19Aは、cDNA増幅後のバイオアナライザートレースを示し、1.8×100%イソプロパノールを含む3.2×SPRIを使用したMULTI-seqバーコード濃縮は、2つの別個のピークを呈する。バイオアナライザートレースは、この研究で提示されたすべてのデータセットの代表である(n=4)。最初のピーク(p1)は、長さが平均65~70bpであり、MULTI-seq添加剤プライマーを介して増幅されたバーコードに対応する可能性がある。第2のピーク(p2)は、長さが平均100bpであり、MMLV-RTaseテンプレートスイッチングに成功し、その後標準の10X Genomics Single Cell V2プライマーによって増幅されたバーコードに対応する可能性がある。
図19Bは、ライブラリー調製後のバイオアナライザー分析を示す。PCRは、予想に一致する平均長173bpの1つの別個のピーク(p3)を呈する。バイオアナライザートレースは、この研究で提示されたすべてのデータセットの代表である(n=4)。
図19Cは、テンプレートスイッチングを用いる場合と用いない場合の2種の逆転写MULTI-seqバーコードを示す概略図を示す。テンプレートスイッチングを用いない進行性逆転写(p1)は、テンプレートスイッチングを用いる逆転写(p2)よりも可能性が高く、cDNA増幅後の65~70bpの産生物が比較的濃縮される。
【
図20】
図8に関連して、LMO/CMO標識HEKと非標識HEKとの発現差が1.5倍を超える遺伝子のリストを示す。
【
図21】MULTI-seqバーコード配列決定統計を示す。
【
図23】
図10に関連して、分類されたデータセットおよび分類されていないデータセット内の各低RNAクラスターの上位5つのマーカー遺伝子を示す。
【
図24】
図10に関連して、転移進行の別個の段階で古典的単球間の発現差が1.5倍を超える遺伝子のリストを示す。
【
図25】
図10に関連して、後期の古典的単球間の発現差が1.5倍を超える遺伝子のリストを示す。
【
図26】
図26A~26Gは、バーコードが対象における発現プロファイルの空間位置に対応する多層プレートの一連の容器内のセグメントにおける組織の各1mm切片の固有のバーコードを使用することにより、配列発現プロファイルを試料または組織との空間位置に相関させる実験を示す。
【
図27】
図27A~27Fは、バーコードが対象における発現プロファイルの空間位置に対応する多層プレートの一連の容器内のセグメントにおける組織の各1cm切片の固有のバーコード化を使用することにより、配列発現プロファイルを試料または組織との空間位置に相関させる実験を示す。
【発明を実施するための形態】
【0022】
態様の詳細な説明
本開示は、脂質修飾または疎水性アンカーオリゴヌクレオチド、および脂質修飾または疎水性アンカーオリゴヌクレオチドを含む組成物を提供する。脂質修飾または疎水性アンカーオリゴヌクレオチドの合成方法、そのような脂質修飾または疎水性アンカーオリゴヌクレオチドを含む組成物、および例えば、単一細胞RNA配列決定を化学スクリーニングまたは多重摂動の他の方法に連結する際のそのような脂質修飾または疎水性アンカーオリゴヌクレオチドおよびその組成物の使用もまた提供される。単一細胞RNA配列決定ベースのスクリーニングアプローチから得ることができる豊富な情報は、CRISPRベースおよびショートヘアピンRNAベースの遺伝子摂動技法の最近の開発で実証されている。これらの方法は、配列決定データに遺伝子摂動特異的バーコードを導入する。
【0023】
例示的な実施形態が説明される前に、本開示が、説明される特定の実施形態に限定されず、そのようなものとして、当然のことながら変化し得ることを理解されたい。本明細書で使用される用語は、特定の実施形態を説明するためのものであるにすぎず、本開示の範囲が添付の特許請求の範囲のみによって限定されるため、限定的であることは意図されないことも理解されたい。
【0024】
値の範囲が提供される場合、文脈上別段に明確に記載していない限り、その範囲の上限と下限の間にある各それぞれの介在値はまた、下限の単位の10分の1まで、具体的に開示されることは理解される。記載された範囲の記載された何らかの値または介在値と、その記載された範囲の何らかの他の値または介在値との間の、より小さな各範囲は、本開示に包含される。これらのより小さい範囲の上限および下限は、独立してこの範囲の中に包含または除外され得、こうした限界のいずれか、または両方が、より小さな範囲に含まれる各範囲、またはいずれも含まれない各範囲も、本開示の範囲内に包含され、記載された範囲内で何らかの具体的に除外された制限を受ける。記載された範囲が限界の一方または両方を含む場合、それらの含まれる限界のうちのいずれかまたは両方を除外する範囲も、本開示に含まれる。
【0025】
別途定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、この本開示が属する当業者に一般に理解される意味と同じ意味を有する。本明細書に説明されるものと同様または同等の何らかの方法および材料は、開示される実施形態の実施または試験において使用することができるが、いくつかの見込みのある例示的な方法および材料をここで説明し得る。本明細書で言及されるいかなるおよびすべての公開物は、公開物が引用されるものとの関連で方法および/または材料を開示し、説明するために、参照によりそれら全体が本明細書に組み込まれる。本開示は、矛盾が存在する限り、組み込まれた公開物のいかなる開示にも優先することが理解される。
【0026】
本明細書および添付の特許請求の範囲で使用される場合、単数形「a」、「an」、および「the」は、文脈が別途明確に指示しない限り、複数の指示物を含むことに必ず留意されたい。したがって、例えば、「脂質修飾オリゴヌクレオチド」に対する参照は、複数のそのような脂質修飾オリゴヌクレオチドを含み、「オリゴヌクレオチド」に対する参照は、1つ以上のオリゴヌクレオチドへの参照を含む、などである。
【0027】
特許請求の範囲は、任意であり得るいかなる要素も除外するように立案され得ることにさらに留意される。このようなものとして、この陳述は、特許請求の要素の列挙に関連して「専ら」、「唯一の」およびこれらに類するものなど排他的な用語の使用または「否定的な」制限の使用のための先行基準としての役割を担うことを意図している。
【0028】
本明細書に論じられる公開物は専ら、本出願の出願日前のそれらの開示のためだけに提供される。本明細書内のいかなるものも、本開示がそのような公開物に先立する権利がないことを認めるものと解釈されるべきではない。さらに、示されている公開日は、実際の公開日とは異なる場合があり、別個に確認する必要があり得る。このような公開物が、本開示の明示的または暗示的な定義と矛盾する用語の定義を示すことができる範囲で、本開示の定義は制御する。
【0029】
本開示を読むと当業者には明らかであるように、本明細書に説明され例証された個々の実施形態の各々は、本開示の範囲または趣旨から逸脱することなく、他のいくつかの実施形態のいずれかの特徴から容易に分離され得るか、または組み合わせられ得る別個の要素および特徴を有する。いかなる列挙された方法も、引用された事象の順序で、または論理的に可能な何らかの他の順序で実施することができる。
【0030】
定義
本組成物および方法を説明する前に、本開示は、記載される特定の分子、組成物、方法論、またはプロトコルに限定されないこと(これらは様々であり得るため)を理解されたい。説明で使用される用語は、特定のバージョンまたは実施形態を説明することのみを目的としており、添付の特許請求の範囲によってのみ限定される本開示の範囲を限定することを意図しないことも理解されたい。これらの実施形態は、記載される特定の方法論、プロトコル、細胞株、ベクター、および試薬に限定されないこと(これらは様々であり得るため)を理解されたい。また、本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、本実施形態または特許請求の範囲を限定することを意図するものではないことも理解されたい。
【0031】
別途定義されない限り、本明細書で使用されるすべての技術的および科学的用語は、当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載のものと類似または同等の任意の方法および材料を、本開示の実施形態の実施または試験に使用することができるが、好ましい方法、デバイス、および材料を次に説明する。本明細書で言及されるすべての刊行物は、参照により組み込まれる。本明細書内のいかなるものも、事前の開示により、本開示がそのような開示に先立する権利がないことを認めるものと解釈されるべきではない。
【0032】
本明細書および特許請求の範囲において本願で使用される場合、不定冠詞「a」および「an」は、反対のことが明確に示されない限り、「少なくとも1つ」を意味すると理解されるべきである。
【0033】
本明細書および特許請求の範囲において本願で使用される場合、「および/または」という句は、そのように結合された要素、すなわち、ある場合には接続的に存在し、他の場合には離接的に存在する要素の「いずれかまたは両方」を意味すると理解されるべきである。「および/または」節によって具体的に特定される要素以外の他の要素は、反対のことが明確に指示されない限り、具体的に特定されるそれらの要素に関連するか否かにかかわらず、任意選択的に存在してもよい。したがって、非限定的な例として、「含む」などの非限定的用語と組み合わせて使用される場合、「Aおよび/またはB」への言及は、一実施形態では、Bを含まないA(任意選択的にB以外の要素を含む)を指し、別の実施形態では、Aを含まないB(任意選択的にA以外の要素を含む)を指し、さらに別の実施形態では、AおよびBの両方(任意選択的に他の要素を含む)などを指す。
【0034】
本明細書および特許請求の範囲において本願で使用される場合、「または」は、上記で定義された「および/または」と同じ意味を有すると理解されるべきである。例えば、列挙中の項目を区切る場合、「または」または「および/または」は、包括的、すなわち、いくつかのまたは列挙の要素のうちの少なくとも1つを含むが、2つ以上、および任意選択で、追加の列挙されていない項目を含むと解釈されるべきである。「のうちの1つのみ」または「のうちの正確に1つ」などの反対のことが明確に指示される用語のみ、または特許請求の範囲で使用される場合、「からなる」は、いくつかのまたは列挙の要素のうちの正確に1つの要素を含むことを指す。概して、本明細書で使用される場合、「または」という用語は、排他性の用語である「いずれか」、「のうちの一方」、「のうちの一方のみ」、または「のうちの正確に1つ」が先行する場合、排他的代替(すなわち、「一方または他方、しかし両方ではない」)を示すものとしてのみ解釈されるべきであり、特許請求の範囲で使用される場合、「本質的にからなる」は、特許法の分野で使用されるその通常の意味を有するものとする。
【0035】
量、時間的持続時間などの測定可能な値を指すときに本明細書で使用される「約」という用語は、指定された値からの±20%、±10%、±5%、±1%、または±0.1%の変動を、開示された方法を実施するためにそのような変動が適切であるときに包含することを意味する。
【0036】
本明細書で使用される場合、「X~Yの整数」という句は、エンドポイントを含む任意の整数を意味する。つまり、範囲が開示される場合、エンドポイントを含む範囲内の各整数が開示される。例えば、「X~Yの整数」という句は、1、2、3、4、または5、ならびに1~5の範囲を開示する。
【0037】
「脂質修飾オリゴヌクレオチド」、「脂質-DNA」、「疎水性アンカーオリゴヌクレオチド」という用語および同様の用語は、「脂質修飾オリゴヌクレオチド」、「脂質-DNA」、「疎水性アンカーオリゴヌクレオチド」、またはその一部が実際に膜に挿入されているかどうかに関係なく、膜に挿入することができる、疎水性、親油性、または両親媒性領域に何らかの手段で結合する任意のオリゴヌクレオチドまたはポリヌクレオチドを含むと広く解釈されるべきである。
【0038】
「膜」という用語または何らかの同様の用語は、何らかの脂質含有膜、細胞膜、核膜、単層、二重層、小胞、リポソーム、脂質二重層などを指すために、本明細書中で広範かつ総称的に使用され、本開示は、何らかの特定の膜に限定されるよう意味するものではない。
【0039】
本明細書で使用される場合、交換可能に使用される「対象」、「個体」、または「患者」という用語は、マウス、ラット、他のげっ歯類、ウサギ、イヌ、ネコ、ブタ、ウシ、ヒツジ、ウマ、またはヒトなどの霊長類などの哺乳動物を含む任意の動物を意味する。
【0040】
本明細書で使用される場合、「キット」という用語は、ヌクレオチドを配列決定する、および/またはヌクレオチド配列を単離する、および/または存在、不在、および/または試料もしくは細胞から発現したヌクレオチド配列の量に基づいて、疾患または感染を有する対象を診断するためのシステムの文脈において提供される構成要素のセットを指す。そのようなシステムは、例えば、1つもしくは複数の細胞(例えば、適切な容器内のオリゴヌクレオチド、酵素をコードするオリゴヌクレオチド、細胞外マトリックス成分など)、および/またはある場所から別の場所への支持材料(例えば、緩衝液、培地、細胞、アッセイを実行するための書面による指示など)における発現された遺伝子の保存、同定、または送達を可能にするシステムを含み得る。例えば、いくつかの実施形態では、キットは、関連する反応試薬および/または支持材料を含む1つ以上のエンクロージャー(例えば、ボックス)を含む。本明細書で使用される場合、「断片化されたキット」という用語は、各々がキットの全構成要素の一部を含む2つ以上の別々の容器を含む診断アッセイを指す。容器は、意図した受取人に一緒にまたは別々に送達される場合がある。例えば、第1の容器は、細胞培養アッセイで使用するための固体支持体またはポリスチレンプレートを含み得、一方、第2の容器は、対照細胞などの細胞を含み得る。別の例として、キットは、本明細書に開示される1つまたは複数のバイオマーカーに対する親和性を有する1つまたは複数のリガンドを有するチップまたはスライドなどの固体支持体を含む第1の容器と、試料中の脂質修飾オリゴヌクレオチドの量の検出および/または定量化に必要な任意の1つまたは複数の試薬を含む第2の容器と、を含み得る。「断片化されたキット」という用語は、連邦食品・医薬品・化粧品法のセクション520(e)に基づいて規制される分析物特異的試薬(ASR)を含むキットを包含することを意図しているが、これに限定されない。各々がキットの全構成要素の一部を含む2つ以上の別々の容器を含む任意の送達システムは、「断片化されたキット」という用語に含まれる。対照的に、「組み合わされたキット」は、すべての構成要素を単一の容器に(例えば、所望の構成要素の各々を収容する単一のボックスに)含む送達システムを指す。「キット」という用語には、断片化されたキットと組み合わされたキットの両方が含まれる。
【0041】
本明細書で使用される場合、「動物」という用語は、ヒト、および非ヒト脊椎動物、例えば、野生動物、ラット、フェレットなどのげっ歯類、ならびに家畜、ならびにイヌ、ネコ、ウマ、ブタ、ウシ、ヒツジ、およびヤギなどの農場動物などの非ヒト脊椎動物を含むが、これらに限定されない。いくつかの実施形態では、動物は哺乳動物である。いくつかの実施形態では、動物はヒトである。いくつかの実施形態では、動物は、非ヒト哺乳動物である。
【0042】
本明細書で使用される場合、「哺乳動物」という用語は、げっ歯類(すなわち、マウス、ラット、またはモルモット)、サル、ネコ、イヌ、ウシ、ウマ、ブタ、またはヒトなどの哺乳綱の任意の動物を意味する。いくつかの実施形態では、哺乳動物はヒトである。いくつかの実施形態では、哺乳動物は、任意の非ヒト哺乳動物を指す。本開示は、試料が哺乳動物または非ヒト哺乳動物から採取される、本明細書に開示される問題の方法または組成物のいずれにも関する。本開示は、試料がヒトから採取される、本明細書に開示される問題の方法または組成物のいずれかに関する。
【0043】
本明細書で使用される場合、「それを必要とする」という句は、動物または哺乳動物が、バイオマーカーの存在、不在、および/または量に基づいて必要とされる特定の方法または治療の必要性を有すると特定されているか、またはその疑いがあることを意味する。いくつかの実施形態では、特定は、いずれの診断または観察手段によるものであってもよい。本明細書に記載される方法および治療のいずれにおいても、動物または哺乳動物はそれを必要とし得る。いくつかの実施形態では、動物または哺乳動物は、特定の障害または状態が蔓延している、または発生する可能性が高い環境にあるか、またはその環境に移動する予定である。
【0044】
「核酸」、「オリゴヌクレオチド」、および「ポリヌクレオチド」という用語の特定の使用は決して限定的であると考えられるべきではなく、本明細書では相互交換可能に使用され得る。関連する核酸分子が典型的には約100塩基未満を含む場合、「オリゴヌクレオチド」が使用される。関連する核酸分子が典型的には約100塩基超を含む場合、「ポリヌクレオチド」が使用される。両方の用語は、DNA、RNA、修飾または合成のDNAまたはRNA(合成および天然に存在する塩基類似体を含む核酸、ジデオキシまたは他の糖、チオールまたは他の非天然もしくは天然ポリマー骨格を含むがこれらに限定されない)、あるいはDNAおよび/またはRNAにハイブリダイズすることができる他の核酸塩基含有ポリマーを示すために使用される。したがって、これらの用語は、本明細書で言及および使用される核酸の長さを定義または制限するように解釈されるべきではなく、また、これらの用語は、核酸塩基が結合するポリマー骨格の性質を制限するために使用されるべきではない。
【0045】
本開示のポリヌクレオチドは、一本鎖、二本鎖、三本鎖であり得、またはこれらの立体配座の組み合わせを含み得る。概して、ポリヌクレオチドは、ホスホジエステル結合を含有するが、いくつかの場合、以下の概略するように、ホスホラミド、ホスホロチオアート、ホスホロジチオアート、O-メチルホスホロアミダイト結合、ならびにペプチド核酸骨格および結合を含む代替的な骨格を有し得る核酸類似体が含まれる。他の類似体核酸には、モルホリノ、ロック核酸(LNA)、ならびに正の骨格、非イオン骨格、および非リボース骨格を有するものが含まれる。1つ以上の炭素環式糖を含有する核酸も、核酸の定義に含まれる。リボース-リン酸骨格のこれらの修飾は、標識などの追加の部分の付加を容易にするため、または生理学的環境におけるこのような分子の安定性および半減期を増大させるために行われ得る。
【0046】
「核酸配列」または「ポリヌクレオチド配列」という用語は、ヌクレオチド塩基の連続鎖を指し、特に、ポリヌクレオチド中に現れる場合に、互いに関連するヌクレオチド塩基の特定の配置も指す。
【0047】
本明細書で使用される場合、「含む(comprising)」(ならびに「comprise」、「comprises」、および「comprised」などのcomprisingの任意の形態)、「有する(having)」(ならびに「「have」および「has」などのhavingの任意の形態)、「含む(including)」(ならびに「includes」および「include」などのincludingの任意の形態)、または「含む(containing)」(ならびに「contains」および「contain」などのcontainingの任意の形態)は、包括的かつ非限定的であり、追加の引用されていない要素または方法ステップを除外しない。
【0048】
本明細書で使用される場合、「蛍光発生プローブ」という用語は、既知の波長の光への曝露時に既知および/または検出可能な波長の光を放出する任意の分子(色素、ペプチド、もしくは蛍光マーカー)を指す。いくつかの実施形態では、1つまたは複数の動物または単細胞生物によって発現される酵素のうちのいずれかによって認識可能な既知の切断部位を有する基質またはペプチド。いくつかの実施形態では、蛍光発生プローブは、本明細書に開示される1つまたは複数のオリゴヌクレオチド配列のうちのいずれに付着する。いくつかの実施形態では、本明細書に開示されるオリゴヌクレオチドへの蛍光発生プローブの付着は、酵素への曝露が、蛍光光度計または分光光度計の存在下で定量化可能な反応産物を作成するように、酵素および既知の波長の光への基質の曝露時に蛍光発光または発光が可能なキメラ分子を作成する。いくつかの実施形態では、蛍光発生プローブは、基質の酵素的切断の前に既知の波長の光に曝露されると完全にクエンチされ、蛍光発生プローブは、既知の波長の光を放出し、その強度は、蛍光光度計の存在下、および任意選択で、結合しているオリゴヌクレオチドからのプローブの切断後に、吸光度の読み取りまたは強度レベルによって定量化可能である。いくつかの実施形態では、蛍光発生プローブは、所定の波長の光の存在下または曝露下で測定可能または定量化可能な蛍光発光スペクトルを有するクマリンベースの色素またはローダミンベースの色素である。いくつかの実施形態では、蛍光発生プローブは、ローダミンを含む。いくつかの実施形態では、蛍光発生プローブは、ローダミン-100を含む。クマリンベースの蛍光発生プローブは、当該技術分野において、例えば、米国特許第7625758号および同第7863048号において既知であり、これらは、参照によりそれら全体が本明細書に組み込まれる。いくつかの実施形態では、蛍光発生プローブは、本明細書に開示される酵素のうちのいずれかに対する1つまたは複数の基質に対する、共有結合される、非共有結合される、挿入される成分である。いくつかの実施形態では、蛍光発生プローブは、ACCまたはAMCから選択される。いくつかの実施形態では、蛍光発生プローブは、フルオレセイン分子である。いくつかの実施形態では、蛍光発生プローブは、本明細書に開示される1つまたは複数の脂質修飾オリゴヌクレオチドの切断を触媒する1つまたは複数の酵素への曝露後に、蛍光光度計によって検出可能および/または定量化可能な共鳴波を放出することができる。
【0049】
本明細書で使用される場合、「スコア」という用語は、診断、予後、または試料中の発現遺伝子の存在、不在、または量の可能性についての予測モデルの構成要素として使用できる単一の値を指し、この単一の値は、システムで測定された機能またはメトリックに基づいて、生データ値を対照値と組み合わせるか、または対照値に対して正規化することによって計算される。いくつかの実施形態では、スコアは、解釈関数またはアルゴリズムを介して計算される。いくつかの実施形態では、対象は、感染症または過剰増殖性細胞を有することが疑われる、発症するリスクがある、または有する。
【0050】
本明細書で使用される場合、「スコア」という用語は、対象の診断、予後、または臨床治療計画についての予測モデルの構成要素として使用できる単一の値を指し、この単一の値は、システムで測定された機能またはメトリックに基づいて、生データ値を対照値と組み合わせるか、または対照値に対して正規化することによって計算される。いくつかの実施形態では、スコアは、解釈関数またはアルゴリズムを介して計算される。いくつかの実施形態では、対象は、病状を獲得する可能性を促進または寄与する遺伝子の発現を有することが疑われるか、またはその発現が病原体の存在と相関している。
【0051】
本明細書に開示される脂質修飾オリゴヌクレオチドの検出を容易にするために、例えば、検出可能な物質は、表面、例えば、プレート、ウェル、ビーズ、または1つもしくは複数の反応容器を含む他の固体支持体に事前に適用され得る。いくつかの実施形態では、試料は、それが表面に適用される前に、希釈剤または試薬と事前に混合され得る。検出可能な物質は、視覚的にまたは機器デバイスによって検出可能な脂質オリゴヌクレオチドとして機能し得る。視覚的にまたは機器デバイスによって検出可能なシグナルを一般に産生することができる任意の物質を、検出プローブとして使用することができる。好適な検出可能な物質には、例えば、発光性化合物(例えば、蛍光性、リン光性など)、放射性化合物、視覚的化合物(例えば、着色染料もしくは金などの金属物質)、リポソームまたはシグナル生成物質を含む他の小胞、酵素および/または基質などが含まれ得る。他の好適な検出可能な物質は、Jouらの米国特許第5,670,381号およびTarchaらの米国特許第5,252,459号に記載され得、これらはあらゆる目的のために参照によりそれら全体が本明細書に組み込まれる。検出可能な物質が色付けされている場合、理想的な電磁放射は、相補的な波長の光である。例えば、青色の検出プローブは、赤色光を強く吸収する。いくつかの実施形態では、脂質修飾オリゴヌクレオチドは、プローブを含む。いくつかの実施形態では、検出可能なプローブは、試料中の脂質オリゴヌクレオチドのレベルまたは量に対応する光学的に検出可能なシグナルを生成する発光化合物を含むか、またはそれからなる。例えば、好適な蛍光分子は、フルオレセイン、ユーロピウムキレート、フィコビリタンパク質、フィコエリスリン、フィコシアニン、アロフィコシアニン、o-フタルアルデヒド、フルオレサミン、ローダミン、ならびにそれらの誘導体および類似体を含み得るが、これらに限定されない。他の好適な蛍光化合物は、一般に「量子ドット」と称される半導体ナノ結晶である。例えば、そのようなナノ結晶は、式CdXのコアを含み得、式中、Xは、Se、Te、Sなどである。ナノ結晶はまた、式YZの上にあるシェルで不動態化することができ、式中、Yは、CdまたはZnであり、Zは、SまたはSeである。好適な半導体ナノ結晶の他の例はまた、Barbera-Guillemらの米国特許第6,261,779号およびDapprichの米国特許第6,585,939号にも記載され得、これらはあらゆる目的のために参照によりそれら全体が本明細書に組み込まれる。
【0052】
さらに、好適なリン光化合物には、ルテニウム、オスミウム、レニウム、イリジウム、ロジウム、白金、インジウム、パラジウム、モリブデン、テクネチウム、銅、鉄、クロム、タングステン、亜鉛などの1つ以上の金属の金属錯体が含まれ得る。特に好ましいのは、ルテニウム、レニウム、オスミウム、白金、およびパラジウムである。金属錯体は、水性または非水性環境における錯体の溶解性を促進する1つ以上のリガンドを含み得る。例えば、リガンドのいくつかの好適な例には、ピリジン、ピラジン、イソニコチンアミド、イミダゾール、ビピリジン、ターピリジン、フェナントロリン、ジピリドフェナジン、ポルフィリン、ポルフィン、およびそれらの誘導体が含まれるが、これらに限定されない。そのようなリガンドは、例えば、アルキル、置換アルキル、アリール、置換アリール、アラルキル、置換アラルキル、カルボキシレート、カルボキサルデヒド、カルボキサミド、シアノ、アミノ、ヒドロキシ、イミノ、ヒドロキシカルボニル、アミノカルボニル、アミジン、グアニジニウム、ウレイド、硫黄含有基、リン含有基、およびN-ヒドロキシ-スクシンイミドのカルボキシレートエステルで置換され得る。
【0053】
ポルフィリンおよびポルフィリン金属錯体は、メチレンブリッジと一緒にカップリングされたピロール基を持ち、金属キレート内部空洞を持つ環状構造を形成する。これらの分子の多くは、好適な溶媒(例えば、水)および無酸素環境において、室温で強いリン光特性を示す。リン光特性を示すことができるいくつかの好適なポルフィリン錯体には、白金(II)コプロポルフィリン-IおよびIII、パラジウム(II)コプロポルフィリン、ルテニウムコプロポルフィリン、亜鉛(II)-コプロポルフィリン-I、それらの誘導体などが含まれるが、これらに限定されない。同様に、リン光特性を示すことができるいくつかの好適なポルフィン錯体には、白金(II)テトラ-メソ-フルオロフェニルポルフィンおよびパラジウム(II)テトラ-メソ-フルオロフェニルポルフィンが含まれるが、これらに限定されない。さらに他の好適なポルフィリンおよび/またはポルフィン錯体は、Schmidtらの米国特許第4,614,723号、Hendrixの米国特許第5,464,741号、Soiniの米国特許第5,518,883号、Ewartらの米国特許第5,922,537号、Sagnerらの米国特許第6,004,530号、およびPonomarevらの米国特許第6,582,930号に記載されており、これらはあらゆる目的のために参照することによりそれら全体が本明細書に組み込まれる。
【0054】
本明細書で使用される場合、「配列同一性」は、2つの配列をブラストするためのスタンドアロンの実行可能BLASTエンジンプログラム(bl2seq)を使用することによって決定され、これはデフォルトパラメータを使用して、国立バイオテクノロジー情報センター(National Center for Biotechnology Information、NCBI)のftpサイトから取得することができる(Tatusova and Madden,FEMS Microbiol Lett.,1999,174,247-250、これは参照によりその全体が本明細書に組み込まれる)。「に相同」という用語を使用することは、測定された「配列同一性」と同義である。
【0055】
本明細書で使用される場合、「試料」という用語は、概して、あるものの限られた量を指し、これは、そのもののより多くの量に類似し、それを代表することが意図される。本開示において、試料は、本明細書に開示されるアッセイまたは方法について試験される収集、綿棒、ブラッシング、掻き取り、生検、除去された組織、または外科的切除である。いくつかの実施形態では、試料は、過剰増殖性細胞を含むと考えられる患者または対象から採取される。いくつかの実施形態では、感染を含むと考えられる試料は、1つまたは複数の細胞を含まないことがわかっている「対照試料」と比較される。いくつかの実施形態では、病原体細胞を含むと考えられる試料は、病原体細胞を含まないことがわかっている対照試料と比較される。いくつかの実施形態では、過剰増殖性細胞を含むと考えられる試料は、過剰増殖性細胞を含まないことがわかっている「対照試料」と比較される。いくつかの実施形態では、試料は、実験室のベンチまたは医療機器などの環境領域または場所のブラッシングである。本開示は、本明細書に開示される任意の1つまたは複数の方法を使用して、遺伝子の潜在的に有害な発現の量、または特定のアイテムもしくは場所における有害な病原体または有害な細胞の量を、有害な遺伝子またはヌクレオチド配列に基づいて同定、検出、および/または定量することを企図する。
【0056】
「相補的」または「相補性」という用語は、塩基対形成則によって関連するポリヌクレオチド(すなわち、ヌクレオチドの配列)を指す。例えば、配列「5’-AGT-3’」は、配列「5’-ACT-3’」に相補的である。相補性は、核酸の塩基の一部のみが塩基対形成則によって一致する「部分的」であってもよく、または核酸間に「完全な」もしくは「完全な」相補性が存在してもよい。核酸鎖間の相補性の程度は、規定された条件下での核酸鎖間のハイブリダイゼーションの効率および強度に大きな影響を及ぼし得る。これは、核酸塩基間の結合に依存する方法にとって特に重要である。
【0057】
本明細書に開示される任意のプローブは、抗体であり得る。本明細書で使用される「抗体」という用語は、抗原の抗原決定基の特徴に相補的な内部表面形状および電荷分布を有する三次元結合空間を有するポリペプチド鎖の折り畳みから形成される少なくとも1つの結合ドメインから構成されるポリペプチドまたはポリペプチドの群を指す。抗体は、典型的には、ポリペプチド鎖の2つの同一の対を含む四量体形態を有し、各対は、1つの「軽」鎖および1つの「重」鎖を有する。各軽鎖/重鎖対の可変領域は、抗体結合部位を形成する。本明細書で使用される場合、「標的結合剤」は、標的部位に優先的に結合する抗体またはその結合フラグメントである。一実施形態では、標的結合剤は、1つの標的部位のみに特異的である。他の実施形態では、標的結合剤は、2つ以上の標的部位に特異的である。一実施形態では、標的結合剤は、モノクローナル抗体であり得、標的部位は、本明細書に開示される修飾オリゴヌクレオチドのうちの1つ以上を含む細胞の表面上のエピトープまたは抗原であり得る。。抗体の「結合フラグメント」は、組み換えDNA技法によって、またはインタクトな抗体の酵素的もしくは化学的切断によって産生される。結合フラグメントには、Fab、Fab’、F(ab’)2、Fv、および単鎖抗体が含まれる。「二重特異性」または「二機能性」抗体以外の抗体は、その結合部位の各々が同一であると理解されている。抗体は、過剰な抗体が、カウンター受容体に結合する受容体の量を(インビトロ競合結合アッセイにおいて測定して)少なくとも約20%、40%、60%、または80%、より通常は約85%よりも多く低減する場合、カウンター受容体への受容体の接着を実質的に阻害する。抗体は、単独の、または既知の技法によって提供される他のアミノ酸配列と組み合わせたオリゴクローナル、ポリクローナル抗体、モノクローナル抗体、キメラ抗体、CDR移植抗体、多重特異性抗体、二重特異性抗体、触媒抗体、キメラ抗体、ヒト化抗体、完全ヒト抗体、抗イディオタイプ抗体、および可溶性または結合形態で標識することができる抗体、ならびにそれらのフラグメント、変異体、またはそれらの誘導体であり得る。抗体はいかなる種に由来してもよい。抗体という用語はまた、本発明の抗体の結合フラグメントを含み、例示的なフラグメントには、Fv、Fab、Fab’、一本鎖抗体(svFC)、二量体可変領域(ダイアボディ)、および二硫化物安定化可変領域(dsFv)が含まれる。本明細書で論じられるように、抗体または免疫グロブリン分子のアミノ酸配列のわずかな変化は、アミノ酸配列の変化が本明細書に記載される抗体または免疫グロブリン分子に少なくとも75%、より好ましくは少なくとも80%、90%、95%、および最も好ましくは99%の配列同一性を維持するという条件で、本発明に含まれることが企図される。特に、保存的アミノ酸置換が企図される。保存的置換は、関連する側鎖を有するアミノ酸のファミリー内で行われるものである。遺伝的にコードされたアミノ酸は、一般的にファミリーに分けられる:(1)酸性=アスパラギン酸塩、グルタミン酸塩、(2)塩基性=リジン、アルギニン、ヒスチジン、(3)非極性=アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、トリプトファン、および(4)非電荷極性=グリシン、アスパラギン、グルタミン、システイン、セリン、スレオニン、チロシン。より好ましいファミリーは次のとおりである。セリンおよびスレオニンは、脂肪族ヒドロキシファミリーであり、アスパラギンおよびグルタミンは、アミドを含むファミリーであり、アラニン、バリン、ロイシン、およびイソロイシンは、脂肪族であり、ならびにフェニルアラニン、トリプトファン、およびチロシンは、芳香族である。例えば、ロイシンのイソロイシンまたはバリンへの単独置換、アスパラギン酸塩のグルタミン酸塩への置換、スレオニンのセリンへの置換、またはアミノ酸の構造的に関連するアミノ酸への同様の置換は、特に置換がフレームワーク部位内のアミノ酸を含まない場合、得られる分子の結合機能または特性に対する主要な影響を有しない。アミノ酸の変化が機能性ペプチドをもたらすかどうかは、ポリペプチド誘導体の比活性をアッセイすることによって容易に決定することができる。アッセイは、本明細書に詳細に記載されている。抗体または免疫グロブリン分子のフラグメントまたは類似体は、当業者によって容易に調製することができる。フラグメントまたは類似体の好ましいアミノ末端およびカルボキシ末端は、機能ドメインの境界近くに生じる。構造的および機能ドメインは、ヌクレオチドおよび/またはアミノ酸配列データを公的または独自の配列データベースと比較することによって同定することができる。好ましくは、コンピュータ化された比較方法を使用して、既知の構造および/または機能の他のタンパク質で生じる配列モチーフまたは予測されるタンパク質立体配座ドメインを同定する。既知の3次元構造に折りたたまれるタンパク質配列を同定する方法は既知である。例えば、参照によりその全体が組み込まれる、Bowie et al.Science 253:164(1991)を参照されたい。抗体は、従来の技法を使用してフラグメント化することができ、フラグメントは、抗体全体について上記したのと同じ方法で有用性についてスクリーニングすることができる。例えば、F(ab’)2フラグメントは、抗体をペプシンで処理することによって生成することができる。得られたF(ab’)2フラグメントを処理して、ジスルフィド架橋を還元し、Fab’フラグメントを産生することができる。
【0058】
本発明はまた、1つまたは複数のキメラ抗体誘導体、すなわち、非ヒト動物可変領域およびヒト定常領域を組み合わせる抗体分子を使用することを企図する。キメラ抗体分子は、例えば、ヒト定常領域を有する、マウス、ラット、または他の種の抗体からの抗原結合ドメインを含み得る。キメラ抗体を作製するための様々なアプローチが記載されており、分化細胞または腫瘍細胞の表面上の選択された抗原を認識する免疫グロブリン可変領域を含むキメラ抗体を作製するために使用することができる。例えば、Morrison et al.,1985;Proc.Natl.Acad.Sci.U.S.A.81,6851、Takeda et al.,1985,Nature 314:452、Cabillyらの米国特許第4,816,567号、Bossらの米国特許第4,816,397号、Tanaguchiらの欧州特許公開第EP171496号、欧州特許公開第0173494号、英国特許第GB2177096B号を参照されたい。開示された方法のうちのいずれかにおいて、方法は、表1に示される任意の1つまたは複数の酵素への基質の曝露後に既知の基質の切断によって生成される反応生成物のうちのいずれかに対して親和性を有する任意の抗体を曝露することを含み得る。
【0059】
化学的抱合は、E-アミノ基またはヒンジ領域チオール基を持つホモおよびヘテロ二機能性試薬の使用に基づいている。5,5’-ジチオビス(2-ニトロ安息香酸)(DNTB)などのホモ二機能性試薬は、2つのFab間にジスルフィド結合を生成し、0-フェニレンジマレイミド(O-PDM)は、2つのFab間にチオエーテル結合を生成する(Brenner et al.,1985、Glennie et al.,1987)。N-スクシンイミジル-3-(2-ピリジルジチオ)プロピオネート(SPDP)などのヘテロ二機能性試薬は、クラスまたはアイソタイプに関係なく、抗体の露出アミノ基およびFabフラグメントを組み合わせる(Van Dijk et al.,1989)。
【0060】
本開示のアッセイデバイスを使用して、対象から単離された試料または細胞における脂質修飾オリゴヌクレオチドもしくは核酸配列またはそれらの機能的フラグメントの存在または非存在を試験するために、様々なフォーマットを使用することができる。例えば、「サンドイッチ」フォーマットは、典型的に、試験試料を、分析物の特異的結合メンバー(例えば、抗体)と抱合した脂質修飾核酸配列と混合して、分析物と抱合プローブとの間に複合体を形成することを含む。次いで、これらの複合体は、検出ゾーン内に固定化された受容材料(例えば、抗体)と接触することができる。結合は、分析物/プローブ抱合複合体と固定化された受容材料との間で起こり、それにより、本明細書に開示される細胞のうちのいずれか1つ上の分析物または抗原の存在を示すために検出可能な「サンドイッチ」複合体を局在化する。この技法を使用して、定量的または半定量的な結果を得ることができる。そのようなサンドイッチ型アッセイのいくつかの例は、米国特許第4,168,146に記載されている。
【0061】
本明細書で使用される場合、「ハイブリダイゼーション」という用語は、相補的な核酸の対形成に関して使用される。ハイブリダイゼーションおよびハイブリダイゼーションの強度(すなわち、核酸間の会合の強度)は、核酸間の相補性の程度、関与する条件のストリンジェンシー、および形成されたハイブリッドのTmなどの因子によって影響される。「ハイブリダイゼーション」方法は、ある核酸の、別の相補的な核酸、すなわち相補的なヌクレオチド配列を有する核酸へのアニーリングを包含する。
【0062】
ハイブリダイゼーションは、特定のハイブリダイゼーションを可能にする条件で実施される。相補的な配列の長さ、2次構造、およびGC含有量は、標的部位の標的核酸への特異的ハイブリダイゼーションを得るために必要なハイブリダイゼーション条件の熱融点Tmに影響を及ぼす。ハイブリダイゼーションは、ストリンジェントな条件下で実施することができる。「ストリンジェントなハイブリダイゼーション条件」という句は、プローブが、典型的には核酸の複雑な混合物において、その標的部分配列にハイブリダイズするが、検出可能または有意なレベルの他の配列にはハイブリダイズしない条件を指す。ストリンジェントな条件は配列に依存し、異なる条件では異なる。ストリンジェントな条件は、塩濃度が約6~約8の間のpHで約1.0Mナトリウムイオン未満、例えば約0.01M未満であり(約0.001M~約1.0Mのナトリウムイオン濃度(または他の塩)を含む)、温度が約20℃~約65℃の範囲である条件である。ストリンジェントな条件はまた、ホルムアミドなどであるがこれに限定されない不安定化剤を添加することによって達成することもできる。
【0063】
本開示のオリゴヌクレオチド配列、核酸配列、または他の薬剤は、とりわけ、薬学的に許容される塩、エステル、またはアミドとして投与することができる。「塩」という用語は、本開示の化合物の無機塩および有機塩を指す。塩は、化合物の最終的な単離および精製中にその場で調製することができるか、または遊離塩基もしくは酸形態の精製化合物を、好適な有機もしくは無機塩基もしくは酸と別々に反応させ、こうして形成された塩を単離することによって調製することができる。代表的な塩には、臭化水素酸塩、塩酸塩、硫酸塩、重硫酸塩、硝酸塩、酢酸塩、シュウ酸塩、パルミチン酸塩、ステアリン酸塩、ラウリン酸塩、ホウ酸塩、安息香酸塩、乳酸塩、リン酸塩、トシル酸塩、クエン酸塩、マレイン酸塩、フマル酸塩、コハク酸塩、酒石酸塩、ナフチル酸塩、メシル酸塩、グルコヘプトン酸塩、ラクトビオン酸塩、ラウリルスルホン酸塩などが挙げられる。塩は、ナトリウム、リチウム、カリウム、カルシウム、マグネシウムなどのアルカリおよびアルカリ土類金属に基づくカチオン、ならびに非毒性アンモニウム、第4級アンモニウム、およびアミンカチオンを含み得る(限定されないが、アンモニウム、テトラメチルアンモニウム、テトラエチルアンモニウム、メチルアミン、ジメチルアミン、トリメチルアミン、トリエチルアミン、エチルアミンなどを含む)。例えば、S.M.Berge,et al.,″Pharmaceutical Salts,″J Pharm Sci,66:1-19(1977)を参照されたい。いくつかの実施形態では、本明細書に開示される組成物は、本明細書に開示されるオリゴヌクレオチド配列の1つまたは複数の塩を含む。
【0064】
「熱融点」、「融解温度」、または「Tm」という用語は、本明細書では、標的に相補的なプローブの50%が標的配列に平衡状態でハイブリダイズする(規定されたイオン強度、pH、および核酸濃度の下での)温度を指す(標的配列が過剰に存在すると、Tmにおいて、プローブの50%が平衡状態で占有される)。いくつかの場合、「Td」という用語は、プローブの少なくとも半分が、完全に一致した標的核酸から解離する温度を規定するために使用される。
【0065】
対応するヌクレオチド間にすべて完全に形成された水素結合を有する二本鎖分子の形成は、「一致」または「完全に一致」と呼ばれ、対応しないヌクレオチドの単一またはいくつかの対を有する二本鎖は、「不一致」と呼ばれる。一本鎖RNAまたはDNA分子の任意の組み合わせは、適切な実験条件下で二本鎖分子(DNA:DNA、DNA:RNA、RNA:DNA、またはRNA:RNA)を形成することができる。同様に、合成類似体は、適切な条件下で、互いに、またはRNAおよびDNAと二本鎖分子を形成することができる。
【0066】
「選択的に(または特異的に)ハイブリダイズする」という句は、特定のヌクレオチド配列が、複合体混合物(例えば、全細胞のまたはライブラリーのDNAまたはRNA)中に存在する場合、ストリンジェントなハイブリダイゼーション条件下でその配列にのみ分子が結合、二本鎖形成、またはハイブリダイズすることを指す。当業者は、代替的なハイブリッド形成条件および洗浄条件を利用して類似のストリンジェンシーの条件を提供することができることを容易に認識することになっており、パラメータの組み合わせがいかなる単一のパラメータの尺度よりもはるかに重要であることを認識することになっている。
【0067】
「結合」は、高分子間の(例えば、タンパク質と核酸との間の)配列特異的な非共有相互作用を指す。相互作用が全体として配列特異的である限り、結合相互作用のすべての成分が配列特異的である必要はない(例えば、DNA骨格のリン酸残基との接触)。このような相互作用は、一般に、10-6M-1以下の解離定数(Kd)によって特徴付けられる。「親和性」は、結合の強さを指し、結合親和性の増加は、より低いKdと相関している。
【0068】
核酸またはアミノ酸配列同一性の文脈で使用される「実質的に類似する」という用語は、少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する2つ以上の配列を指す。
【0069】
本明細書で使用される場合、「%配列同一性」は、European Molecular Biology Laboratory(EMBL)の一部であるThe European Bioinformatics Institute(EMBL-EBI)から入手可能なEMBOSS Pairwise Alignment Algorithmsツールを用いて決定される。このツールは、「www.」を「ebi.ac.uk/Tools/emboss/align/」の前に置くことによって位置付けられたウェブサイトからアクセスできる。このツールは、Needleman-Wunsch包括的整列化アルゴリズムを利用する(Needleman,S.B.and Wunsch,C.D.(1970)J.Mol.Biol.48,443-453、Kruskal,J.B.(1983)An overview of sequence comparison In D.Sankoff and B.Kruskal,(ed.),Time warps,string edits and macromolecules:the theory and practice of sequence comparison,pp.1-44 Addison Wesley。Gap Open:10.0とGap Extend 0.5とを含むデフォルト設定を利用する。デフォルトマトリックス「Blosum62」はアミノ酸配列に利用し、デフォルトマトリックス「DNAfull」は核酸配列に利用する。
【0070】
「作動可能に連結された」という用語は、2つ以上の構成要素(配列要素など)の並置を指し、構成要素は、両方の構成要素が正常に機能し、構成要素のうちの少なくとも1つが、他の構成要素のうちの少なくとも1つに対する機能を媒介できる可能性を可能にするように配置される。
【0071】
本明細書で使用される「バーコード」は、その同一性(例えば、タグDNA配列)を使用して試料中のポリヌクレオチドを区別することができる、ポリヌクレオチドに関連するタグまたはタグの組み合わせを指す。ある特定の実施形態では、ポリヌクレオチド上のバーコードを使用して、ポリヌクレオチドが由来する供給源を同定する。例えば、核酸試料は、異なる供給源に由来するポリヌクレオチドのプールであり得(例えば、異なる個体、異なる組織もしくは細胞に由来するポリヌクレオチド、または異なる時点で単離されたポリヌクレオチド)、ここで、異なる各供給源からのポリヌクレオチドは、固有のバーコードでタグ付けされる。このように、バーコードは、ポリヌクレオチドとその供給源との間の相関関係を提供する。ある特定の実施形態では、バーコードを用いて、試料中の個々のポリヌクレオチドを固有にタグ付けする。試料中の固有のバーコードの数を特定することで、試料に存在する個々のポリヌクレオチドの数を(または操作されたポリヌクレオチド試料が得られた元のポリヌクレオチドの数から)読み取ることができる。例えば、参照によりその全体が本明細書に組み込まれる、米国特許第7,537,897号を参照されたい。バーコードは、長さが約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または約100ヌクレオチド塩基以上の範囲であり得、複数のサブユニットを含んでもよく、ここで、異なる各バーコードは、サブユニットの別個の同一性および/または順序を有する。バーコードとして使用される例示的な核酸タグは、米国特許第7,544,473号および米国特許第7,393,665号に記載されており、これらは両方とも、核酸タグの説明およびオリゴヌクレオチドの同定におけるそれらの使用について、参照によりそれら全体が本明細書に組み込まれる。ある特定の実施形態では、複数の試料にタグ付けするために用いられるバーコードのセットは、本明細書に記載される方法が多種多様な固有のバーコードセットに対応できるため、任意の特定の共通特性(例えば、Tm、長さ、塩基組成など)を有する必要はない。ここで強調されるのは、バーコードが所与の実験内でのみ固有である必要があるということである。したがって、同じバーコードを使用して、異なる実験で処理されている異なる試料にタグ付けすることができる。さらに、ある特定の実験では、ユーザーは、同じバーコードを使用して、同じ実験内の異なる試料のサブセットにタグ付けすることができる。例えば、特定の表現型を有する個体に由来するすべての試料を同じバーコードでタグ付けすることができる。例えば、対照(または野生型)対象に由来するすべての試料を第1のバーコードでタグ付けすることができ、病状のある対象を第2のバーコード(第1のバーコードとは異なる)でタグ付けすることができる。別の例として、同じ供給源から得られた異なる試料を異なるバーコードでタグ付けすることが望ましい場合がある(例えば、時間の経過とともに得られた試料、または組織内の異なる部位から得られた試料)。さらに、バーコードは、様々な異なる方法で、例えば、1つのバーコードをライゲーションによって付加し、第2のバーコードをプライマー伸長によって付加するコンビナトリアルタグ付けアプローチによって生成され得る。いくつかの実施形態では、複数の固有のバーコードを同じ試料に付加して、他の試料に対するその固有性を高めることができる。あるいは、1つのバーコードが、試料のクラス(例えば、ウェルプレート)を表し、第2または第3のバーコードが、そのプレート内の特定のウェルを表し得る。いくつかの実施形態では、試料は、複数のバーコードオリゴヌクレオチドを脂質修飾または疎水性アンカーオリゴヌクレオチドにハイブリダイズすることによって複数のバーコードでタグ付けすることができるか、または試料は、複数のバーコード脂質修飾または疎水性アンカーオリゴヌクレオチドで標識することができる。いくつかの実施形態では、個々の細胞は、スプリット・プール標識を介してバーコード化され、プール内の他のすべての細胞とは異なる固有のバーコードプロファイルを生成することができる。したがって、バーコードは、処理および分析中にポリヌクレオチドフラグメントを追跡するための様々な異なる方法で設計および実装することができ、したがって、この点に関する制限は意図されていない。
【0072】
「ポリメラーゼ連鎖反応」または「PCR」は、DNAの相補鎖の同時プライマー伸長による特定のDNA配列のインビトロ増幅のための反応を意味する。言い換えれば、PCRは、プライマー部位に隣接する標的核酸の複数のコピーまたは複製を作製するための反応であり、そのような反応は、(i)標的核酸を変性させるステップ、(ii)プライマーをプライマー部位にアニーリングするステップ、および(iii)ヌクレオシド三リン酸塩の存在下で核酸ポリメラーゼによってプライマーを伸長するステップの1回以上の繰り返しを含む。通常、反応は、サーマルサイクラー機器の各ステップに最適化された異なる温度で循環する。特定の温度、各ステップでの持続時間、およびステップ間の変化率は、例えば、参考文献:McPherson et al,editors,PCR:A Practical Approach and PCR2:A Practical Approach(それぞれIRL Press,Oxford,1991および1995)によって例示される、当業者に周知の多くの要因に依存する。例えば、Taq DNAポリメラーゼを使用する従来のPCRでは、二本鎖標的核酸は、>90℃の温度で変性され、プライマーは、50~75℃の範囲の温度でアニーリングされ、プライマーは、72~78℃の範囲の温度で伸長される。「PCR」という用語は、RT-PCR、リアルタイムPCR、ネステッドPCR、定量的PCR、マルチプレックスPCRなどを含むがこれらに限定されない、反応の派生形態を包含する。反応量は、数百ナノリットル、例えば200nLから数百μL、例えば200μLの範囲である。「逆転写PCR」または「RT-PCR」とは、標的RNAを相補的な一本鎖DNAに変換し、次いで増幅される逆転写反応が先行するPCRを意味する。例えば、Tecottらの米国特許第5,168,038号(この特許は、参照により本明細書に組み込まれる)。「リアルタイムPCR」は、反応が進行するにつれて反応生成物、すなわちアンプリコンの量がモニターされるPCRを意味する。リアルタイムPCRには多くの形態があり、主に反応生成物のモニタリングに使用される検出化学が異なる。例えば、Gelfandらの米国特許第5,210,015号(「TAQMAN(登録商標)」)、Wittwerらの米国特許第6,174,670号および同第6,569,627号(インターカレーター色素)、Tyagiらの米国特許第5,925,517号(分子ビーコン)(これらの特許は、参照により本明細書に組み込まれる)。リアルタイムPCRの検出化学は、Mackay et al,Nucleic Acids Research,30:1292-1305(2002)において概説されており、これもまた参照により本明細書に組み込まれる。「ネステッドPCR」は、第1のPCRのアンプリコンが、新しいプライマーのセットを使用する第2のPCRの試料となり、その少なくとも1つが第1のアンプリコンの内部位置に結合する、2段階PCRを意味する。本明細書で使用される場合、ネステッド増幅反応に関する「初期プライマー」は、第1のアンプリコンを生成するために使用されるプライマーを意味し、「二次プライマー」は、第2の、またはネステッドアンプリコンを生成するために使用される1つ以上のプライマーを意味する。「マルチプレックスPCR」は、複数の標的配列(または単一の標的配列および1つ以上の参照配列)が、同じ反応混合物中で同時に実行されるPCRを意味する。例えば、Bernard et al.,Anal.Biochem.273:221-28(1999)(2色リアルタイムPCR)。通常、増幅されている各配列に別個のプライマーセットが用いられる。
【0073】
「過剰増殖性細胞」という用語は、癌性、前癌性、過形成性、または老化性であり、正常に有糸分裂を進行することができない細胞を意味する。いくつかの実施形態では、過剰増殖性細胞は、腫瘍細胞である。いくつかの実施形態では、過剰増殖性細胞は、細胞が同じ型の細胞よりも速く増殖し、代謝的に安定であるように、アポトーシスを欠くかまたは代謝的に不安定にする機能不全の細胞周期を含む。
【0074】
本明細書で使用される場合、「発現」は、ポリヌクレオチドがDNAテンプレートから(例えば、mRNAまたは他のRNA転写物に)転写されるプロセスおよび/または転写されたmRNAがその後にペプチド、ポリペプチド、またはタンパク質に翻訳されるプロセスを指す。転写物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ばれることがある。ポリヌクレオチドがゲノムDNAに由来する場合、発現には真核細胞でのmRNAのスプライシングが含まれる場合がある。
【0075】
「機能的フラグメント」という用語は、フラグメントが基づく完全長ポリペプチドまたは核酸に少なくとも類似する、または実質的に類似する生物学的影響を付与するのに十分な長さであり、十分な構造を有する、それぞれの完全長ポリペプチドまたは核酸が関連するポリペプチドまたは核酸配列の任意の部分を意味する。いくつかの実施形態では、機能的フラグメントは、本明細書に開示される核酸配列のうちのいずれか1つをコードする完全長または野生型核酸配列の一部であり、当該部分は、完全長よりも短いが、完全長または野生型タンパク質と比較して依然として生物学的に機能しているドメインをコードする、ある特定の長さおよび/または構造のポリペプチドをコードする。いくつかの実施形態では、機能的フラグメントは、フラグメントが基づいている野生型または完全長ポリペプチド配列と比較して、低減した生物学的活性、ほぼ同等の生物学的活性、または増強された生物学的活性を有し得る。いくつかの実施形態では、機能的フラグメントは、ヒトなどの生物の配列に由来する。そのような実施形態では、機能的フラグメントは、配列が由来する野生型ヒト配列に対して99%、98%、97%、96%、95%、94%、93%、92%、91%、または90%の配列同一性を保持し得る。いくつかの実施形態では、機能的フラグメントは、配列が由来する野生型配列またはヌクレオチドのオリゴ部分に対して85%、80%、75%、70%、65%、または60%の配列相同性を保持し得る。
【0076】
脂質修飾オリゴヌクレオチド
本開示は、組成物、および最近開発された脂質抱合または疎水性アンカーオリゴヌクレオチドの特定のセットを使用する細胞バーコード化方法に組成物を使用して、別個の患者または試験条件に由来する単一細胞を効率的に標識する方法に関する。オリゴヌクレオチドバーコード(PCRハンドル、固有の識別子、および捕捉配列で操作された)は、その後、液滴マイクロフルイディクスベースのRNA配列決定ライブラリーの調製のために処理された細胞および細胞のサブセットに導入することができる。
【0077】
二成分系を介して細胞原形質膜内に脂質修飾オリゴヌクレオチドを安定して埋め込むことは、Selden et al.,J.Am.Chem.Soc.134:765-68(2012)、Weber et al.,BioMacromolecules 15:4621-26(2014)、および公開済み米国特許出願第2017/0305955号に開示されており、各々が参照によりそれら全体が本明細書に組み込まれる。
【0078】
本明細書に開示される脂質修飾オリゴヌクレオチドの1つの一般的かつ非限定的な例を
図5に提示する。この脂質修飾オリゴヌクレオチドは、3つのオリゴヌクレオチドを含む:5’から3’の配向で、第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む第1のオリゴヌクレオチド、5’から3’の配向で、第2のハイブリダイゼーション領域および第2の脂質部分を含む第2のオリゴヌクレオチド(第2のハイブリダイゼーション領域は、第1のハイブリダイゼーション領域の逆相補体である)、および5’から3’の配向で、第2のプライマー領域、バーコード領域、および捕捉配列を含む第3のオリゴヌクレオチド(第2のプライマー領域は、第1のプライマー領域の逆相補体である)。
【0079】
本開示はまた、マイクロフルイディクスおよび標識された核酸に関する。例えば、ある特定の態様は、概して、例えば、細胞から生じるマイクロ流体液滴または他の区画内の核酸を標識するためのシステムおよび方法を対象とする。一組の実施形態では、例えば、粒子の表面に付着した標的核酸を決定するために使用され得るオリゴヌクレオチドを含む粒子が調製され得る。オリゴヌクレオチドは、例えば、核酸が一緒にプールされるか、または液滴から除去された後でも、液滴中の核酸を別の液滴中の核酸から区別するために使用され得る「バーコード」または固有の配列を含み得る。本発明のある特定の実施形態は、概して、追加または任意の配列を、マイクロ流体液滴または他の区画、例えば、液滴内に存在すると疑われる所望の配列を選択的に決定または増幅するために使用され得る認識配列内の核酸に付着させるためのシステムおよび方法を対象とする。そのようなシステムは、例えば、ハイスループット配列決定アプリケーションなどの様々なアプリケーションでの選択的増幅に有用であり得る。
【0080】
本開示のいくつかの態様は、概して、マイクロ流体液滴または他の好適な区画、例えば、マイクロウェルプレートのマイクロウェル、スライド上の個々のスポット、または他の表面など内に脂質修飾または疎水性アンカーオリゴヌクレオチドを含む核酸を含むまたはカプセル化するためのシステムおよび方法を対象とする。場合によっては、核酸およびオリゴヌクレオチドを一緒にライゲーションまたは結合させることができる。核酸は、溶解した細胞、細胞小器官、または液滴内の他の物質から生じ得る。液滴内のオリゴヌクレオチドは、他の液滴中、例えば、複数の液滴または液滴の集団内のオリゴヌクレオチドと区別可能であり得る。例えば、オリゴヌクレオチドは、様々な液滴間で異なる1つ以上の固有の配列または「バーコード」を含み得る。したがって、各液滴内の核酸は、核酸に関連するバーコードを決定することによって固有に同定され得る。これは、例えば、液滴が「破壊」または破裂し、その後、例えば、配列決定または他の分析のために、異なる液滴からの核酸が一緒に複合またはプールされる場合に重要であり得る。
【0081】
本開示は、1つまたは複数の脂質修飾オリゴヌクレオチドを含む細胞に関し、ここで、脂質修飾オリゴヌクレオチドは、脂質部分領域、および任意選択で、捕捉領域を含む。いくつかの実施形態では、細胞は、過剰増殖性細胞、細胞株からの形質転換細胞、または対象もしくは患者から単離された初代細胞である。
【0082】
脂質部分領域
いくつかの実施形態では、脂質部分領域は、アルキル鎖、およびアルケニル鎖、アルキル鎖、アリール鎖、またはアラルキル鎖を含む。このアルケニル、アルキル、アリール、またはアラルキル鎖は、約12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上の炭素原子を含み得る。いくつかの実施形態では、アルキル鎖は、約12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上の炭素原子を含み、アルケニル、アルキル、アリール、または、アラルキル鎖は、約12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上の炭素原子を含む。いくつかの実施形態において、鎖は同じ数の炭素原子を共有する。他の実施形態では、一方の鎖は、もう一方の鎖よりも約1、2、3、4、5、6、7、8、9、または10個より少ない炭素原子を有する。脂質部分領域は、複数のアルケニル、アリール、またはアラルキル鎖を含み得、各鎖は、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上の炭素原子を含む。
【0083】
いくつかの実施形態では、脂質部分領域は、1つ以上の不飽和炭素結合を含有し得る。いくつかの実施形態において、不飽和結合はすべて同じ鎖内に含有される。さらに他の実施形態では、不飽和結合は、2つ以上の鎖に含有されていてもよい。
【0084】
ある特定の実施形態では、脂質部分領域は、ジアルキルホスホグリシエリドを含み、ポリヌクレオチドは、ジアルキルホスホグリシエリドに抱合される。いくつかの実施形態において、ジアルキルホスホグリシエリドの各鎖は、もう一方の鎖と同じ数の炭素原子を有する。他の実施形態において、炭素原子の数は、ジアルキルホスホグリシエリドの2つのアルキル鎖の間で異なる。いくつかの実施形態では、各鎖は、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上の炭素原子を有する。いくつかの実施形態において、各鎖は、約12個の炭素原子、または約14個の炭素原子、約16個の炭素原子、約18個の炭素原子、約20個の炭素原子、または約22個の炭素原子を有する。いくつかの実施形態において、少なくとも1つの鎖は、約12個の炭素原子、約14個の炭素原子、約16個の炭素原子、約18個の炭素原子、約20個の炭素原子、または約22個の炭素原子を有する。
【0085】
脂質部分領域は、モノアルキルアミドを含み得、ポリヌクレオチドは、モノアルキルアミドに抱合され得る。いくつかの実施形態では、モノアルキルアミド鎖は、約12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または約100個以上の炭素原子を有する。いくつかの実施形態では、モノアルキルアミド鎖は、約12個の炭素原子、または約14個の炭素原子、約16個の炭素原子、約18個の炭素原子、約20個の炭素原子、または約22個の炭素原子を有する。ある特定の実施形態において、モノアルキルアミドは、約16または18個の炭素原子を含む。
【0086】
他の実施形態では、脂質部分領域およびポリヌクレオチドは、リン酸基を含む化合物によって接合される。他の実施形態では、脂質部分領域およびポリヌクレオチドは、尿素基を含む化合物によって接合される。さらに他の実施形態では、脂質部分領域およびポリヌクレオチドは、スルホニル基を含む化合物によって接合される。別の実施形態では、脂質部分領域およびポリヌクレオチドは、スルホンアミド、エーテル、チオエーテル、カルバメート、またはカーボネート基を含む化合物によって接合される。
【0087】
さらに他の実施形態では、脂質部分領域は、ステロール基を含み得る。いくつかの実施形態では、ステロール基は、天然もしくは合成であり得るか、またはポリヌクレオチドへの結合に使用される官能基を担持する(または担持するように修飾された)ステロール化合物に由来し得る。例えば、生物源からのステロールは、通常、遊離ステロールアルコール、アシル化(ステロールエステル)、アルキル化(ステリルアルキルエーテル)、硫酸化(コレステロール硫酸塩)、またはそれ自体がアシル化され得るグリコシド部分(ステリルグリコシド)に連結したもの(アシル化ステロールグリコシド)として見られる(例えば、Fahy et al.,J.Lipid Res.46:839-61(2005)を参照。この参考文献は、その全体が組み込まれる)。例としては、(1)動物源から入手可能なステロール(本明細書では、動物ステロールコレステロールおよびある特定のステロイドホルモンなどの「動物ステロール」と称される)、ならびに(2)植物、真菌、および海洋源から得られるステロール(本明細書では、植物ステロール、カンペステロール、シトステロール、スチグマステロール、およびエルゴステロールなどの「フィトステロール」と称される)が挙げられる。これらのステロールは、一般に、通常、環Aの3位、別の位置、またはそれらの組み合わせで、少なくとも1つの遊離ヒドロキシル基を担持するか、または必要に応じて好適なヒドロキシルまたは他の官能基を組み込むように修飾することができる。
【0088】
特に興味深いステロールは、ポリヌクレオチドへの付着のための固有の官能基を担持する単純なステロールである。特に興味深いのは、固有の官能基がヒドロキシルである単純なステロールであり、特に、環Aの3位に位置するヒドロキシル基を有する単純なステロールアルコール(例えば、コレステロール、β-シトステロール、スチグマステロール、カンペステロール、およびブラシカステロール、エルゴステロールなど、ならびにそれらの誘導体)である。
【0089】
コレステロールは、脂質部分領域に含めるためのある特定の実施形態では特に興味深い。対象となるコレステロールクラス(置換コレステロールを含む)の代表的なステロールには、例えば、以下が含まれる:(1)コレステロール(羊毛)、コレステロール(植物由来)、デスモステロール、スチグマステロール、β-シトステロール、チオコレステロール、3-コレステリルアクリレートなどの天然および合成ステロール、(2)コレスタノールおよびコレステノンなどのA環置換オキシステロール、ならびに(3)7-ケトコレステロール、5α、6α-エポキシコレスタノール、5β、6β-エポキシコレスタノール、および7-デヒドロコレステロールなどのB環置換オキシステロール、(4)25-ケトコレステンおよび15-ケトコレスタンなどのD環置換オキシステロール、(5)25-ヒドロキシコレステロール、27-ヒドロキシコレステロール、24(R/S)-ヒドロキシコレステロール、24(R/S),25-エポキシコレステロール、および24(S),25-エポキシコレステロールなどの側鎖置換オキシステロール、(6)24-ジヒドロラノステロールおよびラノステロールなどのラノステロール、(7)F7-コレステロール、F7-5α、6α-エポキシコレスタロール、F7-5β、6β-エポキシコロスタノール、およびF7-7-ケトコレステロールなどのフッ素化ステロール、(8)25-NBDコレステロール、デヒドロエルゴステロール、およびコレステロールトリエンなどの蛍光コレステロール。これらの化合物には、重水素化および非重水素化バージョンも含まれる場合があり、Avanti Polar Lipids,Incなどから市販されている。
【0090】
ある特定の実施形態では、脂質部分領域は、飽和または不飽和、直鎖状または分岐鎖状、置換または非置換脂肪族鎖を含み得る。特に興味深いのは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の炭素を有する飽和または不飽和、直鎖状または分岐鎖状、置換または非置換の炭化水素鎖である。
【0091】
さらなる実施形態は、脂肪酸、ジセロ脂質、グリセロリン脂質、スフィンゴ脂質、プレノール脂質、ポリプレノール脂質、および糖脂質のような様々な脂質に基づくか、または由来する、例えば、Fahy et al.,J.Lipid Res.46:839-61(2005)に記載される脂質に由来するエレメントを含み得る。
【0092】
「アンカー」脂質修飾または疎水性アンカーオリゴヌクレオチド(例えば、5’から3’の配向または3’から5’の配向で、第1の脂質部分、第1のハイブリダイゼーション領域、および第1のプライマー領域を含む脂質修飾オリゴヌクレオチド)および「コアンカー」脂質修飾または疎水性アンカーオリゴヌクレオチド(例えば、5’から3’の配向または3’から5’の配向で、第2のハイブリダイゼーション領域および第2の脂質部分を含む脂質修飾オリゴヌクレオチド、ここで、第2のハイブリダイゼーション領域は、第1のハイブリダイゼーション領域の逆相補体である)は、同じ脂質部分または異なる脂質部分(例えば、異なる炭素鎖長、異なる組成、または異なる修飾)を含み得る。いくつかの実施形態では、「アンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドは、「コアンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドの脂質部分と同じ数の炭素を含む脂質部分を含む。いくつかの実施形態では、「アンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドは、「コアンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドの脂質部分と比較して、約1、2、3、4、5、6、7、8、9、10、11、または12個以上の炭素を含む脂質部分を含む。いくつかの実施形態では、「コアンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドは、「アンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドの脂質部分と比較して、約1、2、3、4、5、6、7、8、9、10、11、または12個以上の炭素を含む脂質部分を含む。いくつかの実施形態では、「アンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドは、「コアンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドの脂質部分と比較して、約1、2、3、4、5、6、7、8、9、10、11、または12個以上の炭素を含む脂質部分を含む。いくつかの実施形態では、アンカー脂質修飾または疎水性アンカーオリゴヌクレオチドのみが、対応するコアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドなしで使用される。
【0093】
いくつかの実施形態では、脂質部分(すなわち、アンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドのみを有する実施形態における脂質部分、またはアンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドおよびコアンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドの両方を有する実施形態における第1もしくは第2の脂質部分のいずれか)は、式Iの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1は、5~25であり、n
2は、1~25であり、Xは、NH、CH
2、O、およびCH-Rからなる群から選択され、ここで、Rは、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである。
【0094】
いくつかの実施形態では、脂質部分(すなわち、アンカー脂質修飾または疎水性アンカーオリゴヌクレオチドのみを有する実施形態における脂質部分、またはアンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドおよびコアンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドの両方を有する実施形態における第1もしくは第2の脂質部分のいずれか)は、式IIの化合物:
またはその生理学的に許容される塩を含み、
式中、n
1は、5~25であり、n
2は、0~24であり、Xは、NH、CH
2、O、およびCH-Rからなる群から選択され、ここで、Rは、C12~C28のモノグリセリド、アルケニル、アルキル、アリール、またはアラルキルである。いくつかの実施形態では、脂質部分、第1の脂質部分、第2の脂質部分、または両方の脂質部分は、式IIIの化合物を含む。
【0095】
いくつかの実施形態では、「アンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドは、ステロール部分を含み、「コアンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドは、脂質部分を含む。いくつかの実施形態では、「コアンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドは、ステロール部分を含み、「アンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドは、脂質部分を含む。いくつかの実施形態では、「アンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドおよび「コアンカー」脂質修飾または疎水性アンカーオリゴヌクレオチドの両方は、ステロール部分を含む。
【0096】
ハイブリダイゼーション領域
アンカー脂質修飾または疎水性アンカーオリゴヌクレオチドおよびコアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドは、互いに相補的なハイブリダイゼーション領域を含む。アンカー脂質修飾または疎水性アンカーオリゴヌクレオチドは、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上のヌクレオチド塩基のオリゴヌクレオチドを含む第1のハイブリダイゼーション領域に作動可能に連結(例えば、共有結合)された脂質部分を含む。オリゴヌクレオチドは、DNA、RNA、または修飾もしくは合成のDNAもしくはRNAであり得る。
【0097】
コアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドは、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上のヌクレオチド塩基のオリゴヌクレオチドを含む第2のハイブリダイゼーション領域に作動可能に連結(例えば、共有結合)された脂質部分を含む。オリゴヌクレオチドは、DNA、RNA、または修飾もしくは合成のDNAもしくはRNAであり得る。いくつかの実施形態では、第2のハイブリダイゼーション領域は、第1のハイブリダイゼーション領域と同じ型の核酸であるか(例えば、第1のハイブリダイゼーション領域がDNAである場合、第2のハイブリダイゼーション領域は、DNAである)、または第2のハイブリダイゼーション領域は、第1のハイブリダイゼーション領域と比較して異なる型の核酸であり得る(例えば、第1のハイブリダイゼーション領域がDNAである場合、第2のハイブリダイゼーション領域は、RNA、または修飾もしくは合成のDNAもしくはRNAであり得る)。
【0098】
第2のハイブリダイゼーション領域は、第1のハイブリダイゼーション領域の逆相補体である。いくつかの実施形態では、相補性は、完全な相補性であり得る(すなわち、第2のハイブリダイゼーション領域は、第1のハイブリダイゼーション領域と同じ長さであり、第2のハイブリダイゼーション領域の各塩基は、第1のハイブリダイゼーション領域上のその塩基対に対する完全な相補体である)。いくつかの実施形態では、第1のハイブリダイゼーション領域は、第2のハイブリダイゼーション領域よりも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、または80個以上の追加の塩基を含む。いくつかの実施形態では、第2のハイブリダイゼーション領域は、第1のハイブリダイゼーション領域よりも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、または80個以上の追加の塩基を含む。いくつかの実施形態では、第1のハイブリダイゼーション領域は、第2のハイブリダイゼーション領域に対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。
【0099】
いくつかの実施形態では、第1のハイブリダイゼーション領域は、配列番号4(GTAACGATCCAGCTGTCACT)に対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。
【0100】
いくつかの実施形態では、第2のハイブリダイゼーション領域は、配列番号2(AGTGACAGCTGGATCGTTAC)に対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。
【0101】
プライマー領域
アンカー脂質修飾または疎水性アンカーオリゴヌクレオチドおよびバーコードオリゴヌクレオチドは、互いに相補的なプライマー領域を含む。アンカー脂質修飾または疎水性アンカーオリゴヌクレオチドは、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個以上のヌクレオチド塩基のオリゴヌクレオチドを含む第1のプライマー領域に作動可能に連結(例えば、共有結合)された第1のハイブリダイゼーション領域に作動可能に連結(例えば、共有結合)された脂質部分を含む。オリゴヌクレオチドは、DNA、RNA、または修飾もしくは合成のDNAもしくはRNAであり得る。
【0102】
バーコードオリゴヌクレオチドは、バーコード領域(以下に記載)に作動可能に連結(例えば、共有結合)され、順に、捕捉配列(以下に記載)に作動可能に連結(例えば、共有結合)される第2のプライマー領域を含み、第2のプライマー領域は、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個以上のヌクレオチド塩基のオリゴヌクレオチドを含む。オリゴヌクレオチドは、DNA、RNA、または修飾もしくは合成のDNAもしくはRNAであり得る。いくつかの実施形態では、第2のプライマー領域は、第1のプライマー領域と同じ型の核酸であるか(例えば、第1のプライマー領域がDNAである場合、第2のプライマー領域は、DNAである)、または第2のプライマー領域は、第1のプライマー領域と比較して異なる型の核酸であり得る(例えば、第1のプライマー領域がDNAである場合、第2のプライマー領域は、RNA、または修飾もしくは合成のDNAもしくはRNAであり得る)。
【0103】
第2のプライマー領域は、第1のプライマー領域の逆相補体である。いくつかの実施形態では、相補性は、完全な相補性であり得る(すなわち、第2のプライマー領域は、第1のプライマー領域と同じ長さであり、第2のプライマー領域の各塩基は、第1のプライマー領域上のその塩基対に対する完全な相補体である)。いくつかの実施形態では、第1のプライマー領域は、第2のプライマー領域よりも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個以上の追加の塩基を含む。いくつかの実施形態では、第2のプライマー領域は、第1のプライマー領域よりも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個以上の追加の塩基を含む。いくつかの実施形態では、第1のプライマー領域は、第2のプライマー領域に対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。
【0104】
いくつかの実施形態では、第1のプライマー領域は、配列番号5(TGGAATTCTCGGGTGCCAAGG)に対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。
【0105】
いくつかの実施形態では、第2のプライマー領域は、配列番号6(CCTTGGCACCCGAGAATTCCA)に対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。
【0106】
バーコード領域
バーコードオリゴヌクレオチドは、バーコード領域に作動可能に連結(例えば、共有結合)、順に、捕捉配列(以下に記載)に作動可能に連結(例えば、共有結合)される第2のプライマー領域を含み、バーコード領域は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上のヌクレオチド塩基のオリゴヌクレオチドを含む。オリゴヌクレオチドは、DNA、RNA、または修飾もしくは合成のDNAもしくはRNAであり得る。バーコード配列のセットを設計する方法は、例えば、米国特許第6,235,475号に示され、その内容は、参照によりその全体が本明細書に組み込まれる。バーコード配列を核酸テンプレートに付加することは、米国公開第2008/0081330号および米国公開第2011/0301042号に示され、これらの各々の内容は、参照によりその全体が本明細書に組み込まれる。バーコード配列のセットを設計するための方法およびバーコード配列を付加するための他の方法は、米国特許第6,138,077号、同第6,352,828号、同第5,636,400号、同第6,172,214号、同第6,235,475号、同第7,393,665号、同第7,544,473号、同第5,846,719号、同第5,695,934号、同第5,604,097号、同第6,150,516号、RE39,793、同第7,537,897号、同第6,172,218号、および同第5,863,722号に示され、これらの各々の内容は、参照によりその全体が本明細書に組み込まれる。配列決定およびコピー数推定のためのバーコードは、米国公開第2016/0046986号に記載されており、その全体が参照により本明細書に組み込まれる。
【0107】
バーコードは、完全にランダムであり得るか、またはある特定の所定の配列で操作することができる。それらは、ランダム性またはセミランダム性の領域および他の固定領域を有し得る。バーコードは、プライミング部位、アダプター、またはさらなる処理および分析を容易にする他の補完的な領域などの他の領域を含み得る。その第2のプライマー領域に関連する特定のバーコード自体の同一性は、第1および第2のプライマー領域のハイブリダイゼーションを介してアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドの結合または捕捉の前に作成することができる。したがって、いくつかの実施形態では、すべてのバーコードのデータベースが作成され、いくつかの実施形態では、コンピュータ記憶媒体上に格納される。
【0108】
いくつかの実施形態では、バーコード領域の最後のヌクレオチドは、捕捉配列の最初のヌクレオチドと同一ではないであろう。例えば、捕捉配列がポリアデニル化テールである場合、いくつかの実施形態では、バーコード領域の最後のヌクレオチドは、アデニンではないであろう。
【0109】
バーコードは、特定の細胞または膜のその後の同定および起源を可能にするために、脂質修飾または疎水性アンカーオリゴヌクレオチドを含む細胞または膜のタグ付けまたは追跡を可能にする。オリゴヌクレオチドの個々またはサブグループへのバーコードの割り当ては、個々の配列、配列のフラグメント、または細胞に固有の同一性を割り当てることを可能にし得る。これにより、個々の試料からデータを取得できる場合があり、試料の平均に限定されない。
【0110】
いくつかの実施形態では、オリゴヌクレオチドは、共通のバーコードを共有することができ、したがって、後で同じ標的細胞に由来するものとして同定され得る。(同じまたは異なる型の)複数の細胞は、複数のバーコードを使用して同定することができ、各バーコードは、特定の細胞型または特定の細胞型内の複数の細胞を同定する。
【0111】
単一細胞または膜は、複数の脂質修飾または疎水性アンカーオリゴヌクレオチドを含み得、各脂質修飾または疎水性アンカーオリゴヌクレオチドは、異なる第1のプライマー領域を有する。したがって、そのような細胞または膜は、異なるバーコードオリゴヌクレオチドを介して単離および/または同定することができ、各々は、異なる第1のプライマー領域に対して相補性を有する第2のプライマー領域、および各バーコードオリゴヌクレオチドに対する単一のバーコードまたはバーコードオリゴヌクレオチドの一部もしくはすべてに対する異なるバーコードを含む。
【0112】
捕捉配列
いくつかの実施形態では、バーコードオリゴヌクレオチドは、バーコード領域に作動可能に連結(例えば、共有結合)され、順に、捕捉配列(以下に記載)に作動可能に連結(例えば、共有結合)される、第2のプライマー領域を含み、捕捉配列は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個以上のヌクレオチド塩基のオリゴヌクレオチドを含む。オリゴヌクレオチドは、DNA、RNA、または修飾もしくは合成のDNAもしくはRNAであり得る。
【0113】
いくつかの実施形態では、捕捉配列は、ポリアデニル化テール(「ポリ(A)テール」)であり、すなわち、捕捉配列全体がアデニン塩基からなる。いくつかの実施形態では、捕捉配列は、ポリ(A)テールに対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。いくつかの実施形態では、捕捉配列は、配列番号7
の配列を有する。
【0114】
いくつかの実施形態では、捕捉配列は、ポリチミンテール(「ポリ(T)テール」)であり、すなわち、捕捉配列全体がチミン塩基からなる。いくつかの実施形態では、捕捉配列は、ポリ(T)テールに対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。
【0115】
いくつかの実施形態では、捕捉配列は、ポリウラシルテール(「ポリ(U)テール」)であり、すなわち、捕捉配列全体がウラシル塩基からなる。いくつかの実施形態では、捕捉配列は、ポリ(U)テールに対して少なくとも約50%、少なくとも約51%、少なくとも約52%、少なくとも約53%、少なくとも約54%、少なくとも約55%、少なくとも約56%、少なくとも約57%、少なくとも約58%、少なくとも約59%、少なくとも約60%、少なくとも約61%、少なくとも約62%、少なくとも約63%、少なくとも約64%、少なくとも約65%、少なくとも約66%、少なくとも約67%、少なくとも約68%、少なくとも約69%、少なくとも約70%、少なくとも約71%、少なくとも約72%、少なくとも約73%、少なくとも約74%、少なくとも約75%、少なくとも約76%、少なくとも約77%、少なくとも約78%、少なくとも約79%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%の配列同一性を有する。
【0116】
いくつかの実施形態では、捕捉配列は、ポリ(A)、ポリ(T)、またはポリ(U)テールの変異体である。そのような変異体には、純粋なポリ(A)、ポリ(T)、またはポリ(U)テール以外の塩基が含まれる。例えば、変異体は、
のようなポリ(A)変異体などの捕捉配列を含むことができ、各変異体は、必要に応じて、例えば、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個の追加のヌクレオチド塩基を含み、追加のヌクレオチド塩基の大部分、およびいくつかの実施形態ではすべてがアデニンである。変異体ポリ(T)およびポリ(U)捕捉配列も同様に構築され得る。
【0117】
いくつかの実施形態では、捕捉配列の代替として、カップリング対のメンバー(例えば、抗体/抗原、受容体/リガンド、または例えば、参照により本明細書に組み込まれる米国特許出願第2006/0252077号に記載されているようなアビジン-ビオチン対)は、そのカップリング対のそれぞれの第2のメンバーでコーティングされた表面に捕捉される各フラグメントに連結されてもよい。捕捉に続いて、配列は、例えば、単一分子の検出/配列決定によって分析されてもよく、これは、例えば、参照により本明細書に組み込まれる米国特許第7,283,337号に記載されているように行われる。
【0118】
脂質修飾または疎水性アンカーオリゴヌクレオチドを合成する方法
オリゴヌクレオチドは、例えば、Caruthers et al.,Meth.Enzymol.211:3(1992)、WO99/54459、Wincott et al.,Nucleic Acids Res.23:2677(1995)、Wincott et al.,Meth.Mol.Bio.74:59(1997)、Brennan et al.,Biotechnol.Bioeng.61:33(1998)、および米国特許第6,001,311号に記載されているように、当該技術分野で知られているプロトコルを使用して合成することができる。これらの参考文献はすべて、参照により本明細書に組み込まれる。オリゴヌクレオチドの合成は、5’末端のジメトキシトリチルおよび3’末端のホスホルアミダイトなどの一般的な核酸保護およびカップリング基を利用する。
【0119】
本明細書に開示されるオリゴヌクレオチドは、天然および合成または修飾オリゴヌクレオチドを包含する。修飾された核酸は、核酸に新しいまたは強化された特徴(例えば、改善された安定性)を提供するために、1つ以上の修飾、例えば、塩基修飾、骨格修飾などを有する。ヌクレオシドは、その塩基部分が複素環式塩基である塩基-糖の組み合わせであり得る。複素環式塩基には、プリンおよびピリミジンが含まれる。ヌクレオチドは、ヌクレオシドの糖部分に共有結合したリン酸基をさらに含むヌクレオシドである。ペントフラノシル糖を含むヌクレオシドの場合、リン酸基は、糖の2’、3’、または5’ヒドロキシル部分に連結することができる。オリゴヌクレオチドを形成する際に、リン酸基は、隣接するヌクレオシドを互いに共有結合させて、線状高分子化合物を形成する。場合によっては、この線状高分子化合物のそれぞれの末端をさらに接合して、環状化合物を形成することができる。さらに、線状化合物は、内部ヌクレオチド塩基相補性を有し得るため、完全にまたは部分的に二本鎖化合物を産生するように折りたたむことができる。オリゴヌクレオチド内では、リン酸基は、オリゴヌクレオチドのヌクレオシド間骨格を形成していると称され得る。RNAおよびDNAの結合または骨格は、3’から5’のホスホジエステル結合であり得る。
【0120】
修飾を含む好適な核酸の例には、修飾された骨格または非天然のヌクレオシド間結合を有する核酸が含まれる。修飾された骨格を有する核酸には、骨格にリン原子を保持している核酸および骨格にリン原子を持たない核酸が含まれる。その中にリン原子を含む好適な修飾オリゴヌクレオチド骨格には、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、メチルならびに3’-アルキレンホスホネート、5’-アルキレンホスホネートおよびキラルホスホネートを含む他のアルキルホスホネート、ホスフィネート、3’-アミノホスホルアミデートおよびアミノアルキルホスホルアミデートを含むホスホルアミデート、ホスホロジアミデート、チオノホスホルアミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、セレノホスフェートおよび通常の3’~5’結合を有するボラノホスフェート、これらの2’-5’結合類似体、ならびに1つ以上のヌクレオチド間結合が3’と3’、5’と5’、または2’と2’の結合である逆極性を有するものが含まれる。逆極性を有する好適なオリゴヌクレオチドには、3’端ヌクレオチド間結合での単一の3’と3’の結合、すなわち、塩基性であり得る単一の逆ヌクレオシド残基が含まれる(核酸塩基が欠落しているか、またはその代わりにヒドロキシル基を有する)。様々な塩(例えば、カリウムまたはナトリウムなど)、混合塩および遊離酸形態も含まれる。
【0121】
いくつかの実施形態では、主題の核酸は、1つ以上のホスホロチオエートおよび/またはヘテロ原子ヌクレオシド間結合、特に、--CH2--NH--O--CH2--、--CH2--N(CH3)--O--CH2-(メチレン(メチルイミノ)またはMMI骨格として知られている)、--CH2--O--N(CH3)--CH2--、--CH2--N(CH3)--N(CH3)--CH2--、および--O--N(CH3)--CH2--CH2--を有する(天然のホスホジエステルヌクレオチド間結合は、--O--P(=O)(OH)--O--CH2--として表される)。MMI型ヌクレオシド間結合は、上記で参照された米国特許第5,489,677号に開示されている。好適なアミドヌクレオシド間結合は、米国特許第5,602,240号に開示されている。
【0122】
例えば、米国特許第5,034,506号に記載されているようなモルホリノ骨格構造を有する核酸も好適である。例えば、いくつかの実施形態では、対象の核酸は、リボース環の代わりに6員のモルホリノ環を含む。これらの実施形態のうちのいくつかでは、ホスホジアミデートまたは他の非ホスホジエステルヌクレオシド間結合が、ホスホジエステル結合に置き換わる。
【0123】
その中にリン原子を含まない好適な修飾ポリヌクレオチド骨格は、短鎖アルキルまたはシクロアルキルヌクレオシド間結合、混合ヘテロ原子およびアルキルもしくはシクロアルキルヌクレオシド間結合、または1つ以上の短鎖ヘテロ原子もしくは複素環ヌクレオシド間結合によって形成される骨格を有する。これらには、モルホリノ結合(ヌクレオシドの糖部分から部分的に形成される);シロキサン骨格;硫化物、スルホキシド、およびスルホン骨格;ホルムアセチルおよびチオホルムアセチル骨格;メチレンホルムアセチルおよびチオホルムアセチル骨格;リボアセチル骨格;アルケン含有骨格;スルファメート骨格;メチレンイミノおよびメチレンヒドラジノ骨格;スルホン酸塩およびスルホンアミド骨格;アミド骨格;ならびに混合N、O、S、およびCH2成分部分を有する他のものを有するものが含まれる。
【0124】
核酸模倣物も含まれる。ポリヌクレオチドに適用される「模倣物」という用語は、フラノース環のみ、またはフラノース環およびヌクレオチド間結合の両方が非フラノース基で置換されているポリヌクレオチドを包含し、フラノース環のみの置換は、糖代用物とも称される。複素環式塩基部分または修飾された複素環式塩基部分は、適切な標的核酸とのハイブリダイゼーションのために維持される。優れたハイブリダイゼーション特性を有することが示されているポリヌクレオチド模倣物であるそのような核酸の1つは、ペプチド核酸(PNA)と称される。PNAでは、ポリヌクレオチドの糖骨格は、アミド含有骨格、特にアミノエチルグリシン骨格で置き換えられる。ヌクレオチドは保持され、骨格のアミド部分のアザ窒素原子に直接または間接的に結合される。
【0125】
優れたハイブリダイゼーション特性を有する1つのポリヌクレオチド模倣物は、ペプチド核酸(PNA)である。PNA化合物の骨格は、PNAにアミド含有骨格を与える、2つ以上の連結したアミノエチルグリシン単位である。複素環式塩基部分は、骨格のアミド部分のアザ窒素原子に直接または間接的に結合される。PNA化合物の調製を説明する代表的な米国特許としては、米国特許第5,539,082号、同第5,714,331号、および同第5,719,262号が挙げられるが、これらに限定されない。
【0126】
別のクラスの好適なポリヌクレオチド模倣物は、モルホリノ環に付着した複素環式塩基を有する連結されたモルホリノ単位(モルホリノ核酸)に基づく。モルホリノ核酸中のモルホリノ単量体単位を連結することができる多くの連結基が報告されている。非イオン性オリゴマー化合物を与えるために、連結基の1つのクラスが選択された。非イオン性モルホリノベースのオリゴマー化合物は、細胞タンパク質との望ましくない相互作用を有する可能性が低い。モルホリノベースのポリヌクレオチドは、細胞タンパク質との望ましくない相互作用を形成する可能性が低いオリゴヌクレオチドの非イオン性模倣物である(Braasch et al.,Biochemistry,41(14):4503-10(2002))。モルホリノベースのポリヌクレオチドは、米国特許第5,034,506号に開示されている。ポリヌクレオチドのモルホリノクラス内の様々な化合物が調製されており、単量体サブユニットに接合する様々な異なる連結基を有する。
【0127】
ポリヌクレオチド模倣物の別の好適なクラスは、シクロヘキセン核酸(CeNA)と称される。DNA/RNA分子に通常存在するフラノース環は、シクロヘキセン環で置き換えられる。CeNA DMTで保護されたホスホルアミダイトモノマーが調製され、古典的なホスホルアミダイト化学に従うオリゴマー化合物合成に使用されている。完全に修飾されたCeNAオリゴマー化合物およびCeNAで修飾された特定の位置を有するオリゴヌクレオチドが調製され、研究されている(Wang et al.,J.Am.Chem.Soc.,122:8595-8602(2000)を参照)。CeNAモノマーをDNA鎖に組み込むと、DNA/RNAハイブリッドの安定性が向上する。CeNAオリゴアデニル酸塩は、RNAおよびDNA相補体と複合体を形成し、天然の複合体と同様の安定性を示した。天然の核酸構造へのCeNA構造の取り込みは、NMRおよび円二色性によって立体配座の適応を進めることが示された。
【0128】
修飾核酸としても好適なのは、ロック核酸(LNA)および/またはLNA類似体である。LNAでは、2’-ヒドロキシル基が糖環の4’炭素原子に連結し、それによって2’-C、4’-C-オキシメチレン結合を形成し、それによって二環式糖部分を形成する。結合は、メチレン(--CH2--)、2’酸素原子と4’炭素原子とを架橋する基であり得、nは、1または2である(Singh et al.,Chem.Commun.,4:455-456(1998))。LNAおよびLNA類似体は、相補的DNAおよびRNAで非常に高い二本鎖熱安定性(Tm=+3~+10℃)、3’-エキソヌクレアーゼ分解に対する安定性、および良好な溶解性を示す。LNAを含む強力かつ非毒性のオリゴヌクレオチドが記載されている(Wahlestedt et al.,Proc.Natl.Acad.Sci.U.S.A.,97:5633-38(2000))。
【0129】
LNAモノマーであるアデニン、シトシン、グアニン、5-メチル-シトシン、チミン、およびウラシルの合成と調製、ならびにそれらのオリゴマー化とともに、核酸認識特性が記載されている(Koshkin et al.,Tetrahedron,54:3607-30(1998))。LNAおよびその調製はまた、WO98/39352およびWO99/14226に記載されており、これらは両方とも、参照によりそれら全体が本明細書に組み込まれる。例示的なLNA類似体は、米国特許第7,399,845号および同第7,569,686号に記載されており、これらは両方とも、参照によりそれら全体が本明細書に組み込まれる。
【0130】
核酸はまた、1つ以上の置換された糖部分を含み得る。好適なポリヌクレオチドには、OH;F;O-、S-、もしくはN-アルキル;O-、S-、もしくはN-アルケニル;O-、S-、もしくはN-アルキニル;またはO-アルキル-O-アルキルから選択される糖置換基が含まれ、ここで、アルキル、アルケニル、およびアルキニルは、置換または非置換のC1~C10アルキルまたはC2~C10アルケニルおよびアルキニルであり得る。また、O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2、およびO(CH2)nON((CH2)nCH3)2が好適であり、ここで、nおよびmは、1~約10である。他の好適なポリヌクレオチドには、C1~C10低級アルキル、置換低級アルキル、アルケニル、アルキニル、アルカリル、アラルキル、O-アルカリル、またはO-アラルキル、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、および同様の特性を有する他の置換基から選択される糖置換基が含まれる。好適な修飾は、2’-メトキシエトキシ(2’-O-(2-メトキシエチル)または2’-MOEとしても知られる、2’-O--CH2CH2OCH3)(Martin et al.,Helv.Chim.Acta,78:486-504(1995))、すなわち、アルコキシアルコキシ基を含み得る。好適な修飾には、2’-DMAOEとしても知られる2’-ジメチルアミノオキシエトキシ、すなわち、O(CH2)2ON(CH3)2基、および2’-ジメチルアミノエトキシエトキシ(2’-O-ジメチル-アミノ-エトキシ-エチルまたは2’-DMAEOEとも称される)、すなわち2’-O--CH2--O--CH2--N(CH3)2が含まれ得る。
【0131】
他の好適な糖置換基には、メトキシ(--O-CH3)、アミノプロポキシ(--OCH2CH2CH2NH2)、アリル(--CH2-CH=CH2)、--O-アリル(--O--CH2-CH=CH2)、およびフルオロ(F)が含まれる。2’-糖置換基は、アラビノ(上)位置またはリボ(下)位置にあり得る。好適な2’-アラビノ修飾は、2’-Fである。同様の修飾はまた、オリゴマー化合物の他の位置、特に3’末端ヌクレオシド上または2’-5’結合オリゴヌクレオチド内の糖の3’位、および5’末端ヌクレオチドの5’位でも行うことができる。オリゴマー化合物はまた、ペントフラノシル糖の代わりにシクロブチル部分などの糖模倣物を有し得る。
【0132】
核酸はまた、核酸塩基(「塩基」とも称される)修飾または置換を含み得る。本明細書で使用される場合、「未修飾」または「天然」核酸塩基には、プリン塩基アデニン(A)およびグアニン(G)、ならびにピリミジン塩基チミン(T)、シトシン(C)、およびウラシル(U)が含まれる。修飾核酸塩基には、5-メチルシトシン(5-me-C)、5-ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2-アミノアデニン、6-メチルとアデニンおよびグアニンの他のアルキル誘導体、2-プロピルとアデニンおよびグアニンの他のアルキル誘導体、2-チオウラシル、2-チオチミンおよび2-チオシトシン、5-ハロウラシルおよびシトシン、5-プロピニル(--C=C--CH3)ウラシルおよびシトシン、ならびにピリミジン塩基の他のアルキニル誘導体、6-アゾウラシル、シトシンおよびチミン、5-ウラシル(擬ウラシル)、4-チオウラシル、8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシルと他の8-置換アデニンおよびグアニン、5-ハロ、特に5-ブロモ、5-トリフルオロメチルと他の5-置換ウラシルおよびシトシン、7-メチルグアニンおよび7-メチルアデニン、2-F-アデニン、2-アミノ-アデニン、8-アザグアニンおよび8-アザアデニン、7-デアザグアニンおよび7-デアザアデニン、および3-デアザグアニンおよび3-デアザアデニンなどの他の合成および天然の核酸塩基が含まれる。修飾核酸塩基にはまた、フェノキサジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾオキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾチアジン-2(3H)-オン)などの三環式ピリミジン、置換フェノキサジンシチジン(例えば、9-(2-アミノエトキシ)-H-ピリミド(5,4-(b)(1,4)ベンゾキサジン-2(3H)-オン)などのGクランプ、カルバゾールシチジン(2H-ピリミド(4,5-b)インドール-2-オン)、およびピリドインドールシチジン(H-ピリド(3’,2’:4,5)ピロロ(2,3-d)ピリミジン-2-オン)も含まれる。
【0133】
複素環式塩基部分はまた、プリンまたはピリミジン塩基が他の複素環、例えば、7-デアザ-アデニン、7-デアザグアノシン、2-アミノピリジン、および2-ピリドンで置き換えられているものを含み得る。さらなる核酸塩基には、米国特許第3,687,808号に開示されているもの、The Concise Encyclopedia Of Polymer Science And Engineering,pages 858-859,Kroschwitz,J.I.,ed.John Wiley&Sons,1990に開示されているもの、Englisch et al.,Angewandte Chemie,International Edition,1991,30,613によって開示されているもの、およびSanghvi,Y.S.,Chapter 15,Antisense Research and Applications,pages 289-302,Crooke,S.T.and Lebleu,B.,ed.,CRC Press,1993によって開示されているものが含まれる。これらの核酸塩基のいくつかは、オリゴマー化合物の結合親和性を高めるのに有用である。これらには、5-置換ピリミジン、6-アザピリミジン、ならびにN-2、N-6、およびO-6置換プリンが含まれる(2-アミノプロピルアデニン、5-プロピニルウラシル、および5-プロピニルシトシンを含む)。5-メチルシトシン置換は、核酸二本鎖の安定性を0.6~1.2℃増加させることが示されており(Sanghvi et al.,eds.,Antisense Research and Applications,CRC Press,Boca Raton,1993,pp.276-278)、例えば、2’-O-メトキシエチル糖修飾と組み合わせた場合、好適な塩基置換である。
【0134】
脂質(例えば、脂質、脂質(複数)、脂質前駆体(複数)、脂質前駆体、オレオケミカル(複数)、またはオレオケミカル)は、任意の化学物質または生化学物質によって産生され得(例えば、参照によりそれら全体が本明細書に組み込まれる、US9,896,691、US9598710、US9,499,829、US9,428,779、US9,127,288;およびKinney,1997,Genetic Engeneering,Ed.:J K Setlow,19:149-166、Ohlrogge and Browse,1995,Plant Cell 7:957-970、Shanklin and Cahoon,1998,Annu.Rev.Plant Physiol.Plant Mol.Biol.49:611-641、Voelker,1996,Genetic Engineering,Ed.:J K Setlow,18:111-13、Gerhardt,1992,Prog.Lipid R.31:397-417、Guhnemann-Schafer&Kindl,1995,Biochim.Biophys Acta 1256:181-186、Kunau et al.,1995,Prog.Lipid Res.34:267-342、Stymne et al.,1993,in:Biochemistry and Molecular Biology of Membrane and Storage Lipids of Plants,Ed.:Murata and Somerville,Rockville,American Society of Plant Physiologists,150-158,Murphy&Ross 1998,Plant Journal.13(1):1-16に見出されるように)、任意の便利な方法によって収集され得る(例えば、細胞外分泌脂質の遠心分離、溶媒への曝露、全細胞抽出(例えば、細胞破壊および収集)、疎水性溶媒抽出(例えば、ヘキサン)、液化、超臨界二酸化炭素抽出、凍結乾燥、機械的粉砕、分泌(例えば、効果的なエクスポータータンパク質の添加による)、またはそれらの組み合わせ)。いくつかの実施形態では、脂質は、例えば、植物、細菌、または油性酵母もしくは真菌から抽出および精製することができる。
【0135】
いくつかの実施形態では、脂質は、本明細書に開示されるオリゴヌクレオチドに共有結合している。いくつかの実施形態では、脂質は、本明細書に開示されるオリゴヌクレオチドに架橋される。脂質をオリゴヌクレオチドに結合する方法は、特に限定されない。脂質およびオリゴヌクレオチドは、直接またはリンカー(結合領域)を介して結合することができる。いくつかの実施形態では、脂質をオリゴヌクレオチドに結合するために使用されるリンカーは、核酸を含む。いくつかの実施形態では、脂質をオリゴヌクレオチドに結合するために使用されるリンカーは、核酸を含まない。
【0136】
脂質およびオリゴヌクレオチドが互いに共有結合している限り、使用できるリンカーは特に限定されない。使用可能なリンカーの例には、次の構造:
のものが含まれ、ここで、n1は、約1~約40の整数であり、n2は、約1~約20の整数であり、n3およびn4は、同じでも異なってもよく、約1~約20の整数である。いくつかの実施形態では、リンカーは、リン酸基(--O-P(=O)(OH)-O--)である。
【0137】
膜
本開示の別の態様は、本明細書に開示される脂質修飾または疎水性アンカーオリゴヌクレオチドを含む膜、粒子、またはビーズを含む組成物に関する。いくつかの実施形態では、膜は、生体膜(例えば、人工細胞を含む細胞などの生物学的区画、または核、ミトコンドリア、およびペルオキシソームなどの膜小胞もしくはシートもしくは細胞内部区画を取り囲む脂質二重層)である。いくつかの実施形態では、膜は、生細胞の一部である。他の実施形態では、膜は、人工(合成)膜、例えば、平面膜、リポソームなどである。膜は、単離された膜であり得る。いくつかの実施形態では、膜は、表面に取り付けられている。
【0138】
いくつかの実施形態では、人工膜は、脂質二重層である。他の実施形態では、人工膜は、脂質単層である。いくつかの実施形態では、人工膜は、リポソームの一部である。リポソームには、単一膜または脂質二重層で構成される単層小胞、および多くの同心膜(または脂質二重層)で構成される多層小胞(MLV)が含まれる。
【0139】
人工膜、およびそれを作製する方法は、当該技術分野において説明されている。例えば、米国特許第6,861,260号、Kansy et al.(1998)J.Med.Chem.41(7):1007-10、およびYang et al.(1996)Advanced Drug Delivery Reviews 23:229-256を参照されたい。
【0140】
主題の人工膜は、いくつかの実施形態では、1つ以上のリン脂質を含む。いくつかの実施形態では、人工膜は、飽和または不飽和の一置換または二置換脂肪酸を含むリン脂質の混合物、およびそれらの組み合わせを含む。これらのリン脂質は、いくつかの実施形態では、ジオレオイルホスファチジルコリン、ジオレオイルホスファチジルセリン、ジオレオイルホスファチジルエタノールアミン、ジオレオイルホスファチジルグリセロール、ジオレオイルホスファチジン酸、パルミトイルオレオイルホスファチジルコリン、パルミトイルオレオイルホスファンジルセリン、パルミトイルオレオイルホスファチジルエタノールアミン、パルミトイルオレオイルホスファチジルグリセロール、パルミトイルオレオイルホスファチジン酸、パルミテライドイルオレオイルホスファチジルコリン、パルミテライドイルオレオイルホスファチジルセリン、パルミテライドイルオレオイルホスファチジルエタノールアミン、パルミテライドイルオレオイルホスファチジルグリセロール、パルミテライドイルオレオイルホスファチジン酸、ミリストールオレオイルホスファチジルコリン、ミリストールオレオイルホスファチジルセリン、ミリストールオレオイルホスファチジルエタノールアミン、ミリストールオレオイルホスファチジルグリセロール、ミリストールオレオイルホスファチジン酸、ジリノレオイルホスファチジルコリン、ジリノレオイルホスファチジルセリン、ジリノレオイルホスファチジルエタノールアミン、ジリノレオイルホスファチジルグリセロール、ジリノレオイルホスファチジン酸、パルミチクリンオレオイルホスファチジルコリン、パルミチクリンオレオイルホスファチジルセリン、パルミチクリンオレオイルホスファチジルエタノールアミン、パルミチクリンオレオイルホスファチジルグリセロール、およびパルミチクリンオレオイルホスファチジン酸から選択される。好適なリン脂質には、ホスファチジルコリン(リソホファチジリジルコリン)、ホスファチジルセリン(リソホスファチジルセリン)、ホスファチジルエタノールアミン(リソホスファチジルエタノールアミン)、ホファチジルグリセロール(リソホスファチジルグリセロール)、およびホスファチジン酸(リソホスファチジン酸)のモノアシル化誘導体も含まれる。そのようなリソホスファチジル誘導体中のモノアシル鎖は、いくつかの実施形態では、パリムトイル、オレオイル、パルミトレオイル、リノレオイル、ミリストイル、またはミリストレオイルであろう。
【0141】
使用方法
脂質修飾または疎水性アンカーオリゴヌクレオチド化合物および脂質修飾または疎水性アンカーオリゴヌクレオチド含有組成物は、様々な異なる製薬、薬用化粧品、診断、および生物医学的用途で使用することができる。そのような使用の非限定的な例を以下に説明する。
【0142】
例えば、脂質修飾または疎水性アンカーオリゴヌクレオチド化合物、および脂質修飾または疎水性アンカーオリゴヌクレオチド化合物を含む組成物は、細胞間相互作用、膜力学の研究、組織のボトムアップアセンブリ、非接着細胞の定量的イメージング、または細胞表面近くで発生する生物学的プロセスの研究を含む、研究および治療的用途で使用される。
【0143】
そのような方法を実施する際に、脂質修飾または疎水性アンカーオリゴヌクレオチドを含む組成物は、最初に、当該組成物の当該膜への挿入を可能にする条件下で膜と接触させることができる。いくつかの実施形態では、この方法は、脂質修飾または疎水性アンカーオリゴヌクレオチドを含む組成物と膜を接触させることと、当該組成物を当該膜に挿入できる条件下で当該組成物を当該脂質膜とインキュベートすることと、を含む。
【0144】
いくつかの実施形態では、アンカー脂質修飾または疎水性アンカーオリゴヌクレオチドおよびコアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドは、細胞または膜に同時に添加される。いくつかの実施形態では、アンカー脂質修飾または疎水性アンカーオリゴヌクレオチドおよびコアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドは、細胞または膜に順次添加される。すなわち、アンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドが、最初に細胞もしくは膜に添加され、続いてコアンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドが細胞もしくは膜に添加されるか、またはコアンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドが、最初に細胞もしくは膜に添加され、続いてアンカー脂質修飾もしくは疎水性アンカーオリゴヌクレオチドが細胞もしくは膜に添加される。
【0145】
いくつかの実施形態では、本開示は、細胞を標識する方法、単一細胞から内因性DNAを単離する方法、または単一細胞内の核酸配列を配列決定する方法に関し、単一細胞を1つまたは複数のアンカー脂質修飾オリゴヌクレオチドに曝露することと、次いで、少なくともアンカー脂質修飾オリゴヌクレオチドに相補的な第1の標識オリゴヌクレオチド配列を添加することであって、第1の標識オリゴヌクレオチド配列が、その3’領域に既知の核酸配列部分を含む、添加することとを含む。いくつかの実施形態では、第1の標識オリゴヌクレオチドは、アンカー脂質修飾オリゴヌクレオチドの3’領域に相補的であり、その結果、3’末端の既知の核酸配列の少なくとも一部が一本鎖である。いくつかの実施形態では、この方法は、第1の標識オリゴヌクレオチドの一本鎖3’末端をリガーゼ緩衝液およびリガーゼに曝露して、第1の標識オリゴヌクレオチドをアンカー脂質修飾オリゴヌクレオチドに共有結合させることをさらに含む。アンカー脂質修飾オリゴヌクレオチドは、少なくとも第2、第3、もしくは第4、またはそれ以上の標識オリゴヌクレオチドに順次曝露され得、第1、第2、第3、第4、またはそれ以上のオリゴヌクレオチドの各々は、分子のそれぞれの3’領域に固有の同定核酸配列を含む。いくつかの実施形態では、この方法は、アンカー脂質修飾オリゴヌクレオチドおよび第1または複数の標識オリゴヌクレオチドを第1のリンカーに曝露することをさらに含み、そのようなオリゴヌクレオチド配列は、第1の標識オリゴヌクレオチドおよび第2の標識オリゴヌクレオチドの一部に相補的であり、その結果、リガーゼおよび遊離dNTPに曝露されると、第1のリンカーは、各標識オリゴヌクレオチドの3’末端の一本鎖領域である核酸の鎖に沿って相補的な核酸配列をライゲーションおよび形成するためのテンプレート核酸鎖として機能する。いくつかの実施形態では、本開示は、細胞を標識する方法、単一細胞から内因性DNAを単離する方法、または単一細胞から核酸配列を配列決定する方法に関し、
(a)細胞を、1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドに、アンカー-脂質修飾オリゴヌクレオチドがそれ自体を細胞の細胞膜内に埋め込むのに十分な期間、曝露することと、
(b)細胞を、アンカー-脂質修飾オリゴヌクレオチドに相補的な1つまたは複数の標識オリゴヌクレオチドに、アンカー-脂質修飾オリゴヌクレオチドが1つまたは複数の標識オリゴヌクレオチドとともに核酸の相補鎖を形成するのに十分な期間、曝露することと、
(c)1つまたは複数の標識オリゴヌクレオチドを1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドにライゲーションすることと、任意選択で、
(d)1つまたは複数の標識オリゴヌクレオチドの存在を、1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって、検出すること、および/あるいは
(e)細胞を、1つまたは複数の標識オリゴヌクレオチドの存在に基づいて単離することであって、1つまたは複数の標識オリゴヌクレオチドの存在が、1つまたは複数の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって決定される、単離すること
を含む。
【0146】
いくつかの実施形態では、細胞を標識する方法、単一細胞から内因性DNAを単離する方法、または単一細胞から核酸配列を配列決定する方法は、
(a)細胞を、1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドに、アンカー-脂質修飾オリゴヌクレオチドがそれ自体を細胞の細胞膜内に埋め込むのに十分な期間、曝露することと、
(b)細胞を、アンカー-脂質修飾オリゴヌクレオチドに相補的な第1の標識オリゴヌクレオチドに、アンカー-脂質修飾オリゴヌクレオチドが1つまたは複数の標識オリゴヌクレオチドとともに核酸の相補鎖を形成するのに十分な期間、曝露することと、
(c)1つまたは複数の標識オリゴヌクレオチドを第1のアンカー-脂質修飾オリゴヌクレオチドにライゲーションすることと、任意選択で、
(d)第1の標識オリゴヌクレオチドの存在を、第1の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって、検出すること、および/あるいは
(e)細胞を、第1の標識オリゴヌクレオチドの存在に基づいて単離することであって、1つまたは複数の標識オリゴヌクレオチドの存在が、第1の標識オリゴヌクレオチドに対応するより固有のヌクレオチド配列のうちの1つの検出によって決定される、単離すること
を含む。
【0147】
いくつかの実施形態では、細胞を標識する方法、単一細胞から内因性DNAを単離する方法、または単一細胞から核酸配列を配列決定する方法は、
(a)細胞を、1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドに、アンカー-脂質修飾オリゴヌクレオチドがそれ自体を細胞の細胞膜内に埋め込むのに十分な期間、曝露することと、
(b)細胞を第1、第2、第3、第4、またはそれ以上の標識オリゴヌクレオチドに曝露することであって、第1の標識オリゴヌクレオチドが、1つまたは複数のアンカー-脂質修飾オリゴヌクレオチドに相補的であり、アンカー-脂質修飾オリゴヌクレオチドが第1の標識オリゴヌクレオチドと核酸の相補鎖を形成するのに十分な期間、1つまたは複数のアンカー脂質に曝露され、第2、第3、および/もしくは第4、またはそれ以上の標識オリゴヌクレオチドが、第2、第3、および/もしくは第4またはそれ以上の標識オリゴヌクレオチドが細胞に曝露される直前に、第2、第3、および/もしくは第4、またはそれ以上の標識オリゴヌクレオチドが以前に曝露された標識オリゴヌクレオチドに共有結合または非共有結合するのに十分な期間、細胞に曝露される標識オリゴヌクレオチドの3’部分に順次曝露される、曝露することと、
(c)1つまたは複数の標識オリゴヌクレオチドを第1のアンカー-脂質修飾オリゴヌクレオチドにライゲーションし、第2、第3、第4、またはそれ以上の標識オリゴヌクレオチドの場合、標識オリゴヌクレオチドを互いに同時にライゲーションすることと、任意選択で、
(d)第1、第2、第3、第4、および/またはそれ以上の標識オリゴヌクレオチドの存在を、第1、第2、第3、第4の標識オリゴヌクレオチドの各々に対応するより固有のヌクレオチド配列のうちの1つの検出によって、検出することと、および/あるいは
(e)第1、第2、第3、第4、および/またはそれ以上の標識オリゴヌクレオチドの存在に基づいて、または第1、第2、第3、第4、および/またはそれ以上の標識オリゴヌクレオチドの各々の固有のヌクレオチド配列の連続的な組み合わせに基づいて細胞を単離することであって、第1、第2、第3、第4、および/またはそれ以上の標識オリゴヌクレオチドの存在が、標識オリゴヌクレオチドのうちの1つまたは各々の組み合わせに対応するより固有のヌクレオチド配列のうちの1つの検出によって決定される、単離することと
を含む。
【0148】
いくつかの実施形態では、本開示は、試料から複数の細胞を標識する方法に関し、この方法が、細胞を複数の標識オリゴヌクレオチドに曝露することを含む場合、この方法は、第2、第3、第4、またはそれ以上の標識オリゴヌクレオチドへの曝露の各連続ステップに細胞を曝露する前に、細胞を単一の容器にプールするステップをさらに含む。
【0149】
一態様では、マイクロ流体液滴は、例えば、細胞を含むために使用される。マイクロ流体液滴を使用して、複数の細胞の細胞を分離して識別可能に保つことができ、例えば、異なる細胞間の差異を識別できるようにする。いくつかまたはすべてが個体差を含み得る複数の細胞は、例えば、本明細書に開示される脂質修飾または疎水性アンカーオリゴヌクレオチドを使用することにより、単一細胞レベルまでの解像度で研究され得る。
【0150】
細胞は、任意の対象、例えば、ヒト、または非ヒト動物、例えば、無脊椎動物細胞(例えば、フルーツフライからの細胞)、魚細胞(例えば、ゼブラフィッシュ細胞)、両生類細胞(例えば、カエル細胞)、爬虫類細胞、鳥細胞、またはサル、類人猿、ウシ、ヒツジ、ヤギ、ウマ、ロバ、ラクダ、ラマ、アルパカ、ウサギ、ブタ、マウス、ラット、モルモット、ハムスター、イヌ、ネコなどの哺乳動物細胞から生じ得る。細胞が多細胞生物に由来する場合、細胞は、生物の任意の部分に由来する可能性がある。いくつかの実施形態では、組織を研究することができる。例えば、生物からの組織は、本明細書で論じられるように、組織内の差異が決定され得るように、細胞を産生するために処理され得る(例えば、組織の均質化を通じてまたは組織からの細胞のレーザー捕捉によって)。
【0151】
細胞または組織は、健康な対象、または罹患している、もしくは罹患している疑いのある対象から生じ得る。例えば、対象からの血液細胞を取り出して研究して、それらの細胞のプロファイルの違いまたは変化を決定することができ、例えば、対象が健康であるか疾患を有するか、例えば、動物が癌を有するかどうかを(例えば、血液中の癌細胞を決定することによって)決定することができる。場合によっては、腫瘍が研究され(例えば、生検を使用して)、腫瘍のプロファイルが決定され得る。例えば、細胞のいずれかが癌幹細胞であるかどうかを決定するために細胞を研究することができる。
【0152】
細胞はまた、本明細書で論じられているものに加えて、細胞の後成的プロファイルを決定するのを助けることができる他の技法を使用して決定され得る。例えば、細胞は、フローサイトメトリー、顕微鏡検査を使用して研究する、細胞を培養するなどして、プロファイル(またはプロファイルの変化)が細胞の他の変化、例えば、タンパク質の発現レベル、形態の変化、生殖または分化する能力などと相関するかどうかを決定し得る。
【0153】
液滴は、マイクロ流体チャネルに含まれ得る。例えば、ある特定の実施形態では、液滴は、約1mm未満、約500マイクロメートル未満、約300マイクロメートル未満、約200マイクロメートル未満、約100マイクロメートル未満、約75マイクロメートル未満、約50マイクロメートル未満、約30マイクロメートル未満、約25マイクロメートル未満、約10マイクロメートル未満、約5マイクロメートル未満、約3マイクロメートル未満、または場合によっては約1マイクロメートル未満の平均寸法または直径を有し得る。平均直径はまた、ある特定の場合では、少なくとも約1マイクロメートル、少なくとも約2マイクロメートル、少なくとも約3マイクロメートル、少なくとも約5マイクロメートル、少なくとも約10マイクロメートル、少なくとも約15マイクロメートル、または少なくとも約20マイクロメートルであり得る。液滴は、球形または非球形であり得る。液滴が非球形である場合、液滴の平均直径または寸法は、非球形液滴と同じ体積を有する完全な球の直径と見なすことができる。
【0154】
液滴は、任意の好適な技法を使用して産生することができる。例えば、チャネルの接合部を使用して、液滴を作成することができる。接合部は、例えば、T接合部、Y接合部、チャネル内チャネル接合部(例えば、同軸構成であるか、または内部チャネルの少なくとも一部を取り囲む内部チャネルおよび外部チャネルを含む)、クロス(または「X」)接合部、フローフォーカス接合部、または液滴を作成するための任意の他の好適な接合部であり得る。例えば、各々が参照によりその全体が本明細書に組み込まれる、WO2004/091763およびWO2004/002627を参照されたい。いくつかの実施形態では、接合部は、実質的に単分散の液滴を産生するように構成および配置され得る。
【0155】
場合によっては、細胞は、比較的高い速度で液滴内にカプセル化され得る。例えば、液滴への細胞カプセル化の速度は、少なくとも約10細胞/秒、少なくとも約30細胞/秒、少なくとも約100細胞/秒、少なくとも約300細胞/秒、少なくとも約1,000細胞/秒、少なくとも約3,000細胞/秒、少なくとも約10,000細胞/秒、少なくとも約30,000細胞/秒、少なくとも約100,000細胞/秒、少なくとも約300,000細胞/秒、または少なくとも約106細胞/秒であり得る。
【0156】
PCR反応(例えば、本明細書に開示される脂質修飾または疎水性アンカーオリゴヌクレオチドを利用する逆転写PCRおよびプライマー伸長PCRを含む)は、例えば、任意のマイクロ流体デバイス(例えば、マルチ試料ナノディスペンサーとインターフェースするマイクロ流体デバイスを含む)を使用して行うことができる。マイクロ流体デバイスは、流体の量が少なく、典型的に約マイクロリットルからナノリットルである流体システムである。いくつかの実施形態では、マイクロフルイディクスは、少量で数十から数千の試料を処理することができる。マイクロフルイディクスは、能動的または受動的であり得る。マイクロ流体デバイスのバルブなどの能動素子を使用することにより、マイクロ流体回路を作成することができる。これにより、少量の試薬を使用できるだけでなく、複数の手順を処理して同じチップに物理的に固定することができるため、高タスクの並列化も可能になる。
【0157】
マイクロ流体チャネルでは、液体の流れは完全に層流になり得、つまり、すべての流体が同じ方向に同じ速度で移動する。乱流とは異なり、これにより、流体内の分子の輸送を非常に予測可能にすることができる。マイクロ流体デバイスは、ガラスまたはプラスチックで作製することができる。いくつかの実施形態では、シリコーンの一種であるポリジメチルシロキサン(PDMS)を使用することができる。PDMSのいくつかの利点は、安価で、光学的に透明で、ガスを含むいくつかの物質に対して透過性があることである。いくつかの実施形態では、ソフトリソグラフィーまたはマイクロ成形を使用して、PDMSベースのマイクロ流体デバイスを作成することができる。デバイスは、圧力駆動流、動電流、または湿潤駆動流を使用することができる。
【0158】
いくつかの実施形態では、マイクロ流体デバイスは、複数のチャンバーを有し、各チャンバーは、リアルタイムマイクロアレイを有する。いくつかの実施形態では、アレイは、マイクロ流体デバイスに組み込まれる。いくつかの実施形態では、マイクロ流体デバイスは、チャンバーがリアルタイムマイクロアレイに対応するチャンバーを作成するために、複数のリアルタイムマイクロアレイを有する平面に特徴を追加することによって形成される。いくつかの実施形態では、3次元特徴を有する基板、例えば、ウェルおよびチャネルを備えたPDMS表面が、複数のリアルタイムマイクロアレイを有する表面と接触して配置され、複数のチャンバー内に複数のアレイを有するマイクロ流体デバイスを形成する。
【0159】
複数の試料を同時に分析するために、各々がリアルタイムマイクロアレイを備えた複数のチャンバーを有するデバイスを使用することができる。いくつかの実施形態では、複数のチャンバーは、同じ試料に由来する試料流体を有する。同じ試料の試料流体を複数のチャンバーに入れると、例えば、同じ試料の異なる態様を分析するために異なるアレイで各々を測定するか、または例えば、同一アレイでの並行測定によって精度を高めるために有用であり得る。場合によっては、同じ試料内の異なるアンプリコンは、異なる最適な温度プロファイル条件を有する。したがって、いくつかの実施形態では、同じ試料が異なる流体量に分割され、異なる流体量は、リアルタイムマイクロアレイを備えた異なるチャンバー内にあり、異なる流体量の少なくともいくつかには、異なる温度サイクルが与えられる。
【0160】
いくつかの実施形態では、複数のチャンバーは、異なる供給源からの試料流体を有する。所与の機器で所与の期間にさらに多くの試料を測定することによってスループットを向上させるために、異なる供給源からの試料流体を用意することが有用であり得る。いくつかの実施形態では、リアルタイムマイクロアレイを含む複数のチャンバーを備えたマイクロ流体を診断用途に使用することができる。デバイスは、各々がリアルタイムマイクロアレイを有する、約2、3、4、5、6、7、8、9、10、10~15、15~20、20~30、30~50、50~75、75~100、または100以上のチャンバーを有することができる。
【0161】
いくつかの実施形態は、固体支持体と組み合わせた脂質修飾または疎水性アンカーオリゴヌクレオチドの使用に関する。「固体支持体」は、共有結合または非共有結合のいずれかを介して、分子が直接的または間接的に付着され得る表面を有する任意の基板を指す。固体支持体は、表面に取り付けられたプローブに物理的支持を提供することができる任意の基板材料を含み得る。この材料は、一般に、バーコードオリゴヌクレオチドの表面への付着、およびアッセイの実施中に遭遇する任意の後次の処置、取り扱い、または処理に関連する条件に耐えることができる。材料は、天然に存在する、合成であるか、または天然に存在する材料の修飾であり得る。好適な固体支持体材料には、単独で、または他の材料と組み合わせて使用される、シリコン、グラファイト、鏡面、ラミネート、セラミック、プラスチック(例えば、ポリ(塩化ビニル)、シクロオレフィンコポリマー、ポリアクリルアミド、ポリアクリレート、ポリエチレン、ポリプロピレン、ポリ(4-メチルブテン)などのポリマーを含む)、ポリスチレン、ポリメタクリレート、ポリ(エチレンテレフタレート)、ポリテトラフルオロエチレン(PTFEまたはテフロン(登録商標))、ナイロン、ポリ(ビニルブチレート))、ゲルマニウム、ガリウムヒ素、金、銀などが含まれ得る。シリカを含み、さらに、例えば、Bioglassとして入手可能なガラスを含むガラスなどの追加の剛性材料を検討することができる。用いることができる他の材料には、例えば、制御された細孔ガラスビーズなどの多孔質材料が含まれる。例えば、その表面に組み込まれたアミノ、カルボキシル、チオール、またはヒドロキシル官能基のいずれかなどの1つ以上の官能基を有することができる、当該技術分野において知られている他の任意の材料も企図される。
【0162】
固体支持体に使用される材料は、単純なものから複雑なものまで、様々な構成のうちのいずれかを取ることができる。固体支持体は、ストリップ、プレート、ディスク、棒、粒子を含む(ビーズ、チューブ、ウェルなどを含む)、いくつかの形状のうちのいずれか1つを有し得る。通常、材料は、例えば、スライドなどの比較的平面であるが、例えば、ビーズなどの球形、または円筒形(例えば、柱)であり得る。多くの実施形態では、材料は、一般に長方形の固体として形作られている。例えば、プローブのアレイなどの複数の所定の配置をシート上に合成することができ、これを次にさいの目に切る、すなわち、スコアラインに沿って破断することによって単一のアレイ基板に切断する。使用できる例示的な固体支持体には、マイクロタイターウェル、顕微鏡スライド、膜、磁気ビーズ、帯電紙、ラングミュア・ブロジェットフィルム、シリコンウエハチップ、フロースルーチップ、およびマイクロビーズが含まれる。いくつかの実施形態では、ビーズは、プラスチックまたはポリスチレンである。いくつかの実施形態では、ビーズは、磁性である。ビーズを磁力に曝露した後、細胞を形成する核酸分子または配列を単離することができる。個々のDNAおよびRNA
【0163】
いくつかの実施形態では、ポリ(A)テールなどのその捕捉配列を介したバーコードオリゴヌクレオチドの固体支持体への直接抱合が可能である。そのような実施形態では、アンカーおよびコアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドを含む細胞または膜は、アンカーおよびコアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドを含む細胞または膜が、バーコードオリゴヌクレオチドに結合するようなハイブリダイズ条件で、固体支持体に曝露され得る。次いで、固体支持体を非結合物質から洗い流し、結合した細胞および膜を含む残りの固体支持体を、配列決定または他の同定スキームによってさらに分析することができる。
【0164】
いくつかの実施形態では、固体支持体は、最初は結合されておらず、バーコードオリゴヌクレオチドの捕捉配列を介してバーコードオリゴヌクレオチドに結合する。そのような実施形態では、アンカーおよびコアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドを含む細胞または膜は、第1および第2のプライマー領域を介してバーコードオリゴヌクレオチドに既にハイブリダイズしている。次いで、固体支持体を非結合物質から洗い流し、結合した細胞および膜を含む残りの固体支持体を、配列決定または他の同定スキームによってさらに分析することができる。
【0165】
いくつかの実施形態では、本開示は、本明細書に開示されるバーコードまたは脂質修飾オリゴヌクレオチドで細胞を標識する方法に関する。いくつかの実施形態では、方法は、開示されたオリゴヌクレオチドの1つまたは複数の均質な混合物または不均質な混合物を、1つまたは複数の細胞と接触させることを含む。いくつかの実施形態では、細胞は、試料からのものである。いくつかの実施形態では、細胞は、脂質-オリゴヌクレオチドが細胞中に存在するRNA、DNA、またはRNA/DNAハイブリッドとハイブリダイズするように、少なくとも第1および第2の脂質修飾オリゴヌクレオチドと接触させられる。いくつかの実施形態では、オリゴヌクレオチドの捕捉領域を使用して、オリゴヌクレオチドを固体支持体または別の固定オリゴヌクレオチドに単離し、それにより細胞からハイブリダイズしていない要素または成分を除去することができ、細胞から捕捉されたRNA/DNAの保持液を保存する。いくつかの実施形態では、単一細胞から捕捉されたRNA/DNAは、培養容器において単離され得る。いくつかの実施形態では、複数の捕捉されたDNA/RNA配列は、それが単離された細胞に対応するライブラリーに維持され得る。いくつかの実施形態では、複数の捕捉されたDNA/RNA配列は、配列決定されたDNAまたはRNAが、その細胞の発現パターンに対応するように配列決定される。
【0166】
本開示は、単一細胞または複数の細胞によって単独で発現されるオリゴヌクレオチドのライブラリーを調製する方法であって、1つまたは複数の細胞が、本明細書に開示される1つまたは複数の脂質修飾オリゴヌクレオチドに曝露された後に1つまたは複数の細胞からのRNAまたはDNAを配列決定することを含む、ライブラリーを生成する方法に関する。いくつかの実施形態では、1つまたは複数の細胞からの内因性ヌクレオチドは、脂質修飾オリゴヌクレオチドに結合したプローブの既知のシグナルまたは頻度を、オリゴヌクレオチドが結合した細胞に相関させることによって単離および/または同定することができる。プローブのシグナルまたは頻度は、内因性DNAおよび/またはRNAの供給源と対形成することができる。いくつかの実施形態では、内因性ヌクレオチドは、例えば、PCRまたは単離されたmRNAからcDNAライブラリーを作成するための他の既知の技法によってDNAの相補鎖のライブラリーを構築することから形成された1つまたは複数の細胞またはcDNAから発現されたmRNAである。いくつかの実施形態では、cDNAまたはmRNAは、細胞を本明細書に開示される1つまたは複数の脂質修飾オリゴヌクレオチドに接触させることによって単一細胞から単離され、それにより捕捉された各細胞は、脂質修飾オリゴヌクレオチドまたはオリゴヌクレオチド(複数)に結合したプローブの同定、数、または検出に相関し得る。1つまたは複数の細胞上の1つまたは複数の脂質修飾オリゴヌクレオチドの異なる分布を使用して、その細胞をその特定の内因性発現パターンのセットと相関させることができる。1つまたは2つ以上の脂質修飾オリゴヌクレオチドを保有する細胞は、細胞の表面上の抗原または他のタンパク質に特異的な抗体を使用して単離され得る。細胞の発現パターン(細胞によって発現される1つまたは複数の内因性配列を配列決定することによって作成される)は、細胞の対応する同一性を、抗体の標的配列に結合することが知られている抗体の接着によって同定された既知の抗原と相関させることができる。
【0167】
キット
本明細書に開示される組成物の産生および/または使用を容易にすることができるキットおよびシステムが提供される。本明細書で企図されるキットは、脂質修飾または疎水性アンカーオリゴヌクレオチド、脂質修飾または疎水性アンカーオリゴヌクレオチドを含む組成物、送達のための目的の薬剤のうちの1つ以上を含み得、これらは、別個の容器で、またはより通常は、滅菌容器内の単一組成物で提供され得る。
【0168】
さらに、キットには、キットの構成要素の使用説明書を含めることができる。
【0169】
いくつかの実施形態では、キットは、試料バーコードにプレハイブリダイズされたアンカー脂質修飾または疎水性アンカーオリゴヌクレオチドを含む、マルチウェルプレート、例えば、96、384、1536、または3456ウェルプレートを含む。別個の患者、状態などに由来する細胞は、コアンカー標識、洗浄、および単一細胞RNA配列決定の上流で、固有のウェルに分注することでバーコード化することができる。
【実施例】
【0170】
実施例1
リグノセリン酸部分(LMO)またはコレステロール-TEG(CMO)は、LMO/CMOについてのCite-Seq(Stoekius et al.,Nat.Meth.14:865-68(2017))のバーコード設計から適応され、以下の材料を合成/順序付けした。
(1)5’末端でリグノセリン酸部分(LMO)またはコレステロール-TEG(CMO)にカップリングされた41ntの「アンカー」DNAオリゴ。5’端の20ntは、コアアンカー配列の逆補体であり(以下を参照)、膜の標識を安定させる。下流の21ntは、未修飾のDNAバーコードの5’末端に位置するTruSeq Small RNA PCRハンドルの逆相補体である(以下を参照)。LMO/CMOアンカー配列は、次のとおりである。
(2)3’末端でパルミチン酸部分(LMO)またはコレステロール-TEG(CMO)にカップリングされた20ntの「コアンカー」DNAオリゴ。コアンカーは、アンカーの5’末端の逆相補体であり、次の配列を有する。
(3)59nt scRNAseqバーコードのセット。各バーコードは、アンカー配列の3’末端へのハイブリダイゼーションを介して細胞に局在する。ハイブリダイゼーション領域は、TruSeq Small RNA PCRハンドルであり、ライブラリー調製中のバーコードのPCRベースの濃縮に使用される。バーコードには、scRNAseq mRNA捕捉ビーズで捕捉するための6nt試料バーコードおよび32ntポリA領域が含まれている。バーコードは、次の配列を有する。
【0171】
次いで、フローサイトメトリーを使用して、(1)異なる細胞型を、LMOおよびCMOを使用して正常かつ予測どおりに標識できるか、および(2)10X Genomics scRNAseqワークフローに一致する時間枠にわたって、標識がscRNAseq緩衝液中で安定しているか(すなわち、細胞間でスクランブルしなかったか)を確認した。
図1では、ヒト胎児腎臓細胞(HEK293)、マウス胎児線維芽細胞(NIH3T3)、およびヒト乳腺上皮細胞(HMEC)が、LMOおよび/またはCMOで標識され得ることを示す。これは、単一種からの細胞を標識するためにのみ使用できる既存のBD技術に対する改善である。
図2では、標識効率は予測可能であり、HEKの滴定シリーズ全体に比例する。
図3では、混合細胞を別個のLMOまたはCMO(すなわち、別個のフルオロフォア抱合オリゴにハイブリダイズした共通のアンカー配列)で標識し、HEKではバーコードスクランブルの程度が無視できることを示した。
図4では、組織培養皿に付着した状態で細胞を標識し、トリプシン処理後もシグナルが失われなかった。これはまた、トリプシンに曝露されると分解される既存の抗体ベースの標識技法に対する改善である。
【0172】
実施例2
ビヒクルまたは5ng/§L TGF-βのいずれかで24時間処理して転写応答を誘発するHEKおよびHMECを培養した。細胞をトリプシン処理した後、これらの細胞型は、別個のLMO、CMO、またはBD抗体ベースのバーコードで標識され、プールされた細胞は、マイクロ流体カプセル化の直前に同じタイプのバーコードで標識された。10Xマイクロ流体チップの4つのレーンが使用され、各レーンには、LMO、CMO、BDで標識された細胞の混合物が含まれていたか、バーコードが全く含まれていなかった。
【0173】
LMOおよびCMOバーコードの配列決定ライブラリーの調製が成功したことを検証した後、V2 MiSeqキットを使用してバーコードライブラリーを配列決定し、HiSeq 4000を使用して発現ライブラリーを配列決定した。
図6は、HiSeqデータで検出された単一細胞ごとの試料バーコードの比率の分布を示す。有意なバーコード交換なしで細胞を安定して標識するために期待されるように、LMOおよびCMO標識試料の両方で、細胞は3Dプロットの隅で濃縮される(すなわち、ほとんどの細胞は単一の試料バーコードのみで高度に濃縮される)。
【0174】
次いで、tSNEを使用して、発現ライブラリーデータ内の細胞間の関係を視覚化し、MiSeqデータ内の関連する試料コールによって各細胞に色を付けた(
図7)。この場合も、標識を成功させるために予想されるように、試料バーコードはクラスター全体でランダムにスクランブルされるのではなく、別個のクラスターまたはクラスターの領域で特に濃縮される。TGFbによるHMECの刺激は、刺激されていないHMECとは完全に別々にクラスター化するのに十分な大きさの転写応答を誘発しなかったが、試料バーコードは、HMECクラスター内でスクランブルされないが、むしろそれらのクラスター内で別個のドメインを定義する。
【0175】
実施例3
単一細胞および単一核RNA配列決定(scRNA-seq、snRNA-seq)は、多細胞系の異種転写プロファイルを調べるための強力な技術として登場した。初期のscRNA-seqワークフローは、一度に数十から数百の単一細胞トランスクリプトームの分析に限定された。マイクロウェル、スプリット・プールバーコード、および液滴マイクロフルイディクスに基づいた単一細胞配列決定技術の出現により、103~105個の細胞または核の平行転写分析は、現在のルーチンである。細胞スループットのこの増加は、臓器全体および生物全体の組成を特徴付ける努力を触媒した。
【0176】
これらの技術は、細胞集団が相互作用して発達、恒常性、および疾患を促進する機序を明らかにするためにますます使用されるであろう。記述的分析から機械的分析へのこの移行には、強力な結論を引き出すために、時空間情報、多様な摂動、および実験的複製を統合する必要がある。既存の方法では数千もの細胞をアッセイすることができるが、試料特異的バーコード(例えば、Illuminaライブラリーインデックス)は、標準ライブラリー調製ワークフローの最後に組み込まれ、これにより、試薬のコストおよび液滴マイクロ流体デバイスの物理的制約により、scRNA-seq試料スループットが制限される。試料多重化アプローチは、プーリングおよび単一細胞単離の前に試料特異的バーコードで細胞を標識することにより、この制限に対処する。既存の遺伝的多様性を使用して試料を区別する、または遺伝的もしくは非遺伝的機序のいずれかを使用して試料バーコードを導入するいくつかの多重化方法が説明されている。しかしながら、これらの方法の各々には、スケーラビリティ、ユニバーサリティ、実験に二次的な摂動を導入する可能性に関する問題を含む短所がある。
【0177】
本発明者らは、脂質およびコレステロールで修飾されたオリゴヌクレオチド(LMO、CMO)を、他の試料多重化技法の制限の多くを回避する試薬として同定した。本発明者らは以前に、段階的な組み立てによって生細胞の原形質膜に迅速かつ安定的に組み込まれるLMOおよびCMO足場について説明した。ここでは、脂質タグ付きインデックスを使用して、LMOとCMOをMULTI-seq-scRNA-seqおよびsnRNA-seq試料の多重化に適応させる。MULTI-seqは、種または遺伝的背景に関係なく、試料のバーコードを生細胞および核に局在させる。MULTI-seqは、非摂動的で高速であり、最小限の試料処理を伴う。ここでは、MULTI-seqの単純さおよびモジュール性により、T細胞活性化の時間経過、96ヒト乳腺上皮細胞(HMEC)培養条件、および転移進行の様々な段階で患者由来の異種移植片(PDX)マウスモデルから単離された凍結保存された初代細胞の分析が可能になった。
【0178】
LMO、CMO、および試料バーコードオリゴヌクレオチドの設計および合成:
アンカーおよびコアンカーLMOおよびCMOの設計は、Weberらから採用された。簡単に説明すると、アンカーLMOは、2つのオリゴヌクレオチドドメインを持つ5’リグノセリン酸(LA)修飾を有する。5’末端は、3’パルミチン酸(PA)を担持するコアンカーLMOに相補的であり、3’末端は、試料バーコードオリゴヌクレオチドのPCRハンドルに相補的である。試料バーコードは、(Stoeckiusらのように)3つの構成要素を有するように設計された:(1)バーコード増幅およびライブラリー調製のための5’PCRハンドル、(2)他のすべての利用されたバーコードと比較してハミング距離が3を超える8bpバーコード、および(3)mRNA捕捉ービーズオリゴヌクレオチドのオリゴdT領域へのハイブリダイゼーションに必要な30bpのポリAテール。同一に設計されたアンカーおよびコアンカーCMOは、トリエチレングリコール(TEG)リンカーを介して3’または5’末端でコレステロールに抱合され、Integrated DNA Technologiesから市販されている。
【0179】
アンカーLMOおよびコアンカーLMO合成:
オリゴヌクレオチドは、前述のように(Weber et al,Supplemental Materials)、Applied Biosystems Expedite 8909 DNAシンセサイザーで合成された。
【0180】
細胞培養物:
概念実証scRNA-seqおよびsnRNA-seq実験では、HEK293細胞、HMEC、Jurkat細胞、およびMEF細胞を、5% CO2により37℃で維持した。HEK293およびMEF細胞は、10%ウシ胎児血清(FBS)およびペニシリン/ストレプトマイシン(それぞれ100U/mLおよび100μg/mL)で補足された、4.5g/Lのグルコース、0.584g/LのL-グルタミン、3.7g/LのNaHCO3を含むダルベッコ改変イーグル培地、高グルコース(DMEM H-21)中で培養した。HMECは、5ng/mLのヒト組み換えTGF-β(Peprotech)による24時間の刺激の有無にかかわらず、M87A培地で培養した。Jurkat細胞を、10% FBSおよびペニシリン/ストレプトマイシン(それぞれ100U/mLおよび100μg/mL)で補足された、25mM HEPESおよび2.0g/LのNaHCO3を含むRPMI-1640中で培養した。
【0181】
96試料のHMEC実験では、第4継代HMECを0.05%トリプシン-EDTAを使用して5分間持ち上げた。細胞懸濁液を45μmセルストレーナーに通して、凝集塊をすべて除去した。細胞をM87A培地で1回洗浄し、10
7細胞/mLで再懸濁した。細胞を1:50 APC/Cy-7抗ヒト/マウスCD49f(Biolegend、#313628)および1:200 FITC抗ヒトCD326(EpCAM)(Biolegend、#324204)抗体とともに氷上で30分間インキュベートした。細胞をPBSで1回洗浄し、DAPIとともに2% BSAを含むPBSに200~400万細胞/mLで再懸濁した。細胞は、BD FACSAria IIIで選別した。DAPI+細胞は破棄した。LEPは、EpCAM
hi/CD49f
loとしてゲートし、MEPは、EpCAM
lo/CD49f
hiとしてゲートした(
図17)。特に、このゲート戦略では、わずかな数のMEPおよびLEPが正しく選別されない。HMEC亜集団は、ウェルがLEPのみ、MEPのみ、またはLEPとMEPの比率が2:1になるように、24ウェルプレートに選別された。選別された細胞集団をM87A培地中で48時間培養した後、異なるシグナル伝達分子またはシグナル伝達分子の組み合わせで補足された、M87A培地(-EGF)中で72時間培養した。具体的には、M87A培地(-EGF)を、100ng/mLのRANKL、100ng/mLのWNT4、100ng/mLのIGF-1、113ng/mLのAREG、および/または5ng/mLのEGF(すべてPeprotech製)単独で、またはすべての可能な対の組み合わせで補足した。96試料のHMEC技術的複製実験では、すべての選別されたウェルにLEPおよびMEPの両方が含まれていることを除いて、上記のようにインビトロ培養物を調製した。次いで、培養物を完全なM87A培地で72時間増殖させた後、単離した。
【0182】
scRNA-seq試料調製:
概念実証実験では、まず細胞を0.05%トリプシン-EDTA中、37℃で5分間トリプシンで処理した後、適切な細胞培養培地でクエンチした。次いで、単一細胞懸濁液を160rcfで4分間ペレット化し、PBSで1回洗浄した後、PBS中に等モル量のアンカーLMOおよび試料バーコードオリゴヌクレオチドを含む200nM溶液90μLに懸濁した。アンカーLMO-バーコード標識を氷上で5分間行った後、PBS中の2μMコアンカーLMO(最終濃度200nM)10μLを各細胞プールに添加した。穏やかに混合した後、標識反応を氷上でさらに5分間続けた後、細胞をPBSで2回洗浄し、0.04%のBSAを含むPBSに再懸濁し、ろ過し、プールした。同じワークフローを、CMOでも行った。次いで、LMO、CMO、および非標識の対照細胞を3つの別個の10Xマイクロフルイディクスレーンにロードした。
【0183】
元の96-plex HMEC実験では、洗浄ステップを最小限に抑え、それによって細胞の損失を制限し、細胞の生存率を維持するために、トリプシン処理中にLMO標識を行った。24ウェルプレートで培養されたHMECを、37℃で5分間、0.05%トリプシン-EDTA中に等モル量のアンカーLMOおよび試料バーコードオリゴヌクレオチドを含有する200nM溶液190μL中の5% CO2で標識した。次いで、0.05%トリプシン-EDTA中の4μMコアンカーLMO10μLを、各ウェルに添加し(最終濃度200nM)、標識/トリプシン処理を37℃および5% CO2でさらに5分間続けた後、適切な細胞培養培地でクエンチした。細胞が単一細胞懸濁液中に存在するようになったらLMOを組み込んだことを除いて、同様の標識プロトコルを技術的複製実験に使用した。次いで、細胞を96ウェルプレートに移し、PBS中の0.04% BSAで洗浄した。最後に、細胞を単一のアリコートにプールし、0.45μmのセルストレーナーでろ過し、カウントした後、10Xマイクロフルイディクスレーンにロードした。
【0184】
PDX実験では、前述のようにNOD-SCIDγ(NSG)マウスで生成されたトリプルネガティブ乳癌PDXモデルから解剖した後、原発腫瘍および肺を凍結保存した。UCSFの施設内動物管理使用委員会(IACUC)は、すべての動物実験をレビューし、承認した。実験当日、凍結保存した組織を解凍し、標準GentleMacsプロトコルを使用してDMEM/F12(Gibco)に50μg/mLのLiberase TL(Sigma-Aldrich)および2×104U/mLのDNase I(Sigma-Aldrich)を含有する消化培地で解離させた。次いで、解離した細胞を70μmセルストレーナーでろ過して、単一細胞懸濁液を得た後、PBSで洗浄した。次いで、細胞を氷上で15分間、PBS中の1:500 Zombie NIR(BioLegend、#423105)生存率色素で染色した。次いで、細胞をPBS中の2% FBSで洗浄した後、氷上で5分間、PBS中の2% FBS中の1:200 Fcブロック(Tonbo、#70-0161-U500)100μLでブロックした。ブロックした後、細胞を氷上で45分間、抗マウスTER119(FITC、ThermoFisher、#11-5921-82)、抗マウスCD31(FITC、ThermoFisher、#11-0311-85)、抗マウスCD45(BV450、Tonbo、#75-0451-U100)、抗マウスMHC-I(APC、eBioscience、#17-5999-82)、および抗ヒトCD298(PE、BioLegend、#341704)を含有する100μLの抗体カクテルで染色した。次いで、細胞をPBSで洗浄した後、氷上で5分間、PBS中の2.5μMアンカーLMOバーコード100μLでMULTI-seq標識を行った。PBS中の15μMコアンカーLMO20μLを、各細胞プールに添加し(最終濃度2.5μM)、標識をさらに5分間続けた。
【0185】
特に、この実験では、解離後に残っている細胞および親油性分子の総数の増加を説明するために、10倍高いLMO濃度を使用した。LMO標識後、細胞をPBS中の2% FBS100μLで希釈してLMOを「クエンチ」し、PBS中の2%FBSで1回洗浄した。最後に、以前に記載されたように(Lawson et al.,2015、
図18、
図19)、解離した原発腫瘍および肺からのmCD45+マウス免疫細胞およびhCD298+ヒト転移を、FACS濃縮後にプールした。次いで、細胞プールを単一の10Xマイクロフルイディクスレーンで配列決定した。
【0186】
snRNA-seq試料調製:
経時的なJurkat細胞活性化の場合、2×105 Jurkat細胞を、12ウェルプレートのうちの8ウェルに添加し、10ng/μLのホルボール12-ミリステート13-アセテート(PMA、Sigma-Aldrich #P8139)および1.3μMのイオノマイシン(Sigma-Aldrich #I0634)で、LMOによるバーコードの15分前、30分前、1時間前、2時間前、4時間前、6時間前、または24時間前に処理した。Jurkat細胞の単一ウェルは未処理のままにした。HEK293およびMEF細胞を上記のように培養した。核は、10X Genomicsから採用したプロトコルを使用して細胞から単離した。簡単に説明すると、HEK293、MEF、または処理したJurkat細胞の懸濁液をPBSで1回洗浄し、160rcf(HEK293、MEFS)または300rcf(Jurkat)で4分間、4℃でペレット化し、冷却した溶解緩衝液(milliQ水中の0.5% Nonidet P40代替、10mMのTris-HCl、10mMのNaCl、および3mMのMgCl2)に2.5×106細胞/mLの密度まで懸濁した。溶解を氷上で5分間進行させた後、溶解物をペレット化し(500rcf、4℃、4分)、冷却した再懸濁緩衝液(PBS中の2% BSA)で3回洗浄した。次いで、核を、LMOまたはCMO標識の前に約106核/mLの濃度に希釈した。HEK293およびMEF細胞を、各々2つの試料に分割し、生細胞について説明したのと同じ手順を使用して、LMOまたはCMO(再懸濁緩衝液中500nM)で標識した(標識中のBSAの存在は、核の凝集を防ぐために必要な唯一の変化である)。各Jurkat試料は、LMO単独で標識した。各試料を1mLの再懸濁緩衝液で3回洗浄した(500rcf、4℃、4分)。4つのLMOおよびCMOで標識されたHEK293およびMEF試料は、等しい分量でプールし、別々に、Jurkat試料は、等しい割合でプールした。これらの最後の2つの試料は、1:1の比率で組み合わされ、単一の10Xマイクロフルイディクスレーンで配列決定した。
【0187】
scRNA-seqおよびsnRNA-seqライブラリーの調製:
配列決定ライブラリーは、10X Genomics Single Cell V2およびCITE-seqワークフローに基づくカスタムプロトコルを使用して調製した。簡単に説明すると、10Xワークフローは、cDNA増幅まで追跡し、2.5μMのMULTI-Seq添加剤プライマー1μLをcDNA増幅マスターミックスに添加した。
【0188】
MULTI-seq添加剤プライマー:
このプライマーは、mRNA捕捉ビーズで逆転写を正常にプライミングしたが、テンプレートスイッチングを介して拡張されなかったバーコードの増幅を可能にすることにより、バーコード配列決定の収量を増加させる(
図110C)。特に、MULTI-seq添加剤プライマーは、概念実証snRNA-seqライブラリーの調製中に誤って除外されたが、核は、依然として確実に分類することができた。増幅後、0.6X SPRIサイズ選択を使用して、バーコードおよび内因性cDNA画分を分離した。次いで、内因性cDNA画分を10Xワークフローに従って、次の形式の次世代配列決定(NGS)まで処理した。
【0189】
NGSのバーコード画分を調製するために、cDNA増幅から残っている汚染オリゴヌクレオチドを、最初に、確立された低分子RNA濃縮プロトコル(Beckman Coulter)を使用して除去した。具体的には、バーコード画分の最終SPRI比を3.2倍の反応量に増やし、1.8倍反応量の100%イソプロパノール(Sigma-Aldrich)を添加した。次いで、ビーズを400μLの80%エタノールで2回洗浄し、2~3分間風乾させた後、50μLの緩衝液EB(Qiagen,USA)で溶出した。溶出したバーコードcDNAは、ライブラリー調製PCRの前にQuBitを使用して定量した(95℃、5’;98℃、15″;60℃、30″;72℃、30″;8サイクル;72℃、1’;4℃保持)。各反応量は、26.25μLの2X KAPA HiFi HotStartマスターミックス(Roche)、2.5μLの10μM TruSeq RPIXプライマー(Illumina)、2.5μLの10μM TruSeqユニバーサルアダプタープライマー(Illumina)、3.5ngのバーコードcDNA、およびヌクレアーゼフリー水を含む合計50μLであった。
容器-細胞の塊(脂質)-バーコード-各ウェル
【0190】
対象からの試料から採取された組織または細胞切片の厚さ約100~約1000ミクロン
1.空間的にバーコード化する
2.切片の位置をバーコードと相関させる
3.Vibrotone-生検組織切片
4.Dropseq
5.マークまたは動員して処理する-細胞をウェルから取り出し、単一細胞を配列決定する
ここで、Nは、任意のヌクレオチドである。
【0191】
ライブラリー調製PCRに続いて、残りの配列決定プライマーおよび汚染オリゴヌクレオチドを、1.6X SPRIクリーンアップによって除去した。MULTI-seqライブラリー調製ワークフローの異なる段階での代表的なBioanalyzerトレースを
図11に示す。バーコードライブラリーは、
図21に示されているNGSフォーマットを使用して配列決定された。特に、配列決定読み取りは、主にバーコード参照配列に整列され、重複したUMIの割合が低い高いSNRをもたらし、提示された実験のいずれについてもバーコードライブラリーが飽和状態に配列決定されなかったことを示唆している。
【0192】
発現ライブラリーの前処理:
発現ライブラリーのFASTQは、CellRanger(10X Genomics)を使用して前処理され、hg19(概念実証scRNA-seq、HMEC)、連結されたmm10-hg19(PDX)、または連結されたmm10-hg19pre-mRNA(概念実証snRNA-seq)参照トランスクリプトームに整列された。実験で複数の10Xレーンが配列決定された場合、CellRanger凝集体を使用して読み取り深度の正規化を行った。
【0193】
細胞/核の呼び出し:
概念実証scRNA-seq、snRNA-seq、およびHMECの技術的複製実験では、CellRangerを使用して細胞関連のバーコードを定義した。元の96-plex HMEC実験では、細胞は、(2)MULTI-seq試料分類ワークフロー中に正常に分類された600以上の全RNA UMIに関連付けられた細胞バーコード(1)として定義された。低品質の細胞バーコードを除外するために、閾値として600RNA UMIを手動で選択した。PDX実験では、(2)MULTI-seq試料分類ワークフロー(Supplemental Materials)中に正常に分類された100以上の全RNA UMIに関連付けられたバーコード(1)として細胞を定義した。
【0194】
発現ライブラリー分析:
前処理および細胞/核の呼び出しに続いて、前述のように、「Seurat」Rパッケージを使用して、分析用にRNA UMIカウントマトリックスを調製した。簡単に説明すると、ミトコンドリア遺伝子にマッピングされた読み取りのパーセンテージ(Mito%)を各細胞について計算する前に、3つ未満の細胞で発現した遺伝子を破棄した。Mito%が上昇した外れ値の細胞は視覚的に定義され、破棄された。次いで、データはlog2変換され、中央に配置され、Mito%による分散の前にスケーリングされ、RNA UMIの総数が回帰された。次いで、平均発現および分散の閾値を選択することにより、各データセットに非常に可変的な遺伝子を定義し、合計で約2000個の遺伝子をもたらした。次いで、これらの可変遺伝子がPCA中に使用され、統計的に有意なPCが、PCエルボープロット変曲点推定によって定義された。次いで、重要なPCを教師なしLouvianクラスター化に利用し、t-SNEにより次元削減した。
【0195】
前処理に続いて、「Seurat」の「FindMarkers」コマンドを使用して、差次的遺伝子発現解析を行い、「test.use」を「bimod」に設定し、log倍率変化閾値を状況に応じて設定した(補足資料)。他のデータセット特異的分析については、補足資料で論じられている。データセット特異的「Seurat」前処理パラメータ:
【0196】
バーコードライブラリーの前処理:
「ShortRead」および「stringdist」Rパッケージを活用するカスタムスクリプトを使用して、生のバーコードライブラリーFASTQをバーコードUMIカウントマトリックスに変換した(
図13)。簡単に説明すると、生のFASTQを最初に解析して、R1の最初の16塩基が、事前定義された細胞バーコードのリストに関連付けられた細胞バーコードのうちのいずれとも完全に一致しなかった読み取りを破棄した。第2に、R2の最初の8塩基が、任意の参照バーコードと1未満のミスマッチで整列しなかった読み取りを破棄した。第3に、読み取りを細胞バーコードによってビニングし、重複したUMIを、R2の塩基17~26が正確に一致する読み取りとして同定した。最後に、参照バーコードアライメントの結果を解析して、重複したUMIを削除した後、最終的なバーコードUMIカウントマトリックスに変換した。
【0197】
バーコードライブラリー配列決定統計:
MULTI-seqバーコードライブラリー配列決定統計は、この研究で提示されたすべてのデータセットの分類されたシングレットについて計算した。SNRは、上位2つの最も豊富なバーコードの商を見つけることによってすべての細胞について計算した。この研究で提示された各データセットのすべてのシングレットの平均SNRは、
図21に示されている。アラインメント率は、R2の最初の8塩基が任意の参照バーコードと1未満のミスマッチで整列されたシングレット関連配列決定読み取りの割合として定義された。
【0198】
MULTI-seq試料分類:
MULTI-seqバーコードUMIカウントマトリックスを使用して、以前のscRNA-seq多重化アプローチに触発されたワークフローを介して細胞を試料群に分類した(
図13)。まず、生のバーコード読み取りを、log
2変換し、平均中心化した。次いで、「initial_dims」をバーコードの総数に設定して、「Rtsne」Rパッケージにおいて実装されているように、正規化されたバーコードカウントマトリックスに対してt-SNEを行うことによって、各バーコードの存在を視覚的に検査した。欠落しているバーコード(96-plex HMEC実験でのみ観察された)は、バーコード空間の濃縮が不足しているものとして識別し、削除した。
【0199】
次に、各バーコードの値の上位および下位0.1%を除外し、各バーコードの確率密度関数(PDF)を、「KernSmooth」Rパッケージからの「bkde」関数を使用して産生されたGaussianカーネル密度推定に「approxfun」R関数を適用することによって定義した。次いで、各バーコードに対して正および負の細胞群が、ローカルPDFの最大値として現れるという仮定に従って、細胞を分類しようとした。この目的のために、各PDFのすべての極大値を計算し、負の最大値および正の最大値をそれぞれ最も頻繁な極大値および最も高い極大値として定義した。特に、この戦略は、真にバーコード化された細胞が、任意の所与のバーコードに対して最も豊富であり、個々の試料群が他のすべての群の合計よりも多くのメンバーを有することはないと想定している。
【0200】
これらの正と負の近似値を使用して、次にバーコード特異的UMI閾値を定義しようとした。閾値の定義に最適な最大値間分位数を見つけるために(例えば、最大値間分位数0.5は中点に対応する)、0.02分位数の増分を繰り返し、シングレット分類の数を最大化する値を選択した。次いで、これらのバーコード特異的UMI閾値を使用して、各細胞がどの閾値を超えるかを識別し、ダブレットを1より大きい閾値を超える細胞として定義して、試料分類を行った。次いで、陰性細胞(すなわち、0の閾値を超える細胞)を除去し、すべての細胞がシングレットまたはダブレットとして分類されるまで、この手順を繰り返した。次いで、半教師あり学習を使用して、負の細胞のサブセットを再分類することができ、この場合、最初のワークフロー中に定義されたシングレットを使用して、負の細胞のk-平均クラスター化中にクラスター中心を初期化する(補足資料)。
【0201】
統計的検定:
概念実証scRNA-seq実験におけるTGF-β刺激および非刺激HMEC間の統計的に有意なTGFBI発現の濃縮は、ウィルコクソン順位和検定(両側、n=1,950細胞)を使用して評価した。シグナル伝達分子の曝露に従ってグループ化されたLEPおよびMEP間の統計的に有意なTGFBI発現の濃縮は、ウィルコクソン順位和検定を使用して評価した(両側、n=32シグナル伝達分子条件群)。すべてのデータセットのクラスター間で差次的に発現した遺伝子は、ボンフェローニ多重比較調整を用いた単一細胞遺伝子発現の尤度比検定を使用して定義した。転移進行中の肺免疫細胞型比率の統計的に有意な変化は、ボンフェローニ多重比較調整を伴う2比例z検定を使用して評価した(n=44腫瘍ステージ/細胞型群)。
【0202】
生の遺伝子発現およびバーコードカウントマトリックスを、関連するメタデータとともに、Gene Expression
Omnibus(GSE…)にアップロードした。
【0203】
MULTI-seqの概要:
MULTI-seqは、「アンカー」LMOへのハイブリダイゼーションにより、DNAバーコードを原形質膜に局在させる。「アンカー」LMOは、疎水性の5’リグノセリン酸アミドを介して膜と会合する。3’パルミチン酸アミドを組み込んだ「コアンカー」LMOへのその後のハイブリダイゼーションは、複合体の疎水性を高め、それによって膜の保持を延長する(
図8A)。MULTI-seq試料バーコードには、3’ポリA捕捉配列、8bp試料バーコード、およびライブラリー調製とアンカーハイブリダイゼーションに必要な5’PCRハンドルが含まれる。細胞または核は、膜関連のMULTI-seqバーコードをエマルジョン液滴に運び、3’ポリAドメインは、mRNA捕捉ビーズへのハイブリダイゼーション中に内因性転写物を模倣する。次いで、内因性転写物およびMULTI-seqバーコードは、逆転写中に共通の細胞または核特異的バーコードに連結され、試料の逆多重化が可能になる。MULTI-seqバーコードおよび内因性発現ライブラリーは、次世代配列決定ライブラリー構築の前にサイズ選択によって分離され、ユーザー定義の比率でプールされた配列決定を可能にする(実験方法)。同じ戦略を市販のCMOに適用することができる。
【0204】
フローサイトメトリーを使用して、LMOとCMOが4℃の典型的な試料調製温度で生細胞間を予測どおりに標識し、最小限に交換するかどうかを評価した(
図11A、S1B)。新たに単離された核を使用して、同一の実験も行った(
図11C、S1D)。これらのデータは、LMOが4℃で生細胞膜上のCMOよりも長い膜滞留時間を示すのに対し、LMOおよびCMOは、室温で生細胞間で同等に交換することを明らかにし、最適な試料多重化結果を達成するために細胞を氷上で維持する必要があることを示唆している(
図11E)。核の場合、両方のオリゴヌクレオチド抱合は、最小限の核膜間の交換を示したが(
図11D)、核単離緩衝液中のウシ血清アルブミン(BSA)はLMOを特異的にクエンチし、標識効率を低減した(
図11B)。核の標識中には問題であるが、LMOクエンチングを生細胞の標識中に戦略的に用いて、オフターゲットバーコードを低減し、試料プール前の洗浄を潜在的に最小限に抑えることができると考えた。実際、LMO標識反応をPBS中の1% BSAで希釈すると、プーリング後のオフターゲット標識が最小限に抑えられ(一次標識シグナルの1%未満)、PBSでの希釈よりも18倍低いことがわかった(
図11F)。
【0205】
MULTI-seqによりscRNA-seq試料の逆多重化が可能になる:
TGF-βの存在下または非存在下で培養されたHEK293細胞(HEK)および初代ヒト乳腺上皮細胞(HMEC)を使用して概念実証実験を行うことにより、MULTI-seqがscRNA-seq試料を逆多重化する能力を試験した(
図8B)。細胞をトリプシン処理し、LMOまたはCMOでバーコード化し、10X Genomics Chromiumシステムで液滴マイクロ流体エマルジョンの前にプールした。並行して、MULTI-seqが遺伝子発現またはmRNA捕捉効率に影響を与えるかどうかを試験するために、バーコードなしの複製を調製した。
【0206】
データの前処理(計算方法)に続いて、合計14,377個の細胞を含む最終的なscRNA-seqデータセットを分析した。HEKの既知のマーカー、ならびにHMECの2つの細胞成分、筋上皮(MEP)、および管腔上皮細胞(LEP、
図8C、
図12A)に従って、遺伝子発現空間のクラスターを同定した。MULTI-seqバーコード分類をLMO標識細胞(
図8D)およびCMO標識細胞(
図12B)の遺伝子発現空間に投影すると、両方の膜足場が各試料を正常に逆多重化したことがわかる。TGF-βとともに培養されたと予測されたHMECは、濃縮されたTGFBI発現を示した(
図8E)。重要なことに、RNAおよびMULTI-seqバーコードUMIカウントは、負の相関関係がなく、MULTI-seqがmRNA捕捉を損なわないことを実証する(
図12C)。しかしながら、LMO標識HEKには存在しなかったCMO標識HEK(
図12D、
図20)の転写変化を観察した。
【0207】
単一核RNA-seq(snRNA-seq)の逆多重化および経時的実験:
snRNA-seqは、解離が困難な固形組織の分析に広く使用されている。MULTI-seqがHEKおよびマウス胚性線維芽細胞(MEF)から核を精製し、snRNA-seqの前に核の各プールをLMOまたはCMOで標識することにより、snRNA-seq試料を逆多重化できるかどうかを調査した。並行して、イオノマイシンおよびホルボール12-ミリステート13-アセテート(PMA)で処理したJurkat細胞を8つの時点(0~24時間)で多重化し、T細胞の活性化ダイナミクスを追跡した(
図12E)。MULTI-seq試料分類は、遺伝子発現空間で意図された細胞型クラスター(
図12F、
図12G)と一致し、誤分類率は約0.5%であった(
図8F)。特に、MULTI-seq分類は種特異的であり、マウス-ヒトダブレットの約85%を予測した。これは、理論上のダブレット検出限界である約92%に近似している。生細胞の結果と一致して、MULTI-seqバーコードは、mRNA捕捉を損なわなかった(
図12H)。生細胞の結果とは対照的に、CMOおよびLMOで標識された核は、バーコード化されていない対照と転写的に区別できなかった(
図12I)。さらに、CMO標識された核は、LMO標識された核と比較して、平均信号対ノイズ比(SNR)およびバーコードUMIの総数が高く(
図21)、以前のフローサイトメトリーの結果と一致していた。
【0208】
T細胞活性化の軌跡に沿って個々の時点を逆多重化すると(
図8G)、複数の文献で裏付けられている転写ダイナミクスが観察された(
図8H)。例えば、初期の下方調節(例えば、TSHR)、ならびに一過性(例えば、DUSP2)、持続性(例えば、CD69)、および後期(例えば、GRZA)の上方調節を受けている遺伝子は、データで容易に同定された。
【0209】
MULTI-seqは、scRNA-seqデータのダブレットを同定する:
次に、一連の微小環境条件にまたがる96個の固有のHMEC試料を多重化することにより、MULTI-seqのスケーラビリティを実証しようとした。MEP、LEP、およびEGFを含まないM87A培地で増殖した両方の細胞型からなる重複培養物を、15の生理学的に関連するシグナル伝達分子またはシグナル伝達分子の組み合わせに曝露した(
図13A)。3つの10Xマイクロフルイディクスレーンに細胞をプールしてロードする前に、各試料をバーコード化した結果、標準的な実践と比較して試薬の使用量が32分の1に低減した。
【0210】
HMECを試料群に分類するために、以前の戦略(計算方法、補足資料、
図13)によって触発された試料分類ワークフローを実装し、合計26,439個の細胞からなる76個の試料群を同定した(
図14)。各群は、単一バーコードについて排他的に濃縮され(
図9A、左、
図13C)、最も豊富なオフターゲットバーコードの平均約199倍であった(
図13D)。比較的少ない試料の試料多重化データとは異なり、この実験では、MULTI-seqで定義されたダブレットがバーコード空間のシングレットクラスターの周辺に局在した(
図9A、右)。技術的複製により96の試料群すべてが得られたため(
図13E~G)、取り扱いエラーに起因するバーコードの欠落が疑われた(
図13B、補足資料)。
【0211】
逆多重化の精度を評価するために、細胞型の構成(例えば、MEP単独、LEP単独、または両方)に従ってMULTI-seq分類をグループ化し、これらの群を遺伝子発現空間で視覚化した。得られたトランスクリプトームデータの教師なしクラスター化およびマーカー分析は、両方の細胞型のマーカーを発現する不明瞭な細胞のサブセットとともに、LEPをMEPから区別した(
図9B、左、
図15A)。MULTI-seq分類は、予想される細胞型クラスターと一致したが(
図9B、右)、MEPマーカーおよびLEPマーカーを共発現する細胞は、主にダブレットとして定義された。MULTI-seqは、マーカー遺伝子を使用してダブレットを予測するときに見落とされていたダブレットを同定した(
図9B、矢印)。さらに、MULTI-seqダブレット分類は、計算ダブレット検出技法には鈍感である「同型」ダブレット(すなわち、転写的に類似した細胞から形成されたダブレット)を除いて、一般に計算予測と一致した(
図9C、感度=0.283、特異性=0.965)(補足資料)。さらに、DoubletFinderは、増殖性LEPを誤ってダブレットとして分類し(
図9C、矢印)、細胞型の数が少ないデータセットに適用した場合に計算ダブレット推論のパフォーマンスがどのように低下するかを示している。
【0212】
MULTI-seqは、共培養条件およびシグナル伝達分子に対する転写応答を同定する:
試料の逆多重化、ダブレット除去、および品質管理フィルタリングにより、合計21,753個の細胞を含む最終的なscRNA-seqデータセットが得られ、培養組成に関連する2つの転写応答が明らかになった。最初に、MEPと共培養されたLEPが、単独で培養されたLEPと比較して濃縮された増殖を示すことを観察した(
図9D、
図15B)。対照的に、MEPは単独でまたはLEPと一緒に培養した場合に等しく増殖した(
図15C)。第2に、非増殖性の共培養されたMEPおよびLEPは、単独で培養されたMEPおよびLEPと比較してTGFBI発現が濃縮されていることを観察した(
図9D、右下、
図15D)。
【0213】
次に、階層的クラスター化を使用して、LEPまたはMEPがシグナル伝達分子の曝露にどのように反応したかを評価した。EGFRリガンドAREGおよびEGFに曝露されたHMECは、対照細胞とは有意に異なる遺伝子発現プロファイルを示した。AREGおよびEGFで刺激されたLEPは、対照LEPと比較して、EGFRシグナル伝達遺伝子(例えば、DUSP4)およびHER2+乳癌で上方調節された遺伝子(例えば、PHLDA1、
図9E)のレベルの上昇を表した。AREGおよびEGFで刺激されたMEPはまた、高レベルの既知のEGFR調節遺伝子も発現する(例えば、ANGPTL4、
図15E)。
【0214】
MULTI-seqは、凍結保存された一次PDX試料中の低RNA細胞を同定する:
scRNA-seqを使用してアーカイブの一次組織試料を分析することは、凍結保存、解凍、酵素消化、およびscRNA-seq試料調製の間に複合されるこれらの試料が低い細胞生存率を有し得るため、しばしば困難である。MULTI-seqバーコードの迅速かつ非摂動的な性質が、転移性トリプルネガティブ乳癌のPDXマウスモデルから解剖された試料を使用して凍結保存された組織の多重化を可能にするかどうかを調査した。このモデルシステムでは、原発腫瘍の直径を、肺の転移進行の代用として使用した(
図16A)。初期および中期PDXマウスからの原発腫瘍および肺を表す9つの別個の試料(重複)、1つの後期PDXマウス、および腫瘍のない免疫不全マウスからの1つの肺をバーコード化した(
図10A)。次いで、単一の10X Genomicsマイクロフルイディクスレーンを「スーパーローディング」する前に、バーコード化hCD298+ヒト転移のFACS濃縮集団をmCD45+マウス免疫細胞とプールした。
【0215】
品質管理フィルタリング、試料分類、およびダブレット除去により、9個の試料すべてにまたがる9,110のマウスおよびヒトシングレットの最終的なscRNA-seqデータセットが得られた(
図10B、
図16B)。試験した条件下では、バーコードSNRは、全細胞数および生存率の試料間差に対してほとんど不変であった(
図16C、
図22)。分類の精度は、組織特異的な遺伝子発現パターン(
図16D)およびFACS濃縮結果との比較(
図16E)によって裏付けられた。さらに、MULTI-seq分類により、標準の品質管理ワークフローを使用して破棄されたであろう高品質の単一細胞トランスクリプトームが同定された(例えば、CellRanger RNA UMI変曲点閾値=1350、
図10C)。細胞を100~1350のRNA UMIと比較すると、分類された細胞には、単一細胞およびバルクトランスクリプトミクス(例えば、好中球)を使用して検出するのが難しい免疫細胞型が含まれていた。驚くべきことに、配列決定された好中球の90.8%が、CellRangerによって破棄されたはずである。対照的に、分類されていない低RNA細胞は、主に壊れた細胞に対応する質の悪い遺伝子発現プロファイルを有していた(
図23)。
【0216】
転移進行に対する肺の免疫応答の特徴付け:
次に、肺の免疫細胞が転移進行にどのように応答するかを説明しようとした。5,690 mCD45+細胞で構成されるデータセットから始めて、好中球、単球、マクロファージ(肺胞、間質、および(非)古典的単球)、樹状細胞(成熟、未成熟、Ccr7+、および形質細胞様DC)、ならびに内皮細胞(
図10C、上、
図16F)に関連する遺伝子発現プロファイルを同定した。免疫不全のPDXマウスを使用すると、リンパ球(例えば、T、B、NK細胞)が不足する。
【0217】
各腫瘍ステージで、免疫細胞の比率(
図10D)および転写状態(
図10E)の文献に裏付けられた変化を観察した。例えば、好中球は、初期段階のPDXマウスで濃縮され、肺胞マクロファージは、転移の過程で枯渇した。さらに、古典的単球(CM、
図10F)間のステージ特異的転写の不均一性は、PDX乳癌モデルにおける肺のCM状態遷移の以前の説明を反映している。
【0218】
CMの教師なしクラスター化は、各腫瘍ステージから細胞をきれいに分離し(
図17G)、転移進行中にCMで上方調節された遺伝子の同定を可能にする(
図24)。特に、クラスター化により、後期PDXマウスのCMが、以前の観察結果と一致するCd14発現(
図10F、挿入図、
図25)によって識別できる2つの別個の転写状態に陥ることも明らかになった。CMサブセット間で差次的に発現される遺伝子には、転移進行に影響を与えることが知られている遺伝子(例えば、Thbs1、S100a8/9、Wfdc21)が含まれる。結果が主にマウス間の変動に起因するかどうかを識別するために、Earth Mover’s Distance(EMD)を使用して、各マウスの肺CMと腫瘍ステージとの間の転写の非類似性の大きさを定量化した。これらの結果は、初期および中期のマウス複製からのCM(スケーリングされたEMD=0.16)が、異なる腫瘍ステージからのCM(スケーリングされたEMD=0.69)よりも類似していたことを示している。
【0219】
MULTI-seqは、スケーラブルでユニバーサルであり、scRNA-seqデータの品質を向上させるため、理想的な試料多重化アプローチである。MULTI-seqは、安価な試薬を使用し、試料処理が最小限で済み、設計が迅速でモジュール性であるため、スケーラブルである。MULTI-seqモジュール性により、任意の数の試料を「アンカー」および「コアンカー」LMOの単一対で多重化することができる。さらに、LMOはBSAでクエンチ可能であり、タンパク質分解解離中に組み込むことができるため、方法をさらに最適化することで、洗浄不要の試料調製ワークフローが容易になると予想される。自動化された液体処理と統合された場合、これらの機能は、MULTI-seqを、多細胞系(例えば、オルガノイド、PBMCなど)での「スクリーン・バイ・シーケンシング」アプリケーション(例えば、L1000、DRUG-seq)を可能にする強力な技術として位置付ける。
【0220】
この研究では、MULTI-seqスケーラビリティを活用して、96-plex HMEC摂動アッセイを行い、将来のscRNA-seq試料多重化実験の注目すべき原理を明らかにした。具体的には、シグナル伝達分子への応答は、細胞組成に関連する応答よりも顕著ではないことを観察した。例えば、共培養されたMEPおよびLEPは、関連する単一培養には存在しないTGF-βシグナル伝達に関与する。対照的に、MEPおよびLEPは、乳腺の形態形成におけるすべての試験されたシグナル伝達分子の確立された役割にもかかわらず、これらのデータではEGFRリガンドAREGおよびEGFに対して顕著な転写応答のみを示した。ここで使用されているM87A培地(-EGF)など、細胞を増殖させるために使用される富栄養培地製剤は、微小環境の摂動に対して細胞を緩衝する可能性が高いと推測される。したがって、将来のscRNA-seq実験を正確に解釈するには、細胞型の組成および培地製剤を慎重に検討することが不可欠である。
【0221】
MULTI-seqは、スケーラビリティに加えて、2つの別個の方法でscRNA-seqデータの品質を向上させる。まず、MULTI-seqは、ダブレットを複数の試料インデックスに関連付けられた細胞として同定する。ダブレットを検出する能力により、液滴マイクロ流体デバイスを「スーパーロード」することができ、細胞スループットが約5倍向上する。さらに、計算ダブレット予測法とは異なり、MULTI-seqは、同型ダブレットを検出し、最小限の細胞型の複雑さでscRNA-seqデータに対して良好に機能する。しかしながら、計算ダブレット検出方法は、共有試料バーコードを持つ細胞から形成されたダブレットを検出するため、ダブレット検出には、理想的には計算アプローチと分子アプローチとの相乗効果が必要である。
【0222】
第2に、MULTI-seqは、RNA UMI閾値を利用した品質管理ワークフローによって破棄される細胞を「レスキュー」することにより、scRNA-seqデータの品質を向上させる。そのようなワークフローは、RNA含有量の少ない細胞型に対して体系的に偏っている。MULTI-seq分類は、低RNAと低品質細胞とを区別するためのRNA UMIに直交するメトリックを提供する。この特徴(Stoeckiusらによって最初に説明された)を利用して、PDXデータセットの品質を改善し、ここで、MULTI-seq分類は、壊れた細胞の誤分類を回避しながら、配列決定された好中球の90%超を「レスキュー」した。
【0223】
最後に、MULTI-seqは、形質膜にアクセス可能な細胞または核を含むあらゆる試料にユニバーサルに適用できる。その結果、同じセットのMULTI-seq試薬を使用して、マウスおよびヒトの両方から15の別個の細胞型または核を多重化した。特に、BSAは、LMOを隔離するため、CMOは、BSAを含む核単離緩衝液中でLMOを上回った。さらに、MULTI-seqは、瞬間冷凍および固定などの試料保存戦略と互換性があると予想される。
【0224】
これらの3つの特徴(スケーラビリティ、ユニバーサリティ、データ品質の向上)をすべて活用して、転移進行の様々な段階でPDXマウスモデルから解剖された凍結保存された原発腫瘍および肺を多重化した。PDX試料の多重化には、(ii)抗体ベースの多重化技法(例えば、MHC-1)によって一般的に標的とされる表面エピトープを下方調節し、(iii)最小限の試料の取り扱いを必要とする本質的に低い生存率を有し得る、(i)複数の種からのバーコード細胞が必要である。MULTI-seqは、すべての試料の逆多重化に成功し、肺の転移進行に対する新規で文献に裏付けられた免疫細胞応答を明らかにした。例えば、好中球、肺胞マクロファージ、およびCM比率の転移関連シフトが以前に観察された一方で、間質マクロファージ、樹状細胞、および非古典的単球の有意なシフトについて説明した。これは、本発明者らの知る限り、新規であり、さらなる実験的検証が必要である。
【0225】
さらに、Cd14の発現と転移進行に多様な影響を与える遺伝子によって識別できるCMサブセットを同定した。困惑することに、転移促進遺伝子Thbs1を発現するCd14-高CMと、抗転移遺伝子S100a8/9およびWfdc21を発現するCD14-低CMが転移した肺に共存していた。この研究では肺全体から免疫細胞を単離したため、CD14-高およびCD14-低状態が転移部位と空間的に相関しているかどうかを識別できなかった。しかしながら、MULTI-seqを用いて、単一の転移性肺の別個の領域を空間的にバーコード化し、CMの空間的不均一性を直接調べることができる。
【0226】
要約すると、MULTI-seqを使用すると、ユーザーは情報の追加レイヤーをscRNA-seq実験に組み込むことができる。将来的には、空間座標、時点、起源の種、および細胞内構造(例えば、多核細胞からの核)を含む、より多様なタイプの情報が標的になると予想される。また、代替オリゴヌクレオチド抱合設計を使用してLMO膜滞留時間を長くすると、非遺伝的系統追跡および/または細胞競合アッセイのMULTI-seqアプリケーションが可能になると予想される。
【0227】
実施例4-LMOを用いたスプリット・プールバーコードおよびmRNA捕捉
単一細胞RNA配列決定では、基本的にmRNA分子を捕捉し、転写物特異的バーコードおよび細胞特異的バーコードの両方でタグ付けする必要がある。伝統的に、この目標は、(i)5’PCRハンドル、(ii)すべてのビーズ結合オリゴ間で共有される細胞特異的バーコード、(iii)固有の分子識別子(UMI)、および(iv)オリゴdTポリA mRNA捕捉配列を有するオリゴヌクレオチドに結合したヒドロゲルビーズで個々の細胞を共カプセル化することによって達成された。しかしながら、ビーズを含まないscRNA-seqアプリケーションが非常に望ましい。脂質修飾オリゴヌクレオチド(LMO)は、生細胞の表面に安定したDNA足場を形成し、バーコード化mRNA捕捉配列を構築するために活用できる。細胞特異的バーコードは、分割-プールアプローチによって生成される。
【0228】
試料の単一細胞懸濁液は、前述のように0.5~5μMのLMOおよびバーコードオリゴで標識されている。次いで、試料をPBS中の2% BSAで洗浄し、プールし、混合し、多くの(例えば、96または384)ウェルに分割する。各ウェルは、5’リン酸塩と、第1および第2のバーコードにハイブリダイズして、それらを一緒に連結するリンカーオリゴと、を含む0.5~5μMの第2のバーコードを受け取る。このプロセスは、各細胞が固有のバーコードセットを受信するために必要な回数だけ繰り返され、最終的なバーコードには常に捕捉配列(例えば、オリゴ-dT)が含まれる。バーコードラウンドの後、細胞は最後にもう一度プールされ、μLあたり1000細胞の濃度に希釈される。単一細胞は、80mMのTris-HCl(pH8.0~8.4)、2U/μL RNase阻害剤、20U/μL T4 DNAリガーゼ、およびNEBクイックライゲーションキットの1Xライゲーション緩衝液、溶解のための0.1~0.5%のIgepal CA-630洗剤、1.0mMのdNTP、1.5U/μLのWarmStart RT×逆転写酵素(RT)(NEB)とともにマイクロ流体液滴で単離される。単一細胞の単離および溶解の後、細胞を氷上で約30分間保持し、リガーゼが各バーコードを一本鎖に共有結合できるようにする。次いで、混合物を55℃に加熱してリガーゼを不活性化し、RT酵素を活性化する。55℃で約1時間後、エマルジョンを80℃に10分間加熱し、次いで室温に冷却する。エマルジョンは、1mLのパーフルオロオクタノールで破砕される。この時点で、試料は、標準的なcDNA増幅および次世代配列決定ライブラリーの調製ワークフローをいくつでも実行できる。
【0229】
実施例5-組織または試料内の一般的な空間情報
LMOを使用して、相対的な空間配向に基づいて細胞をバーコード化することができる。一般的に言えば、空間バーコード化を実現するには2つのアプローチがある:(1)物理的な分離細胞/組織領域とそれに続く前述のバーコード化、および(2)脂質修飾オリゴヌクレオチドアンカーの細胞への添加とそれに続く空間的に定義されたバーコードオリゴヌクレオチドの添加。最初の場合、メスによる解剖、マイクロウェル単離、またはレーザー捕捉マイクロダイセクションを通じて、一連の長さスケールにわたって物理的な分離を実現することができる。細胞が単離されると、バーコードを各固有の試料に導入して、その試料内の細胞の相対的な位置を示すことができる。第2の場合では、すべての細胞は、バーコードオリゴヌクレオチドの添加前にアンカーおよびコアンカーを受け取る。バーコードは、場所に特異的であり、導入場所から拡散して、アンカー鎖へのハイブリダイゼーションを介して細胞に捕捉される。細胞の相対的な位置は、空間バーコードの量および相対的な比率によって決定される。空間バーコードの導入は、マイクロアレイヤー、インクジェットプリンター、音響液体ハンドラー、および固体支持体(例えば、アレイまたはビーズ)からの裂開を含むいくつかの方法によって達成することができる。
【0230】
発達中の腸の空間バーコード化(実験およびデータ)
scRNA-seq試料のメソスケール空間バーコードにMULTI-seqを適用するために、まず、安楽死させたばかりのマウスまたは解剖した胚から小腸を外科的に切除した。次いで、小腸を表面に沿って伸ばした後、結合組織および脂肪をメスで除去した。次いで、小腸をフィレットした後、氷冷したPBSで振とうしながら4回洗浄した。洗浄後、各腸を同じサイズのセグメントに切断した(すなわち、成人の腸では近位-遠位軸に沿って長さが約1cm、発達中の腸では約2.5mm)。次いで、2mLの解離培地(3% FBS、1%ペン/ストレップ、1%ピルビン酸ナトリウム、1% MEM非必須アミノ酸、1% L-グルタミン、2.5% HEPES、5mM EDTA、および10mM DTTを含むRPMI1640)で振とうさせながら、セグメントを室温で20分間解離させた。
【0231】
解離およびp1000ピペットによる手動撹拌に続いて、解離溶液を100mMフィルターを通して氷上の15mLコニカルバイアルに濾した。次いで、ストレーナーの上部に残っている組織塊を、4mLのEDTAを含む別の15mLコニカルバイアルに移して、再ろ過する前にさらに消化した(例えば、30秒間激しく振とうさせる)。このプロセスを2回繰り返し、大まかにろ過した細胞懸濁液を生成した。次いで、この大まかにろ過した懸濁液を、70mMフィルターでろ過し、新しい15mLコニカルバイアルに入れた後、1500rpmで8分間遠心分離した。
【0232】
次いで、各細胞懸濁液を10mLの氷冷PBSで1回洗浄した後、氷冷PBS中の160mLの単一細胞懸濁液に再懸濁した。次いで、単一細胞懸濁液を48ウェルプレートの個々のウェルに移してから、単一のMULTI-seq試料バーコードにプレハイブリダイズした2.5mMアンカーLMOを20mL添加した。次いで、細胞懸濁液を手動で撹拌し、氷上で5分間インキュベートした後、20mLの2.5mMコアンカーLMOを添加し、その後に氷上で5分間インキュベートした。MULTI-seq標識に続いて、標識溶液を5% BSAを含む300mLで希釈し、生細胞のプーリング、抗体染色、およびFACS濃縮の前に周囲のLMOをクエンチした。次いで、生細胞を、液滴マイクロフルイディクスを使用して、標準の10× Genomics scRNA-seqワークフローに供した。各実験で収集された概略図およびデータを、
図26および
図27に示す。
【配列表】