(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-19
(54)【発明の名称】細胞株背景遺伝学の合成バーコード化
(51)【国際特許分類】
C12Q 1/02 20060101AFI20240209BHJP
C12N 5/10 20060101ALI20240209BHJP
C12Q 1/6869 20180101ALI20240209BHJP
C12N 15/09 20060101ALN20240209BHJP
【FI】
C12Q1/02
C12N5/10
C12Q1/6869 Z
C12N15/09 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023550166
(86)(22)【出願日】2022-02-17
(85)【翻訳文提出日】2023-10-17
(86)【国際出願番号】 US2022070707
(87)【国際公開番号】W WO2022178522
(87)【国際公開日】2022-08-25
(32)【優先日】2021-02-18
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】522454068
【氏名又は名称】インシトロ インコーポレイテッド
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】サリック, マックス アール.
(72)【発明者】
【氏名】ルベック, エリック
(72)【発明者】
【氏名】シヴァナンダン, シュリニヴァサン
(72)【発明者】
【氏名】ケイカス, アジャメテ
【テーマコード(参考)】
4B063
4B065
【Fターム(参考)】
4B063QA20
4B063QQ08
4B063QQ42
4B063QR08
4B063QR32
4B063QR62
4B063QS25
4B063QS40
4B063QX01
4B063QX02
4B065AA90X
4B065AB01
4B065BA02
4B065BA24
4B065BA25
(57)【要約】
本明細書では、異なる遺伝的背景からの細胞のプール化スクリーニングの方法が提供される。また、本明細書では、生体試料の第1の複数の画像と第2の複数の画像との間の位置合わせのためのコンピュータ実装方法も提供される。
【特許請求の範囲】
【請求項1】
a)異なる遺伝的背景の細胞の2つ以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する2つ以上の固有の核酸バーコードシーケンスで標識することと、
b)細胞の単一の混合集団を得るために、前記細胞の2つ以上の集団を組み合わせることと、
c)前記細胞に対するin situ単細胞シーケンシングを行うことと、
d)前記混合集団における前記細胞の、既知の表現型を分析すること又は新しい表現型を同定することと、
を含む、異なる遺伝的背景からの細胞のプール化スクリーニング方法。
【請求項2】
前記細胞の2つ以上の集団が異なる細胞株由来である、請求項1に記載の方法。
【請求項3】
前記異なる細胞株が健康な細胞株である、請求項2に記載の方法。
【請求項4】
前記異なる細胞株が患者細胞株である、請求項2に記載の方法。
【請求項5】
前記異なる細胞株が同質遺伝子操作された細胞株である、請求項2に記載の方法。
【請求項6】
前記異なる細胞株が、健康な細胞株、患者細胞株、及び同質遺伝子操作された細胞株の任意の組合せを含む、請求項2に記載の方法。
【請求項7】
前記細胞が人工多能性幹細胞(iPSCs)である、請求項1乃至6のいずれか一項に記載の方法。
【請求項8】
前記iPSCsが、前記表現型を分析する前に分化させられる、請求項7に記載の方法。
【請求項9】
前記表現型を分析する前に前記細胞を培養することをさらに含む、請求項8に記載の方法。
【請求項10】
前記細胞の単一の混合集団が、基板上又は三次元培養物中にある、請求項1乃至9のいずれか一項に記載の方法。
【請求項11】
前記基板が細胞培養皿である、請求項10に記載の方法。
【請求項12】
前記方法が、単一細胞RNAseqを行うことをさらに含む、請求項1乃至11のいずれか一項に記載の方法。
【請求項13】
前記方法が、工程b)の前に、前記細胞の2つ以上の集団を2世代以上増殖させることをさらに含む、請求項1乃至12のいずれか一項に記載の方法。
【請求項14】
前記方法が、前記細胞の2つ以上の集団のゲノムに前記固有の核酸バーコードシーケンスを安定に組み込むことを含む、請求項1乃至13のいずれか一項に記載の方法。
【請求項15】
前記固有の核酸バーコードシーケンスが、ウイルスを使用して前記細胞内に送達される、請求項14に記載の方法。
【請求項16】
前記ウイルスがレンチウイルスである、請求項15に記載の方法。
【請求項17】
前記ウイルスが選択マーカーをコードする、請求項15又は16に記載の方法。
【請求項18】
前記選択マーカーが抗生物質耐性遺伝子である、請求項17に記載の方法。
【請求項19】
前記ウイルスが蛍光タンパク質をコードする、請求項15乃至18のいずれか一項に記載の方法。
【請求項20】
固有の核酸バーコードシーケンスそれぞれが少なくとも1塩基対の長さである、請求項1乃至19のいずれか一項に記載の方法。
【請求項21】
固有の核酸バーコードシーケンスそれぞれが1~約18塩基対の長さである、請求項20に記載の方法。
【請求項22】
固有の核酸バーコードシーケンスそれぞれが8塩基対の長さである、請求項20に記載の方法。
【請求項23】
前記細胞の2つ以上の集団が、前記固有の核酸バーコードシーケンスで標識する前にシーケンシングされる、請求項1乃至22のいずれか一項に記載の方法。
【請求項24】
前記シーケンシングが全ゲノムシーケンシングである、請求項23に記載の方法。
【請求項25】
前記細胞の2つ以上の集団が関連個体から得られた、請求項1乃至24のいずれか一項に記載の方法。
【請求項26】
前記細胞の2つ以上の集団がヒトから得られた、請求項25に記載の方法。
【請求項27】
異なる遺伝的背景の細胞の10以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する10以上の固有の核酸バーコードシーケンスで標識することを含む、請求項1乃至26のいずれか一項に記載の方法。
【請求項28】
前記細胞の表現型を分析することが、ハイコンテントイメージング、カルシウムイメージング、免疫組織化学、細胞形態撮像、タンパク質凝集撮像、細胞間相互作用撮像、生細胞撮像、及び任意の他の画像ベースのアッセイモダリティからなる群から選択されるアッセイを含む、請求項1乃至27のいずれか一項に記載の方法。
【請求項29】
工程d)が、前記細胞の顕微鏡画像又は時系列の顕微鏡画像をキャプチャすることによって前記細胞の表現型を分析することと、前記画像又は複数の画像において示される表現型特徴を評価することとを含む、請求項1乃至28のいずれか一項に記載の方法。
【請求項30】
前記方法が、
培養プレート上のウェルのものである第1の複数の画像の第1の基準座標空間を生成することと、
前記第1の複数の画像の第1のパッチを抽出することと、
前記培養プレート上の前記ウェルのものである第2の複数の画像の第2の基準座標空間を生成することと、
前記第2の複数の画像の第2のパッチを抽出することと、
複数の変換パラメータを得るために、前記第1のパッチと前記第2のパッチとの間のアフィン変換関数を計算することと、
前記複数の変換パラメータに基づいて、前記第1の基準座標空間と前記第2の基準座標空間との間の座標変換関数を生成することと、
を含む、前記第1の複数の画像と前記第2の複数の画像との間の位置合わせのためのコンピュータ実装技術をさらに含む、請求項29に記載の方法。
【請求項31】
培養プレート上のウェルのものである第1の複数の画像の第1の基準座標空間を生成することと、
前記第1の複数の画像の第1のパッチを抽出することと、
前記培養プレート上の前記ウェルのものである第2の複数の画像の第2の基準座標空間を生成することと、
前記第2の複数の画像の第2のパッチを抽出することと、
複数の変換パラメータを得るために、前記第1のパッチと前記第2のパッチとの間のアフィン変換関数を計算することと、
前記複数の変換パラメータに基づいて、前記第1の基準座標空間と前記第2の基準座標空間との間の座標変換関数を生成することと、
を含む、前記第1の複数の画像と前記第2の複数の画像との間の位置合わせのためのコンピュータ実装方法。
【請求項32】
前記第1の複数の画像は複数のバーコーディング画像である、請求項31に記載の方法。
【請求項33】
前記第2の複数の画像は複数のマーカーベースの/マーカーを含まない読み出し画像である、請求項31又は32に記載の方法。
【請求項34】
前記第1の複数の画像及び前記第2の複数の画像は、前記ウェルの異なるカバレッジを提供する、請求項31乃至33のいずれか一項に記載の方法。
【請求項35】
前記第1の複数の画像及び前記第2の複数の画像が異なる時間に撮像される、請求項33乃至34のいずれか一項に記載の方法。
【請求項36】
前記第1の複数の画像及び前記第2の複数の画像が異なる解像度を有する、請求項31乃至35のいずれか一項に記載の方法。
【請求項37】
前記第1の複数の画像が第1の顕微鏡によって撮影され、前記第2の複数の画像が第2の顕微鏡によって撮影される、請求項31乃至36のいずれか一項に記載の方法。
【請求項38】
前記第1の顕微鏡が蛍光顕微鏡である、請求項37に記載の方法。
【請求項39】
前記第2の顕微鏡が非蛍光顕微鏡である、請求項37に記載の方法。
【請求項40】
前記第1の複数の画像が第1のイメージャによってキャプチャされる、請求項31乃至39のいずれか一項に記載の方法。
【請求項41】
前記第1の複数の画像における前記ウェルの1つ以上の物理的特性を検出することと、
検出された前記1つ以上の物理的特性に基づいて前記第1の基準座標空間を生成することと、
をさらに含む、請求項40に記載の方法。
【請求項42】
前記ウェルの前記1つ以上の物理的特性が、前記ウェルの形状、前記ウェルのエッジ、前記ウェルの位置を含む、請求項41に記載の方法。
【請求項43】
前記第1の複数の画像中の2つ以上の画像が重複比によって互いにオフセットされ、前記第1の基準座標空間が前記重複比に基づいて生成される、請求項40乃至42のいずれか一項に記載の方法。
【請求項44】
前記第1の基準座標空間は、前記第1のイメージャのメタデータに基づいて生成される、請求項40乃至43のいずれか一項に記載の方法。
【請求項45】
1つ以上の画像内で捕捉された1つ以上のランドマークに基づいて前記第1の複数の画像から1つ以上のマーカー画像を選択することであって、前記第1のパッチは、前記第1の複数の画像からの前記1つ以上のマーカー画像から取得される、選択することをさらに含む、請求項40乃至44のいずれか一項に記載の方法。
【請求項46】
前記1つ以上のランドマークは、1つ以上の細胞、1つ以上のウェル境界、1つ以上のビーズ、1つ以上の核、又はそれらの任意の組合せを含む、請求項45に記載の方法。
【請求項47】
前記第2の複数の画像が第2のイメージャによってキャプチャされる、請求項31乃至46のいずれか一項に記載の方法。
【請求項48】
前記第2の複数の画像における前記ウェルの1つ以上の物理的特性を検出することと、
検出された前記1つ以上の物理的特性に基づいて前記第2の基準座標空間を生成することと、
をさらに含む、請求項47に記載の方法。
【請求項49】
前記ウェルの前記1つ以上の物理的特性が、前記ウェルの形状、前記ウェルのエッジ、前記ウェルの位置を含む、請求項48に記載の方法。
【請求項50】
前記第2の複数の画像中の2つ以上の画像が重複比によって互いにオフセットされ、前記第2の基準座標空間が前記重複比に基づいて生成される、請求項47乃至49のいずれか一項に記載の方法。
【請求項51】
前記第2の基準座標空間は、前記第2のイメージャのメタデータに基づいて生成される、請求項47乃至50のいずれか一項に記載の方法。
【請求項52】
1つ以上の画像内で捕捉された1つ以上のランドマークに基づいて前記第2の複数の画像から1つ以上のマーカー画像を選択することであって、前記第2のパッチは、前記第2の複数の画像の前記1つ以上のマーカー画像から取得される、選択することをさらに含む、請求項47乃至51のいずれか一項に記載の方法。
【請求項53】
前記1つ以上のランドマークは、1つ以上の細胞、1つ以上のウェル境界、1つ以上のビーズ、1つ以上の核、又はそれらの任意の組合せを含む、請求項52に記載の方法。
【請求項54】
前記第1のパッチが第1の画像の中心をカバーする、請求項31乃至53のいずれか一項に記載の方法。
【請求項55】
前記第2のパッチが第2の画像の中心をカバーする、請求項31乃至54のいずれか一項に記載の方法。
【請求項56】
前記第1のパッチの少なくとも一部分及び前記第2のパッチの少なくとも1つのパッチが同じ被写体に対応する、請求項31乃至55のいずれか一項に記載の方法。
【請求項57】
前記変換パラメータが、並進パラメータ、スケーリングパラメータ、及び回転パラメータのうちの1つ以上を含む、請求項31乃至56のいずれか一項に記載の方法。
【請求項58】
a)異なる遺伝的背景の細胞の2つ以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する2つ以上の固有の核酸バーコードシーケンスで標識することと、
b)細胞の単一の混合集団を得るために、前記細胞の2つ以上の集団を組み合わせることと、
c)前記細胞に対するin situ単細胞シーケンシングを行うことと、
d)前記混合集団における前記細胞の、既知の表現型を分析すること又は新しい表現型を同定することと、
を含む、異なる遺伝的背景からの細胞のプール化スクリーニングのアッセイから、第1の画像及び第2の画像が得られた、請求項31乃至57のいずれか一項に記載の方法。
【請求項59】
画像を受け取り分類結果を出力するように構成された分類器を利用することをさらに含む、請求項1乃至58のいずれか一項に記載の方法。
【請求項60】
前記分類器が複数の層を含む、請求項59に記載の方法。
【請求項61】
前記分類器が畳み込みニューラルネットワークである、請求項59又は60に記載の方法。
【請求項62】
前記分類器がDenseNet分類器である、請求項59乃至61のいずれか一項に記載の方法。
【請求項63】
前記分類結果が、前記画像内で捕捉された単一細胞それぞれの遺伝的背景に基づく分類である、請求項59乃至62のいずれか一項に記載の方法。
【請求項64】
前記画像の埋め込みを生成することをさらに含む、請求項59乃至63のいずれか一項に記載の方法。
【請求項65】
前記埋め込みは、前記分類器の最後の層の前の活性化出力層から生成される、請求項64に記載の方法。
【請求項66】
前記埋め込みは、線形次元削減法を使用して次元が削減される、請求項64又は65に記載の方法。
【請求項67】
前記埋め込みの可視化のための1つ以上のUMAP(Uniform Manifold Approximation and Projection for Dimension Reduction)プロットを得るために、前記埋め込みはUMAPアルゴリズムを使用して次元が削減される、請求項64乃至66のいずれか一項に記載の方法。
【請求項68】
前記埋め込みの少なくとも一部に基づいて処理を評価することをさらに含む、請求項64乃至67のいずれか一項に記載の方法。
【請求項69】
1つ以上のUMAPプロットの少なくとも一部に基づいて処理を評価することをさらに含む、請求項67又は68に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願に関する相互参照]
本出願は2021年2月18日に出願された「Synthetic BARCODING OF CELL LINE BACKGROUND GENETICS」という名称の米国仮出願第63/150,979号の優先度を主張し、その内容は、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。
【0002】
[技術分野]
本発明は、異なる遺伝的背景からの細胞のプール化スクリーニングの方法に関する。本発明はまた、第1の複数の画像と第2の複数の画像との間の位置合わせのためのコンピュータ実装方法に関する。
【背景技術】
【0003】
細胞ベースのモデルにおいて、細胞株の背景遺伝学は、細胞挙動、表現型、及び疾患状態に実質的な影響を有し得る。細胞のプールを利用するアプローチは、集団ベースの研究をインビトロで行うことを可能にする可能性を有する。しかしながら、現在利用可能なプール化スクリーニングアプローチには限界がある。
【0004】
いくつかの現行のプール化スクリーニングアプローチは、その「バーコード」としての細胞の背景遺伝学に依存し、これは、そのアッセイはそれらの最終的な読み出しとしてシーケンシングを最終的に使用し得ることを意味する。これは、典型的には、選別された細胞のゲノムDNA(gDNA)シーケンシングの形で、又は単一細胞RNAseqデータのdemuxlet分析としてもたらされ、単一細胞転写物の3’末端における遺伝子変異体に基づく遺伝子型同定を可能にする。このシーケンシングデータへの依存は、このプール化フォーマットで実施することができるアッセイの数を大幅に制限する。
【0005】
代替のプール化アプローチは、光バーコーディングを利用する。現行のプール化光学バーコーディング及びCRISPRスクリーニング戦略は一般に、固有のパドロック隣接の、そうでなければシーケンシング可能なバーコードの組み込みとともに、Cas9の変異体を含有する単一の細胞株を実装する。このように、摂動するgRNAは、in situシーケンシングを介して同定することができる。実質的な技術的特徴であるが、この方法は一度に単一の遺伝的背景のみを利用することができる。
【0006】
本明細書に提供される異なる遺伝的背景に由来する細胞のプール化スクリーニングの方法を用いて、様々な健康及び/又は患者株に由来する個々の細胞株が、任意のアッセイ後にin situシーケンシングを介して処理されるように設計された固有の遺伝的バーコードで標識される。次いで表現型は、分類され、元の細胞株の遺伝子型にリンクして戻されることができ、統計的遺伝学的分析を高度に制御されたインビトロアッセイにおいて行うことを可能にする。この技術はまた、プール化スクリーニング研究が類似の背景遺伝学を有する細胞株(すなわち、trios及び遺伝子操作された株)に適用されること、並びに摂動ベースの遺伝子スクリーニングと多重化されることを可能にする。また、本明細書では、遺伝的バーコード化方法の機械学習可能な改善も提供される。
【0007】
本明細書で提供される方法は、困難で、コストのかかる、アーチファクト感受性のスケーリングの課題に直面することなく、インビトロで大集団研究を行うことができないという問題を解決する。プール化アプローチは、蒸発、温度、及びより大きなスクリーンを不明瞭にし得る他のプレート状又はウェル状のアーチファクトの影響を大幅に低減する。これらの方法はまた、集団遺伝学に基づくアッセイを、極めて変動しやすく、無数の畳み込み因子によって影響される臨床転帰ではなく、高度に制御された手法で、特定の細胞型に対して行うことを可能にする。上記のような他の方法はシーケンシングのみの読み出し又は摂動因子のバーコーディング(プール化光学バーコーディング)のいずれかを含み、これは、所与のアッセイにおける非コーディング変異体の重要性を失わせる。
【0008】
特許出願、特許刊行物、及び科学文献を含む、本明細書に引用される全ての参考文献は、それぞれの個々の参考文献が具体的かつ個別に参照により組み込まれることが示されているかのように、その全体が参照により本明細書に組み込まれる。
【発明の概要】
【0009】
a)異なる遺伝的背景の細胞の2つ以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する2つ以上の固有の核酸バーコードシーケンスで標識することと、b)細胞の単一の混合集団を得るために、細胞の2つ以上の集団を組み合わせることと、c)細胞上のin situ単一細胞シーケンシングを行うことと、d)混合集団における細胞の、既知の表現型を分析すること又は新しい表現型を同定することと、を含む、異なる遺伝的背景からの細胞のプール化スクリーニング方法が、本発明において提供される。いくつかの実施形態では、細胞の2つ以上の集団が異なる細胞株由来である。いくつかの実施形態では、異なる細胞株は健康な細胞株である。いくつかの実施形態では、異なる細胞株は患者細胞株である。いくつかの実施形態では、異なる細胞株が同質遺伝子操作された細胞株である。いくつかの実施形態では、異なる細胞株が健康な細胞株、患者細胞株、及び同質遺伝子操作された細胞株の任意の組合せを含む。いくつかの実施形態では、細胞は、人工多能性幹細胞(iPSCs)である。いくつかの実施形態では、iPSCsは、表現型を分析する前に分化される。いくつかの実施形態では、その方法は、表現型を分析する前に細胞を培養することをさらに含む。いくつかの実施形態では、細胞の単一の混合集団が、基板上又は三次元培養物中にある。いくつかの実施形態では、基質は細胞培養皿である。いくつかの実施形態では、その方法は、単一細胞RNAseqを実施することをさらに含む。いくつかの実施形態では、その方法が、工程b)の前に、細胞2つ以上の集団を2世代以上増殖させることをさらに含む。いくつかの実施形態では、その方法が、細胞の2つ以上の集団のゲノムに固有の核酸バーコードシーケンスを安定的に組み込むことを含む。いくつかの実施形態では、固有の核酸バーコードシーケンスがウイルスを使用して細胞内に送達される。いくつかの実施形態では、ウイルスはレンチウイルスである。いくつかの実施形態では、ウイルスが選択マーカーをコードする。いくつかの実施形態では、選択マーカーは、抗生物質耐性遺伝子である。いくつかの実施形態では、ウイルスは蛍光タンパク質をコードする。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが少なくとも1塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが1~約18塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、8塩基対の長さである。いくつかの実施形態では、細胞の2つ以上の集団が固有の核酸バーコード配列で標識する前にシーケンシングされる。いくつかの実施形態では、シーケンシングは、全ゲノムシーケンシングである。いくつかの実施形態では、細胞の2つ以上の集団は、関連する個体から得られた。いくつかの実施形態では、細胞の2つ以上の集団は、ヒトから得られた。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の10以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する10以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、細胞の表現型を分析することが、ハイコンテントイメージング、カルシウムイメージング、免疫組織化学、細胞形態撮像、タンパク質凝集撮像、細胞間相互作用撮像、ライブセルイメージング、及び任意の他の画像ベースのアッセイモダリティからなる群から選択されるアッセイを含む。いくつかの実施形態では、工程d)が、細胞の顕微鏡画像又は時系列の顕微鏡画像をキャプチャすることによって細胞の表現型を分析することと、画像又は複数の画像において示される表現型特徴を評価することとを含む。いくつかの実施形態では、その方法が、a)培養プレート上のウェルのものである第1の複数の画像の第1の基準座標空間を生成することと、b)第1の複数の画像の第1のパッチを抽出することと、c)培養プレート上のウェルのものである第2の複数の画像の第2の基準座標空間を生成することと、d)第2の複数の画像の第2のパッチを抽出することと、e)複数の変換パラメータを得るために、第1のパッチと第2のパッチとの間のアフィン変換関数を計算することと、f)複数の変換パラメータに基づいて、第1の基準座標空間と第2の基準座標空間との間の座標変換関数を生成することと、を含む、第1の複数の画像と第2の複数の画像との間の位置合わせのためのコンピュータ実装方法をさらに含む。
【0010】
培養プレート上のウェルのものである第1の複数の画像の第1の基準座標空間を生成することと、第1の複数の画像の第1のパッチを抽出することと、培養プレート上の前記ウェルのものである第2の複数の画像の第2の基準座標空間を生成することと、第2の複数の画像の第2のパッチを抽出することと、複数の変換パラメータを得るために、第1のパッチと第2のパッチとの間のアフィン変換関数を計算することと、複数の変換パラメータに基づいて、第1の基準座標空間と第2の基準座標空間との間の座標変換関数を生成することと、を含む、第1の複数の画像と第2の複数の画像との間の位置合わせのためのコンピュータ実装方法が、本明細書においてさらに提供される。いくつかの実施形態では、第1の複数の画像は複数のバーコーディング画像である。いくつかの実施形態では、第2の複数の画像は複数のマーカーベースの/マーカーを含まない読み出し画像である。いくつかの実施形態では、第1の複数の画像及び第2の複数の画像がウェルの異なるカバレッジを提供する。いくつかの実施形態では、第1の複数の画像及び第2の複数の画像が異なる時間に撮像される。いくつかの実施形態では、第1の複数の画像及び第2の複数の画像が異なる解像度を有する。いくつかの実施形態では、第1の複数の画像は第1の顕微鏡によって撮像され、第2の複数の画像は第2の顕微鏡によって撮像される。いくつかの実施形態では、第1の顕微鏡は蛍光顕微鏡である。いくつかの実施形態では、第2の顕微鏡は非蛍光顕微鏡である。いくつかの実施形態では、第1の複数の画像が第1のイメージャによってキャプチャされる。いくつかの実施形態では、その方法が、第1の複数の画像におけるウェルの1つ以上の物理的特性を検出することと、検出された1つ以上の物理的特性に基づいて第1の基準座標空間を生成することとをさらに含む。いくつかの実施形態では、ウェルの1つ以上の物理的特性がウェルの形状、ウェルのエッジ、ウェルの位置を含む。いくつかの実施形態では、第1の複数の画像中の2つ以上の画像が重複比によって互いにオフセットされ、第1の基準座標空間は重複比に基づいて生成される。いくつかの実施形態では、第1の基準座標空間が第1のイメージャのメタデータに基づいて生成される。いくつかの実施形態では、その方法が、1つ以上の画像内に捕捉された1つ以上の目印に基づいて第1の複数の画像から1つ以上のマーカー画像を選択することであって、第1のパッチは第1の複数の画像からの1つ以上のマーカー画像から取得される、選択することをさらに含む。いくつかの実施形態では、1つ以上の目印が、1つ以上の細胞、1つ以上のウェル境界、1つ以上のビーズ、1つ以上の核、又はそれらの任意の組合せを含む。いくつかの実施形態では、第2の複数の画像が第2のイメージャによってキャプチャされる。いくつかの実施形態では、その方法が、第2の複数の画像におけるウェルの1つ以上の物理的特性を検出することと、検出された1つ以上の物理的特性に基づいて第2の基準座標空間を生成することとをさらに含む。いくつかの実施形態では、ウェルの1つ以上の物理的特性がウェルの形状、ウェルのエッジ、ウェルの位置を含む。いくつかの実施形態では、第2の複数の画像中の2つ以上の画像が重複比によって互いにオフセットされ、第2の基準座標空間は重複比に基づいて生成される。いくつかの実施形態では、第2の基準座標空間が第2のイメージャのメタデータに基づいて生成される。いくつかの実施形態では、その方法が、1つ以上の画像内に捕捉された1つ以上の目印に基づいて第2の複数の画像の1つ以上のマーカー画像を選択することであって、第2のパッチは第2の複数の画像からの1つ以上のマーカー画像から取得される、選択することをさらに含む。いくつかの実施形態では、1つ以上の目印が、1つ以上の細胞、1つ以上のウェル境界、1つ以上のビーズ、1つ以上の核、又はそれらの任意の組合せを含む。いくつかの実施形態では、第1のパッチが第1の画像の中心をカバーする。いくつかの実施形態では、第2のパッチが第2の画像の中心をカバーする。いくつかの実施形態では、第1のパッチの少なくとも一部及び第2のパッチの少なくとも1つのパッチが同じ被写体に対応する。いくつかの実施形態では、変換パラメータが、並進パラメータ、スケーリングパラメータ、及び回転パラメータのうちの1つ以上を含む。いくつかの実施形態では、a)異なる遺伝的背景の細胞の2つ以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する2つ以上の固有の核酸バーコードシーケンスで標識することと、b)細胞の単一の混合集団を得るために、細胞の2つ以上の集団を組み合わせることと、c)前記細胞に対するin situ単一細胞シーケンシングを行うことと、d)前記混合集団における前記細胞の、既知の表現型を分析すること又は新しい表現型を同定することと、を含む、異なる遺伝的背景からの細胞のプール化スクリーニングのアッセイから、第1の画像及び第2の画像が得られる。
【0011】
いくつかの実施形態では、その方法が、画像を受け取り分類結果を出力するように構成された分類器を利用することをさらに含む。いくつかの実施形態では、分類器が複数の層を含む。いくつかの実施形態では、分類器が畳み込みニューラルネットワークである。いくつかの実施形態では、分類器がDenseNet分類器である。いくつかの実施形態では、分類結果が画像内で捕捉された単一細胞それぞれの遺伝的背景に基づく分類である。いくつかの実施形態では、この方法が画像の埋め込みを生成することをさらに含む。いくつかの実施形態では、埋め込みは分類器の最後の層の前の活性化出力層から生成される。いくつかの実施形態では、埋め込みはUMAP(Uniform Manifold Approximation and Projection for Dimension Reduction)アルゴリズム、主成分分析(PCA)、t-分散確率的近傍埋め込み(t-SNE)などの線形次元削減方法を使用して、次元が削減される。いくつかの実施形態では、埋め込みは、埋め込みの可視化のための1つ以上のUMAPプロットを取得するために、UMAPアルゴリズムを使用して次元が削減される。いくつかの実施形態では、その方法が、埋め込みの少なくとも一部に基づいて処理を評価することをさらに含む。いくつかの実施形態では、その方法が、1つ以上のUMAPプロットの少なくとも一部に基づいて処理を評価することをさらに含む。
【0012】
本明細書で記載される様々な実施形態の特性のうちの1つ、いくつか、又はすべては、本発明の他の実施形態を形成するために組み合わせられてもよいことは理解されるべきである。本発明のこれら及び他の態様は、当業者にとって明らかになるのであろう。本発明のこれら及び他の実施形態は、以下の詳細な説明によってさらに説明される。
【図面の簡単な説明】
【0013】
この特許又は出願書類は、カラーで実行される少なくとも1の図面を含んでいる。カラー図面付きのこの特許又は特許出願公開の写しは、請求及び必要な手数料の納付によって、特許商標庁により提供されるであろう。
【0014】
【
図1】固有の核酸バーコードシーケンスを細胞に導入するために使用されるベクターの例を示す。固有の核酸バーコードシーケンスに隣接する特徴を示す。POSH=ヒト細胞におけるプール光学スクリーニング。
【0015】
【
図2】本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法を使用する第1のモダリティを示す概略図である。いくつかの実施形態では、そのモダリティがウルトラスループット薬物スクリーニングを実行することを含む。POSH=ヒト細胞におけるプール光学スクリーニング。
【0016】
【
図3】本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法を使用する第2のモダリティを示す概略図である。いくつかの実施形態では、そのモダリティがウルトラスループット薬物スクリーニングを実行することを含む。POSH=ヒト細胞におけるプール光学スクリーニング。
【0017】
【
図4】本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法を使用する第3のモダリティを示す概略図である。いくつかの実施形態では、そのモダリティがウルトラスループット薬物スクリーニングを実行することを含む。
【0018】
【
図5】本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法から得られたデータを分析するために使用される分析パイプラインを示す概略図である。
【0019】
【
図6】いくつかの実施形態に従う、(例えば、第1の画像取得からの)第1の複数の画像と(例えば、第2の画像取得からの)第2の複数の画像との間の位置合わせのための例示的なコンピュータ実装プロセスを図示する。
【0020】
【
図7】いくつかの実施形態に従う、顕微鏡取得のために設計された例示的なプレートを描写する。
【0021】
【
図8】いくつかの実施形態に従う、ウェルの複数の画像を図示する。
【0022】
【
図9】いくつかの実施形態に従う、ウェルの複数の画像を図示する。
【0023】
【
図10】いくつかの実施形態に従う、2つの異なる画像取得からの2つの例示的なパッチを示す。
【0024】
【
図11】いくつかの実施形態に従う、変換パラメータを計算するための例示的なプロセスを図示する。
【0025】
【
図12】いくつかの実施形態に従う、例示的な電子デバイスを図示する。
【0026】
【
図13B】いくつかの実施形態に従う、抗MAP2抗体で染色された星状細胞(例えば、TSC2ノックアウト(TSC2 ko)、野生型(wt)、SETD1Aヘテロ接合性ノックアウト(SETD1A het))との共培養におけるニューロン細胞(
図13A)、並びにバックグラウンドからセグメント化されたニューロン単細胞の対応する細胞核及び細胞体セグメント化(
図13B)の例示的な画像を示す。
【0027】
【
図14A】いくつかの実施形態に従う、合成によるin situシーケンシングのラウンド中に捕捉された遺伝子型標識バーコード化細胞(例えば、TSC2ノックアウト(TSC2 ko)、野生型(wt)、SETD1Aヘテロ接合性ノックアウト(SETD1A het))の例示的な画像を示す。
【0028】
【
図14C】いくつかの実施形態に従う、各遺伝子型(例えば、TSC2ノックアウト(TSC2 ko)、野生型(wt)、SETD1Aヘテロ接合性ノックアウト(SETD1A het))のプール光学スクリーニング(POSH)バーコードの例示的カウント(
図14B)及び各遺伝子型の対応する細胞カウント(
図14C)を示す。
【0029】
【
図15A】いくつかの実施形態に従う、未処理細胞のシーケンシング及び撮像データを描写する例示的な変換(例えば、埋め込み)を示す。破線の円は、TSC2 ko細胞が主に占める特徴埋め込み空間を示す。
【0030】
【
図15B】いくつかの実施形態に従う、それらの埋め込み座標にわたる、未処理の細胞の代表的な画像パッチの例示的なオーバーレイを図示する。
【0031】
【
図16A】いくつかの実施形態に従う、ラパマイシンによる、又は処理なし(No Tr)の細胞(例えば、TSC2ノックアウト(TSC2 ko)、野生型(wt)、SETD1Aヘテロ接合性ノックアウト(SETD1A het))の処理後に計算された例示的な変換を示す。破線の円は、未処理のTSC2 ko細胞が主に占める特徴埋め込み空間を示す。
【0032】
【
図16B】いくつかの実施形態に従う、TSC2ノックアウト細胞をラパマイシン(ラパマイシン)で処理した後、又は処理なし(Trなし)で処理した後に計算された例示的な変換を示す。破線の円は、未処理のTSC2 ko細胞が主に占める特徴埋め込み空間を示す。
【0033】
【
図17】様々な化合物(例えば、DMSO、エベロリムス、イアダデムスタット、ロナファルニブ、ラパマイシン)を用いた細胞(例えば、TSC2ノックアウト(TSC2 ko)、TSC2ヘテロ接合ノックアウト(TSC2 het)、野生型(wt)、SETD1AG3ヘテロ接合ノックアウト(SETD1AG3 het)SETD1AG4ヘテロ接合ノックアウト(SETDAG4 het))、又は未処理細胞の処理が続く、例示的なscRNAseq埋め込みを示す。TSC2 koニューロンは実線の矢印によって表されるように、クラスター6に現れる。明確な矢印は、ラパマイシンでの処理の際の全ての細胞の新しい集団へのシフトを示す。
【発明を実施するための形態】
【0034】
[I.定義]
本開示をより容易に理解することができるように、特定の用語を最初に定義する。本出願において使用される場合、本明細書で別段明示的に提供される場合を除き、以下の用語の各々は、以下に記載される意味を有するものとする。追加の定義は、本出願の全体にわたって記載されている。
【0035】
別途定義されない限り、本明細書で使用されるすべての技術用語及び科学用語は、本開示が関連する技術分野の当業者によって一般に理解されるのと同じ意味を有する。例えば、生物医学及び分子生物学の簡潔辞書、Juo、Pei-Show、2nd ed、2002、CRC Press、The dictionary Of Cell And Molecular Biology、3rd ed、1999、Academic Press、及びOxford dictionary Of Biochemistry And Molecular Biology、Revised、2000、Oxford University Pressは、本開示において使用される多くの用語の一般的な辞書を用いたスキルの1つを提供する。
【0036】
ユニット、接頭辞、及び記号は、systeme International de Unites(SI)の承認された形式で示される。数値範囲は、範囲を定義する数値を含む。本明細書で提供される見出しは、本明細書全体を参照することによって得ることができる本開示の様々な態様を限定するものではない。したがって、直後に定義される用語は、その全体が本明細書を参照することによってより完全に定義される。
【0037】
用語「及び/又は」は、本明細書で使用される場合、2つの指定された特徴又は構成要素の各々の、他のものを伴うか又は伴わない具体的な開示として解釈されるべきである。したがって、本明細書で「A及び/又はB」などの語句で使用される「及び/又は」という用語は、「A及びB」、「A又はB」、「A」(単独)、並びに「B」(単独)を含むことが意図される。同様に、「A、B、及び/又はC」などの語句で使用される「及び/又は」という用語は、A、B、及びCと、A、B、又はCと、A又はCと、A又はBと、B又はCと、A及びCと、A及びBと、B及びCと、A(単独)と、B(単独)と、C(単独)と、の態様のそれぞれを包含することが意図される。
【0038】
代替物(例えば、「又は」)の使用は、その代替物の一方、両方、又はそれらの任意の組合せを意味すると理解されるべきである。本明細書で使用される場合、不定冠詞「a」又は「an」は、列挙又は列挙された構成要素の「1つ以上」を指すと理解されるべきである。
【0039】
本明細書に記載される本発明の態様及び実施形態は、態様及び実施形態「を含む」、「からなる」、及び「から本質的になる」を含むことが理解される。
【0040】
用語「約」は、当業者によって決定される特定の値又は組成物について許容される誤差範囲内にある値又は組成物を指し、これは、その値又は組成物がどのように測定又は決定されるか、すなわち、測定システムの限界に部分的に依存するであろう。例えば、「約」は、その技術分野における実践あたりの、1以内又は1標準偏差超を意味することができる。あるいは、「約」は20%までの範囲を意味することができる。さらに、特に生物学的システム又はプロセスに関して、この用語は、1桁まで又は5倍までの値を意味することができる。特定の値又は組成物が本出願及び特許請求の範囲において提供される場合、特に明記しない限り、「約」の意味は、その特定の値又は組成物について許容される誤差範囲内であると想定されるべきである。
【0041】
「任意の」又は「任意に」という語は、後続に記載されるイベント、状況又は置換物が起こっても起こらなくてもよいこと、並びにその記載がイベント又は状況が起こる場合及び起こらない場合を含むことを意味する。
【0042】
「被写体」は、任意のヒト又は非ヒト動物を含む。「非ヒト動物」という用語は非ヒト霊長類、ヒツジ、イヌ、並びにマウス、ラット、及びモルモットなどのげっ歯類などの脊椎動物を含むが、これらに限定されない。いくつかの実施形態では、被験者はヒトである。用語「被写体」及び「患者」及び「個体」は、本明細書において互換的に使用される。
【0043】
本明細書で使用される場合、「生物学的試料」は、全細胞並びに/又は生細胞及び/若しくは細胞残屑を含んでもよい。この生物学的試料は、「体液」を含有してもよい(又はそれに由来してもよい)。本発明は、この体液が、羊水、房水、硝子体液、胆汁、血液血清、母乳、脳脊髄液、耳屎(耳垢)、乳び、糜汁、内リンパ、外リンパ、滲出液、糞便、女性射精液、胃酸、胃液、リンパ液、粘液(鼻排液及び痰を含む)、心膜液、腹膜液、胸膜液、膿、リウム、唾液、皮脂(皮膚油)、精液、痰、滑液、汗、涙、尿、膣分泌物、嘔吐物、並びにびそれらの1つ以上の混合物から選択される実施形態を包含する。生物学的試料は、細胞培養物、体液、体液由来の細胞培養物を含む。体液は、哺乳動物生物から、例えば、穿刺、又は他の収集若しくはサンプリング手順によって得ることができる。
【0044】
本明細書で使用される場合、「同質遺伝子」は、本質的に同一のゲノムDNAを特徴とする生物又は細胞を指し、例えば、ゲノムDNAは、同質遺伝子の生物又は細胞のゲノムDNAと少なくとも約92%、好ましくは少なくとも約98%、最も好ましくは少なくとも約99%同一である。
【0045】
用語「細胞」は、外部から分離された膜構造によって囲まれ、遺伝情報を有し、遺伝情報を発現する機構を有する、多細胞生物の組織の構造単位である生体を意味するために、本明細書で最も広い意味で使用される。本明細書で使用されるこの細胞は、天然に存在する細胞又は人工的に改変された細胞(例えば、融合細胞、遺伝的に改変された細胞など)であってもよい。
【0046】
本明細書で使用される用語「分化細胞」は、未分化表現型から特殊表現型に発達した細胞を指すことができる。例えば、胚細胞は、腸内層の上皮細胞に分化することができる。分化細胞は例えば、胎児又は生まれた動物から単離することができる。
【0047】
本明細書で使用される用語「未分化細胞」は、未分化表現型を有し、分化することができる前駆細胞を指すことができる。未分化細胞の例は幹細胞である。
【0048】
本明細書で使用される場合、用語「幹細胞」は、自己複製可能で多能性の細胞を指す。「多能性」は、細胞が、成体動物を含む3つのプライマリ胚葉;その子孫生殖細胞及び3つの胚葉すべて、内胚葉(内胃粘膜、胃腸管、肺)、中胚葉(筋肉、骨髄、血中、泌尿生殖器)、又は外胚葉(上皮組織及び神経系)を介して、成体動物を含む3つの一次胚葉を生み出すことができることを意味する。本明細書における幹細胞は、胚性幹(ES)細胞、組織幹細胞(組織特異的幹細胞若しくは体性幹細胞とも呼ばれる)、又は人工多能性幹細胞であってもよいが、これらに限定されない。上記の能力を有する人工的に産生された細胞(例えば、リプログラムされた細胞)は、幹細胞であってもよい。
【0049】
本明細書で使用される用語「胚性幹(ES)細胞」は、インビトロ細胞培養培地中で維持された胚から単離された多能性細胞を指すことができる。
【0050】
組織幹細胞は、細胞が由来する部位に基づいてカテゴリーに分けられる。例えば、皮膚系(例えば、表皮幹細胞、毛包幹細胞)、消化系(例えば、膵幹細胞、肝幹細胞など)、骨髄(例えば、造血幹細胞、間葉幹細胞など)及び神経系(例えば、神経幹細胞、網膜幹細胞など)である。
【0051】
「誘導多能性幹細胞」(一般にiPS細胞又はiPSCsと略される)は、非多能性細胞、典型的には成体体細胞、又は線維芽細胞、造血細胞、筋細胞、若しくは神経細胞などの最終分化細胞に由来する多能性幹細胞である。これは、上皮細胞などの一時的に分化した細胞からリプログラミング因子を発現させることによって人工的に調製された多能性幹細胞の一種を指す。
【0052】
「自己再生」は未分化状態を維持しながら、細胞分裂の多くのサイクルを経る能力を指す。
【0053】
本明細書で使用される場合、用語「体細胞」は、卵又は精子などの、生殖細胞以外の任意の細胞を指す。典型的には、体細胞は、限定された多能性を有するか、又は多能性を有さない。本明細書で使用される場合、体細胞は、天然又は遺伝子改変されていてもよい。
【0054】
本明細書で使用される「単一細胞RNAseq」又は「scRNA-Seq」は一般に、個々の細胞の発現プロファイルを得るための単一細胞RNAシーケンシング方法を指す。
【0055】
「全ゲノムシーケンシング(WGS)」という用語は本明細書では生物、例えば、ヒト、イヌ、マウス、ウイルス又は細菌の全ゲノムの配列を決定することができるプロセスを指す。ゲノム全体が実際にシーケンシングされる必要はない。
【0056】
本明細書における「シーケンシング」という用語は、ポリヌクレオチド、例えばゲノムDNAのヌクレオチド配列を決定するための方法を指す。好ましくは、シーケンシング方法が非限定的な例として、次世代シーケンシング(NGS)方法、(NGS)を含み、ここで、クローン増幅DNA鋳型又は単一DNA分子は超並列様式で(例えば、Volkerding et alClin Chem 55:641-658 (2009); Metzker M Nature Rev 11:31-46 (2010)に記載されるように)シーケンシングされる。
【0057】
本明細書に記載されるように、任意の濃度範囲、パーセンテージ範囲、比範囲、又は整数範囲は特に明記しない限り、列挙された範囲内の任意の整数の値、並びに適切な場合、その分数(整数の10分の1及び100分の1など)を含むと理解されるべきである。
【0058】
本開示の様々な態様は、以下のサブセクションでさらに詳細に説明される。
【0059】
[II.発明の方法]
本発明の一態様は、a)異なる遺伝的背景の細胞の2つ以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する2つ以上の固有の核酸バーコードシーケンスで標識することと、b)細胞の単一の混合集団を得るために、細胞の2つ以上の集団を組み合わせることと、c)細胞上のin situ単一細胞シーケンシングを行うことと、d)混合集団における細胞の、既知の表現型を分析すること又は新しい表現型を同定することと、を含む、異なる遺伝的背景からの細胞のプール化スクリーニング方法を提供する。いくつかの実施形態では、細胞の2つ以上の集団が培養細胞、プライマリ細胞、有糸分裂後細胞(神経細胞など)、及び組織切片の任意の組合せを含む。いくつかの実施形態では、細胞の2つ以上の集団が異なる細胞株由来である。いくつかの実施形態では、異なる細胞株は健康な細胞株である。いくつかの実施形態では、異なる細胞株は患者細胞株である。いくつかの実施形態では、異なる細胞株が同質遺伝子操作された細胞株である。いくつかの実施形態では、異なる細胞株が健康な細胞株、患者の細胞株、及び同質遺伝子操作された細胞株の任意の組合せを含む。いくつかの実施形態では、細胞の2つ以上の集団が人工多能性幹細胞(iPSCs)である。いくつかの実施形態では、その方法は、表現型を分析する前に細胞を培養することをさらに含む。いくつかの実施形態では、細胞の2つ以上の集団は、ヒトから得られた。いくつかの実施形態では、工程d)が、細胞の顕微鏡画像又は時系列の顕微鏡画像をキャプチャすることによって細胞の表現型を分析することと、画像又は複数の画像において示される表現型特徴を評価することとを含む。いくつかの実施形態では、その方法が、1)培養プレート上のウェルのものである第1の複数の画像の第1の基準座標空間を生成することと、2)第1の複数の画像の第1のパッチを抽出することと、3)培養プレート上のウェルのものである第2の複数の画像の第2の基準座標空間を生成することと、4)第2の複数の画像の第2のパッチを抽出することと、5)複数の変換パラメータを得るために、第1のパッチと第2のパッチとの間のアフィン変換関数を計算することと、6)複数の変換パラメータに基づいて、第1の基準座標空間と第2の基準座標空間との間の座標変換関数を生成することと、を含む、第1の複数の画像と第2の複数の画像との間の位置合わせのためのコンピュータ実装方法をさらに含む。
【0060】
いくつかの実施形態では、その方法が、本明細書で提供される方法に従って、第1の複数の画像及び第2の複数の画像から生成された整列画像などの画像を受け取り分類結果を出力するように構成された分類器を利用することをさらに含む。この分類器は、複数の層を含むニューラルネットワークとすることができる。いくつかの実施形態では、分類器が畳み込みニューラルネットワーク(CNN)、例えば、DenseNet分類器である。いくつかの実施形態では、埋め込みなどの画像の低次元表現を取得するために分類器が使用されてもよい。埋め込みは、分類器の複数の層のうちの1つの層から生成することができる。例えば、分類器の最後の層の前の活性化出力層が、視覚化のための画像の低次元表現として利用されてもよい。いくつかの実施形態では、この埋め込みは次元削減方法を使用して次元が削減される。いくつかの実施形態では、この次元削減方法が教師なし線形次元削減方法である。いくつかの実施形態では、この次元削減方法が教師なし非線形次元削減方法である。いくつかの実施形態では、この埋め込みはUMAP(Uniform Manifold Approximation and Projection for Dimension Reduction)アルゴリズム、主成分分析(PCA)、t-分散確率的近傍埋め込み(t-SNE)、又は任意の他の適切な次元削減方法を使用して、次元が削減される。いくつかの実施形態では、この埋め込みは、埋め込みの可視化のためのUMAPプロットを取得するために、UMAPアルゴリズムを使用して次元が削減される。
【0061】
いくつかの実施形態では、その方法が、工程b)の前に、細胞2つ以上の集団を2世代以上増殖させることをさらに含む。いくつかの実施形態では、その方法が、工程b)の前に、細胞の2つ以上の集団を、3世代以上、4世代以上、5世代以上、6世代以上、7世代以上、8世代以上、9世代以上、又は10世代以上増殖させることをさらに含む。
【0062】
いくつかの実施形態では、in situ単一細胞シーケンシングを行うことは蛍光in situRNAシーケンシング(FISSEQ)を使用することを含む(Lee et al、Nature Protocols 2015、10(3):442-58)。この方法において、mRNAは、アミノアリルdUTP及びアダプター配列タグ化ランダムヘキサマーを用いてin situで逆転写される。得られたcDNA断片は、細胞タンパク質マトリクスに固定され、環状化される。環状テンプレートは、ローリングサークル増幅(RCA)によって増幅され、続いてシークエンシング及び撮像が行われる。この方法は、組織特異的遺伝子発現、RNAスプライシング、転写後修飾、及びそれらの空間情報の保存の同時検出を可能にする。これは、比較的偏りのない方法であり、トランスクリプトーム全体のサンプリングを達成することができる。
【0063】
いくつかの実施形態では、in situ単一細胞シーケンシングを行うことはパドロックin situシーケンシング法を使用することを含む(Ke et al. Nature Methods 2013、10(9)857-60)。この方法では、mRNAがcDNAに逆転写された後、mRNAはRNaseHによって分解される。次いで、パドロックプローブは、シーケンシングの標的とされる塩基上のプローブエンド間のギャップでcDNAに結合する。ギャップはDNA重合によって充填され、連結されて環状化分子を形成する。環状鋳型は、RCAによって増幅され、続いてシーケンシング及び撮像が行われる。FISSEQと同様に、パドロックin situシーケンシングは、分析されたRNA配列の空間情報の保存を可能にする。
【0064】
いくつかの実施形態では、RCA後、増幅されたDNAのシーケンシングは、ライゲーションによるシーケンシング又は合成によるシーケンシングを使用して達成することができる。合成によるシーケンシングは、DNAポリメラーゼに依存して、4つの可逆的ターミネーター結合dNTPを組み込む。1サイクルにつき1塩基を添加し、各dNTPを添加すると、蛍光標識された可逆的ターミネーターが撮像される。ライゲーションによるシーケンシングは目的の配列を区別し、様々な長さの蛍光標識オリゴヌクレオチドのプールを組み込む代わりに、DNAリガーゼのミスマッチ感受性を使用する。ライゲーションによるシーケンシングは高い精度を有するが、パリンドローム配列に関する問題に直面する可能性がある。
【0065】
いくつかの実施形態では、RNAのin situシーケンシングではなく、DNAバーコードは、ペプチド核酸、ロックド核酸、トランスポザーゼ、ゾンビ、又は他のin situ転写法などの方法を介して直接読み取られる。
【0066】
いくつかの実施形態では、RNA又はDNAのin situシーケンシングではなく、プロコードなどの方法を使用して、タンパク質タグをバーコードとして使用して個々の細胞株を標識する。
【0067】
特定の実施形態では、同じ細胞内の複数のバーコード配列がin situシーケンスによって決定されてもよい。バーコードスクリーニング法は、高次元形態学的プロファイリング及びin situ多重化遺伝子発現分析と組み合わせることもできる。特定の実施形態では、表現型は、組織サンプルのin situシーケンシングを使用して、天然の空間的文脈内で測定することができる。
【0068】
いくつかの実施形態では、その方法は、単細胞RNAseq(scRNA-seq)を実施することをさらに含む。いくつかの実施形態では単一の固有の核酸バーコード配列がin situ単一細胞シーケンス及びscRNA-seqのために使用される。scRNA-seqアプローチは10x Ganomics、Drop-seq、及びSeq-well、inDrops、Rhapsody、並びにSplit-Seqを含む。例えば、単一細胞ライブラリは、Chromium with v2 chemistry(l0x Ganomics)を用いて単一細胞懸濁液から調製することができる。そのような単一細胞ライブラリをシーケンシングすることができる(例えば、NextSeq 500(Illumina))。シークエンシングリードは例えば、Cell Ranger 1.2(10x Ganomics)を使用して、位置合わせ、濾過、重複排除、及び/又はデジタルカウントマトリクスへの変換によって処理されてもよい。
【0069】
いくつかの実施形態では、この方法がsc-RNAseqの適用及びRNAシーケンシングのための圧縮検知方法論の利用を含む。例としては、L1000及びハイブリッド捕捉が挙げられる。
【0070】
いくつかの実施形態では、この方法は、表現型を分析する前に、細胞の単一混合集団を培養することをさらに含む。いくつかの実施形態では、細胞を培養するために使用される培養培地が血清を含有する。いくつかの実施形態では、細胞を培養するために使用される培養培地は無血清である。無血清培地は未処理又は未精製の血清を含まない培地を指し、したがって、精製血液由来成分又は動物組織由来成分(例えば、増殖因子)を有する培地を含むことができる。異なる動物由来成分による汚染を防止する観点から、血清は、細胞と同じ動物由来であってもよい。培地は、血清代替物を含んでも含まなくてもよい。血清代替物としては、アルブミン(脂質に富むアルブミン、組換えアルブミン、植物デンプン、デキストラン及びタンパク質加水分解物などのアルブミン代替物)、トランスフェリン(若しくは他の鉄輸送体)、脂肪酸、インスリン、コラーゲン前駆体、微量元素、2-メルカプトエタノール、若しくは3’-チオグリセロール、又はそれらの均等物が挙げられる。
【0071】
いくつかの実施形態では、細胞の単一混合集団が基板上又は三次元培養物中にある。いくつかの実施形態では、細胞の混合集団が基板上にある。いくつかの実施形態では、基板が組織培養プレート又はフラスコなどの任意の標準的な組織培養容器である。いくつかの実施形態では、基板は細胞培養皿である。いくつかの実施形態では、基板は組織培養プレートである。いくつかの実施形態では、基板はペトリ皿である。いくつかの実施形態では、基板は組織培養フラスコである。いくつかの実施形態では、基板が6ウェル、12ウェル、24ウェル、96ウェル、384ウェル、又は1,536ウェルプレートなどの標準マイクロウェルプレートのウェルである。いくつかの実施形態では、基板は6ウェルプレートである。いくつかの実施形態では、基板は12ウェルプレートである。いくつかの実施形態では、基板は24ウェルプレートである。いくつかの実施形態では、基板は96ウェルプレートである。いくつかの実施形態では、基板は384ウェルプレートである。いくつかの実施形態では、基板は1,536ウェルプレートである。基板は、本明細書に記載される撮像モダリティを使用して撮像するために任意の材料から作製されてもよい。特定の実施形態では、プレートは、本明細書に記載の撮像モダリティを使用して撮像するのに適したプラスチック底プレートであってもよい。特定の実施形態では、プレートは、本明細書に記載の撮像モダリティを使用して撮像するのに適したガラス底プレートであってもよい。特定の実施形態では、基板は、マイクロ流体デバイス上に画定された培養チャンバのアレイ内の培養チャンバ、又はマイクロ流体デバイス上で生成された液滴であってもよい。特定の実施形態例では、単一の細胞又は細胞集団は、培養培地中の個々の顕微鏡スライド上で培養されてもよい。いくつかの実施形態では、細胞の単一混合集団が、三次元培養物中にある。いくつかの実施形態では、三次元培養物は足場を含む。いくつかの実施形態では、足場が三次元マトリクスを含む。いくつかの実施形態では、三次元マトリクスは、BDマトリゲル(商標)基底膜マトリクス(BD Sciences)、Cultrex(登録商標)基底膜抽出物(BME;トレビゲン)、ヒアルロン酸、ポリエチレングリコール(PEG)、ポリビニルアルコール(PVA)、ポリラクチド-コ-グリコリド(PLG)、及びポリカプロラクトン(PLA)からなる群から選択されるデータを含む。いくつかの実施形態では、三次元マトリクスがBDマトリゲル(商標)基底膜マトリクス(BD Sciences)を含む。いくつかの実施形態では、三次元マトリクスがCultrex(登録商標)基底膜抽出物(BME;トレビゲン)を含む。いくつかの実施形態では、三次元マトリクスはヒアルロン酸を含む。いくつかの実施形態では、三次元マトリクスがポリエチレングリコール(PEG)を含む。いくつかの実施形態では、三次元マトリクスがポリビニルアルコール(PVA)を含む。いくつかの実施形態では、三次元マトリクスがポリラクチド-コ-グリコリド(PLG)を含む。いくつかの実施形態では、三次元マトリクスがポリカプロラクトン(PLA)を含む。いくつかの実施形態では、三次元培養物が足場を含まない。
【0072】
いくつかの実施形態では、その方法が、細胞の2つ以上の集団のゲノムに固有の核酸バーコードシーケンスを安定的に組み込むことを含む。いくつかの実施形態では、固有の核酸バーコードシーケンスがウイルスを使用して細胞内に送達される。いくつかの実施形態では、ウイルスはレトロウイルスである。いくつかの実施形態では、レトロウイルスは、モロニーマウス白血病ウイルス(MMULV)、ネコ免疫不全ウイルス(FIV)、ハーベイマウス肉腫ウイルス(HaMuSV)、マウス乳癌ウイルス(MuMTV)、テナガザル白血病ウイルス(GaLV)、ヒト免疫不全ウイルス(HIV)、ラウス肉腫ウイルス(RSV)、又はレンチウイルスであるか、又はそれに由来する。いくつかの実施形態では、ウイルスはレンチウイルスである。いくつかの実施形態では、ウイルスはレンチウイルスに由来する。いくつかの実施形態では、レンチウイルス5’ LTR由来のU3シーケンスは、ウイルス構築物中のプロモーターシーケンスで置換されてもよい。これは、パッケージング細胞株から回収されるウイルスの力価を増加させ得る。エンハンサー配列も含まれてもよい。いくつかの実施形態では、ウイルスが選択マーカーをコードする。いくつかの実施形態では、選択マーカーは、抗生物質耐性遺伝子である。いくつかの実施形態では、抗生物質耐性遺伝子はピューロマイシン、ハイグロマイシン、ブレオマイシン、ネオマイシン、アクチノマイシンD、及びマイトマイシンCからなる群より選択される抗生物質に対する耐性を付与する。いくつかの実施形態では、抗生物質耐性遺伝子はピューロマイシンに対する耐性を付与する。いくつかの実施形態では、抗生物質耐性遺伝子はハイグロマイシンに対する耐性を付与する。いくつかの実施形態では、抗生物質耐性遺伝子はブレオマイシンに対する耐性を付与する。いくつかの実施形態では、抗生物質耐性遺伝子はネオマイシンに対する耐性を付与する。いくつかの実施形態では、抗生物質耐性遺伝子はアクチノマイシンDに対する耐性を付与する。いくつかの実施形態では、抗生物質耐性遺伝子はマイトマイシンCに対する耐性を付与する。いくつかの実施形態では、ウイルスは抗生物質耐性遺伝子の1つ以上の断片をコードする。いくつかの実施形態では、ウイルスは蛍光タンパク質をコードする。いくつかの実施形態では、蛍光タンパク質が、緑色蛍光タンパク質、赤色蛍光タンパク質、青色蛍光タンパク質、シアン蛍光タンパク質、黄色蛍光タンパク質、及びオレンジ色蛍光タンパク質からなる群から選択される。
【0073】
いくつかの実施形態では、固有の核酸バーコードシーケンスが、標的分子及び/若しくは標的核酸などの関連分子の識別子として、又は起源細胞などの関連分子の供給源の識別子として使用されるヌクレオチドの短いシーケンス(例えば、DNA又はRNA)である。バーコードはまた、核酸断片の発生源を同定するために使用され得る、任意の固有の、天然に存在しない核酸配列を指してもよい。
【0074】
固有の核酸バーコードシーケンスは、標的分子に結合されてもよく、又は「タグ付け」されてもよい。この結合は、直接的(例えば、標的分子への固有の核酸バーコード配列の共有結合又は非共有結合)又は間接的(例えば、追加の分子を介して)であり得る。
【0075】
標的分子は、コンビナトリアル様式で(例えば、標的分子を特異的に認識する1つ又は複個数の特異的結合剤に結合した複数の固有の核酸バーコードシーケンスを使用して)複数の固有の核酸バーコードシーケンスを用いて任意に標識することができ、したがって、特定の固有の核酸バーコードシーケンスプール内にあり得る固有の識別子の個数を大幅に増大させる。特定の実施形態では、固有の核酸バーコードシーケンスが標的分子に結合した成長中のバーコードコンカテマーに、例えば、一度に1つずつ付加される。他の実施形態では、複数の固有の核酸バーコードシーケンスが標的分子への結合の前に組み立てられる。
【0076】
いくつかの実施形態では、各固有の核酸バーコードシーケンスは、少なくとも1塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが1~約18塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが1~約12塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが1~約10塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが1~約8塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが2~約12塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが2~約10塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが2~約8塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが3~約12塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが3~約10塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが3~約8塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが4~約12塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが4~約10塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが4~約8塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが5~約12塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが5~約10塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが5~約8塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが6~約12塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが6~約10塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれが6~約8塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、1塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、2塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、3塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、4塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、5塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、6塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、7塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、8塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、9塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、10塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、11塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、12塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、13塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、14塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、15塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、16塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、17塩基対の長さである。いくつかの実施形態では、固有の核酸バーコードシーケンスそれぞれは、18塩基対の長さである。特定の実施形態では、固有の核酸バーコードシーケンスがin situシーケンシング法を使用して直接検出されてもよい。特定の例示的な実施形態では、固有の核酸バーコード配列が、蛍光in situ RNAシーケンス(FISSEQ)、in situ mRNA-seq、パドロックin situシーケンス、ライゲーションによるシーケンス、SOLiD(登録商標)シーケンス、合成によるシーケンス、ペプチド核酸、ロックド核酸、トランスポザーゼ、ゾンビ、他のin situ転写法、又はProCodesなどの他のタンパク質ベース若しくはペプチドベースのバーコード技術を使用して検出される。特定の例示的な実施形態では、固有の核酸バーコード配列をコードするmRNA転写物がシーケンシングされる。特定の他の例示的な実施形態では、mRNAのcDNAコピーが最初に生成され、次いでシーケンシングされる。特定の他の例示的な実施形態では、バーコードを含むDNAは直接シーケンシングされる。
【0077】
いくつかの実施形態では、細胞の2つ以上の集団が固有の核酸バーコード配列で標識する前にシーケンシングされる。いくつかの実施形態では、細胞の2つ以上の集団のゲノムの一部がシーケンシングされる。いくつかの実施形態では、シーケンシングは、全ゲノムシーケンシングである。いくつかの実施形態では、全ゲノムシーケンシングは、次世代シーケンシング(NGS)の使用を含む。全ヒトゲノム配列を決定するためのNGS技術は、以前に記載されている(Levy et alPLoS Biol 55、e254 (2007); Wheeler et al. Nature 452:872-876 (2008); Bentley et al、Nature 456:53-59 (2008))。
【0078】
いくつかの実施形態では、細胞の2つ以上の集団は、関連する個体から得られる。いくつかの実施形態では、関連する個体は親及び子孫である。いくつかの実施形態では、関連する個体は兄弟である。いくつかの実施形態では、細胞の2つ以上の集団は、低い遺伝的多様性を有する個体から得られる。いくつかの実施形態では、細胞の2つ以上の集団は、高い遺伝的多様性を有する個体から得られる。いくつかの実施形態では、細胞の2つ以上の集団は、低い遺伝的多様性及び高い遺伝的多様性を含むグループの組み合わせから構成される。
【0079】
いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の3以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する3以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の4以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する4以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の5以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する5以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の6以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する6以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の7以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する7以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の8以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する8以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の9以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する9以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の10以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する10以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の11以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する11以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の12以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する12以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の13以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する13以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の14以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する14以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の15以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する15以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の20以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する20以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の50以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する50以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の100以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する100以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の500以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する500以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の1000以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する1000以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の2000以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する2000以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の5000以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する5000以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の10,000以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する10,000以上の固有の核酸バーコードシーケンスで標識することを含む。いくつかの実施形態では、その方法が、異なる遺伝的背景の細胞の100を2桁上回る大きさの集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する、100を2桁上回る大きさの固有の核酸バーコードシーケンスで標識することを含む。
【0080】
いくつかの実施形態では、細胞の単一混合集団の表現型を分析することが、ハイコンテントイメージング、カルシウムイメージング、免疫組織化学、細胞形態撮像、タンパク質凝集撮像、細胞間相互作用撮像、ライブセルイメージング、及び任意の他の画像ベースのアッセイモダリティからなる群から選択されるアッセイを含む。いくつかの実施形態では、細胞の表現型を分析することが、ハイコンテントイメージング、カルシウムイメージング、免疫組織化学、細胞形態撮像、タンパク質凝集撮像、細胞間相互作用撮像、及びライブセルイメージングからなる群から選択されるアッセイを含む。いくつかの実施形態では、細胞の単一混合集団の表現型を分析することは、ハイコンテントイメージングを行うことを含む。いくつかの実施形態では、細胞の単一混合集団の表現型を分析することは、カルシウムイメージングを行うことを含む。いくつかの実施形態では、細胞の単一混合集団の表現型を分析することは、免疫組織化学を行うことを含む。いくつかの実施形態では、細胞の単一混合集団の表現型を分析することは、細胞形態撮像を行うことを含む。いくつかの実施形態では、細胞の単一混合集団の表現型を分析することは、タンパク質凝集撮像を行うことを含む。いくつかの実施形態では、細胞の単一混合集団の表現型を分析することは、細胞間相互作用撮像を行うことを含む。いくつかの実施形態では細胞の単一混合集団の表現型を分析することは、ライブセルイメージングを行うことを含む。
【0081】
[幹細胞]
いくつかの実施形態では、細胞は幹細胞である。いくつかの実施形態では、幹細胞は多能性幹細胞である。いくつかの実施形態では、細胞は、人工多能性幹細胞(iPSCs)である。いくつかの実施形態では、iPSCsは、1つ以上の既知のリプログラミング因子を導入することによって体細胞から生成される。いくつかの実施形態では、iPSCsは、表現型を分析する前に分化される。幹細胞は、有糸分裂細胞の分裂及び多様な範囲の特殊化した細胞型への分化を介して自身を再生する能力を特徴とする。哺乳動物幹細胞には、胚盤胞中に見出される胚性幹細胞と成体組織中に見出される成体幹細胞との2つの主要なタイプがある。発生中の胚において、幹細胞は、任意の特殊化された胚組織に分化することができる。成人では、幹細胞及び前駆細胞が身体の修復系として機能し、特殊化された細胞を動員するだけでなく、血液、皮膚、又は腸組織などの再生器官の正常な代謝回転を維持する。ヒト胚性幹細胞(hES)は、いくつかの転写因子及び細胞表面タンパク質の存在によって定義することができる。転写因子Oct4、Nanog、並びにSox2は、分化及び多能性の維持に繋がる遺伝子を確実に抑制するコア調節ネットワークを形成する。hES細胞を同定するために最も頻繁に使用される細胞表面抗原は、糖脂質SSEA3及びSSEA4並びにケラタン硫酸抗原Tra-1-60及びTra-1-81を含む。
【0082】
iPSCsの生成は、誘導に使用される遺伝子に依存する。Oct3/4、KLF4、Sox2及び/若しくはc-mycなどの因子又はそれらの組み合わせが使用され得る。これらのリプログラミング因子をコードする核酸は、モノシストロン性又はマルチシストロン性発現カセットに含めることができる。同様に、モノシストロン性又はマルチシストロン性発現カセットを符号化する核酸は、1つのリプログラミングベクター又は複数のリプログラミングベクターに含めることができる。
【0083】
iPSCsは、典型的には特定の幹細胞関連遺伝子を成体線維芽細胞又は臍帯血細胞などの非多能性細胞にトランスフェクトすることによって生成される。トランスフェクションは、レトロウイルス(例えば、レンチウイルス)などの組み込みウイルスベクター、又はセンダイウイルスなどの非組み込みウイルスベクターを用いて達成することができる。リプログラミングはまた、エピソームリプログラミング又はmRNAリプログラミングなどのウイルスフリーの方法を使用して行われてもよい。臨界期の後、少数のトランスフェクトされた細胞は、形態学的選択、倍加時間、レポーター遺伝子発現、及び/又は抗生物質耐性に基づいて、形態学的並びに生化学的に多能性幹細胞と類似し始める。
【0084】
多能性細胞は、様々な方法を用いて未分化状態で培養及び維持することができる。いくつかの実施形態では、多能性細胞を実質的に又は本質的に未分化の状態で培養及び維持するために、マトリクス成分を所与の培地に含めてもよい。hESC又はiPSCsなどの多能性細胞を培養及び維持するために、様々なマトリクス成分を使用することができる。例えば、胚細胞培養並びに維持のための固体支持体を提供するために、コラーゲンIV、フィブロネクチン、ラミニン、及びビトロネクチンを組み合わせて使用することができる。
【0085】
マトリゲル(商標)は、細胞培養及び多能性細胞の維持のための基板を提供するために使用されてもよい。マトリゲル(商標)はマウス腫瘍細胞によって分泌されるゼラチン状タンパク質混合物であり、BD Biosciences(New Jersey、USA)から市販されている。この混合物は多くの組織に見られる複雑な細胞外環境に似ており、細胞培養のための基板として細胞生物学者によって使用される。iPSCsを培養及び維持するさらなる方法は当業者にとって周知であり、本発明の実施形態とともに使用されてもよいことが認められるだろう。
【0086】
いくつかの実施形態では、この方法は、幹細胞の分化を分析することを含む。いくつかの実施形態では、この方法は、多能性幹細胞の分化を分析することを含む。いくつかの実施形態では、この方法は、iPSCsの分化を分析することを含む。いくつかの実施形態では、この方法は、幹細胞分化に由来する細胞型を分析することを含む。
【0087】
[顕微鏡画像位置合わせ]
いくつかの実施形態では、例示的なプラットフォームが顕微鏡画像位置合わせ技術を含む。この技術は、単一細胞画像ベースの読み出しを逆多重化するための、シーケンシングとマーカーに基づく/マーカーを含まない読み出しとの間の変換を得るために使用することができる。
【0088】
画像位置合わせは、画像の異なるセットを1つの座標系に変換するプロセスである。画像の異なるセットは、同じ物体のものであってもよいが、異なる画像取得からのものであってもよく、言い換えれば、異なるセットの画像は異なる設定を使用して異なる時間に異なるイメージャ(例えば、異なる顕微鏡)によって撮像されてもよく、したがって、異なる深度、異なる解像度、異なる視点などを有していてもよい。例えば、バーコードのベースそれぞれは、取得間の潜在的な物理的移動を伴って、時間的に離間された独立した取得として捕捉することができる。さらに、マーカー/表現型獲得は、バーコード画像獲得と比較して、異なる解像度、時間、及び/又は異なる顕微鏡から捕捉することができる。
【0089】
顕微鏡画像取得間の位置合わせのための既存の方法は、フィールドレベル又はウェルレベルのいずれかで実行され、両方とも欠点に悩まされる。例えば、フィールドレベルの位置合わせは、異なる設定において、又は異なる顕微鏡間で取得するために使用することができず、取得間のプレートの移動は情報の損失につながり得る。ウェルレベルの位置合わせは、計算量的に高価であり、整列方法の複雑さがO(NlogN)(Nは画像内の画素数)であるので、より大きなウェルサイズ及びより高い倍率に対してはスケーラブルではない。現行のアプローチの欠点は、本明細書に詳細に記載されている。
【0090】
本開示における画像位置合わせ技術は2つの取得の間の変換関数(例えば、固定アフィン変換関数)を計算することを含む。この2つの取得は、2つの異なる取得設定を使用して、2つの異なる時点で、及び/又は2つの異なる撮像装置(例えば、異なる顕微鏡)を使用して撮像された画像の2つのセットを指す。そのような変換関数を計算した後、ソース取得におけるフィールド画像の座標に変換を独立に適用して、ターゲット取得における対応するフィールド画像及び座標を取得することによって、重複情報の取得をなすことができる。
【0091】
したがって、本開示における画像位置合わせ技術は同じオブジェクトの2つの異なる取得間の座標の変換を取得するために使用することができ、この2つの取得は、異なる設定及び異なる装置を使用して生じていてもよく、潜在的な人間対話が取得間に生じていてもよい。この技術は、様々な実験室画像ベースの実験設定において有用である可能性がある。
【0092】
例えば、本開示の実施形態は、2つの異なる顕微鏡(蛍光/非蛍光)から取得された画像間の物理的座標の位置合わせを実行するために使用することができる。例えば、一方の画像はライブイメージング設定におけるインキュベータ内部の顕微鏡からのものであってもよく、他方は固定後に取得された蛍光画像であってもよい。別の例として、本開示の実施形態は、マルチスケール画像分析及び再構成のために、2つの異なる解像度で取得された画像間の物理的座標の位置合わせを実行するために使用することができる。別の例として、本開示の実施形態は、連続洗浄後の固定サンプルから得られた画像間の物理的座標の位置合わせ、及び/又は顕微鏡と自動設定との間のプレートの移動を伴う複数の染色手順、例えば、プール化光学スクリーニング分析におけるバーコーディング細胞の合成サイクルによるシーケンシングを実施するために使用することができる。
【0093】
ハイコンテントイメージング、高スループット撮像のための顕微鏡的取得は一般に、特殊用途のプラスチック/ガラス底板中で培養される細胞を撮像することを含む。
図7は、いくつかの実施形態に従う、顕微鏡取得のために設計された例示的なプレート700を描写する。プレート700は、ウェル702などの複数のウェル(例えば、6、24、86、384個)を含む。複数のウェルのそれぞれは、実験計画に従って所定の条件で処理された細胞を含む。いくつかの実施形態ではプレート上の複数のウェルを同じ状態で処理し、いくつかの実施形態ではそのウェルを異なる状態で処理する。
【0094】
図7を参照すると、ウェルは一般に、顕微鏡カメラによる重なり合う視野画像の集合として、部分的に撮像される。例えば、典型的な顕微鏡カメラは、約2,000×2,000画素の画像出力サイズを有する。この画像の解像度は、撮像に使用される対物レンズの倍率に基づいて変化することができる。
図7に示すように、ウェル702の3つの別個の視野画像704a、704b、及び704cを撮像することができる。
【0095】
図8は、いくつかの実施形態に従う、ウェルの複数の画像を図示する。示されるように、複数の画像はウェルの境界(例えば、画像802及び804)及びウェルの中心(例えば、画像806)を捕捉する画像を含む。この複数の画像は同じサイズであり、隣接する画像は互いに重なり合う。例えば、画像802及び808は、812により水平方向に互いに重なり合う。別の例として、画像802、808、及び810は、エリア814によって互いに重なり合う。
【0096】
顕微鏡画像取得のために画像位置合わせを実行することは、多くの理由から困難である可能性がある。画像位置合わせは、画像の異なるセットを1つの座標系に変換するプロセスである。画像の2つの異なるセット(すなわち、2つの画像取得)は異なるセンサ(例えば、異なる顕微鏡)、異なる時間、異なる深度、異なる解像度、及び/又は異なる視点からのものであり得る。顕微鏡画像取得間の位置合わせのための既存の方法は、フィールドレベル又はウェルレベルのいずれかで実行され、両方とも以下に説明するような欠点に悩まされる。
【0097】
現行のフィールドレベルの位置合わせは、2つの画像取得から取得されたフィールド画像間の1対1の対応関係を確立することを含む。1対1の対応関係は、ウェル内のフィールド及びフィールド位置内の画像取得の順序によって確立される。これにより、第1の取得で撮像されたフィールド画像が、第2の取得で撮像された同一のフィールド画像に位置合わせされる。ただし、フィールドレベルの位置合わせは、同じ設定、同じ顕微鏡を使用して取得した場合にのみ機能する。これは、異なる設定において、又は異なる顕微鏡間で取得するために使用することができず、取得間のプレートの移動は情報の損失につながり得る。
【0098】
現行のウェルレベルの位置合わせは、より小さい視野画像をつなぎ合わせ、フーリエ相関に基づく又は関連する方法論を使用してウェル画像を位置合わせすることによって、ウェル画像を再構成することを含む。この方法は、より小さいウェルサイズ及びより小さい対物レンズ倍率(画素数に関するウェル画像サイズはより小さい)に対して機能することができるが、位置合わせ方法の複雑さはO(NlogN)(Nは画像中の画素数)であるので、より大きいウェルサイズ及びより高い倍率に対してはスケーラブルではない。
【0099】
図6は、(例えば、第1の画像取得からの)第1の複数の画像と(例えば、第2の画像取得からの)第2の複数の画像との位置合わせのための例示的なコンピュータ実装プロセス600を図示する。第1及び第2の取得はウェルのカバレージ、画像解像度、画像サイズ、及びイメージャタイプに関して異なっていてもよく、ウェルの相対位置はシフト/回転されてもよいが、その撮像される根本的なオブジェクトは同じである。処理600は、1つ以上の電子デバイスを使用して少なくとも部分的に実行することができる。いくつかの実施形態では、600のブロックが複数の電子デバイス間で分割され得る。いくつかのブロックは任意選択的に組み合わせることができ、いくつかのブロックの順序は任意選択的に変更することができ、いくつかのブロックは任意選択的に省略される。いくつかの例では、追加の工程がプロセスと組み合わせて実行されてもよい。したがって、図示されるように、動作は本質的に例示的なものであり、それ故に限定的であると見なされるべきではない。
【0100】
例示的なプロセス600では、第1の複数の画像及び第2の複数の画像は両方とも培養プレート上のウェル(例えば、ウェル702)のものであるが、それらは2つの異なる画像取得からのものである。ウェル内の内容物は2つの画像取得の間で同じままであるが、撮像設定は2つの画像取得の間で変更されていてもよい。例えば、第1の複数の画像は第1のイメージャ(例えば、蛍光顕微鏡)を使用してキャプチャされてよく、第2の複数の画像は第2のイメージャ(例えば、非蛍光顕微鏡)を使用してキャプチャされてもよい。別の例として、第1の複数の画像は、第2の複数の画像とは異なる解像度を有していてもよい。別の例として、第1の複数の画像及び第2の複数の画像はウェルの異なるカバレッジを提供する(例えば、第2のカバレッジは、第1のカバレッジと異なるサイズであってもよく、及び/又は第1のカバレッジと比較してシフトされてもよい)。別の例として、第1の複数の画像及び第2の複数の画像は、異なる時間に撮像される。
【0101】
いくつかの実施形態では、この画像が、異なる遺伝的背景からの細胞のプール化スクリーニングのアッセイから得られる。いくつかの実施形態では、第1の複数の画像は複数のバーコーディング画像であり、第2の複数の画像は複数のマーカーベースの/マーカーを含まない読み出し画像である。いくつかの実施形態では、第1の複数の画像が複数のマーカーベースの/マーカーを含まない読み出し画像であり、第2の複数の画像は複数のバーコーディング画像である。いくつかの実施形態では、マーカーベースの/マーカーを含まない読み出し画像の複数のラウンド又は取得は、異なるイメージング/染色パラダイムを使用して取得されてもよく、一方で最後の複数の画像は複数のバーコーディング画像である。
【0102】
ブロック602において、例示的なシステム(例えば、1つ以上の電子デバイス)は、第1の複数の画像の第1の基準座標空間を生成する。言い換えれば、このシステムは、第1の複数の画像のうちの少なくとも1つの画像の画素に第1の基準座標空間の座標値を割り当てる。この第1の複数の画像は、1つ以上の取得に対応する1つ以上の画像セットを含むことができる。基準座標空間は、ウェルレベルで計算することができる。ウェルの特定の位置は、第1の基準座標空間上の値を割り当てることができる。一例として、ウェルの中心は、第1の基準座標空間の原点(すなわち、0)として割り当てることができる。さらに、ウェルの左端及び右端のポイントにはX軸上の-x及びxの値を割り当てることができ、ウェルの上端及び下端のポイントにはY軸上の-y及びyの値を割り当てることができ、ここで、x及びyは予め定義された数である。いくつかの実施形態では、X及びYの値が視野の物理的寸法に基づく。いくつかの実施形態では、X及びYの値は、イメージャによって提供され得る画像取得メタデータから取得される。
【0103】
いくつかの実施形態では、画素空間内の座標の値がX=image_size_X(画素単位)及びY=image_size_Y(画素単位)とすることができる。画素空間では、座標は画像寸法(画素単位)に対するものである。物理的寸法(すなわち、第1の座標空間)では、システムが顕微鏡ステージに対する座標空間を構築する。顕微鏡からのフィールドの物理的寸法(例えば、マイクロメートル単位のフィールド寸法)(例えば、メタデータ)に基づいて、システムは、画素空間を顕微鏡から得られた物理的空間に変換することができる。
【0104】
第1の複数の画像の各画像は、第1の基準座標空間に関連付けることができる。いくつかの実施形態では、システムが画像内のウェルの1つ以上の物理的特性(例えば、ウェルのエッジ、ウェルの形状、ウェルの位置)を検出し、それに応じて、その画像を第1の基準座標空間と関連付ける。
図8を参照すると、システムは画像内のウェルの最も左のポイント及び最も右のポイントを検出し、それに応じて-X及びXの値を割り当てることができる。さらに、このシステムは(例えば、画像802と808との間の)重複比を計算することができる。この重複比は、イメージャからのメタデータ情報(例えば、顕微鏡メタデータ)の一部であってもよく、又は2つの画像間の冗長画像情報を使用して計算されてもよい。重複比及びウェル上の特定の位置に基づいて、このシステムは画像の画素に座標値(例えば、X、Y)を割り当てることができる。
【0105】
いくつかの実施形態では、このシステムが(例えば、イメージャのメタデータを使用して)物理的寸法において顕微鏡ステージ内のウェル位置に対するグローバル座標空間を計算することができる。例えば、
図9を参照すると、各フィールド画像の中心の位置は、デバイス及び取得設定に基づいてアプリオリに測定することができ、重複比及びウェル極値は、フィールド画像の位置及び既知の画像寸法を使用して計算される。いくつかの実施形態では、第1の座標空間が画素の物理的寸法及び重複比を使用して人工的にシミュレートすることができる。例えば、顕微鏡装置メタデータがフィールド画像の位置(すなわち、物理的座標位置)に関する情報を含まない場合、座標空間は、ウェル内のフィールド画像取得の順序、画像サイズ、及び重複比を識別することによって作成することができる。
【0106】
604において、システムは、第1の複数の画像の第1のパッチを抽出する。いくつかの実施形態では、ブロック604は、以下で説明するように、ブロック606及び608を含む。
【0107】
ブロック606において、システムは、第1の複数の画像から1つ以上の目印(すなわち、マーカー画像)を捕捉する1つ以上の画像を選択する。この目印は、1つ以上の核、1つ以上の細胞、1つ以上のビーズ(蛍光マーカーから得られるか、又は明視野若しくは定量的位相コントラスト画像からのセグメント化から得られる)などのウェル内の情報であり得る。この目印は、ウェルの境界及びウェルのセンタなどのウェルの情報でもあり得る。いくつかの実施形態では、このマーカー画像の選択は、1つ以上の機械学習モデルを使用して実行することができる。
図8を参照すると、マーカー画像は、(ウェル境界を捕捉する)画像802、(ウェルのセンタを捕捉する)画像806、(ウェル内の物体又は目印を捕捉する)画像816を含んでいてもよい。
【0108】
ブロック608において、システムは、1つ以上のマーカー画像から第1のパッチを抽出する。第1のパッチは、マーカー画像のうちの1つ、又はマーカー画像のうちの1つの一部であってもよい。パッチは特定の物体若しくはマーカー、又はウェルの特定の位置(例えば、ウェルの中心)を捕捉するように抽出することができる。パッチのサイズは、ブロック612を参照して以下に説明するように、パッチが、取得間の動き/シフトの最大許容公差限界を捕捉するのに十分な大きさであるかどうかのように決定される。いくつかの実施形態では、パッチのサイズ及び位置は、許容公差閾値に基づいて経験的に決定される。例えば、システムが2つの取得の間で最大1mmのシフトを可能にすることを目的とする場合、このシステムは、x>1である対応する画像空間においてx×1mmに対応するパッチサイズをとることができる。このパッチの位置は、許容公差値に対応するパッチサイズを有するならば、どこでもよい。いくつかの実施形態では、システムが、ウェル内のランダムな位置、又は2つの取得の間の固定された位置のいずれかにおいて、マーカー画像のスパースサンプリングによって第1のパッチを抽出する。例えば、ウェルは、数百の画像によってカバーされ得る。スパースサンプリングは、ウェル内のランダムな物理的位置に対応するこれらの画像のサブセットを選択して、第1のパッチを得ることを含む。
パッチはまた、固定されたウェル位置(例えば、ウェルの中心)に対応する複数の画像を組み合わせることによって構築することができる。
【0109】
ブロック610において、システムは、第2の複数の画像の第2の基準座標空間を生成する。言い換えれば、このシステムは、第2の複数の画像のうちの少なくとも1つの画像の画素に第2の基準座標空間の座標値を割り当てる。この第2の複数の画像は、培養プレート上の同じウェルのものである。上述のように、第2の複数の画像は、第2の画像取得からのものであり得る。第1及び第2の取得はウェルのカバレージ、画像解像度、画像サイズ、及びイメージャタイプに関して異なっていてもよく、ウェルの相対位置はシフト/回転されてもよいが、その撮像される根本的なオブジェクトは同じである。ブロック610における第2の基準座標空間の生成は、ブロック602と同様の方法で、ただし独立して実行することができる。
【0110】
ブロック612において、システムは、第2の複数の画像の第2のパッチを抽出する。第2のパッチの抽出は、ブロック604と同様の方法で行うことができる。例えば、第2の複数の画像から1つ以上のマーカー画像を選択することができる。次いで、第2のパッチは、1つ以上のマーカー画像から抽出することができる。第2のパッチは、第1のパッチに捕捉された同じオブジェクト若しくはマーカー又はウェルの同じ位置(例えば、ウェルの中心)を捕捉するように抽出することができる。
【0111】
第1及び第2のパッチのサイズは、そのパッチが取得間の移動/シフトの最大許容公差限界を捕捉するのに十分な大きさであるかどうかのように決定される。例えば、第1のパッチ及び第2のパッチの両方がウェルの中心を捕捉する場合、両方のパッチは、両方の取得においてウェルの中心の周りの並進、回転及びスケーリングを捕捉するのに十分な大きさである必要がある。
【0112】
図10は、いくつかの実施形態に従う、2つの異なる画像取得からの2つの例示的なパッチを示す。円1002は第1の画像取得中のウェルの位置を表し、円1004は第2の画像取得中の同じウェルの位置を表す。示されるように、ウェルは2つの取得の間に(例えば、プレートの移動又は撮像装置の位置に起因して)シフトしている。パッチ1006は、バーコーディング画像が撮像される第1の画像取得から選択される。パッチ1008は、マーカーベースの/マーカーを含まない読み出し画像が取得される第2の画像取得から選択される。この2つのパッチはまた、ウェルの異なる解像度及びカバレッジを有する。図示される例では、この2つのパッチが同じオブジェクトを含むように選択される。
図10に示されるように、1008におけるドット及び1006におけるドットは、同じ物理的ポイント又は場所に対応する。アフィン関数T(x)及びT-1(x)は以下に説明するように、2つの取得の座標空間の間で並進するように計算することができる。
【0113】
614において、システムは、複数の変換パラメータを取得するために、第1のパッチと第2のパッチとの間のアフィン変換関数を計算する。変換パラメータは、並進パラメータ、スケーリングパラメータ、及び回転パラメータのうちの1つ以上を含むことができる。
【0114】
図11は、いくつかの実施形態に従う、変換関数の例示的なセットを図示する。変換T
1(x)~T
5(x)の各々は、T
1(x)=T
1×x(ここで、T
1はアフィン行列である)である行列乗算演算として表すことができる。
【0115】
図11を参照すると、第1のパッチ1112は第1の画像取得からのものであり、ブロック602で生成することができる第1の基準座標空間1102に関連付けられる。T
1(x)はフィールドA画素座標(例えば、画素値)から基準座標空間1102への変換を指す。上述のように、第1の基準座標空間1102内の値は物理的寸法(例えば、視野の物理的寸法)に基づくことができる。
【0116】
いくつかの実施形態では、追加の変換T2(x)が実行される。T2(x)は、第1の基準座標空間1102からウェルA画素座標への変換を指す。第1基準座標空間1102は、顕微鏡ステージを原点とする座標空間である。ウェル画素座標は、ウェル画像(画素単位)の左上隅(左下でもよい)を原点とする座標空間を示す。ステージとウェル画素座標との間の変換T2(x)は、典型的には顕微鏡ステージの寸法及びウェル画像の寸法に基づいて計算されるスケール+並進変換である。
【0117】
図11では、第2のパッチ1114は第2の画像取得からのものであり、ブロック610で生成することができる第2の基準座標空間1104に関連付けられる。パッチ1112内の画素及びパッチ1114内の画素は同じ物理的ポイント(例えば、ウェル上の同じポイント、ウェル内の同じオブジェクト)に対応するが、2つの異なる基準座標空間に関連付けられる。T
5(x)は、第2の基準座標空間1104からフィールドB画素座標への変換を指す。言い換えれば、ブロック606において、ブロック610において第2の画像取得から第2の基準座標空間1104に画像を変換するために、T
5
-1(x)が取得される。上述のように、第2の基準座標空間1104内の値は物理的寸法(例えば、視野の物理的寸法)に基づくことができる。さらに、T
4(x)はウェルB画素座標から基準座標空間1104への変換を指し、T
4
-1(x)は第2の基準座標空間1104からウェルB画素座標への変換を指す。
【0118】
ブロック614において、T3(x)は、変換されたパッチ1112(T1及びT2で変換された)及び変換されたパッチ1114(T5
-1及びT4
-1で変換された)に基づいて計算される。T3(x)は、高速フーリエ変換に基づく位置合わせ方法を用いてパッチ情報から計算されるウェルA画素座標からウェルB画素座標への変換を指す。この変換パラメータは、図示の例では並進行列、回転行列、スケール行列、及びせん断行列を含む。これらのパラメータは標準的な高速フーリエ変換ベースの位置合わせ方法を使用して、パッチ内の共通の目印(例えば、ウェル上の特定の位置、細胞)を使用して計算される。
【0119】
言い換えれば、T
3(x)は2つの基準座標空間の画素座標間を変換するために、2つのパッチに基づいて生成される。
図11のブロック間の各矢印は、座標変換演算を含む。例えば、フィールドA画素座標が与えられた場合、基準空間A座標を得ることは、変換演算T
1(x)を含む。
【0120】
いくつかの実施形態では、
図11の変換T
3は、座標ベクターxに対する行列事前乗算演算として表すことができる4つの変換行列を順番に適用することによって計算することができる。
【0121】
T3(x)=T3_translate(T3_shear(T3_scale(T3_rotate(x))))
【0122】
=T3_translate×T3_shear×T3_scale×T3_rotate×x(ここで、T3_<>は
図11に示される対応する行列である。)
【0123】
=T3×x(ここで、T3=T3_translate×T3_shear×T3_scale×T3_rotate)
【0124】
616において、システムは、複数の変換パラメータに基づいて、第1の基準座標空間と第2の基準座標空間との間の座標変換関数を生成する。
図11の図示の例において、全体の変換行列は、T=T5×T4×T3×T2×T1として計算される。したがって、エンドツーエンド変換関数T(x)は、以下のような一連の行列事前乗算として表すことができる。
【0125】
T(x)=T5(T4(T3(T2(T1(x)))))=T5×T4×T3×T2×T1×x=T×x(ここで、T=T5×T4×T3×T2×T1)
【0126】
この画像は、細胞遺伝的背景、処理などを画像中の単一細胞に割り当てるなどの細胞表現を得るために、さらに処理されてもよい。画像中の細胞の遺伝的背景間を分類するため、細胞表現を取得するために、特徴抽出のための任意のモデルが使用されてもよい。いくつかの実施形態では、システムは、自己教師付き学習(SSL)、半教師付き学習、又は教師なし学習方法を展開する。いくつかの実施形態では、システムは、本明細書で詳細に説明するように、機械学習モデルがラベルなしサンプルデータから学習するSSL技術を展開する。例えば、画像(例えば、セグメント化された形態学的画像)は、画像を受け取り潜在空間における画像を表す埋め込み(すなわち、ベクター)を出力するように構成される、訓練された自己教師付き学習モデルに入力されてもよい。この埋め込みは、潜在空間における入力画像のベクター表現とすることができる。入力画像を埋め込みに変換することにより、元のデータのサイズ及び次元を大幅に削減することができる。本明細書に記載されるように、下位次元の埋め込みは、下流処理に使用することができる。画像から埋め込みを得ることによって、自己教師付きモデルは、指向性が利用可能な時空トポロジー空間を生成することができる。例えば、各画像は埋め込みに変換され、その埋め込みは、トポロジー空間内の位置にマッピングされ、画像がキャプチャされた時間でタイムスタンプを押されることができる。したがって、空間及び/又は時間にわたる指向性は、トポロジー空間内の複数の埋め込みにわたって得ることができる。
【0127】
いくつかの実施形態では、自己教師付き学習モデルがDINO視覚変換器、SimCLRモデル、又はラベルなしサンプルデータから学習する任意の他のモデルである。いくつかの実施形態では、教師なし機械学習モデルは、訓練された対照的学習アルゴリズムである。コントラスト学習は、どのデータ点が類似又は異なるのかをモデルに教示することによって、ラベルなしでデータセットの一般的な特徴を学習するために使用される機械学習技術を指すことができる。コントラスト学習モデルは、そうでなければそのようなデータに割り当てられる可能性があるラベルを線形的に予測する撮像データから埋め込みを抽出することができる。任意対照的な学習モデルは対照的な損失を最小化することによって訓練され、これは、同じサンプル画像の異なる拡張からの埋め込み間の類似性を最大化し、異なるサンプル画像の埋め込み間の類似性を最小化する。例えば、このモデルは、回転、反転、クロッピング、及び色ジッタに対して不変である画像から埋め込みを抽出することができる。
【0128】
いくつかの実施形態では、システムは、画像を分析するために分類器を展開する。いくつかの実施形態では、分類器が、DenseNet分類器などの複数の層を備える畳み込みニューラルネットワーク(CNN)である。例えば、画像(例えば、セグメント化された形態学的画像)は、画像を受け取り分類結果を出力するように構成された分類器に入力されてもよい。いくつかの実施形態では、複数の細胞のセグメント化された形態学的画像が分類器に入力される。いくつかの実施形態では、遺伝的背景標識(例えば、複数の細胞のうちの個々の細胞の遺伝子型を同定する標識)は分類器の出力である。いくつかの実施形態では、分類結果は、単一細胞を遺伝的背景と関連付けることを含んでいてもよい。潜在空間内の画像を表す埋め込み(すなわち、ベクター)は、分類器から取得されてもよい。いくつかの実施形態では、埋め込みは、分類器の最後の層の前の、分類器の複数の層のうちの層から得られる。例示的なDenseNetモデルアーキテクチャは、"Densely Connected Convolutional Networks, "、Huang et al(2016)、arXiv:1608.06993に記載されており、その内容は、その全体が参照により組み込まれる。いくつかの実施形態では、その複数の層が、入力としてマルチチャネル蛍光画像を受け取り遺伝的背景標識を出力するように修正される。この埋め込みは、潜在空間における入力画像のベクター表現とすることができる。分類器を使用して入力画像を埋め込みに変換することにより、元のデータのサイズ及び次元を大幅に削減することができる。埋め込み又はその一部は例えば、異なる遺伝的背景の単一細胞の処理応答などの処理応答を評価するために使用することができる。いくつかの実施形態では、取得された埋め込みは、本明細書に記載されるように、下流処理のために使用され得る、埋め込みの可視化のためのUMAPプロットを取得するために、UMAPアルゴリズムを使用して次元がさらに低減される。UMAPプロット又はその一部は例えば、異なる遺伝的背景の単一細胞の処理応答などの処理応答を評価するために使用することができる。
【0129】
画像から埋め込みを取得することによって、システムは、指向性が利用可能な時空トポロジー空間を生成することができる。例えば、各画像は埋め込みに変換され、その埋め込みは、トポロジー空間内の位置にマッピングされ、画像がキャプチャされた時間でタイムスタンプを押されることができる。したがって、空間及び/又は時間にわたる指向性は、トポロジー空間内の複数の埋め込みにわたって得ることができる。埋め込み及び後続のUMAPプロットは、任意選択で異なる処理(例えば、遺伝的処理又は化学的処理)を受けた異なる遺伝的背景の単一細胞などの単一細胞を表すデータ点を、埋め込み及び/又はUMAPプロットの特定の部分にクラスタ化することができる。個々の細胞の画像をそれらの埋め込み座標上に重ね合わせることによって、細胞は、トポロジー空間内の特定の位置にクラスター化し、細胞画像のどの特徴(例えば、表現型)がモデル内で分離を引き起こしているかがより明確になる。いくつかの実施形態では、埋め込み及び/又はUMAPプロットが分類結果として分類器から得られた遺伝子型(例えば、遺伝的背景)と生理学的表現型を一致させる。
【0130】
図6を参照して上述した動作は、
図12に示す構成要素によって任意に実装される。
図12は、一実施形態に従うコンピューティングデバイスの一例を図示する。デバイス1200は、ネットワークに接続されたホストコンピュータとすることができる。デバイス1200は、クライアントコンピュータ又はサーバとすることができる。
図12に示されるように、デバイス1200は、パーソナルコンピュータ、ワークステーション、サーバ、又は電話若しくはタブレットなどのハンドヘルドコンピューティングデバイス(ポータブル電子装置)など、任意の適切な種類のマイクロプロセッサベースのデバイスとすることができる。デバイス1600は例えば、プロセッサ1210、入力装置1220、出力装置1230、記憶装置1240、及び通信装置2160のうちの1つ以上を含むことができる。入力装置1220及び出力装置1230は概して上述のものに対応することができ、コンピュータに接続可能であるか、又はコンピュータと一体化されるかのいずれかであってもよい。
【0131】
入力装置1220は、タッチスクリーン、キーボード若しくはキーパッド、マウス、又は音声認識装置などの、入力を提供する任意の適切な装置とすることができる。出力装置1230は、タッチスクリーン、触覚装置、又はスピーカなどの、出力を提供する任意の適切な装置とすることができる。
【0132】
記憶装置1240は、RAM、キャッシュメモリ、ハードドライブ、若しくはリムーバブル記憶ディスクを含む、電気、磁気、又は光学メモリなどの、記憶装置を提供する任意の適切な装置とすることができる。通信装置1260は、ネットワークインタフェースチップ又は装置など、ネットワークを介して信号を送信及び受信することが可能な任意の適切な装置を含むことができる。コンピュータの構成要素は、物理的バスを介して又は無線などで、任意の適切な手法で接続することができる。
【0133】
記憶装置1240に格納され、プロセッサ1210によって実行することができるソフトウェア1250は、例えば、本開示の機能を具現化する(例えば、上述したような装置において具現化される)プログラミングを含むことができる。
【0134】
ソフトウェア1250はまた、命令実行システム、機器、若しくは装置からソフトウェアに関連付けられた命令をフェッチし、その命令を実行することができる、上述したものなどの命令実行システム、機器、若しくは装置によって使用するための、又はそれに関連して使用するための、任意の非一時的コンピュータ可読記憶媒体内に格納及び/又は輸送することができる。本開示の文脈では、コンピュータ可読記憶媒体は、命令実行システム、機器、若しくは装置によって使用するための、若しくはそれに関連して使用するためのプログラムを含むか又は格納することができる、記憶装置1240などの任意の媒体とすることができる。
【0135】
ソフトウェア1250はまた、命令実行システム、機器、若しくは装置からソフトウェアに関連付けられた命令をフェッチし、その命令を実行することができる、上述したものなどの命令実行システム、機器、若しくは装置によって使用するための、又はそれに関連して使用するための、任意の輸送媒体内に伝播することができる。本開示の文脈では、輸送媒体は、命令実行システム、機器、若しくは装置によって使用するための、若しくはそれに関連して使用するためのプログラムを通信する、伝播する、又は輸送することができる任意の媒体とすることができる。輸送可読媒体は、電子、磁気、光学、電磁気、又は赤外線有線若しくは無線伝播媒体を含むことができるが、これらに限定されない。
【0136】
デバイス1200は、任意の適切な種類の相互接続された通信システムとすることができるネットワークに接続されてもよい。このネットワークは、任意の適切な通信プロトコルを実装することができ、任意の適切なセキュリティプロトコルによって保護することができる。このネットワークは、無線ネットワーク接続、T1若しくはT3回線、ケーブルネットワーク、DSL、又は電話回線など、ネットワーク信号の送信及び受信を実装することができる任意の適切な配置のネットワークリンクを備えることができる。
【0137】
デバイス1200は、ネットワーク上で動作するのに適した任意のオペレーティングシステムを実装することができる。ソフトウェア1250は、C、C++、Java、又はPythonなどの任意の適切なプログラミング言語で書くことができる。様々な実施形態において、本開示の機能を具現化するアプリケーションソフトウェアは、例えばクライアント/サーバ配置において、又はウェブベースのアプリケーション若しくはウェブサービスとしてのウェブブラウザを通して、異なる構成で展開され得る。
【0138】
本開示及び実施例は添付の図面を参照して十分に説明されてきたが、様々な変更及び修正が当業者には明らかになることに留意されたい。そのような変更及び修正は、特許請求の範囲によって定義される開示及び実施例の範囲内に含まれているものとして理解されるべきである。
【0139】
前述の説明は、説明の目的で、特定の実施形態を参照して説明されている。しかしながら、上記の例示的な議論は、網羅的であること、又は本発明を開示された正確な形態に限定することを意図するものではない。上記の教示に鑑みて、多くの修正及び変形が可能である。実施形態は、技術の原理及びそれらの実際の応用を最も良く説明するために選択、及び説明された。これにより、当業者であれば、想定される特定の用途に適した様々な修正を加えて、本技術及び様々な実施形態を最良に利用することができる。
【0140】
本発明は、以下の実施例を参照することによってより完全に理解されるのであろう。しかしながら、それらは、本発明の範囲を限定するものとして解釈されるべきではない。本明細書に記述された実施例及び態様は説明のみを目的とするものであり、それらに関する様々な修正又は変更は、当業者に対して示唆され、本出願の精神及び範囲、並びに添付された特許請求の範囲の内に含まれるべきであると理解される。
【0141】
[実施例]
[実施例1:異なる遺伝的背景からの細胞のプール化スクリーニングの方法を使用するモダリティ]
本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法は、様々な異なるアッセイモダリティにおいて使用することができる。本明細書に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法は、Visual Village in a Dish(ViViD)とも呼ばれる。各モダリティにおいて、固有の核酸バーコードシーケンスをコードするベクターが、アッセイされる細胞に導入される。固有の核酸バーコードシーケンスをコードする例示的なベクターを
図1に示す。
【0142】
本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法を使用する第1のモダリティを
図2に示す。このモダリティでは、様々な遺伝的背景を含む細胞株の大規模な集合が収集される。次いで、これらの個々の系統を固有の核酸バーコードシーケンスで標識し、これが送達されてゲノムに組み込まれる。次いで、iPSCsなどの細胞をプールし、任意のアッセイを通して運ぶ。いくつかの実施形態では、そのモダリティがウルトラスループット薬物スクリーニングを実行することを含む。アッセイの最後に、バーコードを読み取り、測定された表現型を、バーコードに一致するゲノムDNAと連結させる。最後に、根底にある生物学、疾患表現型、薬物応答などを明らかにするために、機械学習又は他の統計的遺伝学的方法が、表現型/遺伝子型データセットに適用される。
【0143】
本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法を使用する第2のモダリティを
図3に示す。このモダリティでは、第1のモダリティのようにいくつかの遺伝的背景をプールするのではなく、1つ以上の健常/患者株からの複数の操作された変異体が個々に標識される。これは、精製されたサブクローンを含む特異的に操作された変異体がアッセイにおいて実装されることを可能にする。この変異株は、一旦バーコード化されると、プールされ、以前に記載されたような任意のアッセイを通して運ばれる。いくつかの実施形態では、そのモダリティがウルトラスループット薬物スクリーニングを実行することを含む。
【0144】
本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法を使用する第3のモダリティを
図4に示す。このモダリティでは、標準ViViDは摂動と併合される。いくつかの遺伝的背景からの複数の細胞株を収集し、固有の核酸バーコードシーケンスで個々に標識する。これらの細胞はまた、遺伝子改変剤を含むように操作され、次いで、遺伝子の選択又はすべてを標的とするgRNAを含有するプール化レンチウイルスライブラリで処理される。あるいは、レンチウイルスライブラリは「オールインワン」ベクターとすることができる。次いで、プール化細胞は、任意のアッセイを通して運ばれる。いくつかの実施形態では、そのモダリティがウルトラスループット薬物スクリーニングを実行することを含む。最後に、遺伝子型及び摂動の組み合わせを検出し、観察される任意の細胞表現型に結び付けることができる。
【0145】
[実施例2:異なる遺伝的背景からの細胞のプール化スクリーニングから得られたデータの分析]
本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法から得られたデータを分析するために使用され得る分析パイプラインが本明細書に記載される。本明細書に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法は、Visual Village in a Dish(ViViD)とも呼ばれる。分析パイプラインは、細胞バーコードを検出及び逆多重化し、細胞をセグメント化し、有意義な表現の学習のために取得と他の下流タスクとの間で画像座標を整列させ、本明細書に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法から生成されたデータから未知の生物学を発見するための、ノンパラメトリック並びにパラメトリック学習可能方法を含む。
【0146】
図5は、本出願に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法から得られたデータを分析するために使用される分析パイプラインを示す概略図である。分析パイプラインは、顕微鏡画像取得から始まり、下流分析のための単一細胞画像ベースの読み出しで終わる、異なるサブコンポーネントを含む。分析パイプラインは、以下の工程を含む。
(0)顕微鏡を用いて撮像された画像(合成によるシーケンシング)及びマーカーベースの/マーカーを含まない読み取り画像(CellPaint/抗体染色/FISH/QPC)のバーコード化
(1)合成によるシーケンシングによって撮像された個々のベースサイクルからのバーコードの検出及びシーケンシング
(2)下流の読み出しのためのマーカーベースの/マーカーを含まない細胞画像の前処理
(3)単一細胞画像ベースの読み出しを逆多重化するための、シーケンシングとマーカーに基づく/マーカーを含まない読み出しとの間の変換の計算
(4)実験で使用されたバーコードの辞書へのシーケンシングされたバーコードのマッピング
(5)マーカーベースの/マーカーを含まない読み出し画像において単一細胞を同定するための核及び細胞境界のセグメント化
(6)(3)から計算された変換を使用する細胞セグメンテーションによって識別された対応する単一細胞へのシーケンシングされたバーコードの割り当て
(7)下流の単一細胞画像分析のためのマーカーベースの/マーカーを含まない読み出し画像のタイリング(及び細胞セグメント化によるマスキング)
(8)このパイプラインによって可能になる、あり得る単一細胞読み出しの非網羅的リスト(抗体/蛍光タンパク質マーカー、CellPaint、定量的位相画像、蛍光in-situハイブリダイゼーション)
【0147】
[実施例3:Visual Village in a Dish(ViViD)を使用した異なる遺伝的背景からの細胞のプール化スクリーニング]
この実施例は、異なる遺伝的背景からの細胞のプール化スクリーニング、及び本明細書に記載の方法を用いたその分析を示す。具体的には、この実施例は、本明細書に記載される異なる遺伝的背景からの細胞のプール化スクリーニングの方法から生成されたデータからの取得間の、細胞バーコードの検出及び逆多重化、細胞のセグメント化、並びに画像座標のアラインメントを示す。
【0148】
[試料の調製、スクリーニング、及び細胞培養]
野生型GM25256誘導多能性幹細胞(iPSCs)(California Institute for Regenerative Medicine(CIRM))を、スタンダードEssential 8(E8)、ビトロネクチン、及びReLeSR培養法を用いて増殖させた。AAVS1の安全な遺伝子座にドキシサイクリン誘導性ニューロゲニン-2(doxNGN2)遺伝子を含有するように細胞を操作し、doxNGN2ベクターは連結されたジェネティシン耐性遺伝子を含み、これらのベクターの抗生物質選択下での連続培養を可能にした。
【0149】
最初のスクリーニングはガイドRNA(gRNA)結合Cas9のリボ核タンパク質(RNP)トランスフェクションを用いて行い、TSC2(「TSC2 ko」)及びSETD1A遺伝子(「SETD1A ko」)のノックアウトに有効なgRNAをそれぞれ同定した。次いで、標的遺伝子の純粋なホモ接合性又はヘテロ接合性ノックアウトを達成するために、iPSCsを単一又は二重ラウンドでサブクローニングした。Wt制御サブクローンは同じプロセスを通して採取したが、RNPトランスフェクション段階中に編集を受けなかった細胞に由来した。SETD1Aのホモ接合性ノックアウトは、細胞生存のための遺伝子の少なくとも1つのコピーの不可欠性のため、培養物中で生存しなかった。したがって、SETD1Aのヘテロ接合性ノックアウト(「SETD1AG3 het」)は、個数指定SETD1A gRNA 3及びSETD1A gRNA4を使用して生成され、SETD1AG3のヘテロ接合性ノックアウト(「SETD1AG3 het」)及びSETD1AG4のヘテロ接合性ノックアウト(「SETD1AG4 het」)としてそれぞれ標識された細胞株をもたらした。TSC2のヘテロ接合性ノックアウト(「TSC2 het」)。
【0150】
非標的gRNAを含有するレンチウイルスベクターを合成した。上記の複数の操作された株は、それぞれ、遺伝子型の特異的な「バーコード」として記録された固有のgRNA標識で標識された。gRNA発現転写物のレンチウイルス組み込みを有する細胞を、ピューロマイシンを用いて選択した。レンチウイルスベクターはまた、特徴抽出成分を含有し、単一細胞RNAseq(scRNAseq)分析中に固有の標識を読み取ることを可能にした。
【0151】
各サブクローンを一意的に標識した後、複数の操作された株を、全ての下流アッセイのために一緒にプールした。次いで、NGN2遺伝子の誘導を用いて、細胞をニューロンに分化させた。簡潔に述べると、細胞をアキュターゼを介して解離させ、E8媒体+Y27632中で-2日目に播種し、次いで-1日目にE8のみを与えた。0日目に、細胞を処理して、1日目及び2日目にNGN2発現を誘導した。
【0152】
2日目に、培養プレートを細胞培養水中の0.1%ポリエチレンイミン(PEI)で処理し、37℃で一晩インキュベートした。3日目に、PEIプレートを完全に吸引し、乾燥させた。次いで、PEIプレートをPBS中のラミニンで1時間、37℃でコーティングした。次いで、神経前駆細胞をアキュターゼで37℃で5分間解離させ、NGN2媒体に再懸濁した。細胞を濾過し、様々な密度でプレーティングした。
【0153】
ニューロンのみの培養物(例えば、scRNAseqサンプル)については、ラミニンコーティング溶液を吸引し、神経前駆細胞を、NGN2培地中のPEI/ラミニンコーティングされた培養プレート上にプレーティングした。
【0154】
ニューロン-星状細胞共培養物(例えば、イメージングサンプル)のために、神経前駆細胞を、ラット星状細胞(Lonza)と同時に、PEI/ラミニンでコーティングされた培養プレート上にプレーティングした。各ウェルは、ニューロン及びラット星状細胞を3:2の比で、すべてNGN2媒体中で受けた。月曜日/水曜日/金曜日のスケジュールで、6日目が月曜日から始まるように、培地を変更した。各播種日に、培地の1/3を各ウェルから取り出し、新鮮な培地と交換した。11日目から、細胞をドキシサイクリンを含まないNGN2媒体で処理し、月曜日/水曜日/金曜日のスケジュールを継続した。
【0155】
[撮像及びセグメンテーション]
20日目から、細胞をDMSOコントロール又は100nMラパマイシンのいずれかで処理した。ラパマイシン処理は、22日目及び24日目に、27日目(総処理期間7日間)のプレートの最終的なパラホルムアルデヒド(PFA)固定のために補充した。固定された細胞を、洗浄し、それぞれの背景ゲノム標識(「バーコード」)を逆転写し、ギャップ充填を伴うローリングサークル増幅によって増幅した。
【0156】
細胞を、二次抗体に対応する、Hoescht(1:200,000)、1:1,000 rab-phS6抗体(Cell Signaling Tech)、及び1:2,500 ch-MAP2抗体(Novus)で4℃で一晩染色し、lumencor celesta励起を用いてNikon Ti2を介して撮像した。
図13Aは、ニューロン及び星状細胞の共培養における染色された細胞の例示的な画像を示す。
【0157】
次いで、細胞画像を、
図13Bに示されるように、核及び細胞境界によってセグメント化し、読み出し画像中のニューロン単一細胞を同定した。簡潔に述べると、DAPIチャネルを閾値処理し、続いて、分水界変換を適用して、標識核インスタンスを得ることによって、核セグメント化マスクを生成した。次いで、MAP2チャネルを閾値処理し、その後、一連の形態学的動作を行い、核セグメント化マスクをシードとして使用して、分水界変換を適用することによってニューロン細胞をセグメント化した。
【0158】
[バーコードの検出及びシーケンシング]
撮像後、細胞は、細胞遺伝的背景に対応するgRNAバーコード標識全体がそれぞれの細胞において測定されるまで、合成によるin situシーケンシングの数サイクルを受けた。in situシーケンシングの例示的な画像を
図14Aに示す。シーケンシングされたバーコードは、実験で使用されたバーコードの辞書にマッピングされた。バーコードシーケンスは、ピーク検出アルゴリズム、続いてピーク蛍光チャネルに基づくヌクレオチド塩基の強度による分類を用いて、合成によるシーケンス決定画像から計算した。
図14Bは各細胞株遺伝子バックグラウンドについて合計されたPOSH(例えば、プール化光学スクリーニング)バーコードの個数を示し、POSHバーコードの個数に基づく、対応する細胞の個数が
図14Cに示される。
【0159】
[変換]
次に、単一細胞画像ベースの読み出しを逆多重化するための、シーケンシングとマーカーに基づく/マーカーを含まない読み出しとの間の変換を計算した。シーケンシングされたバーコードは、計算された変換を用いた細胞セグメント化によって同定された対応する単一細胞に割り当てられた。簡潔に述べると、次いで、合成によるシーケンシング撮像実行及び表現型(MAP2+DAPI)撮像実行の第1サイクルからのウェル画像を、変換機能を計算するために登録した。次いで、合成によるシーケンシングの第1サイクルにおけるバーコード位置は、計算された変換関数を使用して表現型画像に変換され、それらのセグメンテーションラベルに基づいて単一細胞に割り当てられた。バーコードが細胞に割り当てられると、セグメンテーションマスクを使用して単一の神経細胞画像が生成され、後続モデリングのために保存された。教師あり分類器を訓練するために、1つのウェルからのサンプルを使用して試験データセットを作成し、残りのウェルを訓練に使用した。単一細胞入力を与えられた遺伝的背景間を分類するために、交差エントロピー損失関数を持つデータセットを用いて教師付きDenseNetモデルを訓練した。これらの単一細胞画像の低次元表現を得るために、ネットワークの最後の層の前の活性化出力層を可視化のための低次元特徴埋め込みとして利用した。次いで、これらの埋め込みは、可視化のための2つの次元(例えば、「UMAP1」及び「UMAP2」)を得るために、UMAPアルゴリズムを使用して次元がさらに低減された。
【0160】
教師ありDenseNetモデルは、試験データセットに対して45.5%の分類精度を達成することができた。
図15Aは未処理(「No Tr」)細胞のバーコードシーケンシング及び撮像データ(例えば、「UMAP1及びUMAP2」の埋め込み)を可視化する例示的な変換を示す。個々の細胞の代表的な画像タイルをそれらの埋め込み座標上に重ねることによって(
図15B)、細胞画像のどの特徴がモデル内で分離を引き起こしているかがより明確になる。特に、低い方のUMAP1/高い方のUMAP2(
図15A及び15Bの左上)領域はプール化細胞のより密集した領域を含み、複数の遺伝子型の混合物を伴い、単一のタイルにおける複数の遺伝子型の細胞をもたらした。あるいは、細胞体サイズ及び神経突起形状の明瞭な差異が、高UMAP1(
図15A及び15Bの右中)と比較して、低UMAP1/低UMAP2(
図15A及び15Bの左下(破線で示す円))において出現し、患者の過誤腫においてニューロンが示す生理学的フェノタイプと一致する。要約すると、UMAP視覚化は、TSC2 ko細胞が、残りの細胞と比較して、
図15Aにおいて破線を伴う円によって示される異なる特徴埋め込み空間を有することを確認した。
【0161】
図16A~16Bは未処理細胞(「No Tr」)及びラパマイシン(「Rapamycin」)で処理された細胞のバーコードシーケンシング及び撮像データ(例えば、埋め込み)を可視化する例示的な変換を示す。
図16A及び16Bの左下のクラスター(破線を有する円によって示される)は主に、未処理のTSC2 ko細胞によって占められ、一方、未処理のwt細胞、SETD1A het細胞、及びラパマイシン処理されたTSC2 koニューロンは、全て、埋め込みの他の領域に分類される。
【0162】
[scRNAseq分析]
14日目に、ニューロンを、ラパマイシン(100nM)、エベロリムス(100nM)、ロナファルニブ(100nM)、イアダデムスタット(100nM)、DMSO(処理に適合するように1:100,000希釈)、及び未処理の6つの処理で処理した。1/3の培地交換後に標的希釈物を作製するために、播種を行った。細胞を、16日目に同じ処理で再度処理した。17日目に、ニューロンを37℃で30分間アキュターゼにより解離させた。アキュターゼをNGN2で不活性化し、細胞を濾過し、計数した。細胞を培地に再懸濁し、PCR増幅特徴抽出オプションを用いて標準的な10X scRNAseq処理を行った。シーケンシングライブラリを、標準CellRangerパイプライン(10X)を用いてHg38転写マップにアラインした。遺伝子型標識非標的gRNA(例えば、「特徴」)は、以下の、1)最高数のバーコードが、総バーコード読み取りの55%より多くを構成する場合に、所与の細胞に割り当てられた、2)2番目に高い数のバーコードが読み取りの40%より多くを構成する場合に、細胞が(「1」に優先して)「多重線」と標識された、及び3)バーコードカウントが検出されなかった場合に、細胞が「未割り当て」と標識された、に基づいて、細胞に割り当てられた。遺伝的背景を標識し、各プールが由来する処理ウェルをトラッキングすることによって、14の遺伝的背景を有する6つの処理を組み合わせたデータセットを生成した。
【0163】
図17は、未処理細胞及びラパマイシン、エベロリムス、ロナファルニブ、イアダデムスタット、及びDMSOで処理された細胞の、scRNAseqを用いて測定されたバーコード及び転写シグネチャーを有する、プール化ViViD標識細胞の例示的な埋め込みを示す。TSC2 koニューロンは、クラスター6(実線矢印)で示される。ラパマイシン処理は、TSC2 koニューロンを含む全ての遺伝子型の全ての細胞を新しい集団に押しやった(白抜き矢印)。
【0164】
全体として、これらのデータは、異なる遺伝的背景からの細胞のVisual Village in a Dish(ViViD)プール化光学スクリーニングプラットフォームが畳み込み因子なしで特定の細胞型に基づく大規模集団遺伝学アッセイを用いて新規生物学を発見することができることを示している。
【0165】
[例示的な実施形態]
以下の実施形態は例示的なものであり、本明細書に記載される発明の範囲を限定することを意図するものではない。
【0166】
[実施形態1]
a)異なる遺伝的背景の細胞の2つ以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する2つ以上の固有の核酸バーコードシーケンスで標識することと、
b)細胞の単一の混合集団を得るために、前記細胞の2つ以上の集団を組み合わせることと、
c)前記細胞に対するin situ単細胞シーケンシングを行うことと、
d)前記混合集団における前記細胞の、既知の表現型を分析すること又は新しい表現型を同定することと、
を含む、異なる遺伝的背景からの細胞のプール化スクリーニング方法。
【0167】
[実施形態2]
前記細胞の2つ以上の集団が異なる細胞株由来である、実施形態1に記載の方法。
【0168】
[実施形態3]
前記異なる細胞株が健康な細胞株である、実施形態2に記載の方法。
【0169】
[実施形態4]
前記異なる細胞株が患者細胞株である、実施形態2に記載の方法。
【0170】
[実施形態5]
前記異なる細胞株が同質遺伝子操作された細胞株である、実施形態2に記載の方法。
【0171】
[実施形態6]
前記異なる細胞株が、健康な細胞株、患者細胞株、及び同質遺伝子操作された細胞株の任意の組合せを含む、実施形態2に記載の方法。
【0172】
[実施形態7]
前記細胞が人工多能性幹細胞(iPSCs)である、実施形態1乃至6のいずれか1つに記載の方法。
【0173】
[実施形態8]
前記iPSCsが、前記表現型を分析する前に分化させられる、実施形態7に記載の方法。
【0174】
[実施形態9]
前記表現型を分析する前に前記細胞を培養することをさらに含む、実施形態8に記載の方法。
【0175】
[実施形態10]
前記細胞の単一の混合集団が、基板上又は三次元培養物中にある、実施形態1乃至9のいずれか1つに記載の方法。
【0176】
[実施形態11]
前記基板が細胞培養皿である、実施形態10に記載の方法。
【0177】
[実施形態12]
前記方法が、単一細胞RNAseqを行うことをさらに含む、実施形態1乃至11のいずれか1つに記載の方法。
【0178】
[実施形態13]
前記方法が、工程b)の前に、前記細胞の2つ以上の集団を2世代以上増殖させることをさらに含む、実施形態1乃至12のいずれか1つに記載の方法。
【0179】
[実施形態14]
前記方法が、前記細胞の2つ以上の集団のゲノムに前記固有の核酸バーコードシーケンスを安定に組み込むことを含む、実施形態1乃至13のいずれか1つに記載の方法。
【0180】
[実施形態15]
前記固有の核酸バーコードシーケンスが、ウイルスを使用して前記細胞内に送達される、実施形態14に記載の方法。
【0181】
[実施形態16]
前記ウイルスがレンチウイルスである、実施形態15に記載の方法。
【0182】
[実施形態17]
前記ウイルスが選択マーカーをコードする、実施形態15又は16に記載の方法。
【0183】
[実施形態18]
前記選択マーカーが抗生物質耐性遺伝子である、実施形態17に記載の方法。
【0184】
[実施形態19]
前記ウイルスが蛍光タンパク質をコードする、実施形態15乃至18のいずれか1つに記載の方法。
【0185】
[実施形態20]
固有の核酸バーコードシーケンスそれぞれが少なくとも1塩基対の長さである、実施形態1乃至19のいずれか1つに記載の方法。
【0186】
[実施形態21]
固有の核酸バーコードシーケンスそれぞれが1~約18塩基対の長さである、実施形態20に記載の方法。
【0187】
[実施形態22]
固有の核酸バーコードシーケンスそれぞれが8塩基対の長さである、実施形態20に記載の方法。
【0188】
[実施形態23]
前記細胞の2つ以上の集団が、前記固有の核酸バーコードシーケンスで標識する前にシーケンシングされる、実施形態1乃至22のいずれか1つに記載の方法。
【0189】
[実施形態24]
前記シーケンシングが全ゲノムシーケンシングである、実施形態23に記載の方法。
【0190】
[実施形態25]
前記細胞の2つ以上の集団が関連個体から得られた、実施形態1乃至24のいずれか1つに記載の方法。
【0191】
[実施形態26]
前記細胞の2つ以上の集団がヒトから得られた、実施形態25に記載の方法。
【0192】
[実施形態27]
異なる遺伝的背景の細胞の10以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する10以上の固有の核酸バーコードシーケンスで標識することを含む、実施形態1乃至26のいずれか1つに記載の方法。
【0193】
[実施形態28]
前記細胞の表現型を分析することが、ハイコンテントイメージング、カルシウムイメージング、免疫組織化学、細胞形態撮像、タンパク質凝集撮像、細胞間相互作用撮像、生細胞撮像、及び任意の他の画像ベースのアッセイモダリティからなる群から選択されるアッセイを含む、実施形態1乃至27のいずれか1つに記載の方法。
【0194】
[実施形態29]
工程d)が、前記細胞の顕微鏡画像又は時系列の顕微鏡画像をキャプチャすることによって前記細胞の表現型を分析することと、前記画像又は複数の画像において示される表現型特徴を評価することとを含む、実施形態1乃至28のいずれか1つに記載の方法。
【0195】
[実施形態30]
前記方法が、
培養プレート上のウェルのものである第1の複数の画像の第1の基準座標空間を生成することと、
前記第1の複数の画像の第1のパッチを抽出することと、
前記培養プレート上の前記ウェルのものである第2の複数の画像の第2の基準座標空間を生成することと、
前記第2の複数の画像の第2のパッチを抽出することと、
複数の変換パラメータを得るために、前記第1のパッチと前記第2のパッチとの間のアフィン変換関数を計算することと、
前記複数の変換パラメータに基づいて、前記第1の基準座標空間と前記第2の基準座標空間との間の座標変換関数を生成することと、
を含む、前記第1の複数の画像と前記第2の複数の画像との間の位置合わせのためのコンピュータ実装技術をさらに含む、実施形態29に記載の方法。
【0196】
[実施形態31]
培養プレート上のウェルのものである第1の複数の画像の第1の基準座標空間を生成することと、
前記第1の複数の画像の第1のパッチを抽出することと、
前記培養プレート上の前記ウェルのものである第2の複数の画像の第2の基準座標空間を生成することと、
前記第2の複数の画像の第2のパッチを抽出することと、
複数の変換パラメータを得るために、前記第1のパッチと前記第2のパッチとの間のアフィン変換関数を計算することと、
前記複数の変換パラメータに基づいて、前記第1の基準座標空間と前記第2の基準座標空間との間の座標変換関数を生成することと、
を含む、前記第1の複数の画像と前記第2の複数の画像との間の位置合わせのためのコンピュータ実装方法。
【0197】
[実施形態32]
前記第1の複数の画像は複数のバーコーディング画像である、実施形態31に記載の方法。
【0198】
[実施形態33]
前記第2の複数の画像は複数のマーカーベースの/マーカーを含まない読み出し画像である、実施形態31又は32に記載の方法。
【0199】
[実施形態34]
前記第1の複数の画像及び前記第2の複数の画像は、前記ウェルの異なるカバレッジを提供する、実施形態31乃至33のいずれか1つに記載の方法。
【0200】
[実施形態35]
前記第1の複数の画像及び前記第2の複数の画像が異なる時間に撮像される、実施形態33乃至34のいずれか1つに記載の方法。
【0201】
[実施形態36]
前記第1の複数の画像及び前記第2の複数の画像が異なる解像度を有する、実施形態31乃至35のいずれか1つに記載の方法。
【0202】
[実施形態37]
前記第1の複数の画像が第1の顕微鏡によって撮影され、前記第2の複数の画像が第2の顕微鏡によって撮影される、実施形態31乃至36のいずれか1つに記載の方法。
【0203】
[実施形態38]
前記第1の顕微鏡が蛍光顕微鏡である、実施形態37に記載の方法。
【0204】
[実施形態39]
前記第2の顕微鏡が非蛍光顕微鏡である、実施形態37に記載の方法。
【0205】
[実施形態40]
前記第1の複数の画像が第1のイメージャによってキャプチャされる、実施形態31乃至39のいずれか1つに記載の方法。
【0206】
[実施形態41]
前記第1の複数の画像における前記ウェルの1つ以上の物理的特性を検出することと、
検出された前記1つ以上の物理的特性に基づいて前記第1の基準座標空間を生成することと、
をさらに含む、実施形態40に記載の方法。
【0207】
[実施形態42]
前記ウェルの前記1つ以上の物理的特性が、前記ウェルの形状、前記ウェルのエッジ、前記ウェルの位置を含む、実施形態41に記載の方法。
【0208】
[実施形態43]
前記第1の複数の画像中の2つ以上の画像が重複比によって互いにオフセットされ、前記第1の基準座標空間が前記重複比に基づいて生成される、実施形態40乃至42のいずれか1つに記載の方法。
【0209】
[実施形態44]
前記第1の基準座標空間は、前記第1のイメージャのメタデータに基づいて生成される、実施形態40乃至43のいずれか1つに記載の方法。
【0210】
[実施形態45]
1つ以上の画像内で捕捉された1つ以上のランドマークに基づいて前記第1の複数の画像から1つ以上のマーカー画像を選択することであって、前記第1のパッチは、前記第1の複数の画像からの前記1つ以上のマーカー画像から取得される、選択することをさらに含む、実施形態40乃至44のいずれか1つに記載の方法。
【0211】
[実施形態46]
前記1つ以上のランドマークは、1つ以上の細胞、1つ以上のウェル境界、1つ以上のビーズ、1つ以上の核、又はそれらの任意の組合せを含む、実施形態45に記載の方法。
【0212】
[実施形態47]
前記第2の複数の画像が第2のイメージャによってキャプチャされる、実施形態31乃至46のいずれか1つに記載の方法。
【0213】
[実施形態48]
前記第2の複数の画像における前記ウェルの1つ以上の物理的特性を検出することと、
検出された前記1つ以上の物理的特性に基づいて前記第2の基準座標空間を生成することと、
をさらに含む、実施形態47に記載の方法。
【0214】
[実施形態49]
前記ウェルの前記1つ以上の物理的特性が、前記ウェルの形状、前記ウェルのエッジ、前記ウェルの位置を含む、実施形態48に記載の方法。
【0215】
[実施形態50]
前記第2の複数の画像中の2つ以上の画像が重複比によって互いにオフセットされ、前記第2の基準座標空間が前記重複比に基づいて生成される、実施形態47乃至49のいずれか1つに記載の方法。
【0216】
[実施形態51]
前記第2の基準座標空間は、前記第2のイメージャのメタデータに基づいて生成される、実施形態47乃至50のいずれか1つに記載の方法。
【0217】
[実施形態52]
1つ以上の画像内で捕捉された1つ以上のランドマークに基づいて前記第2の複数の画像から1つ以上のマーカー画像を選択することであって、前記第2のパッチは、前記第2の複数の画像の前記1つ以上のマーカー画像から取得される、選択することをさらに含む、実施形態47乃至51のいずれか1つに記載の方法。
【0218】
[実施形態53]
前記1つ以上のランドマークは、1つ以上の細胞、1つ以上のウェル境界、1つ以上のビーズ、1つ以上の核、又はそれらの任意の組合せを含む、実施形態52に記載の方法。
【0219】
[実施形態54]
前記第1のパッチが第1の画像の中心をカバーする、実施形態31乃至53のいずれか1つに記載の方法。
【0220】
[実施形態55]
前記第2のパッチが第2の画像の中心をカバーする、実施形態31乃至54のいずれか1つに記載の方法。
【0221】
[実施形態56]
前記第1のパッチの少なくとも一部分及び前記第2のパッチの少なくとも1つのパッチが同じ被写体に対応する、実施形態31乃至55のいずれか1つに記載の方法。
【0222】
[実施形態57]
前記変換パラメータが、並進パラメータ、スケーリングパラメータ、及び回転パラメータのうちの1つ以上を含む、実施形態31乃至56のいずれか1つに記載の方法。
【0223】
[実施形態58]
a)異なる遺伝的背景の細胞の2つ以上の集団を、固有の核酸バーコードシーケンスそれぞれが異なる細胞の集団に対応する2つ以上の固有の核酸バーコードシーケンスで標識することと、
b)細胞の単一の混合集団を得るために、前記細胞の2つ以上の集団を組み合わせることと、
c)前記細胞に対するin situ単細胞シーケンシングを行うことと、
d)前記混合集団における前記細胞の、既知の表現型を分析すること又は新しい表現型を同定することと、
を含む、異なる遺伝的背景からの細胞のプール化スクリーニングのアッセイから、第1の画像及び第2の画像が得られた、実施形態31乃至57のいずれか1つに記載の方法。
【0224】
[実施形態59]
画像を受け取り分類結果を出力するように構成された分類器を利用することをさらに含む、実施形態1乃至58のいずれか1つに記載の方法。
【0225】
[実施形態60]
前記分類器が複数の層を含む、実施形態59に記載の方法。
【0226】
[実施形態61]
前記分類器が畳み込みニューラルネットワークである、実施形態59又は60に記載の方法。
【0227】
[実施形態62]
前記分類器がDenseNet分類器である、実施形態59乃至61のいずれか1つに記載の方法。
【0228】
[実施形態63]
前記分類結果が、前記画像内で捕捉された単一細胞それぞれの遺伝的背景に基づく分類である、実施形態59乃至62のいずれか1つに記載の方法。
【0229】
[実施形態64]
前記画像の埋め込みを生成することをさらに含む、実施形態59乃至63のいずれか1つに記載の方法。
【0230】
[実施形態65]
前記埋め込みは、前記分類器の最後の層の前の活性化出力層から生成される、実施形態64に記載の方法。
【0231】
[実施形態66]
前記埋め込みは、線形次元削減法を使用して次元が削減される、実施形態64又は65に記載の方法。
【0232】
[実施形態67]
前記埋め込みの可視化のための1つ以上のUMAP(Uniform Manifold Approximation and Projection for Dimension Reduction)プロットを得るために、前記埋め込みはUMAPアルゴリズムを使用して次元が削減される、実施形態64乃至66のいずれか1つに記載の方法。
【0233】
[実施形態68]
前記埋め込みの少なくとも一部に基づいて処理を評価することをさらに含む、実施形態64乃至67のいずれか1つに記載の方法。
【0234】
[実施形態69]
1つ以上のUMAPプロットの少なくとも一部に基づいて処理を評価することをさらに含む、実施形態67又は68に記載の方法。
【国際調査報告】