(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-12
(54)【発明の名称】細胞活性機械学習
(51)【国際特許分類】
C12Q 1/02 20060101AFI20240405BHJP
C12N 5/0793 20100101ALN20240405BHJP
C12M 1/34 20060101ALN20240405BHJP
C12M 1/42 20060101ALN20240405BHJP
【FI】
C12Q1/02
C12N5/0793
C12M1/34 B
C12M1/42
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023568034
(86)(22)【出願日】2022-05-03
(85)【翻訳文提出日】2023-12-28
(86)【国際出願番号】 US2022027473
(87)【国際公開番号】W WO2022235671
(87)【国際公開日】2022-11-10
(32)【優先日】2021-05-04
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】516056971
【氏名又は名称】キュー-ステート バイオサイエンシーズ, インコーポレイテッド
【氏名又は名称原語表記】Q-State Biosciences, Inc.
【住所又は居所原語表記】179 Sidney Street, Cambridge, Massachusetts 02139 United States
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ライアン, スティーブン
(72)【発明者】
【氏名】デラニー-ブッシュ, ナサニエル
(72)【発明者】
【氏名】デンプシー, グラハム ティー.
【テーマコード(参考)】
4B029
4B063
4B065
【Fターム(参考)】
4B029AA07
4B029BB11
4B029CC02
4B029FA03
4B029FA04
4B063QA01
4B063QA18
4B063QA19
4B063QQ08
4B063QR90
4B063QS40
4B063QX04
4B065AA93X
4B065AC20
4B065BB40
4B065CA46
(57)【要約】
本発明は、神経障害および潜在的な治療的処置を特徴付けるために使用されることができる、測定された神経活性内の特徴を識別するために光遺伝学的アッセイを使用する方法およびシステムを提供する。本発明は、電気的に励起された細胞から記録された活動電位内の特徴またはパラメータを識別するために、光遺伝学的アッセイおよび機械学習システムを使用することを提供する。識別された特徴は、健康な細胞および疾患の細胞の両方の機能的表現型またはフィンガプリントを特徴付けると共に、表現型に影響を及ぼす薬物を識別するために使用されることができる。
【特許請求の範囲】
【請求項1】
細胞活性を特徴付ける方法であって、
1つまたは複数の電気的活性細胞の活性の記録を行うステップと、
既知の病状を有する細胞および前記病状を有さない細胞からの記録を含む、訓練データに対して訓練された機械学習システムに前記記録を提示するステップと、
前記機械学習システムによって、前記電気的活性細胞の表現型を報告するステップと、
を含む、方法。
【請求項2】
前記記録は、前記電気的活性細胞によって示された1つまたは複数の活動電位を含む、請求項1に記載の方法。
【請求項3】
前記機械学習システムは、前記病状を有するとしてまたは前記病状を有さないとして、前記電気的活性細胞の前記表現型を報告する、請求項1に記載の方法。
【請求項4】
試験化合物に前記電気的活性細胞を曝露するステップを更に含む、請求項1に記載の方法。
【請求項5】
前記機械学習システムは、試験化合物への曝露により前記病状を有することから前記病状を有さないことに戻るとして、前記電気的活性細胞の前記表現型を報告する、請求項1に記載の方法。
【請求項6】
前記記録は、CMOS撮像センサを有する顕微鏡を通じて、前記電気的活性細胞を撮像することによって作られたデジタル動画である、請求項1に記載の方法。
【請求項7】
前記機械学習システムは、メモリに結合されたプロセッサを含むコンピュータシステムに存在し、前記記録は、前記メモリに保存される、請求項1に記載の方法。
【請求項8】
前記記録は、活動電位を捕捉し、前記方法は、前記活動電位からの複数の特徴を測定および記憶するステップを更に含む、請求項1に記載の方法。
【請求項9】
前記記録からの特徴を測定するステップと、前記機械学習システムに前記特徴を提示するステップとを更に含み、必要に応じて、前記特徴は、スパイク率、スパイク高さ、スパイク幅、過分極化後の深度、発症タイミング、発火の中止のタイミング、スパイク間間隔、一定の刺激にわたる適合、スパイク波形の第1の派生物、およびスパイク波形の第2の派生物のうちの1つまたは複数を含む、請求項1に記載の方法。
【請求項10】
前記機械学習システムに提示される特徴の数を制限するバジェットラッパの制御の下で前記機械学習システムを動作させるステップを更に含む、請求項1に記載の方法。
【請求項11】
前記記録から100よりも多い特徴を抽出するステップを更に含み、更に、バジェットラッパは、前記機械学習システムに、約20よりも少ない前記特徴を提示する、請求項1に記載の方法。
【請求項12】
前記機械学習システムは、ニューラルネットワークを含む、請求項1に記載の方法。
【請求項13】
前記ニューラルネットワークは表現学習によって動作するオートエンコーダニューラルネットワークである、請求項12に記載の方法。
【請求項14】
前記オートエンコーダは、既知の効能を有する既知の化合物に曝露された試料および前記既知の化合物に曝露されていない対照試料内の、前記既知の病状を有する細胞および前記病状を有さない前記細胞からの前記記録を含む、手動で選択された訓練データを使用して訓練されている、請求項13に記載の方法。
【請求項15】
前記機械学習システムは、階層型ブートストラッピングアルゴリズムを使用して訓練された、請求項1に記載の方法。
【請求項16】
前記階層型ブートストラッピングアルゴリズムは、任意の数のレベルの入れ子データから回帰的にサンプリングする、請求項15に記載の方法。
【請求項17】
前記階層型ブートストラッピングアルゴリズムは、前記訓練データ内の活動電位から測定された特徴からの置き換えにより再サンプリングすることによって、増補された試料を作成し、前記機械学習システムは、前記増補された試料を使用して訓練される、請求項15に記載の方法。
【請求項18】
未処理動画データを圧縮する方法であって、
電気的活性細胞のデジタルビデオデータを取得するステップと、
ブロックごとに、ブロックワイズ方式において前記ビデオデータを処理し、そのブロックの共分散マトリックスおよび固有値分解を計算し、前記固有値分解を切り詰め、いくつかの主成分のみを維持し、それによって、前記ブロックからのノイズを破棄するステップと、
前記維持された主成分のみを使用して、圧縮されたビデオとして前記ビデオをメモリに書き込むステップと、
を含む、方法。
【請求項19】
前記ブロックは、平均動画フレームの局所的強度最大値に基づいて、領域に基づくタイリングを使用して前記データを区画化することによって選択される、請求項18に記載の方法。
【請求項20】
前記デジタルビデオデータは、細胞電気活性の光学リポータを発現する前記電気的活性細胞から取得される、請求項18に記載の方法。
【請求項21】
前記細胞は、神経であり、前記デジタルビデオデータは、前記神経の軸索に沿って伝播する活動電位を示す、請求項18に記載の方法。
【請求項22】
前記圧縮されたビデオは、前記神経の前記軸索に沿って伝播する前記活動電位を表示するように取り出されることができ、および再生されることができる、請求項21に記載の方法。
【請求項23】
機械学習システムによって、前記活動電位からの特徴を測定するステップを更に含み、前記機械学習システムは、前記デジタルビデオデータまたは前記圧縮されたビデオから測定するかどうかに関わらず、前記測定された特徴についての同一の値を取得する、請求項21に記載の方法。
【請求項24】
前記特徴は、電圧、蛍光対時間、スパイク高さ、スパイク幅、形状変化、傾き、周波数、およびタイミングのうちの1つまたは複数を含む、請求項23に記載の方法。
【請求項25】
前記圧縮されたビデオは、前記デジタルビデオデータに対して必要とされるディスク空間の約10%未満を占有する、請求項18に記載の方法。
【請求項26】
前記取得するステップは、顕微鏡を通じて、およびデジタル撮像センサを使用して、生きている神経の発火を撮影することを含む、請求項18に記載の方法。
【請求項27】
前記デジタル撮像センサは、前記処理するステップを実行するコンピュータに接続され、更に、前記圧縮されたビデオは、インターネット接続を介してリモートコンピュータに書き込まれる、請求項26に記載の方法。
【請求項28】
前記デジタル撮像センサは、1日に50テラバイトを上回る前記デジタルビデオデータを生み出す、請求項26に記載の方法。
【請求項29】
前記処理するステップは、少なくとも約20分の1に前記デジタルビデオデータを圧縮する、請求項28に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は概して、治療的化合物を特徴付ける方法およびシステムに関する。
【背景技術】
【0002】
背景
神経学的障害の原因、活動の機構、および潜在的な処置を理解するために、有意なリソースがささげられてきた。神経学的障害を引き起こす機構を理解することに費やされた時間およびリソースに関わらず、多くの症候群の機能的病因は、未知のままである。これは、神経学的障害を処置することへの潜在的な治療薬を効率的にスクリーニングすることに妨害をもたらす。
【0003】
神経科学薬の発見における進歩が制限されることは、一次的治療的エンドポイントを予測する出力により変換可能なモデルシステムが不足していること、およびスクリーニング技術が不足していることの両方に部分的に起因する。例えば、神経科学薬の発見において動物モデルに依存することは、強いモデル検証が不足していることに部分的に起因して、いくつかの臨床的な失望につながってきた。齧歯類モデルは、歴史的に、人類における効能の不良な予測子であった。加えて、動物モデルは典型的には、化合物ライブラリをスクリーニングするために必要なスループットを許容しない。
【0004】
おそらくはより根本的に、既存の神経学的モデルおよびスクリーニングモダリティは、いくつかの有形の定義された測定にまたがる比較を可能にする方式において、神経障害および薬物反応を効率的に特徴付ける方法を不足している。むしろ、ほとんどのモデルおよびスクリーニングモダリティは、特定の障害または薬物を中心にして設計されるべきであり、それらの出力は、特定の実験を超えて関連する最小の情報を提供する。
【発明の概要】
【課題を解決するための手段】
【0005】
要旨
本発明は、電気的に励起された細胞から記録された活動電位内の特徴またはパラメータを識別するために、光遺伝学的アッセイおよび機械学習システムを使用することを提供する。識別された特徴は、健康な細胞および疾患の細胞の両方の機能的表現型またはフィンガプリントを特徴付けると共に、表現型に影響を及ぼす薬物を識別するために使用されることができる。
【0006】
重要なことに、本発明の方法は、化合物の治療的効能に相関付ける結果を生み出すことによって、いずれかの疾患に対する薬物発見のために使用され得る。これは、本明細書で開示されるような新規の機械学習システムの性質によって達成される。特に、機械学習システムは、いずれかの疾患に対する手動で選択された遺伝子標的、および標的を調整する化合物の手動で選択されたファミリを使用して訓練され得る。このようにして、表現型は、いずれかの疾患に対する薬物発見を可能にする、機械学習システムが訓練された全ての疾患に対して発達する。よって、本発明の方法は、いずれかの疾患に対する対照に対して化合物効果および疾患表現型をフィンガプリントすることを有効にする。
【0007】
本発明の方法およびシステムは、神経活動電位を示す検出可能なシグナルを提供するために、光遺伝学的アッセイを使用する。それらのシグナルは、例えば、ビデオとして、経時的に記録される。それらのシグナル内で、数百の活動電位の一意な特徴またはパラメータがある。本発明は、それらの特徴/パラメータの統計的に有意なサブセットを識別、分析、および選択するために、機械学習システムおよび工程を使用する。特徴のサブセットは、機能的表現型を作成するために使用される。機能的表現型は、健康な細胞または或る神経障害の細胞を示し得る。機能的表現型は更にこのようであり得、本発明は、神経病状と関連付けられた活動電位の特徴を識別する。
【0008】
それらが導出される未処理ビデオシグナルと比較するとき、抽出された活動電位特徴は、複雑度が大いに低減する。結果として生じる活動電位データは、有形の測定を提供し、有形の測定は、前例のない横幅、深度、および粒度を有する細胞挙動に対する障害および治療薬の効果を特徴付ける。
【0009】
更に、未処理ビデオから活動電位に(例えば、電圧トレースとして)、活動電位特徴およびパターンに、最終的には機能的表現型に光学シグナルを低減させることは、本発明のシステムおよび方法が、細胞挙動の有益な多次元測定を導出するために必要とされるデータフットプリントを著しく低減させることを可能にする。以下で説明されるデータ圧縮方法と共に、これは、細胞挙動が効率的にデータベースに記憶されおよびデータベースにおいて操作されることを可能にし、例えば、細胞タイプ、細胞状態、疾患表現型、および薬理学的反応の高スループット分析を可能にする。その上、それらの表現型は、比較のための、疾患モデルなどのモデルとしてデータベースに記憶されることができる。これは、労働および試薬集中スクリーニングおよび実験を再現する必要性を除去する。
【0010】
本発明はまた、それらの機能的表現型を作成するときに生成されたデータを処理およびパースするための方法およびシステムを含む。本発明者らは、8時間の期間の間に活動電位シグナルを記録する単一の機器が、50テラバイトを上回る圧縮されていない未処理データを生成することを発見した。本発明の方法は、20倍~200倍の係数によって、データを圧縮する不可逆圧縮スキームを使用する間の困難を克服し得る。その上、圧縮の不可逆的性質にも関わらず、重要なデータの損失が少なくまたは損失がない。実際に、或る例では、データ内の望ましくないアーチファクトのみが圧縮の間に損失した。
【0011】
機械学習システムを使用することによって、本発明のシステムおよび方法は、健康な細胞と比較するとき、活動電位特徴内の顕著な差異を明らかにする、疾患細胞に対する機能的表現型を生成する。それらの差異は、疾患細胞の挙動を特徴付け、診断目的のために試験細胞への直接の比較として使用されることができる。それらの差異を神経病状と相関付けることは(関連する症状学、他の診断試験などを介して)、機能的表現型が診断基準として使用されることを可能にする。その上、特徴内の識別された差異は、例えば、後続の薬物スクリーニングを行うために、またはいずれかの適切な情報的目的のために使用される有益な標的を提供する。本発明のシステムおよび方法は、同様に、既知の治療薬または潜在的な治療薬を与薬することによって引き起こされた細胞挙動における変化を明らかにする機能的表現型を作成することができる。有利なことに、このコアとなる概念は、例えば、障害に対する潜在的な治療的処置を識別し、薬物候補の潜在的な副作用を予測し、複数の化合物を使用して現存の処置と比較して副作用が低減しもしくは副作用がない候補処置、相乗効果のある処置、または組合せ処置を識別し、更には、潜在的な第2の処置使用のための既知の化合物を迅速にスクリーニングするために拡大することができる。
【0012】
或る態様では、開示は、細胞活性を特徴付ける方法を提供する。方法は、1つまたは複数の電気的活性細胞の活性の記録を行うステップと、既知の病状を有する細胞および病状を有さない細胞からの記録を含む、訓練データに対して訓練された機械学習システムに記録を提示するステップと、機械学習システムによって、電気的活性細胞の表現型を報告するステップとを含む。記録は、電気的活性細胞によって示される1つまたは複数の活動電位を含み得る。機械学習システムは、例えば、病状を有するとして、または病状を有さないとして、電気的活性細胞の表現型を報告する。方法は、電気的活性細胞を試験化合物に曝露するステップを含み得る。機械学習システムは、試験化合物への曝露と共に、病状を有することから病状を有さないことに反転するとして、電気的活性細胞の表現型を報告し得る。好ましくは、記録は、CMOS撮像センサを有する顕微鏡を通じて電気的活性細胞を撮像することによって作られたデジタル動画である。機械学習システムは、メモリに結合されたプロセッサを含むコンピュータシステムに存在し、記録はメモリに保存される。
【0013】
いくつかの実施形態では、記録は、活動電位を捕捉し、方法は更に、活動電位からの複数の特徴を測定および記憶するステップを含む。方法は、記録からの特徴を測定するステップと、機械学習システムに特徴を提示するステップとを含み得、必要に応じて、特徴は、スパイク率、スパイク高さ、スパイク幅、過分極化後の深度、発症タイミング、発火の中止のタイミング、スパイク間間隔、一定の刺激にわたる適合、スパイク波形の第1の派生物、およびスパイク波形の第2の派生物のうちの1つまたは複数を含む。方法は、機械学習システムに提示される特徴の数を制限するバジェットラッパの制御の下で機械学習システムを動作させるステップを含み得る。方法は、記録から数百よりも多い特徴を抽出するステップを含み得、バジェットラッパは、機械学習システムに、約数十よりも少ない特徴を提示し得る。
【0014】
或る実施形態では、機械学習システムは、ニューラルネットワークを含む。ニューラルネットワークは、表現学習によって動作するオートエンコーダニューラルネットワークであり得る。好ましくは、オートエンコーダは、既知の効能を有する既知の化合物に曝露された試料および既知の化合物に曝露されていない対照試料内の、既知の病状を有する細胞および病状を有さない細胞からの記録を含む手動で選択された訓練データを使用して訓練されている。
【0015】
いくつかの実施形態は、訓練データセットに対する増補されたデータを作成するために、ブートストラッピングアルゴリズムを使用する。いくつかの深層学習方法が訓練データに対して過適合する傾向があることを理由に、実施形態では、本発明の方法は、機械学習システムが過適合する傾向があることを回避するために有益な、増補された訓練データを提供するためにブートストラッピングアルゴリズムを使用する。従来技術のデータ増補方法は、類似の合成データを生成するために、既存のデータにノイズを注入し、またはデータセットの特性をパラメータ化することによって、過適合に対処してきた。対照的に、本発明の方法は、合成データに対するいずれの要件も有さない増補されたデータを作成するために、訓練データ内から再サンプリングするために(例えば、置き換えによる)ブートストラッピングを使用する。
【0016】
他の態様は、未処理動画データを圧縮する方法を提供する。方法は、電気的活性細胞のデジタルビデオデータを取得するステップと、ブロックごとにブロックワイズ方式においてビデオデータを処理し、そのブロックの共分散マトリックスおよび固有値分解を計算し、固有値分解を切り詰め、いくつかの主成分のみを維持し、それによって、ブロックからノイズを破棄するステップとを含む。ビデオは、維持された主成分のみを使用して圧縮されたビデオとしてメモリに書き込まれる。
【0017】
ブロックは、平均動画フレームの局所的強度最大値に基づいて、領域に基づくタイリングを使用してデータを区画化することによって選択され得る。デジタルビデオデータは、細胞電気活性の光学リポータを発現する電気的活性細胞から取得され得る。或る実施形態では、細胞は神経であり、デジタルビデオデータは、神経の軸索に沿って伝播する活動電位を示す。好ましくは、圧縮されたビデオは、神経の軸索に沿って伝播する活動電位を表示するように取り出されることができ、および再生されることができる。
【0018】
方法は、機械学習システムによって、活動電位からの特徴を測定するステップを含み得、機械学習システムは、デジタルビデオデータまたは圧縮されたビデオから測定するかどうかに関わらず、測定された特徴に対する同一の値を取得する。
【0019】
好ましい実施形態では、圧縮されたビデオは、デジタルビデオデータに対して必要とされる約10パーセント未満のディスク空間を占有する。取得するステップは、顕微鏡を通じて、およびデジタル撮像センサを使用して、生きている神経の発火を撮影することを含み得る。好ましくは、デジタル撮像センサは、処理するステップを実行するコンピュータに接続され、圧縮されたビデオは、インターネット接続を介してリモートコンピュータに書き込まれ得る。いくつかの実施形態では、デジタル撮像センサは、1日に50テラバイトを上回るデジタルビデオデータを生み出す。処理するステップは、少なくとも約20分の1にデジタルビデオデータを圧縮し得る。
【0020】
他の態様では、本発明は、活動電位から測定された特徴に基づいて細胞挙動を特徴付けるために、機械学習を使用する方法を提供する。神経表現型を特徴付ける例示的な方法は、既知の病状を有する刺激された神経細胞および病状を有さない刺激された神経細胞の活動電位を記録するステップを含む。病状と関連付けられた先述の活動電位の特徴は、機械学習システムを訓練するように識別および使用される。機械学習システムは次いで、病状を特徴付けるように、活動電位特徴のサブセットを使用して機能的表現型を生成する。機械学習システムは、表現型の所望の次元または情報利用に対する制約の対象であり得、機械学習システムは、それらの制約の下で最適な表現型表現を探索し得る。これは、表現型の次元を低減させ、それは、そのデータサイズを低減させることができ、表現型を有意な特徴に制限することができ、細胞挙動に対するアプローチ可能な測定を提供することができる。本発明の例示的な方法では、機械学習システムは、複数の特徴を学習および/または識別する。そのような方法では、バジェットラッパは、機能的表現型を生成するように、機械学習システムへの入力を、例えば、約12個よりも少ない特徴に制限する。本発明の例示的な方法では、機械学習システムは、データ(数十から数百の特徴であり得る)からの合理的なバジェットを推測し、次いで、バジェット制約を仮定して、疾患の細胞からの健康であると最良に判別する特徴の最適な組合せを発見する。最適な組合せは、いずれかの単一の特徴、複数の特徴、または全ての利用可能な特徴を含み得る。それらの状態の下で機械学習モデルによって選択された特徴は次いで、独立した試料における統計的有意性に対して評価される。
【0021】
機械学習システムは、病状を処置するための標的として、学習された活動電位特徴のうちの1つまたは複数を識別する出力を提供するために、特定の病状に対して生成された機能的表現型を使用し得る。
【0022】
本発明はまた、既知の病状を有する神経細胞を取得するステップ、および細胞に膜電位の光学リポータを発現させるステップを含む、細胞病状を判断する例示的な方法を提供する。次いで、方法は、それらが活動電位を示すように、マルチウエルプレートのウエル内の神経細胞を刺激するステップを含む。刺激された活動電位に反応した光学リポータからの光学シグナルが記録される。活動電位特徴は、記録された光学シグナルから識別される。
【0023】
本発明はまた、機能的表現型を使用して病状を診断する方法を提供する。例示的な方法では、試験神経細胞からの活動電位特徴は、試験細胞に対する機能的表現型を生成するように、機械学習システムによって識別または使用される。試験神経細胞は、対象からの試料から取得および導出されることができる。方法は次いで、試験神経細胞表現型が病状を有する神経細胞の表現型に合致する程度に基づいて、試験神経細胞が病状を有するかどうかを判定するステップを含む。方法は次いで、機能的表現型に対する次元が低減したスコアであることができる、診断を提供することができる。
【0024】
本発明はまた、機能的表現型を生成するように、機械学習システムを使用して神経病状に対する薬物の効能を判断する方法およびシステムを提供する。効能を判断する例示的な方法は、既知の治療的化合物に曝露された神経の活動電位を測定するステップと、治療的効能と関連付けられた活動電位の特徴を識別するステップとを含む。機械学習システムは、それが試験化合物の治療的効能を判断することができるように、それらの特徴を使用して訓練される。
【0025】
機械学習システムは、バジェットラッパの制御の下で動作し得る。例えば、薬物効能を判断するとき、機械学習システムは、バジェットラッパが特徴のサブセットを選択する複数の特徴に曝露され得る。
【0026】
薬物効能を判断する例示的な方法では、測定された活動電位は、特定の病状の神経からであり、機械学習システムは、病状を処置するための標的として、学習された活動電位特徴を識別する出力を提供する。
【0027】
開示の或る方法では、機能的表現型は、例えば、階層型ブートストラッピングを使用して検証される。そのような方法は、複数のin vitroアッセイ内のクラス内の相関付けの効果を検出または回避するように、サンプリング階層の各々の関連するレベルにおいて訓練データから再サンプリングするステップを含むことができる。
【0028】
記録から識別された例示的な活動電位特徴は、例えば、蛍光、スパイク高さ、幅、形状変化、傾き、周波数、タイミング、屈折、バースティング、同調性、および刺激に対する関係のうちの1つまたは複数を含む。
【0029】
開示の実施形態は、神経撮像動画(例えば、カルシウム撮像または光遺伝学的動画)に対して特に有用な動画を圧縮する圧縮アルゴリズムを提供する。いくつかの実施形態は、不可逆アルゴリズムを使用して記録されたシグナルを圧縮する。不可逆アルゴリズムは、パッチワイズ主成分分析(PCA:principal component analysis)などのPCAを含み得る。例示的な方法では、不可逆アルゴリズムは、少なくとも20倍の係数によって記録されたシグナルを圧縮する。有利なことに、不可逆アルゴリズムは、記録されたシグナルから望ましくないノイズを主に損失させる。
【0030】
本発明の例示的なシステムおよび方法では、機械学習システムは、光学シグナルを各々のウエル内の或る細胞と関連付けるように、プレートの各々のウエル内の空間時間的に相関付けられた光学シグナルを識別する。
【0031】
或る態様では、本発明は、薬物発見のための方法を提供する。方法は、化合物に電気的励起可能細胞を曝露するステップと、細胞の電気活性を測定するステップと、細胞の活動電位の特徴を測定するステップと、入力され測定された特徴に基づいて、化合物の治療的効能を判断するために、機械学習システムを使用するステップとを含む。
【0032】
述べられたように、活動電位特徴は、単一の細胞に対して識別され得、スパイク率、スパイク高さ、スパイク幅、過分極化後の深度、スパイク発症のタイミング、発火の中止のタイミング、第1のスパイクのスパイク間間隔、一定の刺激にわたる適合の程度、スパイク波形の第1の派生物、およびスパイク波形の第2の派生物のうちの1つまたは複数を含み得る。機械学習システムは、化合物の治療的効能と関連付けられた電気活性の特徴を識別するように訓練される。
【0033】
識別された特徴が測定の間の非線形関係を有する表形式データの出力であり得ることを理由に、機械学習システムは、上記説明されたようなオートエンコーダニューラルネットワークを含み得る。オートエンコーダは必然的に、生物学的表現に未処理測定をマッピングするように構成された表現学習アルゴリズムであり得る。重要なことに、オートエンコーダは、手動で選択された遺伝子標的および標的を調整する手動で選択された化合物を使用して訓練され得る。オートエンコーダは更に、オートエンコーダの深度、幅、非線形性、バッチサイズ、学習率、モーメント、勾配クリッピング、および訓練サイクルを最適化することによって、ハイパーパラメータチューニングを使用して訓練され得る。それらのチューニングされたハイパーパラメータは、モデル性能および有用性に対する大きな影響を有する。
【0034】
実施形態では、本発明の方法は、化合物内の活性を検出するステップを提供する。活性の兆候を示す化合物をどの生物学的試料が制約するかを知ることが貴重である。例えば、スクリーニングにおいて生物学的に活性の化合物を発見すること、または検出可能な活性による最低の投与を発見することである。
【図面の簡単な説明】
【0035】
【
図1】
図1は、膜電位の光学リポータから測定された電圧トレースを提供する。
【0036】
【
図2】
図2は、光学リポータを使用して識別されることができる特徴を示す。
【0037】
【
図3】
図3は、野生型(WT:wildtype)神経およびノックアウト(KO:knockout)神経からの電圧トレースを比較する。
【0038】
【
図4】
図4は、対照細胞(例えば、WT)および疾患の細胞内の特徴のレーダプロットを提供する。
【0039】
【
図5】
図5は、活動電位特徴のレーダプロットを提供する。
【0040】
【
図6】
図6は、疾患細胞のインシリコモデルからの機能的表現型を示す。
【0041】
【
図7】
図7は、機能的表現型を表す2つの例示的なレーダプロットを提供する。
【0042】
【
図8】
図8は、下位次元空間にマッピングされた特徴を示す。
【0043】
【
図9】
図9は、2つの化合物に対する表現型反転(x軸)および副作用(y軸)を示す。
【0044】
【
図10】
図10は、活動電位から測定された、重要度によってランク付けられた特徴を示す。
【0045】
【
図11】
図11は、機械学習システムモデルに対するまばらさを提供することを示す。
【0046】
【0047】
【
図13】
図13は、試料に向かってビームをガイドするプリズムを示す。
【0048】
【
図14】
図14は、顕微鏡に対する光学的光パターニングシステムを示す。
【0049】
【
図15】
図15は、自動化分析によって識別されたhiPSC由来神経に対するオーバレイを示す。
【0050】
【
図16】
図16は、神経の挙動における根底にある変動を証明する。
【0051】
【
図17】
図17は、各々のポイントが識別された活動電位であるラスタプロットを提供する。
【0052】
【
図18】
図18は、細胞に対して平均化されたスパイク率(発火頻度)を提供する。
【0053】
【
図19】
図19は、活動電位から抽出されたスパイク形状パラメータを提供する。
【0054】
【
図20】
図20は、活動電位から抽出されたスパイクタイミングパラメータを提供する。
【0055】
【0056】
【
図22】
図22は、ML-213によって引き起こされた神経励起性における明確な低減を示す。
【0057】
【
図23】
図23は、機械学習システムによって生成された機能的表現型を示す。
【0058】
【0059】
【
図25】
図25は、濃度が増大するにつれてのKO細胞挙動に対する増大する効果を有する。
【0060】
【
図26】
図26は、神経スパイクにおける薬物誘発変化を示す。
【0061】
【
図27】
図27は、化合物の様々な濃度に対する濃度反応曲線を提供する。
【0062】
【0063】
【
図29】
図29は、各々のカラムに記録されたスパイクを示すラスタプロットを示す。
【0064】
【0065】
【
図31】
図31は、スパイクの数を示すヒートマップを提供する。
【0066】
【0067】
【
図33】
図33は、DRG神経に対して記録されたスパイクの平均数のプロットを提供する。
【0068】
【
図34】
図34は、ノックアウト細胞内のタンパク質の除去を示す。
【0069】
【
図35】
図35は、複数の細胞株にまたがって記録された電圧トレースからのスパイクを提供する。
【0070】
【0071】
【
図37】
図37は、機能的表現型を有する多次元レーダプロットを提供する。
【0072】
【
図38】
図38は、更なる次元低減を表す疾患スコアを提供する。
【0073】
【
図39】
図39は、スパイクパラメータおよびスパイク率を提供する。
【0074】
【
図40】
図40は、神経のサブセット内で発現されたCheRiffを示す。
【0075】
【
図41】
図41は、顕微鏡を使用して取得された蛍光画像を提供する。
【0076】
【
図42】
図42は、シナプス後電位(PSP:postsynapticpotential)を示す蛍光トレースを示す。
【0077】
【
図43】
図43は、アゴニストに反応した単一の細胞PSPの調節を示す。
【0078】
【
図44】
図44は、対照薬理学に対する平均PSPトレースを示す。
【0079】
【
図45】
図45は、平均薬物前反応に正規化された薬物誘発変化をプロットする。
【0080】
【
図46】
図46は、高スループットスクリーニングのための例示的な方法の図である。
【0081】
【
図47】
図47は、電気的活性細胞の記録を行うコンピュータシステムを示す。
【0082】
【発明を実施するための形態】
【0083】
詳細な説明
本発明は、機能的表現型によって神経障害を特徴付けるために使用されることができる、電気的に励起された細胞から記録された活動電位における特徴またはパラメータを識別するために、光遺伝学的アッセイおよび機械学習を使用する方法およびシステムを提供する。好ましい実施形態では、機械学習システムは、例えば、既知の病状を有する細胞および健康な細胞と関連付けられた活動電位測定のデータセットを使用して訓練される。機械学習システムは、疾患の細胞、或る化合物または環境的状況に曝露された細胞、および異なる細胞タイプと比較して、健康な/対照細胞内の細胞挙動における差異を明らかにする機能的表現型を生成するように、活動電位の特徴を識別し、それらの特徴のサブセットを使用する。
【0084】
光遺伝学では、生きている細胞内の或るイベントを制御および観察するために光が使用される。例えば、蛍光電圧リポータなどの蛍光エンコーディング遺伝子が細胞の中に導入される。このリポータは、例えば、膜電位における変化に反応して光学シグナルを生成し、それによって、光学リポータとして機能する、膜貫通タンパク質であり得る。或る波長において刺激光により励起されるとき、リポータが活発化され、異なる波長の放出光を生み出し、異なる波長の放出光は、膜電位における変化を示す。試料における細胞も、光依存性イオンチャネルなどの光遺伝学アクチュエータを含み得る。そのようなチャネルは、活動電位またはシナプス後電位の生成を含む、細胞活性における変化につながる、特定の波長の刺激光に反応する。本発明の方法およびシステムは、細胞活性の追加のリポータ、およびそれらを作動させるための関連するシステムを使用し得る。例えば、タンパク質は、細胞内カルシウム、細胞内代謝物、または第2のメッセンジャレベルにおける変化を報告する。
【0085】
例示的な方法では、遺伝子編集技術(例えば、転写活性化因子様エフェクタヌクレアーゼ(TALEN:transcription activator-like effector nucleases)、CRISPR/Casシステム、ジンクフィンガドメインの使用)は、同質遺伝子型であるが、目的の変異体に対する細胞を作成するために使用される。細胞は、神経または心筋細胞などの電気的に励起可能な細胞に転化される。細胞は、特定の神経サブタイプ(例えば、運動神経)に転化され得る。細胞は、細胞電気活性の光学リポータを発現するように引き起こされ、光学リポータは、細胞が活動電位を示すとき、細胞膜電位における変化に反応して蛍光シグナルを放出する。細胞はまた、細胞活性の光学アクチュエータを発現するように引き起こされ得、光学アクチュエータは、光によって活性化されると、細胞内の活性を引き起こす。
【0086】
細胞は、例えば、光学的作動、シナプス作動、化学的作動、または電気的作動を通じて刺激される。刺激に反応して、細胞は、活動電位を示し得る。本明細書で説明される顕微鏡法および分析方法を使用して、刺激に対する細胞の反応は、光学リポータからの蛍光シグナルを使用して測定される。光学リポータからのシグナルは、刺激によって引き起こされた活動電位を示す、細胞の膜電位における変化に反応して変化する。
【0087】
検出可能な蛍光シグナルにおける特徴またはパラメータが次いで識別される。開示の或る方法およびシステムでは、機械学習およびシグナル処理を含む自動化アルゴリズムは、シグナルにおける活動電位の特徴またはパラメータを識別するために使用される。
【0088】
膜電位の光学リポータを発現する神経細胞に対して、測定が経時的に行われ得る。細胞は、細胞活性の光学アクチュエータを発現し得る。細胞に方向付けられた刺激光は、アクチュエータを作動させ、それは、膜電位における変化につながる。刺激光は、可変または傾斜強度または周波数のパルスにおいて細胞に伝達され得る。測定(電圧トレース)は、リポータによって生成された蛍光シグナルにおけるスパイクを示す。各々のスパイクは、刺激への曝露によって引き起こされた活動電位である。
【0089】
図1は、膜電位の光学リポータから測定された例示的な電圧トレースを提供する。本発明のシステムおよび方法では、活動電位特徴は、それらの電圧トレースから識別される。機械学習システムは、電圧トレースからの活動電位特徴を識別するように訓練および使用されることができる。
【0090】
図2は、光学リポータからのシグナルにおいて識別されることができる特徴またはパラメータの限定された実施例を提供する。示されるように、シグナルにおけるスパイクタイミング、形状、幅、周波数、および高さなどの特徴が識別されることができる。システムおよび方法は、光学リポータから測定されたシグナルにおける少なくとも300個の個別のおよび一意な活動電位特徴を識別し得る。それらの特徴は、特定の神経病状を特徴付ける表現型を生成するために、機械学習システムによって使用されることができる。
【0091】
システムは、表現型の所望の次元または情報利用に対して制約を課し得、それらの制約の下で最適な表現型表現を探索し得る。これは、表現型の次元を低減し、それは、そのデータサイズを低減させることができ、表現型を有意な特徴に制限することができ、細胞挙動に対するアプローチ可能な測定を提供することができる。本発明の例示的な方法では、システムは、複数の識別可能な特徴を測定および/または識別する。そのような方法では、バジェットラッパは、例えば、機能的表現型を生成するように特徴のサブセットのみを機械学習システムが受信することを必要とする。
【0092】
図3は、特定の神経障害をモデル化する野生型神経(「WT」)およびノックアウト突然変異(「KO」)を有する神経から記録された部分的電圧トレースの比較を示す。この例では、KO細胞は、WT細胞と比較するときの、電圧トレース上のスパイク幅が低減した活動電位特徴を示す。コンピュータシステムは、トレースからの数百またはそれよりも多い一意な活動電位特徴を測定し得る。好ましくは、細胞の挙動を特徴付ける機能的表現型を生成するように、それらの特徴のサブセットのみが機械学習システムへの入力として提供される。機械学習システムは、健康な細胞/対照細胞のいずれかと関連付けられた活動電位もしくは活動電位特徴、または特定の神経状態を有する細胞もしくは特定の神経状態をモデル化する細胞のデータセットを使用して訓練され得る。健康な細胞または野生型細胞と神経障害を有する細胞との間の識別された活動電位特徴における差異は、障害に対する機能的表現型を提供する。システムは、それらの特徴のサブセットを選択することができ、それらの特徴のサブセットから、それが機能的表現型を生成する。類似の比較は、例えば、個別の活動電位特徴のいずれかを使用して、および異なる治療的化合物、刺激、環境的状況などに曝露された細胞において行われることができる。
【0093】
図4は、本発明の機械学習システムによって生成された機能的表現型の表現を提供する、対照細胞(例えば、WT神経)および疾患の細胞(例えば、KO神経)内で測定および識別された活動電位特徴のレーダプロットを提供する。活動電位特徴ごとの値は、対照細胞の値に正規化される。識別された全ての活動電位特徴から、プロットされた活動電位特徴は、システムによって、この比較において予測となると判定される。プロットされた特徴の間の差異は、疾患に反応した神経の挙動を特徴付ける、疾患の機能的表現型を提供する。
【0094】
有利なことに、対照細胞の機能的表現型、活動電位測定、および活動電位特徴は、関係データベースに記憶されることができ、関係データベースでは、それらは、対照細胞のインシリコモデルを提供する。異なる刺激された細胞から測定された後続の活動電位は、機能的表現型を生成するように、機械学習システムを使用してこのインシリコモデルと比較されることができる。
【0095】
図5は、対照細胞505、例えば、野生型細胞集団に対して識別された活動電位特徴/パラメータ503の例示的なレーダプロット501を提供する。対照細胞に対するプロットは、合理的データベース上の対照のインシリコモデルからであり得る。プロット501はまた、第1の細胞集団507および異なる第2の細胞集団509に対する同一の特徴を提供する。測定された特徴の大きさは、対照細胞の測定された値に正規化される。第1の細胞集団および第2の細胞集団は、例えば、異なる神経障害を有する細胞である。対照のそれらと比較されるときの第1の細胞集団および第2の細胞集団の活動電位特徴におけるプロットされた差異は、第1の細胞集団および第2の細胞集団に対する機能的表現型を表す。
【0096】
示されるように、2つよりも多い表現型は、例えば、様々な細胞タイプ、化合物への反応、治療的効能および副作用、異なる神経状態などを比較するようにオーバレイされることができる。いくつかの用途では、同一の作製から異なる細胞集団を同時に測定することが貴重である。測定された細胞ごとに、一方の部分集団またはもう一方におけるメンバシップは、光パッチ記録の時に、または後に他の方法を使用して、のいずれかで判定されることができる。これは、本発明のシステムおよび方法が、例えば、単一の細胞作製における明確に異なる治療的に関連する部分集団を識別すること、集団を比較するときの細胞培養作製の間の特異な変動を除去すること、または野生型神経および疾患神経の異質な集団における複雑な相互作用を調査することを有効にする。本開示の活動電位、神経、光遺伝学、および他の特徴の光パッチ記録は、全ての目的のために参照によってその全てが組み込まれる、米国特許第9057734号、米国特許第9207237号、米国特許第9594075号、米国特許第9518103号、米国特許第10048275号、米国特許第10392426号、米国特許第10457715号、米国特許第10107796号、米国特許第10161937号、米国特許第10352945号、米国特許第10288863号、および米国特許第10613079号のいずれかの1つまたはいずれかの組合せに示される要素、方法、および特徴のいずれかを使用し得る。
【0097】
第1の507細胞および第2の509細胞は、例えば、異なる化合物、刺激、環境的状況などに曝露された細胞であり得る。対照細胞は、例えば、野生型細胞であり得、または野生型細胞から導出され得る。対照細胞はまた、神経障害などの特定の障害を有する細胞、障害をモデル化する細胞、特定の突然変異を有する細胞などであり得る。
【0098】
対照のように、第1の507細胞および第2の509細胞の機能的表現型、活動電位測定、および活動電位特徴は、インシリコモデルを提供するように、関係データベースに配置されることができる。
【0099】
図6は、関係データベースに配置され、診断目的のために使用され得る、疾患細胞のインシリコモデルからの機能的表現型を示す。細胞は、患者の細胞から取得または導出され得る。それらの細胞に対して生成された機能的表現型は、疾患細胞モデルの機能的表現型と比較されることができる。例えば、特定の閾値または疾患スコアによって定義されるように、表現型が十分に重なる場合、診断、または予防薬が提供されることができる。
【0100】
本発明はまた、機能的表現型を生成するように、機械学習システムを使用して神経病状に対する薬物の効能を判断する方法およびシステムを提供する。効能を判断する例示的な方法は、既知の治療的化合物に曝露された神経の活動電位を測定するステップと、治療的効能と関連付けられた活動電位の特徴を識別するステップとを含む。機械学習システムは、試験化合物の治療的効能をそれが判断することができるように、それらの特徴を使用して訓練される。
【0101】
図7は、機械学習システムを使用して活動電位特徴から生成された機能的表現型を表す2つの例示的なレーダプロットを提供する。「既知の治療薬」プロットは、刺激された野生型/対照細胞(例えば、光学リポータの神経発現)と、神経障害もしくは疾患を有する対象からの刺激された細胞または障害をモデル化する細胞と、既知の治療薬が存在するときに刺激された疾患/モデル細胞と、に対して機械学習システムによって識別された、測定された活動電位特徴のサブセットを含む。識別された活動電位特徴の大きさは、野生型/対照細胞に対して測定された値に正規化される。既知の治療薬が存在するときに刺激された細胞内で識別された一意な活動電位特徴は、治療薬の機能的表現型、すなわち、治療薬との接触によって引き起こされた細胞挙動における変化である。よって、機能的表現型は、特定の神経障害または疾患を処置する際の治療薬の効能と相関付けられることができる。治療的利点と相関付けられることができる野生型/対照細胞内のそれらの同一の特徴についての値により収束する、一意な活動電位特徴は、治療薬が存在するときに刺激された細胞内で識別され得る。野生型/対照のそれらから発散する特徴は、既知の治療薬の潜在的な副作用と相関付けられることができる。「推定上の治療的」のプロットは、刺激された野生型/対照細胞、障害をモデル化する神経障害または疾患または細胞を有する対象からの刺激された細胞、および推定上の治療薬が存在するときに刺激された疾患/モデル細胞に対する識別され測定された活動電位特徴/パラメータのサブセットを提供する。「推定上の治療的」のプロットは、刺激された野生型/対照細胞、障害をモデル化する神経障害または疾患または細胞を有する対象からの刺激された細胞、および推定上の治療薬が存在するときに刺激された疾患/モデル細胞に対する識別され測定された活動電位特徴/パラメータのサブセットを提供する。
【0102】
例示的な方法では、推定上の治療的化合物が存在するときに測定された活動電位特徴が細胞に対して識別された後、機械学習システムは、神経の疾患を処置する際に効果があるとして既知の1つまたは複数の化合物により処置された、刺激された細胞に存在する実質的に同一の特徴に特徴をマッピングすることによって、推定上の治療薬の治療的効能を判断する。いくつかの実施形態では、約300の特徴/パラメータが識別され、ベクトルとして約300次元空間にマッピングされる。よって、ベクトルは、測定された活動電位特徴によって示されるように、細胞に対する疾患表現型および/または化合物効果を記述する。
【0103】
図8は、下位次元空間にマッピングされた、識別された特徴の実施例を提供する。簡潔のために、マッピングは、2つの次元を示すにすぎず、2つの次元の各々は、一意な活動電位特徴または特徴の群、すなわち、機能的表現型に対応する。野生型/対照細胞および疾患/モデル細胞は、それらの共有された特徴についての発散値に基づいて、明確に異なる群に分割されることができる。ベクトル803は、疾患(または、モデル化された疾患)表現型の反転を表す。ベクトル807は、化合物が存在するときに疾患細胞を刺激することによって引き起こされた特徴/パラメータ、すなわち、化合物効果または薬物効果を表す。示されるように、ベクトル807は、2つの別個の成分ベクトル807aおよび807bに分離される。成分ベクトルは、表現型反転ベクトル803に沿って降下し、疾患/モデル表現型を反転させることに対する化合物が有する効果(治療的利点)を表す。成分ベクトル807bは、成分ベクトル807aに直交し、疾患/モデル表現型を反転させない化合物の効果を表し、よって、潜在的な副作用を表す。
【0104】
図9は、表現型反転(x軸)および副作用ベクトル(y軸)の大きさが2つの推定上の治療的化合物に対してプロットされた実施例を示す。
図8にあるように、野生型/対照細胞は、共有された活動電位特徴に基づいて共にクラスタ化される(903)。同様に、疾患/モデル細胞は共にクラスタ化される(905)。推定上の治療的化合物が存在するときに刺激された細胞に対する識別された活動電位特徴は、既知の治療的化合物が存在するときに刺激された細胞に対する実質的に同一の特徴909にマッピングされる(907)。このマップでは、識別された特徴の大きさは、推定上の治療薬または既知の治療薬のいずれかの濃度が増大することに反応して大きさにおいて増大する。
【0105】
よって、機械学習システムは、推定上の治療薬に対する機能的表現型が既知の治療的化合物の機能的表現型に合致する程度に基づいて、推定上の治療的化合物の治療的効能を予測する。推定上の治療薬に対するマッピングされ識別された特徴が既知の治療薬に対する実質的に同一の特徴から発散することを理由に、推定上の治療薬の予測された治療的効果が低くなる。更に、推定上の治療薬の識別された特徴と既知の治療薬の実質的に同一の特徴との間の発散は、推定上の治療薬が副作用を引き起こす可能性を示し得る。機械学習システムは、それらの発散する効果を認識し、化合物によって引き起こされた潜在的な副作用の予測的出力を提供するように訓練されることができる。
【0106】
有利なことに、例示的な方法は、推定上の治療薬に対する予測された効能を導出するために、既知の効果がある化合物と関連付けられた特徴/パラメータを使用する。よって、効果がある化合物および推定上の治療薬が示された共通点、例えば、構造的類似性または共通する診療的指標を有さない場合でさえ、予測がなおも導出されることができる。更に、いずれかの化合物が細胞における効果をどのように達成するかに関する先験的情報に対する必要性がない。むしろ、比較のための基準を提供する、活動電位特徴において示されるように、化合物によって引き起こされた細胞挙動における変化が使用される。
【0107】
本明細書で説明される方法では、治療的効能と関連付けられた活動電位特徴は、神経の疾患を処置する際に既知の効能を有する化合物に曝露された神経の活動電位特徴を識別することから導出され得る。代わりにまたは加えて、特徴は、神経の疾患を有する神経および神経の疾患を有さない神経の活動電位特徴を比較することによって識別されることができる。同様に、野生型/対照神経と疾患表現型をモデル化する細胞との間で比較が行われることができる。モデルは、例えば、疾患表現型を引き起こすノックイン突然変異またはノックアウト突然変異を含み得る。代わりにまたは加えて、モデルは、細胞活性のアクチュエータを含み得、アクチュエータは、作動されるとき、疾患表現型を引き起こし、または疾患の状態から神経を救済する。疾患の神経および健康な細胞の活動電位特徴をマッピングすることは、多次元空間上のベクトルを使用して記述されることができる、疾患に対する表現型を提供する。特徴は、例えば、表形式または関係データベースに記憶されることができ、その結果、試験される化合物ごとに、治療的効能と関連付けられた特徴が再識別される必要がない。この表現型を反転させる活動電位特徴を誘発する化合物が、推定上の治療薬として識別されることができる。
【0108】
図10は、重要度によってランク付けられた、活動電位から測定され得る特徴を示す。コンピュータは、多くの一意なかつ識別可能な活動電位特徴を測定し得る。概して、システムおよび方法は、約300またはそれよりも多い特徴を識別する。いくつかの実施形態では、約300の特徴/パラメータが識別され、対照細胞および試験細胞に対するベクトルとして約300次元空間にマッピングされる。対照細胞と試験細胞との間の活動電位特徴のベクトルは、表現型を表し、試験細胞の機能的表現型を提供する。よって、ベクトルは、測定された活動電位からの特徴を使用して細胞挙動を特徴付ける。
【0109】
本発明の方法およびシステムでは、機械学習システムは、細胞に対する機能的表現型を生成するように活動電位特徴を分析するために使用される。説明として、機械学習は、人工知能の分岐およびデータの使用に焦点を当てるコンピュータサイエンスであり、コンピュータアルゴリズムの機械学習は、経験を通じて、およびデータの使用によって自動で改善することができるコンピュータアルゴリズムの学習である。機械学習アルゴリズムは、それを行うように明示的にプログラムされることなく、予測または決定を行うために、訓練データとして既知の、試料データに基づいてモデルを作り上げる。概して、本発明の機械学習システムは、機能的表現型を生成するために使用される、不可欠な活動電位特徴のサブセットまたは複合体を識別する。機械学習システムは、特徴から機能的表現型を確立するように、それらの能力における活動電位特徴の相対的重要性を決定する。機械学習システムモデルは、様々な方法を使用して検証または訓練されることができる。
【0110】
機械学習システムおよび関連するアルゴリズムの好ましい実施形態は、以下で詳細に説明される。しかしながら、いくつかの適切なタイプの機械学習アルゴリズムのいずれかは、開示される方法およびシステムの1つまたは複数のステップに対して使用され得る。適切な機械学習タイプは、ランダムフォレスト、サポートベクトルマシン(SVM:support vector machine)、相関ルール学習、帰納論理プログラミング、回帰的分析、クラスタリング、ベイジアンネットワーク、強化学習、計量学習、多様体学習、エラスティックネット、および遺伝的アルゴリズムなどのニューラルネットワーク、決定木学習を含み得る。機械学習タイプまたはモデルのうちの1つまたは複数は、本明細書で説明される方法ステップのいずれかまたは全てを完了させるために使用され得る。例えば、実施形態では、機械学習システムは、高度情報活動電位特徴を識別し、および/または機能的表現型を生成するために、ランダムフォレストおよび均整のとれた値、エラスティックネット分類器、y認識主成分分析(PCA:principal component analysis)、および階層型線形混合効果モデルのうちの1つまたは複数を使用し得る。以下で説明されるように、実施形態では、機械学習システムは、この構造を十分に活用し、in vitro生物学用途のための強力かつ効率的なカスタムツールを構築するために、入れ子データに対する新規のアルゴリズムを利用する。
【0111】
好ましい実施形態では、機械学習システムは、薬物フィンガプリントを導出するために、新規のアルゴリズムを使用する。本明細書で開示されるように、本発明の方法は、スパイク率、スパイク高さおよび幅、過分極化後の深度、スパイク発症のタイミングおよび発火の中止、第1のスパイクのスパイク間間隔、一定の刺激にわたる適合の程度、ならびにスパイク波形の第1の派生物および第2の派生物など、各々の神経の電気生理学測定を捕捉する。測定にまたがって、および測定内の刺激領域にまたがって、不変パターンが明らかである。実施例として、「高速活動電位動力学」は、スパイク形状のほぼ全ての測定を変え、発火頻度は、何らかの最大点まで刺激と共に増大する傾向があり、特性「周波数-強度」曲線をトレースする。それらの複合的、非線形の、多次元パターンは、疾患状態および化合物効果の一意な兆候をもたらす。
【0112】
しかしながら、データセットが高次元であることを理由に、各々の細胞からの大多数の測定-数百の測定は、そのままでは下流での使用に対して困難であり得る。次元は、データセットがどの程度の属性を有しているかを指す。高次元データは、本発明におけるケースのように、次元の数がびっくりするほど高く、その結果、計算が極端に難しくなる場合があるデータセットを記述する。高次元データにより、特徴の数は、観察の数をはるかに超え得る。高次元空間がまばらであり、ほとんどのベクトルが直交することを理由に、高次元読み出しは、多くのクラスタリング、マッチング、および分類タスクにおいて良好に機能しない傾向がある。いくつかの実施形態は、特徴の総数を、制限されたサブセット、機械学習システムに実際に提示されたより少数の特徴に低減させる。
【0113】
図11は、機械学習システムモデルにまばらさを意図的に提供する、すなわち、ニューラルネットワークなどの機械学習システムへの入力として使用される特徴の数を制限するための正則化技術の適用を示す。例えば、特定の病状と関連付けられた細胞からの活動電位に対し、特徴が測定され得る。正則化された重要度が特徴に割り振られ得、全ての測定されたものよりも少ない特徴が、機械学習システムへの入力として使用され得る。或る実施形態では、第2の(「プレアンプ」)機械学習システムは、全ての特徴の重要度を評価するように訓練され、正則化された重要度を測定された特徴の全てに割り振る出力を提供するように、正則化された重要度が特徴に割り振られる。それは、バジェットラッパが制限された数(例えば、12)の特徴のみを選択することを可能にする。どのような方法で特徴が選択されても、それらは、細胞表現型を与えるように訓練された一次「パワーアンプ」)機械学習システムへの入力の一部を形成し、よって、既知の病状と関連付けられた細胞に対する効能を試験薬物が有することを示すことができる。
【0114】
好ましくは、一次機械学習システムは、健康な/対照細胞および疾患細胞の活動電位特徴を区別するように訓練される。モデルは、健康な細胞に対する疾患細胞の挙動を特徴付ける機能的表現型を生成することに不可欠であるとしてどの特徴が識別されるかを識別するように検査される。どの特徴が機能的表現型の一部であるかを識別するために、推論的統計、例えば、マルチレベルモデルも使用される。機械学習および統計的モデルの両方は、追加のデータ、例えば、ホールドアウトデータに対して評価されることができる。
【0115】
いくつかの実施形態は、オートエンコーダニューラルネットワークを含む機械学習システムを使用する。オートエンコーダは、ラベル付けされていないデータを効率的にコードすることを学習するために使用される人工ニューラルネットワークのタイプであり、教師なし学習技術であると理解される。オートエンコーダは、機械学習システムによって使用可能になるデータをコードする機械学習システムに対する処理ステップとしての役割を果たす。
【0116】
オートエンコーダは、低次元ボトルネックを通じて流れる一連の非線形変換を通じて情報をプッシュし、次いで、ボトルネックの他の側に対する未処理データを再構築することを試みる。しかしながら、本発明の方法は、その高次元空間の内部で低次元マニフォールドに沿って多くの高次元データセットが存在するという仮説を使用する。よって、データ測定が高度に相関付けられることが多いことを理由に、高次元未処理データは、より低い次元の非線形マニフォールドに沿って高度に集中され、その結果、比較的少ない数の変数を使用して、データセットが記述されることができる。
【0117】
実施形態では、オートエンコーダニューラルネットワークは、高次元未処理データに相関付けるより低い次元の非線形マニフォールドを発見することを目的に、多様な化合物兆候のデータセットに対して訓練される。このアプローチは、未処理データからの特徴検出および分類のために必要とされる表現をオートエンコーダが発見することを可能にする。このマニフォールドの次元は各々、根底にある生物学における異なるパターンの活性に関連する。よって、オートエンコーダは、未処理測定を生物学的表現にマッピングする能力を有する、表現学習アルゴリズムとして有効に作用する。
【0118】
このアプローチの成功は、コヒーレントなフィンガプリントを構築することを目的に使用される訓練データセットの性質によって達成される。オートエンコーダの挙動および有用性は大いに、使用される訓練データの関数である。一部の実施形態では、訓練データセットは、目的の遺伝子標的を発見するように、神経作製からRNAを最初に配列することによって作成される。標的は、多様な範囲の疾患および状態を表すように選択される。標的-活性化因子および阻害因子の両方を選択的に調節する化合物は次いで、手動で識別される。実施形態では、各々の神経から抽出された情報を最大にするために、本明細書で開示されるような撮像プロトコールにより、10ポイントの投与反応を含む、化合物に対するデータが四重に収集される。これは、多くの異なるクラスの化合物に対して、活性レベルの範囲にまたがって、高度の活性化合物のデータセットを結果としてもたらす。このタイプのデータセットは、投与が増大するにつれて中心から更に移動する、太陽からの光線のような不活性の中心雲から外に放射する化合物に対するフィンガプリントの非常に多様なセットをオートエンコーダがコードすることを必要とする。加えて、それらのデータに対するオートエンコーダの深度、幅、非線形性、バッチサイズ、学習率、モーメント、勾配クリッピング、および訓練サイクルが最適化される。それらの調整されたハイパーパラメータは、モデル性能および有用性に大きな影響を有する。
【0119】
未処理測定は、訓練または投影の前に階層型回帰的モデルを使用して順応される。それらは、対照神経のセットを指定し、各々のサブ群内のそれらのベースライン活性を推定する。サブ群は、例えば、細胞の各々のプレート、または各々の撮像日であり得る。サブ群は次いで、同一のレベルに整列される。サブ群は、例えば、最良線形不偏予測(BLUP:best linear unbiased prediction)を介して推定され得、BLUPは、データセット全体を介して生成された前の予想により観察された群特有データを部分的にプールする。重要なことに、データをこのように整列させることは、神経の厳密な状態よりも、ベースラインの範囲にまたがってベースラインからの変化を反映するように、フィンガプリントの値および解釈を変化させる。このシフトは、異なるベースラインを有し得る、新規の細胞タイプからフィンガプリントを導出する能力など、オートエンコーダに対する重要な用途を有効にする。よって、本発明の方法は、いずれかの疾患に対する対照に対して、化合物効果および疾患表現型をフィンガプリントすることを有効にする。
【0120】
更に、いくつかの深層学習方法が訓練データに対して過適合する傾向があることを理由に、実施形態では、本発明の方法は、ブートストラッピングアルゴリズムを使用し得る。いくつかの深層学習方法が訓練データに対して過適合する傾向があることを理由に、実施形態では、本発明の方法は、機械学習システムが過適合する傾向があることを防止するために有用な、増補された訓練データを提供するために、ブートストラッピングアルゴリズムを使用する。従来技術のデータ増補方法は、類似の合成データを生成するために、ノイズを既存のデータに注入し、またはデータセットの特性をパラメータ化することによって、過適合に対処してきた。対照的に、本発明の方法は、合成データに対するいずれの要件もなく、増補されたデータを作成するように訓練データ内から再サンプリングするために(例えば、置き換えにより)ブートストラッピングを使用する。
【0121】
上述したように、本発明の方法は、単一ニューロン分解能によりデータを収集する。実施形態では、階層型ブートストラッピングアルゴリズムは、ウエルから収集されることができたデータの別のもっともらしい例を作成するように、置き換えによりウエルからニューロンを再サンプリングすることによって、この事実を利用する。各々の測定は次いで、測定認識方法を使用してウエルレベルにおいて凝集され、測定認識方法は、最適な凝集戦略(平均値、中央値、様々な程度のトリミングされた平均値)を各々の測定に適用する。それらのステップは、ウエルごとに任意の回数で再現される。上記説明されたデータセットでは、これは、ウエルレベルの訓練データのサイズにおいて100倍に増大することを結果としてもたらした。重要なことに、これは、合成データを伴わず、全ての増補された試料は、実データの組合せであり、測定の間の全ての非線形依存性を維持する。メモリ制約を克服するために、この増補方法は、データスタックの作成の間に事前に適用され得、次いで、ディスクに保存される。
【0122】
ブートストラッピングアルゴリズムは、ウエルから収集され得たデータの別のもっともらしい実施例を作成するように、置き換えによりデータを再サンプリングする。各々の測定は、測定認識方法を使用して、ウエルレベルにおいて凝集され得、測定認識方法は、最適な凝集戦略(平均値、中央値、様々な程度のトリミングされた平均値)を各々の測定に適用する。それらのステップは、ウエルごとに任意の回数で再現される。分析は、例えば、ウエルレベルの訓練データのサイズにおける100倍の増大を提供し得る。重要なことに、これは、合成データを伴わず、全ての増補された試料は、真のデータの組合せであり、測定の間で全ての非線形依存性を維持する。
【0123】
本発明の方法およびシステムは、薬物発見のために有用である。方法は、電気的励起可能細胞を化合物に曝露することと、細胞の電気活性を測定することと、細胞の活動電位特徴を識別することと、識別された特徴に基づいて、化合物の治療的効能を判断するために、機械学習システムを使用することと、を含む。重要なことに、機械学習システムは、いずれかの疾患に対する化合物の治療的効能に関する結果を生み出す能力を有する。これは、上記好ましい実施形態において説明されたような機械学習システムの性質によって達成される。
【0124】
上述したように、活動電位特徴は、単一の細胞に対して識別され得、スパイク率、スパイク高さ、スパイク幅、過分極化後の深度、スパイク発症のタイミング、発火の中止のタイミング、第1のスパイクのスパイク間間隔、一定の刺激にわたる適合の程度、スパイク波形の第1の派生物、およびスパイク波形の第2の派生物のうちの1つまたは複数を含む。機械学習システムは、化合物の治療的効能と関連付けられた電気活性の特徴を識別するように訓練される。
【0125】
識別された特徴は、測定の間の非線形関係を有する表形式データの出力であり得る。測定された特徴は、例えば、ベクトルとして数値的に記憶され得、例えば、0~1に必要に応じてスケーリングされ得る。各々の特徴(例えば、必要に応じてスケーリングされた数値ベクトル)は、オートエンコーダニューラルネットワークなどの機械学習システムに対して入力され得る。オートエンコーダは、ラベル付けされていないデータを効率的にコードすることを学習するために使用される人工ニューラルネットワークのタイプであり、よって、教師なし学習技術である。オートエンコーダは、機械学習システムによって使用可能になるデータをコードする。上記説明されたように、オートエンコーダは必然的に、生物学的表現に未処理測定をマッピングするように構成された表現学習アルゴリズムであり得る。オートエンコーダは、既知の病状の細胞または薬物(例えば、既知の効果および対照試料の薬物)に曝露されたそのような細胞および曝露されていないそのような細胞の両方の試料を有する既知の遺伝子標的を有する細胞のビデオなどの訓練データにより訓練され得る。既知の遺伝子標的は、疾患関連突然変異を有する神経であり得る。本発明の方法は、機械学習システムが訓練された全ての疾患に対する表現型を発達させ、よって、いずれかの疾患に対する薬物発見を可能にする。
【0126】
オートエンコーダは更に、オートエンコーダの深度、幅、非線形性、バッチサイズ、学習率、モーメント、勾配クリッピング、および訓練サイクルを最適化することによって、ハイパーパラメータチューニングを使用して訓練され得る。それらのチューニングされたハイパーパラメータは、モデル性能および有用性に対する大きな影響を有する。
【0127】
訓練された機械学習システムは、化合物の効果を検出するために有用である。生物学的試料が薬物にどのように反応するかを知ることは貴重である。例えば、スクリーニングにおける生物学的に活性の化合物を発見すること、または検出可能な活性による最低の投与を発見することである。薬理学では、生物学的活性または薬理学的活性は、生き物に対する薬物の有益な効果または悪影響を記述する。測定が差異を包含し、測定自体が最も共通する複数の比較手順に対する独立した要件でない時間の前に既知でないことを理由に、これは、高次元読み出しにより行うことは困難である。そのようなケースに対する適切な方法は、特徴にまたがって凝集された組合せ試験を伴い、いくつかの計算量が多いノンパラメトリックアプローチは、シミュレーションおよびパーミテーション方法を含む。
【0128】
この課題に対処するために、本発明は、神経フィンガプリンティング方式活性検出器を提供する。実施形態では、方法は、試料ごとにフィンガプリントを計算し、次いで、どのフィンガプリントが対照ウエルの高n次レプリケーションによって定義された「不活性の雲」の内部に存在するかを決定する。不活性である非常に低い確率を与える試料は次いで、活性としてラベル付けされる。この技術は、2つのアセット:1)フィンガプリントを発見するための上記説明されるようなものなどの適合されたフィンガプリンティングアルゴリズムと、2)フィンガプリント空間の中心において「不活性の雲」を育成するための対照試料、によって有効にされる。不活性の確率の決定は、多変量ガウス分布およびノンパラメトリックカーネル密度推定を含む、いくつかの計算的に安価の技術を使用して行われることができる。
【0129】
開示の機械学習システムが再訓練または更新され得る。モデルを再訓練または更新することによって、モデルは、より特有かつ敏感になることができると共に、複数のin vitroアッセイ内でのクラス内相関等の問題を低減させまたは除去する。上記説明されたように、本発明の例示的な方法は、訓練データから活動電位特徴を取り除くステップと、訓練データから再サンプリングするステップと、再サンプリングされたデータに対して機械学習システムを再訓練するステップとを含む。追加の、分析されていない活動電位特徴が再サンプリングデータに追加され得る。代わりにまたは加えて、再サンプリングデータは、複製された活動電位特徴を含む。モデルは、センチネルプレートを使用して頻繁に更新され得、センチネルプレートは、そのデータセットに特有の試験および組織培養状態に対して適切な標準化された対照の兆候を提供する。
【0130】
加えて、異なる技術の統合によって指定された境界を発見する方法が提供される。フィンガプリントは、未処理データよりも数桁低い次元であり、そのようなアプローチを追跡可能にする。フィンガプリント次元は、ベータ変分オートエンコーダのような直交性を奨励する方法への明確な拡張と著しく少なく相関付けられ、ベータ変分オートエンコーダは、標準的な複数の比較修正の使用を有効にする。フィンガプリント次元は、解釈可能な表現であり、活性検出器が活性のタイプおよび方向を要約することを可能にする。
【0131】
開示の或る方法およびシステムでは、関係データベースが使用される。データベースは、例えば、特定の神経障害表現型を発現し、および/または治療的化合物に細胞を曝露することによって引き起こされた細胞から識別された活動電位特徴から導出された機能的表現型を含み得る。関係データベースはまた、細胞に帰属可能な追加のデータを含み得、追加のデータは、細胞タイプ、神経状態、突然変異などの活動電位を示した。加えて、関係データベースは、構造的特徴、活性群、濃度依存効果、既知の副作用、選択性、効力、活動の機構、血液脳関門を交差する能力、他の化合物との交差反応性などの特定の既知の治療的化合物または推定上の治療的化合物に関連するデータを含み得る。
【0132】
本発明のシステムおよび方法は、細胞が活動電位を示すときに引き起こされた膜電位における変化からの光学シグナルを作成および記録するために、光遺伝学を使用する。それらの光遺伝学的リポータによって生み出された時間可変シグナルは、生きている細胞の化学的状態または電子的状態の過程の図表を作るように再現して測定される(すなわち、動画が記録される)。本発明のシステムおよび方法は、膜電位の光遺伝学的リポータによって生み出された時間可変シグナル(動画)をビデオとして記録するために、顕微鏡を使用することができる。
【0133】
本発明は、圧縮技術を使用してこの未処理ビデオデータのサイズを低減させる方法を含む。動画フレームは、高い時間相関を有するが、非常にノイズが多く、よって、標準的な可逆圧縮またはフレーム間差分可逆圧縮のみが約30%の最大の圧縮を達成する。よって、本発明は、不可逆圧縮方法を使用して記録されたデータのサイズを低減させる方法およびシステムを提供する。好ましくは、不可逆圧縮は、切り詰められた主成分分析(PCA)を含み、切り詰められたPCAは、ノイズを破棄するが、活動電位シグナルからのほとんど全ての情報を維持する。
【0134】
PCAは、共分散マトリックスおよびその固有値分解の計算を伴い、固有値分解は、画素の数を二次関数的にスケーリングする。したがって、単純な実装は、むしろ低速である。より計算的に効率的なアルゴリズムは、ブロックワイズ処理を使用する。刺激された細胞からのシグナル相関が局所的に制限されることを理由にこれが可能である。本発明者らは、視覚的検査のときのシグナル品質の損失を少なくすることにより、最大で200倍の係数のアグレッシブ圧縮が達成されることができることを発見した。
【0135】
この圧縮スキームを使用して重要な情報が維持されることを保証するために、圧縮されたデータを使用して、およびその圧縮の前からのデータを使用して、機能的特徴が生成されることができる。これは、スクリーニングウインドウに対する表現型区別のエンドポイントまでの可能性があるシグナル劣化を判断するために使用されることができる。動画の区画化は、平均動画フレームの局所的強度最大値に基づいて、領域に基づくタイリングを使用するように修正されることができる。単一の細胞からの画素が同一の領域内に包含される傾向があることを理由に、これは、より効率的な圧縮を可能にする。
【0136】
伝統的に、本明細書で説明される不可逆圧縮方法は、ダウンストリーム画像のセグメンテーションまたは抽出された電圧トレースを実質的に損なうことなく、約200倍未満の係数によってデータを低減させる。
【0137】
有利なことに、不可逆圧縮は、活動電位シグナルのシグナル対雑音比を高めることができるデノイザとしての役目を果たすことができる。
【0138】
非負マトリックス因子分解(NMF:non-negative matrixfactorization)に基づいた方法は、切り詰められたPCAを使用して、圧縮された表現と直接作用することができる。NMFに基づく方法は、in vivoカルシウム撮像のために開発された最新のアルゴリズムであり、電圧撮像により作用するように修正されてきた。それらの方法は、非凸最適化問題を解決する。よって、良好な初期のパラメータ状態を有することが重要である。
【0139】
データベーススキーマも、テーブルのパーティショニングの使用を通じたより効率的にインデックスを付与することと、クエリされることが多い結果をキャッシュすることとを提供するために使用されることができる。例えば、データベースに対するほとんどのクエリは、特定のプロジェクトに対するものである。データベースにおけるテーブルのクエリは、テーブル内のあらゆる細胞のスパイク波形ごとの特性を通じてパースする必要があり得る。このテーブルをパーティショニングすることは、ほとんどの典型的なクエリに対する待ち時間を減少させる。更に、同一の細胞からのスパイクにまたがる凝集された特性は、源特徴テーブルに記憶され、源特徴テーブルは、計算を繰り返すことなく、事前に計算されることができ、キャッシュされることができ、および取り出されることができる。
【0140】
いずれかの適切な方法によって、蛍光値が未処理動画から抽出される。1つの方法は、Kraljet al., 2012, Optical recording of action potentials in mammalian neurons usinga microbial rhodopsin, Nat Methods 9:90-95に記載された最大尤度画素重み付けアルゴリズムを使用する。簡潔に、各々の画素における蛍光は、全視野平均蛍光と相関付けられる。平均値により強い相関を示した画素が優先して重み付けされる。このアルゴリズムは、ほとんどの情報を運ぶ画素を自動で発見し、背景画素を強調しない。
【0141】
複数の細胞を包含する動画では、参照によってその両方が組み込まれる、Mukamel,2009, Automated analysis of cellular signals from large-scale calcium imagingdata, Neuron 63(6):747-760、またはMaruyama, 2014, Detecting cells usingnon-negative matrix factorization on calcium imaging data, Neural Networks55:11-19などの本分野において既知の方法を介して、各々の細胞からの蛍光が抽出される。それらの方法は、画素のクラスタを識別するために、活動電位発火イベントの空間的および時間的相関特性を使用し、画素の強度は、共分散し、そのようなクラスタを個別の細胞と関連付ける。
【0142】
代わりに、ユーザは、細胞体および隣接する神経突起を含む領域を定義し、この領域内の画素値の重み付けされていない平均から蛍光を計算する。低倍率画像では、最適なシグナル対雑音比を提供するための直接平均化および最大尤度画素重み付けアプローチが発見され得る。画像または動画は、いずれかの所与の視野、フレーム、または画像内に複数の細胞を包含し得る。複数の神経を包含する画像では、Mukamel 2009のものから修正された独立成分分析(ICA:independent components analysis)に基づくアプローチを使用して、セグメント化が半自動で実行されることができる。ICA分析は、画像内から個別の細胞の画像シグナルを隔離することができる。
【0143】
独立成分分析の統計的技術は、その強度がクラスタ内で相関付けられ、クラスタの間で最大で統計的に独立した画素のクラスタを発見する。それらのクラスタは、個別の細胞の画像に対応する。
【0144】
細胞ごとに蛍光強度時間トレースを抽出するように、空間フィルタが計算されることができる。フィルタは、画像セグメントの1つの中のものを除き、全ての画素重みをゼロに設定することによって作成される。それらの画素は、元のICA空間フィルタにおいてそれらが有した同一の重みが割り振られる。
【0145】
セグメント化された空間フィルタを動画データに適用することによって、ICA時間経過が各々の細胞からの明確に異なる貢献に分解される。セグメント化は、ICAによって共に発見された細胞に対して予想されるように、細胞の活性が強く相関付けられることを明らかにし得る。
【0146】
個別の細胞に対し、活動電位伝播の細胞下細部は、補間された活動電位が画像内の各々の画素における閾値を交差するタイミングによって表されることができる。ウェーブフロント伝播を識別することは、ノイズを取り除き、シグナルを正規化し、SNRを改善するようにデータを最初に処理すること、他の事前処理ステップ、またはそれらの組合せによって補助され得る。活動電位シグナルは、フォトブリーチングを取り除き、中央値フィルタリングされたトレースを差し引き、ノイズ閾値を上回るデータを隔離することによって、最初に処理され得る。次いで、参照によってその両方が組み込まれる、Foust, 2010, Action potentials initiate in the axon initial segmentand propagate through axon collaterals reliably in cerebellar Purkinje neurons.J. Neurosci 30:6891-6902、およびPopovic, 2011, The spatio-temporal characteristicsof action potential initiation in layer 5 pyramidal neurons: a voltage imagingstudy, J Physiol 589:4167-4187の補間アプローチに基づいたアルゴリズムなどのサブナイキスト活動電位タイミングに基づいたアルゴリズムを使用して、活動電位ウェーブフロントが識別され得る。
【0147】
サブナイキスト活動電位タイミング(SNAPT:sub-Nyquist actionpotential timing)アルゴリズムは、活動電位の開始における細胞下タイミング差を強調する。例えば、電圧リポータおよび電圧アクチュエータを発現する神経に対してアルゴリズムが適用され得る。体細胞領域または小樹状領域のいずれかは、青色光の繰り返すパルスを介して刺激される。続いて起こる活動電位のタイミングおよび位置が監視される。
【0148】
スパイク動画の時間的登録における第1のステップは、スパイク時間を判定することを伴い得る。スパイク時間の判定は、反復して実行される。おおよそのスパイク時間、{T0}を判定するために、単純な閾値および最大値手順が全視野蛍光トレース、F(t)に適用される。各々のスパイクをひとまとめにする短時間のウインドウ内の波形は、予備的スパイクカーネルK0(t)を生み出すように共に平均化される。元の強度トレースF(t)とのK0(t)の相互相関関数が計算される。F(t)における最大値のタイミングが単一のフレームノイズからの誤りへの対象であるのに対し、時間{T}に位置する相互相関関数におけるピークは、スパイクタイミングのロバストな測定である。平均活動電位伝播を示す動画は、スパイク時間{T}をひとまとめにする短時間のウインドウ内の動画を平均化することによって構築され得る。典型的には、100~300個の活動電位は、この平均に含まれる。活動電位動画は、高シグナル対雑音比を有する。よって、単一の活動電位の時間的に登録された動画(例えば、数百の動画)を平均化することによって、活動電位の参照動画が作成される。
【0149】
空間および時間線形フィルタは更に、活動電位動画内のノイズを減少させ得る。空間フィルタは、Gaussianカーネルとの、典型的には1画素の標準偏差との畳み込みを含み得る。時間フィルタは、単一の画素時間トレースのセットの主成分分析(PCA)に基づき得る。各々の画素における時間トレースは、PCA固有ベクトルを基準に表現される。典型的には、最初の5つの固有ベクトルが活動電位波形における99%よりも高い画素ごとの変動を説明するために十分であり、よって、PCA固有分解が5項の後に切り詰められる。残りの固有ベクトルは、相関付けられていないショットノイズを表した。
【0150】
主成分分析(PCA)から結果として生じる固有ベクトルは、ノイズに対処するために、平滑化演算において使用されることができる。フォトブリーチングまたは他のそのような背景特有でない蛍光が、それらの手段によって対処され得る。
【0151】
この平滑化された参照活動電位動画内で各々の画素における離散的にサンプリングされた蛍光測定の間に、平滑に可変のスプライン関数が補間され得る。補間された活動電位がユーザにより選択された閾値を交差する各々の画素におけるタイミングは、部分曝露精度により推測され得る。ユーザは、追跡する閾値脱分極化(最大蛍光移行の小数によって表される)およびdV/dtについての符号(立ち上がりエッジまたは立下りエッジを示す)を設定する。フィルタリングされたデータは、2次スプライン補間に適合し、交差する閾値の時間が画素ごとに計算される。
【0152】
局所的活動電位タイミングを中心におくGaussian時間経過内に各々の画素を強調することによって、タイミングマップが高時間分解能のSNAPT動画に変換され得る。SNAPT適合は、次のように活動電位伝播を示す動画に変換される。各々の画素は、その画素においてユーザにより選択された活動電位特徴のタイミングと一致するように計時された短時間のフラッシュを除き暗く維持される。フラッシュは、局所的活動電位振幅に等しい振幅、および細胞平均時間分解能、σに等しい持続時間を有するGaussian時間経過に続いた。SNAPT動画内のフレーム時間は、σよりも約2分の1に小さくなるように選択される。タイミングマップをSNAPT動画に変換することは、視覚化のためであり、伝播情報は、タイミングマップ内にある。
【0153】
本発明による使用のための環境的に敏感な蛍光リポータは、ロドプシンタイプ膜貫通タンパク質を含み、ロドプシンタイプ膜貫通タンパク質は、膜電位における変化に反応して光学シグナルを生成し、それによって、膜電位の光学リポータとして機能する。アーチロドプシン型タンパク質QuasAr2およびQuasAr3は、赤色光によって励起され、細胞膜電位に応じて強度において変化するシグナルを生み出す。それらのタンパク質は、膜電位の光学的測定を促進する、トランスフェクションまたはエレクトロポレーションなどの遺伝子工学技術を使用して、細胞の中に導入されることができる。本発明はまた、参照によってその内容の全体が本明細書に組み込まれる、米国特許公開第2014/0295413号に開示されるものなど、電圧を示すタンパク質により使用されることができる。
【0154】
蛍光指標に加えて、細胞を化学的または電気的に摂動するための感光性化合物が発達してきた。光制御活性化因子を使用して、照射パターンを変化させることによって、試料全体、選択された領域、または個別の細胞に刺激が加えられることができる。光制御活性化因子の1つの実施例は、チャネルロドプシンタンパク質CheRiffであり、チャネルロドプシンタンパク質CheRiffは、それに降下する青色光の強度に大まかに比例して増大する大きさの膜貫通電流を生み出す。1つの調査では、CheRiffは、約22mW/cm2の青色光によって照射されるときにタンパク質を発現する細胞全体において、約1nAの電流を生成した。
【0155】
本発明のシステムおよび方法はまた、それらを作動させるための追加のリポータおよび関連するシステムを使用し得る。例えば、遺伝的にコードされたカルシウム指標(GECI:genetically-encoded calcium indicator)など、細胞内カルシウムレベルにおける変化を報告するタンパク質が使用され得る。プレートリーダは、RCaMPに対する黄色光など、GECIに対する刺激光を提供し得る。例示的なGECIは、例えば、jRCaMP1a、jRGECO1a、またはRCaMP2など、GCaMPまたはRCaMP変異体を含む。1つの実施形態では、アクチュエータは、青色光によって活性化され、Ca2+リポータは、黄色光によって励起され、オレンジ色光を放出し、電圧リポータは、赤色光によって励起され、近赤外線光を放出する。
【0156】
光学的に調節された活性化因子は、励起性など特定の細胞特質の全ての光学的な特徴付けを有効にするように、蛍光指標と組み合わされることができる。例えば、光パッチ方法は、CheRiffなどの電気活性化因子タンパク質を、QuasAr2などの蛍光指標と組み合わせる。活性化因子および指標タンパク質は、異なる波長の光に反応し、細胞が光電流の大きさの範囲にわたって励起されるのと同時に膜電位が測定されることを可能にする。光パッチは、全ての目的のために参照によってその両方の内容が組み込まれる、米国特許第10,613,079号および米国特許第9,594,075号の内容を含む。
【0157】
それらが試料内の細胞との正確な微細機械操作または直接の接触を必要としないことを理由に、全ての光学的測定は、パッチクランピングのような従来の方法に魅力的な代替を提供する。光学的方法は、高スループット用途にはるかに従順である。全ての光学的測定によって付与されるスループットにおける劇的な増大は、それらの状態の学習、診断、および処置に革命を起こす可能性を有する。
【0158】
開示の方法およびシステムは、プレートのウエル内の細胞の活動電位を記録するために、マルチウエルプレート顕微鏡を使用し得る。例えば、本発明の方法およびシステムは、プレートのウエル内で生きている細胞が観察および撮像されることを可能にする構成において、近TIR光により試料を照射するためのマルチウエルプレート顕微鏡を採用し得る。顕微鏡は、より強烈な照射と、対応するより低い開口数およびより大きな視野とを可能にする、対物レンズを通じてではなく、側面から試料を照射する。蛍光の波長とは明確に異なる波長における照射光を使用することによって、TIR顕微鏡は、目的の明るいエリアと共に暗い背景を有する画像を結果としてもたらす、照射波長が光学フィルタにより画像からほぼ完全に取り除かれることを可能にする。顕微鏡は、活動電位特徴/パラメータがそれから抽出される細胞活動電位を示す測定を提供するように、蛍光を観察することができる。
【0159】
QuasAr2およびQuasAr3などの膜活動電位の蛍光リポータは、蛍光するために、強烈な励起光を必要とする。低い量子効率および急速なダイナミクスは、電位を測定するために強烈な光を要求する。したがって、照射サブシステムは、高ワットまたは高強度において光を放出するように構成される。量子効率およびピーク励起波長などの蛍光色素の特性は、それらの環境に反応して変化する。強烈な照射は、それが検出されることを可能にする。強烈な光によって引き起こされた自家蛍光は、複数の方法において顕微鏡によって最小化される。近TIR照射の使用は、各々のウエルの底部分のみを照射光に曝露し、それによって、培地またはデバイスの他の構成要素の励起を低減させる。加えて、顕微鏡は、撮像光とは明確に異なる照射光を提供するように構成される。撮像サブシステムにおける光学フィルタは、照射光をフィルタ除去し、画像から望ましくない蛍光を取り除く。細胞を培養するための環状オレフィン共重合体(COC:cyclic olefin copolymer)の皿は、ガラスと比較して背景の自家蛍光を低減させることを有効にする。プリズムは、インデックスマッチング低自家蛍光オイルを通じてマルチウエルプレートに結合される。プリズムはまた、低自家蛍光溶融シリカから構成される。
【0160】
顕微鏡は、細胞の動的特性を光学的に特徴付けるように構成される。顕微鏡は:(1)網内の細胞間の相互作用を測定することを可能にし、または高スループットのために多くの細胞を同時に測定するための広い視野(FOV:field of view)と、(2)ウエル内の個別の細胞の形態を検出し、シグナル処理における選択性を促進するための高空間分解能と、(3)個別の活動電位を区別するための高時間分解能と、(4)正確なデータ分析を促進するための高シグナル対雑音比と、を同時に達成することによって全ての光学的な特徴付けの完全な可能性を実現する。顕微鏡は、数十または数百の細胞を捕捉するのに十分な視野を提供することができる。顕微鏡および関連するコンピュータシステムは、1ミリ秒の次数での非常に短い曝露時間に対応する、少なくとも1キロヘルツの次数での画像獲得率を提供し、それによって、神経などの電気的活性細胞内で発生する急速な変化を記録することを可能にする。したがって、顕微鏡は、従来技術の顕微鏡よりも実質的に短い期間にわたって列挙された光学系を使用して、蛍光画像を獲得することができる。
【0161】
顕微鏡は、細胞の動的特性を光学的に特徴付けることを促進するために、それらの高まる要件の全てを達成する。顕微鏡は、十分な分解能を有する広いFOVおよび低い開口数(NA:numerical aperture)の対物レンズを有する集光能力を提供する。顕微鏡は、sCMOSカメラなどの高速検出器により2倍~6倍の範囲にある大きさにより撮像することができる。高速な撮像率を達成するために、顕微鏡は、典型的には、例えば、約635nm~約2,000W/cm2の波長における50W/cm2よりも大きい蛍光による、極端に強烈な照射を使用する。
【0162】
高電力レベルにも関わらず、顕微鏡はそれにも関わらず、試料、細胞成長媒体、インデックスマッチング液体、および試料コンテナ内の特有でない背景蛍光を励起することを回避する。近TIR照射は、試料および試料媒体の望ましくないエリアの自家蛍光を制限する。撮像サブシステムにおける光学フィルタは、望ましくない光が画像センサに到達することを防止する。加えて、顕微鏡は、照射光に対物ユニットを通過させるのではなく、側面から試料を照射することによって、対物レンズ内のガラス要素の望ましくない自家蛍光を防止する。顕微鏡の対物レンズは、物理的に大きくなり得、少なくとも50mmの前方開口および少なくとも100mmの長さを有し、多数のガラス要素を包含する。
【0163】
図12は、例示的な顕微鏡1201の構成要素を示す。顕微鏡は、マルチウエルプレート1209を保持するように構成されたステージ1205と、顕微鏡内に搭載された光のビームを放出するための励起光源1215と、下からステージに向かってビームを方向付ける光学システム1261とを含む。光学システムは、ビームを空間的に均質化するためのホモジナイザ1225を含む。顕微鏡1201は、様々な機能を実行または制御するためのコンピュータ1271またはコンピューティングシステムハードウェアを含みまたはそれらに通信可能に結合される。
【0164】
コンピュータ1271は、活動電位特徴を識別し、および/または機能的表現型を生成するための機械学習システムを含み得る。
【0165】
顕微鏡1201は、光パターニングシステム1231を含み得る。ステージ1205は好ましくは、電動式x,y並進ステージである。
【0166】
顕微鏡1201は、画像センサ1235を含む。画像センサは、Hamamatsu Photonics K.K.(Shizuoka、JP)によって部品# C15440-20UPの下で販売されたORCA-Fusion BTデジタルCMOSカメラまたはHamamatsu Photonics K.Kによって部品# C14120-20Pの下で販売されたORCA-LightningデジタルCMOSカメラなどのデジタルカメラユニットとして提供され得る。センサ1235に対して使用する別の適切なカメラは、Teledyne Photometrics(Tucson、AZ)によってKINETIXという商標の下で販売された背面照射sCMOSカメラである。
【0167】
顕微鏡はまた、適切なチューブレンズなどの撮像レンズ1237を含み得る。レンズ1237は、ZEISS Milvusの85mmレンズなどの85mmのチューブレンズであり得る。そのような撮像ハードウェアにより、顕微鏡は、96-ウエルプレート内で5.5mmの直径および384-ウエルプレートの全3.45mmウエル幅を有するエリアを撮像することができる。
【0168】
顕微鏡1201は好ましくは、制御システムを含み、制御システムは、並進ステージを移動させて、ビームの経路内でマルチウエルプレートの個別のウエルを位置付けるように動作可能なプロセッサに接続されたメモリを含む。必要に応じて、顕微鏡1201は、光のビーム1221を放出するための顕微鏡内に搭載された励起光源1215を含む。光学システム1261は、下からステージに向かってビーム1221を方向付ける。
【0169】
顕微鏡1201は必要に応じて、二次光源1253を含み得る。二次光源1253は、光学システム1261との何らかの類似性を共有するその自身の光学システムを有し得る。しかしながら、その自身の光学システムと共に光学システム1261および二次光源1253を含むことは、それらのシステムが独立して動作し、同時に動作し、または動作しないことを可能にする。いくつかの実施形態では、光学システム1261とは異なる(例えば、はるかに高い)電力で二次照明システムが動作する。二次光源1253およびそのシステムは、較正のために、または、光学システム1261によって対処される光遺伝学的タンパク質のセットとは異なる電力において最良に動作する光遺伝学的タンパク質に対処するために使用され得る。
【0170】
図13は、試料1213に向かってビーム1221をガイドするプリズム1301を示す。光学システム1261は、ステージの直下にあるプリズム1301を含み、それによって、ビームがプリズムの側面に入射し、プレートのウエル1311の中を通る。示されるように、水性試料1238は、ウエル1311の底面1212上で生きている細胞1213を含む。必要に応じて、インデックスマッチングレンズオイル1219は、プリズム1301をウエルの底部1212に光学結合する。好ましくは、水性試料1238を含有するプレートのウエル1311がプリズム1301の上に位置付けられるとき、プリズムは、プレートのウエルの底部1212内での全内部反射を回避する角度シータにおいて、ビーム1221を試料の中に方向付ける。示されるように、水性試料を含有するプレートのウエルがプリズムの上に位置付けられるとき、プリズムは、光をウエルの下から約10(必要に応じて20)ミクロンに制限する屈折の角度において、ビームを水性試料の中に方向付ける。
【0171】
開示のシステムおよび方法により使用されることができる、本明細書で説明される顕微鏡は、マルチウエルプレートのウエルの下に位置付けられたその光学構成要素の全てを含むことができ、その結果、照射が対物レンズを通じてではなく側面から発生する。側面照射は、顕微鏡がより強烈な照射およびより広い視野を有することを可能にする。
【0172】
必要に応じて、ステージの上のエリアは、プリズムなどの光学要素によって妨げから解放される。その構成は、試料への物理アクセスおよびその環境に対する制御を可能にする。よって、試料は、例えば、栄養培地内の生きている細胞であることができる。その構成は、慣習的なTIRF顕微鏡と関連付けられた問題の多くを解決する。特に、試料細胞の薄い領域は、それらをフローチャンバの中に積み入れることによって細胞と物理的に干渉する必要なく、近TIRビームにより照射されることができる。代わりに、メンテナンスブロスなどの水性媒体内の生きている細胞が観察されることができる。試料は、要望通りに電極または他の機器により上から更に分析されることができる。顕微鏡は、蛍光電圧指標を発現する細胞を撮像するために使用されることができる。構成要素が試料と干渉しないので、生きている細胞は、本発明の顕微鏡を使用して学習されることができる。試料が蛍光電圧指標を発現する電気的活性細胞を含む場合、顕微鏡は、活動電位特徴を導出するように、それらの細胞における電圧変化、よって、それらの細胞の電気活性を見るために使用されることができる。
【0173】
その上、顕微鏡は、試料内の特定の細胞のみを選択的に照射するために有用な、空間的にパターン化された照射のためのシステムを含む。
【0174】
図14は、試料への複数の波長の光を空間的にパターン化するための光学的光パターニングシステム1401を示す。光パターニングシステム1401は、光のビーム1402を放出するための第1の光源1413を含む。光のビームは、デジタルマイクロミラーデバイス(DMD:digital micromirror device)1405から反射する。DMD1405は、パターンの中へのビーム1402を形成する。パターン化されたビームは、試料上に撮像される。DMDは、高速の単一の細胞の刺激のための完全に同期された100マイクロ秒のパターンリフレッシュが、結合された神経上の個別のシナプス結合または僅かに遅れたパルスを測定して、スパイクタイミング依存可塑性を精査することを有効にする。光パターニングシステムは必要に応じて、第2の光源1414を含み得る。第1の光源は好ましくは、ビーム1402の中に第1の波長の光を送信する。これは、第1の波長に対するフィルタ1423を使用して行われ得る。
【0175】
ダイクロイックミラー1443は、第2の光源1414からビーム1402の中に第2の波長の光を選択的に反射し得る。光パターニングシステム1401は、いずれかのダイクロイックミラー(複数可)1443に光をガイドし、またはビーム1402をコリメートするための、30mmのアクロマティックダブレットなどの1つまたはいずれかの数のレンズ要素(複数可)1441を含み得る。第2の光源1414は、第2の波長に対して特有の第2のフィルタ1424を使用して、第2の波長において光を提供し得る。光パターニングシステム1401は、第3の光源1415と、第3のフィルタ1425と、必要に応じて、第4の光源1416および第4のフィルタ1426と、を含み得る。好ましい実施形態では、様々な波長からの光がビーム1402に結び付けられると、ビーム1402が、光パイプ1421を通過する。
【0176】
1つの必要に応じた実施形態は、4つの波長:UV(380nm)、青色(470nm)、黄色/緑色(560nm)、および赤色(625nm)を有する4つの光源を使用する。UV(380nm)は、EBFP2もしくはmTagBFP2撮像、または細胞内カルシウムを撮像するために有用であり得る。50mW/cm2の電力は、十分であり得る。青色(470nm)は、CheRiff(例えば、チャネルの95%よりも多くを開放するために250~500mW/cm2において)、Chronos(例えば、チャネルの大部分を開放するために500mW/cm2において)、FLASH、または他のそのようなタンパク質を撮像するために使用され得る。黄色/緑色(560nm)は、jRGECO1a(神経に対する560nmにおける80mW/cm2、もしくは心筋細胞に対する25mW/cm2)、VARNAM、または他のタンパクを撮像するために使用され得る。赤色(625nm)は、Alexa647を有する標的タンパク質(例えば、50mW/cm2において)、またはBeRSTを有する細胞活性(例えば、神経に対する1~20W/cm2)を測定するために有用であり得る。
【0177】
光パターニングシステム1401は、光源1413(典型的には、固体フレームまたはボードに搭載された)から試料にビーム1402をガイドするための、1つまたはいずれかの数のラウンドミラー1426を含み得る。光パターニングシステム1401は、最終角度を制御する順応可能なラウンドミラー1427を含み、最終角度によって、光がプリズムアセンブリ1409に近づく。好ましい実施形態では、光パターンシステム1401は、プリズムアセンブリ1409を含み、プリズムアセンブリ1409は、DMD1405および試料に光をガイドするための1つまたは複数のプリズムを含む。プリズムは好ましくは、マルチウエルプレートの底部を形成する材料の屈折率に合致する屈折率を有し得る。例えば、顕微鏡1201は、MilliporeSigma(St.Louis、MO)によってSENSOPLATEという商標の下で販売された24、96、384、または1536個のウエルを有するガラス底マイクロプレートなどのプレートによる使用のために設計され得る。そのようなマイクロプレートは、127.76mmの長さおよび85.48mmの幅を含む寸法を有する。マイクロプレートは、ホウケイ酸ガラス(175μmの厚み)を含む。
【0178】
プリズムアセンブリ1408は、ダイクロイックミラー1408を含み得、ダイクロイックミラー1408は、DMD1005から外に選択された光の波長を跳ね返し、近TIR角度において他の選択された波長を通過させることを可能にし、それによって、ウエルのちょうど下から10~20ミクロンにわたって試料を照射する。ここで、近TIRは、角度が臨界角度未満であることを意味すると理解されることができ、それによって、側面から来る光がマルチウエルプレートハードウェアの一部における全内部反射を示す(例えば、プレートのホウケイ酸ガラスの底部におけるTIRを示さない)が、それにも関わらず、例えば、好ましくは、臨界角度の10度以内、より好ましくは、TIRに対する臨界角度の5度以内、最も好ましくは、臨界角度の2度以内のものに非常に近い。
【0179】
示されるように、撮像された試料は、撮像センサ1435に向かって通る(例えば、表されないチューブレンズを通過する)光1438を放出する。ダイクロイックミラーを理由に、試料は、空間的にパターン化された光により照射されることができ、また、試料ウエルの下から約10ミクロンのみを通過する近TIR光によって側面から照射されることができ(どちらもビーム1002からのもの)、また、動画を記録するようにセンサ1435によって捕捉された放出光1438を放出することができる。
【0180】
いずれかの適切なデジタルライトプロセッサまたは空間的パターニング機構がDMD1405として使用され得る。いくつかの実施形態では、DMD1405は、10.8μmピッチにおけるマイクロミラーの1920×1200の画素アレイおよび20.7×13mmのアレイサイズを有するVialux V9601-VIS DMDシステムである。光パターニングシステムは、必要に応じて、試料に対する縮小をもたらすための(例えば、2.7倍)、Zeiss Milvus 135mmなどのチューブレンズを含み得る。
【0181】
表される実施形態では、各々の光源1413は、源をエテンデュに維持する6×6mmの光パイプ1421上で撮像された3×3mmのLuminus LEDである。LEDから光パイプへの4レンズ設計(2 4-f撮像システム)は、集光効率を増大させ、角度のある内容を最小化する。表される光パターニングシステム1401は、3つの明確に異なる波長において少なくとも3つのビームを放出するための少なくとも3つの(例えば、4つ)光源1413、1414、1415、1416を含む。好ましくは、光パターニングシステム1401は、空間内で3つのビームを結び付け、3つのビームがホモジナイザおよび/または光パイプ1421を通過させるための1つまたは複数のダイクロイックミラー1443を有する。光パイプ1421は、源を均質化し、4つのLED色の良好な重なりを保証する。光パイプ1421からの光は、DMDに向かって沿って通る。
【0182】
顕微鏡1201は、光のビーム1221を放出するための、顕微鏡内に搭載された励起光源1215を含み得る。光学システム1261は、下からの角度においてステージに向かってビーム1221を方向付ける。1つの潜在的な問題は、ビーム1221の形状に影響を及ぼし得る収差である。よって、好ましくは、顕微鏡1201は、光学システム1261に、ビーム1221を空間的に均質化するためのホモジナイザ1225を含めることによって、細胞1213の非均一な照射を回避する。レーザビーム均質化の異なる方法は、均一なビームプロファイルを作成するために使用される。例えば、均質化は、レンズアレイ光学系または光パイプロッドを使用し得る。
【0183】
顕微鏡を使用して試料を撮像する例示的な方法は、本明細書で説明されるように、顕微鏡ステージ上にマルチウエルプレートを位置付けることを含み、プレートは、ウエルの底面上で生きている少なくとも1つの細胞を有する。撮像は、細胞の画像を取得するように実行される。画像は、ウエルの底部上の表面を「マスク」し、すなわち、細胞によって占有された底面のエリアおよび細胞によって占有されていないエリアを識別する空間的マスクを作成するように処理される。マスクを使用して、コンピュータは、空間的マスクを使用して細胞の範囲を定めるDMDのマイクロミラーを選択的に活性化するように、DMDをシグナリングする。次いで、光源を使用して、顕微鏡は、DMDに光を照らすことによって試料を照射し、それによって、細胞によって占有された底面のエリア上に光を特異的に反射すると共に、細胞によって占有されていないエリア上に光のいずれをも反射しない。
【0184】
方法は、マルチウエルプレートの複数のウエルの各々内で細胞に対する空間的マスクを作成することと、メモリ内で空間的マスクを保持することと、直列に複数のウエル内の細胞を選択的に照射するために、空間的マスクおよびDMDを使用することと、を含み得る。必要に応じて、DMDは、非一時的メモリシステムに結合されたプロセスを含むコンピュータによって制御され、メモリシステムは、そこに記憶された空間的マスクを有する。
【0185】
ロバストな高スループット演算のために、開示のシステムおよび方法は、例えば、光遺伝学的刺激(例えば、青色光刺激)を印加し、高速ビデオデータを記録し、ウエルの間で移動し、自動化された化合物添加のためのピペッティングロボットを動作させるために、ソフトウェアツール、例えば、顕微鏡による自動化および制御ソフトウェアの使用を採用し得る。ツールは、各々のマルチギガバイトビデオ内の各々の神経からの電圧対時間トレースを抽出するための分析ソフトウェアを含み得る。低減したデータは、関係データベースに記憶され得る、膜貫通電圧に比例する蛍光トレース、識別された活動電位、および抽出された活動電位特徴/パラメータと共に、細胞タイプ、化合物、および化合物濃度などの関連するメタデータを含む。
【実施例】
【0186】
(実施例1)
光遺伝学的タンパク質を発現するhiPSCを使用した自動化活動電位特徴抽出
ヒト人工多能性幹細胞(hiPSC:human induced pluripotent stem cell)を、hiPSC由来運動神経に分化させた。細胞は、光パッチツールキットから光遺伝学的タンパク質を発現しており(光学的刺激に加え、光学的電圧報告、例えば、CheRiff&QuasAr)、光パッチツールキットは、神経活動電位の同時の光学的刺激および記録を可能にする。
【0187】
チャネルロドプシンCheRiffは、青色光による活動電位刺激を有効にし、電圧感受性蛍光タンパク質QuasArは、赤色光による高速電気記録を有効にする。顕微鏡は、本明細書で開示されるように、1ミリ秒の時間的分解能および高シグナル対雑音比(SNR:signal-to-noise ratio)により広い(0.5×4mm)視野(FOV)にわたって100よりも多い個別の神経からの同時電圧記録を取得した。顕微鏡におけるデジタルマイクロミラーデバイス(DMD)は、個別の細胞を直列に刺激するように、完全再構成可能な光学パターンと共に、多くのポストシナプスパートナからの記録を投影した。コンピュータシステムは、各々の個別の神経を識別し、その電圧トレースを計算するための完全自動化分析を提供した。
【0188】
トレースごとに、スパイクが検出され、不可欠なスパイク形状およびタイミングパラメータが計算された。各々の細胞が多くの活動電位を発火したので、例えば、細胞タイプ、細胞状態、疾患表現型、および薬理学的反応を区別するための豊富な情報が抽出され得る。加えて、電極無し記録は、細胞を最小に摂動し、化合物添加の前および後に同一の神経の記録を有効にし、それは、異なる神経サブタイプに対する化合物効果の識別を可能にし、それは、高度に均質の神経反応の生物学的「ノイズ」を克服した。細胞の自律的励起性および発火パターンに加えて、システムは、シナプス伝達、長期間増強/抑制、ならびにネットワークおよび回路挙動を学習することを可能にする。
【0189】
hiPSC由来運動神経は、マルチウエルプレートのウエルの中に置かれ、本明細書で説明されるような顕微鏡を使用して広範囲のスパイキング挙動を精査するように設計された刺激プロトコール(青色光パルス)により尋問された。刺激に反応した蛍光シグナルの記録は、顕微鏡によって取られた。
【0190】
図15は、システムを使用して自動化分析によって識別されたhiPSC由来運動神経のオーバレイ(色付けされた領域)による記録からの画像を示す。
【0191】
図16は、機械学習システムを使用して自動化分析によって識別されたhiPSC由来運動神経からの電圧記録を示す。選択された細胞からの電圧記録、および発火:ステップ、パルス列、およびランプを起こすために使用される青色が刺激が示される。
【0192】
各々の神経内の膜電位のリポータからの蛍光を捕捉した記録内の画素は、細胞の一意な発火パターンに従って時間内に共分散した。時間的共分散は、細胞ごとの重量マスクを生成するために使用された(
図15における色付けられた領域)。マスクされた画素は、トレースを計算するように、記録内のフレームごとに平均化された。各々のFOVは、カリウムチャネル開口薬ML-213の添加の前および後の2回記録された。
【0193】
図16におけるトレースは、神経の挙動における根底にある変動性を証明する。多くの神経からの記録は、化合物が神経の活動電位に対して有していた効果を捕捉するように平均化された。トレースから、各々の個別の、記録された活動電位が識別された。
【0194】
図17は、ラスタプロットを提供し、ラスタプロットでは、各々のポイントは、識別された活動電位であり、各々の行は、単一の視野からの神経である。暗く色付けられたプロットは、ML-213、静止電位を低下させ、神経内の活動電位発火を抑制するカリウムチャネル阻害因子の添加の前に神経の記録から導出された。明るく色付けられたプロットは、1μmのML-213の添加の後に記録から導出された。
【0195】
図18は、細胞に対して平均のスパイク率(発火頻度)を提供する。
【0196】
図19は、活動電位から抽出されたスパイク形状パラメータを提供する。
【0197】
図20は、活動電位から抽出されたスパイクタイミングパラメータを提供する。
【0198】
図21は、活動電位から抽出されたような細胞にわたる適応平均を提供する。
【0199】
スパイク形状、スパイクタイミング特性、および適合は、細胞ごとに機械学習システムを使用して自動で抽出され、刺激に応じて測定された。
【0200】
図22は、ML-213によって引き起こされた神経励起性における明確な低減を示す。全てのパラメータは、クラウドにおける並列化分析によって自動で抽出され、データベースに記憶されており、図がシステムによって自動で生成される。刺激依存の抽出された値は、未処理ビデオデータから数および複雑度を大いに低減させており、本明細書で説明されるような活動電位特徴が、細胞タイプ、細胞状態、疾患表現型、および薬理学的反応を区別するためのより詳細な分析のための基礎として機能することができる。更に、より深い深度および横幅の分析を提供するために、おおよそ300個のパラメータは、各々の細胞の活動電位から抽出され得る。機械学習システムは、機能的表現型を生成するように、それらの特徴の不可欠なサブセットを識別することができる。
(実施例2)
光遺伝学的タンパク質を発現するhiPSCからの活動電位特徴を使用した化合物スクリーニング
【0201】
この実施例では、iPSC由来励起皮質神経(NGN2)は、培養において30日の間に成長した。神経は、実施例1において説明されたような光パッチタンパク質を発現した。神経の2つのセットが成長した。1つ目は、野生型対照ラインであった。2つ目は、神経の疾患をモデル化するための遺伝子のノックアウト(KO)によって引き起こされた機能突然変異の機密損失を有していた。
【0202】
細胞は、実施例1において説明されたような青色光を使用して刺激され、それらの活動電位は、電圧トレースとして記録した。記録は、対照細胞と、いずれかの試験化合物が存在しないときに刺激されるときの疾患-モデル細胞とから成っていた。記録はまた、無差別カリウムチャネル阻害因子4-APおよび無差別ナトリウムチャネル阻害因子ラモトリジンの存在下で刺激されるときの疾患-モデル細胞から成っていた。
【0203】
図23は、細胞が青色光により刺激されたときの記録された活動電位から抽出された活動電位特徴を使用して機械学習システムによって生成された機能的表現型を表すレーダプロットを提供する。特徴についての値は、対照細胞記録に対して正規化される。左のプロットは、ナトリウムチャネル阻害因子が存在するときの疾患-モデル細胞からの抽出された特徴の機能表現型を示す。右は、カリウムチャネル阻害因子が存在するときの疾患-モデル細胞から表現型を示す。記録されたトレースにおける差異は、レーダプロットに対して提供される特徴を選択し、疾患-モデルの機能的表現型を示す。4-APは、4-APが存在しないときの疾患-モデル細胞と比較するとき、疾患-モデル細胞の活動電位特徴を対照細胞のものにより近くにすることによって、レーダプロットに示されるように、表現型を実質的に反転した。対照的に、ラモトリジンは、挙動を摂動したが、表現型を反転しなかった。
【0204】
レーダプロットは、疾患表現型および化合物効果の容易な視覚化を可能にする。
【0205】
図24は、その2つのみが示される、記録されたパラメータの約300次元空間に、抽出された活動電位特徴をマッピングすることによって記述された表現型反転および「副作用」を例示する図である。対照細胞(WT)ウエルに対する抽出された特徴(緑色)は、KO細胞に対する特徴(赤色)にあるようにクラスタ化される。それらの集団の間のベクトルは、表現型(赤色)を表す。薬物効果(青色)は表現型ベクトルに沿った(表現型反転)および表現型ベクトルに直交する(副作用)成分に分離される。理想的な薬物は、突然変異の効果を取り消し、KOクラスタから対照細胞クラスタにウエルを移動させる。
【0206】
図25は、表現型/副作用空間上に投影された多くのウエルを示すプロットである。WTおよびKOウエルは、表現型方向に沿って分割されるウエルである。
図25からの2つの化合物(0.28~600μmの8濃度)の適用は、濃度が増大するにつれてKO細胞挙動に対する効果を増大させてきた。4-APは、WT挙動に向かっておよびWT挙動を超えて細胞挙動を移動させると共に、ラモトリジンは、WTおよびKOの両方から離れて挙動を移動させる。接続された薬物ポイントは、濃度が増大する順序にあり、2つのラインは、2週間続けての実験に対する実験的複製である。
【0207】
よって、この実施例は、様々な濃度におけるものを含む、薬物化合物への細胞反応を正確に確認するために活動電位特徴が使用されることができることを示す。
【0208】
(実施例3)
いくつかの化合物によって引き起こされた活動電位特徴に対する効果の特徴付け
【0209】
この実施例は、様々な標的に効果があるいくつかの異なる化合物に反応した細胞の変化した挙動を特徴付ける機能的表現型を導出するために、現在開示されているシステムおよび方法が使用されることができることを示す。
【0210】
E18ラットの海馬神経は、14日の間に培養され、実施例1において説明されたような光パッチタンパク質を発現するように引き起こされた。細胞は、XE-991(Kv7.x阻害因子)、ML-213(Kv7.x開口薬)、a-デンドロトキシン(Kv1.x阻害因子)、OXO-M(ムスカリンアゴニスト)、4AP(無差別Kv阻害因子)、イスラジピン(Cav1.x阻害因子)、または対照ビークルが存在するときに刺激された。
【0211】
図26は、多次元に従った神経スパイク挙動における薬物誘発変化を示す、生成された機能的表現型を表すレーダプロットを提供する。活動電位特徴値は、対照ビークルが存在するときに刺激された細胞に対する特徴値に正規化された。レーダプロットに示されるように、各々の化合物は、識別可能かつ一意な機能的表現型を提供した。例えば、XE-991、電圧ゲートカリウムチャネルKv7.x阻害因子、およびML-213、Kv7.x開口薬は、予想されるように、細胞反応を駆動した。
【0212】
図27は、化合物の様々な濃度の存在下で細胞に対する濃度反応曲線を提供する。各々のシンボルは、1つのウエル内の100よりも多い細胞を表し、全ての測定が1日に取得された。よって、本システムおよび方法は、様々な化合物の治療的反応を解明することができるだけでなく、濃度依存反応をも示すことができる。その上、測定が1日に行われたように、現在開示されているシステムおよび方法は、高速の、高スループット薬物スクリーニングを有効にする。
【0213】
(実施例4)
薬理学的効果および疾患表現型の一貫しかつ再現可能な測定
【0214】
この実施例は、開示のシステムおよび方法を使用して取得された測定が、均一であり、一貫し、かつ再現可能であることを示す。
【0215】
E18ラットの海馬神経は、14日の間に培養され、実施例1において説明されたような光パッチタンパク質を発現するように引き起こされた。細胞は、96-ウエルプレートのウエルに置かれた。1μmにおけるML-213は、プレートの交互のカラムに追加され、対照ビークルが残りのカラムに追加された。全てのウエル内の細胞が刺激され、それらの活動電位は、実施例1において説明されたような顕微鏡を使用して記録された。
【0216】
図28は、96-ウエルプレート内の神経の顕微鏡から取得された高SNR蛍光電圧記録を示す。青色光刺激が下に示される。
【0217】
図29は、各々のカラムにおいて記録されたスパイクを示すラスタプロットを示す。
【0218】
図30は、ウエルごとの青色光刺激ランプの間の平均発火頻度を提供する。示されるように、ビークルウエル(緑色)およびML-213ウエル(赤色)が明確に区別可能であるように、ML-213は、発火頻度を劇的に低減させる。
【0219】
図31は、青色光刺激ランプの間の各々のウエル内の記録されたスパイクの数を示すヒートマップを提供する。
【0220】
図32は、青色光刺激ランプの間の各々のウエル内の個別の細胞に対して記録されたスパイクの平均数のプロットを提供する。計算された0.31のZ’は、73,000個のウエルの1つ内の機能しないコールを示し、測定がウエルにまたがって一貫することを示し、本発明のシステムおよび方法が薬物発見スクリーニングにおいて使用されることを可能にする。
【0221】
図33は、96-ウエルプレートのウエル内のDRG神経ごとに記録されたスパイクの平均数のプロットを提供する。プレートの各々のカラムは、関節炎患者の関節において発見された炎症性メディエータの対照ビークルまたは混合物のいずれかと接触した。予想されるように、メディエータを有するウエル内の細胞は、対照ビークルを有するウエル内の活動電位よりも多くの活動電位を発火した。Z’スコアは、異なる生物学的状態が存在するとき、および/または異なる薬物化合物の存在下で細胞の表現型を正確に区別するための、現在開示されているシステムおよび方法の再現性および一貫性を再度示す。炎症性メディエータの混合物は、参照によって本明細書に組み込まれる、国際公開第2018/165577号に説明されるような組成物であり得る。
【0222】
(実施例5)
同質遺伝子型疾患モデルを使用した活動電位特徴抽出
【0223】
現在開示されているシステムおよび方法は、機能的表現型を生み出すために、多くの神経タイプおよび/または疾患モデルに適用されることができる。
【0224】
野生型細胞が取得されており、CRISPR/Cas9システムは、遺伝子をノックアウトして、同質遺伝子型クローンを生み出すために使用されており、同質遺伝子型クローンは、神経を拡大し、および神経に転化され、実施例1において説明されたような光パッチタンパク質を発現するように引き起こされた。ノックアウトは、機能の喪失に起因して単因性てんかん表現型を示す神経を引き起こした。ノックアウトは、機能の喪失に対するヘテロ接合性またはホモ接合性のいずれかを生じさせた。
【0225】
図34に示されるように、ノックアウトの標的であったタンパク質は、ホモ接合性ノックアウト細胞内で取り除かれており、ヘテロ接合性ノックアウト細胞内で発現を低減させてきた。
【0226】
図35は、複数の細胞株にまたがって記録された電圧トレースからのスパイクを提供し、複数の細胞株は、野生型(緑色)、ノックアウトに対するホモ接合性(ピンク色)、またはノックアウトに対し、臨床的に有効な化合物が存在するときに刺激されたホモ接合性(黒色)のいずれかであった。示されるように、異なる野生型細胞株および異なるノックアウト細胞株は、一貫したスパイク形状を提供したと共に、野生型およびホモ接合性ラインは、相互から一貫して異なる。更に、臨床的に有効な化合物の存在下での刺激は、野生型のものにより近いノックアウトのものからスパイク形状を一貫して移動させた。
【0227】
図36は、複数の細胞株にまたがって記録された電圧トレースからのスパイクを提供し、複数の細胞株は、野生型(緑色)、ノックアウトホモ接合性(ピンク色)、ヘテロ接合性ノックアウト突然変異を有する患者からのもの(紫色)、またはノックアウトを含まなかった患者ラインに対する家族性対照からのもの(青色)のいずれかであった。ヘテロ接合性患者細胞株は、一貫しているが、ホモ接合性ノックアウト変異株よりも深刻でない表現型を生じさせた。
【0228】
図37は、
図35におけるスパイクを提供した電圧トレースから抽出された特徴から、機械学習システムを使用して生成された機能的表現型を表す多次元レーダプロットを提供する。プロットは、神経形態と、活動電位形状と、野生型細胞(緑色)、ホモ接合性ノックアウト細胞(ピンク色)、および臨床的に有効な化合物が存在するときに刺激されたホモ接合性ノックアウト細胞(緑色)の間のスパイク訓練挙動とにおける変化を明らかにする。予想されるように、臨床的化合物による処置は、全てのメトリックのためにWTに対する特徴に向かってホモ接合性ノックアウト細胞株の機能表現型を移動させる。
【0229】
図38は、突然変異および臨床的に有効な化合物が細胞挙動に対して有する効果を即時的に特徴付けるための、さらなる活動電位特徴の次元低減を表す疾患スコアを提供する。この疾患スコアは、試験された全てのラインにわたる一貫しかつ比較可能であるロバストな表現型を提供する。更に、予想されるように、この低減された次元でさえ、本発明の方法およびシステムは、WT表現型を救済するための薬物の能力を容易に決定することができる。
【0230】
関連する実験では、CRISPR/Cas9システムは、単因性てんかん疾患モデルに対するイオンチャネルに機能獲得突然変異を導入するために使用された。
【0231】
図39は、機能獲得細胞(青色)および野生型対照細胞(紫色)に対して測定されたスパイクパラメータおよびスパイク率を提供する。予想されるように、突然変異は、活動電位形状および疾患モデル神経とそれらの同質遺伝子型対照との間の発火挙動を変化させる。
【0232】
よって、多様な薬理学的機構を試験することに加えて、開示のシステムおよび方法は、異なる疾患モデルに対する多くの神経タイプに適用されることができる。まさに提供される実施例では、開示のシステムおよび方法は、齧歯類CNS神経と、齧歯類DRG感覚神経と、NGN2皮質の励起性、抑制性、および運動性神経を含む、複数のタイプのヒトiPSC由来神経との中で薬理学的効果によって引き起こされた細胞挙動における変化を特徴付ける機能的表現型を発達させるように活動電位特徴を記録するために使用された。その上、実施例は、CRISPR/Cas9および患者由来神経を有する遺伝子ノックアウトまたはノックインを使用した、同質遺伝子型背景内の疾患モデルを含む、異なる神経疾患モデルを含む。
【0233】
(実施例6)
高スループット、全領域刺激アッセイ
【0234】
上記説明された固有励起性測定に加えて、開示のシステムおよび方法は、シナプス機能への鋭敏な測定を生成することができる。方法は、個別の細胞内の励起性および抑制性シナプス後電位(EPSPおよびIPSP)、カルシウム撮像またはマイクロ電極アレイにより取得されることができない情報を測定するために使用され得る。有利なことに、システムおよび方法は、励起性測定のスループットと比較可能なスループットにより、96-ウエルプレートフォーマットおよび384-ウエルプレートフォーマットにおいてロバストに実装されることができる。
【0235】
シナプス機能の高スループットスクリーニングは、Creリコンビナーゼおよびフロックス構造を使用して、E18ラットの海馬神経:アクチュエータCheRiffを発現するシナプス前神経および電圧-センサQuasArを発現するシナプス後神経の明確に異なる集団により実行された。全ての細胞は、CreOFF-CheRiff(Creは、CheRiffを切除し、発現をターンオフする)およびCreON-QuasAr(Creは、前方の向きに向かってQuasArを反転させ、発現をターンオンする)を発現した。Creは、QuasArまたはCheRiffのいずれかを発現する神経のばらばらの集団を生じさせる神経のサブセットを変換するように、低滴定量に添加された。青色光の短いパルスは、シナプス前細胞内の活動電位を作動させるように神経に伝達され、シナプス後電位は、シナプス後細胞内で検出された。
【0236】
図40は、CheRiffが神経のサブセット(シナプス前神経4001)(典型的には、10~50%)において発現され、QuasArが残り(典型的には、50~90%)(シナプス後神経4002)において発現されることを示す。
【0237】
図41は、黄水晶と癒合されたQuasAr(緑色)、EBFP2と癒合されたCheRiff(青色)、および自動化画像セグメンテーションのために使用される核輸送TagRFP(赤色)を示す、本明細書で説明されたような顕微鏡を使用して取得された蛍光画像を提供する。
図42は、シナプス後電位(PSP)を示す単一細胞蛍光トレースを示す。シナプスシグナルは、AMPA、NMDA、およびGABAを薬理学的に隔離することによって独立して精査された。
【0238】
図43は、AMPARおよびGABAARアッセイに対するアゴニストおよび阻害因子を制御することに反応した単一の細胞PSPの調節を示す。CheRiff刺激が底部に示される。
【0239】
図44は、対照薬理学に対する平均PSPトレースを示し、黒色が薬物前を示し、シアンが競合阻害因子[AMPAR:100μmのNBQX/CNQX、389個の細胞、GABAAR:20μmのガバジン、176個の細胞]を示し、緑色が陰性アロステリック調節因子(NAM)[100μmのGYKI53655、291個の細胞、GABAAR:30μmのピクロトキシン、176個の細胞]を示し、紫色がビークル対照[AMPAR:167個の細胞、GABAAR:236個の細胞]を示し、青色、赤色、および黄色が陽性アロステリック調節因子(PAM)[AMPAR:0.1~1μmのシクロチアジド、512個の細胞、GABAAR:0.1~1μmのジアゼパム、244個の細胞]を示す。
【0240】
図43~44に示されるように、適切なシナプス後チャネル阻害因子を使用することは、励起性と、AMPAチャネルおよびNMDAチャネルから結果として生じる脱分極化電圧変化と、GABAAチャネルからの抑制性過分極化電圧変化との隔離を有効にする。
【0241】
図45は、平均薬物前反応に正規化されたPSPエリア内の薬物誘発変化を示すドット密度プロット(各々のドットが1つのシナプス後神経である)を与える。黒色のウィスカは、平均±SEMである。密度プロットは、測定された多数の個別の細胞をハイライトし、陽性チャネル調節因子および陰性チャネル調節因子の両方の明確な効果を示す。蛍光ラベルにより細胞タイプが識別される場合、追加の識見が取得されることができる。例えば、励起性細胞および抑制性細胞は、抑制性プロモータによって駆動されたGFPを包含するレンチウイルス構築物により細胞を変換することによって区別されることができ、励起性サブタイプおよび抑制性サブタイプは、マウスCreラインを使用して識別されることができる。シナプスアッセイは、顕微鏡のDMDにより単一のシナプス前細胞を刺激することによって、個別のシナプスを解決することができる。
(実施例7)
高スループットスクリーニング
【0242】
開示の方法およびシステムは、疾患および薬理学的化合物に起因した細胞挙動変化を特徴付けるように、活動電位特徴から導出された機能的表現型を使用して薬物の高スループットスクリーニング(HTS:high-throughput screening)を実装するために使用されることができる。
【0243】
プレートの生成は、疾患関連表現型を識別するために、薬物スクリーニングアッセイに対して自動化され、高スループット薬物スクリーニングに対して最適化される。ヒートマップ分析は、プレート内変動およびプレート間変動を特徴付けるために使用される。細胞のメッキおよび扱いにおける変化、刺激プロトコール、ならびにアッセイ持続時間が試験され、20%を下回るプレート内変動およびプレート間変動を結果としてもたらすと共に、説明されるような0.3を上回るZ’値を維持する。
【0244】
DMSO許容差は、緩衝液対照値と比較したアッセイ窓の大きさにおける10%を下回る変化を生み出すDMSOレベルを識別するように、濃度反応実験を使用して定義される。アッセイ用意の確認に従って、5つのスクリーニングプレートの小さいセットは、最終的なスクリーニング濃度の選択をガイドするように、ライブラリからランダムに選択される。化合物のそれらのプレートは、1、3、7、および10 Mの濃度において複製してスクリーニングされる。対照値からの3の標準偏差(SDの)よりも大きい変化として定義されたヒットと共に、約1%のヒットレートを得る化合物濃度が選択される。この濃度を使用して、最小の偽陽性により多数の真のヒットが捕捉される。
【0245】
FDAのパイロットスクリーニングは、薬物ライブラリを承認しており、ツール化合物は、世界的に承認されたおおよそ2400個の薬物のライブラリを使用する。そのライブラリは、選択されたスクリーニング濃度において利用可能なツール化合物の選択されたセットを発見するようにスクリーニングされる。このライブラリが活性化合物を含有する可能性が高いので、このステップは、HTSに対するアッセイ用意の最終試験としての役割を果たし、ヒット選択基準を確立するためのデータセットを提供する。化合物ライブラリは、100%のDMSOにおいてバーコードの384-ウエルプレート内で作製される。
【0246】
例示的な方法は、HTSに対する試薬の生成およびバンキングを含む。均一な細胞作製を保証するために、1つは、3億個のiPSC由来NGN2神経、1億個の一次齧歯類グリア、および光パッチ構築物をコードするレンチウイルスの大量のバッチを生成し、アリコートし、および凍結する。各々のバッチは、スクリーニングを1.5倍実行するのに十分である。効率性および均一性を改善するために、自動化細胞培養工程がHTS活性の全体を通じて適用される。
【0247】
例示的な方法は、HTSスクリーニングおよびヒット確認を含む。化合物は、対照に対して保存された各々のプレート内の32個のウエルと共に、選択されたスクリーニング濃度において384-ウエルフォーマット(n=1)においてスクリーニングされる。プレートごとのスキャン時間は、アッセイプロトコールに依存するが、全体的におおよそ90分を要し、それは、3スクリーニング日/週において本明細書で説明されるような1つの顕微鏡上で5,000よりも多い化合物/週のスクリーニングを有効にする。過度な変動(Z’<0.3)、少数の活性細胞、または均一でないメッキを有するプレートは、再現のためにフラグ付けされる。ヒット選択および確認は、HTSに従って行われる。
【0248】
図46は、高スループットスクリーニングのための例示的な方法の図である。
【0249】
ヒットは、マルチパラメータ表現型スコアおよび副作用スコアの反転に基づいて最初に選択される。ヒット選択基準は、プレート内対照値からの3よりも多いSD変化を示す化合物として定義されたヒットと共に統計的基準に基づいている。
【0250】
最大で200個の選択されたヒットの活性は、1倍および0.3倍のスクリーニング濃度において複製して最初に確認される。2倍の濃度は、単調でない濃度反応を有する化合物を識別することを支援する。確認されたヒットは、表現型反転および副作用を定量的に特徴付けるように、11-pt濃度反応において試験される。結果は、プラットフォーム性能を確認する。
(実施例8)
コンピュータシステム
【0251】
図47は、1つまたは複数の電気的活性細胞の活性の記録を行うコンピュータシステム4701を示す。ビデオデータは、画像センサ1435から処理モジュール4705に流れ、処理モジュール4705は、既知の病理を有する細胞および病理を有さない細胞からの記録を含む、訓練データに対して訓練された機械学習システム4709に記録を提示するようにメモリに結合されたプロセッサを使用する。機械学習システム4709は、電気的活性細胞の表現型を報告する。処理モジュール4705は、機械学習システム4709への入力として提示され得る、ビデオデータ内の活動電位からの特徴を測定し得る。必要に応じて、バジェットラッパは、入力として使用されることになる制限された数(例えば、8、10、または12など)のそのような特徴のみを選択する。選択されたデータは、機械学習システム4709に入力として提示され、機械学習システム4709は、撮影される生きている電気的活性細胞の表現型を出力として与える。
【0252】
出力が表現型であることを理由に、出力(よって、機械学習システム4709)は、細胞が病理によって影響を及ぼされるかどうかを報告する。よって、機械学習システム4709は、試験化合物が疾患によって影響を及ぼされた細胞に対する効能を有するときを示すことができる。
【0253】
システム4701は、未処理動画データを圧縮するために動作可能である。処理モジュールは、センサ1435を介して、電気的活性細胞のデジタルビデオデータを取得することによって、圧縮を実行し得る。システム4701は、ブロックごとに、そのブロックの共分散マトリックスおよび固有値分解を計算し、固有値分解を切り捨て、いくつかの主成分のみを維持し、それによって、ブロックからのノイズを破棄することによって、ブロックワイズ方式においてビデオデータを処理する。更に、システム4701は、維持された主成分のみを使用して、圧縮されたビデオとしてビデオをメモリに書き込む。好ましい実施形態では、システム4701は、少なくとも10の係数によって、好ましくは、更には約20倍~200倍圧縮によってビデオを圧縮し、システム4701がリモートストレージ4729に圧縮されたビデオを書き込むことを可能にし、リモートストレージ4729は、サーバシステム、クラウドコンピューティングリソース、または第三者システムであり得る。
(実施例9)
階層型ブートストラッピングアルゴリズム
【0254】
実施形態は、統計試験および信頼区間構築と共に、階層的な入れ子データに対する検定力分析のための能力を有する階層型ブートストラッピング関数と、任意の数のレベルにおいて階層型データからサンプリングすることを可能にする回帰的再サンプリングアルゴリズムとを含む。入れ子データに排他的に焦点を当てることは(本開示のための関連しかつ貴重なケース)は、この構造を完全に活用し、in vitro生物学用途のための強力かつ効率的なカスタムツールを構築することを有効にする。センサ1435を使用して行われる電気的活性細胞からの測定のために、処理モジュール4705は、特徴を回帰的に再サンプリングすることができる。
【0255】
図48は、処理モジュール4705によって呼び出されることができる回帰的再サンプリングルーチンの図である。メイン入力は、階層情報を包含するカラムのリスト(例えば、{「CellId」、「PlateId」、「WellId」})と、レベルごとに選択するいくつかの試料(ユーザによって指定されない場合、アルゴリズムは元のデータセットのサイズを模倣し、例えば、データが各々で96個のウエルの有する6プレートの2ラウンドから成る場合、各々で96個のウエルを有する6プレートの2ラウンドをサンプリングする)と、使用するエスティメータおよび有意レベルと、を使用する階層および特徴を定義するメタデータを有するテーブルを含む。ルーチンは、必要に応じて、集団に対する統計(提供されない場合、テーブル内の全ての数値特徴を使用する)および/または集団を指定するカラム(1または2の集団を現在サポートする)を計算するための特徴を含み得る。
【0256】
全体的に、前処理は、統計を実行するように所望の数値特徴のマトリックスを抽出することと、階層情報を使用して、再サンプリング関数への群情報および入力を作製することとを含み得る。検定力分析を実行する場合、真の測定ノイズデータに指定されたサイズのシグナルを追加する。所望の回数の反復の間、試料行インデックス、特徴マトリックスにアクセスし、全ての特徴を一度に再サンプリングするための使用行インデックスは、全ての特徴に対する所望の試験統計を一度に計算し、所望のエスティメータに基づいて、結果テーブルを作製する。ルーチンは、所望の推定を包含する結果テーブル、反復ごとに計算された統計のテーブルを出力する。再サンプリングアルゴリズムの実装態様は、回帰的実装に起因して、任意の数のサンプリングレベルに適合する。メイン入力は、階層群情報(必要に応じて、集団情報を有するエクストラカラムを包含する)およびレベルごとに選ぶ試料の数(全てゼロである場合、群情報から試料サイズを推論し、同一のフォーマットの試料を返す)のマトリックスを含む。出力:再サンプリングされた行インデックスのベクトル。
【0257】
第1の再サンプリングステップおよび回帰的呼び出しについての実施例として、ルーチンは、最高レベルにおいて所望の数をサンプリングする(提供される場合、集団情報を考慮に入れて)。試料ごとに、ルーチンは、対応する下位の階層レベルを選択し、下位レベルデータに対するアルゴリズムを呼び出す。試料インデックスは、元のテーブルからのサンプリングされた行インデックスを包含する1つの出力ベクトルに組み合わされる。
【0258】
説明される回帰的ブートストラッピングアルゴリズムは、検定力分析を実行するために有用である。検定力分析は、所与の生物学的クエリまたは化学的クエリのためにどの程度の大きさで(ウエルの数、複製の数、試験の回数など)実験が実行されるべきであるかを決定するために有用であり得る。
【0259】
別の実施形態は、訓練された機械学習システム4709がデータを過適合することを回避するように機械学習システム4709を訓練するときに有用な増補されたデータを作成するために、好ましくは非回帰的ブートストラッピングアルゴリズムを使用する。
参照による組み込み
【0260】
特許、特許出願、特許公開、刊行物、本、論文、ウェブコンテンツなどの他の文書への参照および引用が本開示の全体を通じて行われてきた。全てのそのような文書は、全ての目的のためにそれらの全体での参照によって本明細書で以下に組み込まれる。
同等物
【0261】
本明細書で示されおよび説明されたものに加えて、本発明およびその多くの更なる実施形態の様々な修正は、本明細書で引用された科学的文献および特許文献への参照を含む、本文書の全内容から当業者にとって明らかであろう。本明細書における主題は、その様々な実施形態およびその同等物における本発明の実施に適合されることができる重要な情報、例示、およびガイダンスを包含する。
【国際調査報告】