IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザルトリウス バイオアナリティカル インストゥルメンツ, インコーポレイテッドの特許一覧

特表2024-515512迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ
<>
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図1
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図2
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図3
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図4
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図5
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図6
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図7
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図8
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図9
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図10
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図11
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図12
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図13
  • 特表-迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-10
(54)【発明の名称】迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイ
(51)【国際特許分類】
   G16B 40/20 20190101AFI20240403BHJP
   C12M 1/34 20060101ALI20240403BHJP
【FI】
G16B40/20
C12M1/34 A
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023560687
(86)(22)【出願日】2022-03-30
(85)【翻訳文提出日】2023-11-28
(86)【国際出願番号】 US2022022490
(87)【国際公開番号】W WO2022212463
(87)【国際公開日】2022-10-06
(31)【優先権主張番号】21166201.0
(32)【優先日】2021-03-31
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】17/218,439
(32)【優先日】2021-03-31
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520431409
【氏名又は名称】ザルトリウス バイオアナリティカル インストゥルメンツ, インコーポレイテッド
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】マイケル・ダブリュー・オルゾーイ
(72)【発明者】
【氏名】オスカー-ウェルナー・リーフ
(72)【発明者】
【氏名】ジョアン・トゥリッグ
(72)【発明者】
【氏名】リチャード・ウェールズ
(72)【発明者】
【氏名】リカード・シェーグレン
(72)【発明者】
【氏名】クリストファー・エドルンド
【テーマコード(参考)】
4B029
【Fターム(参考)】
4B029AA07
4B029BB13
4B029CC05
4B029FA02
4B029FA10
4B029GB06
(57)【要約】
ウイルス集団を含む細胞培養物の画像または画像のシーケンスからウイルス力価を予測するために機械学習モデルをトレーニングするための方法について説明する。トレーニング済み機械学習モデルは、ウイルス力価の予測が標準的なウイルスプラークアッセイにおける予測よりもはるかに早く、例えば、ウイルスサンプルを細胞培養物に最初に接種してから6または8時間において行われることを可能にする。方法は、(1)開始時間t0から最終時間tfinalまでの1つまたは複数の時点における複数の実験からのウイルス処理された細胞培養物の画像の複数のセットの形態においてトレーニングセットを取得するステップと、(2)各実験について、最終時間tfinalにおけるウイルス処理された細胞培養物の少なくとも1つのウイルス力価の数値読み出しを記録するステップと、(3)トレーニングセット内のすべての画像を処理して、各画像の数値表現を取得するステップと、(4)トレーニングセットの数値表現において、最終的なウイルス力価の予測を行うように1つまたは複数の機械学習モデルをトレーニングするステップとを含む。
【特許請求の範囲】
【請求項1】
ウイルス集団を含む細胞培養物の画像または画像のシーケンスからウイルス力価を予測するために機械学習モデルをトレーニングするための方法であって、
(1)開始時間t0から最終時間tfinalまでの1つまたは複数の時点における複数の実験からのウイルス処理された細胞培養物の複数の画像の形態においてトレーニングセットを取得するステップと、
(2)各実験について、前記最終時間tfinalにおける前記ウイルス処理された細胞培養物の少なくとも1つのウイルス力価の数値読み出しを記録するステップと、
(3)前記トレーニングセット内の前記画像を処理して、各画像の数値表現を取得するステップと、
(4)前記トレーニングセットの数値表現において、最終的なウイルス力価の予測を行うように1つまたは複数の機械学習モデルをトレーニングするステップと
を含む、方法。
【請求項2】
前記ウイルス力価の読み出しが、感染性粒子の数、または単位体積あたりの感染性粒子の数を含む、請求項1に記載の方法。
【請求項3】
前記ウイルス力価の読み出しが、組織培養感染量50%アッセイからの読み出しを含む、請求項1に記載の方法。
【請求項4】
前記ウイルス力価の読み出しが、焦点形成アッセイからの読み出しを含む、請求項1に記載の方法。
【請求項5】
前記ウイルス力価の読み出しが、感染性粒子の数、または単位体積あたりの感染性粒子の数と、組織培養感染量50%アッセイとの組合せを含む、請求項1に記載の方法。
【請求項6】
前記トレーニングセットの画像が、無標識の光学顕微鏡画像を含む、請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記トレーニングセットの画像が、蛍光マーカーで標識された前記細胞培養物の蛍光画像を含む、請求項1から5のいずれか一項に記載の方法。
【請求項8】
前記トレーニングセットの画像が、発色検出システムで標識された前記細胞培養物の免疫組織化学画像を含む、請求項1から5のいずれか一項に記載の方法。
【請求項9】
前記処理するステップ(3)が、前記画像を畳み込みニューラルネットワーク(CNN)に通過させて、前記画像の中間データ表現を取得するステップを含む、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記処理するステップ(3)が、
a)前記画像から個別の細胞をセグメント化するステップと、
b)各細胞の細胞ごとの数値記述を計算するステップと、
c)すべての細胞にわたって前記数値記述を集約するステップと
をさらに含む、請求項1から8のいずれか一項に記載の方法。
【請求項11】
ウイルスによって感染されていない細胞をフィルタリングするステップをさらに含む、請求項10に記載の方法。
【請求項12】
死細胞をフィルタリングするステップをさらに含む、請求項10に記載の方法。
【請求項13】
ウイルス感染により死滅しなかった死細胞をフィルタリングするステップをさらに含む、請求項10に記載の方法。
【請求項14】
前記機械学習モデルが、部分最小二乗線形モデル、人工ニューラルネットワーク、ガウス過程回帰、およびニューラル常微分方程式モデルのうちの1つを含む、請求項1から13のいずれか一項に記載の方法。
【請求項15】
前記トレーニングするステップ(4)が、最終的なウイルス力価のモデル予測と、最終時間tfinalにおける前記ウイルス処理された細胞培養物の前記少なくとも1つの数値ウイルス力価の数値読み出しに関連するグラウンドトゥルースとの間の誤差を最小化するステップを含む、請求項1から13のいずれか一項に記載の方法。
【請求項16】
各時点について、異なるクラスのウイルス、異なる細胞タイプ、または異なる機械学習モデルに対してステップ(1)~(4)を繰り返すステップをさらに含む、請求項1から15のいずれか一項に記載の方法。
【請求項17】
ステップ(1)において少なくとも2つの時点が存在し、前記少なくとも2つの時点間の期間が60分以下である、請求項1から16のいずれか一項に記載の方法。
【請求項18】
前記ウイルス集団を含む前記細胞培養物が、限定はしないが寒天オーバレイを含む、半固体培地オーバレイを含む、請求項1から17のいずれか一項に記載の方法。
【請求項19】
未知の力価のウイルスサンプルが加えられた細胞培養物のウイルス力価を予測するための方法であって、
a)前記細胞培養物の画像の時系列を取得するステップと、
b)ステップa)において取得された前記画像の時系列の数値表現を、請求項1から18のいずれか一項に記載の方法に従ってトレーニングされた1つまたは複数の機械学習モデルに供給するステップと、
c)前記トレーニングされた1つまたは複数の機械学習モデルを用いて前記ウイルス力価の予測を行うステップと
を含む、方法。
【請求項20】
前記ウイルス力価の前記予測が、感染性粒子の数、単位体積あたりの感染性粒子の数、または組織培養感染量50%アッセイからの読み出しの予測である、請求項19に記載の方法。
【請求項21】
ステップa)において取得される前記画像の時系列が、前記細胞培養物を含む1つまたは複数の培養プレートを保持し、統合イメージングシステムを有する機器において取得される、請求項19に記載の方法。
【請求項22】
前記統合イメージングシステムが蛍光イメージングシステムを含む、請求項21に記載の方法。
【請求項23】
前記細胞培養物が、前記細胞培養物のイメージングを支援する特殊な培地をさらに含む、請求項19から22のいずれか一項に記載の方法。
【請求項24】
前記特殊な培地が、細胞内容物の放出に反応する試薬、ウイルス抗原上に凝集する試薬、蛍光色素、ならびに生細胞対死細胞の検出、アポトーシスおよびオートファジー経路の活性化、細胞周期、および酸化ストレスなどの、細胞変性効果の早期検出のために使用される試薬のうちの少なくとも1つをさらに含む、請求項23に記載の方法。
【請求項25】
前記ウイルスサンプルを含む前記細胞培養物が、限定はしないが寒天オーバレイを含む、半固体培地オーバレイを含む、請求項19から24のいずれか一項に記載の方法。
【請求項26】
細胞培養物とウイルスサンプルとを含む1つまたは複数のプレートを保持するように構成されたシステムと、
統合イメージングシステムと、
前記統合イメージングシステムによって取得された前記細胞培養物の画像の時系列における1つまたは複数の画像から前記細胞培養物内のウイルス力価の予測を行うようにトレーニングされた機械学習モデルであって、前記予測が、前記細胞培養物のウイルス感染が終期に進む前に行われる、機械学習モデルと
を備える、分析機器。
【請求項27】
前記分析機器が、トレーニングモジュールを実行する処理ユニットでさらに構成され、前記トレーニングモジュールが、前記分析機器のユーザが前記分析機器を用いてトレーニング方法を実行するのを容易にするためのセットアップ指示を提供し、前記トレーニング方法が、
(1)開始時間t0から最終時間tfinalまでの時点のセットにおける複数の実験からのウイルス処理された細胞培養物の複数の画像の形態においてトレーニングセットを取得するステップと、
(2)各実験について、時間tfinalにおける前記ウイルス処理された細胞培養物の少なくとも1つのウイルス力価の数値読み出しを記録するステップと、
(3)前記トレーニングセット内のすべての画像を処理して、各画像の数値表現を取得するステップと、
(4)前記トレーニングセットの数値表現において、最終的なウイルス力価の予測を行うように1つまたは複数の機械学習モデルをトレーニングするステップであって、前記トレーニングが、最終的なウイルス力価のモデル予測とグラウンドトゥルースとの間の誤差を最小化することを含む、ステップと
を含む、請求項26に記載の分析機器。
【請求項28】
前記処理するステップ(3)が、
a)前記画像から個別の細胞をセグメント化するステップと、
b)各細胞の細胞ごとの数値記述を計算するステップと、
c)すべての細胞にわたって前記数値記述を集約するステップと
をさらに含む、請求項27に記載の分析機器。
【請求項29】
前記処理するステップ(3)が、ウイルスによって感染されていない細胞をフィルタリングするステップをさらに含む、請求項28に記載の分析機器。
【請求項30】
前記処理するステップ(3)が、死細胞をフィルタリングするステップをさらに含む、請求項28に記載の分析機器。
【請求項31】
前記処理するステップ(3)が、ウイルス感染により死滅しなかった死細胞をフィルタリングするステップをさらに含む、請求項28に記載の分析機器。
【請求項32】
前記機械学習モデルが、部分最小二乗線形モデル、人工ニューラルネットワーク、ガウス過程回帰、およびニューラル常微分方程式モデルのうちの1つを含む、請求項26から31のいずれか一項に記載の分析機器。
【請求項33】
分析機器に関連付けられた処理ユニットのための命令のセットを記憶した非一時的コンピュータ可読記憶媒体であって、前記分析機器が、細胞培養物の画像の時系列を取得するためのイメージングシステムを含み、
前記命令のセットが、トレーニング済み機械学習モデル上で動作して、前記イメージングシステムの時系列内の1つまたは複数の画像から前記細胞培養物内のウイルス力価の予測を行い、前記予測が、前記細胞培養物のウイルス感染が終期に進む前に行われる、非一時的コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願との相互参照
本出願は、参照によりそれぞれの内容の全体が本明細書に組み込まれている、2021年3月31日に出願した米国出願第17/218,439号、および2021年3月31日に出願した欧州特許出願第21166201.0号の優先権を主張するものである。
【0002】
本開示は、細胞ベースの機能性ウイルス計数アッセイを実行するための方法およびシステムに向けられており、より具体的にはそのようなアッセイを通常よりもはるかに短い時間で完了させるための方法およびシステムに向けられている。
【背景技術】
【0003】
活性ウイルスなどのウイルスの機能性は、現在様々な方法において測定される。最も広く使用されている方法は、1953年に初めて記述された標準プラークアッセイである。アッセイは、標的細胞の感染および溶解を介してウイルス機能を測定する。アッセイは、サンプル内の機能性ウイルスまたはプラーク形成単位の数を示すプラーク力価(濃度)をもたらす。基本的な方法を図1に示す。まず、細胞が最初にプレーティングされ、コンフルエンスまで増殖される。次いで、未知の濃度(力価)のウイルスサンプルが連続的に希釈され、細胞を含むプレート(しばしば、ペトリ型皿またはプレートの形態)に加えられる。次に、2~14日後に、細胞単層は、溶解(プラーク)の領域を明らかにするために染色される。最後に、プラークの数は、元のサンプルのウイルス力価を決定するために、希釈用に調整される。
【0004】
50パーセント組織培養感染量(TCID50)などの他の機能的アッセイは、プラークアッセイの派生である。ウイルスと細胞の培養期間は、すべてで、2~12日に機能的感染力を測定するために使用されるウイルスと細胞とに応じた日数を加えた日数を必要とする。
【0005】
表1によって示すように、機能的および非機能的なウイルス粒子の合計と、プラーク形成単位(PFU)との比率において、大きい差異が存在する。感染力価または伝染性粒子数、および総粒子数が、完全なウイルス特性評価に不可欠である。粒子とPFUとの比率は、桁違いに変化する可能性がある。
【0006】
【表1】
【0007】
したがって、ワクチン開発および製造などの商業用途と、遺伝子治療における安全性の両方について、プラークアッセイを介する機能的ウイルス力価と、ウイルスサンプル中の総ウイルス粒子数の両方を理解することが、非常に重要になってきている。
【0008】
総粒子数の必要性に対処するために、SartoriusのVirus Counter(登録商標)製品、電子顕微鏡、およびいくつかの間接的な方法において具体化されているような、より近代的な技術が、総粒子数を提供するために開発されている。これらの技術のうちのいくつかについて、これらの計数は、わずか30分で測定され得る。残念ながら、これまで、図1の従来のウイルスプラークアッセイに代わる迅速なものは、存在しなかった。総粒子数と伝染性粒子数の両方を同時に、またはほぼ同時に得ることが非常に望ましい。本開示は、プラークアッセイ力価、ひいては伝染性粒子数を、数日ではなく数時間で提供する、迅速で自動化された画像ベースのウイルスプラークおよびポテンシーアッセイを提示する。したがって、本開示は、総粒子数と伝染性粒子数とを本質的に同時に取得することを可能にする。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】米国特許出願第16/854,756号
【特許文献2】欧州特許出願第20290050.2号
【非特許文献】
【0010】
【非特許文献1】Zaheer, Manzilら,"Deep sets",Advances in neural information processing systems 30 (NIPS 2017)
【非特許文献2】Rasmussen, Carl Edward,"Gaussian processes in machine learning",Summer School on Machine Learning. Springer,Berlin,Heidelberg,2003
【非特許文献3】Chen, Ricky TQら,"Neural ordinary differential equations",Advances in neural information processing systems 31 (NeurlPS 2018)
【非特許文献4】Huber, P.J.,"Robust estimation of a location parameter",Breakthroughs in statistics. Springer,New York,1992,pp. 492-518
【非特許文献5】Ronneberger, O., Fischer, P., およびBrox, T.,"U-net: Convolutional networks for biomedical image segmentation",in International Conference on Medical image computing and computer-assisted intervention. Springer,Cham,2015, October,pp. 234-241
【非特許文献6】Kingma, D.P., およびBa, J.,"Adam: A method for stochastic optimization",arXiv preprint arXiv:1412.6980,2014
【発明の概要】
【課題を解決するための手段】
【0011】
一態様において、本明細書では、ウイルス集団を含む細胞培養物の画像または画像のシーケンスからウイルス力価を予測するために機械学習モデルをトレーニングするための方法について説明する。この文書において、「機械学習モデル」は、所望の入力-出力ペアの前の例に基づいてタスクを学習および実行するために最適化アルゴリズムを使用した計算システムを指す。トレーニング済み機械学習モデルは、ウイルス力価の予測が標準的なウイルスプラークアッセイにおけるよりもはるかに早く、例えば、従来技術における数日と比較して、ウイルスサンプルを細胞培養物に最初に接種してから6または8時間(あるいはそれ未満)において行われることを可能にする。機械学習モデルをトレーニングする方法は、(1)開始時間t0から最終時間tfinalまでの1つまたは複数の時点における複数の実験からのウイルス処理された細胞培養物の複数の画像の形態においてトレーニングセットを取得するステップと、(2)各実験について、時間tfinalにおけるウイルス処理された細胞培養物の少なくとも1つのウイルス力価の数値読み出し(以下、「グラウンドトゥルース」)を記録するステップと、(3)トレーニングセット内のすべての画像を処理して、各画像の数値表現を取得するステップと、(4)トレーニングセットの数値表現において、最終的なウイルス力価の予測を行うように1つまたは複数の機械学習モデルをトレーニングするステップとを含むことができる。
【0012】
本発明では、未知の力価のウイルスサンプルが加えられた細胞培養物のウイルス力価を予測する方法としての、トレーニング済みの1つまたは複数の機械学習モデルの適用についても説明する。この「適用」段階において、方法は、a)細胞培養物の画像の時系列を取得するステップと、b)ステップa)において取得された画像の時系列の数値表現を、前の段落に従ってトレーニングされた1つまたは複数の機械学習モデルに供給するステップと、c)1つまたは複数のトレーニング済み機械学習モデルを用いてウイルス力価の予測を行うステップとを含むことができる。
【0013】
別の態様において、細胞培養物とウイルスサンプルとを含む1つまたは複数のプレートを保持するように構成された分析機器が提供される。機器は、統合イメージングシステムを含む。機器は、イメージングシステムによって取得された細胞培養物の画像の時系列における1つまたは複数の画像から細胞培養物内のウイルス力価の予測を行うようにトレーニングされた機械学習モデルで構成され、予測は、細胞培養物のウイルス感染が終期に進む前に行われる。例えば、予測は、一例として、ウイルス感染の開始後、数日ではなく、4、6、10、または15時間において行われ得る。
【0014】
1つのさらなる態様において、この分析機器は、機器のユーザがウイルス力価予測を行うために新しいトレーニング済み機械学習モデルを作成するためにトレーニング手順を実行することを可能にするトレーニングモジュールを実行する処理ユニットでさらに構成され得る。このトレーニングモジュールは、機器のユーザが機器を用いてトレーニング方法を実行するのを容易にするためのセットアップ指示を提供する。このトレーニング方法は、(1)開始時間t0から最終時間tfinalまでの時点のセットにおける複数の実験からのウイルス処理された細胞培養物の複数の画像の形態においてトレーニングセットを取得するステップと、(2)各実験について、時間tfinalにおけるウイルス処理された細胞培養物の少なくとも1つのウイルス力価の数値読み出しを記録するステップと、(3)トレーニングセット内のすべての画像を処理して、各画像の数値表現を取得するステップと、(4)トレーニングセットにおける数値表現において、最終的なウイルス力価の予測を行うように1つまたは複数の機械学習モデルをトレーニングするステップであって、トレーニングが、最終的なウイルス力価のモデル予測とグラウンドトゥルースとの間の誤差を最小化することを含む、ステップとを含むことができる。
【0015】
モデルトレーニングにおける処理ステップ(3)のためにいくつかの異なる方法が使用され得る。一実装形態において、処理ステップ(3)は、画像を畳み込みニューラルネットワーク(CNN)に通過させて、画像の中間データ表現を取得するステップを含む。別の実施形態において、処理ステップ(3)は、a)画像から個別の細胞をセグメント化するサブステップ、b)各細胞の細胞ごとの数値記述を計算するサブステップ、およびc)すべての細胞にわたって数値記述を集約するサブステップの形態をとる。
【図面の簡単な説明】
【0016】
図1】従来のウイルス力価アッセイの図である。
図2】開始時間t0と最終時間tfinalとの間の画像の時系列からウイルス力価の予測を行い、「グラウンドトゥルース」後の時間tfinalにおけるウイルスで処理された細胞培養物のウイルス力価の数値読み出しを提供するために機械学習モデルをトレーニングするための方法の図であり、1つまたは複数の画像の形態におけるトレーニング済みモデルの新しいモデル入力への適用も示す図であり、トレーニング済みモデルが予測されたウイルス力価の形式における出力を生成する、図である。
図3】モデル出力をユーザに報告する1つの可能な方法の図である。
図4】本開示のモデルトレーニング段階およびモデル適用段階を実装するために使用され得る分析機器の1つの可能な例の図である。
図5図4の分析機器内の蛍光イメージングシステムの図である。
図6】単一の機械学習モデルが複数の時点からの画像の数値表現からトレーニングされるときのトレーニング段階を示すフローチャート図である。
図7】別個の機械学習モデルが時点ごとにトレーニングされるトレーニング段階を示すフローチャート図である。
図8】トレーニング段階中に複数の時点からの数値表現を使用するようにトレーニングされた単一の機械学習モデルを使用するモデル適用段階を示すフローチャート図である。
図9】トレーニング段階中に時点ごとの数値表現を使用するようにトレーニングされた単一の機械学習モデルを使用するモデル適用段階を示すフローチャート図である。
図10】機械学習モデル予測とグラウンドトゥルースとの間の損失または予測誤差が最小化されるモデルトレーニング段階を示すフローチャート図である。
図11】モデルトレーニング手順の画像処理ステップ(3)の1つの代替実施形態において実行されるステップのシーケンスの図である。
図12】ユーザが機器を使用してウイルス力価アッセイを実行することを可能にするセットアップメニューを示す、図4の分析機器に関連付けられたワークステーション上のディスプレイの図である。
図13】播種から実験終了までの緑色蛍光タンパク質(GFP)発現ヒトアデノウイルス5の蛍光活性化を重ね合わさせた複数の例示的な位相差画像の図である。
図14】3つの異なるウイルス希釈の測定された蛍光(左列)およびモデル予測(右列)の例示的な画像例の図である。
【発明を実施するための形態】
【0017】
概説
本開示は、tfinalよりも小さい(またはtfinalよりも早い)時点tにおいて、実験終了時間またはtfinalにおけるウイルス力価読み出しを予測する方法を提供する。「実験終了時間」またはtfinalという語句は、ウイルス力価アッセイが完了まで実行された、または同等に終期まで進められた時間、すなわち、可視のプラークが形成された時間を指し、典型的には、問題のウイルスまたはウイルスのファミリー、ウイルスが増殖させられる細胞タイプ、および当該技術分野において知られる他の要因に応じて2日以上である。開示する方法は、この予測ウイルス力価読み出しが、通常の実験終了時間のずっと前、例えば、数日ではなく、いくつかのウイルス力価アッセイでは6~8時間、または場合によってはそれよりも早く行われることを可能にする。
【0018】
方法は、この予測を行うために使用される1つまたは複数の機械学習モデルのトレーニングおよび使用を含む。したがって、本開示は、図2に示す2つの異なる態様、すなわち、トレーニング済み機械学習モデル150が開発される機械学習モデルトレーニング段階100と、トレーニング済み機械学習モデル150が新しいモデル入力202に適用され、予測されたウイルス力価の形態におけるモデル出力204がトレーニング済み機械学習モデル150によって生成される機械学習モデル適用段階200とを含む。
【0019】
モデルトレーニング段階100は、いくつかのステップを含むことができる。まず、ステップ(1)において、トレーニングセット102が、画像、典型的には、開始時間t0と最終時間tfinalとの間の1つまたは複数の時点における複数の実験からのウイルス処理された細胞培養物の顕微鏡画像104の複数の画像セットの形態において取得される。時点t1、t2、…は、例えば、30分ごとまたは60分ごとなど、周期的であり得る。ステップ(2)において、各実験について、時間tfinalにおけるウイルス処理された細胞培養物の少なくとも1つのウイルス力価数値読み出し、以下、「グラウンドトゥルース」106の記録が行われる。図2は、このグラウンドトゥルースを画像として示しているが、それは、数、例えば、感染性粒子もしくは伝染性粒子の数、もしくは単位体積あたりの伝染性粒子の数、またはウイルス力価(濃度)を表す当該技術分野において知られている他の指標として表され得る。ステップ(3)において、各顕微鏡画像の数値表現を取得するために、トレーニングセット102内のすべての顕微鏡画像の処理が実行される。このステップは、図2に示されていないが、図6図11の実施形態の議論において示されており、以下で詳細に説明される。ステップ(4)において、トレーニングセットの数値表現において、最終的なウイルス力価の予測を行うように1つまたは複数の機械学習モデル108のトレーニングが実行される。トレーニングは、図10において説明し、以下で詳細に論じるように、最終的なウイルス力価のモデル予測とグラウンドトゥルースとの間の損失または予測誤差を最小化することを含む。
【0020】
図2のモデル適用段階200は、トレーニング済み機械学習モデル150がウイルス力価の予測を行うために使用される段階である。特に、未知の力価のウイルスサンプルが加えられた細胞培養物のウイルス力価を予測するための方法について説明し、方法は、a)例えば、細胞培養物へのウイルスの接種後の30分ごとに、細胞培養物の顕微鏡画像の時系列202を取得するステップと、b)ステップa)において取得された顕微鏡画像の時系列の数値表現を、モデルトレーニング段階100に従ってトレーニングされた1つまたは複数の機械学習モデルに供給するステップと、c)1つまたは複数のトレーニング済み機械学習モデルを用いて、モデル出力204として示すウイルス力価の予測を行うステップとを含むことができる。モデル入力に対する数値表現ステップは、顕微鏡画像104の形態においてトレーニングセット102の数値表現を生成するために、以下で説明するのと同じ方法を使用して実行される。モデル出力204は、図2において画像として示されているが、それは、数値、またはウイルス力価(濃度)を表す当該技術分野において知られる他の周知の指標として表され得る。
【0021】
モデル出力204の一例を図3に示す。モデル出力は、図2のモデル適用プロセスまたは段階200を実行する機器のワークステーション24のディスプレイ上に提示された、細胞培養物へのウイルスの最初の接種後のいくつかの時間期間にわたる時間の関数としての「計算された力価」(または同等に、予測された力価)のプロットの形態において示される。図3のこの特定の(仮想の)例において、モデル出力204は、左手におけるスケールと、6時間、9時間、12時間、15時間、および60時間における予測されたウイルス力価のプロットとを含み、誤差バーは、6時間における2,800,000+/-500,000PFU(プラーク形成単位)/mL、9時間における2,900,000+/-300,000PFU/mLなどの、各時点における予測の不確実性を示す。これらの予測は、この例では約6時間において精度の上昇が開始し、12時間においてウイルス力価の精度が高くなり、15時間において精度がより高くなる。
【0022】
図2に戻って参照すると、モデルトレーニングプロセスまたは段階100は、トレーニング済み機械学習モデルのスイートを取得するために、多くの回数繰り返され得る。これは、異なるウイルスまたはウイルスのファミリーが特定の細胞タイプにおいて異なる感染率および細胞溶解速度を示すためである。したがって、多くの異なる細胞タイプおよびウイルスファミリーにわたってウイルス力価を正確に予測するモデルを生成するために、トレーニング手順は、ウイルスの各ファミリーについて、およびウイルス研究において一般的に使用される細胞株の各々について行われ得る。それに加えて、以下で説明するように、t0とtfinalとの間の全期間にわたって生成された画像のセットからトレーニングされた単一の機械学習モデルではなく、様々な時点、例えば、6時間、12時間、15時間などにおいて予測する機械学習モデルを開発することが有利な場合がある。それに加えて、ウイルスの異なる希釈度についてモデルトレーニングプロセスまたは段階100を繰り返すことが望ましい場合もある(図1の左側を参照)。
【0023】
例示的な分析機器
本開示の方法は、異なる時点においてウイルスサンプルを追加した細胞培養物の画像を取得するためのメカニズムを含む任意の適切なマシンまたは機器において実行され得る。好ましくは、そのような画像は、顕微鏡画像である。そのような機器の一例を図4に示し、以下の説明は、例として提供され、限定ではない。図示の実施形態における機器400は、譲受人のIncucyte(登録商標)生細胞イメージングシステムである。機器400は、マイクロウェルプレート、細胞培養プレートなどを含む、異なる可能なフォーマットを有する生細胞または細胞培養物から画像を取得するように適合および構成される。機器400は、ハウジング410を含み、その全体は、使用中、図示しない温度および湿度が制御されたインキュベータ内に配置され得る。機器400は、1つまたは複数の保持ウェル10を含む細胞培養プレート404を受け入れるように適合され、保持ウェル10の各々は、プラーク形成単位の未知の濃度の細胞培養物およびウイルスサンプルを受け入れる。さらに、機器400は、蛍光試薬および/または免疫組織化学試薬406の任意のセットを含むことができる試薬キットとの使用に適合し、蛍光試薬および/または免疫組織化学試薬406のうちの1つまたは複数は、細胞株サンプルから蛍光測定値または免疫組織化学的測定値が取得されることを可能にするように、ウェル10の各々に加えられる。システムは、関連するワークステーション24を含み、ワークステーション24は、機械学習モデルトレーニングプロセスおよび/または適用プロセス(図2、手順または段階100および/または200)と、研究者がサンプルに対して行われたウイルス力価実験の結果を見ることを可能にする表示機能とを実装する。図4において、ワークステーションのディスプレイは、ユーザが「セットアップ」メニュー(図12を参照)を選択し、モデル適用プロセスもしくは段階(図2、200)を行うために必要なパラメータおよび情報を入力することを可能にするか、またはユーザがモデルトレーニングプロセスもしくは段階(図2、100)を行うための手順をセットアップすることを可能にする「トレーニング」メニューを選択することを可能にする「ウイルスプラーク検出」アプリケーションをユーザが入力したことを示す。
【0024】
機器400は、システムから滑り出るトレイ408を含み、培養プレート404がトレイ408上に配置されることを可能にし、次いで、ハウジング410の内部に培養プレート404を配置するように後退して閉じる。培養プレート404は、蛍光光学モジュール402(図5を参照)がプレート404に対して移動し、実験の過程にわたって一連の蛍光画像を取得する間、ハウジング内で静止したままである。この実験の変形例において、取得される画像は、明視野の非蛍光画像であり得る。
【0025】
図5は、図4の蛍光光学モジュール402のより詳細な光学図である。図5に示す蛍光光学モジュール402のさらなる詳細は、本発明の譲受人に譲渡され、その内容が参照により本明細書に組み込まれている、「Optical module with three or more color fluorescent light sources and methods for use thereof」と題する、2020年4月21に出願した、Brad Neagleらの米国特許出願第16/854,756号において見出され得る。図5の光学モジュール402の詳細は、特に重要ではなく、図に示すものとは大きく異なる可能性があるので、図5は、例として提供され、限定ではない。
【0026】
モジュール402は、それぞれ453~486nmおよび546~568nmなどの異なる波長において光を放射するLED励起光源450Aおよび450Bを含む。光学モジュール402は、648~674nmなどの第3の波長において光を放射する第3のLED励起光源(図示せず)、または第4の異なる波長における第4のLED励起光源を有して構成され得る。LED450Aおよび450Bからの光は、それぞれ、細胞培養物およびウイルス培地中の蛍光体を励起するように設計された特定の波長における光を通過させる狭帯域バンドパスフィルタ452Aおよび452Bを通過する。フィルタ452Aを通過した光は、ダイクロイック454Aで反射し、ダイクロイックミラー454Bで反射し、対物レンズ460、例えば20倍拡大レンズに導かれる。LED450Bからの光も、フィルタ452Bを通過し、ダイクロイックミラー454Bを通過し、対物レンズ460に導かれる。レンズ460を通過した励起光は、次いで、プレート10の底部に衝突し、媒体404に入り込む。次に、サンプル中の蛍光体からの発光は、レンズ460を通過し、ミラー454Bで反射し、ダイクロイック454Aを通過し、狭帯域発光フィルタ(非蛍光光をフィルタリングする)を通過し、デジタルカメラ464に衝突し、デジタルカメラ464は、電荷結合素子(CCD)、または当該技術分野において現在知られており、蛍光顕微鏡法において使用される他のタイプのカメラの形態をとり得る。次いで、モータシステム418は、光源450Aまたは450Bがオン状態にある間、光学モジュール402をX、Y、およびオプションでZ方向に移動させるように動作する。通常、一度に1つの光チャネルのみがアクティブ化され、例えば、LED450Aがオンにされ、画像が取り込まれ、次いで、LED450Aがオフにされ、LED450Bがアクティブ化され、第2の画像が取り込まれることが理解されるであろう。
【0027】
対物レンズ460は、異なる倍率で第2の画像を取得するために、異なる倍率の第2の対物レンズが光路内に配置されるように、垂直軸を中心に回転され得るターレットに取り付けられ得ることが理解されるであろう。さらに、モータシステム418は、蛍光光学モジュール402および対物レンズ460の光路がプレート404の様々なウェル10内の細胞培養物の各々の直下に配置されるように、プレート404の下でXおよびY方向において移動するように構成され得る。
【0028】
蛍光光学モジュール402用のモータシステム418の詳細は、広く変化する可能性があり、当業者に知られている。
【0029】
図5における蛍光およびフィルタの使用は、オプションであり、一実施形態において、明視野画像が、広スペクトル照明源から、励起および発光フィルタを使用せずに取得される。
【0030】
一実施形態において、ウイルスサンプルは、総粒子数を取得するために、Sartorius Virus Counter(商標)などの別個の機器に供給され、その別個の機器は、総粒子数と本質的に同時にプラークアッセイ力価を取得するために、適用段階において、図4および図5の機器におけるウイルスプラークアッセイと並行して動作することができる。
【0031】
例示的な実施形態
このセクションは、図2および図6図11と関連して、それぞれモデルトレーニング段階およびモデル適用段階に関する多数の可能な実施形態について説明する。
【0032】
以下の議論において、本明細書で使用される用語に特定の意味が割り当てられる。
【0033】
「人工ニューラルネットワーク」(ANN)は、最適化アルゴリズムを使用して学習されたモデルパラメータを有する非線形数学的変換の複数の層から構成された機械学習モデルのタイプを指す。
【0034】
「畳み込みニューラルネットワーク」(CNN)は、画像内の形状およびオブジェクトを形成するピクセルなどの、空間的相関を有するデータを処理するために一般的に使用されるANNのタイプを指す。
【0035】
「アクティブ化」は、ANNの層を通過する入力データの中間表現を指す。
【0036】
前に説明したように、図2のモデルトレーニング(またはセットアップ)段階100、および図2の適用段階200が存在する。モデルトレーニング段階100は、基本的に4ステッププロセスであり得る。(1)例えば培養プレートのウェル内に保持された細胞培養培地中の、ウイルス処理された細胞の画像のトレーニングセット102を取得し、一連の実験として繰り返す。(2)各実験において、時間tfinalにおけるステップ1において画像化された細胞培養培地に関する少なくとも1つのウイルス力価数値読み出し、または「グラウンドトゥルース」106を取得し、記録する。(3)各顕微鏡画像の数値表現を取得するために、トレーニングセット102内の画像を処理する。(4)より早い時点からの数値表現に基づいて最終的なウイルス力価を予測するために、1つまたは複数の機械学習モデル108、例えば回帰モデルをトレーニングする。このトレーニングステップにおいて、予測された最終的なウイルス力価とグラウンドトゥルースとの間の損失または誤差の最小化が実行される。このモデル(またはモデルのセット)がトレーニングされると、それらは、記憶され、次いで、モデル適用段階200中に使用される。モデル適用段階200は、(1)ウイルス力価の早期予測が望まれる、未知の力価のウイルスを接種された細胞培養物の画像の時系列を取得すること、(2)モデルトレーニング段階100のステップ3に関して上記で論じたのと同じ方法において、画像を数値表現に処理すること、および(3)予測されたウイルス力価を取得するために、トレーニング済み機械学習モデルを適用することから構成される。
【0037】
前述したように、一般的に使用される細胞タイプのためのモデルをトレーニングするために、トレーニング段階を経るか、または繰り返すことが一部の実施形態において可能であり、好ましい。そのようなモデルは、次いで、図4および図5において上記で説明したような分析機器のユーザに、ソフトウェアモジュールの統合部分として出荷または提供され得る。次いで、顧客/ユーザは、適用段階を経るだけでよい。しかしながら、顧客/ユーザが、図2のプロセスを使用してモデルが開発された細胞とはあまりに似ていない、まれな細胞タイプに対してウイルス力価実験を実行することを望む状況が存在する場合がある。この場合、顧客/ユーザは、図2のモデルトレーニングプロセスを実行する。機器は、例えば、図4のワークステーションのディスプレイにおいて示された「トレーニング」モジュールを入力することによって、図2のプロセスまたは段階100を実施するようにユーザを基本的に導くソフトウェアパッケージとしてモデルトレーニング手順を提供することによって、この実施形態をサポートする。
【0038】
図2に示し、上記で説明した4ステップモデルトレーニング段階またはプロセス100および3ステップ適用段階200の一例について、図6と関連してここで説明する。
【0039】
モデルトレーニング(またはセットアップ)段階ステップ(図2図100、および図6)
ステップ1.開始時間t0からtfinalまでの1つまたは複数の時点における複数の実験600から、ウイルス処理された細胞培養物の1つまたは複数の画像、好ましくは顕微鏡画像(602、図6)の形態においてトレーニングセットを取得する。すべての実験について、好ましくは同じ時点が使用される。時点は、均等または不均等に離間され得、30分ごとなど、60分以下の期間で周期的であり得る。1つの実験600は、培養プレート内のウェル内で増殖する細胞培養物を含み得、複数の実験は、異なるウイルス濃度で処理された細胞培養物の複数のウェルを含み得る。画像602のこのセットは、以下でトレーニングセットとして示される。画像を取得するカメラの視野に応じて、画像は、細胞培養物全体の広視野画像を作成するために、結合またはつなぎ合わされ得る。代替的に、合成または結合された全体画像を生成することなく、個々の小視野画像が取得され、処理され得る。
【0040】
顕微鏡画像602は、明視野画像または位相コントラスト画像などの無標識の光学顕微鏡画像であり得る。
【0041】
代替的に、顕微鏡画像602はまた、対象の蛍光マーカーで標識された細胞培養物の蛍光画像であり得る。この実施形態において、蛍光マーカーは、ウイルス感染細胞の表面または内部に発現されるウイルス特異的タンパク質エピトープに結合する蛍光抗体であり得る。代替的に、蛍光マーカーは、細胞膜マーカー、または細胞死マーカーであり得る。上記のマーカーの組合せを用いて細胞培養物を標識することが可能である。
【0042】
顕微鏡画像602はまた、発色検出システムの酵素作用の結果として標識された細胞培養物の免疫組織化学画像、明視野、および位相であり得る。この発色マーカーは、ウイルス感染細胞の表面または内部に発現されるウイルス特異的タンパク質エピトープに結合する酵素結合型直接一次抗体であり得る。代替的に、発色マーカーは、ウイルス感染細胞の表面または内部に発現されるウイルス特異的タンパク質エピトープに特異的な第1の抗体に対して親和性を有する二次抗体であり得る。別の可能性として、発色検出システムは、一次または二次抗体に結合された西洋わさびペルオキシダーゼ(HRP)酵素と、3,3'-ジアミノベンジジン四塩酸塩(DAB)の作用の結果として生じる不溶性生成物との組合せであり得る。さらに別の可能性として、発色検出システムは、免疫組織化学検出システムの複数の他のペアのうちの1つであり得る。例えば、https://www.abcam.com/kits/substrates-and-chromogens-for-ihcを参照されたい。
【0043】
顕微鏡画像602は、上記で説明したように、無標識の光学顕微鏡画像と、蛍光マーカーで標識された蛍光画像とのペアであり得る。
【0044】
ステップ2.トレーニングセットにおいて画像化された各実験について、tfinalにおけるウイルス処理された細胞培養物の少なくとも1つのウイルス力価読み出し604を記録する。ウイルス力価読み出しは、目視検査によって手動で記録されるか、またはtfinalにおける画像を処理する計算アルゴリズムを使用して自動的に記録され得る。これらのウイルス力価読み出しを、以下、グラウンドトゥルースターゲット、または単に「グラウンドトゥルース」と表記する。
【0045】
ウイルス力価読み出しは、プラークアッセイからの読み出しであり得る。特に、プラークアッセイ読み出しは、個々のプラークの数(すなわち、標準的な読み出し)であり得る。
【0046】
代替的に、プラークアッセイ読み出しは、プラークによって覆われた面積でもあり得る(オプションa)。
【0047】
変形例において、ウイルス力価は、プラークアッセイからの読み出しであり得、プラークアッセイ読み出しは、背景およびプラークから細胞塊をセグメント化するために画像セグメント化アルゴリズムを使用することによって、実験期間中に形成される不在細胞塊の穴として自動的に取得される(オプションb)。
【0048】
別の変形例として、ウイルス力価読み出しは、組織培養感染量50%アッセイ(TCID50)からの読み出しであり得る(オプションc)。
【0049】
さらに別の変形例として、ウイルス力価読み出しは、焦点形成アッセイ(FFA)からの読み出しであり得る(オプションd)。
【0050】
さらに別の可能性として、ウイルス力価読み出しは、上記のオプションの組合せ、例えば、オプションaもしくはbおよびオプションc、またはオプションaもしくはbおよびオプションdであり得る。
【0051】
ステップ3.各画像(蛍光画像が使用される場合はペア)の数値表現808を取得するために、トレーニングセット内のすべての顕微鏡画像を処理する(図6のステップ606)。
【0052】
処理606は、画像ごとのCNNアクティブ化のセットを取得するために、画像全体をCNNに通過させることからなり得る。
【0053】
代替として、処理606はまた、または代替的に、図11に示す処理ステップ、ステップ1100-セグメント化、または画像から個々の細胞をセグメント化すること、ステップ1102-オプションのフィルタリングステップ、ステップ1104-各細胞の細胞ごとの数値記述、およびステップ1106-すべての細胞にわたる数値記述を集約することからなり得る。
【0054】
セグメント化(ステップ1100)は、
従来のコンピュータビジョンアルゴリズムを使用する無標識細胞セグメント化、細胞インスタンスセグメント化にCNNを使用する無標識細胞セグメント化、または細胞膜マーカーを使用するステップ1の手順によって与えられるような膜マーカー蛍光画像のしきい値処理などの様々な可能な技法によって実行され得る。
【0055】
細胞ごとの数値記述ステップ1104は、いくつかの異なる方法において計算され得る。例えば、以下の方法のうちのいずれかを使用することができる。
1.細胞面積、離心率、ポイントネス(pointiness)、短軸/長軸、粒度などに基づいて、人間が定義した特徴記述子のセットを計算するプロセスにおけるように、特徴抽出を使用して形態学的特徴を抽出する。
2.機械学習が定義した特徴記述子のセットを抽出するために、細胞のセグメント化されたサブ画像をCNNに供給することによって形態学的特徴を抽出する。
3.蛍光画像に基づいて蛍光ピクセルの細胞内の合計によって定義される蛍光レベルを抽出する(ステップ1において説明したように、細胞培養物は、対象の蛍光マーカーで標識されている)。
【0056】
集約ステップ1106は、いくつかの可能な方法によって実行され得る。例えば、集約ステップ1106は、すべての細胞にわたる特徴ごとの平均を計算し、細胞ごとの数値記述に基づいて定義された異なるタイプの細胞間の比率を計算することによって、または次元削減を実行し、削減された次元空間全体の画像の確率分布を計算し、次いですべての画像に基づいて定義された確率分布に従って、削減された次元上の分布として各画像を集約することによって実行され得る。この後者の方法は、その内容が参照により本明細書に組み込まれている、2020年6月12日に出願した欧州特許出願第20290050.2号に記載されている単一細胞形状分布分析を指す。代替的に、集約ステップは、細胞ごとの特徴記述をセット不変ニューラルネットワーク(ディープセットなど、Zaheer, Manzilら,"Deep sets",Advances in neural information processing systems 30 (NIPS 2017)を参照)に供給することによって実行され得る。
【0057】
図11に示すように、オプションのフィルタリングステップ1102が存在する。特に、図4のステップ1104および1106は、(蛍光画像が取得されるステップ1において取得される)オプションの蛍光画像に基づいて蛍光ピクセルの細胞内合計を最初にしきい値処理することによって、フィルタリングされたウイルス感染細胞のみを使用して、またはウイルス感染しているまたはしていないとして細胞の無標識分類を実行するようにトレーニングされた機械学習モデルを使用して実行され得る。
【0058】
図11のフィルタリングステップ1102の別の例として、処理ステップ1106および1106は、死細胞をフィルタリングすることによって実行され得る。そのような死細胞は、ステップ1において細胞死マーカーが使用されるオプションの蛍光画像に基づいて蛍光ピクセルの細胞内合計をしきい値処理することによって、または死細胞または死細胞ではないとして細胞の無標識分類を実行するようにトレーニングされた機械学習モデルを使用することによって識別され得る。
【0059】
図11のフィルタリングステップ1102の別の例として、ウイルス感染により死滅しなかった死細胞をフィルタリングするために、(上記で説明したような)非ウイルス感染細胞のフィルタリングと、(上記で説明したような)死細胞のフィルタリングとの組合せが実行され得る。
【0060】
ステップ4.tfinalにおけるウイルス力価のモデル予測(予測プラークアッセイ)とグラウンドトゥルースとの間の差異(または、同等、誤差、もしくは損失)を最小化するために、トレーニングセットの数値表現(608)に対して1つまたは複数の機械学習モデルをトレーニングし(ステップ108)し、結果としてトレーニング済み機械学習モデル150を生じる。図10を参照されたい。
【0061】
モデル150は、様々な形態をとり得る。例えば、モデル150は、部分最小二乗回帰モデルなどの線形モデルであり得る。代替的に、モデル150は、ANNなどの非線形モデルであり得る。別の例として、モデル150は、ガウス過程回帰などの、プラークアッセイ読み出しにわたる確率分布であり得る。Rasmussen, Carl Edward,"Gaussian processes in machine learning",Summer School on Machine Learning. Springer,Berlin,Heidelberg,2003を参照されたい。別の例として、モデル150は、神経常微分方程式モデルなどの動的モデルであり得る。例えば、Chen, Ricky TQら,"Neural ordinary differential equations",Advances in neural information processing systems 31 (NeurlPS 2018)を参照されたい。
【0062】
モデル150は、グラウンドトゥルースと比較した予測プラークアッセイ読み出しの誤差を最小化するためにモデルパラメータを反復的に調整することによってトレーニングされ得る。この誤差は、平均二乗誤差、平均絶対誤差、または「フーバー損失」としても知られる区分的絶対誤差、区分的二乗誤差として与えられ得る。Huber, Peter J.,"Robust estimation of a location parameter",Breakthroughs in statistics. Springer,New York,1992,pp. 492-518を参照されたい。
【0063】
注:ANNモデルが2つ以上の連続するステップにおいて使用される場合、それらは、オプションで接続され得、ウイルス力価予測損失は、サブANNを共同で最適化するために、複数のサブANNを通じて逆伝播される。
【0064】
適用段階ステップ(図2、200)
適用段階中、モデルトレーニング段階中にトレーニングされたモデルに基づいてウイルス力価読み出しが時間において早く予測されるウイルス処理された細胞を用いて、1つまたは複数の実験が実行される。所与の実験について、最終的なウイルス力価読み出し数は、時点t<tfinalにおいて以下によって予測される。
1.時点tまで実験細胞培養物の1つまたは複数の顕微鏡画像(図2、202)を取得する。画像は、好ましくは、モデルトレーニング段階100のステップ1と同じ画像取得プロトコルを使用して取得される。
2.上記で説明したモデルトレーニング段階100のステップ3と同じ画像処理プロトコルを使用して、取得された画像を数値表現(図10、1000)に処理する。
3.図10に示すように、トレーニング済み機械学習モデル150を数値表現に適用することによって、最終的なウイルス力価204を予測する。
【0065】
図7は、別個の機械学習モデルが時点ごとにトレーニングされる場合のモデルトレーニング段階を示すフローチャート図である。図には3つのそのようなモデル150A、150B、150Cが示されているが、例えば、トレーニング段階中に実行される各実験の間、例えば、30、45、または60分ごとに画像が取得される、場合によっては10または20個以上の時点が存在する場合、10個または20個以上など、より多くのそのようなモデルが存在し得ることが理解されるであろう。図7における他のステップは、図6と関連して上記で説明したものと同じである。図7の実施形態は、適用段階(図2、200)において使用され得、この適用段階では、例えば、6時間の期間にわたって30分ごとに画像が取得され、次いで、モデルトレーニング中に6時間の期間においてトレーニングされた第12のトレーニング済みモデル150は、実験開始から6時間後に最終的なウイルス力価の予測を行うために使用される。同様に、画像が適用段階において各々30または60分間隔で収集されると、各画像の数値表現は、各間隔において関連するトレーニング済み機械学習モデル、150A(30分)、150B(80分)、150C(90分)、150D(120分)などに供給され、各モデルは、予測を行い、結果は、生成され、予測における誤差バーまたは不確実性とともに、例えば図3に示すようにユーザに対して表示される。
【0066】
図8は、単一の機械学習モデル150が図6において説明した手順に従って複数の時点において取得された画像202からの数値表現608を使用するようにトレーニングされた状況におけるモデル適用段階(図2、200)を示すフローチャート図である。プロセス画像モジュール606は、上記で説明したように画像の数値表現を作成し、数値表現608は、トレーニング済みモデル150に入力され、204に示すようにウイルス力価の予測が行われる。
【0067】
図9は、単一の機械学習モデルが図7に示すトレーニングプロセスに従ってモデルトレーニング段階中に時点ごとにトレーニングされた状況におけるモデル適用段階を示すフローチャート図である。トレーニングプロセスは、複数のトレーニング済み機械学習モデル150A、150B、および150C(およびオプションで、図示されていない、例えば20個の追加のそのようなモデルなどの追加のモデル)を結果として生じる。次いで、各時点における画像の数値表現は、その時点の関連する機械学習モデルに供給され、各モデル150A、150B、150C、…は、それぞれ、ウイルス力価読み出し204A、204B、204C、…の予測を行う。
【0068】
ここで図4および図12を参照すると、分析機器400に関連付けられたワークステーションは、機器のユーザが本明細書に記載のウイルス力価アッセイを実行するために必要なツールまたはインターフェースを提供するディスプレイ24を含むことができる。ディスプレイ24の詳細は、大きく異なる可能性があるが、典型的には、機器内で画像化されるべき細胞培養物およびウイルスのセットとして予測を行うために機器のソフトウェアがメモリ内に記憶された適切な機械学習モデルを選択するために必要な情報をユーザが入力することを可能にする機能を含む。例えば、図12に示すように、ユーザは、
実験における細胞株のタイプ、
細胞株に接種されるウイルスファミリーのタイプ、
アッセイタイプ(例えば、単位体積あたりのプラーク形成単位、TCID50、両方、その他)
細胞プレートにおける希釈レベル、
予測が望まれる処理の開始からの時間または時間期間(例えば、4時間、6時間、15時間、30分ごと、時間ごとなど)
などのことを選択するためのメニューが与えられる。
【0069】
オプションで、メニューは、特定の信頼区間または誤差限界内の予測のみが報告され、より大きい不確実性を有する予測が報告されないようにユーザがアプリケーションをプログラムすることができる信頼レベル機能を含むことができる。図12に示すインターフェースは、1つの可能な例に過ぎず、例として提供され、限定ではなく、インターフェースおよびメニューオプションの設計の詳細は、図12に示すものから大きく異なる可能性がある。
【0070】
それに加えて、メニューは、ユーザがウイルス力価を予測するために新しい追加の機械学習モデルをトレーニングするための実験設計をセットアップするトレーニングモードに入るオプションを含むことができる。例えば、機器のディスプレイは、アクティブ化されると、上記で説明したようにモデルトレーニングを行うためにユーザが実験パラメータを入力することを可能にする「トレーニング」アイコン(図4参照)を含むことができる。
【0071】
トレーニング済み機械学習モデルは、図4の機器400の処理ユニット内に、または機器に接続されたリモートコンピューティングプラットフォーム上に実装され得る。図4の機器400は、さらに、機器のユーザが図4の機器を使用して本開示のモデルトレーニングプロセスを実行することを可能にするモデルトレーニングモジュールをオプションで含むことができる。
【0072】
さらなる考慮事項
上記で説明したように、画像またはシーケンス画像が撮影され、個々の細胞を識別するためにセグメント化アルゴリズムが使用される一実施形態について説明する(図11のステップ1100を参照)。これらのセグメント化アルゴリズムは、インスタンスセグメント化を実行する畳み込みニューラルネットワーク(CNN)に基づき得、または既存の細胞ごとのタイプのアルゴリズムに基づき得る。次いで、表現型、形状、およびテクスチャを1つまたは多くの異なる方法において定量化する多属性表現を使用して、個々の細胞が記述され得る。特に、画像は、ピクセルごとのレベルにおいて検査され得、ピクセル間のパターンおよびテクスチャに関する追加情報を詳細に提供する。この生成された細胞関連記述子および/または他の関連メタデータの特徴が豊富なデータセットに基づいて、次いで、特にウイルス活性に関連する細胞変性効果を検出するために、多変量データ分析が使用され得る。次いで、観察された細胞変性効果に基づいて、ウイルス活性を予測するために機械学習モデルがトレーニングされ得る。機械学習は、予測のための入力として単一の時点、または現在の時間に至るまでの複数の時点を使用し得る。この実施形態は、細胞セグメント化アルゴリズムの使用を省略し、代わりに画像のパッチ単位の説明を使用することによって変更され得る。細胞カーペットの性質により、細胞の部分集団は、画像を規則的なグリッドに分割することによって近似され得、各グリッドは、形状およびテクスチャパラメータに基づいて記述され、説明したのと同じ方法においてウイルス活性を予測する。
【0073】
さらに、方法は、画像ベースのトレーニング済みモデルに基づいているので、方法は、プラークの大きさ、多さ、および特定の位置などの情報を予測することによって、細胞変性効果の程度の決定を可能にする。さらに、細胞変性効果がサンプルにおいて存在するからといって、これがプラークアッセイの形成と一致するとは限らない。本開示のプラークアッセイは、細胞変性効果がプラークに発展するかどうかの予測を可能にする。細胞変性効果を示すすべての細胞がプラーク形成につながる、またはプラーク形成を結果として生じるということは明らかではなく、または予想されない。プラーク形成が生じるためには、特定の環境条件が存在しなければならない。細胞培養物の特定のpHと生理学的温度とを維持する、図4および図5に示すようなインキュベータベースの顕微鏡の生細胞非摂動イメージング能力は、ウイルスの侵入によって引き起こされる宿主細胞における構造変化、およびしたがってプラーク形成のモニタリングおよび観察を可能にする。
【0074】
本開示の様々な実施形態は、インシリコ標識によって補完され得る。インシリコ標識は、機械学習または深層学習モデルが、対象の蛍光ラベルの対応する蛍光画像を予測するようにトレーニングされたことを意味する。ウイルス活性、感染度などを示す標識で標識されたウイルス処理された細胞培養物のデータセットが与えられた場合、機械学習または深層学習モデルは、対応する光学顕微鏡画像から標識を予測するようにトレーニングされ得る。次いで、このトレーニング済みモデルは、無標識方式で対応する標識を予測するために、さらなる画像セットに適用され得る。次いで、予測された標識は、プラーク予測モデルにおける補助入力として使用され得、または予測がグリッド内の特定の細胞に割り当てられる細胞/グリッド要素の追加の記述として使用され得る。
【0075】
多変量データ分析は、ウイルス活性に直接関係せず、予測モデルの一部として使用されるか、またはフィルタリングされる通常の複製中の細胞脱離または円形化などの、時間関連のまたは単一時点における他の表現型効果も検出し得る。新興技術は、プラークのサイズと増殖速度とをリアルタイムでまたは時間的に識別できる可能性もあり、元のサンプルの凝集状態、ウイルスのポテンシー、および突然変異による集団内の変動を含む、検査されたウイルスサンプルに関連するいくつかの品質パラメータのための品質管理モニタリング、外れ値検出、および根本原因分析に関する情報を明らかにする可能性がある。抽出または生成された画像特徴セットまたは他の関連メタデータに基づく多変量データ分析は、プラーク形態における他の変動の検出を通じて、他の未決定のウイルス/細胞相互参照特徴の同定のための発見ツールとしても機能し得る。プラーク形態におけるそのような変動は、現在の方法によって区別できない可能性があるが、本開示の態様である自動機械学習、多変量データ分析、および生細胞イメージングの組合せによって可能になるマルチパラメトリック分析およびスループットによって明らかにされる。
【0076】
本開示の方法の別の利益として、検出に必要なプラークサイズは、低減され、したがって、重複の危険なしに単位面積/視野あたりより多くのプラークを効果的に許容する。そのため、これは、必要な希釈系列を効果的に低減し、大幅な労働負担を軽減する。ここでの他の代替案は、適切な試験希釈からプラークを検査するのに必要な面積を低減することができ、より高いスループットでより小さいフォーマットに移行できる可能性があることである。
【0077】
培養プレートには、特殊な培地、例えば、ウイルスに特有の検出支援物、または一般的かつ機械学習特有の方法においてイメージングを支援する薬剤を含む検出支援物が追加され得る。後者は、より一般的な用途を有する場合がある。そのような培地は、例えば、細胞内容物の放出に反応する試薬、またはウイルス抗原(例えば、抗体)上に凝集し、検出可能なマーカーを担持するか、もしくはそれらの凝集によって検出可能な構造を形成する試薬を有することができる。そのような試薬は、蛍光色素、または培地中のより低い濃度においてより高い量子収率を有する色素、または特定のイメージング方法、例えば、ラマン分光法による検出用に設計された分子タグなどの他の試薬のいずれかであり得る。試薬は、限定はしないが、細胞骨格のリモデリング、膜の完全性の変化による生死判定、アポトーシスおよびオートファジー経路の活性化、細胞周期、ならびに酸化ストレスなどの、特定の細胞変性効果の早期検出のために使用され得る。
【0078】
抗体および他の標識は、これらの画像から導出されるであろう機械学習またはAIのトレーニングモデルに古典的な識別を加えることによって、数学的アルゴリズムの生成を前もって促進することができ、すなわち、モデリングをしている人に、アクションがどこにあるのか、どこを見ればいいのかを伝えることができる。これらの試薬は、モデルの確認のためにも使用され得る。これは、細胞変性効果がより微妙である可能性がある不均一なウイルスまたは生のウイルス調製物においてウイルス感染の相対的な影響があまり明らかではない場合に当てはまる。これは、溶解性ではない可能性があるか、調整物中のより毒性の高いウイルスと同じ時間期間内に溶解性ではない可能性があるいくつかのウイルスで結果として生じる場合がある。
【0079】
そのような結合分子は、検出可能な物理的構造情報への領域の化学的組成および分子組成に関する情報の追加を通して、追加の情報を提供することができる。
【0080】
一実施形態において、細胞のコンフルエントな単層が、様々な希釈度でウイルスに感染され、ウイルス感染が無差別に広がるのを防止するために、寒天などの半個体培地で覆われる。
【0081】
前述したように、本方法は、ここでは、(1)総粒子数(SartoriusのVirus Counter(商標)などのウイルス粒子計数機器におけるサンプルのアッセイによる)、および(2)本開示のウイルスプラークアッセイによる感染性粒子数の本質的に同時の決定を可能にする。両方のアッセイは、別々の機器またはプラットフォームにおいて同時に並行して行われ得る。
【0082】
最後に、これらの技法は、ウイルス学以外で接着細胞を用いて開発および使用される新しい化学的および生物学的エンティティポテンシーアッセイにも適用され得る。これらは、限定はしないが、中和、細胞増殖、細胞死(アポトーシス)、サイトカイン放出、細胞シグナリングの変調、炎症反応の変調、受容体結合/活性化、リガンド結合、およびカルシウム流出を含む。
【0083】
本発明の適用は、非常に広範囲である。基礎研究、開発、および製造にわたるウイルス定量市場の大部分は、プラークアッセイが標準アッセイであると考えている。用途は、限定はしないが、
1.基礎研究(学術または産業)、
2.アッセイ開発、
3.遺伝子治療、バキュロウイルスによる発現によるタンパク質製造、およびウイルスワクチンを含むプロセスの開発および生産、
4.抗ウイルス薬のスクリーニングおよび開発、
5.製造品質管理(QC)、
6.コンバージョン率最適化(CRQ)試験、
7.ウイルスストックの確立、
8.ウイルス除去および/または不活性化、ならびに
9.適正製造プロセス(GMP)検証および非GMP研究、ならびに
10.新しい化学的または生物学的エンティティのためのポテンシーアッセイ
を含む。
【0084】

より早い時点から感染力価を予測する方法の例示的な例を提供するために、本発明者らは、小さい画像の予測ケーススタディを実行した。本発明者らは、標準的なプラークアッセイを実行し、このプラークアッセイでは、HEK293細胞が、付着性が高められたポリ-L-リジンでコーティングされたウェル内で高コンフルエンスまで増殖され、播種から16~20時間後、細胞は、緑色蛍光タンパク質(GFP)発現ヒトアデノウイルス5の段階希釈を接種され、その後、細胞は、ウイルスが細胞と相互作用することを可能にするために、37℃においてインキュベートされた。一時間のインキュベーション後、まだ細胞に侵入していないすべてのウイルスが除去され、次いで、0.5%アガロースオーバレイが追加された。オーバレイは、加熱され、液体として細胞に追加され、次いで、ウェルに注がれた後すぐに凝固する。それは、ウイルス感染を制限する半固体オーバレイを作成し、ウイルスは、最初に感染した細胞に隣接する細胞のみに感染する。次いで、ウェルは、7日間インキュベートされ、位相差イメージングと緑色蛍光イメージングの両方を使用して4倍の倍率でincucyte(登録商標)において画像化された。
【0085】
結果として生じるデータセットは、位相差画像と緑色蛍光画像のペアから構成され、緑色蛍光は、感染細胞を示す(図13における例を参照)。
【0086】
より早い時点からの予測を実証するために、本発明者らは、5日目の位相差画像に基づいて7日目の緑色蛍光画像を予測するために畳み込みニューラルネットワークをトレーニングした。成功した予測は、本発明者らが少なくとも丸2日前に最終的な感染ウイルス力価を推定することができることを示す。本発明者らは、2つの希釈(10-6および10-5)からの測定された蛍光画像と比較した予測された蛍光画像間のフーバー損失(Huber, P.J.,"Robust estimation of a location parameter",Breakthroughs in statistics. Springer,New York,1992,pp. 492-518を参照)を最小化するために、特にU-netアーキテクチャ(Ronneberger, O., Fischer, P., およびBrox, T.,"U-net: Convolutional networks for biomedical image segmentation",in International Conference on Medical image computing and computer-assisted intervention. Springer,Cham,2015, October,pp. 234-241を参照)の完全畳み込みニューラルネットワークをトレーニングした。本発明者らは、10-4の学習率を使用して1000エポックについてモデル重みを更新するために、Adamオプティマイザ(Kingma, D.P., およびBa, J.,"Adam: A method for stochastic optimization",arXiv preprint arXiv:1412.6980,2014を参照)を使用した。次いで、本発明者らは、陰性対照と、ウイルスの10-7および10-5希釈が接種された培養物とを含む3つの他のウェルの蛍光を予測した。
【0087】
結果は、図14に示すように、予測が絶対的な意味で完全ではないにもかかわらず、予測された蛍光がウイルス濃度とよく相関していることを示す。ゼロから低濃度までのウイルスの場合、モデルは、ゼロから低いまでの蛍光を正確に予測し、ゼロから低感染までの感染が存在することを示すが、高ウイルス濃度では、蛍光を正確に予測する。すべての感染部位がモデル予測によって捕捉されていないにもかかわらず(図14の下のパネル、右列における予測と比較した左列における測定)、モデルは、依然としてより低い濃度と比較してより多くのことを予測する。この違いは、モデルが主に一次感染部位によって誘発される細胞変性効果を検出するが、二次感染部位のものはまだ明らかではないことに起因し得る。データは、本発明者らが、完全な実験が終了するのを待つよりも少なくとも2日早く感染ウイルス力価を推定することができることを実証する。
【0088】
添付の特許請求の範囲は、開示された発明のさらなる説明として提供される。上記の詳細な説明は、添付の図を参照して、開示されたシステム、デバイス、および方法の様々な特徴および機能について説明する。図において、文脈がそうでないことを示さない限り、同様の記号は、典型的には同様の構成要素を示す。詳細な説明、図、および特許請求の範囲において説明した例示的な実施形態は、限定であることを意味しない。本明細書において提示する主題の範囲から逸脱することなく、他の実施形態が利用され得、他の変更が行われ得る。本明細書において一般的に説明し、図に示す本開示の態様は、多種多様な異なる構成において配置、置換、結合、分離、および設計され得、それらのすべてが本明細書で明示的に企図されることが容易に理解されるであろう。
【0089】
図中のフロー図、シナリオ、およびフローチャートのいずれかまたはすべてに関して、また本明細書で開示するように、各ステップ、ブロック、および/または通信は、例示的な実施形態による情報の処理および/または情報の伝送を表し得る。代替実施形態は、これらの例示的な実施形態の範囲内に含まれる。例えば、これらの代替実施形態では、ステップ、ブロック、伝送、通信、要求、応答、および/またはメッセージとして説明した機能は、関係する機能に応じて、実質的に同時または逆の順序を含み、図示または論じた順序とは異なる順序で実行され得る。さらに、より多いまたはより少ないステップ、ブロック、および/または機能が、本明細書で論じたメッセージフロー図、シナリオ、およびフローチャートのいずれかとともに使用され得、これらのメッセージフロー図、シナリオ、およびフローチャートは、一部または全体において互いに組み合わされ得る。
【0090】
情報の処理を表すステップまたはブロックは、本明細書で説明した方法および技法の特定の論理機能を実行するように構成され得る回路に対応し得る。代替的に、または追加的に、情報の処理を表すステップまたはブロックは、モジュール、セグメント、またはプログラムコードの一部(関連データを含む)に対応し得る。プログラムコードは、方法または技法における特定の論理機能またはアクションを実装するためにプロセッサによって実行可能な1つまたは複数の命令を含み得る。プログラムコードおよび/または関連データは、ディスクドライブ、ハードドライブ、または他の記憶媒体を含む記憶デバイスなどの任意のタイプのコンピュータ可読媒体上に記憶され得る。
【0091】
コンピュータ可読媒体は、レジスタメモリ、プロセッサキャッシュ、および/またはランダムアクセスメモリ(RAM)などの、データを短期間記憶するコンピュータ可読媒体などの非一時的なコンピュータ可読媒体も含み得る。コンピュータ可読媒体は、例えば、読み取り専用メモリ(ROM)、光ディスクもしくは磁気ディスク、および/またはコンパクトディスク読み取り専用メモリ(CD-ROM)のような二次記憶域または永続的長期記憶域などの、プログラムコードおよび/またはデータを記憶する非一時的コンピュータ可読媒体も含み得る。コンピュータ可読媒体はまた、任意の他の揮発性または不揮発性記憶システムであり得る。コンピュータ可読媒体は、例えば、コンピュータ可読記憶媒体、または有形記憶デバイスと考えられ得る。
【0092】
さらに、1つまたは複数の情報伝送を表すステップまたはブロックは、同じ物理デバイス内のソフトウェアおよび/またはハードウェアモジュール間の情報伝送に対応し得る。しかしながら、他の情報伝送は、異なる物理デバイス内のソフトウェアモジュールおよび/またはハードウェアモジュール間であり得る。
【0093】
様々な態様および実施形態が、限定ではなく例示の目的のために開示されているが、本発明の範囲から逸脱することなく、本開示の詳細からの変更が可能であることは、当業者には明らかであろう。範囲に関するすべての質問は、添付の特許請求の範囲を参照することによって回答されるべきである。
【符号の説明】
【0094】
10 保持ウェル
24 ワークステーション、ディスプレイ
100 機械学習モデルトレーニング段階
102 トレーニングセット
104 顕微鏡画像
106 グラウンドトゥルース
108 機械学習モデル
150 トレーニング済み機械学習モデル
150A モデル
150B モデル
150C モデル
200 機械学習モデル適用段階
202 新しいモデル入力、細胞培養物の顕微鏡画像の時系列
204 モデル出力、最終的なウイルス力価
400 分析機器
402 蛍光光学モジュール
404 細胞培養プレート
406 蛍光試薬および/または免疫組織化学試薬
408 トレイ
410 ハウジング
418 モータシステム
450A LED励起光源
450B LED励起光源
452A 狭帯域バンドパスフィルタ
452B 狭帯域バンドパスフィルタ
454A ダイクロイック
454B ダイクロイックミラー
460 対物レンズ
462 狭帯域発光フィルタ
464 デジタルカメラ
600 実験
602 顕微鏡画像
604 ウイルス力価読み出し
606 プロセス画像モジュール
608 数値表現
808 数値表現
1000 数値表現
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
【国際調査報告】