(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-19
(54)【発明の名称】細胞の形態学的変化の早期検出のための機械学習
(51)【国際特許分類】
G01N 33/48 20060101AFI20240312BHJP
G06T 7/00 20170101ALI20240312BHJP
G06N 3/0895 20230101ALI20240312BHJP
G06N 20/00 20190101ALI20240312BHJP
G01N 33/483 20060101ALI20240312BHJP
【FI】
G01N33/48 M
G06T7/00 350B
G06N3/0895
G06N20/00
G01N33/48 Z
G06T7/00 630
G01N33/483 C
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023547610
(86)(22)【出願日】2022-02-04
(85)【翻訳文提出日】2023-09-26
(86)【国際出願番号】 US2022015379
(87)【国際公開番号】W WO2022170145
(87)【国際公開日】2022-08-11
(32)【優先日】2021-02-05
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-07-31
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2022-02-04
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】523297468
【氏名又は名称】ヴィクィ インク.
(74)【代理人】
【識別番号】110002354
【氏名又は名称】弁理士法人平和国際特許事務所
(72)【発明者】
【氏名】ゴールドバーグ,イリヤ
(72)【発明者】
【氏名】フェドロフ,ドミトリー
(72)【発明者】
【氏名】ラング,クリスチャン
(72)【発明者】
【氏名】クビレクバル,クリスティアン
(72)【発明者】
【氏名】ヤン,キャサリン
(72)【発明者】
【氏名】ドドキンス,ヘンリー
【テーマコード(参考)】
2G045
5L096
【Fターム(参考)】
2G045AA24
2G045CB01
2G045FA19
2G045JA03
5L096AA02
5L096BA05
5L096BA06
5L096BA13
5L096DA01
5L096GA55
5L096HA11
5L096KA04
5L096MA07
(57)【要約】
生体細胞の細胞状態の形態学的変化の早期の検出の機械学習のための方法及びシステムが開示される。1つの開示される実施形態においては、ワクチン及び抗ウイルス薬の開発が、機械学習を使用して高速化されて、人間の観察だけを使用して検出できるよりも早期にウイルスプラークを同定する。開示される実施形態においては、ウイルス感染細胞における形態学的変化の検出は、細胞死によって引き起こされるプラークが観察可能になる(典型的な細胞死では2日~14日)前に行うことができる。機械学習は、新規な抗ウイルス化合物の開発のためのウイルス学の研究に、ハイコンテント/ハイスループットの技術をもたらす。機械学習はまた、インフルエンザ及びSARS-CoV-2等の、急速に変異するウイルス株に対する、新規な抗ウイルス化合物の有効性を特徴付けるために使用することもできる。
【選択図】なし
【特許請求の範囲】
【請求項1】
機械学習を使用したウイルス感染性アッセイのための1つ以上のAIモデルをトレーニングするシステムであって、
細胞よりも小さい解像度で捕捉された1つ以上の捕捉画像を記憶する第1の記憶装置であって、各捕捉画像は、複数のウイルスストックのうちの既知のウイルスストックに感染した複数の無染色細胞を捕捉し、前記複数の無染色細胞は、無染色感染細胞及び無染色非感染細胞の両方を含む、第1の記憶装置と、
前記第1の記憶装置と通信するコンピューターシステムであって、前記コンピューターシステムは、プロセッサと、前記プロセッサによる実行のための命令を記憶する第2の記憶装置とを含み、前記プロセッサは、前記第2の記憶装置に記憶された命令を実行して、前記第1の記憶装置に記憶された前記1つ以上の捕捉画像を読み出して処理する、コンピューターシステムと、
前記プロセッサによる使用のために前記第2の記憶装置に記憶された、1つ以上の撮像人工知能(AI)モデルであって、前記1つ以上の撮像AIモデルは、1つ以上の既知のウイルスを分析するようにトレーニングされ、前記1つ以上の画像AIモデルは、前記プロセッサによって実行される命令と共に使用されて、無染色細胞の前記捕捉画像を処理し、前記1つ以上の捕捉画像における前記無染色感染細胞と前記無染色非感染細胞との間の形態学的差異を検出して、前記1つ以上の捕捉画像に基づいて予測されるウイルス感染性を示す、無染色非感染細胞に対する無染色感染細胞の比率を決定する、1つ以上の撮像AIモデルと、
を備え、
前記1つ以上の捕捉画像における前記無染色感染細胞と前記無染色非感染細胞との間の前記形態学的差異は、前記細胞よりも小さい解像度では人間の視力によって判断不可能なものである、前記システム。
【請求項2】
無染色細胞の前記既知のウイルスストックは、既知の濃度力価及び既知の無染色非感染細胞に対する無染色感染細胞の比率を有する、請求項1に記載のシステム。
【請求項3】
前記無染色感染細胞の感染多重度(MOI)は0.999よりも大きく、前記無染色非感染細胞の感染多重度(MOI)は0である、請求項1に記載のシステム。
【請求項4】
前記捕捉画像は、明視野画像、暗視野画像、位相コントラスト画像、及び微分干渉コントラスト(DIC)画像の群から選択される画像を生成するために、撮像器によって捕捉される、請求項1に記載のシステム。
【請求項5】
前記既知のウイルスストックに感染した前記複数の無染色細胞を含む1つ以上のウェルを有するプレートを更に備える、請求項4に記載のシステム。
【請求項6】
前記1つ以上の捕捉画像は、前記プレート及び前記1つ以上のウェルについて撮影された生画像である、請求項5に記載のシステム。
【請求項7】
前記1つ以上の捕捉画像は、重ならない矩形タイルに分割され、各タイルは包含的に、32画素×32画素と、前記1つ以上の捕捉画像の画素幅×画素高さとの間の範囲内の数の、M画素×N画素を有する、請求項6に記載のシステム。
【請求項8】
前記タイルは、細胞が実質的に含まれないタイルを除外するようにプレフィルタリングされ、
前記細胞は、個々に分離されない、請求項7に記載のシステム。
【請求項9】
前記1つ以上の捕捉画像は、前記AIモデルによって、細胞単位又はタイル単位で分析される、請求項6に記載のシステム。
【請求項10】
前記既知のウイルスストックは、コロナウイルス科に属する、請求項1に記載のシステム。
【請求項11】
前記既知のウイルスストックは、SARS-CoV-2ウイルスである、請求項10に記載のシステム。
【請求項12】
前記1つ以上の捕捉画像に関連するメタデータを記憶するデータベースを更に備え、
前記プロセッサは、前記第2の記憶装置に記憶された命令を更に実行して、前記記憶されたメタデータを読み出し、前記記憶されたメタデータに基づいて、前記第1の記憶装置に記憶された前記1つ以上の捕捉画像を更に処理する、請求項1に記載のシステム。
【請求項13】
機械学習を使用してウイルス感染性アッセイを分析するシステムであって、
1つ以上のウェルを有するプレートであって、前記1つ以上のウェルのそれぞれの中に、複数の無染色感染細胞及び複数の無染色非感染細胞を有する、プレートと、
ウイルスストックに感染した複数の無染色細胞を有する前記プレートの画像を、細胞よりも小さい解像度で捕捉する、撮像器と、
前記撮像器と通信するように結合されたコンピューターシステムであって、前記コンピューターシステムは、プロセッサと、前記プロセッサによる実行のための命令を記憶する記憶装置とを含み、前記プロセッサは、前記記憶装置中の前記記憶された命令を実行する際に、1つ以上の既知のウイルスに対する1つ以上のトレーニングされたAIモデルを提供し、前記プロセッサは、前記トレーニングされたAIモデルを使用するための更なる命令を実行して、前記捕捉画像を分析して非感染細胞に対する感染細胞の比率を決定する機能を更に提供する、コンピューターシステムと、
を備える、システム。
【請求項14】
前記プレートは、複数のウェルを有する、請求項13に記載のシステム。
【請求項15】
前記プレートは、スループットを向上させるために、試料当たり1ウェル~3ウェルの範囲を有する、請求項14に記載のシステム。
【請求項16】
前記撮像器によって捕捉される前記捕捉画像は、明視野画像、暗視野画像、位相コントラスト画像、及び微分干渉コントラスト(DIC)画像の群から選択される、請求項13に記載のシステム。
【請求項17】
前記ウイルスストックは、コーティングされた又はコーティングされていないDNA、及びコーティングされた又はコーティングされていないRNAの群のウイルスを含む、請求項13に記載のシステム。
【請求項18】
前記ウイルスは、COVID-19の原因物質であるRNAコーティングされたウイルスである、SARS CoV-2である、請求項17に記載のシステム。
【請求項19】
前記撮像器は、プレート撮像器である、請求項13に記載のシステム。
【請求項20】
前記撮像器は、顕微鏡である、請求項13に記載のシステム。
【請求項21】
前記撮像器は、ロボット顕微鏡法を実行する撮像ロボットである、請求項13に記載のシステム。
【請求項22】
撮像のために前記プレートを処理する流体操作ロボットを更に備える、請求項13に記載のシステム。
【請求項23】
機械学習を使用したウイルス感染性アッセイのための方法であって、
1つ以上の人工知能(AI)モデルを、既知のウイルスストックに感染した無染色細胞の画像と、無染色非感染細胞の画像とのデータセットに前記AIをさらすことによって、感染細胞と非感染細胞とを識別するようにトレーニングすることであって、前記データセットは、前記感染細胞中のほぼ全ての細胞がウイルスに感染し、模擬感染試料中のどの細胞も感染していないような、既知の高い感染多重度(MOI)比で感染させたウェルの画像からなり、トレーニング画像は、ゼロから、初期感染後に細胞変性効果(CPE)が手作業で観察できるようになるまでの培養期間にわたって、所定の時間に定期的に捕捉されることと、
トレーニング期間の間に決定された培養時点において、前記既知のウイルスストックの既知の力価の一連の希釈物に対して、前記1つ以上の人工知能(AI)モデルを検証することによって、前記アッセイの有効MOI範囲を決定することと、
を含む、前記方法。
【請求項24】
複数の細胞株のうちの1つの細胞株に関連する細胞をプレーティングすることを更に含む、請求項23に記載の方法。
【請求項25】
前記感染細胞を0時間から4~6時間の培養範囲にわたって培養することを更に含む、請求項24に記載の方法。
【請求項26】
プレート撮像器を使用して、前記AIモデルをトレーニングするために使用される前記画像を捕捉することを更に含む、請求項25に記載の方法。
【請求項27】
前記捕捉画像は、明視野画像、暗視野画像、位相コントラスト画像、及び微分干渉コントラスト(DIC)画像の群から選択される、請求項26に記載の方法。
【請求項28】
前記明視野画像は、蛍光染色により細胞を染色していない又はその他のタイプのプローブを取り付けていない、位相コントラスト画像である、請求項27に記載の方法。
【請求項29】
前記捕捉画像を処理してタイルにすることを更に含み、各タイルは包含的に、32画素×32画素と、1つ以上の捕捉画像の画素幅×画素高さとの間の範囲内の数の画素を有する、請求項26に記載の方法。
【請求項30】
前記タイルは、矩形であり、重ならない、請求項29に記載の方法。
【請求項31】
複数のAIモデルを組み合わせて、アンサンブルAIモデルを形成することを更に含む、請求項23に記載の方法。
【請求項32】
前記トレーニング画像は、前記培養期間にわたって毎時に(at each hour)定期的に捕捉される、請求項23に記載の方法。
【請求項33】
前記タイルは、所定量よりも多い背景を示すタイルを除外するようにプレフィルタリングされる、請求項29に記載の方法。
【請求項34】
前記トレーニングされたAIモデルを使用して複数の感染細胞の画像を分析して、受信された画像に基づいて、既知の又は予想される試料の予測されるウイルス感染性を決定することを更に含む、請求項23に記載の方法。
【請求項35】
前記複数の感染細胞の画像は、前記AIモデルの検証の間に決定された有効感染多重度(MOI)範囲内の、既知の又は予想される試料の希釈物から捕捉される、請求項23に記載の方法。
【請求項36】
機械学習を使用したウイルス感染性アッセイのための方法であって、
1つ以上の人工知能(AI)モデルを、既知のウイルスストックに感染した無染色細胞の画像と、無染色非感染細胞の画像とのデータセットに前記AIをさらすことによって、感染細胞と非感染細胞とを識別するようにトレーニングすることであって、前記データセットは、前記感染細胞中のほぼ全ての細胞がウイルスに感染し、模擬感染試料中のどの細胞も感染していないような、既知の高い感染多重度(MOI)比で感染させたウェルの画像からなり、トレーニング画像は、ゼロから、初期感染後に細胞変性効果(CPE)が手作業で観察できるようになるまでの培養期間にわたって、所定の時間に定期的に捕捉されることと、
前記トレーニングされたAIモデルを使用して複数の感染細胞の画像を分析して、受信された画像に基づいて、既知の又は予想される試料の予測されるウイルス感染性を決定することと、
を含む、前記方法。
【請求項37】
複数の細胞株のうちの1つの細胞株に関連する細胞をプレーティングすることを更に含む、請求項36に記載の方法。
【請求項38】
前記感染細胞を0時間から4~6時間の培養範囲にわたって培養することを更に含む、請求項37に記載の方法。
【請求項39】
プレート撮像器を使用して、前記AIモデルをトレーニングするために使用される前記画像を捕捉することを更に含む、請求項38に記載の方法。
【請求項40】
前記捕捉画像は、明視野画像、暗視野画像、位相コントラスト画像、及び微分干渉コントラスト(DIC)画像の群から選択される、請求項39に記載の方法。
【請求項41】
前記明視野画像は、蛍光色素若しくは染色により細胞を染色していない又はその他のタイプのプローブを取り付けていない、位相コントラスト画像である、請求項40に記載の方法。
【請求項42】
前記捕捉画像を処理してタイルにすることを更に含み、各タイルは包含的に、32画素×32画素と、1つ以上の捕捉画像の画素幅×画素高さとの間の範囲内の数の画素を有する、請求項39に記載の方法。
【請求項43】
前記タイルは、矩形であり、重ならない、請求項41に記載の方法。
【請求項44】
複数のAIモデルを組み合わせて、アンサンブルAIモデルを形成することを更に含む、請求項36に記載の方法。
【請求項45】
前記トレーニング画像は、前記培養期間にわたって毎時に定期的に捕捉される、請求項41に記載の方法。
【請求項46】
前記タイルは、所定量よりも多い背景を示すタイルを除外するようにプレフィルタリングされる、請求項42に記載の方法。
【請求項47】
機械学習を使用したウイルス感染性アッセイを分析する方法であって、
1つ以上の人工知能(AI)モデルを、既知のウイルスストックに感染した無染色細胞の画像と、無染色非感染細胞の画像とのデータセットに前記AIをさらすことによって、感染細胞と非感染細胞とを識別するようにトレーニングすることであって、前記データセットは、前記感染細胞中のほぼ全ての細胞がウイルスに感染し、模擬感染試料中のどの細胞も感染していないような、既知の高い感染多重度(MOI)比で感染させたウェルの明視野画像からなり、トレーニング画像は、ゼロから、初期感染後に細胞変性効果(CPE)が手作業で観察できるようになるまでの培養期間にわたって、所定の時間に定期的に捕捉されることと、
トレーニング期間の間に決定された培養時点において、前記既知のウイルスストックの既知の力価の一連の希釈物に対して、前記1つ以上の人工知能(AI)モデルを検証することによって、前記アッセイの有効MOI範囲を決定することと、
前記1つ以上のAIモデルをトレーニング及び検証した後、既知の又は予想される試料のウイルス力価を、
所定の培養時点において、前記既知の又は予想される試料の異なる希釈物で感染させた細胞の1つ以上の画像を受信することであって、前記既知の又は予想される試料の各希釈物のMOI比が、トレーニングにおいて使用された前記画像の既知の高MOI比よりも小さいことと、
前記トレーニングされたAIモデルを使用して、複数の感染細胞の画像を分析して、前記受信された画像に基づいて、前記既知の又は予想される試料の予測されるウイルス感染性を決定することと、
によって、決定することと、
を含む、前記方法。
【請求項48】
前記既知の又は予想される試料に感染した前記細胞の前記1つ以上の画像は、
前記既知の又は予想される試料を希釈して、前記既知の又は予想される試料の複数の異なる希釈物を作成することと、
複数の非感染細胞を、前記既知の又は予想される試料の前記複数の異なる希釈物で感染させることと、
複数の感染細胞を、1つ以上の所定の時間において撮像することと、
によって得られる、請求項47に記載の方法。
【請求項49】
複数の細胞株のうちの1つの細胞株に関連する細胞をプレーティングすることを更に含む、請求項48に記載の方法。
【請求項50】
前記感染細胞を0時間~48時間の培養範囲にわたって培養することを更に含む、請求項49に記載の方法。
【請求項51】
プレート撮像器を使用して、前記AIモデルをトレーニングするために使用される画像を捕捉することを更に含む、請求項47に記載の方法。
【請求項52】
前記捕捉画像は、明視野画像、暗視野画像、位相コントラスト画像、及び微分干渉コントラスト(DIC)画像の群から選択される、請求項51に記載の方法。
【請求項53】
前記明視野画像は、蛍光染料又は染色により細胞を染色していない又はその他のタイプのプローブを取り付けていない、位相コントラスト画像である、請求項52に記載の方法。
【請求項54】
前記捕捉画像を処理してタイルにすることを更に含み、各タイルは包含的に、32画素×32画素と、1つ以上の捕捉画像の画素幅×画素高さと、の間の範囲内の数の画素を有する、請求項51に記載の方法。
【請求項55】
前記タイルは、矩形であり、重ならない、請求項54に記載の方法。
【請求項56】
複数のAIモデルを組み合わせて、アンサンブルAIモデルを形成することを更に含む、請求項47に記載の方法。
【請求項57】
前記トレーニング画像は、前記培養期間にわたって毎時に定期的に捕捉される、請求項51に記載の方法。
【請求項58】
機械学習を使用したウイルス感染性アッセイを分析する方法であって、
1つ以上の人工知能(AI)モデルを、既知のウイルスストックに感染した無染色細胞の画像と、無染色非感染細胞の画像とのデータセットに前記AIをさらすことによって、感染細胞と非感染細胞とを区別するようにトレーニングすることであって、前記データセットは、前記感染細胞中のほぼ全ての細胞がウイルスに感染し、模擬感染試料中のどの細胞も感染していないような、既知の高い感染多重度(MOI)比で感染させたウェルの明視野画像からなり、トレーニング画像は、ゼロから、初期感染後に細胞変性効果(CPE)が手作業で観察できるようになるまでの培養期間にわたって、所定の時間に定期的に捕捉されることと、
トレーニング期間の間に決定された培養時点において、前記既知のウイルスストックの既知の力価の一連の希釈物に対して、前記1つ以上の人工知能(AI)モデルを検証することによって、前記アッセイの有効MOI範囲を決定することと、
前記AIモデルをトレーニング及び検証した後、既知の試料のウイルス力価を、
前記既知の試料を希釈して、複数の異なる希釈された既知の試料を作成することと、
前記複数の異なる希釈された既知の試料で複数の未感染細胞を感染させることと、
複数の感染細胞を、前記異なる希釈された既知の試料の感染性を変化させる処置により処置することと、
前記複数の感染細胞を、前記処置の前後の1つ以上の所定の時間に撮像することと、
前記トレーニングされたAIモデルを使用して、前記複数の感染細胞の画像を分析して、前記処置の前後の前記既知の試料の予測されるウイルス感染性を決定することと、
によって決定することと、
を含む、前記方法。
【請求項59】
前記感染細胞を処置することは、細胞に感染した既知のウイルスを不活性化するために抗体を添加することを含む、請求項58に記載の方法。
【請求項60】
前記感染細胞を処置することは、感染を回避するために感染細胞の遺伝子を改変することを含む、請求項58に記載の方法。
【請求項61】
前記感染細胞を処置することは、1つ以上の医薬、患者血清からの不活性化抗体、殺生物剤、又は抗ウイルス剤を添加することを含む、請求項58に記載の方法。
【請求項62】
前記処置は、遺伝子治療のための遺伝子を発現させるために前記ウイルスの遺伝子を改変すること、前記ウイルスの感染標的細胞に影響を与えるように前記ウイルスの遺伝子を改変すること、前記ウイルスの感染性を調整するように前記ウイルスの遺伝子を改変すること、又は宿主患者の免疫応答を調整するように前記ウイルスの遺伝子を改変することを含む、請求項57に記載の方法。
【請求項63】
機械学習を使用したウイルス感染性アッセイを分析する方法であって、
1つ以上の人工知能(AI)モデルを、既知のウイルスストックに感染した無染色細胞の画像と、無染色非感染細胞の画像とのデータセットに前記AIをさらすことによって、感染細胞と非感染細胞とを区別するようにトレーニングすることであって、前記データセットは、前記感染細胞中のほぼ全ての細胞が既知のウイルスに感染し、模擬感染試料中のどの細胞も感染していないような、既知の高い感染多重度(MOI)比で感染させたウェルの明視野画像からなり、トレーニング画像は、ゼロから、初期感染後に細胞変性効果(CPE)が手作業で観察できるようになるまでの培養期間にわたって、所定の時間に定期的に捕捉されることと、
異なる既知のウイルスを使用して前の方法ステップを繰り返すことによって、前記AIモデルを更にトレーニングすることと、
トレーニング期間の間に決定された培養時点において、前記既知のウイルスストックの既知の力価の一連の希釈物に対して、前記1つ以上の人工知能(AI)モデルを検証することによって、前記アッセイの有効MOI範囲を決定することと、
トレーニング及び検証の後、未知の試料のウイルス力価を、
前記未知の試料を希釈して、複数の希釈された未知の試料を作成することと、
前記複数の希釈された未知の試料で未感染細胞を感染させることと、
前記所定の時間に感染細胞の画像を捕捉することと、
前記トレーニングされたAIモデルを使用して前記感染細胞の前記画像を分析して、前記画像中の前記希釈された未知の試料の予測されるウイルス感染性を決定することと、
によって決定することと、
を含む、前記方法。
【請求項64】
前記AIモデルのそれぞれについて、前記AIモデルがトレーニングされた複数のウイルスのうちの1つのウイルスに、前記細胞が感染した確率を報告することを更に含む、請求項63に記載の方法。
【請求項65】
前記試料が複数のウイルスのうちの1つ以上を含むか否かを決定するための、1つ以上の確率閾値を定義することを更に含む、請求項63に記載の方法。
【請求項66】
1つの確率閾値は下限閾値であり、該下限閾値より低い場合には前記ウイルスが同定されない、請求項64に記載の方法。
【請求項67】
1つの確率閾値は上限閾値であり、該上限閾値を超えた場合には前記試料中に前記ウイルスが同定される、請求項65に記載の方法。
【請求項68】
未知のウイルスのプレート画像及びメタデータをアップロードすることを更に含む、請求項63に記載の方法。
【請求項69】
前記アッセイの前記範囲内の所与の希釈度における前記ウェル中の前記タイルの画像を集計することと、
前記集計画像の統計的分析を決定して、試験中の前記試料の未知の感染力価に対する予測されるMOIを決定することと、
を更に含む、請求項63に記載の方法。
【請求項70】
機械学習を使用したウイルス感染性アッセイを分析する方法であって、
1つ以上の人工知能(AI)モデルを、既知のウイルスストックに感染した無染色細胞の画像と、無染色非感染細胞の画像とのデータセットに前記AIをさらすことによって、感染細胞と非感染細胞とを区別するようにトレーニングすることであって、前記データセットは、前記感染細胞中のほぼ全ての細胞がウイルスに感染し、模擬感染試料中のどの細胞も感染していないような、既知の高い感染多重度(MOI)比で感染させたウェルの明視野画像からなり、トレーニング画像は、ゼロから、初期感染後に細胞変性効果(CPE)が手作業で観察できるようになるまでの培養期間にわたって、所定の時間に定期的に捕捉されることと、
トレーニング期間の間に決定された培養時点において、前記既知のウイルスストックの既知の力価の一連の希釈物に対して、前記1つ以上の人工知能(AI)モデルを検証することによって、前記アッセイの有効MOI範囲を決定することと、
トレーニング及び検証の後、既知の試料のウイルス力価を、
前記既知の試料を希釈して、複数の希釈された既知の試料を作成することと、
前記複数の希釈された既知の試料で未感染細胞を感染させることと、
感染細胞を前記所定の時間に撮像することと、
医薬品製造プロセスステップを実行することと、
前記医薬品製造プロセスステップの後、前記所定の時間に前記感染細胞を撮像することと、
前記トレーニングされたAIモデルを使用して、前記医薬品製造プロセスステップの前後に捕捉された前記感染細胞の画像を分析して、前記画像における予測されるウイルス感染性を決定することと、
によって決定することと、
を含む、前記方法。
【発明の詳細な説明】
【技術分野】
【0001】
[政府のライセンス権]
本発明は全米科学財団によって授与された許可番号2029707に基づく政府支援によって行われた。政府は本発明に関して一定の権利を有する。
【0002】
[関連出願との相互参照]
このPCT特許出願は、発明者であるIlya Goldbergらによる、2022年2月4日に出願された「MACHINE LEARNING FOR EARLY DETECTION OF CELLULAR MORPHOLOGICAL CHANGES」と題された米国非仮特許出願第17/650,067号の利益を主張するものであり、この米国非仮特許出願は、発明者であるIlya Goldbergらによる、2021年7月31日に出願された「MACHINE LEARNING FOR EARLY DETECTION OF CELLULAR MORPHOLOGICAL CHANGES」と題された米国仮特許出願第63/228,093号の利益を主張するものであり、また、発明者であるIlya Goldbergらによる、2021年2月5日に出願された「MACHINE LEARNING FOR EARLY DETECTION OF CELLULAR MORPHOLOGICAL CHANGES」と題された米国仮特許出願第63/146,541号の利益を主張するものであり、これらはいずれも、あらゆる意図及び目的について、参照により本明細書に援用する。
【0003】
開示される実施形態は、包括的には、細胞の中のCOVID-19プラークの早期検出等の、細胞構造の変化の早期検出のための、デジタル画像からの生体細胞についての機械学習に関する。
【背景技術】
【0004】
プラークアッセイは、ウイルス学において最も重要なアッセイの1つである。プラークアッセイは、感受性細胞の培養に対する感染の影響を観察することによって、試料中の感染性ウイルス粒子の数を測定する。現在、正確な読み出しを確実にするためには数回の感染が必要であるため、プラークアッセイを処理するためには約2日~14日を要している。感染性の結果を得るまでの時間を短縮することが望ましい。
【0005】
生体細胞における長期間にわたる変化を観察することは、顕微鏡によって支援される場合であっても、人間の目では行うことが困難である。生体細胞の変化は、顕微鏡下で何百もの細胞を研究している人によってもその変化が見落とされてしまい得るほど、非常にわずかであり得るものであり、雑音の多い環境の中で生じ得るものでもある。一定期間にわたる多数の生体細胞の変化の捕捉及び分析を改善することが望ましい。
【発明の概要】
【0006】
実施形態は、以下の特許請求の範囲によって要約される。
【0007】
この特許又は出願ファイルは、カラーで描かれた少なくとも1枚の図面を含む。カラー図面(複数の場合もある)を含むこの特許又は特許出願公開公報の写しは、要求及び必要な手数料の支払いに応じて、米国特許商標庁によって提供される。
【図面の簡単な説明】
【0008】
【
図1A】
図1Aは、複数のクライアントコンピューターが、インターネットの広域ネットワーク等のコンピューターネットワークを通して、サーバーセンター(又はクラウド)中の1つ以上のコンピューターサーバーと通信する、クライアントサーバーコンピューターシステム、及び提供されるサービスのブロック図である。
【
図1B】
図1Bは、細胞の形態学的変化の早期検出システムを実装した生体細胞分析システムのブロック図を示す。
【
図2A】
図2Aは、生体細胞の明視野画像(中央)及び細胞のいくつかの注釈(右側パネル)を示すスライドビューアーを含む、本システムによって生成されるユーザーインターフェイスウィンドウを示す図である。
【
図2B】
図2Bは、
図2Aに示されるユーザーインターフェイスの右側パネルの詳細を示す図である。
【
図3】
図3は、明視野画像における形態学的変化を検出するための、分類された細胞の機械学習分類の一例示の出力を伴う、本システムによって生成されるユーザーインターフェイスウィンドウを示す図である。
【
図4A】
図4Aは、本システムによって提供される別のユーザーインターフェイスビューアーウィンドウを示す図である。
【
図4B】
図4Bは、生成されたAIモデルを使用した分類アルゴリズムからの分類結果と重ね合わせられた細胞の明視野画像のビューアーウィンドウを示す図である。
【
図5A】
図5Aは、標準的なウイルスプラークアッセイについての従来のアッセイワークフローを、既知の細胞状態を有する細胞の明視野画像による機械学習/モデルトレーニング段階、及びAIモデルによる細胞状態について試験されるべき細胞の細胞分類による診断段階を含む、AIによって強化されたアッセイワークフローと比較する、ワークフロー図である。
【
図5B】
図5Bは、本発明の実施形態による、AIを利用した細胞アッセイのための2つの段階、すなわちトレーニング及び分類のワークフロー図である。
【
図5C】
図5Cは、従来のプラークアッセイを、AIによって強化されたアッセイと比較する、ワークフロー図及びタイムライン図である。
【
図5D】
図5Dは、感染した生体細胞を有するプレート中のウェルのデジタル画像の画像捕捉、及びデジタル画像からの画素の矩形タイルの形成を示す図である。
【
図5E】
図5Eは、AIモデル及び機械学習アルゴリズムを用いて決定された感染性を、従来のアッセイ法を用いて決定された感染性と比較するプロットを有する、検証チャートである。
【
図6】
図6は、複数のクライアントコンピューターが、インターネットの広域ネットワーク等のコンピューターネットワークを通して、サーバーセンター(又はクラウド)中の1つ以上のコンピューターサーバーと通信する、クライアントサーバーコンピューターシステムのブロック図である。
【
図7】
図7は、
図6に示されるシステムにおけるサーバーコンピューター及びクライアントコンピューター(装置)としての使用のためのコンピューターシステムのブロック図である。
【発明を実施するための形態】
【0009】
感染症は、これからも常に我々の周りに存在するであろう。新しいウイルスの変異に素早く反応する能力は、危険なアウトブレークに対処し、脆弱な集団を保護するための鍵である。例えば、専門家たちは、インフルエンザと同様に、季節変動によりCOVID-19ウイルスの更なるアウトブレークが予想されると警告している。それゆえ、ウイルス感染の迅速かつ正確な同定が、我々の将来にとって重要である。
【0010】
開示される実施形態は、機械学習を使用して、感染から数時間以内に明視野顕微鏡法でウイルス感染細胞を同定することに基づく、迅速な自動化された感染性アッセイを開発して、ワクチン及び抗ウイルス剤、遺伝子治療ベクター、並びに腫瘍溶解ウイルス療法の開発を加速させることができる。機械学習は、ウイルス感染に関連する細胞形態を、人間の観察者によっては検出できない場合であっても、検出することができる。開示される実施形態は、従来のプラークアッセイ又はTCID50アッセイにおけるような複数回の感染後の細胞死の検出には依存せず、その代わりに、より早期の感染事象に依存する。明視野顕微鏡法の使用が、細胞の固定及び染色を不要とし、本技術を、より容易に自動化されることを可能とし、また、より迅速で費用対効果の高いものとする。明視野画像の他に、暗視野顕微鏡法による暗視野画像、位相コントラスト顕微鏡法による位相コントラスト画像、及び微分干渉コントラスト(DIC)顕微鏡法によるDIC画像等の、ウイルス感染細胞の他のデジタル画像が使用されてもよい。
【0011】
開示される実施形態の利点は、以下を含む:
ウイルスアッセイを2日間~14日間から数時間に短縮すること。複数回の感染が必要とされない。
試験を自動化及びスケーリングする能力。
標準的なハイコンテントスクリーニング(HCS)装置を用いた、向上したスループット。
材料、試薬及び化合物の削減されたコスト。アガロースオーバーレイ又は固定は必要ではない。
早期検出のための抗体又は遺伝子組み換えウイルスが必要ではない。
客観的で定量的な読み出しを通した、エラーを起こしやすい手作業の結果の排除。
小型化を通した、アッセイ当たりの削減されたコスト。
手作業のプラークアッセイを実行するためのスタッフのトレーニングのための短縮された時間。
BSL3/4の研究室における特殊な試験について、トレーニング及び時間の飛躍的な節約。
より迅速なターン、並行試験、及びより迅速なスクリーニングのために、ワークフロー及び研究を根本的に変革する潜在性。
別のアウトブレーク、COVID-19の亜種、又は将来のパンデミックに対する向上した対応力。
【0012】
クラウドベースの画像処理及び機械学習等の、本発明の他の実施形態は、新規な抗ウイルス化合物の開発のペースを向上させるために、又はインフルエンザ及びSARS-CoV-2等の急速に変異するウイルス株に対する有効性を特徴付けるために、ウイルス学の研究にハイコンテントスクリーニング(HCS)技術を取り入れることができる。
【0013】
ウイルスの迅速で正確な同定は、接触者追跡、検疫、及び効果的な抗ウイルス剤の配備の効果的な手段を実装するために使用され得る。
【0014】
同時に、HCA(ハイコンテント分析)は、早期創薬プログラムにとって貴重であることが証明されている。開示される実施形態は、潜在的なワクチン及び抗ウイルス薬の迅速なターンアラウンド及びスクリーニングをもたらし、ワクチン及び抗ウイルス薬の探索を潜在的に自動化し得る。
【0015】
単一の感染細胞を検出し、ウイルス感染を他のタイプの細胞障害から十分な精度で識別する能力は、これらのタイプのアッセイに現在必要とされている時間及び労力を劇的に変化させることができ、このタイプのアッセイがウイルス学において使用される方法を激変させ得る。さらに、バイオテクノロジー会社及び製薬会社は、新規なワクチン又は抗ウイルス薬を同定し送達する能力を強化する新技術に、当面の関心を有している。開示される実施形態は、ハイコンテント分析(HCA)プラットフォームで自動化することができ、既存の創薬パイプラインに、より容易に適合することができる。医薬品開発の多大なコストを考慮すれば、機械学習プラットフォームのための追加的な利用料はごくわずかである。
【0016】
開示される実施形態は、人工知能(機械学習)を使用して、人間の介入を必要とすることなくパターンを認識する。開示される広範な原理は、以下に詳述されるように、プラークアッセイに適用することができる。同様に、開示される実施形態は、細胞の薬物投与応答、細胞毒性、及び蛍光標識の使用のない生細胞/死細胞の検出にも適用可能である。
【0017】
開示される実施形態は、機械学習を使用して、抗ウイルス剤の試験を加速させる。開示される実施形態は、現代の人工知能(AI)モデル(AI群)をトレーニングして、明視野(位相コントラスト又は微分干渉コントラスト)顕微鏡法を使用して、個々の感染細胞又は感染細胞の小さなクラスターを、手作業で検出できるよりも早期に、生存染色の使用なしで検出することによって、ウイルスアッセイに新規な手法を取り入れる。
【0018】
本明細書に開示されるAIモデルは、細胞の形態学的変化に基づいて感染細胞と非感染細胞とを識別する。AIモデルは、生体試料中の細胞の画像を処理するものであり、本明細書においては撮像人工知能(AI)モデルとも呼ばれ得る。AIの使用は、アッセイプロトコルのいくつかの低速な要素を不要にし、ワクチン及び抗ウイルス薬品の評価についての向上したスループットに帰着する。AIはまた、ハイコンテント分析(HCA)プラットフォームの自動化を促進し、既存の創薬パイプラインに、より容易に適合することができる。
【0019】
この目標を達成するために、いくつかのハードルを乗り越えた:(1)培養の間の明視野顕微鏡法画像取得の実現可能性を、既存のワークフローへの統合の容易さ及び機械学習のための画質に関して、調査する必要があった、(2)機械学習アルゴリズムを、画像の量及び質に対する最適な適合性に関して比較する必要があった、(3)予測品質が、従来のアッセイの読み出しと同等でなければならなかった。
【0020】
開示される実施形態は、自動化されたスクリーニングを使用して、ウイルス感染の初期段階を阻止するワクチン及び化合物の有効性を特徴付けることによって、ハイコンテント分析(HCA)をウイルス学の分野に拡張する。自動化は、より多くの条件下で、より多くの化合物のスクリーニングを可能とし、抗ウイルス治療薬の迅速な開発に導く。このタイプのプラークアッセイの開発は、他の細胞タイプ及びウイルスにも適用可能であり、そのため例えばインフルエンザの研究においても使用できる。さらに、専門家たちは、インフルエンザと同様に、季節変動によりCOVID-19の更なるアウトブレークが予想されると警告しており、それゆえ、有効な抗ウイルス剤の迅速な同定が、我々の将来にとって重要である。
【0021】
プラークアッセイは、ウイルス学において最も重要なアッセイの1つである。このアッセイは、感受性細胞の培養に対する感染の影響を観察することによって、試料中の感染性ウイルス粒子の数を測定する。このアッセイは、試料中の感染性ウイルス粒子の数(プラーク形成単位、すなわちPFU)をカウントするものであり、ウイルスゲノムの数のみをカウントする遺伝物質の増幅(例えばrtPCR)に基づくアッセイとは対照的である。このアッセイがワクチン及び抗ウイルス薬の開発において極めて重要である理由は、これらの処置戦略がしばしばウイルス感染経路を阻害することである。実際、粒子(又はゲノム)対PFU比の増大はしばしば、ワクチン候補における中和抗体の存在、又は抗ウイルス薬品の有効性の指標として使用される。
【0022】
現在、典型的なアッセイは、開発に2日~14日を要するが、これは、様々な理由によって生じ得る単一の死細胞ではなく、感染を示す各プラークを定義する死細胞の局在化したクラスターがあることを確実にするために、数回の感染が必要であるからである。死細胞のクラスターは典型的には、クリスタルバイオレット等のエンドポイントの生死判別染色を用いて検出される。
【0023】
開示される実施形態は、現代の人工知能モデル(AI群)をトレーニングすることによって、ウイルスプラークを自動化された態様で検出して、明視野(位相コントラスト又は微分干渉コントラスト)顕微鏡法を使用して、個々の感染細胞又は感染細胞の小さなクラスターを、手作業で検出できるよりも早期に、生死判別染色の使用なしで、検出する。
【0024】
開示される実施形態は、個々の感染細胞を検出し、かくして、検出を低速化させる現在のプロトコルのいくつかの要素、例えば複数回の感染、ウイルス拡散を制限するためのアガロースオーバーレイ、及びエンドポイントの生死判別染色を不要にする。最終的な結果は、ワクチン及び抗ウイルス薬品を評価するための向上したスループットであり得る。
【0025】
現代の人工知能モデル(AI群)はこれまで、標識又は染色なしで個々のウイルス感染細胞を同定するためには使用されていなかった。開示される実施形態は、高度にトレーニングされた人間の観察者によっても識別できない細胞及び組織の違いを見分けるために、AIモデルを用いた単一細胞の画像ベースのアッセイを使用することができる。人工知能モデル(AI群)は、個々の細胞に対する免疫蛍光アッセイでは、トレーニングされた人間の専門家でさえ識別できなかった、細胞よりも小さいパターンを容易に識別することができる。微分干渉コントラスト(DIC)及び位相コントラストを使用して、人工知能モデル(AI群)は、染色されていない(非染色の)細胞及び組織の試料を容易に識別することができる。人間の観察者は、標識又は染色がなければ、そのようにはできない。さらに、人間の観察者は、大量の感染した生体細胞を含む試料を迅速に観察及びカウントして感染濃度を決定することができない。
【0026】
教師あり機械学習を用いて、開示される実施形態は、抗ウイルス療法の探索において現在ボトルネックとなっている従来のプラークアッセイに適用される利用可能な最良のアルゴリズムを使用する。開示される実施形態によって克服される特定の課題は、可視の変化(典型的には溶解及び死である)を生じることに先立つ状態において、感染細胞の適切なトレーニングセットを収集するための実験デザインであるが、感染の初期段階にある細胞を強調するための染色、マーカー又はその他の手段を使用しない。
【0027】
世界中でのCOVID-19感染者の急増、及び今後何年にもわたり感染の波が続くという現実的な危険性を考えると、ワクチン又は抗ウイルス処置の適時の開発が最優先のものである。かかる処置の選択肢に直接に帰着するものではないが、開示される実施形態は、細胞アッセイの開発パイプラインを短縮することによって、処置の開発を間接的に加速させる。開示される実施形態は、感染症に対抗する薬品をより迅速に開発するために、薬品開発の専門家に重要な研究ツールを提供し得る。
【0028】
開示される実施形態は、単に既存のプラークアッセイに機械学習アプローチを適用する以上のことを行うことができる。AIモデルは、プラーク形成単位(PFU)をカウントするだけではない。開発されるAIモデルは、細胞よりも小さいパターンを識別し、ユーザーインターフェイスに表示することができる。
【0029】
概して、開示される実施形態は、ウイルスアッセイの分析を実行し、感染細胞を認識するモデルを生成し、その結果のAIモデルを迅速に広めるが、顕微鏡法画像フォーマットリーダー、スケーラブルなスライドビューアー、機械学習のためのデータ処理、モデルの評価及び共有、並びに時間のかかるインストール及び設定を最小限に抑えるためのウェブベースのインターフェイスに関連するカスタムソフトウェア開発のための多額の設備投資を必要としない。
【0030】
ここで
図1Aを参照すると、ウェブベースのスケーラブル画像分析プラットフォーム10が示されている。ウェブベースのスケーラブル画像分析プラットフォーム10は、生命科学における様々な画像管理及び分析タスクに使用可能である。ウェブベースのスケーラブル画像分析プラットフォームによって処理される画像の大部分は、高解像度の顕微鏡法画像である。
【0031】
BisQueシステムをモデルとしたウェブベースのスケーラブル画像分析プラットフォーム10が、生体細胞を分析するために使用されてもよい。BisQueは、証拠を収集するための基本ツールとしてデジタル成果物を扱う生物学者のために構築された、オープンソースの画像データベース及び分析システムである。このシステムは、大規模データセットについてのデータ成果物及びメタデータの両方を管理及び分析するために構築されている。BisQueは、世界中のいくつかの大規模な生物撮像の研究室で採用が進んでいる。例えば、CyVerseサイバーインフラストラクチャは、BisQueを使用する何千人ものユーザーの撮像のニーズに応えている。
【0032】
クラウドベースのプラットフォームであるウェブベースのスケーラブル画像分析プラットフォーム10は、スケーラブルなサービス指向アーキテクチャを用いて構築されている。ウェブベースのスケーラブル画像分析プラットフォーム10は、ウェブブラウザ14及びクライアントツール12を通して、サービスへのアクセスを提供する。ウェブブラウザ14は、ビューアー及び統計情報を有するウェブページを含むクライアントサービス19にアクセスするものであり、ファイルのインポート及びファイルのエクスポート等の一般的な制御に使用することができる。
【0033】
ウェブブラウザ14及びクライアントツール12は、それぞれが特化したタスクを実行する複数のマイクロサービス16~18にインターフェイスで接続することができる。ウェブブラウザは、クライアントツール(Javascript)としても機能し、マイクロサービス16~18にインターフェイスすることができる(例えばウェブページから分析モジュールを動作させる)。メタデータサービス17は、メタデータが記憶装置24に記憶され、ネスト化されたタグ/値ドキュメントとして照会されることを可能にする。メタデータの例は、試料調製、実験条件、撮像パラメーター、及び結果を含む。ブロブ及び画像サービス16は、画像等のバイナリデータセットへのアクセスを提供し、例えば画素演算を実行する方法を提供する。分析サービス18は、多くの言語(例えばPython、Matlab)で書かれた複雑な分析モジュールを動作させることを可能にする。分析サービス18のこれらの分析モジュールは、典型的には、計算の間に他のサービスとインターラクトする(例えば画像タイル又はメタデータレコードをフェッチする)。マイクロサービス16~18及びクライアントサービス19は、記憶装置に関連する記憶サービス24、及びコンピュータープロセッサ又は計算クラスターに関連する実行サービス26の、バックエンドサービスにインターフェイスすることができる。
【0034】
本プラットフォームは、あらゆるよく知られている顕微鏡法画像フォーマット(チャネル及び時系列を含む)をサポートする。本プラットフォームは、任意のサイズの、複数のチャネルを有する、任意のビット深度の画像の、視覚化及び注釈付けを可能にする、スライドビューアーを有する。
図2Aは、ビューアーウィンドウ201中に生体試料の一部の一例示の高解像度画像がある、ユーザーインターフェイス200を示す。例示の高解像度画像は、高解像度デジタル顕微鏡又はその他の高解像度デジタル撮像装置(デジタル撮像器)から撮影された、5チャネル、16データビット幅の画像である。1つの実施形態においては、デジタル撮像装置は、ロボット顕微鏡法を実行する撮像ロボットである。より自動化されたプロセスを提供するために、流体処理ロボット等の追加的なロボットを使用して、撮像のためのプレートを処理してもよい。
【0035】
画像取得及び分析の重要な基準は、クラウド処理のための画像の一次的な取得及び適時の転送である。高解像度の画像は大きくなり電子メールによる転送が困難となる傾向がある。大半のユーザーは、インターネット転送機構を利用して、取得装置から直接に、又はローカルのネットワークアタッチトストレージ(NAS)から、画像をアップロードすることができる。
【0036】
正確な分析のためには、最適には、生画像データ、細胞株を含む実験メタデータ、並びにウイルス希釈物及び複製物等のウェル毎のデータが必要である。理想的には、この機能は、撮像を制御するソフトウェアへの密接な統合を通して、取得パイプラインに統合されることとなるが、これらの装置は、互換性のない又は高すぎるセキュリティ、操作、又はハードウェア要件を有し得る。
【0037】
統合されたデータの取得に非互換性又はその他の問題がある場合には、カスタムソフトウェアを使用して、必要とされるデータをクライアントソフトウェアに問い合わせることができる。ツールキット及びサービスをローカルに展開して、取得された画像及びメタデータを自動的かつ安全に転送することができる。いくつかの場合においては、取得機械及びその生画像データへの直接のアクセスが可能でない場合、生画像データは、手作業で又は自動的にインポート又はエクスポートすることができる。ツールキットは、アプリケーションデータベースから、ファイルシステムエクスポートから等、複数の戦略を用いて生画像データの集合がインポートされるように構造化されてもよい。実験メタデータは、LIMS(実験室情報管理システム)の一部でない限り、撮像装置によっては通常はレポートされない。メタデータは、生画像データと共に取得される。
【0038】
実験レイアウトは、スプレッドシートを使用してグリッド上に表現される。実験レイアウトのためのスプレッドシートのテンプレートが、データの均一なインポートを容易化するためにクライアントに提供されてもよい。また、パーサー及びウェブユーザーインターフェイス(UI)コンポーネントが、ユーザーにより提供されたスプレッドシート上で使用されてもよい。あるいは、画像及びメタデータが、独自のウェブポータルを介してウェブブラウザを通して直接に転送されてもよい。不十分なインフラ、規制、又はセキュリティ要件のために、接続が制限されている又は接続がない場合には、ローカルの記憶装置及び処理が大規模ユーザーに利用可能とされてもよい。
【0039】
ここで
図1Bを参照すると、早期段階の細胞の形態学的変化を検出するために機械学習を利用する、生体細胞分析システム100の高レベルのブロック図が示されている。生体細胞分析システム100は、画像処理システム102、分類/分析のためにトレーニング又は使用され得る機械学習(AI)モデル104、及びユーザーインターフェイス106を含む。機械学習(AI)モデル104は、1つ以上の機械学習アルゴリズム(画像処理アルゴリズムを含む)と共に使用するためにトレーニングされてもよく、次いで、生体細胞及びその細胞よりも小さい構造を含む生体試料(感染したもの、感染していないもの、処置済みのもの、又は未処置のもの)の画像内のオブジェクトの分類/分析のために、1つ以上の機械学習アルゴリズムと共に使用されてもよい。
【0040】
画像処理システム102は、記憶装置124に記憶された細胞のデジタル画像、及び関連するメタデータを、データベース101から読み出すことができる。生の画像データ及び関連するメタデータはそれぞれ、クラウド画像処理のために、インターネットを介して、ユーザーの記憶装置/データベースから、記憶装置124及びデータベース101に転送されてもよい。1つの実施形態においては、データベース101は、画像と共に記憶装置124に記憶されるが、別の実施形態においては、データベース101は、生の画像データを記憶する記憶装置124とは別個に、別の記憶装置(例えば
図7に示されるメモリ720、SSD730、ディスクドライブ740)に記憶される。他の場合には、データベース101及び記憶装置124はローカルのものであってもよく、十分なハードウェア及び一定量の記憶されたアッセイを有するクライアントに対しては、ローカルソフトウェアを有する1つ以上のローカルプロセッサによるローカル処理が利用されてもよい。
【0041】
画像データ及び実験メタデータがデータベース101中で利用可能になると、画像処理システム102を使用して生の画像データを処理することができる。生画像データは、特定の画像情報(例えば解像度、サイズ、背景フィルタリング等)を得るために処理することができる。画像処理システム102は、生体細胞の捕捉画像から特徴ベクトルを生成することができる。特徴ベクトルは、機械学習(AI)モデル104をトレーニングするために使用することができる。
【0042】
機械学習(AI)モデル104は、生体試料内の生体細胞及びその他のオブジェクトについての有用で正確な情報を提供するようにトレーニングされてもよい。1つの実施形態においては、機械学習(AI)モデル104は、生体細胞を分類し、分類された生体細胞の経時的な形態学的変化を検出するために、1つ以上の分類アルゴリズムと共に使用される。
【0043】
画像データが画像処理システム102によって処理されると、画像データは、トレーニングモード105AにおいてAIモデル104をトレーニングするために使用することができる。AIモデル104は、トレーニングプロセスから除外された追加的な画像データを用いて検証することができる。AIモデル104が以前にトレーニング(事前トレーニング)されていれば、分析モード105Bにおいて生体細胞アッセイを分析するために使用することができる。分析モード105Bにおいては、生体細胞アッセイの画像を分析して、生体細胞を認識及び分類することができる。画像の所与の領域内で、分類された細胞の数をカウントすることができる。カウントから、予測される濃度の結果及び精度を生成することができる。
【0044】
ユーザーは、ユーザーインターフェイス106を通して、システム100とインターラクトすることができる。ユーザーインターフェイス106は、生体細胞の新しい試料のための1つ以上のAIモデルを構築するために使用することができる。ユーザーインターフェイス106は、新しい試料中の1つ以上のオブジェクトの認識/分類にシード設定するために使用することができる。ユーザーインターフェイス106は、生体試料の1つ以上の画像を分析する際のAIモデル104及びアルゴリズムの使用によって生成されたレポートを受信することができる。レポート及び分析結果は、表示装置上のユーザーインターフェイス106によって生成された様々なウィンドウの中で見ることができる。
【0045】
診断設定において、レポートが、生体試料に関連する患者の診断情報を含んでもよいし、又は試料が、環境モニタリングからのものであってもよい。レポートは、1つ以上の感染性ウイルスの存在の可能性の百分率を含んでもよく、患者のためのとり得る処置情報を通知してもよい。
【0046】
図2Aは、明視野チャネル中の生体細胞の明視野画像を表示する表示ウィンドウ201を有する、ユーザーインターフェイス200を示す。
図2Bは、
図2Aに示される画像201内の、ユーザーによって認識されたいくつかのオブジェクト上に異なる色の丸を有する、異なるタグ又はラベル221~224の注釈の右パネル202を示す。画像中でタグ付け又はラベル付けされたオブジェクトは、画像のメタデータ206の一部として注釈(オブジェクトのタイプ、位置)を追加されて、機械学習によって認識することができる。画像中のタグ又はラベルのオブジェクトは、異なる色の円等によって異なる色にすることができ、
図2Aの画像に示されるように、オブジェクト(例えば細胞、破片)に重ねることができる。異なる色は、注釈を強調し、細胞又は細胞よりも小さい成分(例えば核、リソソーム、ペルオキシソーム、ミトコンドリア、小胞体、ゴルジ装置)及びその状態(生、死、感染、非感染)等の、タグ付けされたオブジェクトについての情報を提供することができる。
【0047】
図2Aに示されるように、タグ又はラベル221~224に関連する注釈は、例えば、第1の色のDebris204A、第2の色のCellX_live204B、第3の色のCellX_dead204C、第4の色のCellY_live204D、及び第5の色のCellY_dead204Eを含むことができる。
図2Bに示された注釈は、
図2Aの画像に示されたオブジェクト(例えば細胞、破片)上に重ねられた着色された円の色と一致するように着色することができる。オブジェクト上のタグ又はラベル221~224及び関連する注釈は、教師あり機械学習アルゴリズムの1つ以上のAIモデルをトレーニングするために使用され、オブジェクトの同じクラスが異なる場所で画像全体を通して認識できるようにする。
【0048】
機械学習サービス
ここで
図3を参照すると、
図1Aに示されるウェブベースのスケーラブル画像分析プラットフォーム10は、AIモデルを構築し、細胞及びその他のオブジェクトを分類するための分析サービス18の一部として、機械学習サービスを含む。
図3は、プラットフォームの一部としての深層学習モデルビルダー300を示す。
図3に示される一例示の撮像AI細胞分類モデルは、細胞の試料中の生細胞/死細胞を分類するために使用される。モデルビルダー300は、フレームの右側に示されているトレーニングデータセットの試料302(試料1~5のうちの試料2)を示している。作成、アップロード、ダウンロード、分析、及び閲覧を含む、各ページの上部における一連の制御ボタン303が、作成、アップロード、ダウンロード、分析、及び閲覧に使用できる。
【0049】
スライダー及びディスプレイ304Aを使用して、クラス当たりの最小試料数に基づいてクラスをフィルタリングすることができる。スライダー及びディスプレイ304Bを使用して、分類に使用されるべきクラスに必要とされる最低精度を選択することができる。スライダー及びディスプレイ304Cを使用して、個々の試料の分類結果が分類の間に破棄されることとなる、優良度の下限閾値を選択することができる。データセットの選択、クラスのフィルタリング、試料の作成、AIモデルのトレーニング、及びAIモデルの検証を含む、AIモデルを構築するステップの進捗バー306が提供される。ユーザーインターフェイスは、進捗バー306によって示されるプロセスのこれらのステップのそれぞれを通して、ユーザーをガイドする。1つ以上の設定中に何らかの変更があった場合、以前にトレーニング及び検証されたAIモデルを再検証するために、再検証ボタン307が提供される。ビルダーは、トレーニングデータセット中に見出された異なるオブジェクトクラスのサイズを異なる色で視覚的に示す、円グラフ308を含む。
【0050】
ビルダー300は更に、認識することができるオブジェクトの利用可能なクラス、モデル構築の間に使用されるオブジェクトのクラスのプロット、モデル性能表(図示されている)、オブジェクトの性能プロット、要約表、及び比較表を含む、AIビルダーについての情報を表示するために選択することができる、複数のタブ310を示す。選択されたタブ(モデル性能)は、選択されたトレーニングデータセットについてAIモデルによって認識されたオブジェクトクラスのモデル性能表312を示している。これは、AIモデルのトレーニングの間に使用される情報である。例えば、ID1161を有するCell_xxxx_liveの細胞のクラスについての表312の行において、AIモデル及び分類器はトレーニングデータセットから145個の細胞を含み、93.8%の精度、8.6%のエラー率、85.7%のF1%率(予測精度を定量化する指標)に帰着し、トレーニングデータセットから32個の細胞が検証のために使用され、0.0%の細胞がトレーニングの間に破棄されている。
【0051】
機械学習サービスは、画像及びメタデータから収集された大規模なトレーニングデータに対して、様々な特徴及び学習フレームワークを用いて、ユーザーが機械学習モデルを構築することを可能にする。生成されたモデルは、大規模な画像集合にわたる特性を予測し、科学的なユーザーによる簡単な理解のために結果をオーバーレイとして視覚化するために、使用することができる。
【0052】
機械学習サービスは、細胞よりも小さいレベルで非感染細胞の明視野画像からウイルス感染細胞の明視野画像を区別することができるAIモデルをトレーニングすることができる。明視野画像化された細胞における初期感染事象を見出すようにAIモデルをトレーニングすることは、完全に自動化可能なウイルス感染アッセイの即日でのターンアラウンドでの作成を可能とする。
【0053】
典型的には、早期の感染事象は、人間の観察者には可視ではない。ウイルス感染に関連する膜結合構造は、電子顕微鏡法によって見ることができ、可視光で読み取るのに十分なサイズのものであるが、光学顕微鏡を用いて手作業で観察されないものであった。対照的に、AIモデルは、明視野顕微鏡法を使用して、人間の観察者には可視でない細胞中の多くの表現型効果を観察するようにトレーニングされてきた。AIモデルは、異なる顕微鏡によって捕捉されたデジタル画像から、異なる研究室で異なるウイルスを使用して、感染後4時間という早期に、アッセイにおいてウイルス感染を検出するようにトレーニングできることが実証されている。
【0054】
従来の感染アッセイは、感染に起因する細胞死が容易に検出できるよう、細胞が複数回の感染を経るようにするために、数日を要する。処理を幾分早め得る代替法は、ウイルスタンパク質に対する蛍光標識抗体に依存するものである。しかしながら、蛍光標識は、多くの処理ステップ及び高価な試薬を必要とし、又は、開発が困難でありウイルスの生存に影響を与え得る、蛍光タンパク質の遺伝子を持つウイルスの開発を必要とする。したがって、蛍光標識抗体又は蛍光タンパク質の遺伝子を持つウイルスなしで、アッセイにおいてウイルス感染を検出することが望ましい。
【0055】
図4A及び
図4Bは、明視野画像において分類された(例えば生/死)細胞及びその他のオブジェクトが認識され、オブジェクト輪郭オーバーレイを使用して色分けされた、機械学習分類の一例示の結果の出力を伴う、ユーザーインターフェイスウィンドウ400を示す。
図2Aにおいては、タグ又はラベル221~224が、オブジェクトの上に追加され、関連する注釈が作成された。
図4Bにおいては、これらのタグ及びラベル221~224が、教師あり機械学習アルゴリズムの1つ以上のAIモデルをトレーニングして、トレーニングオブジェクト421T~424Tに対してトレーニングするために使用される。これらのトレーニングされたAIモデルを用いて、教師あり機械学習アルゴリズムは、トレーニング後の分析の間に、画像全体を通して様々な位置において、認識されたオブジェクト421R~424Rと同じクラスのオブジェクトを認識することができる。ユーザーによって追加されるタグ又はラベルの他に、AIモデルは、対象の細胞をマーキングするための蛍光タグ(蛍光タンパク質遺伝子、蛍光標識抗体等)を使用してトレーニングされてもよい。
【0056】
蛍光チャネル及び明視野チャネルを有するマルチチャネル撮像が、AIモデルをトレーニングするために使用されてもよい。蛍光タンパク質遺伝子を含むウイルス、又は蛍光標識抗体で細胞を染色することが、ウイルスタンパク質を検出し、蛍光チャネル中で非感染細胞から感染細胞を区別するために使用されてもよい。次いで、蛍光チャネル中で一致する感染信号を使用することによって、感染と非感染とを同定された細胞を明視野チャネルのみで観察することにより、AIモデルをトレーニングすることができる。トレーニングされたAIモデルは、明視野チャネルのみを使用して細胞に対して予測をさせ、AIの感染予測値と蛍光チャネル中の信号との一致度を使用してAIモデルの精度を決定することによって、検証することができる。学習及び検証の後、感染細胞の他の明視野画像の分析の間に、蛍光チャネルなしで、明視野チャネルのみに対してAIモデルを使用することができる。
【0057】
図4A及び
図4Bにおいて、ビューアーは、色分けされたマスク領域として画像の上に分類結果を重ねる。例えば、赤色は、或る特定の細胞に重ねて、ユーザーに死細胞を示してもよい。黄色は、例えば、或る特定の細胞に重ねて、生細胞を示してもよい。他の色が代わりに使用されてもよく、他の細胞の状態もより多くの色で示されてもよい。ビジュアライザー(プラットフォームスライドビューアー)は、かかる領域が何百万個もあっても大きな画像のスムーズなナビゲートを可能にする。
【0058】
図4Aに示されるように、ユーザーインターフェイスウィンドウ400は、ビューアーウィンドウ401及びサイドバー402を含む。ビューアーウィンドウ401においては、試料の拡大部分410が表示される。ビューアーウィンドウ401は、ウェル405中の試料の概要ウィンドウ404を含む。ビューアーウィンドウ401に表示された試料の部分410は、ウェル405中の矩形406によって概要404に示される。倍率情報407は、ビューアーウィンドウ401中の部分410に重ねられる。スケール408は、ビューアーウィンドウ401に表示された部分410に重ねられる。倍率調節コントロール409、411U、411Dは、ビューアーウィンドウ401に表示される試料の部分410の調節を可能にするために、部分410上に重ねられる。スライダー409は、ユーザー入力装置によって選択することができ、表示された試料の部分410を拡大又は縮小するために上下に調節することができる。上ボタン411Uは、ビューアーウィンドウ401に表示された試料部分にズームインするために、ユーザー入力装置によって押すことができる。下ボタン411Uは、ビューアーウィンドウ401に表示された試料部分をズームアウトするために、ユーザー入力装置によって押すことができる。
【0059】
細胞の1つ以上の画像に対してAIモデルを用いて分析(予測又は分類)が行われた後、サイドバー402は、認識されビューアーウィンドウ401に表示された様々なオブジェクト(例えば感染細胞、非感染細胞、小細胞)を示すことができる。サイドバーはまた、オブジェクトを生成するために使用されるAIモデル、及びAIモデルを用いて分析が行われた日時を示してもよい。サイドバーはまた、AIモデルをトレーニングするために使用された、ユーザーにより提供されたメタデータを示してもよい。
【0060】
ビューアー401によって示される試料の拡大部分410が、
図4Bに示されている。
図2Aのビューアーウィンドウのこの部分上で、オブジェクトが検出され、分類され、分析後に種々の色で示される。
【0061】
上述した特徴に加えて、ウェブベースのプラットフォームは、科学チーム間の共有及び共同作業のための、組み込まれたサポートを有する。実質的にウェブベースのものであるため、生体細胞の分析を開始するために複雑なソフトウェアのインストールは必要とされない。ウェブベースのスケーラブル画像プラットフォーム10の機能は、細胞構造の変化の早期の検出のために本システムを使用することを容易にする。
【0062】
開示される実施形態は、撮像人工知能モデル(AI群)をトレーニングして、ウイルスに感染した、ラベル付けされていない個々の細胞を検出する。染色又はその他の追加的な調製なしの明視野画像に対する直接の機械学習は、ウイルス感染性アッセイではこれまで実現されなかったことであるため、このことは革新的なことである。このことは、かかるアッセイが、HCA自動化ワークフローと互換性のあるプラットフォーム上で実施されることを可能にし、費用と時間のかかる追加的な染色、試料調製、又は蛍光タンパク質遺伝子を持つ遺伝子組み換えウイルスの開発を必要としない。さらに、モデルの開発の間に得られた知見は、他の細胞ベースのアッセイにも有用である。
【0063】
革新的な機械学習の側面に加えて、開発されたモデルは、ウェブベースのプラットフォームを使用して世界中で共有可能である。これまでのモデル共有は、かかるモデルを読み取り、次いでそれらに基づいて分類を実行するための複雑なソフトウェアシステムを設定することを意味していたので、このことは革新的である。ウェブベースのプラットフォームを使用することによって、モデルの共有は、単にウェブブラウザしか必要としない。緊急に必要とされるワクチン又は抗ウイルス薬の迅速な開発のためには、科学チーム間での効率的なモデルの共有が重要である。
【0064】
トレーニング及び分類のワークフロー
実施形態の主な目的の1つは、機械学習の使用を介して、プラークアッセイの結果を得るまでの時間を1桁(例えば数日から数時間へと)短縮することである。ここで
図5Aを参照すると、パネル501~503が、種々のアッセイワークフローを議論するために示されている。
図5Aのパネル501(上のパネル)は、従来のアッセイワークフローを示す。
図5Aのパネル502及び503(下の2つのパネル)は、トレーニングワークフロー及び分類ワークフローを有する人工知能(AI)によって強化されたワークフローを示す。
【0065】
AIモデルのトレーニングは、2以上の感染多重度(MOI)でウイルスに感染した細胞のウェルの画像と、模擬感染した細胞のウェルの画像とを使用してもよい。これらの画像のサブセットは、AIモデルをトレーニングするための陽性クラスと陰性クラスとして機能し得る。これらの画像は、感染後数分(0時間)~48時間までにわたる、感染後の種々の時間に捕捉される。0.8~0.025にわたるMOIで感染した細胞を有するウェルの画像が、感染性アッセイ検証データセットのために使用されてもよい。感染多重度(MOI)は、細胞当たりの生きた感染性ウイルス粒子の数の比率として定義され得る。
【0066】
図5Aにおいて、パネル501に示される従来のアッセイワークフローは、パネル502及び503に示される人工知能(AI)によって強化されたアッセイワークフローと対比することができる。
【0067】
従来のワークフロー及びAIワークフローのいずれもが、感染細胞を含む複数の培養されたウェル505XYのアレイから始められる。複数のウェル505XYは、トレイ(プレート)504中にあってもよく、列X及び行Yによって編成されてもよい。感染細胞の連続希釈物が、行に沿って各列のウェルに入れられてもよい。ウェル中の感染細胞の連続希釈物は、培養の開始時504Aにトレイのウェル中に連続希釈細胞の複数の行が存在するように、1つ以上の行において繰り返されてもよい。トレイの2時間の培養の後(504B)、トレイ504中の各ウェルの複数のデジタル画像513Aが、顕微鏡又は自動化された撮像器等の、画像捕捉装置512によって捕捉される。トレイの4時間の培養の後(504C)、トレイ504中の各ウェルの複数のデジタル画像513Bが、画像捕捉装置512によって捕捉される。トレイ504中の感染細胞の追加的な培養期間(数時間、数日)の後、画像捕捉装置512によって各培養期間において複数の画像が捕捉されてもよい。複数の日数(例えば2日~15日)の後(504N)、複数の画像の最終的なセット513Nが、画像捕捉装置512によって、最終培養期間において複数のウェル505XYに捕捉されてもよい。各期間におけるトレイ中のウェルの複数の画像513A~513Nは、機械学習モデル514A~514Nをトレーニングするために使用されてもよい。検証の後、機械学習モデル514A~514Nのうちの1つ以上が、分析AIモデル514’として選択され、未知の濃度の感染因子に感染しているトレイ(プレート)504の1つ以上のウェル内の細胞を分類するために使用されてもよい。
【0068】
パネル501に示された従来のアッセイワークフローにおいては、結果は、2日~15日後にプラークが形成された培養物中の「穴」の形をとって読み取られる。例えばCOVID-19抗ウイルス薬/ワクチン開発のように、特に時間が重要である場合には、結果の生成に数日を要することは、重大なボトルネックとなり得る。
【0069】
図5Aのパネル501を更に参照すると、標準的なウイルスプラークアッセイは、プレート又はマルチウェルプレートのウェル当たり5~100のプラーク形成単位(PFU)の感染率を達成するように、ウイルス試料の連続希釈から始められる。希釈された試料は、感受性細胞のほぼコンフルエントな芝生に塗布され、細胞が2日~14日間培養されて、数回の再感染を通して感染が進行することを可能にする。プレートは、生存染色(通常はクリスタルバイオレット)で染色されて、各プラークを構成する死細胞のパッチを呈するようにされてもよい。各プラークは、複数回の局所化されたウイルス産生及び再感染に後続される、単一の感染事象を表す。感染を局所にとどめるために、初回の感染で産生されたウイルスは、細胞をアガロースゲルと重ねることによって、ウェル全体に拡散しないように保たれる。
【0070】
開示される実施形態は、機械学習技術を使用して、アッセイ結果を受け取るまでのタイムラインを短縮する。
図5Aのパネル502において、トレーニング段階の間、明視野顕微鏡法画像が1つ以上の時点において撮影される。これらの明視野画像は、数千~数百万の組織細胞を含み、機械学習モデル(任意選択で最終的なアッセイ結果をトレーニングデータとして含む)をトレーニングするために使用される。最も早期のモデル(例えばモデル514A)は、ウイルス感染から細胞がまだ十分に形質転換していないため、予測能力が低いことが予想される。このトレーニング段階の一部として、従来のアッセイと同様の予測品質を提供する最も早期のモデルが選択される。
【0071】
図5Aのパネル503は、AIを利用した予測段階を示す。予測段階の間、選択されたモデルは次いで、選択されたモデルに対応する時点において細胞を分類するために使用される。その結果、感染の度合い(予測される感染性)のウェル毎の予測が、より短い期間(例えば数日の代わりに数時間以内)で行われることとなる。
【0072】
具体的には、1つの開示される実施形態は、以下の機能的ステップを実行してもよい:
・非標識細胞に対して高分解能明視野顕微鏡法を使用して、ウイルス感染の時間経過を収集する。開示される実施形態は、各時点において、感染に対して明確に陽性である数百~数千の細胞の画像と、同様の条件下における非感染細胞の同数の画像とを収集してもよい。
・注釈付き画像データを照合し、様々な時点において人工知能モデル(AI群)をトレーニングし、標準的なプラークアッセイと比較して性能を評価する。開示される実施形態は、人工知能モデル(AI群)を使用して、標準的なプラークアッセイと少なくとも同じ精度で、しかしはるかに短時間で、生ウイルス力価を測定することができる。
・問題固有の機械学習機構及び視覚化により、ウェブベースのプラットフォームを拡張する。1つ以上の開示される実施形態は、プラークアッセイを自動化し、生存染色又は分子マーカーなしで明視野画像を使用し、感染性ウイルス力価を数日ではなく数時間で得るための、プラットフォームを含む。単一の感染細胞を検出し、ウイルス感染を他のタイプの細胞障害から十分な精度で識別する能力は、これらのタイプのアッセイに通常必要とされる時間及び労力を劇的に変化させ、このタイプのアッセイがウイルス学において使用される方法を激変させる。
【0073】
感染細胞を非感染細胞から見分けるようAI機械をトレーニングするために、明視野(例えば位相コントラスト)チャネルにおいて撮影された感染中の細胞の高解像度画像が収集される。ウイルス感染の早期段階にある細胞は、手作業で見分けることができる形態的変化を有さない。かくして、このデータ収集戦略は、対照の非感染細胞と可視の違いを有さない画像を使用する、感染陽性細胞に対するAI機械のトレーニングに対応する。不測の事態に対処する目的のために、データ収集パートナーの能力に基づいて2つの代替の実施形態が実行された。
【0074】
図5Bは、試験対象の生体細胞の試料のウイルス感染性を予測するための、トレーニングワークフロー(プロセス)551及び分類(分析)ワークフロー(プロセス)552を含む、人工知能(AI)ワークフロー(プロセス)550のブロック図である。生体細胞試料の画像が捕捉された後、トレーニングワークフロー551は、試験対象の生体細胞試料におけるウイルス感染性を推定又は予測するために分類ワークフロー552によって使用され得る背景人工知能モデル562及び細胞アンサンブル人工知能モデル568を生成する。
【0075】
アンサンブルモデルは、1つの最適な予測AIモデルを生成するために、いくつかの基本AIモデルを一緒に組み合わせる機械学習技術である。その目標は、所望の結果を最もよく予測する単一のモデルを見出すことである。アンサンブルモデルは、1つのモデルを作成するのではなく、複数のモデルを考慮に入れ、それらのモデルを平均して1つの最終的なモデルを作る。
【0076】
トレーニング及び検証画像560は、好ましくは、M×N画素の矩形画像タイル555を形成するように、生画像データから処理される。1つのタイルのM画素×N画素は、包含的に、32画素×32画素と、1つ以上の捕捉画像の全画素幅及び画素高さとの間の範囲内の数となり得る。例えば、1つのタイルは、128画素×128画素であってもよいし、又は256画素×256画素であってもよい。
図5Dは、ウェル505XY中の感染細胞の画像554に対する矩形又は正方形のタイル555を示す。タイルの代わりに、分離細胞画像と呼ばれる画像領域において細胞が分離されてもよい。タイルが好ましいが、開示される原理は分離細胞画像及びタイル画像のいずれにも適用可能である。AI群は、細胞単位又はタイル単位でウイルス感染性を認識するようにトレーニングされ得る。
【0077】
より大きなタイルの使用は、より小さなタイルの場合よりも、感染したウェルからの全てのタイルが感染しているという仮定が正しいことが多いことを確実にするのを助け得る。40倍の画像を20倍にダウンサンプリングすることは、4倍少ないタイルしかトレーニングに使用しない(各ケースにおいて同じサイズのタイル)にもかかわらず、より優れた分類器の性能に帰着した。しかしながら、より大きなタイル(又はダウンサンプリングされたタイル)を用いてAI群をトレーニングすることは、最終的なアッセイにおいて解像度を低下させるという欠点を有する。この欠点は、アッセイを処理する際にタイルをオーバーラップさせることで部分的に軽減できるが、アッセイの最終的な解像度は、依然としてタイルサイズに依存することとなる。
【0078】
20倍の対物レンズを使用して得られた画像においては、256画素×256画素(256px)のタイルは、典型的な細胞よりもわずかに大きく、128画素×128画素(128px)のタイルは、個々の細胞よりも小さい。より大きなタイルを使用することは、トレーニングにおける4倍少ないタイルの量にもかかわらず、より正確な予測に帰着し得る。タイルのサイズ、解像度、及び精度の間にはトレードオフがあるが、これらのバランスをとることができるので、実施形態は128pxのタイル及び256pxのタイルの両方を交換可能に使用することができる。
【0079】
ブロック561及び562は、トレーニング及び検証画像560から背景をプレフィルタリングするようにAIをトレーニングする。プレーティングの制限により、いくつかのタイルは精度を低下させることとなる背景を含み得る。この問題を軽減するために、「プレフィルター」ネットワークが、細胞物質を有さないタイルを除去するために使用される。ブロック561において背景フィルタートレーニングが実行されて、ブロック562において背景モデルAIを作り、背景フィルターステップをブロック572において実行して、細胞物質を有さないタイルを破棄することができる。「プレフィルター」ネットワーク及び背景フィルターステップ572の利点は、トレーニング及び検証画像560が個別に分離された細胞のものである必要がないことである。
【0080】
プロセス551の他のワークフロー経路は、細胞レベルでの形態学的変化を検出するように1つ以上のAIをトレーニングすることを含む。典型的には、画像中で認識させたいものは何でも認識することができる人工知能モデルをトレーニングすることは、AIを画像のデータセットにさらし、認識させたいものの画像のどのサブセットを認識させるかをAIに指示することを含む。例えば、犬と猫と停止標識とを区別するためには、AIは、データセット中のどの画像が犬であり、猫であり、停止標識であるかを教えられる必要がある。
【0081】
開示される発明においては、AIは、明視野画像中の感染細胞と非感染細胞とを区別するようにトレーニングされる。しかしながら、典型的なAIのトレーニングシナリオとは異なり、人間の観察者は、このレベルの倍率及び感染の時間では、感染細胞と非感染細胞との違いを言い当てることはできない。簡単に言えば、AIは、同じ画像を「見て」いても、人間の観察者には判らないような細胞の形態学的変化を区別することができる。明視野画像は、染色及び色素の使用がない場合、人間の観察者が変化を認識するには多くの情報を含みすぎている。AI群は、違いを認識するために画像を合成するのが得意である。かくして、AIのトレーニングは、人間の観察者が区別できないものを区別するようにAIをトレーニングするための特定の方法で、確立されなければならない。
【0082】
感染細胞と非感染細胞とを識別するように1つ以上の人工知能(AI)モデルをトレーニングする方法は、既知のウイルスストックに感染した無染色細胞の画像と無染色非感染細胞の画像とのデータセットにAIをさらすことから始められる。上述したように、AI群は、種々のタイプの画像が既に知られている従来の転移学習法とは異なる特定の方法で、トレーニングされなければならない。以上の例においては、猫、犬、及び停止標識は、観察者にとって既知であるため、従来のようにトレーニングされているAIに、どの画像が犬、猫、及び停止標識であるかを単純に教えることができる。しかしながら、人間の観察者は、本発明の実施形態において利用される感染後の倍率及び時点においては、感染細胞と非感染細胞とを区別することはできない。
【0083】
かくして、本発明の実施形態において使用されるAIをトレーニングするために、トレーニングデータセットは、感染細胞中の全ての又はほぼ全ての細胞がウイルスに感染し、模擬感染試料中のどの細胞も感染していないような、既知の高い感染多重度(MOI)比で感染したウェルの画像からなる。本発明の1つの実施形態において使用されたデータセットは、トレーニングにおいて使用された感染細胞についての感染多重度(MOI)が2であり、模擬感染試料についてのMOIが0である、感染したウェルの画像からなるものであった。
【0084】
トレーニング画像は、初期感染後に、ゼロから、細胞変性効果(CPE)を手作業で観察できるようになるまでの培養期間にわたって、所定の時間に定期的に捕捉される。CPEは、ウイルス感染によって引き起こされる宿主細胞における構造変化、例えば細胞の丸まりである。ウイルスが12時間以内にほぼ全ての感染細胞を溶解することが知られている場合、トレーニング画像は12時間を超えて撮影されることはない。本発明の実施形態においては、AIモデルは、初期感染後1時間、4時間、8時間、及び12時間の時点においてトレーニングされた。
【0085】
ウイルスアッセイ用のAIモデルをトレーニングする好ましい方法は、レベル1の個々のAIを独立して並行してトレーニングし、その結果をまとめてレベル2のアンサンブルAIをトレーニングすることである。アンサンブルAIモデル568は、トレーニングに2層積層アプローチを使用する。複数(例えば12個)のレベル1細胞AIモデル565A~565Nはそれぞれ、細胞クラストレーニング564A~564Nの間に、開始モデル及びそれらのトレーニングパラメーターを指定する構成ファイルを使用してトレーニングされる。その結果のトレーニングされた細胞AIモデル565A~565Nは、トレーニング画像から保留された生体細胞の画像についての予測を生成するために使用される。感染性のこれらの予測は、レベル2分類器である細胞アンサンブルモデル568をトレーニングするために、アンサンブルトレーニングの間に使用される。レベル2分類器は次いで、生体細胞の別個の検証画像についての感染性の予測を行うために使用される。
【0086】
以上のプロセス551の一例においては、ステップ564A~564Cにおいて、3つの畳み込みニューラルネットワーク(CNN)、及びこの3つのネットワークのそれぞれについて合計4つのパラメーター設定が、感染細胞の画像についてトレーニングされた。その目的は、アンサンブルが最良の構成AIよりも優れたものとなり得ることを実証することであり、実際にそうである。この例においては、3つのCNNモデルのみがトレーニングされたが、使用できるCNNモデルはより多く、パラメーターもより多く、アンサンブルにおける構成AIの数を潜在的に2倍又は3倍にし得る。
【0087】
感染の早期段階における感染細胞と非感染細胞との間の形態学的変化は、わずかなものである。これらの変化は、人間の観察者によっては観察可能ではない。これらの形態学的変化は、細胞株間で異なり得る。かくして、或る細胞株についてトレーニングされたAIモデルは、更なるトレーニングがなければ、異なる細胞株における感染細胞と非感染細胞とを識別することができないこととなり得る。
【0088】
AIモデル及び関連するアルゴリズムは、異なる細胞株に対してウイルスアッセイの分析を同程度に正確に実行しないこととなり得るが、この記述は絶対的に解釈されるべきではない。近縁の細胞株については、形態学的変化が、正確なウイルスアッセイを得るのに十分に類似したものとなり得る。特定の細胞株に対してトレーニングされたAIモデルは、別の細胞株についてはウイルスアッセイを正確には実行しないこととなり得るが、開示される実施形態の原理は、依然として全ての細胞株に適用可能である。いずれの場合においても、感染性アッセイ用のAIモデルをトレーニングする方法は、全ての細胞株及び全てのウイルスに対して同じままである。かくして、開示される実施形態は、トレーニングされたAIモデルを用いて、全ての細胞株及び全てのウイルスをアッセイすることができる。
【0089】
【0090】
本発明の開示される実施形態は、エンベロープ及びノンエンベロープのRNA及びDNAウイルスを成功裏にアッセイした。本発明の実施形態において使用されるウイルスストックは、DNA(コーティングされたもの又はコーティングされていないもの)及びRNA(コーティングされたもの又はコーティングされていないもの)のグループのウイルスを含む。上記の表は、開示される本発明のAIによって支援されたアッセイシステム及び方法を使用して正確に分類された、様々なタイプのウイルスを列挙している。
【0091】
機械学習の代替の手法は、CHARM特徴(多くの細胞ベースのAIの用途において成功裏に使用されている大規模な特徴セットであり、4000よりも多い数値画像特徴を構成する)を使用した特徴ベースの分類を含む。これらの特徴は、最終的なアンサンブル段階において、自動化された特徴分類器トレーナーと組み合わせることができる。トレーナーはscikit-learnから特徴正規化、スコアリング、選択及び分類アルゴリズムのパイプラインを自動的に選択し、それらのパラメーターを自動的に最適化することができる。CNNを補完するために、この手法のいくつかの変形を使用することができる。
【0092】
特徴ベースの分類器による誤りのタイプは、CNNによる誤りのタイプとはかなり異なることが予想され、したがって潜在的に全体的な精度を高め得る。また、前述した完全に自動化された特徴分類器に加えて、特定のレベル1分類器及びレベル2分類器を自動化するために、Auto-sklearn及びAutoKeras等の既存のAutoMLパッケージを組み込むことも検討する。
【0093】
本発明の前述の実施形態においては、AI群をトレーニングすることは、いくつかのスクリプトを介して手作業で実行することができる。本発明の以降の実施形態においては、トレーニング/分類プロセスの各段階は、コンピューターサーバーシステムクラウドプラットフォーム(例えば
図6参照)中の分析モジュールとして実行され、計算クラスター上の構成ソフトウェアモジュールから構成される全体的なワークフローを自動化する。このことは、トレーニング/分類ワークフローの中間結果のデータフローが、データフローを手作業で管理するのではなく、自動的な態様で、後続の分析に正しく供給されることを確実にする。
【0094】
開示される実施形態はまた、AIトレーニングモジュールの出力としてトレーニングされたモデルを記憶することを提供し、これらが後続の予測ステップにおいて入力として機能することを可能にする。このことは、データフロー全体がワークフローの一部として指定されることを確実にし、様々なデータセット及びパラメーターセットを使用してトレーニングされた様々なAIモデルの組織化を支援するのみならず、これらのフローが潜在的に数千もの手作業で処理された個々のファイルからなる場合に起こり得る不注意による間違いを防止する。
【0095】
以上に説明されたプロセスの一例においては、各タイルサイズに対して合わせて12個のトレーニングされたモデルとなる、3つの異なる事前トレーニングされたネットワークアーキテクチャ、2つの学習率、及び2つのドロップアウト率に基づくアンサンブルモデルが、128px(128画素×128画素)のタイルに対して12個のモデル、及び256px(256画素×256画素)のタイルに対して12個のモデルを用いて、トレーニングされた。自動化された特徴分類器トレーナーは、いくつかの異なる分類器に結合されたいくつかの異なる特徴選択及びスコアリング技術を試し、これらのアルゴリズムに対して適切なパラメーターの範囲を試し、最もパフォーマンスの良いモデル及び対応するパラメーターセットを選択する。個々の構成モデルについての70%の平均値及び77%の最大値に対して、アンサンブルモデルは128pxのタイルについて81%の精度に帰着した。256pxのタイルについては、個々の構成モデルについての82%の平均値及び86%の最大値に対して、アンサンブルネットワークは88%の精度を達成した。パラメーターを変化させることは、構成AIモデルが合理的に可能な限り異なる態様でトレーニングされ、それにより個々の結果が可能な限り異なるようになることを確実にした。
【0096】
この結果から分かるように、基礎となるモデル又は構成モデルも、その精度はしっかりと正確なものとなり得る。しかしながら、アンサンブルモデルは、更に著しく正確であった。とは言え、開示される実施形態の範囲は、構成モデル又はアンサンブルモデルのいずれかに限定されるものではなく、両方をカバーするものであることは、当業者であれば誰にでも明らかであるはずである。
【0097】
アンサンブルAIモデルがトレーニングされると、アンサンブルAIモデルを検証することができる。検証は、既知のウイルスの感染性のAIモデル予測を、従来のプラークアッセイによって決定された同じ既知のウイルスの感染性と比較する。AIモデルは、高MOIのトレーニングセットの状況でトレーニングされるが、MOIが1.0未満である実際のアッセイの状況でこれらのモデルを検証することが重要である。AIモデルの予測は、既知の力価を有するストックの一連のウイルス希釈物におけるMOIの細胞の従来のアッセイの結果と比較される。256pxのタイルについては、アンサンブルAIモデルは、80%以上の精度を達成することができる。
【0098】
AIモデル(背景モデル562、及び細胞アンサンブルモデル568)がトレーニングされると、これらのモデルは、プレート画像570中に捕捉された感染した生体細胞の分類プロセスにおいて使用することができる。ワークフローのプロセスステップ552において、ウェル中の試料のオブジェクトが認識されカウントされて、(少なくともAI群によって)これまで未見の画像570が分類される。画像570は、典型的な96ウェルプレートの単一のウェル中の単一の感染からのものであり得る。画像が分析され、AIモデル及び関連する機械学習アルゴリズムによって予測が行われる。これらのプレート画像570は、トレーニングプロセスにおいては使用されない。プレート画像570は、ステップ572において背景モデル562によってプレフィルタリングされて、例えば細胞以外の物質等の背景「ノイズ」を除去し、プレフィルタリングされた画像574を生成する。次いで、プレフィルタリングされた画像574は、細胞(オブジェクト)分類ステップ578の間、アンサンブルモデル568によって分析される。このことは、画像のタイルに対して並行して実行することができる。分析された画像は、プロセスステップ579において、画像中の各タイルに対してスコアを割り当てられる。集計ステップ580の間に、検証ステップによって決定されたMOIの直線範囲内の所与の希釈物について、画像中の全てのタイル及びウェル中の全ての画像にわたって、スコアが集計又は平均化される。集計されたスコアは次いで、ブロック585においてMOI推定値を予測するために使用される。
【0099】
分析又は分類プロセスステップ552は、不活性化アッセイ等のウイルスアッセイに使用することができる。AI群は、既知のウイルスに対してトレーニング及び検証される。既知のウイルスに感染した細胞は、不活性化剤にさらされ、次いでプロセス552において分析される。研究者は、MOI推定値585から、不活性化剤が既知のウイルスに対してどの程度有効であったかを決定することができる。同様に、本発明の実施形態は、腫瘍溶解ターゲティング、クリアランスアッセイ、診断アッセイ、並びに殺生物剤、ワクチン及び抗ウイルスの作成に使用することができる。
【0100】
AIベースのアッセイ対従来のアッセイ
ここで
図5Cを参照すると、従来のプラークアッセイとAIによって支援されたアッセイとを対比するワークフロー図が示されている。従来のアッセイ及びAIにより支援されたアッセイの両方の第1のステップ582において、生体細胞がプレート又はトレイのウェルへとプレーティングされる。従来のアッセイ及びAIにより支援されたアッセイの両方の第2のステップ583において、プレーティングされた細胞がウイルスに感染させられて、感染細胞を形成する。細胞株及びウイルスの選択は、開示される実施形態の原理に特に重要ではない。本発明の範囲は、細胞株がウイルスに感染しやすいという注意点を有する特定の細胞株又はウイルスに限定されるものではない。開示される実施形態の原理は、任意のウイルス及びそのウイルスに感染しやすい任意の細胞株に適用され得る。
【0101】
図5Cの上部にあるものは、プラークアッセイと呼ばれる、より伝統的な感染性アッセイについてのタイムライン504A~504Nである。プラークアッセイは、ウイルスの分離及び定量に重要なツールである。試料中の感染性ウイルス粒子の数は、「プラーク形成単位」(pfu)で測定される。ウイルス懸濁液の滴定は、既知のウイルスの連続希釈によって行われる。連続希釈を行い試験する目的は、細胞単層中のプラークの「カウント可能な」数を実現することである。多すぎる感染性粒子が存在する場合には、個々の細胞が1つよりも多いビリオンに感染すること、又は個々のプラークが合体して細胞を欠いた大きな領域を形成することの見込みが高い。
【0102】
細胞株の単層は、典型的には、適切な寒天培地を含むペトリ皿上の軟寒天オーバーレイ中でプレーティングされる。ウイルス懸濁液の力価が、使用されるウイルスに感染しやすい細胞の単層に加えられる。アガロースオーバーレイは、単層をウイルスで感染させた後に、細胞単層に適用される。アガロースオーバーレイは、ウイルスを固定化し、プラーク間の交差汚染を防ぐ。タイムライン504A~504Nにわたって、プレーティングされた感染細胞が次いで、2日~14日間の期間、培養される。
【0103】
個々の感染細胞は、細胞の単層の周囲の細胞に感染するウイルスファージを放出する。細胞単層に個々の穴すなわちプラークが現れるまで、複数回の感染が起こり得る。プラークは、感染後4日目までに可視となるはずである。生死判別染色ステップ584において、生細胞が染色され、明瞭なプラークのための暗い背景を提供し得る。感染細胞カウントステップ586において、各ウェル中のプラークの数がカウントされる。このことは、元の懸濁液中のプラーク形成単位の数の算出を可能にする。
【0104】
従来のプラークアッセイとは対照的に、AIベースのアッセイのタイムライン全体は、より伝統的なプラークアッセイについての複数日に比べてはるかに短く、1日か又はそれより短い。
【0105】
AIベースのアッセイのタイムラインにおいては、第1のステップ582において、細胞の単層が撮像プレート(トレイ)504のウェル505XYへとプレーティングされる。第2のステップ584において、細胞の単層がウイルス力価で感染させられて、感染細胞を形成する。第2のステップ583においては、プレーティングされた細胞がウイルスに感染させられて、感染細胞を形成する。感染細胞の複数のウェルがプレート又はトレイにある状態で、培養518Aの期間581A及び518Bが生じ得る。感染細胞は、数時間(例えば4時間~48時間の範囲の間等)培養されるだけでよい。
【0106】
培養後、ステップ587において、プレート撮像器(画像捕捉装置、撮像装置又はデジタル撮像器)512を使用して、感染細胞が撮像される。開示される実施形態は、20倍又は40倍の倍率で明視野画像を作ることが可能な自動化されたプレート撮像器を使用することができる。好ましい画像収集戦略は、通常業務の一環としてプラークアッセイを実行している、COVID-19に対応して作業しているユーザーグループとともに作業することである。このユーザーグループは典型的には、40倍~60倍の解像度での位相コントラストを使用してウェルの表面全体を高解像度(細胞よりも小さい解像度)で撮像することが可能な顕微鏡512を有している。これらのタイプの顕微鏡は、撮像施設において一般的に利用可能であるが、バイオセーフティレベル3(BSL-3)の条件下ではあまり利用可能でないものであり得る。
【0107】
代替の画像収集戦略が使用されてもよい。進行中の感染は、プラークの発生に先立つ感染後、タイムライン504A~504Nに沿って、いくつかの時点(例えば2時間、4時間、8時間、16時間、24時間、36時間、48時間)において撮像される。これらのいくつかの時点は、細胞が、感染の最も早い段階、並びに、より後の段階及び潜在的には後続の感染の初期段階において、捕捉されることを確実にする。各ウェル全体を撮像する目的は、エンドポイントにおける通常のプラーク読み取りを使用してプラーク位置516にプラークを位置特定すること、及び、次いで以前の時点においてウェルの同じ領域516を使用して、可視である任意の変化に先立つ感染細胞の画像を得ることである。エンドポイントにおけるプラーク位置516は、データ収集戦略の一部として、別のAIモデルトレーニング入力として使用することができる。
【0108】
ステップ588において、プレート画像513A~513N及びメタデータが次いで、クラウドAIプラットフォーム10にアップロードされ、そこで画像が処理される。画像処理ステップ589は、ダウンサンプリング、タイリング、背景のフィルタリング等を含んでもよい。画像処理589及び分類ステップ590は、好ましくは、クラウドベースの(ウェブベースの)プラットフォーム10において実行される。しかしながら、貧弱なインターネットしかないか又はインターネットがなく、セキュリティ上の懸念があるが、十分なハードウェア及びアッセイの量を有するクライアントは、クライアント側のソフトウェアを利用して、画像データをローカルに処理し、AIにより支援されたウイルスアッセイを動作させてもよい。処理された画像タイルは、分類又は分析ステップ590のためにトレーニングされたAIに与えられる。画像タイルを用いて、分類ステップ590は、サーバーコンピューター(
図6におけるサーバーコンピューター604を参照)によって提供されるもの等の、コンピュータークラスター中の複数のプロセッサによって並行して実行されてもよい。ステップ591においては、画像タイル及びメタデータ(注釈付きオブジェクト)のAIスコアが、合わせて集計されてもよい。ステップ592において、細胞のウイルス感染性のレポートが生成される。ステップ593において、レポートが次いで、電子メール等によってクライアント又は研究室に送り返されてもよい。ステップ594において、レポートをレビューすることができ、ビューアーウィンドウを有するユーザーインターフェイスをユーザーが見ることができる。
【0109】
撮像ステップ587の後、アップロードプロセス588、AIプラットフォーム10のプロセス589~592、及びレポートを伴う送信プロセス593を経るのに、1時間未満しか要さないこととなり得る。したがって、AIベースのアッセイのタイムラインは、1日以内に完了され得る。
【0110】
開示される実施形態は、既存のCOVID-19ユーザーグループから画像を受信するように開発された。このことは、既存のプラークアッセイのための方法を、追加的な撮像によって変更するものである。追加的な撮像は、バイオセーフティレベル3(BSL-3)施設における高解像度の全ウェル撮像器の限られた利用可能性を超える、更なる課題を提起した。透明試料においてコントラストを生み出すために使用される位相コントラスト法及びその他の明視野法は、試料を通過して対物レンズに入る構造化光の透過に依存している。典型的にプラークアッセイにおいて使用されるアガロースオーバーレイは、通常は構造化光の光学特性を保持する必要がないため、その厚さ、光学的透明度、及び組成が、撮像を妨害し得る。しかしながら、アガロースオーバーレイは走化性研究及び細胞培養モデルにおける化学的刺激物質の研究に高解像度で使用されるため、アガロースオーバーレイを通して撮像することは可能である。これらの撮像の課題は、最終的には克服可能であったが、標準的なプラークアッセイに追加的な試料の取り扱い上の配慮を強いることになった。
【0111】
図5Dは、複数のX列及び複数のY行のウェル505XYを有する、プレート又はトレイ504を示す。典型的なトレイは、12列及び8行の合計96ウェルを有し得る。プレート又はトレイ中の複数のウェル505XYのそれぞれにわたって複数の高解像度デジタル画像554を捕捉するために、撮像装置を使用することができる。各ウェルのデジタル画像554は、感染した生体細胞を含み得る。他の撮像装置を用いる他の実施形態においては、単一のウェル、スライド、又はペトリ皿のデジタル画像554が、感染した生体細胞と共に捕捉されてもよい。ウェル505XYの一部のデジタル画像554は、複数のタイル555に更に分割されてもよい。各タイル555は、M画素×N画素の寸法を有する矩形又は正方形とすることができる。タイルのM画素×N画素は包含的に、32画素×32画素と、1つ以上の捕捉されたデジタル画像554の全画素幅及び画素高さとの間の範囲の数となり得る。例えば、タイルの寸法は、128画素×128画素又は256画素×256画素であり得る。タイルは、好ましくは、隙間又は重なりがなく、合体したものである。
【0112】
図5Eは、AIモデル及び機械学習アルゴリズムを用いて決定された感染性と、従来のアッセイ法を用いて決定された感染性とを比較するプロットを有する検証チャートを示す。X軸上は、プラークアッセイ又は中央値組織培養感染量(TCID50)アッセイ等の従来のアッセイ法によって決定された既知のMOIを有する既知のウイルスである。Y軸上は、トレーニングされたAIによって予測された既知のウイルスの予測された感染性である。直線領域(緑色)は、変曲点から延びる一次関数の切片から、及び上下の漸近線から、決定された。この例示的な検証ステップについては、MOIの直線範囲は、0.05PFU/細胞~0.60PFU/細胞にあると決定された。直線範囲は、研究者が、実際のウイルスアッセイにおいて良好な線形応答を得るために、既知のウイルス試料のどの希釈を使用できるかを決定するために、使用することができる。かくして、検証ステップは、トレーニング期間の間に決定された培養時点における、既知のウイルスストックの既知の力価の一連の希釈物に対して、1つ以上の人工知能(AI)モデルを検証することによって、アッセイの有効なMOI範囲を決定する。感染の初期段階の画像を収集するための代替の開示される実施形態が、ここで開示される。細胞のマルチウェルプレートは、感染率が1PFU/細胞~3PFU/細胞となるように、予め滴定されたウイルスの試料で感染させられる。これらの条件下においては、所与のウェル中の細胞の大部分は、細胞当たり少数のウイルス粒子に感染していると仮定できるので、個々の感染細胞又は局所感染を同定する必要性が回避される。この形式においては、複数のウイルス粒子に感染した細胞だけでなく、非感染細胞も存在するが、このことはAIモデルのトレーニング可能性又はその性能精度には実質的に影響を与えない。
【0113】
コロナウイルス疾患2019(COVID-19)に導き得る重症急性呼吸器症候群コロナウイルス2(SARS-CoV-2)でこのトレーニング戦略を使用することは、バイオセーフティレベル3(BSL-3)施設中のプレート撮像器も直接に必要とする。しかしながら、その利点は、撮像が今や完全に標準化されていることである。細胞の追加的な処理若しくは染色、又はアガロースオーバーレイの使用は、必要とされない。BSL-3封じ込めを必要としないウイルスを用いて作業することは、このアッセイが、ウイルス試料を用いて作業することが可能なプレート撮像器を有する任意の標準的な施設又は臨床研究受託機関(CRO)において実行されることを可能にする。また、SARS-CoV2を用いたこのアッセイは、手作業のステップを必要としないため、自動化された試料ハンドラーにおいて実行することも可能となり得る。疾病管理センター(CDC)は、自動化された試料ハンドラーが、バイオセーフティレベル3(BSL-3)の予防措置を使用しながら、バイオセーフティレベル2(BSL-2)の施設内で潜在的に操作され得ることを示唆するいくつかのガイダンスを提供している。
【0114】
開示される実施形態は、本質的に自動化されている。以前のウイルスアッセイは、潜在的に人為的エラーを結果にもたらし得る多くの手作業処理プロセスを含むものであった。例えば、望ましくないウイルス感染を防ぐためにアガロース層を重ねることは、標準的なプラークアッセイにおいては典型的に手作業で行われる。アガロース層を重ねることは複雑なプロセスステップであり、精密温度制御を必要とする。アガロース層の必要性を除去することによって、開示される実施形態はエンドツーエンドで自動化され、スループットを向上させ、人為的エラーを減少させることができる。
【0115】
COVID-19への関心の高まりは、バイオセーフティレベル3(BSL-3)施設のための要件及びBSL-3施設の需要の急増と相まって、COVID-19研究のための緊急時対応計画と共に、いくつかのデータ収集の選択肢を持つことが望ましくなっている。様々な研究室及び研究施設からの画像データを処理するためのウェブサイトプラットフォームは、トレーニングされたAIモデルを用いて、試料の感染性をより迅速に評価するために使用することができる。サービスとしてのソフトウェアは、特定のパートナーを有するのではなく、機器製造者、研究者、及び学術機関に導入することができる。標準的なアッセイ及び撮像に基づく、好ましいデータ収集戦略及び緊急時対応計画が望ましい。いずれの場合においても、より標準的なバイオセーフティレベル2(BSL-2)条件下の施設において、ウイルスのフィジビリティスタディが依然として実施され得る。
【0116】
一般的に、画像データは注釈付けされて、注釈付き画像データとなる。注釈付き画像データは次いで照合されて、照合済み注釈付き画像データとなる。照合済み注釈付き画像データは、人工知能モデル(AI群)をトレーニングするために使用することができる。人工知能モデル(AI群)は、照合済み注釈付き画像データから、様々な時点においてトレーニングされる。AIモデルの性能は、AIモデルのうちの1つ以上を検証するために、標準的なプラークアッセイの結果と比較される。
【0117】
トレーニングデータは照合され、感染陽性細胞及び感染陰性細胞のラベル付きトレーニングセットとなる。約1以上の感染多重度(MOI)で感染した(MOI≧1)所与のウェル中の細胞の全てが、感染陽性細胞(陽性)であると仮定される。模擬感染させられたウェル中の細胞は、0の感染多重度(MOI)を有し(MOI=0)、感染陰性細胞(陰性)であると仮定される。
【0118】
1つの実施形態においては、感染細胞のトレーニングセットは、プラークが可視となるのに先立って又は生死判別染色を用いて検出可能となるのに先立って、収集されてもよい。この場合には、溶解に先立って感染細胞を検出することが望ましい。したがって、生死判別染色を用いて、後に最終的な時点において溶解するか又は死滅する候補細胞が同定される。このことは、まず細胞レベルで時点の全てを整列させることを必要とする。マルチウェルプレート形式は、プレートが培養器から顕微鏡に複数回移動させられるため、時点を或る程度整列されたままにしておくことができるが、このことは典型的には、処理なしで後続の時点において同じ個々の細胞を同定するには不十分である。この目的のために、本実施形態は、明視野画像で動作するいくつかの細胞セグメント化アルゴリズムを使用してもよい。これらのアルゴリズム及びその他のアルゴリズムは、暗視野画像、位相コントラスト画像、微分干渉コントラスト(DIC)画像等の、感染細胞の他のデジタル画像とともに使用されてもよい。各時点からセグメント化された細胞のセントロイドは、2つの時点のセントロイドのサブ試料を互いに整列させ、整列のアフィン変換を生成する、ランダムサンプルコンセンサス(RANSAC)アルゴリズムにおいて使用される。
【0119】
これらのアフィンは、最終的な時点において可視のプラークを使用して定義された関心領域(ROI)上で使用されて、進行する感染が可視ではない以前の時点におけるROIを生成した。これらのROIの外側の他の領域は、トレーニングのための感染陰性細胞を同定するために使用される。人工知能モデル(AI群)を各時点において独立してトレーニングすることは、非感染細胞から正確に識別するのに十分な数の感染細胞を含む時点を特定することを可能にする。より早い時点においてROIを縮小することは、感染の広がりを模倣するために使用することができ、ROI中の非感染細胞の数を減少させて、より早い時点におけるトレーニングを改善することができる。
【0120】
いずれのデータ収集戦略においても、開示される実施形態は、複数の独立した複製物、感染後の複数の時点、及びいくつかの感染性比(第1のデータ収集戦略(戦略1)についてはPFU/ウェル、第2のデータ収集戦略(戦略2)についてはPFU/細胞又はMOI)を使用する。AIの性能は、感染が進行して時点が遅くなるにつれて向上し得る。しかしながら、アッセイの実用的な価値は、初期の時点において最大となる。この理由のため、AIの性能は各時点で個別に評価される。1つの実施形態においては、6~8の時点、3~5のウイルス希釈物、及び3~5の複製物が、AIモデルのトレーニングに十分である。各時点及び希釈物は、1つの複製物を除く全てをトレーニングのために使用し、残りの複製物を試験に使用して、個別のAIモデル(合計18~40)をトレーニングするために使用される。ラウンドロビン一つ抜き(leave-one-out)試験は、AIモデルの総数を3~5倍にし、AI性能の分散の尺度をもたらすことができる。
【0121】
二重の機械学習
開示される実施形態は、2つの異なるAIシステム、すなわち特徴ベースのもの及び畳み込みニューラルネット(CNN)をトレーニングした。特徴ベースのシステムは、比較的少ない数のトレーニング試料で好適に動作し、トレーニングされた人間の観察者にも可視でない違いを、高い精度で見分けることができる人工知能モデル(AI群)に帰着することが示されている。CNNでも同様の結果が得られている。特徴ベースの人工知能モデル(AI群)よりもはるかに大きなパラメーター空間のため、典型的にCNN人工知能モデルは、より多くのデータをトレーニングのために必要とする。関連性のない撮像問題からの転移学習の使用、又はデータ増強の使用によって、CNN人工知能モデルをトレーニングするためのデータを削減することができる。これらの手法は、これまでに撮像問題において成功裏に使用されており、現在ではCNN人工知能モデルをトレーニングするための標準的なツールボックスの一部となっている。様々なAIモデルの性能が、異なる時点において比較されて、どれがより良い結果をもたらすかを決定することができる。
【0122】
データ量
経験に基づくと、特徴ベースのAIモデルの飽和トレーニングを達成するためには、クラス当たり300の画像例の使用で十分である。第2の収集戦略(戦略2)においては、感染細胞例に不足はない。第1の収集戦略(戦略1)においては、正確なPFUカウントを得るためには、ウェル中に10個~100個のプラークが必要であり、これらのプラークのそれぞれは数百個の細胞を含み得る。ウェル当たりのプラークが許容範囲内であれば、各時点において異なるウイルス希釈物から試料を組み合わせることができる。この実験セットアップは、各時点において、100個以上ものプラーク(したがって数千個の細胞)を導出することができる。かくして、以上に説明されたウイルス希釈物及び複製物以外に、追加的な撮像の必要はほとんどない。
【0123】
検証
本発明者らのトレーニングセットの既知の結果を使用して、候補AIモデルがトレーニングされ、精度レベルが標準的なプラークアッセイに匹敵するものとなると、AIベースのアッセイが、最終的な意図される形で検証されて、精度が維持されるか否かを確認することができる。第1のデータ収集戦略においては、新しいアッセイが、アガロースオーバーレイなしの標準的なマルチウェルプレート上で試験されて、AIモデルのトレーニングがこの条件の変化でも保持されるか否かを確認することができる。第2のデータ収集戦略においては、標準的なプラークアッセイを模倣するために、1よりもはるかに少ないMOIで新たな感染が実行される。プラークは今や単一細胞であるため、本システムは標準的なアッセイよりもはるかに広い範囲のウェル当たりのPFUを許容することが可能である。このことは、健康な細胞の芝生の中から個々の感染細胞を見出し、感染細胞のカウントが標準的なプラークのカウントの代わりになり得ることを見出すことによって、実証され得る。
【0124】
プラットフォームの拡張
ウェブベースのプラットフォームは、元々はBisQueに基づくものであった。しかしながら、ウェブベースのプラットフォームは、多くの領域においてBisQueに対してかなりの改善を行うために書き直されており、任意のサイズのデータに対するスケーラブルなビューアー、画像当たり数百万個の同定されたオブジェクトをサポートする独自の記憶フォーマット、及びスケーラブルな展開を含む。さらに、いくつかのプラットフォームの強化が、リソースのより好適な利用、及び新規なアッセイのより迅速な採用を可能にし、結果の生成を高速化させている。
【0125】
ウェブベースのプラットフォームは、比較及び将来保証の両方のために、複数の機械学習フレームワークをサポートするように設計されている。Caffe深層学習フレームワークがサポートされる。結果の品質に対するフレームワークトレーニングの効果を比較するために、TensorFlow及びPyTorch/Caffe2の両方について追加されたサポートが提供される。新規なデータセットに対して迅速にトレーニングするために、各深層学習フレームワークの事前設定されたニューラルネットワーク及びデータセットに基づく転移学習を利用する。ウェブベースのものが可能にする使用の平準化を考えると、異なるフレームワークを迅速に比較することができる。データが利用可能になれば、異なるニューラルネットワークのトポロジーを更に使用することもできる。
【0126】
従来の深層学習と共に、多数の画素ベースの特徴が、ウイルス形態の早期検出を相関させるために使用される。或る特定の特徴が細胞に対するウイルス損傷の早期検出とどのように好適に相関するかを示すために、特殊化された視覚化が追加される。この視覚化は、相関する感受性特徴のヒートマップの形をとる。かかるヒートマップから得られる情報は、細胞形態の特異性を理解する上で研究者にとって有用なものとなり得る。予測信頼度等の内部のAIモデルの基準を視覚化するために、ビューアーのユーザーインターフェイスが拡張されてもよい。
【0127】
開示される実施形態には、多くの他の利点がある。結果を得るまでのターンアラウンドタイムが短縮される。細胞アッセイの分析がより自動化され、生体有害細胞に対してより安全に実行できる。
【0128】
診断及び不活性化の応用
以上に開示されたように、AIにより支援されたウイルスアッセイは、ウイルス感染性を決定するプロセスを簡略化し高速化することができる。開示された原理は、診断アッセイ又は不活性化アッセイ等の、特定のタイプのウイルスアッセイにも適用することができる。
【0129】
診断アッセイは、採取されるウイルスが未知のウイルスである、感染性アッセイである。ウイルスは、感染した人物のぬぐい液から取られた試料であってもよい。ウイルスの正体は、疑いのあるものであってもよいが、確定的には知られていないものである。ウイルス試料が、既知のウイルスタイプであることが疑われる場合、既知のウイルスタイプに対してトレーニングされたAIによって、ウイルス試料の感染性が分類されてもよい。既知のウイルスであることが疑われないウイルス試料については、複数のウイルスストックについてトレーニングされた、より一般化されたAIを使用して、未知のウイルス試料を分類してもよい。同様に、複数のAIが複数のウイルスに対してトレーニングされてもよい。各AIモデルは、未知の試料の予測されるMOIとAIがトレーニングされたウイルスのMOIとの比較に基づいて、AIモデルがトレーニングされた1つのウイルスに細胞が感染した確率を、レポートしてもよい。診断アッセイの別の変形例が、患者から様々な組織及び体液を採取することによって、患者の体内のどこにウイルス量があるかを決定するために、生検と組み合わせて実行されてもよい。この場合には、ウイルスは既知のもの又は疑いのあるものであり、AIにより支援される感染性アッセイが、ウイルスが局在している場所を決定してもよい。
【0130】
一般的に、不活性化アッセイは、既知のウイルス試料の感染性に対する処置又は手順の効果を決定しようとするものである。ウイルス試料の感染性に影響を与える処置又は手順が既知のウイルス試料又は感染細胞に対して実施される。処置及び手順は、抗ウイルス薬、殺生物剤、感染細胞又はウイルスの遺伝子改変、薬剤、患者血清中の不活性化抗体等を用いるものであってもよい。処置は、ウイルスの遺伝子を改変して、遺伝子治療のための遺伝子を発現させるものであってもよい。処置は、ウイルスの遺伝子を改変して、ウイルスの感染標的細胞に影響を与えるもの(例えば腫瘍溶解療法)であってもよい。処置は、ウイルスの遺伝子を改変して、ウイルスの感染性を調整するものであってもよい。処置は、ウイルスの遺伝子を改変して、宿主患者の免疫応答を調整するもの(例えばワクチン開発及び腫瘍溶解免疫療法)であってもよい。いずれの場合においても、ウイルス試料のMOIは、ウイルス試料の感染性に対する効果を定量化するために、処置又は手順の前後で決定される。開示される発明の実施形態は、処置の前後に感染細胞と非感染細胞を識別するために、AIを使用してウイルス試料のMOIを決定することができる。
【0131】
不活性化アッセイのサブセットは、クリアランスアッセイを含み、そこで医薬品製造プロセスステップが、問題となる手順又は処置になぞらえられる。不活性化剤が、このプロセスステップである。既知のウイルスが医薬品製造プロセスステップに導入され、プロセスステップの前後のウイルスの量に対するプロセスの効果が決定されなければならない。
【0132】
実験的又は治療的使用のために既知のウイルスの新しい調製物を特徴付ける場合、又は、遺伝子治療における使用のための、若しくは腫瘍溶解性ウイルス治療のために使用されるもの等の特定の細胞へのウイルスのターゲティングの有効性を決定するための、候補として開発された新しい株を特徴付ける場合には、不活性化ステップなしでのウイルスの感染性の決定が必要とされる。
【0133】
診断アッセイ及び不活性化アッセイが、開示される実施形態であるが、開示される実施形態はこれら2つのタイプのアッセイに限定されるものではないことは、理解されるべきである。概して、AIにより支援されたウイルスアッセイが、開示される実施形態であり、開示される原理は、AI及びAIモデルを使用して、あらゆる目的のためにウイルス試料中のウイルス感染性を定量化することに適用可能である。
【0134】
コンピューターネットワーク
ここで
図6を参照すると、クライアントサーバーコンピューターシステム600のブロック図が示されている。クライアントサーバーコンピューターシステム600は、インターネットの広域ネットワーク等のコンピューターネットワーク608を通して、サーバーセンター(又はクラウド)606中の1つ以上のコンピューターサーバー604と通信する、複数のクライアントコンピューター602A~602Nを含む。生体細胞用のウェブベースのスケーラブル画像分析プラットフォーム610は、複数のクライアントコンピューター602A~602Nによるアクセスのために、1つ以上のコンピューターサーバー604上で実行することができる。
【0135】
コンピューターシステム
ここで
図7を参照すると、生体細胞用のウェブベースのスケーラブル画像分析プラットフォーム610のためのソフトウェア命令を実行することができるコンピューティングシステム700のブロック図が示されている。コンピューティングシステム700は、本明細書に記載される機能プロセスを実行するための記憶されたソフトウェア命令を実行する、1つ以上のサーバーのインスタンスであってもよい。コンピューティングシステム700はまた、本明細書に記載される様々なウィンドウビューアーを有するウェブブラウザを提供及び表示するために、クライアントコンピューターの本明細書に記載される機能プロセスを実行する、記憶されたソフトウェア命令を実行する、広域ネットワーク中のクライアントコンピューターの複数のインスタンスのうちのインスタンスであってもよい。
【0136】
1つの実施形態においては、コンピューティングシステム700は、マイクロフォンを有していてもよいし有していなくてもよいグラフィックモニタ702と通信可能に結合された、コンピューター701を含んでもよい。コンピューター701は更に、オーディオビデオ装置を有するサービスエリア中のラウドスピーカー790、マイクロフォン791、及びカメラ792に結合されてもよい。1つの実施形態によれば、コンピューター701は、1つ以上のプロセッサ710、メモリ720、1つ以上の記憶ドライブ(例えばソリッドステートドライブ、ハードディスクドライブ)730、740、ビデオ入出力インターフェイス750A、ビデオ入力インターフェイス750B、パラレル/シリアル入出力データインターフェイス760、複数のネットワークインターフェイス761A~761N、複数の無線送受信機(トランシーバー)762A~762N、及びオーディオインターフェイス770を含んでもよい。グラフィックスモニター702は、ビデオ入出力インターフェイス750Aと通信可能に結合されてもよい。カメラ792は、ビデオ入力インターフェイス750Bと通信可能に結合されてもよい。スピーカー790及びマイクロフォン791は、オーディオインターフェイス770と通信可能に結合されてもよい。カメラ792は、モニタ702等の、サービスエリア中の1つ以上のオーディオビジュアル装置を見るために使用することができる。ラウドスピーカー790は、サービスエリア中のユーザーに通信するために使用することができ、マイクロフォン791は、サービスエリア中のユーザーからの通信を受信するために使用することができる。
【0137】
データインターフェイス760は、1つ以上のユニバーサルシリアルバス(USB)インターフェイス及び/又は1つ以上のシリアル入出力インターフェイス(例えばRS232)等の、有線データ接続を提供してもよい。データインターフェイス760はまた、パラレルデータインターフェイスを提供してもよい。複数の無線送受信機(トランシーバー)762A~762Nは、WIFI、Bluetooth、及び/又はセルラーを通したもの等の無線データ接続を提供してもよい。1つ以上のオーディオビデオ装置は、無線データ接続又は有線データ接続を使用して、コンピューター701と通信してもよい。
【0138】
コンピューター701は、複数のネットワークインターフェイス761A~761Nのうちの1つ以上を通して、リモートログイン及びリモート仮想セッションを提供する、エッジコンピューターであってもよい。これに加えて、ネットワークインターフェイスのそれぞれは、1つ以上のネットワーク接続をサポートする。ネットワークインターフェイスは、仮想インターフェイスであってもよく、他の仮想インターフェイスから論理的に分離されていてもよい。複数のネットワークインターフェイス761A~761Nのうちの1つ以上を使用して、クライアントコンピューターとサーバーコンピューターとの間のネットワーク接続を行うことができる。
【0139】
1つ以上のコンピューティングシステム700及び/又は1つ以上のコンピューター701(又はコンピューターサーバー)は、本明細書に開示されるプロセスのいくつか又は全てを実行するために使用することができる。サーバー及び装置の機能を実行するソフトウェア命令は、記憶装置730、740に記憶され、プロセッサ710によって実行されるときにメモリ720にロードされる。
【0140】
1つの実施形態においては、プロセッサ710は、ハードディスクドライブ730、740、リムーバブル媒体(例えばコンパクトディスク799、磁気テープ等)、又はその両方の組み合わせ等の、機械可読媒体上に存在する命令を実行する。代替の実施形態においては、ビデオインターフェイス750A及び750Bのうちの1つ以上は、開示される実施形態の命令を実行し機能を実行するために使用できる、グラフィカルプロセッシングユニット(GPU)を含む。命令は、機械可読媒体から、ランダムアクセスメモリ(RAM)、ダイナミックRAM(DRAM)等を含んでもよい、メモリ720にロードされ得る。プロセッサ710、750A及び750Bは、メモリ720から命令を取り出し、命令を実行して、本明細書に記載の動作を実行することができる。
【0141】
図7に示された構成要素及び関連するハードウェアのいずれか又は全てが、コンピューターシステム700の様々な実施形態において使用され得ることに留意されたい。しかしながら、コンピューターシステム700の他の構成は、
図7に示されたものよりも多い又は少ない装置を含むものであってもよいことは、理解されるべきである。
【0142】
まとめ
先行する詳細な説明の或る部分は、コンピューターメモリ内のデータビットに対して演算を実施するアルゴリズム及び記号的表現によって提示されている場合がある。これらのアルゴリズム的記述及び表現は、データ処理技術の当業者の作業の実質を他の当業者に最も効果的に伝達する、当業者によって使用されるツールである。アルゴリズムは、本明細書において概して、所望の結果に導く演算の自己矛盾のないシーケンスであると考えられる。演算は、物理量の物理的操作を必要とする演算である。通常、必ずしもそうではないが、これらの量は、記憶され、転送され、結合され、比較され、別様に操作されることが可能な電気信号又は磁気信号の形態をとる。これらの信号を、ビット、値、要素、シンボル、キャラクター、用語、数字等として指すことが、主に一般的使用のためにしばしば好都合であることがわかっている。
【0143】
しかし、これらの及び同様の用語の全ては、適切な物理量に関連付けられ、これらの量に適用される好都合なラベルに過ぎないことを念頭に置くべきである。別途特に述べない限り、上記議論から明らかであるように、説明全体を通して、「処理すること(processing)」又は「計算すること(computing)」又は「計算すること(calculating)」又は「決定すること(determining)」又は「表示すること(displaying)」等の用語を利用する議論が、コンピューターシステム、又は同様の電子コンピューティングデバイスのアクション及びプロセスを指し、そのアクション及びプロセスが、コンピューターシステムのレジスター及びメモリ内で物理(電子)量として表現されるデータを操作し、コンピューターシステムのメモリ若しくはレジスター又は他のこうした情報記憶、伝送、又は表示デバイス内の物理量として同様に表現される他のデータに変換することが認識される。
【0144】
実施形態は上記のとおりである。いくつかの或る特定の例示的な実施形態が説明され、添付図面に示されているが、そのような実施形態は、広い本発明の例示にすぎず、広い本発明を限定するものでないこと、並びに、実施形態が、図示及び説明された特定の構造及び構成に限定されるものでないことが理解されよう。なぜならば、当業者は、他の様々な変更を想起することができるからである。
【0145】
ソフトウェアで実装される場合、開示される実施形態の要素は、基本的に、必要なタスクを実行するためのコードセグメントである。プログラム又はコードセグメントは、プロセッサ可読媒体に記憶されてもよいし、又は伝送媒体若しくは通信リンクを通して搬送波に実施化されたコンピューターデータ信号によって伝送されてもよい。「プロセッサ可読媒体」は、情報を記憶することができるいずれの媒体をも含み得る。プロセッサ可読媒体の例は、電子回路、半導体メモリ装置、読み取り専用メモリ(ROM)、フラッシュメモリ、消去可能プログラマブル読み取り専用メモリ(EPROM)、フロッピーディスケット、CD-ROM、光ディスク、ハードディスク、光ファイバー媒体、無線周波数(RF)リンク等を含む。コンピューターデータ信号は、電子ネットワークチャネル、光ファイバー、空気、電磁波、RFリンク等の、伝送媒体上を伝搬できるいずれの信号をも含み得る。コードセグメントは、インターネット、イントラネット等のコンピューターネットワークを介して、コンピューターデータ信号を使用してダウンロードされ、記憶装置(プロセッサ可読媒体)に記憶されてもよい。
【0146】
本明細書は、多くの具体的内容を含むが、これらは、本開示の範囲に対する限定としても、請求項に記載され得るものの範囲に対する限定としても解釈されるべきではなく、逆に、本開示の特定の実施態様に特有の特徴の説明として解釈されるべきである。個別の実施態様の状況で本明細書に説明されたいくつかの或る特定の特徴は、単一の実施態様において組み合わせて実施することもできる。逆に、単一の実施態様の状況で説明された様々な特徴は、複数の実施態様において別々に又は一部を組み合わせて実施することもできる。さらに、特徴は、上記において、いくつかの或る特定の組み合わせで動作するものとして説明することができ、さらには、そのようなものとして最初に特許請求することもできるが、特許請求される組み合わせからの1つ以上の特徴は、いくつかの場合には、その組み合わせから削除される場合があり、特許請求される組み合わせは、部分的な組み合わせ又は部分的な組み合わせの変形形態を対象とする場合がある。したがって、実施形態が特に説明されたが、これらはかかる開示された実施形態によって限定されると解釈されるべきではない。
【国際調査報告】