IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ジェネンテック, インコーポレイテッドの特許一覧

特表2023-508905畳み込みニューラルネットワークによる細胞株開発画像特性評価
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-03-06
(54)【発明の名称】畳み込みニューラルネットワークによる細胞株開発画像特性評価
(51)【国際特許分類】
   G06T 7/00 20170101AFI20230227BHJP
   G06V 10/82 20220101ALI20230227BHJP
   G06V 20/69 20220101ALI20230227BHJP
【FI】
G06T7/00 630
G06T7/00 350C
G06V10/82
G06V20/69
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022537489
(86)(22)【出願日】2020-12-18
(85)【翻訳文提出日】2022-08-02
(86)【国際出願番号】 US2020065865
(87)【国際公開番号】W WO2021127345
(87)【国際公開日】2021-06-24
(31)【優先権主張番号】62/951,998
(32)【優先日】2019-12-20
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】509012625
【氏名又は名称】ジェネンテック, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(72)【発明者】
【氏名】リー, ジェン
(72)【発明者】
【氏名】イム, マンディ マン チュ
(72)【発明者】
【氏名】エフライム, ビビ
(72)【発明者】
【氏名】トラン, ダット
(72)【発明者】
【氏名】リウ, シンユー
(72)【発明者】
【氏名】ショー, デイビッド
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096FA03
5L096FA04
5L096FA06
5L096FA16
5L096FA62
5L096FA66
5L096FA69
5L096GA34
5L096GA51
5L096GA55
5L096HA11
5L096JA22
5L096KA04
(57)【要約】
方法は、コンピューティングシステムによって、サンプリング領域を描写するクエリ画像を受信することと、サンプリング領域内のクラスタを描写するクエリ画像の1つ以上の領域を識別するために単一クラスタ検出モデルを使用してクエリ画像を処理することと、描写された各クラスタが細胞クラスタであるかどうかを決定するためにクラスタ検証深層学習モデルを使用して1つ以上の領域を処理することと、識別された1つ以上の領域のうちの正確に1つが細胞クラスタであるクラスタを描写すると決定することと、を含む。方法は、細胞クラスタ内に1つの細胞のみが存在すると決定し、細胞の形態が許容可能であると決定するために形態深層学習モデルを使用して細胞クラスタを描写する領域を処理することをさらに含む。
【特許請求の範囲】
【請求項1】
コンピューティングシステムによって、
サンプリング領域を描写するクエリ画像を受信することと、
単一クラスタ検出モデルを使用して前記クエリ画像を処理して、前記サンプリング領域内のクラスタを描写する前記クエリ画像の1つ以上の領域を識別することと、
クラスタ検証深層学習モデルを使用して前記1つ以上の領域を処理して、描写された各クラスタが細胞クラスタであるかどうかを決定することと、
前記識別された1つ以上の領域のうちの正確に1つが細胞クラスタであるクラスタを描写していると決定することと、
前記細胞クラスタ内に1つのみの細胞が存在すると決定し、および
前記細胞の形態が許容可能であると決定するように、形態深層学習モデルを使用して前記細胞クラスタを描写する前記領域を処理することと、を含む、方法。
【請求項2】
描写された各クラスタが、所定の範囲内のクラスタ輪郭領域サイズおよび少なくとも所定の数の点を有するクラスタ輪郭領域を含む、請求項1に記載の方法。
【請求項3】
前記領域を識別することが、前記クラスタ輪郭領域の周りに境界ボックスを描くことを含む、請求項2に記載の方法。
【請求項4】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタを、前記サンプリング領域を描写する別のクエリ画像の対応する位置において検証することを含む、請求項1から3のいずれか一項に記載の方法。
【請求項5】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタが細胞を有することについて陽性のクラスタとして現れるかどうかを決定することを含む、請求項1から4のいずれか一項に記載の方法。
【請求項6】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタが細胞を有することについて陰性のクラスタとして現れないかどうかを決定することを含む、請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記細胞クラスタ内に1つのみの細胞が存在すると決定することが、前記細胞クラスタ内で検出された輪郭の数を評価することを含む、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記細胞の形態が許容可能であると決定することが、細胞中心領域を識別することと、真円度について前記細胞中心領域を評価することと、を含む、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記細胞の形態が許容可能であると決定することが、明るい細胞中心領域および前記明るい細胞中心領域の周りの暗いリング状細胞膜を識別することを含む、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記細胞の形態が許容可能であると決定することが、明るい細胞中心領域および細胞膜の外側の明るいリング状領域を識別することを含む、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記クエリ画像が、蛍光画像または明視野画像を含む、請求項1から10のいずれか一項に記載の方法。
【請求項12】
前記クエリ画像を処理する前に、分析の事前チェック段階中に輪郭検出アルゴリズムを使用して前記クエリ画像内の1つ以上の大きな別個のオブジェクトを識別することをさらに含む、請求項1から11のいずれか一項に記載の方法。
【請求項13】
前記クエリ画像を処理する前に、分析の事前チェック段階中に前記クエリ画像が所定の暗さ閾値を下回るかどうかを決定することをさらに含む、請求項1から12のいずれか一項に記載の方法。
【請求項14】
前記クエリ画像を処理する前に、前記サンプリング領域のクリティカルクリッピングが前記クエリ画像内に存在するかどうかを決定することをさらに含む、請求項1から13のいずれか一項に記載の方法。
【請求項15】
前記サンプリング領域がウェルであり、前記ウェルが、複数のウェル輪郭点およびウェル輪郭中心によって画定される前記クエリ画像内のウェル輪郭を有する、請求項14に記載の方法。
【請求項16】
前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することが、
前記クエリ画像内の前記ウェル輪郭に、フィッティング円中心およびフィッティング円半径を有するフィッティング円を適用することを含む、請求項15に記載の方法。
【請求項17】
前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することが、
フィッティング円半径から、複数のウェル輪郭点のそれぞれに対する前記フィッティング円中心の距離を差し引いたものを計算して、前記ウェル輪郭と前記フィッティング円との間の差を識別することをさらに含む、請求項16に記載の方法。
【請求項18】
前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することが、
前記ウェル輪郭中心から画像エッジまでの距離から、ウェル輪郭半径を差し引いたものを計算して、結果が所定の距離閾値以下であるかどうかを決定することを含む、請求項15に記載の方法。
【請求項19】
前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することが、
連続するウェル輪郭点が単一の線にあるかどうか、および前記単一の線の2つの端点間の距離が所定の距離閾値を満たすかまたは超えるかどうかを決定することを含む、請求項15に記載の方法。
【請求項20】
前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することが、
前記単一の線が0の局所曲率を有するかどうかを決定することをさらに含む、請求項19に記載の方法。
【請求項21】
システムであって、
1つ以上のプロセッサと、
前記プロセッサによって実行可能な命令を含む、前記プロセッサに結合された非一時的メモリと、を備え、前記プロセッサが、前記命令を実行すると、
サンプリング領域を描写するクエリ画像を受信することと、
単一クラスタ検出モデルを使用して前記クエリ画像を処理して、前記サンプリング領域内のクラスタを描写する前記クエリ画像の1つ以上の領域を識別することと、
クラスタ検証深層学習モデルを使用して前記1つ以上の領域を処理して、描写された各クラスタが細胞クラスタであるかどうかを決定することと、
前記識別された1つ以上の領域のうちの正確に1つが細胞クラスタであるクラスタを描写していると決定することと、
前記細胞クラスタ内に1つのみの細胞が存在すると決定し、および
前記細胞の形態が許容可能であると決定するように、形態深層学習モデルを使用して前記細胞クラスタを描写する前記領域を処理することと、を行うように動作可能である、システム。
【請求項22】
描写された各クラスタが、所定の範囲内のクラスタ輪郭領域サイズおよび少なくとも所定の数の点を有するクラスタ輪郭領域を含む、請求項21に記載のシステム。
【請求項23】
前記領域を識別することが、前記クラスタ輪郭領域の周りに境界ボックスを描くことを含む、請求項22に記載のシステム。
【請求項24】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタを、前記サンプリング領域を描写する別のクエリ画像の対応する位置において検証することを含む、請求項21から23のいずれか一項に記載のシステム。
【請求項25】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタが細胞を有することについて陽性のクラスタとして現れるかどうかを決定することを含む、請求項21から24のいずれか一項に記載のシステム。
【請求項26】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタが細胞を有することについて陰性のクラスタとして現れないかどうかを決定することを含む、請求項21から25のいずれか一項に記載のシステム。
【請求項27】
前記細胞クラスタ内に1つのみの細胞が存在すると決定することが、前記細胞クラスタ内で検出された輪郭の数を評価することを含む、請求項21から26のいずれか一項に記載のシステム。
【請求項28】
前記細胞の形態が許容可能であると決定することが、細胞中心領域を識別することと、真円度について前記細胞中心領域を評価することと、を含む、請求項21から27のいずれか一項に記載のシステム。
【請求項29】
前記細胞の形態が許容可能であると決定することが、明るい細胞中心領域および前記明るい細胞中心領域の周りの暗いリング状細胞膜を識別することを含む、請求項21から28のいずれか一項に記載のシステム。
【請求項30】
前記細胞の形態が許容可能であると決定することが、明るい細胞中心領域および細胞膜の外側の明るいリング状領域を識別することを含む、請求項21から29のいずれか一項に記載のシステム。
【請求項31】
前記クエリ画像が、蛍光画像または明視野画像を含む、請求項21から30のいずれか一項に記載のシステム。
【請求項32】
前記プロセッサが、前記命令を実行すると、
前記クエリ画像を処理する前に、分析の事前チェック段階中に輪郭検出アルゴリズムを使用して前記クエリ画像内の1つ以上の大きな別個のオブジェクトを識別することを行うようにさらに動作可能である、請求項21から31のいずれか一項に記載のシステム。
【請求項33】
前記プロセッサが、前記命令を実行すると、
前記クエリ画像を処理する前に、分析の事前チェック段階中に前記クエリ画像が所定の暗さ閾値を下回るかどうかを決定することを行うようにさらに動作可能である、請求項21から32のいずれか一項に記載のシステム。
【請求項34】
前記プロセッサが、前記命令を実行すると、
前記クエリ画像を処理する前に、前記サンプリング領域のクリティカルクリッピングが前記クエリ画像内に存在するかどうかを決定することを行うようにさらに動作可能である、請求項21から33のいずれか一項に記載のシステム。
【請求項35】
前記サンプリング領域がウェルであり、前記ウェルが、複数のウェル輪郭点およびウェル輪郭中心によって画定される前記クエリ画像内のウェル輪郭を有する、請求項34に記載のシステム。
【請求項36】
前記プロセッサが、前記命令を実行すると、
前記クエリ画像内の前記ウェル輪郭に、フィッティング円中心およびフィッティング円半径を有するフィッティング円を適用することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項35に記載のシステム。
【請求項37】
前記プロセッサが、前記命令を実行すると、
さらに、フィッティング円半径から、複数のウェル輪郭点のそれぞれに対する前記フィッティング円中心の距離を差し引いたものを計算して、前記ウェル輪郭と前記フィッティング円との間の差を識別することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項36に記載のシステム。
【請求項38】
前記プロセッサが、前記命令を実行すると、
前記ウェル輪郭中心から画像エッジまでの距離から、ウェル輪郭半径を差し引いたものを計算して、結果が所定の距離閾値以下であるかどうかを決定することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項35に記載のシステム。
【請求項39】
前記プロセッサが、前記命令を実行すると、
連続するウェル輪郭点が単一の線にあるかどうか、および前記単一の線の2つの端点間の距離が所定の距離閾値を満たすかまたは超えるかどうかを決定することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項35に記載のシステム。
【請求項40】
前記プロセッサが、前記命令を実行すると、
さらに、前記単一の線が0の局所曲率を有するかどうかを決定することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項39に記載のシステム。
【請求項41】
実行されると、
サンプリング領域を描写するクエリ画像を受信することと、
単一クラスタ検出モデルを使用して前記クエリ画像を処理して、前記サンプリング領域内のクラスタを描写する前記クエリ画像の1つ以上の領域を識別することと、
クラスタ検証深層学習モデルを使用して前記1つ以上の領域を処理して、描写された各クラスタが細胞クラスタであるかどうかを決定することと、
前記識別された1つ以上の領域のうちの正確に1つが細胞クラスタであるクラスタを描写していると決定することと、
前記細胞クラスタ内に1つのみの細胞が存在すると決定し、および
前記細胞の形態が許容可能であると決定するように、形態深層学習モデルを使用して前記細胞クラスタを描写する前記領域を処理することとを行うように動作可能なソフトウェアを具現化する1つ以上のコンピュータ可読非一時的記憶媒体。
【請求項42】
描写された各クラスタが、所定の範囲内のクラスタ輪郭領域サイズおよび少なくとも所定の数の点を有するクラスタ輪郭領域を含む、請求項41に記載の媒体。
【請求項43】
前記領域を識別することが、前記クラスタ輪郭領域の周りに境界ボックスを描くことを含む、請求項42に記載の媒体。
【請求項44】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタを、前記サンプリング領域を描写する別のクエリ画像の対応する位置において検証することを含む、請求項41から43のいずれか一項に記載の媒体。
【請求項45】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタが細胞を有することについて陽性のクラスタとして現れるかどうかを決定することを含む、請求項41から44のいずれか一項に記載の媒体。
【請求項46】
描写された各クラスタが細胞クラスタであるかどうかを決定することが、描写された各クラスタが細胞を有することについて陰性のクラスタとして現れないかどうかを決定することを含む、請求項41から45のいずれか一項に記載の媒体。
【請求項47】
前記細胞クラスタ内に1つのみの細胞が存在すると決定することが、前記細胞クラスタ内で検出された輪郭の数を評価することを含む、請求項41から46のいずれか一項に記載の媒体。
【請求項48】
前記細胞の形態が許容可能であると決定することが、細胞中心領域を識別することと、真円度について前記細胞中心領域を評価することと、を含む、請求項41から47のいずれか一項に記載の媒体。
【請求項49】
前記細胞の形態が許容可能であると決定することが、明るい細胞中心領域および前記明るい細胞中心領域の周りの暗いリング状細胞膜を識別することを含む、請求項41から48のいずれか一項に記載の媒体。
【請求項50】
前記細胞の形態が許容可能であると決定することが、明るい細胞中心領域および細胞膜の外側の明るいリング状領域を識別することを含む、請求項41から49のいずれか一項に記載の媒体。
【請求項51】
前記クエリ画像が、蛍光画像または明視野画像を含む、請求項41から50のいずれか一項に記載の媒体。
【請求項52】
前記ソフトウェアが、実行されると、
前記クエリ画像を処理する前に、分析の事前チェック段階中に輪郭検出アルゴリズムを使用して前記クエリ画像内の1つ以上の大きな別個のオブジェクトを識別することを行うようにさらに動作可能である、請求項41から51のいずれか一項に記載の媒体。
【請求項53】
前記ソフトウェアが、実行されると、
前記クエリ画像を処理する前に、分析の事前チェック段階中に前記クエリ画像が所定の暗さ閾値を下回るかどうかを決定することを行うようにさらに動作可能である、請求項41から52のいずれか一項に記載の媒体。
【請求項54】
前記ソフトウェアが、実行されると、
前記クエリ画像を処理する前に、前記サンプリング領域のクリティカルクリッピングが前記クエリ画像内に存在するかどうかを決定することを行うようにさらに動作可能である、請求項41から53のいずれか一項に記載の媒体。
【請求項55】
前記サンプリング領域がウェルであり、前記ウェルが、複数のウェル輪郭点およびウェル輪郭中心によって画定される前記クエリ画像内のウェル輪郭を有する、請求項54に記載の媒体。
【請求項56】
前記ソフトウェアが、実行されると、
前記クエリ画像内の前記ウェル輪郭に、フィッティング円中心およびフィッティング円半径を有するフィッティング円を適用することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項55に記載の媒体。
【請求項57】
前記ソフトウェアが、実行されると、
さらに、フィッティング円半径から、複数のウェル輪郭点のそれぞれに対する前記フィッティング円中心の距離を差し引いたものを計算して、前記ウェル輪郭と前記フィッティング円との間の差を識別することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項56に記載の媒体。
【請求項58】
前記ソフトウェアが、実行されると、
前記ウェル輪郭中心から画像エッジまでの距離から、ウェル輪郭半径を差し引いたものを計算して、結果が所定の距離閾値以下であるかどうかを決定することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項55に記載の媒体。
【請求項59】
前記ソフトウェアが、実行されると、
連続するウェル輪郭点が単一の線にあるかどうか、および前記単一の線の2つの端点間の距離が所定の距離閾値を満たすかまたは超えるかどうかを決定することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項55に記載の媒体。
【請求項60】
前記ソフトウェアが、実行されると、
さらに、前記単一の線が0の局所曲率を有するかどうかを決定することによって、前記サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である、請求項59に記載の媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像を分析および分類するために、畳み込みニューラルネットワークなどの機械学習アルゴリズムを使用する細胞株開発(CLD)画像特性評価の方法に関する。
【背景技術】
【0002】
生物製剤またはバイオ医薬品としても知られる生物学的治療の分野は、バイオテクノロジー産業内で急速に成長している。生物製剤の大部分は、タンパク質ベースの治療薬であり、そのうちの組換えタンパク質は、世界中で承認された400を超える組換え製品を有する最大の群である。バイオ医薬品の開発では、モノクローナル細胞株から組換えタンパク質が産生される。規制機関は、産生細胞株が単一の前駆細胞に由来するという合理的な保証を必要とする。既存の指針は、生物製剤の生成に使用される細胞株がクローン由来であることを実証するイメージング技術および/または適切な統計の詳細を伴うクローニング手順の文書化を要求する。限界希釈クローニング、単一細胞プリンティングおよび蛍光活性化細胞選別を含む、臨床細胞株、特に哺乳動物細胞株を作製するために使用されるクローニングのいくつかの公知の方法がある。これらの方法は、マルチウェルプレートのウェルに単一の細胞を堆積させるために異なる技術を使用し、それぞれが、使いやすさ、実装コスト、ならびに播種およびクローニング効率の点で独自の利点および欠点を有する。各クローニング方法の意図は単一細胞堆積であるが、これは常に起こるとは限らない。播種すると、プレートウェルは、単一の細胞、複数の細胞、または細胞を全く含まないことがある。このように、本方法は、後にプレートイメージングを行って、各プレートウェルに実際に1つの細胞のみが存在することを確認することができる。プレーティング直後の細胞培養プレートの画像は、クローニング事象の唯一の直接的な証拠として提供されることができ、そのような目的のために米国食品医薬品局に提出されることが多い。それらはまた、クローン由来であるという高い信頼性を有するものとしてどの細胞が先に進められるべきかを決定するために使用される。したがって、これらの画像は、重要な役割を果たし、細胞株の発生に大きく依存している。しかしながら、画像分析プロセス自体には、結果の一貫性ならびに単一細胞クローニングの全体的な効率に影響を及ぼすことがある多くの課題がある。
【発明の概要】
【課題を解決するための手段】
【0003】
本明細書では、機械学習を使用して自動単一細胞画像レビューを達成する細胞株開発画像特性評価のための方法が提供される。
【0004】
臨床細胞株は、モノクローナル抗体(mAb)などの組換えタンパク質ベースの医薬品の開発のために作製されることができる。本明細書では、細胞株開発中の単一細胞クローニングを文書化するための正確且つ詳細な自動イメージングワークフローが開示される。画像特性評価は、画像のレビューを達成するために、細胞株の開発試験からの画像を異なるカテゴリに分類する手順を説明するために使用される。特定の実施形態では、本明細書に開示される細胞株開発画像特性評価方法は、機械学習アルゴリズムを使用することによって画像における欠陥検出を改善することができる。画像特性評価方法は、人工ニューラルネットワークを使用して、細胞の画像を分類することができる機械学習モデルを訓練することができる。画像特性評価方法は、転移学習を使用して、機械学習モデルの訓練に必要なサンプル数を減らすことができる。本明細書では、チャイニーズハムスター卵巣(CHO)細胞を評価する例示的な細胞株開発画像特性評価方法について論じるが、実際には、画像特性評価方法の実施は、任意の哺乳動物細胞に適用可能である。本方法は、レビューされる細胞の画像を取得し、機械学習モデルを使用して細胞の画像を分類し、良好細胞の画像を通過させながら手動検査のために不確実な欠陥を有する画像を返すことができる。
【0005】
本明細書に記載のCLD画像特性評価方法は、変換およびフィルタリングのようなデジタル画像処理技術と、機械学習および深層学習のようなパターン認識技術とを組み合わせる。本方法は、それ自体で、または一緒に、連続した順序で、または代替の順序で実施されることができる複数のステップを含む。このプロセスは、それぞれのウェルが単一細胞を含むという高い信頼性を有する良好画像の選択されたセットが得られるまで、各ステップにおいて不良画像を除外する。CLD画像特性評価方法は、研究者によって行われる第1のラウンドの手動画像分析を置き換えることを意図している。本明細書に開示される方法を利用して自動細胞画像分析を実施することは、結果の一貫性を改善し、単一細胞画像分析のスループットを向上させる。
【0006】
臨床細胞株特性評価をイメージングするために機械学習アルゴリズムを適用するという目標を達成するために、特定の技術的課題が存在する。1つの技術的課題は、不良画像を捕捉しないことが生物製剤の生成に使用される細胞株がクローン由来であるという保証を低減させることができるため、非常に高い精度を達成することを含む。別の技術的課題は、良好画像を不良画像として分類すると、不必要に拒絶される多数のクローンをもたらし、非効率的なワークフローをもたらす可能性があるため、良好画像が正確に識別されることを保証することである。ウェル内の細胞を識別するためのそれぞれのイメージャに関連する画像分析ソフトウェアが市販されている。しかしながら、厳密なパラメータを設定しているにもかかわらず、アルゴリズムの結果は、常に信頼できるとは限らない。上記の課題に対処するために本明細書で開示される実施形態によって提示される解決策は、機械学習アルゴリズムの1つ以上の特定のアーキテクチャを使用することを含み、これは、良好画像と不良画像の双方の高い分類精度をもたらす。本開示は、特定の方法において特定のシステムを介してCLD画像を特性評価することを記載しているが、本開示は、任意の適切な方法において任意の適切なシステムを介して任意の適切な画像を特性評価することを想定している。
【0007】
本開示の一態様は、コンピューティングシステムによって、サンプリング領域を描写するクエリ画像を受信することと、サンプリング領域内のクラスタを描写するクエリ画像の1つ以上の領域を識別するために単一クラスタ検出モデルを使用してクエリ画像を処理することと、描写された各クラスタが細胞クラスタであるかどうかを決定するためにクラスタ検証深層学習モデルを使用して1つ以上の領域を処理することと、識別された1つ以上の領域のうちの正確に1つが細胞クラスタであるクラスタを描写すると決定することと、細胞クラスタ内に1つの細胞のみが存在すると決定し、細胞の形態が許容可能であると決定するために形態深層学習モデルを使用して細胞クラスタを描写する領域を処理することと、を含む、方法を含む。描写された各クラスタは、所定の範囲内のクラスタ輪郭領域サイズおよび少なくとも所定の数の点を有するクラスタ輪郭領域を含む。領域を識別することは、クラスタ輪郭領域の周りに境界ボックスを描くことを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタを、サンプリング領域を描写する別のクエリ画像の対応する位置において検証することを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタが細胞を有することについて陽性のクラスタとして現れるかどうかを決定することを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタが細胞を有することについて陰性のクラスタとして現れないかどうかを決定することを含む。細胞クラスタ内に1つの細胞のみが存在すると決定することは、細胞クラスタ内で検出された輪郭の数を評価することを含む。細胞の形態が許容可能であると決定することは、細胞中心領域を識別すること、および真円度について細胞中心領域を評価することを含む。細胞の形態が許容可能であると決定することは、明るい細胞中心領域および明るい細胞中心領域の周りの暗いリング状細胞膜を識別することを含む。細胞の形態が許容可能であると決定することは、細胞膜の外側の明るい細胞中心領域および明るいリング状領域を識別することを含む。クエリ画像は、蛍光画像または明視野画像を含む。本方法は、クエリ画像を処理する前に、分析の事前チェック段階中に輪郭検出アルゴリズムを使用してクエリ画像内の1つ以上の大きな別個のオブジェクトを識別することをさらに含む。本方法は、クエリ画像を処理する前に、分析の事前チェック段階中にクエリ画像が所定の暗さ閾値を下回っているかどうかを決定することをさらに含む。本方法は、クエリ画像を処理する前に、サンプリング領域のクリティカルクリッピングがクエリ画像内に存在するかどうかを決定することをさらに含む。サンプリング領域は、ウェルであり、ウェルは、複数のウェル輪郭点およびウェル輪郭中心によって画定されるクエリ画像内のウェル輪郭を有する。サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することは、フィッティング円中心およびフィッティング円半径を有するフィッティング円をクエリ画像内のウェル輪郭に適用することを含む。サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することは、フィッティング円半径から、複数のウェル輪郭点のそれぞれに対するフィッティング円中心の距離を差し引いたものを計算して、ウェル輪郭とフィッティング円との間の差を識別することをさらに含む。サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することは、ウェル輪郭中心から画像エッジまでの距離から、ウェル輪郭半径を差し引いたものを計算して、結果が所定の距離閾値以下であるかどうかを決定することを含む。サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することは、連続するウェル輪郭点が単一の線にあるかどうか、および単一の線の2つの端点間の距離が所定の距離閾値を満たすかまたは超えるかどうかを決定することを含む。サンプリング領域のクリティカルクリッピングが存在するかどうかを決定することは、単一の線が0の局所曲率を有するかどうかを決定することをさらに含む。
【0008】
本開示の一態様は、1つ以上のプロセッサと、プロセッサによって実行可能な命令を含むプロセッサに結合された非一時的メモリとを含むシステムであって、プロセッサが、命令を実行すると、サンプリング領域を描写するクエリ画像を受信することと、サンプリング領域内のクラスタを描写するクエリ画像の1つ以上の領域を識別するために単一クラスタ検出モデルを使用してクエリ画像を処理することと、描写された各クラスタが細胞クラスタであるかどうかを決定するためにクラスタ検証深層学習モデルを使用して1つ以上の領域を処理することと、識別された1つ以上の領域のうちの正確に1つが細胞クラスタであるクラスタを描写すると決定することと、細胞クラスタ内に1つの細胞のみが存在すると決定し、細胞の形態が許容可能であると決定するために形態深層学習モデルを使用して細胞クラスタを描写する領域を処理することと、を行うように動作可能である、システムを含む。描写された各クラスタは、所定の範囲内のクラスタ輪郭領域サイズおよび少なくとも所定の数の点を有するクラスタ輪郭領域を含む。領域を識別することは、クラスタ輪郭領域の周りに境界ボックスを描くことを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタを、サンプリング領域を描写する別のクエリ画像の対応する位置において検証することを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタが細胞を有することについて陽性のクラスタとして現れるかどうかを決定することを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタが細胞を有することについて陰性のクラスタとして現れないかどうかを決定することを含む。細胞クラスタ内に1つの細胞のみが存在すると決定することは、細胞クラスタ内で検出された輪郭の数を評価することを含む。細胞の形態が許容可能であると決定することは、細胞中心領域を識別すること、および真円度について細胞中心領域を評価することを含む。細胞の形態が許容可能であると決定することは、明るい細胞中心領域および明るい細胞中心領域の周りの暗いリング状細胞膜を識別することを含む。細胞の形態が許容可能であると決定することは、細胞膜の外側の明るい細胞中心領域および明るいリング状領域を識別することを含む。クエリ画像は、蛍光画像または明視野画像を含む。プロセッサは、命令を実行すると、クエリ画像を処理する前に、分析の事前チェック段階中に輪郭検出アルゴリズムを使用してクエリ画像内の1つ以上の大きな別個のオブジェクトを識別するようにさらに動作可能である。プロセッサは、命令を実行すると、クエリ画像を処理する前に、分析の事前チェック段階中にクエリ画像が所定の暗さ閾値を下回るかどうかを決定するようにさらに動作可能である。プロセッサは、命令を実行すると、クエリ画像を処理する前に、サンプリング領域のクリティカルクリッピングがクエリ画像に存在するかどうかを決定するようにさらに動作可能である。サンプリング領域は、ウェルであり、ウェルは、複数のウェル輪郭点およびウェル輪郭中心によって画定されるクエリ画像内のウェル輪郭を有する。プロセッサは、命令を実行すると、フィッティング円中心およびフィッティング円半径を有するフィッティング円をクエリ画像内のウェル輪郭に適用することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である。プロセッサは、命令を実行すると、フィッティング円半径から、複数のウェル輪郭点のそれぞれに対するフィッティング円中心の距離を差し引いたものを計算して、ウェル輪郭とフィッティング円との間の差を識別することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかをさらに決定するように動作可能である。プロセッサは、命令を実行すると、ウェル輪郭中心から画像エッジまでの距離から、ウェル輪郭半径を差し引いたものを計算して、結果が所定の距離閾値以下であるかどうかを決定することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である。プロセッサは、命令を実行すると、連続するウェル輪郭点が単一の線にあるかどうか、および単一の線の2つの端点間の距離が所定の距離閾値を満たすかまたは超えるかどうかを決定することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である。プロセッサは、命令を実行すると、さらに単一の線が0の局所曲率を有するかどうかを決定することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である。
【0009】
本開示の一態様は、実行されると、サンプリング領域を描写するクエリ画像を受信することと、サンプリング領域内のクラスタを描写するクエリ画像の1つ以上の領域を識別するために単一クラスタ検出モデルを使用してクエリ画像を処理することと、描写された各クラスタが細胞クラスタであるかどうかを決定するためにクラスタ検証深層学習モデルを使用して1つ以上の領域を処理することと、識別された1つ以上の領域のうちの正確に1つが細胞クラスタであるクラスタを描写すると決定することと、細胞クラスタ内に1つの細胞のみが存在すると決定し、細胞の形態が許容可能であると決定するために形態深層学習モデルを使用して細胞クラスタを描写する領域を処理することと、を行うように動作可能なソフトウェアを具現化する1つ以上のコンピュータ可読非一時的記憶媒体を含む。描写された各クラスタは、所定の範囲内のクラスタ輪郭領域サイズおよび少なくとも所定の数の点を有するクラスタ輪郭領域を含む。領域を識別することは、クラスタ輪郭領域の周りに境界ボックスを描くことを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタを、サンプリング領域を描写する別のクエリ画像の対応する位置において検証することを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタが細胞を有することについて陽性のクラスタとして現れるかどうかを決定することを含む。描写された各クラスタが細胞クラスタであるかどうかを決定することは、描写された各クラスタが細胞を有することについて陰性のクラスタとして現れないかどうかを決定することを含む。細胞クラスタ内に1つの細胞のみが存在すると決定することは、細胞クラスタ内で検出された輪郭の数を評価することを含む。細胞の形態が許容可能であると決定することは、細胞中心領域を識別すること、および真円度について細胞中心領域を評価することを含む。細胞の形態が許容可能であると決定することは、明るい細胞中心領域および明るい細胞中心領域の周りの暗いリング状細胞膜を識別することを含む。細胞の形態が許容可能であると決定することは、細胞膜の外側の明るい細胞中心領域および明るいリング状領域を識別することを含む。クエリ画像は、蛍光画像または明視野画像を含む。ソフトウェアは、実行されると、クエリ画像を処理する前に、分析の事前チェック段階中に輪郭検出アルゴリズムを使用してクエリ画像内の1つ以上の大きな別個のオブジェクトを識別するようにさらに動作可能である。ソフトウェアは、実行されると、クエリ画像を処理する前に、分析の事前チェック段階中にクエリ画像が所定の暗さ閾値を下回るかどうかを決定するようにさらに動作可能である。ソフトウェアは、実行されると、クエリ画像を処理する前に、サンプリング領域のクリティカルクリッピングがクエリ画像に存在するかどうかを決定するようにさらに動作可能である。サンプリング領域は、ウェルであり、ウェルは、複数のウェル輪郭点およびウェル輪郭中心によって画定されるクエリ画像内のウェル輪郭を有する。ソフトウェアは、実行されると、フィッティング円中心およびフィッティング円半径を有するフィッティング円をクエリ画像内のウェル輪郭に適用することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である。ソフトウェアは、実行されると、フィッティング円半径から、複数のウェル輪郭点のそれぞれに対するフィッティング円中心の距離を差し引いたものを計算して、ウェル輪郭とフィッティング円との間の差を識別することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかをさらに決定するように動作可能である。ソフトウェアは、実行されると、ウェル輪郭中心から画像エッジまでの距離から、ウェル輪郭半径を差し引いたものを計算して、結果が所定の距離閾値以下であるかどうかを決定することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である。ソフトウェアは、実行されると、連続するウェル輪郭点が単一の線にあるかどうか、および単一の線の2つの端点間の距離が所定の距離閾値を満たすかまたは超えるかどうかを決定することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である。ソフトウェアは、実行されると、さらに、単一の線が0の局所曲率を有するかどうかを決定することによって、サンプリング領域のクリティカルクリッピングが存在するかどうかを決定するように動作可能である。
【図面の簡単な説明】
【0010】
図1】単一細胞画像レビューの課題を示している。
【0011】
図2】CLD画像選択の例示的な処理を示している。
【0012】
図3】例示的な単一細胞クローニングワークフローを示している。
【0013】
図4】自動単一細胞画像レビューにおける3つのタスクを示す例示的なフローチャートを示しており、タスクは、ウェル領域チェック、単一クラスタ検出および検証、ならびに形態レビューを含む。
【0014】
図5】画像ラベリングの例示的な手順を示している。
【0015】
図6A】暗すぎてウェルの輪郭を検出することができず、細胞を明確に見ることができない例示的な明視野(BF)画像を示している。
【0016】
図6B】52の99番目のパーセンタイル画素を有する暗すぎる例示的なBF画像を示している。
【0017】
図6C】63の99番目のパーセンタイル画素を有する暗すぎる例示的なBF画像を示している。
【0018】
図6D】92の99番目のパーセンタイル画素を有する例示的なBF画像を示している。
【0019】
図6E】246の99番目のパーセンタイル画素を有する例示的なBF画像を示している。
【0020】
図7A】細胞として誤って検出されることがあるデブリを有する蛍光(FL)画像の例を示している。
【0021】
図7B】ウェル輪郭の検出の誤りにつながることがあるデブリを有するBF画像の例を示している。
【0022】
図7C】デブリが検出された画像の例を示している。
【0023】
図8A】フィッティング円半径から、複数のウェル輪郭点のそれぞれに対するフィッティング円中心の距離を差し引いたものを計算する例示的なウェルに適用される第1のウェル領域チェック基準を示している。
【0024】
図8B】ウェル輪郭内の次の点までの最大距離を計算する図8Aの例示的なウェルに適用される第2のウェル領域チェック基準、および局所曲率を計算する図8Aの例示的なウェルに適用される第3のウェル領域チェック基準を示している。
【0025】
図8C】ウェル輪郭中心と画像の4つのエッジとの間の最短距離を計算する図8Aの例示的なウェルに適用される第4のウェル領域チェック基準を示している。
【0026】
図9】ウェル輪郭内の次の点までの最大距離および距離-半径の計算値に基づくクリッピング予測によるクリッピングされたウェルの例示的な画像を示している。
【0027】
図10】輪郭検出を使用してFLウェル画像からクラスタを検出する例示的な手順を示している。
【0028】
図11】ブロブ検出を使用して正しく検出された2つのクラスタの例示的な画像を示している。
【0029】
図12A】強い画素閾値を使用して、弱い信号およびクラスタ検出漏れをもたらす例示的な画像を示している。
【0030】
図12B】弱い画素閾値を使用して、強い背景信号および多くの偽陽性クラスタ検出をもたらす例示的な画像を示している。
【0031】
図12C】単一クラスタ検出を使用してデブリが細胞と間違えられた例示的な画像を示している。
【0032】
図13】細胞クラスタを識別するための例示的なクラスタ検証深層学習モデルを示している。
【0033】
図14A】グレースケールの例示的な元の拡大された細胞クラスタ画像を示している。
【0034】
図14B図14Aの細胞クラスタの3次元(3D)表面を示している。
【0035】
図15】画像処理を使用して細胞形態を決定する例示的な方法を示している。
【0036】
図16】細胞輪郭法の成功例を示している。
【0037】
図17】ウェルエッジにある細胞、焦点が合っていない画像、および暗い画像を含む画像の問題および課題の例を示している。
【0038】
図18】VGG16アーキテクチャに基づく例示的な形態深層学習モデルを示している。
【0039】
図19】単一クラスタ検出、単一クラスタ検証、および形態レビューを実行するためのコンピューティングシステムによる例示的な方法のフローチャートを示している。
【0040】
図20A】第1の畳み込み層の後のフィルタパターンの例示的な視覚化を示している。
【0041】
図20B】第2の畳み込み層の後のフィルタパターンの例示的な視覚化を示している。
【0042】
図20C】第4の畳み込み層の後のフィルタパターンの例示的な視覚化を示している。
【0043】
図21】入力画像(A)に対する例示的な出力顕著性マップ(B)を示している。
【0044】
図22】良好形態を有する細胞の例示的な活性化最大化画像(A)および不良形態を有する細胞の例示的な活性化最大化画像(B)を示している。
【0045】
図23A】ウェルエッジにある細胞に基づく予測の誤りの例を示している。
【0046】
図23B】暗い画像に基づく予測の誤りの例を示している。
【0047】
図24】コンピューティングシステムの例を示している。
【発明を実施するための形態】
【0048】
序論
現在の実施は、0日目画像とも呼ばれる、プレーティング時に撮像された画像の機器生成分析を必要とする。イメージャに関連するイメージャアルゴリズムは、1つ以上の細胞がウェル内に存在するかどうかを決定するために使用される。しかしながら、細胞形態および画像品質の変動は、一貫した画像解釈に影響を及ぼし、したがって結果の精度に影響を及ぼすことがある。図1は、0日目に撮像された、拡大された白黒BF画像の単一細胞レビュー課題の例を示している。異なる背景照明条件および反射は、暗い画像をもたらす可能性があるが、カメラの焦点面の外側の細胞は、ぼやけた画像をもたらす可能性がある。さらに、遠心分離から生じるウェルエッジに近い細胞は、見つけるのが困難であり、偽陰性につながる可能性がある。コールアウト102における図1の左上の画像に示されるように、クリッピングされ、したがって不完全な画像は、細胞漏れをもたらす可能性がある。ウェルアーチファクトの存在は、細胞の視覚化を妨げる可能性がある。細胞の様々な形態はまた、上部の第2の画像に示されるように、単一の全細胞と分裂を開始した細胞との間を解読しなければならないイメージャアナライザにとっての課題をもたらすことがある。そのような状況は、全て、誤りを引き起こす可能性がある。したがって、良好形態を有する単一細胞のみが先に進められることを保証することができる、自動CLD画像特性評価のための高速で信頼性の高い方法が必要とされている。
【0049】
臨床細胞株は、モノクローナル抗体(mAb)などの組換えタンパク質ベースの医薬品の開発のために作製されることができる。本明細書では、細胞株開発中の単一細胞クローニングを文書化するための正確且つ詳細な自動イメージングワークフローが開示される。画像特性評価は、画像のレビューを達成するために、細胞株の開発試験からの画像を異なるカテゴリに分類する手順を説明するために使用される。特定の実施形態では、本明細書に開示される細胞株開発画像特性評価方法は、機械学習アルゴリズムを使用することによって画像における欠陥検出を改善することができる。画像特性評価方法は、人工ニューラルネットワークを使用して、細胞の画像を分類することができる機械学習モデルを訓練することができる。画像特性評価方法は、転移学習を使用して、機械学習モデルの訓練に必要なサンプル数を減らすことができる。本明細書では、チャイニーズハムスター卵巣(CHO)細胞を評価する例示的な細胞株開発画像特性評価方法について論じるが、実際には、画像特性評価方法の実施は、任意の哺乳動物細胞に適用可能である。本方法は、レビューされる細胞の画像を取得し、機械学習モデルを使用して細胞の画像を分類し、良好細胞の画像を通過させながら手動検査のために不確実な欠陥を有する画像を返すことができる。
【0050】
本明細書に記載のCLD画像特性評価方法は、変換およびフィルタリングのようなデジタル画像処理技術と、機械学習および深層学習のようなパターン認識技術とを組み合わせる。本方法は、それ自体で、または一緒に、連続した順序で、または代替の順序で実施されることができる複数のステップを含む。図2に示す一実施形態では、CLD画像選択のプロセスは、特定の順序で実行される4つのステップを含む。第1のステップは、プレートウェルが欠陥を含むか、またはさらなる分析に適しているかを決定するために、0日目に取得されたプレートウェルの画像の事前チェックである。分析の事前チェック段階中に、画像が暗すぎるかどうか、および/またはウェルが明らかなデブリを含むかどうかが決定される。第2のステップでは、ウェル領域全体が画像に取り込まれているかどうか、または画像がクリッピングされているかどうかが決定される。第3のステップでは、ウェルが1つの蛍光細胞クラスタのみを含むか否かが決定される。第4のステップでは、1つのみの単一の蛍光細胞クラスタが単一細胞であるかどうか、および細胞が良好形態を有するかどうかが決定される。各ステップを実行するために必要な計算量は増加し、深層学習モデルを含む第3および第4のステップは、最も計算集約的である。このプロセスは、それぞれのウェルが単一細胞を含むという高い保証を有する良好画像の選択されたセットが得られるまで、各ステップにおいて不良画像を除外する。CLD画像特性評価の方法は、研究者によって行われる手動画像分析の第1のラウンドを置き換えることを意図している。深層学習モデルを利用してそのような自動化された細胞画像分析を実施することは、結果の一貫性を改善し、単一細胞画像分析のスループットを向上させる。
【0051】
以下のセクションでは、(1)単一細胞クローニングワークフロー、(2)単一細胞クローニングワークフローにCLD画像特性評価を適用すること、(2a)画像のイメージャ取得および分析、(3)画像の事前チェック、(3a)暗い画像、(3b)ウェル内の明らかなデブリ、(4)ウェル領域チェック、(4a)基準1:フィッティング円半径からフィッティング円中心のウェル輪郭点までの距離、(4b)基準2:ウェル輪郭の次の点までの最大距離、(4c)基準3:局所曲率、(4d)基準4:ウェル輪郭中心と画像の4つのエッジとの間の最短距離、(4e)ウェル領域チェック:例示的な画像特性評価結果、(5)単一クラスタ検出および検証、(5a)単一クラスタ検出方法1:クラスタの輪郭を見つけること、(5b)単一クラスタ検出方法2:ブロブ検出、(5c)単一クラスタ検証:深層学習モデル、(6)形態レビュー、(6a)形態レビュー:画像処理および分析、(6b)形態レビュー:深層学習モデル、(7)細胞検出および細胞形態:CNN予測性能、ならびに(8)システムおよび方法、に関するCLD画像特性評価の様々な態様について説明する。
単一細胞クローニングワークフロー
【0052】
単一細胞クローニングは、細胞株開発中の重要なステップである。図3は、単一細胞クローニングワークフローの例を示している。この例では、チャイニーズハムスター卵巣(CHO)細胞を蛍光色素を使用して染色し、限定希釈クローニングまたは単一細胞沈着を使用して細胞培養培地を含む384ウェルプレートに播種する。プレートは、1000rpmで3分間遠心分離されて、細胞をウェルの底まで下げ、次いで直ちにイメージングされる。画素あたり1ミクロンの解像度を有するNexcelom製のCeligo(登録商標)イメージャを使用して、各ウェルの全解像度明視野(BF)および蛍光(FL)画像が取得される。これらの画像は、本明細書ではクエリ画像と呼ばれる。次いで、Celigo(登録商標)イメージャアルゴリズムが使用されて、プレーティング直後または0日目にウェルに存在する蛍光単一細胞の数を計数および決定する。細胞がコンフルエントになるまで、細胞は、一定の日数、例えば14日間インキュベートされる。コンフルエンスにおいて、384個全てのウェルが、Celigo(登録商標)イメージャを使用してイメージングされる。次いで、増殖細胞によって覆われたそれらのウェル領域の割合を決定するために、Celigo(登録商標)イメージャアルゴリズムを使用してコンフルエンス画像が分析される。画像がCeligo(登録商標)イメージャアルゴリズムによって0日目に良好画像であると決定され、25%コンフルエンスを超えるクローンが、ロボットによるピッキングを使用して96ウェルプレートに播種されて、供給回分生産培養物におけるクローン選択のためのスケールアップを行う。次いで、研究は、Celigo(登録商標)イメージャによって良好であると決定された0日目の画像を手動でレビューして、それらが実際に高力価クローンの良好画像であることを確認するために、第1のラウンドの画像分析を実行する。研究者によって行われるこの第1のラウンドの手動レビューは、細胞株当たり最大192個の単一細胞画像からなり、面倒で時間がかかり、主観的なプロセスである。主題専門家(SME)によって実行される第2の手動レビューと、それに続く細胞バンキング前の上級SMEまたはグループリーダーによる第3の手動レビューとを含む、追加の手動レビューがクローニングワークフローの異なる段階で行われる。
【0053】
プレートインキュベーション後の細胞増殖データと組み合わせたプレーティング時の細胞数データが使用されて、どのクローンが自動ヒットピッキングワークセルによってピッキングされるかを決定する。単一細胞に由来するウェルのみが培養され、そのクローンについてさらにスケールアップされるため、0日目の画像分析の結果の高い信頼性が望まれる。
【0054】
このワークフローにおける任意の第1のステップとして、プレートアーチファクトの存在を捕捉するために、細胞堆積の前に細胞培養培地を含む各ウェルのベースラインBF画像が撮像されることができる。これは、追加の情報層として提供し、手動画像レビュー中のアーチファクトの減算を可能にする。クエリ画像とベースライン画像との間の区別を識別することは、プレーティング後のアーチファクトから細胞を区別するのに役立つ。
単一細胞クローニングワークフローへのCLD画像特性評価の適用
【0055】
本明細書に記載の方法は、自動CLD画像特性評価のための高速で信頼性の高い方法として提供し、図3の例示的な単一細胞クローニングワークフローにおいて研究者によって実行される手動画像分析の第1のラウンドを置き換えることを意図している。しかしながら、本方法は、その使用に限定されず、異なるサイズのプレート、細胞の種類、イメージャ、クローニング方法、画像種類などを使用するものを含む他の単一細胞クローニングワークフローに適用されることができることが理解される。さらに、クエリ画像は、任意の種類のサンプリング領域に関連付けられてもよく、または任意の種類のサンプリング領域を描写してもよく、プレートウェルに限定されない。
【0056】
記載されたCLD画像特性評価の方法は、機械学習および深層学習アルゴリズムを使用して、自動単一細胞画像レビューを達成する。画像の特性評価は、以下の3つの特定のタスクを実行するか、または3つの特定の目標を達成するために複数の技術を適用する:1)ウェル領域のチェック、2)単一クラスタの検出および検証、および3)形態のレビュー。図4は、これら3つのタスクまたは目標を示す例示的なフローチャートを示している。実行可能な限り多くのウェル領域を取り込む第1のタスクについて、本方法は、BF画像に基づいて各ウェルの領域の完全性および真円度をチェックする。輪郭検出およびハフ円検出を使用して、クリッピングを有するウェルが識別される。単一クラスタ検出および検証の第2のタスクについて、本方法は、FL画像内の蛍光クラスタの総数をチェックし、クラスタをBF画像内の細胞クラスタとして検証する。エッジ検出および深層学習を使用して、複数の細胞クラスタを有する画像が識別される。形態レビューに関する第3のタスクについて、本方法は、細胞クラスタが単一細胞であるかどうかをチェックし、BF画像内の単一細胞の形態をチェックする。エッジ検出および深層学習を使用して、細胞は、それらの評価された形態に基づいて異なるカテゴリに分類される。
【0057】
画像ラベリングの例示的な手順を図5に示す。自信のない予測は、予測された分類の確率に基づいており、低い確率は低い信頼度を意味する。ラベリング手順は、信頼度の高い順とすることができ、信頼度の低い画像が最初にラベル付けされる。後により詳細に説明するように、手順の第1のラウンドにおけるラベルは、手動で作成されてもよく、または輪郭検出アルゴリズムもしくはブロブ検出アルゴリズムなどのコンピュータバージョンの方法を使用して作成されてもよい。ラベリング手順は、研究者が全ての画像を手動でラベル付けする必要がないため、効率を向上させる。さらに、深層学習モデルは、データ拡張によって改善されることができる。データ拡張は、フリップ、ズーム、シフト、回転などを含む画像変換を使用して利用可能な画像から新たな画像を構築し、深層学習モデルの予測性能を向上させるのに役立つ。既に使用可能な段階にあるが、モデルをより成熟した段階まで訓練し続けることにより、性能が向上する。
イメージャ取得および画像の分析
【0058】
プレートが単一細胞堆積または限定希釈クローニングなどの別のクローニング方法を使用して播種され、次いで細胞をウェルの底部に持ってくるために遠心分離された後、各プレートウェルのFLおよびBF画像が撮像される。カメラは、細胞が焦点面内にあるようにウェルの底部に焦点を合わせるように設定される。イメージャは、画像スティッチングなしでウェル全体の単一画像を取得する。プレーティング時の高解像度生細胞FL画像は、短寿命蛍光色素で以前に染色された生CHO細胞または他の哺乳動物細胞の存在および位置を高い信頼性で識別する。プレーティング時の高解像度BF画像は、細胞を確実に識別するのに十分な解像度を提供する。BFイメージングでは、ウェルの上から光が照射され、ウェルの下方から画像が取得されてもよいし、ウェルの下方から光が照射され、ウェルの上方から画像が取得されてもよい。
【0059】
高解像度イメージャによって取得された画像をクエリすることは、ウェル内の1つ以上の別個のオブジェクトを取り込むことができる。別個のオブジェクトは、画像内で識別された別個のオブジェクト輪郭領域であり、単一細胞クラスタ、複数細胞クラスタ、デブリまたはアーチファクト、破損したエッジなどのウェル欠陥、またはそれらの組み合わせとすることができる。画像を取得した後、イメージャの単一細胞クローニングイメージング分析アルゴリズムの最適化が実行されて、ウェル内の細胞を識別する。Celigo(登録商標)イメージャに特有のアルゴリズムの場合、例として、自動画像分析中に25ミクロンの細胞サイズカットオフが設定されて、細胞の大きな塊を排除する。CHO細胞は、15~20ミクロンに近いサイズを有するが、細胞サイズフィルタをその範囲に設定することは、分析ソフトウェアがFL画像分析において細胞を有すると認識するウェルの数を劇的に減少させ、それによってシステムのスループットを制限する。設定にもかかわらず、35ミクロンまでの少数のダブレットおよび小さな細胞塊がソフトウェア分析フィルタを通過することが観察されている。さらに、遠心分離は、細胞をウェル底部の中心ではなくウェルエッジウェルまたはその近くに位置させることができる。これは、ウェルの最大60%で起こり得る。そのような場合、細胞は、もはやカメラの焦点面にないため、画像は、ぼやけて見え、イメージャソフトウェアが細胞を識別することを困難にする。少なくともこれらの理由のために、Celigo(登録商標)画像分析アルゴリズムによる0日目の画像分析は完全には信頼性がない。
【0060】
本明細書に記載のCLD画像特性評価の方法は、0日目の画像の手動イメージャ分析の第1のラウンドの代わりとして提供される。本方法は、選択されたパラメータを有する機械学習および深層学習アルゴリズムを利用して、細胞がウェル内で正確且つ詳細に識別されることを確実にする。それは、プレーティング時に、イメージャアルゴリズムから得られるものよりも一貫した信頼性の高い細胞数データをもたらす。したがって、本明細書に開示される方法を使用して得られた細胞数データをプレートインキュベーション後の細胞増殖データと組み合わせてどのクローンが先に進められるべきかを決定する場合、単一細胞に由来するウェルのみが培養され、そのクローンについてさらにスケールアップされるという高い信頼性がある。
【0061】
CLD画像特性評価の方法の以下の説明では、特定の機能および計算を実行するために開示される機能/アルゴリズムおよび関連するパラメータは単なる例示であり、他のライブラリの使用は、本開示の範囲内であることが理解される。さらに、画素範囲は、イメージャ、捕捉解像度、使用されるアルゴリズム、および他の要因に依存するため、それらの値は、実際には本明細書に開示されているものとは異なってもよい。
画像の事前チェック
【0062】
CLD画像特性評価方法は、0日目のBF画像の任意の事前チェックから開始することができる。このステップは、それらが欠陥を有するか、またはさらなる分析に適しているかどうかを決定するために実行される。分析の事前チェック段階中に、画像が暗すぎるかどうか、および/またはウェルが明らかなデブリを含むかどうかが決定される。
暗い画像
【0063】
BF画像は、暗さについて事前にレビューされる。閾値関数を使用して、ウェルを背景と異ならせるバイナリ変換の閾値が25画素に設定される。暗すぎるものは、ウェルの輪郭を検出する際の誤りにつながる可能性があり、これは、後にさらに説明するように、ウェルクリッピングを検出する際の誤りにつながる可能性がある。暗すぎる画像はまた、ウェル輪郭内の細胞を検出する際の誤りにつながる可能性がある。図6Aは、ウェル輪郭604を検出するには暗すぎるBF画像の例を示しており、ウェルの左側部分は背景と同じくらい暗く、ボックス602に示される細胞を識別することを不可能にする。
【0064】
暗さを事前にチェックするために、BF画像の99番目のパーセンタイル画素が基準として使用される。BF画像は暗すぎると見なされ、値が80画素よりも小さい場合に警告される。この所定の暗さ閾値を超える画像は許容可能であり、良好画像と見なされ、さらなる分析のために継続する。この暗さ閾値を下回る画像は、欠陥を含むための不良画像と見なされ、除外される。図6Bおよび図6Cは、所定の暗さ閾値を下回る、それぞれ52および63の99番目のパーセンタイル画素を有する、暗すぎるために不良と見なされるBF画像の他の例を示している。図6Dおよび図6Eの例示的なBF画像は良好であると見なされ、所定の暗さ閾値を上回る、それぞれ92および246の99番目のパーセンタイル画素を有する。
ウェル内の明らかなデブリ
【0065】
FL画像は、明らかなデブリの存在について事前にレビューされる。明らかなデブリは、所定の範囲内の大きな明確なオブジェクト輪郭領域サイズを有するウェル内の大きな明確なオブジェクトとすることができる。そのようなデブリの存在は、細胞検出の誤りにつながる可能性があるため、それらを含む画像は警告される。図7Aは、細胞として誤って検出されることがあるボックス702などのボックス内で識別されたいくつかのデブリを有するFL画像の2つの例を示している。BF画像のデブリはまた、ウェルの輪郭を検出する際の誤りにつながる可能性がある。図7Bでは、破損したウェルエッジと誤って見なされることがあるデブリ704を有するBF画像の例が示されている。
【0066】
明らかなデブリを事前にチェックするために、輪郭検出アルゴリズムが使用される。これらのアルゴリズムは、クラスタ検出に使用されるものと同様であり、後により詳細に説明する。FL画像の場合、バイナリ変換のための閾値は、閾値関数を使用して40画素に設定され、輪郭の面積、または大きな区別対象輪郭領域サイズは、5000から100万画素の間に設定される。BF画像の場合、バイナリ変換のための閾値は、70画素に設定され、輪郭の面積、または大きな区別対象輪郭領域サイズは、5000から100万画素の間に設定される。そのようなデブリがない画像は良好画像と見なされ、さらなる分析のために継続する。明らかなデブリを有する画像は、欠陥を含むために不良であると見なされ、除外される。図7Cは、デブリ706が検出された追加の例示的な画像を示しており、いくつかは、細胞を覆うことがある大きなまたは不透明なデブリを示している。
ウェル領域チェック
【0067】
細胞を識別するためのウェルの完全なレビューが行われることができることを確実にするために、ウェル領域チェックステップが実行されることができる。クリッピングされたウェルは、画像内でその一部が切り取られたウェルである。それは、カメラとウェルとの間の僅かな位置合わせの問題の結果であり得る。クリティカルクリッピングは、CHO細胞について15~20ミクロンとすることができる単一細胞の幅以上のクリッピングである。そのようなクリティカルクリッピングは、ウェルのその部分に細胞を隠す可能性があり、したがって、それらを有する画像は、欠陥を含むための不良画像と見なされる。細胞の幅よりも小さい非クリティカルクリッピングは、良好画像と見なされることができる。ウェル領域をチェックし、クリティカルクリッピングがないことを確認するために、一般にウェルと画像背景との間に良好なコントラストを有するBF画像に基づいてウェルの輪郭を検出するためのツールが使用される。ウェルと背景とを異ならせるためのバイナリ変換の閾値は、opencvパッケージのcv2.閾値関数を用いて25画素に設定される。ウェル輪郭は、オプションcv2.CHAIN_APPROX_SIMPLEを有するopencvパッケージのcv2.findContours関数を使用して検出され、ウェル輪郭を定義する点の数は、少なくとも100画素に設定され、ウェル輪郭の面積は、100万から500万画素の間に設定される。ウェル輪郭は、ハフ円変換アルゴリズム(opencvパッケージのcv2.HoughCircles関数)および以下のパラメータを使用して円、フィッティング円にフィッティングされる:メソッド=cv2.HOUGH_GRADIENT、dp=2、minDist=1500、paraml=10、param2=30、minRadius=300、maxRadius=0。フィッティング円は、半径および中心を有する。
【0068】
4つのウェル領域チェック基準または方法を利用する画像処理ツールは、ウェル領域クリッピングを検出するために実装されるが、4つの基準の任意の数および組み合わせが使用されてもよい。同じ例示的なウェルに適用されたウェルクリッピングを検出するための4つの方法を図8A図8Cに示す。ウェル領域のクリティカルクリッピングを有すると決定された画像は、不良画像と見なされる。それらのウェルは、0日目に同じまたは異なるイメージャで再イメージングされてもよく、または画像は除外されてもよく、さらなる分析のために継続しない。
基準1:フィッティング円半径-フィッティング円中心からウェル輪郭点までの距離
【0069】
この方法は、ウェルクリッピングだけでなく、他のウェル欠陥も検出することができる。第1のウェル領域チェック基準は、図8Aの左画像に示されるウェル輪郭(すなわち、「輪郭」)とそのフィッティング円(すなわち、「輪郭によってフィッティングされた円」)との間の差を検出する。差は、フィッティング円半径から、複数のウェル輪郭点のそれぞれに対するフィッティング円中心(すなわち、「円中心」)の距離を差し引いたものとして計算される。計算された差は、図8Aの右画像に示すように、ウェル輪郭の上部から始まり時計回りの方向に向かってプロットされる。計算に基づいてウェル輪郭とそのフィッティング円との間のピークまたは最大差を検出するために、python scipy.signalパッケージ(パラメータ:プロミネンス=0.7、幅=100、高さ=30)のfind_peaks関数が使用される。中央の大きなピークは、ウェルの底側のクリッピングに対応し、その後の2つの小さなピークは、それぞれ、ウェルの左側の小さなクリッピングおよびウェルの左上側の小さな破断エッジに対応する。
基準2:ウェル輪郭内の次の点までの最大距離
【0070】
第2のウェル領域チェック基準は、図8Bの左画像に示されるウェル輪郭内の直線を検出することによってウェルクリッピングを検出する。クリッピングされたエッジで起こるように、いくつかの連続するウェル輪郭点が単一の線にある場合、画像処理アルゴリズムは、エッジの2つの端点のみを記憶する。2つの連続する輪郭点間の距離が計算され、事前定義された最大距離がクリッピングの基準として使用される。所定の距離閾値は、150画素に設定され、150画素以上の連続するウェル輪郭点間の距離がクリッピングとして予測される。算出された距離が大きいほど、クリッピングが大きくなる。図では、エッジの2つの端点間に大きな距離が計算され、それによってウェルの底部側の1つの大きなクリッピングを示している。ウェルの左側の1つの小さなクリッピングも検出される。
基準3:局所曲率
【0071】
第3のウェル領域チェック基準は、直線の局所曲率を0として、基準2の線の局所曲率をチェックする。ウェル輪郭の局所曲率を計算するためにR EBImageパッケージのlocalCurvature関数が使用され、連続曲率窓の長さが101画素に設定される。これまでに説明した3つのクリッピング基準を、図8Bの右画像の円形プロットに示す。ウェルの底部および左側のクリッピング領域では、基準1(実線802)および基準2(破線804)に対して計算された対応する距離は、双方とも大きく、基準3(点線806)に対して計算された局所曲率は0である。
基準4:ウェル輪郭中心と画像の4辺の最短距離
【0072】
図8Cに示す第4のウェル領域確認基準は、ウェル輪郭中心(すなわち、「円中心」)が画像エッジに近すぎるか否かを検出する。ウェルクリッピングを検出するためのこの方法は、クリッピングが画像の4つの辺のうちの1つでのみ起こることができ、画像の辺と平行であることに基づいている。ウェル輪郭中心と画像の4辺との間の最短距離が計算される。ウェルは、ウェル輪郭中心から最も近い画像エッジまでの距離から、ウェル輪郭半径を差し引いたものとして計算される距離が、所定の距離閾値以下である場合にクリッピングされたものとして予測される。閾値は、5(すなわち、距離-半径≦5画素)に設定される。計算された距離が閾値に近いほど、クリッピングは小さくなる。
ウェル領域チェック:例示的な画像特性評価
【0073】
一例では、第2の基準および第4の基準は、ウェルクリッピングを検出するために使用される。ウェル輪郭内の次の点までの最大距離が150画素以上である場合、またはウェル輪郭中心から最も近い画像エッジまでの距離からウェル輪郭半径を差し引いたものが5画素以下である場合、ウェルは、クリッピングされたと予測される。表1は、アルゴリズムが機能し、基準がクリッピングされたウェルの良好な指標であることを示す、第2および第4の基準を使用したウェルクリッピング予測の混同行列である。390個の偽陽性は、アルゴリズムが小さなクリッピングを検出することができなかった場合であり、これは重要でないクリッピングであれば許容され可能である。2つの基準について計算された距離がそれぞれの所定の閾値距離に近い場合、報告された偽陽性の数を最小限に抑えるためにさらにレビューを行うことができる。
【表1】
【0074】
図9は、ウェル輪郭内の次の点までの最大距離(基準2)およびウェル輪郭中心からウェル輪郭半径を差し引いた最も近い画像エッジまでの距離(基準4、すなわち距離-半径)の計算値に基づくクリッピング予測を有するクリッピングされたウェルの例を示している。左下の画像では、クリッピングの正確な予測が行われた。クリッピングのサイズが小さいため、これは、ボックス902内の細胞などの細胞を隠すのに十分な大きさではない非クリティカルクリッピングと見なされることができる。最も右の画像では、ウェルの輪郭が正確な円ではないため、誤った予測が行われた可能性がある。
単一クラスタの検出および検証
【0075】
高解像度イメージャによって取得された画像は、ウェル内の1つ以上の別個のオブジェクトを取り込むことができる。別個のオブジェクトは、単一細胞クラスタ、マルチ細胞クラスタ、デブリもしくはアーチファクト、破損したエッジなどのウェル欠陥、またはそれらの組み合わせとすることができる。CLD画像特性評価の開示された方法は、特定の特性を有する別個のオブジェクトであるクラスタを他の種類の別個のオブジェクトから区別するために使用されることができる。単一クラスタ検証の第2のタスクまたは目的のために、本方法は、FL画像内の蛍光クラスタの総数をチェックし、クラスタをBF画像内の細胞クラスタとして検証する。エッジ検出および深層学習を使用して、複数の細胞クラスタを有する画像が識別される。1つの細胞クラスタのみが検出された画像は良好画像と見なされ、さらなる分析のために継続する。細胞クラスタがない画像または複数の細胞クラスタがある画像は、欠陥を含むために不良画像と見なされ、除外される。
単一クラスタ検出方法1:クラスタの輪郭を見つける
【0076】
図10は、単一クラスタ検出モデルを使用してFLウェル画像中の蛍光クラスタを検出する例示的な手順を示している。そのような手順では、ウェル内の関心点を識別するためにソフトウェア分析フィルタおよび輪郭検出アルゴリズムが使用される。第1および第2のステップは、グレースケール(オプション0のcv2.imread関数)でFL画像を読み出し、それをバイナリの白黒画像(オプションcv2.THRESH_BINARY_INV、閾値=30画素のcv2.threshold)に変換することを含む。第3のステップは、画像内の黒い領域(cv2.CHAIN_APPROX_TC89_KCOSオプションのcv2.findContours関数)として示される明確なオブジェクト輪郭領域を見つけ、それらの周りに輪郭を追加する。第4のステップでは、次に、個別オブジェクト輪郭領域は、それらの面積および点の数に基づいてフィルタリングされる。図10の例では、区別対象輪郭領域サイズは、50から3000画素の所定の範囲に設定され、区別対象輪郭領域内の所定の点の数は、少なくとも10画素に設定される。第5のステップでは、cv2.rectangle関数および輪郭の各辺上の10画素の拡張を使用して、前のステップのサイズおよびポイント基準を満たす選択された別個のオブジェクト輪郭領域の周りに境界ボックスが描画または追加される。この選択された個別オブジェクト輪郭領域はクラスタである。クラスタとして、この別個のオブジェクト輪郭領域は、50から3000画素の所定の範囲内のクラスタ輪郭領域サイズを有し、10画素の所定数の点を少なくとも有するクラスタ輪郭領域と見なされる。
【0077】
前述のように、同様の輪郭検出アルゴリズムが、大きな別個のオブジェクトである明らかなデブリの存在についての画像の事前チェックに使用される。その用途では、パラメータは、5000から100万画素の間に設定された所定の大きな別個のオブジェクト輪郭領域サイズ範囲を含む。したがって、明らかなデブリを識別するための所定の大きな明確なオブジェクト輪郭領域サイズ範囲は、クラスタを識別するための所定の明確なオブジェクト輪郭領域サイズ範囲よりも大きい。
単一クラスタ検出方法2:ブロブ検出
【0078】
輪郭検出に対する代替の単一クラスタ検出モデルは、ブロブ検出である。候補クラスタは、ブロブ検出アルゴリズム(opencvパッケージからのcv2.SimpleBlobDetector_Params,cv2.SimpleBlobDetector_create,cv2.検出関数)を使用してFL画像において見出される。画像は、30に設定された画素閾値を有するバイナリ画像になる。フィルタリングパラメータは、少なくとも10画素に設定された個別オブジェクト輪郭領域内の所定数の点、および2052×2052スケールで50から3000画素の間の所定の範囲に設定された個別オブジェクト輪郭領域サイズを含む。前のステップ(cv2.rectangle関数)のサイズおよび点の基準を満たす選択された個別オブジェクト輪郭領域の周りにボックスが追加され、輪郭の各側に10画素が拡張される。これらの選択された個別オブジェクト輪郭領域はクラスタである。
【0079】
一般に、ここで説明した輪郭検出およびブロブ検出の単一クラスタ検出モデルは、クラスタの検出において同様の性能を有する。図11は、ブロブ検出を使用して正しく検出された、各ボックス1102および1104内の一方のクラスタである、2つのクラスタの例示的な画像を示している。しかしながら、説明した単一クラスタ検出方法に関連するいくつかの課題がある。そのような課題の1つは、閾値に基づく。強い画素閾値を使用すると、ウェル内の全てのクラスタを検出するには信号が弱くなりすぎ、偽陰性につながる可能性がある。弱い信号による細胞漏れを図12Aに示す。同様に、20または25画素などの弱い画素閾値は、背景信号が強すぎ、偽陽性クラスタ検出が多くなる可能性がある。図12Bのいくつかのボックス1202において識別される偽陽性は、デブリまたはプレートアーチファクトとすることができる。閾値に基づく誤りは、暗い画像または焦点が合っていない画像など、品質が良くない画像において増幅される。
単一クラスタ検証:深層学習モデル
【0080】
クラスタ検出は、クラスタの数を計数し、ウェル内のそれらの位置を識別するために使用される。しかしながら、クラスタ検出は、クラスタ自体について提供する情報において制限される。0日目にウェル内に1つのみの細胞が存在することを確実にすることが単一細胞クローニングの主な目的であるため、ウェル内で検出されたクラスタが少なくとも1つの細胞を含むかどうかを知ることは有益であろう。単一クラスタ検出後の単一クラスタ検証の実施は、その目標を達成するためのステップである。単一クラスタ検出では、サンプリング領域(例えば、ウェル)内のクラスタを描写するクエリ画像、特にFL画像の1つ以上の位置および/または領域は、単一クラスタ検出モデルを使用してクエリ撮像を処理することによって識別される。各クラスタの位置は、単一クラスタ検出モデルによって、画像内の座標(例えば、x/y画素位置)、境界ボックス位置(例えば、ここでも、x/y画素境界によって)、クラスタを含む輪郭領域、または画像の別の同様の部分(全体を通してクエリ画像の領域とも呼ばれる)として返されることができる。図10の最後のステップとして示されているように、単一クラスタ検証は、単一クラスタ検出を使用して識別されたBF画像の対応する位置内の少なくとも1つの細胞の存在を確認し、それによってクラスタが少なくとも1つの細胞を含むことを保証する。換言すれば、単一クラスタ検証は、クラスタが細胞クラスタであることを確認する。識別された画像の領域がない画像は、不良画像と見なされ、除外される。
【0081】
別の言い方をすれば、単一クラスタ検証は、単一クラスタ検出を強化する。それは、クラスタ検証深層学習モデルを使用して、ウェル内のデブリなどの非細胞クラスタから細胞クラスタを区別する。単一クラスタ検証の実施は、プレートアーチファクトおよびデブリが細胞として、またはプレートアーチファクトおよびデブリとしての細胞として誤って解釈されることにより、クローンが廃棄されるかまたは先に進められることを防止することができる。次いで、サンプリング領域内のクラスタを描写するものとして単一クラスタ検出モデルによって識別されたクエリ画像の1つ以上の領域は、描写された各クラスタが細胞クラスタであるかどうかを決定するためにクラスタ検証深層学習モデルによって処理される。クラスタ検証深層学習モデルの出力は、良好画像または不良画像のいずれかとしてのクエリ画像のバイナリ分類である。
【0082】
クラスタ検証深層学習モデルが、領域の正確に1つが細胞クラスタであるクラスタを描写していると決定した場合、画像は、良好画像として分類され、したがって、サンプリング領域は、1つの細胞クラスタのみを含む。クラスタ検証深層学習モデルが、領域のいずれも、細胞クラスタであるクラスタを描写していないと決定した場合、または複数の領域が、細胞クラスタであるクラスタを描写していると決定した場合、画像は、不良画像として分類され、したがって、サンプリング領域は、それぞれ、細胞クラスタを含まないか、または複数の細胞クラスタを含む。実際には、一般に、単一クラスタ検出を使用して識別されたクラスタのうち、約80%は実際の細胞クラスタであり、残りは細胞クラスタではない。例えば、デブリが単一クラスタ検出においてクラスタに必要な同じサイズおよびポイント基準を満たす場合、デブリは、クラスタとして識別されることができる。これは、ボックス1204の図12Cの例示的な画像に示されている。単一クラスタ検出に続く単一クラスタ検証の使用は、クラスタ内に細胞が存在しないこと、およびクラスタが細胞クラスタではなくデブリであることを検証する。単一のクラスタが細胞を含まないことを考えると、ウェルは、細胞を含まないと結論付けられる。したがって、画像は、欠陥を含む不良画像と見なされ、それ以上の分析は実行されずに除外される。
【0083】
クラスタ検証深層学習モデルの例を図13に示す。このモデルへの入力は、FL画像の領域およびBF画像の領域の一方または双方であり、モデルからの出力は、細胞クラスタおよびウェル内のそれらの位置の識別である。追加的または代替的に、モデルは、分析された領域を含む画像全体が良好画像であるか不良画像であるかのバイナリ決定を返すことができる。1つの具体的な実施態様では、画像の領域内の細胞クラスタを識別することは、候補細胞クラスタの信頼スコアを計算することと、候補細胞クラスタについて、信頼スコアと所定の閾値スコアとの比較に基づいて細胞クラスタ指示を決定することと、を含み、細胞クラスタ指示は、少なくとも1つの細胞を含む画像のクラスタ輪郭部分とすることができる。1つの例示的な実施形態では、深層学習モデルのアーキテクチャは、VGG16 CNNモデルであるが、他のニューラルネットワークモデルアーキテクチャも使用されてもよい。
【0084】
モデル訓練のために、高い閾値を使用する検出されたクラスタのFLおよびBF画像(またはその領域)が組み合わされて使用され、細胞クラスタ(すなわち、細胞を有することについて陽性のクラスタ)がどのように見えるかモデルを訓練する。図13の例では、ブロブ検出を使用してボックス1302の上位の強閾値FL画像において識別された細胞クラスタが1つあり、これは下位の強閾値BF画像の対応する位置で検証される。さらに、ランダムに選択された画像のFLおよびBF画像が組み合わされて使用され、非細胞クラスタ(すなわち、デブリなどの細胞を有することに対して負のクラスタ)がどのように見えるかをモデルに訓練する。この例では、細胞クラスタが存在しないウェルの他の領域のランダムな選択が、アルゴリズムが細胞クラスタと非細胞クラスタとの間の相違を理解するのを助けるために使用される。そのような訓練は、信頼スコアの計算および混同行列に役立つため、より正確になることができる。深層学習モデルは、フリップ、ズーム、シフト、回転などを含む画像変換を使用して利用可能な画像から新たな画像を構築するためのデータ拡張によって改善され、深層学習モデルの予測性能を向上させるのに役立つ。また、多数のクラスタを含むように弱閾値を使用して検出されたクラスタのFLおよびBF画像も深層学習モデルに供給され、各候補クラスタに予測が与えられる。この例示的なクラスタ検証深層学習モデルは、検証データに対して99.3%の精度を有する。
【0085】
単一クラスタ検証のための本明細書に記載の深層学習モデルは、各候補クラスタに与える予測に応じて画像が良いか悪いかを決定する。細胞を有する可能性が高い候補クラスタが画像内に2つ以上ある場合、または画像内にない場合、画像は不良であると見なされる。それは除外され、さらなる分析には進まない。1つの候補クラスタのみが細胞を有する可能性が高い場合、画像は良好であると見なされ、形態レビューに進む。
【0086】
前の段落で紹介したように、転移学習および画像拡張は、クラスタ検証深層学習モデルの性能を向上させるために使用される。転移学習とは、ベースまたは補助CNNを補助データセットおよびタスク上で訓練し、それによって特定のパラメータを開発し、その後、標的データセットおよびタスクを利用してそれらのパラメータをさらに改良することを指す。転移学習は、ImageNetまたは他のカスタムデータセットを用いて同じモデルアーキテクチャ上で実行される。本明細書に開示されるCLD特性評価方法におけるクラスタ検証のために、複数の第1の標的訓練サンプルがアクセスされ、第1の標的訓練サンプルは、サンプリング領域に関連付けられた複数の第1の標的訓練画像と、複数の第1の標的訓練画像にそれぞれ関連付けられた複数の細胞クラスタ指示とを含む。複数の第1の補助訓練サンプルは、第1の標的訓練サンプルに基づいて選択され、第1の補助訓練サンプルは、複数の第1の補助訓練画像と、複数の第1の補助訓練画像にそれぞれ関連付けられた複数の第1のコンテンツカテゴリとを含む。次いで、クラスタ検証深層学習モデルは、複数の第1の補助訓練サンプルに基づいて第1の補助機械学習モデルを訓練し、訓練された第1の補助機械学習モデルおよび複数の細胞クラスタ指示に基づいてクラスタ検証深層学習モデルを訓練することによって訓練される。複数の第1の補助訓練画像と関連付けられた複数の第1のコンテンツカテゴリは、複数の第1の標的訓練画像と関連付けられた複数の細胞クラスタ指示と一致しない。
形態レビュー
【0087】
ウェルが、ウェル領域チェックによってクリティカルクリッピングを有していないと決定され、単一クラスタ検証によって1つの細胞クラスタのみを含むと決定されると、画像は形態レビューを続ける。形態レビューでは、画像処理および分析または深層学習モデルを使用して、細胞クラスタ内の細胞の数および細胞形態の受容性を決定する。
形態レビュー:画像処理および分析
【0088】
細胞クラスタとして検証されたクラスタは、例えば、単一の細胞、複数の重複する細胞、または既に分裂を開始した細胞を含むことができる。後者の2つの例では、それらのクローンは、進められないであろう。形態レビューにより、目標は、良好形態を有する単一細胞を含む細胞クラスタを識別することである。細胞形態をレビューする方法は、画像において、細胞が明るい中心および暗い細胞膜境界を有するという観察に基づいている。図14Aは、クラスタ検出中に境界ボックスが周囲に追加された細胞クラスタの例を示している。細胞クラスタが拡大されて、形態レビューのための元のグレースケール画像として提供する。図14Bは、図14Aの細胞クラスタの3D表面を示し、細胞中心を丘として示し、細胞膜を周囲の谷として示している。本明細書に記載の形態をレビューする方法は、細胞の輪郭を検出および構築し、次いで、それに基づいて細胞の数(例えば、検出された輪郭の数)および細胞形態(例えば、細胞の真円度)を予測する。
【0089】
図15は、9つのステップを含み、複数の画像処理技術を使用して細胞形態を決定する例示的な方法を示している。説明されている手順は単なる例示である。細胞形態をレビューするための多くの他の画像処理技術が使用されるlことができることが理解される。追加のもしくはより少ないステップ、または代替の順序で実行されるステップを有する手順は、本開示の範囲内である。
【0090】
ステップ1:ウェルエッジを除去する。第1のステップでは、FL画像(右上の画像)において細胞を含む明領域が識別され、BF画像(左上の画像)におけるこの領域の対応する位置がBF画像(下の画像)における中央値に置き換えられる。これは、BF画像内のウェルエッジおよび黒背景を十分に除去して、さらなる分析中にそれらから生じ得る外乱を除去することができる。
【0091】
ステップ2:画像を強化する。第2のステップでは、Bスプライン補間(比率20のcv2.resize関数)を使用して画像点が強化される。
【0092】
ステップ3:コントラストを増加する。第3のステップでは、画像内の細胞の境界をより明確にするために、BF画像のコントラストが増加される(cv2.equalizeHist関数を使用したヒストグラム等化)。
【0093】
ステップ4:画像を逆バイナリにする。第4のステップでは、閾値を40画素に設定したcv2.threshold閾値関数とcv2.THRESH_BINARY_INVオプションを使用して、閾値毎の逆バイナリ画像(黒から白、白から黒)にする。
【0094】
ステップ5:画像の白い部分に輪郭を追加する。第5のステップでは、少なくとも10画素に設定された輪郭の点の数および50から3000画素の間に設定された細胞領域によってcv2.findContours関数を使用して、画像の白い部分に輪郭または凸包が追加される。凸包は、cv2.convexHull関数を使用して構築された。
【0095】
ステップ6:画像の白い部分に焦点を合わせる。第6のステップでは、0よりも大きいグレースケールの領域を除去し、前のステップからの画像の白色部分に対応する画像にのみ焦点を合わせる。
【0096】
ステップ7:画像をバイナリにする。第7のステップでは、0.8画素(BF画像上の画素の99番目のパーセンタイル)を閾値として、前画像がバイナリ画像にされる。
【0097】
ステップ8:輪郭を追加し、面積によってフィルタリングする。第8のステップでは、輪郭は、cv2.findContours関数を使用して前画像に追加され、50から3000画素の間で設定された面積によってフィルタリングされる。
【0098】
ステップ9:3D輪郭を用いた形態分析。第9のステップでは、輪郭を有する3D表面を示す画像の分析が実行される。
【0099】
この例では、細胞クラスタは、最終的な3D画像において、それぞれが谷に囲まれた2つの別個の丘を有するものとして示されている。細胞クラスタ内の細胞の数は検出された輪郭の数に基づくため、この細胞クラスタ内に2つの細胞があると決定される。そして、細胞形態は輪郭の真円度に基づくため、この細胞クラスタは、不良形態を有すると決定される。細胞クラスタは、単一の細胞クラスタではなく、むしろマルチ細胞クラスタであると決定されるため、画像は、欠陥を含むために不良であると見なされ、除外される。細胞クラスタが1つの細胞のみを含み、実際に良好形態を有する単一の細胞クラスタであると決定された場合、画像は、良好であると見なされる。その良好画像に基づいて、0日目にそのそれぞれのウェルに1つの細胞しかないと結論付けることができる。
【0100】
図16は、細胞輪郭法の成功例を示している。説明した画像処理技術および分析を使用して、リング1602によって示されるように、十分な真円度を有する単一の輪郭が各画像内で識別される。したがって、細胞クラスタは、細胞が良好形態を有する単一細胞クラスタであると正しく決定される。本方法は、画像が良好な品質であり、十分に明るく、焦点が合っている場合にうまく機能する。
形態レビュー:深層学習モデル
【0101】
前のセクションで説明した画像処理技術の代替として、深層学習モデルが使用されて細胞形態を予測することができる。深層学習モデルは、手動の人間によるレビューと比較してより多くの画像の一貫した結果を提供することができるために有利である。暗さやぼやけなどの画質の問題を含む、画像で発生する可能性がある問題をより良好に処理することができる。また、プレート遠心分離に起因する細胞パターンの不一致および細胞がウェルエッジに近いことに関連する課題を有する画像をより良好に分析することができる。図17は、これらの問題や課題を有する画像の例を示している。
【0102】
1つの細胞クラスタのみを含むものとしてクラスタ検証深層学習モデルから良好であると見なされる画像は、形態レビューに続く。細胞クラスタを描写するクエリ画像の1つのみの領域について、CLD画像特性評価方法は、1)細胞クラスタがクラスタ内に正確に1つまたは代替的に2つ以上の細胞を有するかどうか、および同時に2)1つのみの細胞クラスタ内に1つのみの細胞が存在する場合、細胞の形態が許容可能である(すなわち、細胞は良好形態を有する)かどうかを決定するために形態深層学習モデルによって領域を処理することをさらに含む。
【0103】
特定の実施形態では、形態深層学習モデルの出力は、クエリ画像をそれぞれの信頼度で3つのカテゴリのうちの1つに分類することである。カテゴリは、分析には暗すぎる、良好画像、および不良画像とすることができる。モデルは、これら3つのラベルのうちの1ついよって画像を供給することによって訓練される。形態深層学習アルゴリズムは、入力画像に対するこれら3つのカテゴリの確率を計算し、最も高い確率を有するカテゴリを選択する。
【0104】
前述したように、0日目画像の事前チェックは、画像がさらなる分析のために暗すぎるか否かの決定を含む。分析のこの初期チェック前段階中にローパスフィルタを使用して、非常に暗く、所定の暗さ閾値を下回る画像が、形態深層学習モデルによる分析の前のある時点で既に識別され、除外される。したがって、形態深層学習モデルは、画像暗さ分析の別の層を提供する。事前チェック段階を通過するが、依然として暗く、ぼやけなどの追加の問題を有する暗い画像は、さらなる分析には適していない可能性がある。アルゴリズムがそれらの中の細胞クラスタまたは細胞クラスタ内の任意の細胞の存在を正しく識別することができない可能性があるため、暗い画像および焦点の合っていない画像の双方が識別され、欠陥を含むために除外される。分析のために暗すぎることはまた、基本的な明るさ基準を満たす画像のみがワークフロー内で継続することを保証するのを助けるために、深層学習器の出力の1つとして訓練するためのカテゴリラベルとして使用されることができる。
【0105】
画像は、1)1つのみの細胞クラスタ内に識別された単一細胞のみが存在する可能性が高いこと、および2)単一細胞が良好形態を有する可能性が高いことの双方がある場合、形態深層学習モデルによって良好画像として分類される。単一の細胞さえも識別されず、代わりにクラスタが実際には細胞クラスタではなく、例えばデブリである可能性が高い場合、画像は、不良画像として分類される。画像はまた、1つのみの細胞クラスタ内で複数の細胞が識別される/唯一の細胞クラスタを構成する可能性が高い場合、または単一の細胞が細胞クラスタ内で識別されるが、単一の細胞が不良形態を有する可能性が高い場合、形態深層学習モデルによって不良画像として分類される。
【0106】
次いで、クラスタ検証および形態深層学習器を使用した0日目の画像分析の結果は、手動の人間によるレビューを介したさらなる分析のために、コンピュータによってまたはコンピュータ間で記憶および/または送信される。手動の人間によるレビューは、目視検査および関連するイメージャソフトウェアを使用して実行されることができ、その結果、手動のレビュー者は、単一細胞クローニングワークフローにおいてどのクローンを先に進めるべきかに関する最終決定を行うことができる。次いで、選択されたクローンがロボットで採取され、そのクローンを培養し、さらにスケールアップするために、96ウェルプレートまたは他のサイズのプレートに播種される。
【0107】
代替の実施形態では、形態深層学習モデルの出力は、それぞれの信頼性レベルを有する5つのカテゴリのうちの1つへのクエリ画像の分類である。カテゴリは、分析には暗すぎる、良好画像、懸念を伴う良好画像、不良画像、およびメリットを伴う不良画像とすることができる。そのような実施形態では、モデルは、これら5つのラベルのうちの1つを有する画像を供給することによって訓練される。形態深層学習アルゴリズムは、入力画像に対するこれら5つのカテゴリの確率を計算し、最も高い確率を有するカテゴリを選択する。分析には暗すぎると分類された画像、不良画像、およびメリットを伴う不良画像は除外され、さらなる分析のために継続しない。前述の3つのカテゴリの実施形態と比較して、これらの追加の中間層を含むことは、ヒットピッキングステップ中に研究者に選択肢を与える。単一細胞クローニングワークフローの次の段階(すなわち、コンフルエンスイメージングから得られた分析と組み合わせて、培養するクローンを識別すること)に進むために形態深層学習器によって良好画像として分類された十分な画像がない場合、研究者は、懸念を伴う良好画像として分類された画像を手動でレビューし、実際に良好画像である画像を識別することができる。
【0108】
記載された3つのカテゴリまたは5つのカテゴリは単なる例示であり、画像のカテゴリ化における他のラベルおよびラベルの数の使用は、本開示の範囲内であることが理解される。以下の例示的なデータセットでは、ラベルおよび関連する出力カテゴリは、細胞の検出および細胞形態に関してより記述的である。
例示的なデータセット
【0109】
1つの例示的画像データセットでは、それぞれ384個のウェルを有する309個のプレートが、利用可能な合計118,656個のウェルをもたらした。良好な種々の条件の0日目のBFおよびFL画像を含めた。画像の約2%、または4000を超える画像は、良好細胞、良好細胞であるが確実ではない、不良細胞または>1個の細胞、不良細胞であるが確実ではない、何もない(または細胞なし)、デブリの6つのカテゴリのうちの1つに属するとして手動でラベル付けされた。これらのラベルは、予備的な深層学習モデルを構築するためにアルゴリズムに提供され、その後、画像の残りの98%にラベルを付けるために使用された。
【0110】
図18は、一実施形態にかかる、形態深層学習モデルに使用することができるVGG16アーキテクチャに基づく例示的な深層学習モデルを示している。この例では、13個の畳み込み層と3個の全結合層があるが、使用されるモデルは、任意の数の層を有するように構築されてもよい。cov1層への入力は、固定サイズの224×224RGB画像である。画像は、畳み込み(conv.)層のスタックを通過し、フィルタは、以下の非常に小さな受容野で使用される:3×3(これは、左/右、上/下、中央の概念を捕捉するための最小サイズである)。構成の1つでは、1×1の畳み込みフィルタも利用し、これは入力チャネルの線形変換(続いて非線形性)と見なすことができる。畳み込みストライドは、1画素に固定されており、conv.層入力の空間パディングは、畳み込み後に空間分解能が保存されるようなものであり、すなわち、パディングは、3×3のconv.層に対して1画素である。空間プーリングは、凸層のいくつかに続く5つの最大プーリング層(全ての凸層の後に最大プーリングが続くわけではない)によって行われる。最大プーリングは、ストライド2で2×2の画素窓にわたって実行される。3つの全結合(FC)層が畳み込み層のスタックに続き、最初の2つは、それぞれ4096チャネルを有し、3番目は、1000クラスの分類を実行し、したがって1000チャネル(各クラスに1つ)を含む。最終層は、ソフトマックス層である。全結合層の構成は、全てのネットワークにおいて同じである。全ての隠れ層は、調整(ReLU)非線形性を備えている。他の既知のCNNアーキテクチャは、同じ目的のために再チューニングおよび使用されてもよく、本開示の範囲内であることが理解される。
【0111】
上記で導入された例示的な深層学習モデルの1つの例示的な実施形態では、1万個の候補が以下の6つのレベルによってラベリングされた:良好細胞、良好細胞であるが確実ではない、不良細胞または>1個の細胞、不良細胞であるが確実ではない、何もない(または細胞なし)、デブリ。形態がモデルによって確実でないと考えられる場合、それらの画像の手動レビューが行われた。手動ラベリングに加えて、単一クラスタ検出(すなわち、クラスタの輪郭およびブロブ検出を見つける)および細胞形態について記載された画像処理分析結果もまた、初期ラベリングを行うために使用された。BFおよびFL画像の双方がグレースケールで読み出され、cv2.resize関数を使用して64*64*1にサイズ変更され、cv2.merge関数を使用して64*64*2のサイズを有する1つの画像にマージされ、深層学習モデルの入力画像として使用された。データの10%が検証セットとしてランダムに選択され、残りの90%が訓練セットとして選択された。
【0112】
転移学習および画像拡張は、モデルの性能を高めるために使用される。前述したように、転移学習とは、ベースまたは補助CNNを補助データセットおよびタスク上で訓練し、それによって特定のパラメータを開発し、その後、標的データセットおよびタスクを利用してそれらのパラメータをさらに改良することを指す。転移学習は、ImageNetまたは他のカスタムデータセットを用いて同じモデルアーキテクチャ上で実行される。この手順は、著しく大きな補助データセットを使用することによって、過剰適合なしに標的データセット上で大きなCNNを訓練することを可能にすることが実証されている。さらに、従来の研究では、補助データセットと対象データセットとが非常に異なる場合であっても、(ランダムな初期化と比較して)転移学習によってモデル汎化能力が大幅に向上することが報告されている。
【0113】
本明細書に開示されるCLD特性評価方法における形態レビューのために、複数の第2の標的訓練サンプルがアクセスされ、第2の標的訓練サンプルは、サンプリング領域に関連する複数の第2の標的訓練画像と、複数の細胞指示と、複数の第2の標的訓練画像にそれぞれ関連する複数の細胞形態指示とを含む。複数の第2の補助訓練サンプルは、第2の標的訓練サンプルに基づいて選択され、第2の補助訓練サンプルは、複数の第2の補助訓練画像と、複数の第2の補助訓練画像にそれぞれ関連付けられた複数の第2のコンテンツカテゴリとを含む。次いで、形態深層学習モデルは、複数の第2の補助訓練サンプルに基づいて第2の補助機械学習モデルを訓練し、訓練された第2の補助機械学習モデル、複数の細胞指示、および複数の細胞形態指示に基づいて形態深層学習モデルを訓練することによって訓練される。複数の第2の補助訓練画像と関連付けられた複数の第2のコンテンツカテゴリは、複数の第2の標的訓練画像と関連付けられた複数の細胞指示および複数の細胞形態指示と一致しない。
【0114】
図19は、最終的に許容可能な形態を有する単一細胞を含むサンプリング領域を識別するために、単一クラスタ検出、単一クラスタ検証、および形態レビューを実行するコンピューティングシステム1900による例示的な方法のフローチャートを示している。方法1900は、サンプリング領域を描写するクエリ画像を受信すること1902を含む。単一クラスタ検出の場合、クエリ画像は、単一クラスタ検出モデルを使用して処理し1904、サンプリング領域内のクラスタを描写するクエリ画像の1つ以上の領域を識別する1906。単一クラスタ検証の場合、方法1900は、クラスタ検証深層学習モデルを使用して1つ以上の領域を処理して、描写された各クラスタが細胞クラスタであるかどうかを決定すること1908と、識別された1つ以上の領域のうちの正確に1つが細胞クラスタであるクラスタを描写していると決定すること1910とを含む。形態レビューのために、形態深層学習モデルを使用して、細胞クラスタを描写する領域を処理し1912、細胞クラスタ内に1つのみの細胞があることを決定し1914、細胞の形態が許容可能であることを決定する1916。許容可能な形態を有する単一細胞を有するサンプリング領域を描写するクエリ画像は、良好画像と見なされる1918。
【0115】
図19はまた、画像が欠陥を含むために不良画像として除外されることができる方法1900の点を示している。単一クラスタ検出の場合、単一クラスタ検出モデルによってクラスタが識別されない場合、その画像は、不良画像と見なされる1920。単一クラスタ検証の場合、クラスタ検証深層学習モデルによって、識別された1つ以上の領域のうちのいずれの領域も、細胞クラスタであるクラスタを描写していないと決定された場合、または識別された1つ以上の領域のうちの2つ以上の領域が、細胞クラスタであるクラスタを描写していると決定された場合、その画像は、不良画像と見なされる1922。形態レビューのために、形態深層学習モデルによって、唯一の細胞クラスタ内に細胞がないかまたは複数の細胞があると決定された場合、画像は、不良画像と見なされる1924。細胞クラスタ内に1つのみの細胞が存在すると決定されたが、細胞の形態が許容可能ではないと決定された場合、画像は、不良画像と見なされる1926。
【0116】
図20Aから図22は、画像特性評価ツールが動作しているときにCNNが見るものを示している。
【0117】
中間活性化の可視化。図20A図20Cは、元の入力画像がフィルタの各層を通過した後にどのようになるかを示している。いくつかのフィルタは、細胞のパターン、特に細胞膜のリング形状の谷に非常に敏感である。以下の実施例では、図は、kerasパッケージのmodels.Model関数を使用して構築された。各図の左側は、元の生の入力画像であり、右側は、畳み込みフィルタを通過した後の画像であり、画像は手動で選択された。右側の画像は、その画像のフィルタの出力として、形態深層学習アルゴリズムをトリガして、画像が良好であるかまたは不良であるかを決定する。一例では、細胞の明るい中心部分が関心点として提供されるため、形態深層学習アルゴリズムが画像を評価するとき、それは中心部分を識別し、それを真円度について評価する。これは、1つの層に対して実行されてもよく、他の層は画像の異なる態様を見てもよい。図20Aは、第1の畳み込み層の後のフィルタパターンの例示的な視覚化を示している。図20Bは、第2の畳み込み層の後のフィルタパターンの例示的な視覚化を示している。図20Cは、第4の畳み込み層の後のフィルタパターンの例示的な視覚化を示している。
【0118】
顕著性の視覚化。顕著性マップは、画像のどの部分が形態深層学習モデルの予測に重要であるかを示す。以下の例において顕著性マップを構築するために、vis.visualizationパッケージからのvisualize_saliency関数が「ガイド付き」オプションとともに使用した。図21は、画像の最も重要な部分が細胞中心、特に細胞膜に近い領域、および細胞膜の外側のリング形状領域である、例示的な顕著性マップを示している。より具体的には、左側は、良好形態を有する細胞を示す元の生の入力画像(A)である。右側は、顕著性関数による処理後の入力画像であり、入力画像(A)の出力顕著性マップ(B)の例として表されている。この例では、顕著性マップ(B)は、膜の外側に明るい中心および明るいリングを有する細胞を示している。したがって、細胞は、良好形態を有するものとして形態深層学習モデルによって予測される可能性が高い。
【0119】
活性化最大化。活性化最大化は、フィルタ出力活性化を最大化する入力画像を構築または生成する。以下の例では、vis.visualizationパッケージからのvisual_activation関数が使用されて、活性化最大化画像を構築した。図22は、活性化関数が細胞の出力ノードの活性化を最大化した例示的な活性化最大化画像を示している。左側の活性化最大化画像は、良好形態を有する細胞のものである(A)。特定のニューロンを最大化することにより、明るい中心およびその周りの暗いリング状領域などの良好細胞の何らかのパターンが、画像の中央右部分において検出されることができる。右側の活性化最大化画像は、不良形態を有する細胞のものである(B)。
細胞検出および細胞形態:CNN予測性能
【0120】
上述した形態深層学習モデルの例示的な実施形態では、約12,000個のボックスで囲まれたFLおよびBF画像が手動で6つのレベルによってラベリングされ、ウェル画像からランダムに選択された別の約8,000個のボックスで囲まれた画像が「なし」とラベリングされた。約2,000の検証データ上の形態モデルの全体的な正しい分類率は87%であり、細胞(細胞対非細胞)を検出するためのものは99.8%であり、4つのレベルの細胞形態のものは89%である。
【表2】
【0121】
細胞形態については正しい分類率が高いが、特定の課題に基づいて予測誤りが依然として発生する可能性がある。図23Aは、ウェルエッジにある細胞に基づく予測の誤りの例を示している。図23Bは、暗い画像に基づく予測の誤りの例を示している。追加のデータを用いてより成熟した段階まで形態深層学習モデルを訓練し続けることにより、予測性能が向上することが期待される。
【0122】
前述のように、高解像度の0日目プレート画像の適切な分析は、細胞株の開発において重要である。深層学習モデルを利用する本明細書に記載のCLD画像特性評価方法の実施は、より適格なクローンを進めることを可能にするより効率的なワークフローをもたらす。それは、単一細胞画像分析の一貫性を高め、クローン選択および手動レビュープロセスの時間および労力を減らし、このワークフローから誘導された細胞株がクローン由来であるという極めて高い保証を与える。
システムおよび方法
【0123】
図24は、例示的なコンピュータシステム2400を示している。特定の実施形態では、1つ以上のコンピュータシステム2400は、本明細書に記載または図示された1つ以上の方法の1つ以上のステップを実行する。特定の実施形態では、1つ以上のコンピュータシステム2400は、本明細書に記載または図示された機能を提供する。特定の実施形態では、1つ以上のコンピュータシステム2400上で実行されるソフトウェアは、本明細書に記載または図示された1つ以上の方法の1つ以上のステップを実行するか、または本明細書に記載または図示された機能を提供する。特定の実施形態は、1つ以上のコンピュータシステム2400の1つ以上の部分を含む。本明細書では、コンピュータシステムへの言及は、適切な場合には、コンピューティングデバイスを包含することができ、逆もまた同様である。さらに、コンピュータシステムへの言及は、適切な場合には、1つ以上のコンピュータシステムを包含することができる。
【0124】
本開示は、任意の適切な数のコンピュータシステム2400を想定している。本開示は、任意の適切な物理的形態をとるコンピュータシステム2400を想定している。限定ではなく、例として、コンピュータシステム2400は、組み込みコンピュータシステム、システム・オン・チップ(SOC)、シングルボードコンピュータシステム(SBC)(例えば、コンピュータ・オン・モジュール(COM)またはシステム・オン・モジュール(SOM))、デスクトップコンピュータシステム、ラップトップもしくはノートブックコンピュータシステム、インタラクティブキオスク、メインフレーム、コンピュータシステムのメッシュ、携帯電話、携帯情報端末(PDA)、サーバ、タブレットコンピュータシステム、またはこれらのうちの複数の組み合わせとすることができる。適切な場合には、コンピュータシステム2400は、1つ以上のコンピュータシステム2400を含むことができ、単一であるかまたは分布し、複数の場所にまたがり、複数の機械にまたがり、複数のデータセンタにまたがり、1つ以上のネットワーク内の1つ以上のクラウドコンポーネントを含むことができるクラウド内に存在する。適切な場合には、1つ以上のコンピュータシステム2400は、本明細書に記載または図示された1つ以上の方法の1つ以上のステップを実質的な空間的または時間的制限なしに実行することができる。限定ではなく、例として、1つ以上のコンピュータシステム2400は、本明細書に記載または図示された1つ以上の方法の1つ以上のステップをリアルタイムまたはバッチモードで実行することができる。1つ以上のコンピュータシステム2400は、適切な場合には、本明細書に記載または図示された1つ以上の方法の1つ以上のステップを異なる時間または異なる場所で実行することができる。
【0125】
特定の実施形態では、コンピュータシステム2400は、プロセッサ2402、メモリ2404、記憶装置2406、入力/出力(I/O)インターフェース2408、通信インターフェース2410、およびバス2412を含む。本開示は、特定の構成内の特定の数の特定の構成要素を有する特定のコンピュータシステムを記載および図示しているが、本開示は、任意の適切な構成内の任意の適切な数の任意の適切な構成要素を有する任意の適切なコンピュータシステムを想定している。
【0126】
特定の実施形態では、プロセッサ2402は、コンピュータプログラムを構成するものなどの命令を実行するためのハードウェアを含む。限定ではなく、例として、命令を実行するために、プロセッサ2402は、内部レジスタ、内部キャッシュ、メモリ2404、または記憶装置2406から命令を取り出す(またはフェッチする)ことができ、復号して実行することができ、次いで、内部レジスタ、内部キャッシュ、メモリ2404、または記憶装置2406に1つ以上の結果を書き込むことができる。特定の実施形態では、プロセッサ2402は、データ、命令、またはアドレスのための1つ以上の内部キャッシュを含むことができる。本開示は、適切な場合には、任意の適切な数の任意の適切な内部キャッシュを含むプロセッサ2402を想定している。限定ではなく、例として、プロセッサ2402は、1つ以上の命令キャッシュ、1つ以上のデータキャッシュ、および1つ以上の変換ルックアサイドバッファ(TLB)を含むことができる。命令キャッシュ内の命令は、メモリ2404または記憶装置2406内の命令のコピーとすることができ、命令キャッシュは、プロセッサ2402によるそれらの命令の取り出しを高速化することができる。データキャッシュ内のデータは、プロセッサ2402において実行して、プロセッサ2402において実行される後続の命令によるアクセスのため、またはメモリ2404もしくは記憶装置2406への書き込みのためにプロセッサ2402において実行される先行する命令の結果、または他の適切なデータに対して動作する命令のためのメモリ2404または記憶装置2406内のデータのコピーとすることができる。データキャッシュは、プロセッサ2402による読み出し動作または書き込み動作を高速化することができる。TLBは、プロセッサ2402の仮想アドレス変換を高速化することができる。特定の実施形態では、プロセッサ2402は、データ、命令、またはアドレスのための1つ以上の内部レジスタを含むことができる。本開示は、適切な場合には、任意の適切な数の任意の適切な内部レジスタを含むプロセッサ2402を想定している。適切な場合には、プロセッサ2402は、1つ以上の算術論理演算ユニット(ALU)を含むことができるか、マルチコアプロセッサとすることができるか、または1つ以上のプロセッサ2402を含むことができる。本開示は、特定のプロセッサを記載および図示しているが、本開示は、任意の適切なプロセッサを想定している。
【0127】
特定の実施形態では、メモリ2404は、プロセッサ2402が実行するための命令またはプロセッサ2402が動作するためのデータを記憶するためのメインメモリを含む。限定ではなく、例として、コンピュータシステム2400は、別のソース(例えば、別のコンピュータシステム2400など)から記憶装置2406またはメモリ2404に命令をロードすることができる。次いで、プロセッサ2402は、メモリ2404から内部レジスタまたは内部キャッシュに命令をロードすることができる。命令を実行するために、プロセッサ2402は、内部レジスタまたは内部キャッシュから命令を取り出し、それらを復号することができる。命令の実行中または実行後に、プロセッサ2402は、(中間結果または最終結果とすることができる)1つ以上の結果を内部レジスタまたは内部キャッシュに書き込むことができる。次いで、プロセッサ2402は、それらの結果のうちの1つ以上をメモリ2404に書き込むことができる。特定の実施形態では、プロセッサ2402は、(記憶装置2406または他の場所とは対照的に)1つ以上の内部レジスタもしくは内部キャッシュまたはメモリ2404内の命令のみを実行し、(記憶装置2406または他の場所とは対照的に)1つ以上の内部レジスタもしくは内部キャッシュまたはメモリ2404内のデータのみに対して動作する。(それぞれがアドレスバスおよびデータバスを含むことができる)1つ以上のメモリバスは、プロセッサ2402をメモリ2404に結合することができる。バス2412は、後述するように、1つ以上のメモリバスを含むことができる。特定の実施形態では、1つ以上のメモリ管理ユニット(MMU)が、プロセッサ2402とメモリ2404との間に存在し、プロセッサ2402によって要求されるメモリ2404へのアクセスを容易にする。特定の実施形態では、メモリ2404は、ランダムアクセスメモリ(RAM)を含む。このRAMは、必要に応じて揮発性メモリであってもよい。適切な場合には、このRAMは、ダイナミックRAM(DRAM)またはスタティックRAM(SRAM)であってもよい。さらに、適切な場合には、このRAMは、シングルポートまたはマルチポートRAMであってもよい。本開示は、任意の適切なRAMを想定している。メモリ2404は、適切な場合には、1つ以上のメモリ2404を含むことができる。本開示は、特定のメモリを記載および図示しているが、本開示は、任意の適切なメモリを想定している。
【0128】
特定の実施形態では、記憶装置2406は、データまたは命令のための大容量記憶装置を含む。限定ではなく、例として、記憶装置2406は、ハードディスクドライブ(HDD)、フロッピーディスクドライブ、フラッシュメモリ、光ディスク、光磁気ディスク、磁気テープ、もしくはユニバーサルシリアルバス(USB)ドライブ、またはこれらのうちの複数の組み合わせを含むことができる。記憶装置2406は、適切な場合には、取り外し可能または取り外し不可能な(または固定された)媒体を含むことができる。記憶装置2406は、適切な場合には、コンピュータシステム2400の内部または外部にあってもよい。特定の実施形態では、記憶装置2406は、不揮発性ソリッドステートメモリである。特定の実施形態においては、記憶装置2406は、読み出し専用メモリ(ROM)を含む。適切な場合には、このROMは、マスクプログラムROM、プログラマブルROM(PROM)、消去可能PROM(EPROM)、電気的消去可能PROM(EEPROM)、電気的変更可能ROM(EAROM)、またはフラッシュメモリ、またはこれらのうちの2つ以上の組み合わせであってもよい。本開示は、任意の適切な物理的形態をとる大容量記憶装置2406を想定している。記憶装置2406は、適切な場合には、プロセッサ2402と記憶装置2406との間の通信を容易にする1つ以上の記憶制御ユニットを含むことができる。適切な場合には、記憶装置2406は、1つ以上の記憶装置2406を含むことができる。本開示は、特定の記憶装置を記載および図示しているが、本開示は、任意の適切な記憶装置を想定している。
【0129】
特定の実施形態では、I/Oインターフェース2408は、コンピュータシステム2400と1つ以上のI/Oデバイスとの間の通信のための1つ以上のインターフェースを提供するハードウェア、ソフトウェア、またはその双方を含む。コンピュータシステム2400は、適切な場合には、これらのI/Oデバイスのうちの1つ以上を含むことができる。これらのI/Oデバイスのうちの1つ以上は、人とコンピュータシステム2400との間の通信を可能にすることができる。限定ではなく、例として、I/Oデバイスは、キーボード、キーパッド、マイクロフォン、モニタ、マウス、プリンタ、スキャナ、スピーカ、スチルカメラ、スタイラス、タブレット、タッチスクリーン、トラックボール、ビデオカメラ、別の適切なI/Oデバイス、またはこれらのうちの2つ以上の組み合わせを含むことができる。I/Oデバイスは、1つ以上のセンサを含むことができる。本開示は、任意の適切なI/Oデバイスおよびそれらのための任意の適切なI/Oインターフェース2408を想定している。適切な場合には、I/Oインターフェース2408は、プロセッサ2402がこれらのI/Oデバイスのうちの1つ以上を駆動することを可能にする1つ以上のデバイスドライバを含むことができる。I/Oインターフェース2408は、適切な場合には、1つ以上のI/Oインターフェース2408を含むことができる。本開示は、特定のI/Oインターフェースを記載および図示しているが、本開示は、任意の適切なI/Oインターフェースを想定している。
【0130】
特定の実施形態では、通信インターフェース2410は、コンピュータシステム2400と、1つ以上の他のコンピュータシステム2400または1つ以上のネットワークとの間の通信(例えば、パケットベースの通信など)のための1つ以上のインターフェースを提供するハードウェア、ソフトウェア、またはその双方を含む。限定ではなく、例として、通信インターフェース2410は、イーサネット(登録商標)もしくは他の有線ベースのネットワークと通信するためのネットワークインターフェースコントローラ(NIC)もしくはネットワークアダプタ、またはWI-FIネットワークなどの無線ネットワークと通信するための無線NIC(WNIC)もしくは無線アダプタを含むことができる。本開示は、任意の適切なネットワークおよびそのための任意の適切な通信インターフェース2410を想定している。限定ではなく、例として、コンピュータシステム2400は、アドホックネットワーク、パーソナルエリアネットワーク(PAN)、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、またはインターネットの1つ以上の部分、またはこれらのうちの複数の組み合わせと通信することができる。これらのネットワークのうちの1つ以上の1つ以上の部分は、有線または無線とすることができる。例として、コンピュータシステム2400は、無線PAN(WPAN)(例えば、BLUETOOTH(登録商標) WPANなど)、WI-FIネットワーク、WI-MAXネットワーク、携帯電話ネットワーク(例えば、グローバル・システム・フォー・モバイル・コミュニケーションズ(GSM(登録商標))ネットワーク)、またはその他の適切な無線ネットワーク、またはこれらのうちの複数の組み合わせと通信することができる。コンピュータシステム2400は、適切な場合には、これらのネットワークのいずれかのための任意の適切な通信インターフェース2410を含むことができる。通信インターフェース2410は、適切な場合には、1つ以上の通信インターフェース2410を含むことができる。本開示は、特定の通信インターフェースを記載および図示しているが、本開示は、任意の適切な通信インターフェースを想定している。
【0131】
特定の実施形態では、バス2412は、コンピュータシステム2400の構成要素を互いに結合するハードウェア、ソフトウェア、またはその双方を含む。限定ではなく、例として、バス2412は、アクセラレーテッドグラフィクスポート(AGP)もしくは他のグラフィックスバス、エンハンストインダストリスタンダードアーキテクチャ(EISA)バス、フロントサイドバス(FSB)、ハイパートランスポート(HT)インターコネクト、インダストリスタンダードアーキテクチャ(ISA)バス、インフィニバンドインターコネクト、ローピンカウント(LPC)バス、メモリバス、マイクロチャネルアーキテクチャ(MCA)バス、ペリフェラルコンポーネントインターコネクト(PCI)バス、PCIエクスプレス(PCIe)バス、シリアルアドバンスドテクノロジーアタッチメント(SATA)バス、ビデオエレクトロニクススタンダーズアソシエーションローカル(VLB)バス、または別の適切なバス、またはこれらのうちの2つ以上の組み合わせを含むことができる。バス2412は、適切な場合には、1つ以上のバス2412を含むことができる。本開示は、特定のバスを記載および図示しているが、本開示は、任意の適切なバスまたは相互接続を想定している。
【0132】
本明細書では、コンピュータ可読非一時的記憶媒体は、1つ以上の半導体ベースもしくは他の集積回路(IC)(例えば、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向けIC(ASIC)など)、ハードディスクドライブ(HDD)、ハイブリッドハードドライブ(HHD)、光ディスク、光ディスクドライブ(ODD)、光磁気ディスク、光磁気ドライブ、フロッピーディスク、フロッピーディスクドライブ(FDD)、磁気テープ、ソリッドステートドライブ(SSD)、RAMドライブ、セキュアデジタルカードもしくはドライブ、任意の他の適切なコンピュータ可読非一時的記憶媒体、または適切な場合にはこれらのうちの2つ以上の任意の適切な組み合わせを含むことができる。コンピュータ可読非一時的記憶媒体は、必要に応じて、揮発性、不揮発性、または揮発性と不揮発性との組み合わせであってもよい。
【0133】
本明細書では、「または」は包括的であり、排他的ではないが、他に明示的に示されているか、または文脈によって他に示されている場合は除く。したがって、本明細書では、「AまたはB」は、他に明示的に示されない限り、または文脈によって他に示されない限り、「A、B、またはその双方」を意味する。さらに、「および」は、明示的に別段の指示がない限り、または文脈によって別段の指示がない限り、結合およびいくつかの双方である。したがって、本明細書では、「AおよびB」は、他に明示的に示されない限り、または文脈によって他に示されない限り、「AおよびB、一緒にまたは別々に」を意味する。
【0134】
本開示の範囲は、当業者が理解するであろう、本明細書に記載または図示された例示的な実施形態に対する全ての変形、置換、バリエーション、代替、および変更を包含する。本開示の範囲は、本明細書に記載または図示された例示的な実施形態に限定されない。さらに、本開示は、特定の構成要素、要素、特徴、機能、動作、またはステップを含むものとして本明細書のそれぞれの実施形態を記載および図示しているが、これらの実施形態のいずれも、当業者が理解するであろう本明細書のどこかに記載または図示されている構成要素、要素、特徴、機能、動作、またはステップのいずれかの任意の組み合わせまたは順列を含むことができる。さらにまた、特定の機能を実行するように適合され、配置され、可能にされ、構成され、有効にされ、動作可能にされ、または動作する装置またはシステムまたはシステムの構成要素への添付の特許請求の範囲における参照は、その装置、システムまたは構成要素がそのように適合され、配置され、可能にされ、構成され、有効にされ、動作可能にされ、または動作する限り、それまたはその特定の機能が起動され、オンにされ、またはロック解除されているか否かにかかわらず、その装置、システム、構成要素を包含する。さらに、本開示は、特定の利点を提供するものとして特定の実施形態を記載または図示しているが、特定の実施形態は、これらの利点の全てを提供しなくてもよく、いくつか、または全てを提供してもよい。
図1
図2
図3
図4
図5
図6A
図6B
図6C
図6D
図6E
図7A
図7B
図7C
図8A
図8B
図8C
図9
図10
図11
図12A
図12B
図12C
図13
図14A
図14B
図15
図16
図17
図18
図19
図20A
図20B
図20C
図21(A)】
図21(B)】
図22
図23A
図23B
図24
【国際調査報告】