(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-08-29
(54)【発明の名称】画像認識方法、認識モデルの訓練方法及び関連装置、機器
(51)【国際特許分類】
G06V 20/69 20220101AFI20220822BHJP
G06T 7/00 20170101ALI20220822BHJP
【FI】
G06V20/69
G06T7/00 630
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021576344
(86)(22)【出願日】2020-07-22
(85)【翻訳文提出日】2021-12-21
(86)【国際出願番号】 CN2020103628
(87)【国際公開番号】W WO2021169161
(87)【国際公開日】2021-09-02
(31)【優先権主張番号】202010121559.5
(32)【優先日】2020-02-26
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】519290264
【氏名又は名称】シャンハイ センスタイム インテリジェント テクノロジー カンパニー リミテッド
(74)【代理人】
【識別番号】110001427
【氏名又は名称】弁理士法人前田特許事務所
(72)【発明者】
【氏名】ヤン シュアン
(72)【発明者】
【氏名】リー ジアフイ
(72)【発明者】
【氏名】ホアン シオアディー
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA06
5L096BA13
5L096DA02
5L096HA09
5L096HA11
5L096KA04
5L096KA15
5L096MA07
(57)【要約】
本願の実施例は、画像認識方法、認識モデルの訓練方法及び関連装置、機器を提供する。ここで、画像認識方法は、認識されるべき病理学的画像を取得することと、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることと、認識モデルにおける分類サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得ることと、を含む。
【特許請求の範囲】
【請求項1】
画像認識方法であって、
認識されるべき病理学的画像を取得することと、
認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることと、
認識モデルにおける分類サブモデルを用いて、前記検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得ることと、を含む、画像認識方法。
【請求項2】
前記認識モデルにおける検出サブモデルを用いて、前記認識されるべき病理学的画像に対してターゲット検出を行い、前記認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることは、
前記検出サブモデルの第1部分を利用して、前記認識されるべき病理学的画像に対して第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得ることであって、前記画像分類結果は、前記認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものである、ことと、
前記画像分類結果が、前記認識されるべき病理学的画像に前記ターゲット細胞が含まれることを表す場合、前記検出サブモデルの第2部分を利用して、前記認識されるべき病理学的画像に対して領域検出を行い、前記ターゲット細胞を含む検出領域を得ることと、を含むことを特徴とする
請求項1に記載の画像認識方法。
【請求項3】
前記検出サブモデルの第1部分を利用して、前記認識されるべき病理学的画像に対して第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得た後、
前記画像分類結果が、前記認識されるべき病理学的画像にターゲット細胞が含まれないことを表す場合、前記第1部分が、前記認識されるべき病理学的画像に前記ターゲット細胞が含まれないことを表す検出結果提示を出力することを更に含むことを特徴とする
請求項2に記載の画像認識方法。
【請求項4】
前記認識モデルにおける検出サブモデルを用いて、前記認識されるべき病理学的画像に対してターゲット検出を行い、前記認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることは、
前記検出サブモデルの第3部分を利用して、前記認識されるべき病理学的画像に対して特徴抽出を行い、前記認識されるべき病理学的画像の画像特徴を得ることを更に含むことを特徴とする
請求項2又は3に記載の画像認識方法。
【請求項5】
前記検出サブモデルの第1部分を利用して、前記認識されるべき病理学的画像に対して、第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得ることは、
前記検出サブモデルの第1部分を利用して、前記画像特徴に対して第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得ることを含むことを特徴とする
請求項4に記載の画像認識方法。
【請求項6】
前記検出サブモデルの第2部分を利用して、前記認識されるべき病理学的画像に対して領域検出を行い、前記ターゲット細胞を含む検出領域を得ることは、
前記検出サブモデルの第2部分を利用して、前記画像特徴に対して領域検出を行い、前記ターゲット細胞を含む検出領域を得ることを含むことを特徴とする
請求項4に記載の画像認識方法。
【請求項7】
前記第1部分は、グローバル分類ネットワークであり、前記第2部分は、画像検出ネットワークであり、前記第3部分は、特徴抽出ネットワークであり、ここで、前記特徴抽出ネットワークは、変形可能な畳み込み層、及びグローバル情報強化モジュールのうちの少なくとも1つを含むことを特徴とする
請求項4から6のうちいずれか一項に記載の画像認識方法。
【請求項8】
前記認識モデルにおける分類サブモデルを利用して、前記検出領域に対して第1分類処理を行い、前記ターゲット細胞のクラスを得ることは、
前記分類サブモデルを利用して、前記認識されるべき病理学的画像の検出領域に対して特徴抽出を行い、前記検出領域の画像特徴を得ることと、
前記検出領域の画像特徴に対して第1分類処理を行い、前記ターゲット細胞のクラスを得ることと、を含むことを特徴とする
請求項1又は2に記載の画像認識方法。
【請求項9】
前記ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、前記ターゲット細胞のクラスは、前記ターゲット細胞の病変程度を表すためのものであることを特徴とする
請求項1から8のうちいずれか一項に記載の画像認識方法。
【請求項10】
認識モデルの訓練方法であって、前記認識モデルは、検出サブモデルと、分類サブモデルと、を備え、前記訓練方法は、
第1サンプル画像及び第2サンプル画像を取得することであって、前記第1サンプル画像に、ターゲット細胞に対応する実際領域がアノテーションされており、前記第2サンプル画像に、ターゲット細胞の実際クラスがアノテーションされている、ことと、
前記検出サブモデルを利用して、前記第1サンプル画像に対してターゲット検出を行い、前記第1サンプル画像における、ターゲット細胞を含む予測領域を得て、前記分類サブモデルを利用して、前記第2サンプル画像に対して第1分類処理を行い、前記ターゲット細胞の予測クラスを得ることと、
前記実際領域と前記予測領域に基づいて、前記検出サブモデルの第1損失値を決定し、前記実際クラスと前記予測クラスに基づいて、前記分類サブモデルの第2損失値を決定することと、
前記第1損失値及び前記第2損失値を利用して、前記検出サブモデル及び前記分類サブモデルのパラメータを調整することと、を含む、訓練方法。
【請求項11】
前記検出サブモデルを利用して、前記第1サンプル画像に対してターゲット検出を行い、前記第1サンプル画像における、ターゲット細胞を含む予測領域を得ることは、
前記第1サンプル画像に対して第2分類処理を行い、前記第1サンプル画像の画像分類結果を得ることであって、前記画像分類結果は、前記第1サンプル画像に前記ターゲット細胞が含まれるかどうかを表すためのものである、ことと、
前記画像分類結果が、前記第1サンプル画像にターゲット細胞が含まれることを表す場合、前記第1サンプル画像に対して領域検出を行い、前記ターゲット細胞を含む予測領域を得ることと、を含むことを特徴とする
請求項10に記載の訓練方法。
【請求項12】
前記検出サブモデルを利用して前記第1サンプル画像に対してターゲット検出を行い、前記第1サンプル画像における、ターゲット細胞を含む予測領域を得て、前記分類サブモデルを利用して前記第2サンプル画像に対して第1分類処理を行い、前記ターゲット細胞の予測クラスを得る前に、
前記第1サンプル画像及び前記第2サンプル画像に対してデータ強化を行うこと、及び/又は、
第1サンプル画像及び第2サンプル画像の画素値に対して正規化処理を行うこと、を更に含み、
前記ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、前記ターゲット細胞のクラスは、前記ターゲット細胞の病変程度を表すためのものであることを特徴とする
請求項10又は11に記載の訓練方法。
【請求項13】
画像認識装置であって、
認識されるべき病理学的画像を取得するように構成される画像取得モジュールと、
認識モデルにおける検出サブモデルを用いて、前記認識されるべき病理学的画像に対してターゲット検出を行い、前記認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得るように構成される画像検出モジュールと、
前記認識モデルにおける分類サブモデルを用いて、前記検出領域に対して第1分類処理を行い、前記ターゲット細胞のクラスを得るように構成される画像分類モジュールと、を備える、画像認識装置。
【請求項14】
前記画像検出モジュールは、
前記検出サブモデルの第1部分を利用して、前記認識されるべき病理学的画像に対して第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得るように構成される第1部分サブモジュールであって、前記画像分類結果は、前記認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものである、第1部分サブモジュールと、
前記画像分類結果が、前記認識されるべき病理学的画像に前記ターゲット細胞が含まれることを表す場合、前記検出サブモデルの第2部分を利用して、前記認識されるべき病理学的画像に対して領域検出を行い、前記ターゲット細胞を含む検出領域を得るように構成される第2部分サブモジュールと、を備えることを特徴とする
請求項13に記載の画像認識装置。
【請求項15】
前記画像検出モジュールは、
前記画像分類結果が、前記認識されるべき病理学的画像にターゲット細胞が含まれないことを表す場合、前記第1部分が、前記認識されるべき病理学的画像に前記ターゲット細胞が含まれないことを表す検出結果提示を出力するように構成される結果提示サブモジュールを更に備えることを特徴とする
請求項14に記載の画像認識装置。
【請求項16】
前記画像検出モジュールは、
前記検出サブモデルの第3部分を利用して、前記認識されるべき病理学的画像に対して特徴抽出を行い、前記認識されるべき病理学的画像の画像特徴を得るように構成される第3部分サブモジュールを更に備えることを特徴とする
請求項14又は15に記載の画像認識装置。
【請求項17】
前記第1部分サブモジュールは更に、前記検出サブモデルの第1部分を利用して、前記画像特徴に対して第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得るように構成されることを特徴とする
請求項16に記載の画像認識装置。
【請求項18】
前記第2部分サブモジュールは、前記検出サブモデルの第2部分を利用して、前記画像特徴に対して領域検出を行い、前記ターゲット細胞を含む検出領域を得るように構成されることを特徴とする
請求項16に記載の画像認識装置。
【請求項19】
前記第1部分は、グローバル分類ネットワークであり、前記第2部分は、画像検出ネットワークであり、前記第3部分は、特徴抽出ネットワークであり、ここで、前記特徴抽出ネットワークは、変形可能な畳み込み層、及びグローバル情報強化モジュールのうちの少なくとも1つを含むことを特徴とする
請求項16から18のうちいずれか一項に記載の画像認識装置。
【請求項20】
前記画像分類モジュールは、
前記分類サブモデルを利用して、前記認識されるべき病理学的画像の検出領域に対して特徴抽出を行い、前記検出領域の画像特徴を得るように構成される特徴抽出サブモジュールと、
前記検出領域の画像特徴に対して第1分類処理を行い、前記ターゲット細胞のクラスを得るように構成される分類処理サブモジュールと、を備えることを特徴とする
請求項13又は14に記載の画像認識装置。
【請求項21】
前記ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、前記ターゲット細胞のクラスは、前記ターゲット細胞の病変程度を表すためのものであることを特徴とする
請求項13から20のうちいずれか一項に記載の画像認識装置。
【請求項22】
認識モデルの訓練装置であって、前記認識モデルは、検出サブモデルと、分類サブモデルと、を備え、前記訓練装置は、
第1サンプル画像及び第2サンプル画像を取得するように構成される画像取得モジュールであって、前記第1サンプル画像に、ターゲット細胞に対応する実際領域がアノテーションされており、前記第2サンプル画像に、ターゲット細胞の実際クラスがアノテーションされている、画像取得モジュールと、
前記検出サブモデルを利用して、前記第1サンプル画像に対してターゲット検出を行い、前記第1サンプル画像における、ターゲット細胞を含む予測領域を得て、前記分類サブモデルを利用して、前記第2サンプル画像に対して第1分類処理を行い、前記ターゲット細胞の予測クラスを得るように構成されるモデル実行モジュールと、
前記実際領域と前記予測領域に基づいて、前記検出サブモデルの第1損失値を決定し、前記実際クラスと前記予測クラスに基づいて、前記分類サブモデルの第2損失値を決定するように構成される損失決定モジュールと、
前記第1損失値及び前記第2損失値を利用して、前記検出サブモデル及び前記分類サブモデルのパラメータを調整するように構成されるパラメータ調整モジュールと、を備える、訓練装置。
【請求項23】
前記モデル実行モジュールは、
前記第1サンプル画像に対して第2分類処理を行い、前記第1サンプル画像の画像分類結果を得るように構成される初期分類サブモジュールであって、前記画像分類結果は、前記第1サンプル画像に前記ターゲット細胞が含まれるかどうかを表すためのものである、初期分類サブモジュールと、
前記画像分類結果が、前記第1サンプル画像にターゲット細胞が含まれることを表す場合、前記第1サンプル画像に対して領域検出を行い、前記ターゲット細胞を含む予測領域を得るように構成される領域検出サブモジュールと、を備えることを特徴とする
請求項22に記載の訓練装置。
【請求項24】
前記訓練装置は、
前記第1サンプル画像及び前記第2サンプル画像に対してデータ強化を行うように構成されるデータ強化モジュール、
又は、前記第1サンプル画像及び前記第2サンプル画像の画素値に対して正規化処理を行うように構成される正規化処理モジュールを更に備え、
前記ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、前記ターゲット細胞のクラスは、前記ターゲット細胞の病変程度を表すためのものであることを特徴とする
請求項22又は23に記載の訓練装置。
【請求項25】
電子機器であって、前記電子機器は、互いに結合されるメモリとプロセッサを備え、前記プロセッサは、前記メモリに記憶されているプログラム命令を実行して、請求項1から9のうちいずれか一項に記載の画像認識方法、又は、請求項10から12のうちいずれか一項に記載の認識モデルの訓練方法を実現するように構成される、電子機器。
【請求項26】
コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体にプログラム命令が記憶されており、プログラム命令がプロセッサにより実行されると、前記プロセッサに請求項1から9のうちいずれか一項に記載の画像認識方法、又は、請求項10から12のうちいずれか一項に記載の認識モデルの訓練方法を実現させる、コンピュータ可読記憶媒体。
【請求項27】
コンピュータプログラムであって、前記コンピュータプログラムは、コンピュータ可読コードを含み、前記コンピュータ可読コードが電子機器で実行されると、前記電子機器におけるプロセッサに、請求項1から9のうちいずれか一項に記載の画像認識方法、又は、請求項10から12のうちいずれか一項に記載の認識モデルの訓練方法を実行させる、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、2020年02月26日に提出された、出願番号が202010121559.5である中国特許出願に基づく優先権を主張し、該中国特許出願の全内容が参照として本願に組み込まれる。
【0002】
本願は、人工知能技術分野に関し、特に画像認識方法、認識モデルの訓練方法及び関連装置、機器に関する。
【背景技術】
【0003】
ニューラルネットワーク、深層学習などの人工知能技術の成長に伴い、ニューラルネットワークモデルに対して訓練を行い、訓練されたニューラルネットワークモデルにより、医療分野における関連サービスの需要を満たすことは、ますます注目されている。
【0004】
関連サービス需要において、国内で細胞病理学的医者が厳しく不足しているため、人工知能技術を利用して病理学的画像に対して補助認識を行い、病変細胞などのターゲット細胞をスクリーニングすることは、現在の細胞病理学的医療資源が厳しく不足している場合、重要な意義を有する。これに鑑み、病理学的画像におけるターゲット細胞を正確かつ効果的に認識することは、解決されるべき課題である。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本願の実施例は、画像認識方法、認識モデルの訓練方法及び関連装置、機器を提供する。
【課題を解決するための手段】
【0006】
本願の実施例は、画像認識方法を提供する。前記方法は、認識されるべき病理学的画像を取得することと、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることと、認識モデルにおける分類サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得ることと、を含む。
【0007】
認識モデルにおける検出サブモデルを用いて、取得された認識されるべき病理学的画像に対してターゲット検出を行うことで、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得る。また、認識モデルにおける分析サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得る。従って、ターゲット細胞の検出を行ってから、ターゲット細胞の分類を行うことができ、検出と分類を分離させることができる。これにより、病理学的画像におけるターゲット細胞を正確かつ効率的に認識することができる。
【0008】
本願の幾つかの実施例において、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることは、検出サブモデルの第1部分を利用して、認識されるべき病理学的画像に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得ることであって、画像分類結果は、認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものである、ことと、画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれることを表す場合、検出サブモデルの第2部分を利用して、認識されるべき病理学的画像に対して領域検出を行い、ターゲット細胞を含む検出領域を得ることと、を含む。
【0009】
従って、検出サブモデルの第1部分により、認識されるべき病理学的画像に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得る。画像分類結果は、認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものである。画像分類結果は、認識されるべき病理学的画像にターゲット細胞が含まれることを表す時、検出サブモデルの第2部分を利用して、認識されるべき病理学的画像に対して領域検出を行い、ターゲット細胞を含む検出領域を得る。従って、ターゲット細胞の動的検出を実現させ、ターゲット細胞の認識効率を向上させることができる。
【0010】
本願の幾つかの実施例において、検出サブモデルの第1部分を利用して、認識されるべき病理学的画像に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得た後、画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す場合、第1部分が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す検出結果提示を出力することを更に含む。
【0011】
従って、画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す場合、第1部分は、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す検出結果提示を出力するため、ターゲット細胞の動的検出を実現させ、ターゲット細胞の認識効率を向上させることができる。
【0012】
本願の幾つかの実施例において、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることは、検出サブモデルの第3部分を利用して、認識されるべき病理学的画像に対して特徴抽出を行い、認識されるべき病理学的画像の画像特徴を得ることを更に含む。
【0013】
従って、検出サブモデルの第3部分を利用して、認識されるべき病理学的画像に対して特徴抽出を行い、認識されるべき病理学的画像の画像特徴を得ることで、まず、認識されるべき病理学的画像に対して処理を行い、更に、後続でこれを基に、検出サブモデルを利用して他の処理を行うことができるため、モデルの運転効率の向上に寄与する。
【0014】
本願の幾つかの実施例において、検出サブモデルの第1部分を利用して、認識されるべき病理学的画像に対して、第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得ることは、検出サブモデルの第1部分を利用して、画像特徴に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得ることを含む。
【0015】
従って、検出サブモデルの第1部分を利用して、第3部分により抽出された画像特徴に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得ることで、分類処理の正確性を向上させることができる。
【0016】
本願の幾つかの実施例において、検出サブモデルの第2部分を利用して、認識されるべき病理学的画像に対して領域検出を行い、ターゲット細胞を含む検出領域を得ることは、検出サブモデルの第2部分を利用して、画像特徴に対して領域検出を行い、ターゲット細胞を含む検出領域を得ることを含む。
【0017】
従って、検出サブモデルの第2部分を利用して、画像特徴に対して領域検出を行い、ターゲット細胞を含む検出領域を得ることで、ターゲット細胞の認識の正確性の向上に寄与する。
【0018】
本願の幾つかの実施例において、第1部分は、グローバル分類ネットワークであり、第2部分は、画像検出ネットワークであり、第3部分は、特徴抽出ネットワークであり、ここで、特徴抽出ネットワークは、変形可能な畳み込み層、及びグローバル情報強化モジュールのうちの少なくとも1つを含む。
【0019】
従って、特徴抽出ネットワークを、変形可能な畳み込み層を含むものとすることで、多形態のターゲット細胞に対する認識の正確性を向上させることができる。特徴抽出ネットワークを、グローバル情報強化モジュールを含むもののうちの少なくとも1つとすることで、距離が長くて依存関係を有する特徴の取得に寄与し、ターゲット細胞の認識の正確性の向上に寄与する。
【0020】
本願の幾つかの実施例において、認識モデルにおける分類サブモデルを利用して、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得ることは、分類サブモデルを利用して、認識されるべき病理学的画像の検出領域に対して特徴抽出を行い、検出領域の画像特徴を得ることと、検出領域の画像特徴に対して第1分類処理を行い、ターゲット細胞のクラスを得ることと、を含む。
【0021】
従って、認識されるべき病理学的画像の検出領域に対して特徴抽出を行い、検出領域の画像特徴を得て、検出領域の画像特徴に対して第1分類処理を行い、ターゲット細胞のクラスを得ることで、分類処理の効率の向上に寄与する。
【0022】
本願の幾つかの実施例において、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。
【0023】
従って、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含む。単一の病変細胞及び病変細胞クラスタの認識に寄与する。また、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。ターゲット細胞の病変の等級付けの実現に寄与する。
【0024】
本願の実施例は、認識モデルの訓練方法を提供する。認識モデルは、検出サブモデルと、分類サブモデルと、を備え、訓練方法は、第1サンプル画像及び第2サンプル画像を取得することであって、第1サンプル画像に、ターゲット細胞に対応する実際領域がアノテーションされており、第2サンプル画像に、ターゲット細胞の実際クラスがアノテーションされている、ことと、検出サブモデルを利用して、第1サンプル画像に対してターゲット検出を行い、第1サンプル画像における、ターゲット細胞を含む予測領域を得て、分類サブモデルを利用して、第2サンプル画像に対して第1分類処理を行い、ターゲット細胞の予測クラスを得ることと、実際領域と予測領域に基づいて、検出サブモデルの第1損失値を決定し、実際クラスと予測クラスに基づいて、分類サブモデルの第2損失値を決定することと、第1損失値及び第2損失値を利用して、検出サブモデル及び分類サブモデルのパラメータを調整することと、を含む。
【0025】
従って、訓練プロセスにおいて、ターゲット細胞の検出を行ってから、ターゲット細胞の分類を行い、検出と分類を分離させることで、サンプルデータのクラスのバランスが取れないという問題を解決することができ、更に、訓練で得られたモデルの正確性の向上に寄与し、ターゲット細胞の認識の正確性及び効率の向上に寄与する。
【0026】
本願の幾つかの実施例において、検出サブモデルを利用して、第1サンプル画像に対してターゲット検出を行い、第1サンプル画像における、ターゲット細胞を含む予測領域を得ることは、第1サンプル画像に対して第2分類処理を行い、第1サンプル画像の画像分類結果を得ることであって、画像分類結果は、第1サンプル画像にターゲット細胞が含まれるかどうかを表すためのものである、ことと、画像分類結果が、第1サンプル画像にターゲット細胞が含まれることを表す場合、第1サンプル画像に対して領域検出を行い、ターゲット細胞を含む予測領域を得ることと、を含む。
【0027】
従って、訓練プロセスにおいて、画像分類結果が、第1サンプル画像にターゲット細胞が含まれることを表す場合、第1サンプル画像に対して領域検出を行い、ターゲット細胞を含む予測領域を得る。モデルの、ポジティブサンプルとネガティブサンプルの認識能力を向上させ、誤検出確率を低下させることができる。訓練で得られたモデルの正確性の向上に寄与し、ターゲット細胞の認識の正確性の向上に寄与する。
【0028】
本願の幾つかの実施例において、検出サブモデルを利用して第1サンプル画像に対してターゲット検出を行い、第1サンプル画像における、ターゲット細胞を含む予測領域を得て、分類サブモデルを利用して第2サンプル画像に対して第1分類処理を行い、ターゲット細胞の予測クラスを得る前に、方法は、第1サンプル画像及び第2サンプル画像に対してデータ強化を行うこと、及び/又は、第1サンプル画像及び第2サンプル画像の画素値に対して正規化処理を行うこと、を更に含み、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。
【0029】
従って、第1サンプル画像及び第2サンプル画像に対してデータ強化を行うことで、サンプルの多様性を向上させることができ、オーバーフィッティングを避けることに寄与し、モデルの汎化性能を向上させる。第1サンプル画像及び第2サンプル画像における画素値に対して正規化処理を行うことで、モデルの収束速度の向上に寄与する。ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。単一の病変細胞及び病変細胞クラスタの認識に寄与する。また、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。ターゲット細胞の病変の等級付けの実現に寄与する。
【0030】
本願の実施例は、画像認識装置を提供する。前記装置は、画像取得モジュールと、画像検出モジュールと、画像分類モジュールと、を備え、画像取得モジュールは、認識されるべき病理学的画像を取得するように構成され、画像検出モジュールは、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得るように構成され、画像分類モジュールは、認識モデルにおける分類サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得るように構成される。
【0031】
本願の実施例は、認識モデルの訓練装置を提供する。認識モデルは、検出サブモデルと、分類サブモデルと、を備え、認識モデルの訓練装置は、画像取得モジュールと、モデル実行モジュールと、損失決定モジュールと、パラメータ調整モジュールと、を備え、画像取得モジュールは、第1サンプル画像及び第2サンプル画像を取得するように構成され、第1サンプル画像に、ターゲット細胞に対応する実際領域がアノテーションされており、第2サンプル画像に、ターゲット細胞の実際クラスがアノテーションされており、モデル実行モジュールは、検出サブモデルを利用して、第1サンプル画像に対してターゲット検出を行い、第1サンプル画像における、ターゲット細胞を含む予測領域を得て、分類サブモデルを利用して、第2サンプル画像に対して第1分類処理を行い、ターゲット細胞の予測クラスを得るように構成され、損失決定モジュールは、実際領域と予測領域に基づいて、検出サブモデルの第1損失値を決定し、実際クラスと予測クラスに基づいて、分類サブモデルの第2損失値を決定するように構成され、パラメータ調整モジュールは、第1損失値及び第2損失値を利用して、検出サブモデル及び分類サブモデルのパラメータを調整するように構成される。
【0032】
本願の実施例は、電子機器を提供する。前記電子機器は、互いに結合されるメモリとプロセッサを備え、プロセッサは、メモリに記憶されているプログラム命令を実行して、上記1つ又は複数の実施例における画像認識方法、又は、上記1つ又は複数の実施例における認識モデルの訓練方法を実現するように構成される。
【0033】
本願の実施例は、コンピュータ可読記憶媒体を提供する。前記コンピュータ可読記憶媒体にプログラム命令が記憶されており、プログラム命令がプロセッサにより実行されると、前記プロセッサに上記1つ又は複数の実施例における画像認識方法、又は、上記1つ又は複数の実施例における認識モデルの訓練方法を実現させる。
【0034】
本願の実施例は、コンピュータプログラムを提供する。前記コンピュータプログラムは、コンピュータ可読コードを含み、前記コンピュータ可読コードが電子機器で実行されると、前記電子機器におけるプロセッサに、上記1つ又は複数の実施例における画像認識方法、又は、上記1つ又は複数の実施例における認識モデルの訓練方法を実行させる。
【発明の効果】
【0035】
上記技術的解決手段は、認識モデルにおける検出サブモデルを用いて、取得された認識されるべき病理学的画像に対してターゲット検出を行うことで、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得る。また、認識モデルにおける分析サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得る。従って、ターゲット細胞の検出を行ってから、ターゲット細胞の分類を行うことができ、検出と分類を分離させることができる。これにより、病理学的画像におけるターゲット細胞を正確かつ効率的に認識することができる。
【図面の簡単な説明】
【0036】
【
図1】本願の実施例による画像認識方法を示すフローチャートである。
【
図2】本願の実施例による画像認識方法の状態を示す概略図である。
【
図3】本願の実施例による画像認識方法を示すフローチャートである。
【
図4】本願の実施例による画像認識方法の状態を示す概略図である。
【
図5】本願の実施例による認識モデルの訓練方法を示すフローチャートである。
【
図6】本願の実施例による画像認識装置の構造フレームワークを示す概略図である。
【
図7】本願の実施例による認識モデルの訓練装置の構造フレームワークを示す概略図である。
【
図8】本願の実施例による電子機器の構造フレームワークを示す概略図である。
【
図9】本願の実施例によるコンピュータ可読記憶媒体の構造フレームワークを示す概略図である。
【発明を実施するための形態】
【0037】
以下、明細書の図面を参照しながら、本願の実施例の技術的解決手段を詳しく説明する。
【0038】
下記説明において、本願の実施例を深く理解するために、特定システム構造、インタフェース、技術等の具体的な細部を提出し、これは、本願を解釈するためのものに過ぎず、本願を限定するためのものではない。
【0039】
本明細書において、「システム」と「ネットワーク」は相互交換可能に用いられる。本明細書において、用語「及び/又は」は、関連対象の関連関係を説明するためのものであり、3通りの関係が存在することを表す。例えば、A及び/又はBは、Aのみが存在すること、AとBが同時に存在すること、Bのみが存在するという3つの場合を表す。なお、本明細書において、文字「/」は一般的には、前後関連対象が「又は」という関係であることを示す。また、本明細書における「複数」は、2つ又は2つより多いことを表す。
【0040】
図1を参照すると、
図1は、本願の実施例による画像認識方法を示すフローチャートである。具体的には、下記ステップを含み得る。
【0041】
ステップS11において、認識されるべき病理学的画像を取得する。
【0042】
認識されるべき病理学的画像は、子宮頸部病理学的画像、肝臓病理学的画像、腎臓病理学的画像を含むが、これらに限定されない。
【0043】
ステップS12において、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得る。
【0044】
認識モデルは、検出サブモデルを含む。具体的な実施シーンにおいて、検出サブモデルとして、Faster RCNN(Region with Convolutional Neural Networks)ネットワークモデルを用いてもよい。もう1つの具体的な実施シーンにおいて、検出サブモデルとして、Fast RCNN、YOLO(You Only Look Once)などをもちいてもよく、ここで限定しない。
【0045】
検出サブモデルを用いて、認識されるべき病理学的画像に対して検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得る。例えば、子宮頸部病理学的画像に対して検出を行い、子宮頸部病理学的細胞における、扁平上皮細胞を含む検出領域を得る。又は、肝臓病理学的画像に対して検出を行い、肝臓病理学的画像における、病変細胞を含む検出領域を得る。認識されるべき病理学的画像が他の画像である場合、このように類推してもよく、ここで、一々列挙しない。1つの実施シーンにおいて、検出領域は、具体的には、ターゲット細胞を含む矩形の中心座標及び矩形の長さと幅で表されてもよい。例えば、(50,60,10,20)で、認識されるべき病理学的画像における、画素座標(50,60)を中心として、長さが10であって幅が20である矩形を表す。なお、ターゲット細胞を含む矩形の中心座標、矩形の長さ及び幅と所定の矩形の長さ及び幅との比で表されてもよい。例えば、所定の矩形は、長さが10であって幅が20である矩形であると、(50,60,1,1)で、認識されるべき病理学的画像における、画素座標(50,60)を中心として長さが10であって幅が20である矩形を表してもよい。ここで、限定しない。
【0046】
本願の幾つかの実施例において、認識されるべき病理学的画像は、ターゲット細胞を含まない画像である可能性もある。この場合、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行うと、検出領域を得ないため、認識されるべき病理学的画像にターゲット細胞が含まれないという提示を出力することができる。これにより、後続の分類処理ステップを省略し、モデルの運転効率を向上させることができる。例えば、子宮頸部病理学的画像に扁平上皮細胞が含まれないという提示を直接的に出力することができる。他の病理学的画像は、このように類推してもよく、ここで、一々列挙しない。
【0047】
本願の幾つかの実施例において、
図2を参照する。
図2は、本願の実施例による画像認識方法の状態を示す概略図である。
図2に示すように、認識されるべき病理学的画像は、子宮頸部病理学的画像である。認識されるべき病理学的画像に対して認識モデルにおける検出サブモデルによりターゲット検出を行うことで、ターゲット細胞を含む2つの検出領域を得る。
【0048】
ステップS13において、認識モデルにおける分類サブモデルを利用して、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得る。
【0049】
認識モデルは、分類サブモデルを更に含み得る。具体的な実施シーンにおいて、分類サブモデルとして、EfficientNetネットワークモデルを用いてもよい。もう1つの具体的な実施シーンにおいて、分類サブモデルとして、ResNet、MobileNet等を用いてもよく、ここで、限定しない。
【0050】
認識モデルにおける分類サブモデルを利用して、検出領域に対して分類処理を行うことで、ターゲット細胞のクラスを得ることができる。具体的には、分類効率を向上させるために、分類サブモデルを利用して、認識されるべき病理学的画像の検出領域に対して特徴抽出を行い検出領域の画像特徴を得ることができる。これにより、検出領域の画像特徴に対して第1分類処理を行い、ターゲット細胞のクラスを得る。例えば、検出領域の画像特徴に対してプーリング処理、全結合処理を行い、ターゲット細胞のクラスを得ることができる。ここで、詳細な説明を省略する。
【0051】
本願の幾つかの実施例において、ターゲット細胞に対する病変等級付けを実現させるために、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すことができる。認識されるべき病変画像が子宮頸部病理学的画像であることを例として、ターゲット細胞は具体的には、高度扁平上皮内病変(High-grade Squamous Intraepithelial Lesion:HSIL)、軽度扁平上皮内病変(Low-grade Squamous Intraepithelial Lesion:LSIL)、意義不明な異型扁平上皮(Atypical Squamous Cells of Undetermined Significance:ASC-US)、高度扁平上皮内病変を除外できない異型扁平上皮細胞(Atypical Squamous Cells-cannot exclude HSIL:ASC-H)を含んでもよく、これらに限定されない。認識されるべき病理学的画像は、他の病理学的画像である場合、このように類推してもよく、ここで、一々列挙しない。1つの実施シーンにおいて、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み得る。これにより、単一の病変細胞又は病変細胞クラスタに対する認識を実現させることができる。
【0052】
本願の幾つかの実施例において、引き続き
図2を参照する。分類サブモデルは、検出サブモデルにより検出された2つの検出領域に対してそれぞれ分類処理を行い、2つの検出領域に含まれるターゲット細胞のクラスを得る。そのうちの1つの検出領域におけるターゲット細胞は、高度扁平上皮内病変(HSIL)であり、もう1つの検出領域におけるターゲット細胞は、高度扁平上皮内病変を除外できない異型扁平上皮細胞(ASC-H)である。
【0053】
本願の幾つかの実施例において、分類サブモデルは、検出領域に対して第1分類処理を行い、ターゲット細胞のクラス及びその信頼度を得ることもできる。ここで、信頼度は、ターゲット細胞の真実クラスがモデルにより予測されたクラスである信頼度を表す。信頼度が高いほど、確信度が高くなる。引き続き
図2を参照する。分類サブモデルは、検出領域に対してそれぞれ分類処理を行い、ターゲット細胞のクラス及びその信頼度を得る。そのうちの1つの検出領域におけるターゲット細胞は、高度扁平上皮内病変(HSIL)であり、且つその信頼度は、0.97(即ち、97%の確信度)である。もう1つの検出領域におけるターゲット細胞は、高度扁平上皮内病変を除外できない異型扁平上皮細胞(ASC-H)であり、且つその信頼度は、0.98(即ち、98%の確信度)である。
【0054】
上記技術的解決手段は、認識モデルにおける検出サブモデルを用いて、取得された認識されるべき病理学的画像に対してターゲット検出を行うことで、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得る。また、認識モデルにおける分析サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得る。従って、ターゲット細胞の検出を行ってから、ターゲット細胞の分類を行うことができ、検出と分類を分離させることができる。これにより、病理学的画像におけるターゲット細胞を正確かつ効率的に認識することができる。
【0055】
図3を参照すると、
図3は、本願の実施例による画像認識方法を示すフローチャートである。具体的には、下記ステップを含み得る。
【0056】
ステップS31において、認識されるべき病理学的画像を取得する。
【0057】
具体的には、前記実施例における関連ステップを参照する。
【0058】
ステップS32において、検出サブモデルの第1部分を利用して、認識されるべき病理学的画像に対して分類処理を行い、認識されるべき病理学的画像の画像分類結果を得る。
【0059】
ここで、画像分類結果は、認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものである。具体的には、「0」で、認識されるべき病理学的画像にターゲット細胞が含まれないことを表し、「1」で、認識されるべき病理学的画像にターゲット細胞が含まれることを表すことができ、ここで、限定しない。
【0060】
本願の幾つかの実施例において、検出サブモデルの第1部分は、グローバル分類ネットワークであり、グローバル分類ネットワークは、ニューロンを含むニューラルネットワークモデルである。前記実施例における分類サブモデルと異なっており、グローバル分類ネットワークは、認識されるべき病理学的画像に対して二分類処理を行い、認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを示す画像分類結果を得るために用いられる。1つの具体的な実施シーンにおいて、分類サブモデルによる分類処理と区別するために、検出サブモデルの第1部分による分類処理は、第2分類処理と呼ばれてもよく、ここで、限定しない。
【0061】
ステップS33において、画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれることを表すかどうかを判定し、認識されるべき病理学的画像にターゲット細胞が含まれることを表す場合、ステップS34を実行し、そうでなければ、S36を実行する。
【0062】
画像分類結果により、認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを判定し、ターゲット細胞が含まれると、認識されるべき病理学的画像に対して次の処理を実行することができ、そうでなければ、次の処理を実行する必要がない。これにより、ターゲット細胞を含むかどうかを検出するための分類処理とターゲット細胞の検出領域の具体的な検出処理とを分離させ、モデルの運転効率を更に向上させ、画像におけるターゲット細胞の認識効率を向上させることができる。
【0063】
ステップS34において、検出サブモデルの第2部分を利用して、認識されるべき病理学的画像に対して領域検出を行い、ターゲット細胞を含む検出領域を得る。
【0064】
本願の幾つかの実施例において、検出サブモデルの第2部分は、画像検出ネットワークであり、画像検出ネットワークは、ニューロンを含むニューラルネットワークモデルである。検出サブモデルがとしてFaster RCNNを用いることを例として、第2部分は、RPN(Region Proposal Networks)ネットワークであってもよい。検出サブモデルが他のネットワークモデルである場合、このように類推してもよく、ここで、一々列挙しない。
【0065】
本願の幾つかの実施例において、
図2を参照する。
図2は、本願の実施例による画像認識方法の状態を示す概略図である。
図2に示すように、認識されるべき病理学的画像は、子宮頸部病理学的画像であり、認識されるべき病理学的画像に対して、認識モデルにおける検出サブモデルによりターゲット検出を行い、ターゲット細胞を含む2つの検出領域を得る。
【0066】
本願の幾つかの実施例において、ターゲット細胞の認識の正確性を向上させるために、検出サブモデルの第3部分を利用して、認識されるべき病理学的画像に対して特徴抽出を行い、認識されるべき病理学的画像の画像特徴を得ることもできる。具体的には、第3部分は、特徴抽出ネットワークであってもよい。本願の幾つかの実施例において、特徴抽出ネットワークは、ResNet50ネットワークなどであってもよく、ここで、限定しない。本願の幾つかの実施例において、多形態のターゲット細胞に対する認識の正確性を向上させるために、特徴抽出ネットワークは、変形可能な畳み込み層(deformable convolution)を含み得る。変形可能な畳み込み層は、空間に対して用いられる位置情報に基づいて、さらなる変位調整を行い、異なる形態の細胞に対する特徴抽出を実現させる。本願の幾つかの実施例において、距離が長くて依存関係を有する特徴を取得し、ターゲット細胞の認識の正確性を向上させるために、特徴抽出ネットワークは、グローバル情報強化モジュールを更に備えてもよい。
図4を参照すると、
図4は、本願の実施例による画像認識方法の状態を示す概略図である。認識されるべき病理学的画像に対して特徴抽出を行った後、検出サブモデルの第1部分を利用して、画像特徴に対して分類処理を行い、認識されるべき病理学的画像の画像分類結果を得て、画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれる時(即ち、画像分類結果が陽性である時)、検出サブモデルの第2部分を利用して、画像特徴に対して領域検出を行い、ターゲット細胞を含む検出領域を得て、後続の分類処理を行うことができる。具体的には、本実施例における関連ステップを参照することができ、ここで、詳細な説明を省略する。
【0067】
ステップS35において、認識モデルにおける分類サブモデルを利用して検出領域に対して分類処理を行い、ターゲット細胞のクラスを得る。
【0068】
具体的には、前記実施例における関連ステップを参照する。
【0069】
本願の幾つかの実施例において、
図2を参照する。
図2は、本願の実施例による画像認識方法の状態を示す概略図である。
図2示すように、認識されるべき病理学的画像は、子宮頸部病理学的画像であり、認識されるべき病理学的画像に対して、認識モデルにおける検出サブモデルにより、ターゲット検出を行い、ターゲット細胞を含む2つの検出領域を得る。
【0070】
ステップS36において、第1部分が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す検出結果提示を出力する。
【0071】
画像検出結果が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す時(即ち、画像分類結果が陰性である場合、次の処理を行う必要がない。これにより、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す検出結果提示(即ち、結果が陰性であることを表す提示)を直接的に出力し、モデルの運転効率を向上させ、画像におけるターゲット細胞の認識効率を向上させることができる。
【0072】
前記実施例と異なっており、検出サブモデルの第1部分により、認識されるべき病理学的画像に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得る。また、画像分類結果は、認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものである。画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれることを表す時、検出サブモデルの第2部分を利用して、認識されるべき病理学的画像に対して領域検出を行い、ターゲット細胞を含む検出領域を得る。従って、ターゲット細胞の動的検出を実現させ、ターゲット細胞の動的検出を実現させ、ターゲット細胞の認識効率を向上させることができる。
【0073】
図5を参照すると、
図5は、本願の実施例による認識モデルの訓練方法を示すフローチャートである。本願の実施例において、認識モデルは具体的には、検出サブモデルと、分類サブモデルと、を備えてもよく、具体的には、下記ステップを含み得る。
【0074】
ステップS51において、第1サンプル画像及び第2サンプル画像を取得する。
【0075】
本願の実施例において、第1サンプル画像に、ターゲット細胞に対応する実際領域がアノテーションされており、実際領域は、ターゲット細胞を含む矩形の中心座標及び矩形の長さと幅で表されてもよい。例えば、(50,60,10,20)で、第1サンプル画像に位置する、画素点(50,60)を中心として、長さが10であり、幅が20である矩形を表すことができる。第2サンプル画像に、ターゲット細胞の実際クラスがアノテーションされている。本願の幾つかの実施例において、ターゲット細胞の実際クラスは、ターゲット細胞の病変程度を表すためのものである。第2サンプル画像が子宮頸部病理学的画像であることを例として、ターゲット細胞は具体的には、高度扁平上皮内病変(HSIL)、軽度扁平上皮内病変(LSIL)、意義不明な異型扁平上皮(ASC-US)、高度扁平上皮内病変を除外できない異型扁平上皮細胞(ASC-H)を含んでもよく、これらに限定されない。認識されるべき病理学的画像が他の病理学的画像である場合、このように類推してもよく、ここで、一々列挙しない。本願の幾つかの実施例において、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み得る。これにより、単一の病変細胞又は病変細胞クラスタに対する認識を実現させることができる。
【0076】
本願の幾つかの実施例において、第1サンプル画像及び第2サンプル画像は、病理学的画像であり、例えば、子宮頸部病理学的画像、肝臓病理学的画像、腎臓病理学的画像を含むが、これらに限定されない。第1サンプル画像及び第2サンプル画像が子宮頸部病理学的画像であることを例として、ターゲット細胞は、扁平上皮細胞であってもよい。第1サンプル画像及び第2サンプル画像が他の病理学的画像である場合、このように類推してもよく、ここで、一々列挙しない。
【0077】
本願の幾つかの実施例において、取得された第1サンプル画像及び第2サンプル画像に対してデータ強化を行うことで、サンプルの多様性を向上させることができ、オーバーフィッティングを避けることに寄与し、モデルの汎化性能を向上させることもできる。具体的な実施シーンにおいて、ランダム切断、ランダム回転、ランダム反転、色的な外乱、ガンマ補正、ガウス雑音のような操作を行うことでデータ強化を行うことができるが、これらに限定されない。
【0078】
本願の幾つかの実施例において、第1サンプル画像及び第2サンプル画像における画素値に対して正規化処理を行い、モデルの収束速度を向上させることもできる。本願の幾つかの実施例において、まず、全ての第1サンプル画像の画素値の第1平均値及び第1分散を統計し、次に、各第1サンプル画像における画素値から第1平均値を減算し、第1分散で除算することで、各第1サンプル画像に対して正規化処理を行うことができる。また、全ての第2サンプル画像の画素値の第2平均値及び第2分散を統計し、次に、各第2サンプル画像における画素値から第2平均値を減算し、第2分散で除算することで、各第2サンプル画像に対して正規化処理を行うことができる。
【0079】
ステップS52において、検出サブモデルを利用して、第1サンプル画像に対してターゲット検出を行い、第1サンプル画像における、ターゲット細胞を含む予測領域を得て、分類サブモデルを利用して第2サンプル画像に対して第1分類処理を行い、ターゲット細胞の予測クラスを得る。
【0080】
検出サブモデルとして、Faster RCNNを用いることができる。具体的には、前記実施例における関連ステップを参照することができ、ここで、詳細な説明を省略する。予測領域は、矩形の中心座標及び矩形の長さと幅で表されてもよい。例えば、(70,80,10,20)で、第1サンプル画像に位置する、画素点(70,80)を中心として、長さが10であって幅が20である予測領域を表すことができる。予測領域は、矩形の中心座標、矩形の長さ及び幅と所定の矩形の長さ及び幅との比で表されてもよい。例えば、所定の矩形を設定する。所定の矩形の長さは、10であって且つ幅は20であると、(70,80,1,1)で、第1サンプル画像に位置する、(70,80)を画像中心として、長さが10であって且つ幅が20である予測領域を表すことができる。分類サブモデルとして、EfficientNetネットワークモデルを用いることができる。具体的には、前記実施例における関連ステップを参照することができ、ここで、詳細な説明を省略する。
【0081】
本願の幾つかの実施例において、モデルの、ポジティブサンプルとネガティブサンプルの認識能力を向上させ、動的予測を実現させ、モデル運転効率を向上させるために、検出サブモデルを利用して、第1サンプル画像に対してターゲット検出を行い、第1サンプル画像における、ターゲット細胞を含む予測領域を得る過程において、第1サンプル画像に対して第2分類処理を行い、第1サンプル画像の画像分類結果を得ることもできる。ここで、画像分類結果は、第1サンプル画像にターゲット細胞が含まれるかどうかを表すためのものである。画像分類結果が、第1サンプル画像にターゲット細胞が含まれることを表す場合、第1サンプル画像に対して領域検出を行い、ターゲット細胞を含む予測領域を得る。具体的には、前記実施例における関連ステップを参照することができ、ここで、詳細な説明を省略する。なお、検出サブモデルは、第1部分と、第2部分と、を更に備えてもよく、第1部分は、第1サンプル画像に対して分類処理を行い、第1サンプル画像にターゲット細胞が含まれるかどうかを表す画像分類結果を得るように構成され、第2部分は、第1サンプル画像にターゲット細胞が含まれる時、第1サンプル画像に対して領域検出を行い、ターゲット細胞を含む予測領域を得るように構成される。具体的には、前記実施例における関連ステップを参照することができ、ここで、詳細な説明を省略する。なお、検出サブモデルは、第3部分を備えてもよく、第3部分は、第1サンプル画像に対して特徴抽出を行い、第1サンプル画像の画像特徴を得るように構成される。これにより、第1部分は、画像特徴に対して特徴抽出を行い、第1サンプル画像の画像分類結果を得て、第2部分は、画像特徴に対して領域検出を行い、ターゲット細胞を含む予測領域を得る。具体的には、第1部分は、グローバル分類ネットワークであり、第2部分は、画像検出ネットワークであり、第3部分は、特徴抽出ネットワークである。ここで、特徴抽出ネットワークは、変形可能な畳み込み層、及びグローバル情報強化モジュールのうちの少なくとも1つを含む。具体的には、前記実施例における関連ステップを参照することができ、ここで、詳細な説明を省略する。
【0082】
S53において、実際領域と予測領域に基づいて、検出サブモデルの第1損失値を決定し、実際クラスと予測クラスに基づいて、分類サブモデルの第2損失値を決定する。
【0083】
本願の幾つかの実施例において、平均平方誤差損失関数、クロスエントロピー損失関数などを用いて、検出サブモデルの第1損失値を決定することができる。本願の幾つかの実施例において、クロスエントロピー損失関数を用いて分類サブモデルの第2損失値を決定することができる。ここで、詳細な説明を省略する。
【0084】
ステップS54において、第1損失値及び第2損失値を利用して、検出サブモデル及び分類サブモデルのパラメータを調整する。
【0085】
具体的には、確率的勾配降下、指数平均化重み付け、Adam等の勾配降下最適化方法で、検出サブモデル及び分類サブモデルのパラメータに対して調整を行うことができる。ここで、詳細な説明を省略する。
【0086】
なお、第1サンプル画像及び第2サンプル画像を複数のバッチ(batch)に分け、ミニバッチ(mini-batch)の訓練方式で、検出サブモデル及び分類サブモデルに対して訓練を行うことができる。本願の幾つかの実施例において、訓練終了条件を設定することもできる。訓練終了条件を満たす場合、訓練を終了することができる。具体的には、訓練終了条件は、訓練の反復回数が所定の閾値(例えば、100回、500回など)以上であることと、第1損失値及び第2損失値が所定の損失閾値未満であり、減少しなくなることと、検証データ集合を利用して検出サブモデル及び分類サブモデルに対してそれぞれ検証を行うことで得られたモデルの性能が向上しなくなることと、を含み得るが、これらに限定されない。
【0087】
上記技術的解決手段は、訓練プロセスにおいて、ターゲット細胞の検出を行ってから、ターゲット細胞の分類を行い、検出と分類を分離させることで、サンプルデータのクラスのバランスが取れないという問題を解決することができ、更に、訓練で得られたモデルの正確性の向上に寄与し、ターゲット細胞の認識の正確性及び効率の向上に寄与する。
【0088】
図6を参照すると、
図6は、本願の実施例による画像認識装置60の構造フレームワークを示す概略図である。画像認識装置60は、画像取得モジュール61と、画像検出モジュール62と、画像分類モジュール63と、を備え、画像取得モジュール61は、認識されるべき病理学的画像を取得するように構成され、画像検出モジュール62は、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得るように構成され、画像分類モジュール63は、認識モデルにおける分類サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得るように構成される。
【0089】
上記技術的解決手段は、認識モデルにおける検出サブモデルを用いて、取得された認識されるべき病理学的画像に対してターゲット検出を行うことで、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得る。また、認識モデルにおける分析サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得る。従って、ターゲット細胞の検出を行ってから、ターゲット細胞の分類を行うことができ、検出と分類を分離させることができる。これにより、病理学的画像におけるターゲット細胞を正確かつ効率的に認識することができる。
【0090】
本願の幾つかの実施例において、画像検出モジュール62は、第1部分サブモジュールを備え、第1部分サブモジュールは、検出サブモデルの第1部分を利用して、認識されるべき病理学的画像に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得るように構成され、画像分類結果は、認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものであり、画像検出モジュール62は、第2部分サブモジュールを更に備え、第2部分サブモジュールは、画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれることを表す場合、検出サブモデルの第2部分を利用して、認識されるべき病理学的画像に対して領域検出を行い、ターゲット細胞を含む検出領域を得るように構成される第2部分サブモジュールを更に備える。
【0091】
前記実施例と異なっており、検出サブモデルの第1部分により、認識されるべき病理学的画像に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得る。画像分類結果は、認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものである。画像分類結果は、認識されるべき病理学的画像にターゲット細胞が含まれることを表す時、検出サブモデルの第2部分を利用して、認識されるべき病理学的画像に対して領域検出を行い、ターゲット細胞を含む検出領域を得る。従って、ターゲット細胞の動的検出を実現させ、ターゲット細胞の認識効率を向上させることができる。
【0092】
本願の幾つかの実施例において、画像検出モジュール62は、結果提示サブモジュールを更に備え、結果提示サブモジュールは、画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す場合、第1部分が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す検出結果提示を出力するように構成される。
【0093】
前記実施例と異なっており、検出サブモデルの第1部分を利用して、認識されるべき病理学的画像に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得た後、画像分類結果が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す場合、第1部分が、認識されるべき病理学的画像にターゲット細胞が含まれないことを表す検出結果提示を出力することを更に含む。
【0094】
本願の幾つかの実施例において、画像検出モジュール62は、第3部分サブモジュールを更に備え、第3部分サブモジュールは、検出サブモデルの第3部分を利用して、認識されるべき病理学的画像に対して特徴抽出を行い、認識されるべき病理学的画像の画像特徴を得るように構成される。
【0095】
前記実施例と異なっており、検出サブモデルの第3部分を利用して、認識されるべき病理学的画像に対して特徴抽出を行い、認識されるべき病理学的画像の画像特徴を得ることで、まず、認識されるべき病理学的画像に対して処理を行い、更に、後続でこれを基に、検出サブモデルを利用して他の処理を行うことができるため、モデルの運転効率の向上に寄与する。
【0096】
本願の幾つかの実施例において、第1部分サブモジュールは具体的には、検出サブモデルの第1部分を利用して、画像特徴に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得るように構成される。
【0097】
前記実施例と異なっており、検出サブモデルの第1部分を利用して、第3部分により抽出された画像特徴に対して第2分類処理を行い、認識されるべき病理学的画像の画像分類結果を得ることで、分類処理の正確性を向上させることができる。
【0098】
本願の幾つかの実施例において、第2部分サブモジュールは具体的には、検出サブモデルの第2部分を利用して、画像特徴に対して領域検出を行い、ターゲット細胞を含む検出領域を得るように構成される。
【0099】
前記実施例と異なっており、検出サブモデルの第2部分を利用して、画像特徴に対して領域検出を行い、ターゲット細胞を含む検出領域を得ることで、ターゲット細胞の認識の正確性の向上に寄与する。
【0100】
本願の幾つかの実施例において、第1部分は、グローバル分類ネットワークであり、第2部分は、画像検出ネットワークであり、第3部分は、特徴抽出ネットワークであり、ここで、特徴抽出ネットワークは、変形可能な畳み込み層を含み、グローバル情報強化モジュールのうちの少なくとも1つを含む。
【0101】
前記実施例と異なっており、特徴抽出ネットワークを、変形可能な畳み込み層を含むものとすることで、多形態のターゲット細胞に対する認識の正確性を向上させることができる。特徴抽出ネットワークを、グローバル情報強化モジュールを含むもののうちの少なくとも1つとすることで、距離が長くて依存関係を有する特徴の取得に寄与し、ターゲット細胞の認識の正確性の向上に寄与する。
【0102】
本願の幾つかの実施例において、画像分類モジュール63は、特徴抽出サブモジュールを備え、特徴抽出サブモジュールは、分類サブモデルを利用して、認識されるべき病理学的画像の検出領域に対して特徴抽出を行い、検出領域の画像特徴を得るように構成され、画像分類モジュール63は、分類処理サブモジュールを備え、分類処理サブモジュールは、検出領域の画像特徴に対して第1分類処理を行い、ターゲット細胞のクラスを得るように構成される。
【0103】
前記実施例と異なっており、認識されるべき病理学的画像の検出領域に対して特徴抽出を行い、検出領域の画像特徴を得て、検出領域の画像特徴に対して第1分類処理を行い、ターゲット細胞のクラスを得ることで、分類処理の効率の向上に寄与する。
【0104】
本願の幾つかの実施例において、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。
【0105】
前記実施例と異なっており、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含む。単一の病変細胞及び病変細胞クラスタの認識に寄与する。また、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。ターゲット細胞の病変の等級付けの実現に寄与する。
【0106】
図7を参照すると、
図7は、本願の実施例による認識モデルの訓練装置70の構造フレームワークを示す概略図である。認識モデルは、検出サブモデルと、分類サブモデルと、を備え、認識モデルの訓練装置70は、画像取得モジュール71と、モデル実行モジュール72と、損失決定モジュール73と、パラメータ調整モジュール74と、を備え、画像取得モジュール71は、第1サンプル画像及び第2サンプル画像を取得するように構成され、第1サンプル画像に、ターゲット細胞に対応する実際領域がアノテーションされており、第2サンプル画像に、ターゲット細胞の実際クラスがアノテーションされており、モデル実行モジュール72は、検出サブモデルを利用して、第1サンプル画像に対してターゲット検出を行い、第1サンプル画像における、ターゲット細胞を含む予測領域を得て、分類サブモデルを利用して、第2サンプル画像に対して第1分類処理を行い、ターゲット細胞の予測クラスを得るように構成され、損失決定モジュール73は、実際領域と予測領域に基づいて、検出サブモデルの第1損失値を決定し、実際クラスと予測クラスに基づいて、分類サブモデルの第2損失値を決定するように構成され、パラメータ調整モジュール74は、第1損失値及び第2損失値を利用して、検出サブモデル及び分類サブモデルのパラメータを調整するように構成される。
【0107】
上記技術的解決手段は、訓練プロセスにおいて、ターゲット細胞の検出を行ってから、ターゲット細胞の分類を行い、検出と分類を分離させることで、サンプルデータのクラスのバランスが取れないという問題を解決することができ、更に、訓練で得られたモデルの正確性の向上に寄与し、ターゲット細胞の認識の正確性及び効率の向上に寄与する。
【0108】
本願の幾つかの実施例において、モデル実行モジュール72は、初期分類サブモジュールを備え、初期分類サブモジュールは、第1サンプル画像に対して第2分類処理を行い、第1サンプル画像の画像分類結果を得るように構成され、画像分類結果は、第1サンプル画像にターゲット細胞が含まれるかどうかを表すためのものであり、モデル実行モジュール72は、領域検出サブモジュールを備え、領域検出サブモジュールは、画像分類結果が、第1サンプル画像にターゲット細胞が含まれることを表す場合、第1サンプル画像に対して領域検出を行い、ターゲット細胞を含む予測領域を得るように構成される。
【0109】
前記実施例と異なっており、訓練プロセスにおいて、画像分類結果が、第1サンプル画像にターゲット細胞が含まれることを表す場合、第1サンプル画像に対して領域検出を行い、ターゲット細胞を含む予測領域を得る。モデルの、ポジティブサンプルとネガティブサンプルの認識能力を向上させ、誤検出確率を低下させることができる。訓練で得られたモデルの正確性の向上に寄与し、ターゲット細胞の認識の正確性の向上に寄与する。
【0110】
本願の幾つかの実施例において、認識モデルの訓練装置70は、データ強化モジュールを更に備え、データ強化サブモジュールは、第1サンプル画像及び第2サンプル画像に対してデータ強化を行うように構成される。
【0111】
前記実施例と異なっており、第1サンプル画像及び第2サンプル画像に対してデータ強化を行うことで、サンプルの多様性を向上させることができ、オーバーフィッティングを避けることに寄与し、モデルの汎化性能を向上させる。
【0112】
本願の幾つかの実施例において、認識モデルの訓練装置70は、正規化処理モジュールを更に備え、正規化処理モジュールは、第1サンプル画像及び第2サンプル画像の画素値に対して正規化処理を行うように構成される。
【0113】
前記実施例と異なっており、第1サンプル画像及び第2サンプル画像における画素値に対して正規化処理を行うことで、モデルの収束速度の向上に寄与する。
【0114】
本願の幾つかの実施例において、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。
【0115】
前記実施例と異なっており、ターゲット細胞は、ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。単一の病変細胞及び病変細胞クラスタの認識に寄与する。また、ターゲット細胞のクラスは、ターゲット細胞の病変程度を表すためのものである。ターゲット細胞の病変の等級付けの実現に寄与する。
【0116】
図8を参照すると、
図8は、本願の実施例による電子機器80の構造フレームワークを示す概略図である。電子機器80は、互いに結合されたメモリ81及びプロセッサ82を備え、プロセッサ82は、メモリ81に記憶されたプログラム命令を実行して、上記いずれか1つの画像認識方法の実施例のステップ又は上記いずれか1つの認識モデルの訓練方法の実施例のステップを実現するように構成される。具体的な実施シーンにおいて、電子機器80は、マイクロコンピュータ、サーバを含み得るが、これらに限定されない。なお、電子機器80は、ノートパソコン、タブレットなどの携帯機器を含んでもよく、ここで、これを限定しない。
【0117】
具体的には、プロセッサ82は、その自体及びメモリ81を制御して、上記いずれか1つの画像認識方法の実施例のステップ又は上記いずれか1つの認識モデルの訓練方法の実施例のステップを実現させるように構成される。プロセッサ82は、中央演算装置(Central Processing Unit:CPU)と呼ばれてもよい。プロセッサ82は、信号処理能力を持つ集積回路チップであってもよい。プロセッサ82は、汎用プロセッサ、デジタル信号プロセッサ(Digital Signal Processor:DSP)、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array:FPGA)又は他のプログラマブルゲートアレイ、ディスクリートゲート又はトランジスタ論理デバイス、ディスクリートハードウェアコンポーネントであってもよい。汎用プロセッサは、マイクロプロセッサであってもよく、該プロセッサは、如何なる従来のプロセッサなどであってもよい。なお、プロセッサ82は、集積回路チップにより共同で実現してもよい。
【0118】
上記技術的解決手段は、病理学的画像におけるターゲット細胞を正確かつ効果的に認識することができる。
【0119】
図9を参照すると、
図9は、本願の実施例によるコンピュータ可読記憶媒体90の構造フレームワークを示す概略図である。コンピュータ可読記憶媒体90に、プロセッサにより実行可能なプログラム命令901が記憶されており、プログラム命令901は、プロセッサに上記いずれか1つの画像認識方法の実施例のステップ又は上記いずれか1つの認識モデルの訓練方法の実施例のステップを実現させるように構成される。
【0120】
上記技術的解決手段は、病理学的画像におけるターゲット細胞を正確かつ効果的に認識することができる。
【0121】
本願の実施例は、コンピュータプログラムを提供する。前記コンピュータプログラムは、コンピュータ可読コードを含み、前記コンピュータ可読コードが電子機器で実行されると、前記電子機器におけるプロセッサに、本願の実施例で提供されるいずれか1つの画像認識方法、又は、本願の実施例で提供されるいずれか1つの認識モデルの訓練方法を実行させる。
【0122】
本願で提供される幾つかの実施例において、開示される方法及び装置は、他の方式によって実現できることを理解すべきである。例えば、以上に記載した装置の実施形態はただ例示的なもので、例えば、前記モジュール又はコンポーネントの分割はただロジック機能の分割で、実際に実現する時は他の分割方式によってもよい。例えば、複数のコンポーネント又はユニットを組み合わせてもよいし、別のシステムに組み込んでもよい。又は若干の特徴を無視してもよいし、実行しなくてもよい。また、示したか或いは検討した相互間の結合又は直接的な結合又は通信接続は、幾つかのインタフェース、装置又はコンポーネントによる間接的な結合又は通信接続であってもよく、電気的、機械的または他の形態であってもよい。
【0123】
分離部材として説明したコンポーネントは、物理的に別個のものであってもよいし、そうでなくてもよい。コンポーネントとして示された部材は、物理的コンポーネントであってもよいし、そうでなくてもよい。即ち、同一の位置に位置してもよいし、複数のネットワークコンポーネントに分布してもよい。実際の需要に応じてそのうちの一部又は全てのコンポーネントにより本実施例の方策の目的を実現することができる。
【0124】
また、本願の各実施例における各機能コンポーネントは一つの処理コンポーネントに集積されてもよいし、各コンポーネントが物理的に別個のものとして存在してもよいし、2つ以上のコンポーネントが一つのユニットに集積されてもよい。上記集積したコンポーネントはハードウェアとして実現してもよく、ソフトウェア機能コンポーネントとして実現してもよい。
【0125】
集積したものは、ソフトウェア機能コンポーネントの形で実現され、かつ独立した製品として販売または使用されるとき、コンピュータにより読み取り可能な記憶媒体内に記憶されてもよいことに留意されたい。このような理解のもと、本願の実施例の技術的解決手段は、本質的に、又は、従来技術に対して貢献をもたらした部分又は該技術的解決手段の一部は、ソフトウェア製品の形式で具現することができ、このようなコンピュータソフトウェア製品は、記憶媒体に記憶しても良く、また、1台のコンピュータ設備(パソコン、サーバ、又はネットワーク装置など)又はプロセッサ(processor)に、本願の各実施例に記載の方法の全部又は一部のステップを実行させるための若干の命令を含む。前記の記憶媒体は、USBメモリ、リムーバブルハードディスク、読み出し専用メモリ(ROM:Read Only Memory)、ランダムアクセスメモリ(RAM:Random Access Memory)、磁気ディスク又は光ディスクなどの、プログラムコードを記憶できる種々の媒体を含む。
【産業上の利用可能性】
【0126】
本願の実施例は、画像認識方法、認識モデルの訓練方法及び関連装置、機器を提供する。ここで、画像認識方法は、認識されるべき病理学的画像を取得することと、認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることと、認識モデルにおける分類サブモデルを用いて、検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得ることと、を含む。本願の実施例の画像認識方法によれば、病理学的画像におけるターゲット細胞を正確かつ効果的に認識することができる。
【手続補正書】
【提出日】2021-12-21
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
画像認識方法であって、
認識されるべき病理学的画像を取得することと、
認識モデルにおける検出サブモデルを用いて、認識されるべき病理学的画像に対してターゲット検出を行い、認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることと、
認識モデルにおける分類サブモデルを用いて、前記検出領域に対して第1分類処理を行い、ターゲット細胞のクラスを得ることと、を含む、画像認識方法。
【請求項2】
前記認識モデルにおける検出サブモデルを用いて、前記認識されるべき病理学的画像に対してターゲット検出を行い、前記認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることは、
前記検出サブモデルの第1部分を利用して、前記認識されるべき病理学的画像に対して第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得ることであって、前記画像分類結果は、前記認識されるべき病理学的画像にターゲット細胞が含まれるかどうかを表すためのものである、ことと、
前記画像分類結果が、前記認識されるべき病理学的画像に前記ターゲット細胞が含まれることを表す場合、前記検出サブモデルの第2部分を利用して、前記認識されるべき病理学的画像に対して領域検出を行い、前記ターゲット細胞を含む検出領域を得
、及び/又は、前記画像分類結果が、前記認識されるべき病理学的画像にターゲット細胞が含まれないことを表す場合、前記第1部分が、前記認識されるべき病理学的画像に前記ターゲット細胞が含まれないことを表す検出結果提示を出力することと、を含むことを特徴とする
請求項1に記載の画像認識方法。
【請求項3】
前記認識モデルにおける検出サブモデルを用いて、前記認識されるべき病理学的画像に対してターゲット検出を行い、前記認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得ることは、
前記検出サブモデルの第3部分を利用して、前記認識されるべき病理学的画像に対して特徴抽出を行い、前記認識されるべき病理学的画像の画像特徴を得ることを更に含むことを特徴とする
請求項
2に記載の画像認識方法。
【請求項4】
前記検出サブモデルの第1部分を利用して、前記認識されるべき病理学的画像に対して、第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得ることは、前記検出サブモデルの第1部分を利用して、前記画像特徴に対して第2分類処理を行い、前記認識されるべき病理学的画像の画像分類結果を得ることを含
み、
及び/又は
前記検出サブモデルの第2部分を利用して、前記認識されるべき病理学的画像に対して領域検出を行い、前記ターゲット細胞を含む検出領域を得ることは、前記検出サブモデルの第2部分を利用して、前記画像特徴に対して領域検出を行い、前記ターゲット細胞を含む検出領域を得ることを含むことを特徴とする
請求項3に記載の画像認識方法。
【請求項5】
前記第1部分は、グローバル分類ネットワークであり、前記第2部分は、画像検出ネットワークであり、前記第3部分は、特徴抽出ネットワークであり、ここで、前記特徴抽出ネットワークは、変形可能な畳み込み層、及びグローバル情報強化モジュールのうちの少なくとも1つを含むことを特徴とする
請求項
3又は4に記載の画像認識方法。
【請求項6】
前記認識モデルにおける分類サブモデルを利用して、前記検出領域に対して第1分類処理を行い、前記ターゲット細胞のクラスを得ることは、
前記分類サブモデルを利用して、前記認識されるべき病理学的画像の検出領域に対して特徴抽出を行い、前記検出領域の画像特徴を得ることと、
前記検出領域の画像特徴に対して第1分類処理を行い、前記ターゲット細胞のクラスを得ることと、を含むことを特徴とする
請求項1又は2に記載の画像認識方法。
【請求項7】
前記ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、前記ターゲット細胞のクラスは、前記ターゲット細胞の病変程度を表すためのものであることを特徴とする
請求項1から
6のうちいずれか一項に記載の画像認識方法。
【請求項8】
認識モデルの訓練方法であって、前記認識モデルは、検出サブモデルと、分類サブモデルと、を備え、前記訓練方法は、
第1サンプル画像及び第2サンプル画像を取得することであって、前記第1サンプル画像に、ターゲット細胞に対応する実際領域がアノテーションされており、前記第2サンプル画像に、ターゲット細胞の実際クラスがアノテーションされている、ことと、
前記検出サブモデルを利用して、前記第1サンプル画像に対してターゲット検出を行い、前記第1サンプル画像における、ターゲット細胞を含む予測領域を得て、前記分類サブモデルを利用して、前記第2サンプル画像に対して第1分類処理を行い、前記ターゲット細胞の予測クラスを得ることと、
前記実際領域と前記予測領域に基づいて、前記検出サブモデルの第1損失値を決定し、前記実際クラスと前記予測クラスに基づいて、前記分類サブモデルの第2損失値を決定することと、
前記第1損失値及び前記第2損失値を利用して、前記検出サブモデル及び前記分類サブモデルのパラメータを調整することと、を含む、訓練方法。
【請求項9】
前記検出サブモデルを利用して、前記第1サンプル画像に対してターゲット検出を行い、前記第1サンプル画像における、ターゲット細胞を含む予測領域を得ることは、
前記第1サンプル画像に対して第2分類処理を行い、前記第1サンプル画像の画像分類結果を得ることであって、前記画像分類結果は、前記第1サンプル画像に前記ターゲット細胞が含まれるかどうかを表すためのものである、ことと、
前記画像分類結果が、前記第1サンプル画像にターゲット細胞が含まれることを表す場合、前記第1サンプル画像に対して領域検出を行い、前記ターゲット細胞を含む予測領域を得ることと、を含むことを特徴とする
請求項
8に記載の訓練方法。
【請求項10】
前記検出サブモデルを利用して前記第1サンプル画像に対してターゲット検出を行い、前記第1サンプル画像における、ターゲット細胞を含む予測領域を得て、前記分類サブモデルを利用して前記第2サンプル画像に対して第1分類処理を行い、前記ターゲット細胞の予測クラスを得る前に、
前記第1サンプル画像及び前記第2サンプル画像に対してデータ強化を行うこと、及び/又は、
第1サンプル画像及び第2サンプル画像の画素値に対して正規化処理を行うこと、を更に含み、
前記ターゲット細胞は、単一の病変細胞、及び病変細胞クラスタのうちのいずれか1つを含み、前記ターゲット細胞のクラスは、前記ターゲット細胞の病変程度を表すためのものであることを特徴とする
請求項
8又は9に記載の訓練方法。
【請求項11】
画像認識装置であって、
認識されるべき病理学的画像を取得するように構成される画像取得モジュールと、
認識モデルにおける検出サブモデルを用いて、前記認識されるべき病理学的画像に対してターゲット検出を行い、前記認識されるべき病理学的画像における、ターゲット細胞を含む検出領域を得るように構成される画像検出モジュールと、
前記認識モデルにおける分類サブモデルを用いて、前記検出領域に対して第1分類処理を行い、前記ターゲット細胞のクラスを得るように構成される画像分類モジュールと、を備える、画像認識装置。
【請求項12】
認識モデルの訓練装置であって、前記認識モデルは、検出サブモデルと、分類サブモデルと、を備え、前記訓練装置は、
第1サンプル画像及び第2サンプル画像を取得するように構成される画像取得モジュールであって、前記第1サンプル画像に、ターゲット細胞に対応する実際領域がアノテーションされており、前記第2サンプル画像に、ターゲット細胞の実際クラスがアノテーションされている、画像取得モジュールと、
前記検出サブモデルを利用して、前記第1サンプル画像に対してターゲット検出を行い、前記第1サンプル画像における、ターゲット細胞を含む予測領域を得て、前記分類サブモデルを利用して、前記第2サンプル画像に対して第1分類処理を行い、前記ターゲット細胞の予測クラスを得るように構成されるモデル実行モジュールと、
前記実際領域と前記予測領域に基づいて、前記検出サブモデルの第1損失値を決定し、前記実際クラスと前記予測クラスに基づいて、前記分類サブモデルの第2損失値を決定するように構成される損失決定モジュールと、
前記第1損失値及び前記第2損失値を利用して、前記検出サブモデル及び前記分類サブモデルのパラメータを調整するように構成されるパラメータ調整モジュールと、を備える、訓練装置。
【請求項13】
電子機器であって、前記電子機器は、互いに結合されるメモリとプロセッサを備え、前記プロセッサは、前記メモリに記憶されているプログラム命令を実行して、請求項1から
7のうちいずれか一項に記載の画像認識方法、又は、請求項
8から10のうちいずれか一項に記載の認識モデルの訓練方法を
実行する、電子機器。
【請求項14】
コンピュータに請求項1から
7のうちいずれか一項に記載の画像認識方法、又は、請求項
8から10のうちいずれか一項に記載の認識モデルの訓練方法を
実行させるためのコンピュータプログラムを記憶した、コンピュータ可読記憶媒体。
【請求項15】
コンピュータに、請求項1から
7のうちいずれか一項に記載の画像認識方法、又は、請求項
8から10のうちいずれか一項に記載の認識モデルの訓練方法を実行させる、コンピュータプログラム。
【国際調査報告】