(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-05-16
(45)【発行日】2024-05-24
(54)【発明の名称】病理画像の分類方法、装置、デバイスおよび記憶媒体
(51)【国際特許分類】
G06T 7/00 20170101AFI20240517BHJP
G06V 10/82 20220101ALI20240517BHJP
【FI】
G06T7/00 350C
G06V10/82
G06T7/00 612
(21)【出願番号】P 2023095155
(22)【出願日】2023-06-09
【審査請求日】2023-06-09
(31)【優先権主張番号】202211578025.0
(32)【優先日】2022-12-06
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】521162399
【氏名又は名称】之江実験室
(74)【代理人】
【識別番号】110000729
【氏名又は名称】弁理士法人ユニアス国際特許事務所
(72)【発明者】
【氏名】朱 聞▲タオ▼
(72)【発明者】
【氏名】薛 梦凡
(72)【発明者】
【氏名】呉 元鋒
(72)【発明者】
【氏名】黄 海亮
(72)【発明者】
【氏名】顔 成鋼
(72)【発明者】
【氏名】張 少霆
【審査官】伊知地 和之
(56)【参考文献】
【文献】中国特許出願公開第111723812(CN,A)
【文献】中国特許出願公開第113178255(CN,A)
【文献】Saverio Vedacchino et al.,HAD-Net: A Hierarchical Adversarial Knowledge Distillation Network for Improved Enhanced Tumour Segmentation Without Post-Contrast Images,arXiv.org[online],arXiv(Cornell University Library),2021年03月30日,[検索日 2024.2.9], インターネット:<URL:https://arxiv.org/pdf/2103.16617.pdf>
【文献】Ge Shiming et al.,“Low-Resolution Face Recognition in the Wild via Selective Knowledge Distillation”,IEEE Transactions on Image Processing,IEEE,2019年,Vol.28,No.4,pp.2051-2062,DOI: 10.1109/TIP.2018.2883743
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00 - 3/12
G06N 7/08 - 99/00
G06T 1/00 - 1/40
G06T 3/00 - 5/94
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G06V 30/418
G06V 40/16
G06V 40/20
CSDB(日本国特許庁)
(57)【特許請求の範囲】
【請求項1】
検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るステップと、
事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するステップと、
前記複数のダウンサンプリング画像ブロックを、分類のために前記分類サブネットワークに入力し、前記複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果を得るステップと、
前記複数のダウンサンプリング画像ブロックのそれぞれの前記初期分類結果に基づいて、前記病理画像に対応する分類結果を得るステップと、を含む、
ことを特徴とする病理画像の分類方法。
【請求項2】
検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るステップは、
前記検出すべき病理画像に対してダウンサンプリング処理を行い、ダウンサンプリング病理画像を得るステップと、
前記ダウンサンプリング病理画像を前処理して、前記複数のダウンサンプリング画像ブロックを得るステップであって、前記前処理は、フィルタリング処理とカット処理とを含むステップと、を含む、
ことを特徴とする請求項1に記載の方法。
【請求項3】
事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するステップは、
教師分類ネットワークと、生成器と、
判別器と、生徒分類ネットワークとを含む蒸留と敵対的ネットワークを構築するステップと、
訓練データセットを構築するステップであって、前記訓練データセットは複数の高解像度画像ブロックと複数の低解像度画像ブロックとを含み、前記複数の高解像度画像ブロックは高解像度病理画像から得られ、前記複数の低解像度画像ブロックは、前記高解像度病理画像に対してダウンサンプリング処理を行って得られた低解像度病理画像から得られる、ステップと、
前記訓練データセットを前記蒸留と敵対的ネットワークに入力して訓練を行い、訓練済みの蒸留と敵対的ネットワークを得るステップと、
前記訓練済みの蒸留と敵対的ネットワークから前記生成器と前記生徒分類ネットワークとを抽出するステップと、
前記生成器と前記生徒分類ネットワークとに基づいて前記分類サブネットワークを構築するステップと、を含む、
ことを特徴とする請求項1に記載の方法。
【請求項4】
前記訓練データセットを前記蒸留と敵対的ネットワークに入力して訓練を行い、訓練済みの蒸留と敵対的ネットワークを得るステップは、
前記高解像度画像ブロックを前記教師分類ネットワークの入力として前記教師分類ネットワークを訓練するステップと、
前記低解像度画像ブロックを前記生成器に入力して、新たに生成された画像ブロックを得、前記新たに生成された画像ブロックと前記高解像度画像ブロックとを一緒に前記判別器に入力して前記判別器を訓練するステップと、
訓練済みの前記教師分類ネットワークと訓練済みの前記判別器とに基づいて、前記高解像度画像ブロックと前記低解像度画像ブロックの両方を前記蒸留と敵対的ネットワークの入力として前記生成器と前記生徒分類ネットワークとを訓練するステップと、
訓練済みの前記教師分類ネットワークと、訓練済みの前記生成器と、訓練済みの前記判別器と、訓練済みの前記生徒分類ネットワークとに基づいて、訓練済みの蒸留と敵対的ネットワークを得るステップと、を含む、
ことを特徴とする請求項3に記載の方法。
【請求項5】
前記複数のダウンサンプリング画像ブロックのそれぞれの前記初期分類結果に基づいて、前記病理画像に対応する分類結果を得るステップは、
前記初期分類結果における異なるカテゴリの前記ダウンサンプ
リング画像ブロックの数に基づいて、前記ダウンサンプ
リング画像ブロックの数が最も多いカテゴリを前記病理画像に対応する分類結果とするステップを含む、
ことを特徴とする請求項1に記載の方法。
【請求項6】
検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るための処理モジュールと、
事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するためのネットワークモジュールと、
前記複数のダウンサンプリング画像ブロックを、分類のために前記分類サブネットワークに入力し、前記複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果を得るための第1の分類モジュールと、
前記複数のダウンサンプリング画像ブロックのそれぞれの前記初期分類結果に基づいて、前記病理画像に対応する分類結果を得るための第2の分類モジュールと、を含む、
ことを特徴とする病理画像の分類装置。
【請求項7】
メモリとプロセッサとを含むコンピュータデバイスであって、前記メモリは、コンピュータプログラムを記憶しており、前記プロセッサは、前記コンピュータプログラムを実行すると、請求項1~5のいずれか1項に記載の病理画像の分類方法を実施する、
ことを特徴とするコンピュータデバイス。
【請求項8】
コンピュータプログラムを記憶しているコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行されると、請求項1~5のいずれか1項に記載の病理画像の分類方法が実施される、
ことを特徴とするコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、医療画像処理技術分野および人工知能技術分野に関し、特に、病理画像の分類方法、装置、デバイスおよび記憶媒体に関する。
【背景技術】
【0002】
病理画像は、がんの最終診断のためのゴールドスタンダードである。病理画像を医師が手作業で分類する方法は、時間と手間がかかるだけでなく、その診断結果は医師の経験やレベルなどの人間の主観的な要素に影響されやすい。
【0003】
また、病理画像解析を強化するための人工知能技術の利用は、人工知能技術と医療分野の知識を密接に結びつける良い技術的機会である。現在、深層学習に基づく病理画像分類法では、病変領域がラベル付けされた病理画像をニューラルネットワークに投入して、ニューラルネットワークを訓練する教師あり学習を採用することが一般的である。
【0004】
しかし、通常、病理画像は非常に高い解像度を有するため、1枚の病理画像のサイズは300Mを超え、5Gに達することもある。このような大量のデータにより、現在の深層学習モデルによる病理画像の分類は、モデルの訓練時間が長く、分類結果の予測速度が遅く、時間がかかるという欠点がある。
【発明の概要】
【0005】
これを踏まえて、上記技術的課題に対応し、病理画像を迅速かつ効率的に分類することができる病理画像の分類方法、装置、デバイスおよび記憶媒体を提供することが必要である。
【0006】
第1の側面において、本発明は、病理画像の分類方法を提供する。前記方法は、
検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るステップと、
事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するステップと、
前記複数のダウンサンプリング画像ブロックを、分類のために前記分類サブネットワークに入力し、前記複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果を得るステップと、
前記複数のダウンサンプリング画像ブロックのそれぞれの前記初期分類結果に基づいて、前記病理画像に対応する分類結果を得るステップと、を含む。
【0007】
一実施形態において、検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るステップは、
前記検出すべき病理画像に対してダウンサンプリング処理を行い、ダウンサンプリング病理画像を得るステップと、
前記ダウンサンプリング病理画像を前処理して、前記複数のダウンサンプリング画像ブロックを得るステップであって、前記前処理は、フィルタリング処理とカット処理とを含むステップと、を含む。
【0008】
一実施形態において、事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するステップは、
教師分類ネットワークと、生成器と、判別器と、生徒分類ネットワークとを含む蒸留と敵対的ネットワークを構築するステップと、
訓練データセットを構築するステップであって、前記訓練データセットは複数の高解像度画像ブロックと複数の低解像度画像ブロックとを含み、前記複数の高解像度画像ブロックは高解像度病理画像から得られ、前記複数の低解像度画像ブロックは、前記高解像度病理画像に対してダウンサンプリング処理を行って得られた低解像度病理画像から得られる、ステップと、
前記訓練データセットを前記蒸留と敵対的ネットワークに入力して訓練を行い、訓練済みの蒸留と敵対的ネットワークを得るステップと、
前記訓練済みの蒸留と敵対的ネットワークから前記生成器と前記生徒分類ネットワークとを抽出するステップと、
前記生成器と前記生徒分類ネットワークとに基づいて前記分類サブネットワークを構築するステップと、を含む。
【0009】
一実施形態において、前記訓練データセットを前記蒸留と敵対的ネットワークに入力して訓練を行い、訓練済みの蒸留と敵対的ネットワークを得るステップは、
前記高解像度画像ブロックを前記教師分類ネットワークの入力として前記教師分類ネットワークを訓練するステップと、
前記低解像度画像ブロックを前記生成器に入力して、新たに生成された画像ブロックを得、前記新たに生成された画像ブロックと前記高解像度画像ブロックとを一緒に前記判別器に入力して前記判別器を訓練するステップと、
訓練済みの前記教師分類ネットワークと訓練済みの前記判別器とに基づいて、前記高解像度画像ブロックと前記低解像度画像ブロックの両方を前記蒸留と敵対的ネットワークの入力として前記生成器と前記生徒分類ネットワークとを訓練するステップと、
訓練済みの前記教師分類ネットワークと、訓練済みの前記生成器と、訓練済みの前記判別器と、訓練済みの前記生徒分類ネットワークとに基づいて、訓練済みの蒸留と敵対的ネットワークを得るステップと、を含む。
【0010】
一実施形態において、前記複数のダウンサンプリング画像ブロックのそれぞれの前記初期分類結果に基づいて、前記病理画像に対応する分類結果を得るステップは、
前記初期分類結果における異なるカテゴリの前記ダウンサンプリング画像ブロックの数に基づいて、前記ダウンサンプリング画像ブロックの数が最も多いカテゴリを前記病理画像に対応する分類結果とするステップを含む。
【0011】
第2の側面において、本発明は、病理画像の分類装置を提供する。前記装置は、
検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るための処理モジュールと、
事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するためのネットワークモジュールと、
前記複数のダウンサンプリング画像ブロックを、分類のために前記分類サブネットワークに入力し、前記複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果を得るための第1の分類モジュールと、
前記複数のダウンサンプリング画像ブロックのそれぞれの前記初期分類結果に基づいて、前記病理画像に対応する分類結果を得るための第2の分類モジュールと、を含む。
【0012】
第3の側面において、本発明は、コンピュータデバイスを提供する。前記コンピュータデバイスはメモリとプロセッサとを含み、前記メモリは、コンピュータプログラムを記憶しており、前記プロセッサは、前記コンピュータプログラムを実行すると、第1の側面に記載の方法を実施する。
【0013】
第4の側面において、本発明は、コンピュータ可読記憶媒体を提供する。前記コンピュータ可読記憶媒体はコンピュータプログラムを記憶しており、前記コンピュータプログラムがプロセッサによって実行されると、第1の側面に記載の方法が実施される。
【0014】
上記の病理画像の分類方法、装置、デバイスおよび記憶媒体は、低解像度のダウンサンプリング画像ブロックを、分類ネットワークに入力するサンプルとすることにより、分類ネットワークに入力するデータ量を削減し、分類結果の予測時間を短縮する。病理画像を正確に分類できる蒸留と敵対的ネットワークを構築し、その中から軽量な分類サブネットワークを疾患分類のための最終的な分類ネットワークとして抽出することにより、デバイスのメモリ消費を削減し、分類結果の予測を高速化し、病理画像の分類効率を大幅に向上させる。
【図面の簡単な説明】
【0015】
ここで説明される添付図面は、本発明の理解を深めるために用いられ、本発明の一部を構成し、本発明の例示的な実施形態およびその説明は、本発明を説明するために用いられ、本発明の不当な制限を構成するものではない。
【
図1】本発明の実施形態における病理画像の分類方法を実行するための端末のハードウェア構成を示すブロック図である。
【
図2】本発明の実施形態における病理画像の分類方法のフローを示す模式図である。
【
図3】本発明の実施形態における
判別器の訓練のフローを示す概略図である。
【
図4】本発明の実施形態における蒸留と敵対的ネットワークの訓練のフローを示す概略図である。
【
図5】本発明の別の実施形態における病理画像の分類方法のフローを示す模式図である。
【
図6】本発明の実施形態における病理画像の分類装置の構成を示すブロック図である。
【
図7】本発明の実施形態におけるコンピュータデバイスの内部構造を示す図である。
【発明を実施するための形態】
【0016】
本発明の実施形態の目的、技術的解決手段および利点をより明確にするために、以下、本発明を添付の図面および実施形態とともに記載し、説明する。
【0017】
特に定義しない限り、本発明で使用される技術用語または科学用語は、本発明の属する技術分野における通常の知識を有する者によって理解される通常の意味を有するものとする。「一」、「一つ」、「一種」、「当該」、「これら」などの用語は、量的な制限を表すものではなく、単数または複数であってもよい。本発明で使用される用語「含む」、「包含する」、「有する」およびこれらの変形は、非排他的包含を意図しており、例えば、一連のステップまたはモジュール(ユニット)からなるプロセス、方法およびシステム、製品またはデバイスは、記載されたステップまたはモジュール(ユニット)だけでなく、記載されていないステップまたはモジュール(ユニット)も含むことがあり、またはそれらのプロセス、方法、製品またはデバイスに固有のステップまたはモジュール(ユニット)を含むことがある。本発明で使用される用語「接続」、「連結」、「結合」などの用語は、物理的または機械的な接続に限定されず、直接または間接にかかわらず、電気的接続を含み得る。本発明で使用される「複数」は、2つ以上を意味する。「および/または」は、関連する対象の関係を説明し、3つの関係が存在し得ることを表し、例えば、「Aおよび/またはB」は、Aだけの存在、AとBの両方の存在、Bだけの存在の3つの場合を表し得る。通常、文字「/」は、その前後の関連する対象は、「または」の関係であることを表す。本発明で使用される用語「第1」、「第2」、「第3」などは、類似の対象を区別するために使用され、オブジェクトの特定の順序を表すものではない。
【0018】
本実施形態で提供される方法の実施形態は、端末、コンピュータ、または類似のコンピューティングデバイスにおいて実行されてもよい。例えば、
図1に示すように、端末で実行される場合、端末は、1つ以上の(
図1では1つのみが示されている)プロセッサ102と、データを記憶するためのメモリ104とを含み得、ここで、プロセッサ102は、マイクロプロセッサMCUまたはプログラマブルロジックデバイス(Programmable Logic Device、PLD、例えばプログラマブルゲートアレイProgrammable Gate Array、FPGA)を含み得るが、これらに限定はされない。また、上記端末はさらに、通信のための送信デバイス106と、入出力デバイス108とを含み得る。
図1に示した構造は例示的なものに過ぎず、上記端末の構造を限定するものではないことは、当業者であれば理解されることであろう。例えば、端末は、
図1に示す構成要素よりも多いまたは少ない構成要素で構成されたり、
図1に示す構成要素とは異なる構成を有する場合もある。
【0019】
メモリ104はコンピュータプログラム、例えば、本実施形態における病理画像の分類方法に対応するコンピュータプログラムを記憶するために用いられてもよい。プロセッサ102は、メモリ104に記憶されたコンピュータプログラムを実行することにより、様々な機能アプリケーションやデータ処理を実行し、すなわち、上記の方法を実施する。いくつかの実施形態において、メモリ104は、プロセッサ102に対して遠隔に配置されて、ネットワークを介して端末に接続されてもよい。上記のネットワークは、インターネット、イントラネット、ローカルエリアネットワーク、移動通信ネットワークおよびこれらの組み合わせを含むが、これらに限定されない。
【0020】
送信デバイス106は、ネットワークを介してデータを受信または送信するために用いられる。上記のネットワークは、端末の通信プロバイダが提供する無線ネットワークを含み得る。一実施形態において、送信デバイス106は、インターネット上で通信するための1つのネットワークインターフェースコントローラ(Network Interface Controller、NIC)を含む。一実施形態において、送信デバイス106は、インターネットと無線で通信するための無線周波数(Radio Frequency、RF)モジュールであってもよい。
【0021】
本実施形態において、病理画像の分類方法が提供され、
図2は、本実施形態の病理画像の分類方法のフローを示す図である。
図2に示すように、ステップS210~S240を含み得る。
【0022】
ステップS210、検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得る。
【0023】
具体的には、病理画像に対してダウンサンプリング処理を行い、病理画像の解像度とデータ量とを低減する。そして、ダウンサンプリングされた病理画像を自動的に分割して空白の背景や天然の空洞をフィルタリングし、フィルタリングされた病理画像をサイズがn×nの複数の画像ブロックにカットし、当該画像ブロックはウンサンプリング画像ブロックである。ここで、nは画像ブロックの長さと幅を表す。
【0024】
いくつかの実施形態において、上記の病理画像は全スライド病理画像(Whole Slide Image)であってもよい。全スライド病理画像とは、全自動顕微鏡スキャナとコンピュータ技術とを利用して病理切片を可視化して得られた高解像度デジタル画像である。
【0025】
ステップS220、事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出する。
【0026】
ここで、蒸留と敵対的ネットワークは対照学習(Contrastive Learning)と条件付き敵対的生成ネットワーク(Conditional Generative Adversarial Nets)とに基づく複雑なネットワークであり、教師分類ネットワークCTと、生徒分類ネットワークCSと、生成器Gと、判別器Dとを含む。生成器Gと生徒分類ネットワークCSは、分類サブネットワークとして、事前に訓練された蒸留と敵対的ネットワークから抽出される。分類サブネットワークは、シンプルで軽量な分類ネットワークであり、蒸留と敵対的ネットワークを訓練することで、分類サブネットワークの病理画像に対する分類精度を確保しつつ、分類を高速化することができる。
【0027】
ステップS230、複数のダウンサンプリング画像ブロックを、分類のために分類サブネットワークに入力し、複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果を得る。ここで、初期分類結果は各ダウンサンプリング画像ブロックに対応する疾患カテゴリを示す。
【0028】
ステップS240、複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果に基づいて、病理画像に対応する分類結果を得る。例えば、初期分類結果を総合的に分析して病理画像を分類し、その属する疾患カテゴリを予測する。
【0029】
本実施形態によって提供される病理画像の分類方法は、関連技術と比較すると、一方、低解像度のダウンサンプリング画像ブロックを分類ネットワークの入力とすることにより、分類ネットワークに入力するデータ量を削減し、分類結果の予測時間を短縮する。他方、事前に訓練された、病理画像を正確に分類できる蒸留と敵対的ネットワークから軽量な分類サブネットワークを疾患分類のための最終的な分類ネットワークとして抽出することにより、デバイスのメモリ消費を削減し、分類結果の予測を高速化し、病理画像の分類効率を大幅に向上させる。
【0030】
一実施形態において、上記のステップS210、即ち検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るステップは、具体的に、ステップS211~S212を含み得る。
【0031】
ステップS211、検出すべき病理画像に対してダウンサンプリング処理を行い、ダウンサンプリング病理画像を得る。
【0032】
具体的には、元の病理画像の各行、各列においてk点間隔で点を取って新しい画像を形成する。
【0033】
ステップS212、ダウンサンプリング病理画像を前処理して、複数のダウンサンプリング画像ブロックを得る。
【0034】
さらに、一実施形態において、上記のステップS212は具体的に、ダウンサンプリング病理画像に対してフィルタリング処理およびカット(cutting)処理を行い、複数のダウンサンプリング画像ブロックを得るステップを含み得る。例示的に、フィルタリング処理は具体的に、ダウンサンプリング病理画像に対してエッジ検出および空洞検出を行い、病理画像における組織領域を取得し、組織領域以外の背景領域および天然の空洞を除去する処理である。フィルタリングされた病理画像に対してカット処理を行い、例えば、当該病理画像を複数のサイズが256×256の画像ブロックにカットし、各画像ブロックはダウンサンプリング画像ブロックである。
【0035】
上記のステップS211~S212において、検出すべき病理画像に対してダウンサンプリング処理、フィルタリング処理、カット処理を行うことで、解像度を低減し、無関係な画素を除去し、データ量の少ないダウンサンプリング画像ブロックを得た。
【0036】
さらに、一実施形態において、上記のステップステップS220、即ち事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するステップは、具体的に、S221~S224を含み得る。
【0037】
ステップS221、教師分類ネットワークCTと、生成器Gと、判別器Dと、生徒分類ネットワークCSとを含む蒸留と敵対的ネットワークを構築する。
【0038】
ここで、教師分類ネットワークCTは、学習した分類知識を生徒分類ネットワークCSに蒸留・転移するために用いられる。オプションで、教師分類ネットワークCTは、ResNet-50、ResNet-101またはResNet-152であってもよい。生成器Gは、低解像度の画像データを入力として新しい画像データを出力し、判別器の指導の下、出力される新しい画像データを高解像度の画像データにできるだけ近づける。判別器Dは、実際の高解像度の画像データと生成器Gによって生成された新しい画像データとを区別して生成器Gを最適化するために用いられる。生成器Gは任意の従来の生成器であってもよく、例示的に、生成器Gは4つの残差ブロックと3つのストライドが小さい畳み込み層からなる。生徒分類ネットワークCSは、教師分類ネットワークCTから蒸留・転移された分類知識を学習し、入力された画像データを最終的に判断するために用いられる、より低遅延でより少ないパラメータ数の分類ネットワークである。オプションで、生徒分類ネットワークCSはResNet-18であってもよい。
【0039】
ステップS222、訓練データセットを構築し、訓練データセットは複数の高解像度画像ブロックmhighと複数の低解像度画像ブロックmlowとを含み、複数の高解像度画像ブロックmhighは高解像度病理画像から得られ、複数の低解像度画像ブロックmlowは、高解像度病理画像に対してダウンサンプリング処理を行って得られた低解像度病理画像から得られる。
【0040】
異なる臓器のがん疾患のサブタイプを診断するためには、異なる訓練データセットを構築する必要がある。例えば、肺がんのうちの肺腺がんと肺扁平上皮がんを分類するための訓練データセットを構築するためには、肺腺がんと肺扁平上皮がんの病理画像を収集する必要がある。
【0041】
さらに、上記のステップS222、即ち訓練データセットを構築するステップは、具体的に、ステップS2221~S2224を含み得る。
【0042】
ステップS2221、高解像度病理画像を収集する。
【0043】
オープンソースデータベースTCGAおよびTCIAから、肺腺がん1516枚、肺扁平上皮がん1484枚を含む3000枚の肺がんの病理画像を収集し、2つの肺がんのサブタイプのデータ量が均等に分布するように保つ。画像をラベル付けして病理画像の真のラベルを得、ここで、肺腺がんの病理画像を0とラベル付けし、肺扁平上皮がんの病理画像を1とラベル付けし、すべてのデータはいかなる画素レベル、パッチレベルまたはROI(region of interest)レベルのラベルを含まない。
【0044】
したがって、蒸留と敵対的ネットワークを訓練する際にいかなる画素レベル、ブロックレベルまたはROIレベルの注釈を必要とせず、病理画像の疾患のサブタイプのラベルのみが必要であるため、データセットのラベル付けの作業負担が大幅に軽減された。また、必要な病理画像データは疾患の種類に限定されず、あらゆる臓器のがん診断タスクに適用可能であり、汎用性が高い。
【0045】
ステップS2222、高解像度病理画像に対してダウンサンプリング処理を行い、低解像度病理画像を得る。
【0046】
また、一実施形態において、上記ステップS2222の前に、病理画像の染色差によるネットワークへの悪影響を排除するため、元の高解像度病理画像に対して色正規化を行うステップをさらに含む。例示的に、鮮明で標準的な染色を有する1枚の高解像度病理画像をテンプレート画像として選択し、全ての高解像度病理画像が同じ色分布を有するように、色正規化アルゴリズム(SPCN、Structure-Preserving Color Normalization)を用いて残りの高解像度病理画像に対して色正規化を行う。
【0047】
ステップS2223、高解像度病理画像と低解像度病理画像とを前処理して、高解像度画像ブロックmhighと低解像度画像ブロックmlowとを得る。
【0048】
ここで、前処理は、高解像度病理画像と低解像度病理画像とを自動的に分割して空白の背景や天然の空洞をフィルタリングし、フィルタリングされた病理画像をサイズが256×256の複数の画像ブロックにカットすることを含む。
【0049】
ステップS2224、高解像度画像ブロックmhighと低解像度画像ブロックmlowとに基づいて、訓練データセットを構築する。
【0050】
高解像度画像ブロックmhighは、分類精度の高い教師分類ネットワークCTを得るために、教師分類ネットワークCTを訓練するために用いられる。高解像度画像ブロックmhighと低解像度画像ブロックmlowはともに、生徒分類ネットワークCS、生成器Gおよび判別器Dに作用して、軽量な生徒分類ネットワークCSを訓練するために用いられる。
【0051】
ステップS223、訓練データセットを蒸留と敵対的ネットワークに入力して訓練を行い、訓練済みの蒸留と敵対的ネットワークを得る。
【0052】
さらに、一実施形態において、上記のステップステップS223は、具体的に、ステップS2231~S2234を含み得る。
【0053】
ステップS2231、高解像度画像ブロックmhighを教師分類ネットワークCTの入力として教師分類ネットワークCTを訓練する。
【0054】
ここで、高解像度画像ブロックmhighを入力とし、確率的勾配降下アルゴリズムを用いて勾配の逆伝播を行い、クロスエントロピー損失関数を最小化することを目的として訓練を行い、教師分類ネットワークCTのネットワークパラメータを最適化する。Adamオプティマイザを使用し、初期学習率を0.0001に設定し、早期終了(Early Stopping)を用いてパラメータを適時に更新・保存する。訓練済みの教師分類ネットワークCTは、生徒分類ネットワークCSの訓練を支援するための、診断の参考として用いられる。
【0055】
ステップS2232、低解像度画像ブロックmlowを生成器Gに入力して、新たに生成された画像ブロックmlow,fakeを得、新たに生成された画像ブロックmlow,fakeと高解像度画像ブロックmhighとを一緒に判別器Dに入力して判別器Dを訓練する。
【0056】
具体的に、生成器Gと判別器Dとのネットワークパラメータをランダムに初期化し、生成器Gのネットワークパラメータを固定して
判別器Dのみを訓練する。
図3に示すように、具体的なプロセスは以下の通りである。
【0057】
低解像度画像ブロックmlowを生成器Gに入力して、新たに生成された画像ブロックmlow,fakeを得、式は以下の通りである。
mlow,fake=G(mlow)
【0058】
新たに生成された画像ブロックmlow,fakeと高解像度画像ブロックmhighとを一緒に判別器Dに入力して第1の判別損失LD1を計算する。確率的勾配降下アルゴリズムを用いて、第1の判別損失LD1を最大化することを目的として訓練を行い、判別器Dのパラメータを最適化して更新する。例示的に、更新を5回繰り返し、訓練済みの判別器Dを得てもよい。
【0059】
ステップS2233、訓練済みの教師分類ネットワークCTと訓練済みの判別器Dとに基づいて、高解像度画像ブロックmhighと低解像度画像ブロックmlowの両方を蒸留と敵対的ネットワークの入力として生成器Gと生徒分類ネットワークCSとを訓練する。
【0060】
具体的に、生成器Gと生徒分類ネットワークC
Sとのネットワークパラメータをランダムに初期化し、訓練済みの判別器Dのネットワークパラメータを固定して生成器Gと生徒分類ネットワークC
Sとを訓練する。
図4に示すように、具体的なプロセスは以下の通りである。
【0061】
低解像度画像ブロックmlowを生成器Gに入力して、新たに生成された画像ブロックmlow,fakeを得、式は以下の通りである。
mlow,fake=G(mlow)
【0062】
新たに生成された画像ブロックmlow,fakeと高解像度画像ブロックmhighとを一緒に訓練済みの判別器Dに入力して第2の判別損失LDを計算する。新たに生成された画像ブロックmlow,fakeを生徒分類ネットワークCSに入力し、生徒分類ネットワークCSの出力結果と真のラベルとに基づいて分類損失LCを計算し、生徒分類ネットワークCSの出力結果と、訓練済みの教師分類ネットワークCTによって出力されるソフトラベルとに基づいて、蒸留損失LTを計算する。分類損失LCは損失関数を用い、蒸留損失LTは、KLダイバージェンス(Kullback-Leibler Divergence)を用いる。ソフトラベルは、高解像度画像ブロックmhighを訓練済みの教師分類ネットワークCTに入力した後、当該教師分類ネットワークCTによって出力された分類結果である。
【0063】
第2の判別損失LD、分類損失LC、蒸留損失LTを含む総合損失関数Ltotalを計算し、具体的な式は以下の通りである。
Ltotal=λDLD+λCLC+λTLT
【0064】
ここで、各λは、対応する損失関数の重みであり、例示的に、λT=10、λD=5、λC=5と設定する。
【0065】
確率的勾配降下アルゴリズムを用いて、総合損失関数Ltotalを最小化することを目的として訓練を行い、Adamをオプティマイザとして、生成器Gと生徒分類ネットワークCSとのネットワークパラメータを1回最適化して更新する。
【0066】
ステップS2234、訓練済みの教師分類ネットワークCTと、訓練済みの生成器Gと、訓練済みの判別器Dと、訓練済みの生徒分類ネットワークCSとに基づいて、訓練済みの蒸留と敵対的ネットワークを得る。
【0067】
上記のステップS2231~S2234において、訓練済みの教師分類ネットワークCTの出力結果を、生徒分類ネットワークCSの最適化方向を導くソフトラベルとして用いることで、元のデータから直接に最適化学習を行う生徒分類ネットワークCSと比べ、学習速度が速く、性能が高い。また、ソフトラベルは、ラベル平滑化(Label Smoothing)訓練により、生徒分類ネットワークCSに正則化制約を与えるため、生徒分類ネットワークCSが訓練サンプルの真のラベルを過信することを避け、訓練のオーバーフィットを防ぎ、モデルのロバスト性を向上させる。複雑な教師分類ネットワークCTから、わずかな性能低下を犠牲にしてシンプルで軽量な生徒分類ネットワークCSに知識を転移するすることで、分類精度を落とすことなく、ダウンサンプリングされた低解像度病理画像を入力とすることで、病理画像予測速度の大幅な向上を実現する。
【0068】
さらに、一実施形態において、上記のステップS2234の前に、ステップS2232~S2233を順に繰り返し、判別器Dと、生成器Gと、生徒分類ネットワークCSとのネットワークパラメータの最適化を繰り返すステップをさらに含む。繰り返し回数が30回に達するか、または総合損失関数の値が減少しなくなると訓練を停止し、10分割交差検証(10-Fold Cross-validation)を用いて最適モデルを決定し、訓練済みの蒸留と敵対的ネットワークを得る。
【0069】
ステップS224、訓練済みの蒸留と敵対的ネットワークから生成器Gと生徒分類ネットワークCSとを抽出し、生成器Gと生徒分類ネットワークCSとに基づいて分類サブネットワークを構築する。
【0070】
上記のステップS221~S223を通じて、蒸留と敵対的ネットワークを設計し、ネットワーク最適化のプロセスは、ゲーム理論におけるミニマックスアルゴリズム(Minimax Algorithm in Game Theory)のプロセスであり、訓練する際に一方のネットワークパラメータを固定して他方のネットワークパラメータを更新し、交互に繰り返す。生成器Gは、低解像度画像ブロックmlowを入力とし、可能な限り高解像度画像ブロックmhighの特徴情報を有する、新たに生成された画像ブロックmlow,fakeを生成し、当該新たに生成された画像ブロックmlow,fakeを学生分類ネットワークCSの入力とすることで、高解像度病理画像の元の情報量を大きく保持し、モデルの精度を向上させる。また、分類損失LCを条件変数として導入し、データの生成を、がんのサブタイプの正確な診断に有利な傾向へ導くことで、敵対的生成ネットワークの自由度を圧縮し、分類性能をさらに向上させる。
【0071】
一実施形態において、上記のステップS240、即ち複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果に基づいて、病理画像に対応する分類結果を得るステップは、具体的に、初期分類結果における異なるカテゴリのダウンサンプリング画像ブロックの数に基づいて、ダウンサンプリング画像ブロックの数が最も多いカテゴリを病理画像に対応する分類結果とするステップを含み得る。上記の肺がんのサブタイプの分類を例として、ダウンサンプリング画像ブロックの初期分類結果において、肺腺がんに分類されたダウンサンプリング画像ブロックの数と肺扁平上皮がんに分類されたダウンサンプリング画像ブロックの数とをカウントし、多数決により、ダウンサンプリング画像ブロックの数が多い肺がんのサブタイプを、病理画像に対応する分類結果として決定し、分類結果の精度を向上させる。
【0072】
図5は本発明の別の実施形態における病理画像の分類方法のフローを示す図である。
【0073】
ステップS501、検出すべき病理画像に対してダウンサンプリング処理を行い、ダウンサンプリング病理画像を得る。
【0074】
ステップS502、ダウンサンプリング病理画像を前処理して、複数のダウンサンプリング画像ブロックを得る。
【0075】
ステップS503、教師分類ネットワークCTと、生成器Gと、判別器Dと、生徒分類ネットワークCSとを含む蒸留と敵対的ネットワークを構築する。
【0076】
ステップS504、訓練データセットを構築し、訓練データセットは複数の高解像度画像ブロックmhighと複数の低解像度画像ブロックmlowとを含み、複数の高解像度画像ブロックmhighは高解像度病理画像から得られ、複数の低解像度画像ブロックmlowは、高解像度病理画像に対してダウンサンプリング処理を行って得られた低解像度病理画像から得られる。
【0077】
ステップS505、訓練データセットを蒸留と敵対的ネットワークに入力して訓練を行い、訓練済みの蒸留と敵対的ネットワークを得る。
【0078】
ステップS506、訓練済みの蒸留と敵対的ネットワークから生成器Gと生徒分類ネットワークCSとを抽出し、生成器Gと生徒分類ネットワークCSとに基づいて分類サブネットワークを構築する。
【0079】
ステップS507、複数のダウンサンプリング画像ブロックを、分類のために分類サブネットワークに入力し、複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果を得る。
【0080】
ステップS508、初期分類結果における異なるカテゴリのダウンサンプリング画像ブロックの数に基づいて、ダウンサンプリング画像ブロックの数が最も多いカテゴリを病理画像に対応する分類結果とする。
【0081】
なお、上記ステップの順序は、説明のためのものであり、示された特定の順序で、または順番に実行されると解釈されるべきではない。例えば、上記のステップS503~S506は、ステップS501の前に実行されてもよい。
【0082】
本実施形態において、病理画像の分類装置も提供され、当該装置は、上述した実施形態および好ましい実施形態を実施するために用いられるが、すでに説明されたことについては繰り返さない。以下、使用される用語「モジュール」、「ユニット」、「サブユニット」などは、所定の機能を果たすことができるソフトウェアおよび/またはハードウェアの組み合わせを指す。以下の実施形態で説明される装置は、好ましくはソフトウェアで実現されるが、ハードウェアでの実現、またはソフトウェアとハードウェアの組み合わせも可能であり、想定されたものである。
【0083】
図6は本発明の実施形態における病理画像の分類装置の構成を示すブロック図である。
図6に示すように、当該装置は、処理モジュール61と、ネットワークモジュール62と、第1の分類モジュール63と、第2の分類モジュール64とを含む。
【0084】
処理モジュール61は、検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るために用いられる。
【0085】
具体的には、病理画像に対してダウンサンプリング処理を行い、病理画像の解像度とデータ量とを低減する。そして、ダウンサンプリングされた病理画像を自動的に分割して空白の背景や天然の空洞をフィルタリングし、フィルタリングされた病理画像をサイズがn×nの複数の画像ブロックにカットし、当該画像ブロックはウンサンプリング画像ブロックである。ここで、nは画像ブロックの長さと幅を表す。
【0086】
ネットワークモジュール62は、事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するために用いられる。
【0087】
ここで、蒸留と敵対的ネットワークは対照学習と条件付き敵対的生成ネットワークとに基づく複雑なネットワークであり、教師分類ネットワークCTと、生徒分類ネットワークCSと、生成器Gと、判別器Dとを含む。生成器Gと生徒分類ネットワークCSは、分類サブネットワークとして、事前に訓練された蒸留と敵対的ネットワークから抽出される。分類サブネットワークは、シンプルで軽量な分類ネットワークであり、蒸留と敵対的ネットワークを訓練することで、分類サブネットワークの病理画像に対する分類精度を確保しつつ、分類を高速化することができる。
【0088】
第1の分類モジュール63は、前記複数のダウンサンプリング画像ブロックを、分類のために前記分類サブネットワークに入力し、前記複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果を得るために用いられる。ここで、初期分類結果は各ダウンサンプリング画像ブロックに対応する疾患カテゴリを示す。
【0089】
第2の分類モジュール64は、前記複数のダウンサンプリング画像ブロックのそれぞれの前記初期分類結果に基づいて、前記病理画像に対応する分類結果を得るために用いられる。
【0090】
本実施形態によって提供される病理画像の分類装置は、関連技術と比較すると、一方、低解像度のダウンサンプリング画像ブロックを、分類ネットワークに入力するサンプルとすることにより、分類ネットワークに入力するデータ量を削減し、分類結果の予測時間を短縮する。他方、病理画像を正確に分類できる蒸留と敵対的ネットワークを構築し、その中から軽量な分類サブネットワークを疾患分類のための最終的な分類ネットワークとして抽出することにより、デバイスのメモリ消費を削減し、分類結果の予測を高速化し、病理画像の分類効率を大幅に向上させる。
【0091】
なお、上記のモジュールは、機能モジュールであってもプログラムモジュールであってもよく、ソフトウェアによって実現されてもよいし、ハードウェアによって実現されてもよい。ハードウェアによって実現されるモジュールの場合、上記の各モジュールは、同じプロセッサに配置されてもよく、または、上記の各モジュールは、任意の組み合わせで異なるプロセッサに配置されてもよい。
【0092】
一実施形態において、コンピュータデバイスが提供され、当該コンピュータデバイスは端末であってもよく、その内部構造は、
図7に示されるものであってもよい。当該コンピュータデバイスは、システムバスを介して接続されたプロセッサと、メモリと、通信インターフェースと、ディスプレイと、入力装置とを含む。ここで、当該コンピュータデバイスのプロセッサは、コンピューティング機能および制御機能を提供するために用いられる。当該コンピュータデバイスのメモリは、不揮発性記憶媒体と内部メモリとを含む。当該不揮発性記憶媒体には、オペレーティングシステムと、コンピュータプログラムとが記憶されている。当該内部メモリは、不揮発性記憶媒体におけるオペレーティングシステムおよびコンピュータプログラムの動作のための環境を提供する。当該コンピュータデバイスの通信インターフェースは、外部の端末と有線または無線で通信するために用いられ、無線での通信は、WIFI、モバイルセルラーネットワーク、NFC(近距離無線通信)、または他の技術により実現され得る。当該コンピュータプログラムは、プロセッサによって実行されると、病理画像の分類方法が実施される。当該コンピュータデバイスのディスプレイは、液晶ディスプレイまたは電子インク(electronic ink)ディスプレイであってもよく、当該コンピュータデバイスの入力装置は、ディスプレイ上のタッチレイヤーであってもよく、またはコンピュータデバイスの筐体に設けられたキー、トラックボール、タッチパッドであってもよく、または外部キーボード、タッチパッド、マウスなどであってもよい。
【0093】
なお、
図7に示す構造は、本発明の解決手段に関連する一部の構造のブロック図に過ぎず、本発明の解決手段が適用されるコンピュータデバイスを限定するものではなく、具体的なコンピュータデバイスは、図示よりも多いまたは少ない構成要素で構成されたり、特定の構成要素を組み合わせたり、または異なる構成要素の配置を有する場合もある。
【0094】
一実施形態において、メモリとプロセッサとを含むコンピュータデバイスが提供され、メモリは、コンピュータプログラムを記憶しており、プロセッサはコンピュータプログラムを実行すると、本発明の上記いずれかの実施形態の病理画像の分類方法を実施する。
【0095】
一実施形態において、コンピュータプログラムを記憶しているコンピュータ可読記憶媒体が提供され、コンピュータプログラムがプロセッサによって実行されると、本発明の上記いずれかの実施形態の病理画像の分類方法が実施される。
【0096】
一実施形態において、コンピュータプログラムを含むコンピュータプログラム製品が提供され、当該コンピュータプログラムがプロセッサによって実行されると、本発明の上記いずれかの実施形態の病理画像の分類方法が実施される。
【0097】
なお、本発明に係るユーザ情報(ユーザデバイス情報、ユーザ個人情報などを含むがこれらに限定されない)およびデータ(解析のためのデータ、記憶されるデータ、表示されるデータなどを含むがこれらに限定されない)は、いずれもユーザによって承認された、または各関係者によって十分に承認された情報およびデータである。
【0098】
当業者であれば、上記の実施形態の方法におけるフローの全部または一部を実施することは、関連するハードウェアに指示するコンピュータプログラムによって実現可能であることを理解でき、前記コンピュータプログラムは、不揮発性コンピュータ可読記憶媒体に記憶されていてもよく、当該コンピュータプログラムが実行される際に、上記の各方法の実施形態のフローを含み得る。ここで、本発明によって提供される各実施形態において使用されるメモリ、データベースまたは他の媒体への言及は、いずれも不揮発性メモリおよび揮発性メモリの少なくとも1つを含み得る。不揮発性メモリは、読み取り専用メモリ(Read-Only Memory、ROM)、磁気テープ、フロッピーディスク、フラッシュメモリ、光メモリ、高密度埋め込み型不揮発性メモリ、抵抗変化型メモリ(ReRAM)、磁気抵抗メモリ(Magnetoresistive Random Access Memory、MRAM)、強誘電体メモリ(Ferroelectric Random Access Memory、FRAM(登録商標))、相変化メモリ(Phase Change Memory、PCM)、グラフェンメモリなどを含み得る。揮発性メモリは、ランダムアクセスメモリー(Random Access Memory、RAM)または外部キャッシュメモリなどを含み得る。限定ではない例示として、RAMは、スタティックRAM(Static Random Access Memory、SRAM)やダイナミックRAM(Dynamic Random Access Memory、DRAM)など、さまざまな形態をとることができる。本発明によって提供される各実施形態に係るデータベースは、リレーショナルデータベースと非リレーショナルデータベースの少なくとも1つを含み得る。非リレーショナルデータベースは、限定されないが、ブロックチェーンに基づく分散型データベースなどを含み得る。本発明によって提供される各実施形態に係るプロセッサは、限定されないが、汎用プロセッサ、中央処理装置、グラフィックプロセッサ、デジタル信号プロセッサ、プログラマブル論理デバイス、量子コンピューティングに基づくデータ処理論理デバイスなどであってもよい。
【0099】
上記の実施形態の各技術的特徴は、任意に組み合わせること可能であり、説明を簡潔にするために、上記の実施形態における各技術的特徴のすべての可能な組み合わせが記載されていないが、これらの技術的特徴の組み合わせが矛盾しない限り、本発明の範囲内にあるとみなされるべきである。
【0100】
上述した実施形態は、本発明のいくつかの実施形態のみを記載し、その記載は具体的で詳細なものであるが、特許請求の範囲を限定するものとして解釈されるものではない。当業者にとって、本発明の思想から逸脱することなく、いくつかの変形や改良を行うことができるが、これらはいずれも本発明の保護範囲に含まれる。したがって、本発明の保護範囲は、添付の特許請求の範囲に準拠するものとする。
【要約】 (修正有)
【課題】病理画像を迅速かつ効率的に分類する方法を、装置、デバイス及び記憶媒体提供する。
【解決手段】方法は、検出すべき病理画像を処理して複数のダウンサンプリング画像ブロックを得るステップ(S210)と、事前に訓練された蒸留と敵対的ネットワークから分類サブネットワークを抽出するステップ(S220)と、複数のダウンサンプリング画像ブロックを、分類のために分類サブネットワークに入力し、複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果を得るステップ(S230)と、複数のダウンサンプリング画像ブロックのそれぞれの初期分類結果に基づいて、病理画像に対応する分類結果を得るステップ(S240)と、を含み、データ量の少ないダウンサンプリング画像ブロックを軽量な分類サブネットワークに入力することで、対応する病理画像を高速かつ効率的に分類する。
【選択図】
図2