(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-23
(54)【発明の名称】畳み込みニューラルネットワークに基づく画像処理方法およびシステム
(51)【国際特許分類】
G06T 7/00 20170101AFI20241016BHJP
G06V 10/82 20220101ALI20241016BHJP
【FI】
G06T7/00 350C
G06V10/82
【審査請求】有
【予備審査請求】有
(21)【出願番号】P 2024518801
(86)(22)【出願日】2021-10-14
(85)【翻訳文提出日】2024-03-26
(86)【国際出願番号】 SG2021050623
(87)【国際公開番号】W WO2023063874
(87)【国際公開日】2023-04-20
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】520342725
【氏名又は名称】エコー イメージング,インク.
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(72)【発明者】
【氏名】チン,シュエビン
(72)【発明者】
【氏名】デーガン,マスード
(72)【発明者】
【氏名】ゾヌービ,ドルヌーシュ
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096HA11
5L096KA04
(57)【要約】
畳み込みニューラルネットワーク(CNN)に基づく画像処理方法が提供される。この方法は、入力画像を受け取るステップと、入力画像に基づいてCNNのそれぞれ複数の畳み込み層を使用して複数の特徴量抽出動作を実行し、それぞれ複数の出力特徴マップを作成するステップと、複数の畳み込み層の複数の出力特徴マップに基づいて、入力画像に対する出力画像を作成するステップとを含む。特に、複数の特徴量抽出動作の各々に対して、畳み込み層を使用して特徴量抽出動作を実行するステップは、畳み込み層によって受け取られた入力特徴マップ、および複数の加重座標マップに基づいて、畳み込み層の出力特徴マップを作成するステップと、複数の座標マップおよび空間注意マップに基づいて、複数の加重座標マップを作成するステップと、畳み込み層によって受け取られた入力特徴マップに基づいて空間注意マップを作成し、複数の座標マップの各々における座標情報を修正して、複数の加重座標マップを作成するステップとを含む。CNNに基づく対応する画像処理システムも提供される。
【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサを使用した畳み込みニューラルネットワーク(CNN)に基づく画像処理方法であって、
入力画像を受け取るステップと、
前記入力画像に基づいて前記CNNのそれぞれ複数の畳み込み層を使用して複数の特徴量抽出動作を実行し、それぞれ複数の出力特徴マップを作成するステップと、
前記複数の畳み込み層の前記複数の出力特徴マップに基づいて、前記入力画像に対する出力画像を作成するステップと、
を含み、
前記複数の特徴量抽出動作の各々に対して、前記畳み込み層を使用して前記特徴量抽出動作を実行するステップが、
前記畳み込み層によって受け取られた入力特徴マップおよび複数の加重座標マップに基づいて、前記畳み込み層の前記出力特徴マップを作成するステップと、
複数の座標マップおよび空間注意マップに基づいて、前記複数の加重座標マップを作成するステップと、
前記畳み込み層によって受け取られた入力特徴マップに基づいて前記空間注意マップを作成し、前記複数の座標マップの各々における座標情報を修正して、前記複数の加重座標マップを作成するステップと、
を含む、方法。
【請求項2】
前記空間注意マップを作成するステップが、
前記畳み込み層によって受け取られた入力特徴マップに基づいて第1の畳み込み動作を実行し、畳み込み特徴マップを作成するステップと、
前記畳み込み特徴マップに基づいて活動化関数を適用し、前記空間注意マップを作成するステップと、
を含む、請求項1に記載の方法。
【請求項3】
前記活動化関数が、シグモイド活動化関数である、請求項2に記載の方法。
【請求項4】
前記複数の加重座標マップを作成するステップが、前記複数の座標マップの各々を前記空間注意マップと乗じて、前記複数の座標マップの各々における前記座標情報を修正するステップを含む、請求項2または3に記載の方法。
【請求項5】
前記複数の座標マップが、第1の次元に対する座標情報を含む第1の座標マップと、第2の次元に対する座標情報を含む第2の座標マップとを含み、前記第1の次元および前記第2の次元が、前記第1の畳み込み動作が実行されるように構成された2つの次元である、請求項2~4のいずれか一項に記載の方法。
【請求項6】
前記畳み込み層の前記出力特徴マップを作成するステップが、
前記畳み込み層によって受け取られた入力特徴マップおよび前記複数の加重座標マップをチャネルごとに連結して、連結特徴マップを形成するステップと、
前記連結特徴マップに基づいて第2の畳み込み動作を実行して、前記畳み込み層の前記出力特徴マップを作成するステップと、
を含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記CNNが、前記CNNの前記複数の畳み込み層のうちの少なくとも1つの畳み込み層を含む予測サブネットワークを含み、
前記方法が、前記入力画像に基づいて、前記予測サブネットワークを使用して1組の予測特徴マップを作成するステップをさらに含み、前記1組の予測特徴マップを作成するステップが、前記予測サブネットワークの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含み、
前記1組の予測特徴マップのうちの複数の予測特徴マップが、異なる空間分解能レベルを有する、
請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記予測サブネットワークが、1組のエンコーダブロックおよび1組のデコーダブロックを含むエンコーダ-デコーダ構造を有し、前記予測サブネットワークの前記1組のエンコーダブロックが、複数のエンコーダブロックを含み、前記予測サブネットワークの前記1組のデコーダブロックが、複数のデコーダブロックを含み、
前記方法が、
前記予測サブネットワークの前記複数のエンコーダブロックの各々に対して、前記エンコーダブロックによって受け取られた入力特徴マップに基づいて、前記エンコーダブロックを使用してダウンサンプル特徴マップを作成するステップと、
前記予測サブネットワークの前記複数のデコーダブロックの各々に対して、入力特徴マップ、および前記デコーダブロックに対応する前記エンコーダブロックによって作成され、前記デコーダブロックによって受け取られた前記ダウンサンプル特徴マップに基づいて、前記デコーダブロックを使用してアップサンプル特徴マップを作成するステップと、
をさらに含む、請求項7に記載の方法。
【請求項9】
前記予測サブネットワークを使用して前記1組の予測特徴マップを作成するステップが、それぞれ前記複数のデコーダブロックによって作成された前記複数のアップサンプル特徴マップに基づいて、前記複数の予測特徴マップを作成するステップを含む、請求項8に記載の方法。
【請求項10】
前記予測サブネットワークの前記エンコーダブロックを使用して前記ダウンサンプル特徴マップを作成するステップが、
前記エンコーダブロックによって受け取られた前記入力特徴マップに基づいて、マルチスケール特徴を抽出するステップと、
前記エンコーダブロックによって抽出された前記抽出マルチスケール特徴に基づいて、前記ダウンサンプル特徴マップを作成するステップと、
を含み、
前記予測サブネットワークの前記デコーダブロックを使用して前記アップサンプル特徴マップを作成するステップが、
前記入力特徴マップ、および前記デコーダブロックに対応する前記エンコーダブロックによって作成され、前記デコーダブロックによって受け取られた前記ダウンサンプル特徴マップに基づいて、マルチスケール特徴を抽出するステップと、
前記デコーダブロックによって抽出された前記抽出マルチスケール特徴に基づいて、前記アップサンプル特徴マップを作成するステップと、
を含む、
請求項8または9に記載の方法。
【請求項11】
前記予測サブネットワークの前記複数のエンコーダブロックの各々が、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、前記予測サブネットワークの前記エンコーダブロックを使用して前記ダウンサンプル特徴マップを作成するステップが、前記エンコーダブロックの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含み、
前記予測サブネットワークの前記複数のデコーダブロックの各々が、前記CNNの前記複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、前記予測サブネットワークの前記デコーダブロックを使用して前記アップサンプル特徴マップを作成するステップが、前記デコーダブロックの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む、
請求項8~10のいずれか一項に記載の方法。
【請求項12】
前記予測サブネットワークの前記複数のエンコーダブロックの各々の各畳み込み層が、前記CNNの前記複数の畳み込み層のうちの1つであり、
前記予測サブネットワークの前記複数のデコーダブロックの各々の各畳み込み層が、前記CNNの複数の畳み込み層のうちの1つである、
請求項11に記載の方法。
【請求項13】
前記予測サブネットワークの前記複数のエンコーダブロックの各々が、残差ブロックとして構成され、
前記予測サブネットワークの前記複数のデコーダブロックの各々が、残差ブロックとして構成される、
請求項8~12のいずれか一項に記載の方法。
【請求項14】
前記CNNが、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含む精練サブネットワークをさらに含み、
前記方法が、融合特徴マップに基づいて前記精練サブネットワークを使用して1組の精練特徴マップを作成するステップをさらに含み、前記1組の精練特徴マップを作成するステップが、前記精練サブネットワークの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含み、
前記1組の精練特徴マップのうちの複数の精練特徴マップが、異なる空間分解能レベルを有する、
請求項7~13のいずれか一項に記載の方法。
【請求項15】
前記1組の予測特徴マップを連結して、前記融合特徴マップを作成するステップをさらに含む、請求項14に記載の方法。
【請求項16】
前記精練サブネットワークが、それぞれ前記複数の精練特徴マップを作成するように構成された複数の精練ブロックを含み、前記複数の精練ブロックの各々が、1組のエンコーダブロックおよび1組のデコーダブロックを含むエンコーダ-デコーダ構造を有し、前記精練サブネットワークの前記1組のエンコーダブロックが、複数のエンコーダブロックを含み、前記精練サブネットワークの前記1組のデコーダブロックが、複数のデコーダブロックを含み、
前記方法が、前記複数の精練ブロックの各々に対して、
前記精練ブロックの前記複数のエンコーダブロックの各々に対して、前記エンコーダブロックによって受け取られた入力特徴マップに基づいて、前記エンコーダブロックを使用してダウンサンプル特徴マップを作成するステップと、
前記精練ブロックの前記複数のデコーダブロックの各々に対して、入力特徴マップ、および前記デコーダブロックに対応する前記エンコーダブロックによって作成され、前記デコーダブロックによって受け取られた前記ダウンサンプル特徴マップに基づいて、前記デコーダブロックを使用してアップサンプル特徴マップを作成するステップと、
をさらに含む、
請求項14または15に記載の方法。
【請求項17】
前記複数の精練ブロックの前記複数のエンコーダ-デコーダ構造が、異なる高さを有する、請求項16に記載の方法。
【請求項18】
前記精練サブネットワークを使用して前記1組の精練特徴マップを作成するステップが、前記複数の精練ブロックの各々に対して、前記精練ブロックによって受け取られた前記融合特徴マップ、および前記精練ブロックの前記複数のデコーダブロックのうちの第1のデコーダブロックによって作成された前記アップサンプル特徴マップに基づいて、前記精練ブロックの前記精練特徴マップを作成するステップを含む、請求項16または17に記載の方法。
【請求項19】
前記精練ブロックの前記エンコーダブロックを使用して前記ダウンサンプル特徴マップを作成するステップが、
前記エンコーダブロックによって受け取られた前記入力特徴マップに基づいて、マルチスケール特徴を抽出するステップと、
前記エンコーダブロックによって抽出された前記抽出マルチスケール特徴に基づいて、前記ダウンサンプル特徴マップを作成するステップと、
を含み、
前記精練ブロックの前記デコーダブロックを使用して前記アップサンプル特徴マップを作成するステップが、
前記入力特徴マップ、および前記デコーダブロックに対応する前記精練ブロックの前記エンコーダブロックによって作成され、前記デコーダブロックによって受け取られた前記ダウンサンプル特徴マップに基づいて、マルチスケール特徴を抽出するステップと、
前記デコーダブロックによって抽出された前記抽出マルチスケール特徴に基づいて、前記アップサンプル特徴マップを作成するステップと、
を含む、
請求項16~18のいずれか一項に記載の方法。
【請求項20】
前記複数の精練ブロックの各々に対して、
前記精練ブロックの前記複数のエンコーダブロックの各々が、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、前記精練ブロックの前記エンコーダブロックを使用して前記ダウンサンプル特徴マップを作成するステップが、前記エンコーダブロックの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含み、
前記精練ブロックの前記複数のデコーダブロックの各々が、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、前記精練ブロックの前記デコーダブロックを使用して前記アップサンプル特徴マップを作成するステップが、前記デコーダブロックの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む、
請求項16~19のいずれか一項に記載の方法。
【請求項21】
前記精練ブロックの前記複数のエンコーダブロックの各々の各畳み込み層が、前記CNNの複数の畳み込み層のうちの1つであり、
前記精練ブロックの前記複数のデコーダブロックの各々の各畳み込み層が、前記CNNの複数の畳み込み層のうちの1つである、
請求項20に記載の方法。
【請求項22】
前記複数の精練ブロックの各々に対して、
前記精練ブロックの前記複数のエンコーダブロックの各々が、残差ブロックとして構成され、
前記精練ブロックの前記複数のデコーダブロックの各々が、残差ブロックとして構成される、
請求項16~21のいずれか一項に記載の方法。
【請求項23】
前記出力画像が、前記1組の精練特徴マップに基づいて作成される、請求項14~21のいずれか一項に記載の方法。
【請求項24】
前記出力画像が、前記1組の精練特徴マップの平均に基づいて作成される、請求項23に記載の方法。
【請求項25】
前記入力画像を受け取るステップが、複数の入力画像を受け取るステップを含み、前記複数の入力画像の各々が、前記CNNを訓練して訓練済みCNNを得るためのラベル付き画像であり、
前記複数の入力画像の各々に対して、
前記入力画像に基づいて前記CNNのそれぞれ前記複数の畳み込み層を使用して前記複数の特徴量抽出動作を実行し、それぞれ前記複数の出力特徴マップを作成するステップと、
前記複数の畳み込み層の前記複数の出力特徴マップに基づいて、前記入力画像に対する前記出力画像を作成するステップと、
を含む、
請求項1~24のいずれか一項に記載の方法。
【請求項26】
前記ラベル画像が、組織構造を含むラベル付き超音波画像である、請求項25に記載の方法。
【請求項27】
前記出力画像が、前記CNNを使用した前記入力画像に対する推論の結果である、請求項1~24のいずれか一項に記載の方法。
【請求項28】
前記入力画像が、組織構造を含む超音波画像である、請求項27に記載の方法。
【請求項29】
CNNに基づく画像処理システムであって、
メモリと、
前記メモリに通信的に結合されており、請求項1~28のいずれか一項に記載のCNNに基づく画像処理方法を実行するように構成された少なくとも1つのプロセッサと、
を備える、システム。
【請求項30】
1つまたは複数の非一時的コンピュータ可読記憶媒体で実施されており、請求項1~28のいずれか一項に記載のCNNに基づく画像処理方法を実行するように少なくとも1つのプロセッサによって実行可能な命令を含む、コンピュータプログラム製品。
【請求項31】
少なくとも1つのプロセッサを使用して、CNNを使用して超音波画像内の組織構造を分割する方法であって、
請求項1~24のいずれか一項に記載のCNNに基づく画像処理方法を実行するステップを含み、
前記入力画像が、前記組織構造を含む前記超音波画像であり、
前記出力画像が、分割された前記組織構造を有し、前記CNNを使用した前記入力画像に対する推論の結果である、方法。
【請求項32】
前記CNNが、請求項25または26に記載のように訓練される、請求項31に記載の方法。
【請求項33】
CNNを使用して超音波画像内の組織構造を分割するためのシステムであって、
メモリと、
前記メモリに通信的に結合されており、請求項31または32に記載のCNNを使用して超音波画像内の組織構造を分割する方法を実行するように構成された少なくとも1つのプロセッサと、
を備える、システム。
【請求項34】
1つまたは複数の非一時的コンピュータ可読記憶媒体で実施されており、請求項31または32に記載のCNNを使用して超音波画像内の組織構造を分割する方法を実行するように少なくとも1つのプロセッサによって実行可能な命令を含む、コンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
[0001]本発明は、一般に、畳み込みニューラルネットワーク(CNN)に基づく画像処理方法およびシステムに関する。
【背景技術】
【0002】
[0002]畳み込みニューラルネットワーク(CNN)は、当技術分野ではよく知られている人工ニューラルネットワークのクラスであり、予測の目的で様々な領域で、特に画像分割および画像分類などの様々な予測用途の画像処理で適用されてきた。CNNは概して、様々な予測用途の様々な領域で適用可能であると理解されることがあるが、様々な予測用途でCNNを使用することが、常に満足のいく予測結果を提供するとは限らず(たとえば、画像分割または画像分類において十分に正確とは限らない)、満足のいく予測結果を得ることは難しいまたは困難な可能性がある。
【0003】
[0003]一例として、医療用超音波撮像は、安全かつ非侵襲的な実時間撮像診断法であり、高周波音波を使用して人体の構造の画像を提供する。コンピュータ断層撮影法(CT)および磁気共鳴撮像(MRI)などの他の撮像診断法と比べて、超音波撮像は比較的安く、持ち運ぶことができ、より普及しているため、21世紀の聴診器になると広く考えられている。しかし、超音波画像は、手持ち式のプローブから得られることがあり、したがって操作者次第であり、大きいスペックルノイズ、陰影、およびぼやけた境界などの多数のアーチファクトを受けやすい。これにより、関心組織構造(たとえば、解剖学的構造)を隣接する組織から分割することがより難しくなる。複数の従来の方法(たとえば、動的輪郭、グラフカット、スーパーピクセル、およびディープモデル(たとえば、完全畳み込みネットワーク(FCN)、U-Netなど)が、超音波画像分割のために提案および適合されてきた。しかし、超音波画像のノイズの多さのため、そのような従来の方法は通常、粗悪な結果をもたらす。ディープモデルは、従来の方法に比べて大きな改善を実現しているが、超音波画像から軟組織構造を正確に分割することは、依然として困難なタスクである。
【0004】
[0004]単一のディープモデルを使用して超音波画像を分割することに伴う別の問題は、概してぼやけた境界およびテキスチャのためにバイアスの大きい結果をもたらし、ノイズおよび不均質性のために分散が大きいことである。バイアスおよび分散の両方を低減させるために、バギング、ブースティングなどのマルチモデルアンサンブル手法が提案されている。しかし、アンサンブル化のために複数のモデルを訓練することは、計算コストが高い。従来、これに対処するために、1回のパスでモデルを訓練しながら、学習率アニーリングによって最適化経路に沿って複数組のモデル重みを節約することが提案されてきた。しかし、そのような方法ではそれでもなお、推論プロセスを複数回走らせる必要がある。この問題に対処しようとして、直列モジュールによって分割結果を予測し、徐々に精練するための複数の多段階予測精練ディープモデル(たとえば、HourglassNet、CU-Net、R3-Net、BASNet)が開発されてきた。そのような方策は、分割バイアスを低減させることは可能であるかもしれないが、分散に与える影響は制限されており、これは、データセット全体に対する平均的な性能は良好に見えるが、様々な入力画像に対して安定した予測をもたらす可能性は低いことを意味する。
【発明の概要】
【発明が解決しようとする課題】
【0005】
[0005]したがって、CNNに基づく従来の画像処理方法およびシステムに伴う1つまたは複数の問題の克服または少なくとも改善、特にそれだけに限定されるものではないが画像分割などのCNNに基づく画像処理に伴う予測能力(たとえば、予測結果の精度)の強化または改善を目指す、CNNに基づく画像処理方法およびシステムを提供することが必要とされている。この背景に基づいて、本発明は開発されている。
【課題を解決するための手段】
【0006】
[0006]本発明の第1の態様によれば、少なくとも1つのプロセッサを使用したCNNに基づく画像処理方法が提供され、この方法は、
入力画像を受け取るステップと、
入力画像に基づいてCNNのそれぞれ複数の畳み込み層を使用して複数の特徴量抽出動作を実行し、それぞれ複数の出力特徴マップを作成するステップと、
複数の畳み込み層の複数の出力特徴マップに基づいて、入力画像に対する出力画像を作成するステップとを含み、
複数の特徴量抽出動作の各々に対して、畳み込み層を使用して特徴量抽出動作を実行するステップが、
畳み込み層によって受け取られた入力特徴マップおよび複数の加重座標マップに基づいて、畳み込み層の出力特徴マップを作成するステップと、
複数の座標マップおよび空間注意マップに基づいて、複数の加重座標マップを作成するステップと、
畳み込み層によって受け取られた入力特徴マップに基づいて空間注意マップを作成し、複数の座標マップの各々における座標情報を修正して、複数の加重座標マップを作成するステップとを含む。
【0007】
[0007]本発明の第2の態様によれば、CNNに基づく画像処理システムが提供され、このシステムは、メモリと、メモリに通信的に結合されており、本発明の上述した第1の態様によるCNNに基づく画像処理方法を実行するように構成された少なくとも1つのプロセッサとを備える。
【0008】
[0008]本発明の第3の態様によれば、1つまたは複数の非一時的コンピュータ可読記憶媒体で実施されており、本発明の上述した第1の態様によるCNNに基づく画像処理方法を実行するように少なくとも1つのプロセッサによって実行可能な命令を含むコンピュータプログラム製品が提供される。
【0009】
[0009]本発明の第4の態様によれば、少なくとも1つのプロセッサを使用して、CNNを使用して超音波画像内の組織構造を分割する方法が提供され、この方法は、
本発明の上述した第1の態様によるCNNに基づく画像処理方法を実行するステップを含み、
入力画像は、組織構造を含む超音波画像であり、
出力画像は、分割された組織構造を有し、CNNを使用した入力画像に対する推論の結果である。
【0010】
[0010]本発明の第5の態様によれば、CNNに基づく画像処理システムが提供され、このシステムは、メモリと、メモリに通信的に結合されており、本発明の上述した第4の態様によるCNNを使用して超音波画像内の組織構造を分割する方法を実行するように構成された少なくとも1つのプロセッサとを備える。
【0011】
[0011]本発明の第6の態様によれば、1つまたは複数の非一時的コンピュータ可読記憶媒体で実施されており、本発明の上述した第4の態様によってCNNを使用して超音波画像内の組織構造を分割する方法を実行するように少なくとも1つのプロセッサによって実行可能な命令を含むコンピュータプログラム製品が提供される。
【0012】
[0012]本発明の実施形態は、ほんの一例として、図面と併せて以下に記載の説明から、当業者にはよりよく理解され、容易に明らかになる。
【図面の簡単な説明】
【0013】
【
図1】本発明の様々な実施形態によるCNNに基づく画像処理方法の概略的な流れ図である。
【
図2】本発明の様々な実施形態によるCNNに基づく画像処理システムの概略的なブロック図である。
【
図3】本発明の様々な実施形態によるCNNに基づく画像処理システムを実現または実装するために使用することができる例示的なコンピュータシステムの概略的なブロック図である。
【
図4A】本発明の様々な例示的な実施形態による例示的なCNNの例示的なネットワークアーキテクチャを示す図である。
【
図4B】本発明の様々な例示的な実施形態による例示的なCNNの例示的なネットワークアーキテクチャを示す図である。
【
図5】本発明の様々な例示的な実施形態による例示的なCNNの予測モジュールおよび精練モジュールの例示的な詳細な構成を示す表(表1)である。
【
図6】本発明の様々な例示的な実施形態による残差Uブロック(RSU)の概略的なブロック図である。
【
図7A】
図7Aは、様々な例示的な実施形態による残差ブロックの概略的なブロック図である。
【
図7B】
図7Bは、様々な例示的な実施形態によるRSUの概略的なブロック図である。
【
図8A】
図8Aは、本発明の様々な例示的な実施形態による元の座標畳み込み(CoordConv)の概略的なブロック図である。
【
図8B】
図8Bは、本発明の様々な例示的な実施形態による注意座標畳み込み(AC-Conv)の概略的なブロック図である。
【
図9A】
図9Aは、本発明の様々な例示的な実施形態による従来の直列精練モジュールおよび並列精練モジュールの概略的なブロック図である。
【
図9B】
図9Bは、本発明の様々な例示的な実施形態による従来の直列精練モジュールおよび並列精練モジュールの概略的なブロック図である。
【
図10】本発明の様々な例示的な実施形態による甲状腺および超音波走査プロトコルを、手動でラベル付けされた甲状腺葉オーバーレイを有する対応する超音波画像とともに示す概略図である。
【
図11】本発明の様々な例示的な実施形態による超音波画像の各部分集合におけるボリューム番号および対応するスライス(画像)を示す表(表2)である。
【
図12】横断面(TRX)および矢状面(SAG)試験セットにおける本発明の様々な例示的な実施形態による例示的なCNNと他の現況技術の分割モデルとの定量的な評価または比較を示す表(表3)である。
【
図13A】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13B】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13C】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13D】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13E】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13F】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13G】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13H】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13I】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13J】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13K】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図13L】本発明の様々な例示的な実施形態による例示的なCNNを使用したTRX甲状腺画像におけるサンプル分割結果を示す図である。
【
図14A】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14B】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14C】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14D】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14E】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14F】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14G】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14H】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14I】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14J】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14K】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図14L】本発明の様々な例示的な実施形態による例示的なCNNを使用したSAG甲状腺画像におけるサンプル分割結果を示す図である。
【
図15A】TRX画像における本発明の様々な例示的な実施形態による例示的なCNNおよび他の現況技術モデルの成功率曲線グラフである。
【
図15B】SAG画像における本発明の様々な例示的な実施形態による例示的なCNNおよび他の現況技術モデルの成功率曲線グラフである。
【
図16】異なる畳み込みブロックおよび精練アーキテクチャで行われたアブレーション研究を示す表(表4)である。
【発明を実施するための形態】
【0014】
[0013]本発明の様々な実施形態は、畳み込みニューラルネットワーク(CNN)、より詳細にはディープCNNに基づく画像処理のための方法およびシステムを提供する。CNNは、人工ニューラルネットワークのクラスまたはタイプであり、CNNモデル、または単にモデルと呼ばれることもある。たとえば、背景に記載したように、CNNは概して、様々な予測用途の様々な領域で適用可能であると理解されることがあるが、様々な予測用途でCNNを使用することが、常に満足のいく予測結果を提供するとは限らず(たとえば、画像分割または画像分類において十分に正確とは限らない)、満足のいく予測結果を得ることは難しいまたは困難な可能性がある。一例として、組織構造(たとえば、解剖学的構造、または腫瘍などの他のタイプの組織構造)を含む超音波画像はノイズが多く、CNNに基づいてそのような超音波画像を分割するための従来の方法は、粗悪な結果をもたらすことが分かっている。それに応じて、本発明の様々な実施形態は、CNNに基づく画像処理のための従来の方法およびシステムに伴う1つまたは複数の問題の克服または少なくとも改善、特にそれだけに限定されるものではないが画像分割などのCNNに基づく画像処理に伴う予測能力(たとえば、予測結果の精度)の強化または改善を目指す、CNNに基づく画像処理のための方法およびシステムを提供する。
【0015】
[0014]
図1は、本発明の様々な実施形態による少なくとも1つのプロセッサを使用したCNNに基づく画像処理方法100の概略的な流れ図を示す。方法100は、入力画像を受け取るステップ(102)と、入力画像に基づいてCNNのそれぞれ複数の畳み込み層を使用して複数の特徴量抽出動作を実行し、それぞれ複数の出力特徴マップを作成するステップ(104)と、複数の畳み込み層の複数の出力特徴マップに基づいて、入力画像に対する出力画像を作成するステップ(106)とを含む。特に、複数の特徴量抽出動作の各々に対して、畳み込み層を使用して特徴量抽出動作を実行するステップは、畳み込み層によって受け取られた入力特徴マップおよび複数の加重座標マップに基づいて、畳み込み層の出力特徴マップを作成するステップと、複数の座標マップおよび空間注意マップに基づいて、複数の加重座標マップを作成するステップと、畳み込み層によって受け取られた入力特徴マップに基づいて空間注意マップを作成し、複数の座標マップの各々における座標情報を修正して、複数の加重座標マップを作成するステップとを含む。
【0016】
[0015]それに応じて、画像処理方法100は、有利には、特に画像分割に関連して、より詳細には超音波画像分割に関連して、予測能力を強化または改善することが分かっている。特に、上述したように対応する畳み込み層を使用して特徴量抽出動作を実行することによって、関連付けられた畳み込み動作が、座標情報へのアクセス(座標マップ(余分の座標チャネルの使用による))を有するだけでなく、関連付けられた畳み込み動作は、特徴量抽出動作(単に注意マップと呼ぶこともできる空間注意マップの使用による)にとって有益となりうる特定の座標により注目すること(すなわち、追加の注意)も可能になり、それによってそのような追加の注目(すなわち、追加の注意)は、畳み込み層によって受け取られた入力特徴マップによって、入力特徴マップから導出された空間注意マップを介して案内される。それに応じて、関連付けられた畳み込み動作が、空間的な場所(たとえば、デカルト空間内)を知るだけでなく、関連付けられた畳み込み動作は、空間注意マップを介してより注目すべき場所も知る。たとえば、空間注意マップによって、入力特徴マップによる案内に応じて、より多くの注目または注意を必要としうる特定の座標に余分の重みを加えることができ、より少ない注目または注意を必要としうる特定の座標への重みを低減させることができ(たとえば、したがって入力特徴マップのより重要な部分は、特徴量抽出動作においてより多くの注意を受け取ることができる)、それによって畳み込み層の関連付けられた畳み込み動作は、有利には、注意座標案内を有することになる。それに応じて、注意座標案内を有するそのような畳み込み層を使用するそのような特徴量抽出動作を、注意座標案内畳み込み(AC-Conv)と呼ぶことができ、注意座標案内を有するそのような畳み込み層を、AC-Conv層と呼ぶことができる。これに関して、注意座標案内によって、画像処理方法100は、有利には、予測能力を強化または改善することが分かっている。画像処理方法100ならびに対応する画像処理システムが、本発明の様々な実施形態および例示的な実施形態によってより詳細に説明されているため、これらの利点もしくは技術的効果、および/または他の利点もしくは技術的効果が当業者にはより明らかになるであろう。
【0017】
[0016]様々な実施形態では、空間注意マップを作成する上述したステップは、畳み込み層によって受け取られた入力特徴マップに基づいて第1の畳み込み動作を実行し、畳み込み特徴マップを作成するステップと、畳み込み特徴マップに基づいて活動化関数を適用し、空間注意マップを作成するステップとを含む。
【0018】
[0017]様々な実施形態では、活動化関数は、シグモイド活動化関数である。
[0018]様々な実施形態では、複数の加重座標マップを作成する上述したステップは、複数の座標マップの各々を空間注意マップと乗じて、複数の座標マップの各々における座標情報を修正するステップを含む。
【0019】
[0019]様々な実施形態では、複数の座標マップは、第1の次元に対する座標情報を含む第1の座標マップと、第2の次元に対する座標情報を含む第2の座標マップとを含み、第1および第2の次元は、第1の畳み込み動作が実行されるように構成された2つの次元である。
【0020】
[0020]様々な実施形態では、畳み込み層の出力特徴マップを作成する上述したステップは、畳み込み層によって受け取られた入力特徴マップおよび複数の加重座標マップをチャネルごとに連結して、連結特徴マップを形成するステップと、連結特徴マップに基づいて第2の畳み込み動作を実行し、畳み込み層の出力特徴マップを作成するステップとを含む。
【0021】
[0021]様々な実施形態では、CNNは、CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含む予測サブネットワークを含む。これに関して、方法100は、入力画像に基づいて、予測サブネットワークを使用して1組の予測特徴マップを作成するステップをさらに含み、1組の予測特徴マップを作成する上述したステップは、予測サブネットワークの少なくとも1つの畳み込み層を使用して、複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む。さらに、1組の予測特徴マップのうちの複数の予測特徴マップは、異なる空間分解能レベルを有する。
【0022】
[0022]様々な実施形態では、予測サブネットワークは、1組のエンコーダブロックおよび1組のデコーダブロックを含むエンコーダ-デコーダ構造を有する。予測サブネットワークの1組のエンコーダブロックは、複数のエンコーダブロックを含み、予測サブネットワークの1組のデコーダブロックは、複数のデコーダブロックを含む。これに関して、方法100は、予測サブネットワークの複数のエンコーダブロックの各々に対して、エンコーダブロックによって受け取られた入力特徴マップに基づいて、エンコーダブロックを使用してダウンサンプル特徴マップを作成するステップと、予測サブネットワークの複数のデコーダブロックの各々に対して、入力特徴マップ、およびデコーダブロックに対応するエンコーダブロックによって作成され、デコーダブロックによって受け取られたダウンサンプル特徴マップに基づいて、デコーダブロックを使用してアップサンプル特徴マップを作成するステップとをさらに含む。
【0023】
[0023]様々な実施形態では、予測サブネットワークを使用して1組の予測特徴マップを作成する上述したステップは、それぞれ複数のデコーダブロックによって作成された複数のアップサンプル特徴マップに基づいて、複数の予測特徴マップを作成するステップを含む。
【0024】
[0024]様々な実施形態では、予測サブネットワークのエンコーダブロックを使用してダウンサンプル特徴マップを作成する上述したステップは、エンコーダブロックによって受け取られた入力特徴マップに基づいて、マルチスケール特徴を抽出するステップと、エンコーダブロックによって抽出された抽出マルチスケール特徴に基づいて、ダウンサンプル特徴マップを作成するステップとを含む。様々な実施形態では、予測サブネットワークのデコーダブロックを使用してアップサンプル特徴マップを作成する上述したステップは、入力特徴マップ、およびデコーダブロックに対応するエンコーダブロックによって作成され、デコーダブロックによって受け取られたダウンサンプル特徴マップに基づいて、マルチスケール特徴を抽出するステップと、デコーダブロックによって抽出された抽出マルチスケール特徴に基づいて、アップサンプル特徴マップを作成するステップとを含む。
【0025】
[0025]様々な実施形態では、予測サブネットワークの複数のエンコーダブロックの各々は、CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、予測サブネットワークのエンコーダブロックを使用してダウンサンプル特徴マップを作成する上述したステップは、エンコーダブロックの少なくとも1つの畳み込み層を使用して、複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む。様々な実施形態では、予測サブネットワークの複数のデコーダブロックの各々は、CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、予測サブネットワークのデコーダブロックを使用してアップサンプル特徴マップを作成する上述したステップは、デコーダブロックの少なくとも1つの畳み込み層を使用して、複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む。
【0026】
[0026]様々な実施形態では、予測サブネットワークの複数のエンコーダブロックの各々の各畳み込み層は、CNNの複数の畳み込み層のうちの1つである。様々な実施形態では、予測サブネットワークの複数のデコーダブロックの各々の各畳み込み層は、CNNの複数の畳み込み層のうちの1つである。
【0027】
[0027]様々な実施形態では、予測サブネットワークの複数のエンコーダブロックの各々は、残差ブロックとして構成される。様々な実施形態では、予測サブネットワークの複数のデコーダブロックの各々は、残差ブロックとして構成される。
【0028】
[0028]様々な実施形態では、CNNは、CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含む精練サブネットワークをさらに含む。これに関して、方法100は、融合特徴マップに基づいて精練サブネットワークを使用して1組の精練特徴マップを作成するステップをさらに含み、1組の精練特徴マップを作成する上述したステップは、精練サブネットワークの少なくとも1つの畳み込み層を使用して、複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む。さらに、1組の精練特徴マップのうちの複数の精練特徴マップが、異なる空間分解能レベルを有する。
【0029】
[0029]様々な実施形態では、方法100は、1組の予測特徴マップを連結して、融合特徴マップを作成するステップをさらに含む。
[0030]様々な実施形態では、精練サブネットワークは、それぞれ複数の精練特徴マップを作成するように構成された複数の精練ブロックを含み、複数の精練ブロックの各々は、1組のエンコーダブロックおよび1組のデコーダブロックを含むエンコーダ-デコーダ構造を有する。精練サブネットワークの1組のエンコーダブロックは、複数のエンコーダブロックを含み、精練サブネットワークの1組のデコーダブロックは、複数のデコーダブロックを含む。これに関して、方法100は、複数の精練ブロックの各々に対して、精練ブロックの複数のエンコーダブロックの各々に対して、エンコーダブロックによって受け取られた入力特徴マップに基づいて、エンコーダブロックを使用してダウンサンプル特徴マップを作成するステップと、精練ブロックの複数のデコーダブロックの各々に対して、入力特徴マップ、およびデコーダブロックに対応するエンコーダブロックによって作成され、デコーダブロックによって受け取られたダウンサンプル特徴マップに基づいて、デコーダブロックを使用してアップサンプル特徴マップを作成するステップとをさらに含む。
【0030】
[0031]様々な実施形態では、複数の精練ブロックの複数のエンコーダ-デコーダ構造は、異なる高さを有する。
[0032]様々な実施形態では、精練サブネットワークを使用して1組の精練特徴マップを作成する上述したステップは、複数の精練ブロックの各々に対して、精練ブロックによって受け取られた融合特徴マップ、および精練ブロックの複数のデコーダブロックのうちの第1のデコーダブロックによって作成されたアップサンプル特徴マップに基づいて、精練ブロックの精練特徴マップを作成するステップを含む。
【0031】
[0033]様々な実施形態では、精練ブロックのエンコーダブロックを使用してダウンサンプル特徴マップを作成する上述したステップは、エンコーダブロックによって受け取られた入力特徴マップに基づいて、マルチスケール特徴を抽出するステップと、エンコーダブロックによって抽出された抽出マルチスケール特徴に基づいて、ダウンサンプル特徴マップを作成するステップとを含む。様々な実施形態では、精練ブロックのデコーダブロックを使用してアップサンプル特徴マップを作成する上述したステップは、入力特徴マップ、およびデコーダブロックに対応する精練ブロックのエンコーダブロックによって作成され、デコーダブロックによって受け取られたダウンサンプル特徴マップに基づいて、マルチスケール特徴を抽出するステップと、デコーダブロックによって抽出された抽出マルチスケール特徴に基づいて、アップサンプル特徴マップを作成するステップとを含む。
【0032】
[0034]様々な実施形態では、複数の精練ブロックの各々に対して、精練ブロックの複数のエンコーダブロックの各々は、CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、精練ブロックのエンコーダブロックを使用してダウンサンプル特徴マップを作成する上述したステップは、エンコーダブロックの少なくとも1つの畳み込み層を使用して、複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む。様々な実施形態では、複数の精練ブロックの各々に対して、精練ブロックの複数のデコーダブロックの各々は、CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、精練ブロックのデコーダブロックを使用してアップサンプル特徴マップを作成する上述したステップは、デコーダブロックの少なくとも1つの畳み込み層を使用して、複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む。
【0033】
[0035]様々な実施形態では、精練ブロックの複数のエンコーダブロックの各々の各畳み込み層は、CNNの複数の畳み込み層のうちの1つである。様々な実施形態では、精練ブロックの複数のデコーダブロックの各々の各畳み込み層は、CNNの複数の畳み込み層のうちの1つである。
【0034】
[0036]様々な実施形態では、複数の精練ブロックの各々に対して、精練ブロックの複数のエンコーダブロックの各々は、残差ブロックとして構成され、精練ブロックの複数のデコーダブロックの各々は、残差ブロックとして構成される。
【0035】
[0037]様々な実施形態では、出力画像は、1組の精練特徴マップに基づいて作成される。
[0038]様々な実施形態では、出力画像は、1組の精練特徴マップの平均に基づいて作成される。
【0036】
[0039]様々な実施形態では、入力画像を受け取る上述したステップ(102)は、複数の入力画像を受け取るステップを含み、複数の入力画像の各々は、CNNを訓練して訓練済みCNNを得るためのラベル付き画像である。これに関して、複数の入力画像の各々に対して、入力画像に基づいてCNNのそれぞれ複数の畳み込み層を使用して複数の特徴量抽出動作を実行し、それぞれ複数の出力特徴マップを作成するステップと、複数の畳み込み層の複数の出力特徴マップに基づいて、入力画像に対する出力画像を作成するステップ。
【0037】
[0040]様々な実施形態では、ラベル画像は、組織構造を含むラベル付き超音波画像である。
[0041]様々な実施形態では、出力画像は、CNNを使用した入力画像に対する推論の結果である。
【0038】
[0042]様々な実施形態では、入力画像は、組織構造を含む超音波画像である。
[0043]
図2は、本発明の様々な実施形態による
図1を参照して前述した画像処理方法100に対応する、本発明の様々な実施形態によるCNNに基づく画像処理システム200の概略的なブロック図を示す。システム200は、メモリ202と、メモリ202に通信的に結合されており、本発明の様々な実施形態による本明細書に記載する画像処理方法100を実行するように構成された少なくとも1つのプロセッサ204とを備える。それに応じて、様々な実施形態では、少なくとも1つのプロセッサ204は、入力画像を受け取り、入力画像に基づいてCNNのそれぞれ複数の畳み込み層を使用して複数の特徴量抽出動作を実行し、それぞれ複数の出力特徴マップを作成し、複数の畳み込み層の複数の出力特徴マップに基づいて、入力画像に対する出力画像を作成するように構成される。特に、前述したように、複数の特徴量抽出動作の各々に対して、畳み込み層を使用して特徴量抽出動作を実行するステップは、畳み込み層によって受け取られた入力特徴マップ、および複数の加重座標マップに基づいて、畳み込み層の出力特徴マップを作成するステップと、複数の座標マップおよび空間注意マップに基づいて、複数の加重座標マップを作成するステップと、畳み込み層によって受け取られた入力特徴マップに基づいて空間注意マップを作成し、複数の座標マップの各々における座標情報を修正して、複数の加重座標マップを作成するステップとを含む。
【0039】
[0044]少なくとも1つのプロセッサ204は、様々な機能または動作を実行するように少なくとも1つのプロセッサ204によって実行可能な命令セット(たとえば、ソフトウェアモジュール)によって、様々な機能または動作を実行するように構成することができることが、当業者には理解されよう。それに応じて、
図2に示すように、システム200は、入力画像を受け取るように構成された入力画像受信モジュール(または入力画像受信回路)206と、入力画像に基づいてCNNのそれぞれ複数の畳み込み層を使用して複数の特徴量抽出動作を実行し、それぞれ複数の出力特徴マップを作成するように構成された特徴量抽出モジュール(または特徴量抽出回路)208と、複数の畳み込み層の複数の出力特徴マップに基づいて、入力画像に対する出力画像を作成するように構成された出力画像作成モジュール(または出力画像作成回路)210とを備えることができる。
【0040】
[0045]上述したモジュールは、必ずしも別個のモジュールであるとは限らず、本発明の範囲から逸脱することなく、所望される場合または適当な場合、1つまたは複数のモジュールを、1つの機能モジュール(たとえば、回路またはソフトウェアプログラム)によって実現することができ、または1つの機能モジュール(たとえば、回路またはソフトウェアプログラム)として実装することができることが、当業者には理解されよう。たとえば、入力画像受信モジュール206、特徴量抽出モジュール208、および出力画像作成モジュール210のうちの2つまたはそれ以上を、1つの実行可能なソフトウェアプログラム(たとえば、ソフトウェアアプリケーション、または単に「アプリ」と呼ばれる)として実現(たとえば、ともにコンパイル)することができ、1つの実行可能なソフトウェアプログラムは、たとえば、メモリ202内に記憶することができ、本発明の様々な実施形態による本明細書に記載する様々な機能/動作を実行するように少なくとも1つのプロセッサ204によって実行可能とすることができる。
【0041】
[0046]様々な実施形態では、画像処理システム200は、様々な実施形態による
図1を参照して前述した画像処理方法100に対応しており、したがって少なく1つのプロセッサ204によって実行されるように構成された様々な機能または動作は、様々な実施形態によって前述した画像処理方法100の様々なステップまたは動作に対応することができ、したがって明瞭かつ簡潔にするために、画像処理システム200に関して繰り返す必要はない。言い換えれば、方法の文脈で本明細書に記載する様々な実施形態は、対応するシステムにも類似的に有効であり、逆も同様である。
【0042】
[0047]たとえば、様々な実施形態では、メモリ202は、入力画像受信モジュール206、特徴量抽出モジュール208、および/または出力画像作成モジュール210を記憶することができ、これらのモジュールは、様々な実施形態による本明細書に記載する画像処理方法100の様々なステップ(または動作もしくは機能)にそれぞれ対応しており、本明細書に記載する対応する機能または動作を実行するように少なくとも1つのプロセッサ204によって実行可能である。
【0043】
[0048]様々な実施形態では、本発明の様々な実施形態による、少なくとも1つのプロセッサを使用して、CNNを使用して超音波画像内の組織構造を分割する方法が提供される。この方法は、様々な実施形態によって前述したCNNに基づく画像処理方法100を実行するステップを含み、それによって入力画像は、組織構造を含む超音波画像であり、出力画像は、分割された組織構造を有し、CNNを使用した入力画像に対する推論の結果である。
【0044】
[0049]様々な実施形態では、CNNは、様々な実施形態によって前述したように訓練される。すなわち、CNNは、上述した訓練済みCNNである。
[0050]様々な実施形態では、様々な実施形態による超音波画像内の組織構造を分割する上述した方法に対応する、様々な実施形態によるCNNを使用して超音波画像内の組織構造を分割するためのシステムが提供される。システムは、メモリと、メモリに通信的に結合されており、超音波画像内の組織構造を分割する上述した方法を実行するように構成された少なくとも1つのプロセッサとを備える。様々な実施形態では、超音波画像内の組織構造を分割するためのシステムは、画像処理システム200と同じものとすることができ、それによって入力画像は、組織構造を含む超音波画像であり、出力画像は、分割された組織構造を有し、CNNを使用した入力画像に対する推論の結果である。
【0045】
[0051]本開示における様々な実施形態によれば、計算システム、コントローラ、マイクロコントローラ、または処理能力を提供する任意の他のシステムを提供することができる。そのようなシステムは、1つまたは複数のプロセッサおよび1つまたは複数のコンピュータ可読記憶媒体を含むと見なすことができる。たとえば、前述した画像処理システム200は、たとえば本明細書に記載するように様々な処理で使用されるプロセッサ(またはコントローラ)204およびコンピュータ可読記憶媒体(またはメモリ)202を含むことができる。様々な実施形態で使用されるメモリまたはコンピュータ可読記憶媒体は、揮発性メモリ、たとえばDRAM(ダイナミックランダムアクセスメモリ)、または不揮発性メモリ、たとえばPROM(プログラマブルリードオンリメモリ)、EPROM(消去可能PROM)、EEPROM(電気的消去可能PROM)、もしくはフラッシュメモリ、たとえば浮遊ゲートメモリ、電荷トラップメモリ、MRAM(磁気抵抗ランダムアクセスメモリ)、もしくはPCRAM(相変化ランダムアクセスメモリ)とすることができる。
【0046】
[0052]様々な実施形態では、「回路」とは、任意の種類の論理実装実体であると理解することができ、メモリ、ファームウェア、またはこれらの任意の組合せに記憶された特別目的回路またはプロセッサ実行ソフトウェアとすることができる。したがって、一実施形態では、「回路」は、プログラマブルプロセッサ、たとえばマイクロプロセッサ(たとえば、複合命令セットコンピュータ(CISC)プロセッサまたは縮小命令セットコンピュータ(RISC)プロセッサ)などのハードワイヤード論理回路またはプログラマブル論理回路とすることができる。「回路」はまた、プロセッサ実行ソフトウェア、たとえば任意の種類のコンピュータプログラム、たとえば仮想機械コード、たとえばJavaを使用するコンピュータプログラムとすることができる。様々な実施形態によれば、それぞれの機能の任意の他の種類の実装形態もまた、「回路」であると理解することができる。同様に、「モジュール」は、様々な実施形態によるシステムの一部分とすることができ、上述した「回路」を包含することができ、または任意の種類の論理実装実体であると理解することができる。
【0047】
[0053]本開示のいくつかの部分は、コンピュータメモリ内のデータに対する動作のアルゴリズムおよび機能的または象徴的表現の点から明示的または暗示的に提示される。これらのアルゴリズム説明および機能的または象徴的表現は、データ処理技術の当業者であれば、作業の本質を他の当業者に最も効果的に伝えるために使用する手段である。本明細書では、アルゴリズムとは概して、所望の結果をもたらす一貫した一連のステップであると考えられる。これらのステップは、記憶、伝達、結合、比較、および他の方法で操作することが可能な電気、磁気、または光学信号などの物理量の物理的操作を必要とする。
【0048】
[0054]別途特別に記載しない限り、以下から明らかなように、本明細書全体にわたって、「受信」、「実行」、「作成」、「乗算」、「連結」、「抽出」などの用語を利用する説明または議論は、コンピュータシステム内の物理量として表されるデータを、コンピュータシステムまたは他の情報記憶、伝送、もしくは表示デバイス内の物理量として同様に表される他のデータに操作および変換するコンピュータシステムまたは類似の電子デバイスの動作およびプロセスを指すことが理解されよう。
【0049】
[0055]本明細書はまた、本明細書に記載する様々な方法の様々な動作/機能を実行するための画像処理システム200などのシステム(たとえば、デバイスまたは装置として実施することもできる)を開示する。そのようなシステムは、必要とされる目的で特別に構築することができ、またはコンピュータ内に記憶されたコンピュータプログラムによって選択的に起動もしくは再構成される汎用コンピュータもしくは他のデバイスを備えることができる。本明細書に提示するアルゴリズムは、何らかの特定のコンピュータまたは他の装置に本質的に関係するとは限らない。本明細書の教示によるコンピュータプログラムとともに、様々な汎用機械を使用することができる。別法として、様々な方法ステップを実行するためのより特殊な装置の構造も適当なことがある。
【0050】
[0056]加えて、本明細書はまた、本明細書に記載する様々な方法の個々のステップをコンピュータコードによって実施することができることが当業者には明らかなはずであることから、コンピュータプログラムまたはソフトウェア/機能モジュールを少なくとも暗示的に開示する。コンピュータプログラムは、何らかの特定のプログラミング言語およびその実装形態に限定されることを意図したものではない。本明細書に包含される本開示の教示を実装するために、様々なプログラミング言語およびそのコーディングを使用することができることが理解されよう。さらに、コンピュータプログラムは、何らかの特定の制御フローに限定されることを意図したものではない。本発明の範囲から逸脱することなく、異なる制御フローを使用することができるコンピュータプログラムの多くの他の変形形態が存在する。本明細書に記載する様々なモジュール(たとえば、入力画像受信モジュール206、特徴量抽出モジュール208、および/または出力画像作成モジュール210)は、必要とされる機能を実行するためにコンピュータプロセッサによって実行可能なコンピュータプログラムもしくは命令セットによって実現されるソフトウェアモジュールとすることができ、または必要とされる機能を実行するように設計された機能的ハードウェアユニットであるハードウェアモジュールとすることができることが、当業者には理解されよう。ハードウェアおよびソフトウェアモジュールの組合せを実装することができることも理解されよう。
【0051】
[0057]さらに、本明細書に記載するコンピュータプログラム/モジュールまたは方法のステップのうちの1つまたは複数は、連続的にではなく並行して実行することができる。そのようなコンピュータプログラムは、任意のコンピュータ可読媒体に記憶することができる。コンピュータ可読媒体は、磁気もしくは光学ディスク、メモリチップ、または汎用コンピュータと相互作用するのに好適な他の記憶デバイスなどの記憶デバイスを含むことができる。コンピュータプログラムは、そのような汎用コンピュータ上にロードおよび実行されたとき、本明細書に記載する方法のステップを実装する装置を実質的にもたらす。
【0052】
[0058]様々な実施形態では、1つまたは複数のコンピュータ可読記憶媒体(非一時的コンピュータ可読記憶媒体)で実施されており、様々な実施形態による
図1を参照して本明細書に記載する画像処理方法100を実行するように1つまたは複数のコンピュータプロセッサによって実行可能な命令(たとえば、入力画像受信モジュール206、特徴量抽出モジュール208、および/または出力画像作成モジュール210)を含むコンピュータプログラム製品が提供される。それに応じて、本明細書に記載する様々なコンピュータプログラムまたはモジュールは、様々な機能を実行するようにシステム200の少なくとも1つのプロセッサ204によって実行するために、
図2に示す画像処理システム200などのシステムによって受け入れることが可能なコンピュータプログラム製品内に記憶することができる。
【0053】
[0059]様々な実施形態では、1つまたは複数のコンピュータ可読記憶媒体(非一時的コンピュータ可読記憶媒体)で実施されており、様々な実施形態による超音波画像内の組織構造を分割する上述した方法を実行するように1つまたは複数のコンピュータプロセッサによって実行可能な命令を含むコンピュータプログラム製品が提供される。それに応じて、本明細書に記載する様々なコンピュータプログラムまたはモジュールは、様々な機能を実行するようにシステムの少なくとも1つのプロセッサによって実行するために、超音波画像内の組織構造を分割するための上述したシステムなど、システムによって受け入れることが可能なコンピュータプログラム製品内に記憶することができる。
【0054】
[0060]本明細書に記載するソフトウェアまたは機能モジュールはまた、ハードウェアモジュールとして実装することができる。より具体的には、ハードウェアの意味で、モジュールは、他の構成要素またはモジュールとともに使用するために設計された機能的ハードウェアユニットである。たとえば、モジュールは、個別の電子構成要素を使用して実装することができ、または特定用途向け集積回路(ASIC)などの電子回路全体の一部分を形成することができる。多数の他の可能性も存在する。本明細書に記載するソフトウェアまたは機能モジュールはまた、ハードウェアおよびソフトウェアモジュールの組合せとして実装することができることが、当業者には理解されよう。
【0055】
[0061]様々な実施形態では、画像処理システム200は、限定ではなくほんの一例として
図3に概略図的に示すコンピュータシステム300など、少なくとも1つのプロセッサおよびメモリを含む任意のコンピュータシステム(たとえば、デスクトップまたは携帯型コンピュータシステム)によって実現することができる。コンピュータシステム300内で実行されており、様々な実施形態によって本明細書に記載する様々な機能または動作を行うようにコンピュータシステム300(特に、その中の1つまたは複数のプロセッサ)に指示する、コンピュータプログラムなどのソフトウェアとして、様々な方法/ステップまたは機能モジュールを実装することができる。コンピュータシステム300は、コンピュータモジュール302と、キーボードおよび/またはタッチスクリーン304ならびにマウス306などの入力モジュールと、ディスプレイ308およびプリンタ310などの複数の出力デバイスとを備えることができる。コンピュータモジュール302は、たとえばインターネットまたはローカルエリアネットワーク(LAN)またはもしくは(WAN)などの他のネットワークシステムへのアクセスを可能にするために、好適なトランシーバデバイス314を介してコンピュータネットワーク312に接続することができる。この例のコンピュータモジュール302は、様々な命令を実行するためのプロセッサ318と、ランダムアクセスメモリ(RAM)320と、リードオンリメモリ(ROM)322とを含むことができる。コンピュータモジュール302はまた、複数の入出力(I/O)インターフェース、たとえばディスプレイ308へのI/Oインターフェース324、およびキーボード304へのI/Oインターフェース326を含むことができる。コンピュータモジュール302の構成要素は、典型的には、当業者には知られている方法で、相互接続バス328を介して通信する。
【0056】
[0062]本明細書で使用する術語は、様々な実施形態について説明することのみを目的とし、本発明を限定することを意図したものではないことが、当業者には理解されよう。本明細書では、文脈上別途明白に指示しない限り、単数形の「a」、「an」、および「the」は、複数形も同様に含むことが意図される。本明細書で使用する「含む、備える(comprises)」および/または「含む、備える(comprising)」という用語は、記載の特徴、整数、ステップ、動作、要素、および/または構成要素の存在を指定するが、1つまたは複数の他の特徴、整数、ステップ、動作、要素、構成要素、および/またはこれらの群の存在または追加を除外するものではないことがさらに理解されよう。
【0057】
[0063]別途記載されない限り、または文脈上必要とされない限り、「第1」、「第2」などの名称を使用した本明細書における要素または特徴の参照は、そのような要素または特徴の数量または順序を限定するものではない。たとえば、そのような名称は、2つ以上の要素または要素事例を区別する好都合な方法として、本明細書で使用されることがある。したがって、第1および第2の要素の参照は、2つの要素のみを用いることができること、または第1の要素が第2の要素に先行しなければならないことを、必ずしも意味するものではない。加えて、項目のリストのうちの「少なくとも1つ」を参照する語句は、その中の任意の単一の項目、またはその中の2つ以上の項目の任意の組合せを指す。
【0058】
[0064]本発明を容易に理解して実際的に実施することができるように、本発明の様々な例示的な実施形態について、限定ではなくほんの例として以下に説明する。しかし本発明は、様々な異なる形態または構成で実施することができ、以下に記載する例示的な実施形態に限定されると解釈されるべきではないことが、当業者には理解されよう。逆に、これらの例示的な実施形態は、本開示を徹底的かつ完全にし、本発明の範囲を当業者に十分に伝えるために提供される。
【0059】
[0065]特に、限定または一般性の損失なく、本発明をより良好に理解するために、本発明の様々な例示的な実施形態について、入力画像が超音波画像であり、画像処理が超音波画像分割、すなわち超音波画像内の組織構造を分割するためのCNNに基づく画像処理方法のためのものであることに関して、次に説明する。そのような特定の用途(すなわち、超音波画像分割)は、様々な例示的な実施形態に好ましいことがあるが、本発明は、そのような特定の用途に限定されるものではなく、画像処理方法は、所望される場合または適当な場合、それだけに限定されるものではないが画像分類など、他のタイプの用途(たとえば、入力画像に比較的ノイズが多く、あるいは/または関心構造が全体として入力画像内に類似の位置および/もしくは形状を有する用途)に実装することができることが、当業者には理解されよう。
【0060】
[0066]超音波画像分割は、減衰、陰影、スペックルノイズ、不均一のテキスチャ、およびぼやけた境界など、診断法に固有のアーチファクトの存在のため、困難なタスクである。これに関して、様々な例示的な実施形態は、超音波画像内の軟組織構造の分割のための予測精練注意ネットワーク(CNN)を提供し、これを本明細書では、ACU2E-Net、または単に本CNNまたはモデルと呼ぶことができる。予測精練注意ネットワークは、注意座標畳み込み(AC-Conv)を含む予測モジュールまたはブロック(たとえば、様々な実施形態によって前述した予測サブネットワークに対応しており、本明細書ではACU2-Netと呼ぶことができる)と、複数(たとえば、3つ)の並列残差精練モジュールまたはブロック(たとえば、様々な実施形態によって前述した複数の精練ブロックに対応する)を含むマルチヘッド残差精練モジュールまたはブロック(たとえば、様々な実施形態によって前述した精練サブネットワークに対応しており、本明細書ではMH-RRMまたはE-Moduleと呼ぶことができる)とを備える。様々な例示的な実施形態では、AC-Convは、標的の解剖学的構造の形状および位置情報を知覚することによって、分割精度を改善するように構成または設計される。残差精練およびアンサンブル方策を統合することによって、MH-RRMは、有利には、分割バイアスおよび分散の両方を低減させ、アンサンブル方法で一般的に見られるマルチパス訓練および推論を回避することが分かっている。様々な例示的な実施形態による超音波画像内の組織構造の分割のための本CNNに基づく画像処理方法の有効性を実証するために、甲状腺超音波走査のデータセットが収集され、現況技術の分割方法と比べて本CNNが評価された。現況技術モデルとの比較は、横断面および矢状面の両方の甲状腺画像において、本CNNの競争力のあるまたは改善された性能を実証している。たとえば、アブレーション研究は、AC-ConvおよびMH-RRMモジュールが、基線モデルの分割Diceスコアを79.62%から80.97%および83.92%まで改善するとともに、分散を6.12%から4.67%および3.21%まで低減させることを示す。
【0061】
[0067]背景に記載したように、超音波画像は、手持ち式のプローブから得られることがあり、したがって操作者次第であり、大きいスペックルノイズ、陰影、およびぼやけた境界などの多数のアーチファクトを受けやすい。これにより、関心組織構造(たとえば、解剖学的構造)を隣接する組織から分割することがより難しくなる。複数の従来の方法(たとえば、動的輪郭、グラフカット、スーパーピクセル、およびディープモデル(たとえば、完全畳み込みネットワーク(FCN)、U-Netなど)が、超音波画像分割のために提案および適合されてきた。しかし、超音波画像のノイズの多さのため、そのような従来の方法は通常、粗悪な結果をもたらす。ディープモデルは、従来の方法に比べて大きな改善を実現しているが、超音波画像から軟組織構造を正確に分割することは、依然として困難なタスクである。
【0062】
[0068]超音波画像分割に関連して、様々な例示的な実施形態では、自然の画像分割における様々な形状および位置の概略的な物体とは異なり、超音波画像内の組織構造(たとえば、解剖学的構造)は、類似の位置および形状パターンを有することに留意されたい。しかし、これらの幾何学的な特徴は、表現および符号化するのが難しいため、分割ディープモデルではほとんど使用されない。それに応じて、従来、超音波画像における軟組織構造の特有の幾何学的な制約をどのように使用するかは、依然として難題のままである。単一のディープモデルを使用して超音波画像を分割することに伴う別の問題は、概してぼやけた境界およびテキスチャのためにバイアスの大きい結果をもたらし、ノイズおよび不均質性のために分散が大きいことである。
【0063】
[0069]それに応じて、これらの難題を克服するために、様々な例示的な実施形態は、上述したAC-Conv上に構築された予測モジュールと、マルチヘッド残差精練モジュール(MH-RRM)とを備える、上述した注意にも基づく予測精練アーキテクチャ(すなわち、本CNN)を提供する。そのような注意に基づく予測精練アーキテクチャは、有利には、超音波画像内に提示される解剖学的位置および形状制約を活用して、分割結果のバイアスおよび分散を低減させるとともに、マルチパス訓練および推論を回避する。それに応じて、本CNNの寄与は、(a)超音波画像から両方の幾何学的情報(たとえば、形状および位置情報)を知覚することによって、分割精度を改善するように構成されたAC-Conv、ならびに/または(b)アンサンブル方策および予測精練方策の両方をともに統合することによって、分割精度を改善するMH-RRMを伴う予測精練アーキテクチャを含む。以下に後述するように、様々な例示的な実施形態による超音波画像分割のための本CNNに基づく画像処理方法は、甲状腺超音波走査のデータセットに関して試験され、従来のモデルと比べて改善された性能(たとえば、精度)を実現した。
【0064】
CNNアーキテクチャ
[0070]
図4Aおよび
図4Bは、本発明の様々な例示的な実施形態による例示的なCNN400の例示的なネットワークアーキテクチャをともに示す。やはり前述したように、例示的なCNN400は、予測モジュールまたはブロック(ACU
2-Net)410(
図4A)およびMH-RRM450(
図4B)を備える。様々な例示的な実施形態では、予測モジュール410は、Qinら、「U
2-Net:Going Deeper with nested U-structure for salient object detection」、Pattern Recognition、106:107404、2020(本明細書では参照文献Qinと呼び、その内容があらゆる目的で全体として参照により本明細書に組み込まれている)に開示されているU
2-Netに基づいて、U
2-Netにおける各単純畳み込み層を、様々な例示的な実施形態によって本明細書に記載するAC-Conv層に置き換えることによって、注意座標案内U
2-Net(ACU
2-Netと呼ぶことができる)を形成するように構成することができる。様々な例示的な実施形態では、精練モジュール450は、予測モジュール(ACU
2-Net)の1組の並列に配置された変形形態を備える(たとえば、異なる空間分解能レベルを有する精練特徴マップを作成するため)。一例として、
図4Bに示すように、精練モジュール450は、並行して配置された3つの精練ヘッドまたはブロック(異なる空間分解能レベルを有する精練特徴マップを作成するための3つのACU
2-Net変形形態である)454-1、454-2、454-3を有するように構成することができ、これらはそれぞれ、ACU
2-Net-Ref7、ACU
2-Net-Ref5、およびACU
2-Net-Ref3として
図4Bに示されている(たとえば、「E」の文字のように見えており、したがって精練モジュール450のそのような例示的な構成を、本明細書ではE-Moduleと呼ぶことができる)。
図4Aに示す凡例では、AC-CBRという用語が、AC-Conv+BacthNorm+ReLUを示す。
【0065】
[0071]限定ではなく説明の目的でほんの一例として、
図5は、様々な例示的な実施形態による例示的なCNN400の予測モジュール410および精練モジュール450の例示的な詳細な構成を示す表(表1)を示す。表1の空白のセルは、そのような段階が存在しないことを示す。加えて、「I」、「M」、および「O」は、各AC-RSUブロック(注意座標案内残差Uブロック)の入力チャネル(C
in)、中間チャネル、および出力チャネル(C
out)の数を示す。「En_i」および「De_j」は、それぞれエンコーダおよびデコーダ段階を示す。「AC-RSU-L」内の数字「L」は、AC-RSUブロックの高さを示す。本発明は、
図5に示す例示的な詳細な構成(またはパラメータ)を有するCNNに限定されるものではなく、これらは限定ではなく説明の目的でほんの一例として提供されることが、当業者には理解されよう。CNNのパラメータは、所望される場合または適当な場合、それだけに限定されるものではないが、ACU
2-Netのエンコーダ-デコーダ構造の所望の高さ、作成される予測特徴マップの所望の異なる空間分解能レベル(および/または異なる空間分解能レベルの所望の数)、作成される精練特徴マップの所望の異なる空間分解能レベル(および/または異なる空間分解能レベルの所望の数)、エンコーダまたはデコーダブロック内の層の所望の数、エンコーダまたはデコーダブロック内のチャネルの所望の数などの様々な目的で、変更または修正することができることが、当業者には理解されよう。
【0066】
[0072]参照文献Qinは、顕著オブジェクト検出(SOD)のためのディープネットワークアーキテクチャ(U
2-Netと呼ばれる)を開示している。U
2-Netのネットワークアーキテクチャは、2レベルのネスト状U構造である。ネットワークアーキテクチャには、(1)残差Uブロック(RSUブロック、単にRSUと呼ばれることもある)内の異なるサイズの受容野の混合により、異なるスケールからより多くの文脈情報を捕捉することが可能であり、(2)これらのRSUブロック内で使用されるプーリング動作のため、計算コストを大幅に増大させることなく、アーキテクチャ全体の深さが増大するという利点がある。そのようなネットワークアーキテクチャは、画像分類タスクからのバックボーンを使用することなく、スクラッチからのディープネットワークの訓練を可能にする。特に、U
2-Netは、画像分類からの事前に訓練されたバックボーンを使用することなく、SOD向けに設計された2レベルのネスト状U構造である。U
2-Netは、競争力のある性能を実現するように、スクラッチから訓練することができる。さらに、このネットワークアーキテクチャにより、メモリおよび計算コストを大幅に増大させることなく、ネットワークはより深化し、高い分解能を達成することが可能になる。これは、ネスト状のU構造によって実現され、それによって最下レベルでは、特徴マップ分解能を劣化させることなく段階内マルチスケール特徴を抽出することが可能なRSUブロックが構成され、最上レベルでは、U-Net状の構造(エンコーダ-デコーダ構造)が存在し、各段階はRSUブロックによって埋められている。2レベル構成の結果、ネスト状のU構造、および
図4Aに示す様々な例示的な実施形態によるネスト状のU構造(エンコーダ-デコーダ構造)の一例が得られ、それによって前述したように、U
2-Netにおける各単純畳み込み層が、様々な例示的な実施形態によって本明細書に記載するAC-Conv層に置き換えられて、ACU
2-Net410を形成する。
【0067】
[0073]要約すると、マルチレベルの深層特徴統合方法では主に、より良好なマルチレベル特徴集約方策の開発に注目が集まっている。他方では、マルチスケール特徴量抽出の分野の方法は、バックボーンネットワークによって得られた特徴から局所的情報および大局的情報の両方を抽出するための新しいモジュールの設計を標的としている。これに関して、U2-NetまたはACU2-Net410のネットワークアーキテクチャは、マルチスケール特徴を段階ごとに直接抽出するように構成される。
【0068】
残差Uブロック(RSU)/注意座標案内残差Uブロック(AC-RSU)
[0074]局所的文脈情報および大局的文脈情報はどちらも、顕著オブジェクト検出および他の分割タスクにとって重要である。VGG、ResNet、DenseNetなどの現代のCNN設計において、1×1または3×3のサイズを有する小さい畳み込みフィルタは、特徴量抽出のために最も頻繁に使用される構成要素である。これらの畳み込みフィルタは、必要とする記憶空間が小さく、計算効率がよいことから好ましい。たとえば、浅い層の出力特徴マップは、1×1または3×3フィルタの受容野が大局的情報を捕捉するには小さすぎるため、局所的特徴のみを収容する。浅い層からの高分解能の特徴マップでより多くの大局的情報を実現するために、最も直接的な概念は、受容野を拡大することである。しかし、元の分解能で入力特徴マップにおいて(特に、早い段階で)複数の膨張畳み込みを行うためには、あまりに多くの計算およびメモリ資源を必要とする。計算コストを減少させるためには、ピラミッドプーリングモジュール(PPM)から、並列構成を適合させることができ、これは元のサイズの特徴マップにおける膨張畳み込みではなく、ダウンサンプル特徴マップで小さいカーネルフィルタを使用する。しかし、直接アップサンプリングおよび連結(または追加)による異なるスケールの特徴の融合は、高分解能特徴の劣化を招く可能性がある。
【0069】
[0075]それに応じて、参照文献Qinに記載されているように、段階内マルチスケール特徴を捕捉するためにRSUブロックが提供される。限定ではなくほんの一例として、RSU-L(C
in、M、C
out)ブロック600の例示的な構造が
図6に示されており、ここで、Lはエンコーダ内の層の数であり、C
in、C
outは入力および出力チャネルを示し、MはRSUブロック600の内部層内のチャネルの数を示す。RSU-Lブロック600は、
図6に示す特定の寸法(たとえば、層の数L)に限定されるものではなく、これは限定ではなくほんの一例であることが、当業者には理解されよう。それに応じて、RSUブロック600は、3つの構成要素を備える。
【0070】
(i)入力特徴マップx(H×W×Cin)を、Coutのチャネルを有する中間マップF1(x)に変換する入力畳み込み層。これは、局所的特徴量抽出のための単純畳み込み層である。
【0071】
(ii)中間特徴マップF
1(x)を入力とし、マルチスケール文脈情報U(F
1(x))を抽出および符号化することを学習する、Lの高さを有するU-Net状の対称なエンコーダ-デコーダ構造。Uは、
図6に示すU-Net状の構造を表す。Lが大きければ大きいほど、より深い残差Uブロック(RSU)、より多くのプーリング動作、より大きい範囲の受容野、ならびにより豊富な局所的および大局的特徴がもたらされる。このパラメータを構成することで、任意の空間分解能を有する入力特徴マップからのマルチスケール特徴の抽出が可能になる。マルチスケール特徴は、累進的なアップサンプリング、連結、および畳み込みによって、徐々にダウンサンプルされる特徴マップから抽出され、高分解能の特徴マップに符号化される。このプロセスにより、大きいスケールの直接アップサンプリングによって引き起こされる細かい詳細の損失が軽減される。
【0072】
(iii)加算F
1(x)+U(F
1(x))によって局所的特徴およびマルチスケール特徴を融合する残差接続。
[0076]より良好な理解のために、
図7Aおよび
図7Bは、比較のために、元の残差ブロック700(
図7A)および残差Uブロック(RSU)720(
図7B)の概略図を示す。元の残差ブロック700内の動作は、H(x)=F
2(F
1(x))+xとして要約することができ、ここで、H(x)は入力特徴xの所望のマッピングを示し、F
2、F
1は重み層を表し、この設定では、これらは畳み込み動作である。RSUブロック720と元の残差ブロック700との間の主な設計の違いは、RSUブロック720では、単純な単一ストリームの畳み込みが、U-Net状構造600に置き換えられ、元の特徴が、重み層H
RSU(x)=U(F
1(x))+F
1(x)によって変換された局所的特徴に置き換えられることであり、ここでUは、
図6に示すような多層U構造600を表す。RSUブロック720と元の残差ブロック700との間のそのような違いにより、ネットワークは、複数のスケールからの特徴を、各RSUブロックから直接抽出することが可能になる。さらに、ほとんどの動作がダウンサンプル特徴マップで適用されるため、U構造による計算オーバーヘッドは小さい。
【0073】
[0077]様々な例示的な実施形態では、AC-RSUブロックは、(所望される場合または適当な場合に変更または修正されうる層の数Lなどの特定の寸法に限定されることなく)上述したRSUブロック720に基づいて(たとえば、同じまたは同様に)形成することができ、それによってRSUブロック720内の各単純畳み込み層が、様々な例示的な実施形態によって本明細書に記載するAC-Conv層に置き換えられる。
【0074】
ACU
2-Netのアーキテクチャ
[0078]様々な例示的な実施形態によれば、ACU
n-Netが開示され、それによって複数のU-Net状構造がネスト上に積み重ねられる。特に、指数表記は、直列の積み重ねではなく、ネスト状のU構造を指す。理論的には、指数nは、単一レベルまたはマルチレベルのネスト状U構造を実現するために、任意の正の整数として設定することができる。ただし、ネストレベルが多すぎるアーキテクチャは、現実の用途で実装および使用するにはあまりに複雑である。たとえば、nを2に設定して、ACU
2-Netを形成することができる。ACU
2-Netは、2レベルのネスト状U構造を有し、
図4Aは、様々な例示的な実施形態による予測モジュール410を形成する例示的なACU
2-Netの概略的なブロック図を示す。上部レベルは、複数の段階(
図4Aの複数の立方体)、たとえば限定ではなく14段階を含むU構造である。各段階は、構成されたAC-RSUブロックによって埋められる(最下レベルのU構造)。それに応じて、ネスト状のU構造は、段階内マルチスケール特徴の抽出および段階間マルチレベル特徴の集約をより効率的に可能にする。
【0075】
[0079]
図4Aに示すように、予測モジュール(ACU
2-Net)410は、1組のエンコーダブロック420および1組のデコーダブロック430を含むエンコーダ-デコーダ構造を有する。限定ではなくほんの一例として、予測モジュール410は、(1)多段階(たとえば、7段階)のエンコーダ構造420、(2)多段階(たとえば、7段階)のデコーダ構造430、および(3)デコーダ段階430に結合されまたは取り付けられた特徴マップ融合モジュールまたはブロック440という3つの部分を含む。
【0076】
[0080]エンコーダ段階420に関しては、1組のエンコーダブロック420の例示的な構成が、
図5の表1に示されている。デコーダ段階430に関しては、1組のデコーダブロック430の例示的な構成がまた、
図5の表1に示されている。前述したように、「7」、「6」、「5」、および「4」は、AC-RSUブロックの高さ(L)を示す。たとえば、Lは、入力特徴マップの空間分解能に従って構成することができる。高さおよび幅が大きい特徴マップの場合、Lが大きければ大きいほど、より大きいスケールの情報を捕捉するために使用することができる。たとえば、En_6およびEn_7における特徴マップの分解能は比較的低く、これらの特徴マップのさらなるダウンサンプリングは、有用な文脈の損失を招く。したがって、En_6およびEn_7段階の両方において、AC-RSU-4Fが使用され、ここで「F」は、AC-RSUブロックが膨張版であることを示し、たとえばプーリングおよびアップサンプリング動作が膨張畳み込みに置き換えられる。この場合、AC-RSU-4Fの中間特徴マップのすべてが、その入力特徴マップと同じ分解能を有する。
【0077】
[0081]デコーダ段階430に関しては、1組のデコーダブロック(AC-RSU)の例示的な構成がまた、
図5の表1に示されている。様々な例示的な実施形態では、デコーダ段階430は、対称のまたは対応するエンコーダ段階420に類似または対応する構造を有することができる。たとえば、膨張版AC-RSU-4Fは、デコーダブロックDe_6およびDe_7にも使用され、これは対称のまたは対応するエンコーダブロックEn_6およびEn_7に使用されるものに類似または対応している。
図4Aに示すように、各デコーダ段階は、その直前の段階からのアップサンプル特徴マップおよびその対称のまたは対応するエンコーダ段階からのダウンサンプル特徴マップの連結を入力として取るように構成することができる。
【0078】
[0082]様々な例示的な実施形態では、予測モジュール410は、デコーダ段階430によって作成されたアップサンプル特徴マップに基づいて、複数の予測特徴マップを生成するように構成することができる。限定ではなくほんの一例として、
図4Aに示す例示的な構成では、3×3畳み込み層およびシグモイド関数に基づいて、それぞれデコーダ段階De_1、De_2、De_3、De_4、De_5、De_6、De_7からの7つの予測特徴マップ(たとえば、サイド出力顕著性確率マップ)S
(1)
side、S
(2)
side、S
(3)
side、S
(4)
side、S
(5)
side、S
(6)
side、S
(7)
sideを作成することができる。次いで、予測モジュール410は、サイド出力顕著性マップのロジット(シグモイド関数前の畳み込み出力)を入力画像サイズへアップサンプリングし、これらを連結動作ならびにそれに続く1×1畳み込み層およびシグモイド関数に融合して、融合特徴マップ(たとえば、最終顕著性確率マップ)S
fuse444を生成することができる。
【0079】
[0083]それに応じて、ACU2-Netの構成は、豊富なマルチスケール特徴ならびに比較的低い計算およびメモリコストを伴うディープアーキテクチャを有することを可能にする。加えて、様々な例示的な実施形態では、ACU2-Netアーキテクチャは、画像分類から適合された事前に訓練されたバックボーンを使用することなく、AC-RSUブロックに基づいて構築されているため、著しい性能損失なく異なる作業環境に柔軟かつ容易に適合される。
【0080】
[0084]それに応じて、様々な例示的な実施形態では、予測モジュール410は、1組のエンコーダブロック(たとえば、En_1~En_7)420および1組のデコーダブロック(たとえば、De_1~De_7)430を含むエンコーダ-デコーダ構造を有する。
図4Aに示すように、1組のエンコーダブロックのうちの複数のエンコーダブロック(たとえば、En_1~En_5)の各々に対して、エンコーダブロックによって受け取られた入力特徴マップに基づいて、エンコーダブロックを使用してダウンサンプル特徴マップを作成することができる。さらに、
図4Aに示すように、1組のデコーダブロックのうちの複数のデコーダブロック(たとえば、De_1~De_5)の各々に対して、入力特徴マップ、およびデコーダブロックに対応するエンコーダブロックによって作成され、デコーダブロックによって受け取られたダウンサンプル特徴マップに基づいて、デコーダブロックを使用してアップサンプル特徴マップを作成することができる。それに応じて、様々な例示的な実施形態では、複数のデコーダブロックに基づいて作成された複数の予測特徴マップは、異なる空間分解能レベルを有する。
【0081】
[0085]様々な例示的な実施形態では、複数の予測特徴マップは、それぞれ複数のデコーダブロックによって作成された複数のアップサンプル特徴マップに基づいて作成される。
注意座標畳み込み(AC-Conv)
[0086]様々な例示的な実施形態では、医療画像内の甲状腺のような軟組織構造は、予測可能な位置および形状パターンを有すると考えられ、これを使用して分割プロセスを支援することができることに留意されたい。座標変換の問題を解決するために、
図8Aに示すような座標畳み込み(CoordConv)が開示されている(本明細書では参照文献Liuと呼び、その内容があらゆる目的で全体として参照により本明細書に組み込まれている、Liuら、「An intriguing failing of convolution neural networks and the CoordConv solution(畳み込みニューラルネットワークの興味深い欠点およびCoordConvの解決策)」、NIPS、9605~9616、2018参照)。特に、
図8Aは、元のCoordConv層800の概略的なブロック図を示す。入力特徴マップM
in(h×ω×c)804を考慮して、CoordConvは、M
out=conv(cat(M
in,M
i,M
j))として記述することができ、ここでM
i806およびM
j808は、それぞれ行および列の座標マップを示す。しかし、本発明の様々な例示的な実施形態では、異なる層内の特徴に取り付けられた座標マップ(M
i,M
j)がほぼ一定であるため、これらを異なる層内の特徴マップM
inに直接連結すると、ネットワークの一般化能力を劣化させる可能性があることに留意されたい。これは、対応する畳み込み重みが、これらの値スケールを特徴マップM
inのものと同期させること、ならびに幾何学的情報を抽出することを担うからである。この問題に対処するために、様々な例示的な実施形態は、
図8Bに示す注意座標畳み込み(AC-Conv)850を提供する。特に、
図8Bは、本発明の様々な例示的な実施形態によるAC-Conv850の概略的なブロック図を示す。AC-Conv850は、入力特徴マップ854および座標マップ856’、858’(様々な実施形態によって前述した複数の加重座標マップに対応)の連結(チャネルごと)前に、空間的注意のような動作を追加する。
【0082】
【0083】
ここで、σはシグモイド関数である。
[0087]それに応じて、様々な例示的な実施形態では、畳み込み(AC-Conv)層850を使用して特徴量抽出動作を実行するステップは、畳み込み層850によって受け取られた入力特徴マップ854および複数の加重座標マップ856’、858’に基づいて、畳み込み層850の出力特徴マップ870を作成するステップと、複数の座標マップ856、858および空間注意マップ860に基づいて、複数の加重座標マップ856’、858’を作成するステップと、畳み込み層850によって受け取られた入力特徴マップ854に基づいて空間注意マップ860を作成し、複数の座標マップ856、858の各々における座標情報を修正して、複数の加重座標マップ856’、858’を作成するステップとを含む。様々な例示的な実施形態では、空間注意マップ860を作成するステップは、畳み込み層850によって受け取られた入力特徴マップ854に基づいて第1の畳み込み動作862を実行し、畳み込み特徴マップを作成するステップと、畳み込み特徴マップに基づいて活動化関数864を適用し、空間注意マップ860を作成するステップとを含む。様々な例示的な実施形態では、複数の加重座標マップ856’、858’を作成するステップは、複数の座標マップ856、858の各々を空間注意マップ860と乗じて、複数の座標マップ856、858の各々における座標情報を修正するステップを含む。様々な例示的な実施形態では、畳み込み層850の出力特徴マップ870を作成するステップは、畳み込み層850によって受け取られた入力特徴マップ854および複数の加重座標マップ856’、858’をチャネルごとに連結して、連結特徴マップ866を形成するステップと、連結特徴マップ866に基づいて第2の畳み込み動作868を実行し、畳み込み層850の出力特徴マップ870を作成するステップとを含む。
【0084】
[0088]空間的注意のような動作は、i)Minと{Mi,Mj}との間のスケール差を低減させるための同期層、ii)現在の入力特徴マップ854から導出された注意マップ860の案内によってより重要な幾何学的情報を捕捉するために、一定の座標マップを使用するのではなく、すべての画素の座標の再加重という2つの役割を担う。たとえば、2つの座標iおよびjに関して、i座標マップ(またはi座標チャネル)856およびj座標マップ(またはj座標チャネル)858を提供することができる。たとえば、i座標マップ856は、h×ωのランク1マトリックスとすることができ、その第1の行は0で埋められ、その第2の行は1で埋められ、その第3の行は2で埋められ、以下同様である。j座標マップ858は、i座標マップ856と同じまたは同様のものとすることができるが、行ではなく列が、上述した値で埋められている。様々な例示的な実施形態によって前述したように、U2-Netで使用されるRSU720は、畳み込み層を様々な例示的な実施形態によるAC-Conv層850に置き換えることによって、様々な例示的な実施形態によるAC-RSUを作成または構築するように修正または適合することができる。たとえばRSU720と比較すると、AC-RSUは、テキスチャおよび幾何学的特徴の両方を異なる受容野から抽出することが可能である。様々な例示的な実施形態では、予測モジュールACU2-Net410、ならびに精練E-Module450内の3つのサブネットワークACU2-Net-Ref7、ACU2-Net-Ref5、およびACU2-Net-Ref3はすべて、AC-RSUに基づいて構築されている。
【0085】
並列マルチヘッド残差精練モジュール(MH-RRM)
[0089]精度をさらに改善しようとして、複数の従来の予測精練モデルが、
図9Aに示すように、
【0086】
【0087】
として、直列サブネットワーク(直列精練モジュール)によって粗い結果を再帰的または累進的に精練するように設計されてきた。最終出力
【0088】
【0089】
は、理論的には最も正確な出力であり、したがって通常は最終結果として利用される。この直列精練方策は、分割結果のバイアスを低減させることが可能である。しかし、様々な例示的な実施形態では、そのようなネットワークを使用した超音波画像内の軟組織の分割は、実際には、低い画像品質およびぼやけた境界により、大きな分散を有することが多いことが分かった。予測のバイアスおよび分散を低減させるために、マルチモデルアンサンブル方策を使用することができる。しかし、様々な例示的な実施形態では、複数のディープモデルの直接アンサンブル化には、大きい計算および時間コストが必要となることが分かった。従来の技法に伴うこれらの問題に対処するために、様々な例示的な実施形態は、アンサンブル方策を精練モジュールに埋め込む。特に、本発明の様々な例示的な実施形態によれば、
図4Bに示す簡単かつ効果的な並列マルチヘッド残差精練モジュール(MH-RRM)450が提供される。限定ではなくほんの一例として、様々な例示的な実施形態によるMH-RRMヘッド454-1、454-2、454-3(たとえば、様々な実施形態によって前述した複数の精練ブロックに対応)の数は、
図4Bに示すように、3
【0090】
【0091】
に設定される。前述したように、3つの精練ヘッドまたはブロック454-1、454-2、454-3は各々、融合特徴マップ444に基づいて異なる空間分解能レベルを有する精練特徴マップを作成するように構成されたACU2-Netに基づいて形成することができる。様々な例示的な実施形態では、複数の精練ブロック454-1、454-2、454-3は、それぞれ複数の精練特徴マップ464-1、464-2、464-3を作成する。それに応じて、様々な例示的な実施形態では、複数の精練特徴マップ464-1、464-2、464-3は、異なる空間分解能レベルを有する。
【0092】
[0090]様々な例示的な実施形態では、複数の精練ブロック454-1、454-2、454-3の各々は、複数のエンコーダブロックおよび複数のデコーダブロックを含むエンコーダ-デコーダ構造を有する。各精練ブロックおよび精練ブロックの複数のエンコーダブロックの各々に対して、
図4Bに示すように、エンコーダブロックによって受け取られた入力特徴マップに基づいて、エンコーダブロックを使用してダウンサンプル特徴マップを作成することができる。さらに、各精練ブロックおよび精練ブロックの複数のデコーダブロックの各々に対して、
図4Bに示すように、入力特徴マップ、およびデコーダブロックに対応するエンコーダブロックによって作成され、デコーダブロックによって受け取られたダウンサンプル特徴マップに基づいて、デコーダブロックを使用してアップサンプル特徴マップを作成することができる。様々な例示的な実施形態では、複数の精練ブロックの複数のエンコーダ-デコーダ構造は、異なる高さを有する。
【0093】
[0091]様々な例示的な実施形態では、
図4Bに示すように、各精練ブロックに対して、精練ブロックによって受け取られた融合特徴マップ444、および精練ブロックの複数のデコーダブロックのうちの第1のデコーダブロック458-1、458-2、458-3によって作成されたアップサンプル特徴マップに基づいて、精練ブロックの精練特徴マップを作成することができる。様々な例示的な実施形態では、例示的なCNN400の出力画像は、1組の精練特徴マップ464-1、464-2、464-3の平均に基づいて作成される。
【0094】
[0092]それに応じて、様々な例示的な実施形態では、入力画像Xを考慮して、例示的なCNN400の最終分割結果は、
【0095】
【0096】
として表現することができる。
[0093]
図9Bは、上述した並列精練モジュールを伴う例示的なCNN400の予測精練アーキテクチャの意味論的な作業フローを示す。
図9Aおよび
図9Bで、太字は最終予測結果を示す。
【0097】
訓練および推論
[0094]訓練プロセスにおいて、E-Module450の3つの精練出力R
(1)464-1、R
(2)464-2、およびR
(3)464-3が、
図4Aに示すようにおよび
図4B、7つのサイド出力
【0098】
【0099】
および予測モジュール410からの1つの融合出力Sfuse444とともに、独立して計算された損失によって監視される。モデル全体を、バイナリ交差エントロピー(BCE)損失
【0100】
【0101】
によって、端末相互間で訓練することができ、ここで、
【0102】
【0103】
は総損失であり、
【0104】
【0105】
【0106】
および
【0107】
【0108】
はサイド出力、融合出力、および精練出力の対応する損失であり、
【0109】
【0110】
【0111】
および
【0112】
【0113】
は異なる出力を強調するための対応する重みである。様々な例示的な実施形態によって行われた実験では、λ重みはすべて1.0に設定されている。推論プロセスにおいて、R(1)464-1、R(2)464-2、およびR(3)464-3の平均が、最終予測結果(たとえば、様々な実施形態によって前述したCNNの出力画像に対応)として利用される。
【0114】
実験
[0095]甲状腺は、首の根元で鎖骨の真上にある蝶形の臓器であり、左葉および右葉が、峡部と呼ばれる中間で細い帯状組織によって接続されている(
図10参照)。特に、
図10は、手動でラベル付けされた甲状腺葉オーバーレイ1010を有する対応する超音波画像に沿って、甲状腺および超音波走査プロトコルの概略図を示す。
図10の画像の上の行の点線矢印は、横断面(TRX)および矢状面(SAG)における超音波プローブの走査方向を示す。
図10の画像の下の行は、手動でラベル付けられた甲状腺葉オーバーレイ1010とともに、サンプルTRX画像(左)およびSAG画像(右)を示す。
【0115】
[0096]甲状腺異常を診断するために、臨床医は、収集された超音波スキャンから甲状腺を手動で分割することによって、そのサイズを評価することができる。限定ではなく説明の目的でほんの一例として、例示的なCNN400は、甲状腺組織の分割の問題に関して事例研究として評価された。
【0116】
データセット
[0097]既存の公開データセットはいずれも、大規模学習に基づく方法には好適ではないと考えられる。大規模な臨床応用を可能にするために、参加施設の健康研究倫理委員会の承認を得て、包括的な甲状腺超音波分割データセットが収集された。
【0117】
[0098]超音波スキャンの収集に関しては、12の異なる撮像施設の甲状腺超音波検査で見つかった18歳から82歳の700人の患者から、777点の超音波スキャンが遡及的に収集された。スキャンは、超音波プローブの走査方向によって、横断面(TRX)および矢状面(SAG)に分けられた(たとえば、
図10参照)。したがって、2つの区分(TRXおよびSAGセット)が利用可能であった。各区分は、訓練、認証、および試験に関して、同じ患者が2つの異なる部分集合に入らないように、患者IDに基づいてさらに3つの部分集合にランダムに分割された。
図11は、各部分集合におけるボリューム番号および対応するスライス(画像)を示す表(表2)を示す。特に、表2は、甲状腺データセット内のTRXおよびSAG甲状腺スキャンの数を示し、それによって「Vol#」および「Slice#」は、それぞれボリューム番号および対応するラベル付き画像を示す。
【0118】
[0099]注釈またはラベル付けに関して、データセット内の画像は、5人の経験豊富な音波検査者によって手動でラベル付けされ、3人の放射線科医によって検証された。合計でかなり多数の画像が利用可能であることを考慮して、ラベル付け時間を節約するために、訓練セット内の超音波スキャンは、3つまたは5つごとのスライスにラベル付けされた。しかし、認証および試験セットは、正確なボリューム評価のために、スライスごとにラベル付けされた。
【0119】
[00100]実装の詳細に関して、例示的なCNN400は、PyTorchによって実装された。指定された訓練、評価、および試験セットを使用して、例示的なCNN400の性能を評価した。訓練プロセスでは、入力画像はまず、160×160×3にサイズ変更され、次いでランダムに144×144×3に切り取られた。オンラインのランダム水平および垂直反転を使用して、データセットを増強した。訓練バッチサイズは12に設定された。モデル重みは、デフォルトのHeの一様初期化によって初期化された(たとえば、Heら、「Delving deep into rectifiers: Surpassing human-level performance on imagenet classification(整流器の探求:ImageNet分類における人間レベルの性能を超える)」、Proceedings of the IEEE international conference on computer vision、1026~1034、2015参照)。Adam optimizer(たとえば、Kingma、「Adam:A method for stochastic optimization(Adam:確率論的最適化の方法)」、arXiv preprint arXiv:1412.6980、2014参照)が、学習率le-3および重み減衰なしで使用された。訓練損失は約50,000回の反復後に収束し、これには約24時間を費やした。試験プロセスにおいて、入力画像は160×160×3にサイズ変更され、例示的なCNNへ送られた。ダウンサンプリングプロセスおよびアップサンプリングプロセスの両方において、双線形補間が使用された。訓練プロセスおよび試験プロセスはどちらも、AMD Ryzen Threadripper 2920x 4.3 GHz CPU (128 GB RAM)を有し、NVIDIA GTX 1080 Ti GPUを伴う12コア、24スレッドのPCで行われた。
【0120】
[00101]評価メトリクスに関しては、体積Dice(たとえば、Popovicら、「Statistical validation metric for accuracy assessment in medical image segmentation(医療画像分割における精度評価のための統計的評価基準)」、IJCARS、2(2-4):169~181、2007)およびその標準偏差σという2つの測定結果を使用して、本方法の全体的な性能を評価した。Diceスコアは、
【0121】
【0122】
として定義され、ここでPおよびGは、それぞれ予測される分割マスクスイープ(h×ω×c)およびグラウンドトゥルースマスクスイープ(h×ω×c)である。Diceスコアの標準偏差は、
【0123】
【0124】
として計算され、ここで、Nは試験体積の数であり、Diceμは全試験セットの平均体積Diceスコアである。行われた実験では、各試験セットの平均ダイス(Dice)が、標準偏差(σ)とともに報告された。
【0125】
[00102]例示的なCNN(ACU2E-Net)400は、U-Net(Ronnebergerら、「U-net:Convolutional networks for biomedical image segmentation(U-net:生物医学画像分割のための畳み込みネットワーク)」、MICCAI、234~241、2015)を含む11の現況技術(SOTA)モデル、ならびにRes U-Net(たとえば、Xiaoら、「Weighted Res-UNet for high-quality retina vessel segmentation(高品質網膜血管分割のための加重Res-UNet)」、ITME、327~331、2018参照)、Dense U-Net(たとえば、Guanら、「Fully Dense UNet for 2-D Sparse Photoacoustic Tomography Artifact Removal(2Dの希薄な光音響トモグラフィアーティファクト除去のための完全高密度UNet)」、IEEE JBHI、24(2):568~576、2019参照)、Attention U-Net(たとえば、Oktayら、「Attention u-net:Learning where to look for the pancreas(注意U-net:膵臓を探すべき場所の学習)」、arXiv preprint arXiv:1804:03999、2018参照)、U-Net++(たとえば、Zhouら、「Unet++:A nested u-net architecture for medical image segmentation(Unet++:医療画像分割のためのネスト状U-netアーキテクチャ)」、MICCAI-W、3~11、2018参照)、およびU2-Net(たとえば、Qinら、「U2-Net:Going Deeper with nested U-structure for salient object detection(U2-Net:顕著オブジェクト検出のためにネスト状U構造によって深化する)」、Pattern Recognition、106:107404、2020参照)を含むその5つの変形形態、ならびにStacked HourglassNet(たとえば、Newellら、「Stacked hourglass networks for human pose estimation(人物姿勢推定のための積層砂時計)」、ECCV、483~499、2016参照)、SRM(たとえば、Wangら、「A stagewise refinement model for detecting salient objects in images(画像内で顕著オブジェクトを検出するための段階ごとの精練モデル)」、ICCV、4019~4028、2017参照)、C-U-Net(たとえば、Tangら、「Quantized densely connected u-nets for efficient landmark localization(効率的なランドマーク特定のための量子化され高密度に接続されたU-net)」、ECCV、339~354、2018参照)、R3-Net(Dengら、「R3net:Recurrent residual refinement network for saliency detection(R3net:顕著性検出のための再帰残差精練ネットワーク)」、AAAI、2018)、およびBASNet(Qinら、「Basnet:Boundary-aware salient object detection(Basnet:境界認識顕著オブジェクト検出)」、CVPR、7479~7489、2019)を含む5つの予測精練モデルと比較された。
【0126】
[00103]
図12は、TRXおよびSAG試験セットにおける例示的なCNN400と他の現況技術の分割モデルとの定量的な評価または比較を示す表(表3)を示す。表3の上部は、従来のU-NetおよびAttention U-Netのようなその変形形態に対する比較を含み、表の下部は、R
3-Netのような予測精練方策を伴うモデルに対する比較を示す。例示的なCNN400はTRX画像およびSAG画像の両方において最も高いDiceスコアを生じさせることを観察することができる。さらに、並列精練モジュール450は、次善のモデル(BASNet)およびR
3-Netのような他の精練モジュール設計に対して、Diceスコアを2.55%、1.22%大幅に改善し、標準偏差σを31.99%、7.51%低減させる。
【0127】
[00104]
図13A~
図13Lおよび
図14A~
図14Lは、TRXおよびSAG甲状腺画像におけるサンプル分割結果を示す。特に、
図13A~
図13Lは、均質な甲状腺のサンプリングされたTRXスライスにおける異なる方法に対するグラウンドトゥルース(白色点線)および分割結果(白色実線)の定性的比較を示し、
図14A~
図14Lは、不均質な甲状腺のサンプリングされたSAGスライスにおける異なる方法に対するグラウンドトゥルース(白色点線)および分割結果(白色実線)の定性的比較を示す。見ることができるように、例示的なCNN400は、改善された(より正確な)分割結果をもたらすことが可能であった。具体的には、
図13A~
図13Lは、大きいスパークルノイズおよびぼやけた境界を有する均質なTRX甲状腺葉を示す。Res U-Net、U-Net++、SRM、C-U-Net、R
3-Net、およびBASNetは、正確な境界を捕捉することができない。U-Net、Dense U-Net、Attention U-Net、U
2-Net、およびStacked HourglassNetなどの他のモデルは、甲状腺の左上の細長い領域を分割することができない。
図14A~
図14Lは、いくつかの複雑な結節を含む不均質なSAG図の甲状腺の分割結果を示す。それに応じて、見ることができるように、例示的なCNN400は、他のモデルより比較的良好な結果をもたらす。
【0128】
[00105]例示的なCNN400の頑強性をさらに評価するために、TRX画像およびSAG画像における例示的なCNN400および他の11の現況技術モデルの成功率曲線を、それぞれ
図15Aおよび
図15Bに描く。成功率は、走査総数に対する走査予測の数(特定のダイス閾値より高いスコアを有する)の比として定義される。成功率が高ければ高いほど、性能がより良好であることを示し、したがって上部の曲線(ACU
2E-Net)は、比較されている他の11の現況技術モデルより良好である。それに応じて、見ることができるように、例示的なCNN400は、TRXおよびSAGの両方の試験セットにおいて、他のモデルより大差で性能が優れている。
【0129】
[00106]様々な例示的な実施形態によるAC-Convの有効性を認証するために、適合されたU
2-Netにおける単純畳み込み(単純Conv)(LeCunら、「Gradient-based learning applied to document recognition(文書認識に適用される勾配に基づく学習)」、Proceedings of IEEE、86(11):2278~2324、1998)を、その圧縮および励起(squeeze-and-excitation)ブロックによってチャネル相互依存を明示的にモデル化するSE-Conv(Huら、「Squeeze-and-excitation networks(圧縮および励起ネットワーク)」、CVPR、7132~7141、2018)、特徴マップをそのチャネルおよび空間注意ブロックによって精練するCBAM-Conv(Wooら、「Cbam:Convolutional block attention module(Cbam:畳み込みブロック注意モジュール)」、ECCV、3~19、2018)、座標チャネルの使用によってその独自の入力座標に畳み込みアクセスを与えるCoordConv(Liuら、「An intriguing failing of convolution neural networks and the CoordConv solution(畳み込みニューラルネットワークの興味深い欠点およびCoordConvの解決策)」、NIPS、9605~9616、2018)、ならびに本発明者らのAC-Convという変形形態に置き換えることによって、アブレーション研究が行われた。
図16は、異なる畳み込みブロックおよび精練アーキテクチャで行われたアブレーション研究を示す表(表4)を示す。表4で、Ref7は、ACU
2-Net-Ref7の略語である。これらの実験は、TRX甲状腺試験セットで行われた。TRX試験セットに関する結果が、表4の上部に示されている。見ることができるように、AC-Convを使用したACU
2-Netは、Diceスコアおよび標準偏差σの両方の点で最善の結果を与える。これにより、幾何学的情報および空間情報を一緒に知覚する複合的な方策が、単独の空間的な注意に基づく方法(CBAM)または座標に基づく方法(CoordConv)より効果的であることがさらに実証される。
【0130】
[00107]MH-RRM(E-Module)の性能を認証するために、アブレーション研究はまた、直列RRM Ref3(Ref5(Ref7)))、並列RRMを有する3つの同じRRM avg(Refk,Refk,Refk){k=3,5,7}、および融合された並列RRM conv(Ref7,Ref5,Ref3)を含む異なる精練構成に関して行われ、並列精練出力は、推論における平均化ではなく、畳み込み層によって融合された。表4の下部は、RRMに関するアブレーション結果を示し、直列RRM、同じ分岐を有する並列RRM、ならびに融合された並列RRMがすべて、様々な例示的な実施形態によるMH-RRMに劣ることを示す。
【0131】
[00108]それに応じて、様々な例示的な実施形態は、有利には、超音波画像における柔組織構造の分割のために、注意に基づく予測精練ネットワーク(ACU2E-Net)400を提供する。特に、ACU2E-Netは、(a)超音波画像にける甲状腺の幾何学的情報を十分に活用する注意座標畳み込み(AC-Conv)850、および(b)アンサンブル方策を残差精練手法と統合することによって、分割結果を精練する並列マルチヘッド精練モジュール(MH-RRM)450に基づいて構築される。
【0132】
[00109]徹底的なアブレーション研究、および前述した現況技術モデルとの比較により、訓練および推論プロセスを複雑にすることなく、例示的なCNN400の有効性および頑強性が実証される。例示的なCNN400について、超音波画像からの甲状腺組織の分割に関して説明してきたが、例示的なCNN400、ならびにAC-Conv850およびMH-RRM450は、超音波画像から甲状腺組織を分割するために適用されることに限定されるものではなく、所望される場合または適当な場合、それだけに限定されるものではないが、肝臓、脾臓、および腎臓、ならびに腫瘍(たとえば、肝臓内の肝細胞がん(HCC)または皮下腫瘤)など、他のタイプの組織を超音波画像から分割するために適用することもできることが理解されよう。
【0133】
[00110]本発明の実施形態について、特有の実施形態を参照して特に図示および説明してきたが、添付の特許請求の範囲によって定義される本発明の範囲から逸脱することなく、形態および詳細に様々な変更を加えることができることを、当業者には理解されたい。したがって、本発明の範囲は、添付の特許請求の範囲によって示されており、したがって、特許請求の範囲に等価の意味および範囲内のすべての変更が包含されることが意図される。
【手続補正書】
【提出日】2024-03-26
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサを使用した畳み込みニューラルネットワーク(CNN)に基づく画像処理方法であって、
入力画像を受け取るステップと、
前記CNNの複数の畳み込み層を使用して複数の特徴量抽出動作を実行し、複数の出力特徴マップを作成するステップであって、前記複数の特徴量抽出動作のそれぞれの特徴量抽出動作が、前記複数の畳み込み層のそれぞれの畳み込み層によって実行され、
前記それぞれの畳み込み層によって、それぞれの入力特徴マップ(854)および複数の座標マップ(856、858)を受け取るステップと、
前記それぞれの畳み込み層によって、前記それぞれの入力特徴マップ(854)に基づいて、それぞれの空間注意マップ(860)を生成するステップと、
前記それぞれの畳み込み層によって、前記複数の座標マップ(856、858)および前記それぞれの空間注意マップ(860)に基づいて、複数の加重座標マップ(856”、858”)を生成するステップと、
前記それぞれの畳み込み層によって、前記それぞれの入力特徴マップ(854)および前記複数の加重座標マップ(856”、858”)に基づいて、前記それぞれの畳み込み層のそれぞれの出力特徴マップ(870)を出力するステップを含む、作成するステップと、
を含むステップと、
前記複数の畳み込み層の前記複数の出力特徴マップに基づいて、前記入力画像に対応する出力画像を作成するステップと、
を含む、方法。
【請求項2】
前記それぞれの畳み込み層によって、前記それぞれの入力特徴マップに基づいて、それぞれの空間注意マップを生成するステップが、
前記それぞれの畳み込み層によって受け取られた前記それぞれの入力特徴マップ(854)に基づいて第1の畳み込み動作(862)を実行し、それぞれの畳み込み特徴マップを作成するステップと、
前記それぞれの畳み込み特徴マップに基づいて活動化関数(864)を適用し、前記それぞれの空間注意マップ(860)を生成するステップと
を含む、請求項1に記載の方法。
【請求項3】
前記活動化関数(864)が、シグモイド活動化関数である、請求項2に記載の方法。
【請求項4】
前記それぞれの畳み込み層によって、前記複数の加重座標マップ(856”、858”)を生成するステップが、複数の座標マップ(856、858)の各々を前記それぞれの空間注意マップ(860)と乗じて、前記複数の座標マップの各々における座標情報を修正するステップを含む、請求項2または3に記載の方法。
【請求項5】
前記複数の座標マップ(856、858)が、第1の次元に対する座標情報を含む第1の座標マップ(856)と、第2の次元に対する座標情報を含む第2の座標マップ(858)とを含み、前記第1の次元および前記第2の次元が、前記第1の畳み込み動作が実行されるように構成された2つの次元である、請求項2~4のいずれか一項に記載の方法。
【請求項6】
前記それぞれの畳み込み層によって、前記それぞれの畳み込み層のそれぞれの出力特徴マップを出力するステップが、
前記それぞれの畳み込み層によって受け取られた前記それぞれの入力特徴マップ(854)および前記複数の加重座標マップ(856”、858”)をチャネルごとに連結して、それぞれの連結特徴マップ(866)を形成するステップと、
前記それぞれの連結特徴マップに基づいて第2の畳み込み動作を実行して、前記それぞれの畳み込み層のそれぞれの出力特徴マップを作成するステップと
を含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記CNNが、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含む予測サブネットワーク(410)を含み、
前記方法が、
前記入力画像に基づいて、前記予測サブネットワーク(410)を使用して1組の予測特徴マップを作成するステップをさらに含み、前記1組の予測特徴マップを作成するステップが、
前記予測サブネットワークの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含み、前記1組の予測特徴マップが、異なる空間分解能レベルを有する複数の予測特徴マップを含む、
請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記予測サブネットワーク(410)が、複数の第1のエンコーダブロック(420)および複数の第1のデコーダブロック(430)を含むエンコーダ-デコーダ構造を有し、前記複数の第1のエンコーダブロックの各々の第1のエンコーダブロックが、前記複数の第1のデコーダブロックのうちの1つのそれぞれの第1のデコーダブロックに対応し、
前記方法が、
前記複数の第1のエンコーダブロック(420)のうちのそれぞれの第1のエンコーダブロックによって、前記それぞれの第1のエンコーダブロックによって受け取られたそれぞれの入力特徴マップに基づいて、それぞれのダウンサンプル特徴マップを作成するステップと、
前記複数の第1のデコーダブロック(430)のうち、前記それぞれの第1のエンコーダブロックに対応するそれぞれの第1のデコーダブロックによって、前記それぞれの入力特徴マップ、および前記それぞれの第1のデコーダブロックに対応する前記それぞれの第1のエンコーダブロックによって作成された前記それぞれのダウンサンプル特徴マップに基づいて、それぞれのアップサンプル特徴マップを作成するステップと、
をさらに含む、請求項7に記載の方法。
【請求項9】
前記予測サブネットワーク(410)を使用して前記1組の予測特徴マップを作成するステップが、前記複数の第1のデコーダブロックによって作成された複数のアップサンプル特徴マップに基づいて、前記複数の予測特徴マップを作成するステップを含む、請求項8に記載の方法。
【請求項10】
前記複数の第1のエンコーダブロック(420)のうちのそれぞれの第1のエンコーダブロックに対して、前記それぞれのダウンサンプル特徴マップを作成するステップが、
前記それぞれの第1のエンコーダブロックによって受け取られた前記それぞれの入力特徴マップに基づいて、第1のマルチスケール特徴を抽出するステップと、
前記抽出された第1のマルチスケール特徴に基づいて、前記それぞれのダウンサンプル特徴マップを作成するステップとを含み、
前記複数の第1のデコーダブロック(430)のうちのそれぞれの第1のデコーダブロックに対して、前記それぞれのアップサンプル特徴マップを作成するステップが、
前記それぞれの入力特徴マップ、および前記それぞれの第1のエンコーダブロックによって作成され、前記デコーダブロックによって受け取られた前記それぞれの第1のデコーダブロックに対応する前記それぞれのダウンサンプル特徴マップに基づいて、第2のマルチスケール特徴を抽出するステップと、
前記それぞれのデコーダブロックによって抽出された前記抽出マルチスケール特徴に基づいて、前記それぞれのアップサンプル特徴マップを作成するステップとを含む、
請求項8または9に記載の方法。
【請求項11】
前記予測サブネットワーク(410)の前記複数の第1のエンコーダブロック(420)の各々が、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、
前記複数の第1のエンコーダブロックのうちの前記それぞれの第1のエンコーダブロックによって、前記それぞれのダウンサンプル特徴マップを作成するステップが、
前記それぞれの第1のエンコーダブロックの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含み、
前記予測サブネットワーク(410)の前記複数の第1のデコーダブロック(430)の各々が、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、
前記複数の第1のデコーダブロックのうちの前記それぞれの第1のデコーダブロックによって、前記それぞれのアップサンプル特徴マップを作成するステップが、
前記それぞれの第1のデコーダブロックの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む、
請求項8~10のいずれか一項に記載の方法。
【請求項12】
前記予測サブネットワーク(410)の前記複数の第1のエンコーダブロック(420)の各々の各畳み込み層が、前記CNNの複数の畳み込み層のうちの1つであり、
前記予測サブネットワーク(410)の前記複数の第1のデコーダブロック(430)の各々の各畳み込み層が、前記CNNの複数の畳み込み層のうちの1つである、
請求項11に記載の方法。
【請求項13】
前記予測サブネットワークの前記複数の第1のエンコーダブロックの各々が、残差ブロックとして構成され、
前記予測サブネットワークの前記複数の第1のデコーダブロックの各々が、残差ブロックとして構成される、
請求項8~12のいずれか一項に記載の方法。
【請求項14】
前記CNNが、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含む精練サブネットワーク(450)をさらに含み、
前記方法が、融合特徴マップ(444)に基づいて前記精練サブネットワーク(450)を使用して1組の精練特徴マップ(464-1、464-2、464-3)を作成するステップをさらに含み、前記作成するステップが、
前記精練サブネットワークの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含み、前記1組の精練特徴マップ(464-1、464-2、464-3)が、異なる空間分解能レベルを有する複数の精練特徴マップ(464-1、464-2、464-3)を含む、
請求項7~13のいずれか一項に記載の方法。
【請求項15】
前記1組の予測特徴マップを連結して、前記融合特徴マップ(444)を作成するステップをさらに含む、請求項14に記載の方法。
【請求項16】
前記精練サブネットワーク(450)が、前記複数の精練特徴マップ(464-1、464-2、464-3)を作成するように構成された複数の精練ブロック(454-1、454-2、454-3)を備え、前記複数の精練ブロックの各々が、複数の第2のエンコーダブロックおよび複数の第2のデコーダブロックを含むエンコーダ-デコーダ構造を有し、前記複数の第2のエンコーダブロックのうちのそれぞれの第2のエンコーダブロックが、前記複数の第2のデコーダブロックのうちの1つのそれぞれの第2のデコーダブロックに対応し、
前記方法が、前記複数の精練ブロック(454-1、454-2、454-3)のうちの各精練ブロックに対して、
前記複数の第2のエンコーダブロックのうちの各々の第2のエンコーダブロックによって、前記それぞれの第2のエンコーダブロックによって受け取られた入力特徴マップに基づいて、前記それぞれの第2のエンコーダブロックを使用してそれぞれのダウンサンプル特徴マップを作成するステップと、
前記複数の第2のデコーダブロックのうちの各々の第2のデコーダブロックによって、前記それぞれの入力特徴マップ、および前記それぞれの第2のデコーダブロックに対応する前記それぞれの第2のエンコーダブロックによって作成され、前記それぞれの第2のデコーダブロックによって受け取られた前記それぞれのダウンサンプル特徴マップに基づいて、前記それぞれの第2のデコーダブロックを使用してそれぞれのアップサンプル特徴マップを作成するステップとをさらに含む、
請求項14または15に記載の方法。
【請求項17】
前記複数の精練ブロック(454-1、454-2、454-3)が、異なる高さを有する複数のエンコーダ-デコーダ構造を含む、請求項16に記載の方法。
【請求項18】
前記複数の精練ブロック(454-1、454-2、454-3)が、
前記複数の精練ブロックのうちの各精練ブロックに対して、前記それぞれの精練ブロックによって受け取られた前記融合特徴マップ(444)、および前記複数の第2のデコーダブロックのうち、前記それぞれの精練ブロックに対応するそれぞれの第2のデコーダブロックによって作成されたそれぞれのアップサンプル特徴マップに基づいて、前記複数の精練特徴マップのうちのそれぞれの精練特徴マップを作成することによって、前記複数の精練特徴マップ(464-1、464-2、464-3)を作成するように構成される、
請求項16または17に記載の方法。
【請求項19】
前記複数の第2のエンコーダブロックのうちの各々の第2のエンコーダブロックに対して、前記それぞれのダウンサンプル特徴マップを作成するステップが、
前記それぞれの第2のエンコーダブロックによって受け取られた前記それぞれの入力特徴マップに基づいて、第1のマルチスケール特徴を抽出するステップと、
前記それぞれの第2のエンコーダブロックによって抽出された前記抽出された第1のマルチスケール特徴に基づいて、前記それぞれのダウンサンプル特徴マップを作成するステップとを含み、
前記複数の第2のデコーダブロックのうちの各々の第2のデコーダブロックに対して、前記それぞれのアップサンプル特徴マップを作成するステップが、
前記それぞれの入力特徴マップ、および前記それぞれの第2のデコーダブロックに対応する前記それぞれの第2のエンコーダブロックによって作成され、前記それぞれの第2のデコーダブロックによって受け取られた前記それぞれのダウンサンプル特徴マップに基づいて、第2のマルチスケール特徴を抽出するステップと、
前記それぞれのデコーダブロックによって抽出された前記抽出マルチスケール特徴に基づいて、前記それぞれのアップサンプル特徴マップを作成するステップとを含む、
請求項16~18のいずれか一項に記載の方法。
【請求項20】
前記複数の精練ブロック454-1、454-2、454-3)のうちのそれぞれの精練ブロックに対して、
前記それぞれの精練ブロックに対応する前記複数の第2のエンコーダブロックの各々が、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、
前記複数の第2のエンコーダブロックのうちの各々の第2のエンコーダブロックによって、前記それぞれの精練ブロックの前記それぞれの第2のエンコーダブロックを使用して前記それぞれのダウンサンプル特徴マップを作成するステップが、
前記それぞれの第2のエンコーダブロックの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含み、
前記それぞれの精練ブロックに対応する前記複数の第2のデコーダブロックの各々が、前記CNNの複数の畳み込み層のうちの少なくとも1つの畳み込み層を含み、
前記複数の第2のデコーダブロックのうちの各々の第2のデコーダブロックによって、前記それぞれの精練ブロックの前記それぞれの第2のデコーダブロックを使用して前記それぞれのアップサンプル特徴マップを作成するステップが、
前記それぞれの第2のデコーダブロックの前記少なくとも1つの畳み込み層を使用して、前記複数の特徴量抽出動作のうちの少なくとも1つの特徴量抽出動作を実行するステップを含む、
請求項16~19のいずれか一項に記載の方法。
【請求項21】
前記精練ブロックの前記複数の第2のエンコーダブロックの各々の各畳み込み層が、前記CNNの複数の畳み込み層のうちの1つであり、
前記精練ブロックの前記複数の第2のデコーダブロックの各々の各畳み込み層が、前記CNNの複数の畳み込み層のうちの1つである、
請求項20に記載の方法。
【請求項22】
前記複数の精練ブロックの各々に対して、
前記精練ブロックの前記複数の第2のエンコーダブロックの各々が、残差ブロックとして構成され、
前記精練ブロックの前記複数の第2のデコーダブロックの各々が、残差ブロックとして構成される、
請求項16~21のいずれか一項に記載の方法。
【請求項23】
前記出力画像が、前記1組の精練特徴マップ(464-1、464-2、464-3)に基づいて作成される、請求項14~21のいずれか一項に記載の方法。
【請求項24】
前記出力画像が、前記1組の精練特徴マップ(464-1、464-2、464-3)の平均に基づいて作成される、請求項23に記載の方法。
【請求項25】
前記入力画像を受け取るステップが、複数の入力画像を受け取るステップを含み、前記複数の入力画像の各々が、前記CNNを訓練して訓練済みCNNを得るためのラベル付き画像であり、
前記方法が、前記複数の入力画像の各々に対して、
前記CNNの複数の畳み込み層を使用して前記複数の特徴量抽出動作を実行し、前記複数の出力特徴マップを作成するステップと、
前記複数の畳み込み層の前記複数の出力特徴マップに基づいて、前記入力画像に対応する前記出力画像を作成するステップとをさらに含む、
請求項1~24のいずれか一項に記載の方法。
【請求項26】
前記ラベル画像が、組織構造を含むラベル付き超音波画像である、請求項25に記載の方法。
【請求項27】
前記出力画像が、前記CNNを使用した前記入力画像に対する推論の結果である、請求項1~24のいずれか一項に記載の方法。
【請求項28】
前記入力画像が、組織構造を含む超音波画像である、請求項27に記載の方法。
【請求項29】
畳み込みニューラルネットワーク(CNN)に基づく画像処理システムであって、
メモリと、
前記メモリに通信的に結合されており、請求項1~28のいずれか一項に記載のCNNに基づいて画像処理方法を実行するように構成された少なくとも1つのプロセッサと、
を備える、システム。
【請求項30】
1つまたは複数の非一時的コンピュータ可読記憶媒体で実施されており、請求項1~28のいずれか一項に記載の畳み込みニューラルネットワーク(CNN)に基づく画像処理方法を実行するように少なくとも1つのプロセッサによって実行可能な命令を含む、コンピュータプログラム製品。
【請求項31】
少なくとも1つのプロセッサを使用して、畳み込みニューラルネットワーク(CNN)を使用して超音波画像内の組織構造を分割する方法であって、
請求項1~24のいずれか一項に記載のCNNに基づく画像処理方法を実行するステップを含み、
前記入力画像が、前記組織構造を含む前記超音波画像であり、
前記出力画像が、分割された前記組織構造を有し、前記CNNを使用した前記入力画像に対する推論の結果である、方法。
【請求項32】
前記CNNが、請求項25または26に記載のように訓練される、請求項31に記載の方法。
【請求項33】
CNNを使用して超音波画像内の組織構造を分割するためのシステムであって、
メモリと、
前記メモリに通信的に結合されており、請求項31または32に記載の畳み込みニューラルネットワーク(CNN)を使用して超音波画像内の組織構造を分割する方法を実行するように構成された少なくとも1つのプロセッサと、
を備える、システム。
【請求項34】
1つまたは複数の非一時的コンピュータ可読記憶媒体で実施されており、請求項31または32に記載の畳み込みニューラルネットワーク(CNN)を使用して超音波画像内の組織構造を分割する方法を実行するように少なくとも1つのプロセッサによって実行可能な命令を含む、コンピュータプログラム製品。
【国際調査報告】