IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝メディカルシステムズ株式会社の特許一覧

<>
  • 特開-超音波診断装置及びデータ処理方法 図1A
  • 特開-超音波診断装置及びデータ処理方法 図1B
  • 特開-超音波診断装置及びデータ処理方法 図2
  • 特開-超音波診断装置及びデータ処理方法 図3
  • 特開-超音波診断装置及びデータ処理方法 図4
  • 特開-超音波診断装置及びデータ処理方法 図5
  • 特開-超音波診断装置及びデータ処理方法 図6
  • 特開-超音波診断装置及びデータ処理方法 図7
  • 特開-超音波診断装置及びデータ処理方法 図8
  • 特開-超音波診断装置及びデータ処理方法 図9
  • 特開-超音波診断装置及びデータ処理方法 図10
  • 特開-超音波診断装置及びデータ処理方法 図11
  • 特開-超音波診断装置及びデータ処理方法 図12
  • 特開-超音波診断装置及びデータ処理方法 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024161915
(43)【公開日】2024-11-20
(54)【発明の名称】超音波診断装置及びデータ処理方法
(51)【国際特許分類】
   A61B 8/14 20060101AFI20241113BHJP
【FI】
A61B8/14
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2024075952
(22)【出願日】2024-05-08
(31)【優先権主張番号】63/500,847
(32)【優先日】2023-05-08
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】18/361,238
(32)【優先日】2023-07-28
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.WINDOWS
2.UNIX
3.Mac OS
(71)【出願人】
【識別番号】594164542
【氏名又は名称】キヤノンメディカルシステムズ株式会社
(74)【代理人】
【識別番号】110001771
【氏名又は名称】弁理士法人虎ノ門知的財産事務所
(72)【発明者】
【氏名】ティン シア
(72)【発明者】
【氏名】ジエン ジョウ
(72)【発明者】
【氏名】リヤン ツァイ
(72)【発明者】
【氏名】ジョウ ユウ
(72)【発明者】
【氏名】今村 智久
(72)【発明者】
【氏名】岩崎 亮祐
(72)【発明者】
【氏名】高橋 広樹
【テーマコード(参考)】
4C601
【Fターム(参考)】
4C601DE08
4C601EE04
4C601JB34
4C601JC06
(57)【要約】
【課題】画質を向上させること。
【解決手段】実施形態に係る超音波診断装置は、処理回路を備える。処理回路は、基本波成分および高調波成分を含む第1の訓練超音波データを複数の教師モデルの各々に入力し、前記第1の訓練超音波データを教師入力データとして、前記高調波成分を含む第2の訓練超音波データを教師ターゲットデータとして、前記複数の教師モデルの各教師モデルを訓練し、前記複数の教師モデルの各教師モデルについて、第1の超音波データの前記教師モデルへの入力に応答して、前記教師モデルから出力される対応する第1の推定データを取得し、前記訓練された教師モデルの各々から出力される前記対応する第1の推定データを評価することによって、前記複数の教師モデルのうちの、第1の特定の教師モデルを選択し、前記第1の超音波データを生徒入力データとして、前記第1の推定データを生徒ターゲットデータとして、生徒モデルを訓練する。
【選択図】図4
【特許請求の範囲】
【請求項1】
基本波成分および高調波成分を含む第1の訓練超音波データを複数の教師モデルの各々に入力し、前記第1の訓練超音波データを教師入力データとして、前記高調波成分を含む第2の訓練超音波データを教師ターゲットデータとして、前記複数の教師モデルの各教師モデルを訓練し、
前記複数の教師モデルの各教師モデルについて、第1の超音波データの前記教師モデルへの入力に応答して、前記教師モデルから出力される対応する第1の推定データを取得し、
前記訓練された教師モデルの各々から出力される前記対応する第1の推定データを評価することによって、前記複数の教師モデルのうちの、第1の特定の教師モデルを選択し、前記第1の超音波データを生徒入力データとして、前記第1の推定データを生徒ターゲットデータとして、生徒モデルを訓練する、処理回路
を備える、超音波診断装置。
【請求項2】
前記複数の訓練された教師モデルの各々が、前記生徒モデルとは異なるモデル構造および前記生徒モデルより多くのパラメータを有する、請求項1に記載の超音波診断装置。
【請求項3】
前記処理回路が、
前記複数の教師モデルの各教師モデルについて、前記第1の超音波データとは異なる第2の超音波データの前記教師モデルへの入力に応答して、前記教師モデルから出力される対応する第2の推定データを取得し、
前記第2の推定データを評価することによって、前記複数の教師モデルから第2の特定の教師モデルを選択し、
前記第2の超音波データを前記生徒入力データとして、前記選択された第2の特定の教師モデルの前記対応する第2の推定データを前記生徒ターゲットデータとして、前記生徒モデルを訓練する、請求項1に記載の超音波診断装置。
【請求項4】
前記処理回路が、前記選択された第1の特定の教師モデルとは異なる前記第2の特定の教師モデルを選択する、請求項1に記載の超音波診断装置。
【請求項5】
前記処理回路が、入力超音波データを前記生徒モデルに入力することにより、前記高調波成分を含む出力超音波データを生成する、請求項1に記載の超音波診断装置。
【請求項6】
基本波成分および高調波成分を含む第1の超音波データを入力超音波データとして、前記高調波成分を含む第2の超音波データを前記第1の超音波データに対応するターゲット出力超音波データとして取得し、
教師出力超音波データを生成するために、前記第1の超音波データを以前に訓練された教師モデルに入力し、
生徒出力超音波データを生成するために、前記第1の超音波データを生徒モデルに入力し、
前記教師出力超音波データ、前記生徒出力超音波データ、および前記ターゲット出力超音波データに基づいて、損失関数の損失値を計算し、
前記損失値に基づいて前記生徒モデルのパラメータを更新する処理回路
を備える、超音波診断装置。
【請求項7】
前記損失値の計算において、前記処理回路が、
前記生徒出力超音波データおよび前記ターゲット出力超音波データに基づいて、第1の損失関数の第1の損失値を計算し、
前記教師出力超音波データおよび前記生徒出力超音波データに基づいて、第2の損失関数の第2の損失値を計算し、
前記第1の損失値と前記第2の損失値との加重和として前記損失値を計算する、請求項6に記載の超音波診断装置。
【請求項8】
前記処理回路が、前記生徒モデルの前記パラメータが収束基準を満たすまで、異なる入力超音波データおよび対応する異なる第2の超音波データに対して、前記取得、入力、計算、および更新のステップを繰り返すようにさらに構成される、請求項6に記載の超音波診断装置。
【請求項9】
前記更新において、前記処理回路が、前記教師モデルのパラメータを更新することなく、前記生徒モデルの前記パラメータを更新する、請求項6に記載の超音波診断装置。
【請求項10】
前記処理回路が、入力超音波データを前記生徒モデルに入力することにより、前記高調波成分を含む出力超音波データを生成する、請求項6に記載の超音波診断装置。
【請求項11】
基本波成分および高調波成分を含む第1の訓練超音波データを複数の教師モデルの各々に入力し、前記第1の訓練超音波を教師入力データとして、前記高調波成分を含む第2の訓練超音波データを教師ターゲットデータとして、前記複数の教師モデルの各教師モデルを訓練し、
前記複数の教師モデルの各教師モデルについて、第1の超音波データの前記教師モデルへの入力に応答して、前記教師モデルから出力される対応する第1の推定データを取得し、
前記第1の推定データを評価することによって、前記複数の教師モデルから第1の特定の教師モデルを選択し、
前記第1の超音波データを生徒入力データとして、前記第1の推定データを生徒ターゲットデータとして、生徒モデルを訓練する、データ処理方法。
【請求項12】
基本波成分および高調波成分を含む第1の超音波データを入力超音波データとして、前記高調波成分を含む第2の超音波データを前記第1の超音波データに対応するターゲット出力超音波データとして取得し、
教師出力超音波データを生成するために、前記第1の超音波データを以前に訓練された教師モデルに入力し、
生徒出力超音波データを生成するために、前記第1の超音波データを生徒モデルに入力し、
前記教師出力超音波データ、前記生徒出力超音波データ、および前記ターゲット出力超音波データに基づいて、損失関数の損失値を計算し、
前記損失値に基づいて前記生徒モデルのパラメータを更新することと、
を含む、データ処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書及び図面に開示の実施形態は、超音波診断装置及びデータ処理方法に関する。
【背景技術】
【0002】
高次の高調波を用いた超音波イメージングを行うことで、アーチファクトを減少させ、コントラスト対ノイズ比を改善し、方位分解能を改善した画像を提供することができる。
また、近年、深層学習に基づく技術により、優れた画質および高速な画像取得で高調波イメージングを行うことができる。
【0003】
ここで、軽量モデルを開発するために、過去に多くの試みがなされてきた。しかし、これらのアプローチはいずれも、超音波イメージング特性に合わせた高調波超音波イメージング用に特別に設計されたものではない。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許出願公開第2023/0040181号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
本明細書及び図面の開示の実施形態が解決しようとする課題の一つは、画質を向上させることである。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置づけることもできる。
【課題を解決するための手段】
【0006】
実施形態に係る超音波診断装置は、処理回路を備える。処理回路は、基本波成分および高調波成分を含む第1の訓練超音波データを複数の教師モデルの各々に入力し、前記第1の訓練超音波データを教師入力データとして、前記高調波成分を含む第2の訓練超音波データを教師ターゲットデータとして、前記複数の教師モデルの各教師モデルを訓練し、前記複数の教師モデルの各教師モデルについて、第1の超音波データの前記教師モデルへの入力に応答して、前記教師モデルから出力される対応する第1の推定データを取得し、前記訓練された教師モデルの各々から出力される前記対応する第1の推定データを評価することによって、前記複数の教師モデルのうちの、第1の特定の教師モデルを選択し、前記第1の超音波データを生徒入力データとして、前記第1の推定データを生徒ターゲットデータとして、生徒モデルを訓練する。
【図面の簡単な説明】
【0007】
図1A図1Aは、例示的な従来の超音波画像の一例を示す図である。
図1B図1Bは、例示的な3次高調波を示す図である。
図2図2は、超音波イメージングシステムのためのシステム図である。
図3図3は、超音波組織高調波イメージングの方法を示す図である。
図4図4は、オフライン知識蒸留のフロー図である。
図5図5は、オンライン自己知識蒸留のフロー図である。
図6図6は、本開示の例示的な態様による、知識蒸留訓練プロセスのフローチャートである。
図7図7は、本開示の例示的な態様による、知識蒸留訓練プロセスのフローチャートである。
図8図8は、本開示の例示的な態様による、推論ステップのフローチャートである。
図9図9は、本開示の例示的な態様による、超音波高調波イメージングのための生徒モデルを訓練する方法のフローチャートである。
図10図10は、図9の計算ステップのフローチャートである。
図11図11は、図9の更新ステップのフローチャートである。
図12図12は、本開示の例示的な態様による、フローチャートであり、推論ステップのためのものである。
図13図13は、本開示の例示的な態様による機械学習訓練および推論方法を実施するための、例示的なコンピュータシステム204を示すブロック図である。
【発明を実施するための形態】
【0008】
以下、図面を参照しながら、超音波診断装置及びデータ処理方法の実施形態について詳細に説明する。
【0009】
図面において、同様の参照番号は、複数の図を通して同一または対応する部分を示す。
【0010】
超音波高調波イメージングにおいて、より高次の高調波を用いることにより、アーチファクトを著しく減少させ、コントラスト対ノイズ比を改善し、方位分解能を改善した画像を得ることができる。血管などのいくつかの解剖学的構造については、改善されたコントラストを有する高次高調波画像が所望される。例えば、3次高調波イメージングは、2次高調波画像と比較して、より少ないアーチファクトおよび改善された分解能を有する画像を提供し得る。例えば、図1Aは従来の超音波画像を示している。これに対して、図1Bは、例示的な3次高調波画像を示している。
【0011】
超音波システムが病院および診療所においてより柔軟で手ごろな価格になるにつれ、高画質で加速されたイメージング速度による高調波イメージングを有することが望まれる。近年、深層学習に基づく技術が、優れた画質および高速な画像取得で高調波イメージングを改善するための良好な解決策を提供している。深層学習は、所望の位相を有するより少ないパルスを同じラインに沿って組織内に順次送信し、同時に取得フレームレートを改善することによって、高調波の画質を改善するのに役立ち得る。
【0012】
深層学習に基づくフレームワークは、第2または第3高調波(すなわちIQ2およびIQ3)を直接使用することができ、または代わりに、IQ0、IQ1およびIQ2などの、より基本的な周波数を含むIQデータを使用して、高次または複合高調波画像を得ることができる。このようなフレームワークは、特徴を認識し、深度に依存し、異なるBMIおよび/または人口統計学的情報を有する患者用にカスタマイズすることができる。
【0013】
しかし、1つの問題は、通常、深層ニューラルネットワークは、膨大な計算コストおよびメモリコストを伴う、より深い、またはより広いネットワーク構造を必要とすることである。したがって、その大きなメモリコストおよび数値コストが、特に高フレームレートのリアルタイムイメージングに対して、深層ニューラルネットワークを実世界の解決策に適用することを妨げている。性能指標を大きく損なうことなくモデルサイズを縮小することは、時間およびメモリ効率の高い超音波イメージングにとって極めて重要である。これはまた、メモリサイズ、推論速度、およびネットワーク帯域幅のすべてが厳しく制約される携帯型超音波診断に特に有用である。
【0014】
軽量モデルを開発するために、効率的なアーキテクチャの使用、モデルの量子化、枝刈り、および知識蒸留を含む、他の分野で過去に多くの試みがなされてきた。しかし、これらのアプローチはいずれも、超音波イメージング特性に合わせた高調波超音波イメージング用に特別に設計されたものではない。
【0015】
例えば、現在の知識蒸留モデルのほとんどは、分類問題用に設計されている。加えて、生徒モデルと教師モデルのギャップが大きい場合、生徒モデルの性能が低下することがあり、生徒モデルは、データの多様性により、すべてのデータセットに対してではなく、いくつかのケースにおいてのみ最適でない可能性がある。これは、ユーザが走査深度、ビーム数、焦点、周波数、イメージング解剖学、ゲインなどを自由に変更することができる超音波イメージングに特に一般的である。したがって、超音波イメージングのタスクに対して、より優れた汎化能力を有する、よりロバストな生徒モデルを有することが望ましい。
【0016】
図2は、超音波イメージングシステムのためのシステム図である。超音波イメージングシステム200は、様々なトランスデューサ202のいずれかを含むことができる。トランスデューサのタイプには、凸型、直線型、およびセクタ型、ならびに特別な目的のために設計されたものが含まれる。トランスデューサ202によって受信された信号は、コンピュータシステム204で処理される。超音波イメージングシステム200は、個々のビームからの信号が隣接するビームからの重複するデータとマージされるマルチ高調波コンパウンディング(multi-harmonic compounding)を含むこともできる。
【0017】
超音波画像は、一般的に1から10MHz程度以上の、人間に聞こえる範囲を超える周波数の音波から作成される。トランスデューサ202は高周波を放射し、組織の界面から跳ね返ってくる反射波(基本周波数)を一連の時間領域信号として記録する。超音波画像の1つのタイプは、Bモード画像としても知られる輝度画像であり、これは被検体のグレースケール、強度ベースの表現である。
【0018】
トランスデューサ202が受信する生の信号は高周波領域であり、高周波(Radio Frequency、RF)データとして知られている。一連の信号処理ステップは、RFデータからBモード画像などの超音波画像に変換するためにコンピュータシステム204内で実行される。1つの前処理ステップは、RFデータをベースバンドに復調し、データを格納するのに必要な帯域幅を低減するために信号を間引くことである。この新しい信号は同相/直交位相(In-phase and Quadrature phase、IQ)信号と呼ばれ、一般的に複素数で表される。本開示では、IQデータとRFデータは、どちらもトランスデューサからの生データを表すが、フォーマットが異なるため、互換的に使用される。加えて、本開示の深層ニューラルネットワークの実施形態は、IQデータまたはIQデータに基づく超音波画像のいずれかを入力として取り込むように構成される。
【0019】
コンピュータシステム204は、携帯型超音波診断装置に組み込むことができ、リモートサーバとすることができ、またはインターネットを介してアクセスされるクラウドサービスとすることができる。超音波イメージングシステム200は、1つ以上の超音波画像を表示するための少なくとも1つの表示デバイス206を含む。表示デバイス206は、LCDディスプレイ、LEDディスプレイ、有機LEDディスプレイなどのいずれかであることができる。ディスプレイサイズおよび解像度は、コンピュータシステム204によって出力される超音波画像を表示するのに十分である。
【0020】
上述したコンピュータシステム204によって、以下の処理方法を実行することができる。
【0021】
一実施形態では、以下により詳細に説明するように、複数の教師モデルのうち、最もよく訓練された教師モデルが知識蒸留のために使用される。このアイデアは、オフライン知識蒸留のために実施され、代替的に、オンライン自己知識蒸留のために使用することができる。
【0022】
一実施形態では、オフライン知識蒸留において、本方法はまず、大規模データセット上で重くて強力な深層ネットワークを使用して一連の教師モデルを訓練する。畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)は、視覚認識タスクで使用されている。CNNは、例えばImageNetデータセットのように、100万枚の訓練画像などの大規模な訓練画像セットで訓練することができる。ImageNetは、8つの層および数百万のパラメータを有した。非常に重くて強力な深層畳み込みネットワークは、大規模な画像認識のために使用することができる。深層ニューラルネットワークは、例えば視覚用のあらゆる深層ニューラルネットワークであり得る。上述したように、畳み込みニューラルネットワークは優れた結果を示しており、特にU-Netアーキテクチャは、完全な畳み込みニューラルネットワークよりも少ないデータセットでの訓練を可能にする。また、多層パーセプトロンまたはビジョントランスフォーマを含む他のタイプの深層ニューラルネットワークを使用して、深層ニューラルネットワークを実装してもよい。
【0023】
次に、教師モデルの結果のうち、与えられた訓練データセットについて、最良の教師の知識は、小さなネットワーク、例えば、より少ない層およびパラメータを有する生徒モデルに転送される。生徒モデルの訓練には、与えられた入力に対する最良の教師モデルの結果のみが使用される。最良の教師モデルとは、例えば、最も高い精度を有するネットワークであるが、他の基準を使用することもできる。したがって、生徒は複数の教師から学習することができ、常に様々な訓練データのセットに対して既知の最良の教師から学習することが保証される。この戦略では、例えば、グランドトゥルースのターゲットデータが欠落している場合、生徒モデルの訓練のためにより多くの訓練データのペアを生成することもできる。これにより、データの多様性(例えば、様々なイメージング条件、周波数、イメージング深度、ビーム数など)を高めるための効果的なデータ増強が可能になる。
【0024】
一実施形態では、オンライン自己知識蒸留において、生徒ネットワークは、事前に訓練された「教師」ネットワークなしで、それ自身の知識を蒸留することによって漸進的に訓練される。最良の教師の概念を使用するために、生徒モデルは、現在のモデルの訓練プロセスを導くために、過去最良の生徒モデルを使用して更新される。この戦略は単純なネットワーク構造を使用し、モデルの汎化能力を向上させる。これは、生徒モデルと「教師」モデルとの間のギャップを縮小し、様々なイメージング条件においてよりロバストでありながらも軽量な構造のネットワークにするのに非常に有用である。
【0025】
図3は、超音波組織高調波イメージングの方法を示す図である。超音波の遠距離場画像でより多くの信号を得るために、2次高調波と3次高調波の両方の画像を取得することができる。上述したように、1つの方法はDTHI法であり、この方法では、fおよびfと呼ばれる異なる周波数で同時に2つのパルスが送信される。特に、それらの第2高調波周波数(2fおよび2f)に加えて、送信周波数の和および差(それぞれf+fおよびf-f)が組織内で発生する。低い周波数(2f)および差の周波数(f-f)のそれぞれの第2高調波信号316は、トランスデューサによって検出される。しかし、この方法はパルス生成に長い時間間隔312を必要とする。その結果、フレームレートが遅くなり、特に組織に動きがある場合には低画質のイメージングにつながる。
【0026】
図4は、オフライン知識蒸留の一実施形態のフロー図である。
【0027】
ステップS402において、複数の重くて強力な深層教師モデル452が、様々なIQ入力データ462および所望の高調波IQデータ/画像である出力データ464を使用して訓練される。一実施形態では、各教師モデルのための深層学習ベースのフレームワークは、トランスデューサ202によって受信され、コンピュータシステム204におけるデータ処理ステップを受ける、様々な異なる組み合わせのIQデータを入力し、改善された画質、より少ない近距離音場アーチファクト、改善されたコントラスト、およびより深い到達度(penetration)を有する所望の画像を出力するように構成される。深層学習に基づくフレームワークは、2次もしくは3次の高調波を直接使用することができ、または代わりに、基本周波数を含むデータを使用することもできる。入力IQデータは、基本周波数信号、2次高調波信号、および3次高調波信号の組み合わせ(IQ0)を含むことができる。IQデータは、基本超音波周波数と3次高調波の組み合わせ(IQ1)を含むことができる。入力IQデータは、2次高調波信号(IQ2)のみ、または3次高調波信号(IQ3)のみを含むこともできる。また、入力IQデータは、3次よりも大きい他の高次高調波であることもできる。
【0028】
ステップS406において、必要に応じてデータ増強を実行することができ、訓練された教師モデル452の各々は、様々なテストデータセット上で推論を実行する。各データセットについて、最良の出力結果/特徴マップを有する教師モデルが、そのデータセットの軽量な生徒モデル474を訓練するために使用される教師モデル472として選択される。
【0029】
ステップS410において、増強されたデータペア(IQ入力データ462、および対応するIQ入力データ462の最良の教師モデルの出力データ464から生じる知識蒸留データ468)を使用して、生徒モデル474が高調波イメージングのために訓練される。
【0030】
オフライン知識蒸留プロセスを図6図8のフローチャートにさらに示す。図6において、訓練プロセスは、ステップS602において、基本波成分および高調波成分を含む第1の訓練超音波データを複数の教師モデルの各々に入力することと、ステップS604において、第1の訓練超音波データを教師入力データとして、高調波成分を含む第2の訓練超音波データを教師ターゲットデータとして、複数の教師モデルの各教師モデルを訓練することとを含む。
【0031】
ステップS606において、本方法は、複数の訓練された教師モデルの各教師モデルについて、第1の超音波データの教師モデルへの入力に応答して、教師モデルから出力される対応する第1の推定データを取得することを含む。
【0032】
ステップS608において、本方法は、訓練された教師モデルの各々から出力される対応する第1の推定データを評価することによって、複数の訓練された教師モデルのうちの、第1の特定の教師モデルを選択することを含む。
【0033】
ステップS610において、第1の超音波データを生徒入力データとして、選択された第1の特定の教師モデルの対応する第1の推定データを生徒ターゲットデータとして、生徒モデルを訓練する。
【0034】
図7は、図6の方法のさらなるステップのフローチャートである。ステップS702において、本方法は、訓練された複数の教師モデルの各教師モデルについて、第1の超音波データとは異なる第2の超音波データの教師モデルへの入力に応答して、教師モデルから出力される対応する第2の推定データを取得することを含む。
【0035】
ステップS704において、本方法は、訓練された教師モデルの各々から出力される対応する第2の推定データを評価することによって、複数の訓練された教師モデルのうちの、第2の特定の教師モデルを選択することを含む。
【0036】
ステップS706において、本方法は、第2の超音波データを生徒入力データとして、選択された第2の特定の教師モデルの対応する第2の推定データを生徒ターゲットデータとして、生徒モデルを訓練することを含む。
【0037】
図8は、図6のさらなるステップのフローチャートである。ステップS802において、本方法は、入力超音波データを訓練された生徒モデルに入力することにより、高調波成分を含む出力超音波データを生成することを含む。
【0038】
図5は、オンライン自己知識蒸留訓練プロセスの一実施形態のフロー図である。
ステップS402において、IQ入力データ462を前処理し、その後生徒モデル474に入力することができる。IQ入力データ462に対応するターゲットIQデータは、図5に示す出力データ464である。ステップS404において、生徒モデルに入力されたのと同じIQ入力データ462が、以前の最良の生徒モデルである可能性のある擬似最良教師モデル482に入力される。ここで、生徒モデル474および擬似最良教師モデル482は、例えば、同じネットワーク構造およびパラメータ数を有することができる。生徒モデルの出力である知識蒸留データ468、擬似教師モデルの出力484、および所望/ターゲット出力データ464は、損失関数値を計算するために使用され、その後、生徒モデル474のパラメータを更新するために使用される。生徒モデル474の訓練中、擬似最良教師モデルのパラメータは固定されたままである。
【0039】
一実施形態では、オンライン訓練プロセスは、以下の擬似コードで表すことができ、(F,θ)は生徒モデル474を表し、θは訓練可能なパラメータのセットであり、(F,θ)は擬似最良教師モデル482を表し、θは凍結パラメータ(frozen parameter)のセットであり、L(Z、y’;θ)は、モデル入力x’に対するグランドトゥルースy’(所望のIQ出力データ464)と生徒モデル出力Z(知識蒸留データ468)の間の損失であり、L(Z、Z;θ)は、擬似最良教師モデル出力Z(出力484)と生徒モデル出力Z(知識蒸留データ468)の間の損失であり、λは損失の重みである。
【0040】
【数1】
【0041】
ここで、損失関数の重みλは、一定のハイパーパラメータとすることもでき、またはλをエポックの関数として設定することもできる。例えば、ステップごと、指数的、線形成長である。さらに、MSE、MAE、特徴マップベース、またはノイズを含む教師から学習したターゲットの外れ値検出を考慮した損失関数など、加重損失を計算するために異なる損失関数を利用することができる。
【0042】
オンライン知識蒸留プロセスを図9図12のフローチャートにさらに示す。図9は、超音波高調波イメージングのための生徒モデルを訓練する方法のフローチャートである。
【0043】
訓練プロセスは、ステップS902において、基本波成分および高調波成分を含む第1の超音波データを入力超音波データとして、高調波成分を含む第2の超音波データを第1の超音波データに対応するターゲット出力超音波データとして取得することを含む。
【0044】
ステップS904において、本方法は、教師出力超音波データを生成するために、第1の超音波データを以前に訓練された教師モデルに入力することを含む。
【0045】
ステップS906において、本方法は、生徒出力超音波データを生成するために、第1の超音波データを生徒モデルに入力することを含む。
【0046】
ステップS908において、本方法は、生成された教師出力超音波データ、生成された生徒出力超音波データ、およびターゲット出力超音波データに基づいて、損失関数の損失値を計算することを含む。
【0047】
ステップS910では、本方法は、計算された損失値に基づいて生徒モデルのパラメータを更新することを含む。
【0048】
ステップS912において、本方法は、生徒モデルのパラメータが収束基準を満たすまで、異なる入力超音波データおよび対応する異なる第2の超音波データに対して、取得、入力、計算、および更新のステップを繰り返す。
【0049】
図10は、図9の損失関数の損失値の計算ステップ(すなわち、ステップS908)のフローチャートである。
【0050】
ステップS1002において、本方法は、生成された生徒出力超音波データおよびターゲット出力超音波データに基づいて、第1の損失関数の第1の損失値を計算することを含む。
【0051】
ステップS1004において、本方法は、生成された教師出力超音波データおよび生成された生徒出力超音波データに基づいて、第2の損失関数の第2の損失値を計算することを含む。
【0052】
ステップS1006において、本方法は、第1の損失値と第2の損失値との加重和として損失値を計算することを含む。
【0053】
図11は、図9の更新ステップ(すなわち、ステップS910)のフローチャートである。ステップS1102では、訓練された教師モデルのパラメータを更新することなく、生徒モデルのパラメータを更新することを含む。
【0054】
図12は、本開示の例示的な態様による、推論ステップのフローチャートである。ステップS1202において、本方法は、入力超音波データを訓練された生徒モデルに入力することにより、高調波成分を含む出力超音波データを生成することを含む。
【0055】
本開示では、異なる入力および要求される出力に基づいて、高調波イメージングのための知識蒸留を行う様々な方法があり、以下のものが含まれる。
【0056】
1.逆パルスシーケンスを直接使用して、IQ1(基本波+第3高調波)を得、深層学習技術を使用して第3高調波を抽出し、臨床で使用されている第2高調波イメージングを置き換える。次に、教師-生徒モデルを用いて、高速イメージングのためのコンパクトなネットワークを訓練する。
【0057】
2.第2および第3高調波IQデータまたは画像を直接使用して、所望のターゲット高調波IQデータ/画像を取得するための生徒ネットワークを訓練し、エンドツーエンドの訓練、およびフュージョンマップを訓練することを含み、フュージョンマップに基づいて損失を計算する。
【0058】
3.IQ1(基本波+第3高調波)およびIQ2(第2高調波)のデータまたは画像を直接使用して、ターゲットIQデータ/画像を取得するための生徒モデルを訓練し、エンドツーエンドの訓練、およびIQ1からIQ3を取得するためにネットワークを訓練することを含み、推定されたIQ3をIQ2とスマートに融合する。
【0059】
4.IQ0(基本波+第2高調波+第3高調波)を直接使用して、ターゲット高調波IQデータ/画像を取得し、エンドツーエンド訓練、およびIQ0からIQ2(第2高調波)とIQ3(第3高調波)を分割するようにネットワークを訓練することを含み、所望のIQデータ/画像を出力する。
【0060】
5.より高次の高調波については、フレームワークを拡張して、より高次の高調波IQデータ/画像を取得することができる。
【0061】
開示された方法は、深層畳み込みニューラルネットワークの知識蒸留を使用して、加速され強化された超音波組織高調波イメージングを実行することを目的としている。知識蒸留に関する従来の研究は、ほとんどが従来のコンピュータビジョンの分類問題を対象としており、超音波イメージングおよび回帰問題には直接適していない。
【0062】
最良の教師モデルとしてのオフライン知識蒸留と、最良の教師のためのオンライン自己知識蒸留の両方が、高調波イメージングのための軽量生徒モデルを訓練するために提供される。オフライン訓練では、データの多様性に関係なく、生徒の訓練のために使用される複数の教師モデルの中で最高性能の教師が保証される。オンライン訓練では、教師ネットワークは重みを有する固定モデルではなく、訓練の進行に応じて動的に進化する。生徒と同じ構造を共有しているため、異なる構造の教師ネットワークを使用する場合と比較して、オンライン訓練の時間が節約される。
【0063】
その結果、このフレームワークは、教師と生徒の間のギャップを最小化するために最高性能の教師を提供し、また、軽量な生徒モデルの汎化能力を向上させる。これは、計算能力および帯域幅が限られたシステムであっても、様々な走査条件下で、様々なシステム上で超音波高調波イメージングのためのロバストで高速なDCNNネットワークを生成するために特に有用である。
【0064】
入力およびタスクの要件に応じて、本方法は、アーチファクトが少なく、コントラストが改善され、加速されたフレームレートでより深く到達する高調波を提供することができる。本方法は、高速な特徴認識型の深度依存性の高調波を提供することができ、これは必ずしも純粋な高調波または純粋な複合高調波である必要はなく、フレームレートを大幅に削減した拡張高調波(深度依存性、特徴認識型)とすることもできる。
【0065】
超音波高調波イメージングでは、より高次の高調波を取得するために、従来の複数のパルスシーケンス法ではフレームレートが制限され、モーションアーチファクトに悩まされる。深層学習に基づく方法は、特徴認識型の優れた高調波の画質を取得するための解決策を提供することができる。しかし、深層ネットワークを直接実装することは、膨大な計算能力およびメモリを必要とするため、使用できないことがある。この知識蒸留フレームワークは、加速されたイメージング速度で高度な超音波高調波イメージング問題を解決するためのロバストな解決策を提供する。高速超音波高調波イメージングのための知識蒸留フレームワークは、フレームレートを向上させながら高調波の画質を改善する。
【0066】
本開示では、訓練された生徒ネットワークを使用して、より少ないパルスシーケンスを送信する深層ネットワークで、より高次の高調波または強化された高調波を取得する。超音波高調波イメージングにおける知識蒸留のために、オフラインとオンライン両方の最良の教師の訓練フレームワークが提供される。このモデルは高調波イメージングを加速し、計算能力およびメモリに制限のある超音波システムに簡単に実装することができる。このモデルアーキテクチャは、高品質の高調波イメージングを実行するための携帯型超音波システムを含む、低コストの超音波システムに特に適している。
【0067】
図13は、本開示の例示的な態様による機械学習訓練および推論方法を実施するための、例示的なコンピュータシステム204を示すブロック図である。コンピュータシステムは、例えばUbuntu Linux(登録商標)OS、Windows Server、Unix OSのバージョン、またはMac OS Serverなどの、サーバのオペレーティングシステムを実行するAIワークステーションであってもよい。コンピュータシステム1300は、複数のコアを有する1つ以上の中央処理装置(Central Processing Unit、CPU)1350を含んでもよい。コンピュータシステム1300は、複数のGPUを有するグラフィックボード1312を含んでもよく、各GPUはGPUメモリを有する。グラフィックボード1312は、開示された機械学習方法の数学的演算の多くを実行してもよい。他の実施形態では、コンピュータシステム1300は、機械学習エンジンを含んでもよい。機械学習エンジンは、開示された機械学習方法の数学的演算の多くを実行してもよい。コンピュータシステム1300は、CPU1350およびGPU(グラフィックボード1312)によって実行されるソフトウェアを含むメインメモリ1302、典型的にはランダムアクセスメモリRAM、ならびにデータおよびソフトウェアプログラムを格納するための不揮発性記憶デバイス1304を含む。I/Oバスインターフェース1310、キーボード、タッチパッド、マウスなどの入力/周辺機器1318、ディスプレイアダプタ1316および1つ以上のディスプレイ1308(206)、ならびにネットワーク99を介した有線または無線通信を可能にするネットワークコントローラ1306を含む、コンピュータシステム1300と相互作用するためのいくつかのインターフェースが提供され得る。インターフェース、メモリ、およびプロセッサは、システムバス1326を介して通信してもよい。コンピュータシステム1300は電源1321を含むが、これは冗長電源であってもよい。
【0068】
いくつかの実施形態では、コンピュータシステム1300は、サーバCPUと、GPUが複数のCUDA(登録商標)コアを有するNVIDIA(登録商標)によるグラフィックカードとを含み得る。
【0069】
上述したハードウェアの説明は、本明細書で説明する機能を実行するための対応する構造の非限定的な例である。また、実施形態は、超音波診断装置に限られず、その他の医用モダリティについてついても同様に適用可能である。また、超音波診断装置と独立した画像処理装置が、同様の処理を行ってもよい。
【0070】
上記の教示に照らして、本開示の多数の修正および変形が可能である。したがって、特許請求の範囲内で、本発明は、本明細書に具体的に記載された方法とは異なる方法でも実施され得ることを理解されたい。
【0071】
以上説明した少なくとも1つの実施形態によれば、画質を向上させることができる。
【0072】
いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、実施形態同士の組み合わせを行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0073】
452 教師モデル
462 IQ入力データ
464 出力データ
468 知識蒸留データ
472 教師モデル
474 生徒モデル
482 擬似教師モデル
484 出力
図1A
図1B
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13