(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-27
(45)【発行日】2024-10-07
(54)【発明の名称】医用画像処理装置、医用画像処理方法及びプログラム
(51)【国際特許分類】
G06T 3/4046 20240101AFI20240930BHJP
A61B 6/00 20240101ALI20240930BHJP
A61B 5/055 20060101ALI20240930BHJP
【FI】
G06T3/4046
A61B6/00 550Z
A61B5/055 380
(21)【出願番号】P 2020179041
(22)【出願日】2020-10-26
【審査請求日】2023-08-23
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100126240
【氏名又は名称】阿部 琢磨
(74)【代理人】
【識別番号】100223941
【氏名又は名称】高橋 佳子
(74)【代理人】
【識別番号】100159695
【氏名又は名称】中辻 七朗
(74)【代理人】
【識別番号】100172476
【氏名又は名称】冨田 一史
(74)【代理人】
【識別番号】100126974
【氏名又は名称】大朋 靖尚
(72)【発明者】
【氏名】近江 裕行
【審査官】遠藤 直恵
(56)【参考文献】
【文献】国際公開第2020/175446(WO,A1)
【文献】特開2020-141908(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00-1/40、3/00-5/94
A61B 6/00-6/58
A61B 5/055
(57)【特許請求の範囲】
【請求項1】
第1の解像度の医用画像と
前記第1の解像度の医用画像を解像度変換することにより得た前記第1の解像度よりも低い解像度である第2の解像度の医用画像とを含む学習データ
と、前記第1の解像度の医用画像のノイズ量に基づいて決定された学習パラメータと、を用いて学習された学習モデル
に、被検者を撮影することにより得られた医用画像を入力することにより、当該医用画像よりも解像度の高い医用画像を生成する生成手段と、
を備える医用画像処理装置。
【請求項2】
前記学習パラメータは、学習率を含み、
前記第1の解像度の医用画像のノイズ量が所定の値以上である場合は、当該ノイズ量が所定の値より低い場合に比べて前記学習率が小さい請求項1に記載の医用画像処理装置。
【請求項3】
前記学習パラメータは、損失関数を含み、
前記第1の解像度の医用画像のノイズ量が所定の値以上である場合は、当該ノイズ量が所定の値より低い場合に比べて前記損失関数の出力が小さい
請求項1または2に記載の医用画像処理装置。
【請求項4】
第1の解像度の医用画像のノイズ量を推定する推定手段と、
前記第1の解像度の医用画像と、前記第1の解像度の医用画像を解像度変換することにより得た前記第1の解像度よりも低い解像度である第2の解像度の医用画像とを含む学習データを用いて学習モデルの学習を行う学習手段と、を備え、
前記学習手段は、前記推定されたノイズ量に基づいて、前記学習モデルの学習パラメータを決定する医用画像処理装置。
【請求項5】
前記学習パラメータは、学習率と損失関数を含み、
前記学習手段は、前記推定手段により推定されたノイズ量が所定の値以上である場合に、ノイズ量が所定の値以上である前記学習データの前記学習率を前記ノイズ量が所定の値より低い学習データに比べて小さくする請求項4に記載の医用画像処理装置。
【請求項6】
前記学習手段は、前記推定手段により推定されたノイズ量が所定の値以上である場合に、前記ノイズ量が所定の値より低い学習データに比べて前記損失関数の出力が小さくなるように学習する請求項5に記載の医用画像処理装置。
【請求項7】
前記
第1の解像度の医用画像は、放射線検出器を用いて被検者の撮影を行うことにより得られた放射線画像である請求項1乃至
6のいずれか1項に記載の医用画像処理装置。
【請求項8】
前記放射線検出器と、
前記放射線検出器と通信可能に接続される請求項
7に記載の医用画像処理装置と、
を備えるシステム。
【請求項9】
第1の解像度の医用画像と
前記第1の解像度の医用画像を解像度変換することにより得た前記第1の解像度よりも低い解像度である第2の解像度の医用画像とを含む学習データ
と、前記第1の解像度の医用画像のノイズ量に基づいて決定された学習パラメータと、を用いて学習された学習モデル
に、被検者を撮影することにより得られた医用画像を入力することにより、当該医用画像よりも解像度の高い医用画像を生成する生成工程と、
を含む医用画像処理方法。
【請求項10】
第1の解像度の医用画像のノイズ量を推定する推定工程と、
前記第1の解像度の医用画像と、前記第1の解像度の医用画像を解像度変換することにより得た前記第1の解像度よりも低い解像度である第2の解像度の医用画像とを含む学習データを用いて学習モデルの学習を行う学習工程と、を含み、
前記学習工程では、前記推定されたノイズ量に基づいて、前記学習モデルの学習パラメータを決定する医用画像処理方法。
【請求項11】
請求項
9または10に記載の医用画像処理方法をコンピュータに実行させるプログラム。
【請求項12】
第1の解像度の医用画像と前記第1の解像度の医用画像を解像度変換することにより得た前記第1の解像度よりも低い解像度である第2の解像度の医用画像とを含む学習データと、前記第1の解像度の医用画像のノイズ量又は前記第2の解像度の医用画像のノイズ量に基づいて決定された学習パラメータと、を用いて学習された学習モデルに、被検者を撮影することにより得られた医用画像を入力することにより、当該医用画像よりも高画質な医用画像を生成する生成手段と、
を備える医用画像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、医用画像処理装置、医用画像処理方法及びプログラムに関する。
【背景技術】
【0002】
医療現場ではX線を用いた撮影に基づく診断や治療が盛んに行われており、フラットパネルセンサ(以下センサ)を用いて撮影されたX線画像によるデジタル画像診断が世界的に普及している。センサは出力を直ちに画像化できるため静止画像のみならず動画像も撮影することができる。さらにセンサの高解像度化がすすみ、より詳細な情報を取得する撮影が可能となっている。
【0003】
その一方で、被検者への被曝量を抑えるため、解像度を落として放射線画像を得る場合がある。例えば、動画像のようにX線を長く照射するようなユースケースである。このとき、センサからの出力データを複数画素分まとめて1つの画素として扱うことで1画素あたりのX線量を多くする。それにより全体のX線照射量を抑え、被検者への被曝量を抑えることができる。
【0004】
しかし、解像度を落とすことで、病変の情報や撮影装置のより正確なポジショニングのための情報といったX線画像の詳細な情報は失われる。
【0005】
低解像度の画像の詳細な情報を復元(高解像度化)させるための処理として超解像処理がある。超解像処理は、複数枚の低解像度画像から高解像度化を行ったり、低解像度画像と高解像度画像の特徴を関連付け、その情報を基に高解像度化を行ったりする方法が古くから知られている(特徴文献1)。近年は特徴を関連付ける方法として機械学習が利用されるようになってきた。特に畳み込みニューラルネットワーク(以下CNN)を用いて教師あり学習を行う構成のものが、その性能の高さから急速に普及している(特許文献2)。CNNを利用した超解像処理は、教師あり学習により作成された学習パラメータを用い、入力された低解像度画像の詳細情報を復元する。超解像処理は医療画像への適用も行われている。
【先行技術文献】
【特許文献】
【0006】
【文献】特許4529804公報
【文献】特許6276901公報
【文献】特開2020-141908公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
CNNを利用した超解像処理は、低解像度画像を入力として推論し、推論結果として超解像画像を出力する。そして学習時の正解画像となるのが高解像度画像である。そのため、学習データとして複数の高解像度画像と低解像度画像とをセットで用意する。画像として、例えば、医用画像を用意することで医用画像にも適用可能である。しかし、例えば、放射線画像は低線量領域ではノイズに対する信号の割合(S/N)が低く、ノイズが支配的な画像である。そのため、放射線画像でCNNを学習させると、CNNは復元させる情報として信号成分である被写体の構造だけではなく、ノイズ成分も復元させるように学習をしてしまう。したがって、前記学習にて得られた学習パラメータを用いて超解像処理を行うと、ノイズが重畳された超解像画像が生成されていた。ノイズが少ない高線量領域の画像を入力しても、ノイズが付加された超解像画像が出力され、解像度は向上するが、画質の低下を招いていた。
【0008】
本発明は、上記課題に鑑みてなされたものであり、ノイズを低減しつつ解像度を向上させた医用画像を出力可能な学習モデルを構築することを目的とする。
【0009】
なお、前記目的に限らず、後述する発明を実施するための形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本発明の他の目的の1つとして位置付けることができる。
【課題を解決するための手段】
【0010】
本開示に係る医用画像処理装置の一つは、
第1の解像度の医用画像と前記第1の解像度の医用画像を解像度変換することにより得た前記第1の解像度よりも低い解像度である第2の解像度の医用画像とを含む学習データと、前記第1の解像度の医用画像のノイズ量に基づいて決定された学習パラメータと、を用いて学習された学習モデルに、被検者を撮影することにより得られた医用画像を入力することにより、当該医用画像よりも解像度の高い医用画像を生成する生成手段と、を備える。
【発明の効果】
【0011】
本発明によれば、ノイズを低減しつつ解像度を向上させた医用画像を出力可能な学習モデルを構築することができる。
【図面の簡単な説明】
【0012】
【
図1】第1の実施形態に係る医用画像処理装置の機能の構成の一例を示す図
【
図2】第1の実施形態に係る医用画像処理装置のハードウェア構成の一例を示す図
【
図3】第1の実施形態に係る医用画像処理装置の処理手順の一例を示すフロー図
【
図4】第1の実施形態に係る医用画像処理装置の学習手順の一例を示すフロー図
【
図5】第2の実施形態に係る医用画像処理装置の機能の構成の一例を示す図
【
図6】第2の実施形態に係る医用画像処理装置のハードウェア構成の一例を示す図
【
図7】第3の実施形態に係る医用画像処理装置のハードウェア構成の一例を示す図
【発明を実施するための形態】
【0013】
以下の実施形態においては、医用画像の一例として放射線画像を用いる場合を代表例として説明する。より具体的には、放射線画像の一例として単純X線撮影により得られるX線画像を用いる場合を説明する。なお、本実施形態に適用可能な医用画像はこれに限定されるものでなく、他の医用画像であっても好適に適用できる。例えば、CT装置、MRI装置、3次元超音波撮影装置、光音響トモグラフィ装置、PET/SPECT、OCT装置、デジタルラジオグラフィ装置などで撮影された医用画像であってもよい。
【0014】
また、以下の実施形態においては、入力データである低解像度の医用画像と正解データとなる高解像度の医用画像とを教師データとした、畳み込みニューラルネットワーク(CNN)を用いた教師あり学習による学習モデルの構築を例示する。そのため、以下では学習モデルをCNNと記載して説明する。なお、必ずしもCNNを用いた学習でなくてもよく、ノイズを低減しつつ解像度を向上させた医用画像を出力可能な学習モデルを構築できる機械学習の方法であればよい。
【0015】
[実施形態1]
本実施形態に係る医用画像処理装置は、ノイズ低減処理を行った高解像度の放射線画像と、該ノイズ低減処理を行った高解像度の放射線画像から生成された低解像度の放射線画像を用いて学習を行う。そして、入力された放射線画像から該放射線画像を高解像度化した画像を生成する学習モデルを構築することを特徴とする。
【0016】
本発明における医用画像処理装置100の構成図を
図1に示す。医用画像処理装置100は、入力部101、ノイズ低減部102、画像変換部103、機械学習部104から構成される。
【0017】
入力部101は、外部装置から放射線画像を取得し、高解像度の放射線画像として出力する。ノイズ低減部102は、高解像度の放射線画像を入力とし、ノイズ低減された高解像度の放射線画像をとして出力する。解像度変換部103は、ノイズ低減された高解像度の放射線画像を入力とし縮小処理することで、ノイズ低減された低解像度の放射線画像を出力する。機械学習部104は、ノイズ低減された高解像度の放射線画像とノイズ低減された低解像度の放射線画像を入力とし、超解像処理CNNの学習を行い、CNNのパラメータを更新する。
【0018】
図2は、
図1の医用画像処理装置100の機能の構成を、ハードウェアを用いて実現する場合のハードウェア構成の一例を示す図である。まず、
図2(a)の構成例にて学習に必要な放射線画像が取得される。コントロールPC201とX線センサ202がギガビットイーサ204でつながっている。信号線はギガビットイーサでなくてもCAN(Controller Area Network)や光ファイバーなどでもよい。ギガビットイーサ204には、X線発生装置203、表示部205、記憶部206、ネットワークインタフェース部207、イオンチャンバー210、X線制御部211が接続されている。コントロールPC201には例えば、バス2011に対して、CPU(中央演算装置)2012、RAM(Random Access Memory)2013、ROM(Read Only Memory)2014、記憶部2015が接続された構成になる。そしてコントロールPC201には、USBやPS/2で入力部208が接続され、DisplayPortやDVIで表示部209が接続される。このコントロールPC201を介して、X線センサ202や表示部205などにコマンドを送る。コントロールPC201では、撮影モードごとの処理内容がソフトウェアモジュールとして記憶部2015に格納され、不図示の指示手段によりRAM2013に読み込まれ、実行される。処理された画像はコントロールPC内の記憶部2015もしくはコントロールPC外の記憶部206へと送られ、保存される。
【0019】
次に
図2(b)の構成例にてCNNの学習がされる。学習用PC221には例えば、バス2211に対して、CPU(中央演算装置)2212、RAM(Random Access Memory)2213、ROM(Read Only Memory)2214、記憶部2215が接続された構成になる。そして学習用PC201には、USBやPS/2で入力部222、DisplayPortやDVIで表示部223、USBで記憶部224が接続される。
図1に示した101、102、103、104は、ソフトウェアモジュールとして記憶部2215に格納されている。もちろん本発明は
図1に示した101、102、103、104を専用の画像処理ボードとして実装してもよい。目的に応じて最適な実装を行うようにすればよい。
図2(a)にて取得した学習画像は、記憶部224から入力するか、もしくはネットワークI/Fを介した不図示の記憶部などから入力してもよい。
【0020】
次に、
図1の機能構成図と
図3の全体の処理手順を示すフロー図を使い、処理の流れにそって説明する。
【0021】
(S301:X線画像取得)
まず、S301において、入力部101は、放射線画像を取得する。
【0022】
(S302:データ拡張)
続いて、S302において、入力部101は、取得した放射線画像のデータ拡張を行う。データ拡張とは、1つの画像を回転や反転することで、異なる特徴の画像として扱うことである。CNNに入力する高解像度画像サイズが入力部101で取得した放射線画像サイズ以下である場合は、切り出しも含める。切り出し、回転、反転の組み合わせによってデータ拡張を行う。
【0023】
(S303:高解像度画像生成)
続いて、S303において、入力部101は、データ拡張した画像を高解像度画像としてノイズ低減部102へ出力する。高解像度画像とは、CNNが出力する超解像画像に対する正解画像に相当する。
【0024】
(S304:ノイズ低減処理)
続いて、S304において、ノイズ低減部102は、高解像度画像に対してノイズ低減処理を行い、ノイズ低減済み高解像度画像を出力する。ノイズ低減方法として、例えば空間的な処理のεフィルタリングを行う。εフィルタリングはエッジ構造を保持しながらノイズだけを低減する方法で、数1で表される。Hが高解像度画像、HNがノイズ低減後の高解像度画像、εはエッジとノイズを切り分けるための閾値である。なお、エッジとノイズを切り分けるための閾値はユーザが任意の値を決定してもよいし、実施形態2において後述する放射線ノイズモデルを用いて算出してもよい。なお、εフィルタリングは非線形空間フィルタの一例であって、例えば、NL-Meansフィルタ、メディアンフィルタなどであってもよい。
【0025】
【数1】
同じ被写体を同じアライメントで複数回撮影されている場合は、数2のように加算平均を行い、ノイズ低減をしてもよい。H(x,y)は高解像度画像で、nは加算枚数である。すなわち、第1の解像度の放射線画像と、第1の解像度の放射線画像と同一の撮影条件で撮影された複数の放射線画像とを加算平均することによりノイズ低減処理を行う。
【0026】
【数2】
また、ノイズ低減方法にCNNを使ってもよい(特許文献3)。
【0027】
(S305:低解像度画像生成)
続いて、S305において、解像度変換部103は、ノイズ低減済みの高解像度画像を入力とし、縮小処理によってノイズ低減済みの低解像度画像を出力する。縮小処理の方法は、超解像処理を適用する低解像度画像と高解像度画像との関係に依存する。例えば、適用する系における低解像度画像は、高解像度画像を加算平均することで得られる関係であれば、縮小処理は加算平均にて行う。すなわち、CNNを学習させる内容に合った縮小の方法を選択する。縮小率も同様で、解像度を2倍にするCNNを学習させるのであれば、縮小率は2分の1とする。
【0028】
(S306:前処理)
次に、S306において、機械学習部104は、ノイズ低減済みの高解像度画像およびノイズ低減済みの低解像度画像に対し、前処理を行い、前処理済みの高解像度画像および前処理済みの低解像度画像を出力する。前処理とは、CNNのロバスト性を向上させるための処理である。例えば画像の最大値と最小値の範囲で正規化をしたり、画像の平均値を0、標準偏差を1にした正則化をしたりする。
【0029】
(S307:機械学習)
最後に、S307において、機械学習部104は、前処理済みの低解像度画像と前処理済みの高解像度画像を用いてCNNの学習を行う。
【0030】
なお、S307において用いる前処理済みの低解像度画像と前処理済みの高解像度画像は、医用画像処理装置100がS301からS306の工程を経て生成してもよいし、異なる医用画像処理装置で生成されたものを取得してもよい。また、医用画像処理装置100が備える記憶部2015に前処理済みの低解像度画像と前処理済みの高解像度画像が予め記憶されている場合は、記憶部2015から読み出して取得してもよい。
【0031】
【0032】
(S401:推論処理)
S401において、機械学習部104は、入力データと出力データの組を教師データとした教師あり学習を行うことにより学習モデルを構築する。教師データは、入力データとして低解像度画像411と、それに対応した正解データとして高解像度画像415の組である。機械学習部104は、低解像度画像411に対して、学習途中のCNN412のパラメータによる推論処理が行われ、推論結果として超解像画像414が出力される(S401)。ここで、CNN412は、多数の処理ユニット413が任意に接続された構造を取る。処理ユニット413の例としては、畳み込み演算や、正規化処理、あるいは、ReLUやSigmoid等の活性化関数による処理が含まれ、それぞれの処理内容を記述するためのパラメータ群を有する。これらは例えば、畳み込み演算→正規化→活性化関数、のように順番に処理を行う組が3~数百程度の層状に接続され、さまざまな構造を取ることができる。
【0033】
(S402:損失関数計算)
次に、S402において、機械学習部104は、推論結果である超解像画像414と高解像度画像415から、損失関数を算出する。損失関数は例えば二乗誤差や、交差エントロピー誤差など、任意の関数を用いることができる。
【0034】
(S403:誤差逆伝搬)
次に、S403において、機械学習部104は、S402で算出した損失関数を起点とした誤差逆伝搬を行い、CNN412のパラメータ群を更新する。
【0035】
(S404:学習終了判定)
最後に、S404において、機械学習部104は、学習の終了判定を行い、学習を継続する場合はS401に進む。S401~403の処理を、低解像度画像411と高解像度画像415を変えながら繰り返すことで、損失関数が低下するようにCNN412のパラメータ更新が繰り返され、機械学習部104の精度を高めることができる。十分に学習が進み、学習終了と判定された場合は、処理を完了する。学習終了の判断は、例えば、過学習が起こらずに推論結果の精度が一定値以上になる、損失関数が一定値以下になるなど、問題に応じて設定した判断基準に基づいて行う。
【0036】
以上により、医用画像処理装置100の処理が実施される。
【0037】
上記によれば、CNNのパラメータは、前処理済みの低解像度画像を入力しCNNが出力した超解像画像と、前処理済みの高解像度画像との比較結果から更新される。前処理済みの低解像度画像および前処理済みの高解像度画像は、共にノイズ成分が低減されており、信号成分が支配的な画像になっている。したがって、信号成分のみの高解像度化が学習されることになる。
【0038】
したがって、本実施形態で学習されたCNNパラメータを用いて出力される超解像画像は、ノイズ成分の強調を抑えた超解像画像となり、高画質の画像が得られる。ノイズ低減は低解像度画像、高解像度画像共になされていることが望ましい。低解像度画像もしくは高解像度画像どちらか一方にでもノイズ成分が含まれていると、高解像度化の他にノイズ量を調整する処理も学習することになる。これにより、学習内容の複雑度が増し、画質の劣化、ネットワーク規模の増大(使用リソース、パフォーマンスの増大)等を招く。
【0039】
本実施形態に係る医用画像処理装置によれば、ノイズ成分が低減された低解像度画像と高解像度画像を学習データとして学習モデルを構築するため、ノイズを低減しつつ解像度を向上させた医用画像を出力可能な学習モデルを構築することができる。
【0040】
さらに、該学習モデルに対して被検者を撮影して得られる医用画像を入力することにより、ノイズを低減しつつ解像度を向上させた医用画像を生成することができる。また、ネットワーク規模も低減することができる。
【0041】
[実施形態2]
本実施形態について、
図5の機能構成図と
図6の全体の処理手順を示すフロー図を使い、処理の流れにそって説明する。
【0042】
図5における医用画像処理装置500が備える入力部501、解像度変換部503、機械学習部504は、
図1の入力部101、解像度変換部103、機械学習部104と同様である。
【0043】
ノイズ推定部502は、高解像度画像を入力として高解像度画像のノイズ量を出力し、
図2におけるソフトウェアモジュールとして記憶部2015に格納されている。
【0044】
S601からS603は実施形態1のS301からS303と同様のため省略する。また、S605からS607は実施形態1のS305からS307と同様のため省略する。
【0045】
以下、
図3のフロー図との相違部分についてのみ説明する。
【0046】
(S604:ノイズ量判定)
S604において、ノイズ推定部502は、高解像度画像を入力とし、高解像度画像に含まれるノイズ量の推定を行う。ノイズ量の算出の方法として、例えば、所定の領域における標準偏差を使用する。複数の領域で標準偏差を算出しその平均をとる。別のノイズ量の算出方法として、X線の物理特性から算出してもよい。X線のノイズはX線量に依存するランダム量子ノイズとX線量に非依存のランダムシステムノイズに大きく分けられる。放射線画像の画素値からランダム量子ノイズ量を計算する際の変換係数Kqとランダムシステムノイズの量Snをあらかじめ求めておくと、画素値xのノイズ量nは数3のようにあらわすことができる。
【0047】
【数3】
算出したノイズ量をそのまま利用してもよいが、X線のノイズ量はX線量に依存するため、実際の画像に対する影響具合がわかりづらい。そのための信号値をノイズ量で除算したS/N比を推定結果としてもよい。
【0048】
ノイズ推定部502は、推定したノイズ量とあらかじめ設定された閾値とを比較し、ノイズ量が少ない画像と判断した場合は、解像度変換部503が低解像度画像を生成する(S605)。一方、ノイズ量が多いと判断した場合は、その高解像度画像を学習するための画像として使用せずに、処理を終了する。すなわち、解像度変換部503は、ノイズ推定部502が推定したノイズ量に基づいて選択された第1の解像度の医用画像を解像度変換し、第1の解像度よりも低い解像度である第2の解像度の医用画像を取得する取得手段の一例に相当する。
【0049】
ノイズ量の多い画像を学習に使用すると、CNNは信号成分だけではなくノイズ成分の高解像度化を学習するため、超解像画像の画質劣化を招く。そのため、ノイズ量が多い画像が入力されてきた場合は、その画像を学習に利用しない。
【0050】
本実施形態では、高解像度画像のノイズ量を計測していたが、高解像度画像にノイズ低減を行い、ノイズ低減後の高解像度画像からノイズ量を計測してもよい。高解像度画像からではなく低解像度画像から推定してもよい。
【0051】
[実施形態3]
本実施形態について、
図5の機能構成図と
図6の全体の処理手順を示すフロー図を使い、処理の流れにそって説明する。
【0052】
S701からS703は実施形態2のS601からS603と同様のため省略する。
【0053】
ノイズ推定部502は、高解像度画像を入力とし、高解像度画像に含まれるノイズ量の推定を行い、ノイズ量を出力する(S704)。推定方法は実施形態2と同様の方法のため省略する。S705からS706は実施形態2のS605からS606と同様のため省略する。
【0054】
機械学習部504は、前処理済みの低解像度画像と前処理済みの高解像度画像を用いてCNNの学習を行う(S307)。
【0055】
学習フローを
図4に示す。まず機械学習部104は、低解像度画像411に対して、学習途中のCNN412のパラメータによる推論処理が行われ、推論結果として超解像画像414が出力される(S401)。次に、推論結果である超解像画像414と高解像度画像415から、損失関数を算出する(S402)。S402で算出した損失関数を起点とした誤差逆伝搬を行い、CNN412のパラメータ群を更新する(S403)。
【0056】
機械学習部104は、ノイズに対する影響を抑えるため、S704にて算出したノイズ量に応じて、CNN412のパラメータ更新の学習率を変更する。CNN412のパラメータを決定するには、一般的に勾配降下法が用いられる。CNN412のパラメータWにおける誤差をJとすると、勾配降下法でのパラメータ更新は、数4のように行われる。:=は代入演算、▽は勾配を表す。
【0057】
W:=W-α▽J(W)
αが学習率である。αの大きさを小さくすると、現パラメータWへの誤差の反映が小さく、αの大きさを大きくすると、現パラメータWへの誤差の反映が大きくなる。S704にて算出したノイズ量が大きい場合は、信号成分よりもノイズ成分を復元する学習になっている。そのため、学習率αの大きさを小さくし、ノイズに対する影響を抑えるようにCNN412のパラメータ更新をする。ノイズ量と学習率αの関係は連続的に変化させてもよいし、離散的に変化させてもよい。
【0058】
また、ノイズに対する影響を抑えるため、S704にて算出したノイズ量に応じて、損失関数を変更してもよい。損失関数の例としてL1ロス、L2ロスがあり、学習モデルの出力にあたる超解像画像をSR,学習データの正解画像をHRとすると、それぞれ数5、数6のように表される。
【0059】
L1=|SR-HR|
L2=(SR-HR)2
L1ロスはL2ロスに比べ、画像間の差が大きい場合に値が小さくなる傾向があり、その結果、誤差がパラメータに反映されづらい。したがってノイズ量が多いときにL1ロスを使用すると、ノイズに関連する外れ値に対して影響を小さくすることができる。すなわち、例えば、ノイズ量が多いデータは、ノイズ量が少ないデータに対して、誤差が大きいときに出力が小さくなるような損失関数としてもよい。
【0060】
機械学習部104は、誤差の大きさなどによって、学習を継続するかを判断する(S404)。継続する場合は、更新されたCNN412のパラメータにて再度学習が行われる。一方、継続しない場合は、更新されたCNN412のパラメータが最終決定したパラメータとなる。
【0061】
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路によっても実現可能である。
【0062】
プロセッサまたは回路は、中央演算処理装置(CPU)、マイクロプロセッシングユニット(MPU)、グラフィクスプロセッシングユニット(GPU)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートウェイ(FPGA)を含みうる。また、プロセッサまたは回路は、デジタルシグナルプロセッサ(DSP)、データフロープロセッサ(DFP)、またはニューラルプロセッシングユニット(NPU)を含みうる。
【0063】
上述の各実施形態における医用画像処理装置は、単体の装置として実現してもよいし、複数の装置を互いに通信可能に組合せて上述の処理を実行する形態としてもよく、いずれも本発明の実施形態に含まれる。共通のサーバ装置あるいはサーバ群で、上述の処理を実行することとしてもよい。医用画像処理装置を構成する複数の装置は所定の通信レートで通信可能であればよく、また同一の施設内あるいは同一の国に存在することを要しない。
【0064】
本発明の実施形態には、前述した実施形態の機能を実現するソフトウェアのプログラムを、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムのコードを読みだして実行するという形態を含む。
【0065】
したがって、実施形態に係る処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明の実施形態の一つである。また、コンピュータが読みだしたプログラムに含まれる指示に基づき、コンピュータで稼働しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【0066】
また、本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施形態を組み合わせた構成も全て本発明の実施形態に含まれるものである。
【符号の説明】
【0067】
101 入力部
102 ノイズ低減部
103 解像度変換部
104 機械学習部