(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-20
(45)【発行日】2024-10-01
(54)【発明の名称】医用画像処理装置、医用画像処理方法及びプログラム
(51)【国際特許分類】
G06T 3/4046 20240101AFI20240924BHJP
A61B 6/00 20240101ALI20240924BHJP
A61B 5/055 20060101ALI20240924BHJP
【FI】
G06T3/4046
A61B6/00 550Z
A61B5/055 380
(21)【出願番号】P 2020179042
(22)【出願日】2020-10-26
【審査請求日】2023-08-23
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100126240
【氏名又は名称】阿部 琢磨
(74)【代理人】
【識別番号】100223941
【氏名又は名称】高橋 佳子
(74)【代理人】
【識別番号】100159695
【氏名又は名称】中辻 七朗
(74)【代理人】
【識別番号】100172476
【氏名又は名称】冨田 一史
(74)【代理人】
【識別番号】100126974
【氏名又は名称】大朋 靖尚
(72)【発明者】
【氏名】近江 裕行
【審査官】遠藤 直恵
(56)【参考文献】
【文献】国際公開第2019/204406(WO,A1)
【文献】特開2019-212050(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 3/4046
A61B 6/00-6/58
A61B 5/055
(57)【特許請求の範囲】
【請求項1】
センサを用いて被検者の撮影を行うことにより得られた医用画像を取得する取得手段と、
前記センサの駆動モードと学習モデルとの関連付けを設定する設定手段と、
第1の駆動モードに
関連付けられた学習モデルと前記第1の駆動モードとは異なる第2の駆動モードに
関連付けられた学習モデルとを含む複数の学習モデルのうち前記撮影における前記センサの駆動モードに基づいて選択された学習モデルの入力データとして前記取得された医用画像を入力することにより、前記取得された医用画像とは異なる医用画像を生成する生成手段と、を備える医用画像処理装置
であって、
前記設定手段は、
センサの駆動速度が、前記第1の駆動モードより前記第2の駆動モードが速い場合に、前記第1の駆動モードに関連付けられて設定された第1の学習モデルに比べて処理速度の速い第2の学習モデルを、前記第2の駆動モードに関連付けて設定する医用画像処理装置。
【請求項2】
前記駆動モードは、ビニング数、及び、フレームレートのうち少なくともいずれか1つの項目を含み、
前記生成手段は、前記少なくともいずれか1つの項目に基づいて選択された学習モデルの入力データとして前記取得された医用画像を入力する請求項1に記載の医用画像処理装置。
【請求項3】
前記生成手段は、第1の解像度の医用画像と、前記第1の解像度の医用画像を解像度変換することにより得られる前記第1の解像度よりも低い解像度である第2の解像度の医用画像とを含む教師データを学習して得た学習モデルを用いて、前記取得された医用画像よりも解像度の高い医用画像を生成する請求項1または2に記載の医用画像処理装置。
【請求項4】
前記生成手段は、ノイズ低減処理を施した第1の解像度の医用画像と、前記ノイズ低減処理を施した前記第1の解像度の医用画像を解像度変換することにより得られる前記第1の解像度よりも低い解像度である第2の解像度の医用画像とを含む教師データを学習して得た学習モデルを用いて、前記取得された医用画像よりも解像度の高い医用画像を生成する請求項1乃至3のいずれか1項に記載の医用画像処理装置。
【請求項5】
前記設定手段は、
前記第1の駆動モードが含む第1のビニング数
より前記第2の駆動モードが含む第2のビニング数
が大きい場合に、前記第1の駆動モードに関連付けられて設定された第1の学習モデルに比べて処理速度の速い第2の学習モデルを
、前記第2の駆動モードに関連付けて設定する請求項
1乃至
4のいずれか1項に記載の医用画像処理装置。
【請求項6】
前記設定手段は、前記生成された医用画像の表示方法をさらに設定する請求項
1乃至
5のいずれか1項に記載の医用画像処理装置。
【請求項7】
センサを用いて被検者の撮影を行うことにより得られた医用画像を取得する取得手段と、
前記センサの駆動モードと学習モデルとの関連付けを設定する設定手段と、
第1の駆動モードに関連付けられた学習モデルと前記第1の駆動モードとは異なる第2の駆動モードに関連付けられた学習モデルとを含む複数の学習モデルのうち前記撮影における前記センサの駆動モードに基づいて選択された学習モデルの入力データとして前記取得された医用画像を入力することにより、前記取得された医用画像とは異なる医用画像を生成する生成手段と、を備える医用画像処理装置であって、
前記設定手段は、前記センサの複数画素の信号の出力を加算して、1つの画素の信号として出力するビニング処理における前記加算する複数の画素の加算方法をさらに設定する医用画像処理装置。
【請求項8】
前記センサは、放射線検出器であり、
前記医用画像は、前記放射線検出器を用いて被検者の撮影を行うことにより得られた放射線画像である請求項1乃至
7のいずれか1項に記載の医用画像処理装置。
【請求項9】
前記放射線検出器と、
前記放射線検出器と通信可能に接続される請求項
8に記載の医用画像処理装置と、
を備えるシステム。
【請求項10】
センサを用いて被検者の撮影を行うことにより得られた医用画像を取得する取得工程と、
前記センサの駆動モードと学習モデルとの関連付けを設定する設定工程と、
第1の駆動モードに
関連付けられた学習モデルと前記第1の駆動モードとは異なる第2の駆動モードに
関連付けられた学習モデルとを含む複数の学習モデルのうち前記撮影における前記センサの駆動モードに基づいて選択された学習モデルの入力データとして前記取得された医用画像を入力することにより、前記取得された医用画像とは異なる医用画像を生成する生成工程と、
を含む医用画像処理方法
であって、
前記設定工程は、
センサの駆動速度が、前記第1の駆動モードより前記第2の駆動モードが速い場合に、前記第1の駆動モードに関連付けられて設定された第1の学習モデルに比べて処理速度の速い第2の学習モデルを、前記第2の駆動モードに関連付けて設定する医用画像処理方法。
【請求項11】
センサを用いて被検者の撮影を行うことにより得られた医用画像を取得する取得工程と、
前記センサの駆動モードと学習モデルとの関連付けを設定する設定工程と、
第1の駆動モードに関連付けられた学習モデルと前記第1の駆動モードとは異なる第2の駆動モードに関連付けられた学習モデルとを含む複数の学習モデルのうち前記撮影における前記センサの駆動モードに基づいて選択された学習モデルの入力データとして前記取得された医用画像を入力することにより、前記取得された医用画像とは異なる医用画像を生成する生成工程と、を備える医用画像処理方法であって、
前記設定工程は、前記センサの複数画素の信号の出力を加算して、1つの画素の信号として出力するビニング処理における前記加算する複数の画素の加算方法をさらに設定する医用画像処理方法。
【請求項12】
請求項
10または11に記載の医用画像処理方法をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、医用画像処理装置、医用画像処理方法及びプログラムに関する。
【背景技術】
【0002】
医療現場ではX線を用いた撮影に基づく診断や治療が盛んに行われており、放射線検出器(以下センサ)を用いて撮影されたX線撮影画像によるデジタル画像診断が世界的に普及している。センサは出力を直ちに画像化できるため静止画像のみならず動画像も撮影することができる。さらにセンサの高解像度化がすすみ、より詳細な情報を取得する撮影が可能となっている。
【0003】
その一方で、被検者への被曝量を抑えるため、解像度を落としてX線画像を得る場合がある。例えば、動画像のようにX線を長く照射するようなユースケースである。このときセンサは、複数画素分をまとめて1つの画素として扱う駆動をすることで、1画素あたりのX線量を多くする。それにより全体のX線照射量を抑え、被検者への被曝量を抑えることができる。
【0004】
しかし、解像度を落とすことで、病変の情報や撮影装置のより正確なポジショニングのための情報といったX線画像の詳細な情報は失われる。
【0005】
低解像度の画像の詳細な情報を復元(高解像度化)させるための処理として超解像処理がある。超解像処理は、複数枚の低解像度画像から高解像度化を行ったり、低解像度画像と高解像度画像の特徴を関連付け、その情報を基に高解像度化を行ったりする方法が古くから知られている(特徴文献1)。近年は特徴を関連付ける方法として機械学習が利用されるようになってきた。特に畳み込みニューラルネットワーク(以下CNN)を用いて教師あり学習を行う構成のものが、その性能の高さから急速に普及している(特許文献2)。CNNを利用した超解像処理は、教師あり学習により作成された学習パラメータを用い、入力された低解像度画像の詳細情報を復元する。超解像処理は医療画像への適用も行われている。
【先行技術文献】
【特許文献】
【0006】
【文献】特許4529804公報
【文献】特許6276901公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
CNNを利用した超解像処理は、低解像度画像を入力として推論し、推論結果として超解像画像を出力する。そして学習時の教師画像となるのが高解像度画像である。そのため、教師データとして高解像度画像と低解像度画像のセットを複数用意する。学習では、高解像度画像から低解像度画像が生成される方法を学ぶことになる。しかし、高解像度画像から低解像度画像が生成される方法はセンサの駆動方式によって異なる。ある生成方法を学習したCNNを使用し、別の生成方法で生成された低解像度画像を入力として推論をしても、超解像画像の画質の低下を招くことになる。
【0008】
本発明は、上記課題に鑑みてなされたものであり、適切に解像度を向上させた医用画像を生成することができる医用画像処理装置、医用画像処理方法及びプログラムの提供を目的とする。
【0009】
なお、前記目的に限らず、後述する発明を実施するための形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本発明の他の目的の1つとして位置付けることができる。
【課題を解決するための手段】
【0010】
本開示に係る医用画像処理装置の一つは、
センサを用いて被検者の撮影を行うことにより得られた医用画像を取得する取得手段と、
前記センサの駆動モードと学習モデルとの関連付けを設定する設定手段と、
第1の駆動モードに関連付けられた学習モデルと前記第1の駆動モードとは異なる第2の駆動モードに関連付けられた学習モデルとを含む複数の学習モデルのうち前記撮影における前記センサの駆動モードに基づいて選択された学習モデルの入力データとして前記取得された医用画像を入力することにより、前記取得された医用画像とは異なる医用画像を生成する生成手段と、を備える医用画像処理装置であって、
前記設定手段は、
センサの駆動速度が、前記第1の駆動モードより前記第2の駆動モードが速い場合に、前記第1の駆動モードに関連付けられて設定された第1の学習モデルに比べて処理速度の速い第2の学習モデルを、前記第2の駆動モードに関連付けて設定する。
【発明の効果】
【0011】
本発明によれば、適切に解像度を向上させた医用画像を生成することができる。
【図面の簡単な説明】
【0012】
【
図1】第1の実施形態に係る医用画像処理装置の機能の構成の一例を示す図
【
図2】第1の実施形態に係る医用画像処理装置のハードウェア構成の一例を示す図
【
図3】第1の実施形態に係る医用画像処理装置の処理手順の一例を示すフロー図
【
図4】第1の実施形態に係る医用画像処理装置の選択画面の一例を示す図
【
図5】第1の実施形態に係る医用画像処理装置の学習手順の一例を示すフロー図
【
図6】第1の実施形態に係る医用画像処理装置のセンサの駆動モードと学習モデルの関係を示す図
【
図7】第2の実施形態に係る医用画像処理装置のセンサの駆動モードと学習モデルの関係を示す図
【発明を実施するための形態】
【0013】
以下の実施形態においては、医用画像の一例として放射線画像を用いる場合を代表例として説明する。より具体的には、放射線画像の一例として単純X線撮影により得られるX線画像を用いる場合を説明する。なお、本実施形態に適用可能な医用画像はこれに限定されるものでなく、他の医用画像であっても好適に適用できる。例えば、CT装置、MRI装置、3次元超音波撮影装置、光音響トモグラフィ装置、PET/SPECT、OCT装置、デジタルラジオグラフィ装置などで撮影された医用画像であってもよい。
【0014】
また、以下の実施形態においては、入力データである低解像度の医用画像と正解データとなる高解像度の医用画像とを教師データとした、畳み込みニューラルネットワーク(CNN)を用いた教師あり学習による学習モデルの構築を例示する。そのため、以下では学習モデルをCNNと記載して説明する。なお、必ずしもCNNを用いた学習でなくてもよく、ノイズを低減しつつ解像度を向上させた医用画像を出力可能な学習モデルを構築できる機械学習の方法であればよい。
【0015】
[実施形態1]
本実施形態に係る医用画像処理装置は、医用画像の撮影におけるセンサの駆動モードに基づいて選択された学習モデルに医用画像を入力し、医用画像よりも解像度の高い医用画像を生成することを特徴とする。
【0016】
本発明における医用画像処理装置100の構成図を
図1に示す。医用画像処理装置100は、学習モデル選択部101、画像取得部102、機械学習部103から構成される。
【0017】
学習モデル選択部101は、センサの駆動モードを取得し、機械学習の学習モデルを出力する。画像取得部102は、外部装置からX線画像を取得し、低解像度のX線画像として出力する。機械学習部103は、低解像度のX線画像と、機械学習の学習モデルを入力とし、超解像処理CNNの推論処理を行い、超解像画像を出力する。
【0018】
図1の構成を、ハードウェアを使って実現する場合、
図2のようになる。
図2(a)の構成例では学習に必要なX線画像が取得される。コントロールPC201とX線信号をデジタル画像に変換して出力するフラットパネルセンサなどのX線センサ202がギガビットイーサ204でつながっている。信号線はギガビットイーサでなくてもCAN(Controller Area Network)や光ファイバーなどでもよい。ギガビットイーサ204には、X線発生装置203、表示部205、記憶部206、ネットワークインタフェース部207、イオンチャンバー210、X線制御部211が接続されている。コントロールPC201には例えば、バス2011に対して、CPU(中央演算装置)2012、RAM(Random Access Memory)2013、ROM(Read Only Memory)2014、記憶部2015が接続された構成になる。そしてコントロールPC201には、USBやPS/2で入力部208が接続され、DisplayPortやDVIで表示部209が接続される。このコントロールPC201を介して、X線センサ202や表示部205などにコマンドを送る。コントロールPC201では、撮影モードごとの処理内容がソフトウェアモジュールとして記憶部2015に格納され、不図示の指示手段によりRAM2013に読み込まれ、実行される。処理された画像はコントロールPC内の記憶部2015もしくはコントロールPC外の記憶部206へと送られ、保存される。
【0019】
図1に示した学習モデル選択部101、画像取得部102、機械学習部103は、ソフトウェアモジュールとして記憶部2215に格納されている。もちろん本発明は
図1に示した学習モデル選択部101、画像取得部102、機械学習部103を専用の画像処理ボードとして実装してもよい。目的に応じて最適な実装を行うようにすればよい。
【0020】
図2(b)の構成例ではCNNの学習がされる。学習用PC221には例えば、バス2211に対して、CPU(中央演算装置)2212、RAM(Random Access Memory)2213、ROM(Read Only Memory)2214、記憶部2215が接続された構成になる。そして学習用PC201には、USBやPS/2で入力部222、DisplayPortやDVIで表示部223、USBで記憶部224が接続される。CNNの学習時、
図1に示した103はソフトウェアモジュールとして記憶部2215に格納されている。もちろん本発明は
図1に示した103を専用の画像処理ボードとして実装してもよい。目的に応じて最適な実装を行うようにすればよい。
【0021】
次に、
図1の機能構成図と
図3の全体の処理手順を示すフロー図を使い、処理の流れにそって説明する。
【0022】
(S301:センサの駆動モード取得)
まず、S301において、学習モデル選択部101は、被検者を撮影する際のセンサの駆動モードを取得する。センサの駆動モードとは、センサがどのように画像を生成し出力するかの方法である。駆動モードは、詳しくは後述するが、例えば、ビニング数、ビニング領域における画素の加算方法、フレームレートなどの項目を含む。
【0023】
(S302:学習モデル選択)
続いて、S302において、学習モデル選択部101は、センサの駆動モードに基づいて、学習モデルを選択する。学習モデルとは、事前に教師あり学習を行ったCNNの学習パラメータである。センサの駆動モードと学習モデルとの関連付けは、事前に設定する。より具体的には、例えば、センサの駆動モードと、センサの駆動モードと同様の駆動モードで撮影された画像を用いて予め学習された学習モデルとを関連付けて設定する。このとき、例えば、
図4のように設定画面を表示し、表示に基づいてユーザが対応を設定させてもよく、ビニング数やフレームレートといったセンサの駆動モードの設定と共に、学習モデルを設定する。なお、上記の設定方法は一例であって、センサの駆動モードと学習モデルとの関連付けができればよい。例えば、学習モデルの学習に用いられる医用画像に駆動モードに関する付帯情報が関連付けられている場合、その情報を読み込んで学習モデルに関連付けるなどでもよい。また、画像の表示方法も、センサの駆動モードや学習モデルと対応付けて設定してもよい。
【0024】
ここで、CNNの学習時の動作を、
図5を用いて説明する。
【0025】
(S501:推論処理)
S501において、機械学習部103は、入力データと出力データの組を教師データとした教師あり学習を行うことにより学習モデルを構築する。教師データは、入力データとして低解像度画像511と、それに対応した正解データとして高解像度画像515の組である。なお、教師データとして用いる低解像度画像511と高解像度画像515については、例えば、高解像度画像515を解像度変換することにより、高解像度画像515よりも低い解像度である低解像度画像511を生成する。さらに、高解像度画像515にノイズ低減処理を予め施し、ノイズ低減処理を施した高解像度画像515を解像度変換することにより、ノイズ低減処理を施した低解像度画像511を生成してもよい。
【0026】
そして、機械学習部103は、低解像度画像511に対して、学習途中のCNN512のパラメータによる推論処理を行い、推論結果として超解像画像514が出力する(S501)。ここで、CNN512は、多数の処理ユニット513が任意に接続された構造を取る。処理ユニット513の例としては、畳み込み演算や、正規化処理、あるいは、ReLUやSigmoid等の活性化関数による処理が含まれ、それぞれの処理内容を記述するためのパラメータ群を有する。これらは例えば、畳み込み演算→正規化→活性化関数、のように順番に処理を行う組が3~数百程度の層状に接続され、さまざまな構造を取ることができる。
【0027】
(S502:損失関数計算)
次に、S502において、機械学習部103は、推論結果である超解像画像514と高解像度画像515から、損失関数を算出する。損失関数は例えば二乗誤差や、交差エントロピー誤差など、任意の関数を用いることができる。
【0028】
(S503:誤差逆伝搬)
次に、S503において、機械学習部103は、S502で算出した損失関数を起点とした誤差逆伝搬を行い、CNN512のパラメータ群を更新する。
【0029】
(S504:学習終了判定)
最後に、S504において、機械学習部103は、学習の終了判定を行い、学習を継続する場合はS501に進む。S501~503の処理を、低解像度画像511と高解像度画像515を変えながら繰り返すことで、損失関数が低下するようにCNN512のパラメータ更新が繰り返され、機械学習部103の精度を高めることができる。十分に学習が進み、学習終了と判定された場合は、処理を完了する。学習終了の判断は、例えば、過学習が起こらずに推論結果の精度が一定値以上になる、損失関数が一定値以下になるなど、問題に応じて設定した判断基準に基づいて行う。
【0030】
以上の工程により、CNNの学習が行われる。
【0031】
こうして得られる学習パラメータとセンサの駆動モードの組み合わせ例を
図6(a)に示した。センサの駆動モード例として、ビニング数と加算方法を示した。ビニング処理は、X線センサ202における複数画素の信号を加算して、1つの画素の信号として出力する処理を示す。ビニング数がMとは、M×Mの領域を1画素として出力することである。つまり、ビニング数が2の場合は、2×2の領域4画素分を1画素として出力することになる。なお、ビニング領域は、M×N(NはMとは異なる数)でもよい。加算方法とは、ビニングする際に1画素にまとめる方法のことである。
図6(b)にビニング数が2の場合の加算方法の例を示した。〇のついている画素が縮小時に使用する画素である。間引きの場合は2×2領域の中の1画素を使用する。全加算は全ての画素を使用する。斜め加算は斜め方向に使用する画素を選択する。全加算、斜め加算など、加算した場合は、画素値を同レベルにするために、加算数で除算し平均値にしてもよい。また、加算前にエイリアシング対策として、フィルタリングをしてもよい。ビニング数や加算方法が異なると、低解像度画像から高解像度画像を作成する過程は異なるため、CNNが学習する内容も異なる。そのため、ビニング数や加算方法毎に、
図5に示される低解像度画像511と、高解像度画像515の教師データの組を用意して学習をし、パラメータを作成する必要がある。
【0032】
図6(a)にあるように、センサの駆動モードが選択されることで、その中のどのパラメータを使用するかを決定する。センサの駆動モードは例えば、撮影方法が決まるタイミングで決定される。撮影方法は撮影手技に紐づいているため、ある撮影手技を選択すると、撮影条件、駆動モードと決定する。したがって、学習モデル選択部101は、撮影手技が決まったタイミングで、使用するパラメータをロードし、必要なメモリ領域にデータを展開する。メモリ領域に余裕がある場合は、あらかじめ装置起動時など全パラメータをロードしておき、撮影手技を決めたタイミングで、データの参照先を変更する方法でもよい。
【0033】
(S303:X線画像取得)
次に、S303において、画像取得部102は、X線センサから画像を取得する。
【0034】
(S304:前処理)
次に、S304において、画像取得部102は、取得した画像に対し前処理を行い、前処理済み画像を出力する。前処理とは超解像処理を行う準備の処理である。例えば、センサの特性を補正する処理、周波数処理及び階調処理のうち少なくとも一つの処理を行う。センサの特性を補正する処理では、オフセット補正(暗電流補正)、ゲイン補正、欠損補正などを行い、周辺画素との相関関係が保たれている状態にする。
【0035】
(S305:超解像処理)
最後に、S305において、機械学習部103は、前処理済み画像を入力とし、S302において選択された学習モデルを用いてCNN推論処理をし、超解像画像を出力する。
【0036】
以上により医用画像処理装置100の処理が実施される。
【0037】
上記によれば、撮影時のセンサの駆動モードに基づいて、該撮影により得られた医用画像を入力とし、高解像度化した医用画像を出力とする学習モデルが選択される。なお、選択される学習モデルは、例えば、撮影時のセンサの駆動モードと同様の駆動モードにおいて撮影された医用画像を予め学習してある。これにより、入力される医用画像と、学習モデルの学習に用いられた医用画像の生成方法が一致するため、適切に解像度を向上させた医用画像を生成することができる。
【0038】
なお、本実施形態では、センサの駆動モード例として加算方法やビニング数を示したが、センサの画像取得レート(フレームレート)や読み出しエリアサイズなど、センサ駆動方式の変更に関連する他の項目でもよい。また、センサの駆動モードの違いは単一のセンサだけではなく、複数のセンサにまたがっていてもよい。このとき同一センサ内で加算方法が同じになる場合は、センサ毎に学習モデルを切り替えることになる。
【0039】
全ての駆動モード毎に必ずしも異なる学習モデルを用意することはない。低解像度画像から高解像度画像を作成する過程が同様とみなせるものなど、共通化が可能なセンサの駆動モードがあれば、センサの駆動モード間で同じ学習モデルを使用してもよい。
【0040】
[実施形態2]
実施形態1のS302における学習モデル設定において、異なる実施形態を
図1の構成図と
図3の全体フローを使い説明する。
【0041】
(S301:センサの駆動モード取得)
まず、S301において、学習モデル選択部101は、センサの駆動モードを取得する。センサの駆動モードとは、センサがどのように画像を生成し出力するかのパターンである。
【0042】
(S302:学習モデル選択)
そして、S302において、学習モデル選択部101は、センサの駆動モードに基づいて、学習モデルを選択する。学習モデルとは、事前に教師あり学習を行った学習ネットワーク(CNN)と、学習を行うことにより得られたCNNの学習パラメータである。
【0043】
CNNの学習時の動作は実施形態1と同じであるため省略する。学習モデルとセンサの駆動モードの組み合わせ例を
図7(a)に示した。センサの駆動モード例として、ビニング数を示した。ビニング数が増えると、センサの読取速度を高めることができるため、高フレームレートが必要な撮影に使用される。それに伴いCNNに対するパフォーマンス要求が高くなる。すなわちビニング数が異なると、要求されるパフォーマンスが異なる。そのため、よりビニング数が多いセンサの駆動モードには、より処理速度の速いCNNを選択するように設定する。すなわち、第1の駆動モードに比べてセンサの駆動速度が速い第2の駆動モードに対して、第1の駆動モードに関連付けられて設定された第1の学習モデルに比べて処理速度の速い第2の学習モデルを関連付けて設定する。
【0044】
また、例えば、
図5のCNN512を構成する処理ユニット513の数を、ビニング毎に変更してもよい。ビニング数が増えることに対し、処理ユニットを減らすことで処理速度の向上を図る。もしくは、処理にユニット513の数は同様であるが、処理ユニット513で行われる畳み込み演算の入出力のパラメータ数を少なくすることで処理速度の向上を図る。パラメータ数を少なくする方法として、畳み込み演算のサイズを小さくすることや、出力チャンネル数を減らすことを行う。
【0045】
S303からS305は実施形態1と同様のため省略する。
【0046】
本実施形態では、センサの駆動モード例としてビニング数を示したが、センサ駆動の高速化と関連するセンサの駆動モードに対して、同様の切り替えをしてもよい。
【0047】
[実施形態3]
実施形態1のS302における学習モデル設定において、異なる実施形態を
図1の構成図と
図3の全体フローを使い説明する。
【0048】
(S301:センサの駆動モード取得)
S301において、学習モデル選択部101は、センサの駆動モードを取得する。センサの駆動モードとは、センサがどのように画像を生成し出力するかのパターンである。
【0049】
(S302:学習モデル設定)
そして、S302において、学習モデル選択部101は、センサの駆動モードに基づいて、学習モデルを取得する。学習モデルとは、事前に教師あり学習を行ったCNNの学習パラメータである。
【0050】
CNNの学習時の動作を実施形態1と同じであるため省略する。学習モデルとセンサの駆動モードの組み合わせ例を
図7(b)に示した。センサの駆動モード例として、加算方法を示した。加算方法によってCNNでの表現難易度が異なるため、CNNの学習時の収束具合が異なる。そのため、加算方法によって、ハイパーパラメータを変更し、損失曲線が振動しない最適な収束が得られるようにする。ハイパーパラメータとは、例えば学習率とする。学習率とは誤差反映のパラメータで以下のように決まる。CNNのパラメータを決定するには、一般的に勾配降下法が用いられる。CNNパラメータWにおける誤差をJとすると、勾配降下法でのパラメータ更新は、式1のように行われる。:=は代入演算、▽は勾配を表す。
【0051】
W:=W-α▽J(W)・・・(式1)
αが学習率である。αの大きさを小さくすると、現CNNパラメータWへの誤差の反映が小さく、αの大きさを大きくすると、現CNNパラメータWへの誤差の反映が大きくなる。したがって、損失曲線が振動するような加算方法には、学習パラメータを小さくすることで、誤差への反応を小さくする。
【0052】
S303からS305は実施形態1と同様のため省略する。
【0053】
本実施形態では、ハイパーパラメータとして学習率を示したが、バッチサイズやエポック数などでもよい。
【0054】
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路によっても実現可能である。
【0055】
プロセッサまたは回路は、中央演算処理装置(CPU)、マイクロプロセッシングユニット(MPU)、グラフィクスプロセッシングユニット(GPU)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートウェイ(FPGA)を含みうる。また、プロセッサまたは回路は、デジタルシグナルプロセッサ(DSP)、データフロープロセッサ(DFP)、またはニューラルプロセッシングユニット(NPU)を含みうる。
【0056】
上述の各実施形態における医用画像処理装置は、単体の装置として実現してもよいし、複数の装置を互いに通信可能に組合せて上述の処理を実行する形態としてもよく、いずれも本発明の実施形態に含まれる。共通のサーバ装置あるいはサーバ群で、上述の処理を実行することとしてもよい。医用画像処理装置を構成する複数の装置は所定の通信レートで通信可能であればよく、また同一の施設内あるいは同一の国に存在することを要しない。
【0057】
本発明の実施形態には、前述した実施形態の機能を実現するソフトウェアのプログラムを、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムのコードを読みだして実行するという形態を含む。
【0058】
したがって、実施形態に係る処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明の実施形態の一つである。また、コンピュータが読みだしたプログラムに含まれる指示に基づき、コンピュータで稼働しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【0059】
また、本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施形態を組み合わせた構成も全て本発明の実施形態に含まれるものである。
【符号の説明】
【0060】
100 医用画像処理装置
101 学習モデル選択部
102 画像取得部
103 機械学習部