(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-06-12
(45)【発行日】2023-06-20
(54)【発明の名称】血管抽出装置および血管抽出方法
(51)【国際特許分類】
A61B 6/03 20060101AFI20230613BHJP
【FI】
A61B6/03 360J
A61B6/03 360T
(21)【出願番号】P 2019546703
(86)(22)【出願日】2018-10-01
(86)【国際出願番号】 JP2018036733
(87)【国際公開番号】W WO2019069867
(87)【国際公開日】2019-04-11
【審査請求日】2021-09-06
(31)【優先権主張番号】P 2017193805
(32)【優先日】2017-10-03
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】391039313
【氏名又は名称】株式会社根本杏林堂
(73)【特許権者】
【識別番号】304059797
【氏名又は名称】株式会社ユーワークス
(74)【代理人】
【識別番号】100106297
【氏名又は名称】伊藤 克博
(72)【発明者】
【氏名】増田 和正
(72)【発明者】
【氏名】根本 茂
(72)【発明者】
【氏名】宇田 渉
(72)【発明者】
【氏名】▲ハイ▼島 嵐
【審査官】松岡 智也
(56)【参考文献】
【文献】特開2017-174039(JP,A)
【文献】特開2015-119768(JP,A)
【文献】欧州特許出願公開第03171297(EP,A1)
【文献】金井 廉 他1名,”1C-01 立体フィルタを用いた畳み込みニューラルネットワークによる三次元物体認識”,情報処理学会第78回全国大会 予稿集,2016年,2-37~2-38
【文献】OSAREH Alireza et al.,"An Automated Tracking Approach for Extraction of Retinal Vasculature in Fundus Images",JOURNAL OF OPHTHALMIC AND VISION RESEARCH,2010年,Vol. 5, No. 1,pp.20-26
【文献】Titinunt KITRUNGROTSAKUL et al.,"OP11-1 Automatic Vessel Segmentation using A Combined Deep Network",第36回日本医用画像工学会大会 予稿集,2017年07月27日,379-382頁
(58)【調査した分野】(Int.Cl.,DB名)
A61B 6/00-6/14
医中誌WEB
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
畳込みニューラルネットワークを利用し医療用ボリュームデータからそれに含まれる血管を抽出する画像処理ユニットを有する装置であって、
前記畳込みニューラルネットワークは、
前記医療用ボリュームデータの一部の対象ボクセルを含む対象領域の3次元のデータを畳み込み、畳み込んだ3次元のデータを出力する畳込み部と、
ニューラルネット構造を有し、前記畳込み部の出力結果を入力データとして、前記対象ボクセルを血管として表示するかしないか、または、表示する場合にどの程度の明度で表示するかを示す可視化に関する数値を出力する出力部と、
を有し、前記医療用ボリュームデータと血管のボリュームデータとが関連付けられた教師データを用いて学習されたものであり、
前記畳込み部は、
a1:複数の畳込み層を含む第1のパスであって、前記医療用ボリュームデータのうちの一部の対象ボクセルを含む第1の対象領域についての
3次元のデータが、第1の解像度で入力される第1のパスと、
a2:複数の畳込み層を含む第2のパスであって、前記医療用ボリュームデータのうちの
前記一部の対象ボクセルを含む第2の対象領域についての
3次元のデータが、
前記第1の解像度とは異なる第2の解像度で入力される第2のパスと、
を有
し、さらに、
c1:複数の畳込み層を含む第1の追加パスであって、前記医療用ボリュームデータのうちの前記一部の対象ボクセルを含む対象領域について、前記医療用ボリュームデータのCT値を前記医療用ボリュームデータが含むCT値の範囲の一部である第1の範囲内にクリップした3次元のデータが入力される第1の追加パス、または、
c2:複数の畳込み層を含む第2の追加パスであって、前記医療用ボリュームデータのうちの前記一部の対象ボクセルを含む対象領域について、前記医療用ボリュームデータのCT値を前記第1の範囲とは異なる第2の範囲内にクリップした3次元のデータが入力される第2の追加パスのいずれかを、前記第1のパスおよび前記第2のパスと並列となるように含んでいる、
血管抽出装置。
【請求項2】
前記第1の範囲は上限を500HUとする範囲であり、
前記第2の範囲は下限を300HUとする範囲である、
請求項
1に記載の血管抽出装置。
【請求項3】
さらに、前記畳込み部として、
a3:複数の畳込み層を含む第3のパスであって、前記医療用ボリュームデータのうちの一部の
前記対象ボクセルを含む第3の対象領域についてのデータが、第3の解像度で入力される第3のパスを有する、
請求項
1または
2に記載の血管抽出装置。
【請求項4】
前記画像処理ユニットは、前記可視化に関する数値に基づき当該ボクセルの表示態様を決定し、それに基いて血管を表示するように構成されている、
請求項1~
3のいずれか一項に記載の血管抽出装置。
【請求項5】
前記血管が冠動脈であり、前記医療用ボリュームデータは、少なくとも心臓と冠動脈とを含む範囲のデータである、
請求項1~
4のいずれか一項に記載の血管抽出装置。
【請求項6】
畳込みニューラルネットワークを利用し医療用ボリュームデータからそれに含まれる血管を抽出する血管抽出方法であって、
前記畳込みニューラルネットワークは、
前記医療用ボリュームデータの一部の対象ボクセルを含む対象領域の3次元のデータを畳み込み、畳み込んだ3次元のデータを出力する畳込み部と、
ニューラルネット構造を有し、前記畳込み部の出力結果を入力データとして、前記対象ボクセルを血管として表示するかしないか、または、表示する場合にどの程度の明度で表示するかを示す可視化に関する数値を出力する出力部と、
を有し、前記医療用ボリュームデータと血管のボリュームデータとが関連付けられた教師データを用いて学習されたものであり、
前記畳込み部は、
a1:複数の畳込み層を含む第1のパスであって、前記医療用ボリュームデータのうちの一部の対象ボクセルを含む第1の対象領域についての
3次元のデータが、第1の解像度で入力される第1のパスと、
a2:複数の畳込み層を含む第2のパスであって、前記医療用ボリュームデータのうちの前記一部の対象ボクセルを含む第2の対象領域についての
3次元のデータが、
前記第1の解像度とは異なる第2の解像度で入力される第2のパスと、
を有
し、さらに、
c1:複数の畳込み層を含む第1の追加パスであって、前記医療用ボリュームデータのうちの前記一部の対象ボクセルを含む対象領域について、前記医療用ボリュームデータのCT値を前記医療用ボリュームデータが含むCT値の範囲の一部である第1の範囲内にクリップした3次元のデータが入力される第1の追加パス、または、
c2:複数の畳込み層を含む第2の追加パスであって、前記医療用ボリュームデータのうちの前記一部の対象ボクセルを含む対象領域について、前記医療用ボリュームデータのCT値を前記第1の範囲とは異なる第2の範囲内にクリップした3次元のデータが入力される第2の追加パスのいずれかを、前記第1のパスおよび前記第2のパスと並列となるように含んでいる、
血管抽出方法。
【請求項7】
畳込みニューラルネットワークを利用し医療用ボリュームデータからそれに含まれる血管を抽出する血管抽出プログラムであって、
前記畳込みニューラルネットワークは、
前記医療用ボリュームデータの一部の対象ボクセルを含む対象領域の3次元のデータを畳み込み、畳み込んだ3次元のデータを出力する畳込み部と、
ニューラルネット構造を有し、前記畳込み部の出力結果を入力データとして、前記対象ボクセルを血管として表示するかしないか、または、表示する場合にどの程度の明度で表示するかを示す可視化に関する数値を出力する出力部と、
を有し、前記医療用ボリュームデータと血管のボリュームデータとが関連付けられた教師データを用いて学習されたものであり、
前記畳込み部は、
a1:複数の畳込み層を含む第1のパスであって、前記医療用ボリュームデータのうちの一部の対象ボクセルを含む第1の対象領域についての3次元のデータが、第1の解像度で入力される第1のパスと、
a2:複数の畳込み層を含む第2のパスであって、前記医療用ボリュームデータのうちの前記一部の対象ボクセルを含む第2の対象領域についての3次元のデータが、前記第1の解像度とは異なる第2の解像度で入力される第2のパスと、
を有し、
さらに、
c1:複数の畳込み層を含む第1の追加パスであって、前記医療用ボリュームデータのうちの前記一部の対象ボクセルを含む対象領域について、前記医療用ボリュームデータのCT値を前記医療用ボリュームデータが含むCT値の範囲の一部である第1の範囲内にクリップした3次元のデータが入力される第1の追加パス、または、
c2:複数の畳込み層を含む第2の追加パスであって、前記医療用ボリュームデータのうちの前記一部の対象ボクセルを含む対象領域について、前記医療用ボリュームデータのCT値を前記第1の範囲とは異なる第2の範囲内にクリップした3次元のデータが入力される第2の追加パスのいずれかを、前記第1のパスおよび前記第2のパスと並列となるように含んでいる、
血管抽出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、血管抽出装置および血管抽出方法に関し、特には、操作者の作業を省力化でき、かつ、医療用ボリュームデータから高精度に血管を抽出することが可能な血管抽出装置および血管抽出方法に関する。
【背景技術】
【0002】
医用画像診断装置として、従来、X線CT(Computed Tomography)装置、MRI(Magnetic Resonance Imaging)装置、PET(Positron Emission Tomography)装置、超音波診断装置、血管造影(アンギオグラフィ)撮像装置等が知られている。
【0003】
また、このような撮像装置で取得された撮像データを使用して被検者の身体内部を三次元画像化することも行われている。例えば特許文献1では、心臓付近をX線CT装置で撮影して得たCTボリュームデータに基づき、冠動脈の領域をセグメンテーション処理によって抽出することが開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、従来、医療用ボリュームデータから例えば冠動脈などの血管を抽出しようとする場合、操作者が、例えば当該血管の複数の断面画像を見ながら血管の輪郭を決定する作業が必要となる。あるいは、ソフトウェアで自動的に抽出を行う場合であっても自動抽出のために必要な閾値の設定を行うといった作業が必要となるのが一般的である。
【0006】
これに対して、本発明者らは、畳込みニューラルネットワーク技術を応用してそのような操作者の作業を省力化し効率的に対象の血管を抽出し得ることを見出した。
【0007】
そこで本発明の目的は、操作者の作業を省力化でき、かつ、医療用ボリュームデータから高精度に血管を抽出することが可能な血管抽出装置および血管抽出方法を提供することにある。
【課題を解決するための手段】
【0008】
上記課題を解決するための本発明の一形態の血管抽出装置は下記の通りである:
畳込みニューラルネットワークを利用し医療用ボリュームデータからそれに含まれる血管を抽出する画像処理ユニットを有する装置であって、
前記畳込みニューラルネットワークは、
a1:複数の畳込み層を含む第1のパスであって、前記医療用ボリュームデータのうちの一部の対象ボクセルを含む第1の対象領域についてのデータが、第1の解像度で入力される第1のパスと、
a2:複数の畳込み層を含む第2のパスであって、前記医療用ボリュームデータのうちの一部の対象ボクセルを含む第2の対象領域についてのデータが、第2の解像度で入力される第2のパスと、
を有する畳込みネットワーク部と、
b:ニューラルネット構造を有し、前記第1のパスと前記第2のパスとの出力結果を入力データとして、前記対象ボクセルの可視化に関する数値を出力する出力部と、
を含むことを特徴とする、血管抽出装置。
【0009】
(用語の説明)
・「畳込みニューラルネットワーク」とは、少なくとも1つの畳込み層(CNN:Convolutional Neural Network)を含み、その畳込み層により、入力された画像データ(3次元のものも含む)に対して畳込み処理を実行して特徴量抽出を行うものをいう。畳込み処理に用いられるフィルタとしては、3次元の入力データに対しては3次元のフィルタが用意され、フィルタの各要素にはいわゆるフィルタパラメータと呼ばれる数値(重み)が設定されている。
・「可視化に関するデータ」とは、例えばボクセルごとに与えられた数値(ボクセル値)であり、その数値に対応して、当該ボクセルを表示するかしないか、または、表示する場合にどの程度の明度で表示するか等を決定できる数値のことをいう。例えば、「0」~「1」の範囲内の数値である。
【発明の効果】
【0010】
本発明によれば、操作者の作業を省力化でき、かつ、医療用ボリュームデータから高精度に血管を抽出することが可能な血管抽出装置および血管抽出方法を提供することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の一形態の血管抽出装置を含むシステムについて模式的に示す図である。
【
図3】畳込みニューラルネットワークの構成を示す図である。
【
図4】
図3の畳込みニューラルネットワークの機能を説明するための図である。
【
図5】CTボリュームデータと、そこから自動抽出された血管とを示す図である。
【
図6】CTボリュームデータに含まれるボクセル値の模式的なヒストグラムである。
【
図7】
図3の畳込みニューラルネットワークでの処理のフローチャートである。
【
図9】
図3の畳込みニューラルネットワークの学習を説明するための図である。
【発明を実施するための形態】
【0012】
1.基本的構成
図1は、本発明の一形態に係る血管抽出装置を含むシステム全体の構成を模式的に示す図である。システム全体としては、一例で、撮像装置300、カルテ管理装置であるHIS360、撮像管理装置であるRIS370、データ保存装置であるPACS380、患者に造影剤等を注入する薬液注入装置100、血管抽出装置400、それらの各機器を接続するネットワーク350等を備えるものであってもよい。なお、血管抽出装置400以外の構成は従来公知のものを利用してもよい。
【0013】
HIS(Hospital Information System)360は、専用のコンピュータプログラムが実装されたコンピュータであり、カルテ管理システムを有する。カルテ管理システムで管理される電子カルテは、例えば、固有の識別情報であるカルテID、患者ごとの患者ID、患者の氏名などの個人データ、患者の疾病に関するカルテデータ、等のデータを含むものであってもよい。また、カルテデータには、治療全般に関連した個人条件データとして、患者の体重、性別、年齢等が登録されていてもよい。
【0014】
RIS(Radiology Information System)370は、患者の透視画像データを撮像するための撮像オーダデータを固有の識別情報で管理する。この撮像オーダデータは、HISから取得する電子カルテに基づいて作成されるものであってもよい。撮像オーダデータは、例えば、固有の識別情報である撮像作業ID、CT撮像やMR撮像などの作業種別、前述の電子カルテの患者IDとカルテデータ、CTスキャナの識別情報、撮像開始および終了の日時、身体区分または撮像部位、撮像作業に対応した造影剤などの薬液種別からなる適正種別、撮像作業に適合した薬液IDからなる適正ID、等のデータを含むものであってもよい。
【0015】
PACS(Picture Archiving and Communication Systems)380は、撮像装置から撮像オーダデータが付与された透視画像データを受信してそれを記憶装置内に保存する。
【0016】
撮像装置300は、一例でX線CT装置であり、患者の透視画像を撮像する撮像部と、患者を載せるベッドと、それらの動作を制御する制御部とを有するものであってもよい。撮像部は、ガントリ内に配置された、X線管やコリメータ等を有しX線を患者に向けて照射するX線照射部と、患者を透過したX線の検出するX線検出器を有する検出部とを有するものであってもよい。X線照射部および検出部が、それらの位置関係を保ったまま患者の体軸の周りを回転しながらスキャンを行うように構成されている。
【0017】
薬液注入装置100について
図2も参照して説明する。薬液注入装置100は、一例で可動式スタンド111に保持された注入ヘッド110と、ケーブル102で注入ヘッド110に接続されたコンソール150とを備えている。この例では、注入ヘッド110には、2本のシリンジが並列に取外し自在に装着される。なお、注入ヘッド110とコンソール150とは無線方式で接続されていてもよい。
【0018】
シリンジに充填される薬液としては、造影剤および生理食塩水などが挙げられる。例えば、一方のシリンジに造影剤が充填され、もう一方のシリンジに生理食塩水が充填されていてもよい。シリンジは、中空筒状のシリンダ部材と、そのシリンダ部材にスライド自在に挿入されたピストン部材とを有している。シリンダ部材は、その基端部にシリンダフランジが形成されるとともに先端部に導管部が形成されたものであってもよい。ピストン部材をシリンダ部材内に押し込むことにより、シリンジ内の薬液が導管部を介して外部に押し出される。なお、シリンジは予め薬液が充填されたプレフィルドタイプであってもよいし、空のシリンジに薬液を吸引して使用する吸引式のものであってもよい。
【0019】
注入ヘッドは、詳細な図示は省略するが、次のようなものであってもよい。すなわち、注入ヘッドは、一例として前後方向に長く延びるような筐体を有しており、この筐体の上面先端側には、それぞれシリンジが載せられる2つの凹部が形成されている。凹部はシリンジ保持部として機能する部分である。凹部に対しては、シリンジが直接装着されてもよいし、または、所定のシリンジアダプタを介して装着されてもよい。
【0020】
注入ヘッドは、また、シリンジのピストン部材を押し込む機能を少なくとも有するピストン駆動機構を有している。ピストン駆動機構は二系統設けられており、各機構は独立して動作する。ピストン駆動機構は、例えばシリンジ内への薬液吸引のために、ピストン部材を後退させる機能を有するものであってもよい。2つのピストン駆動機構は同時に駆動されてもよいし、別々のタイミングで駆動されてもよい。ピストン駆動機構は、詳細な図示は省略するが、駆動モータと、その駆動モータの回転出力を直線運動に変換する運動変換機構と、その運動変換機構に連結され、ピストン部材を前進および/または後退させるシリンジプレッサー(ラム部材)とを有するものであってもよい。
【0021】
このようなピストン駆動機構としては、薬液注入装置で一般に用いられる公知の機構を用いることができる。なお、モータ以外のアクチュエータを駆動源としてもよい。「ピストン駆動機構」に代えて、シリンジ以外の所定の薬液収容体(例えばボトル、バッグ等)から薬液を患者に向けて送達する駆動機構が設けられていてもよい。
【0022】
シリンジにICタグ(識別タグ)が付されている場合には、注入ヘッドは、同ICタグの情報を読み取るおよび/または同ICタグに情報を書き込むリーダ/ライタを有していてもよい。このリーダ/ライタは、シリンジが装着される凹部に設けられていてもよい。なお、リーダ/ライタは、ICタグの情報を読み取る機能のみを有するものであってもよい。
【0023】
コンソール150は、一例で検査室に隣接した操作室内に置かれて使用されるものであってもよい。コンソール150は、所定の画像を表示するディスプレイ151と、その筐体前面に設けられた操作パネル159と、筐体内に配置された制御回路などを有している。操作パネル159は、1つまたは複数の物理ボタンが配置された部分であり、操作者によって操作される。ディスプレイ151は、タッチパネル式表示デバイスであってもよいし、単なる表示デバイスであってもよい。コンソール150は、音および/または音声を出力するためのスピーカ等(不図示)を有していてもよい。コンソール150の記憶部(不図示)には、注入プロトコルの作成や注入の実行などに関わる各種データが格納されていてもよい。例えば、グラフィカルユーザインターフェースのデータや、注入条件(注入パターン)等のデータである。
【0024】
(血管抽出装置)
血管抽出装置400は、入力デバイス461、画像処理ユニット450、インターフェース463、記憶部460等を一例として備えている。入力デバイス461としては、例えばキーボードやマウス等といった一般的なデバイスが挙げられる。必要に応じて、音声入力のためのマイクなどを利用してもよい。限定されるものではないが、血管抽出装置400は、ワークステーション、ラップトップコンピュータ、タブレット端末等で構成されてもよい。なお、血管抽出装置400は、必ずしも物理的に独立した機器である必要はなく、例えばネットワーク上の1つまたは複数のコンピュータによって実現されるものであってもよい。または、撮像装置の一部として設けられていてもよいし、薬液注入装置の一部として設けられたものであってもよい。具体的には、本発明の一形態に係るコンピュータプログラムを、撮像装置のコンソールに実装する、ネットワーク上の1つまたは複数のコンピュータに実装する、または、薬液注入装置のコンソール等に実装するなどして、これを実現してもよい。
【0025】
インターフェース463は外部の種々の機器等との接続を行うためのものであり、図では1つのみ示されているが、当然ながら複数設けられていてもよい。接続の方式(通信の方式)は有線であっても無線であってもよい。
図1の例では、インターフェース463にネットワーク経由で撮像装置300等が接続されており、これにより、例えば撮像装置300やPACS380等からのデータが血管抽出装置400に読み込まれる(または当該装置によって識別される)ようになっている。
【0026】
記憶部460は、ハードディスクドライブ(HDD:Hard Disk
Drive)、ソリッドステートドライブ(SSD:Solid State Drive)、および/またはメモリなどで構成されたものであってもよく、OS(Operating
System)のプログラムや、本発明の一形態に係る血管抽出プログラムが格納されていてもよい。
【0027】
また、各種処理に用いるその他のコンピュータプログラムや、データテーブル、画像データ等が必要に応じて記憶部460に格納されていてもよい。コンピュータプログラムは、プロセッサ(CPUやGPU等)のメモリにロードされることによって実行される。コンピュータプログラムは、任意のネットワークを介して必要時に外部機器からその全部または一部がダウンロードされるものであってもよい。コンピュータプログラムは、コンピュータ読み取り可能な記録媒体に格納してもよい。
【0028】
血管抽出装置400は、ディスプレイ430に所定の情報を表示するように構成されている。ディスプレイ430としては、特に限定されるものではないが、LCD(Liquid
Crystal Display)ディスプレイや有機EL(Organic Electro-Luminescence)ディスプレイ等を利用可能である。ディスプレイ430は、血管抽出装置400が1つの筐体として構成されている場合、その一部に一体的に設けられたものであってもよい。あるいは、本体部(不図示)とは別体に構成され、接続して使用されるものであってもよい。
【0029】
(画像処理ユニットの構成)
画像処理ユニット450は、コンピュータプログラムの命令にしたがってプロセッサ等を動作させ所定の画像処理や機械学習の演算を行うように構成されている。限定されるものではないが、本実施形態では後述するようにニューラルネットワークでの畳込み処理等を行うものであるので、GPU(Graphics Processing Unit:グラフィックス プロセッシング ユニット)を利用するものであることが一形態において好ましい。
【0030】
2.ニューラルネットワークの構成および動作
〔構成〕
本実施形態で使用するニューラルネットワークの一例を
図3に示す。
図3に示すように、この畳込みニューラルネットワーク600は、畳込み処理を行う複数のパスが並列に配置された畳込み部600aと、それに続く出力部600bとを有している。畳込み部600aを構成する各パスの機能は基本的に同様であるが、入力されるデータの種別によって、以下の説明では、パスA1~A3と追加パスC1~C2(単にパスC1、C2ともいう)というように区別するものとする。
【0031】
(第1のパスA1)
第1のパスA1は、畳込み処理を行う複数の畳込み層611~619を有している。各畳込み層611~619は、不図示の3次元フィルタを用いて、入力された3次元データ(詳細下記)を畳み込む。
【0032】
畳込み層の数は特に限定されるものではないが、この例では、9層である。必要に応じて、層の数を増減してもよい。3次元フィルタとしては、フィルタサイズが例えば3x3x3のものを使用することができる。フィルタの各要素(この場合、3x3x3の27要素)ごとにフィルタパラメータ(重み)が設定されている。このフィルタパラメータとしては、一例として、事前の機械学習により、適切な値に調整されたデータセットを利用することができる。
【0033】
なお、畳込みの際にフィルタを移動させる距離(ストライド)は、限定されるものではないが、例えば1ボクセルずつであってもよいし2ボクセルずつであってもよい。
【0034】
本実施形態では、第1のパスA1に入力されるデータ51は、25x25x25の3次元のデータである(詳しい内容については後述する)。それを各畳込み層で順次畳み込んでいくことで、一辺のサイズが「25」→「23」→「21」→「19」→「17」→「15」→「13」→「11」と減少し、最終的に9x9x9のサイズが得られるようになっている。
【0035】
(他のパスA2、A3、C1、C2)
他のパスA2、A3、C1、C2についても、基本的には、上述したパスA1と同様であり、各々、9つの畳込み層を有している。ただし、入力されるデータに関して相違がある。詳細は後述するが、パスA2、A3については第1のパスA1と解像度を異らせたデータが入力される。すなわち、この実施形態では、入力データを多重解像度として、異なるパスに流す方式を採用している。一方、追加パスC1、C2については、解像度の違いではなく、CT値の範囲を異らせた入力データとしている。
【0036】
なお、
図3では、パスA2、A3への入力されるデータのサイズが一辺「19」のように表示されているが、これは本発明の本質的部分ではなく、25x25x25サイズのデータを入力するようにしてもよい。また、他の留意事項として、パスA2、A3においては、入力データが19x19x19であるため、第8層の段階でサイズが3x3x3となる。そこで、最終的に各パスの出力データのサイズが揃うように(つまり、9x9x9となるように)アップサンプリング処理(畳込み処理によって生成された対象のサイズを大きくするための処理)を行っている。
【0037】
(入力データ)
次に、入力画像の詳細について、
図4を参照して説明する。なお、
図4では説明の都合上、2次元の画像として表現している。また、説明を簡単にするためにパスA2、A3に入力されるデータ52、53についても、一辺のサイズが「19」ではなく「25」と示している。
【0038】
医療用ボリュームデータ601としては、例えば
図5(a)に示すような心臓付近のCTボリュームデータであってもよい。この例では、ボリュームデータ601は、心臓11および冠動脈12を含み、さらに大動脈や大静脈のような他の血管13や骨(不図示)なども含んでいる。限定されるものではないが、医療用ボリュームデータのサイズは一例として512x512x512である。なお、この医療用ボリュームデータとしては、予めX線CT装置などによって被検者を撮像し、その撮像データを用いて従来公知の方法で作成されたものであってもよい。例えば、ネットワーク上の所定のサーバに保管されたCTボリュームデータを読み出して使用するようにしてもよい。
【0039】
第1のパスA1へ入力されるデータ51は、
図4に示すように、医療用ボリュームデータ601のうちの1つのボクセル681aと、その周辺の所定範囲の領域とを含む第1の対象領域R1のデータである。対象領域R1は、例えば、ボクセル681aを中心とした、25x25x25の範囲のデータであってもよい。
【0040】
第2のパスA2へ入力されるデータ52は、ボクセル681aを中心とした領域のデータということでは上記とほぼ共通する。ただし、多重解像度の入力とするために、次のような処理を行っている。すなわち、第1の対象領域R1よりも大きな対象領域R2をサンプリングし、それに対して解像度を下げて所望のサイズのデータ52としている。具体的には、(25x3)3の対象領域R2とし、解像度を1/3に落とすことで25x25x25のデータ52を得るようにしてもよい。もっとも、「25」ではなく、一辺のサイズが「19」であってもよいことは前述のとおりであり、この場合は、(19x3)3の対象領域R2ということになる。
【0041】
第3のパスA3へ入力されるデータ53についても、考え方は第2のパスA2の場合と同様である。ただし、データ53については、(25x9)
3の対象領域R3とし、解像度を1/9に落としている。なお、
図4で図示しているR2やR3のサイズは模式的なものであり、実際のサイズを正確に表したものではない。
【0042】
パスC1、C2へ入力されるデータ54、55は、第1のパスA1のデータ51とサイズは同様であるが、CT値を所定の範囲内にクリップした(制限した)ものである点で異なっている。すなわち、そのCT値範囲内のデータのみを入力するようにしている。これについて、以下、
図6も参照しつつ説明する。
【0043】
図6は、医療用ボリュームデータ601に含まれるボクセルのCT値のヒストグラムを模式的に示したものである。横軸はCT値(HU)であり、縦軸は出現数(N)である。このように、一般に、医療用ボリュームデータのヒストグラムは、軟組織や水分といった比較的CT値が低い個所と、骨/石灰化組織を含む比較的CT値が高い個所とにピークが存在するデータとなる。具体的には、水および空気のCT値はそれぞれ0HU、-1000HUであり、軟部組織等(軟部組織、血液、脳、臓器実質など)は20~100HU未満程度、骨/石灰化組織は1000HU程度、脂肪は-100HU程度である。
【0044】
図6において、範囲18は、上限を500HU程度とするCT値が低い側の範囲であり、範囲19は、下限を300HU程度とするCT値が高い側の範囲である。具体的なCT値は特に限定されるものではなく、検査内容や患者の関心部位等に応じて適宜設定すればよい。範囲18としては、下限が-1000HU、-200HU、-100HU、または0HUであってもよい。冠動脈抽出のケースでは、範囲18の具体的な例として、0~500HUまたは0~400HUの範囲内などが挙げられる。範囲19の具体的な例としては、300~2000HUまたは300~1700HUの範囲内などが挙げられる。
【0045】
このように医療用ボリュームデータ601をCT値の範囲で区分したうえで、CT値の低い側の範囲に絞ったデータをパスC1に入力し、CT値の高い側の範囲に絞ったデータをパスC2に入力するようにしている。
【0046】
なお、上記説明において入力データ51~55について説明したが、畳込みニューラルネットワークでデータ処理をするにあたっては、必要に応じて、ボクセルのCT値を一定範囲の数値範囲に変換したり(この状態の数値を「ボクセル値」などともいう)、バッチノーマライゼーションや白色化といった前処理を行ってもよい。
【0047】
次に、畳込みニューラルネットワーク600の出力部600bについて説明する。出力部600bは、全結合層B1、B2と、出力層B3と含むニューラルネットワーク構造である。なお、この場合も、全結合層の数は特に限定されるものではなく、1層のみまたは3層以上としてもよい。全結合層B1へは、各パスA1~A5の出力結果が入力される。つまり、各パスA1~A5の出力結果である3次元データの各要素の数値が、入力として、全結合層B1のノード(不図示)に結合されている。
【0048】
なお、「全結合層」とは、基本的には、文字通り、全てのノードどうしを接続した順伝播型のネットワークのことをいうが、本願の技術思想との関係では、必ずしも厳密に全てのノードどうしが接続されている必要はない。
【0049】
出力層B3は、全結合層B2からのデータに基づき、最終的な出力を行う層であり、この例では、「0」~「1」の範囲の数値データを出力する。これは、対象ボクセル681aが冠動脈であるか否かを示す確率と考えることができ、1(または1に近い)であれば冠動脈であるとし、0(または0に近い)であれば冠動脈ではないとするようにしてもよい。このような出力を得るためには、種々の活性化関数を利用し得るが、一例でシグモイド関数などを用いることができる。
図8に示すように、シグモイド関数は、入力されたxに対して「0」~「1」の範囲内で出力(y)を行う関数である。
【0050】
〔動作〕
続いて、本実施形態の多層ニューラルネットワーク600の動作について説明する。なお、前提として、ネットワークの重みパラメータ(不図示)は、例えば事前の機械学習によって既に与えられているものとする。
【0051】
まず、画像処理ユニット450(
図1参照)は、予め用意された医療用ボリュームデータ601を識別するかまたは読み込む。
【0052】
次いで、
図7のフローチャートに示すように、1つのボクセル681a(
図4参照)を対象としたデータ処理を行う(ステップS1)。上述した多層ニューラルネットワーク600の機能により、畳込みニューラルネット部601aで3次元の入力データ51~55の畳込み処理が行われる(ステップS2)とともに、出力部600bでの順伝播計算処理が行われ、最終的に、出力層B3において、当該ボクセル681aが冠動脈であるか否かを示す数値データが求められる(ステップS3、
図4も参照)。
【0053】
同様の処理を医療用ボリュームデータ601の全ボクセルについて、繰り返し実施する(ステップS4)。これにより、全てのボクセルを0~1の範囲内で数値化することができる。このようにして得られたデータに基づき、所定のボクセルについてのみ画像表示を行うことで、
図5(b)に示すような、冠動脈12のみが抽出された3次元画像を生成することができる(ステップS5)。
【0054】
画像表示に関する具体的な手法は特に限定されるものではないが、例えば、ボクセル値を所定の閾値とを比較し、当該ボクセル値が閾値を超えていた場合には、当該ボクセルを表示とし、それ以外を非表示(または明度を下げた状態での表示等でもよい)とする。
【0055】
以上説明したような畳込みニューラルネットワーク600を利用した血管抽出手法によれば、
図5(a)のような医療用ボリュームデータ601を入力するだけで、
図5(b)に示すように、自動的に対象の血管12のみが抽出されるため、非常に効率的に血管抽出を実施することができる。
【0056】
また、多層ニューラルネットワーク601において、適切な数値範囲内とされた重みパラメータのデータセットを使用することで、実際の血管形状(
図5(a)の血管形状)を精度よく再現した血管形状(
図5(b))を得ることが可能となる。本実施形態は、基本的には、医療用ボリュームデータ601に基づき、不要なボクセルを表示させないことで冠動脈12のみを表示するという手法である。したがって、例えば、血管の中心のパスを作成してそのパスに対してある一定の半径部分を血管と見做して表示するような手法と異なり、本来冠動脈でないボクセルを冠動脈として表示してしまう可能性も低減する。
【0057】
なお、上記実施形態では、解像度に関連するパスA1~A3の3つと、CT値に関連するパスC1、C2の計5つのパスを利用したが、パスの数は適宜変更してもよい。
【0058】
畳込みニューラルネットワーク600を利用して血管を抽出するという技術的思想は、必ずしも冠動脈に限らず他の部位の血管抽出にも適用可能である。また、解像度のパスA1~A3(2つのパスのみでもよい)のみを用い、CT値のパスC1、C2を用いることなく、比較的精度のよい血管抽出が実施できる場合には、パスC1、C2を省略してもよい。
【0059】
また、以上、血管の抽出を中心として説明を行ったが、本発明の技術思想は、臓器や骨のようなその他の解剖学的構造に応用することも可能である。
【0060】
〔学習フェーズ〕
次に、上述したような畳込みニューラルネットワーク600の重みパラメータの学習について説明する。
図9を参照してパスA1の例に単純化して説明を行う。
【0061】
畳込み層611~619には、それぞれには3次元フィルタが設定されており、その3次元フィルタは重みパラメータを含んでいる。具体的には、3x3x3の3次元フィルタであれば、33=27個のフィルタパラメータを含むこととなる。また全結合層に関してもノード(不図示)どうしの結合強度を表すパラメータが含まれている。
【0062】
学習に際しては、教師データのセットを用意する。本実施形態では、教師データとしては、ある医療用ボリュームデータ601に基づき、医師等が実際にデータを見ながら手作業で血管抽出を行って得られた冠動脈ボリュームデータを使用することができる。このような、医療用ボリュームデータ601とそこから抽出された冠動脈ボリュームデータの対を複数用意して教師データのセットとする。
【0063】
そして、畳込みニューラルネットワーク600に対して、ある医療用ボリュームデータ601を入力した際の出力値と、教師データの値とを用い、所定の誤差関数(損失関数)を使用してその誤差Eが十分に小さくなるまで学習を繰り返す。
【0064】
誤差関数としては特に限定されるものではないが、二乗平均誤差(Mean Squared Error)等を用いることができる。誤差Eを小さくするための手法としては、特に限定されるものではないが、勾配降下法などを利用してパラメータを順次更新するものであってもよい。データの集合どうしの類似度を評価するための関数として、Jaccard係数、Dice係数、またはSimpson係数等を使用するようにしてもよい。また、勾配降下法の学習においては、当然ながら、全ての学習用データを一度に使用するのではなく、一部のサンプルのみを順に学習に使っていくいわゆるミニバッチ学習(minibatch learning)を利用してもよい。
【0065】
以上一連の学習工程により、畳込みニューラルネット600のパラメータを、十分な精度にまで最適化することができる。学習の効率という観点で言えば、本実施形態のように、CT値の範囲を異ならせた2つパスC1、C2が設けられている場合、より少ない教師データ数で学習を行えることが期待できる。
【0066】
以上、本発明の一形態について、具体的な例を挙げて説明したが、本発明はその趣旨を逸脱しない範囲で適宜変更可能である:
・データ拡張(Data Augmentation)
学習に用いるデータに関し、データ拡張によってデータ数を増加させ、学習を行うことも好ましい。データ拡張の手法としては、移動、回転、拡大縮小のようなものの他にも、例えば、形状データやベクトルデータを変形させる非剛体変形を用いるようにしてもよい。比較的少量のデータであってもデータ拡張を有効に利用することで、効果的な学習を実施でき、血管抽出の精度の向上を図ることが可能となる。
【0067】
・異なるパスに対する異なる学習用データの入力
上述した実施形態では、解像度の異なる3つのパスA1~A3を含むニューラルネットワーク構造を説明した。ここで、例えば、10個のボリュームデータを順に学習させていく場合を考える。この場合、共通のボリュームデータ「1」を、解像度を変えて、それぞれのパスA1~A3に入力してもよいが、次のような手法がより効果的であると考えられる。すなわち、ボリュームデータ「1」をそれぞれのパスA1~A3に入力する手法の場合、縮小画像はほぼ同様のものとなり得るので、各パスでの学習効率が比較的低くなってしまう懸念がある。その場合には、それぞれのパスに対し(または、あるパスグループと他のパスグループとのそれぞれに対し)異なる学習用データを入力するようにしてもよい。より具体的には、例えばミニバッチ学習の際、パスA1~A3のそれぞれに、異なるバッチデータを入力するように上記のようにすることで、各パスでの学習の改善が期待できる。
【0068】
上記実施形態では、3次元のボクセルデータを対象に説明を行ったが必要であれば、3次元データに本発明の技術を応用してもよい。学習を行う主体および/または血管抽出処理を行う主体は、必ずしも単一のコンピュータである必要はなく、複数のコンピュータであってもよい。
【0069】
なお、本出願では基本的に「血管抽出装置」という名称で説明を行ったが、本発明の対象は必ずしもそのような名称に限定されるものでなく、例えば「画像処理装置」などと表現されてもよいし、また、「装置」の部分に関しても、「デバイス」や「システム」などの表現に置き換えてもよい。
【0070】
(付記)
本出願は以下の発明を開示する。なお、括弧内の符号は参考のために付したものであり、これにより本発明が限定されるものではない。
1.畳込みニューラルネットワーク(600)を利用し医療用ボリュームデータ(601)からそれに含まれる血管を抽出する画像処理ユニット(450)を有する装置(400)であって、
上記畳込みニューラルネットワーク(600)は、
a1:複数の畳込み層(conv)を含む第1のパスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む第1の対象領域(R1)についてのデータ(51)が、第1の解像度で入力される第1のパス(A1)と、
a2:複数の畳込み層(conv)を含む第2のパスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む第2の対象領域(R2)についてのデータ(52)が、第2の解像度で入力される第2のパス(A2)と、
を有する畳込み部(600a)と、
b:ニューラルネット構造を有し、上記第1のパスと上記第2のパスとの出力結果を入力データとして、上記対象ボクセル(681a)の可視化に関する数値を出力する出力部(600b)と、
を含むことを特徴とする、血管抽出装置。
【0071】
本発明の一形態によれば、このように、異なる解像度のボリュームデータを畳込みニューラルネットワーク並列のパス(A1、A2等)に入力して、対象ボクセルの可視化に関する数値を得る(限定されるものではないが、その数値に基づいて当該ボクセルの表示・非表示を決定したり、表示濃度を決定したりしてもよい)ものであるので、精度よく対象物の抽出を行うことができる。
【0072】
2.さらに、上記畳込み部(600a)として、
c1:複数の畳込み層を含む第1の追加パスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む対象領域について、上記医療用ボリュームデータ(601)のCT値を第1の範囲内にクリップしたデータ(54)が入力される第1の追加パス(C1)と、
c1:複数の畳込み層を含む第2の追加パスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む対象領域について、上記医療用ボリュームデータ(601)のCT値を第2の範囲内にクリップしたデータ(55)が入力される第2の追加パス(C2)と、を含む。
【0073】
3.上記第1の範囲は上限を500HUとする範囲であり、上記第2の範囲は下限を300HUとする範囲である。
このように、一方を比較的低いCT値範囲とし他方を比較的高いCT値範囲として、これらの別々に畳込み処理を行うことで機械学習が効率的に実施できるようになることが期待できる。
【0074】
4.さらに、上記畳込み部(600a)として、
a3:複数の畳込み層を含む第3のパスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む第3の対象領域(R3)についてのデータ(53)が、第3の解像度で入力される第3のパス(A3)を有する。
【0075】
5.上記画像処理ユニット(450)は、上記可視化に関する数値(例:080)に基づき当該ボクセルの表示態様を決定し、それに基いて血管を表示するように構成されている。
【0076】
6.上記血管が冠動脈であり、上記医療用ボリュームデータは、少なくとも心臓と冠動脈とを含む範囲のデータである。
【0077】
7.畳込みニューラルネットワーク(600)を利用し医療用ボリュームデータ(601)からそれに含まれる血管を抽出する血管抽出方法であって、
上記畳込みニューラルネットワーク(600)は、
a1:複数の畳込み層(conv)を含む第1のパスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む第1の対象領域(R1)についてのデータ(51)が、第1の解像度で入力される第1のパス(A1)と、
a2:複数の畳込み層(conv)を含む第2のパスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む第2の対象領域(R2)についてのデータ(52)が、第2の解像度で入力される第2のパス(A2)と、
を有する畳込み部(600a)と、
b:ニューラルネット構造を有し、上記第1のパスと上記第2のパスとの出力結果を入力データとして、上記対象ボクセル(681a)の可視化に関する数値を出力する出力部(600b)と、
を含むことを特徴とする、血管抽出方法。
【0078】
8.畳込みニューラルネットワーク(600)を利用し医療用ボリュームデータ(601)からそれに含まれる血管を抽出する血管抽出プログラムであって、
上記畳込みニューラルネットワーク(600)は、
a1:複数の畳込み層(conv)を含む第1のパスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む第1の対象領域(R1)についてのデータ(51)が、第1の解像度で入力される第1のパス(A1)と、
a2:複数の畳込み層(conv)を含む第2のパスであって、上記医療用ボリュームデータのうちの一部の対象ボクセル(681a)を含む第2の対象領域(R2)についてのデータ(52)が、第2の解像度で入力される第2のパス(A2)と、
を有する畳込み部(600a)と、
b:ニューラルネット構造を有し、上記第1のパスと上記第2のパスとの出力結果を入力データとして、上記対象ボクセル(681a)の可視化に関する数値を出力する出力部(600b)と、
を含むことを特徴とする、血管抽出プログラム。
【0079】
本発明の一形態に係る発明は次のようなものであってもよい:
A1.畳込みニューラルネットワーク(600)を利用し医療用データ(601)からそれに含まれる解剖学的構造体を抽出する画像処理ユニット(450)を有する装置(400)であって、
上記畳込みニューラルネットワーク(600)は、
a1:複数の畳込み層(conv)を含む第1のパスであって、上記医療用データのうちの一部の対象画素(681a)を含む第1の対象領域(R1)についてのデータ(51)が、第1の解像度で入力される第1のパス(A1)と、
a2:複数の畳込み層(conv)を含む第2のパスであって、上記医療用データのうちの一部の対象画素(681a)を含む第2の対象領域(R2)についてのデータ(52)が、第2の解像度で入力される第2のパス(A2)と、
を有する畳込み部(600a)と、
を含むことを特徴とする、装置。
【0080】
解剖学的構造体としては、血管に限らず、臓器や骨等であってもよい。
【0081】
A2.さらに、
b:ニューラルネット構造を有し、上記第1のパスと上記第2のパスとの出力結果を入力データとして、上記対象画素(681a)の可視化に関する数値を出力する出力部(600b)を備える。
【0082】
なお、本明細書において、本発明の趣旨を逸脱しない限り、1つの技術的要素と他の技術的要素は適宜組合せ可能である。また、例えば装置の発明として説明された内容は、方法の発明またはコンピュータプログラム(プログラム媒体)の発明としても表現可能である。
【符号の説明】
【0083】
11 心臓
12 冠動脈
13 他の血管
100 薬液注入装置
110 注入ヘッド
150 コンソール
400 血管抽出装置
450 画層処理ユニット
600 畳込みニューラルネットワーク
600a 畳込み部
600b 出力部
601 医療用ボリュームデータ
611~619 畳込み層
A1~A3 パス
B1~B2 全結合層
B3 出力層
C1~C2 追加パス