(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023067230
(43)【公開日】2023-05-16
(54)【発明の名称】医用画像観察支援装置
(51)【国際特許分類】
A61B 1/045 20060101AFI20230509BHJP
A61B 1/307 20060101ALI20230509BHJP
【FI】
A61B1/045 618
A61B1/307
A61B1/045 614
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2021178275
(22)【出願日】2021-10-29
(71)【出願人】
【識別番号】504139662
【氏名又は名称】国立大学法人東海国立大学機構
(71)【出願人】
【識別番号】501083643
【氏名又は名称】学校法人慈恵大学
(74)【代理人】
【識別番号】100085361
【弁理士】
【氏名又は名称】池田 治幸
(74)【代理人】
【識別番号】100147669
【弁理士】
【氏名又は名称】池田 光治郎
(72)【発明者】
【氏名】森 健策
(72)【発明者】
【氏名】小田 昌宏
(72)【発明者】
【氏名】山本 徳則
(72)【発明者】
【氏名】松川 宜久
(72)【発明者】
【氏名】古田 昭
(72)【発明者】
【氏名】木村 高弘
【テーマコード(参考)】
4C161
【Fターム(参考)】
4C161AA15
4C161CC06
4C161HH28
4C161WW18
(57)【要約】
【課題】
膀胱内視鏡により撮影された画像を、機械学習の方法を用いて、ハンナ型間質性膀胱炎についての分類を行うことのできる、画像観察支援装置を提供する。
【解決手段】
画像観察支援装置10は、学習済みのネットワーク36を有する画像処理部34を有し、画像処理部34は、画像読み込み部32によって読み込まれた、膀胱内視鏡によって得られる内視鏡画像について、ハンナ型間質性膀胱炎、膀胱痛症候群、および、膀胱癌の3分類を行うことができる。
【選択図】
図3
【特許請求の範囲】
【請求項1】
医用画像の分類を行う医用画像観察支援装置であって、
学習済みのネットワークを有する分類部を有し、
前記医用画像は、膀胱鏡によって得られる内視鏡画像であり、
前記分類部は、入力された内視鏡画像について、ハンナ型間質性膀胱炎、膀胱痛症候群、膀胱癌の3分類を行うこと、
を特徴とする医用画像観察支援装置。
【請求項2】
前記3分類の結果に基づいて、ハンナ型間質性膀胱炎とそれ以外の2分類を行うこと、
を特徴とする請求項1の医用画像観察支援装置。
【請求項3】
前記ネットワークを学習させるための学習部と、
前記学習部による学習用データを記憶する記憶部と、
前記記憶部に記憶された学習用データに基づいて、追加学習用データを生成する追加データ生成部と、を有し、
前記学習部は、予め記憶部に記憶されている学習用データに加え、前記追加学習用データを用いて前記ネットワークを学習させること、
を特徴とする請求項1または2に記載の医用画像観察支援装置。
【請求項4】
前記分類部は、分類結果の尤度を出力すること、
を特徴とする請求項1乃至3のいずれか1に記載の医用画像観察支援装置。
【請求項5】
複数の前記分類部と、
前記複数の分類部の出力に基づいて分類結果を決定する判定統合部を有し、
前記複数の分類部は、対応する複数の前記ネットワークを有すること、
を特徴とする請求項1乃至4のいずれか1に記載の医用画像観察支援装置。
【請求項6】
内視鏡装置と請求項1乃至5のいずれか1に記載の医用画像観察支援装置とを含む医用画像観察支援システムであって、
前記内視鏡装置に設けられたレリーズスイッチが操作された場合に、前記内視鏡装置から前記医用画像観察支援装置に画像が入力されること、
を特徴とする医用画像観察支援システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習により医用画像を解析する医用画像解析装置に関し、特に、膀胱内視鏡によって得られる画像を解析する装置に関する。
【背景技術】
【0002】
医療分野において、医用画像を用いた診断支援(CAD;computer aided diagnosis)が広く用いられている。様々な撮像装置によって撮影された医用画像がコンピュータを用いて解析され、その解析結果が観察支援に活用される。
【先行技術文献】
【特許文献】
【0003】
【非特許文献】
【0004】
【非特許文献1】Goodfellow, I.J., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., Bengio, Y., “Generative Adversarial Nets,”Advances in Neural Information Processing Systems 27 (NIPS) (2014)
【0005】
たとえば特許文献1に示すものがそれである。特許文献1においては、内視鏡などから撮像された粘膜上皮の血管を含んで撮像された画像に対し、全撮像画像全体の濃淡についてテクスチャ解析、および、血管特徴量の算出を行い、それらを用いて、非腫瘍、腺腫、癌、SSA/Pのうちのいずれかを診断結果として出力する画像処理装置が開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0006】
一方、医用画像を用いた診断においては、画像から特定の疾患の有無を判断することが極めて難しい検査がある。ハンナ型間質性膀胱炎(Hunner type interstitial cystitis;HIC)の診断もその一つである。具体的には、膀胱内視鏡(膀胱鏡)によって撮影される画像を用いて、被験者がハンナ型間質性膀胱炎であるか否かの診断が行われるが、膀胱鏡検査において、ハンナ型間質性膀胱炎を正しく診断できる医師は少ない。また、ハンナ型間質性膀胱炎の有無を画像から判断する機械装置も従来においては存在しない。
【0007】
本発明は、かかる観点からなされたものであり、膀胱鏡により撮影された画像から、機械学習の方法を用いて、(1)膀胱鏡画像が類似するハンナ型間質性膀胱炎(指定難病であり、QOLを大きく損ねる良性疾患)と膀胱上皮内癌(悪性腫瘍)とを鑑別(良悪性疾患を鑑別)でき、さらに、(2)臨床症状が類似するハンナ型間質性膀胱炎と膀胱痛症候群(膀胱内に明らかな異常所見なし)とを鑑別できる、すなわち、(3)ハンナ型間質性膀胱炎、膀胱痛症候群、および、膀胱癌の3群の疾患を鑑別できる、医用画像観察支援装置を提供することにある。
【課題を解決するための手段】
【0008】
本願第1の発明の要旨とするところは、(a)医用画像の分類を行う医用画像観察支援装置であって、(b)学習済みのネットワークを有する分類部を有し、(c)前記医用画像は、膀胱鏡によって得られる内視鏡画像であり、(d)前記分類部は、入力された内視鏡画像について、ハンナ型間質性膀胱炎、膀胱痛症候群、膀胱癌の3分類を行うこと、を特徴とする。
【発明の効果】
【0009】
第1の発明にかかる医用画像観察支援装置によれば、膀胱鏡によって得られる画像について、学習済みのネットワークを有する分類部により、ハンナ型間質性膀胱炎、膀胱痛症候群、膀胱癌の3分類が行われる。
【0010】
好適には、本願第2の発明にかかる医用画像観察支援装置の特徴とするところは、第1の発明にかかる医用画像観察支援装置であって、(e)前記3分類の結果に基づいて、ハンナ型間質性膀胱炎とそれ以外の2分類を行うこと、にある。このようにすれば、前記分類部が直接ハンナ型間質性膀胱炎とそれ以外の2分類を行う場合に比べて、好適な分類結果を得られる。
【0011】
また好適には、本願第3の発明にかかる医用画像観察支援装置の特徴とするところは、第1または第2の発明にかかる医用画像観察支援装置であって、(f)前記ネットワークを学習させるための学習部と、(g)前記学習部による学習用データを記憶する記憶部と、(h)前記記憶部に記憶された学習用データに基づいて、追加学習用データを生成する追加データ生成部と、を有し、(i)前記学習部は、予め記憶部に記憶されている学習用データに加え、前記追加学習用データを用いて前記ネットワークを学習させること、を特徴とする。このようにすれば、追加学習用データが記憶部に記憶された学習用データに基づいて追加データ生成部によって生成され、前記ネットワークは、学習用データに加えて追加学習用データを用いて学習部によって学習させられるので、学習用データのみが与えられた場合であっても、より多くの学習を行うことができる。
【0012】
また好適には、本願第4の発明にかかる医用画像観察支援装置の特徴とするところは、第1乃至第3のいずれか1にかかる医用画像観察支援装置であって、(j)前記分類部は、分類結果の尤度を出力すること、を特徴とする。このようにすれば、分類結果に加えてその尤度についての情報が得られることから、尤度を考慮して分類結果の参照が可能となる。
【0013】
また好適には、第5の発明にかかる医用画像観察支援装置の特徴とするところは、第1乃至第4のいずれか1にかかる医用画像観察支援装置であって、(k)複数の前記分類部と、(l)前記複数の分類部の出力に基づいて分類結果を決定する判定統合部を有し、(m)前記複数の分類部は、対応する複数の前記ネットワークを有すること、を特徴とする。このようにすれば、複数の学習されたネットワークをそれぞれ有する複数の分類部の出力に基づいて分類結果を決定することができ、学習によって生じる統計的な認識誤りを抑えることができる。
【0014】
また好適には、本願第6の発明にかかる医用画像観察支援システムの特徴とするところは、内視鏡装置と、第1乃至第5のいずれか1にかかる医用画像観察支援装置と、を含む医用画像観察支援システムであって、前記内視鏡装置に設けられたレリーズスイッチが操作された場合に、前記内視鏡装置から前記医用画像観察支援装置に画像が入力されること、を特徴とする。このようにすれば、内視鏡装置による撮像から、医用画像観察支援装置による画像の分類までを一連の操作として簡便に行うことができる。
【図面の簡単な説明】
【0015】
【
図1】本実施例の医用画像観察支援装置の構成を例示する図である。
【
図2】支援装置に備えられた制御機能の要部を説明する機能ブロック線図である。
【
図4】
図3のネットワークにおける拡張畳み込み(dilated convolution)を説明する図である。
【
図5】出力部による3分類の出力結果をまとめた表である。
【
図6】実際の入力画像のうち、正解がハンナ型間質性膀胱炎であり、本発明の支援装置がハンナ型間質性膀胱炎と判断した画像を示したものである。
【
図7】実際の入力画像のうち、正解がハンナ型間質性膀胱炎であり、本発明の支援装置が膀胱痛症候群と判断した画像を示したものである。
【
図8】実際の入力画像のうち、正解がハンナ型間質性膀胱炎であり、本発明の支援装置が膀胱癌と判断した画像を示したものである。
【
図9】実際の入力画像のうち、正解が膀胱痛症候群であり、本発明の支援装置が膀胱痛症候群と判断した画像をに示したものである。
【
図10】実際の入力画像のうち、正解が膀胱痛症候群であり、本発明の支援装置がハンナ型間質性膀胱炎と判断した画像を示したものである。
【
図11】実際の入力画像のうち、正解が膀胱痛症候群であり、本発明の支援装置が膀胱癌と判断した画像を示したものである。
【
図12】実際の入力画像のうち、正解が膀胱癌であり、本発明の支援装置が膀胱癌と判断した画像を示したものである。
【
図13】実際の入力画像のうち、正解が膀胱癌であり、本発明の支援装置がハンナ型間質性膀胱炎と判断した画像を示したものである。
【
図14】実際の入力画像のうち、正解が膀胱癌であり、本発明の支援装置が膀胱痛症候群と判断した画像を示したものである。
【
図15】出力部による2分類の出力結果をまとめた表である。
【
図16】本実施例の支援装置10の受信者動作特性(ROC)曲線およびAUCを示した図である。
【
図17】本発明の別の実施例である医用画像観察支援システムの概略を説明する図である。
【
図18】本発明の別の実施例における支援装置に備えられた制御機能の要部を説明する機能ブロック図である。
【発明を実施するための形態】
【0016】
以下、本発明の一実施例を図面により詳細に説明する。
【実施例0017】
図1は、本発明の一実施例である医用画像観察支援装置10(以下、単に支援装置10という。)の構成を例示する図である。この
図1に示すように、本実施例の支援装置10は、中央演算処理装置であるCPU12および画像処理に特化した処理装置であるGPU(Graphics Processing Unit)13と、読出専用メモリであるROM14と、随時書込読出メモリであるRAM16と、記憶装置18と、を備えて構成されている。前記CPU12およびGPU13は、前記RAM16の一時記憶機能を利用しつつ前記ROM14に予め記憶された所定の医用画像解析プログラムに基づいて電子情報を処理・制御する所謂マイクロコンピュータである。前記医用画像解析プログラムは、たとえばCD-ROM等の媒体や後述するネットワークインタフェース30を解して供給される。
【0018】
前記記憶装置18は、好適には、情報を記憶可能なハードディスクドライブやSSD(Solid State Drive)等の公知の記憶装置(記憶媒体)である。小型メモリカードや光ディスク等の着脱式記憶媒体であってもよい。出力インタフェース26は必要に応じて表示装置などを接続するためのものであり、入力インタフェース28は、キーボードやマウス等の公知の入力デバイスを接続したり、あるいは所定の画像信号を取り込むためケーブルを接続するためのものである。入力インタフェース28に画像信号が入力される場合には、必要に応じてコンバータやエンコーダなどが併せて設けられてもよい。また、ネットワークインタフェース30は、支援装置10をネットワークに接続するためのものであって、支援装置10はネットワークを解して他のコンピュータなどと情報通信が可能とさせられる。ネットワークケーブルや無線ネットワークのためのアンテナなどが接続される。なお、これらの出力インタフェース26、入力インタフェース28、ネットワークインタフェース30は必要に応じて設けられればよく、必ずしも必須のものではない。
【0019】
図2は、前記支援装置10に備えられた制御機能の要部を説明する機能ブロック線図である。この
図2に示すように、支援装置10は、画像読込部32、画像処理部34、出力部38、学習部40を機能的に備えて構成されている。
【0020】
画像読込部32は、支援装置10により解析する画像を後述する画像処理部34に入力する。具体的には、支援装置10により解析しようとする画像は、予め前記記憶装置18に格納されており、たとえば操作者に入力操作に応じて、解析しようとする画像を記憶装置18から読み込み、画像処理部34に渡す処理を行う。本実施例においては、膀胱内視鏡(膀胱鏡)によって予め撮影された、膀胱内部の画像が入力される。
【0021】
画像処理部34は、画像読込部32から入力された画像に基づき、画像中における注目領域の特定と、注目領域のクラス分類を行う。画像処理部34は、その内部に学習済みネットワーク36を有しており、前記学習済みネットワーク36は入力された画像を処理して出力画像を生成する。
【0022】
学習済みネットワーク36(以下、ネットワーク36という。)は、畳み込みニューラルネットワーク(CNN;Convolutional Neural Network)の構成を有している。学習済みネットワーク36により、いわゆるDeepLearningによる入力画像の特徴量の算出を行う。
【0023】
出力部38は、画像処理部34から出力された出力結果を、所定のフォーマットに変換するなどして、ファイルや他のプログラムに出力したり、前記出力インタフェース26を解して接続されたディスプレイ装置などの装置に出力したり、ネットワークインタフェース30を介して他のコンピュータなどに送信したりする。
【0024】
図3は、ネットワーク36の一例を示す図である。ネットワーク36は、上述のとおりCNN型の構造を有するネットワークである。
図3における長方形状の層50a乃至50sは、特徴マップもしくは画像を示している。以下の説明において個々の層を区別しない場合には層50という。
図3において横方向に連なる3乃至5個の層50によりブロックが構成されている。すなわち、層50a乃至層50cによりブロック51aが、層50d乃至層50gによりブロック51bが、層50h乃至層50kによりブロック51cが、層50l乃至層50oによりブロック51dが、層50p乃至層50tによりブロック51eが、それぞれ構成されている。なお、各ブロック51の一番左にある層50の下部に記載された数字は、各ブロックにおける層50のカーネル数を示している。
【0025】
また、ブロック間を接続する太線のうち、太実線52は3×3畳み込み(convolution)を示している。ここで3×3はカーネルの大きさを示している。太二重線54は拡張畳み込み(dilated convolution)を示している。太三重線58は全体平均プーリング(Global Average Pooling)を示している。この全体平均プーリング58は、直前の層50sにおける特徴マップを構成する全てのピクセル値の平均を、個々の特徴マップごとに算出して出力する。なお、各ブロック51の左端の層50a、50d、50h、50l、50pのうち、複数の入力があるものについては、それらの入力を統合したものとなる。
【0026】
図3に示すように、本実施例のネットワーク36におけるブロック51aにおいては2回の畳み込み(convolution)が、ブロック51bにおいては3回の畳み込みが、ブロック51cおよび51dにおいては2回の畳み込みと1回の拡張畳み込みが行われるものとなっている。また、ブロック51eにおいては、3回の畳み込みと1回の全階平均プーリングが行われる。
【0027】
また、ネットワーク36における各ブロック51においては、残差パス(Residual Path)56が設けられており、また、各ブロック51間では、dense pooling(64~70)が行われるものとされており、連続するブロック51以外のブロック51との間でも入出力が行われるものとされている。
【0028】
このうち、残差パス56は、ある層50の前の層50の内容を、前記ある層50の出力と合わせて次の層50に渡すものである。具体的にはたとえば、ブロック51aにおいて、層50bに着目すると、層50bへは、層50aの内容が畳み込み52されて入力されている。一方、層50bからは、層50bの内容が畳み込み52されて層50cに出力される。ここで、ブロック51aに設けられている残差パス56は,層50bの前の層である層50aの内容を、層50bの出力と合わせたものが、層50cとするものである。このように残差パス56を設けることにより、各層における勾配の損失が防止される。
【0029】
続いて、dense pooling について説明する。dense poolingは、畳み込みによって得た特徴(特徴マップ)から重要な要素を残しつつデータ量を削減する手法であるプーリング(pooling)の一つである。ネットワーク36のブロック51a乃至51c、畳み込み52やdilated convolutionが行われた特徴マップもしくは画像は、dense poolingにより、それ以降の畳み込みに用いられる。
【0030】
また、本実施例におけるdense poolingは、mixed poolingを用いるものである。具体的には、2回の畳み込みの出力となる特徴マップは、細実線64で示すようにカーネルサイズが2×2のプーリング(以下、2×2プーリングという。他も同様。)がなされて、次の(すなわち、1段目の出力においては2段目の、2段目の出力においては3段目の、3段目の出力においては4段目の、4段目の出力においては5段目の)2回の畳み込みの入力とされる。また、細点線66で示すように4×4プーリングがなされてその次の(すなわち1段目の出力においては3段目の、2段目の出力においては4段目の、3段目の出力においては5段目の)2回の畳み込みの入力とされる。また、細破線68で示すように8×8プーリングがなされてさらにその次の(すなわち1段目の出力においては4段目の、2段目の出力においては5段目の)2回の畳み込みの入力とされる。さらに、細一点鎖線70で示すように16×16プーリングがなされてその次の(すなわち1段目の出力においては5段目の)2回の畳み込みの入力とされる。これにより、2回の畳み込みの出力を、最大値プーリングした後に次の2回の畳み込みの入力とする場合と異なって、失われる可能性のある情報を得つつ畳み込みを繰り返すことができる。
【0031】
図4は、
図3において太二重線54で表された拡張畳み込み(dilated convolution)を説明する図である。この拡張畳み込みは、
図3のネットワーク36におけるブロック51cおよび51dの2回の畳み込み52に続いて行われる。拡張畳み込みは、特徴マップにおいて広がって存在する特徴を考慮した畳み込み処理を可能にする。
【0032】
図4において、細実線72、細点線74、細破線76、細一点鎖線78は、いずれも3×3畳み込みを示すものであるが、それぞれ、拡張率(dilation rate;DR)がそれぞれ異なるものとされており、細実線72はDR=1、細点線74はDR=2、細破線76はDR=4、細一点鎖線78はDR=8にそれぞれ対応している。拡張率DRは、畳み込みにおけるカーネルの隙間を示すものであり、DR=1はカーネルをそのまま用いる場合を意味している。また、DR=nは、元のカーネルの各要素間に(n-1)個の隙間を設けたカーネルを用いることを意味している。言い換えれば、本実施例の拡張畳み込み54においては、複数の異なる拡張率の拡張畳み込みを併せて実行するものである。拡張畳み込みによれば、poolingを用いることなく、サイズの大きい特徴マップの畳み込みができ、poolingと異なり、出力される特徴マップのサイズが小さくならない特徴がある。
【0033】
すなわち、拡張畳み込み54は、
図4に示すとおり、入力から1×1畳み込み58aが行われた出力、DR=1の3×3畳み込み72およびその出力に対する1×1畳み込み58bが行われた出力、DR=2の3×3畳み込み74およびその出力に対する1×1畳み込み58cが行われた出力、DR=4の3×3畳み込み76およびその出力に対する1×1畳み込み58dが行われた出力、および、DR=8の3×3畳み込み78およびその出力に対する1×1畳み込み58eが行われた出力、が統合されて出力される。
【0034】
また、
図2に戻って、学習部40は、ネットワーク36の学習を行う。具体的には、学習用の画像と、それに対応する正解(ground truth)とを用いて、いわゆる教師あり学習を行う。この学習部40は、予め支援装置10の使用前にネットワーク36の学習を行うものであってもよいし、使用過程においてさらに学習を行うものであってもよい。
【0035】
学習部40は、(1)予め撮影され、記憶部18に記憶された内視鏡画像を、一定の割合で、学習用の画像と、学習後のネットワークを評価するための評価用の画像とに分ける。そして、(2)学習用の画像とされた画像を用いてネットワーク36の学習を実行し、(3)学習後のネットワーク36を用いて、評価用の画像に対し、分類を実行する。この(1)から(3)までの一連の作業を所定の回数だけ繰り返すことで、ネットワーク36の学習を完了する。このようにすれば、作業の繰り返しに伴って学習用の画像が入れ代わるので、ネットワーク36の学習が好適に実行される。また、多数の評価を行うことができるため、評価結果が学習用画像の選択のしかたに影響を受けにくくなる。さらに、前記一連の作業は個々に独立されたものであるため、いわゆる学習データと評価データに同一のデータが混じるデータコンタミネーション(data contamination)の発生が生じない。
【0036】
また、追加データ生成部42は、予め記憶部18に記憶された内視鏡画像のうち、前述のとおり学習部40により学習用の画像として用いられる画像について、所定の処理を行うことにより、追加データを作成する、いわゆるData augmentation処理を実行する。これにより作成された追加データは、前述の学習用の画像とともに学習部40におけるネットワーク36の学習に用いられる。本実施例においては、追加データ生成部42による追加データの生成は、予め設定された数の追加データが生成される。
【0037】
ここで、前記追加データ生成部42が行う所定の処理は、たとえば、以下の処理を含む。(1)記憶部18に記憶された内視鏡画像(以下、「元画像」という。)を、±30度以内の角度で回転させる。(2)元画像を、上下左右方向の少なくとも一方に±22画素以内(言い換えれば画像幅の10%以内)で平行移動させる。(3)0.8~1.2倍の範囲内で元画像を拡大もしくは縮小させる。(4)元画像を、縦又は横方向に反転させる。(5)HSV色空間において、色相、彩度、明度の少なくとも1つを変化させる。追加データ生成部42は、上記(1)~(5)の処理のうちの少なくとも1つを元画像に実行することで、新たな画像を生成させる。このとき、いずれの処理が適用されるかはランダムに決定される。なお、上記(1)~(5)の処理を行った結果、元画像の画像外に相当する画素が新たな画像内に生じる場合には、当該画素は黒塗りとされる。
【0038】
あるいは、上述の非特許文献1に示される、生成型学習モデルであるGAN (Generative Adversarial Model)を用いて、膀胱内視鏡画像を学習させ、学習用画像を生成してもよい。
【0039】
ところで、学習部40によるネットワーク36の学習においては、1回の学習におけるデータ件数であるミニバッチサイズ、および、全データについての学習処理の繰替指数である学習エポック数が適宜定められる。前述の追加データ生成部42による追加データの作成は、各エポックごとに実行されるものとされている。
【0040】
(実験例)
本実施例の有効性を検証するために以下の実験を行った。
本実験例においては、支援装置10は、膀胱内視鏡画像から、その画像に対応する症例が、ハンナ型間質性膀胱炎、膀胱痛症候群、または、膀胱癌の3分類を行い、その3分類の結果に基づいて、ハンナ型間質性膀胱炎とそれ以外との2分類を行うものである。
【0041】
まず、記憶装置18には、患者から得られた膀胱鏡画像が681人分記憶されている。膀胱鏡画像は、前記膀胱内視鏡によって撮影されるもので、1枚の画像が224×224ピクセルの大きさとされている。これらの画像については、予め専門医により分類についての情報、すなわち、ハンナ型間質性膀胱炎、膀胱痛症候群、膀胱癌のいずれであるかについての情報が関連づけられて保存されている。
【0042】
実験に先立ち、ネットワーク36の学習が行われる。この学習は、予め記憶装置18に記憶された上述の681人分の膀胱鏡画像と、追加データ生成部42により作成される追加データとに基づいて、学習部40によって実行される。
【0043】
まず、学習部40は、予め記憶装置18に記憶された681人分の膀胱鏡画像を、所定の割合、本実験例においては、80:20の割合で、学習用の画像と評価用の画像とに分ける。
【0044】
続いて、追加データ生成部42は、分けられた学習用の画像から、追加データを生成する。具体的には上述の通り、(1)前記学習用の画像(元画像)を、±30度以内の角度で回転させる。(2)元画像を、上下左右方向の少なくとも一方に±22画素以内(言い換えれば画像幅の10%以内)で平行移動させる。(3)0.8~1.2倍の範囲内で元画像を拡大もしくは縮小させる。(4)元画像を、縦又は横方向に反転させる。(5)HSV色空間において、色相、彩度、明度の少なくとも1つを変化させる。追加データ生成部42は、上記(1)~(5)の処理のうちの少なくとも1つを元画像に実行することで、新たな画像を生成させる。このとき、生成された追加データの正解データは、元データのものが用いられる。また、追加データ生成部42による追加データの生成は、本実験例においては、前記学習用の画像と、追加データ生成部42によって生成された追加データとの合計が、前記学習用の画像の50倍となるように行われる。
【0045】
学習部40は、学習用の画像および追加データを用いて、ネットワーク36の学習を行う。なお、
図3に示すネットワーク36に、学習用の画像および追加データ(以下、「入力画像」という。)を入力する。このとき、入力される画像は、画像における各色要素ごとに、すなわち、R要素、G要素、B要素のそれぞれの3つの画像とされ、それらの各色要素ごとの濃度値としてネットワーク36に入力される。
【0046】
また、本実験例においては、学習部40によるネットワーク36の学習は、1回の学習におけるデータ件数であるミニバッチサイズを15、全データについての学習処理の繰替指数である学習エポック数を200とした。これらの値は、実験的に重みパラメータが収束したとみなせる値とされればよく、適宜変更可能である。また、学習を行う際の重みパラメータの変更幅である学習率は初期値を0.005とし、100エポック以降は徐々に現象させるものとした。これは、初期値は比較的大きい値として、重みが極小解とならないようにする一方、学習を重ねた場合においては、発散を避けるため値を小さくしたものである。
【0047】
このように学習されたネットワーク36に対して、本実施例の支援装置10により分類を行おうとする画像が入力される。前述の通り、本実験例においては、入力画像は224×224ピクセルの大きさとされており、R、G、Bの各色要素ごとの画像として入力される。最初の層50aに入力された入力画像は、順次ネットワーク36における各層50を経て前述の処理が行われる。ネットワーク36の最後に位置する層50tに至る際に、前述の通り全体平均プーリング58が実行される。このとき、ブロック51eの層50sにおける各画像のそれぞれを数値化した上で、入力画像を、ハンナ型間質性膀胱炎、膀胱痛症候群、または、膀胱癌の3分類についての評価を行う。なお、入力される画像の一辺が224ピクセルに満たない場合には、その部分を黒塗りとしてもよいし、あるいは224ピクセルになるように拡大されてもよい。また、一辺が224ピクセルよりも大きい場合には、224ピクセルとなるようにトリミングがなされてもよいし、224ピクセルになるように縮小されてもよい。
【0048】
このとき、ネットワーク36は、入力された画像に対して、前記3分類のそれぞれについての尤度を出力するようにされている。すなわち、3分類を構成するハンナ型間質性膀胱炎、膀胱痛症候群、膀胱癌、のそれぞれについて、そうであると考えられる尤度を出力する。
【0049】
出力部38は、上記ネットワーク36の出力に基づき、入力画像が前記3分類のいずれであるかを出力する。具体的にはたとえば、出力された前記3分類のそれぞれの尤度のうち、最も尤度が高いものとされた分類に該当すると出力する。
【0050】
図5は、学習済みのネットワーク36に、記憶装置18に記憶された膀胱鏡画像681枚のうち646枚を入力した際の、この出力部38による出力結果をまとめた表である。
図5においては、出力部38が分類した前記3分類のそれぞれについて、正解との関係を示している。これによれば、正解がハンナ型間質性膀胱炎である画像についての正解率は82.9%、膀胱痛症候群である画像についての正解率は93.1%、膀胱癌である画像についての正解率は86.5%であった。
【0051】
また、
図6~
図14は、実際の入力画像を、分類結果ごとに示したものである。このうち、
図6~
図8は、正解がハンナ型間質性膀胱炎である画像に示したものであり、このうち
図6は本実施例の支援装置10もハンナ型間質性膀胱炎であると分類した画像である。
図7は本実施例の支援装置10が膀胱痛症候群であると分類した画像である。また、
図8は本実施例の支援装置10が膀胱癌であると分類した画像である。なお、
図6~8、および、後述する
図9~11、
図12~14においては、判定の根拠となった尤度を画像と合わせて示している。出力部38は、画像と、判定結果と、その判定結果についての尤度を合わせて示すことができる。
【0052】
図9~11は、正解が膀胱痛症候群である画像に示したものであり、このうち
図9は本実施例の支援装置10も膀胱痛症候群であると分類した画像である。
図10は本実施例の支援装置10がハンナ型間質性膀胱炎であると分類した画像である。また、
図11は本実施例の支援装置10が膀胱癌であると分類した画像である。
【0053】
図12~14は、正解が膀胱癌である画像に示したものであり、このうち
図12は本実施例の支援装置10も膀胱癌であると分類した画像である。
図13は本実施例の支援装置10がハンナ型間質性膀胱炎であると分類した画像である。また、
図14は本実施例の支援装置10が膀胱痛症候群であると分類した画像である。
【0054】
さらに出力部38は、本実験例においては、前記3分類、すなわち、ハンナ型間質性膀胱炎、膀胱痛症候群、膀胱癌について行われた出力のうち、膀胱痛症候群、膀胱癌であるとされたものを、ハンナ型間質性膀胱炎でないものと分類することができる。言い換えれば、出力部は、前記3分類の結果に基づいて、ハンナ型間質性膀胱炎である、あるいは、ハンナ型間質性膀胱炎でない、の2分類を出力することができる。
【0055】
図15は、出力部38による2分類の出力結果をまとめた表である。
図15においては、出力部38が分類した前記2分類のそれぞれについて、正解との関係を示している。これによれば、支援装置10の感度は、正解がハンナ型間質性膀胱炎である総画像数に対する、ハンナ型間質性膀胱炎であると判断した画像数の割合、すなわち165/(165+34)であり、82.9%である。また、特異度は、正解がハンナ型間質性膀胱炎でない総画像数に対する、ハンナ型間質性膀胱炎でないと判断した画像数、すなわち416/(416+31)であり、93.1%となる。これによれば、2分類の正解率は89.9%となり、3分類を行った場合に比べて分類の精度が向上する。
【0056】
このように、3分類による判断においても、2分類による判断においても、膀胱鏡画像がハンナ型間質性膀胱炎のものであることについて良好な判断が行われていることがわかる。
【0057】
図16は、本実施例の支援装置10の受信者動作特性(ROC;receiver operating characteristic)曲線を示している。このうち、実線がハンナ型間質性膀胱炎(truth)に対して、それ以外、すなわち膀胱痛症候群あるいは膀胱癌(false)である場合、破線が膀胱痛症候群(truth)に対して、それ以外、すなわち、膀胱癌あるいはハンナ型間質性膀胱炎(false)である場合、一点鎖線は、膀胱癌(truth)に対して、それ以外、すなわち、ハンナ型間質性膀胱炎あるいは膀胱痛症候群(false)である場合を示している。
図16に示すように、いずれのROC曲線も、本実施例の支援装置10による分類が良好であることを示している。また、AUC(各ROC曲線より下側の面積の割合)は、それぞれ実線の場合について0.96、破線について0.98、一点鎖線について0.97であり、いずれについても本実施例の支援装置10の分類器(分類アルゴリズム)の性能が良好であることがわかる。
【0058】
本実施例の支援装置10によれば、学習済みのネットワーク36を有する画像処理部34(分類部)を有し、画像処理部34は、画像読み込み部32によって読み込まれた、膀胱鏡によって得られる内視鏡画像について、ハンナ型間質性膀胱炎、膀胱痛症候群、膀胱癌の3分類を行うことができる。
【0059】
また、本実施例の支援装置10によれば、出力部38は、前記3分類の結果に基づいて、ハンナ型間質性膀胱炎とそれ以外の2分類を行うものであるので、直接ハンナ型間質性膀胱炎とそれ以外の2分類を行う場合に比べて、好適な分類結果を得られる。
【0060】
また、本実施例の支援装置10によれば、ネットワークを学習させるための学習部40と、学習部40による学習用データを記憶する記憶部18と、前記記憶部18に記憶された学習用データに基づいて、追加学習用データを生成する追加データ生成部42と、を有し、前記学習部40は、予め記憶部18に記憶されている学習用データに加え、前記追加学習用データを用いて前記ネットワーク36を学習させるものであるので、学習用データのみが与えられた場合であっても、より多くの学習を行うことができる。
【0061】
また、本実施例の支援装置10によれば、画像処理部34は、分類結果の尤度を出力するものであるので、尤度を考慮して分類結果の参照が可能となる。
【0062】
つぎに、本発明の他の実施例を説明する。なお、以下の説明において、前述の実施例と共通する部分には同一の符号を附して説明を省略する。
本実施例の支援システム100においては、実施例1の支援装置10に加えて、内視鏡装置102を有するものとされている。そして、前述の実施例1においては、画像読込部32には予め記憶部18に記憶されていた入力画像が入力されていたが、本実施例においては、内視鏡装置102から直接入力される点において異なる。具体的には、内視鏡装置102、すなわち膀胱鏡102にはレリーズスイッチ104が設けられており、施術者が膀胱鏡102において患者の患部を捉えた状態でレリーズスイッチ104を押下することにより、その時点の膀胱鏡画像が画像読込部32に入力されるものとなっている。
膀胱鏡102より画像読込部32に入力画像が入力されると、画像読込部32は前述の実施例1と同様にして画像処理部34にその画像を読み込ませ、画像処理部34は学習済みネットワーク36を用いて、入力された入力画像の3分類を行う。また、出力部38はハンナ型間質性膀胱炎、膀胱痛症候群、または、膀胱癌についての3分類の結果を出力するほか、必要に応じて画像処理部34によって算出された尤度を出力したり、前記3分類の結果に基づいて、ハンナ型間質性膀胱炎であるか、否かの2分類の分類を出力する。
本実施例の支援システム100によれば、内視鏡装置102と、支援装置10と、を含み、内視鏡装置102に設けられたレリーズスイッチ104が操作された場合に、内視鏡装置102から支援装置10に画像が入力されるので、内視鏡装置102による撮像から、支援装置10による画像の分類までを一連の操作として簡便に行うことができる。