IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人東京農工大学の特許一覧 ▶ 日本メジフィジックス株式会社の特許一覧

特許7352261学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置
<>
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図1
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図2A
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図2B
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図2C
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図3
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図4
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図5
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図6
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図7
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図8
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図9
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図10
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図11
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図12
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図13
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図14
  • 特許-学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-20
(45)【発行日】2023-09-28
(54)【発明の名称】学習装置、学習方法、プログラム、学習済みモデルおよび骨転移検出装置
(51)【国際特許分類】
   G01T 1/164 20060101AFI20230921BHJP
   G06T 7/00 20170101ALI20230921BHJP
【FI】
G01T1/164 L
G01T1/164 N
G06T7/00 614
G06T7/00 350C
【請求項の数】 17
(21)【出願番号】P 2020519910
(86)(22)【出願日】2019-05-16
(86)【国際出願番号】 JP2019019478
(87)【国際公開番号】W WO2019221222
(87)【国際公開日】2019-11-21
【審査請求日】2022-04-14
(31)【優先権主張番号】P 2018096186
(32)【優先日】2018-05-18
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】504132881
【氏名又は名称】国立大学法人東京農工大学
(73)【特許権者】
【識別番号】000230250
【氏名又は名称】日本メジフィジックス株式会社
(74)【代理人】
【識別番号】100113549
【弁理士】
【氏名又は名称】鈴木 守
(74)【代理人】
【識別番号】100115808
【弁理士】
【氏名又は名称】加藤 真司
(72)【発明者】
【氏名】清水 昭伸
(72)【発明者】
【氏名】斎藤 篤
(72)【発明者】
【氏名】若林 駿土
(72)【発明者】
【氏名】西川 和宏
【審査官】遠藤 直恵
(56)【参考文献】
【文献】特開2016-142664(JP,A)
【文献】国際公開第2007/029467(WO,A1)
【文献】特許第6294529(JP,B2)
【文献】国際公開第2018/008593(WO,A1)
【文献】河上 一公,人工知能を用いた核医学画像の解析,医用画像情報学会雑誌,2017年06月,100-102,https://www.jstage.jst.go.jp/article/mii/34/2/34_100/_article/-char/ja/
【文献】木田 智士,Deep learning で画像認識9~Kerasで畳み込みニューラルネットワーク vol.5~,IMCEL ACADEMY,2017年08月03日,https://lp-tech.net/articles/5MIeh
(58)【調査した分野】(Int.Cl.,DB名)
G01T 1/161-1/166
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
被験者のシンチグラムから骨転移領域を検出するためのニューラルネットワークのモデルを生成する学習装置であって、
複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとして入力する入力部と、
前記教師データを用いて骨シンチグラムの骨転移領域の検出に用いるニューラルネットワークのモデルの学習を行う学習部と、
を備え、
前記ニューラルネットワークは、第1のネットワーク部分と、第2のネットワーク部分 とを結合した構造を有し、
前記入力部は、各被験者について、前後から撮影したシンチグラム及びその正解ラベル を入力し、
前記学習部は、前記第1のネットワーク部分の入力層に被験者を前方から撮影したシン チグラムを入力すると共に、前記第2のネットワーク部分の入力層に前記被験者を後方か ら撮影したシンチグラムを入力して学習を行う、学習装置。
【請求項8】
前記第1のネットワーク部分および前記第2のネットワーク部分がEncoder-D ecoder構造を有する、請求項1ないし6のいずれか一項に記載の学習装置。
【請求項9】
前記第1のネットワーク部分および前記第2のネットワーク部分がEncoder-D ecoder構造を有し、
前記学習部は、前記第1のネットワーク部分の入力層に被験者を前方から撮影したシンチグラムから切り出した第1のパッチ画像を入力すると共に、前記第2のネットワーク部分の入力層に前記被験者を後方から撮影したシンチグラムから切り出した、前記第1のパッチ画像と対応する第2のパッチ画像を入力して学習を行う、
請求項2ないし6のいずれか一項に記載の学習装置。
【請求項11】
被験者のシンチグラムから骨転移領域を検出するためのニューラルネットワークのモデルを生成する学習方法であって、
複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとして入力するステップと、
前記教師データを用いて骨シンチグラムの骨転移領域の検出に用いるニューラルネットワークのモデルの学習を行うステップと、
を備え
前記ニューラルネットワークは、第1のネットワーク部分と、第2のネットワーク部分 とを結合した構造を有し、
前記入力するステップにおいて、各被験者について、前後から撮影したシンチグラム及 びその正解ラベルを入力し、
前記学習を行うステップにおいて、第1のネットワーク部分の入力層に被験者を前方か ら撮影したシンチグラムを入力すると共に、第2のネットワーク部分の入力層に前記被験 者を後方から撮影したシンチグラムを入力して学習を行う、学習方法。
【請求項12】
被験者のシンチグラムから骨転移領域を検出するためのニューラルネットワークのモデルを生成するためのプログラムであって、
複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとして入力するステップと、
前記教師データを用いて骨シンチグラムの骨転移領域の検出に用いるニューラルネットワークのモデルの学習を行うステップと、
を実行させ、
前記ニューラルネットワークは、第1のネットワーク部分と、第2のネットワーク部分 とを結合した構造を有し、
前記入力するステップは、各被験者について、前後から撮影したシンチグラム及びその 正解ラベルを入力し、
前記学習を行うステップは、第1のネットワーク部分の入力層に被験者を前方から撮影 したシンチグラムを入力すると共に、第2のネットワーク部分の入力層に前記被験者を後 方から撮影したシンチグラムを入力して学習を行うステップと、
を実行させるプログラム。
【請求項13】
被験者のシンチグラムから骨転移領域を検出するよう、コンピュータを機能させるための学習済みモデルであって、畳み込み層と、逆畳み込み層とを有し、畳み込み層で得られた特徴マップを逆畳み込み層に入力する構造を含むニューラルネットワークで構成され、複数の被験者の前後から撮影したシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとし、前記畳み込み層に2枚のシンチグラムのう ちの一方を水平方向に反転させた上で2枚のシンチグラムを入力して学習されたものであり、前記ニューラルネットワークに入力された被験者のシンチグラムから骨転移領域を検出するよう、コンピュータを機能させる学習済みモデル。
【請求項17】
被験者のシンチグラムから骨転移領域を検出するためのニューラルネットワークのモデ ルを生成する学習装置であって、
複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の 正解ラベルを教師データとして入力する入力部と、
前記教師データを用いて骨シンチグラムの骨転移領域の検出に用いるニューラルネット ワークのモデルの学習を行う学習部と、
前記複数の被験者のシンチグラムから、被験者の骨が写っている領域を切り出してパッ チ画像を作成するパッチ画像作成部と、
前記パッチ画像作成部にて作成したパッチ画像において、骨転移領域又は非骨転移領域 を含むパッチ画像と骨転移領域及び非骨転移領域のいずれも含まないパッチ画像の構成比 を求める教師データ分析部と、
を備え、
前記学習部は、前記パッチ画像およびそれに対応する正解ラベルを教師データとして用 いて学習を行う学習装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被験者のシンチグラムから骨転移領域を検出する技術に関する。
【背景技術】
【0002】
骨シンチグラム上の骨転移検出の関連研究として河上一公らの研究が挙げられる(非特許文献1)。非特許文献1では、セグメンテーション(全身の骨格分類)を行った後、各骨格領域(8領域)において、平均や標準偏差などの情報を利用し高集積部位を検出する。また、非特許文献2では、CADシステム”BONENAVI version 2.1.7” (FUJIFILM RI Pharma Co., Ltd., Tokyo, Japan)を用いて、全身画像の骨シンチグラムを解析した225人の前立腺がん患者(骨転移症例:124例、正常例:101例)を人工ニューラルネットワーク(ANN : Artificial Neural Networks)で解析を行い、それらの解析結果が示されている。このBONENAVIシステムでは、ANNとBSI(Bone Scan Index)という2つのイメージングマーカーを出力する。ANN値は、骨転移の可能性を示し、ANNの範囲は0-1の連続した値であり、”0”は骨転移の可能性がないことを意味し、”1”は骨転移の疑いが高いことを意味する。BSIは、転移性腫瘍量(全身骨格に対する骨転移領域の構成比)を示す。検出結果は、Sensitivityは82%(102/124)、Specificityは83%(84/101)である。
【先行技術文献】
【非特許文献】
【0003】
【文献】河上 一公ら「骨シンチグラフィ診断支援ソフト「BONENAVI」の紹介」核医学分科会誌,63(0):41-51,2011
【文献】M. Koizumi, K. Motegi, M. Koyama, T. Terauchi, T. Yuasa, and J. Yonese, 「Diagnostic performance of a computer-assisted diagnosis system for bone scintigraphy of newly developed skeletal metastasis in prostate cancer patients: search for low-sensitivity subgroups」Annals of Nuclear Medicine, 31(7):521-528, 2017
【発明の概要】
【0004】
骨シンチグラム上の骨転移の検出支援システムは、主に、解剖構造の認識処理と、異常部位の強調(特徴抽出)や検出処理からなる。最終的に、これらの処理を一つにまとめて骨転移と疑われる部位を判定して、その結果を医師に提示する。
【0005】
上記した従来技術では、被験者のシンチグラム上に骨転移領域を表示するが、骨転移領域と類似した濃度値を持つ非骨転移領域(骨折、炎症等の非悪性病変領域)を骨転移領域と誤検出し(いわゆる「拾いすぎ」)、検出精度の低下が見られた。そこで、本発明は、骨転移領域の検出率を維持しつつ、拾いすぎを低減する技術を提供する。
【0006】
本発明の一態様は、被験者のシンチグラムから骨転移を検出するためのニューラルネットワークのモデルを生成する学習装置であって、複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとして入力する入力部と、前記教師データを用いて骨シンチグラムの骨転移領域の検出に用いるニューラルネットワークのモデルの学習を行う学習部とを備える。
【0007】
また、本発明の他の態様は、被験者のシンチグラムから骨転移領域を検出するためのニューラルネットワークのモデルを生成する学習方法であって、複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとして入力するステップと、教師データを用いて骨シンチグラムの骨転移領域の検出に用いるニューラルネットワークのモデルの学習を行うステップと、を備える学習方法である。
【0008】
また、本発明の他の態様は、被験者のシンチグラムから骨転移領域を検出するためのニューラルネットワークのモデルを生成するためのプログラムであって、複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとして入力するステップと、教師データを用いて骨シンチグラムの骨転移領域の検出に用いるニューラルネットワークのモデルの学習を行うステップと、を実行させるプログラムである。
【0009】
また、本発明の他の態様は、被験者のシンチグラムから骨転移領域を検出するよう、コンピュータを機能させるための学習済みモデルであって、畳み込み層と、逆畳み込み層とを有し、畳み込み層で得られた特徴マップを逆畳み込み層に入力する構造を含むニューラルネットワークで構成され、複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとして学習されたものであり、前記ニューラルネットワークに入力された被験者のシンチグラムから骨転移領域を検出するよう、コンピュータを機能させる学習済みモデルである。
【0010】
このように骨転移領域及び非骨転移領域の正解ラベルを用いてニューラルネットワークのモデルを学習することにより、このモデルを用いて、被験者のシンチグラムから骨転移領域を適切に検出することができる。
【図面の簡単な説明】
【0011】
図1図1は、第1の実施の形態の学習装置の構成を示す図である。
図2A図2Aは、被験者のシンチグラム及び正解ラベルを示す図である。
図2B図2Bは、パッチ画像の例を示す図である。
図2C図2Cは、パッチ画像の別の例を示す図である。
図3図3は、ニューラルネットワークモデルの構成を示す図である。
図4図4は、第1の実施の形態の骨転移検出装置の構成を示す図である。
図5図5は、シンチグラムから切り出したパッチ画像の例を示す図である。
図6図6は、第1の実施の形態の学習装置の動作を示す図である。
図7図7は、第1の実施の形態の骨転移検出装置の動作を示す図である。
図8図8は、第2の実施の形態の学習装置の構成を示す図である。
図9図9は、変形例に係る学習装置の構成を示す図である。
図10図10は、実験によって得られたSensitivityとFP(P)との関係を示すFROC曲線である。
図11図11は、第3の実施の形態の学習装置の構成を示す図である。
図12図12は、第3の実施の形態の学習装置に入力される被験者のシンチグラムを示す図である。
図13図13は、第3の実施の形態の学習装置で用いられるニューラルネットワークモデルの構成を示す図である。
図14図14は、第3の実施の形態の骨転移検出装置の構成を示す図である。
図15図15は、第3の実施の形態の学習装置の動作を示す図である。
【発明を実施するための形態】
【0012】
以下、本発明の実施の形態の学習装置および骨転移検出装置について、図面を参照しながら説明する。なお、下記の説明において、サイズ等の条件として記載されている数値は、あくまでも好ましい態様における例示であり、本発明を限定する意図ではない。
【0013】
実施の形態の学習装置は、被験者のシンチグラムから骨転移を検出するためのニューラルネットワークのモデルを生成する学習装置であって、複数の被験者のシンチグラムと各シンチグラムにおける骨転移領域及び非骨転移領域の正解ラベルを教師データとして入力する入力部と、教師データを用いて骨シンチグラムの骨転移領域の検出に用いるニューラルネットワークのモデルの学習を行う学習部とを備える。ここで、非骨転移領域は、骨転移領域と類似した濃度値を持つ領域であるが、骨転移を起こしていない領域である。非骨転移領域には、非悪性病変領域(骨折、炎症等)が含まれる。なお、骨転移領域は、「異常集積」ともいう。
【0014】
このように骨転移領域及び非骨転移領域の正解ラベルを用いてニューラルネットワークのモデルを学習することにより、このモデルを用いて、被験者のシンチグラムから骨転移領域を適切に検出することができる。
【0015】
実施の形態の学習装置は、複数の被験者のシンチグラムから、被験者の骨が写っている領域を切り出してパッチ画像を生成するパッチ画像作成部を備え、学習部は、パッチ画像およびそれに対応する正解ラベルを教師データとして用いて学習を行ってもよい。
【0016】
ニューラルネットワークモデルにおいて学習時に必要となるメモリサイズは、画像サイズが大きくなるに従って増大する。実施の形態の構成によれば、被験者の骨が写っている領域を切り出したパッチ画像を生成し、パッチ画像を用いて学習を行うことにより、学習時に必要になるメモリサイズを低減できる。また、骨転移領域の現れ方は器官の形状にそれほど依存しないので、器官全体が写っていない場合でも学習を行うことができる。したがって、パッチ画像は、骨転移領域を検出するニューラルネットワークモデルの学習の教師データに適している。
【0017】
実施の形態の学習装置において、パッチ画像作成部は、被験者のシンチグラム上で所定の大きさのウィンドウを走査し、当該ウィンドウ内に被験者の骨が写っているときに、ウィンドウの領域をパッチ画像として切り出してもよい。このようにウィンドウを走査してパッチ画像を切り出すことにより、被験者のシンチグラムから万遍なくパッチ画像を切り出せる。
【0018】
実施の形態の学習装置は、パッチ画像作成部にて作成したパッチ画像において、骨転移領域又は非骨転移領域を含むパッチ画像と骨転移領域及び非骨転移領域のいずれも含まないパッチ画像の構成比を求める教師データ分析部を備えてもよい。
【0019】
発明者らは、様々な教師データで学習を行って生成したモデルを使って推論を行い、骨転移領域の検出を適切に行えるニューラルネットワークモデルを生成できる条件について検討した。その結果、教師データを構成するパッチ画像の内容(骨転移領域又は非骨転移領域を含むパッチ画像と、骨転移領域及び非骨転移領域のいずれも含まないパッチ画像の構成比)が、ニューラルネットワークモデルの精度に関係していることを見出した。実施の形態によれば、学習に用いた教師データの分析を行い、教師データの内容を表示することにより、適切な学習を行なえるように教師データを調整することが可能となる。
【0020】
実施の形態の学習装置は、教師データ分析部にて求めた構成比が、所定の範囲に含まれるように、パッチ画像作成部にて作成されたパッチ画像から、骨転移領域及び非骨転移領域のいずれも含まないパッチ画像を間引くパッチ画像選択部を備えてもよい。
【0021】
骨転移領域を含むパッチ画像の構成比が小さすぎると学習によって得られるモデルの精度が悪くなる可能性があるので、実施の形態の構成により、骨転移領域を含むパッチ画像の構成比を大きくする。
【0022】
実施の形態の学習装置は、パッチ画像作成部にて作成されたパッチ画像の少なくとも一部のパッチ画像を左右反転または上下反転させるパッチ画像反転部を備えてもよい。
【0023】
このようにパッチ画像を反転することにより、教師データのバリエーションが増加し、学習によって精度の高いモデルを生成することができる。なお、パッチ画像を反転した場合、反転されたパッチ画像を用いてもよいし、反転されたパッチ画像と反転前のパッチ画像の両方を教師データとして用いてもよい。
【0024】
実施の形態の学習装置において、ニューラルネットワークは、Encoder-Decoder構造を有し、Encoder構造で得た特徴マップをDecoder構造に入力する構造を含んでもよい。
【0025】
この構成により、Encoder構造によって画像の大局的な特徴を捉え、Encodeの過程で得られた特徴マップをDecoder構造に入力することで局所的な特徴も学習する。骨転移領域部位の空間的広がりを捉えることで、骨転移領域部位の位置情報を適切に求めることができる。
【0026】
実施の形態の骨転移検出装置において、ニューラルネットワークは、Encoder-Decoder構造を有する第1のネットワーク部分と、Encoder-Decoder構造を有する第2のネットワーク部分とを結合した構造を有し、入力部は、各被験者について、前後から撮影したシンチグラム及びその正解ラベルを入力し、学習部は、第1のネットワーク部分の入力層に被験者を前方から撮影したシンチグラムを入力すると共に、第2のネットワーク部分の入力層に被験者を後方から撮影したシンチグラムを入力して学習を行ってもよい。
【0027】
また、実施の形態の骨転移検出装置において、ニューラルネットワークは、Encoder-Decoder構造を有する第1のネットワーク部分と、Encoder-Decoder構造を有する第2のネットワーク部分とを結合した構造を有し、入力部は、各被験者について、前後から撮影したシンチグラム及びその正解ラベルを入力し、学習部は、第1のネットワーク部分の入力層に被験者を前方から撮影したシンチグラムから切り出した第1のパッチ画像を入力すると共に、第2のネットワーク部分の入力層に被験者を後方から撮影したシンチグラムから切り出した、第1のパッチ画像と対応する第2のパッチ画像を入力して学習を行ってもよい。
【0028】
前方から撮影したシンチグラムと後方から撮影したシンチグラムを独立して処理するのではなく、Encoder-Decoder構造を有する2つのネットワーク部分を結合した構造のニューラルネットワークで同時に処理することにより、骨転移領域と非骨転移領域の鑑別の精度を高めたニューラルネットワークのモデルを生成することができる。
【0029】
実施の形態の骨転移検出装置において、非骨転移領域には非悪性病変領域が含まれ、入力部は、骨転移領域と非悪性病変領域のそれぞれの正解ラベルが付された複数の被験者のシンチグラムを教師データとして受け付け、学習部は、教師データを用いて、骨転移領域と非悪性病変領域のそれぞれを検出するニューラルネットワークのモデルを学習してもよい。
【0030】
実施の形態の骨転移検出装置は、上記の学習装置で学習されたニューラルネットワークの学習済みモデルを記憶した記憶部と、被験者のシンチグラムを入力する入力部と、シンチグラムからパッチ画像を作成するパッチ画像作成部と、記憶部から読み出した学習済みモデルの入力層にパッチ画像を入力し、パッチ画像に含まれる骨転移領域を求める推論部と、骨転移領域を示すデータを出力する出力部とを備える。この構成により、骨転移領域の検出率を維持しつつ、拾いすぎを低減することができる。
【0031】
実施の形態のプログラムは、被験者のシンチグラムから骨転移領域を検出するためのプログラムであって、コンピュータに、被験者のシンチグラムを入力するステップと、シンチグラムからパッチ画像を作成するステップと、上記した学習装置で学習されたニューラルネットワークの学習済みモデルを記憶した記憶部から学習済みモデルを読み出し、学習済みモデルの入力層にパッチ画像を入力し、パッチ画像に含まれる骨転移領域を求めるステップと、骨転移領域を示すデータを出力するステップとを実行させてもよい。
【0032】
実施の形態のプログラムは、被験者のシンチグラムから骨転移領域を検出するためのプログラムであって、コンピュータに、被験者を前後から撮影した2枚のシンチグラムを入力するステップと、2枚のシンチグラムのうちの一方を水平方向に反転するステップと、教師データを用いた学習によって予め生成された学習済みモデルを記憶した記憶部から、学習済みモデルを読み出し、学習済みモデルの入力層に、2枚のシンチグラムを入力し、シンチグラムに含まれる骨転移領域を求めるステップと、骨転移領域を示すデータを出力するステップとを実行させる。このように前後から撮影した2枚のシンチグラムの一方を反転させて同じ向きとしたうえで、2枚のシンチグラムを学習済みモデルの入力層に入力して推論を行うことにより、骨転移領域を精度良く検出することができる。
【0033】
以下、図面を参照して、実施の形態の学習装置及び骨転移検出装置について説明する。
(第1の実施の形態)
図1は、第1の実施の形態の学習装置1の構成を示す図である。第1の実施の形態の学習装置1は、被験者のシンチグラムから骨転移領域を検出するためのニューラルネットワークモデルを学習によって生成する装置である。本実施の形態の学習装置1が生成するニューラルネットワークモデルは、被験者のシンチグラムの領域を、骨転移領域、非骨転移領域および背景の3つのクラスに分類するためのモデルである。本実施の形態では、非骨転移領域のクラスには、非悪性病変領域に加え、腎臓や膀胱等の生理的集積領域を含める。
【0034】
学習装置1は、教師データを入力する入力部10と、教師データに基づいてニューラルネットワークモデルの学習を行う制御部11と、学習により生成されたモデルを記憶する記憶部16と、記憶部16に記憶されたモデルを外部に出力する出力部17とを有している。
【0035】
図2Aは、入力部10に入力される教師データの例を示す図である。教師データは、被験者のシンチグラムと、被験者のシンチグラムに与えられた正解ラベルのデータとからなる。本例において、シンチグラムの大きさは、512×1024[pixels]である。正解ラベルは、注目画素が集積に対応する画素であるか、背景(集積以外)画素であるかを画素ごとに指定したものである。集積に対応する画素の場合は、さらに、骨転移領域、注射漏れ又は尿漏れ、非骨転移領域のいずれであるかを指定している。なお、注射漏れ又は尿漏れは、本実施の形態の骨転移検出装置20による検出の対象から除外するものとする。
【0036】
次に、制御部11について説明する。制御部11は、濃度正規化処理部12と、パッチ画像作成部13と、パッチ画像反転部14と、学習部15とを有している。
【0037】
濃度正規化処理部12は、被験者ごとに異なる正常骨領域の濃度値のばらつきを抑えるために、濃度値の正規化を行う機能を有する。濃度正規化処理部12は、濃度レンジ調整、正常骨レベルの同定、グレースケール正規化の処理により濃度値の正規化を行う。濃度レンジの調整は、例えば、入力画像の濃度値0を除く濃度ヒストグラムの累積上位0.2%のピクセル値が1023に、累積上位98%のピクセル値が0になるように線形変換する。
【0038】
正常骨レベルの同定は、濃度レンジ調整後の画像の濃度値0を除く濃度ヒストグラムに対して、多重閾値法を利用する。閾値は、ヒストグラムの累積上位1%から25%のピクセル値まで1%刻みとする。それぞれの閾値でレンジ調整後の画像を2値化後、4連結ラベリングを行う。その結果に対して、面積が10[pixels]以上4900[pixels]未満の領域を抽出する。次に、求めた領域内の平均濃度値を降順に並べ、移行点(正常領域と異常領域の境)を求める。2つの連続する平均濃度値がピークピクセルの3%以下となるところを移行点とする。ピークピクセルとは、領域ごとの平均濃度値の最大値のことである。
【0039】
続いて、グレースケール正規化では、移行点を含む連続した5点の平均濃度値の平均値Pを求める。最後に正規化係数F=k/Pを濃度レンジ調整後の画像に乗じることで正規化を行う。ここで、定数kは358.4としたが、この値は実験的に決定したものである(伊藤達也「骨シンチグラム上の異常集積検出処理の開発」東京農工大学学士論文、2015)。
【0040】
パッチ画像作成部13は、被験者のシンチグラムからパッチ画像を切り出して作成する機能を有する。本例において、パッチ画像のサイズは、64×64[pixels]である。被験者のシンチグラム(512×1024[pixels])の上を64×64[pixels]のウィンドウを2[pixels]間隔で走査し、(1)ウィンドウ内に集積ラベル(骨転移領域又は非骨転移領域)が含まれるか、あるいは(2)骨領域が含まれ、集積が含まれない場合に、画像パッチとして切り出す。パッチ画像作成部13は、入力された複数の被験者の骨シンチグラムから画像パッチを切り出す。図2B及び図2Cは、被験者のシンチグラムから切り出された画像パッチ及びそれに対応する正解ラベルの例を示す図である。
【0041】
パッチ画像反転部14は、作成されたパッチ画像のうち、一部のパッチ画像を左右反転させる機能を有する。
【0042】
学習部15は、パッチ画像を用いて、シンチグラムから骨転移領域を検出するためのニューラルネットワークモデルの学習を行う機能を有する。本実施の形態では、ニューラルネットワークモデルとして、FCN(Fully Convolutional Network)の一つであるU-Netを用いる。
【0043】
図3は、本実施の形態で用いるニューラルネットワークモデルの例を示す図である。図3では、パッチサイズ64×64[pixel]のパッチを入力した際の構造の例を示している。本実施の形態で用いるニューラルネットワークモデルは、Encoder-Decoder構造を有する。Encoder構造では、畳み込みとプーリングを繰り返し行い、画像の大局的な特徴を抽出する。Decoder構造によって、大局的な構造を元のサイズの画像に戻していくが、その過程において、Encodeの過程で得られた特徴を結合することにより、局所的な特徴も学習する。
【0044】
また、本実施の形態で用いるニューラルネットワークモデルは、より高度な特徴を抽出するために、残差ブロックのひとつであるBottleneck(K. He, X. Zhang, S. Ren, and J. Sun「Deep residual learning for image recognition」arXiv:1512.03385, 2015)を有する。
【0045】
図3に示すニューラルネットワークモデルの構造について詳細に説明する。本例において、入力画像はグレースケールであり、入力の次元は64×64×1である。まず、畳み込み層でチャンネル数を32にし、Bottleneckに通す。その後、2×2のMAXプーリングを行い、チャンネル数が倍になるようにBottleneckに通す。これらの層を計4回繰り返し、Encoderの最終的な特徴マップのサイズは4×4×512となる。
【0046】
続いて、逆畳み込み層を用いて、特徴マップのサイズを倍にする。そして、逆畳み込み層の出力とEncoderの特徴マップを連結(concat)し、Bottleneckに通す。Encoderと同様にこれらの層を計4回繰り返し、Decoderの最終的な特徴マップのサイズは64×64×32となる。最後に、1×1の畳み込み層で出力クラス数である3チャンネル(背景、骨転移領域、非骨転移領域)にし、64×64×3にする。また、全ての3×3の畳み込み層ではゼロパディングし、畳み込み層の後ろにはBatch Normalization(S. Ioffe, and C. Szegedy, 「Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift」arXiv:1502.03167, 2015)とReLU関数がある。
【0047】
学習部15は、パッチ画像(パッチ画像反転部14で左右反転されたものを含む)とその正解ラベルを用いて、ニューラルネットワークモデルの学習を行う。パッチ画像をニューラルネットワークモデルに入力したときの出力をソフトマックス関数で変換した確率pと正解の確率との誤差(損失関数)を評価することで学習を行う。ソフトマックス関数と損失関数を次に示す。
【数1】
【0048】
また、学習部15は、検証用データセット(バリデーションセット)を用いて、学習したネットワークの検証を行う。教師データを用いて任意の反復回数だけ学習を行った学習モデルを保存し、全ての学習モデルに対してバリデーションセットで、学習モデルのパラメータの探索を行う。画素単位の拾いすぎFP(P)と画素単位の見落としFN(P)の和であるFP(P)+FN(P)を評価値として学習の反復回数を決定する。学習部15は、学習にて生成されたモデルを記憶部16に記憶する。
【0049】
以上、本実施の形態の学習装置1の構成について説明したが、上記した学習装置1のハードウェアの例は、CPU、RAM、ROM、ハードディスク、ディスプレイ、キーボード、マウス、通信インターフェース等を備えたコンピュータである。上記した各機能を実現するモジュールを有するプログラムをRAMまたはROMに格納しておき、CPUによって当該プログラムを実行することによって、上記した学習装置1が実現される。このようなプログラムも本発明の範囲に含まれる。
【0050】
図4は、骨転移検出装置20の構成を示す図である。骨転移検出装置20は、被験者のシンチグラムを入力する入力部21と、被験者のシンチグラムから骨転移領域を検出する制御部22と、上述した学習装置1によって学習した学習済みモデルを記憶した記憶部26と、検出した骨転移領域のデータを出力する出力部27とを有している。
【0051】
制御部22は、濃度正規化処理部23と、パッチ画像作成部24と、推論部25とを有している。濃度正規化処理部23は、学習装置1が備える濃度正規化処理部12と同じである。パッチ画像作成部24は、入力された被験者のシンチグラムから、64×64[pixels]のパッチ画像を切り出す機能を有する。基本的な構成は、学習装置1が備えるパッチ画像作成部13と同じであるが、パッチ画像を切り出す間隔は異なる。すなわち、学習装置1では、2[pixels]間隔で切り出しを行ったが、骨転移検出装置20では、32[pixels]間隔でパッチ画像を切り出す。
【0052】
推論部25は、学習済みモデル記憶部26から学習済みモデルを読み出し、学習済みモデルの入力層にパッチ画像を入力し、パッチ画像の各画素が、背景・骨転移領域・非骨転移領域の各クラスに該当する確率を求める。
【0053】
図5は、シンチグラムから切り出したパッチ画像の例を示す図である。図5に示すように、パッチ画像は、互いに隣り合うパッチ画像が半分ずつ重なるようにして、被験者のシンチグラムから切り出される。したがって、例えば、領域Rは、パッチ画像A~Dが重なりあっており、領域R内の画素の特徴マップは、4つのパッチ画像A~Dのそれぞれで求められている。推論部25は、4つのパッチ画像のそれぞれで求めた特徴マップの平均をとる。そして、推論部25は、再構成された出力をソフトマックス関数で確率に変換し、確率が最も高いクラスを画素ごとに判定し、最終出力とする。
【0054】
図6は、学習装置1の動作を示す図である。学習装置1は、教師データとして、複数の被験者のシンチグラムとそれに対応する正解ラベル(背景、骨転移領域、非骨転移領域)を入力する(S10)。学習装置1は、入力されたシンチグラムの濃度正規化を行い(S11)、正規化されたシンチグラムからパッチ画像を作成する(S12)。学習装置1は、作成されたパッチ画像のうちの一部のパッチ画像を左右反転する(S13)。続いて、学習装置1は、パッチ画像とそれに対応する正解ラベルを用いて、ニューラルネットワークモデルの学習を行い(S14)、学習によって得られたニューラルネットワークモデルを記憶部16に記憶する(S15)。なお、学習済みのモデルを骨転移検出装置20で用いる場合には、記憶部16に記憶された学習モデルを読み出して、他の装置等に出力する。
【0055】
図7は、骨転移検出装置20の動作を示す図である。骨転移検出装置20は、検査対象の被験者のシンチグラムを入力する(S20)。骨転移検出装置20は、入力されたシンチグラムの濃度正規化を行い(S21)、正規化されたシンチグラムからパッチ画像を作成する(S22)。骨転移検出装置20は、記憶部26から学習済みのニューラルネットワークモデルを読み出し、読み出したニューラルネットワークモデルの入力層にパッチ画像を入力して、パッチ画像に含まれる各画素の骨転移領域を検出する(S23)。骨転移検出装置20は、複数のパッチ画像がオーバーラップする領域の画素について、検出結果を統合する(S24)。骨転移検出装置20は、求めた骨転移領域の最終結果を出力する(S25)。
【0056】
第1の実施の形態の学習装置1は、被験者のシンチグラムとそれに対応する正解ラベルを用いてニューラルネットワークモデルを学習する。この学習済みモデルを用いることにより、いわゆる「拾いすぎ」を低減し、骨転移領域を適切に検出することができる。
【0057】
また、第1の実施の形態の学習装置1は、被験者のシンチグラムから切り出したパッチ画像を用いて学習を行うことにより、学習時に必要となるメモリサイズを低減することができる。また、骨転移領域の発生箇所は、器官の形状によらないので、パッチ画像に分割して学習を行っても、適切な学習を行なえる。
【0058】
また、第1の実施の形態の学習装置1は、多数のパッチ画像のうちの一部のパッチ画像を左右反転することにより、教師データのバリエーションを増やし、ロバストな学習結果が得られる。なお、本実施の形態では、パッチ画像を左右反転する例を挙げたが、パッチ画像を上下反転してもよい。上下反転したパッチ画像を用いる方法は、背景の骨の解剖学的構造が上下対称の場合(例えば、鉛直方向に伸びる四肢の集積を調べる場合等)に、好適である。
【0059】
(第2の実施の形態)
図8は、第2の実施の形態の学習装置2の構成を示す図である。第2の実施の形態の学習装置2が生成するニューラルネットワークモデルは、第1の実施の形態と同様に、被験者のシンチグラムの領域を、骨転移領域、非骨転移領域および背景の3つのクラスに分類するためのモデルである。第2の実施の形態の学習装置2の基本的な構成は、第1の実施の形態の学習装置1と同じであるが、第2の実施の形態の学習装置2は、教師データである多数の画像パッチの内容を分析する教師データ分析部18を備えている。多数の画像パッチには、骨転移領域又は非骨転移領域が含まれるパッチ画像と、骨転移領域及び非骨転移領域の何れも含まないパッチ画像がある。教師データ分析部18は、教師データである多数のパッチ画像に含まれる、骨転移領域又は非骨転移領域が含まれるパッチ画像と、骨転移領域及び非骨転移領域のいずれも含まないパッチ画像の構成比を求める。出力部17は、記憶部16に記憶された学習済みモデルを生成したパッチ画像の構成比のデータを出力する。
【0060】
このように学習済みモデルの生成に用いたパッチ画像の構成比を出力することにより、学習済みモデルを用いて行った骨転移領域の検出精度が高くならず、新しい学習済みモデルを生成する際に、教師データをどのように変更して学習を行うべきかのヒントが得られる。本実施の形態では、パッチ画像の構成比を見たユーザが、教師データを変更する例を挙げているが、さらに進めて、パッチ画像の構成比に基づいて、学習装置2が教師データを変更してもよい。
【0061】
図9は、第2の実施の形態の変形例である学習装置3を示す図である。変形例に係る学習装置3は、第2の実施の形態の学習装置2の構成に加えて、パッチ画像選択部19を備えている。パッチ画像選択部19は、教師データ分析部18による分析結果に基づいて、学習に使うパッチ画像を選択する機能を有する。本発明者らの研究によれば、骨転移領域及び非骨転移領域の何れも含まないパッチ画像が多すぎると、適切なモデルを生成できないと考えられる。そこで、変形例に係る学習装置3は、骨転移領域又は非骨転移領域が含まれないパッチ画像の構成比が所定の閾値以上である場合には、骨転移領域又は非骨転移領域が含まれないパッチ画像をすべて使用するのではなく、学習に使用するパッチ画像を選択する。これにより、骨転移領域の検出精度の良いモデルを生成することができる可能性が高まる。
【0062】
(第3の実施の形態)
図11は、第3の実施の形態の学習装置4を示す図である。第3の実施の形態の学習装置4は、学習対象のニューラルネットワークのモデルとして、Butterfly-Netを用いる。Butterfly-Netは、Encoder-Decoder構造を有する2つのネットワーク部分を結合した構造を有している。Butterfly-Netについては、「Btrfly Net: Vertebrae Labelling with Energybased Adversarial Learning of Local Spine Prior」Anjany Sekuboyina他、MICCAI 2018に詳しく記載されている。
【0063】
学習装置4は、教師データを入力する入力部40と、教師データに基づいてニューラルネットワークモデルの学習を行う制御部41と、学習により生成されたモデルを記憶する記憶部47と、記憶部47に記憶されたモデルを外部に出力する出力部48とを有している。なお、第3の実施の形態の学習装置4は、被験者のシンチグラムの領域を、骨転移領域、非悪性病変領域(骨折、炎症等)、その他領域(腎臓、膀胱等の生理的集積領域、注射漏れ・尿漏れ、背景)の3クラスに分類するためのモデルを生成する。本実施の形態では、生理的集積領域をその他領域のクラスに含め、非悪性病変領域とは別のクラスに分類する。
【0064】
本実施の形態の学習装置4は、教師データとして、前方から撮影した被験者のシンチグラム(以下、「前方画像」という)と後方から撮影した被験者のシンチグラム(以下、「後方画像」という)と、それぞれのシンチグラムに与えられた正解ラベルを用いる。図12は、前方画像と後方画像の例を示す図である。なお、後方画像は水平方向に反転されている。
【0065】
制御部41は、画像反転部42と、前後画像位置合せ部43と、濃度正規化処理部44と、パッチ画像作成部45と、学習部46とを有している。
【0066】
画像反転部42は、後方画像を反転する機能を有する。画像反転部42にて反転を行う際には、後方画像に与えられた正解ラベルも反転する。前後画像位置合せ部43は、前方画像と反転された後方画像との位置合わせを行う。なお、ここでは後方画像を反転させて前方画像と位置合わせする例を挙げているが、前方画像を反転させて後方画像と位置合わせすることとしても、もちろんよい。
【0067】
濃度正規化処理部44は、被験者ごとに異なる正常骨領域の濃度値のばらつきを抑えるために、濃度値の正規化を行う機能を有する。濃度正規化処理部44は、濃度レンジ調整、正常骨レベルの同定、グレースケール正規化の処理により濃度値の正規化を行う。濃度正規化処理部44は、入力されたシンチグラムの濃度Iinを次式(3)によって正規化した濃度Inormalizedに変換する。
【数2】
【0068】
パッチ画像作成部45は、被験者のシンチグラムからパッチ画像を切り出して作成する機能を有する。本実施の形態においては、パッチ画像作成部45は、前方画像と後方画像から対応する場所のパッチ画像を切り出して、前後一対のパッチ画像を生成する。図12において、前方画像から得られたパッチ画像Aと後方画像から得られたパッチ画像A´は対をなすパッチ画像である。また、パッチ画像Bとパッチ画像B´も対をなすパッチ画像である。
【0069】
本例において、パッチ画像のサイズは、64×64[pixels]である。被験者のシンチグラム(512×1024[pixels])の上を64×64[pixels]のウィンドウを2[pixels]間隔で走査し、(1)ウィンドウ内に集積ラベル(骨転移領域又は非骨転移領域)が含まれるか、あるいは(2)骨領域が含まれ、集積が含まれない場合に、画像パッチとして切り出す。前方画像または後方画像のいずれか一方で上記(1)(2)の条件に該当し、パッチ画像を切り出した場合には、前方画像または後方画像の他方から対になるパッチ画像を切り出す。
【0070】
学習部46は、パッチ画像を用いて、シンチグラムから骨転移領域を検出するためのニューラルネットワークモデルの学習を行う機能を有する。本実施の形態では、ニューラルネットワークモデルとして、2つのU-Netを結合した構造を有するButterfly-Netを用いる。
【0071】
図13は、本実施の形態で用いるButterfly-Netの例を示す図である。Butterfly-Netの上側は下の凸の構成を有しており、図3で示したネットワークとほぼ同じ構造を有している。Butterfly-Netの下側は上に凸の構成を有しており、図3で示したネットワークと同じ構造を有している(上下を反転して描いているだけである)。Butterfly-Netは、2つのU-Netが8×8の128個ずつの特徴マップのところで結合されている。
【0072】
また、本実施の形態で用いるニューラルネットワークモデルは、より高度な特徴を抽出するために、残差ブロックのひとつであるBottleneck(K. He, X. Zhang, S. Ren, and J. Sun「Deep residual learning for image recognition」arXiv:1512.03385, 2015)を用いている。このように改良されたButterfly-Netを、本書では「ResButterfly-Net」という。
【0073】
本例において、入力画像はグレースケールであり、入力の次元は64×64×1である。まず、畳み込み層でチャンネル数を32にし、Bottleneckに通す。その後、2×2のMAXプーリングを行い、チャンネル数が倍になるようにBottleneckに通す。これらの層を計3回繰り返す処理を上下のU-Netのそれぞれで行う。そして、8×8×128のサイズの特徴マップが得られたところで、上下の2つのU-Netの特徴マップを結合し、さらに、BottleneckとMAXプーリングを2回行って、最終的にEncodeによって2×2×512のサイズの特徴マップを得る。
【0074】
続いて、Bottleneckに通した後に逆畳込みを行って、特徴マップのサイズを倍にする。そして、逆畳込みの出力とEncoderの特徴マップを連結(concat)し、Bottleneckに通す。Encoderと同様にこれらの層を2回行った後、その結果を複製し、上下のEncoderのそれぞれの特徴マップを連結し、Bottleneckに通して逆畳込みを行う処理を3回繰り返す。最後に、1×1の畳み込み層で出力クラス数である3チャンネル(骨転移領域、非悪性病変領域、その他領域)にし、64×64×3にする。なお、図13では、骨転移領域(Bone metastatic legion)と非悪性病変領域(Non-malignant lesion)を示しているが、骨転移領域および非悪性病変領域以外の部分がその他領域である。
【0075】
学習部46は、対になる前後のパッチ画像とその正解ラベルを用いて、ニューラルネットワークモデルの学習を行う。一対のパッチ画像をニューラルネットワークモデルに入力したときの出力をソフトマックス関数で変換した確率pと正解の確率との誤差(損失関数)を評価することで学習を行う。損失関数を次に示す。
【数3】
ここで、wは、ピクセル数の違いの影響を低減するためのクラスcの重みである。
【数4】
【0076】
図14は、第3の実施の形態の骨転移検出装置50の構成を示す図である。骨転移検出装置50は、被験者のシンチグラムを入力する入力部51と、被験者のシンチグラムから骨転移領域を検出する制御部52と、上述した学習装置4によって学習した学習済みモデルを記憶した記憶部58と、検出した骨転移領域のデータを出力する出力部59とを有している。
【0077】
制御部52は、画像反転部53と、前後画像位置合せ部54と、濃度正規化処理部55と、パッチ画像作成部56と、推論部57とを有している。画像反転部53、前後画像位置合せ部54及び濃度正規化処理部55は、学習装置4が備える画像反転部42、前後画像位置合せ部43及び濃度正規化処理部44と同じである。パッチ画像作成部56は、入力された被験者のシンチグラム(前方画像および後方画像)からパッチ画像を切り出す機能を有する。パッチ画像作成部56は、前後のシンチグラムから対応する領域を切り出して対をなすパッチ画像を生成する。なお、パッチ画像作成部56は、学習装置4が備えるパッチ画像作成部45とは、パッチ画像を切り出す間隔を変えてもよい。
【0078】
推論部57は、学習済みモデル記憶部58から学習済みモデルを読み出し、学習済みモデルの入力層に一対のパッチ画像を入力し、パッチ画像の各画素が、骨転移領域・非悪性病変領域・その他領域の各クラスに該当する確率を求める。
【0079】
図15は、学習装置4の動作を示す図である。学習装置4は、教師データとして、複数の被験者のシンチグラム(前方画像および後方画像)とそれに対応する正解ラベル(骨転移領域、非悪性病変領域、その他領域)を入力する(S30)。学習装置4は、後方画像を反転させ(S31)、前方画像と反転された後方画像との位置合わせを行う(S32)。次に、学習装置4は、入力された前方画像および後方画像の濃度正規化を行い(S33)、前後の画像の対応する領域を切り出して複数対のパッチ画像を生成する(S34)。
【0080】
続いて、学習装置4は、パッチ画像とそれに対応する正解ラベルを用いて、ニューラルネットワークモデルの学習を行う(S35)。上述したとおり、ここでの学習では、一対の前後のパッチ画像をButterfly-Netの入力層に入力し、出力層から出力されたクラスと正解データとに基づいて学習を行う。学習装置4は、学習によって得られたニューラルネットワークモデルを記憶部47に記憶する(S36)。なお、学習済みのモデルを骨転移検出装置50で用いる場合には、記憶部47に記憶された学習モデルを読み出して、他の装置等に出力する。
【0081】
第3の実施の形態の学習装置4は、学習モデルとしてButterfly-Netのニューラルネットワークモデルを用い、その入力層に一対の前後のパッチ画像を入力して学習を行う構成としたので、相関の高いパッチ画像を同時に処理することにより、精度良く骨転移領域を検出できるニューラルネットワークのモデルを生成することができる。
【0082】
なお、第3の実施の形態に係る学習装置4においても、第1の実施の形態と同様に、パッチ画像を反転し、多数のパッチ画像のうちの一部のパッチ画像を左右反転することにより、教師データのバリエーションを増やしてもよい。ただし、本実施の形態においては、教師データであるパッチ画像は前後一対の画像であるので、前方または後方のパッチ画像を反転させた場合には、他方のパッチ画像も同じ方向に反転させる。このようにパッチ画像を反転させて教師データを増やすことにより、ロバストな学習を行うことができる。
【0083】
また、上記した第3の実施の形態に係る学習装置4では、第1の実施の形態とは異なるクラスに分類する学習済みモデルを生成する例を挙げたが、第1の実施の形態と同じクラスに分類する学習済みモデルを生成することももちろん可能である。逆に、上記した第1の実施の形態や第2の実施の形態では、注射漏れや尿漏れを除外したが、腎臓や膀胱等の生理的集積、注射漏れ・尿漏れ、及び背景をその他領域として、第3の実施の形態と同じクラスに分類するモデルを生成することもできる。
【実施例
【0084】
(実施例1)
第1の実施の形態の学習装置1を用いて生成した学習済みモデルを用いて、骨転移領域を検出した実施例について説明する。学習済みモデルとしては、パッチ画像を反転させた教師データを用いて生成した学習済みモデルと、パッチ画像を反転させない教師データを用いて生成した学習済みモデルで、骨転移領域の検出を行った。
(実験に用いた試料)
・前面骨シンチグラム濃度値正規化画像:103症例
・画像サイズ:512×1024[pixels]
・解像度:2.8×2.8[mm/pixel]
・パッチサイズ:64×64[pixels]
【0085】
(評価法)
・3-fold交差検証(学習:68症例、検証:17症例、テスト:17~18症例)
なお、検証データは、学習の反復回数を決定するためのデータである。
【0086】
(評価値)
・FP(P):画素単位の拾いすぎ
・FN(P):骨転移領域の画素単位の見落とし
・Sensitivity:骨転移領域の領域単位の検出率
=(検出した骨転移領域数)/(骨転移領域数)
・FROC曲線:Sensitivity vs.FP(P)又はFP(R)
・FP(P)/背景+FN(P)/骨転移領域
【0087】
(モデルの学習条件)
・Optimizer:Adam(α=0.001, β=0.9, β=0.999)
・バッチサイズ64
・反復回数:10000回
・検証にて、FP(P)+FN(P)が最少のネットワークを選択
【0088】
(比較例)
比較例として、多数の弱分類器による分類結果に基づいて検出を行うMadaBoost(C. Domingo and O. Watanabe「MadaBoost: A modification of AdaBoost」Proc. Thirteenth Annual Conference on Computational Learning Theory, pp.180-189, 2000)を用いて求めた検出結果と比較した。MadaBoostのアルゴリズムは、発明者らの研究室で開発した方法を用いた(南勇太「骨シンチグラム上の骨転移検出処理の改良」第3回腫瘍核医学画像解析ソフトウェア開発会議)。
【0089】
(実験結果)
図10は、実験によって得られたSensitivityとFP(P)との関係を示すFROC曲線である。図10に示すFROC曲線は、縦軸のSensitivityが高くなると、それだけ、非骨転移領域を骨転移領域として拾ってしまう「拾いすぎ」が多くなることを示している。実施例に係る方法では、例えば、Sensitivityを0.8とすると、拾いすぎは200画素以下である。MadaBoostを用いた従来法では、500画素以上の拾いすぎが生じていたことと比べると、実施例では、拾いすぎを抑制することができた。図10において、U-Net(Flip)のグラフは、一部のパッチ画像を反転させた教師データを用いて生成した学習済みモデルを用いて検出を行った結果を示し、U-Netのグラフは、パッチ画像の反転を行わないで生成した学習済みモデルを用いて検出を行った結果を示す図である。
【0090】
(実施例2)
第3の実施の形態の学習装置4を用いて生成した学習済みモデルを用いて、骨転移領域を検出した実施例について説明する。学習済みモデルとしては、第3の実施の形態で説明したResButterfly-Netと、ResButterfly-NetのBottleneckを畳込み層に代えたButterfly-Netを用いた。また、比較例としてU-Netを用いた。
【0091】
(実験に用いた試料)
・52歳~95歳の前立腺癌の日本人男性:246症例
(評価法)
・3-fold交差検証(学習:164症例、検証:41症例、テスト:41症例)
なお、検証データは、学習の最適な反復回数を決定するためのデータである。
(評価値)
・FP(P):画素単位の拾いすぎ
・FP(R):領域単位の拾いすぎ
・FP(P)+FN(P):画素単位の拾いすぎと骨転移領域の画素単位の見落とし
(モデルの学習条件)
・Optimizer:Adam(α=0.001, β=0.9, β=0.999)
・バッチサイズ256
・反復回数:最大50000回とし、誤分類されたピクセルの総数が最小になったときを最適の反復回数とした。
【0092】
(実験結果)
表1は、骨転移領域の感度が0.9のときの各評価値を示す。上が前方画像の結果、下が後方画像の結果である。
【表1】
表1に見られるように、学習モデルとしてResButterfly-Net、Butterfly-Netを用いると、U-Netを用いたモデルよりも、ホットスポット検出時の誤りが少ないことが、多くの指標において確認できた。
【0093】
上記実施形態よび実施例は以下(1)から(11)に示す技術思想を包含するものである。
(1) 被験者のシンチグラムから異常集積を検出するためのニューラルネットワークのモデルを生成する学習装置であって、
複数の被験者のシンチグラムと各シンチグラムにおける正常集積及び異常集積の正解ラベルを教師データとして入力する入力部と、
前記教師データを用いて骨シンチグラムの異常集積の検出に用いるニューラルネットワークのモデルの学習を行う学習部と、
を備える学習装置。
(2)前記複数の被験者のシンチグラムから、被験者の骨が写っている領域を切り出してパッチ画像を作成するパッチ画像作成部を備え、
前記学習部は、前記パッチ画像およびそれに対応する正解ラベルを教師データとして用いて学習を行う(1)に記載の学習装置。
(3)前記パッチ画像作成部は、前記被験者のシンチグラム上で所定の大きさのウィンドウを走査し、当該ウィンドウ内に被験者の骨が写っているときに、前記ウィンドウの領域を前記パッチ画像として切り出す(2)に記載の学習装置。
(4)前記パッチ画像作成部にて作成したパッチ画像において、正常集積又は異常集積を含むパッチ画像と正常集積及び異常集積のいずれも含まないパッチ画像の構成比を求める教師データ分析部を備える(2)または(3)に記載の学習装置。
(5)前記教師データ分析部にて求めた構成比が、所定の範囲に含まれるように、パッチ画像作成部にて作成されたパッチ画像から、正常集積及び異常集積のいずれも含まないパッチ画像を間引くパッチ画像選択部を備える請求項4に記載の学習装置。
(6)前記パッチ画像作成部にて作成されたパッチ画像の少なくとも一部のパッチ画像を左右反転または上下反転させるパッチ画像反転部を備える(1)ないし(5)のいずれかに記載の学習装置。
(7)前記ニューラルネットワークは、Encoder-Decoder構造を有し、Encoder構造で得た特徴マップをDecoder構造に入力する構造を含んでいる(1)ないし(6)のいずれかに記載の学習装置。
(8)被験者のシンチグラムから異常集積を検出するためのニューラルネットワークのモデルを生成する学習方法であって、
複数の被験者のシンチグラムと各シンチグラムにおける正常集積及び異常集積の正解ラベルを教師データとして入力するステップと、
前記教師データを用いて骨シンチグラムの異常集積の検出に用いるニューラルネットワークのモデルの学習を行うステップと、
を備える学習方法。
(9)被験者のシンチグラムから異常集積を検出するためのニューラルネットワークのモデルを生成するためのプログラムであって、
複数の被験者のシンチグラムと各シンチグラムにおける正常集積及び異常集積の正解ラベルを教師データとして入力するステップと、
前記教師データを用いて骨シンチグラムの異常集積の検出に用いるニューラルネットワークのモデルの学習を行うステップと、
を実行させるプログラム。
(10)被験者のシンチグラムから異常集積を検出するよう、コンピュータを機能させるための学習済みモデルであって、
畳み込み層と、逆畳み込み層とを有し、畳み込み層で得られた特徴マップを逆畳み込み層に入力する構造を含むニューラルネットワークで構成され、複数の被験者のシンチグラムと各シンチグラムにおける正常集積及び異常集積の正解ラベルを教師データとして学習されたものであり、前記ニューラルネットワークに入力された被験者のシンチグラムから異常集積を検出するよう、コンピュータを機能させる学習済みモデル。
(11)(2)ないし(7)のいずれかに記載の学習装置で学習されたニューラルネットワークの学習済みモデルを記憶した記憶部と、
被験者のシンチグラムを入力する入力部と、
前記シンチグラムからパッチ画像を作成するパッチ画像作成部と、
前記記憶部から読み出した学習済みモデルの入力層に前記パッチ画像を入力し、前記パッチ画像に含まれる異常集積の領域を求める推論部と、
前記異常集積領域を示すデータを出力する出力部と、
を備える異常集積検出装置。
【0094】
この出願は、2018年5月18日に出願された日本出願特願2018-096186号を基礎とする優先権を主張し、その開示の総てをここに取り込む。
図1
図2A
図2B
図2C
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15