IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士フイルム株式会社の特許一覧

特許7022195機械学習装置、方法およびプログラム並びに記録媒体
<>
  • 特許-機械学習装置、方法およびプログラム並びに記録媒体 図1
  • 特許-機械学習装置、方法およびプログラム並びに記録媒体 図2
  • 特許-機械学習装置、方法およびプログラム並びに記録媒体 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-02-08
(45)【発行日】2022-02-17
(54)【発明の名称】機械学習装置、方法およびプログラム並びに記録媒体
(51)【国際特許分類】
   A61B 6/03 20060101AFI20220209BHJP
   G06T 7/00 20170101ALI20220209BHJP
【FI】
A61B6/03 360J
A61B6/03 360G
A61B6/03 360T
G06T7/00 350C
G06T7/00 612
【請求項の数】 10
(21)【出願番号】P 2020503492
(86)(22)【出願日】2019-02-25
(86)【国際出願番号】 JP2019007049
(87)【国際公開番号】W WO2019167883
(87)【国際公開日】2019-09-06
【審査請求日】2020-09-15
(31)【優先権主張番号】P 2018035354
(32)【優先日】2018-02-28
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
(74)【代理人】
【識別番号】100083116
【弁理士】
【氏名又は名称】松浦 憲三
(74)【代理人】
【識別番号】100170069
【弁理士】
【氏名又は名称】大原 一樹
(74)【代理人】
【識別番号】100128635
【弁理士】
【氏名又は名称】松村 潔
(74)【代理人】
【識別番号】100140992
【弁理士】
【氏名又は名称】松浦 憲政
(72)【発明者】
【氏名】ケシュワニ ディーパック
(72)【発明者】
【氏名】北村 嘉郎
【審査官】山口 裕之
(56)【参考文献】
【文献】HINTON Geoffrey et al.,”Distilling theKnowledge in a Neural Network”,[online]、 NIPS 2014 Deep Learning Workshop,2015年03月09日,pp. 1-9,インターネット<URL: https://arxiv.org/abs/1503.02531>
【文献】周 向栄 等,「深層学習に基づくCT画像からの複数の解剖学的構造の同時自動認識と抽出」,MEDICAL IMAGING TECHNOLOGY,2017年09月30日,pp. 187-193
【文献】LIU Siqi et al.,”3D Anisotropic Hybrid Network: Transferring Convolutional Feature from 2D Images to 3D Anisotropic Volumes”,[online]、 Computer Vision and Pattern Recognition,2017年11月23日,pp. 1-17,インターネット<URL: https://arxiv.org/abs/1711.08580>
(58)【調査した分野】(Int.Cl.,DB名)
A61B 6/03
(57)【特許請求の範囲】
【請求項1】
第1のニューラルネットワークで構築された、第1ボリュームデータの分類が可能な第1の学習済みモデルによって、前記第1ボリュームデータと異なる第2ボリュームデータの分類の確からしさを示す確率を算出する確率算出部と、
前記第2ボリュームデータの分類の確からしさを示す確率を修正した修正確率を設定する修正確率設定部と、
前記第2ボリュームデータと前記修正確率とに基づいて、前記第1の学習済みモデルと異なる第2の学習済みモデルを得るための機械学習を、前記第1のニューラルネットワークと異なる第2のニューラルネットワークにさせる機械学習部と、
を備え、
前記第1ボリュームデータは2次元データであり、前記第2ボリュームデータは3次元データであり、
前記修正確率設定部は、前記第2ボリュームデータから特定の分類対象の構造物が3次元的にラベリングされた場合には、前記第2ボリュームデータの分類の確からしさを示す確率のうちの、前記特定の分類対象の構造物に対応する分類の確からしさを示す確率を1、他の分類の確からしさを示す確率を0に修正する、
械学習装置。
【請求項2】
前記第1ボリュームデータは2次元医用断層画像であり、
前記第2ボリュームデータは前記第1ボリュームデータよりもスライス厚の薄い複数の2次元医用断層画像を含む3次元医用断層画像である請求項に記載の機械学習装置。
【請求項3】
前記第1のニューラルネットワークは2次元畳み込みニューラルネットワークであり、前記第2のニューラルネットワークは3次元畳み込みニューラルネットワークである請求項またはに記載の機械学習装置。
【請求項4】
第1のニューラルネットワークで構築された、第1ボリュームデータの分類が可能な第1の学習済みモデルによって、前記第1ボリュームデータと異なる第2ボリュームデータの分類の確からしさを示す確率を算出する確率算出部と、
前記第2ボリュームデータの分類の確からしさを示す確率を修正した修正確率を設定する修正確率設定部と、
前記第2ボリュームデータと前記修正確率とに基づいて、前記第1の学習済みモデルと異なる第2の学習済みモデルを得るための機械学習を、前記第1のニューラルネットワークと異なる第2のニューラルネットワークにさせる機械学習部と、
を備え、
前記第1ボリュームデータは3次元データであり、前記第2ボリュームデータは4次元データであり、
前記修正確率設定部は、前記第2ボリュームデータから特定の分類対象の構造物が3次元的にラベリングされた場合には、前記第2ボリュームデータの分類の確からしさを示す確率のうちの、前記特定の分類対象の構造物に対応する分類の確からしさを示す確率を1、他の分類の確からしさを示す確率を0に修正する、
械学習装置。
【請求項5】
前記修正確率設定部は、前記確率算出部から算出された前記第2ボリュームデータの分類確率に対し、前記第2ボリュームデータから手動または自動のラベリングにより得られる少なくとも1つの領域抽出の結果に基づき、修正確率を設定する請求項1~のいずれか1項に記載の機械学習装置。
【請求項6】
前記修正確率設定部は、領域拡張法により判別された分類に基づいて修正確率を設定する請求項に記載の機械学習装置。
【請求項7】
第1のニューラルネットワークで構築された、第1ボリュームデータの分類が可能な第1の学習済みモデルによって、前記第1ボリュームデータと異なる第2ボリュームデータの分類の確からしさを示す確率を算出するステップと、
前記第2ボリュームデータの分類の確からしさを示す確率を修正した修正確率を設定するステップと、
前記第2ボリュームデータと前記修正確率とに基づいて、前記第1の学習済みモデルと異なる第2の学習済みモデルを得るための機械学習を、前記第1のニューラルネットワークと異なる第2のニューラルネットワークにさせるステップと、を含み、
前記第1ボリュームデータは2次元データであり、前記第2ボリュームデータは3次元データであり、
前記修正確率を設定するステップは、前記第2ボリュームデータから特定の分類対象の構造物が3次元的にラベリングされた場合には、前記第2ボリュームデータの分類の確からしさを示す確率のうちの、前記特定の分類対象の構造物に対応する分類の確からしさを示す確率を1、他の分類の確からしさを示す確率を0に修正する、
械学習方法。
【請求項8】
第1のニューラルネットワークで構築された、第1ボリュームデータの分類が可能な第1の学習済みモデルによって、前記第1ボリュームデータと異なる第2ボリュームデータの分類の確からしさを示す確率を算出するステップと、
前記第2ボリュームデータの分類の確からしさを示す確率を修正した修正確率を設定するステップと、
前記第2ボリュームデータと前記修正確率とに基づいて、前記第1の学習済みモデルと異なる第2の学習済みモデルを得るための機械学習を、前記第1のニューラルネットワークと異なる第2のニューラルネットワークにさせるステップと、を含み、
前記第1ボリュームデータは3次元データであり、前記第2ボリュームデータは4次元データであり、
前記修正確率を設定するステップは、前記第2ボリュームデータから特定の分類対象の構造物が3次元的にラベリングされた場合には、前記第2ボリュームデータの分類の確からしさを示す確率のうちの、前記特定の分類対象の構造物に対応する分類の確からしさを示す確率を1、他の分類の確からしさを示す確率を0に修正する、
機械学習方法。
【請求項9】
請求項7又は8に記載の機械学習方法をコンピュータに実行させるための機械学習プログラム。
【請求項10】
非一時的かつコンピュータ読取可能な記録媒体であって、前記記録媒体に格納された指令がコンピュータによって読み取られた場合に請求項に記載の機械学習プログラムをコンピュータに実行させる記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は機械学習装置および方法に関し、特に、画像の構造の分類(セグメンテーション)を行う機械学習モデルを構築するための機械学習装置および方法に関する。
【背景技術】
【0002】
従来、CT(Computed Tomography)画像など3次元の医用画像データ(ボリュームデータ)に対して、各画素値が複数のラベルのいずれかに属するかを決定する学習済みモデルを用いて、それよりも規模の小さい学習モデルを機械学習させる“蒸留”(distillation)という技術が存在する。蒸留(distillation)は、softmax関数を用いて分類の確率(ソフトターゲットあるいはソフトラベルと呼ばれる値)を算出し、ソフトターゲットを用いて、学習済みモデルとは異なる別の学習モデルのニューラルネットワークの重みを更新するものである。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2017-182320号公報
【非特許文献】
【0004】
【文献】Geoffrey Hinton, Oriol Vinyals, Jeff Dean, ”Distilling the Knowledge in a Neural Network” 、インターネット<URL https://arxiv.org/abs/1503.02531>
【発明の概要】
【発明が解決しようとする課題】
【0005】
肺の所見分類においては、「正常」、「網状」、「蜂窩」、「すりガラス」、「穏やかなLow attenuation area (LAA)」、「中程度のLAA」、「高度のLAA」、「牽引性気管支拡張」、「点状影」など30を超える画像パターンがある。これらを機械学習するための正解ラベルを作成する場合、2次元のスライス画像で対象領域を囲む程度のことは容易であるが、3次元のスライス画像で正解ラベルを作成することは困難である。
【0006】
そこで2次元画像を入力してニューラルネットワークを学習させて学習モデルを構築し、この学習モデルを3次元画像のスライスごとに適用することが考えられる。しかし、分類対象の構造物が血管や気管支など3次元である場合、それらの見え方が異なる場合には、学習モデルは高い精度でこれを分類することはできない。例えば、スライスに垂直に走行する血管は、点状影として分類される。一方、血管や気管支を3次元的にラベリングすることは、疾患パターンへのラベリングよりも容易である。
【0007】
本発明は、分類対象の構造物に応じてより精度の高く効率的な蒸留(distillation)を可能とする機械学習装置および方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の態様に係る機械学習装置は、第1のニューラルネットワークで構築された、第1ボリュームデータの分類が可能な第1の学習済みモデルによって、第1ボリュームデータと異なる第2ボリュームデータの分類の確からしさを示す確率を算出する確率算出部と、第2ボリュームデータの分類の確からしさを示す確率を修正した修正確率を設定する修正確率設定部と、第2ボリュームデータと修正確率とに基づいて、第1の学習済みモデルと異なる第2の学習済みモデルを得るための機械学習を、第1のニューラルネットワークと異なる第2のニューラルネットワークにさせる機械学習部と、を備える。
【0009】
本発明の第2の態様に係る機械学習装置において、第1ボリュームデータは2次元データであり、第2ボリュームデータは3次元データである。
【0010】
本発明の第3の態様に係る機械学習装置において、第1ボリュームデータは2次元医用断層画像であり、第2ボリュームデータは第1ボリュームデータよりもスライス厚の薄い複数の2次元医用断層画像を含む3次元医用断層画像である。
【0011】
本発明の第4の態様に係る機械学習装置において、第1のニューラルネットワークは2次元畳み込みニューラルネットワークであり、第2のニューラルネットワークは3次元畳み込みニューラルネットワークである。
【0012】
本発明の第5の態様に係る機械学習装置において、第1ボリュームデータは3次元データであり、第2ボリュームデータは4次元データである。
【0013】
本発明の第6の態様に係る機械学習装置において、修正確率設定部は、確率算出部から算出された第2ボリュームデータの分類確率に対し、第2ボリュームデータから手動または自動のラベリングにより得られる少なくとも1つの領域抽出の結果に基づき、修正確率を設定する。
【0014】
本発明の第7の態様に係る機械学習装置において、修正確率設定部は、領域拡張法により判別された分類に基づいて修正確率を設定する。
【0015】
本発明の第8の態様に係る機械学習方法は、第1のニューラルネットワークで構築された、第1ボリュームデータの分類が可能な第1の学習済みモデルによって、第1ボリュームデータと異なる第2ボリュームデータの分類の確からしさを示す確率を算出するステップと、第2ボリュームデータの分類の確からしさを示す確率を修正した修正確率を設定するステップと、第2ボリュームデータと修正確率とに基づいて、第1の学習済みモデルと異なる第2の学習済みモデルを得るための機械学習を、第1のニューラルネットワークと異なる第2のニューラルネットワークにさせるステップと、を含む。
【0016】
上記の機械学習方法をコンピュータに実行させるための機械学習プログラムおよびこの機械学習プログラムによって機械学習された機械学習済みモデルも本発明に含まれる。更に、非一時的かつコンピュータ読取可能な記録媒体であって、記録媒体に格納された指令がコンピュータによって読み取られた場合に上記の機械学習プログラムをコンピュータに実行させる記録媒体も本発明に含まれる。
【発明の効果】
【0017】
この発明によると、従来の領域拡張法などで得られた正確な分類(ハードラベル)によって確率(ソフトラベル)を修正して蒸留(distillation)を行えば、より高い精度で学習済みモデルから別のモデルを学習させることができる。
【図面の簡単な説明】
【0018】
図1】機械学習装置の概略構成図
図2】スライス画像の一例を示す図
図3】機械学習処理のフローチャート
【発明を実施するための形態】
【0019】
図1は本発明の好ましい実施形態に係る機械学習装置1の概略構成図である。機械学習装置1は、学習データ入力部11、機械学習部12、第1ニューラルネットワーク13、確率算出部14、修正確率設定部16、および第2ニューラルネットワーク18を備える。
【0020】
学習データ入力部11は、1枚のアキシャル断層画像(第1スライス画像Ithick)からなる第1ボリュームデータと、その第1ボリュームデータに含まれる各ボクセルに対し、医師などが手動で、「肺実質」、「気管支」、「血管」、「腫瘤」、「その他」などの正解のラベルを付すこと(ラベリング)で、画像内の各画素がn種類の解剖学的構造(クラスCi,1≦i≦n)に分類された正解マスクとの組(学習データ)の入力を受け付ける。
【0021】
第1ニューラルネットワーク13は2次元畳み込みニューラルネットワークである。機械学習部12は、学習データ入力部11から入力された学習データに基づいて、第1ニューラルネットワーク13を機械学習させることで、スライス画像にラベリングを行う学習済みモデル(教師モデル13a)を得る。
【0022】
また、第1ニューラルネットワーク13の学習で得られた教師モデル13aは、学習データ入力部11から入力された多数のアキシャル断層画像(マルチスライス画像)からなる第2ボリュームデータの各々のスライス画像(第2スライス画像Ithin-1,Ithin-2,…)のボクセルに対しラベリングを行う。マルチスライス画像は平面画像と撮影時間とからなる動画であってもよい。
【0023】
図2に示すように、この第2スライス画像Ithin-1,Ithin-2,…のスライス厚βは、学習データの第1スライス画像Ithickのスライス厚αよりも薄いものとする。すなわちα>βである。
【0024】
第1スライス画像Ithickのスライス厚αや第2スライス画像Ithin-1,Ithin-2,…のスライス厚βを無視すれば、これらは疑似的な2次元画像データとして扱うことができる。このため、第1ニューラルネットワーク13により、第1スライス画像Ithickや第2スライス画像Ithin-1,Ithin-2,…の各ボクセルに対し、ラベリングを行うことが可能である。第1スライス画像Ithickと正解マスクとの組から、教師モデル13aが得られる。
【0025】
教師モデル13aは、第2スライス画像Ithin-1,Ithin-2,…の各々のボクセルへの、肺実質、気管支、血管、腫瘤、その他などのクラスCiへのラベリングを行う。
【0026】
確率算出部14は、学習済みの教師モデル13aによる、第2スライス画像の各ボクセルに対するクラスCiへのラベリングの確からしさを示す値pi(ソフトラベル)を算出する。
【0027】
これは非特許文献1に記載のように、教師モデル13aのsoftmax層を用いれば、第2スライス画像の各ボクセルに対するソフトラベルすなわち各クラスCiの温度付き確率piは以下の式(温度付きsoftmax関数)で求めることができる。viはロジット(logit)である。なおTは通常1であるが、より大きい値とすることでより各モデルの出力分布がよりソフトとなる。
【0028】
【数1】
【0029】
例えば、クラスCiの添え字i=1~5は、「肺実質」、「気管支」、「血管」、「腫瘤」、「それ以外」に対応するものとすると、第2スライス画像Ithin-1の座標(x1,y1,z1)のボクセルB1に対し、教師モデル13aのsoftmax層を用いた各クラスCiの温度付き確率pi(B1)は
p1(B1)(=ボクセルB1に対する肺実質のソフトラベル)=0.8
p2(B1)(=ボクセルB1に対する気管支のソフトラベル)=0.03
p3(B1)(=ボクセルB1に対する血管のソフトラベル)=0.05
p4(B1)(=ボクセルB1に対する腫瘤のソフトラベル)=0.05
p5(B1)(=ボクセルB1に対するそれ以外のソフトラベル)=0.07
などと算出される。ただし、気管支や血管のように、アキシャル方向に延びる解剖学的構造は、教師モデル13aによる検出は精度が高いとは言えない。これは、α>βであり、第1スライス画像にある気管支や血管の特徴を示す情報が、個々の第2スライス画像では失われている可能性があるからである。
【0030】
検出部15は、第2スライス画像のボクセルに対し、領域拡張法などの公知の手法により、「気管支」および「血管」を検出し、「気管支」および「血管」のラベリングを行う。これらのラベリングは確率的な確からしさが0または1のハードラベルである。あるいは、検出部15は、医師などの手動操作に基づいて、第2スライス画像のボクセルに対する「気管支」および「血管」のラベリングを検出することで、確率的な確からしさが0または1のハードラベルを各ボクセルに付与してもよい。
【0031】
例えば、領域拡張法による「気管支」の検出は、気管支内部の空気領域に対応する画素値を有する連続した領域を抽出する手法(特に、所定の条件を満たす程度に画素値が近似する、近接した画素を連結する手法)が挙げられる。この画素の連結はアキシャル方向についても行われるため、第2スライス画像から比較的精度の高い気管支の抽出が可能である。
【0032】
また例えば、「血管」の検出は、領域拡張法による他、ヘッセ行列等に基づく線フィルタにより血管らしい領域を抽出し、未分類の血管の領域に連結することによって未分類の血管の領域を拡張させる手法が挙げられる。
【0033】
「気管支」および「血管」の他の検出方法としては、グラフカット法やレベルセット法等の公知の手法がある。
【0034】
なお検出部15は、公知の方法で、第2スライス画像から「気管支」および「血管」以外の解剖学的構造を検出してもよい。例えば、検出部15は、領域拡張法を用いて心内腔領域を検出してもよい。検出部15は、自動検出、手動操作、あるいはそれらの組み合わせにより、第2スライス画像から「気管支」や「血管」などの解剖学的構造を検出することができる。
【0035】
修正確率設定部16は、第2スライス画像のボクセルにおいて検出部15が検出した「気管支」または「血管」のハードラベルによって、上記ボクセルのソフトラベルを置き換える。
【0036】
例えば、上述の第2スライス画像Ithin-1の座標(x1,y1,z1)とは異なる座標(xk,yk,zk)のボクセルBkについて、検出部15により「気管支」のハードラベル「1」が付与された場合は、ボクセルBkのソフトラベルは以下のように書き換えられる。
【0037】
p1(Bk)(=ボクセルBkに対する肺実質のソフトラベル)=0.8→0.0
p2(Bk)(=ボクセルBkに対する気管支のソフトラベル)=0.35→1
p3(Bk)(=ボクセルBkに対する血管のソフトラベル)=0.05→0.0
p4(Bk)(=ボクセルBkに対する腫瘤のソフトラベル)=0.0
p5(Bk)(=ボクセルBkに対する腫瘤のソフトラベル)=0.0
あるいは、上述の座標(x1,y1,z1)および(xk,yk,zk)とは異なる座標(xm,ym,zm)のボクセルBmについて、検出部15により「血管」のハードラベル「1」が付与された場合は、ボクセルBmのソフトラベルは以下のように書き換えられる。
【0038】
p1(Bm)(=ボクセルBmに対する肺実質のソフトラベル)=0.2→0.0
p2(Bm)(=ボクセルBmに対する気管支のソフトラベル)=0.1→0.0
p3(Bm)(=ボクセルBmに対する血管のソフトラベル)=0.4→1
p4(Bm)(=ボクセルBmに対する腫瘤のソフトラベル)=0.1→0.0
p5(Bm)(=ボクセルBmに対する腫瘤のソフトラベル)=0.3→0.0
なお検出部15によって「気管支」または「血管」のハードラベルが検出されないボクセルについては、ソフトラベルの書き換えは生じない。
【0039】
第2ニューラルネットワーク18は3次元畳み込みニューラルネットワークである。
【0040】
蒸留部17は、修正確率設定部16による修正後のソフトラベルと、修正のされなかったソフトラベルとを用いて、教師モデル13aから、第2ニューラルネットワーク18の未学習の生徒モデル18aの蒸留(distillation)を行うことで、学習済みの生徒モデル18aを得る。蒸留(distillation)は、例えば非特許文献1に記載の手法に従えばよい。
【0041】
すなわち、まず確率算出部14は、生徒モデル18aによる、第2スライス画像の各ボクセルに対するクラスCiへのラベリングの確からしさを示す値qi(ソフトラベル)を算出する。
【0042】
これは非特許文献1に記載のように、第2ニューラルネットワーク18のsoftmax層を用いて、第2スライス画像の各ボクセルに対するソフトラベルすなわち各クラスCiの温度付き確率qiを求める。qiは以下の式(温度付きsoftmax関数)で求められる。ziはlogitである。
【0043】
【数2】
【0044】
蒸留部17による蒸留(distillation)とは、ziに対する交差エントロピーCの勾配
【0045】
【数3】
【0046】
を最小化することである。蒸留(distillation)により、生徒モデル18aのqiの出力分布が、教師モデル13aのpiの出力分布に近づく。なおTは通常1であるが、より大きい値とすることでより各モデルの出力分布がよりソフトとなる。
【0047】
典型的には、蒸留(distillation)は、大きくて複雑なニューラルネットワーク(教師)の学んだ知識を蒸留し、小さくて軽量なモデル(生徒)の学習に利用するものであるが、上述の数1および数2を用いることで、2次元ニューラルネットワークの教師モデル13aから3次元ニューラルネットワークの生徒モデル18aに適用することも可能である。
【0048】
図3は機械学習装置1の実行する機械学習処理のフローチャートである。
【0049】
S1(教師モデル学習ステップ)において、機械学習部12は、学習データ入力部11から入力された第1スライス画像と正解マスクの組からなる学習データに基づいて、第1ニューラルネットワーク13を機械学習させることで、第2スライス画像にラベリングを行うことが可能な学習済みの教師モデル13aを得る。
【0050】
S2(ソフトラベル算出ステップ)において、確率算出部14は、学習済みの教師モデル13aによる、第2スライス画像の各ボクセルに対するクラスCiへのラベリングの確からしさを示すソフトラベルpiを算出する。
【0051】
S3(ハードラベル検出ステップ)において、検出部15は、第2スライス画像のボクセルに対し、領域拡張法などの公知の手法により、「気管支」および「血管」を検出し、「気管支」および「血管」のラベリングを行う。
【0052】
S4(ソフトラベル修正ステップ)において、修正確率設定部16は、検出部15の検出した「気管支」または「血管」のハードラベルによってソフトラベルpiを修正する。
【0053】
S5(蒸留ステップ)において、蒸留部17は、修正確率設定部16による修正後のソフトラベルと、修正のされなかったソフトラベルとを用いて、教師モデル13aから生徒モデル18aの蒸留(distillation)を行う。これにより、教師モデル13aから、学習済みの生徒モデル18aが得られる。
【0054】
教師モデル13aは第1スライス画像により学習されたモデルであるため、教師モデル13aにより得られた第2スライス画像の「気管支」および「血管」のソフトラベルの確からしさは、精度が高いとは言えない。これに対し、検出部15に得られた「気管支」および「血管」のハードラベルは、従来の領域拡張法などで正確に抽出できる。これを利用し、第2スライス画像の「気管支」および「血管」のソフトラベルをハードラベルで修正して蒸留(distillation)を行えば、より高い精度で教師モデル13aから生徒モデル18aを学習させることができる。
【0055】
なお、上記では、第1ニューラルネットワーク13は2次元畳み込みニューラルネットワーク、第2ニューラルネットワーク18は3次元畳み込みニューラルネットワークであり、第1ボリュームデータは疑似的2次元画像、第2ボリュームデータは3次元画像であったが、第1ニューラルネットワーク13および第2ニューラルネットワーク18の次元は上記に限られない。
【0056】
例えば、第1ニューラルネットワーク13は3次元ニューラルネットワーク、第2ニューラルネットワーク18は2次元ニューラルネットワークであり、第1ボリュームデータは疑似的3次元画像、第2ボリュームデータは2次元画像であってもよい。疑似的3次元画像は平面画像と撮影時間とからなる動画の1コマであってもよい。
【0057】
あるいは、第1ニューラルネットワーク13は3次元ニューラルネットワーク、第2ニューラルネットワーク18は4次元ニューラルネットワークであり、第1ボリュームデータは3次元画像、第2ボリュームデータは4次元画像であってもよい。4次元画像は立体画像と撮影時刻とからなる動画であってもよい。
【0058】
また、教師モデル13aと生徒モデル18aは異なるニューラルネットワークで構築されたモデルであればよく、それぞれのニューラルネットワークの次元は同じであってもよいし異なってもよい。たとえば、教師モデル13aと生徒モデル18aは異なる2次元ニューラルネットワーク、3次元ニューラルネットワーク、あるいは4次元ニューラルネットワークで構築されてもよい。
【符号の説明】
【0059】
11 学習データ入力部
12 機械学習部
13 第1ニューラルネットワーク
13a 教師モデル
14 確率算出部
15 検出部
16 修正確率設定部
17 蒸留部
18 第2ニューラルネットワーク
18a 生徒モデル
図1
図2
図3