(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-25
(45)【発行日】2025-05-08
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20250428BHJP
G06T 7/00 20170101ALI20250428BHJP
A61B 3/14 20060101ALI20250428BHJP
【FI】
G06N20/00
G06T7/00 350C
G06T7/00 614
A61B3/14
(21)【出願番号】P 2021140629
(22)【出願日】2021-08-31
【審査請求日】2024-08-29
(73)【特許権者】
【識別番号】520228991
【氏名又は名称】DeepEyeVision株式会社
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】久留 陽一郎
(72)【発明者】
【氏名】近藤 佑亮
【審査官】真木 健彦
(56)【参考文献】
【文献】特開2019-209136(JP,A)
【文献】国際公開第2019/246250(WO,A1)
【文献】米国特許出願公開第2018/0330518(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06T 7/00
A61B 3/14
(57)【特許請求の範囲】
【請求項1】
血液循環異常領域のアノテーション情報が付与された医用画
像を機械学習モデルに入力して前記機械学習モデルを学習させる
学習部であって、前記血液循環異常領域は無灌流領域及び新生血管が生じた領域を含み、前記学習部は、異常のない領域、無灌流領域及び新生血管が生じた領域の順序関係に少なくとも基づいて前記機械学習モデルを学習させる、学習部と、
前記学習部で学習された学習済モデルを出力するモデル出力部と
を備える情報処理装置。
【請求項2】
血液循環異常領域を含む医用画像と血液循環異常領域を含まない医用画像とが所定の割合になるように、前記アノテーション情報が付与された医用画像を取得する学習データ取得部をさらに備える
、請求項1に記載の情報処理装置。
【請求項3】
前記学習部は、推論の容易な領域の交差エントロピーロスの重みを動的に減衰させる損失関数を用いて前記機械学習モデルを学習させる、請求項1又は2に記載の情報処理装置。
【請求項4】
血液循環異常領域のアノテーション情報が付与された医用画像を取得すること
であって、前記血液循環異常領域は無灌流領域及び新生血管が生じた領域を含む、ことと、
前記医用画
像を機械学習モデルに入力して
、異常のない領域、無灌流領域及び新生血管が生じた領域の順序関係に少なくとも基づいて前記機械学習モデルを学習させることと、
前記学習の結果得られた学習済モデルを出力することと
を含む学習済モデルの生成方法。
【請求項5】
医用画像を含む第1画像を取得する第1取得部と、
前記第1画像
を第2の学習済モデルに入力することで前記第1画像中の血液循環異常領域を推論する推論部
であって、前記血液循環異常領域は無灌流領域及び新生血管が生じた領域を含み、前記第2の学習済モデルは、異常のない領域、無灌流領域及び新生血管が生じた領域の順序関係に少なくとも基づいて、医用画像から当該医用画像中の血液循環異常領域を推定するように学習された学習済モデルである、推論部と、
前記推論部で推論された結果を出力する出力部と
を備える情報処理装置。
【請求項6】
前記第2の学習済モデルは、血液循環異常領域を含む医用画像と血液循環異常領域を含まない医用画像とが所定の割合になるように取得された、血液循環異常領域のアノテーション情報が付与された医用画像を用いて学習された学習済モデルである、請求項5に記載の情報処理装置。
【請求項7】
前記第1画像を第1の学習済モデルに入力することで前記第1画像中の血管領域を示す第2画像を取得する第2取得部であって、前記第1の学習済モデルは、医用画像から血管領域を推定するように学習された学習済モデルである、第2取得部をさらに備え、
前記推論部は、前記第1画像と前記第2画像とを
前記第2の学習済モデルに入力することで、前記第1画像中の前記血液循環異常領域を推論す
る、
請求項5又は6
に記載の情報処理装置。
【請求項8】
前記第2の学習済モデルはニューラルネットワークであり、大きなストライドの畳み込み層を有する、請求項
5又は6に記載の情報処理装置。
【請求項9】
前記第1画像を、血液循環異常領域を含み得る画像とそれ以外の画像とに分類する分類部をさらに備え、
前記血液循環異常領域を含み得る画像のみを前記推論部で処理する、
請求項5
又は6に記載の情報処理装置。
【請求項10】
医用画像を含む第1画像を取得することと、
前記第1画像
を第2の学習済モデルに入力することで前記第1画像中の血液循環異常領域を推論すること
であって、前記血液循環異常領域は無灌流領域及び新生血管が生じた領域を含み、前記第2の学習済モデルは、異常のない領域、無灌流領域及び新生血管が生じた領域の順序関係に少なくとも基づいて、医用画像から当該医用画像中の血液循環異常領域を推定するように学習された学習済モデルである、ことと、
推論された結果を出力することと
を含む方法。
【請求項11】
1又は複数のコンピュータに、
医用画像を含む第1画像を取得する処理と、
前記第1画像
を第2の学習済モデルに入力することで前記第1画像中の血液循環異常領域を推論する処理
であって、前記血液循環異常領域は無灌流領域及び新生血管が生じた領域を含み、前記第2の学習済モデルは、異常のない領域、無灌流領域及び新生血管が生じた領域の順序関係に少なくとも基づいて、医用画像から当該医用画像中の血液循環異常領域を推定するように学習された学習済モデルである、処理と、
推論された結果を出力する処理と
を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項12】
前記学習部は、前記医用画像中の血管領域を前記医用画像から推定した血管画像を前記医用画像と共に前記機械学習モデルに入力して前記機械学習モデルを学習させる、
請求項1又は2に記載の情報処理装置。
【請求項13】
前記学習部は、異常のない領域、無灌流領域及び新生血管が生じた領域の順序を持つ領域間の分類の誤差を考慮する損失関数を用いて前記機械学習モデルを学習させる、
請求項
1に記載の情報処理装置。
【請求項14】
前記学習部は、前記アノテーション情報として、正解データと関係がある他の領域にも確率を割り当てた確率分布を付与した学習データを用いて、前記機械学習モデルを学習させる、
請求項
1に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
血管障害が生じて虚血状態に陥る糖尿病網膜症などの網膜疾患では、網膜循環動態を把握することが肝要である。網膜循環動態は、蛍光眼底造影検査を行うことによって把握することができる。ここで、蛍光眼底造影検査は、有用な情報を得ることができる検査である一方で、造影剤に対する副作用が出る可能性があるなど、患者や医療者に一定の負担が生じる検査でもある。そこで、蛍光眼底造影検査を実施することなく、眼底画像から循環異常所見を特定する手法が提案されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1では、眼底の画像である眼底画像と、眼底の蛍光眼底造影画像に基づいて特定された血液循環異常領域とに基づいて、眼底画像と、眼底画像における血液循環異常領域との関係を学習した学習済モデルを用いて、眼底画像における血液循環異常領域を特定する診断支援装置が開示されている。
【0005】
このような学習済モデルを生成するためには、血液循環異常領域を示すタグを付けるアノテーションを行い、その情報(以下、アノテーション情報と記す)が付与された眼底画像が大量に必要である。血液循環異常領域の一例である無灌流領域(NPA:Non-Perfusion Area)(以下「NPA領域」とも言う。)は、眼底において、網膜毛細血管床の閉塞などにより、血液が流れていない又はほとんど流れていない領域である。NPA領域のアノテーション情報が付与された眼底画像は以下のようにして作成される。先ず、同一の診察で同一の患者に対して撮影された眼底画像と蛍光眼底造影画像とのセットを準備する。次いで、両画像を確認しながら眼科専門医等が蛍光眼底造影画像上でNPA領域のアノテーションを行う。最後にアノテーション情報を眼底画像に付与する。血液循環異常領域の他の一例である、新生血管が生じた領域についても、眼底画像にアノテーション情報を付与するためには同様の工程が必要である。このような学習データの収集には、多くの時間と労力がかかる。
【0006】
また、通常のセマンティックセグメンテーションとは異なり、NPA領域のアノテーションは、蛍光眼底造影画像において境界が明快でない領域を指摘する必要がある。このことがさらに、学習データの収集を難しくしている。
【0007】
そこで、本発明の第1の態様は、患者の検査対象部位の撮影により取得された医用画像中の血液循環異常領域を推論する学習済モデルをより少ない学習データで生成することが可能な情報処理装置、情報処理方法及びプログラムを提供することを目的の1つとする。また、本発明の第2の態様は、医用画像中の血液循環異常領域を、従来技術と比較して高精度に推論することが可能な情報処理装置、情報処理方法及びプログラムを提供することを目的の1つとする。
【課題を解決するための手段】
【0008】
本発明の一態様に係る情報処理装置は、血液循環異常領域のアノテーション情報が付与された医用画像と、医用画像中の血管領域を医用画像から推定した血管画像とを機械学習モデルに入力して機械学習モデルを学習させる学習部と、学習部で学習された学習済モデルを出力するモデル出力部とを備える。
【0009】
この態様によれば、医用画像から導出された血管画像を機械学習モデルの学習に用いることで、医用画像のみで学習を行う場合と比較して効率的に機械学習モデルを学習させることができ、その結果、より少ない学習データで学習を収束させることができる。
【0010】
上記情報処理装置において、血液循環異常領域を含む医用画像と血液循環異常領域を含まない医用画像とが所定の割合になるように、アノテーション情報が付与された医用画像を取得する学習データ取得部をさらに備えてもよい。この態様によれば、学習データ中、血液循環異常領域を含まない医用画像が、血液循環異常領域を含む医用画像と比較して大幅に多くなるという学習に不利な事態を回避することができる。
【0011】
上記情報処理装置において、学習部は、推論の容易な領域の交差エントロピーロスの重みを動的に減衰させる損失関数を用いて機械学習モデルを学習させてもよい。この態様によれば、機械学習モデルの学習が、推論の容易な、血液循環異常領域を含まない領域の学習に支配されることを防ぎ、推論が難しい、血液循環異常領域を含む領域を効果的に学習することができる。
【0012】
上記情報処理装置において、血液循環異常領域は、無灌流領域及び新生血管が生じた領域を含み、学習部は、異常のない領域、無灌流領域及び新生血管が生じた領域の順序尺度に少なくとも基づいて機械学習モデルを学習させてもよい。この態様によれば、異常のない領域、NPA領域及び新生血管が生じた領域の順序関係を効率的に機械学習モデルに学習させることができ、その結果、より少ない学習データで学習を収束させることが期待できる。
【0013】
上記情報処理装置において、学習部は、異常のない領域、無灌流領域及び新生血管が生じた領域の順序を持つ領域間の分類の誤差を考慮する損失関数を用いて機械学習モデルを学習させてもよい。
【0014】
上記情報処理装置において、学習部は、アノテーション情報として、正解データと関係がある他の領域にも確率を割り当てた確率分布を付与した学習データを用いて、機械学習モデルを学習させてもよい。
【0015】
本発明の他の態様に係る、学習済モデルの生成方法は、血液循環異常領域のアノテーション情報が付与された医用画像を取得することと、医用画像中の血管領域を医用画像から推定した血管画像を取得することと、医用画像と血管画像とを機械学習モデルに入力して機械学習モデルを学習させることと、学習の結果得られた学習済モデルを出力することとを含む。
【0016】
本発明の他の態様に係る情報処理装置は、医用画像を含む第1画像を取得する第1取得部と、第1画像から、第1画像中の血管領域を示す第2画像を取得する第2取得部と、第1画像と第2画像とに基づいて、第1画像中の血液循環異常領域を推論する推論部と、推論部で推論された結果を出力する出力部とを備える。
【0017】
この態様によれば、推論対象である医用画像を含む第1画像から導出された、第1画像中の血管領域を示す第2画像を血液循環異常領域の推論に用いることで、医用画像のみで推論を行う場合と比較して高精度な推論を行うことができる。
【0018】
上記情報処理装置において、第2取得部は、第1画像を第1の学習済モデルに入力することで第2画像を取得するものであり、第1の学習済モデルは、医用画像から血管領域を推定するように学習された学習済モデルであってもよい。この態様によれば、所望の精度を有する第2画像を容易に取得することができる。
【0019】
上記情報処理装置において、推論部は、第1画像と第2画像とを第2の学習済モデルに入力することで、第1画像中の血液循環異常領域を推論するものであり、第2の学習済モデルは、医用画像と、当該医用画像を第1の学習済モデルに入力することで取得される、当該医用画像中の血管領域を示す血管画像とから、当該医用画像中の血液循環異常領域を推定するように学習された学習済モデルであってもよい。この態様によれば、第1画像中の血液循環異常領域について、所望の精度を有する推論結果を得ることができる。
【0020】
上記情報処理装置において、第2の学習済モデルはニューラルネットワークであり、大きなストライドの畳み込み層を有してもよい。この態様によれば、第2の学習済モデルは、血管領域の情報を大域的な範囲の情報として利用して、医用画像中の血液循環異常領域を推定することができる。
【0021】
上記情報処理装置において、第1画像を、血液循環異常領域を含み得る画像とそれ以外の画像とに分類する分類部をさらに備え、血液循環異常領域を含み得る画像のみを推論部で処理してもよい。この態様によれば、効率的に高精度な推論を行うことができる。
【0022】
上記情報処理装置において、血液循環異常領域は、無灌流領域及び新生血管が生じた領域のうちの少なくとも1つを含んでもよい。この態様によれば、医用画像中の無灌流領域及び新生血管が生じた領域のうちの一方、あるいは両方について推論を行うことができる。
【0023】
本発明の他の態様に係る方法は、医用画像を含む第1画像を取得することと、第1画像から、第1画像中の血管領域を示す第2画像を取得することと、第1画像と第2画像とに基づいて、第1画像中の血液循環異常領域を推論することと、推論された結果を出力することとを含む。
【0024】
本発明の他の態様に係るプログラムは、1又は複数のコンピュータに、医用画像を含む第1画像を取得する処理と、第1画像から、第1画像中の血管領域を示す第2画像を取得する処理と、第1画像と第2画像とに基づいて、第1画像中の血液循環異常領域を推論する処理と、推論された結果を出力する処理とを実行させる。
【発明の効果】
【0025】
本発明の第1の態様によれば、医用画像中の血液循環異常領域を推論する学習済モデルをより少ない学習データで生成することが可能な情報処理装置、情報処理方法及びプログラムを提供することができる。また、本発明の第2の態様によれば、医用画像中の血液循環異常領域を、従来技術と比較して高精度に推論することが可能な情報処理装置、情報処理方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0026】
【
図1】本発明の一実施形態に係る情報処理システムのネットワーク構成を示す図である。
【
図2】本発明の一実施形態に係る学習装置の処理及び推論装置の処理を説明する概略図である。
【
図3】本発明の一実施形態に係る学習装置のブロック図である。
【
図4】本発明の一実施形態に係る推論装置のブロック図である。
【
図5】本発明の一実施形態に係る学習装置の学習処理を示すフローチャートである。
【
図6】本発明の一実施形態に係る推論装置の推論処理を示すフローチャートである。
【発明を実施するための形態】
【0027】
添付図面を参照して、本発明の実施形態について説明する。なお、以下の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施形態を採用することが可能であり、係る実施形態も本発明の範囲に含まれる。
【0028】
(システム構成)
図1及び
図2を用いて、本発明の概要について説明する。
図1は、本発明の一実施形態に係る情報処理システムのネットワーク構成を示す図である。
図2は、本発明の一実施形態に係る学習装置の処理及び推論装置の処理を説明する概略図である。
【0029】
情報処理システム1は、学習装置10、推論装置20及び記憶装置30を備える。学習装置10は、通信ネットワークNを介して、推論装置20及び記憶装置30に接続される。通信ネットワークNは、有線又は無線回線により構成された有線通信網及び無線通信網のいずれであってもよく、インターネットやLocal Area Network(LAN)であってよい。
【0030】
学習装置10は、記憶装置30に記憶された学習データに基づいて、機械学習モデルの学習を行い、学習済モデルを記憶装置30に記憶する。本実施形態に係る学習装置10は機械学習モデルを備えるが、機械学習モデルは、学習装置10と別体の装置に備えられてもよい。
【0031】
ここで、機械学習モデルとは、所定のモデル構造と、学習処理によって変動する処理パラメータとを有し、学習データから得られる経験に基づいてその処理パラメータが最適化されることで、識別精度が向上するモデルである。すなわち機械学習モデルは、学習処理によって最適な処理パラメータを学習するモデルである。機械学習モデルのアルゴリズムは、例えば、サポートベクターマシン、ロジスティック回帰、ニューラルネットワーク等を用いることができるが、その種類は特に限定されない。当該学習を行う機械学習モデルには、学習データによりすでに何らかの学習を行っているものもあれば、学習前のものも含む。
【0032】
なお、学習済モデルとは、任意の機械学習アルゴリズムによる機械学習モデルに対して、事前に適切な学習データを用いて学習を行ったモデルである。ただし、学習済モデルは、それ以上の学習を行わないものではなく、追加学習を行うこともできる。
【0033】
推論装置20は、学習済モデルを用いて、入力データの特徴に応じた出力データを出力する。本実施形態に係る推論装置20は、記憶装置30から取得した学習済モデルを用いて、推論を行う。ここで、学習済モデルを取得するとは、学習済モデルの機能を推論装置20において再現するために必要な情報を取得することをいう。例えば、機械学習モデルとしてニューラルネットワークを用いる場合、学習済モデルを取得するとは、少なくとも、ニューラルネットワークのレイヤ数、各レイヤに関するノード数、ノード間を繋ぐリンクの重みパラメータ、各ノードに関するバイアスパラメータ及び各ノードに関する活性化関数の関数形に関する情報を取得することをいう。
【0034】
記憶装置30は、機械学習モデルの学習に用いる学習データを記憶する。本実施形態に係る記憶装置30は、NPA領域のアノテーション情報が付与された眼底画像を学習データとして記憶している。また、記憶装置30は、学習装置10によって出力された学習済モデルを記憶する。
図1では、記憶装置30を単一の記憶装置として示しているが、記憶装置30は、1又は複数のファイルサーバによって構成されてよい。また、本実施形態では、血液循環異常領域の一例として、NPA領域のアノテーション情報が付与された眼底画像を学習データとしているが、別の実施形態では、新生血管が生じた領域など、他の血液循環異常領域のアノテーション情報が付与された眼底画像を学習データとして用いることもできるし、NPA領域及び新生血管が生じた領域の両方についてアノテーション情報が付与された眼底画像を学習データとして用いることもできる。
【0035】
ここで、本実施形態に係る学習装置10は、
図2に示されるように、機械学習モデルの学習時に、補助モデル(第1の学習済モデル)を用いる。本実施形態の補助モデルは、機械学習モデルの学習データである眼底画像を入力データとして受け取り、眼底画像中の血管領域を推定した血管画像を出力する学習済モデルである。学習装置10は、機械学習モデルの学習時に、アノテーション情報が付与された複数の眼底画像に加えて、補助モデルから出力される複数の血管画像を入力データとして用いる。本実施形態では、医用画像の一例である眼底画像を用いた例について説明するが、別の実施形態では、患者の他の検査対象部位の撮影により取得された、脳の画像や心筋の画像を用いることができる。
【0036】
眼底画像から導出された血管画像を機械学習モデルの学習に用いることで、アノテーション情報が付与された眼底画像のみで学習を行う場合と比較して効率的に機械学習モデルを学習させることができ、その結果、より少ない学習データで学習を収束させることができる。補助モデルの学習データは、境界が明快な血管領域についてアノテーション情報が付与された画像となる。そのため、補助モデルの学習データは比較的容易に収集することができる。
【0037】
同様に、本実施形態に係る推論装置20は、学習済モデル(第2の学習済モデル)を用いた推論時に、補助モデル(第1の学習済モデル)を用いる。推論装置20は、推論対象である眼底画像(第1画像)に加えて、当該眼底画像を入力データとして補助モデルから出力される血管画像(第2画像)を、NPA領域を推論する学習済モデルの入力データとして用いる。眼底画像から導出された血管画像をNPA領域の推論に用いることで、眼底画像のみで推論を行う場合と比較して高精度な推論を行うことができる。本実施形態では、血液循環異常領域の一例として、NPA領域を推論しているが、別の実施形態では、新生血管が生じた領域など、他の血液循環異常領域を推論してもよいし、NPA領域及び新生血管が生じた領域の両方を推論してもよい。
【0038】
なお、眼底画像中の血管領域を推定する学習済モデルから直接NPA領域を推論することは困難である。これは、血管位置の推論が局所的な情報を主に用いるのに対して、NPA領域の推論は、より広い領域の情報を必要とすることに起因する。
【0039】
(機能構成:学習装置)
図3は、本発明の一実施形態に係る学習装置のブロック図である。なお、
図3では、単一の学習装置10を想定し、必要な機能構成だけを示しているが、学習装置10を、複数のコンピュータシステムによる多機能の分散システムの一部として構成することもできる。
【0040】
学習装置10は、入力部110と、制御部120と、記憶部130と、通信部140とを備えている。
【0041】
入力部110は、学習装置10の管理者からの操作を受け付けるように構成され、キーボードやマウス、タッチパネル等によって実現することができる。
【0042】
制御部120は、プロセッサに相当するCPUやMPU等の演算処理部121及びRAM等のメモリ122を備えている。演算処理部121(プロセッサ)は、各種入力に基づき、記憶部130に記録されたプログラムをメモリ122に展開して実行することで、演算処理部121における後述する機能及び処理を実現する。このプログラムは、CD-ROM等のコンピュータ読み取り可能な非一時的な記録媒体に記憶され、若しくはネットワークを介して配布され、コンピュータにインストールされるものであってもよい。メモリ122は、演算処理部121(プロセッサ)によるプログラム実行に必要なワークメモリとして機能する。
【0043】
記憶部130は、ハードディスク等の記憶装置によって構成され、制御部120における処理の実行に必要な各種プログラムや、各種プログラムの実行に必要なデータ等を記録しておくものである。本実施形態では、記憶部130は、学習データ記憶部131及び補助モデル132を有していることが望ましい。
【0044】
学習データ記憶部131には、後述の機械学習モデル125の学習に用いる学習データが保存される。本実施形態では、学習データ記憶部131には、NPA領域のアノテーション情報が付与された眼底画像が保存される。
【0045】
補助モデル132には、機械学習モデル125の学習の補助に用いる学習済モデルが保存される。本実施形態では、補助モデル132には、眼底画像を入力データとして受け取り、眼底画像中の血管領域を推定した血管画像を出力する学習済モデルが保存されている。例えば、一実施形態では、血管領域のアノテーション情報が付与された眼底画像を用いて学習させた学習済モデルを補助モデル132として用いてもよい。
【0046】
通信部140は、学習装置10をネットワークに接続するように構成される。例えば、通信部140は、LANカード、アナログモデム、ISDNモデム等、及びこれらをシステムバス等の伝送路を介して処理部と接続するためのインタフェースから実現することができる。
【0047】
さらに、
図3に示すように、演算処理部121は、機能部として、学習データ取得部123、学習部124、機械学習モデル125及びモデル出力部126を備えている。
【0048】
学習データ取得部123は、後述の機械学習モデル125の学習に用いる学習データを取得して、学習データ記憶部131に記憶する。本実施形態では、学習データ取得部123は、記憶装置30からNPA領域のアノテーション情報が付与された眼底画像を取得して、学習データ記憶部131に記憶する。一実施形態では、学習データ取得部123は、NPA領域を含む眼底画像とNPA領域を含まない眼底画像とを含む学習データを記憶装置30から取得する。学習データ取得部123は、NPA領域を含む眼底画像とNPA領域を含まない眼底画像とが、例えば1対1など、所定の割合になるように学習データを取得してもよい。このようにすることで、学習データ中、NPA領域を含まない眼底画像が、NPA領域を含む眼底画像と比較して大幅に多くなるという学習に不利な事態を回避することができる。
【0049】
学習データ取得部123はまた、眼底画像から、当該眼底画像中の血管領域を示す血管画像を取得して、学習データ記憶部131に記憶する。本実施形態では、学習データ取得部123は、眼底画像を補助モデル132に入力して血管画像を取得して、学習データ記憶部131に記憶する。
【0050】
学習部124は、学習データ取得部123が取得した学習データを用いて、機械学習モデル125を学習させる。本実施形態では、学習部124は、眼底画像と当該眼底画像から導出された血管画像とを機械学習モデル125に入力して、機械学習モデル125を学習させる。
【0051】
機械学習モデル125は、NPA領域のアノテーション情報が付与された眼底画像と、当該眼底画像から導出された血管画像とを入力データとして受け取り、眼底画像中のNPA領域を示す情報を出力する。本実施形態では、機械学習モデル125の一例としてニューラルネットワークを用いた実施例について説明する。しかしながら、ニューラルネットワークは機械学習モデル125の一例にすぎず、学習装置10は、機械学習モデル125として他の構成を用いてもよい。
【0052】
一実施形態では、機械学習モデル125は、当該機械学習モデル125の初期設定と比較して大きなストライドの畳み込み層を有する。このようにすることで、機械学習モデル125は、血管領域の情報を大域的な範囲の情報として学習することができる。
【0053】
一実施形態では、学習部124は、推論の容易な領域の交差エントロピーロスの重みを動的に減衰させる損失関数を用いて機械学習モデル125を学習させてもよい。このようにすることで、機械学習モデル125の学習が、推論の容易な、NPA領域を含まない領域の学習に支配されることを防ぎ、推論が難しい、NPA領域を含む領域を効果的に学習することができる。
【0054】
また、NPA領域及び新生血管が生じた領域の両方についてアノテーション情報が付与された眼底画像を学習データとして用いる場合、学習部124は、異常のない領域、無灌流領域及び新生血管が生じた領域の順序尺度に少なくとも基づいて機械学習モデルを学習させてもよい。一実施形態では、新生血管が生じた領域はNPA領域が進行して生じた領域であるという特性を利用して、学習部124は、異常のない領域、NPA領域及び新生血管が生じた領域の順序を持つ領域間の分類の誤差を考慮する損失関数を用いて機械学習モデル125を学習させてもよい。例えば、学習部124は、新生血管が生じた領域のアノテーション情報が付与された眼底画像に対して、異常のない領域と推論する場合と比較してNPA領域と推論する場合の誤差が小さくなるような損失関数を用いて、機械学習モデル125を学習させてもよい。このようにすることで、異常のない領域、NPA領域及び新生血管が生じた領域の順序関係を効率的に機械学習モデルに学習させることができ、その結果、より少ない学習データで学習を収束させることが期待できる。
【0055】
また、NPA領域及び新生血管が生じた領域の両方についてアノテーション情報が付与された眼底画像を学習データとして用いる場合、一実施形態では、新生血管が生じた領域はNPA領域が進行して生じた領域であるという特性を利用して、学習部124は、異常のない領域、NPA領域及び新生血管が生じた領域の順序を持つ領域間の関係を考慮するアノテーション情報を付与した学習データを用いて、機械学習モデル125を学習させてもよい。例えば、学習部124は、新生血管が生じた領域へのアノテーション情報として、新生血管が生じた領域のみ正解データとして、異常のない領域、NPA領域及び新生血管が生じた領域の各確率を0、0、1とする確率分布を付与するのに代えて、正解データと関係がある他の領域にも確率を割り当てた、異常のない領域、NPA領域及び新生血管が生じた領域の各確率を0、0.1、0.9とする確率分布を付与した学習データを用いて、機械学習モデル125を学習させてもよい。このようにすることで、異常のない領域、NPA領域及び新生血管が生じた領域の順序関係を効率的に機械学習モデルに学習させることができ、その結果、より少ない学習データで学習を収束させることが期待できる。
【0056】
機械学習モデル125の学習が完了すると、モデル出力部126は、学習済モデルを記憶装置30に出力する。なお、学習部124は、例えば、所定数の学習データを用いて機械学習モデル125を学習させた後、学習を完了してもよいし、機械学習モデル125の精度が所定の条件を満たした場合に学習を完了してもよい。
【0057】
(機能構成:推論装置)
図4は、本発明の一実施形態に係る推論装置のブロック図である。なお、
図4では、単一の推論装置20を想定し、必要な機能構成だけを示しているが、推論装置20を、複数のコンピュータシステムによる多機能の分散システムの一部として構成することもできる。
【0058】
推論装置20は、入力部210と、制御部220と、記憶部230と、通信部240とを備えている。
【0059】
入力部210は、推論装置20の管理者からの操作を受け付けるように構成され、キーボードやマウス、タッチパネル等によって実現することができる。
【0060】
制御部220は、プロセッサに相当するCPUやMPU等の演算処理部221及びRAM等のメモリ222を備えている。演算処理部221(プロセッサ)は、各種入力に基づき、記憶部230に記録されたプログラムをメモリ222に展開して実行することで、演算処理部221における後述する機能及び処理を実現する。このプログラムは、CD-ROM等のコンピュータ読み取り可能な非一時的な記録媒体に記憶され、若しくはネットワークを介して配布され、コンピュータにインストールされるものであってもよい。メモリ222は、演算処理部221(プロセッサ)によるプログラム実行に必要なワークメモリとして機能する。
【0061】
記憶部230は、ハードディスク等の記憶装置によって構成され、制御部220における処理の実行に必要な各種プログラムや、各種プログラムの実行に必要なデータ等を記録しておくものである。本実施形態では、記憶部230は、画像記憶部231、補助モデル232及び学習済モデル233を有していることが望ましい。一実施形態では、記憶部230は、分類モデル234をさらに有してもよい。
【0062】
画像記憶部231には、推論対象の画像が保存される。本実施形態では、画像記憶部231には、NPA領域の推論を行う眼底画像が保存されている。
【0063】
補助モデル232には、推論の補助に用いる学習済モデルが保存される。本実施形態では、補助モデル232には、眼底画像を入力データとして受け取り、眼底画像中の血管領域を推定した血管画像を出力する学習済モデルが保存されている。例えば、一実施形態では、血管領域のアノテーション情報が付与された眼底画像を用いて学習させた学習済モデルを補助モデル232として用いてもよい。
【0064】
学習済モデル233には、推論に用いる学習済モデルが保存される。本実施形態では、学習済モデル233には、眼底画像と当該眼底画像から導出された血管画像を入力データとして受け取り、眼底画像中のNPA領域の推論を行う学習済モデルが保存される。すなわち、学習済モデル233は、NPA領域のアノテーション情報が付与された眼底画像と当該眼底画像から導出された血管画像とを含む学習データを用いて学習させた学習済モデルである。
【0065】
分類モデル234には、入力画像の分類に用いる学習済モデルが保存される。本実施形態では、分類モデル234には、眼底画像を入力データとして受け取り、NPA領域を含み得る画像とそれ以外の画像とに分類する学習済モデルが保存されている。すなわち、分類モデル234は、NPA領域の有無がアノテーション情報された眼底画像を用いて学習させた学習済モデルである。網膜疾患には、NPA領域が現れ得る疾患と、NPA領域とは無関係の疾患とがある。このような網膜疾患の特性を利用して、容易に分類モデル234の学習データを収集することができる。
【0066】
通信部240は、推論装置20をネットワークに接続するように構成される。例えば、通信部240は、LANカード、アナログモデム、ISDNモデム等、及びこれらをシステムバス等の伝送路を介して処理部と接続するためのインタフェースから実現することができる。
【0067】
さらに、
図4に示すように、演算処理部221は、機能部として、モデル取得部223、第1取得部224、第2取得部225、推論部226、分類部227及び出力部228を備えている。
【0068】
モデル取得部223は、推論に用いる学習済モデルを取得して、学習済モデル233に記憶する。本実施形態では、モデル取得部223は、記憶装置30から学習済モデルを取得して、学習済モデル233に記憶する。
【0069】
第1取得部224は、推論対象の画像を取得する。本実施形態では、第1取得部224は、NPA領域の推論を行う眼底画像を画像記憶部231から取得する。
【0070】
第2取得部225は、第1取得部224が取得した画像中の血管領域を示す血管画像を取得する。本実施形態では、第2取得部225は、眼底画像を補助モデル232に入力することで、眼底画像中の血管領域を示す血管画像を取得する。前述したように、本実施形態の補助モデル232は、眼底の画像から血管領域を推定するように学習された学習済モデルである。
【0071】
推論部226は、第1取得部224が取得した画像と第2取得部225が取得した画像とに基づいて、眼底画像中のNPA領域を推論する。本実施形態では、推論部226は、第1取得部224が取得した眼底画像と当該眼底画像から導出された血管画像とを学習済モデル233に入力して、眼底画像中のNPA領域を示す情報を取得する。
【0072】
一実施形態では、推論装置20は、推論の前処理として分類部227を用いてもよい。分類部227は、眼底画像を、NPA領域を含み得る画像とそれ以外の画像とに分類する。分類部227は、分類モデル234を用いて眼底画像を分類してもよい。このような前処理を行うことで、NPA領域を含み得る画像のみに対してNPA領域の推論を行うことができ、効率的に高精度な推論を行うことができる。
【0073】
出力部228は、推論部226が取得した情報に基づく推論結果を出力する。本実施形態では、出力部228は、推論部226が取得した眼底画像中のNPA領域を示す情報に基づく推論結果を出力する。一実施形態では、出力部228は、眼底画像中のNPA領域を示す情報に加えて、推論に用いた血管画像を出力してもよい。
【0074】
(学習処理)
図5を参照して、本発明の実施形態に係る学習装置の学習処理を詳細に説明する。本実施形態では、
図5で説明される学習処理を行う前に、学習装置10の管理者の管理の下、記憶装置30に学習データが格納されているものとする。なお、
図5に示す処理は、例えば、管理者が入力部110を介して学習済モデルを生成する処理を実行するための指示を入力することで実行される。
【0075】
ステップS501において、学習装置10の学習データ取得部123は、機械学習モデル125の学習に用いる学習データを取得して、学習データ記憶部131に記憶する。本実施形態では、学習データ取得部123は、記憶装置30からNPA領域のアノテーション情報が付与された複数の眼底画像を取得して、学習データ記憶部131に記憶する。ここでは、学習データ取得部123は、NPA領域を含む眼底画像とNPA領域を含まない眼底画像とを1対1の割合で記憶装置30から取得するものとする。このようにすることで、学習データ中、NPA領域を含まない眼底画像が、NPA領域を含む眼底画像と比較して大幅に多くなるという学習に不利な事態を回避することができる。
【0076】
次に、ステップS502において、学習データ取得部123は、眼底画像から、当該眼底画像中の血管領域を示す血管画像を取得して、学習データ記憶部131に記憶する。本実施形態では、学習データ取得部123は、眼底画像を補助モデル132に入力して血管画像を取得して、学習データ記憶部131に記憶する。
【0077】
次にステップS503において、学習装置10の学習部124は、学習データ取得部123が取得した学習データを用いて、機械学習モデル125を学習させる。本実施形態では、学習部124は、アノテーション情報が付与された眼底画像と当該眼底画像から導出された血管画像とを機械学習モデル125に入力して、機械学習モデル125を学習させる。
【0078】
本実施形態では、機械学習モデル125の一例としてニューラルネットワークを用いる。また、本実施形態では、機械学習モデル125は、当該機械学習モデル125の初期設定と比較して大きなストライドの畳み込み層を有する。このようにすることで、機械学習モデル125は、血管領域の情報を大域的な範囲の情報として学習することができる。
【0079】
さらに、本実施形態では、学習部124は、推論の容易な領域の交差エントロピーロスの重みを動的に減衰させる損失関数を用いて機械学習モデル125を学習させる。このようにすることで、機械学習モデル125の学習が、推論の容易な、NPA領域を含まない領域の学習に支配されることを防ぎ、推論が難しい、NPA領域を含む領域を効果的に学習することができる。
【0080】
機械学習モデル125の学習が完了すると、ステップS504において、学習装置10のモデル出力部126は、学習済モデルを記憶装置30に出力する。なお、学習部124は、例えば、所定数の学習データを用いて機械学習モデル125を学習させた後、学習を完了してもよいし、機械学習モデル125の精度が所定の条件を満たした場合に学習を完了してもよい。
【0081】
(推論処理)
図6を参照して、本発明の実施形態に係る推論装置の推論処理を詳細に説明する。本実施形態では、
図6で説明される推論処理を行う前に、推論装置20の管理者の管理の下、学習済モデル233に記憶装置30から取得した学習済モデルが格納されているものとする。また、推論装置20の画像記憶部231には、推論対象の眼底画像が格納されているものとする。なお、
図6に示す処理は、例えば、管理者が入力部210を介して推論処理を実行するための指示を入力することで実行される。
【0082】
ステップS601において、推論装置20の第1取得部224は、推論対象の画像を取得する。本実施形態では、第1取得部224は、NPA領域の推論を行う眼底画像を画像記憶部231から取得する。
【0083】
ステップS602において、推論装置20の分類部227は、第1取得部224が取得した眼底画像を、NPA領域を含み得る画像とそれ以外の画像とに分類する。ここでは、分類部227は、分類モデル234を用いて眼底画像を分類する。このような前処理を行うことで、NPA領域を含み得る画像のみに対してNPA領域の推論を行うことができ、効率的に高精度な推論を行うことができる。
【0084】
ステップS603において、NPA領域を含み得る画像について、推論装置20の第2取得部225は、第1取得部224が取得した画像中の血管領域を示す血管画像を取得する。本実施形態では、第2取得部225は、第1取得部224が取得した眼底画像を補助モデル232に入力することで、眼底画像中の血管領域を示す血管画像を取得する。前述したように、本実施形態の補助モデル232は、眼底の画像から血管領域を推定するように学習された学習済モデルである。
【0085】
ステップS604において、推論装置20の推論部226は、第1取得部224が取得した画像と第2取得部225が取得した画像とに基づいて、眼底画像中のNPA領域を推論する。本実施形態では、推論部226は、第1取得部224が取得した眼底画像と当該眼底画像から導出された血管画像とを学習済モデル233に入力して、眼底画像中のNPA領域を示す情報を取得する。
【0086】
ステップS605において、推論装置20の出力部228は、推論部226が取得した情報に基づく推論結果を出力する。本実施形態では、出力部228は、推論部226が取得した眼底画像中のNPA領域を示す情報に基づいて、
図2に示すような推論結果を出力する。一実施形態では、出力部228は、眼底画像中のNPA領域を示す情報に加えて、推論に用いた血管画像を出力してもよい。
【0087】
以上、本実施形態によれば、学習装置10は、眼底画像から導出された血管画像を機械学習モデルの学習に用いることで、眼底画像のみで学習を行う場合と比較して効率的に機械学習モデルを学習させることができ、その結果、より少ない学習データで学習を収束させることができる。
【0088】
また、本実施形態によれば、推論装置20は、推論対象である眼底画像から導出された血管画像をNPA領域の推論に用いることで、眼底画像のみで推論を行う場合と比較して高精度な推論を行うことができる。
【符号の説明】
【0089】
10…学習装置、110…入力部、120…制御部、121…演算処理部、122…メモリ、123…学習データ取得部、124…学習部、125…機械学習モデル、126…モデル出力部、130…記憶部、131…学習データ記憶部、132…補助モデル(第1の学習済モデル)、140…通信部、20…推論装置、210…入力部、220…制御部、221…演算処理部、222…メモリ、223…モデル取得部、224…第1取得部、225…第2取得部、226…推論部、227…分類部、228…出力部、230…記憶部、231…画像記憶部、232…補助モデル(第1の学習済モデル)、233…学習済モデル(第2の学習済モデル)、234…分類モデル、240…通信部、30…記憶装置、N…通信ネットワーク