(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024098848
(43)【公開日】2024-07-24
(54)【発明の名称】画像識別方法および画像識別プログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20240717BHJP
A61B 5/055 20060101ALI20240717BHJP
【FI】
G06T7/00 612
G06T7/00 350B
G06T7/00 660Z
A61B5/055 380
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023002604
(22)【出願日】2023-01-11
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002918
【氏名又は名称】弁理士法人扶桑国際特許事務所
(72)【発明者】
【氏名】烏谷 あゆ
(72)【発明者】
【氏名】石原 正樹
【テーマコード(参考)】
4C096
5L096
【Fターム(参考)】
4C096AA01
4C096AB37
4C096AB44
4C096AC05
4C096AD14
4C096AD24
4C096DB06
4C096DC20
4C096DC21
4C096DC28
4C096DC36
5L096AA09
5L096BA06
5L096BA13
5L096CA01
5L096FA59
5L096GA30
5L096GA34
5L096GA51
5L096HA13
5L096JA28
5L096KA04
5L096KA15
(57)【要約】
【課題】入力画像が特定の病変領域の画像かを高精度に識別する。
【解決手段】コンピュータが、人体の内部を撮影した断層画像から、断層画像上の同一位置を含み、かつサイズが異なる複数の部分画像を切り出し、複数の部分画像のそれぞれについて、特定の病変の領域である確率を算出し、複数の部分画像のうち、少なくとも中間的なサイズに対応する部分画像から算出された確率の寄与度が高くなるような計算により、複数の部分画像のそれぞれから算出された確率を統合して統合値を算出し、統合値が所定の閾値を超える場合に同一位置が特定の病変の領域であると識別する。
【選択図】
図7
【特許請求の範囲】
【請求項1】
コンピュータが、
人体の内部を撮影した断層画像から、前記断層画像上の同一位置を含み、かつサイズが異なる複数の部分画像を切り出し、
前記複数の部分画像のそれぞれについて、特定の病変の領域である確率を算出し、
前記複数の部分画像のうち、少なくとも中間的なサイズに対応する部分画像から算出された前記確率の寄与度が高くなるような計算により、前記複数の部分画像のそれぞれから算出された前記確率を統合して統合値を算出し、
前記統合値が所定の閾値を超える場合に前記同一位置が前記特定の病変の領域であると識別する、
画像識別方法。
【請求項2】
前記確率の算出は、入力画像が前記特定の病変の領域であるかを識別する学習済みモデルを用いて実行され、
前記学習済みモデルは、前記特定の病変の領域であることを示すラベルが付与された学習用画像として、前記特定の病変が写っている画像のうち、画像における前記特定の病変の領域の面積の割合が、0より大きい所定の下限閾値以上であり、1より小さい所定の上限閾値以下である画像を用いた機械学習によって生成される、
請求項1記載の画像識別方法。
【請求項3】
前記統合値は、前記複数の部分画像のそれぞれから算出された前記確率のうち中央値として算出される、
請求項1記載の画像識別方法。
【請求項4】
前記統合値は、前記複数の部分画像のうち、中間的な第1のサイズの前記部分画像から算出された前記確率と、前記第1のサイズより大きい第2のサイズの前記部分画像から算出された前記確率、または、前記第1のサイズより小さい第3のサイズの前記部分画像から算出された前記確率のうちの大きい値との寄与度が高くなるような計算によって算出される、
請求項1記載の画像識別方法。
【請求項5】
コンピュータが、
人体の内部を撮影した複数の断層画像に基づいて生成された三次元のボリュームデータから、前記ボリュームデータ内の同一位置を含み、かつサイズが異なる複数の三次元部分領域を切り出し、
前記複数の三次元部分領域のそれぞれについて、対応する三次元部分領域の各ボクセルの値を互いに直交する複数の方向に対して最小値投影または最大値投影することで複数の投影画像を生成し、生成された前記複数の投影画像に基づいて前記同一位置が特定の病変の領域である確率を算出し、
前記複数の三次元部分領域のうち、少なくとも中間的なサイズに対応する三次元部分領域から算出された前記確率の寄与度が高くなるような計算により、前記複数の三次元部分領域のそれぞれから算出された前記確率を統合して統合値を算出し、
前記統合値が所定の閾値を超える場合に前記同一位置が前記特定の病変の領域であると識別する、
画像識別方法。
【請求項6】
前記確率の算出は、三次元画像の各ボクセルの値を前記複数の方向に対して最小値投影または最大値投影することで生成された複数の入力投影画像の入力を受けて、前記三次元画像が前記特定の病変の領域であるかを識別する学習済みモデルを用いて実行され、
前記学習済みモデルは、
人体の内部を撮影した複数の学習用断層画像に基づく三次元の学習用ボリュームデータから、それぞれ所定サイズの三次元領域である複数の学習用部分領域を切り出し、
前記複数の学習用部分領域の中から、前記特定の病変の領域の体積の割合が、0より大きい所定の下限閾値以上であり、1より小さい所定の上限閾値以下である病変部分領域を特定し、
特定された前記病変部分領域の各ボクセルの値を前記複数の方向に対して最小値投影または最大値投影することで生成された複数の学習用投影画像を、前記特定の病変の領域であることを示すラベルが付与された学習用データとして用いて機械学習を実行する、
処理を含むモデル生成処理によって生成される、
請求項5記載の画像識別方法。
【請求項7】
コンピュータに、
人体の内部を撮影した断層画像から、前記断層画像上の同一位置を含み、かつサイズが異なる複数の部分画像を切り出し、
前記複数の部分画像のそれぞれについて、特定の病変の領域である確率を算出し、
前記複数の部分画像のうち、少なくとも中間的なサイズに対応する部分画像から算出された前記確率の寄与度が高くなるような計算により、前記複数の部分画像のそれぞれから算出された前記確率を統合して統合値を算出し、
前記統合値が所定の閾値を超える場合に前記同一位置が前記特定の病変の領域であると識別する、
処理を実行させる画像識別プログラム。
【請求項8】
コンピュータに、
人体の内部を撮影した複数の断層画像に基づいて生成された三次元のボリュームデータから、前記ボリュームデータ内の同一位置を含み、かつサイズが異なる複数の三次元部分領域を切り出し、
前記複数の三次元部分領域のそれぞれについて、対応する三次元部分領域の各ボクセルの値を互いに直交する複数の方向に対して最小値投影または最大値投影することで複数の投影画像を生成し、生成された前記複数の投影画像に基づいて前記同一位置が特定の病変の領域である確率を算出し、
前記複数の三次元部分領域のうち、少なくとも中間的なサイズに対応する三次元部分領域から算出された前記確率の寄与度が高くなるような計算により、前記複数の三次元部分領域のそれぞれから算出された前記確率を統合して統合値を算出し、
前記統合値が所定の閾値を超える場合に前記同一位置が前記特定の病変の領域であると識別する、
処理を実行させる画像識別プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像識別方法および画像識別プログラムに関する。
【背景技術】
【0002】
各種疾患の診断には、CT(Computed Tomography)やMRI(Magnetic Resonance Imaging)などによる医用画像が広く用いられている。医用画像を用いた画像診断では、医師は多数の画像を読影しなければならず、医師の負担が大きい。そのため、医師の診断作業をコンピュータによって何らかの形で支援する技術が求められている。
【0003】
医用画像を用いた診断支援技術として、次のような提案がある。例えば、医用画像における病変領域候補を識別する第1の識別器と、第1の識別器によって識別された病変候補領域が血管領域かを識別する第2の識別器とを有し、第2の識別器によって血管領域と識別されなかった病変候補領域を病変領域として検出する医用画像処理装置が提案されている。また、医用画像に含まれる病変候補領域を特定し、病変候補領域を複数の分割領域に分割し、分割された複数の部分領域に対応する特徴量をそれぞれ抽出する医用画像処理装置も提案されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2018-175343号公報
【特許文献2】特開2016-7270号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、医用画像から、撮影された領域が病変の領域かを識別する識別処理では、疾患によっては識別が難しい場合がある。例えば、特定の病変領域と、体内の正常な特定部位とが、画像上では類似する明るさで写るが、前者の病変領域と後者の特定部位の三次元形状は異なるというケースがある。このケースでは、病変領域と特定部位とが画像上に異なる形状で写っていれば、両者を識別できる可能性が高い。しかし、場合によっては両者が類似する形状で画像に写ることがあり、その場合には両者を正確に識別できない可能性がある。
【0006】
上記のケースでは、病変領域や特定部位が画像内に写っている大きさによって、識別精度に違いが生じる。そこで、医用画像の同一位置からサイズが異なる複数の部分画像を切り出し、各部分画像について病変領域かを識別する識別処理を実行し、得られた識別結果を組み合わせて最終的な識別結果を出力する方法が考えられる。しかし、この方法では、部分画像ごとに得られた識別結果をどのように組み合わせて最終的な識別結果を求めるかという点に課題がある。
【0007】
1つの側面では、本発明は、入力画像が特定の病変領域の画像かを高精度に識別可能な画像識別方法および画像識別プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
1つの案では、コンピュータが、人体の内部を撮影した断層画像から、断層画像上の同一位置を含み、かつサイズが異なる複数の部分画像を切り出し、複数の部分画像のそれぞれについて、特定の病変の領域である確率を算出し、複数の部分画像のうち、少なくとも中間的なサイズに対応する部分画像から算出された確率の寄与度が高くなるような計算により、複数の部分画像のそれぞれから算出された確率を統合して統合値を算出し、統合値が所定の閾値を超える場合に同一位置が特定の病変の領域であると識別する、画像識別方法が提供される。
【0009】
また、1つの案では、上記の画像識別方法と同様の処理をコンピュータに実行させる画像識別プログラムが提供される。
さらに、1つの案では、コンピュータが、人体の内部を撮影した複数の断層画像に基づいて生成された三次元のボリュームデータから、ボリュームデータ内の同一位置を含み、かつサイズが異なる複数の三次元部分領域を切り出し、複数の三次元部分領域のそれぞれについて、対応する三次元部分領域の各ボクセルの値を互いに直交する複数の方向に対して最小値投影または最大値投影することで複数の投影画像を生成し、生成された複数の投影画像に基づいて同一位置が特定の病変の領域である確率を算出し、複数の三次元部分領域のうち、少なくとも中間的なサイズに対応する三次元部分領域から算出された確率の寄与度が高くなるような計算により、複数の三次元部分領域のそれぞれから算出された確率を統合して統合値を算出し、統合値が所定の閾値を超える場合に同一位置が特定の病変の領域であると識別する、画像識別方法が提供される。
【0010】
また、1つの案では、上記の画像識別方法と同様の処理をコンピュータに実行させる画像識別プログラムが提供される。
【発明の効果】
【0011】
1つの側面では、入力画像が特定の病変領域の画像かを高精度に識別できる。
【図面の簡単な説明】
【0012】
【
図1】第1の実施の形態に係る画像識別装置の構成例および処理例を示す図である。
【
図2】第2の実施の形態に係る診断支援システムの構成例を示す図である。
【
図3】画像識別装置のハードウェア構成例を示す図である。
【
図4】病変識別処理の比較例を示す第1の図である。
【
図5】病変識別処理の比較例を示す第2の図である。
【
図6】病変識別処理の比較例を示す第3の図である。
【
図7】第2の実施の形態における病変識別処理の例を示す図である。
【
図13】学習処理装置および画像識別装置が備える処理機能の構成例を示す図である。
【
図14】学習処理装置による学習処理の手順を示すフローチャートの例である。
【
図15】学習用パッチ生成処理の手順を示すフローチャートの例である。
【
図16】画像識別装置による画像識別処理の手順を示すフローチャートの例である。
【
図17】スコア算出処理の手順を示すフローチャートの例である。
【
図18】識別結果出力処理の手順を示すフローチャートの例である。
【
図19】結合パッチの生成処理を説明するための第1の図である。
【
図20】結合パッチの生成処理を説明するための第2の図である。
【
図21】学習用パッチ生成処理の手順を示すフローチャートの例である。
【
図22】スコア算出処理の手順を示すフローチャートの例である。
【
図23】識別結果出力処理の手順を示すフローチャートの例である。
【発明を実施するための形態】
【0013】
以下、本発明の実施の形態について図面を参照して説明する。
〔第1の実施の形態〕
図1は、第1の実施の形態に係る画像識別装置の構成例および処理例を示す図である。
図1に示す画像識別装置1は、人体の内部を撮影した断層画像の入力を受け付けて、断層画像を分割した部分領域のそれぞれが特定の病変の領域かを識別する情報処理装置である。例えば、肝臓を含む領域の断層が撮影された場合において、各部分領域が腫瘤の領域と正常の領域のどちらであるかが識別される。なお、断層画像は、例えば、CT画像、MR画像などの医用画像である。
【0014】
ここで、病変領域と体内の正常な特定部位とが、部分画像上では類似する明るさで写るが、前者の病変領域と後者の特定部位の三次元形状は異なるというケースがある。このケースでは、病変領域と特定部位とが部分画像上に異なる形状で写っていれば、両者を識別できる可能性が高い。しかし、場合によっては両者が類似する形状で部分画像に写ることがあり、その場合には両者を正確に識別できない可能性がある。
【0015】
一方、断層画像から切り出される部分画像のサイズが異なる場合には、部分画像内に写る病変領域や特定部位の大きさも異なる。上記のように、病変領域と特定部位とは三次元形状が異なることから、断層画像から切り出す部分画像のサイズを変化させた場合、部分画像には形状の特徴が写りやすくなる場合もあれば、そうでない場合もある。このため、部分画像のサイズが異なり、部分画像に写っている病変領域や特定部位の大きさも異なっていれば、病変領域であるかの識別精度に違いが生じ得る。
【0016】
そこで、画像識別装置1は、断層画像上の同一位置について、サイズの異なる複数の部分画像を断層画像から切り出す。画像識別装置1は、切り出された複数の部分画像のそれぞれについて、病変領域である確率を算出し、算出された確率を統合することによって、上記の同一位置が病変領域であるかを最終的に識別する。
【0017】
画像識別装置1は、処理部1aを有する。処理部1aは、例えば、プロセッサである。処理部1aは、以下のような処理を実行する。
処理部1aは、入力された断層画像2から、断層画像2上の同一位置を含み、かつサイズが異なる複数の部分画像を切り出す。
図1の例では、断層画像2上の位置2aを含む3つのサイズの部分画像3a~3cが切り出される。この例では、部分画像3aのサイズが最も大きく、部分画像3bのサイズは部分画像3aより小さく、部分画像3cのサイズは部分画像3bより小さい。また、部分画像3a~3cには、上記の正常な特定部位が写っているものとする。なお、複数の部分画像は、例えば、同一位置を中心としたサイズの異なる画像として切り出されてもよい。
【0018】
処理部1aは、切り出された部分画像3a~3cのそれぞれについて、病変領域である確率を算出する。この算出では、例えば、入力画像が病変領域であるかを識別する学習済みモデルを用いて実行される。
図1の例では、確率は0から1の値をとるものとする。そして、部分画像3aからは確率が「0」と算出され、部分画像3bからは確率が「0.3」と算出され、部分画像3cからは確率「0.8」と算出されたとする。
【0019】
処理部1aは、部分画像3a~3cのそれぞれから算出された確率の値を統合して、統合値を算出する。そして、処理部1aは、算出された統合値が所定の閾値を超える場合に、位置2aが病変領域であると識別する。本実施の形態では、例として閾値は「0.5」であるとする。
【0020】
ここで、確率の統合処理の例としては、部分画像3a~3cのそれぞれから算出された確率の最大値を統合値として算出する方法が考えられる。しかし、この方法では正常領域(例えば、上記の正常な特定部位を含む領域)が病変領域であると誤って識別される可能性がある。例えば
図1では、確率の最大値は「0.8」となり、算出された統合値が閾値「0.5」を超えてしまうので、位置2aは病変領域であると誤って識別されてしまう。
【0021】
これに対して、本実施の形態の処理部1aは、部分画像3a~3cのうち、少なくとも中間的なサイズに対応する部分画像から算出された確率の寄与度が高くなるような計算によって、統合値を算出する。
図1の例では、中間的なサイズに対応する部分画像は部分画像3bであり、部分画像3bから算出された確率「0.3」の寄与度が高くなるような計算が行われる。これにより、算出された統合値が閾値「0.5」を超えない可能性が高くなり、位置2aは正常領域であると識別される可能性が高くなる。
【0022】
一方、例えば、部分画像3cの領域に、
図1の特定部位と同じような面積で病変領域が写っていたとする。この場合、部分画像3b,3cで閾値「0.5」を超える確率が算出される可能性が高くなる。一方、部分画像3aでは、病変領域が相対的に小さ過ぎることから、確率は比較的低い値になる可能性が高い。このため、中間的なサイズに対応する部分領域から算出された確率の寄与度が高くなるような計算によって統合値が算出されることで、病変領域であると正しく識別される可能性が高くなる。
【0023】
以上のように、本実施の形態の画像識別装置1によれば、入力画像が特定の病変領域の画像かを高精度に識別できる。
〔第2の実施の形態〕
次に、病変の一例として肝臓内の腫瘤を検出可能なシステムについて説明する。
【0024】
図2は、第2の実施の形態に係る診断支援システムの構成例を示す図である。
図2に示す診断支援システムは、MRI撮影による画像診断作業を支援するシステムであり、MRI装置11,21、学習処理装置12および画像識別装置22を含む。なお、画像識別装置22は、
図1に示した画像識別装置1の一例である。
【0025】
MRI装置11,21は、人体のMR画像を撮影する。本実施の形態では、MRI装置11,21は、肝臓を含む腹部領域におけるアキシャル面の断層画像を、人体の高さ方向(アキシャル面に垂直な方向)に対する位置(スライス位置)を所定間隔で変えながら所定枚数撮影する。また、本実施の形態では、MRI装置11,21は、ガドキセト酸ナトリウム(Gd-EOB-DTPA,EOB:Ethoxybenzyl,DTPA:Diethylenetriamine Penta-acetic Acid)を有効成分とする肝臓用造影剤を用いた撮影を行い、肝細胞造影相を用いるものとする。以下、この造影剤を「EOB造影剤」と記載する。
【0026】
画像識別装置22は、MRI装置21によって撮影された各断層画像から病変領域を検出する。本実施の形態では、病変領域として肝臓内の腫瘤が検出されるものとする。また、画像識別装置22は、機械学習によって生成された病変識別モデルを用いて病変領域を検出する。また、画像識別装置22は、例えば、病変領域の識別結果を示す情報を表示装置に表示させる。これにより画像識別装置22は、ユーザ(例えば読影医)の画像診断作業を支援する。
【0027】
学習処理装置12は、画像識別装置22で利用される病変識別モデルを、機械学習によって生成する。このモデル生成処理のために、学習処理装置12は、MRI装置11によって撮影された各断層画像から学習用データを生成し、生成された学習用データを用いて機械学習を実行する。学習処理装置12によって生成された病変識別モデルを示すデータ(モデルパラメータ)は、例えばネットワークを介して、あるいは可搬型の記録媒体を介して画像識別装置22に読み込まれる。
【0028】
なお、学習処理装置12と画像識別装置22とに対しては、同一のMRI装置から撮影画像が入力されてもよい。また、学習処理装置12は、MRI装置から撮影画像を直接的に取得するのではなく、記録媒体などを介して取得してもよい。さらに、学習処理装置12と画像識別装置22は、同一の情報処理装置であってもよい。
【0029】
図3は、画像識別装置のハードウェア構成例を示す図である。画像識別装置22は、例えば、
図3に示すようなコンピュータとして実現される。
図3に示すように、画像識別装置22は、プロセッサ201、RAM(Random Access Memory)202、HDD(Hard Disk Drive)203、GPU(Graphics Processing Unit)204、入力インタフェース(I/F)205、読み取り装置206および通信インタフェース(I/F)207を備える。
【0030】
プロセッサ201は、画像識別装置22全体を統括的に制御する。プロセッサ201は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)またはPLD(Programmable Logic Device)である。また、プロセッサ201は、CPU、MPU、DSP、ASIC、PLDのうちの2以上の要素の組み合わせであってもよい。なお、プロセッサ201は、
図1に示した処理部1aの一例である。
【0031】
RAM202は、画像識別装置22の主記憶装置として使用される。RAM202には、プロセッサ201に実行させるOS(Operating System)プログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM202には、プロセッサ201による処理に必要な各種データが格納される。
【0032】
HDD203は、画像識別装置22の補助記憶装置として使用される。HDD203には、OSプログラム、アプリケーションプログラム、および各種データが格納される。なお、補助記憶装置としては、SSD(Solid State Drive)などの他の種類の不揮発性記憶装置を使用することもできる。
【0033】
GPU204には、表示装置204aが接続されている。GPU204は、プロセッサ201からの命令にしたがって、画像を表示装置204aに表示させる。表示装置204aとしては、液晶ディスプレイや有機EL(Electroluminescence)ディスプレイなどがある。
【0034】
入力インタフェース205には、入力装置205aが接続されている。入力インタフェース205は、入力装置205aから出力される信号をプロセッサ201に送信する。入力装置205aとしては、キーボードやポインティングデバイスなどがある。ポインティングデバイスとしては、マウス、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
【0035】
読み取り装置206には、可搬型記録媒体206aが脱着される。読み取り装置206は、可搬型記録媒体206aに記録されたデータを読み取ってプロセッサ201に送信する。可搬型記録媒体206aとしては、光ディスク、半導体メモリなどがある。
【0036】
通信インタフェース207は、ネットワークを介して、MRI装置21などの他の装置との間でデータの送受信を行う。
以上のようなハードウェア構成によって、画像識別装置22の処理機能を実現することができる。なお、学習処理装置12も、
図3に示すようなハードウェア構成のコンピュータとして実現可能である。
【0037】
次に、
図4~
図6を用いて、病変識別処理の比較例について説明する。
図4は、病変識別処理の比較例を示す第1の図である。病変識別の方法として、機械学習によって生成された病変識別モデルを用いる方法がある。例えば
図4に示すように、各断層画像から一定サイズの画像領域である「パッチ」を切り出し、パッチを単位として病変識別処理を実行する方法がある。
【0038】
図4の例では、MRI装置から断層画像セットが取得され(ステップS11)、断層画像セットに含まれる各断層画像からパッチが生成される(ステップS12)。パッチは、例えば、16画素×16画素などの一定サイズで断層画像を分割することで生成される。
【0039】
このようにして生成されたパッチが、事前の機械学習によって生成された病変識別モデルに入力される。これによって、パッチにおける病変が識別される(ステップS13)。
図4の例では、病変識別モデルによって病変A、病変B、正常(病変でない)のどれであるかが識別される。実際には、病変A、病変B、正常のクラスごとに、クラスに属する確率を示すスコアが算出される。あるクラスに対応するスコアが所定の閾値を超えた場合に、そのクラスに属すると判定される。
【0040】
学習モデルを生成するための学習用データも、上記と同様の手順で断層画像から切り出されたパッチとして生成される。すなわち、学習用のパッチに対して病変A、病変B、正常のどれかを示すラベルが付加され、ラベルが付加された学習用のパッチによって機械学習が行われ、病変識別モデルが生成される。
【0041】
本実施の形態の画像識別装置22では、断層画像としてEOB造影剤を用いたMR画像を入力として、腫瘤(病変の一例)と正常(腫瘤でない)のどちらであるかを識別する病変識別モデルが利用される。ここで、EOB造影剤を用いたMR画像において、臓器(ここでは肝細胞相に写る肝臓)内の腫瘤は臓器に対して暗く描出されるが、臓器内の血管も同様に臓器に対して暗く描出される。このため、
図4の方法を用いて腫瘤を識別する場合、血管の領域(すなわち正常の領域)が腫瘤の領域と誤って識別される可能性がある。
【0042】
図5は、病変識別処理の比較例を示す第2の図である。
図5(A)は小さいパッチ(小パッチ)を用いた場合の識別例を示し、
図5(B)は大きいパッチ(大パッチ)を用いた場合の識別例を示し、
図5(C)は大パッチを用いた場合の他の識別例を示す。
【0043】
図5(A)において、パッチP1には、腫瘤の一部がある程度以上の大きさで写っている。このようなパッチP1が病変識別モデルに入力された場合、腫瘤である確率を示すスコアとしては比較的高い値が算出されるので、パッチP1は腫瘤と正しく識別される。
【0044】
また、パッチP2には、血管が管状の形状で写っている。このようなパッチP2が病変識別モデルに入力された場合、比較的低いスコアが算出されるので、パッチP2は正常と正しく識別される。すなわち、パッチP2のようなケースでは、腫瘤との形状の違いから誤識別が発生しにくい。
【0045】
しかし、パッチP3は、血管の一部をかすめるように配置されている。このため、パッチP3には、管状という血管の形状の特徴が表れていない。なおかつ、パッチP3には、パッチP1における腫瘤の領域と同程度の面積で血管の領域が写っている。このようなパッチP3が病変識別モデルに入力された場合、パッチP1と同程度のスコアが算出される可能性がある。その場合、パッチP3は腫瘤と誤って識別されてしまう。
【0046】
図5(B)は、パッチP1~P3より大きなパッチP4,P5を用いた場合の識別例を示している。パッチP4には腫瘤が写っており、比較的高いスコアが算出される。このため、パッチP4は腫瘤と正しく判定される。パッチP5には、血管が管状の形状で写っており、比較的低いスコアが算出される。このため、パッチP5は正常と正しく判定される。
【0047】
図5(A)のように小パッチを用いた場合には、血管に対するパッチの位置によっては誤識別が発生する可能性がある。一方で、
図5(B)のように大パッチを用いた場合には、血管の形状の特徴がパッチ上に表れやすく、誤識別が発生しにくい。
【0048】
しかし、パッチが大きいほど誤識別が発生しにくいとは言えない。例えば、
図5(C)には、パッチP4,P5と同じ大きさのパッチP6に、腫瘤が小さく写っている。この場合、腫瘤の大きさが小さ過ぎることから比較的低いスコアが算出される場合があり、その場合には正常と誤って識別されてしまう。
【0049】
以上のように、パッチの大きさが変わることで誤識別の発生の仕方も変わる。ある大きさのパッチは、ある種類の識別対象に対しては誤識別しにくくなるが、別の種類の識別対象に対しては逆に誤識別しやすくなる可能性がある。すなわち、腫瘤や血管などの識別対象の種類ごとに、適切なパッチサイズは異なる可能性があり、病変識別のための適切なパッチサイズを事前に知ることは不可能である。
【0050】
このような課題に対して、複数サイズ(複数スケール)のパッチを用いて病変識別を行い、それらの識別結果を統合して最終結果を出力する方法が考えられる。この方法は、マルチスケール法と呼ばれる場合もある。マルチスケール法を用いた場合の識別例を
図6に示す。
【0051】
図6は、病変識別処理の比較例を示す第3の図である。
図6では、あるサイズのパッチ(ここでは「大パッチ」とする)と、縦横のサイズがその大パッチの1/2であるパッチ(ここでは「小パッチ」とする)とを用いた場合の識別例を示している。また、各パッチを病変識別モデルに入力したときのスコアを、4段階の値で示している。
【0052】
なお、大パッチを用いた病変識別処理と小パッチを用いた病変識別処理は、同一の病変識別モデルを用いて実行可能である。例えば、大パッチと同じサイズのパッチを用いて学習された病変識別モデルが用いられたとする。この場合、大パッチはそのまま病変識別モデルに入力されればよい。一方、小パッチは大パッチと同じサイズに拡大され、拡大された小パッチが病変識別モデルに入力されればよい。
【0053】
図6に示すように、1つの大パッチ、および4つの小パッチのそれぞれについて、病変識別モデルを用いてスコアが算出される。そして、各小パッチと、大パッチにおける小パッチに対応する領域との間でスコアが統合される。なお、実際には例えば、大パッチが小パッチの大きさに分割され、分割された各パッチに大パッチのスコアが対応付けられる(スコア補間)。そして、分割された各パッチと、各パッチの位置に対応する小パッチとの間でスコアが統合される。
【0054】
スコア統合方法の一例として、統合対象の各パッチのスコアの最大値を算出する方法が考えられる。この方法では、スケールの異なるパッチのうちの少なくとも1つでスコアが高ければ、腫瘤と識別されることになる。例えば、大パッチでは小さく写った腫瘤も、小パッチでは適切な大きさで写り、小パッチでは高いスコアが算出される。このため、最大値で統合することで小さな腫瘤を検出できる可能性が高まる。
【0055】
しかし、
図6のように血管が写った場合、血管を腫瘤と誤って識別する場合があり得る。例えば、小パッチP11,P12には、血管の一部が写っているが、管状という血管の形状の特徴が明確には表れていない。このため、小パッチP11,P12については比較的高いスコアが算出される。この場合、大パッチと小パッチとの間で最大値によってスコアを統合すると、小パッチP11,P12にそれぞれ対応する統合後のパッチP11a,P12aについては、比較的高いスコアが算出される。したがって、パッチP11a,P12aは腫瘤であると誤って識別されてしまう。また、上記の課題は3つ以上のサイズのパッチを用いた場合でも出現する。
【0056】
そこで、本実施の形態の画像識別装置22は、3つ以上のサイズのパッチを用いて病変識別処理を実行した上で、上記とは異なるスコア統合処理を実行する。
図7は、第2の実施の形態における病変識別処理の例を示す図である。
図7は、腫瘤および血管を、小パッチ、中パッチおよび大パッチという3つのサイズのパッチを用いて識別する場合を示している。なお、パッチサイズとしては、次のようなパターンを採用可能である。例えば、小パッチのサイズが現実空間での6mm×6mmの領域であり、中パッチのサイズが現実空間での12mm×12mmの領域であり、大パッチのサイズが現実空間での24mm×24mmの領域である。
【0057】
腫瘤と血管とで、パッチサイズによってスコアの傾向に違いが生じ得るという特徴がある。具体的には、腫瘤は、適切なサイズのパッチで高いスコアとなり、そのサイズに比較的近く、それより大きいサイズと小さいサイズの各パッチで、中程度のスコアとなる場合が多い。一方、血管に関しては、画像上の血管が大きく写るような小さいサイズのパッチで高いスコアとなり(すなわち、誤識別され)、それよりサイズが大きく、血管が管状に写るようなパッチで低いスコアとなる場合が多い。
【0058】
図7は、小パッチで病変識別処理を実行した場合に誤識別が発生しやすいケースを示している。この例では、腫瘤は小パッチに適切な大きさで写っており、小パッチからは高いスコアが算出される。また、中パッチにおいては腫瘤の大きさが適切な大きさより小さくなることから、中パッチからは中程度のスコアが算出される。そして、大パッチにおいては腫瘤の大きさが小さ過ぎることから、大パッチからは低いスコアが算出される。
【0059】
一方、
図7に示す血管は、その幅が腫瘤の直径と同程度であるとする。この場合、小パッチには、血管の形状の特徴が表れない状態で血管の一部が含まれることから、小パッチからは高いスコアが算出される。すなわち、誤識別が発生している。また、中パッチおよび大パッチには、血管の形状の特徴が表れた状態で血管の一部が含まれることから、中パッチおよび大パッチからは低いスコアが算出される。
【0060】
以上の特徴に鑑みて、本実施の形態の画像識別装置22は、近いサイズの複数のパッチで閾値を超えるスコアが算出されている場合に腫瘤であると判定されるような計算方法を用いて、異なるサイズのパッチ間でスコアを統合する。
図7の例では、腫瘤に関しては小パッチと中パッチとである程度高いスコアが算出されているので、腫瘤であると正しく識別される。一方、血管に関しては、小パッチでのみ高いスコアが算出され、中パッチおよび大パッチでは低いスコアが算出されているので、正常であると正しく識別される。このようなスコア統合処理によれば、血管のパッチに関して、誤識別が発生しているサイズのスコアが抑制されるような計算が行われるので、血管が腫瘤と誤って識別される可能性を低減できる。
【0061】
スコア統合のための具体的な計算方法としては、次のような方法を採用可能である。ここでは、統合後のスコアSを計算するための処理Fを、S=F(si-k,si,si+k)と定義する。この処理Fにおいて、siは、着目するi番目のサイズのパッチのスコアを示す。変数kは、任意の自然数であり、パッチサイズを小さい順に並べた場合に、i番目のサイズからk番だけ離れたパッチサイズを指定するために利用される。すなわち、si-kは、i番目のサイズよりk番だけ小さいサイズのパッチのスコアを示し、si+kは、i番目のサイズよりk番だけ大きいサイズのパッチのスコアを示す。パッチサイズが3つの場合、k=1となる。パッチサイズが4つ以上の場合、kは、パッチサイズの個数(スケール数)の1/2(上限値)より小さい任意の自然数となる。後者の場合、kは例えばユーザによって設定されればよいが、上記の上限値に近過ぎない値の方が望ましい。
【0062】
処理Fを示す計算式としては、例えば、次の式(1)~(4)のいずれかを用いることができる。
F(si-k,si,si+k)=median(si-k,si,si+k) ・・・(1)
F(si-k,si,si+k)=max(min(si-k,si),min(si,si+k)) ・・・(2)
F(si-k,si,si+k)=si-k/4+si/2+si+k/4 ・・・(3)
F(si-k,si,si+k)=si/2+max(si-k,si+k)/2 ・・・(4)
ただし、median(x1,x2,x3,・・・)は、x1,x2,x3,・・・を昇順または降順に並べたときの中央値(順位が中央の値)を示す。max(x,y)は、x,yのうち大きい方の値を示し、min(x,y)は、x,yのうち小さい方の値を示す。
【0063】
上記の式(1)~(4)のいずれも、実質的には、中間的なパッチサイズのスコアの寄与度が高くなるような計算が行われる。例えば、式(3)では、中間的なパッチサイズでのスコアに対して大きな重みが付与される。血管の場合、中間的なパッチサイズでのみスコアが高くなる可能性は低いため、式(3)により血管が腫瘤と誤って識別される可能性が低減される。
【0064】
また、式(1)では、中間的なパッチサイズのスコアが中間値として出力される可能性が高くなる。これは上記のように、血管の場合には中間的なパッチサイズでのみスコアが高くなる可能性が低いためである。例えば
図7のケースで式(1)が適用された場合、腫瘤に関してはスコアの中央値が中間的な値となり、腫瘤と識別される。一方、血管に関してはスコアの中央値が低い値となり、正常と識別される。
【0065】
式(2)および式(4)では、中間的なパッチサイズと、それに近いいずれかのパッチサイズの両方でスコアが高い場合に、統合後のスコアが高くなる可能性が高い。この理由も上記の通り、血管の場合には中間的なパッチサイズでのみスコアが高くなる可能性が低いためである。
【0066】
このように、本実施の形態の画像識別装置22によれば、腫瘤の検出精度を高めつつ、血管を腫瘤と誤って識別する可能性を低減でき、病変検出精度を向上させることができる。
【0067】
また、上記のように、腫瘤と血管とで、パッチサイズによってスコアの傾向に違いが生じ得るという特徴がある。このような特徴を病変識別処理においてより顕著に出現させるために、病変識別モデルを機械学習する際の学習用データを以下のように作成することが望ましい。
【0068】
図8は、学習用パッチの生成処理例を示す図である。腫瘤ラベルが付与される学習用パッチ(腫瘤パッチ)を生成する場合、学習処理装置12はまず、断層画像をパッチに分割し、分割されたパッチの中から腫瘤が写っているパッチを腫瘤パッチ候補として特定する。次に、学習処理装置12は、腫瘤パッチ候補のそれぞれについて、パッチの領域のうち腫瘤が写っている領域の面積の割合(占有率)を算出する。そして、学習処理装置12は、腫瘤パッチ候補の中から、占有率が所定の下限閾値TH
min以上であり、かつ所定の上限閾値TH
max以内であるパッチだけを腫瘤パッチとして決定し、それ以外のパッチを除外する。
【0069】
下限閾値THminから上限閾値THmaxまでの範囲は、パッチ内に写っている腫瘤の大きさが適切と判定される範囲を示す。例えば、腫瘤は断層画像上でほぼ円状となる。そこで、学習処理装置12は、一辺がパッチの幅の1/2となる正方形に収まる円の面積を基に下限閾値THminを下記の式(5a)により算出し、パッチに収まる円の面積を基に上限閾値THmaxを下記の式(5b)により算出する。
THmin=π(1/4)2 ・・・(5a)
THmax=π(1/2)2 ・・・(5b)
また、撮影された複数の断層画像に基づく三次元の画像データを基に下限閾値THminおよび上限閾値THmaxを算出することもできる。例えば、学習処理装置12は、複数の断層画像を基に生成される三次元のボリュームデータから、パッチを一面またはその内部(例えば中央部)に含む立方体のブロックを切り出す。腫瘤はほぼ球状であることから、学習処理装置12は、一辺がブロックの一辺の1/2となる立方体に収まる球の体積を基に下限閾値THminを下記の式(6a)により算出し、ブロックに収まる球の体積を基に上限閾値THmaxを下記の式(6b)により算出する。
THmin=(4/3)π(1/4)3 ・・・(6a)
THmax=(4/3)π(1/2)3 ・・・(6b)
一例として、式(6a)および式(6b)を用いた場合の実際の処理では、式(6a)の値が約0.065となり、式(6b)の値が約0.524となることから、THmin=6%、THmax=52%を使用することができる。
【0070】
学習処理装置12は、上記のように決定された腫瘤パッチを学習用データとして用いて機械学習を行い、病変識別モデルを生成する。これにより、腫瘤が適切な面積で写っているパッチからは高いスコアが算出されるが、腫瘤の面積が小さ過ぎるパッチや大き過ぎるパッチからはより低いスコアが算出されるような病変識別モデルを生成することができる。そして、このような病変識別モデルを用いて
図7に示したスコア統合処理を実行することで、腫瘤の検出精度を高めつつ、血管を腫瘤と誤って識別する可能性を低減でき、病変検出精度を向上させることができる。
【0071】
次に、
図9~
図12を用いてスコア統合処理の例について説明する。
図9~
図12では例として、前述の式(1)を用いてスコアが統合されるものとする。
図9は、スコア統合処理例を示す第1の図である。
図9では、腫瘤が写っている画像領域でのスコア統合処理を例示している。スコアは0から1までの値をとるものとし、腫瘤と判定するための閾値を0.5とする。
【0072】
画像識別装置22は、断層画像を大パッチ、中パッチおよび小パッチに分割する。次に、画像識別装置22は、大パッチ、中パッチおよび小パッチを病変識別モデルに入力して、パッチごとのスコアを算出する。次に、画像識別装置22は、異なるサイズのパッチ間でスコアを統合するために、スコア補間を実行する。スコア補間では、例えば、最近傍補間法が用いられる。この場合、大パッチが小パッチのサイズに分割され、分割された各パッチに対して元の大パッチのスコアが割り当てられる。中パッチも同様に、小パッチのサイズに分割され、分割された各パッチに対して元の中パッチのスコアが割り当てられる。
【0073】
なお、スコア補間としては、このような最近傍補間法に限らず、例えば双一次補間法、双三次補間法などの他の方法が用いられてもよい。また、上記の例では小パッチを単位としてスコア補間が行われたが、例えばピクセル単位やボクセル単位でスコア補間が行われてもよい。特に、ピクセル単位やボクセル単位の場合には、双一次補間法や双三次補間法を用いてスコア補間が行われることが望ましい。
【0074】
次に、画像識別装置22は、同じ位置のパッチ同士で式(1)を用いてスコアを統合する。例えば、パッチP21a~P21cの統合では、中央値の「0.1」が統合後のスコアとして算出される。また、腫瘤が写っているパッチP22a~P22cの統合では、中央値の「0.7」が統合後のスコアとして算出される。そして、画像識別装置22は、統合後のスコアが閾値「0.5」を超えた場合に、そのパッチを腫瘤と識別する。
図9の例では、腫瘤が含まれるパッチP22のみが腫瘤と識別され、その他のパッチが正常と識別される。なお、
図9の例では、中パッチに基づくパッチP22bのスコアと小パッチであるパッチP22cのスコアがともに閾値「0.5」を超えている。
【0075】
図10は、スコア統合処理例を示す第2の図である。
図10では、血管が写っている画像領域でのスコア統合処理を例示している。
図9と同様に、スコアは0から1までの値をとるものとし、腫瘤と判定するための閾値を0.5とする。
【0076】
図9の場合と同様に、画像識別装置22は、断層画像を大パッチ、中パッチおよび小パッチに分割し、分割された各パッチを病変識別モデルに入力して、パッチごとのスコアを算出する。次に、画像識別装置22は、スコア補間を実行して小パッチ単位の領域のスコアを算出し、同じ位置のパッチ同士で式(1)を用いてスコアを統合する。そして、画像識別装置22は、統合後のスコアが閾値を超えた場合に、そのパッチを腫瘤と識別する。
【0077】
図10の例では、すべてのパッチが正常と識別される。例えば、パッチP23a~P23cの統合では、中央値の「0.3」が統合後のスコアとして算出される。このスコアは閾値以下であるため、パッチP23a~P23cに対応するパッチP23は正常と識別される。
【0078】
ここで、
図10では、
図6に示したように最大値によってスコアを統合した場合の例を、比較例として示している。この比較例では、パッチP23についての統合後のスコアは「0.8」となって閾値を超えるので、パッチP23は腫瘤であると誤って識別される。また、比較例ではその他に、パッチP24,P25でも統合後のスコアが閾値を超え、パッチP24,P25も腫瘤であると誤って識別される。これに対して、本実施の形態のスコア統合処理によれば、このような誤識別の発生を抑止できる。
【0079】
図11は、スコア統合処理例を示す第3の図である。また、
図12は、スコア統合処理例を示す第4の図である。
図11では、
図9の例より腫瘤が大きく写っている画像領域でのスコア統合処理例を示している。
図12では、
図11の例よりさらに腫瘤が大きく写っている画像領域でのスコア統合処理例を示している。なお、
図11および
図12では、スコアを4段階で示し、高スコア側の2つの段階について閾値判定により腫瘤と判定されるものとする。
図11および
図12によれば、腫瘤がより大きく写っている場合でも腫瘤を検出可能であることがわかる。
【0080】
次に、学習処理装置12および画像識別装置22の処理について詳しく説明する。
図13は、学習処理装置および画像識別装置が備える処理機能の構成例を示す図である。
【0081】
学習処理装置12は、記憶部110、学習用データ生成部121および学習処理部122を備える。
記憶部110は、学習処理装置12が備える記憶装置に確保される記憶領域である。記憶部110には、腫瘤識別用の学習済みモデル(腫瘤識別モデル)を示すモデルパラメータ111が記憶される。例えば、腫瘤識別モデルがニューラルネットワークによって形成される場合、モデルパラメータ111にはニューラルネットワーク上のノード間の重み係数が含まれる。
【0082】
学習用データ生成部121および学習処理部122の処理は、例えば、学習処理装置12が備えるプロセッサが所定のプログラムを実行することで実現される。学習用データ生成部121は、MRI装置11による撮影によって得られた1組以上の断層画像セットに基づいて、腫瘤識別モデルを機械学習によって生成するための学習用データを生成する。学習処理部122は、生成された学習用データを用いて機械学習を実行することで腫瘤識別モデルを生成し、腫瘤識別モデルを示すモデルパラメータ111を記憶部110に格納する。
【0083】
画像識別装置22は、記憶部210、入力データ生成部221、スコア算出部222、スコア統合部223および病変領域識別部224を備える。
記憶部210は、RAM202やHDD203など、画像識別装置22が備える記憶装置に確保される記憶領域である。記憶部210には、臓器領域識別用の学習済みモデル(臓器領域識別モデル)を示すモデルパラメータ211と、腫瘤識別モデルを示すモデルパラメータ111が記憶される。
【0084】
臓器領域識別モデルは、断層画像セットにおける臓器(肝臓)の領域を識別するための識別器を示す学習済みモデルであり、機械学習によってあらかじめ生成される。モデルパラメータ111は、学習処理装置12によって生成され、例えばネットワークを介して、あるいは可搬型の記録媒体を介して画像識別装置22に読み込まれ、記憶部210に格納される。
【0085】
入力データ生成部221、スコア算出部222、スコア統合部223および病変領域識別部224の処理は、例えば、プロセッサ201が所定のプログラムを実行することで実現される。
【0086】
入力データ生成部221は、MRI装置21による撮影によって得られた断層画像セットに基づいて、三次元のボリュームデータを生成する。入力データ生成部221は、モデルパラメータ211に基づく学習済みモデルに対してボリュームデータを入力して、ボリュームデータのボクセルの中から臓器領域のボクセルを特定する。入力データ生成部221は、ボリュームデータに複数のスライス面を設定し、スライス面ごとに断層画像を生成して、各断層画像から複数サイズ(本実施の形態では3つのサイズ)のパッチを生成する。ただし、臓器領域を含むパッチのみが病変識別の対象として選択される。
【0087】
スコア算出部222は、モデルパラメータ111に基づく病変識別モデルに対して生成されたパッチを入力し、パッチごとに腫瘤である確率を示すスコアを算出する。このスコア算出では、入力されるパッチが、病変識別モデルにおいて規定されたパッチサイズ(学習時に使用されたパッチのサイズ)に必要に応じて拡大または縮小されて、病変識別モデルに入力される。
【0088】
スコア統合部223は、サイズの異なるパッチの間でスコアを統合する。この統合処理では、スコア補間処理により、大パッチおよび中パッチが小パッチと同じサイズに分割され、分割されたパッチに元のパッチのスコアが割り当てられる。そして、小パッチの領域を単位としてスコアが統合される。
【0089】
病変領域識別部224は、統合されたスコアを所定の閾値と比較し、スコアが閾値を超えた領域を病変(腫瘤)の領域と識別する。病変領域識別部224は、病変識別結果を示す表示画像を生成し、表示画像を表示装置204aに表示させる。
【0090】
図14は、学習処理装置による学習処理の手順を示すフローチャートの例である。
[ステップS11]学習用データ生成部121は、MRI装置11から断層画像セットを取得する。学習用データ生成部121は、取得した断層画像セットに基づいて三次元のボリュームデータを生成する。
【0091】
[ステップS12]学習用データ生成部121は、生成されたボリュームデータの各ボクセルを腫瘤領域と正常領域とにアノテーションする。
[ステップS13]学習用データ生成部121は、アノテーションされたボリュームデータに基づいて、学習用パッチを生成する。学習用パッチとしては、腫瘤ラベルが付与された腫瘤パッチと、正常ラベルが付与された正常パッチとが生成される。
【0092】
[ステップS14]学習処理部122は、生成された学習用パッチを用いて機械学習を実行し、入力パッチが腫瘤領域か正常領域かを識別する病変識別モデルを生成する。例えば、学習処理部122は、ニューラルネットワークを用いた深層学習によって病変識別モデルを生成する。学習処理部122は、生成された病変識別モデルを示すモデルパラメータ111を記憶部110に格納する。
【0093】
図15は、学習用パッチ生成処理の手順を示すフローチャートの例である。
[ステップS21]学習用データ生成部121は、例えば、ボリュームデータをパッチの縦横のサイズと同じ間隔でスライスすることで、複数の断層画像を再生成し、各断層画像をパッチに分割する。パッチのサイズは、病変識別モデルに入力される画像のサイズと同じである。
【0094】
[ステップS22]学習用データ生成部121は、生成されたパッチの中から、臓器領域(肝臓領域)内の腫瘤を含むパッチを、腫瘤パッチ候補として抽出する。
[ステップS23]学習用データ生成部121は、腫瘤パッチ候補を1つ選択し、ボクセル単位のアノテーション結果に基づいて、腫瘤パッチ候補の画像領域における腫瘤の面積の占有率を算出する。
【0095】
[ステップS24]学習用データ生成部121は、算出された占有率が前述の下限閾値THminから上限閾値THmaxまでの範囲に含まれるかを判定する。占有率が閾値範囲に含まれる場合、処理がステップS26に進められ、占有率が閾値範囲に含まれない場合、処理がステップS25に進められる。なお、下限閾値THminおよび上限閾値THmaxは、例えばそれぞれ前述の式(5a),(5b)を用いて算出される。
【0096】
[ステップS25]学習用データ生成部121は、腫瘤パッチ候補を除外して、腫瘤パッチとして抽出されないようにする。
[ステップS26]学習用データ生成部121は、すべての腫瘤パッチ候補を選択済みかを判定する。未選択の腫瘤パッチ候補がある場合、処理がステップS23に進められ、未選択の腫瘤パッチ候補の1つが選択される。一方、すべての腫瘤パッチ候補を選択済みの場合、処理がステップS27に進められる。
【0097】
[ステップS27]学習用データ生成部121は、現在残っている腫瘤パッチ候補のそれぞれについて、統計情報として輝度の平均値と輝度の標準偏差とを算出する。
[ステップS28]学習用データ生成部121は、腫瘤パッチ候補の中から、輝度の平均値および輝度の標準偏差が分散するように、所定個数(2以上)の腫瘤パッチを抽出する。
【0098】
MR画像において、腫瘤の領域はその周囲の臓器内の領域と比較して暗く描出される。このため、上記手順により輝度の分布の仕方が互いに異なる腫瘤パッチが抽出されることで、大きさの異なる腫瘤や内部のグラデーションの状態が異なる腫瘤など、多様な形態の腫瘤を含む腫瘤パッチが抽出されるようになる。その結果、腫瘤の領域を腫瘤と正しく識別可能な病変識別モデルを生成可能になる。
【0099】
[ステップS29]学習用データ生成部121は、生成されたパッチの中から、臓器領域(肝臓領域)内の腫瘤を含まないパッチを、正常パッチ候補として抽出する。
[ステップS30]学習用データ生成部121は、正常パッチ候補のそれぞれについて、統計情報として輝度の平均値と輝度の標準偏差とを算出する。
【0100】
[ステップS31]学習用データ生成部121は、正常パッチ候補の中から、輝度の平均値および輝度の標準偏差が分散するように、所定個数(2以上)の腫瘤パッチを抽出する。これにより、輝度の分布の仕方が互いに異なる正常パッチが抽出されるので、血管を含む領域と血管を含まない領域とがバランスよく抽出されるようになる。その結果、血管の領域を正常と正しく識別可能な病変識別モデルを生成可能になる。
【0101】
図16は、画像識別装置による画像識別処理の手順を示すフローチャートの例である。
[ステップS41]入力データ生成部221は、MRI装置21から断層画像セットを取得し、取得した断層画像セットに基づいて三次元のボリュームデータを生成する。
【0102】
[ステップS42]入力データ生成部221は、モデルパラメータ211によって形成される臓器領域識別用の学習済みモデルを用いて、ボリュームデータから臓器領域(肝臓領域)を識別する。
【0103】
この学習済みモデルは、例えば、教師画像としての多数の断層画像と、断層画像内の各画素が臓器内領域、臓器外領域のどちらであるかを示す教師ラベルとを用いた深層学習によって生成される。この場合、ステップS42では、断層画像セットに含まれる各断層画像をこのような学習済みモデルに入力することで、各断層画像の画素ごとに臓器内領域、臓器外領域のどちらであるかが判定される。そして、断層画像ごとの判定結果に基づいて、ボリュームデータ内のボクセルのうち、臓器領域のボクセルが特定される。
【0104】
[ステップS43]入力データ生成部221およびスコア算出部222により、スコア算出処理が実行される。この処理では、ボリュームデータに基づいて、サイズの異なるパッチが生成され、各パッチが病変識別モデルに入力されることで、パッチごとに腫瘤である確率を示すスコアが算出される。
【0105】
[ステップS44]スコア統合部223および病変領域識別部224により、識別結果出力処理が実行される。この処理では、スコア統合部223は、小パッチの領域を単位として、サイズの異なるパッチ間でスコアを統合する。病変領域識別部224は、統合後のスコアを所定の閾値と比較し、スコアが閾値を超えた領域を病変(腫瘤)の領域と識別する。病変領域識別部224は、病変識別結果を示す表示画像を生成し、表示画像を表示装置204aに表示させる。
【0106】
図17は、スコア算出処理の手順を示すフローチャートの例である。
[ステップS51]入力データ生成部221は、パッチサイズ(スケール)を1つ選択する。入力データ生成部221は、ボリュームデータを、選択したパッチサイズ(パッチの縦横サイズ)と同じ間隔でスライスすることで、複数の断層画像を再生成する。
【0107】
[ステップS52]入力データ生成部221は、断層画像を1つ選択する。
[ステップS53]入力データ生成部221は、選択された断層画像を、ステップS51で選択されたパッチサイズで分割して、パッチを生成する。ただし、
図16のステップS42で識別された臓器領域に含まれるパッチのみが、ステップS54以降の処理対象となる。
【0108】
[ステップS54]スコア算出部222は、生成されたパッチを1つ選択する。
[ステップS55]スコア算出部222は、モデルパラメータ111によって形成される病変識別モデルに対して、選択されたパッチを入力し、腫瘤である確率を示すスコアを算出する。
【0109】
ステップS55では、選択されているパッチサイズが病変識別モデルで規定された規定パッチサイズと一致しない場合には、スコア算出部222は、選択されたパッチを規定パッチサイズに合わせて拡大または縮小してから病変識別モデルに入力する。一例として、小パッチ、中パッチおよび大パッチのうち大パッチのサイズが規定パッチサイズと一致しているとする。この場合、小パッチおよび中パッチは大パッチのサイズに拡大され、拡大されたパッチが病変識別モデルに入力される。一方、大パッチは病変識別モデルにそのまま入力される。
【0110】
[ステップS56]スコア算出部222は、すべてのパッチを選択済みかを判定する。未選択のパッチがある場合、処理がステップS54に進められ、未選択のパッチの1つが選択される。一方、すべてのパッチを選択済みの場合、処理がステップS57に進められる。
【0111】
[ステップS57]スコア算出部222は、すべての断層画像を選択済みかを判定する。未選択の断層画像がある場合、処理がステップS52に進められ、未選択の断層画像の1つが選択される。一方、すべての断層画像を選択済みの場合、処理がステップS58に進められる。
【0112】
[ステップS58]スコア算出部222は、すべてのパッチサイズを選択済みかを判定する。未選択のパッチサイズがある場合、処理がステップS51に進められ、未選択のパッチサイズの1つが選択される。一方、すべてのパッチサイズを選択済みの場合、処理が終了する。
【0113】
図18は、識別結果出力処理の手順を示すフローチャートの例である。
[ステップS61]スコア統合部223は、大パッチおよび中パッチについて、スコア補間により小パッチ単位のスコアを算出する。具体的には、スコア統合部223は、大パッチおよび中パッチを小パッチのサイズに分割し、分割後の領域に対して元のパッチのスコアを割り当てる。
【0114】
[ステップS62]スコア統合部223は、小パッチを1つ選択する。
[ステップS63]スコア統合部223は、選択された小パッチと、ステップS61で大パッチおよび中パッチから分割された領域のうち、選択された小パッチと同じ位置の領域とから算出されたスコアを取得する。スコア統合部223は、前述の式(1)~(4)のいずれかを用いてスコアを統合する。
【0115】
[ステップS64]病変領域識別部224は、統合後のスコアを所定の閾値と比較する。病変領域識別部224は、スコアが閾値を超えた場合、小パッチに対応する領域を病変(腫瘤)の領域と識別し、スコアが閾値以下の場合、小パッチに対応する領域を正常の領域と識別する。
【0116】
[ステップS65]病変領域識別部224は、すべての小パッチを選択済みかを判定する。未選択の小パッチがある場合、処理がステップS62に進められ、未選択の小パッチの1つが選択される。一方、すべての小パッチを選択済みの場合、処理がステップS66に進められる。
【0117】
[ステップS66]病変領域識別部224は、病変識別結果を示す表示画像を生成し、表示画像を表示装置204aに表示させる。
以上説明した第2の実施の形態によれば、腫瘤を大きさによらず漏れなく検出できる可能性を高めることができ、なおかつ、血管を腫瘤と誤って識別する可能性を低減できる。したがって、腫瘤の識別精度を向上させることができる。
【0118】
〔第3の実施の形態〕
上記の第2の実施の形態では、断層画像から切り出されたパッチがそのまま病変識別モデルに入力されることで、スコアが算出された。これに対して、第3の実施の形態では、次の
図19に示すような結合パッチが生成され、結合パッチが病変識別モデルに入力される。これにより、血管を腫瘤と誤って識別する可能性をさらに低減できる。
【0119】
図19は、結合パッチの生成処理を説明するための第1の図である。なお、以下の説明では、立位状態の人体における右から左への方向をX軸とし、後ろから前への方向をY軸とし、上から下への方向をZ軸とする。この場合、アキシャル面の断層画像はX-Y平面に沿う画像となり、サジタル面の断層画像はY-Z平面に沿う画像となり、コロナル面の断層画像はX-Z平面に沿う画像となる。
【0120】
本実施の形態では、病変識別モデルに対する入力データとして、ボリュームデータから切り出された、一辺がパッチの縦横サイズと同じである三次元のブロックを基に、3軸方向に対する最小値投影画像が用いられる。
図19に示すように、ブロック30におけるX-Y平面(アキシャル面)上の画素ごとにZ軸方向に対して最小値投影が行われることで、Z軸方向に対する最小値投影画像31が生成される。また、ブロック30におけるY-Z平面(サジタル面)上の画素ごとにX軸方向に対して最小値投影が行われることで、X軸方向に対する最小値投影画像32が生成される。さらに、ブロック30におけるX-Z平面(コロナル面)上の画素ごとにY軸方向に対して最小値投影が行われることで、Y軸方向に対する最小値投影画像33が生成される。
【0121】
なお、例えば、Z軸方向に対する最小値投影画像31の画素値は、次のような計算によって求められる。ここでは、ブロックからn枚の断層画像(ここではアキシャル面の断層画像)が生成されるものとし、i番目の断層画像における座標(x,y)の画素値をgi(x,y)とする。このとき、最小値投影画像31における座標(x,y)の画素値h(x,y)は、次の式(7)を用いて算出される。「min(・・・)」は、(・・・)に含まれる値のうちの最小値を示す。
h(x,y)=min(gi(x,y)),i=1,2,・・・,n ・・・(7)
なお、検出したいサイズの腫瘤が、ボリュームデータから切り出したブロック内に含まれるように、nの値を定めることが望ましい。例えば、検出したい腫瘤の最小サイズをrとし、断層画像間の距離をdとして、パッチサイズ(ブロックの一辺のサイズ)の半分より大きな腫瘤を検出できるようにする場合、n*d/2<rを満たすようにnが決定される。
【0122】
例えば、
図19に示す血管30aは曲線的に伸びているが、血管がどのような形状であっても、最小値投影画像31~33のうちの少なくとも1つにおいて、血管は長細い形状で描出される。
図19の例では、最小値投影画像31においては血管30aが楕円形に描出されているが、最小値投影画像32,33においては血管30aが長細い形状で描出されている。したがって、このような三方向の最小値投影画像を入力データとして用いることで、血管を腫瘤と誤って識別する可能性を低減でき、病変識別モデルによる識別精度を向上させることができる。
【0123】
また、本実施の形態では、ブロックを基に生成された三方向の最小値投影画像が、1枚の画像である結合パッチ34として結合される。なお、
図19では混同を避けるため、結合パッチ34におけるX軸、Y軸をそれぞれX’軸、Y’軸と示している。
【0124】
図19に示すように、結合パッチ34においては、Z軸方向に対する最小値投影画像31と、X軸方向に対する最小値投影画像32とが、互いのY座標を一致させた状態で隣接して結合される。また、Z軸方向に対する最小値投影画像31と、Y軸方向に対する最小値投影画像33とが、互いのX座標を一致させた状態で隣接して結合される。
【0125】
この場合、最小値投影画像31におけるX座標およびY座標は、結合パッチ34におけるX’座標およびY’座標としてそれぞれそのまま用いられる。また、最小値投影画像32におけるY座標は、結合パッチ34におけるY’座標としてそのまま用いられ、最小値投影画像32におけるZ座標にパッチサイズを加算した値が、結合パッチ34におけるX’座標として用いられる。さらに、最小値投影画像33におけるX座標は、結合パッチ34におけるX’座標としてそのまま用いられ、最小値投影画像33におけるZ座標にパッチサイズを加算した値が、結合パッチ34におけるY’座標として用いられる。
【0126】
このようにして、病変識別モデルに対して、二次元の画像データである結合パッチが入力されるようになる。また、病変識別モデルの学習に用いられる学習用データも、元のブロックから生成された三方向の最小値投影画像を結合した結合パッチとなる。すなわち、学習用の結合パッチに対して腫瘤または正常を示すラベルが付加され、それらの結合パッチを用いて病変識別モデルの機械学習が実行される。
【0127】
なお、ブロックを基に生成される最小値投影画像は、必ずしも座標軸に沿う方向に対して投影された画像である必要はない。ただし、各最小値投影画像は、互いに直交する方向に投影された画像であることが望ましい。また、ブロックを基に、互いに直交する2方向に対して投影された2枚の最小値投影画像が生成されてもよい。この場合でも、ブロック内の血管は、少なくとも一方の最小値投影画像において、画像上の一辺から同じ辺または他の一辺に到達する長細い形状で描出される。
【0128】
また、EOB造影剤を用いた肝細胞造影相では、肝臓の内部において、腫瘤および血管は、いずれもその周囲より暗く描出される。このため、結合パッチは最小値投影画像を結合することで生成される。しかし、撮影方法の違いや識別対象の病変によっては、周囲の領域より明るく描出される場合があり得る。この場合には、結合パッチは最大値投影画像を結合することで生成されればよい。
【0129】
図20は、結合パッチの生成処理を説明するための第2の図である。本実施の形態において、入力データ生成部221は、ボリュームデータから大ブロック、中ブロックおよび小ブロックを切り出す。小ブロックの一辺の長さをLとすると、中ブロックの一辺の長さは例えば2Lであり、大ブロックの一辺の長さは例えば4Lとなる。
【0130】
入力データ生成部221は、大ブロック、中ブロックおよび小ブロックのそれぞれについて、3軸方向のそれぞれに対する最小値投影画像を生成し、生成された最小値投影画像を
図19に示した手順で結合して結合パッチを生成する。これにより、ボリュームデータ上の同一の位置(同一のボクセル)に対して、大ブロック、中ブロックおよび小ブロックのそれぞれに対応する結合パッチが生成される。
【0131】
スコア算出部222は、このようにして生成された結合パッチを病変識別モデルに入力して、結合パッチに対応する(すなわち元のブロックに対応する)スコアを算出する。スコア統合部223は、ボリュームデータ上の同一ボクセルに対応する大ブロック、中ブロックおよび小ブロックに基づいて生成された各結合パッチを選択し、各結合パッチから算出されたスコアを前述の式(1)~(4)のいずれかを用いて統合する。病変領域識別部224は、統合されたスコアを閾値と比較することで、上記のボクセルが腫瘤か正常かを識別する。
【0132】
次に、第3の実施の形態における学習用結合パッチの生成処理について説明する。本実施の形態では、
図14のステップS13の処理として次の
図21の処理が実行される。
図21は、学習用パッチ生成処理の手順を示すフローチャートの例である。
【0133】
[ステップS71]学習用データ生成部121は、ボリュームデータをブロックに分割する。
[ステップS72]学習用データ生成部121は、ブロックの中から、臓器領域(肝臓領域)内の腫瘤を含むブロックを、腫瘤ブロック候補として抽出する。
【0134】
[ステップS73]学習用データ生成部121は、腫瘤ブロック候補を1つ選択し、ボクセル単位のアノテーション結果に基づいて、選択した腫瘤ブロック候補の三次元領域における腫瘤の体積の占有率を算出する。
【0135】
[ステップS74]学習用データ生成部121は、占有率が前述の下限閾値THminから上限閾値THmaxまでの範囲に含まれるかを判定する。占有率が閾値範囲に含まれる場合、処理がステップS76に進められ、占有率が閾値範囲に含まれない場合、処理がステップS75に進められる。なお、下限閾値THminおよび上限閾値THmaxは、例えばそれぞれ前述の式(6a),(6b)を用いて算出される。
【0136】
[ステップS75]学習用データ生成部121は、腫瘤ブロック候補を除外して、腫瘤ブロックとして抽出されないようにする。
[ステップS76]学習用データ生成部121は、すべての腫瘤ブロック候補を選択済みかを判定する。未選択の腫瘤ブロック候補がある場合、処理がステップS73に進められ、未選択の腫瘤ブロック候補の1つが選択される。一方、すべての腫瘤ブロック候補を選択済みの場合、処理がステップS77に進められる。
【0137】
[ステップS77]学習用データ生成部121は、残っている腫瘤ブロック候補のそれぞれについて、統計情報として輝度の平均値と輝度の標準偏差とを算出する。
[ステップS78]学習用データ生成部121は、腫瘤ブロック候補の中から、輝度の平均値および輝度の標準偏差が分散するように所定個数(2以上)の腫瘤ブロックを抽出する。そして、学習用データ生成部121は、抽出された腫瘤ブロックのそれぞれについて、3軸方向のそれぞれに対する最小値投影画像を生成し、生成された最小値投影画像を結合して、腫瘤ラベルが付与される結合腫瘤パッチを生成する。
【0138】
[ステップS79]学習用データ生成部121は、生成されたブロックの中から、臓器領域(肝臓領域)内の腫瘤を含まないブロックを正常ブロック候補として抽出する。
[ステップS80]学習用データ生成部121は、正常ブロック候補のそれぞれについて、統計情報として輝度の平均値と輝度の標準偏差とを算出する。
【0139】
[ステップS81]学習用データ生成部121は、正常ブロック候補の中から、輝度の平均値および輝度の標準偏差が分散するように所定個数(2以上)の正常ブロックを抽出する。そして、学習用データ生成部121は、抽出された正常ブロックのそれぞれについて、3軸方向のそれぞれに対する最小値投影画像を生成し、生成された最小値投影画像を結合して、正常ラベルが付与される結合正常パッチを生成する。
【0140】
このようにして学習用結合パッチが生成されると、学習処理部122は、生成された学習用結合パッチを用いて機械学習を実行し、入力された結合パッチが腫瘤領域か正常領域かを識別する病変識別モデルを生成する。学習処理部122は、生成された病変識別モデルを示すモデルパラメータ111を記憶部110に格納する。
【0141】
次に、第3の実施の形態における画像識別処理について説明する。本実施の形態では、
図16のステップS43の処理として
図22の処理が実行され、
図16のステップS44の処理として
図23の処理が実行される。
【0142】
図22は、スコア算出処理の手順を示すフローチャートの例である。
[ステップS91]入力データ生成部221は、臓器領域内のボクセルの中から、ブロックの中心点を選択する。ブロックの中心点は、少なくとも小ブロックの中心となる点であり、例えば、小ブロックの一辺と同じサイズの三次元ウィンドウを所定距離(例えば、パッチサイズの半分)ずつ移動させることで生成される。
【0143】
[ステップS92]入力データ生成部221は、パッチサイズ(スケール)を1つ選択する。
[ステップS93]入力データ生成部221は、選択された中心点を中心とし、選択されたパッチサイズを一辺の長さとするブロックを、ボリュームデータから切り出す。
【0144】
[ステップS94]入力データ生成部221は、切り出されたブロックに基づいて、3軸方向のそれぞれに対する最小値投影画像を生成する。
[ステップS95]入力データ生成部221は、生成された各最小値投影画像を
図19に示した方法で結合して、結合パッチを生成する。
【0145】
[ステップS96]スコア算出部222は、モデルパラメータ111によって形成される病変識別モデルに対して、選択された結合パッチを入力し、腫瘤である確率を示すスコアを算出する。ステップS96では、選択されているパッチサイズが病変識別モデルで規定された規定パッチサイズ(学習用結合パッチの生成元となったブロックまたはパッチのサイズ)と一致しない場合には、スコア算出部222は、選択された結合パッチを規定パッチサイズに合わせて拡大または縮小してから病変識別モデルに入力する。
【0146】
[ステップS97]スコア算出部222は、すべてのパッチサイズを選択済みかを判定する。未選択のパッチサイズがある場合、処理がステップS92に進められ、未選択のパッチサイズの1つが選択される。一方、すべてのパッチサイズを選択済みの場合、処理がステップS98に進められる。後者の場合、選択された中心点を中心とする大ブロック、中ブロックおよび小ブロックのそれぞれを基に生成された各結合パッチから、スコアが算出された状態となる。
【0147】
[ステップS98]スコア算出部222は、すべてのブロックの中心点を選択済みかを判定する。未選択の中心点がある場合、処理がステップS91に進められ、未選択の中心点の1つが選択される。一方、すべての中心点を選択済みの場合、処理が終了する。
【0148】
図23は、識別結果出力処理の手順を示すフローチャートの例である。
[ステップS101]スコア統合部223は、臓器領域内のボクセルの中から、ブロックの中心点を選択する。
【0149】
[ステップS102]スコア統合部223は、選択された中心点を中心とする大ブロック、中ブロックおよび小ブロックのそれぞれを基に生成された各結合パッチを特定し、特定された各結合パッチから算出されたスコアを取得する。スコア統合部223は、前述の式(1)~(4)のいずれかを用いてスコアを統合する。
【0150】
[ステップS103]病変領域識別部224は、統合後のスコアを所定の閾値と比較する。病変領域識別部224は、スコアが閾値を超えた場合、選択された中心点の位置を病変(腫瘤)の領域と識別し、スコアが閾値以下の場合、選択された中心点の位置を正常の領域と識別する。
【0151】
[ステップS104]病変領域識別部224は、すべての中心点を選択済みかを判定する。未選択の中心点がある場合、処理がステップS101に進められ、未選択の中心点の1つが選択される。一方、すべての中心点を選択済みの場合、処理がステップS105に進められる。
【0152】
[ステップS105]病変領域識別部224は、病変識別結果を示す表示画像を生成し、表示画像を表示装置204aに表示させる。
以上説明した第3の実施の形態によれば、第2の実施の形態と比較して、腫瘤と正常(特に血管)とを精度よく識別できるようになる。
【0153】
なお、上記の各実施の形態に示した装置(例えば、画像識別装置1、学習処理装置12、画像識別装置22)の処理機能は、コンピュータによって実現することができる。その場合、各装置が有すべき機能の処理内容を記述したプログラムが提供され、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、磁気テープなどがある。光ディスクには、CD(Compact Disc)、DVD(Digital Versatile Disc)、ブルーレイディスク(Blu-ray Disc:BD、登録商標)などがある。
【0154】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CDなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0155】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムにしたがった処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムにしたがった処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムにしたがった処理を実行することもできる。
【符号の説明】
【0156】
1 画像識別装置
1a 処理部
2 断層画像
2a 位置
3a~3c 部分画像