【文献】
難波 清,”5.ソフトウェアの最新技術とトピックス 定量的乳腺密度評価ソフトウェアの有用性と今後の展望”,INNERVISION,2017年 8月,2017年8月号,38−41頁
【文献】
植松 孝悦,”Dense Breastについて考える 日本のDense Breast対応の現状”,日乳癌検診学会誌,日本乳癌検診学会,2016年,25(3)OCT,205−210頁
【文献】
Shivang Naik et al.,"AUTOMATED GLAND AND NUCLEI SEGMENTATION FOR GRADING OF PROSTATE AND BREAST CANCER HISTPATHOLOGY",Conference Paper in Proceedings/IEEE International Symposium on Biomedical Imaging,2008年 6月,ISBI,pp.284-287
【文献】
加納 拓弥,"Deep CNN に基づくCT画像からの乳腺濃度の自動分類法,信学技報,2016年 5月,SIP2016-5,IE2016-5,PRMU2016-5,MI2016-5,pp.21-25
(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1では、上記のように算出された乳腺割合に基づいて乳腺密度の判断を行っているが、このような判断方法では、狭い範囲に高密度の乳腺領域が存在しているような場合には、乳腺割合が低く算出されて超音波による検査が不要であると判断されやすい。しかし、乳腺領域の範囲が狭い場合であっても、乳腺領域が高密度である場合には、マンモグラフィでは、石灰化物等を精度良く判断できないので、超音波による検査が必要な場合があるので、より適切な基準によって、超音波による検査の要否を判断できることが望ましい。
【0007】
本発明はこのような事情に鑑みてなされたものであり、狭い領域に高密度の乳腺領域が存在している場合であっても、超音波による検査の要否を適切に判断可能な情報を提供可能な情報処理装置を提供するものである。
【課題を解決するための手段】
【0008】
本発明によれば、乳腺領域抽出部と、乳腺画素検出部と、乳腺密度算出部を備える、情報処理装置であって、前記乳腺領域抽出部は、マンモグラフィ画像における乳腺領域を抽出し、前記乳腺画素検出部は、前記乳腺領域中の乳腺画素を検出し、前記乳腺密度算出部は、前記乳腺領域に対する前記乳腺画素の割合に基づいて乳腺密度を算出し、前記乳腺領域は、前記マンモグラフィ画像に含まれる乳房全体よりも狭い領域である、情報処理装置が提供される。
【0009】
本発明では、マンモグラフィ画像に含まれる乳房全体よりも狭い領域を乳腺領域とし、この乳腺領域に含まれる乳腺画素の割合に基づいて乳腺密度を算出している。そして、この乳腺密度は、狭い領域に高密度の乳腺領域が存在している場合には高い値になる。従って、本発明によれば、狭い領域に高密度の乳腺領域が存在している場合であっても、超音波による検査の要否を適切に判断可能な情報が提供される。
【0010】
以下、本発明の種々の実施形態を例示する。以下に示す実施形態は互いに組み合わせ可能である。
好ましくは、前記記載の情報処理装置であって、前記乳腺領域抽出部は、乳腺領域確率算出部と、後処理部を備え、前記乳腺領域確率算出部は、前記マンモグラフィ画像における乳腺領域である確率を算出し、前記後処理部は、前記確率に基づいて前記乳腺領域を抽出する、情報処理装置である。
好ましくは、前記記載の情報処理装置であって、前記後処理部は、候補画素抽出部と、領域形成部を備え、前記候補画素抽出部は、前記確率が第1閾値以上である画素を候補画素として抽出して候補画素マップを生成し、前記領域形成部は、前記候補画素マップに対して欠損領域穴埋めを行って前記乳腺領域を形成する、情報処理装置である。
好ましくは、前記記載の情報処理装置であって、前記乳腺領域確率算出部は、前記マンモグラフィ画像を入力して前記確率を出力する学習モデルに基づき、前記確率を算出する、情報処理装置である。
好ましくは、前記乳腺領域確率算出部は、前記マンモグラフィ画像及び第1追加データを入力して前記確率を出力する学習モデルに基づき、前記確率を算出し、第1追加データは、前記マンモグラフィ画像中の乳頭の位置に関連するデータである、情報処理装置である。
好ましくは、第1追加データは、前記マンモグラフィ画像中の乳頭画素の位置に基づいて、前記マンモグラフィ画像中の人体画素の画素値が補正されている画像データである、情報処理装置である。
好ましくは、第1追加データは、前記乳頭画素と前記人体画素との直線距離に応じて前記マンモグラフィ画像中の前記人体画素の画素値が変化するように、前記マンモグラフィ画像中の前記人体画素の画素値が補正されている画像データである、情報処理装置である。
好ましくは、第1追加データは、前記乳頭画素と前記人体画素との直線距離が短くなるにつれて前記人体画素の画素値が大きくなるように、前記マンモグラフィ画像中の前記人体画素の画素値が補正されている、情報処理装置である。
好ましくは、第1追加データは、第1画像データと、第2画像データとを有し、第1画像データは、前記マンモグラフィ画像の第1方向に前記マンモグラフィ画像中の前記人体画素の画素値が変化するように、前記マンモグラフィ画像中の前記人体画素の画素値が補正されている画像データであり、第2画像データは、前記マンモグラフィ画像の第2方向に前記マンモグラフィ画像中の前記人体画素の画素値が変化するように、前記マンモグラフィ画像中の前記人体画素の画素値が補正されている画像データであり、第1方向と第2方向とは、交差する、情報処理装置である。
好ましくは、第1画像データは、前記乳頭画素と前記人体画素との第1方向の距離が短くなるにつれて前記人体画素の画素値が大きくなるように、前記マンモグラフィ画像中の前記人体画素の画素値が補正され、第2画像データは、第2方向における上側から第2方向における下側に向かうにつれて前記人体画素の画素値が大きくなるように、前記マンモグラフィ画像中の前記人体画素の画素値が補正されている画像データである、情報処理装置である。
好ましくは、前記乳腺領域確率算出部は、前記マンモグラフィ画像及び第2追加データを入力して前記確率を出力する学習モデルに基づき、前記確率を算出し、
第2追加データは、前記マンモグラフィ画像の代表輝度値又は前記マンモグラフィ画像の輝度値の分布を示すデータである、情報処理装置である。
好ましくは、第2追加データは、前記代表輝度値又は前記分布に基づいて、前記マンモグラフィ画像中の人体画素の輝度値が補正されている画像データである、情報処理装置である。
好ましくは、前記記載の情報処理装置であって、前記学習モデルは、前記情報処理装置外で予め学習させる、情報処理装置である。
好ましくは、前記記載の情報処理装置であって、前記学習モデルは、前記情報処理装置内で学習可能に構成される、情報処理装置である。
好ましくは、前記記載の情報処理装置であって、前記乳腺領域確率算出部は、前記マンモグラフィ画像に含まれる大胸筋領域を除去することなく前記確率を算出する、情報処理装置である。
好ましくは、前記記載の情報処理装置であって、前記乳腺画素検出部は、前記確率に基づいて前記乳腺領域中の前記乳腺画素を検出する、情報処理装置である。
好ましくは、前記記載の情報処理装置であって、前記乳腺画素検出部は、前記確率が第2閾値以上である画素を前記乳腺画素として検出し、第2閾値は、第1閾値よりも、前記乳腺領域である確率が高い値である、情報処理装置である。
好ましくは、前記記載の情報処理装置であって、前記乳腺画素検出部は、前記乳腺領域の輝度値に基づいて前記乳腺画素を検出する、情報処理装置である。
本発明の別の観点によれば、乳腺領域抽出ステップと、乳腺画素検出ステップと、乳腺密度算出ステップを備える、情報処理方法であって、前記乳腺領域抽出ステップでは、マンモグラフィ画像における乳腺領域を抽出し、前記乳腺画素検出ステップでは、前記乳腺領域中の乳腺画素を検出し、前記乳腺密度算出ステップでは、前記乳腺領域に対する前記乳腺画素の割合を算出し、前記乳腺領域は、前記マンモグラフィ画像に含まれる乳房全体よりも狭い領域である、情報処理方法が提供される。
本発明のさらに別の観点によれば、コンピュータに、乳腺領域抽出ステップと、乳腺画素検出ステップと、乳腺密度算出ステップを備える、情報処理方法を実行させるコンピュータプログラムであって、前記乳腺領域抽出ステップでは、マンモグラフィ画像における乳腺領域を抽出し、前記乳腺画素検出ステップでは、前記乳腺領域中の乳腺画素を検出し、前記乳腺密度算出ステップでは、前記乳腺領域に対する前記乳腺画素の割合を算出し、前記乳腺領域は、前記マンモグラフィ画像に含まれる乳房全体よりも狭い領域である、コンピュータプログラムが提供される。
【発明を実施するための形態】
【0012】
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。また、各特徴事項について独立して発明が成立する。
【0013】
1.第1実施形態
図1〜
図7を用いて、本発明の第1実施形態の情報処理装置1について説明する。本実施形態の情報処理装置1は、
図1に示すように、乳腺領域抽出部3と、乳腺画素検出部4と、乳腺密度算出部5を備える。
【0014】
上記の各構成要素は、ソフトウェアによって実現してもよく、ハードウェアによって実現してもよい。ソフトウェアによって実現する場合、CPUがコンピュータプログラムを実行することによって各種機能を実現することができる。プログラムは、内蔵の記憶部に格納してもよく、コンピュータ読み取り可能な非一時的な記録媒体に格納してもよい。また、外部の記憶部に格納されたプログラムを読み出し、いわゆるクラウドコンピューティングにより実現してもよい。ハードウェアによって実現する場合、ASIC、FPGA、又はDRPなどの種々の回路によって実現することができる。本実施形態においては、様々な情報やこれを包含する概念を取り扱うが、これらは、0又は1で構成される2進数のビット集合体として信号値の高低によって表され、上記のソフトウェア又はハードウェアの態様によって通信や演算が実行され得るものである。
【0015】
1−1.乳腺領域抽出部3
乳腺領域抽出部3は、
図3に示すようなマンモグラフィ画像における乳腺領域Rを抽出する。マンモグラフィ画像は、多数の画素で構成されたデジタル画像である。各画素は、輝度値を有する。マンモグラフィ画像には、通常、大胸筋領域Gと、乳房領域Bが含まれている。大胸筋領域Gは、大胸筋に相当する領域であり、乳房領域Bは、乳房全体に相当する領域である。乳房領域Bには、乳腺領域Rが含まれている。乳腺領域Rは、乳房領域Bよりも狭い領域である。乳腺領域Rには、乳腺画素と脂肪画素が含まれている。乳腺画素は、乳腺に相当する画素であり、脂肪画素は、脂肪に相当する画素であり、乳腺領域R内の、乳腺画素以外の画素である。乳腺領域Rは、乳腺画素を大まかに囲った領域である。
【0016】
図3では、図示の便宜上、乳腺領域Rを実線で囲んで表示しているが、実際のマンモグラフィ画像では、乳腺領域Rを囲む実線は存在しておらず、乳腺に相当する部位が高輝度で表示されているだけである。乳腺に相当する部位は、雲のように境界が不明瞭に分布しており、その境界を一意的に定めることが困難であるので、本実施形態では、乳腺領域Rである確率Pに基づいて乳腺領域Rを抽出している。なお、大胸筋領域G、乳房領域Bを示す実線も実際のマンモグラフィ画像には存在していない。
【0017】
図2に示すように、乳腺領域抽出部3は、前処理部6と、乳腺領域確率算出部7と、後処理部8を備える。以下、各構成について詳細に説明する。
【0018】
<前処理部6>
前処理部6は、マンモグラフィ画像に対して、種々の前処理を行う。前処理は、マンモグラフィ画像を乳腺領域確率算出部7での処理に適した状態にするために行う処理である。前処理済みの画像もマンモグラフィ画像と称する。
【0019】
前処理部6は、サイズ合わせ部と、ウィンドウレベル調整部と、ノイズ除去部を備える。前処理部6の一部又は全部は、不要な場合には省略可能である。
【0020】
・サイズ合わせ部
サイズ合わせ部は、マンモグラフィ画像のサイズ合わせを行う。マンモグラフィ画像は撮像機材や設定によって解像度が異なる。これは1画素あたりの実サイズ(mm)が入力画像によって異なるということを表わす。サイズ合わせ部は、1画素あたりのサイズ違いによる検出精度の揺らぎを無くすため、1画素あたり、例えば0.2mmになるようにリサイズを行う。
【0021】
・ウィンドウレベル調整部
ウィンドウレベル調整部は、マンモグラフィ画像のウィンドウレベル調整を行う。ウィンドウレベル調整とは、幅広いレンジの階調値を持った画像のある特定の階調域のコントラストを向上させる処理である。ウィンドウレベル調整を行うことによってマンモグラフィ画像の視認性を向上させることができる。これによって、乳腺領域Rの抽出精度を向上させることができる。
【0022】
・ノイズ除去部
ノイズ除去部は、マンモグラフィ画像のノイズ除去を行う。マンモグラフィ画像の中には、乳腺領域Rの抽出精度を低下させるものが存在している場合があり、それをノイズとして除去する。ノイズとしては、人工ラベルや大胸筋領域Gが挙げられる。人工ラベルは、人工的に付されたラベルであり、マスク処理によって除去可能である。大胸筋領域Gは、公知の領域拡張法によって除去可能である。但し、本実施形態では、大胸筋領域Gが含まれた状態でも乳腺領域Rを抽出することが可能であるので、大胸筋領域Gをノイズとして扱わなくてもよい。
【0023】
サイズ合わせ、ウィンドウレベル調整、ノイズ除去を行う順序は、適宜変更可能である。
【0024】
<乳腺領域確率算出部7>
乳腺領域確率算出部7は、マンモグラフィ画像における乳腺領域Rである確率Pを算出する。
【0025】
通常、マンモグラフィ画像において、大胸筋領域Gと乳腺領域R(特に、乳腺画素)の輝度値は、その他の領域に比べて高い(別の表現ではX線の透過率が、その他の領域に比べて低い)。大胸筋領域Gと乳腺領域Rの輝度値は同程度であり、輝度値によって大胸筋領域Gと乳腺領域Rを区別することは困難である。そこで、本実施形態では、マンモグラフィ画像に含まれる各画素が乳腺領域Rであるかどうかを示す確率Pを算出し、確率Pに基づいて乳腺領域Rを抽出している。確率Pは、大胸筋領域Gでは低くなり、乳腺領域Rでは高くなるので、確率Pに基づいて乳腺領域Rを抽出することによって、乳腺領域Rの特定の精度を向上させることができる。また、確率Pは、マンモグラフィ画像に含まれる大胸筋領域を除去することなく算出可能である。確率Pは、例えば0〜1の範囲の値で表現され、値が大きいほど、乳腺領域である確率が高くなる。
【0026】
確率Pは、マンモグラフィ画像を入力して確率Pを出力する学習モデルに基づいて算出することができる。
【0027】
学習モデルとは、多数の教師データ(既知の入力データと正解データの組)を用いてモデルを訓練し、将来の出力を予測可能にするモデルである。本実施形態では、教師データの入力データは、マンモグラフィ画像であり、正解データは、医師が乳腺領域であると判断した領域内の画素の値を1とし、それ以外の画素の値を0としたデータである。
【0028】
本実施形態では、学習モデル(機械学習モデル)は、畳み込みニューラルネットワークの一種である完全畳み込みネットワーク FCN (Fully Convolutional Network)である。FCNの詳細は、非特許文献1に開示されている。
【0029】
乳腺領域確率算出部7を構成するFCNの一例は、
図4に示すように、第1畳み込み部と、第1プーリング部と、第2畳み込み部と、第2プーリング部と、第3畳み込み部と、第3プーリング部と、スコアプール部と、アップサンプル部と、確率算出部を備える。FCNの構成は、適宜変更可能である。
【0030】
第1〜第3畳み込み部は、それぞれ、2層、2層、3層のニューラルネットワークで構成される。第1〜第3畳み込み部の各層のニューロン数は、64,128,256である。第1〜第3畳み込み部では、3×3画素のフィルタで畳み込み処理がなされる。
【0031】
第1〜第3プーリング部では、2×2画素中の最大値を取り出すプーリング処理がなされる。
【0032】
スコアプール部は、ニューロン数が2のニューラルネットワークで構成され、1×1画素のフィルタで畳み込み処理がなされる。
【0033】
アップサンプル部では、プーリング処理で減少した画素数をマンモグラフィ画像の画素数に戻す処理が行われる。アップサンプル部は、ニューロン数が2のニューラルネットワークで構成される。アップサンプル部では、隣接する画素の間に値が0である画素を適宜挿入したものに対して、16×16画素のフィルタで畳み込み処理を行う等の処理を行うことによって、プーリング処理で減少した画素数をマンモグラフィ画像の画素数に戻す処理が行われる。
【0034】
確率算出部は、ソフトマックス関数によって、各画素について確率Pを算出し、確率マップを出力する。確率マップは、マンモグラフィ画像の画素と対応した画素を有する。確率マップの各画素は、確率Pを有する。
【0035】
学習は、以下の(1)〜(2)を繰り返すことによって行うことができる。
(1)教師データの入力データを入力して得られた確率Pに対して、閾値Thを基準にして確率Pを二値化することによって、出力データを得る。閾値Thは、例えば0.5とする。
(2)出力データと正解データに基づいて誤差を算出し、この誤差をバックプロパゲーションさせることによって、フィルタの重み係数を変更する。
【0036】
上記学習は、情報処理装置1外で予め行うことができる。この場合、情報処理装置1は、外部での学習によって得られた重み係数を用いて乳腺領域確率を算出することができる。重み係数は、情報処理装置1の記憶部に記憶させてもよく、外部の記憶部に記憶された重み係数を情報処理装置1が読み出して利用してもよい。また、情報処理装置1内においても、学習可能なように構成しておくことができる。
【0037】
<後処理部8>
後処理部8は、確率Pに基づいて乳腺領域Rを抽出する。後処理部8は、候補画素抽出部9と、領域形成部10を備える。
【0038】
・候補画素抽出部9
候補画素抽出部9は、確率Pが第1閾値を超える画素を候補画素として抽出して候補画素マップを生成し、出力する。第1閾値は、学習段階での閾値Thと同じであっても異なっていてもよい。第1閾値は、固定された値であってもよく、ユーザーが適宜変更可能な値であってもよい。候補画素マップは、確率マップの画素と対応した画素を有する。候補画素マップでは、確率Pが第1閾値以上の画素の値が例えば1で、第1閾値未満の画素の値が例えば0となる。
【0039】
候補画素マップの一例を
図5に示す。候補画素を黒点で示す。大胸筋領域G、乳腺領域R、乳房領域Bの境界を参考のために点線で示す。候補画素マップでは、乳腺領域Rに対応する領域において多数の候補画素が抽出されており、大胸筋領域Gに対応する領域にも小数の候補画素が抽出されている。乳腺領域Rに対応する領域には多数の候補画素が集中しているが、候補画素の間には、欠損領域(
図5の乳腺領域R内の白い領域)が存在している。従って、このままでは一塊の乳腺領域Rとなっているといえない。
【0040】
・領域形成部10
領域形成部10は、候補画素マップに対してノイズ除去及び欠損領域穴埋めを行って乳腺領域Rを形成する。
【0041】
具体的には、大胸筋領域Gに対応する領域の候補画素はノイズであるとしてマスク処理等によって除去する。また、乳腺領域Rに対応する領域については欠損領域穴埋めを行って乳腺領域Rを形成する。欠損領域穴埋めは、例えば、列及び行それぞれの始点・終点の間を穴埋めすることによって行うことができる。これによって、
図6に示すような乳腺領域マップが得られる。乳腺領域Rは、候補画素が集中している領域に形成されるので、欠損領域穴埋め工程では、候補画素が集中している領域から離れている候補画素をノイズとして無視することが好ましい。例えば、列又は行の始点を検出しても、その後に非候補画素が所定数以上連続した場合には、検出した始点を破棄して新たな始点を探すようにしてもよい。
【0042】
なお、大胸筋領域Gに対応する領域に候補画素が生成されないように学習モデルを十分に学習させることによってノイズ除去工程を省略することができる。また、マンモグラフィ画像から大胸筋領域Gを予め除去した場合にも、ノイズ除去工程は省略可能である。さらに、欠損領域穴埋め工程において、候補画素が集中している領域から離れている候補画素を無視することによって、大胸筋領域Gや、大胸筋領域G外であって候補画素が集中している領域以外に存在する候補画素を除外することができる。従って、ノイズ除去工程を別途行わずに、欠損領域穴埋め工程において、乳腺領域Rを形成することも可能である。
【0043】
1−2.乳腺画素検出部4
乳腺画素検出部4は、乳腺領域R中の乳腺画素を検出する。乳腺画素検出部4は、確率Pに基づいて乳腺領域R中の乳腺画素を検出する。乳腺画素は、確率Pが第2閾値以上である画素である。第2閾値は、第1閾値よりも、乳腺領域Rである確率が高い値である。なお、乳腺画素検出部4は、乳腺領域抽出部3により抽出された乳腺領域マップ内で、乳腺画素を検出してもよい。
【0044】
より具体的には、乳腺画素検出部4は、確率Pが第2閾値を超える画素を乳腺画素として抽出して乳腺画素マップを生成し、出力する。乳腺画素マップは、確率マップの画素と対応した画素を有する。乳腺画素マップでは、確率Pが第2閾値以上の画素の値が例えば1で、第2閾値未満の画素の値が例えば0となる。
【0045】
乳腺画素マップの一例を
図7に示す。乳腺画素を黒点で示す。乳腺領域Rの境界を参考のために点線で示す。なお、乳腺領域抽出部3が抽出した乳腺領域Rに基づいて、乳腺領域Rの情報を乳腺画素マップに含めてもよい。
図7に示すように、乳腺画素は、乳腺領域R内に集中して存在している。乳腺画素の数は、候補画素の数よりも少ない。なお、乳腺画素は、乳腺領域R外に存在してもよい。乳腺領域R外の乳腺画素は、乳腺密度の算出の際に、乳腺画素として含めても含めなくてもよい。乳腺領域R外の乳腺画素を含めない場合、乳腺密度の算出の際に、乳腺領域マップ内の乳腺画素についてのみ算出を行う。
【0046】
1−3.乳腺密度算出部5
乳腺密度算出部5は、乳腺領域Rに対する乳腺画素の割合に基づいて乳腺密度を算出する。より具体的には、乳腺密度算出部5は、乳腺領域マップに基づいて乳腺領域に含まれる全ての画素数(乳腺領域総画素数)をカウントし、乳腺画素マップに基づいて乳腺画素数をカウントし、以下の式に基づいて、乳腺密度を算出する。
乳腺密度(%)=100×(乳腺画素数)/(乳腺領域総画素数)
【0047】
このようにして算出された乳腺密度は、狭い領域に高密度の乳腺領域が存在している場合には高い値になる。従って、本実施形態によれば、狭い領域に高密度の乳腺領域が存在している場合であっても、超音波による検査の要否を適切に判断可能な情報が提供される。
【0048】
算出された乳腺密度は、情報処理装置1の表示部に表示させたり、情報処理装置1から外部機器に出力したりして利用可能である。
【0049】
2.第2実施形態
図8〜
図9を用いて、本発明の第2実施形態の情報処理装置1について説明する。本実施形態の情報処理装置1は、第1実施形態に類似しており、乳腺画素検出部4の構成の違いが主な相違点である。以下、相違点を中心に説明する。
【0050】
本実施形態では、乳腺画素検出部4は、乳腺領域Rの輝度値に基づいて乳腺画素を検出している。乳腺画素検出部4は、乳腺領域画像抽出部11と、輝度判断部12を備える。
【0051】
乳腺領域画像抽出部11は、マンモグラフィ画像と乳腺領域マップに基づいて、乳腺領域画像を抽出する。乳腺領域画像は、乳腺領域Rのみの画像である。
【0052】
輝度判断部12は、乳腺領域画像に含まれる各画素の輝度値が第3閾値以上であるか否かに基づいて乳腺画素を検出し、乳腺画素マップを出力する。第3閾値は、固定の値に設定してもよく、その他さまざまな公知の手法を使用してもよい。今回の目的に合いやすいものとしてはヒストグラムの双峰性を仮定したモード法や自動的に閾値を決定する判別分析法、局所的に閾値を変更する適応的閾値処理などがある。
【0053】
乳腺領域抽出部3は、乳腺画素検出部4に対して、乳腺領域マップを出力する点以外は、第1実施形態と同様である。
【0054】
3.第3実施形態
図10〜
図17を用いて、本発明の第3実施形態の情報処理装置1について説明する。第1実施形態の情報処理装置1はマンモグラフィ画像のデータに基づいて確率マップを取得したが、第3実施形態の情報処理装置1はマンモグラフィ画像に加え、後述する第1及び第2追加データに基づいて確率マップを取得する。第3実施形態の情報処理装置1は、実施形態1の情報処理装置の構成に加え、第1及び第2追加データを生成する追加データ生成部30を備える。以下、第1実施形態と第3実施形態との相違点を中心に説明する。
【0055】
なお、第3実施形態において、人体領域Rg1は、マンモグラフィ画像D0中における人体に対応する領域である。また、人体画素は、人体領域Rg1の画素である。非人体領域Rg2とは、マンモグラフィ画像D0中における人体以外の部分に対応する領域である。また、乳頭領域RgNはマンモグラフィ画像D0中における人体の乳頭に対応する領域であり、乳頭領域RgNは人体領域Rg1に含まれる。乳頭画素は、乳頭領域RgNの画素である。
【0056】
3−1.データ説明
情報処理装置1は、マンモグラフィ画像のデータ(以下、単にマンモグラフィ画像D0とも称する)と、第1追加データD1と、第2追加データD2とに基づいて、確率マップを取得する。情報処理装置1が第1追加データD1及び第2追加データD2を用いることで、情報処理装置1はより高精度な確率マップを取得することができる。
【0057】
<第1追加データD1>
人体は乳頭の近傍に乳腺が多いので、乳頭の近傍の部分は乳腺である確率が高い。このため、第3実施形態では、乳頭からの距離を加味したデータを用いて、乳腺領域抽出部3に学習をさせ、乳腺領域抽出部3の出力(確率マップ)をより高精度化する。第3実施形態において、乳頭からの距離を加味したデータは、画像データである。また、第3実施形態において、この画像データは、マンモグラフィ画像中の人体画素の輝度値が補正されている画像データである。マンモグラフィ画像D0の左端寄りの上部は大胸筋領域Gが配置されているので、マンモグラフィ画像D0の左端側の上部は乳腺である確率が低い。このため、第3実施形態では、大胸筋領域Gからの距離を加味した画像データ(第1追加データD1)を用いて、乳腺領域抽出部3に学習をさせ、乳腺領域抽出部3の出力(確率マップ)をより高精度化する。
なお、乳腺領域抽出部3の出力(確率マップ)がより高精度となると、候補画素マップ(
図5参照)の精度、乳腺領域マップ(
図6参照)の精度及び乳腺画素マップ(
図7参照)の精度も向上する。その結果、乳腺密度算出部5はより高精度な乳腺密度を算出することが可能になる。そこで、乳腺領域抽出部3は乳頭からの距離及び大胸筋領域Gからの距離が加味されている第1追加データD1を用いた処理を実行する。
【0058】
図12,
図14及び
図15に示すように、第1追加データD1は、マンモグラフィ画像D0に基づいて生成する画像データである。第1追加データD1は、第1画像データD11と第2画像データD12とを有する。第1画像データD11及び第2画像データD12は、マンモグラフィ画像D0中の各画素と乳頭領域との距離と、マンモグラフィ画像D0中の各画素と大胸筋領域との距離との両方が加味されているデータである。
【0059】
・第1画像データD11
図12及び
図14に示すように、第1画像データD11は、マンモグラフィ画像D0中の乳頭領域RgNの画素(乳頭画素)の位置(座標)に基づいて、マンモグラフィ画像D0中の各人体画素の輝度値が補正されている画像データである。第3実施形態において、第1画像データの各人体画素の輝度値は、マンモグラフィ画像D0中の乳頭領域RgNの位置(座標)と人体領域Rg1中の各人体画素との第1方向距離に基づいている。つまり、第1画像データD11は、乳頭領域RgNと各人体画素との第1方向距離に応じてマンモグラフィ画像D0中の人体画素の輝度値が変化するように、マンモグラフィ画像D0中の各人体画素の輝度値が補正されている画像データである。第3実施形態において、第1方向は水平方向である。
【0060】
第3実施形態において、第1画像データD11は、この第1方向距離が短くなるにつれて各人体画素の輝度値が大きくなるように、マンモグラフィ画像D0中の各人体画素の輝度値が補正されている。つまり、第1画像データD11の乳頭領域RgNはこの第1方向距離が最小なので、この乳頭領域RgNの輝度値は最大である。また、第1画像データD11の左端部分は第1方向距離が最大なので、この左端部分の人体画素の輝度値は最小である。更に、第1画像データD11の乳頭領域RgN側から第1画像データD11の左端部分側へ向かうにつれて、人体画素の輝度値は単調減少する。人体画素の輝度値は、この第1方向距離に比例して減少してもよいし、比例していなくてもよい。また、第3実施形態では、第1画像データD11の乳頭領域RgNの階調値が1であり、第1画像データD11の左端部分の人体画素は階調値が0である。なお、第3実施形態において階調値は正規化されており、階調値の最大値が1であり、最小値が0である。輝度値の最大値及び最小値は、これらの値に限定されるものではない。
【0061】
第3実施形態では、第1画像データD11の乳頭領域RgN側から第1画像データD11の左端部分側へ向かうにつれて、人体画素の輝度値は単調減少しているが、これに限定されるものではない。第1画像データD11の乳頭領域RgN側から第1画像データD11の左端部分側へ向かうにつれて、人体画素の輝度値が増加に転じてもよい。つまり、乳腺は乳頭の近傍に配置されるという傾向が、第1画像データD11に反映されていれば、第1画像データD11の輝度値は上述したように単調減少をしている必要はない。
【0062】
・第2画像データD12
図12及び
図15に示すように、第2画像データD12は、マンモグラフィ画像D0の上下方向にマンモグラフィ画像D0中の人体画素の輝度値が変化するように、マンモグラフィ画像D0中の各人体画素の輝度値が補正されている画像データである。第3実施形態において、第2画像データの各人体画素の輝度値は、マンモグラフィ画像D0中の左端の上端(左上の角)の位置(座標)と人体領域Rg1中の各人体画素との第2方向距離に基づいている。つまり、第2画像データD12は、マンモグラフィ画像D0中の左端の上端(左上の角)と各人体画素との第2方向距離に応じてマンモグラフィ画像D0中の人体画素の輝度値が変化するように、マンモグラフィ画像D0中の各人体画素の輝度値が補正されている画像データである。第2方向は第1方向と交差する方向である。第3実施形態において第2方向は垂直方向である。このため、第3実施形態では、第1方向と第2方向とは直交する。なお、第1方向と第2方向とは直交していなくてもよい。
【0063】
第3実施形態において、第2画像データD12は、この第2方向距離が長くなるにつれて各人体画素の輝度値が大きくなるように、マンモグラフィ画像D0中の各人体画素の輝度値が補正されている。つまり、第2画像データD12の左端の上端(左上の角)は第2方向距離が最小なので、この左端の上端の輝度値は最小である。また、第2画像データD12の左端の下端(左下の角)は第2方向距離が最大なので、この左端の下端の人体画素の輝度値は最大である。更に、第2画像データD12の左端の上端側から左端の下端側へ向かうにつれて、人体画素の輝度値は単調増加する。人体画素の輝度値は、この第2方向距離に比例して減少してもよいし、比例していなくてもよい。また、第3実施形態では、第2画像データD12の左端の上端の人体画素の階調値が0であり、第2画像データD12の左端の下端の人体画素の階調値が1である。輝度値の最大値及び最小値は、これらの値に限定されるものではない。
【0064】
第2画像データD12の人体画素のうち輝度値が中央値となっている画素の位置(座標)は、乳頭領域RgNの画素(乳頭画素)の位置(座標)に一致している。ここでいう中央値は、輝度値を高い方から順番に並べたとき、その順番の真ん中の輝度値である。第3実施形態では、第2画像データD12の人体画素の輝度値の最大値は1であり、最小値は0である。このため、第2画像データD12の人体画素のうち輝度値が中央値となっている画素の輝度値は、0.5である。したがって、第3実施形態において、第2画像データD12は、乳頭領域RgNよりも下側の各人体画素の輝度値が乳頭領域RgNよりも上側の各人体画素の輝度値よりも大きくなるように、マンモグラフィ画像D0中の各人体画素の輝度値が補正されている画像データである。第3実施形態では、乳頭領域RgNの座標が縦方向における中央座標に位置しているため、縦方向の最上部の輝度値は0であり、縦方向の最下部の輝度値は1となっているが、これに限定されるものではない。例えば、乳頭領域Nの座標が縦方向における中央座標よりも下に位置している場合には、縦方向の最上部の座標の階調値が0に設定され、乳頭領域Nの階調値が0.5に設定される。これにより、縦方向の最下部の座標の階調値には、1以下の階調値が適切に割り当てられる。逆に、乳頭領域Nの座標がマンモグラフィ画像D0中の縦方向の中央座標よりも上に位置している場合には、縦方向の最下部の座標の階調値が1に設定され、乳頭領域Nの階調値が0.5に設定される。
【0065】
図18A〜
図18Dを用いて、第1追加データD1の効果を説明する。
図18Aはマンモグラフィ画像D0を模式的に示す。
図18Bは
図18Aに示すマンモグラフィ画像に対応する正解データを模式的に示している。
図18Bの領域CRは、例えば医師によって乳腺であると判断された画素を示している。
乳腺領域抽出部3が第1追加データを用いないで学習している場合には、乳腺領域抽出部3は、
図18Cに示すような候補画素マップを生成することがある。
図18Cにおいて、白点の箇所は、確率Pが第1閾値を超える画素(候補画素)を表している。乳腺領域抽出部3が第1追加データを用いないで学習している場合には、
図18Cに示すように、
図18Bの領域CRに対応する領域だけでなく、大胸筋領域にも、多数の候補画素が生成されている。大胸筋領域にも多数の候補画素が生成されていることは、候補画素マップの精度が低いことを表している。候補画素マップの精度が低いということは、確率マップの精度も低いということである。更には、候補画素マップの精度が低いと、乳腺領域マップの精度、乳腺画素マップの精度及び乳腺密度の算出精度の低下も招く。
それに対し、乳腺領域抽出部3が第1追加データを用いて学習している場合には、乳腺領域抽出部3は、
図18Dに示すような候補画素マップが生成することができる。
図18Dに示す候補画素マップは、候補画素が、
図18Bの領域CRに対応する領域に生成されているが、その一方、大胸筋領域には候補画素の生成が抑制されている。乳腺領域抽出部3が第1追加データを用いて学習している場合には、候補画素マップの精度が高いので、確率マップの精度も高い。また、候補画素マップの精度が高いので、乳腺領域マップの精度、乳腺画素マップの精度及び乳腺密度の算出精度も高くなる。
【0066】
<第2追加データ>
マンモグラフィ画像は、例えば、次のような観点に基づいてこのウィンドウレベル調整がなされる。
第1観点において、乳腺濃度が高い場合にはマンモグラフィ画像の乳腺のあたりが白くなってぼやけるので、乳腺の詳細がわかるよう、マンモグラフィ画像は全体的に暗くなるようにウィンドウレベル調整される。
第2観点において、乳腺濃度が低い場合には、乳腺と脂肪両方の詳細が確認できるよう、マンモグラフィ画像は脂肪が見える程度まで全体的に明るくなるようにウィンドウレベル調整される。
【0067】
上述の第1観点に基づく調整がされたマンモグラフィ画像の学習が多くなされ、重み係数が確定した場合、第2観点に基づく調整がされたマンモグラフィ画像の患者に対し、精度よい出力(確率マップ出力)を提供することができない可能性がある。逆も同様である。つまり、乳腺濃度によるウインドウ調整のばらつきがあるため、その結果、確率マップの精度が低減する可能性がある。このため、第3実施形態では、マンモグラフィ画像の代表となる輝度値(代表輝度値)又はマンモグラフィ画像の輝度値の分布を反映した画像データを用いて、乳腺領域抽出部3に学習をさせ、乳腺領域抽出部3の出力(確率マップ)をより高精度化する。
【0068】
図12及び
図16に示すように、第2追加データは、マンモグラフィ画像D0の代表輝度値又はマンモグラフィ画像D0の輝度値の分布を示すデータである。より詳しくは、第2追加データは、代表輝度値又は分布に基づいて、マンモグラフィ画像D0中の全部の人体画素の輝度値が補正されている画像データである。第2追加データの全部の人体画素の輝度値は同じである。ここで、代表輝度値には、平均値、最頻値、又は、中央値を用いることができる。平均値は、全人体画素の輝度値の総和を、全人体画素の数で割った値である。最頻値は、全人体画素の輝度値の中で、最も数が多い輝度値である。中央値は、全人体画素の輝度値を大きい順番に並べたとき、その順番の真ん中に対応する輝度値である。また、第2追加データは輝度値の分布を示すデータであってもよく、例えば、全人体画素の輝度値の分布を示したヒストグラムであってもよい。第3実施形態においてヒストグラムが用いられる場合、乳腺領域確率算出部7が、順次伝搬型のニューラルネットワークを備えているとよい。つまり、乳腺領域確率算出部7は、例えば、マンモグラフィ画像D0の各画素の輝度値、及び、各輝度値におけるヒストグラムの度数を順次伝搬型のニューラルネットワークに入力して確率Pを出力する学習モデルに基づき、確率Pを出力してもよい。
【0069】
第3実施形態では、学習用データは全て画像データである。つまり、マンモグラフィ画像D0、第1追加データD1及び第2追加データD2は画像データである。第1追加データD1は乳頭と各画素との距離が反映されたデータであるので、乳腺領域抽出部3は座標を加味した学習をすることになる。このため、乳腺領域抽出部3はより高精度な出力が可能となる。なお、第2追加データは必ずしも画像データである必要はない。乳腺領域抽出部3が、上述の代表輝度値や分布を示すデータに基づいて学習したとしても、乳腺領域抽出部3の高精度化が期待される。
【0070】
3−2.前処理部6
前処理部6は、第1実施形態で説明したノイズ除去処理の過程で人体領域Rg1を抽出し、画像データDRg1を生成する。前処理部6の人体領域抽出について説明する。
【0071】
前処理部6は、マンモグラフィ画像D0から人体領域Rg1を抽出する。ここで、人体領域Rg1は、非人体領域Rg2と比較すると、明るい傾向がある。前処理部6は、この傾向を利用して、マンモグラフィ画像D0から人体領域Rg1を抽出する。そして、前処理部6は人体領域Rg1を抽出することで、画像データDRg1を生成する。画像データDRg1は、第1追加データD1及び第2追加データD2を生成するために用いられる。
【0072】
図17を参照して、前処理部6が人体領域Rg1を抽出し、画像データDRg1を生成するフローを説明する。
前処理部6は、マンモグラフィ画像D0の各画素のうち、設定閾値以上の輝度値を有する画素に1を割り当て、この設定閾値未満の輝度値を有する画素に0を割り当てる(ステップS1)。ここで、割り当てられた1や0といった数値は、画素の輝度を区別するための便宜的な数値に過ぎず、これらに限定されるものではない。また、設定閾値は可変である。前処理部6は、人体領域Rg1を抽出するフローの開始当初において、設定閾値を高く設定しており、後述するように徐々に低く設定する。
【0073】
前処理部6は、マンモグラフィ画像D0の各画素のうち、設定閾値以上の輝度値を有する画素の数をカウントする(ステップS2)。そして、前処理部6は、カウントした数がマンモグラフィ画像D0の全画素数に占める割合xを算出する(ステップS3)。前処理部6は、この算出された割合xが予め定められた割合pt(例えば、40%)であるか否かを判定する(ステップS4)。なお、ここでは、便宜的に、予め定められた割合としているが、予め定められた範囲であってもよい。この算出された割合xが予め定められた割合ptではない、すなわち、この算出された割合xが予め定められた割合ptより高い場合には、前処理部6は設定閾値を低下させる(ステップS5)。なお、設定閾値の低下量は、例えば予め定められていてよい。そして、前処理部6はステップS1に戻る。また、この算出された割合xが予め定められた割合ptである場合には、前処理部6は、ステップS1において1が割り当てられている画素を人体領域Rg1と決定する(ステップS6)。前処理部6は、マンモグラフィ画像D0から抽出した人体領域Rg1を示す画像データDRg1を生成する(ステップS7)。画像データDRg1は、人体領域Rg1であることを示すデータと、人体領域Rg1の各画素の輝度値に関するデータとを有する。
【0074】
3−3.乳腺領域抽出部3
図10に示すように、乳腺領域抽出部3は、第1実施形態の構成に加えて、追加データ生成部30を備える。
【0075】
<追加データ生成部30>
図11Bに示すように、追加データ生成部30は、第1追加データD1及び第2追加データD2を生成する。追加データ生成部30は、乳頭領域抽出部32と、代表データ生成部33と、補正部34とを有する。
【0076】
・乳頭領域抽出部32
乳頭領域抽出部32は、画像データDRg1に基づいて、乳頭領域RgNの位置(座標)を抽出(検出)する。そして、乳頭領域抽出部32は、乳頭領域RgNの位置(座標)を示す乳頭領域データDRgNを生成する。画像データDRg1において、乳頭は最も突き出ている部分である。乳頭領域抽出部32は、この乳頭の特徴を利用して、画像データDRg1から乳頭領域RgNを抽出する。
【0077】
図13に示すように、乳頭領域抽出部32は、上下方向にマンモグラフィ画像D0の各画素の輝度値を走査する。
図13において、矢印ARは走査方向を示している。乳頭領域抽出部32は、上下方向の1列の画素の輝度値の走査が完了すると、順次、隣の列の画素の輝度値の走査を行う。そして、乳頭領域抽出部32は、走査を開始してから、はじめて、輝度値の値が予め定められた輝度値以上となった画素を、乳頭領域RgNと決定する。なお、乳頭領域RgNの位置を抽出する方法は、ここで説明した内容に限定されるものではない。
【0078】
・代表データ生成部33
代表データ生成部33は、第2追加データを生成するための代表データDRpを取得する。代表データDRpとは、上記で説明した、マンモグラフィ画像D0の代表輝度値又はマンモグラフィ画像D0の輝度値の分布を示すデータである。ここでは、代表データDRpが、代表輝度値の平均値である場合を一例として説明する。代表データ生成部33は、前処理部6が決定した人体領域Rg1の各画素の輝度値の総和を算出する。そして、代表データ生成部33は、この総和を、前処理部6が決定した人体領域Rg1の画素数で割ることで、平均値を取得することができる。
【0079】
・補正部34
図11Bに示すように、補正部34は、前処理部6が決定した人体領域Rg1(画像データDRg1)と、乳頭領域抽出部32が決定した乳頭領域RgN(乳頭領域データDRgN)と、に基づいてマンモグラフィ画像D0を補正し、第1追加データD1を生成する。
また、補正部34は、前処理部6が決定した人体領域Rg1(画像データDRg1)と、代表データ生成部33が取得した代表データDRpとに基づいてマンモグラフィ画像D0を補正し、第2追加データD2を生成する。
【0080】
<乳腺領域確率算出部7>
乳腺領域確率算出部7は、マンモグラフィ画像D0における乳腺領域Rである確率Pを算出する。
第3実施形態において、確率Pは、マンモグラフィ画像D0、第1追加データD1及び第2追加データD2を入力して、確率Pを出力する学習モデルに基づいて算出する。
【0081】
第3実施形態において、教師データの入力データは、マンモグラフィ画像D0、第1追加データD1及び第2追加データD2である。正解データは、医師が乳腺領域であると判断した領域内の画素の値を1とし、それ以外の画素の値を0としたデータである。情報処理装置1には多数の教師データ及び正解データが入力される。この過程で、乳腺領域確率算出部7は、フィルタの重み係数を適宜変更し、最終的に、乳腺領域確率算出部7はこの重み係数を確定する。
【0082】
情報処理装置1が患者の診断に適用される段階(以下、運用段階と称する)において、乳腺領域確率算出部7には、当該患者のマンモグラフィ画像D0が入力される。これにより、追加データ生成部30はマンモグラフィ画像D0から第1追加データD1及び第2追加データD2を生成する。そして、乳腺領域確率算出部7は、確定した重み係数に基づいて、マンモグラフィ画像D0、第1追加データD1及び第2追加データを処理し、確率マップを出力する。
【0083】
なお、運用段階において、前処理部6が大胸筋領域G(ノイズ)を除去する工程が不要になる。乳腺領域確率算出部7が第1追加データに基づいて学習しているので、大胸筋領域Gを含むマンモグラフィ画像が乳腺領域確率算出部7に入力された場合であっても、乳腺領域確率算出部7は、大胸筋領域Gにおける画素の確率Pを、より確実に低く算出するからである。
【0084】
3−4.第3実施形態の変形例
第1追加データD1の形態は、第1画像データD11及び第2画像データD12を有する形態に限定されるものではない。
図19に示すように、第1追加データD1は、第1画像データD11及び第2画像データD12の代わりに、乳頭領域RgNを中心とする形式の画像データのみで構成してもよい。変形例に係る画像データは、乳頭領域RgNからの直線距離が短くなるにつれて各人体画素の輝度値が大きくなるように、マンモグラフィ画像D0中の各人体画素の輝度値が補正されている。
【0085】
また、第3実施形態では、乳腺領域確率算出部7が、マンモグラフィ画像D0に加えて、第1追加データD1及び第2追加データを用いて学習する形態であったが、これに限定されるものではない。乳腺領域確率算出部7は、マンモグラフィ画像D0に加えて、第1追加データD1及び第2追加データD2のうちの一方を用いて学習する形態であってもよい。この場合には、運用段階において、追加データ生成部30は、マンモグラフィ画像D0から第1追加データD1及び第2追加データD2のうちの一方を生成する。そして、乳腺領域確率算出部7は、マンモグラフィ画像D0と、第1追加データD1及び第2追加データD2のうちの一方とに基づいて、確率マップを出力する。
【0086】
第3実施形態では、情報処理装置1が、追加データ生成部30を備える形態であったが、それに限定されるものではない。追加データ生成部30は、情報処理装置1外に設けられていてもよい。
図20に示すように、この場合には、情報処理装置1には、マンモグラフィ画像D0と、予め生成しておいた第1追加データD1及び第2追加データD2とが入力される。
【0087】
また、第3実施形態において、人体領域Rg1は、マンモグラフィ画像D0中の左側に配置された例を示しているが、この配置に限定されるものではない。学習時の画像データの人体領域Rg1の配置と運用時の画像データの人体領域Rg1の配置とが揃っていれば、人体領域Rg1の配置が
図12に示す配置とは例えば左右対称であってもよい。
【0088】
第3実施形態において、第1追加データは画像データであったが、これに限定されるものではない。第1追加データは、例えば、乳頭の位置データであってもよい。この場合には、追加データ生成部30は、乳頭の位置データに基づき、画像データを生成する。
また、第1追加データは、乳頭の位置データに加え、人体領域Rg1の位置データ、又は、大胸筋の位置データを加味してもよい。追加データ生成部30は、例えば、乳頭の位置に対して人体領域Rg1の位置又は大胸筋の位置に向かって出力(例えば、輝度値)が変化するような関数またはテーブルを使用し、画像データを生成することができる。乳腺領域確率算出部7は、このように生成された画像データを用いて学習を実施することができ、運用段階で確率Pを出力することもできる。
【0089】
また、第1追加データに係る画像データは、マンモグラフィ画像中の乳頭画素の位置に基づいて、マンモグラフィ画像中の人体画素の画素値が補正されている画像データである。画素値は、上述した通りマンモグラフィ画像中の人体画素の輝度値であってもよく、マンモグラフィ画像中の人体画素の輝度値でなくてもよい。例えば、乳頭の座標と、人体領域Rg1の座標又は大胸筋の座標とを用いて第1の追加データに係る画像データを生成する場合は、マンモグラフィ画像中の人体画素の輝度値を用いずに、第1の追加データに係る画像データを生成できる。また、第2追加データについても、例えば、マンモグラフィ画像D0中の人体画素の画素値が補正されている画像データであってもよい。
【0090】
第3実施形態において、第1追加データの座標系は、
図21Aに示すように、乳頭領域Nを中心とする直交座標系である。つまり、第3実施形態の座標系は、縦軸が垂直方向に平行であり、横軸が水平方向に平行であり、縦軸と横軸との交点が乳頭領域Nである。ここで、第1追加データの座標系は、これに限定されるものではない。
図21Bに示すように、人体領域Rg1の縁を通る接線を縦軸とし、この縦軸に直交する線を横軸としてもよい。ここで、人体領域Rg1の縁を通る接線は、乳頭領域Nにおける接線である。また、人体領域Rg1の縁は、乳房カーブであり、人体領域Rg1と非人体領域Rg2との境界に対応する。
【0091】
4.その他実施形態
・上記実施形態では、学習モデルとしてFCNを用いているが、FCN以外にも任意の順伝搬型ニューラルネットワークが利用可能である。
・上記実施形態では、学習モデルによって確率Pを算出しているが、確率Pは、各画素又は複数画素からなる小領域の輝度値によって算出してもよい。例えば、輝度値のヒストグラムに基づき確率Pを算出してもよく、輝度値の絶対値や周辺画素の輝度値との差分に基づき確率Pを算出してもよい。
・上記実施形態では、確率Pに基づいて乳腺領域を抽出しているが、確率Pを用いる以外にも、輝度値の大小から乳腺領域を直接求める方法や、水平方向/垂直方向の輝度値の遷移から乳腺領域であるか否かを判断する方法によって乳腺領域を抽出することが可能である。
・上記実施形態では、画素毎にマンモグラフィ画像における乳腺領域である確率を算出しているが、複数画素からなる小領域毎に乳腺領域である確率を算出してもよい。
【0092】
・上記の実施形態では、情報処理装置1が、乳腺領域抽出部3と、乳腺画素検出部4と、乳腺密度算出部5とを備える形態であったが、この形態に限定されるものではない。例えば、第1及び第2実施形態は、情報処理装置1が乳腺領域抽出部3の乳腺領域確率算出部7を備えており、乳腺領域抽出部3の後処理部8と乳腺画素検出部4と乳腺密度算出部5が情報処理装置1外に設けられている形態であってもよい。また、第3実施形態は、情報処理装置1が乳腺領域抽出部3の乳腺領域確率算出部7と乳腺領域抽出部3の追加データ生成部30とを備えており、乳腺領域抽出部3の後処理部8と乳腺画素検出部4と乳腺密度算出部5が情報処理装置1外に設けられている形態であってもよい。これらの場合には、情報処理装置1では確率マップを生成し、生成された確率マップは情報処理装置1外の場所で利用されることになる。
つまり、情報処理装置は、乳腺領域抽出部を備える情報処理装置であって、前記乳腺領域抽出部は、マンモグラフィ画像における乳腺領域を抽出し、且つ、前記乳腺領域抽出部は、乳腺領域確率算出部を有し、前記乳腺領域確率算出部は、前記マンモグラフィ画像を入力して前記確率を出力する学習モデルに基づき、前記確率を算出するように構成されていてもよい。
また、情報処理装置は、乳腺領域抽出部を備える情報処理装置であって、前記乳腺領域抽出部は、マンモグラフィ画像における乳腺領域を抽出し、且つ、前記乳腺領域抽出部は、乳腺領域確率算出部を有し、前記乳腺領域確率算出部は、前記マンモグラフィ画像に加えて、第1追加データ及び第2追加データのうちの少なくとも一方を入力して前記確率を出力する学習モデルに基づき、前記確率を算出するように構成されていてもよい。
また、情報処理装置は、マンモグラフィ画像及び第1追加データを入力して確率を出力する学習モデルを使用してもよく、マンモグラフィ画像及び第2追加データを入力して確率を出力する学習モデルを使用してもよい。例えば、ウィンドウレベルが調整されたマンモグラフィ画像を情報処理装置に学習させる場合は、マンモグラフィ画像及び第1追加データを入力して確率を出力する学習モデルを使用してもよい。また、大胸筋領域をあらかじめ除去した場合や、第1実施形態のように大胸筋領域に対応する領域に候補画素が生成されないように学習モデルを十分に学習させる場合は、マンモグラフィ画像及び第2追加データを入力して確率を出力する学習モデルを使用してもよい。
このような形態であっても、上記の実施形態と同様の効果を得ることができる。