(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023128463
(43)【公開日】2023-09-14
(54)【発明の名称】生成プログラム、生成方法および情報処理装置
(51)【国際特許分類】
A61B 8/14 20060101AFI20230907BHJP
G06T 7/00 20170101ALI20230907BHJP
【FI】
A61B8/14
G06T7/00 350C
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022032821
(22)【出願日】2022-03-03
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】安富 優
(72)【発明者】
【氏名】酒井 彬
(72)【発明者】
【氏名】河東 孝
(72)【発明者】
【氏名】上村 健人
【テーマコード(参考)】
4C601
5L096
【Fターム(参考)】
4C601EE09
4C601EE11
4C601JC07
4C601JC20
4C601KK24
4C601KK31
5L096AA03
5L096AA06
5L096BA06
5L096BA13
5L096CA18
5L096DA01
5L096FA69
5L096HA11
5L096KA04
(57)【要約】
【課題】超音波画像データを用いた機械学習モデルの過学習を抑制することを課題とする。
【解決手段】情報処理装置は、訓練データに含まれるラベル画像データであって対象物を撮像した超音波画像データにおける影の領域を示すラベル画像データを用いた機械学習により生成された自己符号化器に、擬似的な影の領域を示す画像データを入力することで得られる出力画像データを取得する。情報処理装置は、取得した出力画像データと超音波画像データとを合成することで、訓練データに対応する拡張データを生成する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
コンピュータに、
訓練データに含まれるラベル画像データであって対象物を撮像した超音波画像データにおける影の領域を示すラベル画像データを用いた機械学習により生成された自己符号化器に、擬似的な影の領域を示す画像データを入力することで得られる出力画像データを取得し、
取得した出力画像データと超音波画像データとを合成することで、前記訓練データに対応する拡張データを生成する、
処理を実行させることを特徴とする生成プログラム。
【請求項2】
超音波診断の際に用いる、超音波を発射するプローブの形状に応じた影の領域を生成し、生成された前記影の領域を示す画像データを生成する、前記コンピュータにさらに実行させることを特徴とする請求項1に記載の生成プログラム。
【請求項3】
前記生成する処理は、
黒一色の画像データに、白で塗り潰した領域であって前記プローブの形状に応じた前記領域を配置し、
過去に撮像された、像が写っている超音波画像データから超音波の発射位置を推知し、
推定された前記発射位置と中心に、前記超音波画像データにおいて前記像が写っている場所から前記領域を回転させることで、前記擬似的な影の領域を示す画像データを生成する、ことを特徴とする請求項2に記載の生成プログラム。
【請求項4】
過去に撮像された複数の超音波画像データから、実際に発生した影の統計データを生成し、
前記影の統計データにしたがって、前記擬似的な影の領域を示す画像データを生成する、前記コンピュータにさらに実行させることを特徴とする請求項1から3のいずれか一つに記載の生成プログラム。
【請求項5】
前記生成する処理は、
前記統計データとして、影の数の分布、影の長さの平均と分散、影の幅の平均と分散を生成し、
前記統計データに基づき、影の形状を決定し、
決定された影の形状を示す前記画像データを生成する、ことを特徴とする請求項4に記載の生成プログラム。
【請求項6】
前記生成する処理は、
前記統計データとして、前記影の要因の分布を生成し、
前記影の要因の分布にしたがって、各要因に対応する数の前記画像データを生成する、ことを特徴とする請求項4または5に記載の生成プログラム。
【請求項7】
前記生成する処理は、
前記出力画像データと前記超音波画像データとを画素ごとに乗算することで、前記訓練データに対応する前記拡張データを生成する、ことを特徴とする請求項1から6のいずれか一つに記載の生成プログラム。
【請求項8】
コンピュータが、
訓練データに含まれるラベル画像データであって対象物を撮像した超音波画像データにおける影の領域を示すラベル画像データを用いた機械学習により生成された自己符号化器に、擬似的な影の領域を示す画像データを入力することで得られる出力画像データを取得し、
取得した出力画像データと超音波画像データとを合成することで、前記訓練データに対応する拡張データを生成する、
処理を実行することを特徴とする生成方法。
【請求項9】
訓練データに含まれるラベル画像データであって対象物を撮像した超音波画像データにおける影の領域を示すラベル画像データを用いた機械学習により生成された自己符号化器に、擬似的な影の領域を示す画像データを入力することで得られる出力画像データを取得する取得部と、
取得した出力画像データと超音波画像データとを合成することで、前記訓練データに対応する拡張データを生成する生成部と、
を有することを特徴とする情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、生成プログラム、生成方法および情報処理装置に関する。
【背景技術】
【0002】
対象を非破壊、非侵襲に検査する方法として、超音波検査がある。超音波検査は、プローブから超音波を発生させ、対象物からの反射の強さとタイミングを可視化することで超音波画像データを取得し、取得された超音波画像データを用いて診断を行う検査手法である。
【0003】
超音波画像データに対してディープニューラルネット(DNN:Deep Neural Network)を活用し、写っているものを認識や検出する技術が知られている。一般的なDNNと同様に、超音波画像データに対するDNNにおいても、データが不十分な場合は過学習が生じることから、データ拡張(data augmentation)により訓練データを増やしてDNNの機械学習が行われる。
【0004】
データ拡張としては、入力データにランダムにノイズを付与することでバリエーションを作り出す手法が利用されている。過学習を抑制するためには、実際に存在しそうなバリエーションの訓練データを生成することが重要である。例えば、画像データが対象の場合には、ピクセルごとにランダムなノイズを付与、画像データ全体の輝度をランダムに変化、画像データ全体のコントラストをランダムに変化、画像データ全体の色相をランダムに変化させることが行われる。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記データ拡張を超音波画像データに適応させることが難しく、過学習を抑制することができない。例えば、超音波のバリエーションの多くは、骨など、固く、超音波を反射してしまう素材が原因となる影と呼ばれる音響陰影の影響であり、通常のデータ拡張ではこのようなバリエーションを作り出すことはできない。
【0007】
一つの側面では、超音波画像データを用いた機械学習モデルの過学習を抑制することができる生成プログラム、生成方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
第1の案では、生成プログラムは、コンピュータに、訓練データに含まれるラベル画像データであって対象物を撮像した超音波画像データにおける影の領域を示すラベル画像データを用いた機械学習により生成された自己符号化器に、擬似的な影の領域を示す画像データを入力することで得られる出力画像データを取得し、取得した出力画像データと超音波画像データとを合成することで、前記訓練データに対応する拡張データを生成する、処理を実行させることを特徴とする。
【発明の効果】
【0009】
一実施形態によれば、超音波画像データを用いた機械学習モデルの過学習を抑制することができる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、実施例1にかかる情報処理装置を説明する図である。
【
図2】
図2は、一般的なデータ拡張を説明する図である。
【
図3】
図3は、超音波画像データの影を説明する図である。
【
図4】
図4は、実施例1にかかる情報処理装置の機能構成を示す機能ブロック図である。
【
図5】
図5は、ラベルデータの例を説明する図である。
【
図6】
図6は、影生成器の機械学習を説明する図である。
【
図7】
図7は、プローブの種類と影の種類との関係を説明する図である。
【
図8】
図8は、大まかな疑似影画像データの生成を説明する図である。
【
図9】
図9は、高品質な疑似影画像データの生成を説明する図である。
【
図11】
図11は、拡張データを用いた機械学習モデルの生成を説明する図である。
【
図12】
図12は、拡張データの生成処理の流れを示すフローチャートである。
【
図13】
図13は、統計データを用いた拡張データの生成を説明する図である。
【
図14】
図14は、統計データを用いた拡張データの生成を説明する図である。
【発明を実施するための形態】
【0011】
以下に、本願の開示する生成プログラム、生成方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。
【実施例0012】
[情報処理装置の説明]
図1は、実施例1にかかる情報処理装置10を説明する図である。
図1に示す情報処理装置10は、超音波検査によって得られる超音波画像データの入力に応じて、臓器の認識、超音波画像データに写っている影の検出や除去などを行う機械学習モデルの機械学習に用いられる訓練データを生成するコンピュータの一例である。
【0013】
機械学習モデルにはDNNなどが利用されるが、一般的なDNNと同様に、超音波画像データに対するDNNにおいても、データが不十分な場合は過学習が生じることから、データ拡張により訓練データを増やすことが行われる。
【0014】
図2は、一般的なデータ拡張を説明する図である。
図2に示すように、データ拡張は、ピクセルごとにランダムなノイズを付与、画像データ全体の輝度をランダムに変化、画像データ全体のコントラストをランダムに変化または画像データ全体の色相をランダムに変化させることで、例えば猫の元画像データからノイズを付与した拡張画像データを生成する。そして、拡張画像データをDNN(機械学習モデル)に入力し、DNNの出力結果と拡張画像データのラベル(猫)とが一致するように、DNNの機械学習が実行される。
【0015】
ところが、超音波検査で撮像される超音波画像データには、いわゆる影と呼ばれるノイズが発生する。この影は、
図2で説明したようなノイズとは形式や発生状況などが異なるので、上記データ拡張では機械学習に有用な訓練データを生成することが難しい。
【0016】
図3は、超音波画像データの影を説明する図である。
図3に示すように、超音波画像データは、プローブから対象物(例えば臓器)に対して超音波を発射し、対象物からの反射の強さとタイミングを可視化することで得られる。例えば、放射状にもしくは平行に超音波が発射され、超音波を反射するものがあった場所が明るく表示される。超音波画像データに現れる影は、骨などの固く、超音波を反射してしまう素材が原因となる音響陰影の影響で発生する。したがって、一般的なデータ拡張では、影を再現することが難しく、超音波画像データに対して適切なデータ拡張を行うことが難しい。
【0017】
そこで、実施例1にかかる情報処理装置10は、訓練データに含まれるラベル画像データであって対象物を撮像した超音波画像データにおける影の領域を示すラベル画像データを用いた機械学習により生成された自己符号化器に、擬似的な影の領域を示す画像データを入力することで得られる出力画像データを取得する。情報処理装置10は、取得した出力画像データと超音波画像データとを合成することで、訓練データに対応する拡張データを生成する。
【0018】
例えば、情報処理装置10は、超音波画像に対して影がどこにあるかを示したラベルデータを用いて自己符号化器を生成する。そして、情報処理装置10は、超音波画像データの取得時の情報から大まかな擬似的な影画像データを生成し、これを自己符号化器への入力とすることで、実際の影の形状や分布を考慮した影画像データを生成する。そして、情報処理装置10は、影画像データと超音波画像データとを合成して、ノイズが付加された拡張データを生成する。
【0019】
つまり、情報処理装置10は、超音波画像データにおける影を模した擬似的な影画像データを生成して超音波画像データに重畳することでデータ拡張を行うことで、超音波画像データに対しても有効なデータ拡張を実現し、超音波画像データを用いた機械学習モデルの過学習を抑制することができる。
【0020】
[機能構成]
図4は、実施例1にかかる情報処理装置10の機能構成を示す機能ブロック図である。
図4に示すように、情報処理装置10は、通信部11、記憶部12、制御部20を有する。
【0021】
通信部11は、他の装置との間の通信を制御する処理部であり、例えば通信インタフェースなどにより実現される。例えば、通信部11は、図示しない測定器が測定した超音波画像データを、測定器や管理者端末などから受信する。また、通信部11は、管理者端末などの外部装置から各種データを受信し、外部装置に各種データを送信する。
【0022】
記憶部12は、各種データや制御部20が実行するプログラムなどを記憶する処理部であり、例えばメモリやハードディスクなどにより実現される。この記憶部12は、ラベルデータDB13、訓練データDB14、拡張データDB15、機械学習モデル16を記憶する。
【0023】
ラベルデータDB13は、事前学習部21による影生成器の機械学習に利用されるラベルデータを記憶するデータベースである。具体的には、ラベルデータDB13は、超音波画像データ内のどこに影があるかを示したラベル画像データの一例であるラベルデータであって、対象物を撮像した超音波画像データにおける影の領域を示すラベルデータを記憶する。
図5は、ラベルデータの例を説明する図である。
図5に示すように、過去に撮像された超音波画像データ50の影50aなどを用いて、影の位置を示すラベルデータ51が生成される。
【0024】
訓練データDB14は、機械学習モデル16の機械学習に利用される訓練データを記憶するデータベースである。例えば、教師あり学習が行われる場合、訓練データDB14が記憶する各訓練データは、超音波画像データとラベル(正解情報)とが対応付けられるデータである。なお、超音波画像データには、影が写っていない超音波画像データや影が写っている超音波画像データを採用することができる。ラベルには、機械学習モデルの訓練内容によって任意の情報を設定することができ、例えば影の位置、影の数、影の有無、認識対象の臓器影などを1つ以上組み合わせることができる。なお、教師なし学習に利用することもできる。
【0025】
拡張データDB15は、機械学習モデル16の機械学習に利用される訓練データを記憶するデータベースであって、後述する制御部20によって生成された拡張データを記憶するデータベースである。詳細については後述するが、拡張データDB15が記憶する各拡張データは、訓練データと同様の構成を有する。
【0026】
機械学習モデル16は、DNNを用いて生成された機械学習モデルである。例えば、機械学習モデル16は、訓練データおよび拡張データを用いて生成される。この機械学習モデル16は、例えば影の位置、影の数、影の有無、認識対象の臓器影などを検出する検出器の一例である。
【0027】
制御部20は、情報処理装置10全体を司る処理部であり、例えばプロセッサなどにより実現される。この制御部20は、事前学習部21、拡張データ生成部22、機械学習部23を有する。
【0028】
事前学習部21は、影の生成を実行する影生成器を生成する処理部である。具体的には、事前学習部21は、ラベルデータDB13に記憶される各ラベルデータを用いた機械学習により、影生成器を生成する。すなわち、事前学習部21は、対象物を撮像した超音波画像データにおける影の領域を示すラベルデータを用いた機械学習により影生成器を生成する。
【0029】
図6は、影生成器21aの機械学習を説明する図である。
図6に示すように、事前学習部21は、ラベルデータDB13に記憶される影のラベルデータAを影生成器21aに入力し、影生成器21aにより生成された出力結果A´を取得する。そして、事前学習部21は、影のラベルデータAのラベルと出力結果A´との誤差が最小化するように、DNNのパラメータや重み等を最適化する。
【0030】
ここで、機械学習の損失関数には、平均二乗誤差など一般的に利用される損失関数を採用することができ、最適化には、勾配降下法(Momentum SGD)など一般的に利用される最適化手法を採用することができる。また、影生成器21aには、入力データから中間特徴量を抽出するエンコーダと中間特徴量から入力データを復元するデコーダとを有するオートエンコーダなどを採用することができる。
【0031】
拡張データ生成部22は、訓練データを拡張した拡張データを生成する処理部である。具体的には、拡張データ生成部22は、事前学習部21により生成された影生成器21aに、擬似的な影の領域を示す画像データを入力することで得られる出力画像データを取得する。続いて、拡張データ生成部22は、取得した出力画像データと超音波画像データとを合成することで、訓練データに対応する拡張データを生成する。そして、拡張データ生成部22は、生成された拡張データを拡張データDB15に格納する。
【0032】
すなわち、拡張データ生成部22は、元となる超音波画像データから大まかに影を挿入した疑似影画像データを生成し、その疑似影画像データを影生成器21aに入力して高品質な影が写っている疑似影画像データを生成する。そして、拡張データ生成部22は、元となる超音波画像データと高品質な影が写っている疑似影画像データとを合成した拡張データを生成する。
【0033】
ここでは、大まかな疑似影画像データの生成、高品質な疑似影画像データの生成、拡張データの生成のそれぞれについて説明する。
【0034】
(大まかな疑似影画像データの生成)
拡張データ生成部22は、ルールベースで大まかな疑似影画像データを生成する。例えば、拡張データ生成部22は、超音波計測時に使用されるプローブなどの機器や対象の臓器によって、大まかな影の形状を決定する。
図7は、プローブの種類と影の種類との関係を説明する図である。
図7に示すように、拡張データ生成部22は、扇型に超音波が発射されやすいセクタ型スキャナやコンベックス型スキャナなどのプローブが使用されている場合は、影の形状を扇型に決定する。また、拡張データ生成部22は、平行に超音波が発射されやすいリニア型スキャナなどのプローブが使用されている場合は、影の形状を四角形に決定する。
【0035】
続いて、コンベックス型スキャナを例にして、大まかな疑似影画像データの生成を説明する。
図8は、大まかな疑似影画像データの生成を説明する図である。
図8に示すように、拡張データ生成部22は、拡張元となるデータ拡張対象の超音波画像データを選択する。例えば、拡張データ生成部22は、訓練データDB14に記憶される訓練データZ(超音波画像データZ)を取得する。
【0036】
そして、拡張データ生成部22は、訓練データZ(超音波画像データZ)と同じ大きさであって黒一色の画像データBを生成し、画像データBに、白で塗り潰したランダムな大きさの長方形(もしくはannular sector)B1の領域を配置する(S1)。続いて、拡張データ生成部22は、超音波画像データZに写っている超音波画像(像Z1)から超音波の発射位置を推定する(S2)。例えば、拡張データ生成部22は、超音波画像の両端の線を延長させた交点を発射位置と推定することができ、発射位置が既知である場合にはそれを利用することもできる。
【0037】
その後、拡張データ生成部22は、画像データBに配置した長方形B1を、推定した超音波の発射位置を中心に、超音波画像データZにおいて像Z1が写っている場所からはみ出ないようランダムに回転させる(S3)。このようにして、拡張データ生成部22は、大まかな疑似影画像データBを生成することができる。
【0038】
(高品質な疑似影画像データの生成)
次に、拡張データ生成部22は、影生成器21aを用いて、高品質な疑似影画像データを生成する。
図9は、高品質な疑似影画像データの生成を説明する図である。
図9に示すように、拡張データ生成部22は、大まかな疑似影画像データBを影生成器21aに入力し、影生成器21aの出力結果を取得する。そして、拡張データ生成部22は、影生成器21aの出力結果を、高品質な疑似影画像データCとする。この高品質な疑似影画像データCには、高品質に再現した疑似的な影CBが含まれることとなる。
【0039】
(拡張データの生成)
次に、拡張データ生成部22は、高品質な疑似影画像データCと元の超音波画像データZとを重畳して拡張データを生成する。
図10は、拡張データの生成を説明する図である。
図10に示すように、拡張データ生成部22は、高品質な疑似影画像データCの白黒を反転させて、白黒反転後の高品質な疑似影画像データC1のスケーリングを行い、スケーリング後の画像データC1に[0,1]の範囲の乱数を乗じて影の濃さを調整した画像データC2を生成する。
【0040】
そして、拡張データ生成部22は、元画像データである超音波画像データZに対して同様のスケーリングを実行し、スケーリング後の超音波画像データZと画像データC2とを画素ごとに乗算して、拡張データEを生成する。なお、スケーリングには、最小値を0、最大値を1とする0-1スケーリングなどの公知の手法(正規化)を採用することができる。
【0041】
なお、拡張データ生成部22は、拡張データEを教師あり学習に利用する場合には、生成された拡張データEに、機械学習モデルの訓練内容に応じたラベル(目的変数)を付与して、拡張データDB15に格納する。一方、拡張データ生成部22は、拡張データEを教師なし学習に利用する場合には、生成された拡張データEを拡張データDB15に格納する。
【0042】
図4に戻り、機械学習部23は、訓練データおよび拡張データを用いた機械学習により、機械学習モデル16を生成する処理部である。具体的には、機械学習部23は、機械学習モデル16の用途に応じて、教師あり学習や教師なし学習等の様々な機械学習手法により、機械学習モデル16の訓練を実行する。
【0043】
図11は、拡張データを用いた機械学習モデル16の生成を説明する図である。
図11では、拡張データEを用いた教師あり学習を例にして説明する。
図11に示すように、拡張データEは、説明変数と目的変数とを有する。ここで、説明変数は、拡張データEの画像データであり、目的変数は、訓練内容により決定される正解情報である。機械学習部23は、拡張データEを機械学習モデル16に入力し、機械学習モデル16の出力結果E´を取得する。そして、機械学習部23は、拡張データEの目的変数と出力結果E´との誤差が小さくなるように、機械学習モデル16の訓練を実行する。
【0044】
なお、機械学習モデル16の訓練内容としては、影の位置の検出、影の数の検出、影の大きさの検出、影の有無の検出、臓器の認識など、もしくはこれらの組合せなどが挙げられる。したがって、拡張データEのラベル(目的変数)としては、影の位置、影の数、影の大きさ、影の有無、臓器の名称などが設定される。
【0045】
このようにして生成された機械学習モデル16は、超音波画像データが入力されると、訓練内容にしたがって、影の位置などの検出結果や臓器の認識結果などを出力する。
【0046】
[処理の流れ]
図12は、拡張データの生成処理の流れを示すフローチャートである。
図12に示すように、管理者等により処理開始が指示されると(S101:Yes)、事前学習部21は、ラベルデータDB13に記憶されるラベルデータを用いて影生成器21aを生成する(S102)。
【0047】
影生成器21aが生成されると、拡張データ生成部22は、元となる超音波画像データを基準に、ルールベースに基づいて大まかな疑似影画像データを生成する(S103)。続いて、拡張データ生成部22は、大まかな疑似影画像データを影生成器21aに入力して、高品質な疑似影画像データを生成する(S104)。
【0048】
その後、拡張データ生成部22は、高品質な疑似影画像データと、元となる超音波画像データとを合成して、拡張データを生成する(S105)。なお、上記各処理は、矛盾のない範囲内で適宜入れ替えることができる。また、
図12では、一連の流れで説明したが、これに限定されるものではなく、影生成器21aの生成、大まか疑似影画像データの生成、高品質な疑似影画像データの生成、拡張データの生成の各処理を別々のフローで実行することもできる。
【0049】
[効果]
上述したように、情報処理装置10は、超音波画像データにおける影を再現した擬似的な影を生成する影生成器21aをDNNによって構成して訓練し、高精度な疑似影画像データを生成して元の超音波画像データに重畳することでデータ拡張することができる。この結果、情報処理装置10は、超音波画像データに対しても有効なデータ拡張を実現することができる。したがって、情報処理装置10は、訓練データと、高精度に生成した拡張データとを用いた機械学習により、目的とする機械学習モデルの訓練を実行することができ、超音波画像データを用いた機械学習モデルの過学習を抑制することができる。
【0050】
また、情報処理装置10は、超音波を発射するプローブの形状に応じた影の領域を生成するので、超音波検査の状態を再現することができ、拡張データの精度を向上させることができる。また、情報処理装置10は、発射位置を基準にした手法により大まかな疑似影画像データを生成した上で、高品質な疑似影画像データを生成することができるので、最終的な拡張データの精度を向上させることができる。
ところで、疑似影画像データは、実際に発生した影の状況に基づき生成することで、実際の超音波検査に即した影の発生を再現することができる。そこで、実施例2では、統計データに基づく疑似影画像データの生成について説明する。
そして、拡張データ生成部22は、影の分布と影の形状に関する統計データとに基づいて、大まかな疑似影画像データを生成する。例えば、拡張データ生成部22は、影の分布にしたがって、1つの影の疑似影画像データを全体の2割生成し、2つの影の疑似影画像データを全体の4割生成する。その際、拡張データ生成部22は、平均と分散にしたがって、生成する影の形状を決定する。例えば、影の長さを例にして説明すると、拡張データ生成部22は、分散が閾値未満の場合は、平均値の長さの影を含む大まかな疑似影画像データBを生成し、分散が閾値以上の場合は、平均値の長さからランダムに長さを変えた複数の大まかな疑似影画像データBを生成する。
別例としては、情報処理装置10は、影のラベルデータに影の要因などのラベルがついており、また、その要因によって影の形状が大きく異なる場合、大まかな影を生成するための情報を、要因ごとにラベルデータから計算してもよい。その際、情報処理装置10は、影の要因の頻度分布も計算しておき、生成時にはまず影の要因をサンプリングし、その後にその要因に対応する上記情報を用いて大まかな影を生成することもできる。
また、拡張データ生成部22は、要因ごとにラベルデータの数を計数し、ラベルデータにおける影の要因の分布を生成する。そして、拡張データ生成部22は、影の要因の分布に従って、各要因に対応する大まかな疑似影画像データを生成する。例えば、ラベルデータ全体の6割が肋骨の影、3割が拳の影、1割が腕の影の場合だった場合に、100個の拡張データを生成することを考える。この場合、拡張データ生成部22は、60個の肋骨の大まかな疑似影画像データ、30個の拳の大まかな疑似影画像データ、10個の腕の大まかな疑似影画像データを生成することで、最終的な拡張データの数を影の要因の分布と同じにする。