(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-28
(54)【発明の名称】三次元画像データを解析するためのシステム及び方法
(51)【国際特許分類】
A61B 6/02 20060101AFI20221221BHJP
A61B 6/00 20060101ALI20221221BHJP
【FI】
A61B6/02 301H
A61B6/00 360Z
A61B6/00 350D
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022524091
(86)(22)【出願日】2020-10-26
(85)【翻訳文提出日】2022-06-17
(86)【国際出願番号】 US2020057319
(87)【国際公開番号】W WO2021081483
(87)【国際公開日】2021-04-29
(32)【優先日】2019-10-25
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522163780
【氏名又は名称】ディープヘルス, インコーポレイテッド
(74)【代理人】
【識別番号】100134832
【氏名又は名称】瀧野 文雄
(74)【代理人】
【識別番号】100165308
【氏名又は名称】津田 俊明
(74)【代理人】
【識別番号】100115048
【氏名又は名称】福田 康弘
(72)【発明者】
【氏名】ロッター ウィリアム
【テーマコード(参考)】
4C093
【Fターム(参考)】
4C093AA11
4C093DA06
4C093FD12
4C093FF17
4C093FF28
4C093FF31
4C093FF42
(57)【要約】
本願開示は、患者の乳房組織の悪性可能性スコアを求めるための方法を提供する。本方法は、乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を受け取るステップと、各二次元画像ごとに、訓練済みの第1のニューラルネットワークを含む第1のモデルに当該二次元画像を入力するステップと、複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数のインジケータを第1のモデルから受け取るステップと、複数のインジケータと複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成するステップと、訓練済みの第2のニューラルネットワークを含む第2のモデルに合成二次元画像を入力するステップと、第2のモデルから悪性可能性スコアを受け取るステップと、悪性可能性スコアを含むレポートをメモリ又は表示部のうち少なくとも1つへ出力するステップと、を有する。
【選択図】
図8
【特許請求の範囲】
【請求項1】
患者の乳房組織の悪性可能性スコアを求めるための方法であって、
前記乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を受け取るステップと、
前記各二次元画像ごとに、
訓練済みの第1のニューラルネットワークを含む第1のモデルに当該二次元画像を入力するステップと、
前記複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数のインジケータを前記第1のモデルから受け取るステップと、
前記複数のインジケータと前記複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成するステップと、
訓練済みの第2のニューラルネットワークを含む第2のモデルに前記合成二次元画像を入力するステップと、
前記第2のモデルから悪性可能性スコアを受け取るステップと、
前記悪性可能性スコアを含むレポートをメモリ又は表示部のうち少なくとも1つへ出力するステップと、
を有することを特徴とする方法。
【請求項2】
前記インジケータは関連性スコアを含み、
前記生成するステップは、
第1のインジケータと第2のインジケータとが重複することを判定するステップと、
前記第1のインジケータの方が前記第2のインジケータより高い関連性スコアを有することを判定するステップと、
前記第1のインジケータの方が高い関連性スコアを有すると判定された場合、前記第1のインジケータの少なくとも一部を前記合成二次元画像に含めるステップと、
を有する、
請求項1記載の方法。
【請求項3】
前記第1のインジケータは前記複数の二次元画像に含まれる第1の二次元画像に関連付けられると共に、前記第2のインジケータは前記複数の二次元画像に含まれる第2の二次元画像に関連付けられる、
請求項2記載の方法。
【請求項4】
前記各インジケータは、強度値をそれぞれ有する画素のアレイと、関連性スコアと、を含む、
請求項1記載の方法。
【請求項5】
前記生成するステップは、
前記合成二次元画像に含まれる第1の画素が有する第1の強度値を、インジケータに含まれる第2の強度値に等しく設定するステップを含む、
請求項4記載の方法。
【請求項6】
前記生成するステップは、
前記合成二次元画像に含まれる第1の画素が有する第1の強度値を、前記複数の二次元画像に含まれる第2の二次元画像に含まれる第2の強度値であってどの前記インジケータにも関連付けられていない第2の画素が有する第2の強度値に等しく設定するステップを有する、
請求項4記載の方法。
【請求項7】
前記第2の二次元画像は少なくとも1つのインジケータに関連付けられる、
請求項6記載の方法。
【請求項8】
前記生成するステップは、
前記複数のインジケータに含まれる第1のインジケータに関連付けられた第1のカバレッジ領域であって画素の第2のアレイを含む第1のカバレッジ領域を求めるステップと、
前記複数のインジケータに含まれる第2のインジケータに関連付けられた第2のカバレッジ領域であって画素の第3のアレイを含む第2のカバレッジ領域を求めるステップと、
前記第1のカバレッジ領域に含まれる第2の強度値と前記第2のカバレッジ領域に含まれる第3の強度値とに基づいて、前記合成二次元画像に含まれる第1の画素の第1の強度値を求めるステップと、
を有する、
請求項4記載の方法。
【請求項9】
前記第1のカバレッジ領域は、前記第1のインジケータに含まれない少なくとも1つの画素を含むと共に、前記第2のカバレッジ領域は、前記第2のインジケータに含まれない少なくとも1つの画素を含む、
請求項8記載の方法。
【請求項10】
前記第1の画素の前記第1の強度値を求めるステップは、
前記第2の強度値に第1の重みを乗じたものと、前記第3の強度値に第2の重みを乗じたものと、の和に等しくなるように、前記第1の強度値を設定するステップ
を有する、
請求項8記載の方法。
【請求項11】
前記生成するステップは、
第1のインジケータと第2のインジケータとが重複することを判定するステップと、
前記第1のインジケータの方が前記第2のインジケータより高い関連性スコアを有することを判定するステップと、
前記第1のインジケータの方が高い関連性スコアを有すると判定された場合、前記第2のインジケータのどの部分も前記合成二次元画像に含めないステップと、
を有する、
請求項1記載の方法。
【請求項12】
前記三次元画像は、デジタル乳房トモシンセシスを用いて生成される、
請求項1記載の方法。
【請求項13】
訓練済みの前記第1のニューラルネットワークは第1のサブネットワークを含むと共に、訓練済みの前記第2のニューラルネットワークは第2のサブネットワークを含み、
前記第1のサブネットワーク及び前記第2のサブネットワークの層及びフィルタの数は同数である、
請求項1記載の方法。
【請求項14】
訓練済みの前記第2のニューラルネットワークは、初期の重み値として前記第1のニューラルネットワークの重み値のセットを用いて訓練されたものである、
請求項13記載の方法。
【請求項15】
前記複数のインジケータから少なくとも1つのインジケータを取り出すステップと、
前記複数のインジケータと前記複数の二次元画像のうち少なくとも1つとに基づいて第2の合成二次元画像を生成するステップと、
をさらに有する、
請求項1記載の方法。
【請求項16】
前記第1のモデルは、二次元のフルフィールド・デジタルマンモグラフィ画像に医師の注釈を付したものを含む画像データセットに基づいて訓練される、
請求項1記載の方法。
【請求項17】
前記乳房組織の前記複数の二次元画像に含まれる各二次元画像は、三次元のデジタル乳房トモシンセシスボリュームに含まれるスライスである、
請求項16記載の方法。
【請求項18】
患者の乳房組織の悪性可能性スコア合成二次元画像を生成するための方法であって、
前記乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を受け取るステップと、
前記各二次元画像ごとに、
訓練済みのニューラルネットワークを含むモデルに当該二次元画像を入力するステップと、
それぞれスコアを有する複数の関心領域であって、前記複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数の関心領域を、前記モデルから受け取るステップと、
ターゲットの関心領域が、前記複数の関心領域のうち当該ターゲットの関心領域の二次元位置と少なくとも部分的に重なるいずれかの関心領域の最高スコアを有することを判定するステップと、ただし前記二次元位置は、前記複数の各二次元画像によって共有されるものであり、
前記ターゲットの関心領域と前記複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成するステップと、
を有することを特徴とする方法。
【請求項19】
前記各関心領域は、それぞれ強度値を有する画素のアレイをさらに含む、
請求項18記載の方法。
【請求項20】
前記生成するステップは、
前記合成二次元画像に含まれる第1の画素が有する第1の強度値を、関心領域に含まれる第2の強度値に等しく設定するステップを含む、
請求項19記載の方法。
【請求項21】
前記生成するステップは、
前記合成二次元画像に含まれる第1の画素が有する第1の強度値を、前記複数の二次元画像に含まれる第2の二次元画像に含まれる第2の強度値であってどの前記関心領域にも関連付けられていない第2の画素が有する第2の強度値に等しく設定するステップを有する、
請求項19記載の方法。
【請求項22】
前記生成するステップは、
前記複数の関心領域に含まれる第1の関心領域に関連付けられた第1のカバレッジ領域であって画素の第2のアレイを含む第1のカバレッジ領域を求めるステップと、
前記複数の関心領域に含まれる第2の関心領域に関連付けられた第2のカバレッジ領域であって画素の第3のアレイを含む第2のカバレッジ領域を求めるステップと、
前記第1のカバレッジ領域に含まれる第2の強度値と前記第2のカバレッジ領域に含まれる第3の強度値とに基づいて、前記合成二次元画像に含まれる第1の画素の第1の強度値を求めるステップと、
を有する、
請求項19記載の方法。
【請求項23】
前記第1のカバレッジ領域は、前記第1の関心領域に含まれない少なくとも1つの画素を含むと共に、前記第2のカバレッジ領域は、前記第2の関心領域に含まれない少なくとも1つの画素を含む、
請求項22記載の方法。
【請求項24】
前記第1の画素の前記第1の強度値を求めるステップは、
前記第2の強度値に第1の重みを乗じたものと、前記第3の強度値に第2の重みを乗じたものと、の和に等しくなるように、前記第1の強度値を設定するステップ
を有する、
請求項22記載の方法。
【請求項25】
前記生成するステップは、
第1の関心領域と第2の関心領域とが重複することを判定するステップと、
前記第1の関心領域の方が前記第2の関心領域より高い関連性スコアを有することを判定するステップと、
前記第1の関心領域の方が高い関連性スコアを有すると判定された場合、前記第2の関心領域のどの部分も前記合成二次元画像に含めないステップと、
を有する、
請求項18記載の方法。
【請求項26】
前記三次元画像は、デジタル乳房トモシンセシスを用いて生成される、
請求項18記載の方法。
【請求項27】
前記複数の関心領域から少なくとも1つの関心領域を取り出すステップと、
前記複数の関心領域と前記複数の二次元画像のうち少なくとも1つとに基づいて第2の合成二次元画像を生成するステップと、
をさらに有する、
請求項18記載の方法。
【請求項28】
前記モデルは、二次元のフルフィールド・デジタルマンモグラフィ画像に医師の注釈を付したものを含む画像データセットに基づいて訓練される、
請求項18記載の方法。
【請求項29】
前記乳房組織の前記複数の二次元画像に含まれる各二次元画像は、三次元のトモシンセシスボリュームに含まれるスライスである、
請求項28記載の方法。
【請求項30】
患者の乳房組織の悪性可能性スコアを求めるためのシステムであって、
前記乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を格納するように構成されたメモリと、
前記メモリにアクセスするように構成されたプロセッサと、
を備えており、
前記プロセッサは、
訓練済みの第1のニューラルネットワークを含む第1のモデルに前記各二次元画像を入力し、
前記各二次元画像ごとに、前記複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数のインジケータを前記第1のモデルから受け取り、
前記複数のインジケータと前記複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成し、
訓練済みの第2のニューラルネットワークを含む第2のモデルに前記合成二次元画像を入力し、
前記第2のモデルを用いて悪性可能性スコアを求める
ように構成されており、
前記システムはさらに、前記悪性可能性スコアを含むレポートを表示するように構成された表示部を備えている
ことを特徴とするシステム。
【請求項31】
患者の乳房組織の合成二次元画像を生成するためのシステムであって、
前記乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を格納するように構成されたメモリと、
前記メモリにアクセスするように構成されたプロセッサと、
を備えており、
前記プロセッサは、
訓練済みのニューラルネットワークを含むモデルに前記各二次元画像を入力し、
前記各二次元画像ごとに、それぞれスコアを有する複数の関心領域であって、前記複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数の関心領域を、前記モデルから受け取り、
ターゲットの関心領域が、前記複数の関心領域のうち当該ターゲットの関心領域の二次元位置と少なくとも部分的に重なるいずれかの関心領域の最高スコアを有することを判定し、ただし前記二次元位置は、前記複数の各二次元画像によって共有されるものであり、
前記ターゲットの関心領域と前記複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成する
ように構成されていることを特徴とするシステム。
【請求項32】
患者の乳房組織の悪性可能性スコアを求めるためのシステムであって、
前記乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を格納するように構成されたメモリと、
前記メモリにアクセスするように構成されたプロセッサと、
を備えており、
前記プロセッサは、
訓練済みの第1のニューラルネットワークを含む第1のモデルに前記各二次元画像を入力し、
前記各二次元画像ごとに、前記複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数のインジケータを前記第1のモデルから受け取り、
前記複数のインジケータと前記複数の二次元画像のうち少なくとも1つとに基づいて第1の合成二次元画像を生成し、
前記第1の合成二次元画像と前記複数の二次元画像のうち少なくとも1つとに基づいて第2の合成二次元画像を生成し、
前記第1の合成二次元画像と前記複数の二次元画像のうち少なくとも1つとに基づいて第3の合成二次元画像を生成し、
訓練済みの第2のニューラルネットワークを含む第2のモデルに、前記第1の合成二次元画像と前記第2の合成二次元画像と前記第3の合成二次元画像とを入力し、
前記第2のモデルを用いて悪性可能性スコアを求める
ように構成されており、
前記システムはさらに、前記悪性可能性スコアを含むレポートを表示するように構成された表示部を備えている
ことを特徴とするシステム。
【請求項33】
患者の乳房組織の合成二次元画像を生成するためのシステムであって、
前記乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像であってそれぞれスライス番号に関連付けられた複数の二次元画像を格納するように構成されたメモリと、
前記メモリにアクセスするように構成されたプロセッサと、
を備えており、
前記プロセッサは、
前記複数の二次元画像に含まれる第1の二次元画像と第2の二次元画像と第3の二次元画像とを、訓練済みのニューラルネットワークを含むモデルに入力し、ただし、前記第1の二次元画像に関連付けられたスライス番号と前記第2の二次元画像に関連付けられたスライス番号とは所定のオフセット値だけ異なっていると共に、前記第2の二次元画像に関連付けられたスライス番号と前記第3の二次元画像に関連付けられたスライス番号とは前記所定のオフセット値だけ異なっており、
前記複数の二次元画像に含まれる各二次元画像ごとに、それぞれスコアを有する複数の関心領域であって、前記複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数の関心領域を、前記モデルから受け取り、
ターゲットの関心領域が、前記複数の関心領域のうち当該ターゲットの関心領域の二次元位置と少なくとも部分的に重なるいずれかの関心領域の最高スコアを有することを判定し、ただし前記二次元位置は、前記複数の各二次元画像によって共有されるものであり、
前記ターゲットの関心領域と前記複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成する
ことを特徴とするシステム。
【発明の詳細な説明】
【技術分野】
【0001】
<関連出願の相互参照>
本願は、米国仮特許出願第62/926,088号(出願日:2019年10月25日)に係る優先権の利益を主張するものであり、当該米国仮特許出願の内容は全て、参照により本願の記載内容に含まれるものとする。
【0002】
<連邦政府の支援による研究に関する言明>
なし。
【背景技術】
【0003】
三次元(3D)マンモグラフィとも呼ばれるデジタル乳房トモシンセシス(DBT)は乳がんの検出において、従来のフルフィールド・デジタルマンモグラフィよりも優れた臨床性能を有することが示されている。フルフィールドマンモグラフィは、多くのビューについて乳房の全深さを表す二次元(2D)投影画像を生成することができる。それに対してDBTは、乳房の薄いスライス(すなわち約1mmの厚さのスライス)を表す2D画像を、1ビューあたり10~150個以上生成することができる。
【0004】
DBTはフルフィールドマンモグラフィよりも多くのデータを生成するので、人間の医師がDBT生成画像をふるいにかけ、悪性の腫瘍及び/又は病変の有無について診断を下すことが困難な場合がある。さらに、何を悪性の可能性のある領域とし、何をかかる領域としないかは、医師ごとにばらつきがあるため、同じ画像セットを用いても、患者が悪性の腫瘍及び/又は病変を有するか否かの判断が一致しないことがあり得る。
【0005】
従って、3Dマンモグラフィデータをより効率的かつ正確に解析すると共に、3Dマンモグラフィデータを用いて悪性の腫瘍及び/又は病変を画一的に推定するシステム及び方法を実現することが望ましい。
【発明の概要】
【0006】
本願開示は、3Dマンモグラフィデータを効率的かつ正確に解析すると共に、3Dマンモグラフィデータを用いて悪性の腫瘍及び/又は病変を画一的に評価するためのシステム及び方法を提供する。非限定的な一側面では、本願開示は患者の乳房組織の悪性可能性スコアを求めるための方法を提供する。本方法は、乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を受け取るステップと、各二次元画像ごとに、訓練済みの第1のニューラルネットワークを含む第1のモデルに当該二次元画像を入力するステップと、複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数のインジケータを第1のモデルから受け取るステップと、複数のインジケータと複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成するステップと、訓練済みの第2のニューラルネットワークを含む第2のモデルに合成二次元画像を入力するステップと、第2のモデルから悪性可能性スコアを受け取るステップと、悪性可能性スコアを含むレポートをメモリ又は表示部のうち少なくとも1つへ出力するステップと、を有する。
【0007】
本方法では、インジケータは関連性スコアを含むことができ、前記生成するステップは、第1のインジケータと第2のインジケータとが重複することを判定するステップと、第1のインジケータの方が第2のインジケータより高い関連性スコアを有することを判定するステップと、第1のインジケータの方が高い関連性スコアを有すると判定された場合、第1のインジケータの少なくとも一部を合成二次元画像に含めるステップと、を有することができる。第1のインジケータは複数の二次元画像に含まれる第1の二次元画像に関連付けられることができ、また、第2のインジケータは複数の二次元画像に含まれる第2の二次元画像に関連付けられることができる。
【0008】
本方法では、各インジケータは、強度値をそれぞれ有する画素のアレイと、関連性スコアと、を含むことができる。
【0009】
前記生成するステップは、合成二次元画像に含まれる第1の画素が有する第1の強度値を、インジケータに含まれる第2の強度値に等しく設定するステップを含むことができる。
【0010】
本方法では、前記生成するステップは、合成二次元画像に含まれる第1の画素が有する第1の強度値を、複数の二次元画像に含まれる第2の二次元画像に含まれる第2の強度値であってどのインジケータにも関連付けられていない第2の画素が有する第2の強度値に等しく設定するステップを有することができる。
【0011】
本方法では、第2の二次元画像は少なくとも1つのインジケータに関連付けられることができる。
【0012】
本方法では前記生成するステップは、複数のインジケータに含まれる第1のインジケータに関連付けられた第1のカバレッジ領域であって画素の第2のアレイを含む第1のカバレッジ領域を求めるステップと、複数のインジケータに含まれる第2のインジケータに関連付けられた第2のカバレッジ領域であって画素の第3のアレイを含む第2のカバレッジ領域を求めるステップと、第1のカバレッジ領域に含まれる第2の強度値と第2のカバレッジ領域に含まれる第3の強度値とに基づいて、合成二次元画像に含まれる第1の画素の第1の強度値を求めるステップと、を有することができる。第1のカバレッジ領域は、第1のインジケータに含まれない少なくとも1つの画素を含むと共に、第2のカバレッジ領域は、第2のインジケータに含まれない少なくとも1つの画素を含むことができる。第1の画素の第1の強度値を求めるステップは、第2の強度値に第1の重みを乗じたものと、第3の強度値に第2の重みを乗じたものと、の和に等しくなるように、第1の強度値を設定するステップを有することができる。
【0013】
本方法では前記生成するステップは、第1のインジケータと第2のインジケータとが重複することを判定するステップと、第1のインジケータの方が第2のインジケータより高い関連性スコアを有することを判定するステップと、第1のインジケータの方が高い関連性スコアを有すると判定された場合、第2のインジケータのどの部分も合成二次元画像に含めないステップと、を有することができる。
【0014】
三次元画像は、デジタル乳房トモシンセシスを用いて生成することができる。
【0015】
本方法では、訓練済みの第1のニューラルネットワークは第1のサブネットワークを含むことができると共に、訓練済みの第2のニューラルネットワークは第2のサブネットワークを含むことができ、第1のサブネットワーク及び第2のサブネットワークの層及びフィルタの数は同数とすることができる。訓練済みの第2のニューラルネットワークは、初期の重み値として第1のニューラルネットワークの重み値のセットを用いて訓練されたものとすることができる。
【0016】
本方法は、複数のインジケータから少なくとも1つのインジケータを取り出すステップと、複数のインジケータと複数の二次元画像のうち少なくとも1つとに基づいて第2の合成二次元画像を生成するステップと、をさらに有することができる。
【0017】
本方法では、第1のモデルは、二次元のフルフィールド・デジタルマンモグラフィ画像に医師の注釈を付したものを含む画像データセットに基づいて訓練されることができる。本方法では、乳房組織の複数の二次元画像に含まれる各二次元画像は、三次元のデジタル乳房トモシンセシスボリュームに含まれるスライスとすることができる。
【0018】
非限定的な他の一側面では、本願開示は、患者の乳房組織の合成二次元画像を生成するための方法を提供する。本方法は、乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を受け取るステップと、各二次元画像ごとに、訓練済みのニューラルネットワークを含むモデルに当該二次元画像を入力するステップと、それぞれスコアを有する複数の関心領域であって、複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数の関心領域を、モデルから受け取るステップと、ターゲットの関心領域が、複数の関心領域のうち当該ターゲットの関心領域の二次元位置と少なくとも部分的に重なるいずれかの関心領域の最高スコアを有することを判定するステップと、ただし二次元位置は、複数の各二次元画像によって共有されるものであり、ターゲットの関心領域と複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成するステップと、を有する。
【0019】
本方法では、各関心領域は、それぞれ強度値を有する画素のアレイをさらに含むことができる。
【0020】
本方法では前記生成するステップは、合成二次元画像に含まれる第1の画素が有する第1の強度値を、関心領域に含まれる第2の強度値に等しく設定するステップを含むことができる。
【0021】
本方法では前記生成するステップは、合成二次元画像に含まれる第1の画素が有する第1の強度値を、複数の二次元画像に含まれる第2の二次元画像に含まれる第2の強度値であってどの関心領域にも関連付けられていない第2の画素が有する第2の強度値に等しく設定するステップを有することができる。
【0022】
本方法では、前記生成するステップは、複数の関心領域に含まれる第1の関心領域に関連付けられた第1のカバレッジ領域であって画素の第2のアレイを含む第1のカバレッジ領域を求めるステップと、複数の関心領域に含まれる第2の関心領域に関連付けられた第2のカバレッジ領域であって画素の第3のアレイを含む第2のカバレッジ領域を求めるステップと、第1のカバレッジ領域に含まれる第2の強度値と第2のカバレッジ領域に含まれる第3の強度値とに基づいて、合成二次元画像に含まれる第1の画素の第1の強度値を求めるステップと、を有することができる。第1のカバレッジ領域は、第1の関心領域に含まれない少なくとも1つの画素を含むと共に、第2のカバレッジ領域は、第2の関心領域に含まれない少なくとも1つの画素を含むことができる。第1の画素の第1の強度値を求めるステップは、第2の強度値に第1の重みを乗じたものと、第3の強度値に第2の重みを乗じたものと、の和に等しくなるように、第1の強度値を設定するステップを有することができる。
【0023】
本方法では、前記生成するステップは、第1の関心領域と第2の関心領域とが重複することを判定するステップと、第1の関心領域の方が第2の関心領域より高い関連性スコアを有することを判定するステップと、第1の関心領域の方が高い関連性スコアを有すると判定された場合、第2の関心領域のどの部分も合成二次元画像に含めないステップと、を有することができる。
【0024】
本方法では、三次元画像は、デジタル乳房トモシンセシスを用いて生成されることができる。
【0025】
本方法はさらに、前記複数の関心領域から少なくとも1つの関心領域を取り出すステップと、前記複数の関心領域と前記複数の二次元画像のうち少なくとも1つとに基づいて第2の合成二次元画像を生成するステップと、をさらに有することができる。
【0026】
さらに他の非限定的な一側面では、本願開示は、患者の乳房組織の悪性可能性スコアを求めるためのシステムを提供する。本システムは、乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を格納するように構成されたメモリと、メモリにアクセスするように構成されたプロセッサと、を備えており、プロセッサは、訓練済みの第1のニューラルネットワークを含む第1のモデルに各二次元画像を入力し、各二次元画像ごとに、複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数のインジケータを第1のモデルから受け取り、複数のインジケータと複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成し、訓練済みの第2のニューラルネットワークを含む第2のモデルに合成二次元画像を入力し、第2のモデルを用いて悪性可能性スコアを求めるように構成されており、システムはさらに、悪性可能性スコアを含むレポートを表示するように構成された表示部を備えている。
【0027】
上記方法では、モデルは、二次元のフルフィールド・デジタルマンモグラフィ画像に医師の注釈を付したものを含む画像データセットに基づいて訓練されることができる。上記方法では、乳房組織の複数の二次元画像に含まれる各二次元画像は、三次元のトモシンセシスボリュームに含まれるスライスとすることができる。
【0028】
他の非限定的な一側面では、本願開示は、患者の乳房組織の合成二次元画像を生成するためのシステムを提供する。本システムは、乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を格納するように構成されたメモリと、メモリにアクセスするように構成されたプロセッサと、を備えており、プロセッサは、訓練済みのニューラルネットワークを含むモデルに各二次元画像を入力し、各二次元画像ごとに、それぞれスコアを有する複数の関心領域であって、複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数の関心領域を、モデルから受け取り、ターゲットの関心領域が、複数の関心領域のうち当該ターゲットの関心領域の二次元位置と少なくとも部分的に重なるいずれかの関心領域の最高スコアを有することを判定し、ただし二次元位置は、複数の各二次元画像によって共有されるものであり、ターゲットの関心領域と複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成する。
【0029】
他の非限定的な一側面では、本願開示は、患者の乳房組織の悪性可能性スコアを求めるためのシステムを提供する。本システムは、乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像を格納するように構成されたメモリと、メモリにアクセスするように構成されたプロセッサと、を備えており、プロセッサは、訓練済みの第1のニューラルネットワークを含む第1のモデルに各二次元画像を入力し、各二次元画像ごとに、複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数のインジケータを第1のモデルから受け取り、複数のインジケータと複数の二次元画像のうち少なくとも1つとに基づいて第1の合成二次元画像を生成し、第1の合成二次元画像と複数の二次元画像のうち少なくとも1つとに基づいて第2の合成二次元画像を生成し、第1の合成二次元画像と複数の二次元画像のうち少なくとも1つとに基づいて第3の合成二次元画像を生成し、訓練済みの第2のニューラルネットワークを含む第2のモデルに、第1の合成二次元画像と第2の合成二次元画像と第3の合成二次元画像とを入力し、第2のモデルを用いて悪性可能性スコアを求めるように構成されており、システムはさらに、悪性可能性スコアを含むレポートを表示するように構成された表示部を備えている。
【0030】
さらに他の非限定的な一側面では、本願開示は、患者の乳房組織の合成二次元画像を生成するためのシステムを提供する。本システムは、乳房組織の三次元画像から導出された当該乳房組織の複数の二次元画像であってそれぞれスライス番号に関連付けられた複数の二次元画像を格納するように構成されたメモリと、メモリにアクセスするように構成されたプロセッサと、を備えており、プロセッサは、複数の二次元画像に含まれる第1の二次元画像と第2の二次元画像と第3の二次元画像とを、訓練済みのニューラルネットワークを含むモデルに入力し、ただし、第1の二次元画像に関連付けられたスライス番号と第2の二次元画像に関連付けられたスライス番号とは所定のオフセット値だけ異なっていると共に、第2の二次元画像に関連付けられたスライス番号と第3の二次元画像に関連付けられたスライス番号とは所定のオフセット値だけ異なっており、複数の二次元画像に含まれる各二次元画像ごとに、それぞれスコアを有する複数の関心領域であって、複数の二次元画像に含まれる二次元画像にそれぞれ関連付けられた複数の関心領域を、モデルから受け取り、ターゲットの関心領域が、複数の関心領域のうち当該ターゲットの関心領域の二次元位置と少なくとも部分的に重なるいずれかの関心領域の最高スコアを有することを判定し、ただし二次元位置は、複数の各二次元画像によって共有されるものであり、ターゲットの関心領域と複数の二次元画像のうち少なくとも1つとに基づいて合成二次元画像を生成する。
【図面の簡単な説明】
【0031】
【
図1】一例のX線イメージングシステムを示すブロック図である。
【
図2】三次元トモシンセシスデータの二次元スライスの関心領域を生成するためのモデルの一実施形態例を示すブロック図である。
【
図3】トモシンセシスデータの二次元スライスにおいて関心領域を検出するために訓練されたモデルを用いて合成画像を作成する処理における工程の数例を示すフローチャートである。
【
図4】一例の仮合成画像に関連付けられた関心領域を示す模式図である。
【
図5】
図4の一例の仮合成画像に関連付けられた関心領域及びカバレッジ領域を示す他の一概略図である。
【
図6】悪性可能性スコアを生成するための一例の二次モデルを示す他のブロック図である。
【
図7】乳房組織における腫瘍及び/又は病変の悪性を推定するために訓練されたモデルを用いて合成画像を作成する処理における工程の一例を示すフローチャートである。
【
図8】
図7の処理の視覚的データフローパスを示す画像の集合である。
【
図9】3Dトモシンセシスデータの第1の2Dスライスに基づいて3Dトモシンセシスデータの第2の2Dスライスの関心領域(ROI)を生成するためのモデルの一実施形態例と、3Dトモシンセシスデータの当該第2の2Dスライスと、3Dトモシンセシスデータの第3の2Dスライスである。
【
図10】
図9のモデルを用いて合成画像を生成するための処理である。
【
図11】悪性可能性スコアを生成するための他の一例の二次モデルである。
【
図12】乳房組織における腫瘍及び/又は病変の悪性を推定するために訓練されたモデルを用いて3つの合成画像を作成し、当該合成画像に基づいて悪性可能性スコアを生成するための処理である。
【発明を実施するための形態】
【0032】
本願では、1つ又は複数の合成された二次元(2D)画像を用いて三次元(3D)断層撮影データの関連性の高い領域を高効率かつ画一的に表示すると共に、機械学習技術を用いて1つ又は複数の合成された画像を用いて悪性を高効率かつ画一的に判断するためのシステム及び方法例を開示する。
【0033】
下記に記載するシステム及び方法以外にも、乳房組織の3Dトモシンセシスデータの関連性の高い領域を解析し、並びに/又は腫瘍及び/若しくは病変の悪性を判断するための手法が存在し得るが、これらは全て欠点を有する。かかる手法の1つは、3Dマンモグラムに含まれる全てのスライスの関連性の高い領域に、人間の医師のラベルを設けることである。人間ベースの手法は、人間の医師が1つ1つの2Dスライスにラベルを付与するためにかなりの時間がかかるので、高コストかつ低速度になり得る。その上、人間ベースの手法は、人間の医師ごとに傾向や熟練レベルが異なるため、一貫性が無いことがあり得る。
【0034】
他の一手法は、3D断層撮影データセットの全部(すなわち3D断層撮影データセットに含まれる全部のスライス)を受け取る機械学習モデルであって、乳房組織に存在する腫瘍及び/又は病変の悪性を示す悪性可能性スコアを出力する機械学習モデルを訓練することである。この手法は、そのデータのサイズと、データ処理システムのメモリ限界のため、実現不可能であり、また、オーバーフィッティングを起こしやすくなる可能性もある。
【0035】
さらに他の一手法としては、2Dスライスのセットからスライスをランダムに選択し、又は2Dスライスのセットからデフォルトのスライス(具体的には、25番目のスライス又は真ん中のスライス等)をサンプリング若しくは選択して、当該スライスに基づき悪性可能性スコアを出力するように機械学習モデルを訓練する手法もあり得る。この手法もまた、腫瘍及び/又は病変が存在する場合にスライスがこれを含まない可能性があるため、オーバーフィッティングを起こしやすくなることがある。
【0036】
図1を参照すると、3Dデジタル乳房トモシンセシス(DBT)システム等のX線イメージングシステム100の一例が示されている。X線イメージングシステム100は、アーム102の第1端110に結合されたX線源アセンブリ108を備えることができる。反対側の端部114付近には、X線検出アセンブリ112を結合することができる。X線源アセンブリ108は、アーム102に対して実質的に垂直に延在することができると共に、X線検出アセンブリ112に向けることができる。X線検出アセンブリ112はまた、X線源アセンブリ108によって生成されて乳房を通過しX線検出アセンブリ112に入射したX線を受け取るようにアーム102から延在している。X線源アセンブリ108とX線検出アセンブリ112との間には、乳房台プレート116及び乳房圧迫プレート118が配置される。X線源アセンブリ108は定置型又は可動型とすることができる。X線イメージングシステム100は、3D DBTデータを含む再構成画像を生成することができる。3D DBTデータは複数の2Dスライスを含むことができる。一部の実施形態では、再構成画像は、約1mmの厚さを有する複数の2Dスライスを含む3D断層撮影データを含むことができる。2Dスライスは、合成2D画像を作成するために使用することができ、これについては下記にて説明する。一部の実施形態では、X線イメージングシステム100は、例えば2Dスライスのサブセットの最高強度投影等を表す中間の二次元「スラブ」を生成することができる。例えば、10個のスライスから1つの最高強度投射スラブを生成することができ、また、10~100個のスライス等の複数のスライスから複数のスラブを生成することができる。再構成された画像はコンピュータ126への入力として利用することができ、コンピュータ126はこの再構成画像を大容量記憶装置128に記憶し、大容量記憶装置128はメモリを含むことができる。コンピュータ126は、再構成画像の生成を制御するために、X線イメージングシステム100に指令を供給することもできる。
【0037】
図2を参照すると、3Dトモシンセシスデータの二次元(2D)スライス204の関心領域(ROI)を生成するためのモデル200の一実施形態例が示されている。ROIはインジケータと称され得る。モデル200は2Dスライス204を受け取り、任意の数のROI、例えば、第1の領域208A及び第1のスコア208Bを含む第1のROIと、第2の領域212A及び第2のスコア212Bを含む第2のROIと、を受け取ることができる。各ROIは、当該ROIを生成する元となった2Dスライスを示すスライス番号に関連付けることができ、例えば、75個の2Dスライスのセットのうち4番目のスライスのスライス番号等に関連付けることができる。スライス番号は、下記にて説明するように、合成画像を作成するためにROIを選択し及び/又は組み合わせる際に使用することができる。2Dスライス204の特徴に依存してゼロROIを出力することができ、例えば、悪性の可能性を十分に示唆する領域を当該2Dスライス204が有しないと判断される場合にはゼロROIを出力することができる。各ROIは、2Dスライス204の部分領域とすることができる領域を含むことができる。上述のように、各2Dスライスは画素のアレイの形式とすることができる。部分領域は、この画素アレイのサブセットとすることができる。一部の実施形態において、モデル200は、2D画像内の物体を検出するように構成された1つ以上のニューラルネットワークを含むことができる。上記物体はROIとすることができる。
【0038】
一部の実施形態では、モデル200は、所定の形状に従うROIを出力することができる。例えば、方形のバウンディングボックスを用いて腫瘍又は病変の可能性のある候補を囲むことができる。可能性のある腫瘍又は病変の輪郭をより良く描出するため、不規則な形状(例えば画素の「ブロブ」等)を用いることも可能である。ROIの訓練データベースを作成する場合、人間の医師は、方形のバウンディングボックスを使用する方が他の形状のバウンディングボックスよりも直感的に感じることができる。物体を識別するためにセグメンテーションマスクベースの手法を用いるニューラルネットワークを用いて、不規則な形状の予測ROIを出力することも可能である。その後、2Dスライス204に含まれる画素の部分アレイを含む方形のROIを識別するようにモデル200を訓練することができる。ROIの各画素は、1つ以上のカラー強度値(例えば白色強度値等)と、2Dスライス204における位置(例えば、2000×1500画素スライスにおける特定の(x,y)位置の画素)と、を有することができる。マンモグラフィイメージングシステムの中には、乳房組織のグレイスケール画像を生成するものがあるが、上記モデルはカラー2Dスライスと共に用いることが可能であることが明らかである。3Dトモシンセシスデータの各2Dスライスは同一サイズとすることができ、例えば2000×1500画素等とすることができる。
【0039】
ROIは画素の部分アレイの他にさらに、関連性スコアを有することができ、この関連性スコアは、当該画素の部分アレイが悪性可能性スコアの決定にどの程度関連しているかを示すものである(これについては、下記にて
図7を参照して説明する)。関連性スコアは、下記にて詳細に説明するように、1つ以上のROIを使用して合成2D画像を作成するために使用することができる。関連性スコアは、0~1等の数値範囲から選択することができる。訓練データセットに係るROIを識別する場合、人間の医師は、上記の数値範囲の中で各ROIに関連性スコアを割り当てることができる。これに代えて、人間の医師は0~100等の異なるスケール(スコアが高いほど悪性の可能性が高いことを示す)を用いて関連性スコアを割り当てることができ、この関連性スコアはその後、モデル200によって用いられる関連性スコア範囲に正規化されることができる。一部の実施形態では、人間の医師は、悪性の可能性のあるROIを識別するようにモデル200をより良好に訓練するため、ROIを良性であると識別する作業を行うことができる。
【0040】
一部の実施形態では、モデル200は、畳み込みニューラルネットワーク等のニューラルネットワークを含むことができる。モデル200を訓練するためには、フルフィールド・デジタルマンモグラフィ(FFDM)画像並びに/又は3Dトモシンセシス画像のセットからのスライス及び(例えば1人以上の医師により)事前識別されたROIにより構成される2Dデータを含む訓練データセットを用いて、モデルを訓練することができる。人間の医師は、与えられた2D画像を診察し、方形のボックス等の予め定められた形状を用いて、関心対象となり得るいずれかの領域の輪郭を把握することによりROIを識別し、腫瘍及び/又は病変の評価における自己の医学知識及び/又は経験に基づいて上記の予め定められた形状に関連性スコアを割り当てることができる。これに代えて、病変が悪性か否かを示す病理検査結果に基づいて関連性スコアを割り当てることもできる。複数のFFDM画像から取得された2D画像又は3Dトモシンセシス画像のスライス(例えば複数の患者の画像等)におけるROIの識別(例えば注釈付与等)を1人以上の医師に行わせることにより、大きな訓練データベースを生成することができる。FFDM画像を使用する1つの利点は、現在、注釈付きの3Dトモシンセシス画像よりも、公衆に利用可能となっている注釈付きFFDM画像の方が多いことである。さらに、2D画像への注釈付与は3Dトモシンセシス画像よりも容易であり、3Dトモシンセシス画像の場合、各3Dトモシンセシス画像に含まれる大量の個々のスライスに注釈を付与しなければならないことがある。モデル200は訓練された後、入力2Dスライスを受け取って、推定された関連性スコアと当該入力2Dスライスの画素の部分アレイとをそれぞれ含む1つ又は複数のROIを出力することができる。
【0041】
モデル200は、畳み込み層等の多数の層を含むことができる。モデルのいくつかの実施形態200は、層の数が異なっていたり、層の配列が異なっていたり、他の相違があったりすることが理解される。しかし、全ての実施形態において、モデル200は入力2D入力スライスを受け取り、入力2D入力スライスに関連付けられた何らかの関心領域を出力することができる。モデル200は、1つ以上のサブネットワークを含む一段の検出ネットワークとすることができる。
【0042】
モデル200は、第1のサブネットワーク216を含むことができる。第1のサブネットワーク216は、1つ以上の層218A~Cを有するフィードフォワード残差ニューラルネットワーク(「ResNet」)とすることができる。単一のニューラルネットワークのバックボーンとして第1のサブネットワーク216を用いて当該単一のニューラルネットワークを有効に作成するため、第1のサブネットワークのトップに第2のサブネットワーク220を形成することができる。第2のサブネットワーク220は、第1の層222Aと第2の層222Bと第3の層222Cとを含む複数の層を含むことができるが、使用する層数を変えることもでき(具体的には5層)、図中では簡単化のために3層が示されている。第1の層222A、第2の層222B及び第3の層222Cの各層は、畳み込み層とすることができる。各層は多数の構成ブロック(不図示)から成ることができる。各構成ブロックは、3つのパラメータ層等の多数のパラメータ層を含むことができ、各パラメータ層は特定のフィルタサイズ(例えば3×3等)の多数のフィルタ(例えば256個等)を有する。第1の層222A、第2の層222B及び第3の層222Cの各層は、144×144、72×72、36×36等の関連付けられた出力サイズを有することができる。出力サイズは、前処理条件及び/又はパラメータに基づき入力スライスごとに変わることができる。第2のサブネットワーク220の各層の間で出力サイズが減少するに従い、パラメータ層のフィルタ数を比例的に増加させることができる。すなわち、出力サイズが半減するとフィルタ数は2倍になる。第2のサブネットワークはまた、最終層(すなわち第3の層222C)に接続されたグローバル平均プーリング層と、グローバル平均プーリング層に接続された全結合層と、全結合層に接続された出力サイズ1×1(すなわち単一値)のソフトマックス層と、を含むことができる。
【0043】
モデル200は、第1の三次ネットワーク224A、第2の第三次ネットワーク224B及び第3の三次ネットワーク224C等の複数の三次サブネットワークを含むことができる。各三次ネットワーク224A~Cは、第2のサブネットワーク220の層に接続することができる。第1の三次ネットワーク224Aは第1の層222Aに接続することができ、第2の三次ネットワーク224Bは第2の層222Bに接続することができ、第3の三次ネットワーク224Cは第3の層222Cに接続することができる。各三次ネットワークは、異なるスケールレベルで腫瘍及び/又は病変を検出するため、第2のサブネットワーク220の層から特徴を受け取ることができる。
【0044】
各三次ネットワークは、ボックス回帰サブネットワーク226を含むことができる。ボックス回帰サブネットワーク226は1つ以上の畳み込み層228A~Bを含むことができ、各畳み込み層228A~Bには正規化線形(ReLU)活性化部が後続し、ボックス回帰サブネットワーク226はまた最終畳み込み層230を含むことができ、これは、第2のサブネットワーク220の層のうち一層の一部に関連付けられたアンカーに対応する回帰座標を出力するものである(この回帰座標は、入力2Dスライス204の画素のアレイに対応する)。アンカーは、第2のサブネットワーク220の複数の層の予め決定された部分アレイとすることができる。回帰座標は、アンカーと、予測されたバウンディングボックスと、の間の予測されたオフセットを表すことができる。ROIに含まれる各バウンディングボックスごとに、回帰座標のセット(例えば4つの回帰座標等)と、これに対応するアンカーとを使用して、バウンディングボックスの座標を計算することができる。
【0045】
各三次ネットワークは分類サブネットワーク232を含むことができる。分類サブネットワーク232は1つ以上の畳み込み層234A~Bを含むことができ、各畳み込み層234A~BにはReLU活性化部が後続し、分類サブネットワーク232はさらに最終畳み込み層238を含むことができ、最終畳み込み層238には、物体の有無(すなわち悪性の腫瘍及び/又は病変の有無)の予測を出力するシグモイド活性化部が後続する。分類サブネットワーク232を使用して、患者が2Dスライス204の複数の空間位置において悪性の腫瘍及び/又は病変を有するか否かの1つ以上の推定結果を得ることができる。より具体的には、各バウンディングボックスは、分類サブネットワークによって出力された推定スコアと関連付けることができる。一部の実施形態では、各推定スコアの値は0から1の範囲とすることができる。空間位置のうち1つは、第2のサブネットワーク220の一層すなわち第1の層222Aの全部を含むことができる。このようにして分類サブネットワーク232は、患者が悪性の腫瘍及び/又は病変を有するか否かの推定結果を2Dスライスに基づいて出力することができる。最終畳み込み層238にはモデルでソフトマックス活性化部が後続することができ、これは、複数の種類の悪性領域、例えば複数の悪性レベル(例えば低リスク領域、ハイリスク領域等)等を分類するように訓練されたものである。
【0046】
モデル200は、様々なスケールにわたるデータを正規化し、バウンディングボックス座標を計算し、低スコアのバウンディングボックス予測をフィルタリングにより除外する出力層250を含むことができる。出力層250は、三次サブネットワーク224A~Cの出力を受け取って1つ又は複数のROIを出力することができ、これらの各ROIはそれぞれ、2Dスライス204のアレイサイズにスケーリングされた画素のアレイと、関連付けられたスコアと、を有する。画素アレイは、回帰座標とアンカーとに基づいて計算されるバウンディングボックス(例えば方形のバウンディングボックス等)とすることができる。出力層250は、所定の閾値未満、例えば0.5未満の全てのスコアをフィルタリングにより除外することができる。一部の実施形態では、出力層250は、三次サブネットワーク224A~Cから出力を受け取って、1つの悪性可能性スコアを出力することができる。一部の実施形態では、上記の1つの悪性可能性スコアとして、最高スコアのバウンディングボックスのスコアを選択することができる。
【0047】
図1及び
図3を参照すると、3Dトモシンセシスデータの2Dスライス内のROIを検出するように訓練されたモデルを使用して合成画像を作成するための処理300が示されている。処理300は、モデルから出力された最も関連するROIのうち1つ以上を選択し、この1つ以上のROIを用いて合成画像を作成するための1つ以上の工程を含むことができる。処理300は、データ処理システムが有する1つ以上のメモリ上に指令として実装することができる。データ処理システムはさらに、上記の1つ以上のメモリと通信すると共に上記の指令を実行するように構成された1つ以上のプロセッサを備えることができる。上記の1つ以上のプロセッサは、多数の二次元スライスを含む3Dトモシンセシスデータを記憶したメモリにアクセスするように構成することができ、このメモリは、大容量記憶装置128に含まれるものとすることができる。
【0048】
処理300は304において、患者の乳房組織の3Dトモシンセシスデータを受け取ることができる。3Dトモシンセシスデータは、X線イメージングシステム100等の3Dマンモグラフィイメージングシステムによって生成することができる。3Dトモシンセシスデータは、乳房組織の例えば1mm等の所定の厚さに相当する多数の2Dスライスを含むことができる。患者及び/又はイメージングシステムに依存して、3Dトモシンセシスデータは約10~150個以上の2Dスライスを含むことができる。各2Dスライスは所定のサイズの画素アレイとすることができ、例えば2000×1500画素等とすることができる。その後、処理300は308に進むことができる。
【0049】
処理300は308において、多数の各2Dスライスを訓練済みのモデルに入力することができ、このモデルは、2Dスライスに基づいてROIを検出できるものである。この訓練済みモデルは、上述したモデル200とすることができる。一部の実施形態では、全部の2Dスライスを訓練済みモデルに入力することができる。一部の実施形態では、2Dスライスのサブセットを訓練済みモデルに入力することができ、例えば4つおきに2Dスライスを入力することができる。その後、処理300は312に進むことができる。一部の実施形態では、訓練済みモデルは、医師によって注釈が付された二次元フルフィールド・デジタルマンモグラフィ画像を含む画像データセットに基づいて訓練されたものとすることができる。
【0050】
処理300は312において、モデルに入力された各2Dスライスごとに、モデルが出力した多数のROIを受け取ることができる。モデルは、ゼロROI、1つのROI、又は複数のROIを出力することができる。2Dスライス及び/又はモデルに依存して、大部分のスライスがROIを全く有しないことがあり得る。上述したように、ROIはスコアと、2Dスライスの画素の部分アレイとを有することができ、各画素は強度値と当該2Dスライスにおける位置とを有する。各ROIはスライス番号に関連付けることができ、このスライス番号から、3Dトモシンセシスデータのうちどの2Dスライスが当該ROIを生成する元となったかが分かる。その後、処理300は316に進むことができる。
【0051】
処理300は316において、複数のROIから、所定の閾値を下回るスコアを有する全てのROIをフィルタリングにより除外することができる。閾値は、(より高いを選択することによって)より多くのROIを最終合成画像に含めるように若しくは(より低い閾値を選択することによって)最終合成画像に含めるROIがより少なくなるように、(より低い閾値を選択することによって)可能性のある誤った負の結果を低減するように、及び/又は、(より高い閾値を選択することによって)可能性のある誤った正の結果を低減するように、選択することができる。例えば、スコアが0~1の範囲内である場合、ユーザは0.5の閾値を選択することができる。その後、処理300は複数のROIから、0.5を下回るスコアを有する全てのROIを除去することができる。その後、処理300は320に進むことができる。
【0052】
処理300は320において、複数のROIが少なくとも1つのROIを含むか否かを判定することができる。その後、処理300は324に進むことができる。
【0053】
処理300は324において、複数のROIが少なくとも1つのROIを含まないと判定した場合(324における「いいえ」)、328に進むことができる。あるいは、複数のROIが少なくとも1つのROIを含むと判定した場合、処理300は332に進むことができる。
【0054】
処理300は328において、どのROIも使用せずに最終合成画像を生成することができる。一部の実施形態では、処理は、3Dトモシンセシスデータに含まれる2Dスライスのうち、最終合成画像として使用されるデフォルトスライスを選択することができる。デフォルトスライスはランダムに選択することができ、又は、2Dスライスのうち最初のスライス(例えば75個の2Dスライスのうち最初のスライス等)を選択することができ、又は、2Dスライスのうち最後のスライス(例えば75個の2Dスライスのうち75番目のスライス等)、又は、2Dスライスのうち真ん中のスライス(例えば75個の2Dスライスのうち38番目のスライス等)を選択することができる。その後、デフォルトスライスの各画素を最終合成画像の画素として含めることができる。
【0055】
一部の実施形態では、処理300は、最終合成画像に含めるべき画素として、2Dスライス内の特定の画素位置(例えばアレイ内の(x,y)位置等)で最大の強度値を有する画素を選択することができる。換言すると、処理300は、2Dスライスに基づいて最終的な合成図形を生成するために最大強度の投影(projection)を使用することができる。最終合成画像は、各2Dスライスと等しい寸法を有することができる。処理300は各画素位置ごとにどの(1つ又は複数の)スライスが最大の強度値を有するかを判定することができ、また、当該画素位置における最大強度値を最終合成画像に用いることができる。このようにして、可能性のある病変に相当し得る最大強度の画素を最終合成画像に含めることができる。
【0056】
一部の実施形態では、処理300は、各画素位置ごと2つ以上の2Dスライスの2つ以上の強度値の平均をとることができる。これら2つ以上の2Dスライスの選択は、x番目ごとの2Dスライス(具体的には3番目ごと又は5番目ごとのスライス)を選択することにより、又は、最初の2Dスライスと最後の2Dスライスとを選択することにより、又は、2Dスライスの他のサブセットを選択することにより、又は、2Dスライスに含まれる全てのスライスを選択することにより行うことができる。その後、各画素位置の強度値の平均をとって乳房組織の全体ビューを提供することができる。
【0057】
処理300は332において、仮合成画像の領域に、複数のROIに含まれる1つ又は複数のROIを配置する(populate)ことができる。仮合成画像は、最終合成画像と同一サイズのアレイであって各画素強度値をnull値に初期化したものとすることができる。処理300はその後、1つ又は複数のROIを仮合成画像に追加することができる。ROIは、1つ又は複数の基準に基づいて追加することができる。一部の実施形態では、処理は、各画素位置ごとに最高スコアを有するROIを求めることができる。その後、当該画素位置における仮合成画像の強度値を、当該画素位置におけるROIの強度値に等しく設定することができる。特定の画素位置において複数のROIが同一スコアを有する場合には、画素数が最大であるROI、及び/又は、当該画素位置を取り囲む画素数が最大であるROI、及び/又は、当該画素位置における強度値が最大であるROIを、当該画素位置におけるROIとして選択することができる。一部の実施形態では、仮合成画像への配置は、IoU(intersection-over-union)閾値に基づいて行うことができる。特定の画素において複数のROIが重なり合う場合、処理300は最高スコアのROIを除く全てのROIを「抑圧」することができ、この抑圧は、より低いスコアのROIを仮合成画像への配置に用いないことにより行われる。仮合成画像に配置するために用いられるROIは複数のROIから除去することができ、また、下記にて説明するように、複数のROIに残ったどのROIも、追加の合成画像を作成するために用いることができる。これに代えて、仮画像に配置するために用いられた高スコアのROIは、当該仮画像では用いられなかった低スコアのどのROIとも当該高スコアのROIが重なり合わない追加の合成画像に配置することができる。例えば、スコアが0.85及び0.75のROIを、仮画像への配置に用いることができる。スコアが0.85のROIは、スコアが0.65のより低いスコア化ROIと重複することがあり(例えば、スコアが0.65のROIと同じ画素位置の少なくとも1つを占める)、そして0.75のROIは、スコアが0.65のROIと重複しないことがある。次いで、スコアが0.75のROI及びスコアが0.65のROIを用いて、追加の合成画像を生成することができる。また、仮合成画像の各画素を、当該特定の画素の与えられた強度値を追加するために使用されるROIのスライス番号に関連付けることができる。その後、処理300は336に進むことができる。
【0058】
処理300は336において、仮合成画像のうち配置されなかった領域を埋めることができる。一部の実施形態では、処理300はウォーターシェッド・バイ・フラッディング(watershed-by-flooding)アルゴリズムを用いて、配置されなかった領域を埋めることができる。ウォーターシェッド・バイ・フラッディング・アルゴリズムを実行するため、処理300は、各ROIに関連付けられた2Dスライスに基づいて、配置されなかった領域への配置を行うことができる。処理300は、特定のROIの画素によって初期化された各2Dスライスごとに、カバレッジ領域を生成することができる。例えば、1つのROIが座標(10,11)、(50,11)、(10,40)及び(50,40)に角を有する画素のアレイを有するとすると、処理はこの画素のアレイを2Dスライスのカバレッジ領域に含めることができる。その後処理300は、仮合成画像の各画素がスライス番号に関連付けられるまで、ひいては拡張によって2Dスライスに関連付けられるまで、カバレッジ領域を繰り返し拡張することができる。各画素が2Dスライスに関連付けられた後、処理300は各画素位置ごとに、仮合成画像の各画素の強度値を、関連付けられた2Dスライスの当該特定の画素位置における画素の強度値に等しく設定することができる。処理300は、仮合成画像の全ての画素がスライス番号に関連付けられるまで、ひいては拡張によって2Dスライスに関連付けられるまで、各カバレッジ領域を繰り返し拡張することができる。一部の実施態様では、処理は各カバレッジ領域を上下左右に1画素拡張することができる。例えば、カバレッジ領域が座標(10,11)、(50,11)、(10,40)及び(50,40)に角を有する画素のアレイを有する場合、処理はこのアレイを、座標(9,10)、(51,10)、(9,41)、及び(51,41)に角を有するように拡張することができる。処理300は、カバレッジ領域をさらに拡張させると他のカバレッジ領域に既に関連付けられた画素に拡張してしまう隣接カバレッジ領域、又は、仮合成画像が終了する隣接カバレッジ領域、との境界において、カバレッジ領域の拡張を停止することができる。処理300によって複数のカバレッジ領域が同一の画素に拡張するような場合には、処理300は、最高スコアのROIに関連付けられたカバレッジ領域を当該画素に拡張することができる。処理300は上記のプロトコルに従い、仮合成画像の全ての画素が1つのカバレッジ領域に関連付けられ、ひいては拡張により1つの2Dスライスに関連付けられるまで、カバレッジ領域を繰り返し拡張することができる。
【0059】
一部の実施形態では、処理300は「傾きベース」技術を用いて、配置されなかった領域を埋めることができる。処理は、スライスからカバレッジ領域を所定の反復回数で繰り返し拡張し、その後、隣接スライスを用いて、中央のスライスに達するまで、配置されなかった領域への配置を継続することができる。一例として、処理300は、スライス数40のDBTボリューム(つまり、スライス20が中央のスライスとなる)のうちスライス5のROIを用いて、例えば10回等の所定の反復回数で、配置されなかった領域に配置するためにROIを拡張することができる。10回目の繰り返しの後、処理300は6番目のスライスを用いて、配置されなかった領域への配置を継続することができる。このようにして、元のROIから10画素の距離内に配置されている画素は5番目のスライスに含められるが、次の10画素は6番目のスライスに含められる。処理300は、中央のスライス番号(すなわち20)に達するまで、配置されなかった領域に配置するために使用されるスライス番号の増加(又は、元のスライス番号が中央のスライスより大きい場合、例えば36番目のスライスの場合には、スライス番号の減少)を継続することができ、中央のスライス番号に達すると、他の残りの拡張は全てスライス20から開始する。この「傾きベース」手法により、2つのROIが接触した場合により滑らかな接合部を得ることができると共に、乳房のより「模範的な」ビューを提供することができる。さらに、処理300は元のROIの空間位置を、中央のスライスを基準とする空間位置により良好に一致するように調整することもできる。例えば、中央のスライスより前及び後の時点のスライスは、中央のスライスより多くの画像を取り込む(take up)乳房境界を有することができ、その際、処理は最終合成画像におけるROIの位置を調整することができる。
【0060】
一部の実施形態では、処理300はデフォルトスライスに基づいて、仮合成画像のうち配置されなかった領域を埋めることができる。一部の実施形態では、処理は、仮合成スライスの配置されなかった領域を埋めるために使用するため、3Dトモシンセシスデータに含まれる2Dスライスのデフォルトスライスを選択することができる。デフォルトスライスはランダムに選択することができ、又は、2Dスライスのうち最初のスライス(例えば75個の2Dスライスのうち最初のスライス等)を選択することができ、又は、2Dスライスのうち最後のスライス(例えば75個の2Dスライスのうち75番目のスライス等)、又は、2Dスライスのうち真ん中のスライス(例えば75個の2Dスライスのうち38番目のスライス等)を選択することができる。処理300は、配置されなかった各画素をデフォルトスライスのスライス番号に関連付け、仮合成画像の当該配置されなかった各画素の強度値を、デフォルトスライスにおける各対応する画素位置の画素の強度値に等しくなるように設定することができる。一部の実施形態では、処理300は、2Dスライス内の特定の画素位置(例えばアレイ内の(x,y)位置等)における最大強度値を有する画素を選択し、配置されなかった画素の強度値を当該最大強度値に等しくなるように設定することにより、当該配置されなかった画素の強度値を設定することができる。換言すると、処理300は、2Dスライスに基づいて、配置されなかった画素の強度値を埋めるために最大強度の投影を用いることができる。処理300は各画素位置ごとに、どの(1つ又は複数の)スライスが最大の強度値を有するかを判定し、仮合成画像の各画素を、最大強度値を有する2Dスライスのスライス番号に関連付け、配置されなかった画素の強度値を、全ての2Dスライスを通じて当該画素位置における最大の強度値に等しくなるように設定することができる。このようにして、可能性のある病変に相当し得る最大強度の画素を仮合成画像に含めることができる。
【0061】
一部の実施形態では、全ての画素に強度値が配置された仮合成画像を処理300が生成した後、処理300は、仮合成画像の後処理を行う340に進むことができる。一部の実施形態では、処理300は、最終合成画像を仮合成画像と等しくなるように設定して、344に進むことができる。
【0062】
処理300は340において、仮合成画像に対し後処理を行うことができる。一部の実施形態では、処理300は、仮画像のカバレッジ領域間の境界効果が生じている場合にこれを低減するため、当該カバレッジ領域のエッジをブレンディング処理することができる。上述のように、仮画像の各画素は、スライス番号及び/又は2Dスライスに関連付けることができる。仮画像における2つのカバレッジ領域が互いに接する位置の近傍にある画素の領域では、処理300は、各カバレッジ領域の特定の画素の画素位置における強度値に基づいて、上記の画素の強度値を設定することができる。処理300は、仮合成画像のカバレッジ領域が接する位置の近傍の画素位置における強度値を、以下のように設定することができる:
ivp=w1ivj+w2ivk (1)
上記式中、ivpは仮合成画像の特定の画素位置における強度値であり、w1及びw2は第1及び第2の重みであり、両重みの和は1であり、ivjは第1のカバレッジ領域の特定の画素位置における強度値であり、ivkは第2のカバレッジ領域の特定の画素位置における強度値である。換言すると、ivj及びivkは各対応する2Dスライスの特定の画素位置における強度値である。カバレッジ領域間の境界に位置する画素の場合、例えば各画素がx方向又はy方向に1ステップしか離れていない場合等については、第1の重みw1及び第2の重みw2をそれぞれ0.5に設定することができる。これは、「ホーム」のカバレッジ領域(すなわち、当該画素を含むカバレッジ領域)と、当該ホームのカバレッジ領域に接するカバレッジ領域とで、等しい強調を反映したものである。境界からさらに離れた位置にある画素、例えば、第1のカバレッジ領域内における境界から離れた2画素の距離に位置する画素等の場合、第1の重みw1は0.8に等しく設定することができ、第2の重みw2は0.2に等しく設定することができ、これは、画素のホームカバレッジ領域のより大きな強調を反映したものである。一部の実施形態では、処理300は、例えば線形増加/減少関数等の数学的関数を用いて重みを設定することができる。例えば、境界上に位置する画素、境界から1画素離れた位置にある画素、及び、境界から2画素離れた位置にある画素については、処理300は各画素の第1の重みをそれぞれ0.5,0.75及び1.0に設定すると共に、各画素の第2の重みをそれぞれ0.5,0.25及び0.0に設定することができる。重みの和が1である限り、境界から離れるに従って重みを対数関数的に増加/減少させ又は指数関数的に増加/減少させる等の他の数学的関数を用いて重みを設定することができる。処理300は、隣接するカバレッジ領域間の境界の閾値距離以内に画素が位置する場合、例えば境界から3画素未満の距離にある場合にのみ、上記の数式(1)を用いて画素の強度値を求めるとすることができる。その際には、処理300は数式(1)と、例えば線形増加/減少関数等の適用可能な数学的関数とを用いて、閾値距離内の全ての画素の強度値を求めることができる。閾値距離以内にない画素は、以前に割り当てられた強度値を維持することができる。カバレッジ領域のエッジがブレンディング処理された後、処理300は、最終合成画像を(処理済みの)仮合成画像と等しくなるように設定することができる。その後、処理300は344に進むことができる。
【0063】
処理300は344において、記憶及び/若しくは他の処理での使用のためにメモリへ最終合成画像を出力し、並びに/又は、人間の医師が観察するためにコンピュータモニタ等の表示部へ最終合成画像を出力することができる。例えば、処理300は、医師が最終合成画像を観察し、当該最終合成画像に腫瘍及び/又は病変が存在する場合にはその情報を推測できる医療設備の表示部に、最終合成画像を出力することができる。他の一例として、追加の処理(下記にて説明する)が最終合成画像を使用して、乳房組織における腫瘍及び/又は病変の悪性の可能性を予測することができる。3Dトモシンセシスデータに含まれる全てのスライスの格納データと置換するために最終合成画像を使用することができ、これにより、10~150個以上のスライスを格納する代わりに、最終合成画像の画素のアレイと、これに関連付けられた関心領域に関するデータとのみを格納すれば良くなるので、記憶空間を削減することができる。このようなメモリ要件の緩和により、病院が使用する情報技術システムに必要とされるサーバのサイズを削減することができる。その後、処理300は348に進むことができる。
【0064】
処理は348において、追加の合成2D画像を生成すべきか否かを判断することができる。処理300は、複数のROIが少なくとも1つのROIを含むか否かを判断することができる。複数のROIが少なくとも1つのROIを含まない場合、処理300は、それ以上合成画像を生成すべきでないと判断することができる。複数のROIが少なくとも1つのROIを含む場合、処理300は、さらに合成画像を生成すべきであると判断することができる。その後、処理は352に進むことができる。
【0065】
352において、それ以上合成画像を生成すべきでないと処理300が判断した場合、処理300は終了に進むことができる。処理300が、さらに合成画像を生成すべきであると判断した場合、処理300は332に進むことができる。
【0066】
図3及び
図4を参照すると、一例の仮合成画像に関連付けられたROIが示されている。仮合成画像のアレイ404上に、ROIが配置されているのが示されている。第1のROI 400Aは、2Dスライスのセットのうち5番目の2Dスライスに関連付けることができる。第2のROI 400Bは、2Dスライスのセットのうち2番目の2Dスライスに関連付けることができる。第3のROI 400Cは、2Dスライスのセットのうち8番目の2Dスライスに関連付けることができる。第4のROI 400Dは、2Dスライスのセットのうち4番目の2Dスライスに関連付けることができる。アレイ404は、1つ又は複数の配置されていない画素408を含むことができる。
図4は、工程332が実行された後の仮合成画像の状態を表すことができる。
【0067】
図3及び4並びに
図5を参照すると、
図4の一例の仮合成画像に関連付けられたROI及びカバレッジ領域が示されている。第1のROI 400Aは、第1のカバレッジ領域500Aに関連付けることができる。第2のROI 400Bは、第2のカバレッジ領域500Bに関連付けることができる。第3のROI 400Cは、第3のカバレッジ領域500Cに関連付けることができる。第4のROI 400Dは、第4のカバレッジ領域500Dに関連付けることができる。アレイ404の各画素は、カバレッジ領域500A~Dのいずれか1つに関連付けることができる。
図5は、工程336が実行された後、特に、ウォーターシェッド・バイ・フラッディング・アルゴリズムが実行された後の仮画像の状態を表すことができる。
【0068】
図3及び
図6を参照すると、悪性可能性スコア654を生成するための一例の二次モデル600が示されている。二次モデル600は、上記のように処理300を用いて生成できる入力合成画像604を受け取り、悪性可能性スコア654を出力することができる。この悪性可能スコア654は0~1の範囲とすることができる。一部の実施形態では、悪性可能性スコア654は、低リスク、中リスク又は高リスクのカテゴリといったリスクのカテゴリを示すことができる。一部の実施形態では、悪性可能性スコア654は数値範囲から選択することができ、例えば整数1~5から選択し、1が最も低いリスクレベルを示し、5が最も高いリスクレベルを示すことができる。
【0069】
一部の実施形態では、二次モデル600は、残留回帰ニューラルネットワーク等のニューラルネットワークを含むことができる。二次モデル600を訓練するために、悪性又は非悪性とラベリングされた合成画像を含む訓練データセットを用いてモデルを訓練することができる。人間の医師が合成画像にラベリングすることができる。例えば、がんを有することが既知である患者に対応する合成画像には「1」のラベルを付与し、がんを有しないことが既知である患者に対応する合成画像には「0」のラベルを付与することができる。一部の実施形態では、合成画像は300とすることができる。訓練後、二次モデル600は入力合成画像を受け取って、乳房組織に悪性の腫瘍及び/又は病変が含まれているか否かを示す悪性可能性スコアを出力することができる。
【0070】
二次モデル600は、畳み込み層等の多数の層を含むことができる。二次モデル600の一部の実施形態は、層の数が異なっていたり、層の配列が異なっていたり、他の相違があったりすることが理解される。しかし、全ての実施形態において、二次モデル600は入力2D合成画像を受信して悪性可能性スコアを出力することができる。二次モデル600は、1つ又は複数のサブネットワークを含む1段の検出ネットワークとすることができる。
【0071】
図2及び
図6を再度簡単に参照すると、二次モデル600は一次サブネットワーク616及び二次サブネットワーク620を含むことができ、これらのサブネットワークは、上述したモデル200の一次サブネットワーク216及び二次サブネットワーク220と同一とすることができる。一部の実施形態では、一次サブネットワーク616及び二次サブネットワーク620は、モデル200が訓練された後の一次サブネットワーク216及び二次サブネットワーク220と同一とすることができる。換言すると、二次モデル600は、訓練前にモデルの重みを用いて初期化することができる。
【0072】
二次モデル600が重要であるのは、上述のモデル200は乳房組織の関心領域を検出することができるが、ROIが実際に悪性であるかどうかを正確に判断できないことがあるからである。二次モデル600は、上述のモデル200によって生成された合成画像を使用して、乳房組織の悪性をより正確に推定するために使用され得る。試験では本例のモデル600は、イメージング機器製造業者のデフォルトの画像生成技術を用いて作成された合成画像に対する対照試験として、処理300を用いて作成された合成画像を用いて1000個の初見のマンモグラム(100個のがん)について試験を行ったときの受信者動作特性(ROC)に係る曲線下面積(AUC)が0.03増加したことが観察された。
【0073】
モデル600は、第1の三次ネットワーク624A、第2の三次ネットワーク624B、及び第3の三次ネットワーク624C等の複数の三次サブネットワークを含むことができる。各三次ネットワーク624A~Cは、第2のサブネットワーク620の層に接続することができる。第1の三次ネットワーク624Aは第1の層622Aに接続することができ、第2の三次ネットワーク624Bは第2の層622Bに接続することができ、第3の三次ネットワーク624Cは第3の層622Cに接続することができる。各三次ネットワークは、異なるスケールレベルで乳房組織の悪性を推定するため、第2のサブネットワーク620の層から特徴を受け取ることができる。
【0074】
各三次ネットワークは、ボックス回帰サブネットワーク626を含むことができる。ボックス回帰サブネットワーク626は1つ以上の畳み込み層628A~Bを含むことができ、各畳み込み層628A~Bには正規化線形(ReLU)活性化部が後続し、ボックス回帰サブネットワーク626はまた最終畳み込み層630を含むことができ、これは、第2のサブネットワーク620の層のうち一層の一部に関連付けられたアンカーに対応する回帰座標を出力するものである(この回帰座標は、入力合成2Dスライス604の画素のアレイに対応する)。アンカーは、第2のサブネットワーク620の複数の層の予め決定された部分アレイとすることができる。回帰座標は、アンカーと、予測されたバウンディングボックスと、の間の予測されたオフセットを表すことができる。ROIに含まれる各バウンディングボックスごとに、回帰座標のセット(例えば4つの回帰座標等)と、これに対応するアンカーとを使用して、バウンディングボックスの座標を計算することができる。
【0075】
各三次ネットワークは分類サブネットワーク632を含むことができる。分類サブネットワーク632は1つ以上の畳み込み層634A~Bを含むことができ、各畳み込み層634A~BにはReLU活性化部が後続し、分類サブネットワーク632はさらに最終畳み込み層638を含むことができ、最終畳み込み層638には、物体の有無(すなわち悪性の腫瘍及び/又は病変の有無)の予測を出力するシグモイド活性化部が後続する。分類サブネットワーク632を使用して、患者が合成2Dスライス604の複数の空間位置において悪性の腫瘍及び/又は病変を有するか否かの1つ以上の推定結果を得ることができる。より具体的には、各バウンディングボックスは、分類サブネットワーク632によって出力された推定スコアと関連付けることができる。バウンディングボックスは、上記にて述べたスライス番号と関連付けることもできる。一部の実施形態では、各推定スコアの値は0から1の範囲とすることができる。空間位置のうち1つは、第2のサブネットワーク620の一層すなわち第1の層622Aの全部を含むことができる。このようにして分類サブネットワーク632は、患者が悪性の腫瘍及び/又は病変を有するか否かの推定結果を2Dスライスに基づいて出力することができる。最終畳み込み層638にはモデルでソフトマックス活性化部が後続することができ、これは、複数の種類の悪性領域、例えば複数の悪性レベル(例えば低リスク領域、ハイリスク領域等)等を分類するように訓練されたものである。
【0076】
モデル600は、様々なスケールにわたるデータを正規化し、バウンディングボックス座標を計算し、低スコアのバウンディングボックス予測をフィルタリングにより除外する出力層650を含むことができる。出力層650は、三次サブネットワーク624A~Cの出力を受け取って1つ又は複数のROIを出力することができ、これらの各ROIはそれぞれ、2Dスライス604のアレイサイズにスケーリングされた画素のアレイと、関連付けられたスコアと、を有する。画素アレイは、回帰座標とアンカーとに基づいて計算されるバウンディングボックス(例えば方形のバウンディングボックス等)とすることができる。出力層650は、所定の閾値未満、例えば0.5未満の全てのスコアをフィルタリングにより除外することができる。フィルタリング後、出力層650は、他の残りのスコアに関連付けられた1つ又は複数のアンカーに基づいて各ROIの画素のアレイを決定することができる。出力層650はアンカーを出力ROIのアレイとして含める前に、当該アンカーのサイズを2Dスライス604のスケールに一致するように変更することができる。かかるサイズ変更は、アンカーが第2のサブネットワーク620のより小さい層に関連付けられている場合に必要となり得る。出力層650は、三次サブネットワーク624A~Cから出力を受け取って悪性可能性スコア654を出力することができる。一部の実施形態では、悪性可能性スコア654として、最高スコアのバウンディングボックススコアを選択することができる。一部の実施形態ではモデル600は、スコア608Aと画素のアレイ608Bとをそれぞれ有する1つ又は複数のROI608を出力することができる。画素アレイ208Bは、方形のバウンディングボックスとすることができる。1つ又は複数のROI608は、合成画像604における悪性の可能性のある領域についての追加情報を医師に提供することができる。
【0077】
図1,3及び6並びに
図7を参照すると、乳房組織の腫瘍及び/又は病変の悪性を推定するために訓練されたモデルを用いて合成画像を作成し、当該合成画像に基づいて悪性可能性スコアを生成するための処理700が示されている。処理700は、データ処理システムが有する1つ以上のメモリ上に指令として実装することができる。データ処理システムはさらに、上記の1つ以上のメモリと通信すると共に上記の指令を実行するように構成された1つ以上のプロセッサを備えることができる。上記の1つ以上のプロセッサは、多数の二次元スライスを含む3Dトモシンセシスデータを記憶したメモリにアクセスするように構成することができ、このメモリは、大容量記憶装置128に含まれるものとすることができる。
【0078】
処理700は704において、患者の乳房組織の3Dトモシンセシスデータを受け取ることができる。3Dトモシンセシスデータは、X線イメージングシステム100のような3Dマンモグラフィイメージングシステムによって生成することができる。3Dトモシンセシスデータは、乳房組織の例えば1mm等の所定の厚さに相当する多数の2Dスライスを含むことができる。患者及び/又はイメージングシステムに依存して、3Dトモシンセシスデータは約10~150個以上の2Dスライスを含むことができる。各2Dスライスは、所定のサイズの画素アレイとすることができ、例えば2000×1500画素等とすることができる。その後、処理700は708に進むことができる。
【0079】
処理700は708において、上記のステップ308~352のうち少なくとも1つを用いて1つ又は複数の合成画像(すなわちマンモグラム)を生成することができる。その後、処理700は712に進むことができる。
【0080】
処理700は712において、悪性可能性スコアを求めるために、1つ又は複数の各合成画像を訓練済みモデルに入力することができる。この訓練済みモデルは、上述したモデル600とすることができる。その後、処理700は716に進むことができる。
【0081】
処理700は716において、訓練済みのモデルから悪性可能性スコアを受け取ることができる。一部の実施形態では悪性可能性スコアは、悪性のリスクが高いことを示す1と、悪性のリスクが最小である又は無いことを示す0とを含めた、0~1の範囲とすることができる。一部の実施形態では悪性は、腫瘍が悪性であるか又は悪性でないかを示す「はい」(すなわち1)又は「いいえ」(すなわち0)とすることができる。一部の実施形態では、悪性可能性スコアは、リスクのカテゴリ、例えば、低リスク、中リスク、又は高リスクのカテゴリを示すことができる。一部の実施形態では、悪性可能性スコアは数値範囲から選択することができ、例えば整数1~5から選択し、1が最も低いリスクレベルを示し、5が最も高いリスクレベルを示すことができる。一部の実施形態では、処理700は、上記の関心領域608等の訓練済みモデルによって生成された1つ以上の関心領域を受け取ることもできる。その後、処理700は720に進むことができる。
【0082】
処理700は720において、記憶及び/若しくは他の処理での使用のためにメモリへ悪性可能性スコアを出力し、並びに/又は、人間の医師が観察するためにコンピュータモニタ等の表示部へ悪性可能性スコアを出力することができる。例えば処理300は、医師が悪性可能性スコアを見ることができ、場合によっては悪性可能性スコアに基づいて患者の診断を下すことができる医療設備の表示部に、悪性可能性スコアを出力することができる。悪性可能性スコアは、乳がん患者の将来の分析及び/又は研究のためにカルテのデータベースに記憶することができる。一部の実施形態では、処理700は716において受け取った関心領域のうち1つ若しくは複数を、記憶及び/若しくは他の処理での使用のためにメモリへ出力し、並びに/又は、人間の医師が観察するためにコンピュータモニタ等の表示部へ出力することができる。処理700は、悪性可能性スコア及び/又は1つ以上の関心領域をレポートとして出力することができる。その後、処理700は終了することができる。
【0083】
試験において、処理300及び700は、デンスブレスト(高濃度乳腺乳房)及びノンデンスブレストの両方において乳がんの存在を検出することが判明した。
図2のモデル200による第1のモデルは、注釈付きFFDMデータセットを用いて訓練されたものである。
図6のモデル600による第2のモデルは、注釈付き三次元乳房画像データセットを用いて訓練されたものである。第2のモデルを訓練するために、データセット内の三次元画像に含まれるスライスを使用して、
図3の処理300における処理を使用して合成画像を生成した。その後、合成画像に医師が注釈を付与し、訓練のために第2のモデルに入力した。各合成画像には、全画像レベルでがんを有する又は有しない旨の注釈を付すことができる。一部の実施形態では、注釈を付された三次元乳房画像データセットに関連付けられた注釈に基づいて、各合成画像に注釈を付すことができる。このようにして、合成画像に弱い注釈を付すことができる。その後、
図7の処理700の処理を用いて、追加の三次元乳房画像データセットを使用して、第1のモデル及び第2のモデルを試験した。第2のモデルはノンデンスブレスト(BIRADS A,B)において、88.9%の特異性で92%の感度で、受信者動作特性(ROC)曲線の曲線下面積(AUC)が0.96でがんを識別することができた。特異度は、全国平均に基づいて選択された。さらに、第2のモデルはデンスブレスト(BIRADS C,D)において、88.9%の特異度で85%の感度で、ROC曲線のAUCが0.94でがんを識別することができた。全体的に、追加の三次元乳房画像データセットでの性能は、特異度88.9%でAUCが0.95、感度が91%であった。
【0084】
図7及び
図8を参照すると、処理700の視覚的なデータフロー経路が示されている。一般に、処理700は訓練済みモデルを使用して、3D DBTデータの各スライス804A~EのROI802A~Eを決定する。次に、ROI802A、ROI802C及びROI 802Eを含むROIの一部を用いて、合成画像808を合成する。次に、合成画像808を第2の訓練済みモデル812に入力する。次に、第2の訓練済みモデル812は悪性可能性スコア816を出力する。
【0085】
図9を参照すると、3Dトモシンセシスデータの第1の2Dスライス902と、3Dトモシンセシスデータの第2の2Dスライス903と、3Dトモシンセシスデータの第3の2Dスライス904とに基づき、3Dトモシンセシスデータの当該第2の2Dスライス903の関心領域(ROI)を生成するためのモデル900の一実施形態例が示されている。下記にて説明するように、第1の2Dスライス902、第2の2Dスライス903、及び第3の2Dスライス904の各スライスはモデル900に入力されることができ、モデル900は、第1の2Dスライス902と第2の2Dスライス903と第3の2Dスライス904とに基づいて、第2の2Dスライス903に対応するROIを求めることができる。モデル900は、3つの2Dスライスを受け取るための3つの入力チャネルを有することができる。各2Dスライスと、各2Dスライスに関連付けられた全てのROIは、モデル900によって解析されるデータの入力チャネルに関連付けることができる。例えば、第1の2Dスライス902は第1の入力チャネルに関連付けることができ、第2の2Dスライス903は第2の入力チャネルに関連付けることができ、第3の2Dスライス904は第3の入力チャネルに関連付けることができる。以下でさらに説明するように、第2の入力チャネルに関連する合成画像を、第2の入力チャネルに関連する1つ以上のROIを用いて生成することができる。
【0086】
ROIはインジケータと称され得る。モデル900は入力2Dスライス902,903,904を受け入れ、第2の2Dスライス903に係る任意の数のROIを出力することができる。各ROIは第2の入力2Dスライス903に関連付けることができる。例えば、モデルは、第2の2Dスライス903に関連付けられた第1のROI 958を出力することができる。さらに、各ROIは、第2のチャネルに入力された2Dスライスを示すスライス番号に関連付けることができる。例えば、第2のスライス903は75個の2Dスライスのセットのうち4番目のスライスとすることができ、第1のROI 958はスライス番号4(例えば4番目のスライス等)に関連付けることができる。スライス番号は、下記にて説明するように、合成画像を作成するためにROIを選択し及び/又は組み合わせる際に使用することができる。上記のように、各ROIは領域とスコアとを有することができる。例えば、第1のROI958は領域955及びスコア956を有することができる。
【0087】
第1の2Dスライス902、第2の2Dスライス903及び第3の2D904に関連付けられた各スライス番号は、予め定められた値nだけ離れたものとすることができる。例えば、第2の2Dスライス903がスライス番号x2に関連付けられている場合、第1の2Dスライス902はスライス番号x1=x2-nに関連付け、第2の2Dスライス904はスライス番号x3=x2+nに関連付けることができ、ここでnは、1~5又はそれ以上の範囲とすることができる。一部の実施形態では、予め定められた値nは3とすることができる。スライス903を解析する際には、スライス902及び904は、スライス903によって表される乳房組織中に悪性の腫瘍及び/又は病変が存在するか否かを予測するのに役立ち得るボリュームコンテキストをモデル900に提供することができる。
【0088】
第1の2Dスライス902、第2の2Dスライス903及び第3の2Dスライス904の各スライスは、例えば2000×1500等の所定のサイズの画素のアレイの形式とすることができる。画素は1つの強度値(例えば白色強度値等)を有することができる。ROIの各画素は、1つの強度値(例えば白色強度値等)と、これに関連付けられた2Dスライスにおける位置(例えば、2000×1500画素スライスにおける特定の(x,y)位置の画素)と、を有することができる。
【0089】
各ROIは画素の部分アレイの他にさらに、関連性スコアを有することができ、この関連性スコアは、当該画素の部分アレイが悪性可能性スコアの決定にどの程度関連しているかを示すものである(これについては、下記にて
図11を参照して説明する)。関連性スコアは、下記にて詳細に説明するように、1つ以上のROIを使用して合成2D画像を作成するために使用することができる。関連性スコアは、0~1等の数値範囲から選択することができる。訓練データセットに係るROIを識別する場合、人間の医師は、上記の数値範囲の中で各ROIに関連性スコアを割り当てることができる。これに代えて、人間の医師は0~100等の異なるスケール(スコアが高いほど悪性の可能性が高いことを示す)を用いて関連性スコアを割り当てることができ、この関連性スコアはその後、モデル900によって用いられる関連性スコア範囲に正規化されることができる。一部の実施形態では、人間の医師は、悪性の可能性のあるROIを識別するようにモデル900をより良好に訓練するため、ROIを良性であると識別する作業を行うことができる。
【0090】
一部の実施形態では、モデル900は、畳み込みニューラルネットワーク等のニューラルネットワークを含むことができる。モデル900を訓練するためには、3Dトモシンセシス画像のセットからのスライス及び(例えば1人以上の医師により)事前識別されたROIにより構成される訓練データセットを用いて、モデルを訓練することができる。3Dトモシンセシス画像に対するモデル900の訓練を行う際には、それぞれROIを有する2Dフルフィールド・デジタルマンモグラフィ(FFDM)画像も含むことができ、その場合には、2D画像を3つの入力チャネル全てにわたって複製することができる。FFDM画像又はトモシンセシススライスのいずれかに対し、人間の医師は、与えられた2Dスライスを診察し、方形のボックス等の予め定められた形状を用いて、関心対象となり得るいずれかの領域の輪郭を把握することによりROIを識別し、腫瘍及び/又は病変の評価における自己の医学知識及び/又は経験に基づいて上記の予め定められた形状に関連性スコアを割り当てることができる。これに代えて、病変が悪性か否かを示す病理検査結果に基づいて関連性スコアを割り当てることもできる。複数のFFDM画像から取得された2D画像又は3Dトモシンセシス画像のスライス(例えば複数の患者の画像等)におけるROIの識別を1人以上の医師に行わせることにより、大きな訓練データベースを生成することができる。モデル900は、トモシンセシススライスの場合には3つのスライスを所定のオフセット値(例えばn=1等)だけオフセットさせて順次入力し、又は特定のFFDM画像を3つの入力チャネルに対して複製し、いずれの場合にも何らかの関連付けられたROIを含めることによって、訓練されることができる。モデル900は訓練された後、3つの入力2Dスライスを受け取って、推定された関連性スコアと第2の2Dスライス903の画素の部分アレイとをそれぞれ含む1つ又は複数のROIを出力することができる。
【0091】
モデル900は、畳み込み層等の多数の層を含むことができる。モデル900の層数又は層の配置が異なったり、その他相違点を有する実施形態も存在すると解される。しかし、全ての実施形態において、モデル900は3つの2D入力スライスを受け取り、第2の2Dスライス903に関連付けられた何らかの関心領域を出力することができる。モデル900は、1つ以上のサブネットワークを含む一段の検出ネットワークとすることができる。
【0092】
モデル900は、第1のサブネットワーク916を含むことができる。第1のサブネットワーク916は、1つ以上の層918A~Cを有するフィードフォワード残差ニューラルネットワーク(「ResNet」)とすることができる。層918Cは、3つの入力2Dスライス902,903及び904を受け入れるように構成された入力層とすることができる。このようにしてモデル900は、3つのスライス902、903、及び904全てのデータを使用して、例えば第1の2Dスライス902等の特定のスライスにおいてROIの可能性のあるものを検出することができる。単一のニューラルネットワークのバックボーンとして第1のサブネットワーク916を用いて当該単一のニューラルネットワークを有効に作成するため、第1のサブネットワークのトップに第2のサブネットワーク920を形成することができる。第2のサブネットワーク920は、第1の層922Aと第2の層922Bと第3の層922Cとを含む複数の層を含むことができるが、使用する層数を変えることもでき(具体的には5層)、図中では簡単化のために3層が示されている。第1の層922A、第2の層922B及び第3の層922Cの各層は、畳み込み層とすることができる。各層は多数の構成ブロック(不図示)から成ることができる。各構成ブロックは、3つのパラメータ層等の多数のパラメータ層を含むことができ、各パラメータ層は特定のフィルタサイズ(例えば3×3等)の多数のフィルタ(例えば256個等)を有する。第1の層922A、第2の層922B及び第3の層922Cの各層は、1つの入力2Dスライスあたり144×144、72×72、36×36等の関連付けられた出力サイズを有することができる。出力サイズは、前処理条件及び/又はパラメータに基づき入力スライスごとに変わることができる。第2のサブネットワーク920の各層の間で出力サイズが減少するに従い、パラメータ層のフィルタ数を比例的に増加させることができる。すなわち、出力サイズが半減するとフィルタ数は2倍になる。第2のサブネットワークはまた、最終層(すなわち第3の層922C)に接続されたグローバル平均プーリング層と、グローバル平均プーリング層に接続された全結合層と、全結合層に接続された出力サイズ1×1(すなわち単一値)のソフトマックス層と、を含むことができる。
【0093】
モデル900は、第1の三次ネットワーク924A、第2の三次ネットワーク924B及び第3の三次ネットワーク924C等の複数の三次サブネットワークを含むことができる。各三次ネットワーク924A~Cは、第2のサブネットワーク920の層に接続することができる。第1の三次ネットワーク924Aは第1の層922Aに接続することができ、第2の三次ネットワーク924Bは第2の層922Bに接続することができ、第3の三次ネットワーク924Cは第3の層922Cに接続することができる。各三次ネットワークは、各入力2Dスライス902,903及び904において異なるスケールレベルで腫瘍及び/又は病変を検出するため、第2のサブネットワーク920の層から特徴を受け取ることができる。
【0094】
各三次ネットワークは、ボックス回帰サブネットワーク926を含むことができる。ボックス回帰サブネットワーク926は1つ以上の畳み込み層928A~Bを含むことができ、各畳み込み層928A~Bには正規化線形(ReLU)活性化部が後続し、ボックス回帰サブネットワーク926はまた最終畳み込み層930を含むことができ、これは、第2のサブネットワーク920の層のうち一層の一部に関連付けられたアンカーに対応する回帰座標を出力するものである(この回帰座標は、第2の入力2Dスライス903の画素のアレイに対応する)。アンカーは、第2のサブネットワーク920の複数の層の予め決定された部分アレイとすることができる。回帰座標は、アンカーと、予測されたバウンディングボックスと、の間の予測されたオフセットを表すことができる。ROIに含まれる各バウンディングボックスごとに、回帰座標のセット(例えば4つの回帰座標等)と、これに対応するアンカーとを使用して、バウンディングボックスの座標を計算することができる。
【0095】
各三次ネットワークは分類サブネットワーク932を含むことができる。分類サブネットワーク932は1つ以上の畳み込み層934A~Bを含むことができ、各畳み込み層934A~BにはReLU活性化部が後続し、分類サブネットワーク932はさらに最終畳み込み層938を含むことができ、最終畳み込み層938には、物体の有無(すなわち悪性の腫瘍及び/又は病変の有無)の予測を出力するシグモイド活性化部が後続する。分類サブネットワーク932を使用して、患者が第2の入力2Dスライス903の複数の空間位置において悪性の腫瘍及び/又は病変を有するか否かの1つ以上の推定結果を得ることができる。より具体的には、各バウンディングボックスは、分類サブネットワークによって出力された推定スコアと関連付けることができる。一部の実施形態では、各推定スコアの値は0から1の範囲とすることができる。最終畳み込み層938にはモデルでソフトマックス活性化部が後続することができ、これは、複数の種類の悪性領域、例えば複数の悪性レベル(例えば低リスク領域、ハイリスク領域等)等を分類するように訓練されたものである。
【0096】
モデル900は、様々なスケールにわたるデータを正規化し、バウンディングボックス座標を計算し、低スコアのバウンディングボックス予測をフィルタリングにより除外する出力層950を含むことができる。出力層950は、三次サブネットワーク924A~Cの出力を受け取って1つ又は複数のROIを出力することができ、これらの各ROIはそれぞれ、入力2Dスライス903のアレイサイズにスケーリングされた画素のアレイと、関連付けられたスコアと、を有する。画素アレイは、回帰座標とアンカーとに基づいて計算されるバウンディングボックス(例えば方形のバウンディングボックス等)とすることができる。出力層950は、所定の閾値未満、例えば0.5未満の全てのスコアをフィルタリングにより除外することができる。一部の実施形態では、出力層950は、三次サブネットワーク224A~Cから出力を受け取って、1つの悪性可能性スコアを出力することができる。一部の実施形態では、上記の1つの悪性可能性スコアとして、入力2D903のいずれかに関連付けられた最高スコアのバウンディングボックスのスコアを選択することができる。
【0097】
図1,3,6,7及び9並びに
図10を参照すると、モデル900を用いて合成画像を生成するための処理1000が示されている。一般に、処理1000は、モデル900の第2の入力チャネルに関連付けられたROIに基づいて合成画像を生成する。ROIは、上述のモデル900を使用して生成することができる。処理1000が合成画像を生成した後、合成画像を用いて、上述のモデル600と併せて、処理700を使用して悪性可能性スコアを決定することができる。処理1000は、データ処理システムが有する1つ以上のメモリ上に指令として実装することができる。データ処理システムはさらに、上記の1つ以上のメモリと通信すると共に上記の指令を実行するように構成された1つ以上のプロセッサを備えることができる。上記の1つ以上のプロセッサは、多数の二次元スライスを含む3Dトモシンセシスデータを記憶したメモリにアクセスするように構成することができ、このメモリは、大容量記憶装置128に含まれるものとすることができる。
【0098】
処理1000は1004において、患者の乳房組織の3Dトモシンセシスデータを受け取ることができる。3Dトモシンセシスデータは、乳房組織の例えば1mm等の所定の厚さに相当する多数の2Dスライスを含むことができる。ステップ1004は、上述のステップ304と同一とすることができる。その後、処理1000は1008に進むことができる。
【0099】
処理1000は、3Dトモシンセシスデータに含まれる3つの2Dスライスを、同時処理のために訓練済みモデルに入力することができる。この訓練済みモデルは、上述したモデル900とすることができる。処理1000は、3Dトモシンセシスデータに含まれる3つの2Dスライスを、同時処理のために訓練済みモデルに提供することができる。一部の実施形態では、訓練済みモデルは、医師によって注釈が付された二次元フルフィールド・デジタルマンモグラフィ画像を含む画像データセットに基づいて訓練されたものとすることができる。3つの各2Dスライスはそれぞれ、訓練済みモデルの異なる入力チャネルに入力される。例えば、第1の2Dスライスを第1の入力チャネルに入力し、第2の2Dスライスを第2の入力チャネルに入力し、第3の2Dスライスを第3の入力チャネルに入力することができる。2Dスライスは、所定のオフセット値だけ異なる関連付けられたスライス番号を有することができる。例えばオフセット値が2つの場合、第1の2Dスライスをスライス番号1に関連付け、第2の2Dスライスをスライス番号3に関連付け、第3の2Dスライスをスライス番号5に関連付けることができる。一部の実施形態では、処理1000は、第2の入力チャネルに(第1のチャネルと第2のチャネルとにオフセット値を設けてスライスをオフセットさせて)全てのスライスが入力されるまで3つの2Dスライスを処理に入力することができる。2Dスライスの中には、2Dスライスのスライス番号より所定のオフセット値が小さい又は大きいスライス番号を有する2Dスライスが他に存在しないものがあり得る。例えば、第2の入力チャネルに入力される2Dスライスがスライス番号1を関連付けられており、オフセット値が2である場合、第1の入力チャネルに入力される2Dスライスのスライス番号は負の1となる。かかる場合、処理1000は次に近いスライス(例えば、スライス番号1に関連付けられた2Dスライス)を第1のチャネルに入力することができる。その後本処理は、入力される2Dスライスに関連付けられた各スライス番号を1だけ増加させることにより、2Dスライスを「上方に移動」することができる。例えば処理1000は、スライス番号1,3及び5に関連付けられた2Dスライスを入力した後、スライス番号2,4及び6に関連付けられた2Dスライスを入力することができる。一部の実施形態では、処理1000は第2のチャネルモデル900に2Dスライスのサブセットを入力することができ、例えば1つおき、2つおき等にスライスを入力することができる。全ての2Dスライスが(又は1つおき又は2つおき等にスライスが)訓練済みのモデルに少なくとも1回入力された後、処理1000は1012に進むことができる。
【0100】
処理1000は1012において、訓練済みモデルから多数のROIを受け取ることができる。各ROIは、第2の入力チャネルと2Dスライスのうち1つとに関連付けることができる。各ROIは、これに関連付けられた2Dスライスが訓練済みモデルに入力されると共に、2Dスライスが訓練済みモデルの第1のチャネル及び第3のチャネルに入力されたときに生成することができる。その後、処理1000は1016に進むことができる。
【0101】
処理1000は1016において、複数のROIに基づいて合成画像を生成及び出力することができる。1012で生成された複数のROIを用いて、処理1000は、上述の工程316~352の少なくとも一部を実行することができる。その後、処理1000は1024に進むことができる。その後、処理1000は終了することができる。
【0102】
図10及び
図11を参照すると、悪性可能性スコア1154を生成するための一例の二次モデル1100が示されている。二次モデル1100は、第1の合成画像1102と第2の合成画像1103と第3の合成画像1104とを含む3つの入力合成画像を受け取ることができる。第2の合成画像1103は、上記の処理1000を用いて生成することができる。第1及び第3の合成画像は、以下に記述するように、第2の合成画像と1つ又は複数の2Dスライスとに基づいて生成することができる。モデル1100 は悪性可能性スコア1154を出力することができ、これは0~1の範囲とすることができる。一部の実施形態では、悪性可能性スコア1154は、低リスク、中リスク又は高リスクのカテゴリといったリスクのカテゴリを示すことができる。一部の実施形態では、悪性可能性スコア1154は数値範囲から選択することができ、例えば整数1~5から選択し、1が最も低いリスクレベルを示し、5が最も高いリスクレベルを示すことができる。第2の合成画像1103は、上述のモデル200又はモデル1000を使用して生成することができる。
【0103】
上述のように、合成画像の各画素はスライス番号に関連付けることができる(又は例えば、ブレンディング技術が使用されている場合には複数のスライスに関連付けることができる)。例えば、第2の合成画像1103に含まれる第1の画素群を7番目のスライスに関連付け、当該合成画像に含まれる第2の画素群を5番目のスライスに関連付けることができる。第1の合成画像1102及び第3の合成画像1104に含まれる各画素の強度値は、第2の合成画像1103内の特定の位置における画素に関連付けられたスライスに対して予め定められたオフセットスライス数を加算又は減算したスライスに含まれる画素の強度値を選択することにより求めることができる(具体的に、第2の合成画像1103に含まれる画素に関連付けられたスライス番号をx、予め定められたスライス数をnとすると、第1の合成画像1102の場合にはx-n、第3の合成画像1104の場合にはx+nとなる)。例えば、予め定められたスライス数を1とすると、第1の合成画像1102に含まれる画素であって第1の画素群(第2の合成画像1103に含まれ、7番目のスライスに関連付けられた画素群)と同じ画素位置にある画素の強度値は、6番目のスライスに含まれる画素の強度値と等しくなるように設定すると共に、第1の画素群と同じ位置に配することができる。第3の合成画像1104の場合、第3の合成画像1104に含まれる画素であって第1の画素群(第2の合成画像1103に含まれ、7番目のスライスに関連付けられた画素群)と同じ画素位置にある画素の強度値は、8番目のスライスに含まれる画素の強度値と等しくなるように設定すると共に、第1の画素群と同じ位置に配することができる。
【0104】
第2の合成画像1103を生成するためにブレンディングを用いた実施形態では、第1及び第3の合成画像1102,1104に含まれる各画素の強度値は、第2の合成画像1103を生成するために用いられる各スライスから予め定められたスライス数だけ離れたスライスに含まれる各画素の強度値に、第2の合成画像1103を生成するために使用される重みを乗じたものの和と等しくなるように設定することができる。
【0105】
一部の実施形態では、二次モデル1100は、残留回帰ニューラルネットワーク等のニューラルネットワークを含むことができる。二次モデル1100を訓練するために、悪性又は非悪性とラベリングされた合成画像を含む訓練データセットを用いてモデルを訓練することができる。人間の医師が合成画像にラベリングすることができる。訓練後、二次モデル1100は、乳房組織の3Dトモシンセシスデータから生成された3つの入力合成画像を受け取って、乳房組織に悪性の腫瘍及び/又は病変が含まれているか否かを示す悪性可能性スコアを出力することができる。
【0106】
二次モデル1100は、畳み込み層等の多数の層を含むことができる。二次モデル1100の一部の実施形態は、層の数が異なっていたり、層の配列が異なっていたり、他の相違があったりすることが理解される。しかし、全ての実施形態において、二次モデル1100は3つの入力2D合成画像を受け取って悪性可能性スコアを出力することができる。二次モデル1100は、1つ又は複数のサブネットワークを含む1段の検出ネットワークとすることができる。
【0107】
図9及び
図11を再度簡単に参照すると、二次モデル1100は一次サブネットワーク1116及び二次サブネットワーク1120を含むことができ、これらのサブネットワークは、上述したモデル900の一次サブネットワーク916及び二次サブネットワーク920と同一とすることができる。一部の実施形態では、一次サブネットワーク1116及び二次サブネットワーク1120は、モデル900が訓練された後の一次サブネットワーク916及び二次サブネットワーク920と同一とすることができる。換言すると、二次モデル1100は、訓練前に上記のモデル900、モデル600又はモデル200の重みを用いて初期化することができる。一次サブネットワーク1116は、3つの入力合成画像を受け取るように構成された入力層1118を含むことができる。
【0108】
二次モデル1100が重要であるのは、上述のモデル900は乳房組織の関心領域を検出することができるが、ROIが実際に悪性であるかどうかを正確に判断できないことがあるからである。二次モデル1100は、上述のモデル900によって生成された合成画像を使用して、乳房組織の悪性をより正確に推定するために使用され得る。
【0109】
モデル1100は、第1の三次ネットワーク1124A、第2の三次ネットワーク1124B及び三次ネットワーク1124C等の複数の三次サブネットワークを含むことができる。各三次ネットワーク1124A~Cは、第2のサブネットワーク1120の層に接続することができる。第1の三次ネットワーク1124Aは第1の層1122Aに接続することができ、第2の三次ネットワーク1124Bは第2の層1122Bに接続することができ、第3の三次ネットワーク1124Cは第3の層1122Cに接続することができる。各三次ネットワークは、異なるスケールレベルで乳房組織の悪性を推定するため、第2のサブネットワーク1120の層から特徴を受け取ることができる。
【0110】
各三次ネットワークは、ボックス回帰サブネットワーク1126を含むことができる。ボックス回帰サブネットワーク1126は1つ以上の畳み込み層1128A~Bを含むことができ、各畳み込み層1128A~Bには正規化線形(ReLU)活性化部が後続し、ボックス回帰サブネットワーク1126はまた最終畳み込み層1130を含むことができ、これは、第2のサブネットワーク1120の層のうち一層の一部に関連付けられたアンカーに対応する回帰座標を出力するものである(この回帰座標は、第2の入力合成2Dスライス1103の画素のアレイに対応する)。アンカーは、第2のサブネットワーク1120の複数の層の予め決定された部分アレイとすることができる。回帰座標は、アンカーと、予測されたバウンディングボックスと、の間の予測されたオフセットを表すことができる。ROIに含まれる各バウンディングボックスごとに、回帰座標のセット(例えば4つの回帰座標等)と、これに対応するアンカーとを使用して、バウンディングボックスの座標を計算することができる。
【0111】
各三次ネットワークは分類サブネットワーク1132を含むことができる。分類サブネットワーク1132は1つ以上の畳み込み層1134A~Bを含むことができ、各畳み込み層1134A~BにはReLU活性化部が後続し、分類サブネットワーク1132はさらに最終畳み込み層1138を含むことができ、最終畳み込み層1138には、物体の有無(すなわち悪性の腫瘍及び/又は病変の有無)の予測を出力するシグモイド活性化部が後続する。分類サブネットワーク1132を使用して、患者が第2の入力合成2Dスライス1103の複数の空間位置において悪性の腫瘍及び/又は病変を有するか否かの1つ以上の推定結果を得ることができる。より具体的には、各バウンディングボックスは、分類サブネットワーク1132によって出力された推定スコアと関連付けることができる。バウンディングボックスは、上記にて述べたスライス番号と関連付けることもできる。一部の実施形態では、各推定スコアの値は0から1の範囲とすることができる。空間位置のうち1つは、第2のサブネットワーク1120の一層すなわち第1の層1122Aの全部を含むことができる。このようにして分類サブネットワーク1132は、患者が悪性の腫瘍及び/又は病変を有するか否かの推定結果を合成2Dスライスに基づいて出力することができる。最終畳み込み層1138にはモデルでソフトマックス活性化部が後続することができ、これは、複数の種類の悪性領域、例えば複数の悪性レベル(例えば低リスク領域、ハイリスク領域等)等を分類するように訓練されたものである。
【0112】
モデル1100は、様々なスケールにわたるデータを正規化し、バウンディングボックス座標を計算し、低スコアのバウンディングボックス予測をフィルタリングにより除外する出力層1150を含むことができる。出力層1150は、三次サブネットワーク1124A~Cから出力を受け取って1つ以上のROIを出力することができ、各ROIは、第2の入力合成2Dスライス1103のアレイサイズにスケーリングされた画素のアレイと、関連付けられたスコアと、を有する。画素アレイは、回帰座標とアンカーとに基づいて計算されるバウンディングボックス(例えば方形のバウンディングボックス等)とすることができる。出力層1150は、所定の閾値未満、例えば0.5未満の全てのスコアをフィルタリングにより除外することができる。フィルタリング後、出力層1150は、他の残りのスコアに関連付けられた1つ又は複数のアンカーに基づいて各ROIの画素のアレイを決定することができる。出力層1150はアンカーを出力ROIのアレイとして含める前に、当該アンカーのサイズを入力合成2Dスライス1102,1103及び1104のスケールに一致するように変更することができる。かかるサイズ変更は、アンカーが第2のサブネットワーク1120のより小さい層に関連付けられている場合に必要となり得る。出力層1150は、三次サブネットワーク1124A~Cから出力を受け取って悪性可能性スコア1154を出力することができる。一部の実施形態では、悪性可能性スコア1154として、最高スコアのバウンディングボックススコアを選択することができる。一部の実施形態ではモデル1100は、スコア1108Aと画素のアレイ1108Bとをそれぞれ有する1つ又は複数のROI1108を出力することができる。画素アレイ1108Bは、方形のバウンディングボックスとすることができる。1つ又は複数のROI1108は、第2の入力合成2Dスライス1103における悪性の可能性のある領域についての追加情報を医師に提供することができる。
【0113】
図1,9及び11並びに
図12を参照すると、乳房組織の腫瘍及び/又は病変の悪性を推定するために訓練されたモデルを用いて3つの合成画像を作成し、当該合成画像に基づいて悪性可能性スコアを生成するための処理1200が示されている。処理1200は、データ処理システムが有する1つ以上のメモリ上に指令として実装することができる。データ処理システムはさらに、上記の1つ以上のメモリと通信すると共に上記の指令を実行するように構成された1つ以上のプロセッサを備えることができる。上記の1つ以上のプロセッサは、多数の二次元スライスを含む3Dトモシンセシスデータを記憶したメモリにアクセスするように構成することができ、このメモリは、大容量記憶装置128に含まれるものとすることができる。
【0114】
処理1200は1204において、患者の乳房組織の3Dトモシンセシスデータを受け取ることができる。3Dトモシンセシスデータは、X線イメージングシステム100等の3Dマンモグラフィイメージングシステムによって生成することができる。3Dトモシンセシスデータは、乳房組織の例えば1mm等の所定の厚さに相当する多数の2Dスライスを含むことができる。患者及び/又はイメージングシステムに依存して、3Dトモシンセシスデータは約10~150個以上の2Dスライスを含むことができる。各2Dスライスは、所定のサイズの画素アレイとすることができ、例えば2000×1500画素等とすることができる。その後、処理1200は1208に進むことができる。
【0115】
処理1200は1208において、第2の入力チャネルに係る合成画像を生成することができる。合成画像は第2の合成画像(すなわち、モデル1100の第2のチャネルに係る合成画像)と称され、上記のステップ1008~1016のうち少なくとも1つを用いて生成することができる。その後、処理1200は1212に進むことができる。
【0116】
処理1200は1212において、第1の合成画像(すなわち、モデル1100の第1のチャネルに対する合成画像)と称される、第1の入力チャネルに係る合成画像を、予め定められたオフセットスライス数と第2の合成画像とに基づいて生成することができる。上述のように、合成画像の各画素はスライス番号に関連付けることができる(又は例えば、ブレンディング技術が使用されている場合には複数のスライスに関連付けることができる)。例えば、第2の合成画像に含まれる第1の画素群を7番目のスライスに関連付け、当該第2の合成画像に含まれる第2の画素群を5番目のスライスに関連付けることができる。処理1200は、第1の合成画像に含まれる各画素の強度値を、第2の合成画像内の特定の位置における画素に関連付けられたスライスから予め定められたオフセットスライス数を差し引いたスライスに含まれる画素の強度値を選択することにより求めることができる(具体的に、第2の合成画像に含まれる画素に関連付けられたスライス番号をx、予め定められたスライス数をnとすると、第1の合成画像の場合にはx-nとなる)。例えば、予め定められたスライス数を1とすると、第1の合成画像に含まれる画素であって第1の画素群(第2の合成画像に含まれ、7番目のスライスに関連付けられた画素群)と同じ画素位置にある画素の強度値は、6番目のスライスに含まれる画素の強度値と等しくなるように設定すると共に、第1の画素群と同じ位置に配することができる。第2の合成画像を生成するためにブレンディングを用いた実施形態では、処理1200は、第1の合成画像に含まれる各画素の強度値は、第2の合成画像を生成するために用いられる各スライスから予め定められたスライス数だけ離れたスライスに含まれる各画素の強度値に、第2の合成画像を生成するために使用される重みを乗じたものの和と等しくなるように設定することができる。その後、処理は1216に進むことができる。
【0117】
処理1200は1216において、第3の合成画像(すなわち、モデル1100の第3のチャネルに対する合成画像)と称される、第3の入力チャネルに係る合成画像を、予め定められたオフセットスライス数と第2の合成画像とに基づいて生成することができる。処理1200は、第3の合成画像に含まれる各画素の強度値を、第2の合成画像内の特定の位置における画素に関連付けられたスライスに予め定められたオフセットスライス数を加えたスライスに含まれる画素の強度値を選択することにより求めることができる(具体的に、第2の合成画像に含まれる画素に関連付けられたスライス番号をx、予め定められたスライス数をnとすると、第3の合成画像の場合にはx+nとなる)。例えば、予め定められたスライス数を1とすると、第3の合成画像に含まれる画素であって第1の画素群(第2の合成画像に含まれ、7番目のスライスに関連付けられた画素群)と同じ画素位置にある画素の強度値は、8番目のスライスに含まれる画素の強度値と等しくなるように設定すると共に、第1の画素群と同じ位置に配することができる。第2の合成画像を生成するためにブレンディングを用いた実施形態では、処理1200は、第1及び第3の合成画像に含まれる各画素の強度値は、第2の合成画像を生成するために用いられる各スライスから予め定められたスライス数だけ離れたスライスに含まれる各画素の強度値に、第2の合成画像を生成するために使用される重みを乗じたものの和と等しくなるように設定することができる。その後、処理は1220に進むことができる。
【0118】
処理1200は1220において、悪性可能性スコアを求めるための訓練済みモデルに3つの合成画像を提供することができる。この訓練済みモデルは、上述したモデル1100とすることができる。その後、処理1200は1216に進むことができる。
【0119】
処理1200は1224において、訓練済みのモデルから悪性可能性スコアを受け取ることができる。一部の実施形態では悪性可能性スコアは、悪性のリスクが高いことを示す1と、悪性のリスクが最小である又は無いことを示す0とを含めた、0~1の範囲とすることができる。一部の実施形態では悪性は、腫瘍が悪性であるか又は悪性でないかを示す「はい」(すなわち1)又は「いいえ」(すなわち0)とすることができる。一部の実施形態では、悪性可能性スコアは、リスクのカテゴリ、例えば、低リスク、中リスク、又は高リスクのカテゴリを示すことができる。一部の実施形態では、悪性可能性スコアは数値範囲から選択することができ、例えば整数1~5から選択し、1が最も低いリスクレベルを示し、5が最も高いリスクレベルを示すことができる。一部の実施形態では、処理1200は、上記の関心領域1108等の訓練済みモデルによって生成された1つ以上の関心領域を受け取ることもできる。その後、処理1200は1220に進むことができる。
【0120】
処理1200は1228において、記憶及び/若しくは他の処理での使用のためにメモリへ悪性可能性スコアを出力し、並びに/又は、人間の医師が観察するためにコンピュータモニタ等の表示部へ悪性可能性スコアを出力することができる。例えば処理1200は、医師が悪性可能性スコアを見ることができ、場合によっては悪性可能性スコアに基づいて患者の診断を下すことができる医療設備の表示部に、悪性可能性スコアを出力することができる。悪性可能性スコアは、乳がん患者の将来の分析及び/又は研究のためにカルテのデータベースに記憶することができる。一部の実施形態では、処理1200は1216において受け取った関心領域のうち1つ若しくは複数を、記憶及び/若しくは他の処理での使用のためにメモリへ出力し、並びに/又は、人間の医師が観察するためにコンピュータモニタ等の表示部へ出力することができる。処理1200は、悪性可能性スコア及び/又は1つ以上の関心領域をレポートとして出力することができる。その後、処理1200は終了することができる。
【0121】
モデル200又はモデル900のいずれかによって生成されたROIを用いて生成された合成画像を用いて、上記のモデル600又はモデル1100のいずれかを用いて悪性可能性スコアを生成することができることが理解できる。よって、本願開示は、乳房の3D断層撮影データから合成2D画像を効率的かつ画一的に作成すると共に、乳房に腫瘍及び/又は病変が存在する場合にはその悪性を推定するためのシステム及び方法を提供するものである。
【0122】
1つ又は複数の好適な実施形態を参照して本発明を説明したが、明示的に記載された均等態様、代替態様、変形態様及び改良態様の他にも多くの均等態様、代替態様、変形態様及び改良態様が可能であり、これらは本発明の範囲内であると解すべきである。
【国際調査報告】