IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧

特許77142863Dのz方向の病変の接続性を決定するためのロジスティック・モデルのための方法、コンピュータ・プログラム、および装置(3Dのz方向の病変の接続性を決定するためのロジスティック・モデル)
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-07-18
(45)【発行日】2025-07-29
(54)【発明の名称】3Dのz方向の病変の接続性を決定するためのロジスティック・モデルのための方法、コンピュータ・プログラム、および装置(3Dのz方向の病変の接続性を決定するためのロジスティック・モデル)
(51)【国際特許分類】
   A61B 6/03 20060101AFI20250722BHJP
   A61B 6/46 20240101ALI20250722BHJP
   G06T 7/00 20170101ALI20250722BHJP
   G06T 7/62 20170101ALI20250722BHJP
   G06T 7/60 20170101ALI20250722BHJP
   A61B 6/50 20240101ALI20250722BHJP
【FI】
A61B6/03 560D
A61B6/03 560G
A61B6/46 536Z
G06T7/00 350B
G06T7/62
G06T7/00 612
G06T7/60 180D
A61B6/50 500A
【請求項の数】 7
(21)【出願番号】P 2021176809
(22)【出願日】2021-10-28
(65)【公開番号】P2022074101
(43)【公開日】2022-05-17
【審査請求日】2024-03-19
(31)【優先権主張番号】17/084,849
(32)【優先日】2020-10-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/084,914
(32)【優先日】2020-10-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/085,005
(32)【優先日】2020-10-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/084,875
(32)【優先日】2020-10-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/084,958
(32)【優先日】2020-10-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/085,042
(32)【優先日】2020-10-30
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【弁理士】
【氏名又は名称】太佐 種一
(72)【発明者】
【氏名】ワン イー-シン
(72)【発明者】
【氏名】パルマ ジョバンニ ジョン ジャック
【審査官】遠藤 直恵
(56)【参考文献】
【文献】特開2014-033948(JP,A)
【文献】特開2014-033947(JP,A)
【文献】米国特許出願公開第2011/0255761(US,A1)
【文献】米国特許出願公開第2005/0286750(US,A1)
【文献】米国特許出願公開第2016/0125598(US,A1)
【文献】中国特許出願公開第111513743(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
A61B 6/00-6/58、5/055
G06T 1/160-1/166
(57)【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサおよび少なくとも1つのメモリを備えているデータ処理システムにおける方法であって、前記少なくとも1つのメモリが、前記少なくとも1つのプロセッサによって実行されて、z方向の病変の接続性を決定するためのトレーニング済み機械学習コンピュータ・モデルを実装するための命令を含んでおり、前記方法が、
3次元医用画像内の所与のスライスに関して、前記3次元医用画像内の前記所与のスライス内の第1の病変および隣接するスライス内の第2の病変を識別する段階と、
前記第1の病変に関して前記第1の病変と前記第2の病変の間の第1の交差値を決定する段階と、
前記第2の病変に関して前記第1の病変と前記第2の病変の間の第2の交差値を決定する段階と、
前記第1の交差値および前記第2の交差値に基づいて、前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定する段階と
を備えており、
前記第1の交差値を決定する段階が、前記第1の交差値r を次のように計算する段階を有し、
【数1】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示し、
前記第2の交差値を決定する段階が、前記第2の交差値r を次のように計算する段階を有し、
【数2】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示し、
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定する段階が、前記第1の交差値および前記第2の交差値を特徴として前記トレーニング済み機械学習コンピュータ・モデルに提供する段階を有し、前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の病変および前記第2の病変が同じ3次元の病変に属している確率を生成し、
前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の交差値r および前記第2の交差値r を次のように線形に結合することを学習し、
【数3】
、c 、およびbが、機械学習トレーニング動作によってトレーニング・ボリュームから学習される動作パラメータである、
法。
【請求項2】
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定する段階が、前記第1の病変および前記第2の病変が同じ3次元の病変に属している前記確率が既定のしきい値tより大きいかどうかを判定する段階を有する、請求項1に記載の方法。
【請求項3】
前記3次元医用画像のすべてのスライスについて、各スライス内の各第1の病変および各隣接するスライス内の各第2の病変が同じ3次元の病変に属しているかどうかを判定する段階と、
前記3次元医用画像内の同じ3次元の病変に属している病変をz軸に沿って接続する段階と
をさらに備えている、請求項1または2に記載の方法。
【請求項4】
コンピューティング・デバイスに、z方向の病変の接続性を決定するためのトレーニング済み機械学習コンピュータ・モデルを実装する手順であって、前記トレーニング済み機械学習コンピュータ・モデルが、
3次元医用画像内の所与のスライスに関して、前記3次元医用画像内の前記所与のスライス内の第1の病変および隣接するスライス内の第2の病変を識別することと、
前記第1の病変に関して前記第1の病変と前記第2の病変の間の第1の交差値を決定することと、
前記第2の病変に関して前記第1の病変と前記第2の病変の間の第2の交差値を決定することと、
前記第1の交差値および前記第2の交差値に基づいて、前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することと
を実行する、手順を実行させ、
前記第1の交差値を決定することが、前記第1の交差値r を次のように計算することを含み、
【数4】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示し、
前記第2の交差値を決定することが、前記第2の交差値r を次のように計算することを含み、
【数5】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示し、
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することが、前記第1の交差値および前記第2の交差値を特徴として前記トレーニング済み機械学習コンピュータ・モデルに提供することを含み、前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の病変および前記第2の病変が同じ3次元の病変に属している確率を生成し、
前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の交差値r および前記第2の交差値r を次のように線形に結合することを学習し、
【数6】
、c 、およびbが、機械学習トレーニング動作によってトレーニング・ボリュームから学習される動作パラメータである、
ンピュータ・プログラム。
【請求項5】
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することが、前記第1の病変および前記第2の病変が同じ3次元の病変に属している前記確率が既定のしきい値tより大きいかどうかを判定することを含む、請求項4に記載のコンピュータ・プログラム。
【請求項6】
前記トレーニング済み機械学習コンピュータ・モデルが、
前記3次元医用画像のすべてのスライスについて、各スライス内の各第1の病変および各隣接するスライス内の各第2の病変が同じ3次元の病変に属しているかどうかを判定することと、
前記3次元医用画像内の同じ3次元の病変に属している病変をz軸に沿って接続することと
を実行する、
請求項4または5に記載のコンピュータ・プログラム。
【請求項7】
プロセッサと、
前記プロセッサに結合されたメモリと
を備えている装置であって、
前記メモリが、前記プロセッサによって実行された場合に、前記プロセッサに、z方向の病変の接続性を決定するためのトレーニング済み機械学習コンピュータ・モデルを実装させる命令を含み、前記トレーニング済み機械学習コンピュータ・モデルが実行されて、
3次元医用画像内の所与のスライスに関して、前記3次元医用画像内の前記所与のスライス内の第1の病変および隣接するスライス内の第2の病変を識別することと、
前記第1の病変に関して前記第1の病変と前記第2の病変の間の第1の交差値を決定することと、
前記第2の病変に関して前記第1の病変と前記第2の病変の間の第2の交差値を決定することと、
前記第1の交差値および前記第2の交差値に基づいて、前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することと
を実行し、
前記第1の交差値を決定することが、前記第1の交差値r を次のように計算することを含み、
【数7】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示し、
前記第2の交差値を決定することが、前記第2の交差値r を次のように計算することを含み、
【数8】
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することが、前記第1の交差値および前記第2の交差値を特徴として前記トレーニング済み機械学習コンピュータ・モデルに提供することを含み、前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の病変および前記第2の病変が同じ3次元の病変に属している確率を生成し、
前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の交差値r および前記第2の交差値r を次のように線形に結合することを学習し、
【数9】
、c 、およびbが、機械学習トレーニング動作によってトレーニング・ボリュームから学習される動作パラメータである、
置。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、一般に、改善されたデータ処理装置および方法に関し、より詳細には、3Dのz方向の病変の接続性を決定するロジスティック・モデルを提供するためのメカニズムに関する。
【背景技術】
【0002】
肝臓病変は、生物学的実体の肝臓内の異常細胞のグループであり、腫瘤または腫瘍と呼ばれることもある。非がん性または良性の肝臓病変は、よく見られ、体の他の領域に広がらない。そのような良性の肝臓の病変は、一般に、如何なる健康問題も引き起こさない。しかし、一部の肝臓の病変は、がんの結果として生じる。特定の医学的状態を有する患者は、他の患者よりも、がん性の肝臓病変を有する可能性が高いことがある。これらの医学的状態は、例えば、B型またはC型肝炎、肝硬変、鉄蓄積症(血色素症)、肥満、または有害化学物質(ヒ素またはアフラトキシンなど)への暴露を含む。
【0003】
肝臓病変は、通常、例えば超音波検査、磁気共鳴画像(MRI:magnetic resonance image)、コンピュータ断層撮影(CT:computerized tomograph)、または陽電子放射断層撮影(PET:positron emission tomography)スキャンなどの、医用画像検査を行うことのみによって識別可能になる。そのような医用画像検査は、医用画像に関する人間の主題専門家(SME:subject matter expert)によって見られなければならず、SMEは、自分の専門知識および画像内のパターンを理解する人間の能力を使用して、医用画像検査が何らかの病変を示しているかどうかを判定しなければならない。人間のSMEによってがん性の病変の可能性が識別された場合、患者の医師は、この病変ががん性であるかどうかを判定するために、生検を行うことができる。
【0004】
腹部造影(CE:contrast enhanced)CTは、肝臓の様々な異常(例えば、病変)の評価における現在の標準である。これらの病変は、人間のSMEによって悪性(肝細胞がん、胆管がん、血管肉腫、転移、およびその他の悪性病変)または良性(血管腫、限局性結節性過形成、腺腫、嚢胞または脂肪腫、肉芽腫など)として評価されることがある。人間のSMEによるそのような画像の手動の評価は、その後の治療介入を誘導することにおいて重要である。CE CTにおいて病変を正しく評価するために、複数のフェーズの研究が何度も行われており、複数のフェーズの研究は、健康な肝実質の強化の異なる段階の医用画像、および差異検出を決定するための病変の強化との比較を提供する。その後、人間のSMEは、これらの差異に基づいて病変の診断を決定することができる。
【先行技術文献】
【特許文献】
【0005】
【文献】米国特許出願第16/926,880号
【文献】米国特許出願公開第2011/0125734号
【非特許文献】
【0006】
【文献】Abrahamらによる「A Novel Focal Tversky Loss function with Improved Attention U-Net for Lesion Segmentation」、arXiv:1810.07842[cs]、October 2018
【文献】Yuanらによる「Watson And Healthcare」、IBM developerWorks、2011
【文献】Rob Highによる「The Era of Cognitive Systems:An Inside Look at IBM Watson and How it Works」、IBM Redbooks、2012
【発明の概要】
【発明が解決しようとする課題】
【0007】
いくつかの自動化された画像解析メカニズムが開発されたが、撮像された解剖学的構造(例えば、肝臓またはその他の臓器)内の病変を検出するための医用画像データのより効率的かつ正しい解析を提供するように、そのような自動化された画像解析メカニズムを改良する必要がまだある。
【0008】
この「発明の概要」は、概念の選択を簡略化された形態で導入するために提供されており、本明細書の「発明を実施するための形態」において、さらに説明される。この「発明の概要」は、請求される対象の重要な要因または不可欠な特徴を識別するよう意図されておらず、請求される主題の範囲の限定に使用されることも意図されていない。
【0009】
1つの例示的実施形態では、少なくとも1つのプロセッサおよび少なくとも1つのメモリを備えているデータ処理システムにおいて、方法が提供され、少なくとも1つのメモリが、少なくとも1つのプロセッサによって実行されて、z方向の病変の接続性を決定するためのトレーニング済み機械学習コンピュータ・モデルを実装するための命令を含んでいる。この方法は、3次元医用画像内の所与のスライスに関して、3次元医用画像内の所与のスライス内の第1の病変および隣接するスライス内の第2の病変を識別することを含む。この方法は、第1の病変に関して第1の病変と第2の病変の間の第1の交差値を決定することと、第2の病変に関して第1の病変と第2の病変の間の第2の交差値を決定することとをさらに含む。この方法は、第1の交差値および第2の交差値に基づいて、第1の病変および第2の病変が同じ3次元の病変に属しているかどうかを判定することをさらに含む。これには、3次元を通って病変を接続するという利点を有する。例示的実施形態は、重複の値を使用して3次元医用画像内の病変をz方向に自動的に接続するように機械学習モデルをトレーニングする、アルゴリズムを提供する。機械学習コンピュータ・モデルは、2つの特徴(第1の交差値および第2の交差値)を使用して、3次元内の同じ病変である隣接するスライス内の病変を正確に決定する。
【0010】
1つの実施形態例では、第1の交差値を決定することは、第1の交差値rを次のように計算することを含む。
【0011】
【数1】
【0012】
ここで、Aは第1の病変であり、Bは第2の病変であり、|A|は第1の病変の面積を示し、|B|は第2の病変の面積を示し、|A∩B|は第1の病変と第2の病変の共通集合の面積を示す。別の実施形態では、第2の交差値を決定することは、第2の交差値rを次のように計算することを含む。
【0013】
【数2】
【0014】
ここで、Aは第1の病変であり、Bは第2の病変であり、|A|は第1の病変の面積を示し、|B|は第2の病変の面積を示し、|A∩B|は第1の病変と第2の病変の共通集合の面積を示す。これらの実施形態は、機械学習コンピュータ・モデルをトレーニングして適用するために、第1の交差値および第2の交差値の特徴値を計算するという利点を提供する。これらの実施形態は、2つの病変のうちのより小さい方に関して2つの病変の交差値を計算し、2つの病変のうちのより大きい方に関して2つの病変の交差値を計算し、このようにして、2つの特徴値を提供する。2つの異なる重複の特徴値を使用して、より正確なモデルを実現する。
【0015】
別の実施形態例では、第1の病変および第2の病変が同じ3次元の病変に属しているかどうかを判定することは、第1の交差値および第2の交差値を特徴としてトレーニング済み機械学習コンピュータ・モデルに提供することを含む。トレーニング済み機械学習コンピュータ・モデルは、第1の病変および第2の病変が同じ3次元の病変に属している確率を生成する。さらに別の実施形態例では、トレーニング済み機械学習コンピュータ・モデルは、ロジスティック回帰モデルである。代替の実施形態では、第1の病変および第2の病変が同じ3次元の病変に属しているかどうかを判定することは、第1の病変および第2の病変が同じ3次元の病変に属している確率が既定のしきい値tより大きいかどうかを判定することを含む。これらの実施形態は、しきい値と比較することができる確率を生成するロジスティック回帰モデルを使用するという利点を有する。これによって、モデルの感度を高くするか、または低くするように、しきい値を調整することができる。
【0016】
さらに別の実施形態例では、この方法は、3次元医用画像のすべてのスライスについて、各スライス内の各第1の病変および各隣接するスライス内の各第2の病変が同じ3次元の病変に属しているかどうかを判定することと、3次元医用画像内の同じ3次元の病変に属している病変をz軸に沿って接続することとをさらに含む。これは、トレーニング済み機械学習コンピュータ・モデルの結果に基づいて、3次元を通って病変を接続するという利点を有する。
【0017】
別の実施形態例では、トレーニング済み機械学習コンピュータ・モデルは、第1の交差値rおよび第2の交差値rを次のように線形に結合することを学習する。
【0018】
【数3】
【0019】
ここで、c、c、およびbは、機械学習トレーニング動作によってトレーニング・ボリュームから学習される動作パラメータである。この実施形態は、機械学習コンピュータ・モデルの損失関数を最適化するための複数の動作パラメータを提供し、このようにして、正確な結果を実現する。さらに、2つの異なる重複の特徴値を使用して、より正確なモデルを実現する。
【0020】
他の例示的実施形態では、コンピュータ可読プログラムを含んでいるコンピュータ使用可能媒体またはコンピュータ可読媒体を備えているコンピュータ・プログラム製品が提供される。このコンピュータ可読プログラムは、コンピューティング・デバイス上で実行された場合、コンピューティング・デバイスに、方法の例示的実施形態に関して上で概説された動作のうちの様々な動作およびその組み合わせを実行させる。
【0021】
さらに別の例示的実施形態では、システム/装置が提供される。このシステム/装置は、1つまたは複数のプロセッサおよび1つまたは複数のプロセッサに結合されたメモリを備えてよい。このメモリは命令を含んでよく、これらの命令は、1つまたは複数のプロセッサによって実行された場合、1つまたは複数のプロセッサに、方法の例示的実施形態に関して上で概説された動作のうちの様々な動作およびその組み合わせを実行させる。
【0022】
本発明の実施形態例の以下の詳細な説明を考慮して、本発明のこれらおよびその他の特徴および優位性が説明され、当業者にとって明らかになるであろう。
【図面の簡単な説明】
【0023】
本発明ならびに本発明の最もよく使われる使用方法とその他の目的、および優位性は、例示的実施形態の以下の詳細な説明を、添付の図面と一緒に読みながら参照することによって、最も良く理解されるであろう。
【0024】
図1】1つの例示的実施形態に係る、入力医用画像データ内の解剖学的構造の識別および病変検出を実行するように特に構成されてトレーニングされた複数のML/DLコンピュータ・モデルを実装するAIパイプラインの例示的なブロック図である。
図2】1つの例示的実施形態に係る、AIパイプラインの例示的な動作の概要を示す例示的なフローチャートである。
図3A】1つの例示的実施形態に係る、患者の腹部のスライス(医用画像)の例示的な入力ボリュームを示す例示的な図である。
図3B】対応する軸方向スコアs'infおよびs'supと共に表されたスライスのセクションを含む、図3Aの入力ボリュームの別の表現を示す図である。
図3C】ボリュームがn個の完全に重複するセクションに軸方向に分割された、図3Aの入力ボリュームの例示的な図である。
図4A】1つの例示的実施形態に係る、医用画像の入力ボリュームのセクションのs'supおよびs'infの値を推定するように構成されてトレーニングされたML/DLコンピュータ・モデルの1つの例示的実施形態の例示的な図である。
図4B】1つの例示的実施形態に係る、医用画像の入力ボリュームのセクションのs'supおよびs'infの値を推定するように構成されてトレーニングされたML/DLコンピュータ・モデルの1つの例示的実施形態の例示的な図である。
図4C】1つの例示的実施形態に係る、医用画像の入力ボリュームのセクションのs'supおよびs'infの値を推定するように構成されてトレーニングされたML/DLコンピュータ・モデルの1つの例示的実施形態の例示的な図である。
図5】1つの例示的実施形態に係る、AIパイプラインの肝臓検出および既定の量の解剖学的構造決定論理の例示的な動作の概要を示すフローチャートである。
図6】1つの例示的実施形態に係る、対象の解剖学的構造(例えば、肝臓)において病変検出を実行するために使用されるML/DLコンピュータ・モデルの集団の例示的な図である。
図7】1つの例示的実施形態に係る、AIパイプラインにおける肝臓/病変検出論理の例示的な動作の概要を示すフローチャートである。
図8】1つの例示的実施形態に係る、病変セグメント化の態様を示すブロック図である。
図9】1つの例示的実施形態に係る、病変検出およびスライスごとの分割の結果を示す図である。
図10A】1つの例示的実施形態に係る、シードの位置決めを示す図である。
図10B】1つの例示的実施形態に係る、シードの位置決めを示す図である。
図10C】1つの例示的実施形態に係る、シードの位置決めを示す図である。
図10D】1つの例示的実施形態に係る、シードの位置決めを示す図である。
図11A】1つの例示的実施形態に係る、病変分割のメカニズムを示すブロック図である。
図11B】1つの例示的実施形態に係る、シードの再ラベル付けのメカニズムを示すブロック図である。
図12】1つの例示的実施形態に係る、病変分割の例示的な動作の概要を示すフローチャートである。
図13A】1つの例示的実施形態に係る、病変のz方向接続を示す図である。
図13B】1つの例示的実施形態に係る、病変のz方向の接続を示す図である。
図13C】1つの例示的実施形態に係る、病変のz方向の接続を示す図である。
図14A】1つの例示的実施形態に係る、z方向の病変の接続に関するトレーニング済みモデルの結果を示す図である。
図14B】1つの例示的実施形態に係る、z方向の病変の接続に関するトレーニング済みモデルの結果を示す図である。
図15】1つの例示的実施形態に係る、z軸に沿って2次元の病変を接続するためのメカニズムの例示的な動作の概要を示すフローチャートである。
図16】1つの例示的実施形態に係る、同じ画像内の2つの病変の輪郭を含む例を示す図である。
図17】1つの例示的実施形態に係る、スライスごとの輪郭の精密化のためのメカニズムの例示的な動作の概要を示すフローチャートである。
図18A】1つの例示的実施形態に係る、患者レベルおよび病変レベルの動作点の決定のためのROC曲線の例を示す図である。
図18B】1つの例示的実施形態に係る、患者レベルおよび病変レベルの動作点に基づいて偽陽性除去を実行するための動作の例示的なフロー図である。
図18C】1つの例示的実施形態に係る、入力ボリュームレベルおよびボクセル・レベルの動作点に基づいてボクセルごとの偽陽性除去を実行するための動作の例示的なフロー図である。
図19】1つの例示的実施形態に係る、AIパイプラインの偽陽性除去論理の例示的な動作の概要を示すフローチャートである。
図20】例示的実施形態の態様が実装されてよい、分散データ処理システムの例示的な図である。
図21】例示的実施形態の態様が実装されてよい、コンピューティング・デバイスの例示的なブロック図である。
【発明を実施するための形態】
【0025】
病変の検出または異常細胞のグループの検出は、最新の薬物療法では、主に手動のプロセスである。これは、手動のプロセスであるため、特に、個人がより短い時間にますます多くの数の画像を評価することに対する大きい要求を考えると、そのような病変を示すデジタル医用画像の部分を検出する個人の能力に関する人間の限界に起因する、誤差の発生源を伴う。いくつかの自動化された画像解析メカニズムが開発されたが、撮像された解剖学的構造(例えば、肝臓またはその他の臓器)内の病変を検出するための医用画像データのより効率的かつ正しい解析を提供するように、そのような自動化された画像解析メカニズムを改良する必要がまだある。
【0026】
例示的実施形態は、特に、自動化されたコンピュータによる人工知能医用画像解析を提供する改良されたコンピューティング・ツールを対象にし、この解析は、機械学習/深層学習コンピュータ・プロセスを介して、解剖学的構造を検出することと、そのような解剖学的構造内の、またはそのような解剖学的構造に関連付けられた、病変またはその他の対象の生物学的構造を検出することと、検出された病変またはその他の生物学的構造の特殊なセグメント化を実行することと、特殊なセグメント化に基づいて偽陽性除去を実行することと、検出された病変またはその他の生物学的構造の分類を実行することと、追加のコンピュータの動作を実行するために、病変/生物学的構造の検出の結果を下流コンピューティング・システムに提供することとを実行するように、特にトレーニングされる。例示的実施形態の以下の説明は、対象の生物学的構造としての肝臓病変に関して特にトレーニングされている例示的実施形態のメカニズムに特に関係している実施形態を仮定するが、例示的実施形態は、そのような実施形態に限定されない。むしろ、当業者は、例示的実施形態の機械学習/深層学習に基づく人工知能メカニズムが、本発明の思想および範囲から逸脱することなく、医用画像データ内で表されたその他の解剖学的構造内の、またはその他の解剖学的構造に関連付けられた、多くのその他の種類の生物学的構造/病変に関して実装されてよいということを認識するであろう。さらに、例示的実施形態は、コンピュータ断層撮影(CT)医用画像データである医用画像データに関して説明されてよいが、例示的実施形態は、陽電子放射断層撮影(PET)およびその他の核医学画像、超音波、磁気共鳴画像(MRI)、エラストグラフィ、光音響画像化、心エコー検査、磁気粒子画像法、機能的近赤外分光分析法、エラストグラフィ、蛍光透視法を含む様々なX線画像化などを含むが、これらに限定されない、様々な種類の医用画像技術からの任意のデジタル医用画像データを使用して実装されてよい。
【0027】
全体として、例示的実施形態は、複数の特に構成されてトレーニングされたAIコンピュータ・ツール(例えば、特定のタスクを実行するように有限のデータのセットに基づいてトレーニングされた、ニューラル・ネットワーク、認知コンピューティング・システム、またはその他のAIメカニズム)を含んでいる改良された人工知能(AI)コンピュータ・パイプラインを提供する。構成されてトレーニングされたAIコンピュータ・ツールは、医用画像技術によって捕捉された医用画像を定義するデータまたはメタデータあるいはその両方の1つまたは複数の集団として表された、入力医用画像のボリュームの特定の種類の人工知能処理を実行するように、それぞれ特に構成/トレーニングされる。一般に、これらのAIツールは、タスクを実行するために機械学習(ML:machine learning)/深層学習(DL:deep learning)コンピュータ・モデル(または単に、MLモデル)を採用し、ML/DLコンピュータ・モデルは、生成された結果に関して人間の思考過程をエミュレートしながら、特定の結果(例えば、画像の分類またはラベル、データ値、治療推奨など)を表すデータ間のパターンおよび関係を学習する、コンピュータ・ツールおよび特にML/DLコンピュータ・モデルに固有の異なるコンピュータ・プロセスを使用する。ML/DLコンピュータ・モデルは、基本的に、機械学習アルゴリズム、機械学習アルゴリズムの構成設定、ML/DLコンピュータ・モデルによって識別された入力データの特徴、およびML/DLコンピュータ・モデルによって生成されたラベル(または出力)を含んでいる要素の機能である。機械学習プロセスを介してこれらの要素の機能を特に調整することによって、特定のML/DLコンピュータ・モデルのインスタンスが生成される。同じまたは異なる入力データに関して異なるAI機能を実行するように、異なるMLモデルが特に構成されてトレーニングされてよい。
【0028】
人工知能(AI)パイプラインが複数のML/DLコンピュータ・モデルを実装するため、これらのML/DLコンピュータ・モデルが、特定の目的のためのML/DLプロセスを介してトレーニングされるということが理解されるべきである。したがって、ML/DLコンピュータ・モデルのトレーニング・プロセスの概要として、機械学習が、経験的データ(医用画像データなど)を入力として受け取り、入力データ内の複雑なパターンを認識する技術の設計および開発に関係しているということが、理解されるべきである。機械学習技術に共通する1つのパターンは、基礎になるコンピュータ・モデルMの使用であり、入力データを前提として、Mに関連付けられたコスト関数を最小化するために、Mのパラメータが最適化される。例えば、分類との関連において、モデルMは、M=a*x+b*y+cとなり、コスト関数が誤って分類された点の数になるように、データを2つのクラス(例えば、ラベル)に分離する直線であってよい。その場合、学習プロセスは、誤って分類された点の数が最小になるようにパラメータa、b、cを調整することによって動作する。この最適化フェーズ(または学習フェーズ)の後に、モデルMを使用して新しいデータ点を分類することができる。多くの場合、Mは統計モデルであり、入力データを前提として、コスト関数はMの尤度に反比例する。これは、機械学習トレーニングの一般的な説明を提供するための単純な例にすぎず、本発明の思想および範囲から逸脱することなく、異なるパターン、コスト(または損失)関数、および最適化を使用するその他の種類の機械学習が、例示的実施形態のメカニズムと共に使用されてよい。
【0029】
解剖学的構造検出または病変検出あるいはその両方の目的で(病変は、医用画像データ内の「異常」である)、学習機械は、正常な構造表現のML/DLコンピュータ・モデルを構築し、この正常な構造表現のML/DLコンピュータ・モデルから逸脱している医用画像内のデータ点を検出することができる。例えば、異常のスコアを生成して別のデバイスに報告すること、入力を分類する1つまたは複数のクラスを示す分類出力、様々なクラスに関連付けられた確率またはスコアを生成すること、などのために、所与のML/DLコンピュータ・モデル(例えば、教師ありモデル、教師なしモデル、または半教師ありモデル)が使用されてよい。そのようなML/DLコンピュータ・モデルを構築して解析するために使用されてよい機械学習技術の例としては、最近傍(NN:nearest neighbor)技術(例えば、k-NNモデル、レプリケータNNモデル(replicator NN models)など)、統計的技術(例えば、ベイジアン・ネットワークなど)、クラスタ化技術(例えば、k平均など)、ニューラル・ネットワーク(例えば、リザーバ・ネットワーク、人工ニューラル・ネットワークなど)、サポート・ベクター・マシン(SVM:support vector machines)などが挙げられ得るが、これらに限定されない。
【0030】
例示的実施形態のプロセッサ実装人工知能(AI)パイプラインは、通常、機械学習(ML)コンピュータ・モデルおよび深層学習(DL)コンピュータ・モデルのうちの一方または両方を含む。場合によっては、MLおよびDLのうちの一方または他方が、特定の結果を実現するために使用されるか、または実装され得る。従来の機械学習は、特に、ベイズ判定、回帰、決定木/森、サポート・ベクター・マシン、またはニューラル・ネットワークなどのアルゴリズムを含むか、または使用することができる。深層学習は、深層ニューラル・ネットワークに基づくことができ、畳み込み層などの複数の層を使用することができる。階層型ネットワークなどを使用するそのようなDLは、その実装において効率的であることができ、従来のML技術と比較して、精度の改善を実現することができる。従来のMLは、一般に、DLモデルの性能が古典的なMLモデルの性能を上回ることができるが、DLモデルが相対的に大きい量の処理リソースまたは電力リソースあるいはその両方を消費する可能性があるという点において、DLと区別され得る。例示的実施形態との関連において、本明細書におけるMLおよびDLのうちの一方または他方への言及は、一方または両方の形態のAI処理を包含すると理解され得る。
【0031】
例示的実施形態に関して、AIパイプラインのML/DLコンピュータ・モデルは、ML/DLトレーニング・プロセスを介した構成およびトレーニングの後に実行され、複雑なコンピュータ医用画像解析を実行して、入力医用画像内の解剖学的構造を検出し、対象のターゲット生物学的構造(以下では、実施形態例の説明の目的で、肝臓病変であると仮定される)、それらの分類、これらの対象のターゲット生物学的構造(例えば、肝臓病変)が入力医用画像(以下では、CT医用画像データであると仮定される)内で存在する位置を指定する輪郭、および捕捉された入力医用画像の視点から患者の医学的状態を理解することにおいて、放射線科医、医師などの人間の主題専門家(SME)を支援するその他の情報を特に識別する出力を生成する。さらに、これらの出力は、分類、輪郭などに基づく治療推奨およびその他の意思決定支援動作などの、追加の人工知能動作を実行するために、他の下流のコンピュータ・システムに提供され得る。
【0032】
最初に、例示的実施形態の人工知能(AI)パイプラインは、コンピュータ断層撮影(CT)医用画像データの入力ボリュームを受信し、生物学的実体の体のどの部位がCT医用画像データに示されているかを検出する。医用画像の「ボリューム」は、2次元スライスの積み重ねで構成されている生物学的実体の内部解剖学的構造の3次元表現であり、これらのスライスは、医用画像技術によって捕捉された個別の医用画像であってよい。スライスの積み重ねは、「スラブ」と呼ばれてもよく、これらの積み重ねが、厚さを有している解剖学的構造の部分を表すという点において、スライス自体とは異なってもよく、スライスの積み重ねまたはスラブは、解剖学的構造の3次元表現を生成する。
【0033】
この説明の目的では、生物学的実体が人間であるということが仮定されるが、本発明は、様々な種類の生物学的実体の医用画像に対して動作してよい。例えば、獣医学では、生物学的実体は、様々な種類の小型動物(例えば、犬、猫などのペットなど)または大型動物(例えば、馬、牛、またはその他の家畜)であってよい。AIパイプラインが肝臓病変の検出のために特にトレーニングされる実装の場合、AIパイプラインは、入力CT医用画像データが、CT医用画像データ内に存在している腹部のスキャンを表しているかどうかを判定し、表していない場合、人体の正しい部位または部分に向けられていないため、入力CT医用画像データに関するAIパイプラインの動作が終了する。体の異なる部分の入力医用画像および異なるターゲット生物学的構造を処理するようにトレーニングされた、例示的実施形態に係る異なるAIパイプラインが存在してよく、入力CT医用画像が、AIパイプラインの各々への入力であってよく、または入力CT医用画像に示された体の部位または体の部分の分類に基づいてAIパイプラインにルーティングされてよく、例えば、入力CT医用画像内で表された体の部位または体の部分に関する入力CT医用画像の分類が最初に実行されてよく、次に、入力CT医用画像を処理するための対応するトレーニング済みAIパイプラインが、本明細書に記載された種類の複数のトレーニング済みAIパイプラインから選択されてよいということが、理解されるべきである。以下の説明の目的で、肝臓病変を検出するようにトレーニングされた単一のAIパイプラインが説明されるが、一連のAIパイプラインまたはAIパイプラインの集団へのこの拡張が、本説明を考慮して、当業者にとって明らかになるであろう。
【0034】
入力CT医用画像のボリュームが(肝臓病変検出の目的で)人体の腹部の医用画像を含んでいると仮定すると、入力CT医用画像の処理が2つの初期の段階でさらに実行され、これらの初期の段階は、望ましい実装に応じて、実質的に互いに並行して、または順番に、あるいはその両方で実行されてよい。2つの初期の段階は、フェーズ分類段階および解剖学的構造検出段階(例えば、AIパイプラインが肝臓病変検出を実行するように構成されている場合は、肝臓検出段階)を含む。
【0035】
フェーズ分類段階は、入力CT医用画像のボリュームが単一の撮像フェーズまたは複数の撮像フェーズを含んでいるかどうかを判定する。医用画像における「フェーズ」は、造影剤の摂取の指示である。例えば、一部の医用画像技術では、フェーズは、造影剤の経路を捕捉することを含む医用画像の捕捉を可能にする造影剤が生物学的実体にいつ導入されるかに関して定義されてよい。例えば、フェーズは、造影前フェーズ、動脈造影フェーズ、門脈/静脈造影フェーズ、および遅延フェーズを含んでよく、医用画像は、これらのフェーズのいずれかまたはすべてにおいて捕捉される。フェーズは、通常、注入後のタイミング、および画像内の構造の強化の特性に関連している。可能性のあるフェーズを「並べ替える」ため(例えば、遅延フェーズは常に門脈フェーズの後に取得される)、および所与の画像の可能性のあるフェーズを推定するために、タイミング情報が考慮され得る。画像内の構造の強化の特性の使用に関しては、この種類の情報を使用してフェーズを決定する1つの例が、2020年7月13日に出願された、同一出願人による同時係属の米国特許出願第16/926,880号「Method of Determining Contrast Phase of a Computerized Tomography Image」において説明されている。さらにタイミング情報は、各フェーズの最良の表現を取り出すために、他の情報(サンプリング、再構築カーネルなど)と共に使用され得る(所与の取得が複数の方法で再構築され得る)。
【0036】
強化のタイミングまたは特性あるいはその両方に基づいて、入力ボリューム内の画像が対応するフェーズに割り当てられたか、または分類された後に、フェーズ分類に基づいて、ボリュームが単一のフェーズ(例えば、門脈/静脈フェーズが存在するが動脈フェーズが存在しない)または複数のフェーズの検査(例えば、門脈/静脈および動脈)の画像を含んでいるかどうかが判定され得る。フェーズ分類が、単一のフェーズが入力CT医用画像のボリュームに存在することを示している場合、AIパイプラインによる処理が、以下で説明されているようにさらに実行される。複数のフェーズが検出された場合、ボリュームは、AIパイプラインによってさらに処理されない。しかし、一部の例示的実施形態では、単一/複数のフェーズに基づくボリュームのこのフィルタは、単一のフェーズからの画像を含むボリュームのみを受け入れ、複数のフェーズのボリュームを拒否するが、他の例示的実施形態では、本明細書に記載されたAIパイプライン処理は、対象のターゲットフェーズに分類されなかったボリュームの画像をフィルタ除去してよく、例えば、門脈/静脈フェーズの一部であるとして分類されなかったボリュームの画像をフィルタ除去しながら、ボリューム内の門脈/静脈フェーズの画像が維持されてよく、それによって、ターゲットフェーズに分類された画像のサブセットのみを含んでいる修正されたボリュームになるように、入力ボリュームを修正する。さらに、前述したように、異なる種類のボリュームに対して異なるAIパイプラインがトレーニングされてよく、一部の例示的実施形態では、入力ボリューム内の画像のフェーズ分類は、入力ボリュームの画像を、異なるフェーズの画像を処理するようにトレーニングされて構成された対応するAIパイプラインにルーティングまたは配布するために使用されてよく、それによって、入力ボリュームが、構成要素であるサブボリュームにさらに分割され、処理のために対応するAIパイプラインにルーティングされることができるようにし、例えば、処理のために、門脈/静脈フェーズの画像に対応する第1のサブボリュームが第1のAIパイプラインに送信され、動脈フェーズに対応する第2のサブボリュームが第2のAIパイプラインに送信される。入力CT医用画像のボリュームが単一のフェーズを含んでいる場合、またはAIパイプラインが単一のフェーズの入力ボリュームまたはサブボリュームの画像を処理するように、サブボリュームをフィルタリングし、任意選択的に対応するAIパイプラインにルーティングした後に、ボリューム(またはサブボリューム)が、さらに処理するためにAIパイプラインの次の段階に渡される。
【0037】
第2の初期の段階は、対象の解剖学的構造(この実施形態例では、肝臓)の検出段階であり、この段階では、対象の解剖学的構造を示すボリュームの部分が識別され、AIパイプラインの次の下流の段階に渡される。対象の解剖学的構造の検出段階(以下では、実施形態例に従って、肝臓検出段階と呼ばれる)は、コンピュータ医用画像解析を実行して、対象の解剖学的構造(例えば、肝臓)に対応する入力医用画像の部分を識別するように特にトレーニングされて構成された、機械学習(ML)/深層学習(DL)コンピュータ・モデルを含む。そのような医用画像解析は、入力医用画像(トレーニング中は、トレーニング画像)が対象の解剖学的構造(例えば、肝臓)を含んでいるかどうかを判定するように、入力としてのラベル付きのトレーニング医用画像データに対してML/DLモデルをトレーニングすることを含んでよい。画像のラベルのグラウンド・トゥルースに基づいて、収束に達する(すなわち、損失が最小化される)まで、ML/DLモデルによって生成された結果における損失または誤差を減らすように、ML/DLモデルの動作パラメータが調整されてよい。このプロセスによって、対象の解剖学的構造(この例では肝臓)の存在を示す医用画像データのパターンを認識するように、ML/DLモデルがトレーニングされる。その後、トレーニングされると、新しい入力医用画像データが、解剖学的構造が存在していることを示すパターンを含んでいるかどうかを判定するために、ML/DLモデルを新しい入力データに対して実行することができ、確率が既定のしきい値より大きい場合、医用画像データが対象の解剖学的構造を含んでいるということが判定され得る。
【0038】
したがって、肝臓検出段階で、AIパイプラインは、トレーニング済みML/DLコンピュータ・モデルを使用して、入力CT医用画像のボリュームが肝臓を示している画像を含んでいるかどうかを判定する。肝臓を示しているボリュームの部分が、フェーズ分類段階の結果と共に、AIパイプラインの判定段階に渡され、判定段階は、医用画像の単一のフェーズが存在するかどうか、および少なくとも既定の量の対象の解剖学的構造が、対象の解剖学的構造(例えば、肝臓)を示しているボリュームの部分に存在するかどうかを判定する。既定の量の対象の解剖学的構造が存在するかどうかの判定は、医用画像から構造の測定値を決定する(例えば、画像内の画素の位置の差異から構造のサイズを計算する)既知の測定メカニズムに基づいて決定されてよい。測定値が解剖学的構造の少なくとも既定の量または部分を表している場合、AIパイプラインによって処理をさらに実行できるように、測定値が、類似する人口統計を有している類似する患者の解剖学的構造の既定のサイズ(例えば、平均サイズ)と比較されてよい。1つの例示的実施形態では、この判定は、例えば、肝臓の少なくとも1/3が、肝臓を示していると判定された入力CT医用画像のボリュームの部分に存在するかどうかを判定する。この実施形態例では1/3が使用されるが、本発明の思想および範囲から逸脱することなく、特定の実装に適していると決定された、構造の任意の既定の量が使用されてよい。
【0039】
1つの例示的実施形態では、既定の量の対象の解剖学的構造が、入力CT医用画像のボリュームに存在するかどうかを判定するために、対象の解剖学的構造(例えば、肝臓)の第1の表現を含んでいるボリューム内の医用画像に対応するスライス(すなわち、肝臓を含んでいる最初のスライス(FSL:first slice containing the liver))に、0のスライス・スコアが与えられ、肝臓を含んでいる最後のスライス(LSL:last slice containing the liver)が1のスコアを有するように、軸方向スコアが定義される。人間の生物学的実体を仮定して、ボリューム内の最下位スライス(MISV)(下肢(例えば、足)に最も近い)からボリューム内の最上位スライス(MSSV)(頭に最も近い)に進んで、最初のスライスおよび最後のスライスが定義される。MSSVスライスおよびMISVスライスのスライス・スコアにそれぞれ対応するスライス・スコアの対(ssupおよびsinf)によって、肝臓軸方向スコア推定値(LAE:liver axial score estimate)が定義される。ML/DLコンピュータ・モデルは、後でさらに詳細に説明されるように、入力CT医用画像のボリュームのスライス・スコアssupおよびsinfを決定するように、特に構成されてトレーニングされる。例示的実施形態のメカニズムは、これらのスライス・スコアを認識し、上記の定義から、肝臓が0から1まで広がるということを認識して、入力CT医用画像のボリュームの視界内で、肝臓の断片を決定することができる。
【0040】
一部の例示的実施形態では、スライス・スコアssupおよびsinfは、まず、入力CT医用画像のボリュームをセクションに分割し、次に、セクション内の肝臓の最上位スライス(頭に最も近い)および最下位スライス(足に最も近い)s'supおよびs'infを決定するために、セクションごとに、構成されてトレーニングされたML/DLコンピュータ・モデルをセクションのスライスに対して実行して、スライスごとの高さを推定することによって、間接的に検出されてよい。s'supおよびs'infの推定値を前提として、入力CT医用画像のボリューム全体に対してセクションがどのように位置しているかが分かっているため、外挿によってssupおよびsinfの推定値が検出される。この手法は、入力ボリューム(または、ターゲットフェーズに関連付けられたサブボリューム)からの任意のスライスの高さのロバスト推定量に基づく。そのような推定量は、例えば、チャンク(連続するスライスのセット)からの高さの推定を実行する深層学習モデルを使用して、回帰モデルを学習することによって、取得され得る。例えば、長短期記憶(LSTM:long short-term memory)型人工ニューラル・ネットワーク・モデルは、これらのタスクに適しており、肝臓および腹部の生体構造を含んでいるスライスの順序付けをエンコードする能力を有している。ボリュームごとに、ssupおよびsinfのn個の推定値が存在するということに注意するべきであり、nはボリュームごとのセクションの数である。1つの例示的実施形態では、これらのn個の推定値の非加重平均を取ることによって、最終的な推定値が取得されるが、他の例示的実施形態では、n個の推定値の他の関数を使用して、最終的な推定値が生成されてよい。
【0041】
入力CT医用画像のボリュームのssupおよびsinfの最終的な推定値を決定し、これらの値に基づいて、対象の解剖学的構造(例えば、肝臓)の断片が計算される。このタスクは、各スライスの高さの推定によって可能にされる。入力ボリューム内の肝臓の最初のスライスの高さ(h1)および最後のスライスの高さ(h2)の推定から、肝臓の実際の最初のスライスの高さおよび最後のスライスの高さが(入力ボリュームに含まれているかどうかに関わらず)H1およびH2であると仮定して、入力ボリューム内の可視の肝臓の部分は、(min(h1, H1)-max(h2, H2))/(H1-H2)と表され得る。次に、この計算された断片は、既定の最小量の対象の解剖学的構造が入力CT医用画像のボリュームに存在する(例えば、肝臓の少なくとも1/3が入力CT医用画像のボリュームに存在する)かどうかを判定するために、既定のしきい値と比較されてよい。
【0042】
この判定が、複数のフェーズが存在するか、または既定の量の対象の解剖学的構造が、解剖学的構造を示している入力CT医用画像のボリュームの部分に存在しないか、あるいはその両方であるということの判定に終わった場合、それ以上のボリュームの処理が中断されてよい。この判定が、入力CT医用画像のボリュームが単一のフェーズおよび少なくとも既定の量の対象の解剖学的構造を含んでいる(例えば、肝臓の1/3が画像に表示されている)ということの判定に終わった場合、解剖学的構造を示している入力CT医用画像のボリュームの部分が、処理のためにAIパイプラインの次の段階に転送される。
【0043】
AIパイプラインの次の段階では、AIパイプラインが、対象の解剖学的構造(例えば、肝臓)を表している入力CT医用画像のボリュームの部分に対して、病変検出を実行する。AIパイプラインのこの肝臓および病変検出段階は、ML/DLコンピュータ・モデルの集団を使用して、入力CT医用画像のボリューム内で表された肝臓および肝臓内の病変を検出する。ML/DLコンピュータ・モデルの集団は、異なってトレーニングされたML/DLコンピュータ・モデルを使用して、肝臓および病変検出を実行し、ML/DLコンピュータ・モデルは、病変検出における偽陽性および偽陰性の釣り合いを取るように、損失関数を使用してトレーニングされている。さらに、集団のML/DLコンピュータ・モデルは、第3の損失関数がML/DLコンピュータ・モデルの出力を互いに強制的に一致させるように、構成される。
【0044】
肝臓検出および病変検出がAIパイプラインのこの段階で実行されるということを仮定して、第1のML/DLコンピュータ・モデルが入力CT医用画像のボリュームに対して実行され、肝臓の存在を検出する。このML/DLコンピュータ・モデルは、対象の解剖学的構造の検出の前のAIパイプラインの段階において採用されたML/DLコンピュータ・モデルと同じであってよく、したがって、前に取得された結果が利用されてよい。複数の(2つ以上の)他のML/DLコンピュータ・モデルが、肝臓を示している医用画像の部分において病変検出を実行するように、構成されてトレーニングされる。第1のML/DLコンピュータ・モデルは、2つの損失関数を使用して構成される。第1の損失関数は、偽陰性(すなわち、病変が存在しないということ(正常な解剖学的構造)を誤って示す分類)における誤差にペナルティを科す。第2の損失関数は、偽陽性結果(すなわち、病変が存在するということ(異常な解剖学的構造)を誤って示す分類)における誤差にペナルティを科す。第2のML/DLは、正常な組織を含んでいる肝臓のスライス内の偽陽性の誤差にペナルティを科し、病変を含んでいる肝臓のスライス内の偽陰性の誤差にペナルティを科す適応損失関数を使用して、病変を検出するようにトレーニングされる。2つのML/DLモデルから出力された検出が平均化され、最終的な病変検出を生成する。
【0045】
AIパイプラインの肝臓/病変検出段階の結果は、肝臓の1つまたは複数の輪郭(輪郭線)、および検出された病変に対応する医用画像データ要素の部分を識別する検出マップ(例えば、入力CT医用画像のボリューム内で検出された肝臓病変のボクセルごとのマップ)を含む。次に、画像マップがAIパイプラインの病変セグメント化段階に入力される。病変セグメント化段階は、後でより詳細に説明されるように、流域技術を使用して検出マップを分割し、入力CT医用画像の画像要素(例えば、ボクセル)の分割を生成する。肝臓病変セグメント化段階は、この分割に基づいて入力CT医用画像のボリュームのスライスに存在する病変に対応する輪郭のすべてを識別し、3次元内でどの輪郭が同じ病変に対応するかを識別するための動作を実行する。病変セグメント化は、相互に関連付けられた病変輪郭を集約し、病変の3次元分割を生成する。病変セグメント化は、各病変に個別に焦点を合わせ、能動的輪郭解析を実行するために、医用画像内で表された病変画像要素(例えば、ボクセル)および肝臓以外の組織のインペインティングを使用する。このようにして、医用画像内の他の病変に起因して解析にバイアスをかけることも、肝臓の外側の画像の部分に起因して解析にバイアスをかけることもなく、個別の病変が識別され、処理されてよい。
【0046】
病変セグメント化の結果は、入力CT医用画像のボリューム内の対応する輪郭線または輪郭を含む病変のリストである。これらの出力は、実際の病変ではない検出結果を含むことがある。それらの偽陽性の影響を最小限に抑えるために、これらの出力が、トレーニング済み偽陽性除去モデルを使用する偽陽性除去を対象にする、AIパイプラインの次の段階に提供される。AIパイプラインの偽陽性除去モデルは、どの出力が実際の病変であるか、およびどの検出結果が偽陽性であるかを識別するための分類器として機能する。入力は、病変セグメント化の精密化から得られたマスクに関連付けられた、検出された検出結果を中心とする画像のボリューム(VOI:volume of images)で構成される。偽陽性除去モデルは、検出/セグメント化段階の結果であるデータを使用してトレーニングされる。検出アルゴリズムによって検出されたグラウンド・トゥルースからの病変であるオブジェクトが、トレーニング中に病変クラスを表すために使用され、グラウンド・トゥルースからのどの病変にも一致しない検出が、非病変(偽陽性)クラスを表すために使用される。
【0047】
全体的性能をさらに改善するために、病変検出モデルおよび偽陽性モデルでは、二重の動作点の戦略が採用された。このアイデアは、AIパイプラインの出力が異なるレベルで解釈され得るということに注目する。最初に、AIパイプラインの出力は、検査ボリューム(すなわち、入力ボリュームまたは画像のボリューム(VOI))が病変を含んでいるかどうかを伝えるために使用され得る。次に、AIパイプラインの出力は、病変が同じ患者/検査/ボリュームに含まれているかどうかに関わらず、病変の検出を最大化することを目指す。明確にするために、検査のために行われる測定は、本明細書では「患者レベル」と呼ばれ、病変に関して行われる測定は、本明細書では「病変レベル」と呼ばれる。「病変レベル」での感度を最大にすると、「患者レベル」での特異度が低下する(患者が病変を含んでいると言われるためには、1回の検出で十分である)。これは結局、患者レベルで不十分な特異度を有するか、または病変レベルで低い感度を有するかを選択する必要があるため、臨床的利用にとって準最適になることがある。
【0048】
このことを考慮して、例示的実施形態は、二重の動作点の手法を、病変検出および偽陽性除去の両方に使用する。この原理は、最初に、患者レベルで妥当な性能を与える第1の動作点を使用して処理を実行することである。次に、第1の実行から検出された少なくとも1つの病変を有している患者に対して、検出された病変を再解釈/処理するために、第2の動作点が使用される。この第2の動作点は、より感度が高くなるように選択される。この第2の動作点は、第1の動作点よりも特異度が低いが、第2の動作点が追加の病変を検出したであろうかどうかに関わらず、第1の動作点を使用して病変が検出されなかったすべての患者が現状のままに保たれるため、この特異度の損失は、患者レベルに含まれる。したがって、患者レベルの特異度は、第1の動作点のみによって決定される。患者レベルの感度は、単独で選択された第1の動作点の感度と第2の動作点の感度の間にある(第1の動作点からのある偽陰性の事例が、第2の動作点によって真陽性に変えられる可能性がある)。病変側で、第1の動作点のみと比較して、実際の病変レベルの感度が改善される。第1の動作点のみを使用して処理される場合、偽陽性が発生しないため、単独で選択された特異度が低い第2の動作点よりも、病変の特異度が良くなる。
【0049】
例示的実施形態は、特定の構成および二重の動作点の手法の使用を仮定するが、グループ・レベル(例示的実施形態では、このグループ・レベルは「患者レベル」である)および要素レベル(例示的実施形態では、この要素レベルは「病変レベル」である)で性能を測定することに興味がある場合に、二重の動作点の手法が、他の構成で、他の目的に使用され得るということが、理解されるべきである。例示的実施形態では、二重の動作点の手法は、病変検出および偽陽性除去の両方に適用されるが、二重の動作点の手法がAIパイプラインのこれらの段階を越えて拡張され得るということが、理解され得る。例えば、患者レベルおよび病変レベルではなく、ボクセル・レベル(要素)とボリューム・レベル(グループ)で病変の検出が実行されてよい。別の例として、ボクセル・レベルまたは病変レベルが要素レベルに使用されてよく、スラブ(スライスのセット)がグループ・レベルとして使用されてよい。さらに別の例では、単一のボリュームの代わりに、検査のすべてのボリュームがグループ・レベルとして使用されてよい。この手法が、3次元ボリュームではなく画像を解析するために、2次元画像(例えば、胸部、マンモグラフィなどの2Dエックス線写真)に適用されてもよいということが、理解されるべきである。患者/グループごとの偽陽性の平均数などの特異度が、動作点の選択に使用され得る。さらに、例示的実施形態は、病変検出および分類に適用することとして説明されるが、二重の動作点に基づく手法は、他の構造(クリップ、ステント、インプラントなど)に、および医用画像を越えて、適用されてよい。
【0050】
二重の動作点に基づく検出および偽陽性除去の結果は、AIパイプラインの病変分類段階によってさらに処理される、最終的なフィルタリングされた病変のリストの識別につながる。AIパイプラインの病変分類段階では、構成されてトレーニングされたML/DLコンピュータ・モデルが、病変および対応する輪郭データのリストに対して実行され、それによって、病変を複数の既定の病変分類のうちの1つに分類する。例えば、最終的なフィルタリングされた病変のリスト内の各病変およびその属性(例えば、輪郭データ)は、トレーニング済みML/DLコンピュータ・モデルに入力されてよく、その後、トレーニング済みML/DLコンピュータ・モデルは、このデータに対して動作し、病変を病変の特定の種類として分類する。この分類は、グラウンド・トゥルース・データに対して以前にトレーニングされた分類器(例えば、トレーニング済みニューラル・ネットワーク・コンピュータ・モデル)を、AIパイプラインの前の処理ステップの結果と組み合わせて使用して、実行され得る。この分類タスクは、多かれ少なかれ複雑になる可能性があり、例えば、良性、悪性、または不定などのラベルを提供すること、または別の例では、嚢胞、転移、血管腫などの実際の病変の種類を提供することになる可能性がある。分類器は、例えば、ニューラル・ネットワークに基づくコンピュータ・モデルの分類器(例えば、SVM、決定木など)、または深層学習コンピュータ・モデルであることができる。この分類器の実際の入力は、病変を中心とする部分であり、一部の実施形態では、病変マスクまたは輪郭線(輪郭)を使用して拡張されてよい。
【0051】
AIパイプラインの病変分類段階による病変の分類の後に、AIパイプラインは、病変およびそれらの分類のリストを、病変の任意の輪郭属性と共に出力する。さらに、AIパイプラインは、肝臓の肝臓輪郭情報を出力してもよい。このAIパイプラインによって生成された情報は、対象の解剖学的構造および解剖学的構造に存在する任意の検出された病変の表現のさらなる処理および生成のために、さらに下流コンピューティング・システムに提供されてよい。例えば、入力CT医用画像のボリュームのグラフィック表現が、医用画像ビューアまたはその他のコンピュータ・アプリケーションにおいて生成されてよく、解剖学的構造および検出された病変は、AIパイプラインによって生成された輪郭情報を使用して、グラフィック表現に重ね合わせられるか、またはその他の方法で強調される。他の例示的実施形態では、AIパイプラインによって生成された情報の下流の処理は、病変、分類、および輪郭の検出されたリストに基づく診断意思決定支援動作、自動化された医用画像レポート生成を含んでよい。他の例示的実施形態では、病変の分類に基づいて、医師による確認および検討のために、異なる治療推奨が生成されてよい。
【0052】
一部の例示的実施形態では、病変、それらの分類、および輪郭のリストが、入力CT医用画像のボリュームと一致する患者に関連付けられた履歴データ構造に格納されてよく、その患者に関連付けられた入力CT医用画像の異なるボリュームに対するAIパイプラインの複数の実行を格納し、時間をかけて評価できるようにする。例えば、患者の病気または医学的状態の進行を評価し、そのような情報を医療専門家に提示して、患者の治療を支援するために、病変のリストまたはそれらに関連付けられた分類あるいはその両方および輪郭の間の差異が決定されてよい。
【0053】
例示的実施形態のAIメカニズムによって生成された特定の解剖学的構造および病変検出情報のその他の下流コンピューティング・システムおよび処理が、本発明の思想および範囲から逸脱することなく実装されてよい。例えば、AIパイプラインの出力は、見落とされる可能性のある検出結果を臨床スタッフに認識させるために、AIパイプラインの出力内の解剖学的構造および病変情報を処理して、情報の他のソース(例えば、放射線医学レポート)との不一致を識別する、別の下流コンピューティング・システムによって使用されてよい。
【0054】
したがって、例示的実施形態は、入力医用画像のボリューム内の解剖学的構造およびこれらの解剖学的構造に関連付けられた病変を識別することと、そのような解剖学的構造および病変に関連付けられた輪郭を決定することと、そのような病変の分類を決定することと、AIパイプラインからAIによって生成された情報のさらに下流のコンピュータ処理のために、そのような病変、ならびに病変および解剖学的構造の輪郭のリストを生成することとを実行するために、AIパイプラインの様々な段階の様々な人工知能動作を実装する複数の構成されてトレーニングされたML/DLコンピュータ・モデルを含んでいる自動化されたAIパイプラインを実現するメカニズムを提供する。AIパイプラインの動作は、AIパイプラインのどの段階でも人間の介入がないように自動化され、代わりに、様々な段階の特定のAI解析を実行するために、機械学習/深層学習コンピュータ・プロセスを介してトレーニングされた、特に構成されてトレーニングされたML/DLコンピュータ・モデルが採用された。人間の介入が存在することがあるのは、入力医用画像のボリュームの入力の前(例えば、患者の医用画像の撮像中)、およびAIパイプラインの出力後(例えば、AIパイプラインによって生成された病変および輪郭のリストの出力に基づいて、コンピュータ画像表示アプリケーションを介して提示された、拡張された医用画像を表示しているとき)のみである。したがって、AIパイプラインは、コンピュータ環境内のみに存在する特定の機械学習/深層学習プロセスを使用して人工知能として実装された、改良された自動化コンピュータ・ツールに特に関係しているため、人間によって知的過程として実行され得ない動作を実行し、どのような人間の活動も編成しない。
【0055】
例示的実施形態および例示的実施形態によって実行される改良されたコンピュータの動作の様々な態様の説明を続ける前に、この説明全体にわたって、「メカニズム」という用語が、様々な動作、機能などを実行する本発明の要素を指すために使用されるということが、最初に理解されるべきである。「メカニズム」は、この用語が本明細書において使用されるとき、装置、手順、またはコンピュータ・プログラム製品の形態での、例示的実施形態の機能または態様の実装であってよい。手順の場合、手順は、1つまたは複数のデバイス、装置、コンピュータ、データ処理システムなどによって実装される。コンピュータ・プログラム製品の場合、特定の「メカニズム」に関連付けられた機能を実装するため、または特定の「メカニズム」に関連付けられた動作を実行するために、コンピュータ・プログラム製品内またはコンピュータ・プログラム製品上で具現化されたコンピュータ・コードまたは命令によって表された論理が、1つまたは複数のハードウェア・デバイスによって実行される。したがって、本明細書に記載されたメカニズムは、特殊なハードウェア、ハードウェア上で実行され、それによって、ハードウェアがその他の方法で実行することができない本発明の特殊な機能を実装するようにハードウェアを構成するソフトウェア、命令がハードウェアによって容易に実行可能になり、それによって、本明細書において示された機能および説明された特定のコンピュータの動作を実行するようにハードウェアを特に構成するように、媒体に格納されたソフトウェア命令、機能を実行するための手順または方法、あるいはこれらのいずれかの組み合わせとして実装されてよい。
【0056】
本説明および特許請求の範囲では、例示的実施形態の特定の特徴および要素に関して、「1つの」、「~のうちの少なくとも1つ」、および「~のうちの1つまたは複数」という用語を使用することがある。これらの用語および語句が、特定の例示的実施形態に存在する特定の特徴または要素のうちの少なくとも1つが存在するが、2つ以上が存在する可能性もあるということを述べるよう意図されているということが、理解されるべきである。すなわち、これらの用語/語句は、本明細書または特許請求の範囲を、存在している単一の特徴/要素に限定するよう意図されておらず、そのような特徴/要素が複数存在することを必要とするよう意図されてもいない。反対に、これらの用語/語句は、少なくとも単一の特徴/要素のみを必要とし、そのような特徴/要素は、本明細書および特許請求の範囲内に複数存在する可能性がある。
【0057】
さらに、「エンジン」という用語の使用が、本発明の実施形態および特徴を説明することに関して本明細書において使用された場合、エンジンに起因するか、またはエンジンによって実行されるか、あるいはその両方である動作、ステップ、プロセスなどを実現するため、または実行するため、あるいはその両方のためのいずれかの特定の実装を制限するよう意図されていないということが、理解されるべきである。エンジンは、機械可読メモリに読み込まれるか、または格納されて、プロセッサによって実行される適切なソフトウェアと組み合わせた一般的なプロセッサまたは特殊なプロセッサあるいはその両方の任意の使用を含むが、これらに限定されない、指定された機能を実行するソフトウェア、ハードウェア、またはファームウェア、あるいはその組み合わせであってよいが、これらに限定されない。さらに、特定のエンジンに関連付けられたすべての名前は、特に指定されない限り、参照の便宜のためであり、特定の実装を制限するよう意図されていない。さらに、あるエンジンに起因する任意の機能が、同じ種類または異なる種類の別のエンジンの機能に組み込まれるか、もしくは結合されるか、またはその両方が行われるか、あるいは様々な構成の1つまたは複数のエンジンにわたって分散されて、複数のエンジンによって同じように実行されてよい。
【0058】
加えて、以下の説明では、例示的実施形態の様々な要素の複数の様々な例を使用して、例示的実施形態の例示的な実装をさらに説明し、例示的実施形態のメカニズムの理解を助けているということが、理解されるべきである。これらの例は、非限定的であるよう意図されており、例示的実施形態のメカニズムの実装の様々な可能性を網羅していない。本説明を考慮して、これらの様々な要素に関して、本発明の思想および範囲から逸脱することなく、本明細書において提供された例に加えて、またはそれらの例を置き換えて利用できる、多くのその他の代替の実装が存在するということが、当業者にとって明らかであろう。
【0059】
本発明は、システム、方法、またはコンピュータ・プログラム製品、あるいはその組み合わせであってよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいる1つまたは複数のコンピュータ可読ストレージ媒体を含んでよい。
【0060】
コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用するための命令を保持および格納できる有形のデバイスであることができる。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組み合わせであってよいが、これらに限定されない。コンピュータ可読ストレージ媒体のさらに具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read-only memory)、消去可能プログラマブル読み取り専用メモリ(EPROM:erasable programmable read-only memoryまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM:static random access memory)、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD-ROM:compact disc read-only memory)、デジタル・バーサタイル・ディスク(DVD:digital versatile disk)、メモリ・スティック、フロッピー・ディスク、命令が記録されているパンチカードまたは溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組み合わせを含む。本明細書において使用されるとき、コンピュータ可読ストレージ媒体は、それ自体が、電波またはその他の自由に伝搬する電磁波、導波管またはその他の送信媒体を伝搬する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、あるいはワイヤを介して送信される電気信号などの一過性の信号であると解釈されるべきではない。
【0061】
本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体から各コンピューティング・デバイス/処理デバイスへ、またはネットワーク(例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組み合わせ)を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードされ得る。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを備えてよい。各コンピューティング・デバイス/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス/処理デバイス内のコンピュータ可読ストレージ媒体に格納するために転送する。
【0062】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA:instruction-set-architecture)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、あるいは、Java(登録商標)、Smalltalk(登録商標)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組み合わせで記述されたソース・コードまたはオブジェクト・コードのいずれかであってよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN:local area network)または広域ネットワーク(WAN:wide area network)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されてよく、または接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行われてよい。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ(FPGA:field-programmable gate arrays)、またはプログラマブル・ロジック・アレイ(PLA:programmable logic arrays)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用して、電子回路をカスタマイズすることによって、コンピュータ可読プログラム命令を実行してよい。
【0063】
本発明の態様は、本明細書において、本発明の実施形態に係る、方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組み合わせが、コンピュータ可読プログラム命令によって実装され得るということが理解されるであろう。
【0064】
これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実装する手段を作り出すべく、コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読ストレージ媒体がフローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作の態様を実装する命令を含んでいる製品を含むように、コンピュータ可読ストレージ媒体に格納され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組み合わせに特定の方式で機能するように指示できるものであってもよい。
【0065】
コンピュータ可読プログラム命令は、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実装するように、コンピュータ実装プロセスを生成するために、コンピュータ、その他のプログラム可能なデータ処理装置、またはその他のデバイスに読み込まれ、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で一連の動作可能なステップを実行させるものであってもよい。
【0066】
図内のフローチャートおよびブロック図は、本発明の様々な実施形態に係る、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための1つまたは複数の実行可能な命令を備える、命令のモジュール、セグメント、または部分を表してよい。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生してよい。例えば、連続して示された2つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されるか、または場合によってはそれらのブロックは逆の順序で実行されてよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組み合わせは、指定された機能または動作を実行するか、あるいは専用ハードウェアとコンピュータ命令の組み合わせを実行する専用ハードウェアベースのシステムによって実装され得るということにも注意する。
【0067】
[病変検出および分類AIパイプラインの概要]
【0068】
図1は、1つの例示的実施形態に係る、入力医用画像データ内の解剖学的構造の識別および病変検出を実行するように特に構成されてトレーニングされた複数のML/DLコンピュータ・モデルを実装する病変検出および分類人工知能(AI)パイプライン(本明細書では、単に「AIパイプライン」と呼ばれる)の例示的なブロック図である。単に例示の目的で、示されたAIパイプラインは、医用画像データ内の肝臓検出および肝臓病変検出を対象にしているとして特に説明される。前述したように、例示的実施形態は、そのような例示的実施形態に限定されず、医用画像技術および対応するコンピューティング・システムによって捕捉された医用画像データの画像要素で表されてよい、任意の対象の解剖学的構造およびそのような対象の解剖学的構造に関連付けられた病変に適用されてよい。例えば、例示的実施形態のメカニズムは、肺、心臓などのその他の解剖学的構造、および肺、心臓、またはその他の対象の解剖学的構造に関連付けられた病変の検出、輪郭の識別、分類などに適用されてよい。
【0069】
さらに、以下の説明が、図1に示されたレベルからAIパイプラインの概要を説明するということ、およびこの説明の後のセクションが、AIパイプラインの個別の段階に関する追加の詳細について説明するということが理解されるべきである。AIパイプラインの段階の各々は、一部の例示的実施形態では、AIパイプライン100の様々な段階において記号103によって表されているように、深層学習ニューラル・ネットワークのニューラル・ネットワークなどの、構成されてトレーニングされたML/DLコンピュータ・モデルとして実装される。これらの異なるML/DLコンピュータ・モデルは、例えば、体の部位の識別、肝臓検出、フェーズ分類、肝臓の最小量の検出、肝臓/病変検出、病変セグメント化、偽陽性除去、病変分類などの、本明細書に記載された特定のAIの動作を実行するように、特に構成されてトレーニングされる。以下の説明のこれらの追加のセクションは、様々な段階のAIの動作を実行する新しい技術、メカニズム、および手法を提供するAIパイプラインの様々な段階を実装するための特定の実施形態を示すが、全体としてAIパイプラインとの関連において、例示的実施形態の思想および範囲から逸脱することなく、その他の同等の技術、メカニズム、または手法が使用されてよいということが、理解されるべきである。これらのその他の同等の技術、メカニズム、または手法は、本説明を考慮して当業者にとって明らかであり、本発明の思想および範囲内にあるよう意図されている。
【0070】
図1に示されているように、人工知能(AI)パイプライン100は、1つの例示的実施形態に従って、示された例では1つまたは複数のデータ構造として表された入力コンピュータ断層撮影(CT)医用画像のボリュームである、入力医用画像のボリューム105を入力として受信し、次に、このボリュームが、AIパイプライン100の様々な段階によって自動的に処理され、最終的に、分類および輪郭情報、ならびに対象の解剖学的構造(例えば、示された例では、肝臓)に関する輪郭情報と共に病変のリストを含んでいる出力170を生成する。入力医用画像のボリューム105は、多くの一般に知られているか、または後で開発された、生物学的実体(すなわち、患者)の内部解剖学的構造の画像を1つまたは複数の医用画像データ構造として描画する医用画像技術および機器のいずれかを使用する、医用画像技術102によって捕捉されてよい。一部の例示的実施形態では、この入力医用画像のボリューム105は、患者の体の部分の患者の解剖学的構造の部分の2次元スライス(個別の医用画像)を含み、次に、これらのスライスが結合されてスラブ(軸に沿って厚さを有している医用画像の集団を提供するための、軸に沿ったスライスの組み合わせ)を生成し、これらのスラブが結合されて、体の部分の解剖学的構造の3次元表現(すなわち、ボリューム)を生成する。
【0071】
AIパイプライン100の第1の段階の論理110では、AIパイプライン100が、CT医用画像データの入力ボリューム105に対応する患者の体の部分を決定し(112)、対象の体の部位決定論理114によって、患者の体のこの部分が、対象の解剖学的構造に対応する患者の体の部分を表している(例えば、頭蓋スキャン、下半身スキャンなどではなく、腹部スキャンである)かどうかを判定する。この評価は、入力CT医用画像データのボリューム105(以下では、「入力ボリューム」105と呼ばれる)のみに関するAIパイプライン100の使用に対して初期フィルタとして動作するためであり、AIパイプライン100は、入力CT医用画像データのボリューム105に対して、解剖学的構造の識別および輪郭形成、ならびに病変の識別、輪郭形成、および分類を実行するように特に構成されてトレーニングされる。入力ボリューム105内で表された体の部位のこの検出は、医用画像スキャンを実行するときにソース医用画像技術コンピューティング・システム102によって指定されてよい、スキャンされた患者の体の領域を指定するフィールドを含んでよい、入力ボリューム105に関連付けられたメタデータを参照してよい。代替として、AIパイプライン100の第1の段階の論理110は、患者の体の特定の部分に関して医用画像分類を実行する体の部位検出112のために特に構成されてトレーニングされたML/DLコンピュータ・モデルを実装してよく、この医用画像分類は、入力ボリューム105の医用画像データに対してコンピュータ化されたパターン解析を実行し、患者の体の1つまたは複数の既定の部分に関して、医用画像データの分類を予測する。一部の例示的実施形態では、この評価は、二値(例えば、腹部の医用画像ボリュームであるか、またはそうでないか)であってよく、または例えば複数の異なる体の部位(例えば、腹部、頭蓋、下肢など)の分類に関して確率またはスコアを特に識別する、さらに複雑な複数のクラスの評価であってよい。
【0072】
AIパイプライン100の第1の段階の論理110の対象の体の部位決定論理114が、入力ボリューム105が、対象の解剖学的構造が検出され得る患者の体の部分(例えば、肝臓が検出され得る体の腹部)を表していないということを決定した場合、AIパイプライン100の処理が中断されてよい(拒否の事例)。AIパイプライン100の第1の段階の論理110の対象の体の部位決定論理114が、入力ボリューム105が、対象の解剖学的構造が検出され得る患者の体の部分を表しているということを決定した場合、後で説明されるように、AIパイプライン100による入力ボリューム105の処理がさらに実行される。一部の例示的実施形態では、患者の体の異なる部位に存在することがある異なる解剖学的構造に対応する入力ボリューム105を処理するようにそれぞれ構成されてトレーニングされた、AIパイプライン100の複数の異なるインスタンスが提供されていてよいということが、理解されるべきである。したがって、第1の段階の論理110は、AIパイプライン100の外部で提供されてよく、入力ボリューム105を、特定の分類の入力ボリューム105を処理するように特に構成されてトレーニングされた対応するAIパイプライン100にルーティングするためのルーティング論理として動作してよく、例えば、あるAIパイプラインのインスタンスが肝臓および肝臓病変の検出/分類用であり、別のAIパイプラインのインスタンスが肺および肺病変の検出/分類用であり、第3のAIパイプラインのインスタンスが心臓および心臓病変の検出/分類用である、などとなる。したがって、第1の段階の論理110はルーティング論理を含んでよく、ルーティング論理は、どのAIパイプラインのインスタンス100が異なる体の部位/対象の解剖学的構造に対応するかというマッピングを格納し、入力ボリューム105内で表された体の部位の検出に基づいて、入力ボリューム105を、検出された体の部位に対応する入力ボリューム105を処理するように特に構成されてトレーニングされた対応するAIパイプラインのインスタンス100に自動的にルーティングすることができる。
【0073】
入力ボリューム105が、対象の解剖学的構造が存在する患者の体の部位を表している(例えば、肝臓病変検出の目的で、腹部スキャンが入力ボリューム105に存在する)ことが検出されたと仮定すると、第2の段階の論理120において、AIパイプライン100によって入力ボリューム105の処理がさらに実行される。この第2の段階の論理120は、望ましい実装に応じて、実質的に互いに並行して、または順番に、あるいはその両方で実行されてよい2つの初期の下位段階122および124を含んでいる(図1では、一例として並行した実行が表されている)。2つの初期の下位段階122、124は、フェーズ分類下位段階122および解剖学的構造検出下位段階124(例えば、AIパイプライン100が肝臓病変検出を実行するように構成されている場合は、肝臓検出下位段階124)を含む。
【0074】
フェーズ分類下位段階122は、入力ボリューム105が単一の撮像フェーズ(例えば、造影前フェーズ、動脈造影フェーズ、門脈/静脈造影フェーズ、遅延フェーズなど)を含んでいるかどうかを判定する。やはり、フェーズ分類下位段階122は、医用画像の撮像を実行するときに医用画像技術コンピューティング・システム102によって生成されてよい、医用画像と一致する医用画像研究のフェーズを指定するフィールドを含んでいることがある入力ボリューム105に関連付けられたメタデータを評価する論理として実装されてよい。代替として、例示的実施形態は、医用画像研究の異なるフェーズを示す医用画像のパターンを検出するように特にトレーニングされた、構成されてトレーニングされたML/DLコンピュータ・モデルを実装してよく、それによって、入力ボリューム105の医用画像がどのフェーズに対応するかについて、これらの医用画像を分類してよい。フェーズ分類下位段階122の出力は、入力ボリューム105が1つのフェーズまたは複数のフェーズを含んでいるかどうかを示す二値であってよく、あるいは入力ボリューム105内で表されたフェーズの各々の分類であってよく、その後、単一のフェーズまたは複数のフェーズが表されているかどうかを判定するために使用され得る。
【0075】
フェーズ分類が、単一のフェーズが入力ボリューム105に存在するということを示している場合、後で説明されるように、AIパイプライン100によって、下流の段階130~170を通る処理がさらに実行される。複数のフェーズが検出された場合、入力ボリューム105は、AIパイプライン100によってさらに処理されないか、あるいは前述したように、サブボリュームにフィルタリングされるか、もしくは分割されるか、またはその両方であってよく、各サブボリュームは、ターゲットフェーズに対応する1つのサブボリュームのみがAIパイプライン100によって処理されるか、またはサブボリュームが、特定のフェーズ分類に対応する画像の入力ボリュームを処理するように構成されてトレーニングされた対応するAIパイプラインにルーティングされるか、あるいはその両方が実行されるように、対応する単一のフェーズの画像を含む。いくつかの理由(例えば、肝臓が画像に存在しない、単一のフェーズの入力ボリュームでない、十分な肝臓が画像に存在しないなど)によって入力ボリュームが拒否され得るということが、理解されるべきである。拒否の実際の根本的原因に応じて、ユーザ・インターフェースなどを介して、拒否の原因がユーザに伝達されてよい。例えば、拒否に応答するAIパイプライン100の出力は、拒否の理由を示してよく、出力を介して拒否の理由を伝達するために、下流コンピューティング・システム(例えば、ビューアまたは追加の自動化された処理システム)によって利用されてよい。例えば、入力ボリューム内で肝臓が検出されなかった場合、例えば拒否をユーザに伝達せずに、入力ボリュームが黙って無視されてよく、一方、肝臓を含んでいるが、複数のフェーズの入力ボリュームを含んでいる入力ボリュームの場合、ビューアの下流コンピューティング・システムによって生成されたユーザ・インターフェースにおいて、例えば、入力ボリュームが2つ以上のフェーズの画像を含んでいることに起因して、如何なる検出結果も含んでいない入力ボリュームと間違われないようにするために、入力ボリュームがAIパイプライン100によって処理されなかったということを明確に述べることによって、拒否がユーザ(例えば、放射線科医)に伝達されてよい。
【0076】
第2の初期の下位段階124は、入力ボリューム105の部分において対象の解剖学的構造(この実施形態例では、肝臓)を検出するための検出下位段階である。すなわち、対象の解剖学的構造(肝臓)を特に示している入力ボリューム105内のスライス、スラブなどが識別され、既定の最小量の対象の解剖学的構造(肝臓)がこれらのスライス、スラブ、または入力ボリュームに全体として存在するかどうかを判定するために、評価される。前述したように、検出下位段階124は、コンピュータ医用画像解析を実行して、対象の解剖学的構造(例えば、人間の肝臓)に対応する入力医用画像の部分を識別するように、特にトレーニングされて構成されたML/DLコンピュータ・モデル125を含む。
【0077】
したがって、肝臓検出下位段階124で、AIパイプライン100は、トレーニング済みML/DLコンピュータ・モデル125を使用して、入力CT医用画像のボリュームが肝臓を示している画像を含んでいるかどうかを判定する。肝臓を示しているボリュームの部分が、フェーズ分類下位段階122の結果と共に、AIパイプライン100の単一フェーズ決定論理127および構造最小量決定論理128を含んでいる決定下位段階126に渡され、フェーズ決定論理127は、医用画像の単一のフェーズが存在するかどうかを判定し、構造最小量決定論理128は、少なくとも既定の量の対象の解剖学的構造が、対象の解剖学的構造(例えば、肝臓)を示しているボリュームの部分に存在するかどうかを判定する。前述したように、既定の量の対象の解剖学的構造が存在するかどうかの判定は、例えば画像内の画素位置の差異から構造のサイズを計算して、医用画像から構造の測定値を決定し、これらの測定値を1つまたは複数の既定のしきい値と比較し、最小量の対象の解剖学的構造(例えば、肝臓)が入力ボリューム105に存在するかどうか(例えば、肝臓の1/3が、例えば肝臓を示していると決定された入力ボリューム105の部分に存在するかどうか)を判定する、既知の測定メカニズムに基づいて決定されてよい。
【0078】
1つの例示的実施形態では、既定の量の対象の解剖学的構造(肝臓)が入力ボリューム105に存在するかどうかを判定するために、前述した軸方向スコア・メカニズムが使用され、入力ボリューム105に存在する解剖学的構造の部分を評価してよい。前述したように、ML/DLコンピュータ・モデルは、入力ボリューム105のMSSVスライスおよびMISVスライスのスライス・スコアにそれぞれ対応するスライス・スコアssupおよびsinfを推定するように構成されてトレーニングされてよい。一部の例示的実施形態では、スライス・スコアssupおよびsinfは、まず、入力ボリューム105をセクションに分割し、次に、セクションごとに、構成されてトレーニングされたML/DLコンピュータ・モデルをセクションのスライスに対して実行して、セクション内の最初のスライスおよび最後のスライスのスライス・スコアs'supおよびs'infを推定することによって、間接的に検出されてよい。s'supおよびs'infの推定値を前提として、入力CT医用画像のボリューム全体に対してセクションがどのように位置しているかが分かっているため、外挿によってssupおよびsinfの推定値が検出される。入力ボリューム105ごとに、ssupおよびsinfのn個の推定値が存在するということに注意するべきであり、nはボリュームごとのセクションの数である。1つの例示的実施形態では、これらのn個の推定値の非加重平均を取ることによって、最終的な推定値が取得されるが、他の例示的実施形態では、n個の推定値の他の関数を使用して、最終的な推定値が生成されてよい。
【0079】
入力CT医用画像のボリュームのssupおよびsinfの最終的な推定値を決定し、これらの値に基づいて、対象の解剖学的構造(例えば、肝臓)の断片が計算される。次に、この計算された断片は、既定の最小量の対象の解剖学的構造が入力CT医用画像のボリュームに存在する(例えば、肝臓の少なくとも1/3が入力CT医用画像のボリュームに存在する)かどうかを判定するために、既定のしきい値と比較されてよい。
【0080】
決定論理127および128の決定が、複数のフェーズが存在するか、または既定の量の対象の解剖学的構造が、肝臓を示している入力ボリューム105の部分に存在しないか、あるいはその両方であることを示している場合、段階130~170に関するAIパイプライン100による入力ボリューム105のそれ以上の処理が中断されてよい(すなわち、入力ボリューム105が拒否される)。決定論理127および128の決定が、入力ボリューム105が単一のフェーズの画像を含んでおり、少なくとも既定の量の肝臓が示されているということの決定に終わった場合、解剖学的構造を示している入力ボリューム105の部分が、処理のためにAIパイプライン100の次の段階130に転送される。この例示的実施形態は、さらに処理するために、肝臓を含んでいる入力ボリュームの下位部分を転送するが、他の例示的実施形態では、肝臓の周囲の背景が提供されてもよく、これは、既定の量のマージンを選択された肝臓領域の上下に追加することによって実行され得る。その後の処理動作によって必要とされる背景の量に応じて、マージンは、元の入力ボリュームの範囲全体まで増やされ得る。
【0081】
AIパイプライン100の次の段階130では、AIパイプライン100が、対象の解剖学的構造(例えば、肝臓)を表している入力ボリューム105の部分に対して、病変検出を実行する。AIパイプライン100のこの肝臓/病変検出段階130は、ML/DLコンピュータ・モデル132~136の集団を使用して、入力ボリューム105内で表された肝臓および肝臓内の病変を検出する。ML/DLコンピュータ・モデル132~136の集団は、異なってトレーニングされたML/DLコンピュータ・モデル132~136を使用して、肝臓および病変検出を実行し、ML/DLコンピュータ・モデル132~136は、病変検出における偽陽性および偽陰性の釣り合いを取るように、損失関数を使用してトレーニングされている。さらに、集団のML/DLコンピュータ・モデル132~136は、第3の損失関数がML/DLコンピュータ・モデル132~136の出力を互いに強制的に一致させるように、構成される。
【0082】
1つの例示的実施形態では、構成されてトレーニングされたML/DLコンピュータ・モデル132は、入力ボリューム105に対して実行され、肝臓の存在を検出する。このML/DLコンピュータ・モデル132は、前のAIパイプラインの段階120において採用されたML/DLコンピュータ・モデル125と同じであってよく、したがって、前に取得された結果が利用されてよい。複数の(2つ以上の)他のML/DLコンピュータ・モデル134~136が、肝臓を示している入力ボリューム105の医用画像の部分において病変検出を実行するように、構成されてトレーニングされる。第1のML/DLコンピュータ・モデル134は、入力ボリューム105に対して直接動作し、病変予測を生成するように、構成されてトレーニングされる。第2のML/DLコンピュータ・モデル136は、2つの異なる損失関数を実装する2つの異なるデコーダを使用して構成され、1つの損失関数は、偽陰性(すなわち、病変が存在しないということ(正常な解剖学的構造)を誤って示す分類)における誤差にペナルティを科し、もう1つの損失関数は、偽陽性結果(すなわち、病変が存在するということ(異常な解剖学的構造)を誤って示す分類)における誤差にペナルティを科す。ML/DLコンピュータ・モデル136の第1のデコーダは、多数の偽陽性が存在するという犠牲を払って、相対的に多くの異なる病変を表すパターンを識別するようにトレーニングされる。ML/DLコンピュータ・モデル136の第2のデコーダは、病変の検出に対する感度が低くなるようにトレーニングされるが、検出された病変は、正確に検出されている可能性が非常に高い。ML/DLコンピュータ・モデルの集団の第3の損失関数は、ML/DLコンピュータ・モデル136のデコーダの結果を全体として互いに比較し、それらの結果を互いに強制的に一致させる。第1のML/DLコンピュータ・モデル134および第2のML/DLコンピュータ・モデル136の病変予測結果が結合されて、集団の最終的な病変予測を生成し、一方、肝臓マスクの予測を生成する他のML/DLコンピュータ・モデル132は、肝臓およびその輪郭を表す出力を提供する。これらのML/DLコンピュータ・モデル132~136の例示的なアーキテクチャが、図6に関して後でさらに詳細に説明される。
【0083】
AIパイプライン100の肝臓/病変検出段階130の結果は、肝臓の1つまたは複数の輪郭(輪郭線)、および検出された病変135に対応する医用画像データ要素の部分を識別する検出マップ(例えば、入力ボリューム105内で検出された肝臓病変のボクセルごとのマップ)を含む。次に、検出マップがAIパイプライン100の病変セグメント化段階140に入力される。病変セグメント化段階140は、後でより詳細に説明されるように、流域技術および対応するML/DLコンピュータ・モデル142を使用して検出マップを分割し、入力ボリューム105の医用画像(スライス)の画像要素(例えば、ボクセル)の分割を生成する。肝臓病変セグメント化段階140は、この分割に基づいて入力ボリューム105のスライスに存在する病変に対応する輪郭のすべてを識別し、3次元内でどの輪郭が同じ病変に対応するかを識別するための動作を実行する、ML/DLコンピュータ・モデル144などの他のメカニズムを提供する。病変セグメント化段階140は、相互に関連付けられた病変輪郭を集約して病変の3次元分割を生成する、ML/DLコンピュータ・モデル146などのメカニズムをさらに提供する。病変セグメント化は、各病変に個別に焦点を合わせ、能動的輪郭解析を実行するために、医用画像内で表された病変画像要素(例えば、ボクセル)および肝臓以外の組織のインペインティングを使用する。このようにして、医用画像内の他の病変に起因して解析にバイアスをかけることも、肝臓の外側の画像の部分に起因して解析にバイアスをかけることもなく、個別の病変が識別され、処理されてよい。
【0084】
病変セグメント化140の結果は、入力ボリューム105内の対応する輪郭線または輪郭を含む病変のリスト148である。これらの出力148は、AIパイプライン100の偽陽性除去段階150に提供される。偽陽性除去段階150は、二重の動作点の戦略を使用する構成されてトレーニングされたML/DLコンピュータ・モデルを使用して、AIパイプライン100の病変セグメント化段階140によって生成された病変のリスト内の偽陽性の病変検出を削減する。第1の動作点は、できるだけ多くの病変を除去するように偽陽性除去段階150のML/DLコンピュータ・モデルを構成することによって、偽陽性に対して感度が高くなるように選択される。偽陽性の高感度の除去の後に、既定の数以下の病変がリストに残っているかどうかに関する判定が行われる。残っている場合、偽陽性に対する感度が相対的に低い第2の動作点を使用して、除去されたリスト内の他の病変が再検討される。両方の手法の結果は、AIパイプラインの病変分類段階によってさらに処理される最終的なフィルタリングされた病変のリストを識別する。
【0085】
病変セグメント化段階140によって生成された病変およびそれらの輪郭のリストから偽陽性を除去した後に、結果として得られた病変のフィルタリングされたリスト155が、AIパイプライン100の病変分類段階160に入力として提供され、構成されてトレーニングされたML/DLコンピュータ・モデルが、病変およびそれらに対応する輪郭データのリストに対して実行され、それによって、病変を複数の既定の病変分類のうちの1つに分類する。例えば、最終的なフィルタリングされた病変のリスト内の各病変およびその属性(例えば、輪郭データ)は、病変分類段階160のトレーニング済みML/DLコンピュータ・モデルに入力されてよく、その後、トレーニング済みML/DLコンピュータ・モデルは、このデータに対して動作し、病変を病変の特定の既定の種類またはクラスとして分類する。
【0086】
AIパイプライン100の病変分類段階160による病変の分類の後に、AIパイプライン100は、病変およびそれらの分類の完成したリストを含んでいる出力170を、病変の任意の輪郭属性と共に生成する。さらに、AIパイプライン100の出力170は、肝臓/病変検出段階130から取得された肝臓の肝臓輪郭情報を含んでもよい。このAIパイプライン100によって生成された出力は、対象の解剖学的構造および解剖学的構造に存在する任意の検出された病変の表現のさらなる処理および生成のために、さらに下流コンピューティング・システム180に提供されてよい。例えば、入力ボリュームのグラフィック表現が、下流コンピューティング・システム180の医用画像ビューアまたはその他のコンピュータ・アプリケーションにおいて生成されてよく、解剖学的構造および検出された病変は、AIパイプラインによって生成された輪郭情報を使用して、グラフィック表現に重ね合わせられるか、またはその他の方法で強調される。他の例示的実施形態では、下流コンピューティング・システム180による下流の処理は、病変、分類、および輪郭の検出されたリストに基づく診断意思決定支援動作、自動化された医用画像レポート生成を含んでよい。他の例示的実施形態では、病変の分類に基づいて、医師による確認および検討のために、異なる治療推奨が生成されてよい。一部の例示的実施形態では、病変、それらの分類、および輪郭のリストが、患者識別子に関連する下流コンピューティング・システム180の履歴データ構造に格納されてよく、同じ患者に関連付けられた異なる入力ボリューム105に対するAIパイプライン100の複数の実行を格納し、時間をかけて評価できるようにする。例えば、患者の病気または医学的状態の進行を評価し、そのような情報を医療専門家に提示して、患者の治療を支援するために、病変のリストまたはそれらに関連付けられた分類あるいはその両方と輪郭の間の差異が決定されてよい。例示的実施形態のAIパイプライン100によって生成された特定の解剖学的構造および病変検出情報のその他の下流コンピューティング・システム180および処理が、本発明の思想および範囲から逸脱することなく実装されてよい。
【0087】
図2は、1つの例示的実施形態に係る、AIパイプラインの例示的な動作の概要を示す例示的なフローチャートである。図2で概説される動作は、図1に示されている、この説明の以下の別々のセクションにおいて後で説明される特定の実施形態例を使用して上で説明された、構成されてトレーニングされたML/DLコンピュータ・モデルを含んでいる論理の様々な段階によって、実装されてよい。この動作が、自動化されたコンピュータ・ツールのメカニズムを実装するように特に構成された1つまたは複数のコンピューティング・デバイスを含んでいる1つまたは複数のデータ処理システムにおいて実装された自動化された人工知能パイプラインを特に対象にしているということが、理解されるべきである。図1および2のこの概説される動作には、医用画像のボリュームの作成時、および下流コンピューティング・システムからの出力の使用以外に、人間の介入がない。本発明は、説明された動作を実行するように改良された、自動化された人工知能コンピューティング・メカニズムを特に提供し、これらの動作は、以前の如何なる手動のプロセスとも特に異なる、本発明の改良された人工知能コンピューティング・メカニズムを自動化されたコンピューティング・ツールにおいて実装できるようにする論理およびデータ構造を提供することを特に対象にする、新しい改良されたプロセスを提供することによって、人間とのやりとりを回避し、以前の手動のプロセスに起因する潜在的な誤差を低減する。
【0088】
図2に示されているように、動作は、医用画像技術コンピューティング・システム(例えば、コンピュータ断層撮影(CT)医用画像を提供するコンピューティング・システム)から医用画像の入力ボリュームを受信することから開始する(ステップ210)。AIパイプラインは、受信された入力ボリュームに対して動作して体の部位検出を実行し(ステップ212)、対象の体の部位が受信された入力ボリュームに存在するかどうかに関する判定を実行できるようにする(ステップ214)。対象の体の部位(例えば、肝臓病変の検出および分類の場合は腹部)が入力ボリュームに存在しない場合、動作が終了する。対象の体の部位が入力ボリュームに存在する場合、フェーズ分類および最小解剖学的構造評価が、連続的にまたは並行して実行される。
【0089】
すなわち、図2に示されているように、入力ボリュームに対してフェーズ分類が実行され(ステップ216)、入力ボリュームが医用画像の単一のフェーズ(例えば、造影前の撮像、部分的造影の撮像、遅延フェーズなど)または複数のフェーズの医用画像(スライス)を含んでいるかどうかを判定する。次に、フェーズ分類が単一のフェーズまたは複数のフェーズのいずれを示しているかどうかに関する判定が行われる(ステップ218)。入力ボリュームが複数のフェーズを対象にする医用画像を含んでいる場合、動作が終了し、そうではなく入力ボリュームが単一のフェーズを対象にする医用画像を含んでいる場合、動作がステップ220に進む。
【0090】
ステップ220で、最小量の解剖学的構造が入力ボリュームに存在するかどうかを判定し、AIパイプラインの動作のその後の段階を正確に実行できるようにするために、対象の解剖学的構造(例えば、示されている例では肝臓)の検出が実行される。最小量の解剖学的構造が存在する(例えば、肝臓の少なくとも1/3が入力ボリューム内で表されている)かどうかに関する判定が行われる(ステップ222)。最小量が存在しない場合、動作が終了し、そうでない場合、動作がステップ224に進む。
【0091】
ステップ224で、肝臓/病変検出が実行されて、病変の輪郭および検出マップを生成する。これらの輪郭および検出マップが病変セグメント化論理に提供され、病変セグメント化論理は、これらの輪郭および検出マップに基づいて病変セグメント化(例えば、図に示された例では肝臓病変セグメント化)を実行する(ステップ226)。病変セグメント化は、病変およびそれらの輪郭のリスト、ならびに解剖学的構造(例えば、肝臓)の検出および輪郭の情報の生成をもたらす(ステップ228)。病変およびそれらの輪郭のこのリストに基づいて、偽陽性除去動作がリスト内の病変に対して実行されて、偽陽性を除去し、フィルタリングされた病変およびそれらの輪郭のリストを生成する(ステップ230)。
【0092】
フィルタリングされた病変およびそれらの輪郭のリストが病変分類論理に提供され、病変分類論理は、病変分類を実行し、病変、それらの輪郭、および病変分類の完成したリストを生成する(ステップ232)。この完成したリストが、肝臓輪郭情報と共に下流コンピューティング・システムに提供され(ステップ234)、下流コンピューティング・システムは、この情報に対して動作し、医用画像表示を医用画像ビューア・アプリケーションに生成すること、検出された病変の分類に基づいて治療推奨を生成すること、異なる時点でAIパイプラインによって生成された病変の完成したリストの比較に基づいて、同じ患者の時間の経過に伴う病変の過去の進行を評価することなどを実行してよい。
【0093】
したがって、上で概説された例示的実施形態は、医用画像の入力ボリュームに対して動作し、偽陽性を最小限に抑えながら病変、それらの輪郭、および分類のリストを生成する、自動化された人工知能メカニズムおよびML/DLコンピュータ・モデルを提供する。例示的実施形態は、入力ボリュームの画像のボクセルの所与のセットにおいて、複数のボクセルのうちのどのボクセルが対象の解剖学的構造(例えば、肝臓)の部分に対応するか、およびそれらのボクセルのうちのどのボクセルが、対象の解剖学的構造内の病変(例えば、肝臓病変)に対応するかを特に識別する、自動化された人工知能コンピュータ・ツールを提供する。例示的実施形態は、例示的実施形態が、臨床医のワークフロー内で完全に自動化されたコンピュータ・ツールに統合され得るという点において、手動および自動の両方で、以前の手法を超える明確な改善を提供する。実際には、単一のフェーズ(例えば、腹部スキャン)のみの入力ボリュームを受け入れ、対象の解剖学的構造(例えば、肝臓)を示していないか、または既定の量の対象の解剖学的構造を示していない(例えば、少なすぎる量の肝臓)入力ボリュームを拒否する例示的実施形態のAIパイプライン設計の初期段階に基づいて、自動化されたAIパイプラインによって意味のある入力ボリュームのみが処理され、それによって、放射線科医が、対象の解剖学的構造以外の入力ボリュームを確認する場合(例えば、肝臓以外の場合)に貴重な手動のリソースを役に立たない結果または誤った結果に費やすのを防ぐ。役に立たない情報を大量に放射線科医に送るのを防ぐことに加えて、例示的実施形態の自動化されたAIパイプラインは、対象の解剖学的構造に対応していない場合に関連付けられたデータ、または十分な量の対象の解剖学的構造を提供できない場合に関連付けられたデータによるAIパイプラインおよび下流コンピューティング・システム(ネットワーク、アーカイブ、および確認コンピューティング・システムなど)の混雑を回避することによって、情報技術の円滑な統合も保証する。さらに、前述したように、例示的実施形態の自動化されたAIパイプラインは、完全に自動化された方法で病変の正確な検出、測定、および特徴付けを可能にし、これは、例示的実施形態のうちの1つまたは複数の自動化されたAIパイプラインの構造およびそれに対応する自動化されたML/DLコンピュータ・モデルに基づくコンポーネントによって技術的に可能になる。
【0094】
入力ボリュームに存在する最小量の解剖学的構造を検出するためのML/DLコンピュータ・モデル
【0095】
前述したように、入力ボリューム105の処理の一部として、入力ボリューム105が医用画像の単一のフェーズを表していること、および少なくとも最小量の対象の解剖学的構造が入力ボリューム105内で表されていることを保証することが、重要である。最小量の対象の解剖学的構造が入力ボリューム105に存在するかどうかを判定するために、1つの例示的実施形態では、決定論理128が、入力ボリューム105に存在する解剖学的構造(例えば、肝臓)の部分を決定するためにスライス・スコアを推定する、特に構成されてトレーニングされたML/DLコンピュータ・モデルを実装する。以下では、定義された軸方向スコア技術に基づいて、この構成されてトレーニングされたML/DLコンピュータ・モデルの実施形態例について説明する。
【0096】
図3Aは、1つの例示的実施形態に係る、人間の患者の腹部の例示的な入力ボリューム(医用画像)を示す例示的な図である。図3Aの描写では、3次元ボリュームの2次元表現が示されている。スライスは、図3Aに示されている2次元表現内では水平線であるが、ページ内に、またはページの外に、あるいはその両方に広がる平面として表されて、人体の平坦化された2次元スライスを表し、これらの平面の積み重ねが3次元画像になる。
【0097】
図3Aに示されているように、例示的実施形態は、0~1の範囲にわたるスライスの軸方向スコアを定義する。軸方向スコアは、肝臓を含んでいる最初のスライス(FSL)に対応するスライスが0のスライス・スコアを有し、肝臓を含んでいる最後のスライス(LSL)に対応するスライスが1のスコアを有するように定義される。図に示された例では、最初のスライスおよび最後のスライスは、ボリューム内の最下位スライス(MISV)およびボリューム内の最上位スライス(MSSV)に関連して定義され、下位および上位は、ボリュームの所与の軸(例えば、図3Aに示されている例では、y軸)に沿って決定される。したがって、この示された例では、MSSVが最も高いy軸の値を有するスライスであり、MISVが最も低いy軸の値を有するスライスである。例えば、MISVは、生物学的実体の下肢(例えば、人間被験者の足)に最も近くてよく、MSSVは、生物学的実体の上部(例えば、人間被験者の頭)に最も近くてよい。FSLは、MISVに相対的に最も近い、対象の解剖学的構造(例えば、肝臓)を示すスライスである。LSLは、MSSVに相対的に最も近い、対象の解剖学的構造を示すスライスである。1つの例示的実施形態では、トレーニング済みML/DLコンピュータ・モデル(例えば、ニューラル・ネットワーク)が、スライスのチャンクを入力として受け取り、チャンク内の中央のスライスの高さ(軸方向スコア)を出力することによって、軸方向スコアを割り当ててよい。このトレーニング済みML/DLコンピュータ・モデルは、実際の高さにおける誤差(例えば、最小二乗誤差)を最小化するコスト関数を使用してトレーニングされる。次に、このトレーニング済みML/DLコンピュータ・モデルは、入力ボリュームを覆うすべてのチャンクに適用される(場合によっては、チャンク間が多少重複している)。
【0098】
MSSVスライスおよびMISVスライスのスライス・スコアにそれぞれ対応するスライス・スコアの対(ssupおよびsinf)によって、肝臓軸方向スコア推定値(LAE)が定義される。図1の決定論理128のML/DLコンピュータ・モデルは、入力ボリューム105のスライス・スコアssupおよびsinfを決定するように特に構成されてトレーニングされ、例示的実施形態のメカニズムは、これらのスライス・スコアを認識し、入力ボリューム105の視界内で、肝臓の断片を決定することができる。
【0099】
一部の例示的実施形態では、スライス・スコアssupおよびsinfは、まず、入力ボリューム105をセクション(例えば、X個のスライス(例えば、20個のスライス)を含んでいるセクション)に分割し、次に、セクションごとに、構成されてトレーニングされたML/DLコンピュータ・モデルをセクションのスライスに対して実行して、セクション内の最初のスライスおよび最後のスライスのスライス・スコアs'supおよびs'infを推定することによって、間接的に検出されてよく、「最初」および「最後」は、3次元ボリューム105の軸に沿った進行方向(例えば、最小のy軸の値のスライスから最大のy軸の値のスライスに進む、y軸に沿った最初のスライスから最後のスライスへの進行方向)に従って決定されてよい。s'supおよびs'infの推定値を前提として、ボリューム105全体に対してセクションがどのように位置しているかが分かっているため、外挿によってssupおよびsinfの推定値が検出される。ボリュームごとに、ssupおよびsinfのn個の推定値が存在するということに注意するべきであり、nはボリュームごとのセクションの数である。1つの例示的実施形態では、これらのn個の推定値の非加重平均を取ることによって、最終的な推定値が取得されるが、他の例示的実施形態では、n個の推定値の他の関数を使用して、最終的な推定値が生成されてよい。
【0100】
例えば、図3Bは、対応する軸方向スコアs'infおよびs'supと共に表されたスライスのセクションを含む、図3Aの入力ボリュームの別の表現を示している。図3Bに示されているように、セクションは、この例では5mm離れた20個のスライスとして定義されている。ボリュームの20個のスライスのセクションごとに、ML/DLコンピュータ・モデルによってスライス・スコアs'supおよびs'infが推定され、所与の範囲(例えば、0~1の範囲、-0.5~1.2の範囲、または特定の実装に適した任意の他の望ましい既定の範囲)に沿ったこれらのs'supおよびs'infの値の外挿から、ssupおよびsinfが取得される。この例では、-0.5~1.2の既定の範囲を仮定すると、ML/DLコンピュータ・モデルおよび外挿の適用によって、ssupが約1.2であると推定され、sinfが-0.5であると推定された場合、これらの値は、肝臓全体がボリュームに含まれているということを示している。同様に、ssupが1.2であると推定され、sinfが0.5であると推定された場合、これらの値は、軸方向の肝臓の範囲の上位の約50%がボリュームに含まれるということを示しており、例えば被覆率は(1.2-0.5)/(1.2-(-0.5))=0.41である。追加の例として、肝臓が-2.0で始まって0.8で終わる(すなわち、ssupが0.8であると推定され、sinfが2.0であると推定された)別の例示的実施形態では、肝臓の上限が1.2より低いため、肝臓が上部で切り取られ、下限が-0.5より低いため、肝臓の下部が完全に覆われる。これは、軸方向の肝臓の範囲の下位の約80%がボリュームに含まれていることを示しており、すなわち被覆率は(0.8-max(-2, -0.5))/(1.2-(-0.5))=0.76である。
【0101】
図3Cは、ボリュームがn個の完全に重複するセクションに軸方向に分割された、図3Aの入力ボリュームの例示的な図である。図に示された例では、矢印で示された7つのセクションがある。この例では、最後の2つのセクション(図の上部の矢印)がほぼ完全に同じであるということに注意するべきである。前述したように、ML/DLコンピュータ・モデルによって、これらのセクションの各々に対してs'supおよびs'infの値が推定され、MSSVスライスおよびMISVスライスのssupおよびsinfの値を外挿するために使用され、ssupおよびsinfの値は、その後、入力ボリューム105に存在する対象の解剖学的構造の量を決定するために使用され得る。
【0102】
したがって、MSSVおよびMISVのssupおよびsinfの値は、最初に入力ボリューム105をセクションに分割し、次にセクションごとに、セクション内の最初のスライスおよび最後のスライスのスライス・スコアs'supおよびs'infを推定することによって、間接的に検出される。これらの推定値を前提として、入力ボリューム105全体に対してセクションがどのように位置しているかが分かっているため、ssupおよびsinfの値が外挿によって推定される。各セクションから外挿されたssupおよびsinfのn個の推定値が存在し、nはボリュームごとのセクションの数である。例えば、n個の推定値の非加重平均または任意の他の適切な組み合わせ関数などの、n個の推定値を評価する任意の適切な組み合わせ関数によって、最終的な推定値が取得されてよい。
【0103】
図4A~4Cは、1つの例示的実施形態に係る、医用画像の入力ボリュームのセクションのs'supおよびs'infの値を推定するように構成されてトレーニングされたML/DLコンピュータ・モデルの1つの例示的実施形態の例示的な図を示している。図4A~4CのML/DLコンピュータ・モデルは、ML/DLコンピュータ・モデルのアーキテクチャの一例にすぎず、本発明の思想および範囲から逸脱することなく、入力ボリュームの入力スライスのテンソル・サイズを変更すること、ML/DLコンピュータ・モデルの層内のノードの数を変更すること、層の数を変更することなどの、このアーキテクチャに対する多くの変更が行われてよい。当業者は、本説明を考慮して、例示的実施形態のML/DLコンピュータ・モデルを望ましい実装に変更する方法を認識するであろう。
【0104】
図4Aに示されているように、入力ボリューム105のセクション410または「スラブ」を表す一連の20個のスライスが、処理ブロック(PB:processing blocks)420~430に入力として提供される。示された例示的実施形態では、PB420~430は、図4Bおよび4Cに示されているように、畳み込み層およびLSTM層を混合する論理のブロックである。PB420、430の畳み込み層から特徴が抽出され、次に、これらの特徴がPB420、430のLSTM層に入力として供給される。これは、スライスが解剖学的領域または対象の解剖学的構造(例えば、腹部/肝臓)内で特定の順序を有するという事実の賢明な/軽量のモデル化の一種であり、生体構造(例えば、肝臓の生体構造自体に加えて、肝臓、腎臓、心臓などの相対位置)によって駆動される。図に示された例では、最初に、20個のスライス410のテンソル・サイズは、この例では128x128である。第1の処理ブロック420は、この実施形態例ではテンソルのサイズを8分の1に縮小して、20個のスライスのセクションを生成し(セクション内のスライスの数は実装に固有であり、本発明の思想および範囲から逸脱することなく変更され得るということが理解されるべきである)、これらのスライスは寸法16x16x32を有し、32はフィルタの数である。第2の処理ブロック430は、入力セクションのスライスを、寸法2x2x64を有するスライスを含む20個のスライスのセクションに変換し、64はフィルタの数である。平坦化層、高密度層、および線形層を使用して構成されたその後のニューラル・ネットワーク440は、入力ボリューム105の入力セクション410の推定値s'supおよびs'infを生成するように構成されてトレーニングされる。図4Bは、1つの例示的実施形態に係る、畳み込み層およびLSTM層に関して処理ブロック(PB)の組成を示しており、図4Cは、各PBのこれらの畳み込み層およびLSTM層の各々の例示的な構成を示している。
【0105】
一例として、図4A~4CのML/DLコンピュータ・モデルのアーキテクチャでは、このML/DLコンピュータ・モデルのトレーニング中に、1つの例示的実施形態では、医用画像データ(例えば、医用におけるデジタル画像と通信(DICOM:Digital Imaging and Communications in Medicine)データ)が、入力ボリューム(例えば、ハウンスフィールド単位(HU:Hounsfield Unit)の値を含む、Sx512x512のサイズ、32ビット浮動小数を有する3次元配列)に組み立てられる(ハウンスフィールド単位の値は、所与の位置(例えば、ボクセル)に提示されている材料のX線の減衰を示す正規化された物理値である)。Sは、i番目のボリューム内のスライスの数であり、iは0~N-1の範囲内であり、Nはボリュームの総数である。各入力ボリュームは、体の部位検出器によって処理され、前述したように、(肝臓検出の場合)腹部に対応する近似的領域が抽出される。腹部は、例えば、体の部位検出器からの軸方向スコア-30と23の間の連続領域として定義される。この連続領域の外部のスライスは拒否され、グラウンド・トゥルースが、適切に調整されたFSLおよびLSLの位置として定義されてよい。例えば、入力ボリュームの範囲がa~bであると仮定すると、[a:b]と[-30,23]の間に重複がない場合、入力ボリュームが拒否される。言い換えると、b>23またはa<-30の場合である。
【0106】
入力セクション410または「スラブ」が、既定のスライスの分離(例えば、5mm)に再びスライスされる。入力セクション410が、x、y次元で128x128に再形成され、形状Mx128x128のN個のセクション410が得られる。これは、入力ボリューム内のデータのダウンサンプリングと呼ばれる。入力ボリューム内のスライスの順序付けは大まかな情報(例えば、臓器のサイズ)に頼るため、AIパイプラインは、ダウンサンプリングされたデータに対してまだ十分に動作し、ダウンサンプリングされたデータのサイズが縮小するため、AIパイプラインの処理時間およびトレーニング時間が両方とも改善される。
【0107】
既定の数(例えば、20個)未満のスライスを含んでいるか、または既定の画素サイズ(例えば、55mm)未満の画素サイズを有している入力セクション410が拒否され、N'個のMx128x128のセクションが得られる。セクション内の値は、クリッピングされ、取得範囲(例えば、-1024,2048)から範囲(0,1)への線形変換を使用して正規化される。この時点で、処理されたN'個のMx128x128のセクションは、前述したようにトレーニング・セットを構成し、このトレーニング・セットに対してニューラル・ネットワーク440が、入力セクションのs'supおよびs'infの推定値を生成するようにトレーニングされる。
【0108】
トレーニング済みニューラル・ネットワーク440を使用して推論を実行することに関しては、体の部位検出、対象の体の部位に対応するスライスの選択、再スライス、再形成、既定の要件を満たさない特定のセクションの拒否、およびクリッピングされて正規化されたセクションの生成によって入力ボリューム105を処理するための上記の動作が、入力ボリューム105の新しいセクションに関して再び実行される。クリッピングされて正規化されたセクションの生成後に、入力ボリューム105が、20個のスライスを含んでいるR-ceil(M-10)/10個のサブボリュームまたはセクションに分割され、それによって、重複するチャンクを含むスライスの分割を生成する。例えば、N'=31個のスライスのボリューム(0~30の番号が付けられたスライス)が存在する場合、重複するスライス0~19、10~29、11~30を含んでいる3つのセクションまたはサブボリュームが定義される。セクションまたはサブボリュームは、通常、少なくとも約50%の重複を有する。
【0109】
したがって、ML/DLコンピュータ・モデルが、定義された軸方向スコアの範囲0~1を前提として、既定の数のスライス(医用画像)に対応するボリュームのセクションのs'supおよびs'infの値の推定値に基づいて入力ボリュームのssupおよびsinfの値を推定するように、提供され、構成され、トレーニングされる。これらの推定値から、入力ボリュームが、少なくとも既定の量の対象の解剖学的構造(例えば、肝臓)を一緒に構成する医用スライスを含んでいるかどうかに関する判定が行われ得る。この判定は、前述したように、AIパイプライン100のさらに下流の段階において正確な肝臓/病変検出、病変セグメント化などを可能にするために、解剖学的構造の十分な表現が入力ボリューム105に存在するかどうかを判定するための、AIパイプライン100の決定論理128の一部であってよい。
【0110】
図5は、1つの例示的実施形態に係る、AIパイプラインの肝臓検出および既定の量の解剖学的構造決定論理の例示的な動作の概要を示すフローチャートである。図5に示されているように、AIパイプラインの肝臓検出動作が、入力ボリュームを受信することから開始し(ステップ510)、入力ボリュームを、セクションごとの既定の数のスライスの複数の重複するセクションに分割する(ステップ520)。セクションごとのスライスが、各セクション内の最初のスライスおよび最後のスライスの軸方向スコアを推定するトレーニング済みML/DLコンピュータ・モデルに入力される(ステップ530)。最初のスライスおよび最後のスライスの軸方向スコアが、入力ボリュームのボリューム内の最下位スライス(MISV)およびボリューム内の最上位スライス(MSSV)のスコアに外挿するために使用される(ステップ540)。これによって、MISVおよびMSSVの軸方向スコアの複数の推定値が得られ、次にこれらの推定値が、個別の推定値の関数によって結合され、それによって、入力ボリュームのMISVおよびMSSVの軸方向スコアの推定値を生成する(例えば、加重平均など)(ステップ550)。MISVおよびMSSVの軸方向スコアの推定値に基づいて、軸方向スコアが、既定の量の対象の解剖学的構造(例えば、肝臓)が入力ボリュームに存在するかどうかを判定するための基準と比較される(ステップ560)。その後、動作が終了する。
【0111】
[肝臓/病変検出]
【0112】
前述したように、入力ボリューム105が単一フェーズを表すと決定され、入力ボリューム105が入力ボリューム105のスライスにおいて、既定の量の対象の解剖学的構造を表すと決定されていると仮定すると、対象の解剖学的構造を含む入力ボリューム105の部分に対して、肝臓/病変検出が行われる。1つの例示的実施形態では、AIパイプライン100の段階130の肝臓/病変検出論理では、入力ボリューム105のスライスにおいて対象の解剖学的構造(例えば、肝臓)を検出するように動作する、構成されてトレーニングされたML/DLコンピュータ・モデル(また、一部の例示的実施形態では、これは、肝臓検出のために段階120で使用されるのと同じML/DLコンピュータ・モデル125であり得る)を採用する。AIパイプライン100の段階130の肝臓/病変検出論理は、対象の解剖学的構造(肝臓)の画像において病変を検出するように構成され、トレーニングされた複数の他のML/DLコンピュータ・モデルの集団も含む。
【0113】
図6は、1つの例示的実施形態に係る、対象の解剖学的構造(例えば、肝臓)において病変検出を実行するのに使用されるML/DLコンピュータ・モデルの集団の例示的な図である。ML/DLコンピュータ・モデルの集団600は、対象の解剖学的構造、例えば肝臓を検出し、対応するマスクを生成するための第1のML/DLコンピュータ・モデル610を含む。ML/DLコンピュータ・モデルの集団600は、第2のML/DLコンピュータ・モデル620も含み、この第2のML/DLコンピュータ・モデル620は、第2のML/DLコンピュータ・モデル620の2つのデコーダにおいて実装された2つの競合する損失関数を使用して、肝臓マスク入力を処理し、病変予測を生成するように構成されてトレーニングされる。一方の損失関数は、偽陽性誤差にペナルティを科すように構成され(低感度をもたらすが、高精度)、他方は、偽陰性誤差にペナルティを科すように構成されている(高感度をもたらすが、低精度)。図6において一貫性の損失627と呼ばれる追加の損失関数が、第2のML/DLコンピュータ・モデル620に採用され、2つの競合するデコーダによって生成された出力を互いに同様な(一貫性のある)ものにさせる。ML/DLコンピュータ・モデルの集団は、入力ボリューム105を直接処理し、病変予測を生成するように構成されてトレーニングされた第3のML/DLコンピュータ・モデル630も含む。
【0114】
図6に示され、前述したように、集団600は、具体的には、入力医用画像において、対象の解剖学的構造を識別するように構成されてトレーニングされた第1の構成されてトレーニングされたML/DLコンピュータ・モデル610を含む。一部の例示的実施形態では、この第1のML/DLコンピュータ・モデル610は、画像解析を実行して医用画像内で肝臓を検出するように構成されてトレーニングされたU-Netニューラル・ネットワーク・モデル612を含むが、例示的実施形態が、この特定のニューラル・ネットワーク・モデルに限定されず、セグメント化を実行することができる如何なるML/DLコンピュータ・モデルも、本発明の思想および範囲から逸脱することなく利用され得ることが理解されるべきである。U-Netは、ドイツにあるフライブルグ大学のコンピュータ・サイエンス学部において医用生体画像のセグメント化に展開される畳み込みニューラル・ネットワークである。U-Netニューラル・ネットワークは、アーキテクチャが、より少ないトレーニング画像で働くように、またより正確なセグメント化をもたらすように修正され、拡張された完全畳み込みネットワークに基づいている。U-Netは、当技術分野において一般的に知られているため、本明細書ではより詳細には説明しない。
【0115】
図6に示されるように、1つの例示的実施形態では、第1のML/DLコンピュータ・モデル610が、その枚数が望ましい実装に適していると判定された、例えば、経験的プロセスを通して、3枚のスライスが良い結果をもたらすと判定された時点で既定の枚数のスライスを処理するようにトレーニングされ得る。例えば、他の実装では、例示的実施形態の思想および範囲から逸脱することなく異なるスライス寸法を使用することができるが、この入力ボリュームのスライスは、1つの例示的実施形態では、512x512画素医用画像であった。U-Netは、対象の解剖学的構造、例えば肝臓に対応する1つまたは複数のセグメントをもたらす、入力スライスにおいて解剖学的構造のセグメント化を生成する。第1のML/DLコンピュータ・モデル610は、このセグメント化の一環として、肝臓マスク614に相当するセグメントを生成する。この肝臓マスク614は、肝臓に対応する入力ボリューム105の入力スライスの部分のみに対するML/DLコンピュータ・モデル620による処理に焦点を合わせるために、集団600の他のML/DLコンピュータ・モデル620のうちの少なくとも1つに入力として与えられる。肝臓マスク614によりML/DLコンピュータ・モデルへの入力を前処理することによって、ML/DLコンピュータ・モデルによるこの処理は、対象の解剖学的構造に対応する入力スライスの部分に焦点を合わせられ得、入力画像における「ノイズ」には焦点を合わせられない。ML/DLコンピュータ・モデルのうちのその他は、例えばML/DLコンピュータ・モデル630は、第1のML/DLコンピュータ・モデル610によって生成された肝臓マスク614を使用して、肝臓マスク加工することなく入力ボリューム105を直接受信する。
【0116】
示された集団600の例示的実施形態では、第3のML/DLコンピュータ・モデル630が、エンコーダ・セクション634~636およびデコーダセクション638で構成されている。ML/DLコンピュータ・モデル630は、入力ボリューム105の9枚のスライス・スラブを受信し、この9枚のスライス・スラブが、今度は、それぞれ3枚のスライスのグループ631~633に分けられるように構成され、この場合、各グループ631~633は、対応するエンコーダネットワーク634~636への入力である。各エンコーダ634~636は、入力スライスに存在する様々な種類のオブジェクト(例えば、病変)を認識し、入力スライスに存在するオブジェクトの検出された種類のを示す分類出力を、例えば出力分類ベクトルなどとして出力するように予めトレーニングされている、完全に接続されたヘッドのない、DenseNet-121(D121)などの畳み込みニューラル・ネットワーク(CNN:Convolutional Neural Network)である。CNN634~636は、例えば、入力スライスの3つのチャネルに対して働くことができ、結果として生じたCNN634~636の出力特徴は、連結NHWC論理637に提供され、ここで、NHWCとは、バッチ内の画像枚数(N)、画像の高さ(H)、画像の幅(W)、および画像のチャネル個数(C)を指すものである。元のDenseNetネットワークのアーキテクチャは、3枚のスライスフル解像度入力を、より小さい解像度の多くの特徴チャネルにダウンサンプリングする、多くの畳み込み層とskip-trueの接続を含む。そこから、完全に接続されたヘッドは、すべての特徴を集約し、それらをDenseNetの最終的な出力において複数のクラスにマッピングする。DenseNetネットワークが示されたアーキテクチャではエンコーダとして使用されることから、このヘッドは、取り除かれ、ダウンサンプリングされた特徴のみが保たれる。それにより、連結NHWC論理637では、特徴チャネルのすべてが、望ましい(例えば、512x512)出力確率マップ解像度に達するまで、画像をアップサンプリングする役割を担うデコーダ段階638にそれらを移行させるように、連結されている。
【0117】
エンコーダ634~636は、トレーニング・プロセスを通して最適化された同じパラメータ、例えば、重み、トレーニング時の病変型に対するサンプリング、損失に対する重み、拡大タイプなどを共有する。ML/DLコンピュータ・モデル630のトレーニングでは、2つの異なる損失関数を使用する。主要損失関数は、グラウンド・トゥルースに病変がないスライスにおける偽陽性誤差にペナルティを科すように、またグラウンド・トゥルースに病変があるスライスにおける偽陰性誤差にペナルティを科すように具体的に構成されている適応損失である。損失関数は、以下のような改訂版のTversky損失である。各出力スライスに対して:TP=sum(prediction*target)FP=sum((1-target)*prediction)FN=sum((1-prediction)*target)LOSS=1-((TP+1)/(TP+1+alpha*FN+beta*FP))ここでは、「prediction」は、ML/DLコンピュータ・モデル630の出力確率であり、「target」は、グラウンド・トゥルース病変マスクである。出力確率値は、0~1の範囲である。targetは、スライスにおける画素ごとに0または1のいずれかの値である。それらに病変がないスライスでは、「alpha」、という用語は、小さい(例えば、ゼロ)であり、「beta」は、大きい(例えば、10)である。それらに病変があるスライスでは、「alpha」、という用語は、大きい(例えば、10)であり、「beta」は、小さい(例えば、1)である。
【0118】
第2の損失関数639は、エンコーダ634~636の出力に接続されている関数である。この損失に対する入力がML/DLコンピュータ・モデル630の中間から来ているので、それは、「深層監視」639とも呼ばれる。深層監視は、それが、エンコーダ・ニューラル・ネットワーク634~636に、トレーニング時に、入力データの表現をより良く学習するように強いることが分かっている。1つの例示的実施形態では、この第2の損失は、スライスに病変があるかどうかを予測する際の単純な平均二乗誤差である。それゆえ、マッピング・ネットワークが、9個のスライス入力のそれぞれで病変がある確率に相当する0~1の9個の値にエンコーダ634~636の出力特徴をマッピングするのに使用される。デコーダ638は、入力画像において検出された病変に対して確率マップを指定する出力を生成する。
【0119】
第2のML/DLコンピュータ・モデル620は、肝臓マスク614に対応する3枚のスライスの一部を識別するように、第1のML/DLコンピュータ・モデル610によって生成された肝臓マスク614により前処理されている、3枚のスライスの前処理済み入力を入力ボリュームから受信する。結果として生じた前処理済み入力スライス(示された例示の例示的実施形態では、サイズ192x192x3のものである)は、2つのデコーダ(デコーダが2次元ニューラル・ネットワーク層から成る、2D DECを表す)に接続されたDenseNet-169(D169)エンコーダ621を備える第2のML/DLコンピュータ・モデル620に提供される。D169エンコーダ621は、コンピュータ・ビジョン・アプリケーションに広く使用されている、ニューラル・ネットワーク特徴抽出装置である。これは、各層から抽出された特徴がフィード-フォーワード方式で任意の他の層にも接続されている一連の畳み込み層から成る。エンコーダ621において抽出された特徴は、2つの独立したデコーダ622、623に移送され、そこでは、各デコーダ622、623が、2次元畳み込み層およびアップサンプリング層(図6では2D DECと呼ばれる)で構成されている。各デコーダ622、623は、入力スライスにおいて病変(例えば、肝臓病変)を検出するようにトレーニングされる。両デコーダ622、623は、同じタスク、すなわち、病変検出を実行するようにトレーニングされるが、それらのトレーニングにおける鍵となる違いは、2つのデコーダ622、623がそれぞれ、これまでに述べ、また以下にも述べるように、2つの競合する方向に検出トレーニングを駆動するために、異なる損失関数を利用することである。第2のML/DLモデル620の最終的な検出マップが、平均演算640を用いて、第3のML/DLモデル630の最終的な検出マップと結合される。この手順は、最終的な検出マップ(例えば、肝臓病変)を生成するように、入力ボリューム105の入力スラブのすべてにわたって適用される。
【0120】
前述したように、対向する検出動作点性能を実現しようと試みる、第2のML/DLコンピュータ・モデル620が、2つの異なる損失関数を使用してトレーニングされる。すなわち、一方のエンコーダ622が、偽陰性病変検出における誤差にペナルティを科し、ひいては比較的低い精度で高感度検出を生成する、トレーニング用に損失関数を使用し、他方のエンコーダ623が、偽陽性病変検出における誤差にペナルティを科し、低感度検出ではあるが高精度の検出をもたらす、トレーニング用の損失関数を使用する。これらの損失関数の一例としては、パラメータが、1つの例示的実施形態に従って、偽陽性および偽陰性の高いまたは低いペナルティに合わせて調整されたFocal Tversky Lossを挙げることができる(Abrahamらによる「A Novel Focal Tversky Loss function with Improved Attention U-Net for Lesion Segmentation」、arXiv:1810.07842[cs]、October 2018を参照)。第3の損失関数である一貫性の損失627は、各デコーダ622、623の予測検出間の一貫性を強いるのに使用される。一貫性の損失論理627では、2つのエンコーダ622、623の出力624、625を互いに比較し、これらの出力が互いに同様であるよう強いる。この損失は、例えば、2つの予測検出間の平均二乗誤差損失、構造上類似性損失、または比較対象予測検出間に一貫性/類似性を強いる任意の他の損失でもあり得る。
【0121】
ランタイムでは、これらの対抗する動作点エンコーダ622、623を使用して、第2のML/DLコンピュータ・モデル620が、病変出力の平均値を生成するスライス平均化(SLC AVG)論理623に入力される2つの病変出力624、625を生成する。それにより、この病変出力の平均値は、比較対象の第3のML/DLコンピュータ・モデル630の出力に寸法が釣り合う出力を生成するように再度サンプリングされる(このプロセスが肝臓マスク化動作を逆戻りさせ、それによって、元の512x512x3解像度で病変出力を計算することから成ることに注意されたい)。
【0122】
ランタイムにおいて、スライス平均化(SLC AVG)論理626では、エンコーダ622、623の病変予測出力624および625に対して、ML/DLモデル620の最終的な検出マップを生成するように動作する。各デコーダ622、623を駆動して一貫性のある検出を学習させるトレーニング時に一貫性の損失627が適用されたが、ランタイムにおいて、この一貫性の損失が利用されなくなり、代わりにML/DLモデル620が、SLC AVGモジュール626によって集約される必要がある2つの検出マップを出力することが理解されるべきである。SLC AVG論理626の結果が再度サンプリングされ、入力スラブ(512x512x3)と釣り合う寸法を有する出力を生成する。入力ボリューム105のスラブごとに生成されたML/DLモデル620の検出はすべて、ボリューム平均化(VOL AVG)論理640を経て生成されたML/DLモデル630の検出と結合される。この論理では、ボクセル・レベルで2つの検出マスクの平均値を計算する。この結果は、入力ボリューム105において検出された病変に対応するFinal Lesion mask650である。
【0123】
このように、ML/DLコンピュータ・モデル620、630をトレーニングした後、新しい入力ボリューム105の新しいスライスにより提示されると、第1のML/DLコンピュータ・モデル610が、第2のML/DLコンピュータ・モデル620への入力を前処理するのに肝臓マスク614を生成し、2つのML/DLコンピュータ・モデル620、630が、入力スライスを、ボリューム平均化論理640によってそのボリュームに対して平均化される病変予測を生成するように処理する。この結果は、第1のML/DLコンピュータ・モデル610の動作に基づく肝臓マスク出力660を伴う最終的な病変出力650である。これらの出力は、上でこれまでに述べたように、また以下でより詳細に説明するように、AIパイプライン100の病変セグメント化論理段階140に提供される、AIパイプライン100の肝臓/病変検出論理段階130出力として提供され得る。このように、例示的実施形態のメカニズムは、医用画像(スライス)の入力ボリューム105における解剖学的構造識別および病変検出に集団600手法を提供する。
【0124】
図6に示されるような集団アーキテクチャにより、ML/DLコンピュータ・モデル1つのみの使用を凌ぐ向上した性能が実現される。すなわち、集団アーキテクチャの使用を通して、ML/DLコンピュータ・モデル1つのみと同じ感度レベルにおける向上した検出特異度が、集団の複数のML/DLコンピュータ・モデルの検出出力の結合を通して実現されることが観察される。すなわち、様々な場所におけるML/DLモデル620、630が犯した誤差(偽陽性)により、それらの検出出力が平均化されている場合、真陽性病変からの信号が優勢である一方で偽陽性からの信号が減り、性能向上につながる。
【0125】
図7は、1つの例示的実施形態に係る、AIパイプラインにおける肝臓/病変検出論理の例示的な動作の概要を示すフローチャートである。図7に示されるように、動作は、解剖学的構造(例えば、肝臓)を識別するように構成されてトレーニングされたU-Netコンピュータ・モデルなどの第1のトレーニング済みML/DLコンピュータ・モデルを使用して、入力ボリュームを受信し(ステップ710)、解剖学的構造検出、例えば肝臓検出を実行することによって始まる(ステップ720)。解剖学的構造検出の結果は、解剖学的構造に対するマスク(例えば、肝臓マスク)を識別するための入力ボリュームのセグメント化である(ステップ730)。この入力ボリュームは、病変検出を実行するように具体的に構成されてトレーニングされた、集団の第1のトレーニング済みML/DLコンピュータ・モデルを介しても処理される(ステップ740)。第1のトレーニング済みML/DLコンピュータ・モデルは、入力ボリュームのその処理に基づき、病変検出予測出力の第1のセットを生成する(ステップ750)。
【0126】
集団の第2のトレーニング済みML/DLコンピュータ・モデルは、生成された解剖学的構造マスクを入力ボリュームに適用することによって生成されたマスク付き入力を受信し、それにより、対象の解剖学的構造に対応する医用画像の部分を入力ボリュームにおいて識別する(ステップ760)。第2のトレーニング済みML/DLコンピュータ・モデルは、2つの異なる、競合する損失関数、例えば、偽陽性病変検出において誤差にペナルティを科すものと、偽陰性病変検出において誤差にペナルティを科すもう一つ、を有する2つの異なるデコーダを介してマスク付き入力を処理する(ステップ770)。この結果は、その後、第2のML/DLコンピュータ・モデルの病変予測出力を生成するように結合論理を通して結合される病変予測出力の2つのセットである(ステップ780)。必要であれば、第2の病変予測出力が再度サンプリングされ、最終的な病変予測出力を生成するように集団の第1のML/DLコンピュータ・モデルによって生成された第1の病変予測出力と結合される(ステップ790)。それにより、最終的な病変予測出力が解剖学的構造マスクを伴って出力され(ステップ795)、動作が終了する。
【0127】
[病変セグメント化]
【0128】
前述したように、様々なML/DLコンピュータ・モデルの動作、また体の部位検出、対象の体の部位決定、フェーズ分類、対象の解剖学的構造の識別、および解剖学的構造/病変検出を含む、AIパイプラインの論理の段階を通して、病変予測出力が生成される。例えば、図1に示されるAIパイプライン100では、AIパイプライン100の肝臓/病変検出段階130の結果には、肝臓の1つまたは複数の輪郭(輪郭線)、さらには検出された病変135に対応する医用画像データ要素の部分を識別する検出マップ、例えば、入力ボリューム105において検出された肝臓病変のボクセルごとのマップが含まれる。それにより、検出マップが、AIパイプライン100の病変セグメント化段階140に入力される。
【0129】
前述したように、病変セグメント化論理では、例えば図1における病変セグメント化段階140では、流域技術および対応するML/DLコンピュータ・モデルを使用して、入力ボリュームの医用画像(スライス)の画像要素分割を生成するように検出マップを分割する。肝臓病変セグメント化段階は、画像要素分割に基づき入力ボリュームのスライスに存在する病変に対応する輪郭のすべてを識別し、3次元内でどの輪郭が同じ病変に対応するかを識別するための動作を実行する、1つまたは複数の他のML/DLコンピュータ・モデルなどの他のメカニズムも提供する。この病変セグメント化段階では、3次元の病変分割を生成するように、相互に関連付けられた病変輪郭を集約する、1つまたは複数のさらなるML/DLコンピュータ・モデルなどのメカニズムをさらに装備する。
【0130】
病変セグメント化では、各病変に個別に焦点を合わせ、能動的輪郭解析を実行するために、医用画像内で表された病変画像要素および肝臓以外の組織のインペインティングを使用する。このようにして、医用画像内の他の病変に起因して解析にバイアスをかけることも、肝臓の外側の画像の部分に起因して解析にバイアスをかけることもなく、個別の病変が識別され、処理されてよい。この病変セグメント化の結果は、入力ボリュームにおけるそれらの対応する輪郭線または輪郭による病変のリストである。
【0131】
図8では、1つの例示的実施形態に係る、病変セグメント化論理によって行われる病変セグメント化プロセスの態様の概観のブロック図を示す。図8に示されるように、病変セグメント化は、2次元検出、すなわち、スライスごとに2次元スライスにある病変の検出を分割し(ブロック810)、z軸に沿って2次元病変を接続し(ブロック820)、そしてスライスごとに輪郭を精密化する(ブロック830)の際のメカニズムに及ぶ。これらのブロックのそれぞれについては、後続の図面に関して以下でより詳細に述べる。図8に示されるセグメント化プロセスは、解析下の所与の入力ボリュームにおいて病変をすべて識別し、入力ボリュームの画像(スライス)において互いに近くにある病変を見分ける際のプロセスとして実装される。例えば、1枚または複数枚の画像における画素期間で融合するように見える2つの病変は、病変分類時、また、医用ビューイング・アプリケーションを装備する、治療推奨動作を実行する、意思決定支援動作を実行するなど、下流コンピューティング・システム動作対象の病変のリストの出力における別個の病変識別の際など、検出された病変の他の下流処理を行う目的で2つの異なる領域すなわち見分けの付く病変として識別される必要があり得る。
【0132】
ブロック810におけるスライスごとの2D画像の分割の一環として、例示的実施形態のメカニズムでは、AIパイプラインのそれまでの病変検出段階からの検出マップ、例えば、図1におけるAIパイプライン100の肝臓/病変検出論理130により生成された検出マップ135を分割するのに既存の流域技術を使用する。流域アルゴリズムでは、マスク分割を実行するのにシード定義が必要となる。これによって、図10Aおよび10Cに示されるように、マスクがシードと同じ数の領域に分割されることになり、すべての領域のほぼ中央に厳密に1つのシードが配置されるようにする。自動セグメント化では、マスク内のシードは、その距離マップ(マスク輪郭までの間隔)の極大値として得られ得る。ただし、このような手法は、ノイズを起こしやすく、多すぎるシードにつながる可能性があり、それによりマスクを過剰分割する可能性がある。そのため、その領域のうちの一部をグループ分けし直すことによって、分割に手を入れる必要がある。ほとんどの病変が泡形状のものであるという経験的観察を考えると、領域グループ分けし直しに指針となる原則は、ほぼ円形の新しい領域を結果としてもたらすことである。例えば、図10Cに示されるマスクの場合、メカニズムは、それぞれシード1051、1061で識別される2つの領域を融合させ、それにより、2つのみのほぼ丸い領域で構成されている新しいマスク分割をもたらすようになる。このように、これ以降で説明される図9の左側に示される病変など、検出マップ135に画定された検出された病変の場合、図9の右側に示されるように、数個の泡形状の病変にセグメント化され得る。それらは、スライス上の3D病変の断面と見なされることになる。
【0133】
流域セグメント化は、その起源が数学形態学にある領域ベースの方法である。流域セグメント化では、画像は、尾根および谷のある局所的な景観として見なされる。この景観の高度値は、通常、それぞれの画素の濃淡値またはそれらの勾配の大きさによって定義され、それにより、3次元表現として2次元表現を見なす。流域変換では、画像を「キャッチメント・ベースン」に分解する。極小値ごとに、キャッチメント・ベースンは、その最急降下路がその最小値で終わるすべての点を含む。流域は、ベースンを互いに分ける。流域変換では、画像を完全に分解し、各画素を領域にでも流域にでも割り当てる。
【0134】
流域セグメント化では、画像の各オブジェクトの内部の「シード」点とも呼ばれる、少なくとも1つのマーカーの選択を必要とする。シード点は、オペレータによって選択され得る。1つの実施形態では、シード点は、そのオブジェクトの特定用途向け知識を考慮する自動手順によって選択される。オブジェクトが印付けされたのを受けて、それらは、形態流域転換を使用して、以下にさらに詳細に説明されるように成長することができる。病変は、通常、「泡」形状である。この例示的実施形態は、この仮定に基づき流域分割済み領域を融合させるための技術を提供する。
【0135】
次に、ブロック820において、例示的実施形態のメカニズムが、3次元出力を生成するように、z方向に沿ってスライスのそれぞれに対してボクセル分割を集約する。そのため、このメカニズムは、様々なスライスにおける画像要素の2つのセット、例えばボクセルが同じ病変に属するかどうか、すなわち、それらが3次元で位置が揃っているかどうかを判定する必要がある。メカニズムは、その病変の共通集合および和集合に基づき、隣り合うスライスにある病変間の測定値を計算し、回帰モデルを適用して、隣り合うスライスにある2つの病変が、同じ領域の一部であるかどうかを判定する。各病変をボクセルのセットとして見ることができ、メカニズムは、2つの病変の交差をボクセルの2つのセットの交差と判定し、2つの病変の和集合をボクセルの2つのセットの和集合と判定する。
【0136】
これは、この病変の3次元分割をもたらすが、輪郭が、実際の画像にうまく合わないことがある。過剰なセグメント化病変がある可能性がある。例示的実施形態では、セグメント化問題に取り組むのに従来のフレームワークである、能動的輪郭形成を使用することを提案する。このようなアルゴリズムは、輪郭を画像データに徐々にうまく合わせるように、繰り返し輪郭に手を加え、この間、それが形状平滑度などのいくつかの望ましい性質を確実に維持することを保証することを求める。ブロック830において、例示的実施形態のメカニズムが、分割が第1の段階810および第2の段階820から得られる能動的輪郭を開始し、一度に1つの病変に焦点を合わせ、そうでなければ、類似した病変において運用中の能動的輪郭またはランダム・セグメント化法が、それらが1つの輪郭にまた融合されることをもたらし得るが、それは、これまでの分割段階によってもたらされた利益が事実上取り消されることになるので、非生産的である。このメカニズムは、1つの病変に焦点を合わせ、焦点下で病変付近にある病変ボクセルおよび肝臓以外の組織に対して「インペインティング」を実行する。
【0137】
これら3段階の処理の連鎖により、画像にある他の病変によって、または肝臓の外側の画素すなわち病変によって偏りがなくなる処理が可能になる。
【0138】
[スライスごとの2D検出の分割]
【0139】
図9には、1つの例示的実施形態に係る、病変検出およびスライスごとの分割の結果を示す。図9の左側に見られるように、病変域910が、それまでの上記のAIパイプライン・プロセスを通して検出され、病変検出論理、例えば図1における130からの、輪郭および検出マップ、例えば図1における135の出力において画定され得る。1つの例示的実施形態によれば、図8におけるブロック810の論理は、図9の右側に示されるように、この領域を3つの病変911、912、および913に分割するよう試みる。この例示的実施形態の分割メカニズムは、AIパイプラインのそれまでの病変検出段階からの検出マップを分割するように動作する既存の流域技術に基づいている。流域アルゴリズムが、セグメント化目的で、主に画像処理に使用される。これらの知られている流域アルゴリズムの背後にある根本原理は、高強度が峰および丘を示す一方、低強度が谷を示す地理的表面としてグレースケール画像を見ることができることである。流域技術は、孤立した谷(極小値)ごとに色の異なる水(ラベル)を満たすことから始まる。付近の峰(勾配)に応じて水位が上がるにつれて、それぞれ色が異なる谷からの水が融合し始める。これを避けるのに、水が融合する場所に隔壁が築かれる。水を満たし、隔壁を築く作業は、作り出された隔壁がセグメント化結果を与える時点ですべての峰が水面下になるまで、続く。この場合もやはり、流域技術が一般的に知られているので、詳細には本明細書では説明しない。本発明の思想および範囲から逸脱することなく、スライスごとに2D画像を分割するのに、知られている如何なる技術も使用され得る。
【0140】
病変セグメント化との関連において、ほとんどの病変が円形状であるという経験的観測は、丸い領域のセットをもたらす分割がおそらく良い分割であることを強く示唆する。しかし、これまで述べたように、流域型分割の質は、シードの質で決まってくる。実際のところ、シードの任意のセットが、丸い領域のセットにつながる必要はない。例えば、図10Cでは、ほぼ円形の領域を1つのみ含む3つのシードによって誘発された流域分割を示す。他の2つの領域は、円形ではない。ただし、それらの和集合もまたほぼ円形である。図における斜め分割が他の円形領域を2つのより小さな非円形領域に割ることから、このような構成は、過剰分割と言われる。そのため、過剰分割を補正することができるアルゴリズムを備えることが望ましい。シードの再ラベル付けメカニズムが、いくつかの過剰分割領域を丸形状の領域しか含まないより雑な分割を成すように融合させることによってこれを行う。例えば、このメカニズムは、図10Cにおける分割に対して、シード1051および1061で識別される2つの領域を融合させることによって、より円形の新しい領域が作られることを決める。
【0141】
この例示的実施形態は、分割において領域を融合させて、身体的病変に対応し得る、より丸くより大きな領域にする。この分割により、あるエリアがより小さな領域に割られるか、または本明細書で説明されるように、この分割により、あるマスクがより小さな領域に割られる。輪郭の面では、分割により、大きな輪郭から、より小さな輪郭のセットを生成する(図9の左右を参照)。
【0142】
シードは、分割すべき入力マスクから計算された距離マップから極大値を抽出することによって得られる。マップでは、画素ごとに、マスク輪郭までのユークリッド距離を測定する。入力マスクのトポロジによっては、この距離マップから導出された極大値が流域アルゴリズムによって過剰断片化分割につながる可能性がある。この場合、流域は、過剰分割と言われ、用途によっては望ましいものであり得るが、病変セグメント化には理想的ではない円形ではない領域を生成する傾向にある。図10Cでは、その距離マップに3つの極大値がある合成入力マスクを示す。それにより、流域は、そのうちの1つ(シード1071に対応する)だけがほぼ円形である3つの領域を含む分割をもたらす。他の2つの領域は、円形ではない。シード1051がある領域は、半円形のみである。それにより、シードの再ラベル付けメカニズムが、すべてのシード対を確認し、シード1051と1061とに対応する2つの領域が、それらが共により完全な泡を成すように融合するはずであると判定する。このような動作は、2つしか領域を含まない新しい分割につながり、その両方の領域の形状がほぼ円形である。
【0143】
極大値とは、その直接隣接している点に比べて輪郭までの距離が最長である点のことである。極大値は、点であり、輪郭までのその距離が分かっている。結果として、例示的実施形態のメカニズムは、この点を中心とする円を描くことができる。円の半径は、この距離である。それにより、2つの極大値に対し、メカニズムは、それらのそれぞれの円の重複を計算することができる。これは、図10Aおよび図10Bに示されている。
【0144】
シードの再ラベル付けにより、以下のように2つの領域を融合させるべきかどうかが判定される。その関連付けられたシードが直接隣接しているシードである2つの領域の場合、融合が起こるが、そうでなければ、メカニズムは、その意思決定を仮説検証手順に基づかせる。例えば、図10Aを参照して、示された例では、距離マップが、各極大値が見分けの付く円形病変の中心に相当するという仮定につながる、2つの見分けの付く極大値をもたらし得る状況を説明する。ここで注意すべきは、距離マップにより、例示的実施形態のメカニズムが、極大値が輪郭(境界)からどのくらい離れているかを言うこともできるということである。この距離は、図10Bでは、輪郭上の最大値と点とを接続する点線セグメントで表されている。そのため、仮定が保たれる場合、病変がほぼ丸いかまたは「泡」形状であるという想定に起因してこれら2つの病変の空間範囲を推測することができる。これにより、例示的実施形態のメカニズムは、図10Bに示されるような2つの完全円を描くことができる。これから、メカニズムは、2つの円の重複を(例えば、古典的なダイス指標により)測定し、それを既定のしきい値と比べる。重複指標の値がこのしきい値よりも大きければ、メカニズムは、2つの泡が、過度に重複して、見分けの付かないものであると結論付け、融合が行われことになる。言い換えると、それにより、例示的実施形態のメカニズムは、2つの極大値が同じ病変の2つの「中心」に対応すると結論付ける。しかし、従来の流域では、このようなシード(すなわち、最大値)再ラベル付けメカニズムは、何も存在しない。それにより、マスク過剰分割が頻繁に起こる。
【0145】
この重複は、いくつかのやり方で測定され得る。1つの実施形態例において、メカニズムは、ダイス係数を使用する。図10Bに示されるような2つの極大値に対応する2つの完全円の場合、メカニズムは、これら2つの円のダイス指標を計算し得る。このように、メカニズムは、ダイス指標がしきい値よりも大きくなるのを受けて、2つの極大値が実際には同じ病変の中心であるような最適なしきい値を実際に何に適用すべきかをトレーニング・データセットから学習することができる。
【0146】
図10Cおよび10Dでは、2つの部分的に融合した円が、図10Cよりも図10Aにおいて互いに似ている図10Aおよび10Bの病変マスク形状とは異なる別の病変マスク形状の例を提供する。マスク形状に対して非常に感度が高くなり得る距離マップに起因して、図10Cの病変マスク形状例には3つのシードがある。上記の推論に従うと、病変分割アルゴリズムでは、図10Cに表される病変を、2つの別々の病変に分割することになるが、シードの再ラベル付けをしない流域技術で起こる可能性のある際の3つの別々の病変にではない。
【0147】
図10Cおよび10Dでは、シード1051およびシード1061は、図10Aおよび10Bに示されるものよりも極端な場合を表す。例示的実施形態のシードの再ラベル付け技術を用いず、それらを分ける分割が行われることになる(斜め実線で表される)。しかし、例示的実施形態のシードの再ラベル付けメカニズムでは、この望ましくない結果が事実上避けられ得る。反対に、シード1071がシード1051および1061から十分遠くにあることから、上記の同じ仮説検証手順が、シード1071が見分けの付く泡の中心に対応するとの仮定を受け入れるのに役立ち、図10Cおよび10Dに示されるような垂直分割につながる。同様に、これは、シード1051および1061に割り当てられたラベルから、シード1071用の異なるラベルに転換する。しかし、図10Aおよび10Bにおける状況と同様に、例示的実施形態のシードの再ラベル付け技術の仮説検証手順では、シード1051と1061とが同じ病変に対応すると判定することになる。
【0148】
図11Aは、1つの例示的実施形態に係る、病変分割および再ラベル付けのメカニズムを示すブロック図である。図11Aに示されるように、1つまたは複数のコンピューティング・デバイスの1つまたは複数のプロセッサによって実行される、1つまたは複数のアルゴリズム、機械学習コンピュータ・モデルなどを含むコンピュータ・モデルとして実装され得、また1つまたは複数の医用画像データ構造の入力ボリュームに対して動作するメカニズムが、2次元病変マスク1101を受信し、距離変換を実行して(ブロック1102)、距離マップ1111を生成する。この距離変換(ブロック1102)は、病変マスク内の点ごとに、マスク輪郭(境界)までの最短距離を計算する、二値のマスクに対して行われる演算である。1つが病変マスクの内部に向かって移動すればするほど、もう1つがその輪郭(境界)から離れることになる。このように、距離変換では、病変マスクの中心点、すなわち、他のものよりも長い距離の点を識別する。1つの実施形態では、メカニズムは、場合によっては、距離マップ1111に対してガウシアン平滑化を行う。
【0149】
次に、メカニズムは、極大値の識別を実行して(ブロック1103)、シード1112を生成する。上記のように、これらの極大値は、距離マップ1111において、輪郭または境界から最も長い距離にある点である。メカニズムは、シード1112に基づき流域技術を行って(ブロック1104)、流域分割病変マスク1113を生成する。これまで説明したように、この分割病変マスク1113は、病変の想定された泡形状に合わない領域をもたらす、過剰分割であり得る。そのため、メカニズムは、距離マップ1111、シード1112、および分割2D病変マスク1113に基づきシードの再ラベル付けを実行して(ブロック1120)、更新された分割病変マスク1121を生成する。シードの再ラベル付けについては、図11Bを参照して以下でさらに詳細に述べる。結果として得られた、更新された分割病変マスク1121には、病変に対して想定された泡形状によりぴったり合う領域を成すように、融合している領域があるようになる。
【0150】
図11Bは、1つの例示的実施形態に係る、シードの再ラベル付けメカニズムを示すブロック図である。図11Bに示されるように、1つまたは複数のコンピューティング・デバイスの1つまたは複数のプロセッサによって実行される、1つまたは複数のアルゴリズム、機械学習コンピュータ・モデルなどを含むコンピュータ・モデルとして実装され得、また1つまたは複数の医用画像データ構造の入力ボリュームに対して動作するメカニズムが、距離マップ1111およびシード1112を受信する。より具体的には、メカニズムは、シード1112にある各シード対(シードAとシードB)を考える。メカニズムは、シードAとシードBとが直接隣接しているシードであるかどうかを判定する(ブロック1151)。シードAとシードBとが直接隣接しているシードであれば、メカニズムは、シードAとシードBとに同じラベルを割り当てる(ブロック1155)。言い換えると、シードAとシードBとが、領域1つのみに相当するようにグループ化される。
【0151】
ブロック1151において、シードAとシードBとが直接隣接していない場合、メカニズムは、距離マップ1111に基づき空間範囲推定を実行し(1152)、下記のように、シードAおよびシードBに対してペアワイズ親和性を決定する。この例示的実施形態によれば、空間範囲推定では、ある領域が「泡」形状であると想定する。それにより、メカニズムは、各シードが、距離マップからの距離が円の半径としてである円に相当すると想定する。
【0152】
それにより、メカニズムは、シードAおよびシードBに相当する円に対して重複指標を計算する(ブロック1153)。1つの実施形態例において、メカニズムでは、以下のようにダイス指標を使用する。
【0153】
【数4】
ここで、|A|は、シードAに相当する円の面積を示し、|B|は、シードBに相当する円の面積を示す。同様に、|A∩B|は、AとBとの共通集合の面積を示す。代替の実施形態において、メカニズムは、以下のように重複指標を計算する。
【0154】
【数5】
ここで、|A|は、シードAに相当する円の面積を示し、|B|は、シードBに相当する円の面積を示し、|A∩B|は、AとBとの共通集合の面積を示し、|A∪B|は、AとBとの和集合の面積を示す。
【0155】
メカニズムは、重複指標が既定のしきい値より大きいかどうか判定する(ブロック1154)。ブロック1154において、重複指標がそのしきい値よりも大きければ、メカニズムは、分割2D病変マスク1113内の対応する領域を融合させる(ブロック1155)。
【0156】
2つのシード間の親和性がこのしきい値よりも大きい場合、それらには同じラベルが割り当てられる。そうでなければ、この段階では、それらが同じグループに属するべきであるかどうかが分からない。この意思決定は、以下で説明するように、z方向接続で使用されるのと同じモジュール、ラベル伝搬段階(図15におけるブロック1512)に委ねられる。
【0157】
2つよりも多いシードがある状況では、図11Bの同じ動作が、シードグループを生成するラベル伝搬の前に、すべてのシード対に対して繰り返される。例えば、シード対(a、b)と(b、c)とが、同じグループに属すると判定されているが、シード対(a、c)が図11Bに示されるような検査に落ちる状況がある。それにより、ラベル伝搬では、a、b、cを同じグループに入れる必要があり、すなわち、シードaおよびcに対応する領域がなお融合することになる。しかし、シードa、b、c、およびdがあり、親和性計算(合計6対に対して行われる)で、(a、b)および(c、d)しか検査に合格しなかったことが示される場合、ラベル伝搬により、(a、b)、(c、d)をそれぞれ含む2つのグループがもたらされる。そのため、シード対が検査に落ちた場合、それは、それらが同じグループに入れられるはずで、異なるグループに属するはずではないかどうかが分からないことを意味する。
【0158】
例えば、図10Cでは、3つのシード対(1051-1061、1051-1071、1061-1071)があり、メカニズムがシード1051と1061とに同じラベルが割り当てられるはずである(同じグループに属する)と判定するはずである。それにより、ラベル伝搬ステップでは、これら3つのシードをクラスタ化して、第1のグループが1071しか含まず、第2のグループには1051および1061の両方がある、2グループにする。
【0159】
図12は、1つの例示的実施形態に係る、病変分割の例示的な動作の概要を示すフローチャートである。図12に概説される動作は、図11A~11Bに関してこれまで述べたメカニズムによって行われ得る。図12に示されるように、動作が始まり(ステップ1200)、メカニズムが2次元病変マスクに対して距離マップを生成する(ブロック1101)。これまで述べたように、この距離マップは、2次元病変マスクに対して距離変換演算を実行し、また場合によっては、ガウシアン平滑化を実行してノイズを除去することによって生成され得る。それにより、メカニズムは、極大値の識別を使用して、データ点、例えば、グループごとの極大値のグループ化を生成する(ステップ1202)。メカニズムは、極大値に基づき病変分割を実行して、領域を生成する(ステップ1203)。次に、メカニズムは、距離マップを使用して、ペアワイズ親和性に基づきシードに再ラベル付けを行う(ステップ1204)。これにより、メカニズムは、同じラベルの付いたシードに対応する領域を融合させる(ステップ1205)。例示的実施形態のメカニズムによって実行されたシードの再ラベル付けに起因して、ステップ1205における分割病変マスク出力が、これまで上に述べたように、病変形状のそれぞれに関連付けられたデータ点に間違ったラベルが関連付けられていることに起因した、流域技術に関連付けられた過剰分割問題がないことが理解されるべきである。この後、動作が終了する(ステップ1206)。
【0160】
[病変のz方向接続]
【0161】
病変分割およびシードの再ラベル付けの際の上記プロセスは、入力ボリュームの2次元画像または2次元スライスのそれぞれに対して実行され、それにより、対応する2次元画像に表された病変のそれぞれに適切にラベル付けされた病変マスクを生成することができる。しかし、入力ボリュームは、生物学的実体の内部解剖学的構造の3次元表現を表し、3次元で考えると同じ病変に関連付けられているように見える可能性のある病変が、実際には異なる病変に関連付けられている可能性がある。それゆえ3次元の入力ボリュームで表される際の生物学的実体内で別々の病変を正しく識別することができるように、例示的実施形態は、z軸に沿って、すなわち3次元で2次元病変を接続するためのメカニズムを提供する。
【0162】
病変のz方向接続と呼ばれる、z軸に沿った2次元病変の接続を行うこのメカニズムは、上記のメカニズムによって生成された分割病変出力に対して、3次元z方向病変検出を決定するように実行されるロジスティック回帰モデルを含む。メカニズムは、隣接する画像スライスにおける2つの病変を接続する。ロジスティック回帰モデルが2つの病変が同じ病変を表すと決定すると、2つの病変が接続される。例えば、隣接する画像スライス、すなわち、スライスの3次元的に体系化された集合においてz軸に沿って途切れなく順序付けられたz軸座標を有するスライス上の如何なる2次元病変に対しても、メカニズムは、以下に述べるように、これらの2次元病変が同じ3次元病変に属するかどうかを判定する。
【0163】
図13A~13Cは、1つの例示的実施形態に係る、病変のz方向接続のためのプロセスを示す。図13Aでは、病変マスク入力を示す。図13Bでは、上記のような例示的実施形態の再ラベル付けの改善された病変分割メカニズムを採用し得る、スライスごとの病変分割後の病変を示す。図13Aおよび13Bに示されるように、スライス1310には病変1311および1312があり、スライス1320には病変1321があり、スライス1330には病変1331および1332がある。病変のz方向接続メカニズム、すなわちロジスティック回帰モデルは、入力ボリュームにある隣接するスライス対ごとの分割病変マスクに対して、所与のスライスにある各病変を、対の隣接するスライスにある各病変と比較するように実行される。例えば、病変のz方向接続メカニズムは、スライス1310にある病変1311(病変A)をスライス1320にある病変1321(病変B)と比較する。比較ごとに、メカニズムは、各病変をボクセルのセットと見なし、病変A(病変Aにあるボクセルのセット)と病変B(病変Bにあるボクセルのセット)との共通集合を病変Aのサイズに対して、また病変Bのサイズに対して決定する。病変のz方向接続メカニズムは、次のように、2つの重複率に基づき、ロジスティック回帰モデルを使用して、病変Aと病変Bとが接続されているかどうかを判定する。
【数6】
【0164】
ここで、|A|は、シードAに相当する円の面積を示し、|B|は、シードBに相当する円の面積を示し、|A∩B|は、シードAとシードBとに相当する円の共通集合の面積を示す。メカニズムは、これら2つの比率を、入力特徴として使用して、病変Aと病変Bとが接続されている確率を決定するようにロジスティック回帰モデルをトレーニングする。すなわち、これまで上に述べたものなどの機械学習プロセスを使用して、ロジスティック回帰モデルが、トレーニング画像のボリュームに対して、各トレーニング・ボリュームにおけるスライスの対単位の組み合わせごとに、1つのスライスにある病変が、隣接するスライスに表された病変と同じ病変であるかまたは異なる病変であるかの確率に関する予測を生成するようにトレーニングされる。この予測は、損失または誤差を生成するために、病変が同じ病変であるかまたは異なる病変であるかのグラウンド・トゥルース表示と比較される。次に、ロジスティック回帰モデルの動作パラメータ、例えば、係数または重みが、既定のエポック回数のトレーニングが実行されるかまたは既定の停止条件が満たされるまで、この損失または誤差を減らすように修正される。
【0165】
ロジスティック回帰モデルは、二値分類の問題を解決するために広く使用されている。例示的実施形態との関連において、このロジスティック回帰モデルは、病変の2つの断面が同じ病変の一部であることの確率を予測する。このため、ロジスティック回帰は、これまで述べたように、2つの重複率γ、γを使用する。具体的には、ロジスティック回帰モデルは、以下のように2つの特徴を線形に結合するように学習する。
【数7】
ここで、(c、c、b)は、機械学習トレーニング演算を経てトレーニング・ボリュームから学習される動作パラメータである。数記法上、γ、γは、それぞれ、最小重複率、最大重複率を示す。ロジスティック回帰モデルのトレーニング後の動作パラメータの状態は、(c*、c*、b*)で示され得る。推論時に、すなわち、ロジスティック回帰モデルのトレーニング後に、画像(スライス)の新しい入力ボリュームを処理すると、しきい値tは、2つの断面が、関係f(γ、γ;c*、c*、b*)>tが保持される場合また保持される場合のみ、すなわち、予測確率が設定しきい値よりも大きい場合また大きい場合のみ、同じ病変に属すると見られるように設定される。
【0166】
2つの極端なケースがある。第1に、しきい値tが0に設定されると、例示的実施形態のz方向接続メカニズムが、必ず、病変が同じ病変である、すなわち断面が接続されていると決定する。それにより、真陽性率と偽陽性率の両方が1になる。第2に、しきい値tが1に設定されると、z方向接続メカニズムは、接続される病変の如何なる断面も識別しなくなる。このケースでは、真陽性率と偽陽性率の両方が0になる。そのため、しきい値tが区間(0、1)にある場合のみ、ロジスティック回帰モデルは、病変断面が、隣接するスライスにわたって同じ病変に関連付けられているかどうかに関して判定を下す。理想的なロジスティック回帰モデルを用いると、真陽性率は、1に等しくなる(すべての真接続が識別される)と同時に、偽陽性率は、0になる(ゼロ偽接続がなされる)。
【0167】
このように、ロジスティック回帰モデルがトレーニングされたのを受けて、新しいスライス対が、この対に対してこれらの比率を計算し、これらの対のそれぞれに対して予測を生成するように、それらを入力特徴としてトレーニング済みロジスティック回帰モデルに入力することによって、このように評価され得、次に、予測確率が既定のしきい値確率以上である場合、病変AとBとが、3次元で同じ病変に関連付けられていると見なされる。それにより、スライスにわたる病変の適切な再ラベル付けが、が他の隣接するスライスにある同じ病変表現に2次元スライスの病変を正しく関連付けて、それによって、入力ボリューム内の3次元病変を識別するように実行され得る。
【0168】
ロジスティック回帰モデルをトレーニングするのに使用される2つの比率入力特徴をサポートする論理的根拠がある。例えば、病変AとBとがサイズにおいて十分に異なる場合、それらは、おそらく同じ病変の一部でない。また、スライス1310にある病変1312とスライス1320にある病変1321の場合のように、病変AとBとが交差しない場合、特徴γ、γがゼロ値を有することになる。前述したように、ロジスティック回帰モデルは、2つの特徴値γ、γを前提として回帰を実行し、尤度病変Aと尤度病変Bとが同じ病変の一部であることを表す、0~1の確率値を出力する。
【0169】
図13Cでは、1つの例示的実施形態に係る、スライス間の断面接続を示す。図13Cに示されるように、メカニズムが、上で述べたような重複率に基づき病変共通性を予測する、例示的実施形態のトレーニング済みロジスティック回帰モデルを実行することによって、スライス1310にある病変1311とスライス1320にある病変1321とが同じ病変の一部であると決定する。同様に、メカニズムはまた、スライス1320にある病変1321とスライス1330にある病変1331とが同じ病変の一部であると決定する。このように、メカニズムは、交差する病変をz軸に沿って伝搬し、病変のz軸接続を実行する。
【0170】
2次元スライスにわたって病変のz方向接続を識別することに対する入力ボリュームにおけるスライスの対単位評価と、病変がz軸に沿って接続されているかどうかのトレーニング済みロジスティック回帰モデルによる判定とに基づき、病変の再ラベル付けを実行することで、ある病変と同じラベルが、入力ボリュームのスライスのそれぞれに存在する病変マスクの各々、例えば、入力ボリュームにあるスライスのセットにわたる病変マスクのすべてに適用されることを確実にすることができ、この場合、これらの病変マスクは、同じ病変Aに関連付けられているとロジスティック回帰モデルによって決定され、それらが同じ病変Aの一部であることを指定するように再ラベル付けされ得る。これは、入力ボリュームのスライスのそれぞれにおいて病変断面ごとに実行されて、それによって、入力ボリュームに存在する1つまたは複数の病変に対して病変マスクの3次元の関連付けを生成することができる。それにより、この情報を使用して、同じ病変に関連付けられた断面のすべてが入力ボリュームにおいて正しくラベル付けされた以降の3次元において、後の下流コンピューティング・システム演算時などで病変を表すか、そうでなければ処理することができる。
【0171】
図14Aおよび14Bは、1つの例示的実施形態に係る、トレーニング済みロジスティック回帰モデルの結果を示す。図14Aは、最大重複率(γ)+最小重複率(γ)指標に対する、また最大重複率指標に対する受信者動作特性(ROC:Receiver Operating characteristic)曲線を示す。ROC曲線は、その弁別しきい値が変化した際の二値分類器システムの診断能力を示すグラフィカル・プロットである。ROC曲線は、様々なしきい値設定における偽陽性率(FPR:False Positive Rate)に対する真陽性率(TPR:True Positive Rate)をプロッティングすることによって作り出される。図14Bは、最大重複率+最小重複率指標に対する、また最大重複率指標に対する適合率再現率曲線を示す。適合率再現率曲線は、ROC曲線によく似た、様々なしきい値に対する適合率(y軸)および再現率(x軸)のプロットである。ここで、適合率は、取得されたインスタンスの中の関連インスタンスの割合であり、再現率(または感度)は、実際に取得された関連インスタンスの総量の割合である。これらの図に示されるように、2特徴ロジスティックモデルは、その1特徴の対応物を凌いでいる。したがって、両方の特徴が、貴重な情報をこの予測タスクにもたらす。
【0172】
図14Aにおける最大重複率(γ)+最小重複率(γ)指標曲線を見てみると、適切なしきい値tでは、トレーニング済みロジスティック回帰モデルが、ほぼ3%の偽陽性率を犠牲にして、真陽性率~=95%を生成することができることが分かる。図14Bを見てみると、示されたプロットが、適合率および再現率の面で、トレーニング済みロジスティック回帰モデルを見極め、両方の測定が正しいしきい値tの選択により非常に良い結果をもたらすことができることを示す。
【0173】
図15は、1つの例示的実施形態に係る、z軸に沿って2次元病変を接続するためのメカニズムの例示的な動作の概要を示すフローチャートである。図15に示されるように、動作が始まり(ステップ1500)、メカニズムが入力ボリュームから最初の画像Xを選択し(ステップ1501)、画像Xにおいて最初の病変Aを選択する(ステップ1502)。一部の例示的実施形態では、入力ボリュームにおける画像またはスライスは、上記の分割および再ラベル付けメカニズムを使用して処理され得るが、これは必要とはされない。反対に、病変のz方向接続を対象とする例示的実施形態のメカニズムは、実際には、病変マスクが識別された如何なる入力ボリュームの場合でも実行され得る。
【0174】
次に、例示的実施形態のz方向接続メカニズムは、隣接する画像Y内の最初の病変Bを選択する(ステップ1503)。次に、メカニズムは、病変Aに関して病変Aと病変Bとの交差を決定し、病変Bに関して病変Aと病変Bとの交差を決定する(ステップ1504)。メカニズムは、病変Aと病変Bとの共通集合に対してγ特徴およびγ特徴にトレーニング済みロジスティック回帰モデルを適用することによって、2つの交差値に基づき、病変Aと病変Bとが同じ病変に属するかどうかを判定し、病変Aと病変Bとが同じ病変に属するという予測または確率を生成し、次に、この確率をしきい値確率と比較する(ステップ1505)。この判定の結果に基づき、画像における病変断面が、それらが同じ病変の一部であるかどうかを示すようにラベル付けされるかまたは再ラベル付けされ得る。
【0175】
メカニズムは、画像Yにある病変Bが画像Yにある最後の病変かどうかを判定する(ステップ1506)。病変Bが最後の病変ではない場合、メカニズムは、次の病変Bを隣接する画像Yにあると見なし(ステップ1507)、動作は、ステップ1504に戻って、病変Aと新しい病変Bとの交差を決定する。
【0176】
ステップ1506において、病変Bが隣接するスライスまたは画像Yにある最後の病変である場合、メカニズムは、病変Aが画像Xにある最後の病変であるかを判定する(ステップ1508)。病変Aが画像X内の最後の病変でない場合、メカニズムは、画像X内の次の病変Aを考慮し(ステップ1509)、動作は、ステップ1502に戻って、隣接する画像Yにある最初の病変Bを考慮する。
【0177】
ステップ1508において、病変Aが画像X内の最後の病変であれば、メカニズムは、画像Xが考慮すべき最後の画像であるかどうかを判定する(ステップ1510)。画像Xが最後の画像でなければ、メカニズムは、次の画像Xを考慮し(ステップ1511)、動作は、ステップ1502に戻って、新しい画像X内の最初の病変Aを考慮する。
【0178】
ステップ1510において、画像Xが考慮すべき最後の画像である場合、メカニズムは、z軸に沿って画像間で交差している病変を伝搬する。ここで、伝搬とは、上記プロセスを通して判定されたのと同じ病変に関連付けられたラベルが、それらが同じ病変の一部であると示すように同じ値に設定されることを意味する(ステップ1512)。これは、同じ病変に関連付けられた画像のそれぞれにおける断面が適切にラベル付けされ、それゆえ、各病変の3次元表現が断面のz方向接続を通して生成されるような、入力ボリュームにおいて識別された別々の病変ごとに実行される。その後、動作は、終了する(ステップ1513)。
【0179】
[輪郭精密化]
【0180】
上記プロセスでは、病変の個数および相対位置、また2次元空間(画像またはスライス内)および3次元空間(入力ボリュームにある画像またはスライスにわたる)にわたって接続している病変の面で正確な結果をもたらす。しかし、病変輪郭(境界)は、必ずしもうまく画定されず、改善が必要となる。例示的実施形態は、病変輪郭精度を向上させるためのメカニズムを提供する。このさらなるメカニズムは、上記のメカニズムで、病変セグメント化の一環として採用されてもよく、上記の特定の病変検出、病変分割および再ラベル付け、またはz方向接続メカニズムあるいはその組み合わせを必要としない他の例示的実施形態に採用されてもよい。
【0181】
既存の輪郭アルゴリズムは、周囲に病変がない解剖学的構造の中央に病変がある場合にのみうまく働くが、2つ以上の近接した病変が、初期には見分けの付く輪郭を単一の包括的な輪郭に融合するという「漏れ」の問題につながる様々な状況があり、それにより、早期の2次元病変マスク分割によってもたらされた利点を完全に消し去る場合には、うまく働かない。病変が解剖学的構造境界、例えば肝臓境界の付近にある場合によっては、輪郭形成アルゴリズムでは、輪郭形成アルゴリズムによってほとんどが見分けが付くことから、別の病変からある病変を見分けるのではなく、画像にある他の解剖学的構造、例えば器官の場合の画素に対して解剖学的構造の画素を見分ける。
【0182】
例示的実施形態のメカニズムは、画像またはスライスにおいて対象とするものではないエリアをインペイントする。図16では、ある例示的実施形態に係る、同じ画像にある2つの病変に対する輪郭の場合の例を示す。図16の左側には、有効な輪郭アルゴリズムを使用して、2つの病変に対して輪郭1611および1612を決定する。有効な輪郭アルゴリズムは、画像内容をより良く合わせるように繰り返し輪郭を進化させるクラスのアルゴリズムである。
【0183】
この例示的実施形態によれば、メカニズムは、輪郭1612内、および輪郭1611の付近にあるが、輪郭1611内にない肝臓以外の組織をインペイントするが、このインペインティングが、輪郭1612および輪郭1612内、さらに輪郭1611の付近にある健全な組織(非病変組織)の画素に対する画素値が、それらすべてが同じ値をもつような特定の値に設定されることを意味する場合、輪郭1611内はインペイントしない。例えば、この値は、病変に関連付けられていないと識別された領域、すなわち、解剖学的構造、例えば肝臓の健全な組織における平均組織値であり得る。
【0184】
このインペインティングは、インペインティングが健全な組織および他の病変、例えば、画像にある病変1612に適用されるような選択された病変輪郭1611に対して実行され得る。このように、選択された病変、例えば1611に関連付けられた輪郭および画素が、輪郭1611を再評価する際に画像の他の部分とは別個に考えられる。それにより、輪郭1611は、再評価され得、輪郭1611の再評価が輪郭1611の改善された定義をもたらすかどうかに関して判定が下され得る。すなわち、選択された病変輪郭1611に関連付けられた画素と、選択された病変輪郭1611近くの画素とのコントラストおよび分散の初期判定が生成され得る。インペインティングの前にこのコントラストおよび分散を計算した後、他の病変輪郭、例えば1612、および画像にある健全な組織に相当する解剖学的構造のエリアに関連付けられた画素が、健全な組織の平均画素強度値によりインペイントされるように、インペインティングが、選択された病変1611に対して行われ得る。
【0185】
値のセットの分散が以下のように決定される。言わばn個のボクセルで構成されているボクセルセットを考えてみる。最初に、それらの強度値を合算し、次に結果の和をnで割ることによって、算術平均が計算される。これは、結果としての数がAで示される。2番目に、これらボクセル値が個々に二乗され、次に、算術平均が計算される。この結果は、Bと示される。次に分散がB-A*A、すなわち、Bと二乗Aとの差として定義される。
【0186】
したがって、n個の値のセット{x、...、x}の分散は、以下のように定義される。
【0187】
【数8】
【0188】
この分散は、所与の輪郭の内側と外側のボクセル間で計算される。輪郭の内側のボクセルは、輪郭によって囲まれたボクセルであり、外側のボクセルは、輪郭の外側にあるが輪郭から既定の距離内にとどまっている外側のボクセルを指す。
【0189】
メカニズムは、これまで上に述べたような有効な輪郭形成アルゴリズムを使用したインペインティングの後、選択された病変の輪郭1611を計算し直し、新しい輪郭1611のコントラストまたは分散あるいはその両方を計算し直し、これらの値が、改善されているかどうか判定する(病変の内側または外側あるいはその両方のより高いコントラスト値またはより低い分散値)。コントラストおよび分散が改善されている場合、新たに計算された輪郭1611が、対応する病変の輪郭として維持される。それにより、このプロセスは、次に病変1611および輪郭1612の近くの健全な組織に関連付けられた画素をインペインティングすることによって、選択された病変としての病変1612に対して行われ得る。このように、各病変は、各病変に対して輪郭を生成し、それによって、病変の互いへの漏れを防ぐように別個に評価される。
【0190】
インペインティング後に病変の輪郭を計算するためのメカニズムは、はっきり画定された境界のないオブジェクトをセグメント化するように考案されているChan-Veseセグメンテーション・アルゴリズムに基づくものであり得る。このアルゴリズムは、セグメント化領域の外側の平均値からの差強度の和、セグメント化領域の内側の平均値からの差の和、およびセグメント化領域の境界の長さによって決まってくる項に対応する加重値によって定義されているエネルギーを最小限に抑えるように繰り返し展開されるレベルのセットに基づいている。分割された検出マップを使用して初期化が行われる(エネルギーの極小値の問題を解決する)。
【0191】
メカニズムがセグメント化を備えるのを受けて、メカニズムは、輪郭をそれまでの推定値により初期化し、新しい輪郭の方が良いかどうか、例えば、輪郭のコントラストおよび分散が改善されているかどうかを判定する。元の輪郭の方が良ければ、元の輪郭が維持される。新しい輪郭の方が良ければ、例えば、輪郭のコントラストおよび分散が改善されている場合、メカニズムは、新しい輪郭を使用する。一部の例示的実施形態では、メカニズムは、均質なエリア、また分散を計算するのに基づき、どの輪郭が良くなったかを判定する。分散が、輪郭の内側でも外側でも低減されている場合、メカニズムは、新しい輪郭を使用し、そうでなければ、メカニズムは、これまでの輪郭を使用する。別の例示的実施形態において、メカニズムは、コントラスト(輪郭の内側の平均値対輪郭の付近の平均値)が改善されているかどうかを判定する。例示的実施形態の思想および範囲から逸脱することなく、それまでの輪郭および新しい輪郭のどちらかを選択するのに、様々な尺度を使用する他の技術が使用され得る。
【0192】
図17は、ある例示的実施形態に係る、スライスごとの輪郭の精密化のためのメカニズムの例示的な動作の概要を示すフローチャートである。図17に示されるように、動作は、例えば、肝臓などにおいて、病変を示すようにセグメント化された画像における所与の輪郭で、(ステップ1700)で始まり、メカニズムは、初期輪郭に対して1番目のコントラストおよび分散を決定する(ステップ1701)。メカニズムは、病変の付近にある病変画素(または3次元のボクセル)をインペイントする(ステップ1702)。次に、メカニズムは、病変の周りの輪郭を決定する(ステップ1703)。次に、メカニズムは、新しい輪郭に対して2番目のコントラストおよび分散を決定する(ステップ1704)。メカニズムは、2番目のコントラストおよび分散が、1番目のコントラストおよび分散と比べて改善に相当するかどうか判定する(ステップ1705)。2番目のコントラストおよび分散が改善に相当すれば、メカニズムは、病変を表すのに更新済み輪郭を使用する(ステップ1706)。その後、動作が終了する(ステップ1708)。
【0193】
ステップ1705において、2番目のコントラストおよび分散が改善に相当しない場合、メカニズムは、初期輪郭に戻る(ステップ1707)。その後、動作が終了する(ステップ1708)。このプロセスは、画像/入力ボリュームに存在する病変のそれぞれに関連付けられた輪郭を計算し直し、この輪郭を改善するために、入力スライスまたは入力ボリュームあるいはその両方において識別された病変ごとに繰り返され得る。
【0194】
[偽陽性除去]
【0195】
病変セグメント化を行って、病変およびそれらの輪郭のリストを生成した後、AIパイプライン100が、偽陽性処理段階150を行って、間違って示された病変を病変のリストから除去する。この偽陽性段階150は、病変のリスト、例えば、肝臓/病変検出論理130によって出力され、次に、病変セグメント化論理140において行われるセグメント化および再ラベル付けによって融合される図1における輪郭およびマップ135において間違って識別される病変の個数を減らすような多くの形態を取ることができる。以下の説明では、この偽陽性除去を行うのに使用され得る新規の偽陽性除去メカニズムを明示するが、この特別な偽陽性除去がなくても済む。また、これ以降述べる偽陽性除去メカニズムは、上記の他のメカニズムとは別個に使用され得、画像において識別されたオブジェクトの如何なるリストにも適用され得、例示的実施形態は、特に医用画像にある病変の場合、このような偽陽性除去を利用する。すなわち、このセクションで述べる偽陽性除去メカニズムは、本明細書でこれまで述べた他のメカニズムとは別個に、区別可能に実装され得る。
【0196】
説明の便宜上、偽陽性除去メカニズムがAIパイプライン100の一部として、またAIパイプライン100の偽陽性除去論理150の一部として実装されていると想定することにする。それゆえ、偽陽性段階150では、このセクションで述べる偽陽性除去メカニズムは、上記の病変のz方向接続および輪郭の精密化の場合に入力ボリュームの3次元性質を考慮に入れて、肝臓/病変検出論理ならびに病変のセグメント化および再ラベル付けから得られる病変のリストに対して動作する。図1におけるこのリスト148は、以下に述べるようにリスト148を処理し、間違って識別される病変が修正済みの病変のリストに最小限に抑えられている、フィルタリング済みまたは修正済みの病変のリストを病変分類段階160に出力する、偽陽性除去論理段階150に入力される。それにより、病変分類段階は、修正済みの病変のリストにおいて示された様々な病変を分類する。
【0197】
すなわち、AIパイプライン100の前段階におけるすべての病変の捕捉は、AIパイプライン100に、実際には病変を表していない画素を病変の一部であると誤認させる、感度設定の増加につながり得る。その結果、除去すべき偽陽性が存在し得る。偽陽性段階150には、偽陽性を除去するように、病変およびそれらの輪郭のリストに対して動作する論理が含まれる。このような偽陽性除去が、検査時に(病変レベルに対しての入力ボリュームレベルのセット)、偽陽性の除去が、適切に行われない場合に、未検出になる病変をもたらす可能性があるというリスクを釣り合わせることも必要になることを理解するべきである。これは、医師および患者に、治療を必要とする病変を気付かせなくさせる可能性があることから、課題の多いものであり得る。1つの検査には、理論上、同じ患者に対して数ボリュームの画像が含まれ得ることが理解されるべきである。しかし、単一フェーズ検出実装式AIパイプラインがある一部の例示的実施形態では、1ボリュームのみの画像が処理され、この処理が、単一ボリュームに対して行われると想定されている。分かりやすいように、「患者レベル」は、これが、この例示的実施形態にとって対象となるものであることから、これ以降「検査レベル」に代わって使用される(患者に病変があるかどうか)。他の例示的実施形態では、本明細書に記載の動作が、同じ患者に対して複数ボリュームの画像が評価され得る検査レベルに及び得ることが理解されるべきである。
【0198】
例示的実施形態では、AIパイプライン100の先行段階の出力(スライス、マスク、複数の病変、病変および解剖学的構造輪郭など)を、偽陽性除去段階150への入力148として仮定すると、偽陽性除去段階150は、ほんのわずかな患者レベル偽陽性しか認めないようにするために(少なくとも1つの病変が検出される正常な患者/ボリューム)、患者レベル(入力ボリューム・レベル)における極めて特異な動作点において実施する。この点は、患者の受信者動作特性(ROC)(患者レベルの感度対患者レベルの特異度)解析の解析から取得され得る。本明細書では患者レベルの動作点OPpatientと呼ばれる、極めて特異な動作点を使用すると少なくともいくつかの病変をもたらすボリュームでは、より感度が高い動作点が、本明細書では病変レベルの動作点OPlesionと呼ばれる病変レベルで使用される。病変レベルの動作点OPlesionは、保たれる病変の個数を最大限にするために、病変レベルのROC曲線(病変感度対病変特異度)の解析から識別され得る。
【0199】
2つの動作点、すなわち、OPpatientとOPlesionとは、1つまたは複数のトレーニング済みML/DLコンピュータ・モデルにおいて実装され得る。1つまたは複数のトレーニング済みML/DLコンピュータ・モデルは、識別された病変が真の病変であるかそれとも偽の病変であるか、すなわち、真陽性であるかそれとも偽陽性であるかに関して、入力ボリュームまたはその病変のリスト(セグメント化論理の結果)あるいはその両方を分類するようにトレーニングされている。1つまたは複数のトレーニング済みML/DLコンピュータ・モデルが、その出力が、病変ごとに、それが真陽性であるかそれとも偽陽性であるかを示す、二値分類器として実装され得る。入力された病変のリストにある病変のすべてに対して二値分類を含む出力のセットは、偽陽性を除去するように病変のリストをフィルタリングするのに使用され得る。1つの例示的実施形態では、1つまたは複数のトレーニング済みML/DLコンピュータ・モデルが、最初に、患者レベルの動作点を実装して、分類の結果が、偽陽性をフィルタ除去しながら、病変のリスト内の病変のいずれかが真陽性であることを示しているかどうかを判定する。患者レベル(入力ボリュームレベル)のフィルタリングの後、最初にフィルタリングされた病変のリストに真陽性が残っている場合は、病変レベルの動作点を使用して、もしあれば、残っている偽陽性をフィルタ除去する。結果として、偽陽性を最小限に抑えるフィルタリングされた病変のリストが生成される。
【0200】
動作点の実装は、トレーニング済みML/DLコンピュータ・モデル1つのみまたは複数のトレーニング済みML/DLコンピュータ・モデルに対してのものであり得る。例えば、単一のトレーニング済みML/DLコンピュータ・モデルを使用すると、動作点は、動的に切り替えられ得るML/DLコンピュータ・モデルの動作パラメータの設定であり得る。例えば、ML/DLコンピュータ・モデルへの入力は、病変のリストが病変のそれぞれの分類後に真陽性を含むかどうかを示す結果を生成するように患者レベルの動作点を使用して処理されてよく、次に、真陽性を含めば、ML/DLコンピュータ・モデルの動作点が、病変レベルの動作点に切り替えられてよく、ML/DLコンピュータ・モデルを通過するたびに偽陽性で再び処理された入力は、偽陽性除去段階で出力された最終的な病変のリストから除去される。代替として、一部の例示的実施形態では、少なくとも1つの真陽性を示す第1のML/DLコンピュータ・モデルの結果により、第2のML/DLコンピュータ・モデルを通した入力と、両方のモデルが、AIパイプラインの偽陽性除去段階によって出力された最終的な病変のリストから除去されることによって識別された偽陽性との処理が引き起こされるような、2つの別々のML/DLコンピュータ・モデルが、1つが患者レベルの動作点に対して、もう1つが病変レベルの動作点に対して、トレーニングされることができる。
【0201】
ML/DLコンピュータ・モデルのトレーニングには、ML/DLコンピュータ・モデルが画像のボリュームおよび対応する病変のリストを含むトレーニング入力を処理する、機械学習トレーニング動作を伴うことがあり、この場合、病変のリストには、それが真陽性であるかそれとも偽陽性であるかに関して画像にある病変ごとに、分類を生成するように、病変マスクまたは輪郭が含まれる。トレーニング入力はさらに、画像が病変を含むかどうかを示し、次に、ML/DLコンピュータ・モデルによって生成された出力を評価し、損失または誤差を判断し、次に判断された損失/誤差を減らすようにML/DLコンピュータ・モデルの動作パラメータを修正するのに使用され得る、グラウンド・トゥルース情報に関連付けられる。このように、ML/DLコンピュータ・モデルは、真陽性/偽陽性病変検出を表している入力の特徴を学習する。この機械学習は、ML/DLコンピュータ・モデルの動作パラメータが患者レベルの感度/特異度または病変レベルの感度/特異度あるいはその両方を考慮に入れて学習されるように、動作点、すなわち、OPpatientとOPlesionのそれぞれに対して行われ得る。
【0202】
病変が真陽性であるのかそれとも偽陽性であるのかに関して病変を分類する際、入力ボリューム(「患者レベル」における患者に相当する)は、それが少なくとも1つの病変を含めば、陽性であると見なされる。入力ボリュームは、それが病変を何も含まなければ陰性であると見なされる。これを心に留めると、真陽性は、陽性の入力ボリューム、すなわち、実際には病変である病変として分類された検出結果が少なくとも1つある入力ボリュームと定義される。真陰性は、陰性の入力ボリューム、すなわち、病変がなく、病変として分類された検出結果が何もない、入力ボリュームと定義される。偽陽性は、病変が何もない陰性の入力ボリュームと定義されるが、この入力は、検出結果における病変を示す。すなわち、AIパイプラインは、病変が存在しない場合に病変をリストに載せる。偽陰性は、病変がある陽性の入力ボリュームと定義されるが、AIパイプラインは、検出結果には病変を示すことはない。トレーニング済みML/DLコンピュータ・モデルは、病変が真陽性であるかそれとも偽陽性であるかに関して入力において病変を分類する。偽陽性が、偽陽性除去によって生成された出力フィルタ除去される。偽陽性の検出は、患者レベルおよび病変レベルで、すなわち、2つの異なる動作点で、様々な感度/特異度のレベルにおいて行われる。
【0203】
患者レベルおよび病変レベルの2つの異なる動作点は、ROC曲線解析に基づき決定され得る。ROC曲線は、いくつかの病変(検査当たり0~K個の病変)を含み得るいくつかの入力ボリューム(例えば、様々な患者検査に対応するいくつかの入力ボリューム)から成るML/DLコンピュータ・モデル有効化データを使用して計算され得る。トレーニング済みML/DLコンピュータ・モデル、または「分類器」への入力は、実際の病変であるかそれとも偽陽性である入力においてそれまでに検出された検出結果であり、例えば、AIパイプラインの病変検出段階およびセグメント化段階の出力である。第1の動作点、すなわち患者レベルの動作点OPpatientは、真陽性と識別された病変の少なくともX%を維持するように定義される。つまり、いくつかの偽陽性を除去しながら、真陽性のほとんどすべてが保たれる。Xの値は、ROC曲線の解析に基づき設定され得、特定の実装に適した如何なる値でもあり得る。1つの例示的実施形態では、Xの値は、いくつかの偽陽性が除去される間に真陽性のほとんどすべてが維持されるように、98%に設定される。
【0204】
第2の動作点、すなわち病変レベルの動作点OPlesionは、病変感度が、第1の動作点、すなわち患者レベルの動作点OPpatientに対して得られた病変感度を上回るように、また特異度がY%を上回るように定義される。ここで、Yは、トレーニング済みML/DLコンピュータ・モデルの実際の性能によって決まる。1つの例示的実施形態では、Yは、30%に設定されている。患者レベルおよび病変レベルの動作点の決定のためのROC曲線の例が、図18Aに示されている。図18Aに示されるように、病変レベルの動作点は、病変感度が、患者レベルの動作点に対する病変感度を上回るように、病変レベルのROC曲線に沿って選択されている。
【0205】
図18Bは、1つの例示的実施形態に係る、患者レベルおよび病変レベルの動作点に基づき偽陽性除去を行うための動作の例示的なフロー図である。図18Bに示されるように、AIパイプラインのセグメント化段階論理の結果は、第1の動作点を実装する第1のトレーニング済みML/DLコンピュータ・モデル1820への入力1810である。入力1810は、入力ボリューム(または画像のボリューム(VOI))と、病変のリストとを含み、病変のリストは、画像のボリュームの画像データにおいて識別された病変のそれぞれに対応する画素またはボクセルを指定する病変マスクまたは輪郭データと、入力ボリュームの3次元空間、すなわち、これまでに述べたセグメント化、z方向接続、および輪郭の精密化の出力の3次元空間にどの病変が対応するかを明示する画素に対応付けられたラベルを含む病変のリストと、が含まれる。入力は、セットSと示され得る。第1のトレーニング済みML/DLコンピュータ・モデル1820は、トレーニング済みML/DLコンピュータ・モデル1820の分類によって生成された結果として得られたフィルタリングされた病変のリストにおいて維持されている真陽性と、結果として得られたリストにおいて除去されている偽陽性の一部とのX%、例えば98%で入力から抽出された特徴を分類するために、そのトレーニングにおいて患者レベルの動作点を実装する。結果として得られたリストには、第1のML/DLコンピュータ・モデル1820によって分類された真陽性病変を含むサブセットSと、第1のML/DLコンピュータ・モデル1820によって分類された偽陽性病変を含むサブセットSとが含まれる。
【0206】
偽陽性除去論理としてはさらに、第1のML/DLコンピュータ・モデル1820によって出力された真陽性サブセットが空であるかどうかを判定する真陽性評価論理1830が挙げられる。すなわち、真陽性評価論理1830は、Sからの要素に第1のML/DLコンピュータ・モデル1820によって真の病変として分類されるものが何もないかどうかを判定する。真陽性サブセットが空である場合、真陽性評価論理1830は、真陽性サブセットSが、フィルタリングされた病変のリスト1835として出力されるようにさせ、すなわち、AIパイプラインの病変分類段階に送られた出力において識別される病変が何もないことになる。真陽性評価論理1830が、真陽性サブセットSが空ではないと決定した場合、第2のML/DLコンピュータ・モデル1840が、入力Sを受けて実行され、この第2のML/DLコンピュータ・モデル1840は、そのトレーニングの際の第2の動作点、すなわち、病変レベルの動作点OPlesionを実装する。前述したように、2つのML/DLコンピュータ・モデル1820および1840が説明の便宜上示されているが、第2のML/DLコンピュータ・モデルが、1820と同じML/DLコンピュータ・モデルだが、第2の動作点に対応する動作パラメータが異なる、入力Sの処理であり得るように、同じML/DLコンピュータ・モデルを構成するためのトレーニング済み動作パラメータの様々なセットにおいて、これら2つの動作点が実装され得ることが、理解されるべきである。
【0207】
第2のML/DLコンピュータ・モデル1840は、病変が真陽性であるのかそれとも偽陽性であるのかに関して病変の分類を再び生成するように第2の動作点に対応するトレーニング済み動作パラメータにより入力を処理する。この結果は、予測病変(真陽性)を含むサブセットS'と予測偽陽性を含むサブセットS'である。それにより、フィルタリングされた病変のリスト1845がサブセットS'として出力され、それによりサブセットS'に指定された偽陽性を事実上なくす。
【0208】
図18Aおよび18Bに示される実施形態例については、患者レベルおよび病変レベルの動作点の観点から説明する。偽陽性除去のメカニズムが、様々な異なるレベルの動作点により実装され得ることが理解されるべきである。例えば、同様な動作が、「ボクセルごとの」偽陽性除去動作において、画像ボリュームレベル動作点およびボクセル・レベル動作点に対して行われ得る。図18Cは、1つの例示的実施形態に係る、入力ボリュームレベルおよびボクセル・レベルの動作点に基づきボクセルごとの偽陽性除去を行うための動作の例示的なフロー図である。図18Cにおける動作は、図18Bの動作と同様であるが、これらの動作は、入力セットSにあるボクセルに関して行われ得る。ボクセルごとの偽陽性除去では、第1の動作点がやはり患者レベルまたは入力ボリュームレベルの動作点であり得る一方、第2の動作点は、ボクセル・レベルの動作点OPvoxelにあり得る。この場合、真陽性および偽陽性は、ボクセル・レベルで評価され、任意のボクセルが病変に関連付けられているように示され、かつ、それが実際に病変に関連付けられている場合は、それは真陽性であるが、ボクセルが病変に関連付けられていると示され、かつ、それが実際には病変に関連付けられていない場合は、それは、偽陽性と見なされる。動作点の適切な設定は、上記のように感度と特異度との間で同様の釣り合いが実現されるように、対応するROC曲線に基づき再び生成され得る。
【0209】
偽陽性除去メカニズムの上記の例示的実施形態は、患者検査からの単一の入力ボリュームを想定しているが、この例示的実施形態が、1つまたは複数の画像(スライス)の任意のグループ化に適用され得ることも理解されるべきである。例えば、偽陽性除去が、単一のスライス、入力ボリュームより小さいスライスのセット、またはさらには同じ検査からの複数の入力ボリュームに適用されてもよい。
【0210】
図19は、1つの例示的実施形態に係る、AIパイプラインの偽陽性除去論理の例示的な動作の概要を示すフローチャートである。図19に示されるように、動作は、AIパイプラインの前段階から入力Sを受信する(ステップ1910)ことから開始する(ステップ1900)。ここで、入力は、例えば、画像の入力ボリュームと、マスク、輪郭などを含む対応する病変のリストとを含む。入力は、第1の動作点、例えば、相対的に特異度が高く感度が低い患者レベルの動作点を実装する、トレーニングされた第1のトレーニング済みML/DLコンピュータ・モデルによって処理されて、真陽性サブセットおよび偽陽性サブセットを含む病変に対して分類の第1のセットを生成する(ステップ1920)。真陽性サブセットが空であるかどうかに関して判定が下される(ステップ1930)。真陽性サブセットが空であれば、動作では、真陽性サブセットが、フィルタリングされた病変のリストとして出力され(ステップ1940)、この動作が終了する。真陽性サブセットが空でなければ、入力Sが、第1の動作点よりも相対的に感度が高く特異度が低い第2の動作点を実装する、トレーニングされた第2のML/DLコンピュータ・モデルによって処理される(ステップ1950)。前述したように、一部の例示的実施形態では、第1のML/DLコンピュータ・モデルおよび第2のML/DLコンピュータ・モデルは、同じモデルであり得るが、異なる動作点を実装する異なるトレーニングに対応する、異なる動作パラメータで構成され得る。第2のML/DLコンピュータ・モデルの処理の結果は、第2の真陽性サブセットおよび第2の偽陽性サブセットを含む病変に対する分類の第2のセットである。それにより、この第2の真陽性サブセットは、フィルタリングされた病変のリストとして出力され(ステップ1960)、この動作が終了する。
【0211】
[コンピュータ・システム環境例]
【0212】
例示的実施形態は、多くの様々な種類のデータ処理環境において利用され得る。例示的実施形態の特定の要素および機能性の記述に背景を与えるために、これ以降、図20および21が、例示的実施形態の態様が実装され得る例示的な環境として与えられる。図20および21が本発明の態様または実施形態が実装され得る環境に関して何ら限定を断定するものでも暗にほのめかすものでもないことが理解されるべきである。本発明の思想および範囲から逸脱することなく、示された環境に対して多くの修正がなされ得る。
【0213】
図20では、実施形態によっては、質疑回答(QA:Question Answering)パイプライン、治療推奨パイプライン、医用画像拡大パイプライン、または、生成された結果に対するプロセスを通してだが、ただし様々なコンピュータ固有プロセスを通して人間を近似させる複合人工知能メカニズムを使用してリクエストを処理する任意の他の人工知能(AI:Artificial Intelligence)もしくは認知コンピューティングベースのパイプラインであり得る、リクエスト処理パイプライン2008を実装する認知システム2000の1つの例示的実施形態の概略図を示す。この説明の便宜上、リクエスト処理パイプライン2008が、構造化リクエストまたは非構造化リクエストあるいはその両方を入力質問形態で動作するQAパイプラインとして実装されていると想定される。本明細書に記載の原理と併用され得る質問処理動作の1つの例が、その全体が参照により本明細書に組み込まれている米国特許出願公開第2011/0125734号に記載されている。
【0214】
認知システム2000は、コンピュータ・ネットワーク2002に接続された1つまたは複数のコンピューティング・デバイス2004A~D(1つまたは複数のプロセッサおよび1つまたは複数のメモリ、また場合によっては、バス、記憶デバイス、通信インターフェースなどを含む、当技術分野において一般的に知られている任意の他のコンピューティング・デバイス要素を含む)において実装されている。単に説明の便宜上、図20には、コンピューティング・デバイス2004Aにおいてしか実装されない認知システム2000を示すが、前述したように、認知システム2000は、複数のコンピューティング・デバイス2004A~Dなどの複数のコンピューティング・デバイスにわたって分散していてもよい。ネットワーク2002は、複数のコンピューティング・デバイス、すなわち、サーバ・コンピューティング・デバイスとして動作できるコンピューティング・デバイス2004A~Dと、互いに通信し、1つまたは複数の有線データ通信リンクまたは無線通信リンクあるいはその両方を介して他のデバイスまたは構成要素と通信する、クライアント・コンピューティング・デバイスとして動作できるコンピューティング・デバイス2010~2012とを含み、この場合、各通信リンクとして、ワイヤ、ルータ、スイッチ、送信機、受信機などのうちの1つまたは複数が挙げられる。一部の例示的実施形態では、認知システム2000およびネットワーク2002は、それらのそれぞれのコンピューティング・デバイス2010~2012を介し、1つまたは複数の認知システム・ユーザ対象の質疑処理および回答生成(QA)機能性を有効にする。他の実施形態では、認知システム2000およびネットワーク2002は、望ましい実装に応じて多くの様々な形態を取り得るリクエスト処理および認知応答生成、例えば、認知情報の取得、ユーザのトレーニング/指示、データの認知評価などを含むがこれらに限定されるわけではない他の種類の認知動作を提供することができる。認知システム2000の他の実施形態が、本明細書に描写されているもの以外の構成要素、システム、サブシステムまたはデバイスあるいはその組み合わせと共に使用され得る。
【0215】
認知システム2000は、様々なソースからの入力を受信するリクエスト処理パイプライン2008を実装するように構成されている。リクエストは、自然言語質問、情報に対する自然言語リクエスト、または認知動作の実行に対する自然言語リクエストなどの形態で提起され得る。例えば、認知システム2000が、ネットワーク2002、1つまたは複数の電子文書コーパス2006、認知システム・ユーザ、または他のデータおよび他のあり得る入力源あるいはその組み合わせから入力を受信する。1つの実施形態では、認知システム2000への入力のうちのいくつかまたはすべてがネットワーク2002を介してルーティングされる。ネットワーク2002にある様々なコンピューティング・デバイス2004A~Dは、内容制作者および認知システム・ユーザ用のアクセス・ポイントを含む。コンピューティング・デバイス2004A~Dのうちのいくつかは、1つまたは複数のデータ・コーパス2006(単に説明の便宜上、図20には別個のエンティティとして示されている)を格納するデータベース用のデバイスを含む。1つまたは複数のデータ・コーパス2006の一部は、1つまたは複数の他のネットワーク接続記憶デバイス、1つもしくは複数のデータベース、または図20にははっきりとは示されていない他のコンピューティング・デバイスでも提供され得る。ネットワーク2002は、認知システム2000が、局所および大域を含む、如何なる規模の環境でも、例えばインターネットでも動作できるように、様々な実施形態においてローカル・ネットワーク接続およびリモート接続を含む。
【0216】
1つの実施形態において、内容制作者は、認知システム2000を用いてデータ・コーパスの一部として使用するために、1つまたは複数のデータ・コーパス2006の文書において内容を制作する。文書としては、認知システム2000で使用するための任意のファイル、テキスト、記事、またはデータ源が挙げられる。認知システム・ユーザは、ネットワーク2002へのネットワーク接続またはインターネット接続を介して認知システム2000にアクセスし、1つまたは複数のデータ・コーパス2006内の内容に基づき回答/処理される質問/リクエストを認知システム2000に入力する。1つの実施形態では、質問/リクエストは、自然言語を使用して形成されている。認知システム2000は、パイプライン2008を介してこの質問/リクエストをパースし、解釈し、提示された質問への1つまたは複数の回答、リクエストへの応答、リクエストの処理結果などを含む、応答を認知システム・ユーザ、例えば認知システム・ユーザ2010に与える。一部の実施形態では、認知システム2000が、候補回答/応答のランク付けリスト内のユーザに応答を与え、他の例示的実施形態では、認知システム2000が、単一の最終的な回答/応答、または最終的な回答/応答と他の候補回答/応答のランク付けリストとの組み合わせを与える。
【0217】
認知システム2000は、1つまたは複数のデータ・コーパス2006から得られた情報に基づき、入力された質問/リクエストを処理するための複数の段階を含むパイプライン2008を実装する。パイプライン2008は、入力された質問/リクエストおよび1つまたは複数のデータ・コーパス2006の処理に基づき、入力された質問またはリクエストに対して回答/応答を生成する。
【0218】
一部の例示的実施形態では、認知システム2000は、これ以降述べる、例示的実施形態のメカニズムにより拡大された、ニューヨーク州アーモンクのInternational Business Machines Corporationから入手可能なIBM Watson(商標)認知システムであり得る。これまでに概説したように、IBM Watson(商標)認知システムのパイプラインは、入力された質問またはリクエストを受信し、次に、この質問またはリクエストが質問/リクエストの主要特徴を抽出するようにパースして、今度は、この主要特徴を使用して1つまたは複数のデータ・コーパス2006に適用されているクエリを定式化する。1つまたは複数のデータ・コーパス2006へのクエリの適用に基づいて、一連の仮説、または入力された質問/リクエストに対する候補の回答/応答が生成される。この生成は、入力された質問/応答(これ以降、入力された質問であると想定する)に対する価値ある応答を含む可能性をいくらか備える1つまたは複数のデータ・コーパス2006(これ以降、単にコーパス2006と呼ばれる)の部分を、1つまたは複数のデータ・コーパス2006にわたって探すことによって行われる。それにより、IBM Watson(商標)認知システムのパイプライン2008は、多様な推論アルゴリズムを使用して、クエリの適用時に確認された、入力された質問の言語およびコーパス2006の当該部分のそれぞれで使用される言語に対して深層解析を行う。
【0219】
それにより、様々な推論アルゴリズムから得られたスコアが、この例ではIBM Watson(商標)認知システム2000のパイプライン2008が、あり得る候補回答が質問によって推測されるという証拠に関して備えている信頼レベルをまとめる統計上のモデルに対して重み付けされる。このプロセスは、次に、入力された質問を提出したユーザ、例えばクライアント・コンピューティング・デバイス2010のユーザに提示され得る、またはそこから最終的な回答が選択され、ユーザに提示される、候補回答のランク付けリストを生成するように、候補回答のそれぞれに対して繰り返される。IBM Watson(商標)認知システム2000のパイプライン2008についての情報が、例えば、IBM Corporationウェブサイト、IBM Redbooksなどからさらに得られ得る。例えば、IBM Watson(商標)認知システムのパイプラインについての情報は、Yuanらによる「Watson And Healthcare」、IBM developerWorks、2011およびRob Highによる「The Era of Cognitive Systems:An Inside Look at IBM Watson and How it Works」、IBM Redbooks、2012で確認することができる。
【0220】
前述したように、クライアント・デバイスから認知システム2000への入力は、自然言語質問の形態で提起され得るが、例示的実施形態は、このようなものに限定されない。むしろ、入力質問を、実際には、IBM Watson(商標)などの認知システムの自然言語解析および解析メカニズムを含むがそれらに限定されるわけではない、構造化入力解析または非構造化入力解析あるいはその両方を使用してパースおよび解析され得る任意の適切な種類のリクエストとしてフォーマットまたは構造化して、認知分析を行うための基礎であって、この認知分析の結果をもたらす基礎を決定することができる。例えば、医師や患者などは、特定の医用画像ベースの動作について、例えば「患者ABCに存在する肝臓病変を識別する」または「患者に治療推奨を与える」または「患者ABCの肝臓病変の変化を識別する」などについて、クライアント・コンピューティング・デバイス2010を介してリクエストを認知システム2000に発行することができる。例示的実施形態によれば、このようなリクエストは、例示的実施形態の病変検出および分類メカニズムを採用して対象の解剖学的構造の病変、病変輪郭、病変分類、および輪郭のリストを提供する、認知コンピュータ動作に特に向けられてよく、認知システム2000は、このリストに対して動作して、認知コンピューティング出力を提供する。例えば、リクエスト処理パイプライン2008は、「患者ABCに存在する肝臓病変を識別する」などのリクエストを処理して、このリクエストをパースし、それにより、対象の解剖学的構造を「肝臓」であると識別することができ、特定の入力ボリュームは、患者「ABC」に対する医用画像ボリュームであり、解剖学的構造内の「病変」が識別されるべきである。このパージングに基づき、患者「ABC」に対応する特定の医用画像ボリュームが、コーパス2006から取得され、病変検出および分類AIパイプライン2020に入力され得る。病変検出および分類AIパイプライン2020は、肝臓病変のリストを識別するために、上述したようにこの入力ボリュームに対して動作する。肝臓病変のリストは、医用画像ビューア・アプリケーション出力などを生成するために、リクエスト処理パイプライン2008を通したさらなる評価のために認知コンピューティング・システム2000に出力される。
【0221】
図20に示されるように、コンピューティング・デバイスのうちの1つまたは複数、例えばサーバ2004は、例えば、図1におけるAIパイプライン100などの、病変検出および分類AIパイプライン2020を実装するように特に構成され得る。コンピューティング・デバイスの構成には、例示的実施形態に関して本明細書に記載の動作の実施および出力の生成を促進するように、特定用途向けハードウェア、ファームウェアなどの提供が含まれ得る。コンピューティング・デバイスの構成には、さらにまたは代替として、コンピューティング・デバイスの1つまたは複数のハードウェア・プロセッサに、例示的実施形態に関して本明細書に記載の動作を行い出力を生成するようにプロセッサを構成するソフトウェア・アプリケーションを実行させるのに、1つまたは複数の記憶デバイスに格納され、またサーバ2004などのコンピューティング・デバイスのメモリに読み込まれるソフトウェア・アプリケーションの提供が含まれ得る。また、特定用途向けハードウェア、ファームウェア、ハードウェアにおいて実行されるソフトウェア・アプリケーションなどの如何なる組み合わせも、例示的実施形態の思想および範囲から逸脱することなく使用され得る。
【0222】
コンピューティング・デバイスがこれらのやり方のうちの1つで構成されると、コンピューティング・デバイスは、例示的実施形態のメカニズムを実装するように特に構成された特殊なコンピューティング・デバイスになり、汎用コンピューティング・デバイスではないことが理解されるべきである。また、本明細書に記載のように、例示的実施形態のメカニズムの実装によって、コンピューティング・デバイスの機能性が改善し、対象の解剖学的構造における自動病変検出だけではなく、このような病変の分類も促進する有用で具体的な結果がもたらされ、これにより、手動プロセスに比べて、誤差を減らし、効率を高める。
【0223】
前述したように、例示的実施形態のメカニズムは、特に構成されたコンピューティング・デバイスまたはデータ処理システムを、解剖学的構造の識別、病変の検出および分類を行うための動作を実施するのに利用する。これらのコンピューティング・デバイス、またはデータ処理システムは、ハードウェア構成、ソフトウェア構成、またはハードウェアとソフトウェアとの組み合わせによって、本明細書に記載のシステム/サブシステムのうちの1つまたは複数を実装するように特に構成された様々なハードウェア要素を備え得る。図21は、例示的実施形態の態様が実装されてよい、データ処理システムのほんの一例のブロック図である。データ処理システム2100は、本発明の例示的実施形態のプロセスおよび態様を実装するコンピュータ使用可能コードまたは命令が、本明細書に記載のような例示的実施形態の動作、出力、および外部効果をもたらすように配置されるかまたは実行されるかあるいその両方がなされ得る、図20におけるサーバ2004などのコンピュータの一例である。
【0224】
描写の例では、データ処理システム2100には、ノース・ブリッジおよびメモリ・コントローラ・ハブ(NB/MCH)2102と、サウス・ブリッジおよび入出力(I/O)コントローラ・ハブ(SB/ICH)2104とを含むハブ・アーキテクチャを採用する。処理ユニット2106、メイン・メモリ2108、およびグラフィックス・プロセッサ2110がNB/MCH2102に接続されている。グラフィックス・プロセッサ2110は、加速グラフィックス・ポート(AGP:Accelerated Graphics Port)を通してNB/MCH2102に接続され得る。
【0225】
示された例では、ローカル・エリア・ネットワーク(LAN)アダプタ2112がSB/ICH2104に接続する。オーディオ・アダプタ2116、キーボードおよびマウス・アダプタ2120、モデム2122、読み取り専用メモリ(ROM)2124、ハード・ディスク・ドライブ(HDD:Hard Disk Drive)2126、CD-ROMドライブ2130、ユニバーサル・シリアル・バス(USB:Universal Serial Bus)ポートおよび他の通信ポート2132、さらにPCI/PCIeデバイス2134が、バス2138およびバス2140を通してSB/ICH2104に接続する。PCI/PCIeデバイスとしては、例えば、イーサネット(登録商標)・アダプタ、アドイン・カード、またノートブック・コンピュータ用のPCカードを挙げることができる。PCIでは、カード・バス・コントローラを使用するが、PCIeでは使用しない。ROM2124は、例えば、フラッシュ基本入出力システム(BIOS:Basic Input/Output System)であり得る。
【0226】
HDD2126およびCD-ROMドライブ2130は、バス2140を通してSB/ICH2104に接続する。HDD2126およびCD-ROMドライブ2130では、例えば、一体型ドライブ電子機器(IDE:Integrated Drive Electronics)またはシリアル・アドバンスト・テクノロジー・アタッチメント(SATA:Serial Advanced Technology Attachment)インターフェースを使用することができる。スーパーI/O(SIO:Super I/O)デバイス2136が、SB/ICH2104に接続され得る。
【0227】
オペレーティング・システムは、処理ユニット2106において作動する。このオペレーティング・システムは、図21におけるデータ処理システム2100内の様々な構成要素を連係させ、その制御をもたらす。クライアントとしては、オペレーティング・システムは、Microsoft(登録商標)Windows10(登録商標)などの市販のオペレーティング・システムであり得る。Java(登録商標)プログラミング・システムなどのオブジェクト指向プログラミング・システムは、オペレーティング・システムと相まって作動することができ、データ処理システム200において実行されるJava(登録商標)プログラムまたはアプリケーションからオペレーティング・システムに呼び出しを与える。
【0228】
サーバとしては、データ処理システム2100は、例えば、アドバンスト・インタラクティブ・エグゼクティブ(AIX(登録商標))オペレーティング・システム、またはLINUX(登録商標)オペレーティング・システムを作動させる、IBM eServer(登録商標)System p(登録商標)コンピュータ・システム、Power(登録商標)プロセッサ・ベース・コンピュータ・システムなどであり得る。データ処理システム2100は、処理ユニット2106に複数のプロセッサを含む対称型マルチプロセッサ(SMP:Symmetric MultiProcessor)システムであり得る。代替として、シングル・プロセッサ・システムが採用されてもよい。
【0229】
オペレーティング・システム、オブジェクト指向プログラミング・システム、およびアプリケーションまたはプログラム対象の命令が、HDD2126などの記憶デバイスに位置し、処理ユニット2106による実行に向けてメイン・メモリ2108に読み込まれる。本発明の例示的実施形態のプロセスが、例えばメイン・メモリ2108、ROM2124などのメモリに、または例えば1つまたは複数の周辺機器2126および2130に位置し得るコンピュータ使用可能プログラム・コードを使用して処理ユニット2106によって行われ得る。
【0230】
図21に示されるようなバス2138またはバス2140などのバス・システムは、1つまたは複数のバスで構成されていることがある。当然、バス・システムは、ファブリックまたはアーキテクチャに取り付けられた様々な構成要素またはデバイス間のデータ転送を提供する任意の種類の通信ファブリックまたは通信アーキテクチャを使用して実装され得る。図21のモデム2122またはネットワーク・アダプタ2112などの通信ユニットとしては、データを送受信するのに使用される1つまたは複数のデバイスを挙げることができる。メモリは、例えば、図21におけるNB/MCH2102に見られるものなど、メイン・メモリ2108、ROM2124、またはキャッシュであり得る。
【0231】
これまで述べたように、一部の例示的実施形態では、その例示的実施形態のメカニズムは、特定用途向けハードウェアもしくはファームウェアなど、または、処理ユニット2106などの1つまたは複数のハードウェア・プロセッサによる実行に向けて、HDD2126などの記憶デバイスに格納され、メイン・メモリ2108などのメモリに読み込まれるアプリケーション・ソフトウェアなどとして実装され得る。このように、図21に示されるコンピューティング・デバイスは、例示的実施形態のメカニズムを実装するように特に構成され、また病変検出および分類人工知能パイプラインに関して本明細書に記載の動作を行い出力を生成するように特に構成されるようになる。
【0232】
当業者であれば、図20および21におけるハードウェアが実装によって異なる場合があることを理解するであろう。フラッシュ・メモリ、同等の不揮発性メモリ、または光ディスク・ドライブなどの他の内部ハードウェアまたは周辺機器が、図20および21に示されたハードウェアに加えてまたはその代わりに使用され得る。また、この例示的実施形態のプロセスが、本発明の思想および範囲から逸脱することなく、これまで述べたSMPシステム以外のマルチプロセッサ・データ処理システムに適用されてもよい。
【0233】
また、データ処理システム2100は、クライアント・コンピューティング・デバイス、サーバ・コンピューティング・デバイス、タブレット・コンピュータ、ラップトップ・コンピュータ、電話機または他の通信デバイス、携帯情報端末(PDA:Personal Digital Assistant)などを含むいくつかの様々なデータ処理システムのいずれの形態も取り得る。一部の例示的な例では、データ処理システム2100は、例えば、オペレーティング・システム・ファイルまたはユーザ生成データあるいはその両方を格納するための不揮発性メモリを提供するフラッシュ・メモリ構成されているポータブル・コンピューティング・デバイスであり得る。本来、データ処理システム2100は、構築上の制約を伴わない、知られているまたはこれから開発される如何なるデータ処理システムでもあり得る。
【0234】
前述したように、例示的実施形態が、全体がハードウェアの実施形態、全体がソフトウェアの実施形態、またはハードウェア要素もソフトウェア要素も含む実施形態の形態を取り得ることが理解されるべきである。1つの実施形態例では、例示的実施形態のメカニズムは、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むがそれらに限定されるわけではないソフトウェアまたはプログラム・コードにおいて実装され得る。
【0235】
プログラム・コードを格納しまたは実行するあるいはその両方を行うのに適したデータ処理システムであれば、例えばシステム・バスなどの通信バスを通して記憶素子に直接にまたは間接的に結合された少なくとも1つのプロセッサを含むことになる。記憶素子としては、プログラム・コードの実際の実行時に採用されるローカル・メモリと、大容量記憶域と、コードを実行時に大容量記憶域から取得しなければならない回数を減らすために、少なくとも何らかのプログラム・コードの一時的記憶をもたらすキャッシュ・メモリとを挙げることができる。メモリは、ROM、PROM、EPROM、EEPROM、DRAM、SRAM、フラッシュ・メモリ、ソリッド・ステート・メモリなどを含むがこれらに限定されるわけではない様々な型式のものであり得る。
【0236】
入出力デバイスすなわちI/Oデバイス(キーボード、ディスプレイ、ポインティング・デバイスなどを含むがこれらに限定されるわけではない)は、直接的に、または介在する有線または無線のI/Oインターフェースまたはコントローラあるいはその両方などを通して、このシステムに結合され得る。I/Oデバイスは、例えば、スマートフォン、タブレット・コンピュータ、タッチ・スクリーン・デバイス、音声認識デバイスなどを含むがこれらに限定されるわけではない、無線または有線の接続を通して結合された通信デバイスなど、従来のキーボード、ディスプレイ、ポインティング・デバイスなど以外の多くの様々な形態を取り得る。知られているまたはこれから開発される如何なるI/Oデバイスも、例示的実施形態の範囲内にあると意図されるものである。
【0237】
ネットワーク・アダプタをシステムに結合して、データ処理システムを、介在する私設網または公衆網を通して他のデータ処理システムまたは遠隔プリンタまたは記憶デバイスに結合できるようにしてもよい。モデム、ケーブル・モデム、およびイーサネット・カードは、有線通信用の現在使用可能なネットワーク・アダプタ型式のほんの一部にすぎない。802.11a/b/g/n無線通信アダプタ、Bluetooth(登録商標)無線アダプタなどを含むがこれらに限定されるわけではない、無線通信ベースのネットワーク・アダプタも、利用され得る。知られているまたはこれから開発される如何なるネットワーク・アダプタも、本発明の思想および範囲内にあると意図されるものである。
【0238】
本発明の説明は、例示および説明の目的で提示されており、開示されている形態の本発明を網羅することもそれに限定されることも意図するものではない。当業者には、記載の実施形態の範囲および思想から逸脱しない、多くの修正および変形が明らかになるであろう。実施形態は、本発明の原理や実際の適用を一番良く説明するため、および、当業者が、企図される特定の使用に適した様々な修正を伴う様々な実施形態について本発明を理解できるようにするために選択および説明された。本明細書で使用される専門用語は、実施形態の原理、市場で見られる技術を凌ぐ実際の適用または技術的改善を一番うまく説明するため、または、当業者が、本明細書に開示の実施形態を理解できるようにするために選択された
[項目1]
少なくとも1つのプロセッサおよび少なくとも1つのメモリを備えているデータ処理システムにおける方法であって、前記少なくとも1つのメモリが、前記少なくとも1つのプロセッサによって実行されて、z方向の病変の接続性を決定するためのトレーニング済み機械学習コンピュータ・モデルを実装するための命令を含んでおり、前記方法が、
3次元医用画像内の所与のスライスに関して、前記3次元医用画像内の前記所与のスライス内の第1の病変および隣接するスライス内の第2の病変を識別する段階と、
前記第1の病変に関して前記第1の病変と前記第2の病変の間の第1の交差値を決定する段階と、
前記第2の病変に関して前記第1の病変と前記第2の病変の間の第2の交差値を決定する段階と、
前記第1の交差値および前記第2の交差値に基づいて、前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定する段階と
を備えている、方法。
[項目2]
前記第1の交差値を決定する段階が、前記第1の交差値r を次のように計算する段階を有し、
【数9】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示す、
項目1に記載の方法。
[項目3]
前記第2の交差値を決定する段階が、前記第2の交差値r を次のように計算する段階を有し、
【数10】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示す、
項目1または2に記載の方法。
[項目4]
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定する段階が、前記第1の交差値および前記第2の交差値を特徴として前記トレーニング済み機械学習コンピュータ・モデルに提供する段階を有し、前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の病変および前記第2の病変が同じ3次元の病変に属している確率を生成する、項目1から3のいずれか一項に記載の方法。
[項目5]
前記トレーニング済み機械学習コンピュータ・モデルがロジスティック回帰モデルである、項目4に記載の方法。
[項目6]
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定する段階が、前記第1の病変および前記第2の病変が同じ3次元の病変に属している前記確率が既定のしきい値tより大きいかどうかを判定する段階を有する、項目4または5に記載の方法。
[項目7]
前記3次元医用画像のすべてのスライスについて、各スライス内の各第1の病変および各隣接するスライス内の各第2の病変が同じ3次元の病変に属しているかどうかを判定する段階と、
前記3次元医用画像内の同じ3次元の病変に属している病変をz軸に沿って接続する段階と
をさらに備えている、項目1から6のいずれか一項に記載の方法。
[項目8]
前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の交差値r および前記第2の交差値r を次のように線形に結合することを学習し、
【数11】
、c 、およびbが、機械学習トレーニング動作によってトレーニング・ボリュームから学習される動作パラメータである、
項目1から7のいずれか一項に記載の方法。
[項目9]
コンピューティング・デバイスに、z方向の病変の接続性を決定するためのトレーニング済み機械学習コンピュータ・モデルを実装する手順であって、前記トレーニング済み機械学習コンピュータ・モデルが、
3次元医用画像内の所与のスライスに関して、前記3次元医用画像内の前記所与のスライス内の第1の病変および隣接するスライス内の第2の病変を識別することと、
前記第1の病変に関して前記第1の病変と前記第2の病変の間の第1の交差値を決定することと、
前記第2の病変に関して前記第1の病変と前記第2の病変の間の第2の交差値を決定することと、
前記第1の交差値および前記第2の交差値に基づいて、前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することと
を実行する、手順を実行させるためのコンピュータ・プログラム。
[項目10]
前記第1の交差値を決定することが、前記第1の交差値r を次のように計算することを含み、
【数12】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示す、
項目9に記載のコンピュータ・プログラム。
[項目11]
前記第2の交差値を決定することが、前記第2の交差値r を次のように計算することを含み、
【数13】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示す、
項目9または10に記載のコンピュータ・プログラム。
[項目12]
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することが、前記第1の交差値および前記第2の交差値を特徴として前記トレーニング済み機械学習コンピュータ・モデルに提供することを含み、前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の病変および前記第2の病変が同じ3次元の病変に属している確率を生成する、項目9から11のいずれか一項に記載のコンピュータ・プログラム。
[項目13]
前記トレーニング済み機械学習コンピュータ・モデルがロジスティック回帰モデルである、項目12に記載のコンピュータ・プログラム。
[項目14]
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することが、前記第1の病変および前記第2の病変が同じ3次元の病変に属している前記確率が既定のしきい値tより大きいかどうかを判定することを含む、項目12または13に記載のコンピュータ・プログラム。
[項目15]
前記トレーニング済み機械学習コンピュータ・モデルが、
前記3次元医用画像のすべてのスライスについて、各スライス内の各第1の病変および各隣接するスライス内の各第2の病変が同じ3次元の病変に属しているかどうかを判定することと、
前記3次元医用画像内の同じ3次元の病変に属している病変をz軸に沿って接続することと
を実行する、
項目9から14のいずれか一項に記載のコンピュータ・プログラム。
[項目16]
前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の交差値r および前記第2の交差値r を次のように線形に結合することを学習し、
【数14】
、c 、およびbが、機械学習トレーニング動作によってトレーニング・ボリュームから学習される動作パラメータである、
項目9から15のいずれか一項に記載のコンピュータ・プログラム。
[項目17]
プロセッサと、
前記プロセッサに結合されたメモリと
を備えている装置であって、
前記メモリが、前記プロセッサによって実行された場合に、前記プロセッサに、z方向の病変の接続性を決定するためのトレーニング済み機械学習コンピュータ・モデルを実装させる命令を含み、前記トレーニング済み機械学習コンピュータ・モデルが実行されて、
3次元医用画像内の所与のスライスに関して、前記3次元医用画像内の前記所与のスライス内の第1の病変および隣接するスライス内の第2の病変を識別することと、
前記第1の病変に関して前記第1の病変と前記第2の病変の間の第1の交差値を決定することと、
前記第2の病変に関して前記第1の病変と前記第2の病変の間の第2の交差値を決定することと、
前記第1の交差値および前記第2の交差値に基づいて、前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することと
を実行する、
装置。
[項目18]
前記第1の交差値を決定することが、前記第1の交差値r を次のように計算することを含み、
【数15】
Aが前記第1の病変であり、Bが前記第2の病変であり、|A|が前記第1の病変の面積を示し、|B|が前記第2の病変の面積を示し、|A∩B|が前記第1の病変と前記第2の病変の共通集合の面積を示し、
前記第2の交差値を決定することが、前記第2の交差値r を次のように計算することを含む、
【数16】
項目17に記載の装置。
[項目19]
前記第1の病変および前記第2の病変が同じ3次元の病変に属しているかどうかを判定することが、前記第1の交差値および前記第2の交差値を特徴として前記トレーニング済み機械学習コンピュータ・モデルに提供することを含み、前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の病変および前記第2の病変が同じ3次元の病変に属している確率を生成する、項目17または18に記載の装置。
[項目20]
前記トレーニング済み機械学習コンピュータ・モデルが、前記第1の交差値r および前記第2の交差値r を次のように線形に結合することを学習し、
【数17】
、c 、およびbが、機械学習トレーニング動作によってトレーニング・ボリュームから学習される動作パラメータである、
項目17から19のいずれか一項に記載の装置。
【符号の説明】
【0239】
100 AIパイプライン
128 構造最小量決定
130 肝臓/病変検出論理段階
132 ML/DLコンピュータ・モデルの集団
133 ML/DLコンピュータ・モデルの集団
134 ML/DLコンピュータ・モデルの集団
135 ML/DLコンピュータ・モデルの集団、病変、検出マップ
136 ML/DLコンピュータ・モデルの集団
140 病変セグメント化論理段階
148 リスト、入力
150 偽陽性処理段階
160 病変分類段階
600 ML/DLコンピュータ・モデルの集団
610 第1のML/DLコンピュータ・モデル
612 U-Netニューラル・ネットワーク・モデル
614 肝臓マスク
620 第2のML/DLコンピュータ・モデル
621 DenseNet-169(D169)エンコーダ
622 デコーダ、エンコーダ
623 デコーダ、エンコーダ、スライス平均化(SLC AVG)論理
624 出力、病変出力、病変予測出力
625 出力、病変出力、病変予測出力
626 SLC AVGモジュール
627 一貫性の損失、一貫性の損失論理
630 第3のML/DLコンピュータ・モデル
634 エンコーダ・セクション、エンコーダ、エンコーダ・ニューラル・ネットワーク、CNN
635 エンコーダ・セクション、エンコーダ、エンコーダ・ニューラル・ネットワーク、CNN
636 エンコーダ・セクション、エンコーダ、エンコーダ・ニューラル・ネットワーク、CNN
638 デコーダ段階、デコーダ
639 第2の損失関数、深層監視
640 平均演算、ボリューム平均化(VOL AVG)論理
650 Final Lesion mask、最終的な病変出力
660 肝臓マスク出力
810 第1の段階
820 第2の段階
910 病変域
911 病変
912 病変
913 病変
1051 シード
1061 シード
1071 シード
1101 2次元病変マスク
1111 距離マップ
1112 シード
1113 流域分割病変マスク
1121 更新済み分割病変マスク
1310 スライス
1311 病変
1312 病変
1320 スライス
1321 病変
1330 スライス
1331 病変
1332 病変
1611 輪郭
1612 輪郭
1810 入力
1820 第1のトレーニング済みML/DLコンピュータ・モデル
1830 真陽性評価論理回路
1835 フィルタ処理済み病変のリスト
1840 第2のML/DLコンピュータ・モデル
1845 フィルタ処理済み病変のリスト
2000 認知システム
2002 コンピュータ・ネットワーク
2004A コンピューティング・デバイス、サーバ
2004B コンピューティング・デバイス
2004C コンピューティング・デバイス
2004D コンピューティング・デバイス
2006 コーパス
2006 電子文書コーパスもしくは電子文書コーポラ、データ・コーパスもしくはデータ・コーポラ
2007 認知システム
2008 リクエスト処理パイプライン
2010 認知システム・ユーザ
2010~2012 クライアント・コンピューティング・デバイス
2020 病変検出および分類AIパイプライン
2100 データ処理システム
2102 メモリ・コントローラ・ハブ(NB/MCH)
2104 入力/出力(I/O)コントローラ・ハブ(SB/ICH)
2106 処理ユニット
2108 メイン・メモリ
2110 グラフィックス・プロセッサ
2112 ローカル・エリア・ネットワーク(LAN)アダプタ
2116 可聴アダプタ
2120 キーボードおよびマウスアダプタ
2122 モデム
2124 読み取り専用メモリ(ROM)
2126 ハード・ディスク・ドライブ(HDD)、周辺機器
2130 CD-ROMドライブ、周辺機器
2132 ユニバーサル・シリアル・バス(USB:Universal Serial Bus)ポートおよび他の通信ポート
2134 PCI/PCIeデバイス
2136 スーパーI/O(SIO:Super I/O)デバイス
2138 バス
2140 バス
図1
図2
図3A
図3B
図3C
図4A
図4B
図4C
図5
図6
図7
図8
図9
図10A
図10B
図10C
図10D
図11A
図11B
図12
図13A
図13B
図13C
図14A
図14B
図15
図16
図17
図18A
図18B
図18C
図19
図20
図21