IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ メラティヴ ユーエス エル.ピー.の特許一覧

特許7540873生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ
<>
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図1
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図2
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図3
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図4
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図5
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図6
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図7
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図8
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図9
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図10
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図11
  • 特許-生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-19
(45)【発行日】2024-08-27
(54)【発明の名称】生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240820BHJP
   G06N 3/0455 20230101ALI20240820BHJP
   G06T 7/10 20170101ALI20240820BHJP
   G06V 10/70 20220101ALI20240820BHJP
【FI】
G06T7/00 350C
G06N3/0455
G06T7/00 612
G06T7/10
G06V10/70
【請求項の数】 9
(21)【出願番号】P 2023148849
(22)【出願日】2023-09-14
(62)【分割の表示】P 2021500531の分割
【原出願日】2019-07-15
(65)【公開番号】P2023175804
(43)【公開日】2023-12-12
【審査請求日】2023-09-14
(31)【優先権主張番号】16/037,264
(32)【優先日】2018-07-17
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】523223135
【氏名又は名称】メラティヴ ユーエス エル.ピー.
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】デュフォール、ポール
【審査官】岡本 俊威
(56)【参考文献】
【文献】特開2018-005773(JP,A)
【文献】米国特許出願公開第2018/0033144(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06N 3/0455
G06V 10/70 -10/84
(57)【特許請求の範囲】
【請求項1】
プロセッサとメモリとを含み、前記メモリが、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ・エンジンを実装するように前記プロセッサを特に構成するために前記プロセッサにより実行される命令を含む、データ処理システムにおける方法であって、
ニューラル・ネットワークを、入力画像に基づいてオリジナル画像を予測するノックアウト・オートエンコーダとして使用されるようにトレーニングすることであり、
前記ニューラル・ネットワークをトレーニングすることは、
1組のトレーニング画像のうちの各トレーニング画像について、前記トレーニング画像の1つまたは複数のノックアウト・パッチを選択することと、前記1つまたは複数のノックアウト・パッチをノイズで満たしてノックアウト画像を形成することと、前記ノックアウト画像内の残りのピクセルを考慮して前記ノックアウト画像の前記ノックアウト・パッチ内の予想されるコンテンツに基づいて、前記トレーニング画像を予測するように、前記ニューラル・ネットワークをトレーニングすることとを含み、
前記ニューラル・ネットワークは、前記トレーニング画像内で予想されるピクセル値を予測するための出力確率分布をピクセルごとに生成し、出力し、
前記オリジナル画像は前記トレーニング画像に対応し、前記入力画像は前記ノックアウト画像に対応する、ことと、
前記ノックアウト・オートエンコーダ・エンジンによって、前記入力画像としての生物医学画像を前記ニューラル・ネットワークに提供することと、
前記ニューラル・ネットワークによって、前記生物医学画像内の各ピクセルの確率分布を出力することであって、各確率分布が、前記生物医学画像内の所与のピクセルについての予想ピクセル値の予測確率分布を表す、ことと、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常検出コンポーネントによって、各ピクセルが予想値を有する確率を前記確率分布に基づいて判定して、複数の予想ピクセル確率を形成することと、
前記異常検出コンポーネントによって、前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出することと、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常マーキング・コンポーネントによって、前記生物医学画像内で検出された異常をマーキングして、マーキング生物医学画像を形成することと、
前記ノックアウト・オートエンコーダ・エンジンによって、前記マーキング生物医学画像を出力することと
を含む、方法。
【請求項2】
前記1組のトレーニング画像が、健康な患者の複数の生物医学画像を含む、請求項1に記載の方法。
【請求項3】
1つまたは複数のノックアウト・パッチを選択することが、前記トレーニング画像内の1つまたは複数のランダム・パッチを選択することを含む、請求項1または2に記載の方法。
【請求項4】
前記ニューラル・ネットワークが畳み込みニューラル・ネットワークを含む、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記畳み込みニューラル・ネットワークがU-netを含む、請求項4に記載の方法。
【請求項6】
各ピクセルが予想値を有する確率を前記確率分布に基づいて判定することが、
所与のピクセル値を有する前記生物医学画像内の所与の各ピクセルについて、前記所与のピクセルに対応する所与の確率分布において前記所与のピクセル値に対応する確率値を識別することを含む、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出することが、
前記複数の予想ピクセル確率のうちの各予想ピクセル確率を所定の閾値と比較することと、
前記複数の予想ピクセル確率のうちの1つまたは複数が前記所定の閾値より小さいことに応答して、前記生物医学画像に異常があると判定することとを含む、請求項1~6のいずれか1項に記載の方法。
【請求項8】
コンピューティング・デバイスが実行するコンピュータ・プログラムであって、前記コンピュータ・プログラムが、前記コンピューティング・デバイス上で実行されると、
前記コンピューティング・デバイスに生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ・エンジンを実装させ、
ニューラル・ネットワークを、入力画像に基づいてオリジナル画像を予測するノックアウト・オートエンコーダとして使用されるようにトレーニングし、
前記ニューラル・ネットワークをトレーニングすることは、
1組のトレーニング画像のうちの各トレーニング画像について、前記トレーニング画像の1つまたは複数のノックアウト・パッチを選択することと、前記1つまたは複数のノックアウト・パッチをノイズで満たしてノックアウト画像を形成することと、前記ノックアウト画像内の残りのピクセルを考慮して前記ノックアウト画像の前記ノックアウト・パッチ内の予想されるコンテンツに基づいて、前記トレーニング画像を予測するように、前記ニューラル・ネットワークをトレーニングすることとを含み、
前記ニューラル・ネットワークは、前記トレーニング画像内で予想されるピクセル値を予測するための出力確率分布をピクセルごとに生成し、出力し、
前記オリジナル画像は前記トレーニング画像に対応し、前記入力画像は前記ノックアウト画像に対応し、
前記ノックアウト・オートエンコーダ・エンジンによって、前記入力画像としての生物医学画像を前記ニューラル・ネットワークに提供し、
前記ニューラル・ネットワークによって、前記生物医学画像内の各ピクセルの確率分布を出力し、各確率分布が、前記生物医学画像内の所与のピクセルについての予想ピクセル値の予測確率分布を表し、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常検出コンポーネントによって、各ピクセルが予想値を有する確率を前記確率分布に基づいて判定して、複数の予想ピクセル確率を形成し、
前記異常検出コンポーネントによって、前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出し、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常マーキング・コンポーネントによって、前記生物医学画像内で検出された異常をマーキングして、マーキング生物医学画像を形成し、
前記ノックアウト・オートエンコーダ・エンジンによって、前記マーキング生物医学画像を出力する、コンピュータ・プログラム。
【請求項9】
装置であって、
プロセッサと、
前記プロセッサに結合されたメモリとを含み、
前記メモリが、前記プロセッサによって実行されると前記プロセッサに生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ・エンジンを実装させる命令を含み、
前記命令により、前記プロセッサが、
ニューラル・ネットワークを、入力画像に基づいてオリジナル画像を予測するノックアウト・オートエンコーダとして使用されるようにトレーニングし、
前記ニューラル・ネットワークをトレーニングすることは、
1組のトレーニング画像のうちの各トレーニング画像について、前記トレーニング画像の1つまたは複数のノックアウト・パッチを選択することと、前記1つまたは複数のノックアウト・パッチをノイズで満たしてノックアウト画像を形成することと、前記ノックアウト画像内の残りのピクセルを考慮して前記ノックアウト画像の前記ノックアウト・パッチ内の予想されるコンテンツに基づいて、前記トレーニング画像を予測するように、前記ニューラル・ネットワークをトレーニングすることとを含み、
前記ニューラル・ネットワークは、前記トレーニング画像内で予想されるピクセル値を予測するための出力確率分布をピクセルごとに生成し、出力し、
前記オリジナル画像は前記トレーニング画像に対応し、前記入力画像は前記ノックアウト画像に対応し、
前記ノックアウト・オートエンコーダ・エンジンによって、前記入力画像としての生物医学画像を前記ニューラル・ネットワークに提供し、
前記ニューラル・ネットワークによって、前記生物医学画像内の各ピクセルの確率分布を出力し、各確率分布が、前記生物医学画像内の所与のピクセルについての予想ピクセル値の予測確率分布を表し、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常検出コンポーネントによって、各ピクセルが予想値を有する確率を前記確率分布に基づいて判定して、複数の予想ピクセル確率を形成し、
前記異常検出コンポーネントによって、前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出し、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常マーキング・コンポーネントによって、前記生物医学画像内で検出された異常をマーキングして、マーキング生物医学画像を形成し、
前記ノックアウト・オートエンコーダ・エンジンによって、前記マーキング生物医学画像を出力する、装置。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、一般に、改良されたデータ処理装置および方法に関し、より詳細には、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダをトレーニングおよび使用するメカニズムに関する。
【背景技術】
【0002】
機械学習において、畳み込みニューラル・ネットワーク(CNNまたはConvNet)は、視覚像の解析に最も一般的に適用されるフィードフォワード人工ディープ・ニューラル・ネットワークの一種である。CNNは、最小限の前処理しか必要としないように設計された多層パーセプトロンのバリエーションを使用する。CNNは、その重み共有アーキテクチャおよび並進不変特性に基づく、シフト不変または空間不変人工ニューラル・ネットワーク(SIANN)としても知られている。畳み込みネットワークは、ニューロン間の接続パターンが動物の視覚野の組織に類似しているという点で、生物学的過程から着想を得ている。個々の皮質ニューロンは、受容野として知られる視野の限定された領域における刺激のみに応答する。異なるニューロンの受容野は、全視野を覆うように部分的に重なり合っている。CNNは、他の画像分類アルゴリズムと比較して比較的少ない前処理を使用する。これは、このネットワークが、従来のアルゴリズムでは人の手で設計されていたフィルタを学習することを意味する。この特徴設計における予備知識と人的労力からの独立が、主な利点である。CNNは、画像および動画認識、レコメンダ・システム、および自然言語処理に応用されている。
【0003】
U-Netは、生物医学画像セグメンテーションのために開発された畳み込みニューラル・ネットワークである。このネットワークは、完全畳み込みネットワークに基づいており、そのアーキテクチャが、より少ないトレーニング画像を使って動作して、より正確なセグメンテーションをもたらすように変更および拡張されている。ネットワークは、収束経路(contracting path)と拡散経路(expansive path)とから構成され、U字形アーキテクチャを呈する。収束経路は、畳み込みの反復適用と、それに各々続く正規化線形ユニット(ReLU)および最大プーリング動作とからなる、一般的な畳み込みネットワークである。収束中、空間情報が減少し、特徴情報が増加する。拡散経路は、収束経路からの一連の逆畳み込み(up-convolution)および高解像度特徴との連結(concatenations with high-resolution features)により、特徴と空間情報とを組み合わせる。
【発明の概要】
【0004】
本概要は、本明細書で詳細な説明においてさらに記載する概念の選択を、簡略化した形で導入するために提示される。本概要は、特許請求の範囲に記載される主題の重要な要因または必須の特徴を特定するものではなく、特許請求の範囲に記載される主題の範囲を限定するために使用されるものでもない。
【0005】
例示的な一実施形態において、プロセッサとメモリとを含み、メモリが、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ・エンジンを実装するようにプロセッサを特に構成するためにプロセッサにより実行される命令を含む、データ処理システムにおける方法が提供される。方法は、ニューラル・ネットワークを、入力画像に基づいてオリジナルを予測するノックアウト・オートエンコーダとして使用されるようにトレーニングすることを含む。方法は、ノックアウト・オートエンコーダ・エンジンによって、入力画像としての生物医学画像をニューラル・ネットワークに提供することをさらに含む。方法は、ニューラル・ネットワークによって、生物医学画像内の各ピクセルの確率分布を出力することをさらに含む。各確率分布は、生物医学画像内の所与のピクセルについての予想ピクセル値の予測確率分布を表す。方法は、ノックアウト・オートエンコーダ・エンジン内で実行される異常検出コンポーネントによって、各ピクセルが予想値を有する確率を確率分布に基づいて判定して、複数の予想ピクセル確率を形成することをさらに含む。方法は、異常検出コンポーネントによって、生物医学画像内の異常を複数の予想ピクセル確率に基づいて検出することをさらに含む。方法は、ノックアウト・オートエンコーダ・エンジン内で実行される異常マーキング・コンポーネントによって、生物医学画像内で検出された異常をマーキングして、マーキング生物医学画像を形成することをさらに含む。方法は、ノックアウト・オートエンコーダ・エンジンによって、マーキング生物医学画像を出力することをさらに含む。
【0006】
他の例示的な実施形態において、コンピュータ可読プログラムを有するコンピュータ使用可能または可読媒体を含むコンピュータ・プログラム製品が提供される。コンピュータ可読プログラムは、コンピューティング・デバイス上で実行されると、コンピューティング・デバイスに、本方法の例示的な実施形態に関して上記に要点を記載した動作のうちの様々な動作およびそれらの組合せを実行させる。
【0007】
さらに別の例示的な実施形態において、システム/装置が提供される。システム/装置は、1つまたは複数のプロセッサと、1つまたは複数のプロセッサに結合されたメモリとを含むことができる。メモリは、1つまたは複数のプロセッサによって実行されると、この1つまたは複数のプロセッサに、本方法の例示的な実施形態に関して上記に要点を記載した動作のうちの様々な動作およびそれらの組合せを実行させる命令を含むことができる。
【0008】
本発明のこれらおよびその他の特徴ならびに利点が、以下の本発明の例示の実施形態の詳細な説明に記載され、またはそれを考慮することで当業者に明らかになろう。
【0009】
本発明、ならびにその好ましい使用形態およびさらなる目的および利点が、以下の例示的な実施形態の詳細な説明を添付図面と併せて読むことによって、最もよく理解されよう。
【図面の簡単な説明】
【0010】
図1】コンピュータ・ネットワークにおけるヘルスケア認識システムの例示的な一実施形態の概略図である。
図2】例示的な実施形態の態様が実施される、例示のデータ処理システムのブロック図である。
図3】例示的な一実施形態による、ヘルスケア認識システムの要素の対話を示す例示図である。
図4】例示的な実施形態のノックアウト・エンコーダによって検出され得る異常を含む、例示の生物医学画像を示す図である。
図5】例示的な実施形態による、例示のニューラル・ネットワーク・オートエンコーダを示す図である。
図6】例示的な実施形態による、オートエンコーダとして別の目的で利用されるU-netを示す図である。
図7】例示的な実施形態による、ノックアウト・オートエンコーダのためのニューラル・ネットワークの使用を示す図である。
図8】例示的な実施形態による、検出された異状(abnormality)をマーキングした出力画像を示す図である。
図9】例示的な実施形態による、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダとして使用されるようにニューラル・ネットワークをトレーニングするメカニズムのブロック図である。
図10】例示的な実施形態による、ノックアウト・オートエンコーダを使用して生物医学画像内の異常を検出するメカニズムのブロック図である。
図11】例示的な実施形態による、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダとして使用されるようにニューラル・ネットワークをトレーニングするメカニズムの動作を示すフローチャートである。
図12】例示的な実施形態による、ノックアウト・オートエンコーダを使用して生物医学画像内の異常を検出するメカニズムの動作を示すフローチャートである。
【発明を実施するための形態】
【0011】
畳み込みニューラル・ネットワーク(CNN)は、規則性のある構造を拾い上げる。生物医学画像セグメンテーションは、対象物を表す画像ピクセルに焦点を絞ろうとする。そのような対象物が識別されると、システムは体積または形状を計算し、臓器特異的な所見を探すことができる。CNNは、一定した形状および状況を利用するため、セグメンテーションが得意である。しかしながら、不規則な形状(例えば、腫瘤、病変など)をセグメント化することは困難である。言い換えると、現在のメカニズムは、医療画像における不規則な形状、すなわち、幾何形状、輝度などが変化する形状を十分にセグメント化していない。
【0012】
例示的な実施形態は、CNNを使用して、異状により不明瞭になる規則性の欠如を検出することによって、異状を検出する。例示的な実施形態は、医療画像の残りを使用して医療画像内の特定の位置に何があるべきかを予測するメカニズムを提供する。この予測に基づき、メカニズムは予測との不一致を使用して、その位置に非常に予想外のものがあるときを判定することができる。すなわち、例示的な実施形態のメカニズムは、医療画像に予想されるものがないかどうかを判定することによって異状を検出する。
【0013】
例示的な実施形態のメカニズムは、入力を受け、入力をニューラル・ネットワークに通し、出力層で入力層を再構築しようとする。これは簡単そうだが、有利に働くように、メカニズムがタスクを困難にすることが重要である。
【0014】
標準的なオートエンコーダでは、自由度を制限することによって困難さが得られるため、ネットワークは、はるかに少ない変数、すなわち次元縮小により入力を表現することを学習する。しかしながら、例示的な実施形態は、U-netをオートエンコーダとして別の目的で利用し、画像内のノイズで満たされたランダム・パッチである「ノックアウト」を導入する。その後、U-netは、画像の残り、すなわち、ノックアウトを含まない画像の部分のみを使用して(ノイズの前の)オリジナル画像コンテンツを予測するようにトレーニングされる。これにより、U-netは、画像内の他の値に基づいてそこにあるべきであると予測されるノックアウト領域の値の分布を計算することによって、オリジナル画像を再構築する方法を学習する。ネットワークは、異状である画像の部分を低確率で強調表示する。
【0015】
例示的な実施形態の様々な態様のより詳細な説明を始める前に、まず、本記載全体にわたり、「メカニズム」という用語が、様々な動作、機能などを実行する本発明の要素を指すために使用されることを理解されたい。本明細書で使用されるとき、「メカニズム」は、例示的な実施形態の機能または態様の、装置、手続き、またはコンピュータ・プログラム製品の形での実装であってよい。手続きの場合、手続きは1つまたは複数のデバイス、装置、コンピュータ、データ処理システムなどによって実施される。コンピュータ・プログラム製品の場合、コンピュータ・プログラム製品内または製品上に具現化されたコンピュータ・コードまたは命令によって表現されるロジックが、特定の「メカニズム」に関連する機能性を実装するためまたは動作を実行するために、1つまたは複数のハードウェア・デバイスによって実行される。したがって、本明細書に記載のメカニズムは、専用ハードウェア、汎用ハードウェア上で実行するソフトウェア、専用もしくは汎用ハードウェアによって命令を容易に実行できるように媒体に記憶されたソフトウェア命令、機能を実行する手続きもしくは方法、または上記のいずれかの組合せとして実装され得る。
【0016】
本記載および特許請求の範囲は、例示的な実施形態の特定の特徴および要素に関して「1つの」、「~のうちの少なくとも1つ」、および「~のうちの1つまたは複数」という用語を使用することがある。これらの用語および語句は、特定の例示的な実施形態に特定の特徴または要素のうちの少なくとも1つが存在するが、2つ以上が存在してもよいことを述べるものであることを理解されたい。すなわち、これらの用語/語句は、本記載または特許請求の範囲を、単一の特徴/要素が存在するように、または複数の当該特徴/要素の存在を必要とするように限定するものではない。それとは反対に、これらの用語/語句は、少なくとも単一の特徴/要素のみを必要とし、複数の当該特徴/要素の可能性も、本記載および特許請求の範囲内にある。
【0017】
さらに、「エンジン」という用語の使用は、本発明の実施形態および特徴の記載に関して本明細書で使用される場合、エンジンが発生させる、もしくはそれにより実行される、またはその両方のアクション、ステップ、プロセスなどの達成もしくは実行またはその両方に関する任意の特定の実装を限定するものではないことを理解されたい。エンジンは、指定された機能を実行するソフトウェア、ハードウェア、もしくはファームウェア、またはそれらすべて、あるいはそれらのいずれかの組合せであってよいが、これに限定されず、汎用または専用あるいはその両方のプロセッサの、機械可読メモリにロードまたは記憶されプロセッサにより実行される適切なソフトウェアと組み合わせての任意の使用が含まれるが、これに限定されない。さらに、特定のエンジンに関連する任意の名称は、別段の指定がない限り、参照の便宜のためのものであり、特定の実装に限定するものではない。さらに、エンジンによるとされた任意の機能性は、複数のエンジンにより同様に実行されること、同じもしくは異なるタイプの別のエンジンの機能性に組み込まれもしくはそれと組み合わされ、またはその両方をされること、あるいは様々な構成の1つまたは複数のエンジンにわたって分散することができる。
【0018】
加えて、例示的な実施形態の例示の実装をさらに示すため、および例示的な実施形態のメカニズムの理解を助けるために、以下の記載が例示的な実施形態の様々な要素についての複数の様々な例を使用することを理解されたい。これらの例は、非限定的であり、例示的な実施形態のメカニズムを実装するための様々な可能性を網羅してはいない。本記載に照らし、これらの様々な要素について、本発明の思想および範囲から逸脱することなく、本明細書に示された例に加えて、またはその代わりとして利用され得る他の代替的実装が多数あることが、当業者に明らかであろう。
【0019】
本発明は、システム、方法、またはコンピュータ・プログラム製品、あるいはその組合せであってよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読ストレージ媒体を含むことができる。
【0020】
コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用される命令を保持および記憶することができる有形のデバイスであってよい。コンピュータ可読ストレージ媒体は、限定されないが、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光学ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、または前述のものの任意の適切な組合せであってよい。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的一覧には、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラム可能読み出し専用メモリ(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック(登録商標)、フロッピー(登録商標)・ディスク、パンチ・カードまたは命令が記録された溝の中の隆起構造などの機械的にエンコードされたデバイス、および前述のものの任意の適切な組合せが含まれる。本明細書で使用されるとき、コンピュータ可読ストレージ媒体は、電波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体を伝搬する電磁波(例えば、光ファイバ・ケーブルを通る光パルス)、またはワイヤを介して伝送される電気信号などの、本質的に一過性の信号として解釈されるべきではない。
【0021】
本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれのコンピューティング/処理デバイスに、または、例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組合せなどのネットワークを介して外部コンピュータまたは外部ストレージ・デバイスにダウンロード可能である。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを含み得る。各コンピューティング/処理デバイスのネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、コンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体で記憶するために転送する。
【0022】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはJava(登録商標)、Smalltalk(登録商標)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは同様のプログラミング言語などの従来の手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組合せで書かれたソース・コードもしくはオブジェクト・コードのいずれかであってよい。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で実行されても、部分的にユーザのコンピュータ上で実行されても、スタンドアロン・ソフトウェア・パッケージとして実行されても、部分的にユーザのコンピュータ上でかつ部分的にリモート・コンピュータ上で実行されても、または完全にリモート・コンピュータもしくはサーバ上で実行されてもよい。後者のシナリオでは、ローカル・エリア・ネットワーク(LAN)または広域ネットワーク(WAN)を含む任意のタイプのネットワークを介してリモート・コンピュータがユーザのコンピュータに接続されてもよく、あるいは(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに接続されてもよい。一部の実施形態において、本発明の態様を実行するために、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路が、電子回路をパーソナライズするためのコンピュータ可読プログラム命令の状態情報を利用することによってコンピュータ可読プログラム命令を実行してもよい。
【0023】
本発明の態様が、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して本明細書に記載される。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方におけるブロックの組合せは、コンピュータ可読プログラム命令によって実施可能であることが理解されよう。
【0024】
このようなコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであってよい。このようなコンピュータ可読プログラム命令は、命令が記憶されたコンピュータ可読ストレージ媒体が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作の態様を実施する命令を含んだ製品を含むべく、コンピュータ可読ストレージ媒体に記憶され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組合せに特定の方式で機能するように指示することができるものであってもよい。
【0025】
コンピュータ可読プログラム命令は、コンピュータ、他のプログラム可能装置、または他のデバイスで実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実施するように、コンピュータによって実施されるプロセスを作り出すべく、コンピュータ、他のプログラム可能なデータ処理装置、または他のデバイスにロードされ、コンピュータ、他のプログラム可能装置、または他のデバイス上で一連の動作ステップを実行させるものであってもよい。
【0026】
図中のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実施のアーキテクチャ、機能性、および動作を示す。これに関し、フローチャートまたはブロック図内の各ブロックは、指定された論理機能を実施する1つまたは複数の実行可能な命令を含むモジュール、セグメント、または命令の一部に相当し得る。一部の代替的実施では、ブロック内に示される機能は、図面に示されるものとは異なる順序で生じてもよい。例えば、関連する機能性に応じて、連続して示される2つのブロックは、実際には実質的に同時に実行されてもよく、または、ブロックが逆順で実行されることがあってもよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組合せは、指定された機能もしくは動作を実行する、または、専用ハードウェアおよびコンピュータ命令の組合せを実行する専用ハードウェア・ベース・システムによって実施され得ることにも留意されたい。
【0027】
前述したように、本発明は、生物医学画像内の異常を検出するメカニズムを提供する。例示的な実施形態を、多数の異なるタイプのデータ処理環境において利用することができる。例示的な実施形態の特定の要素および機能性の説明の文脈を提供するために、例示的な実施形態の態様を実施可能な例示の環境として図1図3を示す。図1図3は例に過ぎず、本発明の態様または実施形態を実施可能な環境に関していかなる限定を主張することも暗示することも目的としていないことを理解されたい。本発明の思想および範囲から逸脱することなく、示される環境に対して多数の変更を加えることができる。
【0028】
図1図3は、質問応答(QA)パイプライン(質問/応答パイプラインまたは質問および応答パイプラインとも称する)などの要求処理パイプライン、例えば、要求処理方法、例示的な実施形態のメカニズムが実装される要求処理コンピュータ・プログラム製品を実装する、例示のヘルスケア用途の認識システム(本明細書で「ヘルスケア認識システム」とも称する)を説明するためのものである。このような要求は、構造化または非構造化要求メッセージ、自然言語質問、またはヘルスケア認識システムによって実行される動作を要求するための任意の他の適切な形式として提供され得る。より詳細に以下で説明するように、本発明の認識システムで実施される特定のヘルスケア用途は、グラフ表示エンジンを使用して関連情報を示すためのヘルスケア用途である。
【0029】
ヘルスケア認識システムは、以下の例において単一の要求処理パイプラインを有するものとして示されるが、実際には複数の要求処理パイプラインを有していてもよいことを理解されたい。所望の実施に応じて、各要求処理パイプラインを、異なる分野に関連する要求を処理するように別々にトレーニングもしくは構成する、またはその両方を行うことができ、あるいは入力要求(またはQAパイプラインを使用する実施においては質問)に応じて同一または異なる解析を実行するように構成することができる。例えば、一部の事例では、第1の要求処理パイプラインを、第1の医学的疾患分野(例えば、様々な種類の血液疾患)に向けた入力要求に応じて動作するようにトレーニングし、別の要求処理パイプラインを、別の医学的疾患分野(例えば、様々な種類のがん)の入力要求に応答するようにトレーニングしてもよい。他の事例では、例えば、1つの要求処理パイプラインを患者の診断に使用し、別の要求処理パイプラインをEMRデータの認識解析のために構成し、別の要求処理パイプラインを患者の監視のために構成するなどのように、要求処理パイプラインを、異なる種類の認識機能を提供するまたは異なる種類のヘルスケア用途を支援するように構成してもよい。
【0030】
さらに、各要求処理パイプラインは、それ自身の関連するコーパスを有し、そのコーパスを取り入れ、コーパス上で動作することができる。例えば、上記の例では、血液疾患分野ドキュメントについての1つのコーパスと、がん診断分野関連ドキュメントについての別のコーパスとを有する。このようなコーパスはEMRデータを含むことができるが、これに限定されない。認識システムは、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダを使用することができる。
【0031】
より詳細に以下で説明するように、例示的な実施形態は、このようなQAパイプライン、または要求処理パイプライン、電子カルテの完全性に関するヘルスケア認識システムのメカニズム、およびデータ品質評価メカニズムの機能性に組み込まれ、この機能性を増強および拡張することができる。したがって、例示的な実施形態のメカニズムを、そのような認識システムおよび要求処理パイプライン、またはQAパイプライン、メカニズムに組み込んでこれを増強する方法を説明する前に、認識システムおよびQAパイプラインを実装する認識システムにおける質問応答作成の実施方法をまず理解することが重要である。図1図3に記載のメカニズムは例に過ぎず、例示的な実施形態が実施される認識システムのメカニズムの種類に関する限定を述べることも暗示することも目的としていないことを理解されたい。本発明の思想および範囲から逸脱することなく、本発明の様々な実施形態において、図1図3に示す例示の認識システムに多数の変更を加えることができる。
【0032】
図1は、コンピュータ・ネットワーク102における、要求処理パイプライン108を実装する認識システム100の例示的な一実施形態の概略図である。認識システム100は、コンピュータ・ネットワーク102に接続された1つまたは複数のコンピューティング・デバイス104A~104C(1つまたは複数のプロセッサおよび1つまたは複数のメモリ、および場合により、バス、ストレージ・デバイス、通信インターフェースなどを含む、当技術分野で一般に知られる任意の他のコンピューティング・デバイス要素を含む)上に実装される。例示の目的のみで、図1において、認識システム100はコンピューティング・デバイス104Aのみに実装されているが、前述したように、認識システム100を複数のコンピューティング・デバイス104A~104Cなどの複数のコンピューティング・デバイスにわたって分散させることができる。ネットワーク102は、サーバ・コンピューティング・デバイスとして動作可能な複数のコンピューティング・デバイス104A~104Cと、クライアント・コンピューティング・デバイスとして動作可能な複数のコンピューティング・デバイス110~112とを含み、これらは、1つまたは複数の有線もしくは無線データ通信リンクまたはその両方を介して互いに、かつ他のデバイスまたはコンポーネントと通信する。各通信リンクは、ワイヤ、ルータ、スイッチ、送信機、受信機などのうちの1つまたは複数を含む。一部の例示的な実施形態において、認識システム100およびネットワーク102は、限定されないが、所望の実施に応じて多数の異なる形を取り得る要求処理および認識応答生成、例えば、認識情報検索、ユーザのトレーニング/命令、データの認識評価などを含む認識動作を提供することができる。認識システム100の他の実施形態を、本明細書に記載のもの以外のコンポーネント、システム、サブシステム、またはデバイス、あるいはその組合せと共に使用してもよい。
【0033】
認識システム100は、様々なソースから入力を受信する要求処理パイプライン108を実装するように構成される。要求は、自然言語質問、情報に対する自然言語要求、認識動作の実行に対する自然言語要求などの形で与えられ、応答は、診療現場の臨床環境における効率的な理解のために最大化された自然言語形式で返信され得る。例えば、認識システム100は、ネットワーク102、電子ドキュメントの1つまたは複数のコーパス106、認識システム・ユーザ、または他のデータおよび他の可能な入力ソース、あるいはこれらの組合せから入力を受信する。一実施形態において、認識システム100への入力の一部または全部が、ネットワーク102経由で送られる。ネットワーク102上の様々なコンピューティング・デバイス104A~104Cは、コンテンツ・クリエイタおよび認識システム・ユーザのためのアクセス・ポイントを含む。コンピューティング・デバイス104A~104Cの一部は、(例示の目的のみで、図1に別のエンティティとして示す)データの1つまたは複数のコーパス106を記憶するデータベースのためのデバイスを含む。データの1つまたは複数のコーパス106の一部が、図1に明示しない1つまたは複数の他のネットワーク接続型ストレージ・デバイス、1つまたは複数のデータベース、あるいは他のコンピューティング・デバイスに設けられていてもよい。様々な実施形態において、認識システム100が、ローカルおよびグローバル、例えばインターネットを含む任意のサイズの環境で動作することができるように、ネットワーク102はローカル・ネットワーク接続およびリモート接続を含む。
【0034】
一実施形態において、コンテンツ・クリエイタは、認識システム100によりデータのコーパスの一部として使用する、データの1つまたは複数のコーパス106のドキュメントのコンテンツを作成する。ドキュメントは、認識システム100で使用する任意のファイル、テキスト、記事、またはデータのソースを含む。認識システム・ユーザは、ネットワーク102とのネットワーク接続またはインターネット接続を介して認識システム100にアクセスし、認識システム100に質問/要求を入力し、この質問/要求は、データの1つまたは複数のコーパス106のコンテンツに基づいて応答/処理される。一実施形態において、質問/要求は自然言語を用いて形成される。認識システム100は、パイプライン108を介して質問/要求をパースおよび解釈し、与えられた質問に対する1つまたは複数の応答、要求に対するレスポンス、要求の処理結果などを含むレスポンスを、認識システム・ユーザ、例えば認識システム・ユーザ110に提供する。一部の実施形態において、認識システム100は、応答/レスポンス候補のランク付け一覧(ranked list of candidate answers/responses)にあるレスポンスをユーザに提供し、他の例示的な実施形態において、認識システム100は、単一の最終応答/レスポンス、または最終応答/レスポンスと他の応答/レスポンス候補のランク付け一覧との組合せを提供する。
【0035】
認識システム100は、データの1つまたは複数のコーパス106から得た情報に基づく入力質問/要求を処理するための複数のステージを含むパイプライン108を実装する。パイプライン108は、入力質問/要求の処理およびデータの1つまたは複数のコーパス106に基づいて、入力質問または要求に対する応答/レスポンスを生成する。
【0036】
一部の例示的な実施形態において、認識システム100は、以下で説明する例示的な実施形態のメカニズムによって増強される、International Business Machines Corporation、Armonk、New Yorkから入手可能なIBM Watson(登録商標)認識システムであってよい。上記に要点を記載したように、IBM Watson(登録商標)認識システムのパイプラインは、入力質問または要求を受信し、その質問/要求の主要な特徴を抽出するようにパースし、その後、この特徴を用いて、データの1つまたは複数のコーパス106に適用されるクエリを構築する。データの1つまたは複数のコーパス106にクエリを適用することに基づいて、入力質問/応答(以下で入力質問と仮定する)に対する有益なレスポンスを含む何らかの可能性を有するデータの1つまたは複数のコーパス106(以下で単にコーパス106と称する)の部分について、データの1つまたは複数のコーパス106を見渡すことにより、入力質問/要求に対する1組の仮説または応答/レスポンス候補が生成される。その後、IBM Watson(登録商標)認識システムのパイプライン108は、入力質問の言語、および様々な推論アルゴリズムを用いてクエリを適用する間に見つかったコーパス106の部分の各々で用いられる言語の深い解析を実行する。
【0037】
その後、様々な推論アルゴリズムから得られたスコアを、本例では、可能性のある応答候補が質問により推測されるという証拠に関してIBM Watson(登録商標)認識システム100のパイプライン108が有する信頼度をまとめた統計モデルに対して重み付けする。このプロセスをレスポンス候補の各々について反復して、レスポンス候補のランク付け一覧を生成し、その後、この一覧を、入力要求を発信したユーザ、例えば、クライアント・コンピューティング・デバイス110のユーザに提示する、または、この一覧から、最終レスポンスを選択してユーザに提示することができる。IBM Watson(登録商標)認識システム100のパイプライン108についてのより多くの情報が、例えば、IBM Corporationのウェブサイト、IBM Redbooksなどから得られる。例えば、IBM Watson(登録商標)認識システムのパイプラインについての情報が、Yuan他、「Watson and Healthcare」、IBM developer Works、2011および「The Era of Cognitive Systems: An Inside Look at IBM Watson and How it Works」、Rob High、IBM Redbooks、2012に見られる。
【0038】
前述したように、クライアント・デバイスから認識システム100への入力は自然言語要求の形で与えられ得るが、例示的な実施形態はこれに限定されない。むしろ、実際には、入力要求は、限定されないが、IBM Watson(登録商標)などの認識システムの自然言語パースおよび解析メカニズムを含む、構造化または非構造化入力解析あるいはその両方を使用してパースおよび解析され得る任意の適切な型の要求としてフォーマットまたは構造化されて、認識解析を実行する根拠を判定し、認識解析の結果を提供することができる。ヘルスケア・ベースの認識システムの場合、この解析は、1つまたは複数のコーパスなどから患者のカルテ、医療ガイダンス・ドキュメンテーションなどを処理して、ヘルスケア指向認識システム結果を提供することを含み得る。
【0039】
本発明の文脈で、認識システム100は、ヘルスケア・ベースの動作を支援するための認識機能性を提供することができる。例えば、特定の実施に応じて、ヘルスケア・ベースの動作は、患者の診断診療管理システム、個人患者のケア・プラン作成および監視、臨床試験または特定の種類の治療などに適した患者の識別などの様々な目的のための患者の電子カルテ(EMR)評価を含み得る。したがって、認識システム100は、医療系またはヘルスケア系の分野で動作し、構造化または非構造化要求、自然言語入力質問などとして入力された要求処理パイプライン108を介して、そのようなヘルスケア動作に対する要求を処理することができるヘルスケア認識システム100であってよい。
【0040】
図1に示すように、認識システム100は、例示的な実施形態のメカニズムによって、畳み込みニューラル・ネットワーク(CNN)を使用して入力生物医学画像の各ピクセルまたはボクセルを入力生物医学画像の残りに基づいて予測するためのノックアウト・オートエンコーダ・エンジン120を実装するべく、専用ハードウェア、ハードウェア上で実行するソフトウェア、または専用ハードウェアとハードウェア上で実行するソフトウェアとの任意の組合せに実装されるロジックを含むようにさらに増強される。ノックアウト・オートエンコーダ・エンジン120は、その後、生物医学画像に予想されるものがないかどうかを判定することによって異常を検出する。
【0041】
ノックアウト・オートエンコーダ・エンジン120は、オリジナル画像を予測するようにオートエンコーダとして別の目的で利用されトレーニングされたCNNを備える。一実施形態において、CNNは、画像内のノイズで満たされたランダム・パッチである「ノックアウト」をトレーニング画像に設けることによってトレーニングされたU-netである。U-netは、ノイズが導入される前に画像の残りのみを使用してオリジナル画像コンテンツを予測するようにトレーニングされる。これにより、U-netは、画像中の他の値に基づいて、そこにあるべきであると予測されるノックアウト領域における分布値を計算することによって、オリジナル画像を再構築する方法を学習する。
【0042】
試験画像を考慮して、ノックアウト・オートエンコーダ・エンジン120はピクセルごとに確率分布値を生成する。ノックアウト・オートエンコーダ・エンジン120は各確率分布値を用いて、当該ピクセルが画像内の他のピクセルに基づいて予想されるものであるかどうかを判定する。ノックアウト・オートエンコーダ・エンジン120は、画像内で検出された異常をマーキングし、マーキング画像をユーザに出力することもできる。本明細書で使用されるとき、試験画像は、ノックアウト・オートエンコーダ・エンジン120の精度を試験するために使用される画像、またはユーザが異状もしくは異常を検出したい画像であってよい。
【0043】
前述したように、例示的な実施形態のメカニズムは、コンピュータ技術分野に根差し、そのようなコンピューティングまたはデータ処理システムに存在するロジックを使用して実装される。このようなコンピューティングまたはデータ処理システムは、具体的には、前述した様々な動作を実施するように、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアとの組合せのいずれかによって構成される。したがって、図2は、本発明の態様が実施され得る一種のデータ処理システムの例示として示される。多数の他のタイプのデータ処理システムが、同様に例示的な実施形態のメカニズムを特に実装するように構成され得る。
【0044】
図2は、例示的な実施形態の態様が実施される、例示のデータ処理システムのブロック図である。データ処理システム200は、本発明の例示的な実施形態のプロセスを実施するコンピュータ使用可能コードまたは命令が位置する、図1のサーバ104またはクライアント110などのコンピュータの例である。例示的な一実施形態において、図2は、以下で説明する例示的な実施形態の追加のメカニズムを含むように増強された認識システム100を実装するサーバ104などのサーバ・コンピューティング・デバイスを示す。
【0045】
図示した例では、データ処理システム200は、ノース・ブリッジおよびメモリ・コントローラ・ハブ(NB/MCH)202と、サウス・ブリッジおよび入出力(I/O)コントローラ・ハブ(SB/ICH)204とを含むハブ・アーキテクチャを採用する。処理ユニット206、メイン・メモリ208、およびグラフィックス・プロセッサ210が、NB/MCH202に接続される。グラフィックス・プロセッサ210は、アクセラレーテッド・グラフィックス・ポート(AGP)を介してNB/MCH202に接続される。
【0046】
図示した例において、ローカル・エリア・ネットワーク(LAN)アダプタ212がSB/ICH204に接続する。オーディオ・アダプタ216、キーボードおよびマウス・アダプタ220、モデム222、読み出し専用メモリ(ROM)224、ハード・ディスク・ドライブ(HDD)226、CD-ROMドライブ230、ユニバーサル・シリアル・バス(USB)ポートおよび他の通信ポート232、PCI/PCIeデバイス234が、バス238およびバス240を介してSB/ICH204に接続する。PCI/PCIeデバイスは、例えば、イーサネット(登録商標)アダプタ、アドイン・カード、およびノート型パソコン用PCカードを含んでもよい。PCIはカード・バス・コントローラを使用するが、PCIeはこれを使用しない。ROM224は、例えば、フラッシュ基本入出力システム(BIOS)であってもよい。
【0047】
HDD226およびCD-ROMドライブ230は、バス240を介してSB/ICH204に接続する。HDD226およびCD-ROMドライブ230は、例えば、統合ドライブ・エレクトロニクス(IDE)またはシリアル・アドバンスト・テクノロジー・アタッチメント(SATA)インターフェースを使用してもよい。スーパーI/O(SIO)デバイス236がSB/ICH204に接続される。
【0048】
オペレーティング・システムが処理ユニット206上で実行される。オペレーティング・システムは、図2のデータ処理システム200内の様々なコンポーネントを連携させ、制御する。クライアントとしてのオペレーティング・システムは、Microsoft(登録商標) Windows10(登録商標)などの市販のオペレーティング・システムである。Java(登録商標)プログラミング・システムなどのオブジェクト指向プログラミング・システムが、オペレーティング・システムと共に実行されてもよく、データ処理システム200上で実行されるJava(登録商標)プログラムまたはアプリケーションからオペレーティング・システムへのコールを提供する。
【0049】
サーバとしてのデータ処理システム200は、例えば、アドバンスト・インタラクティブ・エグゼクティブ(AIX(登録商標))オペレーティング・システムまたはLINUX(登録商標)オペレーティング・システムを実行する、IBM(登録商標)eServer System pコンピュータ・システムであってもよい。データ処理システム200は、処理ユニット206内の複数のプロセッサを含む対称型マルチプロセッサ(SMP)システムであってもよい。あるいは、シングル・プロセッサ・システムを採用してもよい。
【0050】
オペレーティング・システム、オブジェクト指向プログラミング・システム、およびアプリケーションまたはプログラムの命令は、HDD226などのストレージ・デバイスに位置し、処理ユニット206により実行するためにメイン・メモリ208にロードされる。本発明の例示的な実施形態のプロセスは、例えば、メイン・メモリ208、ROM224などのメモリ、または1つまたは複数の周辺デバイス226および230に位置するコンピュータ使用可能プログラム・コードを使用して、処理ユニット206により実行される。
【0051】
図2に示すバス238またはバス240などのバス・システムは、1つまたは複数のバスから構成される。当然、バス・システムは、通信ファブリックまたはアーキテクチャに接続された様々なコンポーネントまたはデバイス間のデータの転送を提供する任意のタイプの通信ファブリックまたはアーキテクチャを使用して実装されてもよい。図2のモデム222またはネットワーク・アダプタ212などの通信ユニットは、データを送受信するために使用される1つまたは複数のデバイスを含む。メモリは、例えば、メイン・メモリ208、ROM224、または図2のNB/MCH202にあるようなキャッシュであってもよい。
【0052】
当業者は、図1および図2に示すハードウェアを実施に応じて変えることができることを理解するであろう。フラッシュ・メモリ、同等の不揮発性メモリ、または光ディスク・ドライブなどの他の内蔵ハードウェアまたは周辺デバイスを、図1および図2に示すハードウェアに加えて、またはその代わりに使用してもよい。また、本発明の思想および範囲から逸脱することなく、例示の実施形態のプロセスを、前述したSMPシステム以外のマルチプロセッサ・データ処理システムに適用してもよい。
【0053】
さらに、データ処理システム200は、クライアント・コンピューティング・デバイス、サーバ・コンピューティング・デバイス、タブレット・コンピュータ、ラップトップ・コンピュータ、電話機または他の通信デバイス、携帯情報端末(PDA)などを含むいくつかの異なるデータ処理システムのいずれかの形を取ってもよい。一部の例示的な例において、データ処理システム200は、例えば、オペレーティング・システム・ファイルまたはユーザ生成データあるいはその両方を記憶する不揮発性メモリを提供するフラッシュ・メモリと共に構成されたポータブル・コンピューティング・デバイスであってもよい。基本的に、データ処理システム200は、アーキテクチャの制限なく、既知のまたは後に開発される任意のデータ処理システムであってもよい。
【0054】
図3は、例示的な一実施形態による、ヘルスケア認識システムの要素の対話を示す例示図である。図3の例示図は、患者のEMRデータの認識サマリ(cognitive summary)を提供するように構成されたヘルスケア認識システム300の実施を示す。しかしながら、これは例示の実施に過ぎず、本発明の思想および範囲から逸脱することなく、他のヘルスケア動作をヘルスケア認識システム300の他の実施形態において実施してもよいことを理解されたい。
【0055】
さらに、図3はユーザ306を人間の形で示しているが、ユーザ306が実際にはコンピューティング・デバイス、例えばクライアント・コンピューティング・デバイスであり得るように、ユーザ306との対話はコンピューティング・デバイス、医療機器などを使用して実行され得ることを理解されたい。例えば、ユーザ306とヘルスケア認識システム300との対話は、1つまたは複数のデータ通信リンクおよび場合により1つまたは複数のデータ・ネットワークを介してヘルスケア認識システム300と通信する、図1のクライアント・コンピューティング・デバイス110または112などのユーザ・コンピューティング・デバイス(図示せず)を介した電子的なものである。
【0056】
図3に示すように、例示的な一実施形態によれば、ユーザ306は、ヘルスケア認識システム300がパースおよび処理できる形式でユーザがヘルスケア認識システム300に要求を発信することができるように構成されたクライアント・コンピューティング・デバイスのユーザ・インターフェースなどを介して、ヘルスケア認識システム300に要求308を発信する。要求308は、患者属性318を識別する情報を含むまたは伴うことができる。このような患者属性318は、例えば、患者の識別子302、患者に関する社会歴および人口統計情報、症状、および質問に対するレスポンスから得た他の関連情報、または患者の状態についてのデータを監視または収集するために使用される医療機器から得た情報を含み得る。一実施形態において、患者属性318は、異常を検出する処理のための生物医学画像の識別を含み得る。ヘルスケア認識システム300による患者の認識評価に関連し得る患者についての任意の情報が、要求308または患者属性318あるいはその両方に含まれていてもよい。
【0057】
ヘルスケア認識システム300は、実施専用ヘルスケア指向認識動作を実行するように特に構成された認識システムを提供する。図示した例では、このヘルスケア指向認識動作は、EMRデータの認識サマリ328をユーザ306に提供して、報告された症状および患者について収集された他の情報に基づいて患者を治療する際にユーザ306を支援するためのものである。ヘルスケア認識システム300は、医療コーパスおよび他のソース・データ326、治療ガイダンス・データ324、ならびに患者に関連する患者EMR322から収集された情報を利用して、要求308および患者属性318に応じて動作することにより、認識サマリ328を生成する。一実施形態において、患者EMRデータ322は生物医学画像を含み得る。認識サマリ328は、患者属性318およびデータ・ソース322~326から得られた、EMRデータ322の一部がなぜ提供されているのかに関する推論を示す関連する裏付け証拠と共にランク付け順序で提示され得る。認識サマリ328は、検出された異常を識別するマーキング画像を含んでいてもよい。
【0058】
本明細書の例示的な実施形態によれば、ヘルスケア認識システム300は、畳み込みニューラル・ネットワーク(CNN)を使用して入力生物医学画像の各ピクセルまたはボクセルを入力生物医学画像の残りに基づいて予測するためのノックアウト・オートエンコーダ・エンジン320を含むように増強される。ノックアウト・オートエンコーダ・エンジン320は、その後、生物医学画像に予想されるものがないかどうかを判定することによって異常を検出する。
【0059】
図4は、例示的な実施形態のノックアウト・エンコーダによって検出され得る異常を含む、例示の生物医学画像を示す図である。セグメンテーションのための畳み込みニューラル・ネットワーク(CNN)は、肋骨401などの予想される構造を検出するようにトレーニングされる。U-netなどのCNNは、肋骨401などの構造が肝臓402などの構造にしばしば隣接する、またはその逆であることを学習する。すなわち、CNNは、1組のトレーニング画像に基づいて、生物医学画像内の一定の構造をどこで予想すべきかを学習するようにトレーニングされる。
【0060】
病変403などの異常または異状により、そのような構造が予想される部位が不明瞭になる。病変は、位置、大きさ、形状、輝度パターンなどが非常に変わりやすいため、規則性に乏しい。CNNは、それらの規則性を検出するのではなく、病変により不明瞭になる規則性の欠如を検出することによって、病変セグメンテーションにおいて良好な性能を実現する。
【0061】
例示的な実施形態は、そこにあるものがそこに見つかると予想されるものではないことを主張することによって異常を識別しようとする。具体的には、例示的な実施形態は、画像の残りを入手して特定の位置に何があるべきかを予測し、その位置に非常に予想外のものがあるときを検出することができる。
【0062】
図5は、例示的な実施形態による、例示のニューラル・ネットワーク・オートエンコーダを示す。オートエンコーダの目的は、入力層510で入力を受け、入力をネットワーク500に通し、出力層530で入力を再構築することである。オートエンコーダに有利に働くように、これを困難にすることが重要である。標準的なオートエンコーダでは、自由度を制限することによってこれがなされるため、ネットワークは、はるかに少ない変数、すなわち次元縮小により入力を表現することを学習する。この困難さは、隠れ層520の「ボトルネック」として現れる。
【0063】
図6は、例示的な実施形態による、オートエンコーダとして別の目的で利用されるU-netを示す。U-netは、現在、セマンティック・セグメンテーションのための最高性能のネットワークである。図6に示すU-netアーキテクチャは、最低解像度の32×32ピクセルの例である。U-netアーキテクチャは、収束経路(左側)と拡散経路(右側)とから構成される。収束経路は、畳み込みネットワークの一般的なアーキテクチャをたどる。収束経路は、2つの3×3畳み込み(パディングなしの畳み込み)の反復適用から構成される。各陰影ボックスは、マルチチャネル特徴マップに対応する。チャネルの数が、各ボックスの上に示される。x-yサイズがボックスの左下縁部に示される。白ボックスはコピーされた特徴マップを表す。矢印は様々な動作を表す。横黒矢印は、3×3畳み込み(パディングなしの畳み込み)およびそれに各々続く正規化線形ユニット(ReLU)を表し、縦陰影矢印で表される、ダウンサンプリングの場合のストライド2の2×2最大プーリング動作がそれに続く。各ダウンサンプリング・ステップでは、特徴チャネルの数が2倍になる。拡散経路の各ステップは、特徴マップのアップサンプリングから構成され、特徴チャネルの数が半分になる、縦白矢印で表される2×2畳み込み(「逆畳み込み」)と、横白矢印で表される、収束経路から対応してクロップされた特徴マップとの連結と、2つの3×3畳み込みおよびそれに各々続くReLUとが続く。クロッピングは、あらゆる畳み込みにおいて境界ピクセルの損失により必要とされる。最終層で、横陰影矢印で表される1×1畳み込みを使用して、各64コンポーネント特徴ベクトルを所望の数のクラスにマッピングする。全体として、ネットワークは23の畳み込み層を有する。
【0064】
図6に示すU-netアーキテクチャは、生物医学画像セグメンテーションとして知られる例示のCNNであるが、例示的な実施形態は、U-netをオートエンコーダとしてトレーニングするように、U-netアーキテクチャを変更して別の目的で利用する。例示的な実施形態は、オートエンコーダに有利に働くように問題を困難にする方法を導入する。図7は、例示的な実施形態による、ノックアウト・オートエンコーダのためのニューラル・ネットワークの使用を示す。例示的な実施形態は、入力画像タイル700内のランダム・パッチ701を選択し、これをノイズで満たす。その後、例示的な実施形態は、画像の残りのみを使用して、ノイズの導入前の、オリジナル画像コンテンツを予測するように、ニューラル・ネットワーク710をトレーニングする。したがって、U-netは、オリジナル画像内で予想されるピクセル値を予測するための出力確率分布をピクセルごとに生成するようにトレーニングされる。確率分布は、ピークが最確値にある、ベル・カーブ、ガウス分布などのパラメータ分布であり得る。例示的な実施形態は、出力確率分布を使用して、出力画像720内のノックアウト・パッチ721に何があると予想されるかを判定する。
【0065】
図8は、例示的な実施形態による、検出された異状をマーキングした出力画像を示す。試験画像800に関し、例示的な実施形態は、ノックアウト・オートエンコーダを試験画像800に適用する。画像800のピクセルごとに、ノックアウト・オートエンコーダは、画像のその位置で予想されるピクセル値を予測する確率分布を生成する。一実施形態において、例示的な実施形態は、入力画像のピクセルごとに、そのピクセルについての入力値が予想値である確率を、そのピクセルについての確率分布に従って判定する。その後、例示的な実施形態は、その確率を所定の閾値と比較することができる。確率が閾値より大きい場合には、例示的な実施形態は、ピクセル値が予想範囲内にあると判定することができる。所与のピクセルについての確率が所定の閾値より小さい場合には、例示的な実施形態は、ピクセル値が非常に予想外であるため、異常または異状の部分であり得ることを判定することができる。
【0066】
一実施形態において、例示的な実施形態は、異常または異状であると判定されたピクセルをマーキングすることにより、マーキング異常801を形成する。一実施形態において、マーキングされるピクセルは、前述したように閾値を用いて検出され、低確率であると識別されたピクセルは、オーバレイ画像で1に設定されたピクセルを有し、または正常の場合にはゼロに設定され得る。その後、オーバレイの色が半透明になり、例えば、異状であるとマーキングされた領域は赤色に見え、正常な領域は完全に透明で、オーバレイの下のオリジナル画像のみを示す。
【0067】
図9は、例示的な実施形態による、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダとして使用されるようにニューラル・ネットワークをトレーニングするメカニズムのブロック図である。トレーニング画像901がノックアウト・ジェネレータ・コンポーネント902に提供され、ノックアウト・ジェネレータ・コンポーネント902はトレーニング画像901内のランダム・パッチを選択してパッチをノイズで満たし、ノックアウトを含むトレーニング画像903を形成する。その後、ネットワーク・トレーナ904が、ノックアウトを含むトレーニング画像903を入力としてオリジナル・トレーニング画像901を予測するように、ニューラル・ネットワーク905をトレーニングする。より具体的には、ネットワーク・トレーナ904は、画像903の残りを使用して各ピクセル値を予測するようにニューラル・ネットワーク905をトレーニングする。
【0068】
ニューラル・ネットワーク905をトレーニングするプロセスは、健康な患者から選択された複数のトレーニング画像について反復される。すなわち、トレーニング画像901は、腫瘍または病変などの異状のない生物医学画像である。すなわち、トレーニング画像901は、ピクセル値が健康な患者について予想されるものであると仮定され得るため、本質的に教師あり学習のための予想値でラベル付けされる。様々なトレーニング画像901を入力として、ネットワーク・トレーナ904は、画像の残りを使用して所与のピクセル値を正確に予測するように、ニューラル・ネットワーク905をトレーニングすることができる。したがって、ノックアウト・パッチ内のランダム・ノイズを含むピクセルであっても、ニューラル・ネットワーク905は、画像の残りを使用して、トレーニング画像901でわかるそのピクセルの予想値を予測するようにトレーニングされる。
【0069】
ニューラル・ネットワーク905は畳み込みニューラル・ネットワークであってよい。一実施形態において、ニューラル・ネットワーク905は、セグメンテーションに使用するものとして知られているが、オートエンコーダとなるように別の目的で利用されトレーニングされたU-netである。
【0070】
図10は、例示的な実施形態による、ノックアウト・オートエンコーダを使用して生物医学画像内の異常を検出するメカニズムのブロック図である。試験画像1001は、ノックアウト・オートエンコーダを試験するために使用される画像、またはユーザが異常を検出したい画像である。試験画像1001は、ニューラル・ネットワーク905への入力として提供され、ニューラル・ネットワーク905はピクセルごとに確率分布1002を生成する。各確率分布は、画像内のピクセルの残りに基づいて、試験画像1001の所与のピクセルについてのピクセル値の予測を表す。確率分布1002は、最高確率を有するピクセルが中心となるガウス分布などのパラメータ分布であってもよい。
【0071】
異常検出コンポーネント1003が、試験画像1001の各ピクセル値をその対応する確率分布1002と比較する。すなわち、画像1001の所与のピクセル値について、その確率分布1002は、ピクセル値が予想値である確率を示す確率値を与える。その後、異常検出コンポーネント1003は、各ピクセルの確率値を所定の閾値と比較することができる。閾値より小さい確率値を有する試験画像1001のピクセルについて、異常検出コンポーネント1003は、それらのピクセルが異常を構成することを検出する。その後、異常マーキング・コンポーネント1004がそれらのピクセルを異常の部分としてマーキングし、マーキング画像1005を出力する。
【0072】
図11は、例示的な実施形態による、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダとして使用されるようにニューラル・ネットワークをトレーニングするメカニズムの動作を示すフローチャートである。動作が始まり(ブロック1100)、メカニズムはトレーニング画像を受信する(ブロック1101)。メカニズムは、トレーニング画像に1つまたは複数のノックアウトを生成して、このノックアウトをノイズで満たす(ブロック1102)。メカニズムは、ノイズの導入前のオリジナル画像を予測するようにネットワークをトレーニングする(ブロック1103)。
【0073】
メカニズムは、画像が最後のトレーニング画像であるかどうかを判定する(ブロック1104)。現在の画像が最後のトレーニング画像でない場合には、動作はブロック1101に戻り、次のトレーニング画像を受信する。ブロック1104で現在の画像が最後のトレーニング画像である場合には、メカニズムはトレーニングされたニューラル・ネットワークを出力する(ブロック1105)。各トレーニング画像を一度トラバースすることをエポックと呼ぶ。一般的に、トレーニング・セッションに多数のエポックがあるため、各画像が複数回見られる。しかしながら、本実施形態では、毎回、同一の画像が見られ、ランダム・ノックアウト・パッチが異なる。その後、動作が終了する(ブロック1106)。
【0074】
図12は、例示的な実施形態による、ノックアウト・オートエンコーダを使用して生物医学画像内の異常を検出するメカニズムの動作を示すフローチャートである。動作が始まり(ブロック1200)、メカニズムは試験画像を受信する(ブロック1201)。試験画像は、オートエンコーダを試験するためのラベルなし画像であっても、ユーザが異常を検出したい生物医学画像であってもよい。メカニズムは、ニューラル・ネットワークを試験画像に適用して、各ピクセルの確率分布を生成する(ブロック1202)。その後、メカニズムは、確率分布に基づいて各ピクセルが異常の部分である確率を判定する(ブロック1203)。
【0075】
メカニズムは、異常が検出されたかどうかを判定する(ブロック1204)。ピクセルごとに、メカニズムは、ピクセル値が、オートエンコーダが予測または予想したものである確率を所定の閾値と比較する。その後、メカニズムは、1つまたは複数のピクセルが試験画像内の異常または異状を表すかどうかを判定することができる。U-netは、通常、それ自体非常に良好なジョブを行うが、希望通りの良好なジョブを行わない場合には、一実施形態において、メカニズムは、条件付き確率場モデル(CRF)を採用して、出力に後処理ステップを実行することにより、孔を埋め、小さい点を除去し、検出領域の境界を平滑化することによって結果をクリーンアップする。より簡単かつ旧来の方法は、接続コンポーネントの解析を行うだけで、一定の閾値サイズより小さい任意のコンポーネント(接続領域)をマーキングしない。U-netは、このようなクリーンアップの後処理ステップの適用がおそらく不要となるように良好に動作する。異常が検出された場合、メカニズムは画像内の異常をマーキングする(ブロック1205)。その後、メカニズムはマーキング画像を出力し(ブロック1206)、動作が終了する(ブロック1207)。ブロック1204で異常が検出されない場合には、動作が終了する(ブロック1207)。
【0076】
前述したように、例示的な実施形態は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、またはハードウェアおよびソフトウェアの両方の要素を含む実施形態の形を取り得ることを理解されたい。例示的な一実施形態において、例示的な実施形態のメカニズムは、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むがこれに限定されないソフトウェアまたはプログラム・コードに実装される。
【0077】
プログラム・コードの記憶または実行あるいはその両方に適したデータ処理システムは、例えば、システム・バスなどの通信バスを介してメモリ要素に直接または間接的に結合された少なくとも1つのプロセッサを含む。メモリ要素は、プログラム・コードを実際に実行する間に使用されるローカル・メモリ、大容量ストレージ、および実行中に大容量ストレージからコードを検索しなければならない回数を減らすために少なくとも一部のプログラム・コードの一時的なストレージとなるキャッシュ・メモリを含み得る。メモリは、ROM、PROM、EPROM、EEPROM(登録商標)、DRAM、SRAM、フラッシュ・メモリ、ソリッド・ステート・メモリなどを含むがこれに限定されない様々なタイプのメモリであってよい。
【0078】
入出力すなわちI/Oデバイス(キーボード、ディスプレイ、ポインティング・デバイスなどを含むがこれに限定されない)は、直接、あるいは介在する有線もしくは無線I/Oインターフェースまたはコントローラあるいはその両方などを介してシステムに結合可能である。I/Oデバイスは、スマート・フォン、タブレット・コンピュータ、タッチ・スクリーン・デバイス、音声認識デバイスなどを含むがこれに限定されない、例えば有線または無線接続を介して結合された通信デバイスなどの、従来のキーボード、ディスプレイ、ポインティング・デバイスなど以外の多数の様々な形を取り得る。既知のまたは後に開発される任意のI/Oデバイスが、例示的な実施形態の範囲内にあるものとする。
【0079】
ネットワーク・アダプタもシステムに結合して、データ処理システムを、介在するプライベート・ネットワークもしくはパブリック・ネットワークを介して他のデータ処理システムまたはリモート・プリンタまたはストレージ・デバイスに結合できるようにしてもよい。モデム、ケーブル・モデム、およびイーサネット(登録商標)カードは、現在利用できるタイプの有線通信用ネットワーク・アダプタのごく一部である。802.11a/b/g/n無線通信アダプタ、ブルートゥース(登録商標)無線アダプタなどを含むがこれに限定されない無線通信ベースのネットワーク・アダプタを利用してもよい。既知のまたは後に開発される任意のネットワーク・アダプタが、本発明の思想および範囲内にあるものとする。
【0080】
本発明の記載は、例示および説明のために提示されたものであり、網羅的であることも、開示された形態の発明に限定されることも意図していない。記載された実施形態の範囲および思想から逸脱することなく、多数の変更および変形形態が当業者に明らかであろう。実施形態は、本発明の原理、実際の応用を最もよく説明して、当業者が、意図される特定の用途に適する様々な変更を含む様々な実施形態に関して本発明を理解できるように選択され、記載されている。本願明細書で使用された用語は、実施形態の原理、実際の応用、もしくは市場にある技術に比べた技術的改良を最もよく説明するように、または当業者が本明細書に開示された実施形態を理解できるように選択されている。
上記の実施形態につき以下の付記を残しておく。
(付記1)
プロセッサとメモリとを含み、前記メモリが、生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ・エンジンを実装するように前記プロセッサを特に構成するために前記プロセッサにより実行される命令を含む、データ処理システムにおける方法であって、
ニューラル・ネットワークを、入力画像に基づいてオリジナルを予測するノックアウト・オートエンコーダとして使用されるようにトレーニングすることと、
前記ノックアウト・オートエンコーダ・エンジンによって、前記入力画像としての生物医学画像を前記ニューラル・ネットワークに提供することと、
前記ニューラル・ネットワークによって、前記生物医学画像内の各ピクセルの確率分布を出力することであって、各確率分布が、前記生物医学画像内の所与のピクセルについての予想ピクセル値の予測確率分布を表す、前記出力することと、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常検出コンポーネントによって、各ピクセルが予想値を有する確率を前記確率分布に基づいて判定して、複数の予想ピクセル確率を形成することと、
前記異常検出コンポーネントによって、前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出することと、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常マーキング・コンポーネントによって、前記生物医学画像内で検出された異常をマーキングして、マーキング生物医学画像を形成することと、
前記ノックアウト・オートエンコーダ・エンジンによって、前記マーキング生物医学画像を出力することと
を含む、方法。
(付記2)
前記ニューラル・ネットワークをトレーニングすることが、
1組のトレーニング画像のうちの各トレーニング画像について、前記トレーニング画像の1つまたは複数のノックアウト・パッチを選択することと、前記1つまたは複数のノックアウト・パッチをノイズで満たしてノックアウト画像を形成することと、前記ノックアウト画像内の残りのピクセルを考慮して前記ノックアウト画像の前記ノックアウト・パッチの予想されるコンテンツに基づいて、前記トレーニング画像を予測するように、前記ニューラル・ネットワークをトレーニングすることとを含む、付記1に記載の方法。
(付記3)
前記1組のトレーニング画像が、健康な患者の複数の生物医学画像を含む、付記2に記載の方法。
(付記4)
1つまたは複数のノックアウト・パッチを選択することが、前記トレーニング画像内の1つまたは複数のランダム・パッチを選択することを含む、付記2に記載の方法。
(付記5)
前記ニューラル・ネットワークが畳み込みニューラル・ネットワークを含む、付記1に記載の方法。
(付記6)
前記畳み込みニューラル・ネットワークがU-netを含む、付記5に記載の方法。
(付記7)
各ピクセルが予想値を有する確率を前記確率分布に基づいて判定することが、
所与のピクセル値を有する前記生物医学画像内の所与の各ピクセルについて、前記所与のピクセルに対応する所与の確率分布において前記所与のピクセル値に対応する確率値を識別することを含む、付記1に記載の方法。
(付記8)
前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出することが、
前記複数の予想ピクセル確率のうちの各予想ピクセル確率を所定の閾値と比較することと、
前記複数の予想ピクセル確率のうちの1つまたは複数が前記所定の閾値より小さいことに応答して、前記生物医学画像に異常があると判定することとを含む、付記1に記載の方法。
(付記9)
コンピュータ可読プログラムが記憶された非一過性のコンピュータ可読媒体を含むコンピュータ・プログラム製品であって、
前記コンピュータ可読プログラムが、コンピューティング・デバイス上で実行されると、前記コンピューティング・デバイスに生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ・エンジンを実装させ、
前記コンピュータ可読プログラムにより、前記コンピューティング・デバイスが、
ニューラル・ネットワークを、入力画像に基づいてオリジナルを予測するノックアウト・オートエンコーダとして使用されるようにトレーニングし、
前記ノックアウト・オートエンコーダ・エンジンによって、前記入力画像としての生物医学画像を前記ニューラル・ネットワークに提供し、
前記ニューラル・ネットワークによって、前記生物医学画像内の各ピクセルの確率分布を出力し、各確率分布が、前記生物医学画像内の所与のピクセルについての予想ピクセル値の予測確率分布を表し、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常検出コンポーネントによって、各ピクセルが予想値を有する確率を前記確率分布に基づいて判定して、複数の予想ピクセル確率を形成し、
前記異常検出コンポーネントによって、前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出し、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常マーキング・コンポーネントによって、前記生物医学画像内で検出された異常をマーキングして、マーキング生物医学画像を形成し、
前記ノックアウト・オートエンコーダ・エンジンによって、前記マーキング生物医学画像を出力する、コンピュータ・プログラム製品。
(付記10)
前記ニューラル・ネットワークをトレーニングすることが、
1組のトレーニング画像のうちの各トレーニング画像について、前記トレーニング画像の1つまたは複数のノックアウト・パッチを選択することと、前記1つまたは複数のノックアウト・パッチをノイズで満たしてノックアウト画像を形成することと、前記ノックアウト画像内の残りのピクセルを考慮して前記ノックアウト画像の前記ノックアウト・パッチの予想されるコンテンツに基づいて、前記トレーニング画像を予測するように、前記ニューラル・ネットワークをトレーニングすることとを含む、付記9に記載のコンピュータ・プログラム製品。
(付記11)
前記1組のトレーニング画像が、健康な患者の複数の生物医学画像を含む、付記10に記載のコンピュータ・プログラム製品。
(付記12)
1つまたは複数のノックアウト・パッチを選択することが、前記トレーニング画像内の1つまたは複数のランダム・パッチを選択することを含む、付記10に記載のコンピュータ・プログラム製品。
(付記13)
前記ニューラル・ネットワークが畳み込みニューラル・ネットワークを含む、付記10に記載のコンピュータ・プログラム製品。
(付記14)
前記畳み込みニューラル・ネットワークがU-netを含む、付記13に記載のコンピュータ・プログラム製品。
(付記15)
各ピクセルが予想値を有する確率を前記確率分布に基づいて判定することが、
所与のピクセル値を有する前記生物医学画像内の所与の各ピクセルについて、前記所与のピクセルに対応する所与の確率分布において前記所与のピクセル値に対応する確率値を識別することを含む、付記9に記載のコンピュータ・プログラム製品。
(付記16)
前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出することが、
前記複数の予想ピクセル確率のうちの各予想ピクセル確率を所定の閾値と比較することと、
前記複数の予想ピクセル確率のうちの1つまたは複数が前記所定の閾値より小さいことに応答して、前記生物医学画像に異常があると判定することとを含む、付記9に記載のコンピュータ・プログラム製品。
(付記17)
装置であって、
プロセッサと、
前記プロセッサに結合されたメモリとを含み、
前記メモリが、前記プロセッサによって実行されると前記プロセッサに生物医学画像内の異常を検出するためのノックアウト・オートエンコーダ・エンジンを実装させる命令を含み、
前記命令により、前記プロセッサが、
ニューラル・ネットワークを、入力画像に基づいてオリジナルを予測するノックアウト・オートエンコーダとして使用されるようにトレーニングし、
前記ノックアウト・オートエンコーダ・エンジンによって、前記入力画像としての生物医学画像を前記ニューラル・ネットワークに提供し、
前記ニューラル・ネットワークによって、前記生物医学画像内の各ピクセルの確率分布を出力し、各確率分布が、前記生物医学画像内の所与のピクセルについての予想ピクセル値の予測確率分布を表し、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常検出コンポーネントによって、各ピクセルが予想値を有する確率を前記確率分布に基づいて判定して、複数の予想ピクセル確率を形成し、
前記異常検出コンポーネントによって、前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出し、
前記ノックアウト・オートエンコーダ・エンジン内で実行される異常マーキング・コンポーネントによって、前記生物医学画像内で検出された異常をマーキングして、マーキング生物医学画像を形成し、
前記ノックアウト・オートエンコーダ・エンジンによって、前記マーキング生物医学画像を出力する、装置。
(付記18)
前記ニューラル・ネットワークをトレーニングすることが、
1組のトレーニング画像のうちの各トレーニング画像について、前記トレーニング画像の1つまたは複数のノックアウト・パッチを選択することと、前記1つまたは複数のノックアウト・パッチをノイズで満たしてノックアウト画像を形成することと、前記ノックアウト画像内の残りのピクセルを考慮して前記ノックアウト画像の前記ノックアウト・パッチの予想されるコンテンツに基づいて、前記トレーニング画像を予測するように、前記ニューラル・ネットワークをトレーニングすることとを含む、付記17に記載の装置。
(付記19)
各ピクセルが予想値を有する確率を前記確率分布に基づいて判定することが、
所与のピクセル値を有する前記生物医学画像内の所与の各ピクセルについて、前記所与のピクセルに対応する所与の確率分布において前記所与のピクセル値に対応する確率値を識別することを含む、付記17に記載の装置。
(付記20)
前記生物医学画像内の異常を前記複数の予想ピクセル確率に基づいて検出することが、
前記複数の予想ピクセル確率のうちの各予想ピクセル確率を所定の閾値と比較することと、
前記複数の予想ピクセル確率のうちの1つまたは複数が前記所定の閾値より小さいことに応答して、前記生物医学画像に異常があると判定することとを含む、付記17に記載の装置。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12