特表2024-535806 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ベンタナ　メディカル　システムズ，　インコーポレイテッドの特許一覧

特表2024-535806二重デジタル病理画像における表現型を予測するための機械学習技術

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6A
6B
6C
7
8
9A
9B
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24A
24B
25
26A
26B

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-10-02

(54)【発明の名称】二重デジタル病理画像における表現型を予測するための機械学習技術

(51)【国際特許分類】

G06V 10/82 20220101AFI20240925BHJP

G06T 7/00 20170101ALI20240925BHJP

G06V 20/69 20220101ALI20240925BHJP

G01N 33/48 20060101ALI20240925BHJP

G01N 33/53 20060101ALI20240925BHJP

【ＦＩ】

G06V10/82

G06T7/00 350C

G06T7/00 630

G06V20/69

G01N33/48 M

G01N33/53 Y

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2024515932

(86)(22)【出願日】2022-09-13

(85)【翻訳文提出日】2024-03-12

(86)【国際出願番号】 US2022043285

(87)【国際公開番号】W WO2023043709

(87)【国際公開日】2023-03-23

(31)【優先権主張番号】63/261,308

(32)【優先日】2021-09-17

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】507179346

【氏名又は名称】ベンタナメディカルシステムズ，インコーポレイテッド

(74)【代理人】

【識別番号】100118902

【弁理士】

【氏名又は名称】山本修

(74)【代理人】

【識別番号】100106208

【弁理士】

【氏名又は名称】宮前徹

(74)【代理人】

【識別番号】100196508

【弁理士】

【氏名又は名称】松尾淳一

(74)【代理人】

【識別番号】100173565

【弁理士】

【氏名又は名称】末松亮太

(72)【発明者】

【氏名】マーティン，ジム・エフ

(72)【発明者】

【氏名】ニエ，ヤオ

(72)【発明者】

【氏名】ベヌゴパル，ラガバン

(72)【発明者】

【氏名】ワーン，シンウェイ

【テーマコード（参考）】

2G045

5L096

【Ｆターム（参考）】

2G045AA24

2G045AA25

2G045AA26

2G045CB01

2G045CB02

2G045DA36

2G045FA16

2G045FB03

2G045FB07

2G045JA01

2G045JA03

5L096AA02

5L096BA13

5L096CA02

5L096DA01

5L096EA14

5L096FA66

5L096GA10

5L096GA30

5L096GA51

5L096HA11

5L096KA04

(57)【要約】

組織切片の二重免疫組織化学（ＩＨＣ）染色は、２つのバイオマーカーとそれらの共発現を単一細胞レベルで同時検出することを可能にし、共局在を識別するための２つのＩＨＣ染色およびさらなる位置合わせを必要としない。二重ＩＨＣは、病理学者を含む人間にとって確実にスコアリングすることが困難であることが多い。ここに記載の方法およびシステムは、機械学習モデルおよび確率マップを使用して、個々の表現型ＥＲ／ＰＲを検出し記録する。
【選択図】図１

【特許請求の範囲】

【請求項1】

第１のタイプのバイオマーカーおよび第２のタイプのバイオマーカーについて染色された生物学的試料の少なくとも一部を表示するデジタル病理画像にアクセスすることと、
前記デジタル病理画像を混合解除して、
前記第１のタイプのバイオマーカーが識別される前記生物学的試料の前記少なくとも一部を表示する第１の合成単一画像、および
前記第２のタイプのバイオマーカーが識別される前記生物学的試料の前記少なくとも一部を表示する第２の合成単一画像
を生成することと、
前記第１の合成単一画像に第１の機械学習モデルを適用して、
前記第１の合成単一画像から第１の複数の細胞を検出し、
前記第１の複数の細胞の各細胞について、分類の第１のセットのうちの分類を決定することであって、前記第１のセットのうちの前記分類が、前記細胞が前記第１のタイプのバイオマーカーを有するバイオマーカーを含むかどうかを示す、第１のセットのうちの分類を決定することと、
前記第２の合成単一画像に第２の機械学習モデルを適用して、
前記第２の合成単一画像から第２の複数の細胞を検出し、
前記第２の複数の細胞の各細胞について、分類の第２のセットのうちの分類を決定することであって、前記第２のセットのうちの前記分類が、前記細胞が前記第２のタイプのバイオマーカーを有するバイオマーカーを含むかどうかを示し、前記分類の第１のセットが前記分類の第２のセットとは異なる、第２のセットのうちの分類を決定することと、
前記第１の複数の細胞の分類と前記第２の複数の細胞の分類とをマージして、マージされた分類を生成することと、
マージされた分類を有する前記デジタル病理画像を出力することと
を含む、方法。

【請求項2】

前記第１の複数の細胞についての分類を決定することが、
確率マップの第１のセットを生成することであって、前記確率マップの第１のセットの各確率マップが複数の画素を含み、前記分類の第１のセットのうちの分類に関連付けられ、前記確率マップが、前記複数の画素の各画素について、前記画素が前記分類に対応するかどうかを示す確率値を識別する、確率マップの第１のセットを生成することと、
前記第１の複数の細胞の各細胞について、
前記確率マップの第１のセットのうち、前記細胞を表す１つまたは複数の画素についての最も高い確率値を含む確率マップを識別することと、
識別された前記確率マップと関連付けられた分類を前記細胞に割り当てることと
を含む、請求項１に記載の方法。

【請求項3】

前記第２の複数の細胞についての分類を決定することが、
確率マップの第２のセットを生成することであって、前記確率マップの第２のセットの各確率マップが複数の画素を含み、前記分類の第２のセットのうちの分類に関連付けられ、前記確率マップが、前記複数の画素の各画素について、前記画素が前記分類に対応するかどうかを示す確率値を識別する、確率マップの第２のセットを生成することと、
前記第２の複数の細胞の各細胞について、
前記確率マップの第２のセットのうち、前記細胞を表す１つまたは複数の画素についての最も高い確率値を含む確率マップを識別することと、
識別された前記確率マップと関連付けられた分類を前記細胞に割り当てることと
を含む、請求項１または２に記載の方法。

【請求項4】

前記第１の機械学習モデルおよび／または前記第２の機械学習モデルがＵ－Ｎｅｔモデルを含む、請求項１から３のいずれか一項に記載の方法。

【請求項5】

前記第１のタイプのバイオマーカーがエストロゲン受容体タンパク質であり、前記第２のタイプのバイオマーカーがプロゲステロン受容体タンパク質である、請求項１から４のいずれか一項に記載の方法。

【請求項6】

マージされた分類を有する前記デジタル病理画像を出力することが、前記マージされた分類を前記デジタル病理画像上にオーバーレイすることを含む、請求項１から５のいずれか一項に記載の方法。

【請求項7】

マージされた分類を有する前記デジタル病理画像が、第３の機械学習モデルを訓練するための訓練画像として使用される、請求項１から６のいずれか一項に記載の方法。

【請求項8】

前記第１の複数の細胞についての分類を決定することが、
確率マップの第１のセットを生成することであって、前記確率マップの第１のセットの各確率マップが複数の画素を含み、前記分類の第１のセットのうちの分類に関連付けられ、前記確率マップが、前記複数の画素の各画素について、前記画素が前記分類に対応するかどうかを示す確率値を識別する、確率マップの第１のセットを生成することを含み、
前記第２の複数の細胞についての分類を決定することが、
確率マップの第２のセットを生成することであって、前記確率マップの第２のセットの各確率マップが複数の画素を含み、前記分類の第２のセットのうちの分類に関連付けられ、前記確率マップが、前記複数の画素の各画素について、前記画素が前記分類に対応するかどうかを示す確率値を識別する、確率マップの第２のセットを生成することを含み、
前記確率マップの第１のセットおよび前記確率マップの第２のセットがマージされてアンカーポイントのセットを生成し、前記アンカーポイントのセットの各アンカーポイントが、前記分類の第１のセットのうちの第１の分類および前記分類の第２のセットのうちの第２の分類を割り当てられる、請求項１から７のいずれか一項に記載の方法。

【請求項9】

コンピュータ製品であって、実行されるとコンピュータシステムを制御して請求項１から８のいずれか一項に記載の方法を実行する複数の命令を記憶している非一時的コンピュータ可読媒体を備える、コンピュータ製品。

【請求項10】

請求項９に記載のコンピュータ製品と、
前記コンピュータ可読媒体に記憶された命令を実行するための１つまたは複数のプロセッサと
を備える、システム。

【請求項11】

請求項１から８のいずれか一項に記載の方法を実行するための手段を備える、システム。

【請求項12】

請求項１から８のいずれか一項に記載の方法を実行するように構成された１つまたは複数のプロセッサを備える、システム。

【請求項13】

請求項１から８のいずれか一項に記載の方法のステップをそれぞれ実行するモジュールを備える、システム。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０２１年９月１７日に出願された米国仮特許出願第６３／２６１，３０８号の利益および優先権を主張し、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。

【0002】

分野
本開示は、デジタル病理学に関し、詳細には、機械学習技術を使用して、二重デジタル病理画像に表示された細胞における２つ以上の表現型を予測するための技術に関する。

【背景技術】

【0003】

背景
デジタル病理学は、病理スライド（例えば、組織病理または細胞病理のガラススライド）をデジタル画像にスキャンすることを含む。デジタル画像内の組織および／または細胞は、その後、疾患の診断、治療に対する反応の評価、および疾患と戦うための薬理学的薬剤の開発を含む様々な理由のために、デジタル病理画像解析によって検査され、および／または病理学者によって解釈されることがある。デジタル画像（実質的に透明である）内の組織および／または細胞を検査するために、病理スライドは、組織および／または細胞成分に選択的に結合する様々な染色アッセイ（例えば、免疫染色）を使用して調製されることがある。

【0004】

免疫組織化学（ＩＨＣ）染色は、スライドに固定された検体中の特定のタンパク質の存在を検出するために使用される。エストロゲン受容体（ＥＲ）およびプロゲステロン受容体（ＰＲ）タンパク質は、乳がんの臨床管理および治療決定を推進する重要なバイオマーカーである。単一（ｓｉｎｇｌｅ）ＩＨＣ染色または単一（ｓｉｎｇｌｅｐｌｅｘ）ＩＨＣ染色は、単一のバイオマーカーについて単一のスライドを染色することを含む。単一ＩＨＣ染色は、バイオマーカーの共局在を探すために複数のスライドの使用を必要とする。共局在を探すために、各スライドの画像を互いに位置合わせまたはマッピングしなければならず、次いでオーバーレイして両方のバイオマーカーを示す単一の画像を作成することがある。

【0005】

組織切片の二重免疫組織化学（ＩＨＣ）染色は、単一のスライド上での２つのバイオマーカーの同時検出を可能にする。したがって、二重（ｄｕｐｌｅｘ）ＩＨＣ染色は、それぞれが単一ＩＨＣ染色が施された２枚のスライドを用意して、共局在を識別するためのさらなる位置合わせをする代わりに、単一細胞レベルでのバイオマーカーの共発現の分析を可能にする。しかしながら、二重ＩＨＣスライドは、特定の問題に直面している。例えば、二重ＩＨＣスライドは、人間（例えば、病理学者）にとって確実にスコアリングすることが困難であることが多い。病理学者は、バイオマーカーが重複し、クラスタ化しているため、二重ＩＨＣスライド（例えば、ＥＲ／ＰＲ）上で直接スコアリングすることができないことが多い。さらに、各スライドには数千個の細胞が含まれ得るため、スコアリングプロセスには時間がかかる可能性がある。したがって、発現レベルおよび共局在レベルを正確に識別および計数する作業は、実際にはほぼ不可能である。

【発明の概要】

【0006】

概要
様々な実施形態において、二重デジタル病理画像に表示された細胞における２つ以上の表現型を予測するコンピュータ実装方法が提供される。コンピュータ実装方法は、第１のタイプのバイオマーカーおよび第２のタイプのバイオマーカーについて染色された生物学的試料の少なくとも一部を表示するデジタル病理画像にアクセスすることを含む。コンピュータ実装方法は、デジタル病理画像を混合解除して、（ｉ）第１のタイプのバイオマーカーが識別された生物学的試料の少なくとも一部を表示する第１の合成単一画像と、（ｉｉ）第２のタイプのバイオマーカーが識別された生物学的試料の少なくとも一部を表示する第２の合成単一画像と、を生成することを含む。コンピュータ実装方法は、第１の機械学習モデルを第１の合成単一画像に適用して、（ｉ）第１の合成単一画像から第１の複数の細胞を検出し、第１の複数の細胞の各細胞について、分類の第１のセットのうちの分類を決定することをさらに含む。第１のセットのうちの分類は、細胞第１のタイプのバイオマーカーを有するバイオマーカーを含むかどうかを示す。

【0007】

コンピュータ実装方法は、第２の機械学習モデルを第２の合成単一画像に適用して、（ｉ）第２の合成単一画像から第２の複数の細胞を検出し、（ｉｉ）第２の複数の細胞の各細胞について、分類の第２のセットのうちの分類を決定することをさらに含む。第２のセットのうちの分類は、細胞が第２のタイプのバイオマーカーを有するバイオマーカーを含むかどうかを示す。場合によっては、分類の第１のセットは分類の第２のセットとは異なる。コンピュータ実装方法は、第１の複数の細胞の分類と第２の複数の細胞の分類とをマージして、マージされた分類を生成することをさらに含む。コンピュータ実装方法は、マージされた分類を有するデジタル病理画像を出力することをさらに含む。

【0008】

いくつかの実施形態では、第１の複数の細胞についての分類を決定することは、確率マップの第１のセットを生成することを含む。確率マップの第１のセットの各確率マップは、複数の画素を含み、分類の第１のセットのうちの分類と関連付けられる。確率マップの第１のセットの各確率マップはまた、複数の画素の各画素について、その画素がその分類に対応するかどうかを示す確率値を識別する。第１の複数の細胞についての分類を決定することは、第１の複数の細胞の各細胞について、（ｉ）確率マップの第１のセットのうち、細胞を表す１つまたは複数の画素についての最も高い確率値を含む確率マップを識別することと、（ｉｉ）識別された確率マップと関連付けられた分類を細胞に割り当てることと、を含む。

【0009】

いくつかの実施形態では、第２の複数の細胞の分類を決定することは、確率マップの第２のセットを生成することを含む。確率マップの第２のセットの各確率マップは、複数の画素を含み、分類の第２のセットのうちの分類と関連付けられる。確率マップの第２のセットの各確率マップはまた、複数の画素の各画素について、その画素がその分類に対応するかどうかを示す確率値を識別する。第２の複数の細胞についての分類を決定することは、第２の複数の細胞の各細胞について、（ｉ）確率マップの第２のセットのうち、細胞を表す１つまたは複数の画素についての最も高い確率値を含む確率マップを識別することと、（ｉｉ）識別された確率マップと関連付けられた分類を細胞に割り当てることと、を含む。

【0010】

いくつかの実施形態では、第１の機械学習モデルおよび／または第２の機械学習モデルは、Ｕ－Ｎｅｔモデルを含む。

【0011】

いくつかの実施形態では、第１のタイプのバイオマーカーはエストロゲン受容体タンパク質であり、第２のタイプのバイオマーカーはプロゲステロン受容体タンパク質である。

【0012】

いくつかの実施形態では、マージされた分類を有するデジタル病理画像を出力することは、マージされた分類をデジタル病理画像上にオーバーレイすることを含む。

【0013】

いくつかの実施形態では、マージされた分類を有するデジタル病理画像は、第３の機械学習モデルを訓練するための訓練画像として使用される。

【0014】

いくつかの実施形態では、第１の複数の細胞についての分類を決定することは、確率マップの第１のセットを生成することを含む。確率マップの第１のセットの各確率マップは、複数の画素を含み、分類の第１のセットのうちの分類と関連付けられ、確率マップは、複数の画素の各画素について、画素がその分類に対応するかどうかを示す確率値を識別する。

【0015】

いくつかの実施形態では、第２の複数の細胞の分類を決定することは、確率マップの第２のセットを生成することを含む。確率マップの第２のセットの各確率マップは、複数の画素を含み、分類の第２のセットのうちの分類と関連付けられ、確率マップは、複数の画素の各画素について、画素がその分類に対応するかどうかを示す確率値を識別する。

【0016】

いくつかの実施形態では、確率マップの第１のセットおよび確率マップの第２のセットは、アンカーポイントのセットを生成するためにマージされる。アンカーポイントのセットの各アンカーポインは、分類の第１のセットのうちの第１の分類および分類の第２のセットのうちの第２の分類を割り当てられる。

【0017】

いくつかの実施形態では、１つまたは複数のデータプロセッサと、非一時的コンピュータ可読記憶媒体であって、１つまたは複数のデータプロセッサ上で実行されると、１つまたは複数のデータプロセッサに、本明細書に開示された１つまたは複数の方法の一部もしくはすべてを実行させる命令を含む、非一時的コンピュータ可読記憶媒体とを含むシステムが提供される。

【0018】

いくつかの実施形態では、非一時的機械可読記憶媒体に有形に具現化され、１つまたは複数のデータプロセッサに、本明細書に開示された１つまたは複数の方法の一部もしくはすべてを実行させるように構成された命令を含むコンピュータプログラム製品が提供される。

【0019】

本開示のいくつかの実施形態は、１つまたは複数のデータプロセッサを含むシステムを含む。いくつかの実施形態では、システムは、非一時的コンピュータ可読記憶媒体であって、１つまたは複数のデータプロセッサ上で実行されると、１つまたは複数のデータプロセッサに、１つまたは複数の方法の一部もしくはすべておよび／または本明細書に開示された１つまたは複数のプロセスの一部もしくはすべてを実行させる命令を含む、非一時的コンピュータ可読記憶媒体を含む。本開示のいくつかの実施形態は、１つまたは複数のデータプロセッサに、本明細書に開示された１つまたは複数の方法の一部もしくはすべておよび／または１つまたは複数のプロセスの一部もしくはすべてを実行させるように構成された命令を含む、非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品を含む。

【0020】

採用された用語および表現は、説明の用語として使用されたものであり、限定を意味するものではなく、このような用語および表現の使用において、示され説明された特徴またはその一部の均等物を排除する意図はないが、特許請求される発明の範囲内で様々な修正が可能であることが認識される。したがって、特許請求の範囲に記載された本発明は、実施形態および任意の特徴によって具体的に開示されているが、本明細書に開示された概念の修正および変形は当業者によって使用されてもよく、このような修正および変形は、添付の特許請求の範囲によって定義される本発明の範囲内にあるものと見なされることを理解されたい。

【0021】

様々な実施形態の態様および特徴は、添付の図面を参照して例を説明することによってより明らかになるであろう。

【図面の簡単な説明】

【0022】

【図1】いくつかの実施形態による、機械学習技術を使用して合成単一画像において検出された表現型をマージする画像処理システム１００を示す概略図である。

【図2】いくつかの実施形態による、デジタル病理画像を生成するための例示的なネットワークを示す図である。

【図3】いくつかの実施形態による、機械学習モデルを使用してデジタル病理画像を処理するためのコンピューティング環境を示すブロック図である。

【図4】いくつかの実施形態による、二重ＥＲ／ＰＲおよび隣接する単一ＩＨＣＥＲ／ＰＲの一例を示す図である。

【図5】いくつかの実施形態による、二重ＥＲ／ＰＲ画像から選択され、単一ＩＨＣＥＲ画像および単一ＩＨＣＰＲ画像上に位置合わせされた視野（ＦＯＶ）を示す図である。

【図6A】いくつかの実施形態による、合成単一画像を生成するための例示的な技術を示す図である。

【図6B】いくつかの実施形態による、合成単一画像を生成するための例示的な技術を示す図である。

【図6C】いくつかの実施形態による、合成単一画像を生成するための例示的な技術を示す図である。

【図7】いくつかの実施形態による、事前訓練されたＵ－Ｎｅｔモデルによって得られたｄａｂｓｙｌＥＲおよびｔａｍｒａＰＲの例示的な初期シード位置を示す図である。

【図8】いくつかの実施形態による、二重スライド画像内の表現型を検出するために使用される機械学習モデルの例示的なアーキテクチャである。

【図9A】いくつかの実施形態による残差ブロックを示す図である。

【図9B】いくつかの実施形態によるピラミッド層を示す図である。

【図10】いくつかの実施形態による、二重画像内の表現型を検出するように機械学習モデルを訓練するためのプロセスを示す図である。

【図11】いくつかの実施形態による、例示的なシード位置および２つのモデルによって生成された異なるクラスラベルを示す図である。

【図12】いくつかの実施形態による、ＥＲモデルによって生成された５つの確率マップを示す図である。

【図13】いくつかの実施形態による、ＥＲチャネルおよびＰＲチャネル内の２つのＵ－Ｎｅｔモデルによって生成された確率マップ間の５つのマージされた確率マップの計算を示す図である。

【図14】いくつかの実施形態による、ＥＲチャネルとＰＲチャネルとの間のマージされた確率マップを探索することによって取得されたアンカーポイントの例を示す図である。

【図15】いくつかの実施形態による、画素レベルでの例示的なアンカーポイントならびに周囲のＥＲ＋点およびＰＲ＋点を示す図である。

【図16】いくつかの実施形態による、確率マップから決定された例示的なラベルグラフを示す図である。

【図17】いくつかの実施形態による、ＥＲ＋／ＥＲ－／その他にアンカーポイントを割り当てる例を示す図である。

【図18】いくつかの実施形態による、合成ＥＲ画像においてＥＲ＋／ＥＲ－／その他にアンカーポイントを割り当てるためのプロセスを示す図である。

【図19】いくつかの実施形態による、ＰＲ＋／ＰＲ－／その他にアンカーポイントを割り当てる例を示す図である。

【図20】いくつかの実施形態による、合成ＰＲ画像においてＰＲ＋／ＰＲ－／その他にアンカーポイントを割り当てるためのプロセスを示す図である。

【図21】いくつかの実施形態による、二重画像にオーバーレイされたマージされた表現型の例を示す図である。

【図22】いくつかの実施形態による、訓練された機械学習モデルを使用して二重画像における表現型を検出するためのプロセスを示す図である。

【図23】いくつかの実施形態による、二重ＥＲ／ＰＲアルゴリズム用のマージされた表現型を使用する訓練パイプラインを示す図である。

【図24A】いくつかの実施形態による、３人の病理学者のコンセンサススコアならびにＵ－Ｎｅｔおよびマージ表現型アルゴリズムを示す図である。

【図24B】いくつかの実施形態による、３人の病理学者のコンセンサススコアならびにＵ－Ｎｅｔおよびマージ表現型アルゴリズムを示す図である。

【図25】いくつかの実施形態による、結果二重ＥＲ／ＰＲの表現型検出の例を示す図である。

【図26A】いくつかの実施形態による、異なるタイプの表現型を有する二重ＥＲ／ＰＲの例を示す図である。

【図26B】いくつかの実施形態による、異なるタイプの表現型を有する二重ＥＲ／ＰＲの例を示す図である。

【発明を実施するための形態】

【0023】

詳細な説明
既存の技術は、一般に、細胞検出アルゴリズムを使用してデジタル病理画像から細胞を検出し、次いで、検出された細胞に機械学習モデルを適用して、特定のタイプのバイオマーカーが、検出された細胞の１つまたは複数に存在するかどうかを予測することを含む。これらの機械学習モデルの性能は、通常、訓練データセットの精度に依存する。訓練データセットを生成することは、訓練データセットの１つまたは複数の訓練画像に表示された細胞にラベリングすることを含むことができ、ラベルは１人または複数の病理学者によって付けられ得る。２つ以上のタイプのバイオマーカーを識別するために染色された二重画像では、ラベリングプロセスが困難になる可能性がある。これは、２つ以上の染色が、二重画像の異なる領域に認識できないクラスタを形成する可能性があり、および／または二重画像内の同じ画像領域に存在する可能性があるためである。このような染色特性は、細胞領域をどのように適切にラベリングすべきかに関して混乱をもたらす可能性がある。このような困難さは、訓練画像が不正確なまたは一貫性のない訓練ラベルと関連付けられることにつながる可能性があり、これはさらに、他の二重画像に表示された細胞における２つ以上のバイオマーカーの存在を予測するために、このような訓練画像で訓練される機械学習モデルの性能低下につながる。

【0024】

したがって、本明細書に記載される特定の実施形態は、二重画像に表示される細胞において２つ以上のタイプのバイオマーカーに関連する細胞の表現型を正確に予測することによって、これらの問題および他の問題に対処することができる。画像処理システムは、二重スライド画像にアクセスすることができる。二重画像は、胸部組織の切片などの生物学的試料の少なくとも一部を表示する。２つ以上のタイプのバイオマーカーを識別するために、生物学的試料の少なくとも一部を染色することができる。例えば、第１のタイプのバイオマーカーはエストロゲン受容体（ＥＲ）とすることができ、第２のタイプのバイオマーカーはプロゲステロン受容体（ＰＲ）とすることができる。

【0025】

画像処理システムは、二重画像を処理して合成単一画像のセットを生成することができる。合成単一画像のセットの各合成単一画像を生成して、単一のバイオマーカー（例えば、ＥＲ）について染色された細胞を表示することができる。いくつかの例では、合成単一画像は、（ｉ）対応するバイオマーカーについて染色された細胞を表示する前処理画像を生成し、（ｉｉ）前処理画像を対比染色画像と組み合わせることによって生成される。対比染色画像を使用することにより、バイオマーカーを、前処理画像に表示される他の細胞構造から視覚的に区別することができる。

【0026】

合成単一画像のセットの各合成単一画像について、画像処理システムは、機械学習モデルを合成単一画像に適用して、合成単一画像に表示された検出された細胞それぞれの表現型を予測することができ、この表現型が、対応するタイプのバイオマーカーに関連する。いくつかの例では、機械学習モデルは、第１のタイプのバイオマーカーについて染色された細胞を表示する第１の合成単一画像を処理するように訓練され、異なる機械学習モデルは、第２のタイプのバイオマーカーについて染色された第２の合成単一画像を処理するように訓練される。例えば、画像処理システムは、第１の訓練されたＵ－ＮｅｔモデルをＥＲバイオマーカーについて染色された合成単一画像に適用して、（ｉ）合成単一画像内の細胞を検出し、（ｉｉ）検出された細胞のそれぞれについて、ＥＲバイオマーカーに対する細胞の表現型（例えば、ＥＲ陽性、ＥＲ陰性、アーチファクト）を予測することができる。この例を続けると、画像処理システムは、第２の訓練されたＵ－Ｎｅｔモデルを、ＰＲバイオマーカーについて染色された別の合成単一画像に適用して、（ｉ）他の合成単一画像内の細胞を検出し、（ｉｉ）検出された細胞のそれぞれについて、ＰＲバイオマーカーに対する細胞の表現型（例えば、ＰＲ陽性、ＰＲ陰性、アーチファクト）を予測することができる。

【0027】

場合によっては、機械学習モデルは、合成単一画像内の各細胞について、分類のセットから分類を決定するように訓練される。セットの各分類は、対応するタイプのバイオマーカーに対する細胞の特定の表現型に対応することができる。例えば、機械学習モデルは、検出された細胞が、（ｉ）ＥＲバイオマーカー（ＥＲ＋）を含むか、（ｉｉ）ＥＲバイオマーカー（ＥＲ－）を含まないか、（ｉｉｉ）間質細胞に対応するか、（ｉｖ）免疫細胞に対応するか、または（ｖ）アーチファクトもしくは他のタイプの生物学的構造に対応するかを出力することができる。分類を生成するために、画像処理システムは、機械学習モデルを使用して合成単一画像を処理して確率マップのセットを生成することができる。確率マップのセットの各確率マップは、合成単一画像の複数の画素を表すことができ、分類のセットのうちの特定の分類に対応することができる。確率マップは、複数の画素の各画素について、その画素がその分類に対応するかどうかを示す確率値を含む。この例を続けると、合成単一画像の確率マップのセットは、ＥＲ＋用の第１の確率マップ、ＥＲ－用の第２の確率マップ、間質細胞用の第３の確率マップ、免疫細胞用の第４の確率マップ、およびアーチファクト用の第５の確率マップを含むことができる。

【0028】

合成単一画像を表す確率マップのセットは、他の合成単一画像を表す確率マップの別のセットとマージされて、確率マップのマージされたセットを生成することができる。確率マップのマージされたセットを使用して、二重画像内の位置（「アンカーポイント」）のセットを決定することができ、各アンカーポイントについて１つまたは複数のバイオマーカーの存在を識別することができる。上記の例を続けると、確率マップの第１のセットは、ＥＲバイオマーカーについて染色された合成単一画像を表すことができ、確率マップの第１のセットは、（ｉ）ＥＲ＋分類用の第１の確率マップと、（ｉｉ）ＥＲ－分類用の第２の確率マップと、（ｉｉｉ）間質細胞分類用の第３の確率マップと、（ｉｖ）免疫細胞分類用の第４の確率マップと、（ｖ）アーチファクト分類用の第５の確率マップと、を含む。さらに、確率マップの第２のセットは、ＰＲバイオマーカーについて染色された合成の単一画像を表すことができ、確率マップの第２のセットは、（ｉ）ＰＲ＋分類用の第１の確率マップと、（ｉｉ）ＰＲ－分類用の第２の確率マップと、（ｉｉｉ）間質細胞分類用の第３の確率マップと、（ｉｖ）免疫細胞分類用の第４の確率マップと、（ｖ）アーチファクト分類用の第５の確率マップと、を含む。

【0029】

画像処理システムは、各画素について、確率マップの第１のセットのＥＲ＋確率マップの確率値を、確率マップの第２のセットのＰＲ＋確率マップの別の確率値と比較することによって、マージされたセットの第１の確率マップを生成することができる。次いで、比較に基づいて、より高い確率値およびその対応する分類（例えば、ＥＲ＋）を、マージされたセットの第１の確率マップ（例えば、ＥＲ＋／ＰＲ＋）のそれぞれの画素に割り当てることができる。比較するステップと割り当てるステップを他の画素を介して繰り返して、マージされたセットの第１の確率マップを生成することができる。上記のステップを繰り返して、マージされたセットの他の確率マップ（例えば、ＥＲ－／ＰＲ－、ＥＲ＋／ＰＲ－、ＥＲ－／ＰＲ＋、その他）を生成することもできる。

【0030】

画像処理システムは、確率マップのマージされたセットを使用して、二重画像のアンカーポイントのセットを識別することができる。アンカーポイントのセットの各アンカーポイントは、個々のバイオマーカーまたは複数のバイオマーカーを有すると予測され得る二重画像内の領域（例えば、細胞中心）に対応することができる。アンカーポイントを決定するために、画像処理システムは、画素のセットを含む二重画像の領域を選択することができる。画像処理システムは、マージされたセットの各確率マップから、その領域の確率値のセットを取得することができ、各確率値は、その領域の対応する画素が確率マップに関連付けられた分類に対応するかどうかを識別するかどうかを示す。確率マップのマージされたセット全体にわたる画素のセットから、画像処理システムは、最も高い確率値を有する画素を選択し、選択された画素をアンカーポイントとして割り当てることができる。

【0031】

アンカーポイントのセットの各アンカーポイントは、アンカーポイントによって表される画像領域が個々のマーカーまたは複数のバイオマーカーの存在を示すかどうかを予測する１つまたは複数の対応する分類でラベル付けされ得る。例えば、アンカーポイントは、アンカーポイントが、ＥＲバイオマーカーを含むと予測されたＥＲ＋確率マップの領域から所定の距離（例えば、１０画素）以内にあることに基づいて、ＥＲ＋分類でラベル付けされ得る。この例を続けると、アンカーポイントが、ＰＲバイオマーカーを含むと予測されたＰＲ＋確率マップの領域から所定の距離（例えば、１０画素）以内にあることに基づいて、同じアンカーポイントをＰＲ＋分類でラベリングすることもできる。結果として、アンカーポイントに対応する二重画像の領域を、細胞が２つのタイプのバイオマーカー（例えば、ＥＲ＋／ＰＲ＋）の存在を示す表現型を有するとしてラベリングすることができる。確率マップの確率値を二重画像のアンカーポイントに組み込むことで、二重画像に、複数のバイオマーカーについて細胞の表現型を識別する１つまたは複数の領域を含めることが可能になる。マージされた表現型を有するアンカーポイントを、二重画像上にオーバーレイさせることができ、それにより、二重画像の所与の画像領域について、複数のバイオマーカーに対応する表現型を正確に表示する。

【0032】

本明細書に記載の特定の実施形態は、二重画像におけるバイオマーカーの共局在または共発現を識別する機械学習モデルの性能を向上させる。画像処理システムは、二重画像から合成単一画像を生成し、合成単一画像に別々の機械学習モデルを適用し、機械学習モデルによって生成された確率マップをマージして、二重画像に表示された各細胞についての複数の分類を出力することによって性能を向上させることができる。本画像処理システムは、複数のタイプのバイオマーカーが同じ二重画像内で混合されクラスタ化されている場合でも正確に実行することができる。したがって、本明細書の実施形態は、人工知能システムおよびデジタル病理画像処理技術の機能の向上を反映する。

【0033】

特定の実施形態が説明されているが、これらの実施形態は例としてのみ提示されており、保護の範囲を限定することを意図するものではない。本明細書に記載された装置、方法、およびシステムは、様々な他の形態で具現化されてもよい。さらに、保護の範囲から逸脱することなく、本明細書に記載の例示的な方法およびシステムの形態の様々な省略、置換、および変更が行われてもよい。

【0034】

Ｉ．定義
本明細書で使用される場合、ある行為が何かに「基づく」場合、これは、その行為が何かの少なくとも一部に少なくとも部分的に基づくことを意味する。

【0035】

本明細書で使用される場合、「実質的に（ｓｕｂｓｔａｎｔｉａｌｌｙ）」、「およそ（ａｐｐｒｏｘｉｍａｔｅｌｙ）」、および「約（ａｂｏｕｔ）」という用語は、当業者によって理解されるように、大部分が指定されるものであるが、必ずしも完全には指定されないもの（および完全に指定されるものを含む）として定義される。任意の開示された実施形態では、「実質的に」、「およそ」、または「約」という用語は、指定されたものの「［パーセンテージ］以内」で置き換えられてもよく、パーセンテージは０．１、１、５、および１０％を含む。

【0036】

本明細書で使用される場合、「試料」、「生物学的試料」、「組織」または「組織試料」という用語は、ウイルスを含む任意の生物から得られる生体分子（例えば、タンパク質、ペプチド、核酸、脂質、炭水化物、またはそれらの組み合わせ）を含む任意の試料を指す。生物の他の例には、哺乳動物（例えばヒト、ネコ、イヌ、ウマ、ウシおよびブタのような獣医学動物；ならびにマウス、ラットおよび霊長類のような実験動物）、昆虫、環形動物、クモ類、有袋動物、爬虫類、両生類、細菌および真菌が含まれる。生物学的試料には、組織試料（組織切片および組織の針生検など）、細胞試料（Ｐａｐ塗抹標本もしくは血液塗抹標本などの細胞学的塗抹標本、または顕微解剖によって得られた細胞の試料など）、あるいは細胞画分、断片もしくは細胞小器官（細胞を溶解し、遠心分離などによってそれらの成分を分離することによって得られたものなど）が含まれる。生物学的試料の他の例としては、血液、血清、尿、精液、糞便、脳脊髄液、間質液、粘液、涙、汗、膿、生検組織（例えば、外科的生検または針生検によって得られる）、乳頭吸引物、耳垢、乳、膣液、唾液、スワブ（口腔スワブなど）、または最初の生物学的試料に由来する生体分子を含有する任意の材料が挙げられる。いくつかの実施形態では、本明細書で使用される「生物学的試料」という用語は、被験者から得られた腫瘍またはその一部から調製された試料（均質化試料または液化試料など）を指す。

【0037】

本明細書で使用される場合、「生物学的材料」、「生物学的構造」、または「細胞構造」という用語は、生体構造（例えば、細胞核、細胞膜、細胞質、染色体、ＤＮＡ、細胞、細胞塊など）の全体または一部を含む天然の材料または構造を指す。

【0038】

本明細書で使用される場合、「バイオマーカー」という用語は、正常もしくは異常なプロセス、または症状もしくは疾患の徴候である、血液、他の体液、または組織に見出される生物学的分子（例えば、タンパク質分子）を指す。バイオマーカーは、特定のタイプのバイオマーカーと関連付けられ得る。例えば、バイオマーカーはエストロゲン受容体（ＥＲ）またはプロゲステロン受容体（ＰＲ）とすることができる。

【0039】

本明細書で使用される場合、「デジタル病理画像」とは、染色された試料のデジタル画像を指す。

【0040】

本明細書で使用される場合、「表現型」とは、デジタル病理画像において対応するバイオマーカーに関連付けられた特徴を発現する細胞型を指す。例えば、二重画像のある領域におけるエストロゲン受容体の表現型はエストロゲン受容体（ＥＲ＋）の存在を識別することができ、同じ領域に対するプロゲステロン受容体の表現型はプロゲステロン受容体（ＰＲ－）の非存在を識別することができる。表現型をマージして、複数のバイオマーカー（例えば、ＥＲ＋／ＰＲ＋）の特徴を定義するために使用することができる。

【0041】

本明細書で使用される場合、「合成単一画像」とは、二重画像から生成されるデジタル病理画像を指し、合成単一画像は、（ａ）二重画像から導出された単染色画像と、（ｉｉ）対比染色画像とを組み合わせることによって生成される。合成単一画像は、特定の表現型を識別することができる。

【0042】

本明細書で使用される場合、「二重画像」とは、２つ以上のバイオマーカー（例えば、ＥＲ、ＰＲ）を識別するために染色されたデジタル病理画像を指す。

【0043】

本明細書で使用される場合、「アンカーポイント」とは、個々のバイオマーカーまたは複数のバイオマーカーを有すると予測され得るデジタル病理画像（例えば、二重画像）の領域（例えば、細胞中心）を指す。

【0044】

ＩＩ．概要
深層学習に基づくシステムおよび方法を使用して、二重画像から合成単一画像を生成し、合成単一画像のそれぞれから検出された細胞の表現型を識別し、識別された表現型をマージして、２つ以上のバイオマーカーを含む画像領域を決定することができる。図１は、いくつかの実施形態による、機械学習技術を使用して合成単一画像において検出された表現型をマージする画像処理システム１００を示す概略図を示す。画像処理システムは、２つ以上のタイプのバイオマーカーを示すように染色された病理スライド１０２の画像を受信するように構成され得る（ブロック１０４）。いくつかの実施形態では、画像処理システムは、エストロゲン受容体（ＥＲ）およびプロゲステロン受容体（ＰＲ）タンパク質の存在を示すように染色された二重スライドの画像を使用して動作するように構成される。画像内の各細胞は、ＥＲマーカーおよびＰＲマーカーのそれぞれについて陽性または陰性であるとして分類され得る。したがって、各細胞の表現型は、ＥＲ＋ＰＲ＋、ＥＲ＋ＰＲ－、ＥＲ－ＰＲ＋、ＥＲ－ＰＲ－または他の（例えば、間質、免疫、壊死、アーチファクトなど）として識別され得る。

【0045】

場合によっては、画像処理システムは、二重スライド画像を複数の画像タイルに分ける（ブロック１０６）。複数のバイオマーカーに対する細胞の表現型の識別は、複数の画像タイルのそれぞれについて行われ得る。場合によっては、画像タイルのセットが複数の画像タイルから選択され、画像タイルのセットは、バイオマーカーのタイプに対する細胞の表現型を検出するために１つまたは複数の機械学習モデルを訓練するための訓練画像として使用される。

【0046】

画像処理システムは、合成単一画像のセットを生成するために、二重画像を混合解除することができる（ブロック１０８および１１０）。合成単一画像のセットの各合成単一画像を生成して、単一のバイオマーカー（例えば、ＥＲ）について染色された細胞を表示することができる。いくつかの例では、合成単一画像は、（ｉ）対応するバイオマーカーについて染色された細胞を表示する前処理画像を生成し、（ｉｉ）前処理画像を対比染色画像と組み合わせることによって生成される。

【0047】

いくつかの実施形態では、画像処理システムは、画像タイルのセットを使用して機械学習モデル（例えば、Ｕ－Ｎｅｔモデル）を訓練し、合成単一画像内の検出された細胞それぞれの表現型を予測する。例えば、ＥＲバイオマーカーの細胞の表現型を予測するために画像タイルのセットを使用して第１の機械学習モデルを訓練することができ（ブロック１１２）、ＰＲバイオマーカーの細胞の表現型を予測するために画像タイルのセットを使用して第２の機械学習モデルを訓練することができる（ブロック１１４）。

【0048】

次いで、訓練された機械学習モデルを使用して、対応する合成単一画像内の細胞の表現型を検出することができる（ブロック１１６および１１８）。例えば、画像処理システムは、２つのＵ－Ｎｅｔモデルを使用して複数の確率マップ（例えば、１０個の確率マップ）を生成することができ、複数の確率マップを使用してＥＲおよびＰＲの細胞の表現型を検出することができる。例えば、１０個の確率マップのうちの５個は、ＥＲバイオマーカーについて染色された合成単一画像を表すことができ、確率マップは、（ｉ）ＥＲ＋分類用の第１の確率マップと、（ｉｉ）ＥＲ－分類用の第２の確率マップと、（ｉｉｉ）間質細胞分類用の第３の確率マップと、（ｉｖ）免疫細胞分類用の第４の確率マップと、（ｖ）アーチファクト分類用の第５の確率マップと、を含む。残りの５つの確率マップは、ＰＲバイオマーカーについて染色された合成単一画像を表すことができる。

【0049】

次いで、画像処理システムは、２つの機械学習モデルによって予測された細胞の表現型をマージすることができる（ブロック１２０）。場合によっては、論理「積（ＡＮＤ）」を使用して、各細胞がどの表現型に属するかを直接計算する。確率的優先順位を使用して、バイオマーカーのすべての異なる共発現をマージし、複数のタイプのバイオマーカーの識別に関連する細胞の表現型を識別することができる。いくつかの実施形態では、画像処理システムは、アンカーポイントを各核（ＥＲ＋／ＰＲ＋／ＥＲ－／ＰＲ－／その他を含む）の細胞中心であると決定する。アンカーポイントは、２つの深層学習ネットワークによって訓練された２つの機械学習モデル（例えば、ＥＲモデルおよびＰＲモデル）によって生成された１０個の確率マップを比較することによって取得され得る。次いで、システムは、各アンカーポイントを、第１の機械学習モデル（「ＥＲモデル」）によって生成されたＥＲ＋／ＥＲ－／その他の分類と照合することができる。システムはまた、各アンカーポイントを、第２の機械学習モデル（「ＰＲモデル」）によって生成されたＰＲ＋／ＰＲ－／その他と照合することができる。場合によっては、データ構造を使用して表現型／バイオマーカーＥＲ／ＰＲのすべての位置を記録し、アンカーポイント／核の細胞中心を記録するマップと関連付けることができる。論理演算子（例えば、「ＡＮＤ」）および確率的優先順位を使用して、すべての異なる共発現をマージすることができる。結果として、複数のバイオマーカーを表すマージされた表現型を、二重スライド画像について識別することができる（ブロック１２２）。場合によっては、画像処理システムは、画像１２４に示すように、マージされた表現型を二重画像にオーバーレイする。２つの機械学習モデルおよび記載されたマッピング方法を使用することで、代替方法と比較した場合、計算および検出時間が大幅に短縮される。

【0050】

ＩＩＩ．デジタル病理画像の生成
デジタル病理学は、被験者を正確に診断し、治療上の意思決定を導くために、デジタル化された画像の解釈を伴う。デジタル病理学ソリューションでは、画像分析ワークフローを確立して、関心のある生物学的対象を、例えば陽性、陰性腫瘍細胞などに自動的に検出または分類することができる。例示的なデジタル病理学ソリューションのワークフローは、組織スライドを取得することと、デジタル画像を取得するためにデジタル画像スキャナ（例えば、全スライド画像（ＷＳＩ）スキャナ）で組織スライドの予め選択された領域または全体をスキャンすることと、１つまたは複数の画像解析アルゴリズムを使用してデジタル画像に対して画像解析を実行することと、画像解析（例えば、陽性、陰性、中程度、弱いなどの定量的または半定量的スコアリング）に基づいて各関心対象を潜在的に検出し、定量化する（例えば、各関心対象の対象固有領域または累積領域をカウントまたは識別する）ことと、を含む。

【0051】

図２は、デジタル病理画像を生成するための例示的なネットワーク２００を示す。固定／包埋システム２０５は、固定剤（例えば、ホルムアルデヒド溶液などの液体固定剤）および／または包埋物質（例えば、パラフィンワックスなどの組織学的ワックスおよび／またはスチレンもしくはポリエチレンなどの１つまたは複数の樹脂）を用いて組織試料（例えば、少なくとも１つの腫瘍の少なくとも一部を含む試料）を固定および／または包埋する。各試料は、試料を固定剤に所定の期間（例えば、少なくとも３時間）曝露し、次いで試料を脱水することによって（例えば、エタノール溶液および／または透明化中間体剤への曝露を介して）固定されてもよい。包埋物質は、試料が液体状態にある場合（例えば、加熱時）に浸潤することができる。

【0052】

試料の固定および／または包埋は、試料を保存し、試料の分解を遅らせるために使用される。組織学において、固定とは、一般に、化学組成を保持し、自然な試料構造を保存し、細胞構造を分解から維持するために化学物質を使用する不可逆的なプロセスを指す。固定はまた、切片化のために細胞または組織を硬化させてもよい。固定剤により、架橋タンパク質を使用して試料および細胞の保存が強化されることがある。固定剤は、いくつかのタンパク質に結合して架橋し、脱水によって他のタンパク質を変性させることがあり、これは組織を硬化させ、普通ならば試料を分解させる可能性がある酵素を不活性化し得る。固定剤はまた、細菌を死滅させることがある。

【0053】

固定剤は、例えば、調製された試料の灌流および浸漬によって投与されてもよい。メタノール、ブイン固定剤および／またはホルムアルデヒド固定剤、例えば中性緩衝ホルマリン（ＮＢＦ）またはパラフィン－ホルマリン（パラホルムアルデヒド－ＰＦＡ）を含む様々な固定剤が使用されてもよい。試料が液体試料（例えば、血液試料）である場合、試料をスライド上に塗抹して、固定前に乾燥させてもよい。固定プロセスは、組織学的試験の目的のために試料および細胞の構造を保存するのに役立ち得るが、固定により、組織抗原が隠蔽され、それによって抗原検出が低下する可能性がある。したがって、ホルマリンは抗原を架橋し、エピトープをマスクする可能性があるため、固定は一般に免疫組織化学の制限因子と考えられる。いくつかの例では、固定された試料を無水シトラコン酸（可逆的タンパク質架橋剤）で処理することおよび加熱することを含む、架橋の効果を逆転させるための追加のプロセスが行われる。

【0054】

包埋は、パラフィンワックスなどの適切な組織学的ワックスを試料（例えば、固定された組織試料）に浸潤させることを含み得る。組織学的ワックスは、水またはアルコールに不溶性であり得るが、キシレンなどのパラフィン溶媒には可溶性である場合がある。したがって、組織内の水をキシレンで置換する必要があり得る。そうするために、まず試料中の水をアルコールで徐々に置換することによって試料が脱水され得て、これは組織を、濃度が増加するエチルアルコール（例えば、０～約１００％）を通すことによって達成され得る。水をアルコールで置換した後、アルコールをアルコールと混和性のあるキシレンで置換してもよい。組織学的ワックスはキシレンに可溶性であり得るため、溶融したワックスは、キシレンで充填され、以前に水で充填されていた空間を充填し得る。ワックスで充填された試料を冷却して硬化させたブロックを形成してよく、これをミクロトーム、ビブラトーム、またはコンプレストームにクランプして切片を切断することができる。場合によっては、上記の例示的な手順から逸脱すると、パラフィンワックスの浸潤が生じ、抗体、化学物質、または他の固定剤の浸透が阻害されることがある。

【0055】

次いで、固定および／または包埋された組織試料（例えば、腫瘍の試料）を切片化するために、組織スライサー２１０が使用されてもよい。切片化とは、組織ブロックを検査のために顕微鏡スライド上に取り付ける目的で、組織ブロックから試料の薄いスライス片（例えば、２～５μｍの厚さ）を切断するプロセスである。切片化は、ミクロトーム、ビブラトームまたはコンプレストームを用いて行われてもよい。場合によっては、組織をドライアイスまたはイソペンタン中で急速に凍結させることができ、次いで冷蔵キャビネット（例えば、クライオスタット）内でコールドナイフで切断することができる。液体窒素などの他のタイプの冷却剤を使用して組織を凍結させることができる。明視野および蛍光顕微鏡で使用するための切片は、一般に、２～１０μｍ程度の厚さである。場合によっては、切片をエポキシ樹脂またはアクリル樹脂に埋め込むことができ、これにより、より薄い切片（例えば、＜２μｍ）を切断することが可能になる場合がある。次いで、これらの切片が１つまたは複数のガラススライドに取り付けられてもよい。試料切片を保護するために、カバースリップが上部に配置されてもよい。

【0056】

組織切片およびその中の細胞は実質的に透明であるため、スライドの調製は、典型的には、関連する構造をより視認可能にするために組織切片を染色すること（例えば、自動染色）をさらに含む。場合によっては、染色は手動で行われる。場合によっては、染色は、染色システム２１５を使用して半自動的または自動的に行われる。染色プロセスは、組織の異なる特性を発現するために、組織試料または固定液体試料の切片を１つまたは複数の異なる染色（例えば、連続的にまたは同時に）に曝露することを含む。

【0057】

例えば、染色は、特定のタイプの細胞をマークするために、および／または特定のタイプの核酸および／またはタンパク質にフラグを立てて顕微鏡検査を支援するために使用されてもよい。染色プロセスは、一般に、特定の化合物、構造、分子、または特徴（例えば、細胞内特徴）の存在を確認または定量化するために、色素または染色剤を試料に添加することを含む。例えば、染色は、組織切片から特定のバイオマーカーを識別または強調するのに役立ち得る。他の例では、染色を使用して、生物学的組織（例えば、筋線維または結合組織）、細胞集団（例えば、異なる血球）、または個々の細胞内の細胞小器官を識別または強調することができる。

【0058】

組織染色の１つの例示的なタイプは、組織構造を染色するために１つまたは複数の化学染料（例えば、酸性染料、塩基性染料、色原体）を使用する組織化学染色である。組織化学染色は、組織形態および／または細胞の微小解剖学的構造の（例えば、細胞核を細胞質と区別するため、脂質滴を示すなどのため）一般的な態様を示すために使用されることがある。組織化学染色の一例はＨ＆Ｅである。組織化学染色の他の例としては、三色染色（例えば、マッソンの三色）、過ヨウ素酸シッフ（ＰＡＳ）、銀染色および鉄染色が挙げられる。組織化学染色試薬（例えば、染料）の分子量は、典型的には約５００キロダルトン（ｋＤ）以下であるが、いくつかの組織化学染色試薬（例えば、アルシアンブルー、リンモリブデン酸（ＰＭＡ））は、最大２または３０００ｋＤの分子量を有することがある。高分子量組織化学染色試薬の一例はα－アミラーゼ（約５５ｋＤ）であり、これはグリコーゲンを示すために使用されることがある。

【0059】

組織染色のもう一つのタイプはＩＨＣで、「免疫染色」とも呼ばれ、これは、目的の標的抗原（バイオマーカーとも呼ばれる）に特異的に結合する一次抗体を使用する。ＩＨＣは直接的または間接的であり得る。直接ＩＨＣでは、一次抗体はラベル（例えば、発色団または蛍光団）に直接コンジュゲートされる。間接ＩＨＣでは、一次抗体が最初に標的抗原に結合し、次いでラベル（例えば、発色団または蛍光団）とコンジュゲートされた二次抗体が一次抗体に結合する。ＩＨＣ試薬の分子量は、抗体が約１５０ｋＤ以上の分子量を有するため、組織化学染色試薬の分子量よりもはるかに高い。

【0060】

染色を行うために、様々なタイプの染色プロトコルが使用されることがある。例えば、例示的なＩＨＣ染色プロトコルは、インキュベーション中にスライドからの試薬の漏出を防ぐために試料（例えば、組織切片）の周りに疎水性バリアラインを使用すること、非特異的染色の内因性源（例えば、酵素、遊離アルデヒド基、免疫グロブリン、特異的染色を模倣し得る他の無関係な分子）を遮断するために組織切片を試薬で処理すること、組織への抗体および他の染色試薬の浸透を促進するために透過化緩衝液と共に試料をインキュベートすること、特定の温度（例えば、室温、６～８℃）で一定期間（例えば、１～２４時間）一次抗体と共に組織切片をインキュベートすること、洗浄緩衝液を使用して試料をすすぐこと、次いで別の特定の温度（例えば、室温）で別の期間二次抗体と共に試料（組織切片）をインキュベートすること、水緩衝液を使用して試料を再びすすぎ、すすいだ試料を色原体（例えば、ＤＡＢ：３，３’－ジアミノベンジジン）と共にインキュベートすること、および反応を停止させるために色原体を洗い流すことを含む。場合によっては、その後、対比染色が試料の「風景」全体を識別するために使用され、組織標的の検出に使用される主要な色の基準として機能する。対比染色剤には、例えば、ヘマトキシリン（青から紫色の染色剤）、メチレンブルー（青色の染色剤）、トルイジンブルー（核を深青色に、多糖類をピンクから赤にする染色剤）、核ファストレッド（ケルンエヒトロート色素とも呼ばれ、赤色の染色剤）、メチルグリーン（緑色の染色剤）、非核発色性染色剤、例えばエオシン（ピンク色の染色剤）などが含まれ得る。当業者は、他の免疫組織化学染色技術を実施して染色を行うことができることを認識するであろう。

【0061】

別の例では、組織切片染色のためにＨ＆Ｅ染色プロトコルを実施することができる。Ｈ＆Ｅ染色プロトコルは、金属塩または媒染剤と混合したヘマトキシリン染色剤を試料に適用することを含む。次いで、試料を弱酸溶液ですすいで過剰な染色（分化）を除去し、続いて弱アルカリ水中で青みを付けることができる。ヘマトキシリンの適用後、試料をエオシンで対比染色することができる。他のＨ＆Ｅ染色技術を実施することができることが理解されよう。

【0062】

いくつかの実施形態では、目的の特徴がどれであるかに応じて、様々なタイプの染色剤を使用して染色を行うことができる。例えば、ＤＡＢは、ＩＨＣ染色用の様々な組織切片に使用することができ、ＤＡＢは、染色画像において関心のある特徴を表示する茶色をもたらす。別の例では、ＤＡＢ色がメラニン色素によってマスクされることがあるため、アルカリホスファターゼ（ＡＰ）がＩＨＣ染色用の皮膚組織切片に使用され得る。一次染色技術に関して、適用可能な染色剤は、例えば、好塩基性および好酸性染色、ヘマチンおよびヘマトキシリン、硝酸銀、三色染色剤などを含み得る。酸性染料は、組織または細胞中のカチオン性成分または塩基性成分、例えばタンパク質および細胞質中の他の成分と反応し得る。塩基性色素は、組織または細胞中のアニオン性成分または酸性成分、例えば核酸と反応し得る。上記のように、染色系の一例はＨ＆Ｅである。エオシンは、負に帯電したピンク色の酸性染料であってもよく、ヘマトキシリンは、ヘマテインおよびアルミニウムイオンを含む紫色または青色の塩基性染料であってもよい。染色の他の例には、過ヨウ素酸－シッフ反応（ＰＡＳ）染色、マッソンの三色、アルシアンブルー、ファンギーソン、レチキュリン染色などが含まれ得る。いくつかの実施形態では、異なるタイプの染色剤を組み合わせて使用してもよい。

【0063】

次いで、切片が対応するスライドに取り付けられてもよく、次いで、撮像システム２２０は、生のデジタル病理画像２２５ａ～ｎを生成するためにスキャンまたは撮像することができる。染色された試料を拡大するために、顕微鏡（例えば、電子顕微鏡または光学顕微鏡）を使用することができる。例えば、光学顕微鏡は、約数百ナノメートルなど、１μｍ未満の分解能を有し得る。ナノメートルまたはサブナノメートルの範囲でより細かい詳細を観察するために、電子顕微鏡が使用されてもよい。撮像装置（顕微鏡と組み合わされた、または顕微鏡から分離された）は、拡大された生物学的試料を撮像して、いくつかの（例えば１０～１６個などの）チャンネルを有するマルチチャンネル画像（例えば、マルチチャネル蛍光）などの画像データを取得する。撮像装置には、カメラ（例えば、アナログカメラ、デジタルカメラなど）、光学素子（例えば、１つまたは複数のレンズ、センサフォーカスレンズ群、顕微鏡対物レンズなど）、撮像センサ（例えば、電荷結合素子（ＣＣＤ）、相補型金属酸化膜半導体（ＣＭＯＳ）画像センサなど）、写真フィルムなどが含まれ得るが、これらに限定されない。デジタル実施形態では、撮像装置は、オンザフライ焦点合わせを証明するために協働する複数のレンズを含むことができる。イメージセンサ、例えばＣＣＤセンサは、生物学的試料のデジタル画像を撮像することができる。いくつかの実施形態では、撮像装置は、明視野撮像システム、マルチスペクトル撮像（ＭＳＩ）システムまたは蛍光顕微鏡システムである。撮像装置は、画像を取り込むために、不可視電磁放射線（例えばＵＶ光）または他の撮像技術を利用してもよい。例えば、撮像装置は、顕微鏡と、顕微鏡によって拡大された画像を取り込むように構成されたカメラとを備えてもよい。分析システムによって受信された画像データは、撮像装置によって取り込まれた生画像データと同一であってもよく、および／または生画像データから導出されてもよい。

【0064】

次いで、染色された切片の画像を、サーバーなどの記憶装置２２５に記憶されてもよい。画像は、ローカル、リモート、および／またはクラウドサーバに記憶されてもよい。各画像は、被写体の識別子および日付（例えば、試料が収集された日付および／または画像が取り込まれた日付）と関連付けて記憶されてもよい。画像はさらに、別のシステム（例えば、本明細書でさらに詳細に説明するように、病理学者に関連付けられたシステム、自動または半自動の画像分析システム、または機械学習訓練および展開システム）に送信されてもよい。

【0065】

ネットワーク２００に関して説明したプロセスに対する修正が企図されることが理解されよう。例えば、試料が液体試料である場合、包埋および／または切片化はプロセスから省略されてもよい。

【0066】

ＩＶ．デジタル病理画像変換用の例示的なシステム
図３は、いくつかの実施形態による、機械学習モデルを使用してデジタル病理画像を処理するためのコンピューティング環境３００を示すブロック図である。本明細書でさらに説明するように、デジタル病理画像を処理することは、デジタル病理画像を使用して機械学習アルゴリズムを訓練すること、および／またはデジタル病理画像の一部もしくはすべてを、機械学習アルゴリズムの訓練された（または部分的に訓練された）バージョン（すなわち、機械学習モデル）を使用して１つまたは複数の結果に変換することを含むことができる。

【0067】

図３に示すように、コンピューティング環境３００は、いくつかの段階、すなわち画像記憶段階３０５、前処理段階３１０、ラベリング段階３１５、データ増強段階３１７、訓練段階３２０、および結果生成段階３２５を含む。

【0068】

Ａ．画像記憶段階
画像記憶段階３０５は、生物学的試料スライド（例えば、組織スライド）から予め選択された領域、または生物学的試料スライドの全体のデジタル画像３３５のセットを提供するために（例えば、前処理段階３１０によって）アクセスされる１つまたは複数の画像データストア３３０（例えば、図２に関連して説明した記憶装置２３０）を含む。各画像データストア３３０に記憶され、画像ストア段階３１０でアクセスされる各デジタル画像３３５は、図２に表示されるネットワーク２００に関して説明したプロセスの一部もしくはすべてに従って生成されたデジタル病理画像を含み得る。いくつかの実施形態では、各デジタル画像３３５は、１つまたは複数のスキャンされたスライドからの画像データを含む。デジタル画像３３５のそれぞれは、単一の検体からの画像データ、および／または画像に対応する基礎となる画像データが収集された単一の日からの画像データに対応してもよい。

【0069】

画像データは、画像、ならびに色チャネルまたは色波長チャネルに関する任意の情報、ならびに画像が生成された撮像プラットフォームに関する詳細を含んでもよい。例えば、組織切片は、明視野撮像用の発色性染色剤または蛍光撮像用の蛍光体に関連付けられた１つまたは複数の異なるバイオマーカーを含む染色アッセイの適用によって染色される必要がある場合がある。染色アッセイは、明視野撮像用の発色性染色剤、蛍光撮像用の有機蛍光体、量子ドット、または有機蛍光体と量子ドットの併用、あるいは染色剤、バイオマーカー、および観察または撮像デバイスの任意の他の組合せを使用することができる。バイオマーカーの例としては、エストロゲン受容体（ＥＲ）、ヒト上皮成長因子受容体２（ＨＥＲ２）、ヒトＫｉ－６７タンパク質、プロゲステロン受容体（ＰＲ）、プログラム細胞死タンパク質１（ＰＤ１）などのバイオマーカーが挙げられ、組織切片は、ＥＲ、ＨＥＲ２、Ｋｉ－６７、ＰＲ、ＰＤ１などのそれぞれの結合剤（例えば、抗体）で検出可能にラベル付けされる。いくつかの実施形態では、分類、スコアリング、コックスモデリングおよびリスク層別化などのデジタル画像およびデータ分析操作は、使用されているバイオマーカーのタイプならびに視野（ＦＯＶ）選択および注釈に依存する。さらに、典型的な組織切片は、組織切片に染色アッセイを適用する自動染色／アッセイプラットフォームで処理され、染色された試料が得られる。染色／アッセイプラットフォームとしての使用に適した様々な市販製品が市場に存在し、一例は、譲受人であるＶｅｎｔａｎａＭｅｄｉｃａｌＳｙｓｔｅｍｓ，Ｉｎｃ．のＶＥＮＴＡＮＡ（登録商標）ＳＹＭＰＨＯＮＹ（登録商標）製品である。染色された組織切片は、例えば、顕微鏡、または顕微鏡および／または撮像部品を有するホールスライドスキャナ上の撮像システムに供給されてもよく、一例は、譲受人のＶｅｎｔａｎａＭｅｄｉｃａｌＳｙｓｔｅｍｓ，Ｉｎｃ．のＶＥＮＴＡＮＡ（登録商標）ｉＳｃａｎＣｏｒｅｏ（登録商標）／ＶＥＮＴＡＮＡ（登録商標）ＤＰ２００製品である。多重組織スライドは、同等の多重スライドスキャナシステムでスキャンされ得る。撮像システムによって提供される追加の情報は、染色に使用される化学物質の濃度、染色において組織に適用される化学物質の反応時間、および／または、組織の年齢、固定方法、期間、切片の包埋方法、切断方法などの組織の分析前条件を含む、染色プラットフォームに関する任意の情報を含み得る。

【0070】

Ｂ．画像前処理段階
前処理段階３１０において、デジタル画像３３５のセットのうちの１つ、複数、またはすべてのそれぞれが、１つまたは複数の技術を使用して前処理され、対応する前処理画像３４０が生成される。前処理は、画像をトリミングすることを含んでもよい。場合によっては、前処理は、すべての特徴を同じスケール（例えば、同じサイズスケールまたは同じカラースケールまたは彩度スケール）にするための標準化または再スケーリング（例えば、正規化）をさらに含んでもよい。特定の事例では、画像は、最小サイズ（幅または高さ）が所定の画素（例えば、２５００画素）で、または最大サイズ（幅または高さ）が所定の画素（例えば、３０００画素）でサイズ変更され、任意で元のアスペクト比に維持される。前処理は、ノイズを除去することをさらに含んでもよい。例えば、画像は、望ましくないノイズを除去するために、ガウス関数またはガウスぼかしを適用することなどによって平滑化されてもよい。

【0071】

前処理画像３４０は、１つまたは複数の訓練画像、検証画像、テスト画像、およびラベルなし画像を含み得る。訓練グループ、検証グループ、およびラベルなしグループに対応する前処理画像３４０は、同時にアクセスされる必要はないことを理解されたい。例えば、訓練および検証前処理画像３４０の初期セットは、機械学習アルゴリズム３５５を訓練するために最初にアクセスおよび使用されてもよく、続いて、ラベルなし入力画像が（例えば、１回またはその後複数回）アクセスまたは受信され、訓練された機械学習モデル３６０によって使用され、所望の出力（例えば、細胞分類）を提供し得る。

【0072】

Ｃ．ラベリング段階
場合によっては、機械学習アルゴリズム３５５は、教師あり訓練を使用して訓練され、前処理画像３４０の一部またはすべては、ラベリング段階３１５において、前処理画像３４０内の様々な生物学的物質および構造の「正しい」解釈（すなわち、「グランドトゥルース」）を識別するラベル３４５で、手動、半自動、または自動で部分的もしくは完全にラベル付けされる。例えば、ラベル３４５は、関心対象の特徴（例えば）、細胞の分類、所与の細胞が特定のタイプの細胞であるかどうかに関するバイナリ表示、前処理画像３４０（または前処理画像３４０を有する特定の領域）が特定のタイプの表示（例えば、壊死またはアーチファクト）を含むかどうかに関するバイナリ表示、（例えば、特定のタイプの細胞を識別する）スライドレベルまたは領域固有の表示のカテゴリ特徴、（例えば、領域内の特定のタイプの細胞の量、表示されたアーチファクトの量、または壊死領域の量を識別する）数、１つまたは複数のバイオマーカーの有無などを識別し得る。場合によっては、ラベル３４５は位置を含む。例えば、ラベル３４５は、特定のタイプの細胞の核の点位置、または特定のタイプの細胞の点位置（例えば、生のドットラベル）を識別し得る。別の例として、ラベル３４５は、表示された腫瘍、血管、壊死領域などの辺縁または境界を含んでもよい。別の例として、ラベル３４５は、１つまたは複数の染色を使用して観察されたバイオマーカーパターンに基づいて識別された１つまたは複数のバイオマーカーを含んでもよい。例えば、バイオマーカー、例えばプログラム細胞死タンパク質１（「ＰＤ１」）について染色された組織スライドは、組織におけるＰＤ１の発現レベルおよびパターンを考慮して、陽性細胞または陰性細胞のいずれかとして細胞をラベル付けするために観察および／または処理されることがある。対象の特徴に応じて、所与のラベル化された前処理画像３４０は、単一のラベル３４５または複数のラベル３４５に関連付けられ得る。後者の場合、各ラベル３４５は、そのラベルが前処理画像３４５内のどの位置または部分に対応するかに関する（例えば）指示に関連付けられ得る。

【0073】

ラベリング段階３１５で割り当てられたラベル３４５は、人間のユーザ（例えば、病理学者または画像サイエンティスト）および／またはラベル３４５を定義するように構成されたアルゴリズム（例えば、注釈ツール）からの入力に基づいて識別されてもよい。場合によっては、ラベリング段階３１５は、ユーザによって操作されるコンピューティングデバイスに、１つまたは複数の前処理画像３４０の一部もしくはすべてを送信および／または提示することを含むことができる。場合によっては、ラベリング段階３１５は、ユーザによって操作されるコンピューティングデバイスにおいて、ラベリングコントローラ３５０によって提示されるインターフェースを利用する（例えば、ＡＰＩを使用する）ことを含み、インターフェースは、関心のある特徴についてラベル３４５を識別する入力を受け入れるための入力コンポーネントを含む。例えば、ラベリング用の画像または画像の領域（例えば、ＦＯＶ）の選択を可能にするユーザインターフェースが、ラベリングコントローラ３５０によって提供されてもよい。端末を操作するユーザは、ユーザインターフェースを使用して画像またはＦＯＶを選択してもよい。既知のまたは不規則な形状を指定すること、または解剖学的関心領域（例えば、腫瘍領域）を定義することなど、いくつかの画像またはＦＯＶ選択機構が提供され得る。一例では、画像またはＦＯＶは、Ｈ＆Ｅ染色の組合せで染色されたＩＨＣスライド上で選択された全腫瘍領域である。画像またはＦＯＶの選択は、ユーザによって、または例えばＨ＆Ｅ組織スライド上の腫瘍領域セグメント化など、自動画像解析アルゴリズムによって実行されてもよい。例えば、ユーザは、画像またはＦＯＶを、スライド全体または腫瘍全体として選択してもよく、あるいはスライド全体または腫瘍領域全体が、セグメンテーションアルゴリズムを使用して画像またはＦＯＶとして自動的に指定されてもよい。その後、端末を操作するユーザは、細胞上の点位置、細胞によって発現されるバイオマーカーに対する陽性マーカー、細胞によって発現されないバイオマーカーに対する陰性バイオマーカー、細胞の周囲の境界など、選択された画像またはＦＯＶに適用される１つまたは複数のラベル３４５を選択し得る。

【0074】

場合によっては、インターフェースは、どの特定のラベル３４５が要求されているのかおよび／またはどの程度要求されているかを識別し得、これは、（例えば）テキスト命令および／または視覚化を介してユーザに伝達され得る。例えば、特定の色、サイズ、および／または記号は、ラベル３４５が他の表示に対して画像内の特定の表示（例えば、特定の細胞または領域または染色パターン）に対して要求されていることを表してもよい。複数の表示に対応するラベル３４５が要求される場合、インターフェースは、表示のそれぞれを同時に識別してもよく、または（識別された１つの表示にラベルを提供すると、ラベル付けのための次の表示の識別がトリガされるように）各表示を順次に識別してもよい。場合によっては、各画像は、ユーザが特定の数の（例えば、特定のタイプの）ラベル３４５を識別するまで提示される。例えば、ユーザが３つの異なるバイオマーカーの有無を識別するまで、所与の全スライド画像または全スライド画像の所与のパッチが提示されてもよく、その時点で、インターフェースは、異なる全スライド画像または異なるパッチの画像を提示し得る（例えば、しきい値数の画像またはパッチがラベル付けされるまで）。したがって、場合によっては、インターフェースは、関心対象の特徴の不完全なサブセットのラベル３４５を要求および／または受け入れるように構成され、ユーザは、潜在的に多くの表示のうちのどれがラベル付けされるかを決定し得る。

【0075】

場合によっては、ラベリング段階３１５は、画像または画像内の関心領域の様々な特徴を半自動的または自動的にラベル付けするために、アノテーションアルゴリズムを実装するラベリングコントローラ３５０を含む。ラベリングコントローラ３５０は、ユーザからの入力またはアノテーションアルゴリズムに従って、第１のスライド上の画像またはＦＯＶに注釈を付け、注釈をスライドの残りの部分にわたってマッピングする。定義されたＦＯＶに応じて、注釈付けおよび位置合わせ用のいくつかの方法が可能である。例えば、複数の連続スライドの中からＨ＆Ｅスライド上に注釈が付けられた腫瘍領域全体は、自動的に、またはユーザによってＶＩＲＴＵＯＳＯ／ＶＥＲＳＯ（商標）などのインターフェース上で選択されてもよい。他の組織スライドは同じ組織ブロックからの連続切片に対応するため、ラベリングコントローラ３５０はマーカー間位置合わせ操作を実行して、Ｈ＆Ｅスライドからの腫瘍注釈全体をマッピングし、一連の残りのＩＨＣスライドのそれぞれに転送する。マーカー間の位置合わせ用の例示的な方法は、２０１４年３月１２日に出願された同一出願人による国際公開第２０１４１４００７０号パンフレット「Ｗｈｏｌｅｓｌｉｄｅｉｍａｇｅｒｅｇｉｓｔｒａｔｉｏｎａｎｄｃｒｏｓｓ－ｉｍａｇｅａｎｎｏｔａｔｉｏｎｄｅｖｉｃｅｓ，ｓｙｓｔｅｍｓａｎｄｍｅｔｈｏｄｓ」にさらに詳細に記載されており、これは、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。いくつかの実施形態では、画像位置合わせおよび全腫瘍注釈の生成用の任意の他の方法が使用されてもよい。例えば、病理学者などの資格のある読影者は、任意の他のＩＨＣスライド上の全腫瘍領域に注釈を付け、ラベリングコントローラ３５０を実行して、他のデジタル化スライド上の全腫瘍注釈をマッピングしてもよい。例えば、病理学者（または自動検出アルゴリズム）は、Ｈ＆Ｅスライド上の全腫瘍領域に注釈を付けて、すべての隣接する連続切片化されたＩＨＣスライドの分析をトリガして、すべてのスライド上の注釈付き領域に対する全スライド腫瘍スコアを決定してもよい。

【0076】

場合によっては、ラベリング段階３１５は、画像（または画像のＦＯＶ）に関連付けられた注釈のセット内の注釈位置および注釈ラベルの競合を識別するためにアノテーションアルゴリズムを実装する注釈処理システム３５１をさらに含む。注釈処理システム３５１は、訓練画像の領域内の異なる位置に配置された注釈のセットについてのコンセンサス位置を決定することができる。場合によっては、注釈処理システム３５１は、同じアノテータからの２つ以上の注釈が領域内に存在すると判定することによって、訓練画像内の領域について注釈位置の競合が存在すると判定する。注釈処理システム３５１は、同じアノテータからの他の注釈を破棄する一方で、領域内の他の注釈に最も近い距離を有する注釈を保持することによって、このような位置の競合を解決することができる。決定されたコンセンサス位置で、異なる標的タイプの生物学的構造を識別する注釈のセットについてコンセンサスラベルを決定することができる。異なる位置にわたるコンセンサスラベルを使用して、画像のグランドトゥルースラベルを生成することができる。グランドトゥルースラベルは、デジタル病理画像内の異なるタイプの生物学的構造を予測するように構成された機械学習モデルを訓練、検証、および／またはテストするために使用することができる。

【0077】

Ｄ．増強段階
増強段階３１７において、前処理画像３４０からラベル付けされたまたはラベル付けされていない画像（元の画像）の訓練セットは、１つまたは複数の増強アルゴリズムを実行する増強制御３５４を使用して生成された合成画像３５２で増強される。増強技術は、既存の訓練データのわずかに変更された合成コピー、または既存の訓練データから新たに作成された合成データを追加することによって、訓練データの量および／またはタイプを人為的に増加させるために使用される。本明細書で説明するように、スキャナ間および検査室間の違いは、デジタル画像内の強度および色のばらつきを引き起こす可能性がある。さらに、スキャニングが不十分だと、勾配の変化およびぼやけ効果が生じる可能性があり、アッセイ染色では、バックグラウンド洗浄などの染色アーチファクトが生じる可能性があり、組織／患者の試料が異なると、細胞サイズにばらつきが生じる可能性がある。これらのばらつきおよび変動は、深層学習および人工知能ネットワークの品質および信頼性に悪影響を及ぼす可能性がある。増強段階３１７で実施される増強技術は、これらのばらつきおよび変動の正則化器として機能し、機械学習モデルを訓練するときに過適合を低減するのに役立つ。本明細書に記載の増強技術は、任意の数およびタイプのばらつきおよび変動用の正則化器として使用することができ、本明細書に記載の様々な特定の例に限定されないことを理解されたい。

【0078】

Ｅ．訓練段階
訓練段階３２０において、ラベル３４５および対応する前処理画像３４０は、本明細書に記載の様々なワークフローに従って機械学習アルゴリズム３５５を訓練するために訓練コントローラ３６５によって使用することができる。例えば、アルゴリズム３５５を訓練するために、前処理画像３４０は、訓練用の画像のサブセット３４０ａ（例えば、９０％）と、検証用の画像のサブセット３４０ｂ（例えば、１０％）とに分割されてもよい。分割は、ランダムに（例えば、９０／１０％または７０／３０％）実行されてもよく、またはサンプリングバイアスおよび過適合を最小限に抑えるために、Ｋ分割交差検証、一個抜き交差検証、一群抜き交差検証、入れ子交差検証などのより複雑な検証技術に従って実行されてもよい。分割はまた、前処理画像３４０内に増強画像または合成画像３５２を含めることに基づいて実行されてもよい。例えば、訓練用の画像３４０ａのサブセット内に含まれる合成画像３５２の数または比率を制限することが有益な場合がある。場合によっては、元の画像３３５と合成画像３５２との比は、１：１、１：２、２：１、１：３、３：１、１：４、または４：１に維持される。

【0079】

場合によっては、機械学習アルゴリズム３５５は、ＣＮＮ、残差ニューラルネットワーク（「Ｒｅｓｎｅｔ」）によって置換された符号化層を有する修正ＣＮＮ、またはＲｅｓｎｅｔによって置換された符号化層および復号層を有する修正ＣＮＮを含む。他の例では、機械学習アルゴリズム３５５は、２次元ＣＮＮ（「２ＤＣＮＮ」）、ＭａｓｋＲ－ＣＮＮ、Ｕ－Ｎｅｔ、特徴ピラミッドネットワーク（ＦＰＮ）、動的時間伸縮（「ＤＴＷ」）技術、隠れマルコフモデル（「ＨＭＭ」）、純粋な注意ベースのモデルなどの、前処理画像３４０、または例えば視覚変換器、ＣＮＮ－ＨＭＭもしくはＭＣＮＮ（マルチスケール畳み込みニューラルネットワーク）などのこのような技術のうちの１つもしくは複数の組み合わせをローカライズし、分類し、および／または分析するように構成された任意の適切な機械学習アルゴリズムであり得る。コンピューティング環境３００は、同じタイプの機械学習アルゴリズム、または異なる細胞を検出および分類するように訓練された異なるタイプの機械学習アルゴリズムを採用してもよい。例えば、コンピューティング環境３００は、ＰＤ１を検出し分類するための第１の機械学習アルゴリズム（例えば、Ｕ－Ｎｅｔ）を含むことができる。コンピューティング環境５００はまた、分化クラスタ６８（「ＣＤ６８」）を検出および分類するための第２の機械学習アルゴリズム（例えば、２ＤＣＮＮ）を含むことができる。コンピューティング環境３００はまた、ＰＤ１とＣＤ６８を組み合わせて検出および分類するための第３の機械学習アルゴリズム（例えば、Ｕ－Ｎｅｔ）を含むことができる。コンピューティング環境３００はまた、患者などの被験者の治療または予後用の疾患の診断用の第４の機械学習アルゴリズム（例えば、ＨＭＭ）を含むことができる。本開示による他の例では、さらに他のタイプの機械学習アルゴリズムが実装されてもよい。

【0080】

機械学習アルゴリズム３５５の訓練プロセスは、パラメータデータストア３６３から機械学習アルゴリズム３５５のハイパーパラメータを選択することと、画像のサブセット３４０ａ（例えば、ラベル３４５および対応する前処理画像３４０）を機械学習アルゴリズム３５５に入力することと、機械学習アルゴリズム３５５のパラメータのセット（例えば、１つまたは複数の係数および／または重み）を学習するための反復動作を実行することとを含む。ハイパーパラメータは、機械学習アルゴリズム３５５の挙動を制御するために調整または最適化することができる設定である。ほとんどのアルゴリズムは、メモリまたは実行コストなどのアルゴリズムの異なる態様を制御するハイパーパラメータを明示的に定義する。しかしながら、アルゴリズムを特定のシナリオに適合させるために、追加のハイパーパラメータが定義されてもよい。例えば、ハイパーパラメータは、アルゴリズムの隠れユニットの数、アルゴリズムの学習率（例えば、１ｅ－４）、畳み込みカーネル幅、またはアルゴリズムのカーネルの数を含んでもよい。場合によっては、モデルパラメータの数は、畳み込み層および逆畳み込み層ごとに減少し、および／またはカーネルの数は、畳み込み層および逆畳み込み層ごとに、典型的なＣＮＮと比較して半分減少する。

【0081】

画像のサブセット３４０ａは、所定のサイズのバッチとして機械学習アルゴリズム３５５に入力されてもよい。バッチサイズは、パラメータ更新を実行することができる前に、機械学習アルゴリズム３５５に示される画像の数を制限する。あるいは、画像のサブセット３４０ａは、時系列としてまたは順次に機械学習アルゴリズム３５５に入力されてもよい。いずれの場合も、増強画像または合成画像３５２が前処理画像３４０ａ内に含まれる場合、元の画像３３５の数対各バッチ内に含まれる合成画像３５２の数、または元の画像３３５および表現型の画像３５２がアルゴリズムに供給される方法（例えば、１つおきのバッチまたは画像は、画像の元のバッチまたは元の画像である）を、ハイパーパラメータとして定義することができる。

【0082】

各パラメータは、パラメータについての値が訓練中に調整されるように調整可能な変数である。例えば、コスト関数または目的関数は、表示された表現の正確な分類を最適化し、所与のタイプの特徴の特徴付け（例えば、形状、サイズ、均一性などの特徴付け）を最適化し、所与のタイプの特徴の検出を最適化し、および／または所与のタイプの特徴の正確な位置特定を最適化するように構成され得る。各反復は、機械学習アルゴリズム３５５のコスト関数を最小化または最大化する機械学習アルゴリズム３５５のパラメータのセットを学習することを含むことができ、それにより、パラメータのセットを使用するコスト関数の値が、前の反復において別のパラメータのセットを使用したコスト関数の値よりも小さくまたは大きくなるようにすることができる。コスト関数は、機械学習アルゴリズム３５５を使用して予測された出力と訓練データに含まれるラベル３４５との間の差を測定するように構築され得る。例えば、教師あり学習に基づくモデルの場合、訓練の目標は、訓練入力空間Ｘを目標値空間Ｙ、ｈにマッピングする関数「ｈ（）」（仮説関数と呼ばれることもある）を学習することである。Ｘ→Ｙ、ここでｈ（ｘ）はｙの対応する値に対する良好な予測因子である。この仮説関数を学習するために、様々な異なる技術が使用されてもよい。いくつかの技術では、仮説関数を導出する一部として、ある入力についてのグランドトゥルース値とその入力についての予測値との間の差を測定するコスト関数または損失関数が定義されることがある。訓練の一部として、バックプロパゲーション、ランダムフィードバック、ダイレクトフィードバックアライメント（ＤＦＡ）、インダイレクトフィードバックアライメント（ＩＦＡ）、ヘブスの学習などの技術が、このコストまたは損失関数を最小限に抑えるために使用される。

【0083】

訓練の反復は、停止条件が満たされるまで継続する。訓練完了条件は、（例えば）所定回数の訓練反復が完了したとき、テストもしくは検証に基づいて生成された統計値が所定のしきい値（例えば、分類精度しきい値）を超えたとき、信頼度測定基準（例えば、特定の値を上回る信頼度メトリックの平均もしくは中央値または信頼度メトリックのパーセンテージ）に基づいて生成された統計値が所定の信頼度しきい値を超えたとき、および／または訓練レビューに関与していたユーザ装置が訓練コントローラ３６５によって実行された訓練アプリケーションを閉じるときに満たされるように構成されてもよい。モデルパラメータのセットが訓練を介して識別されると、機械学習アルゴリズム３５５が訓練され、訓練コントローラ３６５は、画像のサブセット３４０ｂ（テストまたは検証データセット）を使用してテストまたは検証の追加のプロセスを実行する。検証プロセスは、ハイパーパラメータを調整し、最終的に最適なハイパーパラメータのセットを見つけるために、Ｋ分割交差検証、一個抜き交差検証、一群抜き交差検証、入れ子交差検証などの検証技術を使用して、画像のサブセット３４０ｂから機械学習アルゴリズム３５５に画像を入力する反復動作を含んでもよい。最適なハイパーパラメータのセットが取得されると、画像のサブセット３４０ｂからの画像の予約されたテストセットが機械学習アルゴリズム３５５に入力されて出力が取得され、出力は、Ｂｌａｎｄ－Ａｌｔｍａｎ法およびＳｐｅａｒｍａｎのランク相関係数などの相関技術を使用して、誤差、正確さ、精度、再現率、受信者動作特性曲線（ＲＯＣ）などの性能メトリックを計算することによって、グラウンドトゥルースに対して評価される。場合によっては、ユーザ装置からの対応する要求またはトリガ条件の受信に応答して、新しい訓練反復が開始されてもよい（例えば、初期モデルの開発、モデルの更新／適応、連続学習、ドリフトは訓練された機械学習モデル３６０内で決定される、など）。

【0084】

理解されるように、他の訓練／検証メカニズムが企図され、コンピューティング環境３００内に実装されてもよい。例えば、画像のサブセット３４０ａからの画像に対して、機械学習アルゴリズム３５５が訓練されてもよく、ハイパーパラメータが調整されてもよく、画像のサブセット３４０ｂからの画像は、機械学習アルゴリズム３５５の性能をテストおよび評価するためにのみ使用されてもよい。さらに、本明細書に記載の訓練メカニズムは、新しい機械学習アルゴリズム３５５の訓練に焦点を合わせている。これらの訓練メカニズムはまた、本明細書で詳細に説明するように、他のデータセットから訓練された既存の機械学習モデル３６０の初期モデルの開発、モデルの更新／適応、および連続学習に利用することができる。例えば、場合によっては、機械学習モデル３６０は、他の対象もしくは生物学的構造の画像を使用して、または他の対象もしくは研究（例えば、人体試験またはマウス実験）からの切片から事前調整されていてもよい。それらの場合、機械学習モデル３６０は、前処理画像３４０を使用した初期モデルの開発、モデルの更新／適応、および連続学習に使用することができる。

【0085】

Ｆ．結果生成段階
次いで、（結果生成段階３２５において）訓練された機械学習モデル３６０を使用して、新しい前処理画像３４０を処理して、細胞中心および／または位置確率を予測する、細胞タイプを分類する、細胞マスク（例えば、画像の画素ごとのセグメンテーションマスク）を生成する、患者などの被験者の疾患の診断もしくは予後を予測する、あるいはそれらの組合せを行うなどの、予測または推測を生成することができる。場合によっては、マスクは、１つまたは複数のバイオマーカーに関連付けられた表示された細胞の位置を識別する。例えば、単一のバイオマーカーについて染色された組織が与えられると、訓練された機械学習モデル３６０は、（ｉ）細胞の中心および／または位置を推測し、（ｉｉ）バイオマーカーに関連付けられた染色パターンの特徴に基づいて細胞を分類し、（ｉｉｉ）陽性細胞に対する細胞検出マスクおよび陰性細胞に対する細胞検出マスクを出力するように構成され得る。別の例として、２つのバイオマーカーについて染色された組織が与えられると、訓練された機械学習モデル３６０は、（ｉ）細胞の中心および／または位置を推測し、（ｉｉ）２つのバイオマーカーに関連付けられた染色パターンの特徴に基づいて細胞を分類し、（ｉｉｉ）第１のバイオマーカーに対して陽性の細胞に対する細胞検出マスク、第１のバイオマーカーに対して陰性の細胞に対する細胞検出マスク、第２のバイオマーカーに対して陽性の細胞に対する細胞検出マスク、および第２のバイオマーカーに対して陰性の細胞に対する細胞検出マスクを出力するように構成され得る。別の例として、単一のバイオマーカーについて染色された組織が与えられると、訓練された機械学習モデル３６０は、（ｉ）細胞の中心および／または位置を推測し、（ｉｉ）細胞の特徴およびバイオマーカーに関連付けられた染色パターンに基づいて細胞を分類し、（ｉｉｉ）陽性細胞に対する細胞検出マスクおよび陰性細胞コードに対する細胞検出マスク、ならびに組織細胞として分類されたマスク細胞を出力するように構成され得る。

【0086】

場合によっては、分析コントローラ３８０は、基礎となる画像の処理を要求したエンティティに利用される分析結果３８５を生成する。分析結果３８５は、新しい前処理画像３４０にオーバーレイされた訓練された機械学習モデル３６０から出力されたマスクを含み得る。追加的または代替的に、分析結果３８５は、全スライド腫瘍スコアなどの、訓練された機械学習モデルの出力から計算または決定された情報を含み得る。例示的な実施形態では、組織スライドの自動分析は、譲受人ＶＥＮＴＡＮＡのＦＤＡ認可済みの５１０（ｋ）アルゴリズムを使用する。代替的または追加的に、他の自動化された任意のアルゴリズムを使用して、画像の選択された領域（例えば、マスクされた画像）を分析して、スコアを生成してもよい。いくつかの実施形態では、分析コントローラ３８０は、コンピューティングデバイスから受信した、病理学者、医師、調査者（例えば、臨床試験に関連付けられた）、患者、医療専門家などの指示にさらに応答してもよい。場合によっては、コンピューティングデバイスからの通信は、特定の被験者のセットのそれぞれの識別子を含み、そのセットで表される各被検者についての分析の反復を実行する要求に対応する。コンピューティングデバイスは、機械学習モデルおよび／または分析コントローラ３８０の出力に基づいて分析をさらに実行することができ、ならびに／あるいは推奨される診断／治療を被験者に提供することができる。

【0087】

コンピューティング環境３００は例示的なものであり、異なる段階を有するおよび／または異なる構成要素を使用するコンピューティング環境３００が考えられることが理解されよう。例えば、場合によっては、ネットワークは、前処理段階３１０を省略してもよく、それにより、アルゴリズムを訓練するために使用される画像および／またはモデルによって処理された画像が（例えば、画像データストアからの）生画像となる。別の例として、前処理段階３１０および訓練段階３２０のそれぞれは、本明細書に記載の１つまたは複数の動作を実行するためのコントローラを含むことができることが理解されよう。同様に、ラベリング段階３１５はラベリングコントローラ３５０に関連して表示されており、結果生成段階３２５は分析コントローラ３８０に関連して表示されているが、各段階に関連付けられたコントローラは、ラベルの生成および／または分析結果の生成以外の本明細書に記載の他の動作をさらにまたは代替的に促進し得る。さらに別の例として、図３に示すコンピューティング環境３００の表示は、（例えば、様々なインターフェースがどのように機能するかなどを定義した機械学習アルゴリズム３５５のアーキテクチャを選択した）プログラマに関連付けられたデバイス、（例えば、ラベリング段階３１５において）初期ラベルまたはラベルレビューを提供するユーザに関連付けられたデバイス、および所与の画像のモデル処理を要求するユーザ（初期ラベルまたはラベルレビューを提供したユーザと同じユーザまたは異なるユーザであってもよい）に関連付けられたデバイスの表示された表現を欠いている。これらのデバイスの表示がないにもかかわらず、コンピューティング環境３００は、デバイスのうちの１つ、複数、またはすべての使用を含んでもよく、実際には、初期ラベルまたはラベルレビューを提供する対応する複数のユーザに関連付けられた複数のデバイス、および／または様々な画像のモデル処理を要求する対応する複数のユーザに関連付けられた複数のデバイスの使用を含んでもよい。

【0088】

Ｖ．二重画像から合成単一画像を生成する
図４は、いくつかの実施形態による、二重ＥＲ／ＰＲおよび隣接する単一ＩＨＣＥＲ／ＰＲ画像４００の一例を示す。二重画像および単一画像４００は、図２のネットワーク２００によって実行されるプロセスを使用して取得することができる。図４では、二重ＥＲ／ＰＲ画像４０２はエストロゲン受容体とプロゲステロン受容体の両方について染色され、単一ＥＲ画像４０４はエストロゲン受容体のみについて染色され得て、単一ＰＲ画像４０６はプロゲステロン受容体のみについて染色され得る。組織切片の二重ＩＨＣ染色は、２つ以上のバイオマーカーの同時検出を可能にする。二重ＩＨＣ染色は、両方のバイオマーカーの共発現を単一細胞レベルでさらに可能にする。二重ＩＨＣ染色は、バイオマーカーの共局在を識別するための２つのＩＨＣ染色およびさらなる位置合わせを必要としない。これらの利点にもかかわらず、二重ＩＨＣ画像におけるバイオマーカーは、バイオマーカーがしばしば互いに重なり合い、クラスタ化されるため、病理学者が識別するのが困難であることが多い。実際には、二重ＩＨＣ画像の手動スコアリングプロセスは困難であり得る。図４の例示的な画像４００において、Ｔａｍｒａ（紫色）を使用してＰＲを染色し、ＱｕｉｎｏｎｅＭｅｔｈｉｄｅＤａｂｓｙｌ（黄色）を使用してＥＲを染色し、ヘマトキシリン（青色）を対比染色剤として使用した。

【0089】

図５は、いくつかの実施形態による、二重ＥＲ／ＰＲ画像上で選択され、単一ＩＨＣＥＲ画像および単一ＩＨＣＰＲ画像上で位置合わせされた視野（ＦＯＶ）５００を示す。図５では、ＦＯＶが二重ＥＲ／ＰＲ画像５０２上で選択され、次いでＦＯＶが位置合わせされ、単一ＩＨＣＥＲ画像５０４および単一ＩＨＣＰＲ画像５０６上にオーバーレイされる。いくつかの実施形態では、ＦＯＶは、一人または複数の病理学者によって選択され、二重ＥＲ／ＰＲ画像５０２上に直接提示される。自動位置合わせアルゴリズムを利用して、単一ＩＨＣＥＲ画像５０４および単一ＩＨＣＰＲ画像５０６上に二重ＥＲ／ＰＲ画像５０２を位置合わせすることができる。

【0090】

二重画像を混合解除して合成単一画像を生成することができ、各合成単一画像は、単一バイオマーカー（例えば、ＥＲ）について染色された細胞を表示することができる。場合によっては、各二重画像を処理して３つのモノクロ画像を生成し、２つのモノクロ画像が２つの染色剤（例えば、ＥＲ、ＰＲ）のそれぞれに対応し、第３のモノクロ画像が対比染色剤（例えば、ヘマトキシリン）に対応する。各単一染色画像を対比染色（「ＣＳ」）画像と組み合わせて、合成単一画像を生成することができる。合成単一画像のそれぞれは、１つまたは複数の機械学習モデルを使用して処理され、各細胞の表現型を予測することができ、その表現型が、対応するタイプのバイオマーカーと関連付けられ得る。他のタイプの画像前処理は、合成単一画像を生成および修正するために適用され得て、他のタイプの画像前処理は、図３の前処理段階３１０で説明されている。場合によっては、合成単一画像は、病理学者によって確実に注釈付けまたはレビューされ、訓練画像のセットを生成することができる。

【0091】

追加的または代替的に、合成単一画像は、ディスプレイ装置に表示される色の範囲を減らすために色補正方法を使用して処理され得る。図６Ａ～図６Ｃは、いくつかの実施形態による、合成単一画像を生成するための例示的な技術を示す。図６Ａでは、ディスプレイ装置６０４ａは、その色範囲が限られているため、スライド走査装置６０２ａによって取り込まれたすべての可能な色を表示することができない可能性があるため、スライド走査装置（例えば、ＤＰ２００スキャナ）によってスキャンされた生画像は、通常、スコアリングのために病理学者に直接表示されない。したがって、生画像に対して色補正演算６０６ａを実行することができる。色補正６０６ａは、描かれた色空間がディスプレイ装置６０４ａの色範囲内に入るように使用され得る。次いで、補正後の画像をディスプレイ装置６０４ａに表示させることができる。色補正された画像は、顕微鏡下で見ることができる色と同様の色を含むことができる。場合によっては、色補正演算６０６ａを実行するために色逆畳み込み技術が使用される。

【0092】

図６Ｂは、いくつかの実施形態による、二重ＥＲ／ＰＲ画像から合成ＤａｂｓｙｌＥＲ画像および合成ＰＲ画像を生成するためのプロセス６００Ｂを示す概略図である。図６Ｂでは、二重ＥＲ／ＰＲ画像６０２ｂを混合解除して生の合成単一画像６０４ｂを生成することができ、生の合成単一画像６０４ｂは合成ＥＲ画像および合成ＰＲ画像を含む。生の合成単一画像６０４ｂのそれぞれは、色補正演算を使用して処理され、色正規化された合成単一画像６０６ｂを生成することができる。場合によっては、合成ＥＲ／ＰＲ画像６０６ｂは、スコアリングのために病理学者に提供され、スコアは、位置合わせされた単一ＥＲ／ＰＲ画像６０８ｂと比較され、システム／色非混合または染色エラーの存在を判定し得る。合成画像と単染色画像との間の正確な比較を可能にする（例えば、位置合わせ中の組織間隙を回避する）ために、特定のスライド切断シーケンスを使用することができる。例えば、位置合わせプロセス中に組織間隙を減少させるために、「Ｈ＆Ｅ、単一ＥＲ、二重ＥＲ／ＰＲ、単一ＰＲ」の切断シーケンスを使用することができる。

【0093】

図６Ｃは、いくつかの実施形態による、二重画像から生成された色補正された合成単一画像６００Ｃの例示的なセットを示す。画像の第１行は、ＥＲ／ＰＲ６０２ｃで染色された例示的な二重画像を処理して、ＰＲバイオマーカー６０４ｃの存在を表示する色補正された合成画像を生成することを含む。図６Ｃに示すように、色補正された合成画像は、隣接する組織部分６０６ｃを表示する単一ＰＲ画像のものと同様のバイオマーカーパターンを表示する。同様に、画像の第２行は、ＥＲ／ＰＲ６０８ｃで染色された別の例示的な二重画像を処理して、ＥＲバイオマーカー６１０ｃの存在を表示する別の色補正された合成画像を生成することを含む。図６Ｃに示すように、色補正された合成画像は、隣接する組織部分６１２ｃを表示する単一ＥＲ画像のものと同様のバイオマーカーパターンを表示する。

【0094】

ＶＩ．二重画像内の表現型を検出するための機械学習モデルの訓練
機械学習モデルを訓練するために、画像処理システムは、訓練画像のセットを含む訓練データを生成することができる。訓練画像は、ＥＲ＋、ＰＲ＋、ＥＲ－、ＰＲ＋、およびその他（例えば、間質細胞、免疫細胞、アーチファクト）を含むグラウンドトゥルースラベルでラベル付けされ得る。場合によっては、画像処理システムは、（ｉ）病理学者が二重画像内の１つまたは複数の視野（ＦＯＶ）を選択することと、（ｉｉ）二重画像から選択されたＦＯＶに基づいて、ＦＯＶを隣接する単一画像に位置合わせすることと、（ｉｉｉ）二重ＥＲ／ＰＲと単一ＥＲおよび単一ＰＲの両方からＦＯＶを抽出することと、（ｉｖ）二重画像から合成ＴａｍｒａＰＲ／合成ＤａｂｓｙｌＥＲ画像を生成し、それによって各ＦＯＶについて４つの画像を生成することと、（ｖ）病理学者が合成単一画像を含むすべてのＦＯＶをスコアリングすることと、（ｖｉ）スコアを使用してＥＲ固有の機械学習モデルおよびＰＲ固有の機械学習モデルを訓練することと、を含む訓練プロセスを実施する。

【0095】

Ａ．訓練データ
図７は、いくつかの実施形態による、合成単一画像内の細胞の表現型を検出するように機械学習モデルを訓練するための訓練画像７００の例示的なセットを示す。訓練画像は、生物学的試料の少なくとも一部（例えば、組織切片）を表示し、２つ以上のバイオマーカー（例えば、ＥＲ、ＰＲ）で染色された二重画像７０２から生成され得る。二重画像７０２は、合成単一画像７０４に混合解除され得る。合成単一画像７０４のそれぞれは、単一の対応するバイオマーカーで染色された生物学的試料の少なくとも一部を表すことができる。場合によっては、合成単一画像７０４は、染色エラーを除去するためにグランドトゥルース単一画像７０６と比較される。グランドトゥルース単一画像７０６は、二重画像７０２の組織部分の隣接する組織部分を表す単一画像に対応することができる。合成単一画像７０４をグランドトゥルース単一画像７０６と比較するために、グランドトゥルース単一画像７０６および合成単一画像７０４を単一の座標系に位置合わせするために位置合わせ操作を実行することができる。

【0096】

染色エラーが除去されると、合成単一画像７０４に１つまたは複数の訓練ラベルを追加することによって、訓練画像７０８を生成することができる。したがって、訓練画像７０８は、複数の訓練ラベルを含む合成単一画像に対応することができる。複数の訓練ラベルの各訓練ラベルは、（ｉ）訓練ラベルによって識別される細胞の位置と、（ｉｉ）対応するバイオマーカーについての細胞の表現型とを含むことができる。例えば、訓練ラベルの赤色は「腫瘍陽性」癌細胞を示し、訓練ラベルの緑色は「腫瘍陰性」非癌細胞を示し、訓練ラベルの青色は間質細胞を示し、訓練ラベルの黄色は免疫細胞を示し、訓練ラベルの黒色はアーチファクトを示す。上記のステップを繰り返して、それぞれの機械学習モデルを訓練するための訓練画像のセットを生成することができる。

【0097】

Ｂ．モデル選択
図８は、いくつかの実施形態による、二重スライド画像内の表現型を検出するために使用される機械学習モデルの例示的なアーキテクチャを示す。図８に示すように、Ｕ－Ｎｅｔ８００は、縮小経路８０５および拡張経路８１０を含んでもよく、これによりｕ字形アーキテクチャが得られる。縮小経路８０５は、畳み込み（例えば、３×３の畳み込み（パッドなしの畳み込み））の繰り返し適用を含むＣＮＮネットワークであり、各畳み込みの後に正規化線形ユニット（ＲｅＬＵ）およびダウンサンプリングための最大プーリング演算（例えば、ストライド２の最大２×２プーリング）が続く。各ダウンサンプリングステップまたはプーリング動作において、特徴チャネルの数が２倍されてもよい。縮小の間、画像データの空間情報は減少するが、特徴情報は増加する。拡張経路８１０は、縮小経路８０５からの特徴と空間情報とを組み合わせるＣＮＮネットワークである（縮小経路８０５からの特徴マップのアップサンプリング）。特徴マップのアップサンプリングの後には、２次元腫瘍マスクを生成するために、チャネル数を半分にする一連のアップ畳み込み（アップサンプリング演算子）、縮小経路８０５からの対応して切り取られた特徴マップとの連結、それぞれの後に正規化線形ユニット（ＲｅＬＵ）が続く畳み込み（例えば、２つの３×３畳み込み）の繰り返し適用、および最終的な畳み込み（例えば、１×１畳み込み）が続く。局所化するために、縮小経路８０５からの高解像度特徴は、拡張経路８１０からのアップサンプリングされた出力と組み合わされる。Ｕ－Ｎｅｔ８００は、全結合層なしで各畳み込みの有効部分を使用し、すなわち、セグメンテーションマップは、入力画像内で完全なコンテキストが利用可能な画素のみを含み、縮小ブロック中に学習されたコンテキスト特徴と拡張ブロックで学習された位置特定特徴とをリンクするスキップ接続を使用する。

【0098】

従来のＵ－Ｎｅｔアーキテクチャでは、畳み込みブロックは、畳み込みを実行するための畳み込み層（例えば、典型的には２つまたは３つの層）から構成される。しかしながら、様々な実施形態によれば、畳み込みブロックおよび畳み込み層は、１つまたは複数の拡張レベルにおいてピラミッド層８２０において実行される分離可能な畳み込みを有する残差ブロック８１５で置き換えられる（単一の畳み込み層は、２つ以上のピラミッド層８２０で置き換えられてもよい）。（例えば、積み重ねられたフィルタ処理された画像）。図９Ａは、図８に示す残差ブロック８１５の層構造を示す。図示のように、残差ブロック９００は、複数のピラミッド層９０５を含み得る。残差ブロック９００を含むネットワーク（例えば、ＲｅｓＮｅｔ）では、各ピラミッド層９０５は、次の層（Ａ，Ｂ，Ｃ．．）に供給され、約２～３層離れた層（Ｄ，Ｅ．．．）に直接供給される。ネットワーク内の残差ブロック９００の使用は、ピラミッド層の数を増加させることから生じる劣化の問題を克服するのに役立つ（層の数が増加し続ける場合、精度は最初は増加するが、ある時点で飽和し始め、最終的に劣化する）。残差ブロック９００は、スキップ接続または残差接続を使用してこれらの追加のピラミッド層のいくつかをスキップし、最終的に初期ピラミッド層に大きな勾配を伝播する。スキップは、初期訓練段階でより少ないピラミッド層を使用して、ネットワークを効果的に単純化する。これにより、伝播する層が少なくなるため、勾配の消失の影響を低減することによって学習が高速化される（すなわち、多速度残差学習）。そして、ネットワークは、特徴空間を学習するにつれて、スキップされた層を徐々に復元する。

【0099】

図９Ｂは、様々な実施形態による、図９Ａの単一のピラミッド層９１０を示す。図９Ｂに示すように、ピラミッド層９１０は、複数の異なるスケール（「拡張ブロック」）（この例では４つのレベル）で、拡張（アトラウス）分離可能型畳み込みを使用してもよい。ピラミッド層９１０は、物体（例えば、腫瘍）の検出精度を高めるために、複数の異なるスケールで同じ画像を含む。拡張（アトラウス）畳み込みは、カーネルサイズに対して受容野のサイズを増加させる受容野が「広がった」フィルタを指す。いくつかの実施形態では、１つまたは複数の拡張レベルは、４つの拡張レベルである。他の実施形態では、より多いまたはより少ない拡張レベル、例えば６つの拡張レベルが使用されてもよい。畳み込み層出力９１５は、拡張ブロック９２０（ここでは拡張子１、２、４、および８とラベル付けされている）の出力である。図９Ｂの図示の例は、４つの拡張ブロックを想定し、各拡張ブロックが（同じ色の）２つのチャネルを出力するため、出力されるチャネルの総数は８である。各拡張ブロックによって出力されるチャネルの数は、問題の残差ブロックに応じて変化し得る。図９Ｂの例は、図８の左上または右上の残差ブロック８１５を示す。いくつかの実施形態では、残差ブロック９０５のピラミッド層９１０内の各拡張ブロック９１５によって出力される各チャネルの数は、残差ブロック９０５上のｋ個のフィルタを４で割った数に等しい。

【0100】

経験的証拠は、残差ブロックが精度の向上およびより容易な最適化を可能にすることを示している。分離可能な畳み込み、深さ方向の畳み込み、それに続く点方向の畳み込みも、収束速度の大きな増加およびモデルサイズの大幅な縮小を示している。拡張畳み込みにより、分解能を失うことなく受容野が拡大し、したがってマルチスケールコンテキスト情報をダウンサンプリングで集約することが可能になる。畳み込みブロックの再設計は、画像内の非常に局所的で希少な情報を抽出することを可能にする。

【0101】

Ｃ．二重画像内の表現型を検出するために機械学習モデルを訓練するための方法
図１０は、一部の実施形態による、二重画像内の表現型を検出するように機械学習モデルを訓練するためのプロセス１０００を示す。例示を目的として、プロセス１０００は、図１の画像処理システム１００および／または図３に示す構成要素を参照して説明されるが、他の実施態様も可能である。例えば、非一時的コンピュータ可読媒体に記憶されている図３のコンピューティング環境３００用のプログラムコードは、１つまたは複数の処理デバイスによって実行され、サーバシステムに本明細書に記載の１つまたは複数の動作を実行させる。

【0102】

ステップ１００２において、訓練サブシステムは、生物学的試料（例えば、組織切片）の少なくとも一部を表示するデジタル病理画像にアクセスする。デジタル病理画像は、第１のタイプのバイオマーカーおよび第２のタイプのバイオマーカーについて染色された二重画像とすることができる。場合によっては、デジタル病理画像は、より大きなデジタル画像の一部（例えば、画像タイル）に対応する。

【0103】

ステップ１００４において、訓練サブシステムは、デジタル病理画像を混合解除して、（ｉ）第１のタイプのバイオマーカーが識別される生物学的試料の少なくとも一部を表示する第１の合成単一画像と、（ｉｉ）第２のタイプのバイオマーカーが識別される生物学的試料の少なくとも一部を表示する第２の合成単一画像とを生成する。場合によっては、合成単一画像は、（ｉ）対応するバイオマーカーについて染色された細胞を表示する前処理画像を生成し、（ｉｉ）前処理画像を対比染色画像と組み合わせることによって生成される。対比染色画像を使用することにより、バイオマーカーを、前処理画像に示される他の細胞構造から視覚的に区別することができる。

【0104】

さらに、第１のタイプのバイオマーカーはＥＲバイオマーカーに対応することができ、第２のタイプのバイオマーカーはＰＲバイオマーカーに対応する。追加的または代替的に、第１および第２の合成単一画像は、色補正演算を使用してさらに処理され、訓練ラベルの追加を容易にすることができる。場合によっては、第１および第２の合成単一画像は、染色エラーなどのあらゆる可能性のあるエラーに対処するために、生物学的試料の別の部分（例えば、隣接する組織切片）を表示するそれぞれの単一画像と比較される。

【0105】

ステップ１００６において、訓練サブシステムは、第１の合成単一画像に第１の訓練ラベルのセットを追加して、第１の訓練画像を生成する。各訓練ラベルは、訓練ラベルによって識別される細胞の位置および対応するバイオマーカーに対する細胞の表現型を識別することができる。例えば、訓練ラベルの第１のセットは、（ｉ）ＥＲ＋分類と、（ｉｉ）ＥＲ－分類と、（ｉｉｉ）間質細胞分類と、（ｉｖ）免疫細胞分類と、（ｖ）アーチファクト分類とを含むことができる。場合によっては、訓練ラベルは、１人または複数の病理学者によって第１の合成単一画像に追加される。

【0106】

ステップ１００８において、訓練サブシステムは、第１訓練画像を使用して第１機械学習モデルを訓練する。上記の例を続けると、第１の機械学習モデルは、ＥＲバイオマーカーについて染色された画像内の細胞の表現型を予測するように訓練され得て、これは、第１の機械学習モデルの出力と第１の合成単一画像に対応するグラウンドトゥルースとの間で計算された損失に基づいて第１の機械学習モデルのパラメータを調整することを含む。第１の機械学習モデルは、第１の訓練画像の確率マップのセットを生成するように訓練され得る。確率マップのセットの各確率マップは、合成単一画像の複数の画素を表すことができ、分類のセットのうちの特定の分類に対応することができる。例えば、第１の機械学習モデルは、第１の訓練画像用の確率マップの第１のセットを生成するように訓練され得て、確率マップの第１のセットは、（ｉ）ＥＲ＋分類用の第１の確率マップと、（ｉｉ）ＥＲ－分類用の第２の確率マップと、（ｉｉｉ）間質細胞分類用の第３の確率マップと、（ｉｖ）免疫細胞分類用の第４の確率マップと、（ｖ）アーチファクト分類用の第５の確率マップと、を含む。場合によっては、第１の機械学習モデルはＵ－Ｎｅｔモデルである。

【0107】

ステップ１０１０において、訓練サブシステムは、第２の合成単一画像に第２の訓練ラベルのセットを追加して、第２の訓練画像を生成する。各訓練ラベルは、訓練ラベルによって識別される細胞の位置および対応するバイオマーカーに対する細胞の表現型を識別することができる。例えば、訓練ラベルの第１のセットは、（ｉ）ＰＲ＋分類と、（ｉｉ）ＰＲ－分類と、（ｉｉｉ）間質細胞分類と、（ｉｖ）免疫細胞分類と、（ｖ）アーチファクト分類とを含むことができる。場合によっては、訓練ラベルは、１人または複数の病理学者によって第２の合成単一画像に追加される。

【0108】

ステップ１０１２において、訓練サブシステムは、第２訓練画像を使用して第２機械学習モデルを訓練する。上記の例を続けると、第２の機械学習モデルは、ＰＲバイオマーカーについて染色された画像内の細胞の表現型を予測するように訓練され得て、これは、第２の機械学習モデルの出力と第２の合成単一画像に対応するグラウンドトゥルースとの間で計算された損失に基づいて第２の機械学習モデルのパラメータを調整することを含む。第２の機械学習モデルは、第２の訓練画像の確率マップのセットを生成するように訓練され得る。例えば、第１の機械学習モデルは、第１の訓練画像用の確率マップの第１のセットを生成するように訓練され得て、確率マップの第１のセットは、（ｉ）ＰＲ＋分類用の第１の確率マップと、（ｉｉ）ＰＲ－分類用の第２の確率マップと、（ｉｉｉ）間質細胞分類用の第３の確率マップと、（ｉｖ）免疫細胞分類用の第４の確率マップと、（ｖ）アーチファクト分類用の第５の確率マップと、を含む。場合によっては、第２の機械学習モデルはＵ－Ｎｅｔモデルである。したがって、第１の機械学習モデルおよび第２の機械学習モデルは、別々の訓練画像を使用して訓練され得て、その結果、訓練された機械学習モデルは、それぞれの合成単一画像に示された細胞の表現型を正確に予測することができる。

【0109】

ステップ１０１４において、訓練サブシステムは、第１および第２機械学習モデルを提供する。例えば、第１および第２の機械学習モデルは、通信ネットワークを介して別のコンピューティングシステム（例えば、図１の画像処理システム１００）によってアクセスされて、他の二重画像内の細胞の表現型を予測することができる。場合によっては、第１および第２の機械学習モデルのそれぞれについて決定された損失が所定のしきい値を下回ると、第１および第２の機械学習モデルは他のシステムによってアクセスされる。プロセス１０００はその後終了する。

【0110】

ＶＩＩ．複数のバイオマーカーについての細胞の表現型のマージ
訓練された２つの機械学習モデルを使用して、初期シード位置を生成し、シード位置の表現型を予測することができる。特に、第１の機械学習モデル（例えば、ＥＲモデル）を使用して、合成単一ＥＲ画像内の細胞の表現型を生成することができ、第２の機械学習モデル（例えば、ＰＲモデル）を使用して、合成単一ＰＲ画像内の細胞の表現型を生成することができる。

【0111】

図１１は、いくつかの実施形態による、例示的なシード位置および２つのモデルによって生成された異なるクラスラベルを示す。図１１において、画像１１０２は、ＥＲモデルによって生成された赤色の「ひし形」を識別しており、ＥＲモデルは１７６２個の細胞（ＥＲ＋、ＥＲ－、免疫、マトリックスおよびバックグラウンドを含む）を検出した。第１の画像１１０２は、ＰＲモデルによって生成された緑色の「Ｘ」も識別しており、ＰＲモデルは１０３４個の細胞を検出した。画像の拡大部分１１０４は、表現型を識別するのが困難な二重画像の細胞が存在することをさらに示す。この困難さは、同じ画像に複数の緑および赤のマークがクラスタ化されていることに起因する可能性がある。二重画像の異なる領域１１０６は、複数のバイオマーカーの表現型を識別することが困難であり得る細胞の例を示す。例えば、ある細胞はＥＲモデルによってＥＲ陽性細胞であると予測され得るが、ＰＲモデルは、同じ細胞を免疫細胞および間質細胞などの他の細胞に対応するものと予測する可能性がある。

【0112】

Ａ．訓練された機械学習モデルを使用して合成単一画像からの確率マップの生成
上述した課題に対処するために、画像処理システムは、第１および第２の機械学習モデルによって生成された表現型をマージすることができる。表現型のマージは、確率マップを用いて行うことができる。特に、機械学習モデルによって生成された確率マップを所与の画像領域について比較することができ、確率マップに基づいて所与の領域について出力を決定することができる。確率マップを使用することで、クラスを割り当てるためにヒューリスティックパラメータを調整するなどの既存の技術に比べて利点が得られる。

【0113】

図１２は、いくつかの実施形態による、ＥＲモデルによって生成された５つの確率マップ１２００を示す。確率マップ１２００の各確率マップは、合成ＥＲ画像の複数の画素を表すことができ、分類のセットのうちの特定の分類に対応することができる。確率マップは、複数の画素の各画素について、その画素がその分類に対応するかどうかを示す確率値を含む。図１２に示すように、合成ＥＲ画像を表す確率マップ１２００は、（ｉ）ＥＲ＋分類用の第１の確率マップ１２０４と、（ｉｉ）ＥＲ－分類用の第２の確率マップ１２０６と、（ｉｉｉ）免疫細胞分類用の第３の確率マップ１２０８と、（ｉｖ）間質細胞分類用の第４の確率マップ１２１０と、（ｖ）アーチファクト／ノイズ分類用の第５の確率マップ１２１２と、を含むことができる。確率マップに加えて、ＥＲモデルはまた、バックグラウンド／物体マップ１２１４を生成することもできる。ＥＲチャネル内の各画素について、画像処理システムは、５つの確率マップ間の確率値を比較して、画素をＥＲ陽性、ＥＲ陰性、免疫細胞、間質細胞、または他の細胞として割り当てるべきかどうかを決定することができる。ＰＲモデルはまた、合成ＰＲ画像を処理することによって５つの確率マップを生成することができる。ＰＲモデルによって生成された確率マップを使用して、画素がＰＲ陽性、ＰＲ陰性、免疫細胞、間質細胞またはその他の細胞になることを決定することができる。

【0114】

Ｂ．アンカーポイントのセットを定義するためのマージされた確率マップの生成
ＥＲモデルおよびＰＲモデルのそれぞれによって生成された確率マップをマージして、確率マップのマージされたセットを生成することができる。確率マップのマージされたセットに基づいて、アンカーポイントのセットを決定することができる。アンカーポイントのセットは、１つまたは複数のバイオマーカーの存在を識別することができる二重画像内の位置に対応することができる。図１３は、いくつかの実施形態による、ＥＲチャネルおよびＰＲチャネルにおける２つのＵ－Ｎｅｔモデルによって生成された確率マップ間の５つのマージされた確率マップ１３００の計算を示す。図１３では、ＥＲモデルが合成ＥＲ画像に対して使用され得て、ＥＲ腫瘍陽性、ＥＲ腫瘍陰性、免疫細胞、間質細胞および他の細胞のオブジェクトマップおよび５つの確率マップ１３０２を生成することができる。ＰＲモデルを合成ＰＲ画像に使用して、ＰＲ腫瘍陽性、ＰＲ腫瘍陰性、免疫細胞、間質細胞および他の細胞のオブジェクトマップおよび５つの確率マップ１３０２を生成することができる。画像処理システムは、確率マップ１３０２と１３０４の両方を比較して、ＥＲおよびＰＲの腫瘍陽性確率マップにおける各画素の最大確率を決定することができる。画像処理システムはまた、ＥＲおよびＰＲの腫瘍陰性確率マップにおける各画素の最大確率を決定することができる。画像処理システムは、ＥＲチャネルとＰＲチャネルとの間の免疫確率マップ、間質確率マップおよび他の細胞確率マップに対して上記プロセスを実行し続けることができる。

【0115】

ＥＲおよびＰＲのチャネル画像から５つのマージされた確率マップ１３０６を計算した後、画像処理システムは、特定の距離または領域内のマージされた確率マップ１３０６内の各画素の最大確率を比較することができ、最大確率を有する画素を、各細胞の潜在的中心または各細胞のアンカーポイントとして予測することができる。

【0116】

図１４は、いくつかの実施形態による、ＥＲチャネルとＰＲチャネルとの間のマージされた確率マップを探索することによって得られたアンカーポイント１４００の例を示す。図１４では、合成ＰＲ画像１４０２および合成ＥＲ画像１４０４のそれぞれにアンカーポイント１４００がオーバーレイされている。画像１４０２および１４０４の青色の正方形はアンカーポイントを識別し、赤色のひし形は、ＴａｍｒａＰＲ画像１４０２およびＤａｂｓｙｌＥＲ画像１４０４で最初に検出された細胞に対応し、アンカーポイントは各細胞の中心であり、すべての赤色のドットはＥＲ／ＰＲチャネル内の５つのタイプのラベルを組み合わせている。いくつかの実施形態では、アンカーポイントは、細胞の別の部分（例えば、核）に対応する。

【0117】

Ｃ．アンカーポイントと対応する表現型との関連付け
図１５は、いくつかの実施形態による、画素レベルでの例示的なアンカーポイントならびに周囲のＥＲ＋点およびＰＲ＋点を示す。図１５には、画素レベルにおける例示的なアンカーポイント１５０２と、それを取り囲むＥＲ＋点１５０４およびＰＲ＋点１５０６とが示されている。いくつかの実施形態では、アンカーポイントとＥＲ＋、ＰＲ＋点１５０４および１５０６との間の距離を計算するために、ｋ最近傍アルゴリズムまたは距離アルゴリズムが適用される。例えば、ＥＲ＋およびＰＲ＋の両方の位置がアンカーポイントから所定の距離内にある場合、アンカーポイントにＥＲ＋およびＰＲ＋の両方のラベルを割り当てることができる。

【0118】

追加的または代替的に、ラベリング技術を使用することができる。図１６は、いくつかの実施形態による、確率マップから決定された例示的なラベルグラフ１６００を示す。図１６は、５つのラベルグラフとアンカーポイントに適用される論理積演算をさらに示す。ＥＲチャネル内の５つの確率マップ内の各点（ＥＲ＋「１」、ＥＲ－「２」、間質－「３」、免疫「４」および他の「５」）について、画像処理システムは、周囲のラベルグラフ１６０２を計算することができる。場合によっては、ラベルグラフは、対応するタイプのバイオマーカーについての表現型（例えば、ＥＲ＋）を示すとして分類された点を囲む１０×１０画素の領域に対応することができる。ラベルグラフ１６０４では、アンカーポイントを「赤色」の円としてマークすることもでき、論理「＆」演算および５つのラベルグラフを使用して、アンカーポイントがＥＲ＋／ＥＲ－／免疫／間質／その他の分類のいずれに属するかを判定する。例えば、アンカーポイント１６０６は、ＥＲ＋分類として分類された点に対応する１０×１０画素領域内にあるため、ＥＲ＋分類に割り当てられ得る。別のＥＲ－ラベルグラフはＥＲ＋ラベルグラフと重複するが、画像処理システムはＥＲ＋ラベルグラフにより高い重みを割り当てることができ、アンカーポイントには他の分類よりもＥＲ＋分類を割り当てることができる。

【0119】

ｉ．アンカーポイントとＥＲ分類との関連付け
図１７は、いくつかの実施形態による、ＥＲ＋／ＥＲ－／その他にアンカーポイントを割り当てる例を示す図である。図１７において、画像処理システムは、合成単一画像１７０４（例えば、ＥＲチャネル画像）に対して画素－距離マップ１７０２を生成する。画素－距離マップ１７０２は、対応するタイプのバイオマーカーについての表現型を有するものとして分類された点のセットを含み、点のセットの各点は、所定の画素領域（例えば、１０×１０画素）によって定義される。画像処理システムは、画素－距離マップ１７０２を合成単一画像１７０４に対応するアンカーポイントのセットにオーバーレイすることができ、それによってアンカーポイントのセットの分類を含むマッピングされた画像１７０６を生成する。マッピングされた画像１７０６の拡大部分１７０８が示されており、１つまたは複数のアンカーポイント（「赤色」ドットとして定義される）が対応する画素領域（「白色」正方形として定義される）に関連付けられている。マッピングされた画像１７０６を、合成ＰＲ画像に対して生成された別のマッピングされた画像（図示せず）と組み合わせて、ＥＲバイオマーカーおよびＰＲバイオマーカーの共局在を含む出力画像１７１０を生成することができる。上記の技術は、より速く、より効率的に、より正確に実行することができるため、上記の技術は、他の既存のアルゴリズムよりも有利である可能性がある。

【0120】

図１８は、いくつかの実施形態による、合成ＥＲ画像内のＥＲ＋／ＥＲ－／その他にアンカーポイントを割り当てるためのプロセス１８００を示す。図１８では、プロセス１８００は、「＆」演算子を使用してＥＲチャネル内でアンカーポイントに分類ラベル（例えば、ＥＲ＋／ＥＲ－／その他）を割り当てるプロセスを含み、（ｉ）アンカーポイントと重複する「ＥＲ＋」ラベルマップの部分は、アンカーポイントのＥＲ＋分類を生成し（ブロック１８０２）、（ｉｉ）アンカーポイントと重複する「ＥＲ－」ラベルマップの部分は、アンカーポイントのＥＲ－分類を生成し（ブロック１８０４）、（ｉｉｉ）アンカーポイントと重複する「免疫／間質／アーチファクト」ラベルマップの部分は、アンカーポイントの「その他」の分類を生成する（ブロック１８０６）。場合によっては、画像処理システムが合成単一画像の画素の分類の最大確率を計算する際、弱く染色されたＥＲ陽性細胞が考慮されずに、見逃されることがある。上記の問題に対処するために、画像処理システムは、このステップにおいて、弱く染色されたＥＲ陽性細胞を追加することができる（ブロック１８０８）。

【0121】

ｉｉ．アンカーポイントとＰＲ分類との関連付け
同様に、画像処理システムは、図１９および図２０に示す合成ＰＲ画像において同等の処理を繰り返すことができる。図１９は、いくつかの実施形態による、ＰＲ＋／ＰＲ－／その他にアンカーポイントを割り当てる例を示す図である。図１９において、画像処理システムは、合成単一画像１９０４（例えば、ＰＲチャネル画像）に対して画素－距離マップ１９０２を生成する。画素－距離マップ１９０２は、ＰＲバイオマーカーの表現型を有するものとして分類された点のセットを含み、このセットの各点は、所定の画素領域（例えば、１０×１０画素）によって定義される。画像処理システムは、画素－距離マップ１９０２を合成単一画像１９０４に対応するアンカーポイントのセットにオーバーレイすることができ、それによってアンカーポイントのセットの分類を含むマッピングされた画像１９０６を生成する。マッピングされた画像１９０６を、合成ＥＲ画像に対して生成されたマッピングされた画像１８０６と組み合わせて、ＥＲバイオマーカーおよびＰＲバイオマーカーの共局在を含む出力画像１９１０を生成することができる。

【0122】

図２０は、いくつかの実施形態による、合成ＰＲ画像においてＰＲ＋／ＰＲ－／その他にアンカーポイントを割り当てるためのプロセス２０００を示す。図２０では、プロセス２０００は、「＆」演算子を使用してＰＲチャネル内でアンカーポイントに分類ラベル（例えば、ＰＲ＋／ＰＲ－／その他）を割り当てるプロセスを含み、（ｉ）アンカーポイントと重複する「ＰＲ＋」ラベルマップの部分は、アンカーポイントのＰＲ＋分類を生成し（ブロック２００２）、（ｉｉ）アンカーポイントと重複する「ＰＲ－」ラベルマップの部分は、アンカーポイントのＰＲ－分類を生成し（ブロック２００４）、（ｉｉｉ）アンカーポイントと重複する「免疫／間質／アーチファクト」ラベルマップの部分は、アンカーポイントの「その他」の分類を生成する（ブロック２００６）。場合によっては、画像処理システムが合成単面画像の画素の分類の最大確率を計算する際、弱く染色されたＰＲ陽性細胞が考慮されずに、見逃されることがある。上記の問題に対処するために、画像処理システムは、このステップにおいて、弱く染色されたＰＲ陽性細胞を追加することができる（ブロック２００８）。

【0123】

Ｄ．表現型の二重画像へのマージ
いくつかの実施形態では、システムは、すべての異なるタイプのアンカーポイントについてＥＲ＋／ＰＲ＋／ＥＲ－／ＰＲ－／その他を組み合わせてマージするように構成される。合成ＥＲ画像および合成ＰＲ画像の異なる優先確率に従って分類を決定することができる。例えば、合成ＥＲ画像および合成ＰＲ画像におけるＥＲ＋／ＰＲ＋／ＥＲ－／ＰＲ－に等しい重みを割り当てることができ、画像処理システムは、２つの合成ＥＲ画像および合成ＰＲ画像において検出された上記の表現型を組み合わせることができる。合成ＥＲ画像および合成ＰＲ画像において検出された他の細胞に対しては、より小さい重みを割り当てることができる。例えば、ある画素がＥＲチャネルにおいてＥＲ＋として検出され、ＰＲ＋がＰＲチャネルにおいて検出された場合、画像処理システムは等しい重みを識別し、その画素をＥＲ＋ＰＲ＋共発現表現型として割り当てることができる。別の例では、画素がＥＲチャネルでＥＲ＋として検出され、間質細胞がＰＲチャネルで検出された場合、画像処理システムは２つの異なる重みを識別し、その画素をＥＲ＋分類のみとして割り当てることができる。図２１は、いくつかの実施形態において、二重画像にオーバーレイされたマージされた表現型を示す例示的な画像のセットを示す。

【0124】

Ｅ．二重画像内の表現型を検出するために機械学習技術を使用する方法
図２２は、いくつかの実施形態による、訓練された機械学習モデルを使用して二重画像内の表現型を検出するためのプロセス２２００を示す。例示を目的として、プロセス２２００は、図１の画像処理システム１００および／または図３に示す構成要素を参照して説明されるが、他の実施態様も可能である。例えば、非一時的コンピュータ可読媒体に記憶されている図３のコンピューティング環境３００用のプログラムコードは、１つまたは複数の処理デバイスによって実行され、サーバシステムに本明細書に記載の１つまたは複数の動作を実行させる。

【0125】

ステップ２２０２において、画像処理システムは、生物学的試料（例えば、組織切片）の少なくとも一部を表示するデジタル病理画像にアクセスする。デジタル病理画像は、第１のタイプのバイオマーカーおよび第２のタイプのバイオマーカーについて染色された二重画像とすることができる。場合によっては、デジタル病理画像は、より大きなデジタル画像の一部（例えば、画像タイル）に対応する。

【0126】

ステップ２２０４において、画像処理システムは、デジタル病理画像を混合解除して、（ｉ）第１のタイプのバイオマーカーが識別される生物学的試料の少なくとも一部を表示する第１の合成単一画像と、（ｉｉ）第２のタイプのバイオマーカーが識別される生物学的試料の少なくとも一部を表示する第２の合成単一画像とを生成する。場合によっては、第１のタイプのバイオマーカーはＥＲバイオマーカーに対応し、第２のタイプのバイオマーカーはＰＲバイオマーカーに対応する。場合によっては、合成単一画像は、（ｉ）対応するバイオマーカーについて染色された細胞を表示する前処理画像を生成し、（ｉｉ）前処理画像を対比染色画像と組み合わせることによって生成される。対比染色画像を使用することにより、バイオマーカーを、前処理画像に示される他の細胞構造から視覚的に区別することができる。

【0127】

ステップ２２０６において、画像処理システムは、第１の機械学習モデルを第１の合成単一画像に適用して、（ｉ）第１の合成単一画像から第１の複数の細胞を検出し、（ｉｉ）第１の複数の細胞の各細胞について、分類の第１のセットのうちの分類を決定する。第１の機械学習モデルは、第１の訓練されたＵ－Ｎｅｔモデルとすることができる。第１のセットのうちの分類は、細胞が第１のタイプのバイオマーカーを有するバイオマーカーを含むかどうかを示す。第１の機械学習モデルは、図１０のプロセス１０００を使用して訓練されたＥＲモデルとすることができる。分類の第１のセットは、ＥＲバイオマーカーについての細胞の表現型を識別することができ、分類の第１のセットは、（ｉ）ＥＲ陽性分類（ＥＲ＋）と、（ｉｉ）ＥＲ陰性分類バイオマーカー（ＥＲ－）と、（ｉｉｉ）間質細胞分類と、（ｉｖ）免疫細胞分類と、（ｖ）アーチファクトまたは他の生物学的構造分類とを含む。場合によっては、画像処理システムは、第１の機械学習モデルを適用して、第１の合成単一画像を表す確率マップの第１のセットを生成する。確率マップの第１のセットの各確率マップは、第１の合成単一画像の複数の画素を表すことができ、分類の第１のセットのうちの特定の分類に対応することができる。確率マップは、複数の画素の各画素について、その画素がその分類に対応するかどうかを示す確率値を含む。

【0128】

ステップ２２０８において、画像処理システムは、第２の合成単一画像に第２の機械学習モデルを適用して、（ｉ）第２の合成単一画像から第２の複数の細胞を検出し、（ｉｉ）第２の複数の細胞の各細胞について、分類の第２のセットのうちの分類を決定する。第２の機械学習モデルは、分類の第１のセットを生成するために使用される第１の訓練されたＵ－Ｎｅｔモデルとは別個に訓練された第２の訓練されたＵ－Ｎｅｔモデルとすることができる。第２のセットのうちの分類は、細胞が第２のタイプのバイオマーカーを有するバイオマーカーを含むかどうかを示す。第２の機械学習モデルは、図１０のプロセス１０００を使用して訓練されたＰＲモデルとすることができる。分類の第２のセットは、ＰＲバイオマーカーについての細胞の表現型を識別することができ、分類の第２のセットは、（ｉ）ＰＲ陽性分類（ＰＲ＋）と、（ｉｉ）ＰＲ陰性分類バイオマーカー（ＰＲ－）と、（ｉｉｉ）間質細胞分類と、（ｉｖ）免疫細胞分類と、（ｖ）アーチファクトまたは他の生物学的構造分類とを含む。場合によっては、画像処理システムは、第２の機械学習モデルを適用して、第２の合成単一画像を表す確率マップの第２のセットを生成する。確率マップの第２のセットの各確率マップは、第２の合成単一画像の複数の画素を表すことができ、分類の第２のセットのうちの特定の分類に対応することができる。確率マップは、複数の画素の各画素について、その画素がその分類に対応するかどうかを示す確率値を含む。分類の第１のセットは、分類の第２のセットとは異なる分類を含むことができる。

【0129】

ステップ２２１０において、画像処理システムは、第１の複数の細胞の分類と第２の複数の細胞の分類とをマージして、マージされた分類を生成する。分類の第１のセットと分類の第２のセットのマージは、複数のバイオマーカー表現型（例えば、ＥＲ／ＰＲ）に関連付けられた細胞を表示するデジタル病理画像の画像領域の識別を容易にする。場合によっては、画像処理システムは、確率マップの第１のセットと第２のセットをマージしてアンカーポイントのセットを定義することによって、分類の第１のセットと分類の第２のセットをマージする。アンカーポイントのセットは、デジタル病理画像内の位置に対応し、各アンカーポイントについて１つまたは複数のバイオマーカーの存在を識別することができる。分類をマージするために、画像処理システムは、アンカーポイントのセットの各アンカーポイントに対して、分類の第１のセットのうちの対応する分類および分類の第２のセットのうちの対応する分類を割り当てる。第１および第２のセットの対応する分類は、アンカーポイントが、対応する分類のそれぞれの位置から所定の距離（例えば、１０画素）内にあるかどうかの判定に基づいて識別され得る。

【0130】

ステップ２２１２において、画像処理システムは、マージされた分類を有するデジタル病理画像を出力する。マージされた分類は、検出された細胞の表現型を識別することができ、その表現型は、デジタル病理画像について染色された複数のバイオマーカーの存在を示すことができる。場合によっては、画像処理システムは、マージされた分類をデジタル病理画像上にオーバーレイすることによってデジタル病理画像を出力する。

【0131】

ＶＩＩ．マージされた表現型を使用した強化された機械学習モデルの訓練
場合によっては、マージされた表現型を使用して、別の機械学習モデルを訓練して、二重画像内の細胞の表現型を予測することができ（「強化された機械学習モデル」と呼ばれる）、強化された機械学習モデルは、二重画像の混合解除を必要としない。図２３は、いくつかの実施形態による、二重ＥＲ／ＰＲアルゴリズムのためのマージされた表現型を使用する訓練パイプライン２３００を示す。

【0132】

図２３において、画像処理システムは、２つ以上のタイプのバイオマーカーを示すように染色された病理スライドの画像を受信するように構成され得る（ブロック２３０２）。いくつかの実施形態では、画像処理システムは、エストロゲン受容体（ＥＲ）およびプロゲステロン受容体（ＰＲ）タンパク質の存在を示すように染色された二重スライドの画像を使用して動作するように構成される。画像内の各細胞は、ＥＲマーカーおよびＰＲマーカーのそれぞれについて陽性または陰性であるとして分類され得る。したがって、各細胞の表現型は、ＥＲ＋ＰＲ＋、ＥＲ＋ＰＲ－、ＥＲ－ＰＲ＋、ＥＲ－ＰＲ－または他の（例えば、間質、免疫、壊死、アーチファクトなど）として識別され得る。

【0133】

場合によっては、画像処理システムは、二重スライド画像を複数の画像タイルに分ける（ブロック２３０４）。複数のバイオマーカーに対する細胞の表現型の識別は、複数の画像タイルのそれぞれについて行われ得る。場合によっては、画像タイルのセットが複数の画像タイルから選択され、画像タイルのセットは、バイオマーカーのタイプに対する細胞の表現型を検出するために１つまたは複数の機械学習モデルを訓練するための訓練画像として使用される。

【0134】

画像処理システムは、二重画像のマージされた表現型を識別して、訓練二重画像を生成することができる（ブロック２３０６）。訓練二重画像は、訓練ラベルのセットを含むことができ、各訓練ラベルは、複数のバイオマーカー（例えば、ＥＲ＋／ＰＲ＋）について対応する細胞の表現型を識別する。訓練画像のマージされた表現型は、図２２に記載されたプロセス２２００のステップを使用して生成され得る。場合によっては、画像処理システムは、機械学習モデルを訓練するための訓練画像のセットを生成するために、画像タイルのセットの各画像タイルについてマージされた表現型を識別する。場合によっては、訓練画像のセットのマージされた表現型は、病理学者によって手動で生成されたグランドトゥルース訓練ラベルと比較される（ブロック２３０８）。

【0135】

いくつかの実施形態では、画像処理システムは、マージされた表現型（すなわち、訓練画像）を有する画像タイルのセットを使用して、強化された機械学習モデル（例えば、Ｕ－Ｎｅｔモデル）を訓練し、強化された機械学習モデルが、複数のバイオマーカーについて検出された各細胞の表現型を予測することができるようにする。例えば、強化された機械学習モデルは、訓練画像のセットを使用して訓練され、ＥＲ／ＰＲバイオマーカーの両方について細胞の表現型を予測することができる（ブロック２３１０）。

【0136】

次いで、訓練された強化された機械学習モデルを使用して、対応する他の二重画像内の細胞の表現型を検出することができる（ブロック２３１２）。結果として、画像処理システムは、単一の強化された機械学習モデルを使用して、複数のバイオマーカーの表現型を予測することができる（ブロック２３１４）。場合によっては、画像処理システムは、マージされた表現型を二重画像にオーバーレイする。マージされた表現型を使用して強化された機械学習モデルを訓練することにより、色の混合解除操作などの画像前処理ステップを実行することなく、二重画像内の複数のバイオマーカーを検出する精度を高めることができる。

【0137】

ＶＩＩＩ．実験結果
本機械学習技術の性能は、病理学者によって実行される手動注釈と同等またはそれ以上であり、それにより、二重画像内の複数のバイオマーカーの存在を識別する際の画像処理システムの精度の向上を実証する。

【0138】

Ａ．コンセンサススコアの比較
図２４Ａ～図２４Ｂは、いくつかの実施形態による、３人の病理学者のコンセンサススコアならびにＵ－Ｎｅｔおよびマージ表現型アルゴリズムを示す。図２４Ａは、ＥＲバイオマーカーについての３人の病理学者のコンセンサススコア（例えば、平均スコア）を本開示の態様に記載される機械学習技術によって予測されたマージされた表現型に対応するスコアと比較して示す。さらに、図２４Ｂは、ＰＲバイオマーカーについての３人の病理学者のコンセンサススコアを、本機械学習技術によって予測されたマージされた表現型に対応するスコアと比較して示す。図２４Ａ～図２４Ｂに示すように、機械学習技術によって生成されたマージされた表現型（緑色ドット）は、３人の病理学者のスコアの範囲内（赤色バー）にあり、コンセンサススコア（黄色ドット）に非常に近かった。したがって、図２４Ａ～図２４Ｂのグラフは、本機械学習技術が病理学者によって手動で行われた注釈付けと同等に機能できることを実証している。

【0139】

表１は、「表現型のマージ＋Ｕ－Ｎｅｔ」アルゴリズムと、コンセンサスが一致した病理学者のスコア（３人の病理学者のスコアの中央値）との相関関係をさらに記載している。

【表1】

【0140】

Ｕ－Ｎｅｔ表１は、Ｕ－Ｎｅｔアルゴリズムおよび表現型のマージが、ＥＲバイオマーカーおよびＰＲバイオマーカーの検出において病理学者と同等に機能することを示す。

【0141】

Ｂ．強化された機械学習モデルの精度評価
別の評価では、病理学者は、ＥＲおよびＰＲのバイオマーカーの多様性と強度に幅のある６枚のスライドから５０個のＦＯＶを選択した。設計されたマージされた表現型は、ＥＲ＋ＰＲ＋、ＥＲ＋ＰＲ－、ＥＲ－ＰＲ＋、ＥＲ－ＰＲ－およびその他の細胞の共発現を検出するために、二重画像において単一のＵ－Ｎｅｔモデルを訓練する。強化されたＵ－Ｎｅｔモデルは、図２３のプロセス２３００に記載されたステップを使用して訓練され得る。さらに、強化されたＵ－Ｎｅｔモデルを訓練するために以下の構成が使用された。（ｉ）オプティマイザはＡｄａｍＯｐｔｉｍｉｚｅｒを含み、（ｉｉ）学習率を１ｅ－４に設定し、（ｉｉｉ）エポックを１００／２００に設定し、（ｉｖ）訓練／検証を８０／２０に設定し、（ｖ）パッチサイズを２５６×２５６に設定し、（ｖｉ）損失関数として交差エントロピー関数を設定した。表２は、Ｕ－Ｎｅｔモデルを訓練するために使用される訓練データセットを提供する。訓練されたＵ－Ｎｅｔモデルの精度結果を表３に列挙する。

【表2】

【表3】

【0142】

Ｃ．定性的結果
定量的結果に加えて、機械学習モデルの性能を評価するために定性的データも生成された。図２５は、いくつかの実施形態による、結果二重ＥＲ／ＰＲの表現型検出の例を示す。図２５は、ＥＲ／ＰＲ二重画像２５０２上にオーバーレイされたマージされた表現型、合成ＥＲ画像２５０４上にオーバーレイされたマージされた表現型、および合成ＰＲ画像２５０６上にオーバーレイされたマージされた表現型を含む、結果二重ＥＲ／ＰＲの表現型検出の例を示す。

【0143】

図２６Ａ～図２６Ｂは、異なるタイプのマージされた表現型を有する二重ＥＲ／ＰＲのさらなる例を表示する。図２６Ａは、二重ＥＲ／ＰＲ２６０２におけるＥＲ＋／ＰＲ＋共発現の一例、および二重ＥＲ／ＰＲ２６０４におけるＰＲ＋優勢の一例を示す。図２６Ｂは、二重ＥＲ／ＰＲ２６０６におけるＥＲ＋優勢の一例、および二重ＥＲ／ＰＲ２６０８における腫瘍陰性優勢の一例を示す。

【0144】

Ｘ．さらなる考察
本開示のいくつかの実施形態は、１つまたは複数のデータプロセッサを含むシステムを含む。いくつかの実施形態では、システムは、非一時的コンピュータ可読記憶媒体であって、１つまたは複数のデータプロセッサ上で実行されると、１つまたは複数のデータプロセッサに、１つまたは複数の方法の一部もしくはすべておよび／または本明細書に開示された１つまたは複数のプロセスの一部もしくはすべてを実行させる命令を含む、非一時的コンピュータ可読記憶媒体を含む。本開示のいくつかの実施形態は、１つまたは複数のデータプロセッサに、本明細書に開示された１つまたは複数の方法の一部もしくはすべてならびに／あるいは１つまたは複数のプロセスの一部もしくはすべてを実行させるように構成された命令を含む、非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品を含む。

【0145】

採用された用語および表現は、説明の用語として使用されたものであり、限定を意味するものではなく、このような用語および表現の使用には、示され、説明された特徴またはその一部の等価物を排除する意図はないが、特許請求された発明の範囲内で様々な変更が可能であることが認識される。したがって、特許請求の範囲に記載された本発明は実施形態および任意の特徴によって具体的に開示されているが、本明細書に開示された概念の修正および変形は当業者によって使用されてもよく、このような修正および変形は、添付の特許請求の範囲によって定義される本発明の範囲内にあるものと見なされることを理解されたい。

【0146】

以下の説明は、好ましい例示的な実施形態のみを提供し、本開示の範囲、適用性または構成を限定することを意図しない。むしろ、好ましい例示的な実施形態の以下の説明は、様々な実施形態を実施するための可能な説明を当業者に提供する。添付の特許請求の範囲に記載の趣旨および範囲から逸脱することなく、要素の機能および配置に様々な変更が加えられ得ることが理解される。

【0147】

実施形態の完全な理解を提供するために、以下の説明において具体的な詳細が与えられる。しかしながら、これらの具体的な詳細なしで実施形態が実施されてもよいことが理解されよう。例えば、回路、システム、ネットワーク、プロセス、および他の構成要素は、実施形態を不必要な詳細で不明瞭にしないために、ブロック図の形態の構成要素として示されることがある。他の事例では、実施形態を不明瞭にすることを避けるために、周知の回路、プロセス、アルゴリズム、構造、および技術は不必要な詳細なしに示されることがある。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6A】

【図6B】

【図6C】

【図7】

【図8】

【図9A】

【図9B】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16】

【図17】

【図18】

【図19】

【図20】

【図21】

【図22】

【図23】

【図24A】

【図24B】

【図25】

【図26A】

【図26B】

【手続補正書】

【提出日】2024-03-12

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

第１のタイプのバイオマーカーおよび第２のタイプのバイオマーカーについて染色された生物学的試料の少なくとも一部を表示するデジタル病理画像にアクセスすることと、
前記デジタル病理画像を混合解除して、
前記第１のタイプのバイオマーカーが識別される前記生物学的試料の前記少なくとも一部を表示する第１の合成単一画像、および
前記第２のタイプのバイオマーカーが識別される前記生物学的試料の前記少なくとも一部を表示する第２の合成単一画像、
を生成することと、
前記第１の合成単一画像に第１の機械学習モデルを適用することであって、その結果、
前記第１の合成単一画像から第１の複数の細胞を検出して、
前記第１の複数の細胞の各細胞について、分類の第１のセットのうちの分類を決定し、前記第１のセットのうちの前記分類が、前記細胞が前記第１のタイプのバイオマーカーを有するバイオマーカーを含むかどうかを示す、
ことと、
前記第２の合成単一画像に第２の機械学習モデルを適用することであって、その結果、
前記第２の合成単一画像から第２の複数の細胞を検出して、
前記第２の複数の細胞の各細胞について、分類の第２のセットのうちの分類を決定し、前記第２のセットのうちの前記分類が、前記細胞が前記第２のタイプのバイオマーカーを有するバイオマーカーを含むかどうかを示し、前記分類の第１のセットが前記分類の第２のセットとは異なる、
ことと、
前記第１の複数の細胞の分類と前記第２の複数の細胞の分類とをマージして、マージされた分類を生成することと、
マージされた分類を有する前記デジタル病理画像を出力することと、
を含む、方法。

【請求項2】

前記第１の複数の細胞について前記分類を決定することが、
確率マップの第１のセットを生成することであって、前記確率マップの第１のセットの各確率マップが複数の画素を含み、前記分類の第１のセットのうちの分類に関連付けられ、前記確率マップが、前記複数の画素の各画素について、前記画素が前記分類に対応するかどうかを示す確率値を識別することと、
前記第１の複数の細胞の各細胞について、
前記確率マップの第１のセットのうち、前記細胞を表す１つまたは複数の画素についての最も高い確率値を含む確率マップを識別し、
識別された前記確率マップと関連付けられた分類を前記細胞に割り当てることと、
を含む、請求項１に記載の方法。

【請求項3】

前記第２の複数の細胞について前記分類を決定することが、
確率マップの第２のセットを生成することであって、前記確率マップの第２のセットの各確率マップが複数の画素を含み、前記分類の第２のセットのうちの分類に関連付けられ、前記確率マップが、前記複数の画素の各画素について、前記画素が前記分類に対応するかどうかを示す確率値を識別することと、
前記第２の複数の細胞の各細胞について、
前記確率マップの第２のセットのうち、前記細胞を表す１つまたは複数の画素についての最も高い確率値を含む確率マップを識別し、
識別された前記確率マップと関連付けられた分類を前記細胞に割り当てることと、
を含む、請求項１に記載の方法。

【請求項4】

前記第１の機械学習モデルおよび／または前記第２の機械学習モデルがＵ－Ｎｅｔモデルを含む、請求項１に記載の方法。

【請求項5】

前記第１のタイプのバイオマーカーがエストロゲン受容体タンパク質であり、前記第２のタイプのバイオマーカーがプロゲステロン受容体タンパク質である、請求項１に記載の方法。

【請求項6】

マージされた分類を有する前記デジタル病理画像を出力することが、前記マージされた分類を前記デジタル病理画像上にオーバーレイすることを含む、請求項１に記載の方法。

【請求項7】

マージされた分類を有する前記デジタル病理画像が、第３の機械学習モデルを訓練するための訓練画像として使用される、請求項１に記載の方法。

【請求項8】

前記第１の複数の細胞について前記分類を決定することが、
確率マップの第１のセットを生成することであって、前記確率マップの第１のセットの各確率マップが複数の画素を含み、前記分類の第１のセットのうちの分類に関連付けられ、前記確率マップが、前記複数の画素の各画素について、前記画素が前記分類に対応するかどうかを示す確率値を識別することを含み、
前記第２の複数の細胞についての分類を決定することが、
確率マップの第２のセットを生成することであって、前記確率マップの第２のセットの各確率マップが複数の画素を含み、前記分類の第２のセットのうちの分類に関連付けられ、前記確率マップが、前記複数の画素の各画素について、前記画素が前記分類に対応するかどうかを示す確率値を識別することを含み、
前記確率マップの第１のセットおよび前記確率マップの第２のセットがマージされてアンカーポイントのセットを生成し、前記アンカーポイントのセットの各アンカーポイントが、前記分類の第１のセットのうちの第１の分類および前記分類の第２のセットのうちの第２の分類を割り当てられる、請求項１に記載の方法。

【請求項9】

実行されるときにコンピュータシステムを制御して請求項１から８のいずれか一項に記載の方法を実行する複数の命令を記憶している非一時的コンピュータ可読媒体。

【請求項10】

請求項９に記載の非一時的コンピュータ可読媒体と、
前記コンピュータ可読媒体に記憶された命令を実行するための１つまたは複数のプロセッサと、
を備える、システム。

【請求項11】

請求項１から８のいずれか一項に記載の方法を実行するための手段を備える、システム。

【請求項12】

請求項１から８のいずれか一項に記載の方法を実行するように構成された１つまたは複数のプロセッサを備える、システム。

【請求項13】

請求項１から８のいずれか一項に記載の方法のステップをそれぞれ実行するモジュールを備える、システム。

【国際調査報告】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版