IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベンタナ メディカル システムズ, インコーポレイテッドの特許一覧

特許7231631腫瘍空間異質性およびインターマーカ異質性の計算方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-20
(45)【発行日】2023-03-01
(54)【発明の名称】腫瘍空間異質性およびインターマーカ異質性の計算方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20230221BHJP
   G06T 7/162 20170101ALI20230221BHJP
   G06T 7/90 20170101ALI20230221BHJP
   G01N 33/48 20060101ALI20230221BHJP
   G01N 33/483 20060101ALI20230221BHJP
   G01N 33/68 20060101ALI20230221BHJP
   C12Q 1/00 20060101ALI20230221BHJP
   C12Q 1/6841 20180101ALI20230221BHJP
【FI】
G06T7/00 630
G06T7/162
G06T7/90 A
G01N33/48 M
G01N33/483 C
G01N33/68
C12Q1/00 C
C12Q1/6841 Z
【請求項の数】 15
(21)【出願番号】P 2020531075
(86)(22)【出願日】2018-12-04
(65)【公表番号】
(43)【公表日】2021-02-18
(86)【国際出願番号】 EP2018083444
(87)【国際公開番号】W WO2019110567
(87)【国際公開日】2019-06-13
【審査請求日】2021-06-10
(31)【優先権主張番号】62/594,783
(32)【優先日】2017-12-05
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】507179346
【氏名又は名称】ベンタナ メディカル システムズ, インコーポレイテッド
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100120112
【氏名又は名称】中西 基晴
(74)【代理人】
【識別番号】100138759
【弁理士】
【氏名又は名称】大房 直樹
(72)【発明者】
【氏名】バーンズ,マイケル
(72)【発明者】
【氏名】チュッカ,スリニバス
(72)【発明者】
【氏名】サーカー,アニンディア
【審査官】小池 正彦
(56)【参考文献】
【文献】国際公開第2016/087592(WO,A1)
【文献】国際公開第2016/201186(WO,A1)
【文献】特表2016-503167(JP,A)
【文献】Vince Lyzinski et al,Community Detection and Classification in Hierarchical Stochastic Blockmodels,IEEE Transactions on Network Science and Engineering,米国,IEEE,2016年12月05日,Vol.4,No.1,p.13-26,https://ieeexplore.ieee.org/document/7769223
【文献】亀山 悟 他2名,腫瘍細胞画像診断支援のための細胞群に着目した階層成長型自己組織化マップを用いた細胞群特徴の抽出,社団法人電気学会,2011年08月25日
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06T 7/162
G06T 7/90
G01N 33/48
G01N 33/483
G01N 33/68
C12Q 1/00
C12Q 1/6841
(57)【特許請求の範囲】
【請求項1】
複数の染色を有する生体試料に対してインターマーカ異質性スコアを計算する方法であって、
(i)第1染色を有する第1画像から特徴を抽出するステップであって、前記第1画像内において細胞を分類するために、前記抽出した特徴を使用する、ステップと、
(ii)前記第1画像の前記抽出された特徴に細胞の分類を適用することによって、前記第1画像内において1または複数の細胞クラスタを識別するステップであって、前記1または複数の細胞クラスタが、グラフ理論手法を使用することによって識別される、ステップと、
(iii)前記第1画像および少なくとも1つの追加画像を、前記第1画像において識別された前記1または複数の細胞クラスタが前記少なくとも1つの追加画像にマッピングされるように共通座標系に位置合わせして、マッピングされた細胞クラスタを提供するステップであって、前記少なくとも1つの追加画像が異なる染色を含む、ステップと、
(iv)前記少なくとも1つの追加画像において前記マッピングされた1または複数の細胞クラスタの細胞を検出および分類するステップと、
(v)前記第1画像における前記1または複数の細胞クラスタの各々において、および前記少なくとも1つの追加画像における前記マッピングされた1または複数の細胞クラスタの各々において、各染色に対する発現スコアを導き出すステップと、
(vi)前記導き出した発現スコアに基づいて、1または複数のインターマーカ異質性スコアを計算するステップであって、前記1または複数のインターマーカ異質性スコアのうちのインターマーカ異質性スコアは、対応するバイオマーカに対して、前記第1画像内の前記1または複数の細胞クラスタと前記少なくとも1つの追加画像内の前記マッピングされた1または複数の細胞クラスタとの間におけるバイオマーカ発現レベルの違いを識別する、ステップと、
を含む、方法。
【請求項2】
請求項1記載の方法において、前記グラフ理論手法が、(i)空間隣接行列を構築するステップと、(ii)コミュニティ・ネットワーク・アルゴリズムを使用して、前記1または複数の細胞クラスタを識別するステップとを含む、方法。
【請求項3】
請求項2記載の方法において、前記空間隣接行列を構築する前記ステップが、(i)各細胞をグラフにおいてノード/頂点として定めるステップと、(ii)互いに所定の距離だけ離間された細胞ノードを識別するステップと、(iii)2つの接続ノード間のリンクをエッジとして定めるステップと、(iv)接続エッジ情報を使用して、全ての前記ノード/頂点に対して前記空間隣接行列を構築するステップとを含む、方法。
【請求項4】
請求項3記載の方法において、前記所定の距離が約50ミクロンである、方法。
【請求項5】
請求項から4までのいずれか1項記載の方法において、前記1または複数の細胞クラスタを識別する前記ステップが、(i)細胞のネットワークにおいて存在する全てのエッジの媒介性を計算するステップと、(ii)最も高い媒介性を有するエッジを除去するステップと、(iii)前記除去によって影響を受ける全てのエッジの媒介性を再計算するステップと、(iv)エッジがなくなるまで、ステップ(ii)および(iii)を繰り返すステップとを含む、方法。
【請求項6】
請求項1から5までのいずれか1項記載の方法において、前記位置合わせが、前記少なくとも1つの追加画像の前記第1画像の座標系への変換を計算する動作を含む、方法。
【請求項7】
請求項1から6までのいずれか1項記載の方法において、前記1または複数のインターマーカ異質性スコアを計算する前記ステップが、染色毎に導き出された複数の発現スコア間において標準偏差を計算するステップを含む、方法。
【請求項8】
請求項1から7までのいずれか1項記載の方法において、前記第1画像がH&Eによって染色される、方法。
【請求項9】
請求項1から8までのいずれか1項記載の方法において、前記少なくとも1つの追加画像が、前記対応するバイオマーカの存在を求めて染色され、および/または前記少なくとも1つの追加画像が、前記対応するバイオマーカを含むバイオマーカ画像である、方法。
【請求項10】
請求項9記載の方法において、前記対応するバイオマーカが、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、Ki-67、およびヒト上皮成長因子受容体2(HER2)から成る一群から、またはPD-L1、CD3、およびCD8から成る一群から選択される、方法。
【請求項11】
請求項1から10までのいずれか1項記載の方法であって、更に、1または複数の空間異質性メトリックを計算するステップを含む、方法。
【請求項12】
請求項1から11までのいずれか1項記載の方法において、前記細胞が、腫瘍細胞、間質細胞、またはリンパ球の内少なくとも1つとして分類される、方法。
【請求項13】
請求項1から12までのいずれか1項記載の方法において、前記発現スコアが、陽性率およびH-スコアから成る一群から選択される、方法。
【請求項14】
腫瘍内変動性を分析するシステム(200)であって、(i)1または複数のプロセッサと、(ii)前記1または複数のプロセッサに結合されたメモリであって、コンピュータ実行可能命令を格納する、メモリとを備え、前記コンピュータ実行可能命令が前記1または複数のプロセッサによって実行されると、前記システムに請求項1から13までのいずれか1項記載の方法を実行させる、システム(200)。
【請求項15】
命令を格納する非一時的コンピュータ読み取り可能媒体であって、前記命令が1または複数のプロセッサによって実行されると、請求項1から13までのいずれか1項記載の方法を実行する、非一時的コンピュータ読み取り可能媒体。
【発明の詳細な説明】
【背景技術】
【0001】
[0001] ディジタル病理学は、組織病理学または細胞病理学のホール・ガラス・スライドをスキャンして、コンピュータ画面上で解釈可能なディジタル画像を得ることを伴う。これらの画像は、その後撮像アルゴリズムによって処理されるか、または病理学者によって解釈されることになる。組織切片(垂直方向に透明である)を検査するために、選択的に細胞成分に結合する有色組織化学的染色を使用して、組織切片を用意する。色が強調された、または染色された細胞構造が、臨床医またはコンピュータ補助診断(CAD)アルゴリズムによって使用され、疾病の形態学的マーカを識別し、それに応じて治療を進める。アッセイを観察することにより、疾病の診断、処置に対する反応の評価、および疾病と闘うための新たな薬剤の開発を含む、種々のプロセスが可能になる。
【0002】
[0002] 免疫組織化学(IHC:Immunohistochemical)スライド染色は、組織切片の細胞においてタンパク質を識別するために利用することができ、したがって、生体組織における癌細胞や免疫細胞というような、異なる型の細胞の研究に広く使用されている。つまり、IHC染色は、免疫反応の研究のために、癌組織における免疫細胞(T-細胞またはB-細胞のような)の発現が異なるバイオマーカの分布および局在化(localization)を理解するために研究において使用することもできる。例えば、腫瘍は免疫細胞の浸潤(infiltrate)を含有することが多く、これが腫瘍の発達(development)を防止する場合や、または腫瘍の増生(outgrowth)に有利に働く場合もある。
【0003】
[0003] インサイチュー・ハイブリダイゼーション(ISH)は、顕微鏡の下で見ると、形態学的に悪性であるように見える、細胞における特異的な癌原因遺伝子の増幅のような遺伝子的異常または状態の存在を捜すために使用することができる。インサイチュー・ハイブリダイゼーション(ISH)は、細胞または組織試料内において標的にした核酸標的遺伝子を検出または位置確認(localize)するために、標的遺伝子配列または転写に対してアンチセンスである標識付きDNAまたはRNAプローブ分子を採用する。ISHは、ガラス・スライド上に不動化された細胞または組織試料を、この細胞または組織試料における所与の標的遺伝子に特異的に交雑させる(hybridizing)ことができる標識付き核酸プローブに露出させることによって行われる。複数の異なる核酸タグが既に標識付けされている複数の核酸プローブに細胞または組織試料を露出させることによって、様々な標的遺伝子を同時に分析することができる。異なる発光波長を有する標識を利用することによって、1つの標的細胞または組織試料に対して1回のステップで同時多色分析を行うことができる。
【発明の概要】
【0004】
[0004] 腫瘍は、組織形態学、生理学、および組織学を含む観察可能な構造(features)、遺伝子発現、遺伝子型、転移、血管新生、および増殖能に関して、大量の異質性を明確に示す。異質性の指示には、大きさ、形態学、およびタンパク質発現のような特性、ならびに細胞交替、細胞間相互作用、侵襲的および転移的能力、ならびに薬理学的介入に対する感度のような挙動が含まれる。細胞異質性は、臨床転帰に結び付けることもできる。例えば、ある型の癌においては、異質性の増大を癌の進展に結び付けることができる。
【0005】
[0005] 以上のことを念頭において、本出願人は、細胞の同質クラスタを識別し、異なる細胞のクラスタ(例えば、腫瘍細胞のクラスタ)から、生体試料の空間異質性およびインターマーカ異質性メトリックを導き出すシステムならびに方法を開発した。本明細書において更に開示するように、本出願人は、1つの画像において識別した腫瘍または細胞クラスタ(例えば、IHCまたはISHアッセイあるいはH&E画像において染色されたバイオマーカ画像)を少なくとも1つの染色が異なる画像(または一連の異なる染色画像)にマッピングし、次いで識別した腫瘍または細胞クラスタ毎に発現スコア(expression score)を導き出すシステムおよび方法を開発した。ある実施形態では、腫瘍または細胞クラスタ毎に導き出した発現スコアは、クラスタ間発現スコア変動性を記述する代用物の役割を果たす、異質性メトリックまたは異質性スコアを生成するために使用することができる。ある実施形態では、本明細書において開示する技法を多重画像データに応用して、生体試料の試料異質性の1つ以上のメトリックを求めることもできる。加えて、本技法は、異質性を評価して、細胞がそれらの近隣、即ち、1つのクラスタにおける近隣に関して、他のクラスタにおける細胞の空間的編成と比較して、どのように編成されているか評価する。
【0006】
[0006] 本開示の一態様は、細胞クラスタ間の異質性を計算するシステムである。このシステムは、1つ以上のプロセッサと、1つ以上のプロセッサに結合されたメモリであって、コンピュータ実行可能命令を格納するメモリとを備える。コンピュータ実行可能命令が1つ以上のプロセッサによって実行されると、(i)第1染色を有する生体試料(例えば、H&Eで染色された試料、または1つのバイオマーカを求めて染色された試料)の第1画像内において細胞(例えば、腫瘍細胞、リンパ球、間質等)を分類する動作と、(ii)第1画像内において1つ以上の細胞クラスタを識別する動作であって、グラフ理論手法を使用して細胞クラスタを識別する、動作と、(iii)第1画像において識別された1つ以上のクラスタを少なくとも1つの追加画像にマッピングして、写像クラスタ(mapped cluster)が得られるように、第1画像および少なくとも1つの追加画像を共通座標に位置合わせするステップであって、少なくとも1つの追加画像が異なる染色を含む、動作と、(iv)少なくとも1つの追加画像において細胞を検出および分類する動作と、(v)写像クラスタの各々において各染色に対する発現スコアを導き出す動作とを含む動作を、1つ以上のプロセッサに実行させる。
【0007】
ある実施形態では、このシステムは、更に、導き出した発現スコアに基づいて1つ以上のインターマーカ異質性スコアを計算する命令を含む。ある実施形態では、このシステムは、更に、導き出した発現スコアに基づいて、1つ以上の空間異質性スコアを計算する命令を含む。ある実施形態では、このシステムは、更に、異なるクラスタからの発現スコアの変動性を定量化するためにメトリックを計算する命令を含む。ある実施形態では、異なるクラスタからの発現スコアの変動性を定量化するメトリックは、異なるクラスタにわたる発現スコアの平均または加重平均を考慮に入れる。ある実施形態では、第1画像において識別された1つ以上のクラスタを複数の追加画像の各々にマッピングして、写像クラスタが得られるように、第1画像を複数の追加画像に位置合わせする。複数の追加画像の各々は、異なる染色を(または分離チャネル)を含む。
【0008】
[0007] ある実施形態では、細胞クラスタを識別するグラフ理論手法は、(i)細胞の空間隣接行列を構築するステップと、(ii)「コミュニティ・ネットワーク」を検出することによって、細胞の干渉クラスタを識別するステップとを含む。ある実施形態では、細胞の空間隣接行列の構築は、(i)各細胞をグラフにおけるノード/頂点として定めるステップと、(ii)互いに約30から約70ミクロン以内で離間された細胞ノードを接続ノードとして識別するステップと、(iii)2つの接続ノード間のリンクをエッジとして定めるステップと、(iv)全ての細胞/頂点に対して、その接続エッジ情報と共に、隣接行列を構築するステップとを含む。ある実施形態では、細胞の干渉クラスタを識別する手順は、(i)細胞のネットワークにおける全ての既存のエッジの「媒介性」を(本明細書において定めるように)計算するステップと、(ii)最も高い媒介性を有するエッジを除去するステップと、(iii)この除去によって影響を受けた全てのエッジの媒介性を再計算するステップと、(iv)エッジがなくなるまでステップ(ii)および(iii)を繰り返すステップとを含む。ある実施形態では、細胞は、腫瘍細胞、間質細胞、またはリンパ球の内少なくとも1つとして分類される。
【0009】
[0008] ある実施形態では、第1画像はH&E画像であり、少なくとも1つの追加画像はバイオマーカ画像(例えば、IHCアッセイまたはISHアッセイにおけるような、特異的バイオマーカを求めて染色された画像)である。勿論、以上で特定したシステムは、単純画像の代わりに1つ以上の多重画像を利用してもよく、これらの実施形態では、多重画像は、更に処理される前に、分離される。入力データの全てが多重画像の形態である場合、位置合わせステップは不要である。ある実施形態では、このシステムは、更に、1つ以上の細胞クラスタの識別の前に、画像における腫瘍および腫瘍外周領域に電子的に注釈を付ける命令も含む。
【0010】
[0009] 本開示の他の態様は、クラスタ間細胞異質性に関連する1つ以上のメトリックを導き出すための非一時的コンピュータ読み取り可能媒体であり、(i)第1染色を有する第1画像から特徴を抽出する動作であって、抽出された特徴が、第1画像内において細胞を分類するために使用される、動作と、(ii)細胞分類に基づいて第1画像内において1つ以上の細胞クラスタを識別する動作であって、細胞クラスタが、(a)隣接行列を構築し、(b)コミュニティ・ネットワーク・アルゴリズムを使用して細胞の干渉クラスタを識別することによって、識別される、動作と、(iii)第1画像において識別された1つ以上のクラスタを少なくとも1つの追加画像にマッピングして、写像クラスタが得られるように、第1画像および少なくとも1つの追加画像を共通座標系に位置合わせする動作であって、少なくとも1つの追加画像が異なる染色を含む、動作と、(iv)少なくとも1つの追加画像において細胞を検出および分類する動作と、(v)写像クラスタの各々において各染色に対する発現スコアを導き出す動作とを含む。
【0011】
[0010] ある実施形態では、非一時的コンピュータ読み取り可能媒体は、導き出した発現スコア、即ち、発現スコア・ベクトルの変動性に基づいて、インターマーカ異質性スコアを計算する命令を含む。ある実施形態では、非一時的コンピュータ読み取り可能媒体は、各染色画像における発現スコアの変動性を反映するために空間異質性を計算し、各写像クラスタの発現スコア・ベクトルを、写像クラスタの複数の染色からの発現スコアとして考慮し、導き出した発現スコア・ベクトルの変動性に基づいて、インターマーカ異質性スコアを計算する命令を含む。
【0012】
[0011] ある実施形態では、非一時的コンピュータ読み取り可能媒体は、更に、隣接行列を構築する命令を含み、この命令は、(a)細胞ノードを判定し、(b)ノードの対間にエッジを確定する命令を含む。ある実施形態では、この非一時的コンピュータ読み取り可能媒体は、更に、細胞の干渉クラスタを識別する命令を含み、この命令は、(i)細胞のネットワークにおける全ての既存のエッジの「媒介性」を計算する命令と、(ii)最も高い媒介性を有するエッジを除去する命令と、(iii)この除去によって影響を受けた全てのエッジの媒介性を再計算する命令と、(iv)エッジがなくなるまでステップ(ii)および(iii)を繰り返す命令とを含む。ある実施形態では、この非一時的コンピュータ読み取り可能媒体は、更に、互いに約50ミクロン以内に位置する細胞ノードを識別する命令を含む。
【0013】
[0012] ある実施形態では、非一時的コンピュータ読み取り可能媒体は、更に、少なくとも1つの追加画像の第1画像の座標系への変換を計算する命令を含む。ある実施形態では、非一時的コンピュータ読み取り可能媒体は、更に、1つ以上のインターマーカ異質性スコアを計算する命令を含み、この命令が、生体試料からの全ての染色スライドのバイオマーカスコアからの導き出された複数の発現スコア間において標準偏差を計算する命令を含む。ある実施形態では、このシステムは、更に、第1画像をH&Eで染色する命令を含む。ある実施形態では、前記少なくとも1つの追加画像が、バイオマーカの存在を求めて染色される。ある実施形態では、このシステムは、更に、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、Ki-67、およびヒト上皮成長因子受容体2(HER2)から成る一群からバイオマーカを選択する命令を含む。ある実施形態では、このシステムは、更に、PD-L1、CD3、およびCD8から成る一群からバイオマーカを選択される命令を含む。
【0014】
[0013] 本開示の他の態様は、インターマーカ異質性スコアを計算する方法であり、(a)第1染色を有する第1画像内において細胞を分類するステップと、(b)細胞分類結果に基づいて第1画像において空間的同質細胞クラスタを識別するステップと、(c)識別した空間的同質クラスタを第1画像から少なくとも1つの追加画像にマッピングして、各画像において写像クラスタを得るステップであって、少なくとも1つの追加画像が異なる染色を有する、ステップと、(d)追加染色画像の各々において細胞を検出および分類するステップと、(e)第1画像における各クラスタにおいて、更に少なくとも1つの追加画像における各写像クラスタにおいて、各染色に対する発現スコアを導き出すステップと、(f)1つ以上のインターマーカ異質性メトリックを計算するステップとを含む。この方法は、本明細書において注記するように、単純画像に加えてまたは単純画像の代わりに、多重画像を使用するように構成することもできる。
【0015】
[0014] ある実施形態では、第1画像において空間同質細胞クラスタを識別するステップは、(i)空間隣接行列を構築するステップと、(ii)コミュニティ・ネットワーク・アルゴリズムを使用して細胞の干渉クラスタを識別するステップとを含む。ある実施形態では、検出した細胞の空間隣接行列を構築するステップは、検出した細胞をノードとして示すステップと、(ii)ノード/細胞/頂点毎に接続ノードおよび関連エッジを識別するステップと、(iii)隣接行列を構築するステップとを含む。ある実施形態では、クラスタを識別するコミュニティ・ネットワーク・アルゴリズムは、繰り返しエッジを除去し、各除去の後に「媒介性」尺度を再計算する。ある実施形態では、コミュニティ・ネットワーク・アルゴリズムはスペクトル・クラスタリング技法を利用する。ある実施形態では、識別した空間的同質クラスタを第1画像から少なくとも1つの追加画像にマッピングするステップは、少なくとも1つの画像の第1画像の座標系への変換を計算するステップを含む。
【0016】
[0015] ある実施形態では、第1画像はH&Eで染色される。ある実施形態では、少なくとも1つの追加画像は、バイオマーカの存在を求めて染色される。ある実施形態では、バイオマーカは、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、Ki-67、およびヒト上皮成長因子受容体2(HER2)から成る一群から選択される。ある実施形態では、バイオマーカはPD-L1、CD3、およびCD8から成る一群から選択される。ある実施形態では、発現スコアは、陽性率およびH-スコアから成る一群から選択される。ある実施形態では、1つ以上のインターマーカ異質性スコアの計算は、識別された異なるクラスタに跨がる複数のバイオマーカにわたって導き出された複数の発現スコア間において標準偏差を計算するステップを含む。ある実施形態では、異質性メトリックは、1つ以上のクラスタに跨がって取り込まれた正規化H-スコアである。ある実施形態では、細胞は少なくとも腫瘍細胞として分類され、識別された空間同質細胞クラスタの少なくとも一部は腫瘍細胞のクラスタである。
【0017】
[0016] ある実施形態では、少なくとも1つの追加画像は単純画像である。ある実施形態では、各々単純画像である複数の追加画像を供給する。ある実施形態では、少なくとも1つの追加画像は、多重画像から導き出される分離画像チャネル画像である。ある実施形態では、前述の方法は、更に、入力画像の一部に、更なる分析のために、注釈を付けるステップを含む。
【図面の簡単な説明】
【0018】
[0017] 本開示の特徴を総合的に理解するために、図面を参照する。図面において、同様の参照番号は、全体を通じて、同じ要素を識別するために使用される。
図1図1は、ある実施形態による、画像取得デバイスおよびコンピュータ・システムを含む代表的なディジタル病理学システムを示す。
図2図2は、ある実施形態にしたがって、ディジタル病理学システムまたはディジタル病理学ワークフロー内において利用することができる種々のモジュールについて説明する。
図3A図3Aは、ある実施形態にしたがって、1つ以上の単純画像から空間異質性メトリックを導き出すステップの全体像を示す。
図3B図3Bは、ある実施形態にしたがって、多重画像から空間異質性メトリックを導き出すステップの全体像を示す。
図4A図4Aは、ある実施形態による領域選択のステップを表すフロー・チャートを示す。
図4B図4Bは、ある実施形態にしたがって、ホール・スライド画像において組織をマスキングする方法を説明する。
図5図5は、ある実施形態にしたがって細胞クラスタを識別するステップの全体像を示す。
図6図6は、ある実施形態にしたがって、多重画像(multiple image)を共通座標系に位置合わせするステップを示す。
図7A図7Aは、ホール・スライド画像内において識別された腫瘍を示す。
図7B図7Bは、種々の識別された細胞クラスタを示す。
図8A図8Aは、ホール・スライド画像内において識別された腫瘍を示す。
図8B図8Bは、種々の識別された細胞クラスタを示す。
図9A図9Aは、ホール・スライド画像内において識別された腫瘍を示す。
図9B図9Bは、種々の識別された細胞クラスタを示す。
図10A図10Aは、ホール・スライド画像内において識別された腫瘍を示す。
図10B図10Bは、種々の識別された細胞クラスタを示す。
【発明を実施するための形態】
【0019】
[0034] ここで特許請求する方法において、明らかに逆のことが示されていない限り、1つよりも多いステップまたはアクトを含むものはいずれも、その方法のステップまたはアクトの順序は、その方法のステップまたはアクトが請求項に記載された順序には必ずしも限定されないことも理解されてしかるべきである。
【0020】
[0035] 本明細書において使用する場合、「1つの」(a)、「1つの」(an)および「その1つ」(the)という単数形には、文脈が明らかにそうでないことを示さない限り、複数の指示対象(referent)が含まれる。同様に、「または」(or)という語には、文脈が明らかにそうでないことを示さない限り、「および」(and)を含むことを意図している。「含む」(include)という用語は、「AまたはBを含む」がA、B、またはAおよびBを含むことを意味するように、包含的に定義される。
【0021】
[0036] 本明細書および請求項において使用する場合、「または」(or)は、先に定めたように、「および/または」(and/or)と同じ意味を有すると理解されてしかるべきである。例えば、リストにおける項目を分けるとき、「または」または「および/または」は包含的に解釈され、即ち、少なくとも1つを含むだけでなく、複数の要素または要素のリストの中の1つよりも多くを含み、更に任意に追加のリストに入っていない項目も含むものとする。「1つだけ」(only one of)または「正確に1つ」(exactly one of)、あるいは請求項において使用されるときの「から成る」(consisting of)というような、明らかに逆を示す用語だけが、複数の要素または要素のリストからの正確に1つの要素を含むことを意味する。一般に、「または」(or)という用語は、本明細書において使用する場合、「いずれか」(either)、「~の内の1つ」(one of)、「~の内の1つだけ」(only one of)、または「正確に1つ」(exactly one of)というような除外の用語が先立つときにのみ、排他的代替(exclusive alternatives)(即ち、「一方または他方であるが、双方ではない」)を示すように解釈されるものとする。「本質的に~から成る」(consisting essentialy of)が請求項において使用される場合、特許法の分野において使用されるその通常の意味を有するものとする。
【0022】
[0037] 「備えている」(comprising)および「含んでいる」(including)、「有している」(having)等の用語は、相互交換可能に使用され、同じ意味を有するものとする。同様に、「備える」(comprises)、「含む」(includes)、「有する」(has)等も相互交換可能に使用され、同じ意味を有するものとする。具体的には、これらの用語の各々は、「備える」(comprising)の一般的な米国特許法の定義と一貫して定められ、したがって「少なくとも以下のこと」を意味する開いた用語であると解釈され、更に追加の特徴、制限、態様等を除外しないように解釈されるものとする。したがって、例えば、「コンポーネントa、b、およびcを有するデバイス」(a device having components a, b, and c)とは、そのデバイスが少なくともコンポーネントa、b、およびcを含むことを意味する。同様に、「ステップa、b、およびcを伴う方法」という語句は、この方法が少なくともステップa、b、およびcを含むことを意味する。更に、ステップおよびプロセスが本明細書において特定の順序で概要が述べられることもあるが、ステップおよびプロセスの順序付けは異なっても良いことは当業者には認められよう。
【0023】
[0038] 本明細書および請求項において使用する場合、1つ以上の要素のリストに言及するときにおける「少なくとも1つの」(at least one)という語句は、複数の要素からなるリストにおける要素の中の任意の1つ以上から選択される少なくとも1つの要素を意味するが、要素のリスト内に具体的に挙げられた全ての要素のうちの少なく1つを必ずしも含むとは限らず、要素のリストの中の要素の任意の組み合わせを排除するものではないことを意味すると理解されるものとする。この定義は、具体的に特定されたそれらの要素に関連していても関連していなくても、要素が、「少なくとも1つの」という語句が指す要素のリスト内で具体的に特定される要素以外に随意に存在してもよいことも可能にする。したがって、非限定的な例として、「AおよびBのうちの少なくとも1つ」(または、同じ意味合いで、「AまたはBのうちの少なくとも1つ」、または均等に「Aおよび/またはBのうちの少なくとも1つ」)は、一実施形態では、Bは存在せず2つ以上のAを随意に含む(およびB以外の要素を随意に含む)少なくとも1つを指すことができ、他の実施形態では、Aは存在せず2つ以上のBを随意に含む(およびA以外の要素を随意に含む)少なくとも1つを指すことができ、更に他の実施形態では、2つ以上のAを随意に含む少なくとも1つ、および2つ以上のBを随意に含む(および他の要素を随意に含む)少なくとも1つなどを指すことができる。
【0024】
[0039] 本明細書において使用する場合、「媒介性」(betweenness)という用語は、グラフ内の頂点の中心性尺度(centrality measure)を意味する。媒介性の中心性は、あるノードが2つの他のノードの間にある最短経路に沿ってブリッジとして作用する回数を定量化する。したがって、媒介性の概念は、本質的には、所与のネットワークにおける任意のノードの中心性を測定するメトリックである。これは、ノードが他のノードに達するために所与のノードを必要とする回数として、緩く特徴化することもできる。実際には、対象のノードを通過するノード対間にある最短経路の端数として計算されるのが通常である。
【0025】
[0040] 本明細書において使用する場合、「生体試料」または「組織試料」という用語は、ウィルスを含む任意の有機体から得られる生体分子(たんぱく質、ペプチド、核酸、脂質、炭水化物、またはそれらの組み合わせというような)を含む任意の試料を指す。有機体の他の例には、哺乳類(人間;猫、犬、馬、牛、豚などの家畜動物;およびマウス、ラット、霊長類等の実験動物というような)、昆虫、環形動物、クモ形類動物、有袋類、爬虫類、両生類、バクテリア、真菌があげられる。生体試料には、 組織試料(組織切片および組織の針生検というような)、 細胞試料(パップ・スメアまたは血液塗抹標本、または顕微解剖によって得られた細胞の試料などの細胞学的塗抹標というような)、または細胞分画、断片、もしくは細胞小器官(細胞を溶解させ、遠心分離機または別の方法によってそれらの成分を分離することによって得られるような)があげられる。 生体試料の他の例には、血液、血清、尿、精液、排泄物、脳脊髄液、間質液、粘液、涙、汗、膿、 生検組織(例えば、外科生検または針生検によって得られる)、乳頭吸引液、耳垢、乳汁、膣液、唾液、 スワブ(口腔スワブのような)、または第1の生体試料から得られる生体分子を含む任意の物質があげられる。特定の実施形態では、本明細書において使用する用語「生体試料」は、被験者から得られる腫瘍またはその一部から調製される(均質化または液化された試料などの)試料を指す。
【0026】
[0041] 本明細書において使用する場合、「バイオマーカ」(biomarker)または「マーカ」(marker)とは、何らかの生物学的状態または条件の測定可能な指標である。具体的には、バイオマーカは、特異的に染色することができ、細胞の生物学的特徴、例えば、細胞の型または細胞の生理学的状態を示す、タンパク質またはペプチド、例えば、表面タンパク質であってもよい。免疫細胞マーカとは、ほ乳類の免疫応答に関係する特徴(feature)を選択的に示すバイオマーカである。バイオマーカは、ある疾病または状態に対する処置に対して、あるいは被験者がある疾病または状態に仕向けられた(predispose)場合に、どのように身体が反応するか判定するために使用することもできる。癌のコンテキストでは、バイオマーカは身体における癌の存在を示す生体物質を指す。バイオマーカは、腫瘍、または癌の存在に対する身体の特異的反応によって分泌される分子であってもよい。遺伝学的、後成学的、プロテオーム(proteomic)、糖鎖生物学的、および撮像バイオマーカを、癌の診断、予後、および疫学に使用することができる。このようなバイオマーカは、非侵襲的に収集された血液または血清のような生体液において分析試験する(assay)ことができる。様々な遺伝子およびタンパク質系バイオマーカが既に患者看護において使用されており、AFP(肝臓癌)、BCR-ABL(慢性骨髄性白血病)、BRCA1/ BRCA2(乳/卵巣癌)、BRAFV600E(黒色腫/大腸癌)、CA-125(卵巣癌)、CA19.9(膵臓癌)、CEA(大腸癌)、EGFR(非小細胞性肺癌)、HER-2(乳癌)、KIT(消化管間質腫瘍)、PSA(前立腺特異抗原)、S100(黒色腫)、およびその他数多くが含まれるが、これらに限定されるのではない。バイオマーカは、診断(早期癌を確認するため)および/または予後(
癌がどのくらい攻撃的か予想するため、および/または被験者が特定の処置に対してどのように反応するか予測するため、および/または癌が再発する可能性がどれくらい高いか予測するため)としても有用であるのはもっともである。
【0027】
[0042] 本明細書において使用する場合、「コミュニティ」(community)という用語は、ノード間の接続が、残りのネットワークとの接続よりも密になるような、グラフにおけるノード(例えば、細胞または細胞ノード)の部分集合と定義されてもよい。ネットワークにおけるコミュニティ構造の検出は、一般には、ネットワークをツリーにマッピングする手順として意図される。このツリー(社会科学では樹形図と呼ばれる)において、リーブがノードになり、一方ブランチはノードまたは(上位レベルの)ノードの集合体を繋ぎ合わせ、こうして互いにネスト状になったコミュニティの階層構造を同定する。このマッピングを実行するためにアルゴリズムを使用してもよい。従前からの方法に、いわゆる階層クラスタリング(Wasserman, S. & Faust, K. (1994) Social Network Analysis(社会ネットワーク分析) (Cambridge Univ. Press, Cambridge, U.K.を参照のこと)がある。ネットワークにおけるノードの対i,j毎に、重みWi,jを計算する。重みは、頂点がどの位接近して接続されているかを表す(measure)。全てのノードがありエッジがない集合から開始して、重みが大きい順に、ノードの対間にリンクを繰り返し追加する。このように、ノードを纏めてもっと大きなコミュニティを作って行き、ツリーをルートまで張り巡らせて(built up to)、ネットワーク全体を表す。この種のアルゴリズムを凝縮型(agglomerative)と呼ぶ。分裂型(divisive)と呼ばれる他のアルゴリズムのクラスでは、ツリーの構築の順序が逆になる。まずグラフ全体から開始して、繰り返しエッジを切断していき、こうしてネットワークを徐々に小さく切断されたサブネットワークに分割していく。これらのサブネットワークがコミュニティとして識別される。分裂型アルゴリズムにおける重要な点は、切断するエッジの選択であり、コミュニティを接続するエッジでなければならず、コミュニティ内にあるエッジではない。最近になって、Girvan and Newman (GN)が紹介した分裂型アルゴリズムでは、切断すべきエッジの選択が、それらの「エッジ媒介性」(edge betweenness)の値に基づいている(Girvan, M. & Newman, M. E. J. (2002) Proc. Natl. Acad. Sci. USA 99, 7821-7826を参照のこと)。中心性媒介の一般化は、Anthonisse(Anthonisse, J. M. (1971) Technical Report BN 971 (Stichting Mathematisch Centrum, Amsterdam)を参照のこと)およびFreeman(Freeman, F. (1977) Sociometry 40, 35-41を参照のこと)によって紹介されている。ネットワークにおける全てのノード対間において、最短経路を考える。エッジの媒介性とは、それを縦貫する(running through)経路の本数である。尚、グラフが、密結合され、緩く相互接続されたクラスタで作られるとき、異なるクラスタ内のノード間における全ての最短経路は、数個のクラスタ間接続を通るはずであり(have to)、したがって大きな媒介性の値を有することは明らかである。GN検出アルゴリズムの1つのステップは、グラフにおける全てのエッジに対するエッジ媒介性の計算、および最も高いスコアを有するそれらの削除から成る。この手順を繰り返すことにより、ネットワークを、切断されたサブグラフに分割し、グラフ全体が分割されて1組の分離されたノードになるまで、それぞれのサブグラフに同じ手順が行われる。このようにして、ルートからリーブまで樹形図を構築する。
【0028】
[0043] 本明細書において使用する場合、「エストロゲン受容体」(estrogen receptor)またはその略語「ER」は、17-β-エストラジオル(17-beta-estradiol)によって活性化される細胞間受容体の核ホルモン族のメンバーを指す。エストロゲン受容体は、乳癌の事例の約70%において過剰発現され、「ER陽性」(ER+)と呼ばれる。
【0029】
[0044] 本明細書において使用する場合、「視野(FOV)」(field of view)という用語は、所定の大きさおよび/または形状を有する画像部分を指す。ある実施形態では、FOVは、更なる手動または自動検査および分析に使用されるディジタル画像における領域である。FOVは、ディジタル画像のいくつかの特徴を分析することによって、例えば、ディジタル画像の画素の強度値を評価することによって、自動的にまたは手作業で選択することができる。
【0030】
[0045] 本明細書において使用する場合、「異質性スコア」(heterogeneity score)という用語は、乳癌試料におけるER、HER2、Ki-67、またはPR染色というような、試料におけるバイオマーカのタンパク質発現異質性の量の指示を指す。異質性スコアは、同じマーカに対して、1つの細胞クラスタが他の細胞クラスタとどのくらい異なるかの尺度を与える。
【0031】
[0046] 本明細書において使用する場合、「H-スコア」(H-score)という用語は、弱く染色された細胞よりも、強く染色された細胞に重く重み付けする、タンパク質発現の指示を指す。例えば、H-スコアは、弱く染色する細胞の割合(例えば、1+)を示し、普通に染色する細胞の割合を2倍にして(例えば、2+)示し、強く染色する細胞の割合を3倍にして(例えば、3+)示すことができる(例えば、Cuzick et al , J. Clin. Oneal. 29:4273-8, 2011を参照のこと。この文献をここで引用したことにより、その内容が本願にも含まれるものとする)。
【0032】
[0047] 本明細書において使用する場合、「画像データ」(image data)という用語は、光センサ、センサ・アレイ、または前処理された画像データによってというようにして、生体組織試料から取得された生画像データを包含する。具体的には、画像データは画素行列を含んでもよい。本明細書において使用する場合、「免疫組織化学」(immunohistochemistry)は、抗原と、抗体のような、特異的結合剤との相互作用を検出することによって、試料における抗原の存在または分布を判定する方法を指す。抗体-抗原結合を許容する条件の下で、試料を抗体と接触させる。抗体-抗原結合は、抗体にコンジュゲートされた検出可能な標識によって(直接検出)、または一次抗体に特異的に結合する二次抗体にコンジュゲートされた検出可能な標識によって(間接検出)検出することができる。
【0033】
[0048] 本明細書において使用する場合、「Ki-67」は、細胞増殖およびリボソームRNA転記に関連する核タンパク質を指す。抗原Ki-67の不活性化により、リボゾームRNA合成の阻害に至る。Ki-67は、例えば、増殖のマーカとして使用される。
【0034】
[0049] 本明細書において使用する場合、「マスク」(mask)という用語は、ディジタル画像の派生物を指し、マスクにおける各画素が二進値、例えば、「1」または「0」(「真」または「偽」)として表される。ディジタル画像を前記マスクと重ね合わせることにより、二進値の特定の1つのマスク画素にマッピングされるディジタル画像の全ての画素は、ディジタル画像に適用される今後の処理ステップにおいて、隠される、除去されるまたそうでなければ無視される、あるいは除外されることになる。例えば、マスクは、元の画像において閾値よりも高い強度値を有する全ての画素に真を割り当て、それ以外の画素に偽を割り当てることによって、元のディジタル画像から生成することができ、これによって、「偽」にマスキングされた画素と重ね合わされた全ての画素を除外するマスクを作成する。
【0035】
[0050] 本明細書において使用する場合、「マルチチャネル画像」(multi-channel image)または「多重画像」(multiplex image)という用語は、核および組織構造というような異なる生体構造が、特異的な蛍光染料、量子ドット、色原体等によって同時に染色された生体組織試料から得られたディジタル画像を包含する。特異的な蛍光染料、量子ドット、色原体等の各々は、異なるスペクトル帯において蛍光するまたそうでなければ検出可能であり、こうしてマルチチャネル画像のチャネルの1つを構成する。
【0036】
[0051] 本明細書において使用する場合、「プロゲステロン受容体」(progesterone receptor)という用語または「PR」は、プロゲステロンに特異的に結合する細胞内ステロイド受容体を指す。プロゲステロン受容体は、「PR陽性」(PR+)と呼ばれる一部の乳癌の事例において過剰発現される。
【0037】
[0052] 本明細書において使用する場合、「分離画像」(unmixed image)という用語は、マルチチャネル画像の1つのチャネルについて得られる中間値またはスカラー画像を含む。マルチチャネル画像を分離することによって、チャネル毎に1つの分離画像が得られる。
【0038】
[0053] 全体像
[0054] 本開示は、ホール・スライド画像において識別された異なる細胞クラスタ間において、一連のバイオマーカに対して導き出した発現スコア間の変動性(variability)を判定する自動システムおよび方法に関する。ある実施形態では、導き出した発現スコア間の変動性は、インターマーカ異質性メトリックとして導き出されてもよい。
【0039】
[0055] 本開示の少なくともいくつかの実施形態は、1つ以上の一次染料(例えば、ヘマトキシリンおよびエオシン(H&E))および1つ以上の検出プローブ(例えば、試料内にある標的の標識付けを容易にする特異結合エンティティを含有するプローブ)によって染色された組織試料を含む、生体試料からキャプチャされたディジタル画像を分析するためのコンピュータ・システムおよび方法に関する。本明細書における特定例では、特定の組織、および/または特定のマーカ(certain markers)(したがって、疾病)の検出のための特定の染料または検出プローブの適用に言及することもあるが、異なる組織および異なる染料/検出プローブを、異なるマーカおよび異なる疾病を検出するために適用してもよいことは、当業者には認められよう。例えば、特定の開示の中には、乳癌および乳癌用マーカ(例えば、ER、PR、Ki-67)について説明するものもあるが、これらの開示は非限定的な実施形態を表す。
【0040】
[0056] 標本(specimen)を撮像し分析するためのディジタル病理学システム200を図1および図2に示す。ディジタル病理学システム200は、撮像装置12(例えば、標本を支持する顕微鏡スライドをスキャンする手段を有する装置)と、コンピュータ14(または204)とを備えるのでもよく、これによって撮像装置12およびコンピュータを互いに通信可能に結合することができる(例えば、直接、またはネットワーク20を通じて間接的に)。コンピュータ・システム14は、デスクトップ・コンピュータ、ラップトップ・コンピュータ、タブレット等、ディジタル電子回路、ファームウェア、ハードウェア、メモリ201、コンピュータ記憶媒体、コンピュータ・プログラムまたは1組の命令(例えば、プログラムはメモリまたは記憶媒体内に格納される)、プロセッサ(プログラミングされたプロセッサを含む)等を含むことができる。図1に示すコンピューティング・システム14は、ディスプレイ・デバイス16とエンクロージャ18とを有するコンピュータを含んでもよい。コンピュータ・システムは、ディジタル画像を二進形態で(メモリ内、サーバ上、または他のネットワーク接続デバイスにというように、ローカルに)格納することができる。また、ディジタル画像を画素の行列に分割することもできる。画素は、ビット深度によって定められる、1つ以上のビットのディジタル値を含むことができる。他のコンピュータ・デバイスまたはシステムを利用してもよいこと、そして本明細書において説明するコンピュータ・システムは、追加のコンポーネント、例えば、標本アナライザ、顕微鏡、その他の撮像システム、自動スライド調製機材等に通信可能に結合できることは、当業者には認められよう。利用してもよいこれら追加のコンポーネントおよび種々のコンピュータ、ネットワーク等の一部については、本明細書において更に説明する。
【0041】
[0057] 一般に、撮像装置12(または予めスキャンされメモリに格納されている画像を含む他の画像源)は、限定ではなく、1つ以上の画像キャプチャ・デバイスを含むことができる。画像キャプチャ・デバイスは、限定ではなく、カメラ(例えば、アナログ・カメラ、ディジタル・カメラ等)、光学素子(例えば、1つ以上のレンズ、センサ合焦レンズ群、顕微鏡対物レンズ等)、撮像センサ(例えば、電荷結合デバイス(CCD)、相補型金属酸化物半導体(CMOS)撮像センサ等)、写真フィルム等を含むことができる。ディジタルの実施形態では、画像キャプチャ・デバイスは、協働して現場での合焦を可能にする複数のレンズを含むことができる。撮像センサ、例えば、CCDセンサは標本のディジタル画像をキャプチャすることができる。ある実施形態では、撮像装置12は、明視野撮像システム、マルチスペクトル撮像(MSI:multispectral imaging)システム、または蛍光顕微鏡システムである。ディジタル化組織データは、例えば、アリゾナ州TucsonのVENTANA MEDICAL SYSTEMSによるVENTANA iSCAN HTまたはVENTANA DP200というような画像スキャン・システム、あるいは他の適した撮像機材によって生成されてもよい。更に他の撮像デバイスおよびシステムについても、本明細書において更に説明する。撮像装置12によって取得されたディジタル・カラー画像は、通常、原色画素によって構成されることは、当業者には認められよう。各有色画素は、3つのディジタル成分によってコード化され、各成分は同数のビットを含み、各成分は、通常では赤、緑、または青である原色に対応し、「RGB」成分という用語で呼ばれることもある。
【0042】
[0058] 図2は、現在開示しているディジタル病理学システム内において利用される種々のモジュールの全体像を示す。ある実施形態では、ディジタル病理学システムは、コンピュータ・デバイス200またはコンピュータ実装方法を採用する。コンピュータ・デバイス200は、1つ以上のプロセッサ203と少なくとも1つのメモリ201とを有し、少なくとも1つのメモリ201は、1つ以上のプロセッサに、1つ以上のモジュール(例えば、モジュール202、および205から211まで)において命令(または格納されているデータ)を実行させるために、1つ以上のプロセッサによって実行される非一時的コンピュータ読み取り可能命令を格納する。
【0043】
[0059] 図2図3A、および図3Bを参照すると、本開示は取得画像(または1つの多重画像)においてインターマーカ腫瘍異質性を評価するコンピュータ実装方法を提供する。ある実施形態では、この方法は、(a)画像取得モジュール202を実行して単純画像データ(即ち、各々が1つの染色を有する画像)または多重画像データ(即ち、複数の染色を有する画像)を生成する、または受け取るステップ(ステップ300)、(b)光学画像注釈付けモジュール206を実行して、更に分析を行う部分というような画像の一部分、例えば、腫瘍領域あるいは腫瘍周辺領域における免疫辺境を示す部分に電子的に注釈を付けるステップ、(c)入力画像が多重画像である場合、光学分離モジュール205を実行して、多重画像内に存在する1つ以上の染色チャネルに対応する画像チャネル画像を生成するステップ、(d)画像分析モジュール207を実行して、第1入力画像内(即ち、H&E画像、バイオマーカ画像、または分離画像チャネル画像内)における特徴に基づいて細胞または核(腫瘍細胞、間質細胞、リンパ球等のような)を検出および/または分類するステップ、(e)細胞クラスタ識別モジュール208を実行して、腫瘍細胞のクラスタまたは他の対象細胞のクラスタを第1画像において識別するステップ(ステップ310)、(f)入力画像が単純画像である場合、光学位置合わせモジュール209を実行して、識別した腫瘍細胞のクラスタまたは識別した他の対象細胞のクラスタ(例えば、免疫細胞)を第1画像から少なくとも1つの追加画像または複数の追加画像にマッピングするステップ(ステップ320)、(g)採点モジュール210を実行して、識別された各細胞クラスタにおけるバイオマーカ毎に発現スコアを導き出すステップ(ステップ330)、および(h)インターマーカ異質性メトリック生成モジュールを実行して、異なるクラスタにおいて導き出した発現スコア間における変動性を記述するメトリックを導き出すステップ(340)を含んでもよい。
【0044】
[0060] ある実施形態では、少なくとも1つの追加画像(または一連の追加画像)において細胞を検出および/または分類するために画像分析モジュール207も使用し、このステップは第1画像における細胞の検出および/または分類と一緒に(即ち、同時にまたは続いて)実行しても、またはワークフロー中における任意の他の時点で実行してもよい。以上で説明した動作は、ある実施形態では、クラスタ毎に異なる染色からマーカ発現スコアのベクトルを供給することもできる。また、追加のモジュールをワークフローに組み込んでもよいことも、当業者であれば認められよう。本明細書において更に詳しく説明するように、ある実施形態では、何らかのフィルタを取得画像に適用するため、または組織試料内において何らかの組織的および/または形態的構造あるいは特徴を識別するために、画像処理または前処理モジュールを実行してもよい。同様に、対象領域選択モジュールを利用して、分析のために画像の特定の部分を選択してもよい。
【0045】
[0061] 画像取得モジュール
[0062] ある実施形態では、初期ステップとして、そして図2を参照すると、ディジタル病理学システム200は画像取得モジュール202を実行して、1つ以上の染色を有する生体試料の画像または画像データをキャプチャする(即ち、画像は単純画像でも多重画像でもよい)。ある実施形態では、受け取られる画像または取得される画像はRGB画像またはマルチスペクトル画像である。ある実施形態では、キャプチャされた画像はメモリ201に格納される。
【0046】
[0063] 画像または画像データ(本明細書では相互交換可能に使用する)は、撮像装置12を使用し、リアル・タイムでというようにして、取得することもできる。ある実施形態では、画像は、本明細書において注記したように、標本支持顕微鏡スライドの画像データをキャプチャすることができる顕微鏡または他の機材(instrument)から取得される。ある実施形態では、画像は、画像タイルをスキャンすることができる2Dスキャナというような、2Dスキャナを使用して、取得される。あるいは、画像は、既に取得され(例えば、スキャンされ)メモリ201に格納されている画像であってもよい(即ち、更に言うなら、ネットワーク20を通じてサーバから引き出される)。
【0047】
[0064] ある実施形態では、このシステムは少なくとも2つの画像を入力として受け取る。ある実施形態では、入力として受け取られた画像(この場合も、単一または多重画像のいずれか)は、連続する組織切片、即ち、同じ異種移植組織ブロックから導き出された連続切片から導き出される。一般に、入力として受け取られた少なくとも2つの画像は、各々、染色に対応するシグナル(色原体、蛍光体、量子ドット等を含む)を含む。ある実施形態では、これらの画像の内1つは少なくとも1つの一次染料(ヘマトキシリンまたはエオシン)によって染色されており、一方これらの画像の内他方は、IHCアッセイまたはISHアッセイの少なくとも1つにおいて、特異的バイオマーカの識別のために染色されている(本明細書では「バイオマーカ」画像と呼ぶ)。ある実施形態では、これらの画像の内1つはヘマトキシリンおよびエオシンの双方によって染色されており(本明細書では「H&E画像」と呼ぶ)、一方これらの画像の内他方はIHCアッセイまたはISHアッセイの少なくとも1つにおいて、特異的バイオマーカの識別のために染色されている。ある実施形態では、入力画像は多重画像、即ち、当業者には知られている方法にしたがって多重アッセイにおいて複数の異なるマーカに合わせて染色された画像であってもよい。
【0048】
[0065] 典型的な生体試料は、染料を試料に適用する自動染色/アッセイ・プラットフォームにおいて処理される。染色/アッセイ・プラットフォームとしての使用に適した種々の製品が市販されており、その一例にVentana Medical Systems, Inc(アリゾナ州、Tuscon)のDiscovery(商標)製品がある。また、カメラ・プラットフォームは、Ventana Medical Systems,IncのVENTANA iSCAN HTまたはVENTANA DP200スキャナというような明視野顕微鏡、あるいは1つ以上の対物レンズおよびディジタル・イメージャを有する任意の顕微鏡を含んでもよい。異なる波長において画像をキャプチャするための他の技法も使用することができる。染色された生体標本を撮像するのに適した更に他のカメラ・プラットフォームも当技術分野では知られており、Zeiss、Canon、Applied Spectral Imaging等のような会社から市販されており、このようなプラットフォームは、本開示のシステム、方法、および装置における使用のために容易に改造可能である。
【0049】
[0066] 当業者には認められるであろうが、異なる型の核および/または細胞膜バイオマーカを求めて生体試料を染色することもできる。組織構造を染色する方法、および種々の目的に適した染料の選択における指針については、例えば、"Sambrook et al., Molecular Cloning: A Laboratory Manual(分子複製:実験室便覧), Cold Spring Harbor Laboratory Press (1989)" および "Ausubel et al., Current Protocols in Molecular Biology(分子生物学における現在の慣習), Greene Publishing Associates and Wiley-Intersciences (1987)"において論じられている。これらの文献をここで引用したことにより、その開示内容は本願にも含まれるものとする。
【0050】
[0067] 非限定的な一例として、そして乳癌を検出するというコンテキストにおいて、ある実施形態では、エストロゲン受容体マーカ、プロゲステロン受容体マーカ、Ki-67マーカ、またはHER2マーカを含む1つまたは複数のバイオマーカの存在を求めて、IHCアッセイにおいて組織試料を染色する。したがって、ある実施形態では、入力として使用されるバイオマーカ画像は、IHC画像である。IHC画像は、エストロゲン受容体(ER)マーカ、プロゲステロン受容体(PR)マーカ、Ki-67マーカ、またはHER2マーカの内少なくとも1つの存在に対応するシグナル(例えば、 色原体または蛍光体であってもよい染料に対応するシグナル)を含む。ある実施形態では、試料におけるER、HER2、Ki-67、およびPRタンパク質の存在を検出または測定するために、試料を分析することができ、例えば、定性的測定または定量的測定がある。ある実施形態では、ER、HER2、Ki-67、およびPRタンパク質の発現パターンも、本明細書において更に説明するように、異なる腫瘍または細胞クラスタ間においてというような、タンパク質発現の異質性を判定するために使用することができる。ある例では、ER、PR、HER2、およびKi-67に対する抗体がVENTANA Medical Systems, Inc(アリゾナ州、Tucson)から得られる。しかしながら、これらの方法において使用することができる他の抗体、および本明細書において提供されるキットは、Novus Biologicals(コロラド州Littleton)、Santa Cruz biotechnology,Inc.(カリフォルニア州Santa Cruz)、Abeam(マサチューセッツ州Cambridge)、およびInvitrogen(カリフォルニア州Carlsbad)というような他の製造元から市販されれていることは、当業者には認められよう。
【0051】
[0068] 他の非限定的な例として、そして非小細胞肺癌を検出するというコンテキストにおいて、ある実施形態では、PD-L1バイオマーカを含む1つまたは複数のバイオマーカの存在を求めて、IHCアッセイにおいて組織試料を染色する。したがって、ある実施形態では、入力として使用されるバイオマーカ画像は、PD-L1マーカ、CD3マーカ、およびCD8マーカの存在に対応するシグナルを含むIHC画像である。
【0052】
[0069] ある実施形態では、随意に、本明細書において説明するような組織マスキング・モジュールによって入力画像にマスキングする(図4B参照)。ある実施形態では、組織領域だけが画像内に残るように、入力画像をマスキングする。ある実施形態では、非組織領域を組織領域から隠蔽するために、組織領域マスクを生成する。ある実施形態では、組織領域マスクは、組織領域を識別し、背景領域(例えば、ホール・スライド画像において、撮像ソースからの白色だけが存在するところというような、試料がないガラスに対応する領域)を除外することによって作成してもよい。尚、組織領域から非組織領域をマスキングすることに加えて、組織マスキング・モジュールは、必要に応じて、特定の組織型に属すると識別された組織の一部または腫瘍が疑われる領域に属すると識別された組織の一部というような、他の対象領域もマスキングしてもよいことは、当業者には認められよう。ある実施形態では、セグメント化技法を使用して、入力画像において非組織領域から組織領域をマスキングすることによって、組織領域隠蔽画像を生成する。適したセグメント化技法には、先行技術から知られているようなものがある(Digital Image Processing(ディジタル画像処理), Third Edition, Rafael C. Gonzalez, Richard E. Woods, chapter 10, page 689、およびHandbook of Medical Imaging, Processing and Analysis(医療撮像、処理、および分析の便覧), Isaac N. Bankman Academic Press, 2000, chapter 2を参照のこと)。ある実施形態では、画像セグメント化技法を利用して、ディジタル化組織データおよび画像におけるスライド間で区別する。組織は前景に対応し、スライドは背景に対応する。ある実施形態では、対象エリア(AoI)における全ての組織領域を検出しつつ、分析される背景非組織エリアの量を制限するために、前述のコンポーネントがホール・スライド画像においてAoIを計算する。例えば、組織データおよび非組織または背景データの境界を判定するために、広範囲の画像セグメント化技法を使用することができる(例えば、HSVカラー・ベース画像セグメント化、Lab画像セグメント化、平均値シフト・カラー画像セグメント化、領域成長、レベル設定方法、高速進行法(fast marching method)等)。少なくとも部分的にセグメント化に基づいて、前述のコンポーネントは組織前景マスクを生成することもできる。この組織前景マスクは、ディジタル化スライド・データの内、組織データに対応する部分を識別するために使用することができる。あるいは、前述のコンポーネントは、組織データに対応しないディジタル化スライド・データの部分を識別するために使用される背景マスクを生成することもできる。
【0053】
[0070] この識別は、エッジ検出等のような、画像分析処理によって可能にしてもよい。画像における非組織背景ノイズ、例えば、非組織領域を除去するために、組織領域マスクを使用してもよい。ある実施形態では、組織領域マスクの生成は、以下の処理の内1つ以上を含む(しかし、以下の処理に限定されるのではない)。低解像度入力画像の輝度を計算する処理、輝度画像を生成する処理、標準偏差フィルタを輝度画像に適用する処理、フィルタ補正輝度画像(filtered luminance image)を生成する処理、所与の閾値よりも高い輝度を有する画素を1に設定し、閾値よりも低い画素を0に設定するように閾値をフィルタ補正輝度画像に適用する処理、組織領域マスクを生成する処理。組織領域マスクの生成に関する追加情報および例は、"An Image Processing Method and System for Analyzing a Multi-Channel Image Obtained from a Biological Tissue Sample Being Stained by Multiple Stains"(複数の染料によって染色された生体組織試料から得られた多チャンネル画像を分析するための画像処理方法およびシステム)と題するPCT/EP/2015/062015に開示されている。この出願をここで引用したことにより、その開示内容全体が本願にも含まれるものとする。
【0054】
[0071] ある実施形態では、対象領域識別モジュールを使用して、生体試料において、画像または画像データを取得すべき部分を選択してもよい。図4Aは、領域選択のステップを表すフロー・チャートを示す。ステップ420において、領域選択モジュールは、識別された対象領域または視野を受け取る。ある実施形態では、対象領域は本開示のシステムのユーザによって、または本開示のシステムに通信可能に結合された他のシステムのユーザによって識別される。あるいは、そして他の実施形態では、領域選択モジュールは、ストレージ/メモリから対象領域の位置または識別を引き出す。ある実施形態では、ステップ430に示すように、領域選択モジュールは、例えば、PCT/EP/2015/062015に記載された方法によって、視野(FOV)または対象領域(ROI)を自動的に生成する。PCT/EP/2015/062015をここで引用したことにより、その内容全体が本願にも含まれるものとする。ある実施形態では、対象領域は、画像内におけるまたは画像の何らかの所定の判断基準あるいは特性に基づいて、システムによって自動的に判定される(例えば、2つよりも多い染料によって染色された生体試料については、2種類の染色だけを含む画像のエリアを識別する)。ステップ440において、領域選択モジュールはROIを出力する。
【0055】
[0072] 画像の注釈付け
[0073] ある実施形態では、随意に、ユーザ(例えば、病理医のような医療専門家)によって、画像注釈モジュール206を使用して、画像分析に対する注釈が入力画像に付けられる。ある実施形態では、ユーザが、H&E画像またはバイオマーカ画像(例えば、IHCホール画像)から、更なる分析に適した部分(例えば、下位領域)を識別する。スライド・スコアを生成するために注釈が付けられる腫瘍領域または免疫領域は、ディジタル・スライド上の腫瘍領域全体または指定された1組の領域であってもよい。例えば、ある実施形態では、識別された部分は、特異バイオマーカ、例えば、特異IHCマーカの過剰発現腫瘍領域を表す。他の実施形態では、ユーザ、医療専門家、または病理医がH&E画像上で腫瘍領域全体に注釈を付けてもよい。
【0056】
[0074] ある実施形態では、全体的なスライド解釈のために病理学者が使用するバイオマーカ発現を反映するために、注釈付けされた代表的フィールドを病理学者によって選択してもよい。注釈は、ビューア・アプリケーション(例えば、VENTANA VIRTUOSOソフトウェア)に設けられている注釈ツールを使用して描いてもよく(draw)、更に注釈は任意の倍率または解像度で描くこともできる。あるいはまたは加えて、セグメント化、閾値による選別(thresholding)、エッジ検出等のような自動画像分析処理を使用して腫瘍領域または他の領域を自動的に検出するために、画像分析処理を使用してもよく、検出された領域に基づいてFOVを自動的に生成する。
【0057】
[0075] 分離モジュール
[0076] ある実施形態では、入力として受け取られた画像は多重画像であってもよい。即ち、受け取られた画像が、1つよりも多い染料(例えば、ERおよびPR双方を求めて染色された画像)によって染色された生体試料のものでもよい。これらの実施形態では、そして更に処理する前に、多重画像(multiple image)を最初に、分離モジュール205によってというようにして、その構成チャネルに分離する。各分離チャネルは特異的染料またはシグナルに対応する。ある実施形態では、分離画像(「チャネル画像」または「画像チャネル画像」と呼ばれることも多い)が、本明細書において説明する各モジュールに対する入力として使用されてもよい。例えば、インターマーカ異質性は、第1H&E画像、複数の分化マーカのクラスタ(CD3、CD8等)を求めて染色された第2多重画像、および各々特異的バイオマーカ(例えば、ER、PR、Ki67等)を求めて染色された複数の単純画像によって判定されてもよい。この例では、多重画像は最初にその構成チャネル画像に分離され、これらのチャネル画像がH&E画像および複数の単純画像と共に使用され、インターマーカ異質性を判定することができる。
【0058】
[0077] ある実施形態では、1つ以上の染料およびヘマトキシリンを含む試料において、1つ以上の染料およびヘマトキシリンのチャネル毎に個々の画像を生成することができる。いずれの特定の理論にも束縛されることを望むのではないが、これらのチャネルは組織画像において異なる組織構造を強調すると考えられ、このため、これらを構造的画像チャネルと呼んでもよい。ある実施形態では、分離によって少なくともヘマトキシリン画像チャネル画像が得られる。ある実施形態では、ヘマトキシリンの局所量を表し、画像内部における核領域を強調する別個のチャネルに、取得画像を分離する。尚、これらのチャネルから抽出される特徴は、組織のいずれの画像内においても、存在する異なる生体構造を記述するのに有用であることは、当業者には認められよう。
【0059】
[0078] 撮像システム202によって供給されるマルチスペクトル画像は、個々のバイオマーカおよびノイズ成分と関連付けられた基礎スペクトル信号(underlying spectral signal)の加重混合である。任意の特定の画素において、混合重みは、組織内の特定の位置における基礎共存バイオマーカ(co-localized biomarker)のバイオマーカ発現、およびその位置における背景ノイズに比例する。つまり、混合重みは画素毎に異なる。本明細書において開示するスペクトル分離方法(spectral unmixing method)は、各画素におけるマルチチャネル画素値ベクトルを、構成要素であるバイオマーカ端成分の集合体に分解し、バイオマーカの各々について個々の構成染料の割合を推定する。
【0060】
[0079] 分離とは、混合画素の測定されたスペクトルを、構成スペクトルまたは端成分の集合体、および画素内に存在する各端成分の割合を示す1組の対応する端数または存在度に分解する手順である。具体的には、分離プロセスは、染料特異チャネルを抽出して、標準的な型の組織および染色の組み合わせについてよく知られている基準スペクトルを使用して、個々の染色の局所濃度を判定することができる。分離は、対照画像(control image)から検索した基準スペクトル、または観察対象画像から推定した基準スペクトルを使用してもよい。各入力画素の成分信号を分離することによって、H&E画像におけるヘマトキシリン・チャネルおよびエオシン・チャネル、またはIHC画像におけるジアミノベンジジン(DAB)チャネルおよび対比染色(例えば、ヘマトキシリン)チャネルというような、染料特異チャネルの検索および分析が可能になる。「分離」(unmixing)および「カラー・デコンボリューション」(color deconvolution)(または「デコンボリューション」)等の用語(例えば、「デコンボリュートする」、「分離された」)は、当技術分野では相互交換可能に使用される。
【0061】
[0080] ある実施形態では、線形分離(liner unmixing)を使用して、分離モジュール205によって多重画像を分離する。線形分離については、例えば、Zimmermann "Spectral Imaging and Linear Unmixing in Light Microscopy" (光顕微鏡におけるスペクトル撮像および線形分離)Adv Biochem Engin/Biotechnol (2005) 95:245-265'、およびC. L. Lawson and R. J. Hanson, "Solving least squares Problems"(最少二乗問題の解決), PrenticeHall, 1974, Chapter 23, p. 161に記載されている。これらの文献をここで引用したことにより、その内容全体が本願にも含まれるものとする。線形染色分離では、任意の画素において測定されたスペクトル(S(λ))は、染色スペクトル成分の線形混合と見なされ、その画素において発現されている各個々の染色の色基準(R(λ))の割合または重み(A)の合計に等しい。
【0062】
[0081]
【0063】
【数1】
【0064】
[0082] これは、以下のように、行列形態にすると更に一般的に表すことができる。
[0083]
【0065】
【数2】
【0066】
[0084] 取得されたMチャネルの画像と、N種類の個々の染色とがある場合、M×N行列Rの列は、本明細書において導き出されるような最適色空間(optimal color system)であり、N×1ベクトルAは、個々の染料の未知の比率(the unknown of the proportions)であり、M×1ベクトルSは画素において測定されたマルチチャネル・スペクトル・ベクトルである。これらの式において、多重画像の取得中に各画素(S)における信号を測定し、本明細書において説明するように、基準スペクトル、即ち、最適色空間を導き出す。種々の染色(A)の寄与は、測定されたスペクトルにおける各点に対するそれらの寄与を計算することによって決定することができる。ある実施形態では、逆最少二乗当てはめ手法を使用して解を得る。この手法は、以下の1組の式を解くことによって、測定されたスペクトルと計算されたスペクトルとの間の二乗差を最小化する。
【0067】
[0085]
【0068】
【数3】
【0069】
[0086] この式において、jは検出チャネルの数を表し、iは染色の数に等しい。線形方程式を解くとき、合計すると1になることを重み(A)に強制するために、分離の制約を許容することを必要とする場合が多い。
【0070】
[0087] 他の実施形態では、2014年5月28日に出願され、"Image Adaptive Physiologically Plausible Color Separation"(画像適応型生理学的妥当な色分離)と題するWO2014/195193に記載されている方法を使用して、分離を遂行する。この特許出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。概略的に、WO2014/195193は、繰り返し最適化される基準ベクトルを使用して、入力画像の成分信号を分離することによる分離方法について記載する。ある実施形態では、アッセイからの画像データを、アッセイの特性に特異的な予測結果または理想的な結果と相関付けて、品質メトリックを判定する。画質が低い場合、または理想的な結果に対して相関が低い場合、行列Rにおける1つ以上の基準列ベクトルを調節し、調節した基準ベクトルを繰り返し使用して、相関が、生理的および解剖学的要件に一致する高品質の画像を示すまで、分離を繰り返す。解剖学的、生理学的、およびアッセイ情報を使用して、品質メトリックを判定するために測定画像データに適用される規則を定めることができる。この情報は、どのように組織が染色されたか、組織の中のどの構造が染色されることを意図したか、または意図しなかったか、そして構造、染色、および処理されるアッセイに特異的なマーカの間の関係を含む。繰り返しプロセスの結果、染色特異ベクトルが得られ、これらのベクトルは、対象構造を精度高く識別する画像、および生物学的に関連する情報を生成することができ、ノイズや望ましくないスペクトルを全く含まず、したがって分析に適している。関連ベクトルは、検索空間内部で調節される。検索空間は、基準ベクトルが染色を表すために取ることができる値の範囲を定める。既知の問題または共通して起こる問題を含む種々の代表的訓練アッセイをスキャンし、訓練アッセイのために高品質の複数組の基準ベクトルを決定することによって、検索空間を決定することができる。
【0071】
[0088] 他の実施形態では、2015年2月23日に出願され、"Group Sparsity Model for Image Unmixing,"(画像分離用グループ・スパシティ・モデル)と題するWO2015/124772に記載された方法を使用して、分離を遂行する。この特許出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。概略的に、WO2015/124772は、グループ・スパシティ・フレームワークを使用する分離について記載し、複数のコロケーション・マーカ(colocation marker)からの複数の染色寄与の端数が「同じグループ」内でモデル化され、複数の非コロケーション・マーカ (non-colocation marker) からの染色寄与の端数が異なるグループにおいてモデル化され、複数のコロケーション・マーカの共存情報を、モデル化されたグループ・スパシティ・フレームワークに提供し、グループ・ラッソを使用してモデル化されたフレームワークを解いて、各グループ内において最少二乗解を求め、最少二乗解がコロケーション・マーカの分離に対応し、グループ間において、非コロケーション・マーカの分離に対応する疎解を求める。更に、WO2015/124772は、生体組織試料から得られた画像データを入力することによる分離方法について記載し、電子メモリから基準データを読み出し、基準データが複数の染料の各々の染色(stain color)を記述し、電子メモリからコロケーション・データを読み出し、コロケーション・データが染料のグループを記述し、各グループが、生体組織試料において収集することができる染料を含み、各グループがグループ・ラッソ基準のためのグループを形成し、これらのグループの内少なくとも1つが2以上のサイズを有し、基準データを基準行列として使用して分離画像を得るために、グループ・ラッソ基準の解を計算する。ある実施形態では、画像を分離する方法は、グループ・スパシティ・モデルを生成するステップを含んでもよく、共存マーカからの染色寄与の端数が1つのグループ内において割り当てられ、非共存マーカからの染色寄与の端数が別個のグループ内において割り当てられ、分離アルゴリズムを使用してグループ・スパシティ・モデルを解いて、各グループ内において最少二乗解を求める。
【0072】
[0089] 画像分析モジュール
[0090] 画像取得および/または分離に続いて、入力画像または分離画像チャネル画像を画像分析モジュール207内において使用して、細胞および/または核を識別ならびに分類する(ステップ300)。本明細書において説明する手順およびアルゴリズムは、入力画像内部の特徴に基づいて、種々の型の細胞または細胞核を識別および分類するように適合させることもでき、腫瘍細胞、腫瘍以外の細胞、間質細胞、リンパ球、標的以外の染色等を識別および分類することを含む。
【0073】
[0091] 尚、細胞の核、細胞質、および膜は、異なる特性を有すること、そして異なる染色が行われた組織試料は異なる生物学的特徴を明示できることは、当業者には認められよう。実際、特定の細胞表面受容体は、膜に局在化される染色パターン、または細胞質に局在化される染色パターンを有することができることは、当業者には認められよう。つまり、「膜」染色パターンは「細胞質」染色パターンとは分析的に全く異なる。同様に、「細胞質」染色パターンおよび「核」染色パターンも分析的に全く異なる。これら全く異なる染色パターンの各々は、細胞および/または核を識別するための特徴として使用することができる。例えば、間質細胞はFAPによって強く染色され、一方腫瘍上皮細胞はEpCAMによって強く染色され、サイトケラチンはpanCKによって染色されるとして差し支えない。このように、異なる染料を使用することによって、画像分析中に異なる細胞型を差別化および区別して、分類の解(classification solution)を得ることができる。
【0074】
[0092] 1つ以上の染色を有する生体試料の画像において核、細胞膜、および細胞質を識別、分類、および/または採点する方法が、米国特許第7,760,927号(「’927特許」)に記載されている。この特許をここで引用したことにより、その内容全体が本願にも含まれるものとする。例えば、’927特許は、バイオマーカによって染色された生体組織の入力画像において複数の画素を同時に識別するための自動化方法について記載し、この方法は、細胞質および細胞膜画素の同時識別のために入力画像の前景において複数の画素の第1色平面(color plane)を検討するステップであって、入力画像の背景部分を除去し、入力画像の対比染色された成分を除去するために入力画像が処理されている、ステップと、ディジタル画像の背景において細胞質および細胞膜画素間で閾値レベルを決定するステップと、選択した画素が細胞質画素である場合、決定した閾値レベルを使用して、選択された画素と前景からのその8つの近隣とによって同時に、ディジタル画像において細胞膜画素または移行画素(transitional pixel)を判定するステップとを含む。
【0075】
[0093] ある実施形態では、腫瘍核は、第1識別候補核によって自動的に識別され、次いで腫瘍核と非腫瘍核との間で自動的に区別される。組織の画像において候補核を識別する方法は、当技術分野では数多く知られている。例えば、自動候補核検出は、分離後にヘマトキシリン画像チャネルまたはバイオマーカ画像チャネル上でというように、放射相称に基づく方法(radial-symmetry-base method)、Parvinの放射相称に基づく方法を適用することによって、行うことができる(Parvin, Bahram, et al. "Iterative voting for inference of structural saliency and characterization of subcellular events"(細胞内現象の構造的顕著性および特徴付けの推論のための繰り返し投票), Image Processing, IEEE Transactions on 16.3 (2007): 615-623を参照のこと。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする)。
【0076】
[0094] 更に具体的には、ある実施形態では、入力として受け取られた画像は、核中心(シード)を検出する、および/または核をセグメント化するように処理される。例えば、Parvinの技法(先に注記した)を使用して、放射相称投票に基づいて核中心を検出するために、命令を供給してもよい。ある実施形態では、核の中心を検出するために放射相称を使用して核を検出し、次いで細胞中心の周りにおける染色の強度に基づいて核を分類する。ある実施形態では、放射相称に基づく核検出処理は、譲受人が本願と同じである係属中の特許出願WO2014/140085A1に記載されるように使用される。この特許出願をここで引用したことにより、その内容は本願にも含まれるものとする。例えば、画像において画像の強度(magnitude)を計算してもよく、選択した領域内における強度の総和を加算することによって、各画素における1つ以上の投票を蓄積する。領域における局所中心(local center)を発見するために、平均値シフト・クラスタリングを使用してもよく、局所中心は実際の核の位置を表す。放射相称投票に基づく核検出は、カラー画像強度データ上で実行され、核は楕円形状をしたブロブであり、サイズおよび離心率が様々に変化するという先験的領域知識を明確に利用する。これを遂行するために、入力画像における色強度と共に、放射相称投票において画像勾配情報も使用し、適応セグメント化プロセスと組み合わせて、細胞核を正確に検出し位置を突き止める。「勾配」(gradient)とは、本明細書において使用する場合、例えば、特定の画素の周囲にある1組の画素の強度値勾配を考慮に入れることによって、前記特定の画素について計算された画素の強度勾配である。各勾配は、座標系に対して特定の「方位」(orientation)を有することができ、座標軸のx軸およびy軸はディジタル画像の2本の直交するエッジによって定められる。実例をあげると、核シード(nuclei seed)検出は、シードを、細胞核の内側にあると仮定され、細胞核の位置を確認するための開始点として機能する点として定める必要がある。第1ステップは、放射相称に基づく非常にロバストな手法を使用して、各細胞核に関連付けられたシード・ポイント(seed point)を検出し、細胞核に似た構造である楕円形状のブロブを検出することである。放射相称手法は、カーネルに基づく投票手順を使用して、勾配画像上で動作する。投票カーネルによって投票を蓄積する各画素を処理することによって、投票応答行列を作成する。カーネルは、その特定の画素において計算された勾配方向、最少および最大核サイズの予測範囲、ならびに投票カーネル角度(通例では[π/4,π/8]の範囲)に基づく。結果的に得られる投票空間において、予め定められている閾値よりも高い投票値を有する極大位置を、シード・ポイントとして保存する。無関係なシードは、後に、後続のセグメント化または分類プロセスの間に破棄してもよい。他の方法も米国特許出願公開第2017/0140246号において論じられている。この特許出願をここで引用したことにより、その開示内容は本願にも含まれるものとする。
【0077】
[0095] 候補核を識別した後、これらを更に分析して、腫瘍核を他の候補核から区別する。他の候補核を更に分類することもできる(例えば、リンパ球核および間質核を識別することによって)。ある実施形態では、本明細書において更に説明するように、腫瘍核を識別するために、学習監視分類器(learnt supervised classifier)を適用する。例えば、腫瘍核を識別するために、核の特徴について学習監視分類器を訓練し、次いで検査画像において核候補を腫瘍核または非腫瘍核のいずれかとして分類するために適用する。随意に、リンパ球核および間質核のような異なるクラスの非腫瘍核間で区別するために、学習監視分類器を更に訓練することもできる。ある実施形態では、腫瘍核を識別するために使用される学習監視分類器は、ランダム・フォーレスト分類器である。例えば、ランダム・フォーレスト分類器は、(i)腫瘍核および非腫瘍核の訓練集合を作成し、(ii)核毎に特徴を抽出し、(iii)抽出した特徴に基づいて腫瘍核と非腫瘍核との間で区別するようにランダム・フォーレスト分類器を訓練することによって、訓練することができる。次いで、検査画像における核を腫瘍核および非腫瘍核に分類するために、訓練されたランダム・フォーレスト分類器を適用することができる。随意に、リンパ球核および間質核のような非腫瘍核の異なるクラス間で区別するように、ランダム・フォーレスト分類器を更に訓練することもできる。
【0078】
[0096] 当業者に知られている他の技法を使用して、核を識別することもできる。例えば、H&EまたはIHC画像の1つの特定の画像チャネルから画像強度を計算してもよく、指定された強度の周囲にある各画素に、その画素の周囲の領域内における強度の総和に基づく数の投票を割り当てるのでもよい。あるいは、核の実際の位置を表す投票画像内において局所中心を求めるために、平均値シフト・クラスタリング処理を実行してもよい。他の実施形態では、形態学的処理および局所二値化によって、既に分かっている核の中心に基づいて、核全体をセグメント化するために、核セグメント化を使用してもよい。更に他の実施形態では、核を検出するためにモデルに基づくセグメント化を利用してもよい(即ち、訓練データ集合から核の形状モデルを学習させ、これを事前知識として使用して、検査画像における核をセグメント化する)。
【0079】
[0097] ある実施形態では、次いで、核毎に個々に計算された閾値を使用して、核をセグメント化する。例えば、識別された核を中心とする領域におけるセグメント化のために、Otsuの方法を使用してもよい。何故なら、核領域内における画素強度は様々に変化すると考えられるからである。当業者には認められるであろうが、Otsuの方法は、クラス内分散を最小化することによって最適な閾値を決定するために使用され、当業者には知られている。更に具体的には、Otsuの方法は、クラスタリングに基づく画像二値化、または中間色画像の二進画像への減退(reduction)を自動的に実行するために使用される。このアルゴリズムは、画像がバイモダル・ヒストグラムに従う2つのクラスの画素(前景画素および背景画素)を含むことを仮定する。次いで、2つのクラスの複合拡散(combined spread)(クラス内分散)が最小または同等(対毎の二乗距離の和は一定になるので)になり、それらのクラス間分散が最大になるように、2つのクラスを分離する最適閾値を計算する。
【0080】
[0098] ある実施形態では、本システムおよび方法は、更に、非腫瘍細胞の核を識別するために、画像において識別された核のスペクトル特徴および/または形状特徴を自動的に分析するステップを含む。例えば、第1ステップにおいて第1ディジタル画像においてブロブを識別するのでもよい。「ブロブ」(blob)とは、本明細書において使用する場合、例えば、ディジタル画像において何らかのプロパティ、例えば、強度またはグレー値が一定であるか、あるいは予め定められた値の範囲以内で変化する領域とすることができる。ブロブにおける全ての画素は、ある意味では、互いに同様であると見なすことができる。例えば、ディジタル画像上の位置の関数の導関数に基づく微分法、および極値に基づく方法を使用して、ブロブを識別することもできる。核ブロブとは、ブロブがおそらく第1染料によって染色された核によって生成されたことを画素および/または輪郭形状が示すブロブである。例えば、ブロブの放射相称を評価すると、このブロブを核ブロブとして識別すべきか、または任意の他の構造、例えば、染色アーチファクトとして識別すべきか判定することができる。例えば、ブロブが長い形状を有し放射相称でない場合、前記ブロブは核ブロブと識別することはできず、むしろ染色アーチファクトと識別すればよい。実施形態によっては、「核ブロブ」であると識別されるブロブは、候補核として識別された1組の画素を表すことができ、前記核ブロブが核を表すか否か判定するために、更に分析することができる。ある実施形態では、任意の種類の核ブロブを直接「識別された核」として使用する。ある実施形態では、バイオマーカ-陽性腫瘍細胞(biomarker-positive tumor cell)に属さない核を識別するため、そして前記識別された非腫瘍核を、既に識別されている核のリストから除去する、または識別された核のリストに前記核を最初から追加しないために、識別された核または核ブロブに対してフィルタリング処理を適用する。例えば、識別された核ブロブの追加スペクトルおよび/または形状特徴を分析して、核または核ブロブが腫瘍細胞の核であるか否か判定することができる。例えば、リンパ球の核は、他の組織細胞、例えば、肺細胞の核よりも大きい。腫瘍細胞が肺組織から得られた場合、最小サイズ、または直径が平均サイズよりも、または通常の肺細胞核の直径よりも著しく大きい全ての核ブロブを識別することによって、リンパ球の核を識別する。識別された核ブロブがリンパ球の核に関係する場合、既に識別されている核の集合から除去すればよい(即ち、「から排除する」(filtered out from))。非腫瘍細胞の核を排除することによって、本方法の精度を高めることができる。バイオマーカによっては、非腫瘍細胞もバイオマーカをある程度発現させることがあり、したがって、腫瘍細胞から由来しない第1ディジタル画像において強度信号を生成することができる。既に識別されている核の全体から腫瘍細胞に属さない核を識別して排除することによって、バイオマーカ-陽性腫瘍細胞を識別する精度を高めることができる。これらおよびその他の方法は、米国特許出願公開2017/0103521に記載されており、この特許出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。ある実施形態では、一旦シードが検出されたなら、局所適応二値化方法(locally adaptive thresholding method)を使用してもよく、検出された中心の周囲にブロブを作成する。ある実施形態では、検出された核中心の周囲で核ブロブを識別するために、マーカに基づく分水嶺アルゴリズム(watershed algorithm)を使用することができるというように、他の方法も組み込むことができる。これらおよびその他の方法は、WO2016/120442として公開された同時係属中の出願PCT/EP2016/051906に記載されている。この出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。
【0081】
[0099] 核の検出に続いて、入力画像内部から特徴(またはメトリック)を導き出す。核特徴からのメトリックの導出は、当技術分野ではよく知られており、任意の既知の核特徴を、本開示のコンテキストにおいて使用してもよい。計算することができるメトリックの非限定的な例には、以下が含まれる。
【0082】
[0100](A)形態学的特徴から導き出されるメトリック
[0101] 「形態学的特徴」(morphology feature)とは、本明細書において使用する場合、例えば、核の形状または寸法を示す特徴である。いずれの特定の理論にも束縛されることを望むのではないが、形態学的特徴は細胞またはその核の大きさおよび形状についていくつかの極めて重要な情報を提供すると考えられる。例えば、形態学的特徴は、核ブロブまたはシード内に含まれるあるいはそれを取り囲む画素に対して種々の画像分析アルゴリズムを適用することによって計算することができる。ある実施形態では、形態学的特徴は、面積、短軸および長軸の長さ、外周、半径、中実であること(solidity)等を含む。細胞レベルでは、このような特徴は、核を健康な細胞または罹患された細胞に属するものとして分類するために使用される。組織レベルでは、組織全体におけるこれらの特徴の統計が、組織が罹患されているか否かの分類において利用される。
【0083】
[0102](B)外観的特徴から導き出されるメトリック
[0103] 「外観的特徴」(appearance feature)とは、本明細書において使用する場合、例えば、核を識別するために使用される核ブロブまたはシード内に含まれるあるいはそれを取り囲む画素の画素強度値を比較することによって、特定の核について計算される特徴であり、これによって、異なる画像チャネル(例えば、背景チャネル、バイオマーカの染色のためのチャネル等)から、比較画素強度(compared pixel intensities)が導き出される。ある実施形態では、外観的特徴から導き出されるメトリックは、異なる画像チャネルから計算される画素強度(pixel intensities)および勾配強度(gradient magnitudes)のパーセンタイル値(例えば、10、50,および95パーセンタイル値)から計算される。例えば、最初に、対象の核を表す核ブロブ内にある複数ICの画像チャネル(例えば、3つのチャネル:HTX、DAB、輝度)の各々の画素値のX-パーセンタイル値(X=10、50、95)の数Pを特定する。外観的特徴メトリックを計算することは、有利であると言える。何故なら、導かれるメトリックは、核領域のプロパティを記述することができ、更に、核を取り囲む膜領域を記述することができるからである。
【0084】
[0104] (C)背景特徴から導き出されるメトリック
[0105] 「背景特徴」(background feature)とは、例えば、細胞質における外観および/または染料の存在を示す特徴、ならびに核を含む細胞の細胞膜の特徴であり、背景特徴はこれらを求めて画像から抽出されたものである。背景特徴および対応するメトリックは、例えば、核ブロブまたは核を表すシードを識別し、識別された1組の細胞に直接隣接する画素エリア(例えば、核ブロブ境界周囲の厚さ20画素、即ち、約9ミクロンの帯状体)を分析し、したがって、この核がある細胞の外観ならびに細胞質および膜における染料の存在を、細胞に直接隣接するエリアと共にキャプチャすることによって、ディジタル画像内に描写される核および対応する細胞について計算することができる。これらのメトリックは、核の外観的特徴に似ているが、各核の境界周囲の約20画素(約9ミクロン)の厚さの帯状体において計算され、したがって、識別された核を有する細胞の外観、ならびに細胞質および膜における染料の存在が、この細胞に直接隣接するエリアと共に、キャプチャされる。いずれの特定の理論にも束縛されることを望むのではないが、この帯状体のサイズを選択したのは、核を取り囲む十分な量の背景組織エリアをキャプチャし、核の差別について有用な情報を提供するために使用することができると考えられるからである。これらの特徴は、J. Kong, et al., "A comprehensive framework for classification of nuclei in digital microscopy imaging: An application to diffuse gliomas"(ディジタル顕微鏡撮像における核の分類のための総合的フレームワーク:びまん性神経膠腫に対する応用)in ISBI, 2011, pp.2128-2131によって開示されたものと同様である。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする。尚、これらの特徴は、周囲の組織が間質かまたは上皮か判定するために使用できると考えられる(H&E染色組織試料におけるように)。いずれの特定の理論にも束縛されることを望むのではないが、これらの背景特徴は、膜染色パターンもキャプチャし、膜染色パターンは、組織試料がしかるべき膜染色剤によって染色されるときに有用であると考えられる。
【0085】
[0106] (D)色から導かれるメトリック
[0107] ある実施形態では、色から導き出されるメトリックには、色比率、R/(R+G+B)、または色の主成分が含まれる。他の実施形態では、色から導き出されるメトリックには、色の各々の局所的統計(平均/中央/分散/標準偏差)、および/または局所画像ウィンドウにおける色強度相関(color intensity correlation)が含まれる。
【0086】
[0108] (E)強度特徴から導き出されるメトリック
[0109] 病理組織学的スライド画像内において中間階調で表示される細胞(grey colored cell)の黒から白までの明暗度の間で、一定の特異的プロパティ値を有する隣接細胞の一群を設定する。色特徴の相関は、サイズ・クラスのインスタンスを定め、したがって、このようにして、これらの着色された細胞の明暗度によって、病的細胞をその周囲にある黒い細胞のクラスタから判定する。
【0087】
[0110] (F)テクスチャ特徴から導き出されるメトリック
[0111] テクスチャ特徴の例、およびそれらの導出方法は、PCT公開WO/2016/075095およびWO/2016/075096に記載されている。これらの特許出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。
【0088】
[0112] (G)空間特徴から導き出されるメトリック
[0113] ある実施形態では、空間特徴は、局所細胞密度、2つの隣接する検出細胞間の平均距離、および/または細胞からセグメント化領域までの距離を含む。
【0089】
[0114] (H)核特徴から導き出されるメトリック
[0115] また、当業者には、核特徴からもメトリックを導き出せることが認められよう。このような核特徴の計算については、Xing et al. "Robust Nucleus/Cell Detection and Segmentation in Digital Pathology and Microscopy Images: A Comprehensive Review"(ディジタル病理学および顕微鏡画像におけるロバストな核/細胞検出およびセグメンテーション:包括的な再検証), IEEE Rev Biomed Eng 9, 234-263, January 2016に記載されている。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする。
【0090】
[0116] 勿論、当業者には知られているような他の特徴も考慮し、特徴の計算のための基準として使用してもよい。
[0117] 他の例として、PCT公開第WO/2016/075096号に記載されているように、細胞をリンパ球として分類することもできる。この出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。具体的には、PCT公開第WO/2016/075096号は、PD-L1バイオマーカの存在を求めてIHCアッセイにおいて染色された組織試料の画像内において細胞を分類するコンピュータ実装方法について記載する。この方法は、組織試料の画像内にある核の特徴から核特徴メトリックを計算するステップと、組織試料の画像を用いて、対象の核に基づいてコンテキスト情報メトリックを計算するステップと、核特徴メトリックとコンテキスト情報メトリックとの組み合わせを使用して(分類器の入力として)組織試料の画像内において細胞を分類するステップとを含み、細胞は、陽性免疫細胞、陽性腫瘍細胞、陰性免疫細胞、および陰性腫瘍細胞、または他の細胞の内少なくとも1つとして分類される。ある実施形態では、この方法は、更に、細胞内において個々の核を識別するために前景セグメント化マスクを作成するステップも含む。更に、この特許公開は、PD-L1染色組織のコンテキストにおいて、PD-L1バイオマーカを発現しないリンパ球(「陰性リンパ球」)がある領域は小さい青色のブロブによって特徴付けられ、PD-L1バイオマーカを発現するリンパ球(「陽性リンパ球」)がある領域は小さい青色のブロブおよび茶色のブロブによって特徴付けられ、PD-L1バイオマーカを主に発現する細胞がある腫瘍領域(「陽性腫瘍細胞」)は大きな青色のブロブおよび茶色のリングによって特徴付けられ、PD-L1バイオマーカを発現しない細胞(「陰性腫瘍細胞」)がある腫瘍領域は大きな青色のブロブのみによって特徴付けられることも記載している。
【0091】
[0118] ある実施形態では、画像分析モジュール207を1回よりも多く実行する。例えば、画像分析モジュール207は、1回目では、第1画像において特徴を抽出し細胞および/または核を分類するために実行され、次いで、2回目では、追加画像(例えば、1つの追加画像、複数の追加画像、または一連の追加画像)において特徴を抽出し、細胞および/または核を分類するために実行され、追加画像は、他の単純画像または分離画像チャネル画像、あるいはこれらの任意の組み合わせであってもよい。
【0092】
[0119] 特徴が導き出された後、核または細胞を分類するために、この特徴を単独でまたは訓練データと併せて使用することができる(例えば、訓練中に、当業者には知られている手順にしたがって、専門家の観察者によって与えられるグラウンド・トゥルース識別と共に、細胞例を提示する)。ある実施形態では、本システムは、少なくとも部分的に、バイオマーカ毎の1組の訓練スライドまたは基準スライドに基づいて訓練された分類器を含むことができる。尚、バイオマーカ毎に分類器を訓練するためには、異なる複数組のスライドを使用できることは、当業者には認められよう。したがって、1つのバイオマーカには訓練後に1つの分類器が得られる。また、異なるバイオマーカから得られた画像データ間には変動性があるので、目に見えない検査データに対する性能向上を確保するために、異なるバイオマーカ毎に、バイオマーカ型の検査データを識別する異なる分類器を訓練できることは当業者には認められよう。スライド解釈のためには、例えば、組織型、染色方法(staining protocol)、およびその他の対象の特徴における訓練データの変動性をどのように扱うのが最良かに、少なくとも部分的に基づいて、訓練された分類器を選択することができる。
【0093】
[0120] ある実施形態では、分類モジュールはサポート・ベクトル・マシン(「SVM」)である。一般に、SVMは分類技法であり、統計学習理論に基づき、非線形ケースのためのカーネルによって、非線形入力データ集合を高次元線形特徴空間に変換する。いずれの特定の理論にも束縛されることを望むのではないが、サポート・ベクトル・マシンは、2つの異なるクラスを表す1組の訓練データEを、カーネル関数Kによって、高次元空間に投影すると考えられている。この変換されたデータ空間では、クラス分離を最大化するようにクラスを分離するために平坦な線(flat line)を生成することができるように(識別超平面)非線形データを変換する。次いで、Kによって検査データを高次元空間に投影し、超平面に関してこれらがどこに入ったかに基づいて、検査データを分類する。カーネル関数Kは、データを高次元空間に投影する方法を定める。
【0094】
[0121] 他の実施形態では、アダブースト・アルゴリズムを使用して分類を実行する。アダブーストとは、多数の弱分類器を組み合わせて強分類器を生成する適応アルゴリズムである。訓練段階中に病理医によって識別された画像画素(例えば、特異的染色を有する、または特定の組織型に属する)を使用して、弱分類器と見なされる、個々のテクスチャ特徴Φj(j∈{1,...,K})の各々について確率密度関数を生成する。次いで、ベイズの定理を使用して弱学習機(weak learner)を構成するΦj毎に、尤度シーン(likelihood scene)Lj=(Cj,Ij∈{1,....,K})を生成する。これらをアダブースト・アルゴリズムによって組み合わせて、強分類器
【0095】
【数4】
【0096】
にする。
ここで、画素cj∈Cj毎に、Πj(cj)は画素cjがクラスωTに属する複合尤度であり、αjiは、特徴Φiについて訓練する間に決定される重みであり、Tは繰り返しの回数である。
【0097】
[0122] 細胞クラスタ識別モジュール
[0123] 次に、入力(単純)画像の1つまたは多重画像から得られた分離画像チャネル画像の1つにおいて空間クラスタを識別するために、細胞クラスタ識別モジュール208を実行する。このモジュールは、第1画像において検出されたクラスタを他の画像、例えば、他のバイオマーカ画像におけるクラスタに関連付ける。図3A図3B、および図5を参照すると、入力画像の1つにおける全ての腫瘍細胞または他の対象細胞の検出および/または分類(ステップ300)に続いて、入力画像(即ち、単純画像または分離された画像チャネル画像のいずれか)において検出された腫瘍細胞または他の検出された対象細胞のクラスタを識別するために、識別モジュール208を使用する。次いで、本明細書において更に説明するように、続いて、第1画像において識別されたクラスタを他の入力画像にマッピングすることができる。
【0098】
[0124] ある実施形態では、細胞クラスタ、例えば、腫瘍クラスタおよび/またはリンパ球凝集クラスタをH&E画像内で識別するために、クラスタ識別モジュール208を利用することができ、次いで、これらの細胞クラスタを1つ以上のバイオマーカ画像(例えば、1つの染色を含むその他の取得単純画像)にマッピングするために、位置合わせモジュール207を利用することができる。このように、ある実施形態では、クラスタ識別モジュール208は、H&E画像において腫瘍クラスタまたは他の対象細胞のクラスタを識別するために使用される。あるいは、他の実施形態では、クラスタ識別モジュール208は、第1バイオマーカによって染色されたバイオマーカ画像(例えば、IHC画像またはISH画像)において腫瘍クラスタまたは他の対象細胞のクラスタを識別するために使用され、この場合も、これらの識別された腫瘍クラスタまたは他の細胞のクラスタを他のバイオマーカ画像(例えば、IHC画像または第2染色を有するISH画像)にマッピングすることもできる。
【0099】
[0125] 図5を参照すると、画像分析モジュール207を使用した細胞検出および分類に続いて、細胞分類データを使用して、細胞グラフ、空間隣接グラフ(spatial adjacency graph)、または空間隣接行列を構築する(ステップ510)。入力画像に対する細胞レベル分類の結果、および細胞の空間分布を考慮して、空間隣接行列を構築することができる。次に、空間隣接行列において「コミュニティ・ネットワーク」を検出するためにアルゴリズムを使用する(ステップ510)。これらのステップの各々について、本明細書において更に詳しく説明する。
【0100】
[0126] セル-グラフ手法は、対毎の関係に対する生物学的仮説に基づいて1対のノード(ここでは細胞)間において任意のエッジ関数を許容することによって、グラフに基づく手法を一般化する。セル-グラフ手法では、試料組織の細胞または細胞クラスタは頂点である。生物学的基盤(または仮説)を有する想定に基づいて、1対の細胞または細胞クラスタ間において、エッジを定める。セル-グラフのノードは個々の細胞である。つまり、セル-グラフのリンクは、基礎組織において生物学的相互作用を取り込むことを狙いとする。ある実施形態では、セル-グラフの作成は、(i)ノードを識別し、(ii)セル-グラフにおいてエッジを確定することを含む。ある実施形態では、頂点集合Vを決定した後、「特徴距離」の生物学的知見および知識を利用することによって、1対のノードuおよびv間のエッジ(u,v)を定めることができる。特徴距離は、本明細書において説明したように、細胞の中心間の単純な空間的ユークリッド距離、または2つの細胞の特徴値に対して定められたユークリッド距離とすることができる。特徴距離を使用して、各2つのノード間における対毎の空間的関係を、セル-グラフにおいて可能なリンクの存在に変換する(translate)。特徴距離は、2つの細胞間にあるエッジの「重み」を構成する。あるいは、エッジ(u,v)は、確率論的にまたは決定論的に、あるいはこれら2つの方法の組み合わせによって、確定することができる。例えば、確率論的セル-グラフでは、任意の2つのノード間にリンクを作成する確率は、確率関数P(u,v)=ed(u,v)/(L)を採用すると、それらの間のユークリッド距離と共に指数的に減衰するとしてよい。ここで、d(u,v)はユークリッド距離であり、Lは格子の2つのノード間における最大のユークリッド距離である。エッジ(u,v)は、距離d(u,v)が閾値未満である場合(例えば、2つの細胞が物理的に互いに接触している場合)、決定論的に確定することができる。いずれの特定の理論にも束縛されることを望むのではないが、ノード間におけるリンクの存在は、ノード(細胞)間にどのような種類の関係が存在するか指定するのではない。これは、単に、何らかの種類の関係が存在するという仮説が立てられたことを示し、それが細胞間の距離に依存することを示すに過ぎない。セル-グラフを作成する更に他の方法が、Bulent Yener, "Cell-Graphs: Image-Driven Modeling of Structure-Function Relationship"(セル-グラフ:構造-関数関係の画像主導モデリング), Communications of the ACM, Vol. 60 No. 1, pp.74-84によって記載されている。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする。
【0101】
[0127] ある実施形態では、空間隣接グラフまたは隣接行列は、有限グラフを表すために使用される正方行列である。行列の要素は、頂点の対がグラフにおいて隣接するか否かを示す。隣接行列は常にN行およびN列の正方行列であり、Nは対象のセル/ノード/頂点の数であり、N^2個のエントリが作られる。ある実施形態では、入力画像における全ての細胞に対する空間隣接行列が導き出され、これによって、空間隣接行列は、行数および列数が等しく、各行および列が入力画像における1つの細胞に対応する正方行列となる。ある実施形態では、互いに約30ミクロンおよび約70ミクロンの距離以内にある細胞を分析することによって、隣接行列内においてノード(例えば、細胞ノード)を作成する。捜すべき細胞を中心とする空間半径は、特定の組織型および基礎生物学的仮説に対して生物学的に特異である。他の実施形態では、隣接行列内におけるノード(例えば、細胞ノード)は、互いに約40ミクロンから約60ミクロンの距離以内にある細胞を分析することによって作成される。更に他の実施形態では、隣接行列内におけるノードは、互いに約50ミクロン以内にある細胞を分析することによって作成される。
【0102】
[0128] 1つ以上の染料によって染色された生体試料の入力画像において細胞間の関係を導き出すために、隣接行列の概念を拡大することができる。ある実施形態では、隣接行列は重み付けされず、細胞は関係付けられる(または接続される)か否かのいずれかである。即ち、隣接行列内における全てのエッジは二進であり、重要度は等しい。他の実施形態では、隣接行列に重み付けする。即ち、細胞間の関係(または接続)の特定のプロパティを反映する重みを割り当てる。ある実施形態では、行におけるゼロでない列の重みは、細胞とその隣接する細胞との間の「特徴距離」に対応する。ある実施形態では、特徴距離は2つの細胞間のユークリッド距離、物理的距離、細胞のサイズ、密度係数、または定めることができる細胞の任意の他の類似性特徴または類似性プロパティである。他の実施形態では、特徴距離は、凸性(convexity)、サイズ、物理的接触、形状等のような細胞レベルの属性である。1対の細胞間に他の類似性尺度が全くない場合、単純なユークリッド距離尺度を特徴距離として採用する(adapt)ことができる。「相関」、「交差エントロピ」、「ハミング距離」等というような他の距離尺度も可能であり、距離は、単純な空間距離、または細胞特徴の値に対して定められる距離尺度であることも可能である。情報理論では、同じ1組の基礎となるイベントに対する2つの確率分布pおよびqの間における交差エントロピは、この1組から引き出されるイベントを識別するために必要とされる平均ビット数の尺度となり、符合化方式が使用される場合、「真の」分布pよりもむしろ、「不自然な」確率分布qに対して最適化される。
【0103】
[0129] 空間隣接行列の生成(ステップ500)に続いて、コミュニティ・ネットワーク最適化方法を使用して、クラスタを識別する(ステップ510)。いずれの特定の理論にも束縛されることを望むのではないが、各コミュニティは細胞(ノード)の空間干渉クラスタ(spatial coherent cluster)を構成すると考えられる。この定式化によって、腺の組織形態または局所的な組織形態を反映する、不規則な形状であるが一貫する細胞の空間クラスタを成長させ、検出することを可能にする。情報理論では、等しい長さの2つの文字列間のハミング距離は、対応するシンボルが異なる位置の数である。言い換えると、これは、1つの文字列を他の文字列に変化させるために必要とされる最小数の代用(substitution)、または1つの文字列を他の文字列に変換させた可能性がある最小数の誤りを表す(measure)。更に一般的なコンテキストでは、ハミング距離は2つのシーケンス間の編集距離(edit distance)を測定するための様々な文字列メトリックの1つである。
【0104】
[0130] コミュニティ検出方法の背後にある基礎的な考えは、ネットワーク(細胞の画像)のノード(細胞)をモジュールまたは腫瘍クラスタに区分することである。標準的なグラフ区分アルゴリズムとは逆に、コミュニティの検出は、前もってモジュールの数もそれらのサイズも指定せずに実行され、自動化された方法で、ネットワークの中規模組織を明らかにすることを目標とする。コミュニティを検出する(ステップ510)1つの方法、即ち、グループの間よりもグループの内部の方がエッジの密度が高くなるように頂点をグループに纏める方法は、空間クラスタリング手法による。いずれの特定の理論にも束縛されることを望むのではないが、より少ない次元にクラスタリングする前に次元減少を実行するために、空間クラスタリング手法はデータの類似行列のスペクトル(固有値)を利用することが考えられる。類似行列は、入力として供給され、データ集合における各点対の相対的類似性の定量的評価から成る。1組のデータ点が列挙されると、類似行列は対称行列Aとして定義することができる。ここで、Aij>0であり、Aはインデックスiおよびjを有するデータ点間の類似性の尺度を表す。スペクトル・クラスタリングに対する一般的な手法は、A(基礎行列Aは異なる特徴距離メトリックとは異なる可能性がある)のラプラシアン行列の関連する固有ベクトルに対して標準的なクラスタリング方法を使用することである(例えば、k-平均法(k-means clustering)。k-平均法は、n回の観察をk個のクラスタに区分することを目標とし、クラスタにおいて、各観察が、最も近い平均を有するクラスタに属し、クラスタのプロトタイプとして役割を果たす)。特徴距離およびクラスタリング基準を定めるには多くの異なる方法があり、したがって、クラスタリングにも異なる解釈がある。関連がある固有ベクトルとは、0の値を有する最も小さい固有値を除いて、ラプラシアンの最も小さい様々な固有値に対応するものである。計算効率のために、これらの固有ベクトルは、多くの場合、ラプラシアンの関数の最も大きい様々な固有値に対応する固有ベクトルとして計算される。この技法についての追加情報は、M. Fiedler, "Algebraic connectivity of graphs"(グラフの代数的連結度), Czech. Math. J. 23, 298 (305 (1973) and A. Pothen, H. Simon、および K.-P. Liou, "Partitioning sparse matrices with eigenvectors of graphs" (グラフの固有ベクトルによる疎行列の区分), SIAM J. Matrix Anal. Appl. 1 1, 430(452 (1990)に記載されている。これらの文献をここで引用したことにより、その内容全体が本願にも含まれるものとする。
【0105】
[0131] 他の実施形態では、2つのステップを含むコミュニティ・ネットワーク・アルゴリズムを採用する。最初に、このようなアルゴリズムは、「ネットワーク」(即ち、細胞の画像)から繰り返しエッジを除去して、それをコミュニティに分割することを含み、除去されたエッジは、複数の可能な「媒介性」尺度の内任意の1つを使用して識別される。第2に、これらの尺度が、各除去の後に、決定的に再計算される(Aaron Clauset et al., "Finding community structure in very large networks"(非常に大きなネットワークにおけるコミュニティ構造の発見), Phys. Rev. E 70, 0661 11 (2004)を参照のこと。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする)。
【0106】
[0132] ある実施形態では、コミュニティ検出は、最小長の経路を辿って信号がグラフ全域に送信されるプロセスにおいてエッジの役割の重要性を表現する中心性尺度(centrality measure)(エッジ「媒介性」)の値にしたがって、エッジを検出することを含む(M. E. J. Newman and M. Girvan, "Finding and evaluating community structure in networks"(ネットワークにおけるコミュニティ構造の発見および評価), Phys. Rev. E 69, 026113, February 2004を参照のこと。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする)。Girvan-Newmanアルゴリズムは、元のネットワークからエッジを徐々に除去することによって、コミュニティを検出する。残ったネットワークの接続されているコンポーネントがコミュニティとなる。コミュニティに対して最も中心にあるエッジはどれかを示す尺度を構築しようとする代わりに、Girvan-Newmanアルゴリズムは、コミュニティの「間にある」可能性が最も高いエッジに的を絞る。頂点媒介性とは、ネットワークにおいて非常に中心に近いノードの指標である。任意のノードiについて、頂点媒介性は、そのノードを通る、ノード対間の最短経路の本数として定義される。これは、ネットワークが商品の転送を既知の開始点と終点との間で、このような転送が利用可能な最短経路を求めるという仮定の下で、変調するモデルに関連がある。
【0107】
[0133] Girvan-Newmanアルゴリズムは、この定義をエッジの場合に拡大し、エッジの「エッジ媒介性」を、そのエッジに沿って走る、ノード対間の最短経路の本数として定義する。1対のノード間に1本よりも多い最短経路がある場合、経路の全ての総重みが1(unity)に等しくなるように、各経路に等しい重みを割り当てる。ネットワークが、数個のグループ間エッジによって疎結合されただけのコミュニティまたはグループを含む場合、異なるコミュニティ間にある全ての最短経路は、これら数個のエッジの内の1つに沿って延びなければならない。つまり、エッジ結合コミュニティは高いエッジ媒介性(少なくともこれらの1つ)を有する。これらのエッジを除去することによって、グループを互いに分離し、したがって、ネットワークの基礎コミュニティ構造が明らかにされる。
【0108】
[0134] Girvan-Newmanアルゴリズムは、以下のステップ、(i)ネットワークにおける全ての既存のエッジの媒介性を計算するステップ、(ii)最も高い媒介性を有するエッジを除去するステップ、(iii)この除去によって影響を受けた全てのエッジの媒介性を再計算するステップ、(iv)エッジがなくなるまでステップ(ii)および(iii)を繰り返すステップを採用する。Girvan-Newmanアルゴリズムの最終的な結果は、樹形図となる。
【0109】
[0135] 他の実施形態では、コミュ二ティ検出「問題」におけるノードiの強度は、式(1)におけるように定義され、Aは隣接行列である。定義上、Aは対称であり、Aijはiおよびj間のリンクの重みである。ネットワークにおける全重みは式(2)によって与えることができる。ノードiおよびj間の距離をdijで示す。距離とは、埋め込み空間上で測定するときにおけるノード間のユークリッド距離を意味し、1つの頂点から他の頂点まで最短経路に沿って横断するエッジの数である。先に論じたように、空間の性質、およびそれに関連する距離は、抽象的であってもよく、隣接行列に対する重みとして選択された「特徴距離」によって与えられる。
【0110】
[0136]
【0111】
【数5】
【0112】
[0137]
【0113】
【数6】
【0114】
[0138] 殆どのコミュニティ検出方法の背後には、区分の品質を測定する数学的定義がある。広く使用される区分のモジュラリティ(modularity)は、リンクが、確率に基づいて予測されるよりも、コミュニティ内に豊富にあるか否かを表す(measure)。即ち、
[0139] Q=(コミュニティ内にあるリンクの端数)-(このようなリンクの予測端数)
[0140] したがって、モジュラリティは式(3)によって与えることができる。
【0115】
[0141]
【0116】
【数7】
【0117】
[0142] ここで、i,j∈Cは、Pの同じコミュニティCに属するノードiおよびjの対全体の総和であり、したがって同じコミュニティ内にあるノード間のリンク数を示す(count)。
【0118】
[0143] 確率(即ち、帰無仮説)が意味するものは、行列Pijによって具体化される。Pijは、何らかの制約があるランダムなネットワークの集合(ensemble)にわたるノードiおよびj間のリンクの予測重みである。これらの制約は、ネットワーク編成についての既知の情報(即ち、そのリンクおよびノードの総数)に対応し、これらは、観察対象のトポロジー的特徴の関連性を評価するときに、考慮に入れなければならない。一般に、Aijが対称である場合、Pijも対称であるように選択され、全体の重みも保存されることも課せられる(式(4)参照)。これらの基本的考慮事項を超えて、考慮対象ネットワークによっては、異なるヌル・モデルを構築することができる。Newman and Girvan(NG)によって提案された、最も一般的な(popular)選択肢を式(5)に表す(先に記した M. E. J. Newman and M. Girvanを参照のこと)。
【0119】
[0144]
【0120】
【数8】
【0121】
[0145]
【0122】
【数9】
【0123】
[0146] ここで、ランダム化ネットワークは各ノードの強度を保存する。ノード強度に制約を加えることは、任意のノードでを任意のノードにも接続でき、接続性(connectivity)だけが問題になるという意味で、ネットワークがうまく混合されるという見方に沿って進んで行く。その場合、ノード強度は、リンクが特定のノードに到達する確率についての好ましい代用(proxy)になると考えられる。対応するNewmanおよびGirvanモダリティの最適値を近似するために、異なる型の経験則を展開する(develop)ことができる。
【0124】
[0147] NewmanおよびGirvanによって提案されたヌル・モードの代替として、2つのノードが接続される確率に距離が強く影響するネットワークでは、ヌル・モデルに対する自然な選択が式(6)によって与えられる。
【0125】
[0148]
【0126】
【数10】
【0127】
[0149] ここで、Nは、位置の重要性、ノードiの重要性の観念を測定し、抑止関数(式7)、
[0150]
【0128】
【数11】
【0129】
[0151] は、リンクが距離dにおいて存在する確率Aij/(N)の加重平均である。したがって、これはデータから直接測定されるのであって、決定された関数依存性によって当てはめられるのではない。構造によって、ネットワークの全重みが保存される。
【0130】
[0152] コミュニティ・ネットワークを検出する他の方法が、Paul Expert et al., "Uncovering space-independent communities in spatial networks"(空間的ネットワークにおける空間独立コミュニティの発見), vol. 108 no. 19, pp. 7663- 7668, doi: 10. l073/pnas.1018962108によって記載されている。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする。
【0131】
[0153] 図7図10は、前述した概念を使用して識別されたクラスタを示す。
[0154] 位置合わせモジュール
[0155] 第1画像における空間的に同質の腫瘍または細胞クラスタの識別に続いて(勿論、単純画像が入力画像として使用されることを仮定する)、次に、位置合わせモジュール209(図2および図3A参照)を使用して、これらの識別された腫瘍または細胞クラスタを1つ以上の追加の画像にマッピングする(ステップ320)。このようにするときに、画像の全てを共通の座標系にマッピングしてもよい。複数の単純組織スライドが生成される組織ブロックに対して、1組の単純画像が与えられる場合、第1入力画像において細胞および/または領域を検出することができ、これらの検出した細胞および/または領域を隣接する連続切片組織スライドにマッピングすることができる。
【0132】
[0156] ある実施形態では、H&E画像である第1画像において細胞クラスタを識別し、本明細書において説明した位置合わせアルゴリズムを使用して、これら識別した細胞クラスタをバイオマーカ画像(単純画像または多重画像からの分離画像チャネル画像)にマッピングする。例えば、H&E画像において識別したクラスタを、1つの染色を有する複数の単純画像の内1つ以上にマッピングしてもよく、または多重画像から得られた複数の分離画像チャネル画像の内1つ以上にマッピングしてもよい。
【0133】
[0157] 他の実施形態では、第1バイオマーカ画像において細胞クラスタを識別し、本明細書において説明した位置合わせアルゴリズムを使用して、これらの識別した細胞クラスタを追加のバイオマーカ画像(単純または多重)またはH&E画像にマッピングする。
【0134】
[0158] 勿論、マッピングされる画像の全てが1つの多重画像から導き出される場合、位置合わせは不要である。何故なら、全ての画像が同じ組織試料スライスから取られるからである。例えば、取得した画像が、H&Eおよび1つ以上のバイオマーカ染料によって染色された多重画像である場合、多重画像の分離および空間的に同質な腫瘍または細胞クラスタの識別の後、位置合わせステップは不要である。
【0135】
[0159] 第1画像から識別されたクラスタを1つ以上の追加画像にマッピングすることによって、各画像における各クラスタ内のバイオマーカ(または染色)毎に発現スコア(本明細書において説明する)を導き出すことが可能になる。一例として、識別したクラスタをH&E画像から1つ以上のバイオマーカ画像(ER、PR、またはKi-67の1つに対して各バイオマーカが染色される)にマッピングする場合、位置合わせに続いて、ER、PR、およびKi-67についての発現スコアが各画像における各クラスタにおいて導き出されるように、H&E画像において識別されたクラスタをER、PR、およびKi-67バイオマーカ画像における同じエリアにマッピングすることができる。
【0136】
[0160] 一般に、位置合わせは、基準画像として役割を果たす1つの入力画像、またはその一部(例えば、細胞クラスタ)を選択し、他の各入力画像の基準画像の座標フレームへの変換を計算することを含む。したがって、画像位置合わせを使用して、全ての入力画像を同じ座標系に揃えることができる(例えば、特異的マーカがある連続組織切片またはスライドの場合、基準座標は組織ブロックの真ん中にあるスライド切片とすることができる)。したがって、各画像は、その古い座標系から新しい基準座標系に整列することができる。
【0137】
[0161] 位置合わせとは、異なる複数組のデータ、ここでは、画像、画像内部の細胞クラスタを1つの座標系に変換プロセスである。更に具体的には、位置合わせとは、2つ以上の画像を整列するプロセスであり、一般に、1つの画像を基準(基準画像または固定画像とも呼ぶ)として指名し、幾何学的変形を他の画像に適用し、これらが基準と整合するようにする処理を伴う。幾何学的変換は、1つの画像における位置を他の画像における新たな位置にマッピングする。正しい幾何学的変換パラメータを決定するステップは、画像位置合わせプロセスにとって重要である。各画像の基準画像への変換を計算する方法は、当業者にはよく知られている。例えば、画像位置合わせアルゴリズムは、例えば、"11th International Symposium on Biomedical Imaging(第11回医用画像処理に関する国際シンポジウム)(ISBI), 2014 IEEE, April 29 2014-May 2 2014)において記載されている。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする。画像位置合わせ方法の詳細については、以下で概説する。
【0138】
[0162] 位置合わせプロセスは当技術分野ではよく知られており、既知の方法のいずれでも本開示に応用することができる。ある実施形態では、画像位置合わせは、2014年9月30日に出願され、"Line-Based Image Registration and Cross-Image Annotation Devices, Systems and Methods"(ラインに基づく画像位置合わせおよび画像間注釈付けデバイス、システム、ならびに方法)と題する WO/2015/049233 に記載された方法を使用して行われる。この出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。WO/2015/049233は、単独で使用される、または精細位置合わせプロセスと組み合わせて使用される、粗雑位置合わせプロセスを含む位置合わせプロセスについて記載する。ある実施形態では、粗雑位置合わせプロセスは、整列のためにディジタル画像を選択し、選択したディジタル画像の各々から前景画像マスクを生成し、結果的に得られた前景画像間で組織構造を一致させるステップを含んでもよい。更に他の実施形態では、前景画像マスクを生成するステップは、染色された組織切片のホール・スライド画像から適度に重み付けした前景画像を生成し、適度に重み付けされた前景画像にOTSU二値化を適用して、二進適度重み付け画像マスク(binary soft-weighted image mask)を生成するステップを含む。更に他の実施形態では、前景画像マスクを生成するステップは、染色された組織切片のホール・スライド画像から二進適度重み付け画像マスクを生成し、同じホール・スライド画像から勾配強度画像マスク(gradient magnitude image mask)を別個に生成し、OTUS二値化を勾配画像マスクに適用して二進勾配強度画像マスクを生成し、二進OR演算を使用して、二進適度重み付け画像および二進勾配強度画像マスクを組み合わせて、前景画像マスクを生成するステップを含む。「勾配」(gradient)とは、本明細書において使用する場合、例えば、特定の画素の周囲にある1組の画素の強度値勾配を考慮に入れることによって、前記特定の画素について計算された画素の強度勾配である。各勾配は、座標系に対して特定の「方位」(orientation)を有することができ、この座標系のx軸およびy軸はディジタル画像の2つの直交するエッジによって定められる。「勾配方位特徴」(gradient orientation feature)とは、前記座標系内部における勾配の方位を示すデータ値であるとしてもよい。ある実施形態では、組織構造を一致させるステップは、結果的に得られた前景画像マスクの各々の境界から、ラインに基づく特徴を計算し、第1前景画像マスク上の第1組のライン-特徴と、第2前景画像マスク上の第2組のライン-特徴との間で大域変換パラメータを計算し、これらの変換パラメータに基づいて第1および第2画像を大域的に整列するステップを含む。更に他の実施形態では、粗雑位置合わせプロセスは、大域変換パラメータに基づいて選択されたディジタル画像を共通格子にマッピングするステップを含む。この格子は、選択されたディジタル画像を包含してもよい。ある実施形態では、精細位置合わせプロセスは、1組の整列されたディジタル画像において第1ディジタル画像の第1下位領域を識別するステップと、1組の整列されたディジタル画像におけて第2ディジタル画像上で第2下位領域を識別するステップであって、第2下位領域が第1下位領域よりも大きく、第1下位領域が共通格子上において実質的に第2下位領域内に位置する、ステップと、第2下位領域における第1下位領域に対する最適位置を計算するステップとを含んでもよい。
【0139】
[0163] これらの方法をここでは図6に示す。方法600は開始ステップ602において開始する。ブロック604において、操作のために、1組の画像データまたはディジタル画像を取得する(例えば、スキャンするまたはデータベースから選択する)。画像データの各組は、例えば、1人の患者の1組の隣接組織切片からの組織切片に対応する画像データを含む。ブロック606において、1つの画像対だけが選択された場合、このプロセスは直接ブロック610に進む。1つよりも多い画像対が選択された場合、ブロック610に進む前に、ブロック608において1組の選択された画像を対に纏める。ある実施形態では、画像対は隣接対として選択される。つまり、例えば、1組の選択された画像が10枚の平行で隣接するスライス(L1...L10)を含む場合、L1およびL2を対として纏め、L3およびL4を対として纏める等となる。他方で、どの画像対が互いに最も類似するかに関して情報が入手できない場合、ある実施形態では、それらの分離距離にしたがって画像を纏め、(例えば、種々の画像のエッジ-マップ間の面取距離に対応するエッジ間距離または画像間距離)、互いに最も近い画像を一緒に対にする。本開示の例示的な実施形態では、エッジ間/画像間距離は、画像の対に利用される。ある実施形態では、エッジに基づく面取距離が、画像間/エッジ間距離を計算するために使用されてもよい。画像の対が既に粗雑位置合わせプロセスを受けており、画像が粗く整列されその結果が保存されている場合、本プロセスはブロック614に進む。そうでない場合、ブロック612において、選択された画像対に対して粗雑位置合わせプロセスを実行する。粗雑位置合わせプロセスについては、以下で更に詳しく説明する。
【0140】
[0164] ブロック614に移り、選択されこの時点で位置合わせされた(整列された)画像を共通格子上に表示する。画像は、1つのモニタ上で、または数台のモニタにまたがって、1つの画像内に重ね合わされるか、別個の画像として表示されるか、または双方である。ブロック616において、クライアント・ユーザは対の画像からの画像の1つを、ソース画像として選択することができる。ソース画像に既に所望通りに注釈が付けられている場合、本プロセスはブロック622に進む。そうでない場合、クライアント・ユーザが、ブロック620において、所望通りにソース画像に注釈を付ける。ブロック620と実質的に同時に行われてもよい(または行われなくてもよい)ブロック622において、対における他方の画像(目標画像)に注釈をマッピングし、目標画像上で図表によって再現する。粗雑位置合わせの前に注釈付けが行われる実施形態では、画像の対が位置合わせ(整列)されるのと実質的に同時に、注釈をソース画像から目標画像にマッピングすることができる。ブロック624において、ユーザは、精細位置合わせプロセスに進むか否か選択することができる。ユーザが、位置合わせを行わずに、直接結果を表示することを選択した場合、本プロセスはブロック626に進む。
【0141】
[0165] そうでない場合、ブロック624において、選択した画像対上で、例えば、マッピングされる注釈の位置および/または画像の整列を最適化するために、精細位置合わせプロセスを実行する。精細位置合わせプロセスについては、以下で更に詳しく論ずる。ブロック626において、注釈が付いた画像対を、精細位置合わせプロセスの結果と共に表示する(または、精細位置合わせが使用されない場合、注釈付き画像対は、粗雑位置合わせプロセスの結果と共に表示されるだけもよい)。次いで、この方法は最終ブロック628において終了する。
【0142】
[0166] 採点モジュール
[0167] 画像位置合わせモジュール209を使用して、空間的同質腫瘍または細胞クラスタを識別し、および/または全ての画像における腫瘍またはその他の細胞クラスタをマッピングした(ステップ320)後に、続いて、各画像(単純画像または多重画像からの分離画像チャネル画像)内にある各細胞クラスタ内部の染色またはバイオマーカ毎に種々のマーカ発現スコアを、採点モジュール210を使用して計算する(ステップ330)。
【0143】
[0168] 採点モジュールは、ある実施形態では、ステップ300における細胞の検出および分類の間に取得されたデータを利用する。例えば、画像分析モジュール207は一連の画像分析アルゴリズムを備えることができ、本明細書において説明したように、識別された細胞クラスタ内において、核、細胞壁、腫瘍細胞、またはその他構造の内1つ以上の存在を判定するために使用することができる。ある実施形態では、視野毎に導き出された染色強度値および特定の核の計数(count)を使用して、陽性率またはH-スコアのような種々のマーカ発現スコアを決定することができる。採点方法は、2013年12月19日に出願され、"Image analysis for breast cancer prognosis"(乳癌予後についての画像分析)と題し、本願と同じ譲受人に譲渡された係属中の特許出願WO/2014/102130A1、および2104年3月12日に出願されたWO/2014/140085A1、"Tissue object-based machine learning system for automated scoring of digital whole slides"(ディジタル・ホール・スライドの自動採点のための組織物体に基づく機械学習システム)において、更に詳しく記載されている。これらの特許出願をここで引用したことにより、各々の内容全体が本願にも含まれるものとする。
【0144】
[0169] 一例として、画像分析モジュール207における自動画像分析アルゴリズムは、一連のIHCスライドの中から1つずつ解釈し、Ki67、ER、PR、FIER2等のような特異的バイオマーカに対して陽性または陰性に染色された腫瘍核を検出するために使用することができる。検出した陽性および陰性の腫瘍核に基づいて、1つ以上の方法を使用して、マーカの陽性率、H-スコア等のような種々のスライド・レベルの採点を計算することができる。
【0145】
[0170] ある実施形態では、発現スコアはH-スコアである。ある実施形態では、「H」スコアは、腫瘍細胞の割合を評価するために使用され、細胞膜染色は「弱」、「中」、または「強」として等級付けられる。これらの等級を総計すると、「陽性」および「陰性」の間で区別するために、300の総合的最大スコアおよび100の分割点(cut-off point)が得られる。例えば、膜染色強度(0、1+、2+、または3+)が固定視野内にある細胞毎に(または、ここでは、腫瘍もしくは細胞クラスタにおける細胞毎に)判定される。H-スコアは、単純に、支配的な染色強度に基づくのでもよく、または更に複雑にして、観察された強度レベル毎の個々のH-スコアの合計を含むこともできる。1つの方法によって、染色強度レベル毎の細胞の割合を計算し、最終的に、次の式、[1×(%細胞1+)+2×(%細胞2+)+3×(%細胞3+)]を使用して、H-スコアを割り当てる。最終スコアは、0~300の範囲を取り、所与の腫瘍試料において、強度が高い膜染色程大きな相対的重みを与える。次いで、特定の判別閾値に基づいて、試料を陽性または陰性と見なすことができる。H-スコアを計算する更に他の方法が米国特許出願公開2015/0347702に記載されている。この特許出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。
【0146】
[0171] ある実施形態では、発現スコアはAllredスコアである。Allredスコアとは、ホルモン受容体検査で陽性となった細胞の割合を、これらの受容体が染色の後どのように現れるか(これを「強度」と呼ぶ)と共に調べる採点システムである。次いで、この情報を組み合わせて、0から8までの目盛上で試料を採点する。スコアが高い程、試料において多くの受容体が発見され、一層容易に試料においてこれらが現れる(are to see)ことになる。
【0147】
[0172] 他の実施形態では、発現スコアは陽性率である。この場合も、RPおよびKi-67バイオマーカを求めて染色される乳癌試料を採点するコンテキストにおいて、PRおよびKi-67スライドについて、以下のようにして、1つのスライドにおける陽性率を計算する(例えば、スライドのディジタル画像における視野毎に陽性に染色された細胞(例えば、悪性細胞)の核の総数を合計し、ディジタル画像の視野の各々からの陽性および陰性に染色された核の総数で除算する)。陽性率=陽性に染色された細胞の数/(陽性に染色された細胞の数+陰性に染色された細胞の数)。
【0148】
[0173] 他の実施形態では、発現スコアは免疫組織化学組み合わせスコア(immunohistochemistry combination score)であり、これはIHCマーカの数に基づく予後スコアであり、マーカの数は1つよりも多い。IHC4は、乳癌試料における4つの測定されるIHCマーカ、即ち、ER、HER2、Ki-67、およびPRに基づく、1つのこのようなスコアである(例えば、Cuzick et al., J. Clin. Oncol. 29:4273-8, 2011、および Barton et al., Br. J. Cancer 1-6, Apr. 24, 2012を参照のこと。これらの文献をここで引用したことにより、これらの内容が本願にも含まれるものとする)。一例では、そして乳癌に対する発現スコアを検出するコンテキストにおいて、例えば、以下の式を使用して、IHC4スコアを計算する。
【0149】
[0174] IHC4=94.7×{-0.100ER10-0.079PR10+0.586HER2+0.240In(1+10×Ki67)}
[0175] 例えば、画像が3つの識別された腫瘍クラスタを含むと仮定し、更に、ER、PR、およびKi-67の各々に1つずつ、3つのバイオマーカ画像が取得されると仮定する。更に、本明細書において説明したように、全ての識別されたクラスタがバイオマーカ画像の各々にマッピングされ、写像クラスタ(mapped cluster)を得ると仮定する。各画像において識別された第1クラスタに対して、ER、PR、およびKi-67発現スコアを導き出すことができる。同様に、第2および第3クラスタの各々に対して、一意のER、PR、およびKi-67スコアを導き出すことができる。言い方を変えると、この例では、識別およびマッピングされたクラスタ毎に、例えば、[ER(1)、PR(1)、Ki-67(1)]、[ER(2)、PR(2)、Ki-67(2)]、[ER(3)、PR(3)、Ki-67(3)]毎に発現スコアのベクトルを有し、ここで、ER(1)、ER(2)、およびER(3)は、第1、第2、および第3クラスタにおけるERの発現スコアを表し、PR(1)、PR(2)、PR(3)は、第1、第2、および第3クラスタにおけるPRの発現スコアを表し、Ki-67(1)、Ki-67(2)、およびKi-67(3)は、第1、第2、および第3クラスタにおけるKi-67の発現スコアを表す。
【0150】
[0176] インターマーカ異質性メトリック生成モジュール
[0177] 識別されたクラスタまたはマッピングされたクラスタの各々においてマーカ毎の発現スコアの判定(ステップ330)に続いて、インターマーカ異質性メトリック生成モジュール211を使用して、空間異質性メトリック(即ち、1つの染色またはマーカ間のばらつき)および/またはインターマーカ空間異質性メトリック(即ち、複数の染色またはマーカにわたるばらつき)を、種々の識別されたクラスタ間で導き出す(ステップ340)。
【0151】
[0178] 当業者には認められるであろうが、採点は、予測尺度または案内処置としても利用することができる。例えば、そして乳癌ならびにERおよびPRバイオマーカのコンテキストにおいて、検査で陽性になった試料は、処置の過程でホルモン療法を提供する判断を案内することができる。また、生体試料内にある全てのクラスタが任意の特異的マーカに対して同じスコアを有する訳ではないことも、当業者には認められよう。クラスタ間における変動性を記述する異質性スコアまたはメトリックを判定することを可能にすることによって、情報に基づいて治療法を決定するための追加の案内を提供することもできる。更に、異質性は、腫瘍の攻撃性および/または成長パターンの空間的ばらつきの指標となることもでき、集約臨床表現型(aggregated clinical phenotype)(例えば、再発しそうな腫瘍)と相関付けることができる。
【0152】
[0179] ある実施形態では、クラスタを互いに比較してどのように異なるか測定するために、異質性を判定する。異質性は、例えば、本明細書において説明したように、タンパク質発現レベルが、種々の識別およびマッピングされたクラスタ間において、互いに比較して、どのように異なるか記述する変動性メトリックによって測定することができる。ある実施形態では、識別された全てのクラスタ間において異質性を測定する。他の実施形態では、識別されたクラスタの部分集合のみの間で異質性を測定する(例えば、何らかの所定の基準を満たすクラスタ)。
【0153】
[0180] ある実施形態では、一連のバイオマーカ(例えば、ER、PR、Ki-67等)を含む異なるクラスタを識別およびマッピングし、これらのクラスタにおけるタンパク質発現測定値PE(例えば、陽性率)の偏差(例えば、標準偏差または他の分布のモーメント)に基づいて、空間異質性の定量的尺度(例えば、1つの染色またはマーカに対して識別およびマッピングされたクラスタ間における異質性)を計算することができる。このような測定は、タンパク質発現測定値がいかに離れているか(例えば、分布の広がり)を定量化することができる。例えば、マッピングされたクラスタにおける所与のバイオマーカに対するそれぞれのタンパク質発現測定値PE(CL1)、PE(CL2)、...PE(CL)を有する1組のクラスタに対する例示的な空間異質性の計算は次の通りである。
【0154】
[0181] 異質性(H)=σ(PE(CL1)、PE(CL2)、...PE(CL))
[0182] 他の例として、ある実施形態では、ERおよびPRタンパク質空間異質性は、識別された腫瘍クラスタを使用して、測定または検出することができる。例えば、タンパク質異質性の測定は、ERおよびPRの各々に対して変動性メトリック(VM)を判定する動作を含むことができ、ここで、VM=STD(PP(CL1)、PP(CL2)、...PP(CL))となる。PP(CL)は、識別された各腫瘍クラスタCL(例えば、ERプローブに特異的な薬剤、PRに特異的な薬剤等と接触した組織試料の1つ以上の画像においてマッピングされたクラスタ)に対する陽性率である。変動性メトリックに基づいて、ERおよびPRの各々に対する異質性スコアを判定または計算することができる。例えば、ERおよびPRの各々に対する異質性スコアは、以下の式を使用して計算することができる。ここで、α=[0.1](例えば、0から1までの範囲の数値)は正規化係数であり、Sは式(8)によって記述されるような平均陽性率スライド・スコアである。
【0155】
[0183]
【0156】
【数12】
【0157】
[0184] タンパク質異質性を測定するためには、標準偏差σ以外でも変動性メトリクス(VM)を使用することができる。例えば、識別およびマッピングされたクラスタ間のタンパク質発現測定値の差、またはその最大値を使用することができる。ある実施形態では、識別およびマッピングされたクラスタが、所与のバイオマーカに対する視野CL1、CL2、CL3毎にそれぞれのタンパク質発現(PE)測定値を有するとき、これらのクラスタに対する異質性の計算は、次のように、絶対値(ABS)関数を使用して行うことができる。
【0158】
[0185]
【0159】
【数13】
【0160】
[0186] また、複数のクラスタにわたるH-スコアの正規化もメトリックとして利用することができる。例えば、正規化は、クラスタ間において観察された偏差を特異的バイオマーカに対する平均スライド・スコアで除算することによって行うことができる。これは、識別およびマッピングされたクラスタにおけるバイオマーカ毎に繰り返すことができる。
【0161】
[0187] 他の空間異質性メトリックの計算方法が、米国特許出願公開第2015/0347702号に記載されている。この特許出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。
【0162】
[0188] ある実施形態では、クラスタ毎に異なるマーカの発現スコアを使用して、インターマーカ異質性を判定する。例えば、4つのマーカがある画像では、1つのクラスタ(または1つの写像クラスタ)におけるスコアは(30,20,40,80)としてもよい。そして同様に、異なるクラスタに対するスコアは(70,20,60,10)とすることができる。全体的にN個のクラスタがある場合、発現スコアのN個のこのようなベクトルを有することになる。ここで計算しているのは、ベクトルにおいてスコアの変動性を定量化するための数値メトリックである。このようなメトリックの例に、全てのクラスタにわたる平均を取った平均発現スコアがある。以上の2つのベクトルを使用すると、平均スコアから次のスコアのベクトル、(50,20,50,45)が得られる。次いで、クラスタ毎に異なるスコアを計算することができる。先の第1クラスタでは、これは(-20,0,-10,35)となり、第2クラスタでは、これは(20,0,10,-35)となる。
【0163】
[0189] ある実施形態では、インターマーカ異質性メトリックはベクトル間の差の二乗平均平方根であってもよい。統計およびその応用では、二乗平均平方根は二乗平均の二乗根として定義される(1組の数値の二乗の算術的平均)。
【0164】
[0190] ある実施形態では、スコア間のばらつき(variations)は、加重平均に基づいてもよい。
[0191] 他の実施形態では、分類別スコア(binning score)を計算してもよい。例えば、各マーカ発現を二進化するために、ビニング・スコアを使用してもよい。
【0165】
[0192] マーカ1について、>10以上が陽性、それ以外は陰性。
[0193] マーカ2について、>1以上が陽性、それ以外は陰性。
[0194] マーカ3について、>50以上が陽性、それ以外は陰性。
【0166】
[0195] マーカ4について、>15以上が陽性、それ以外は陰性。
[0196] 以上のデータを使用すると、
[0197] 4つのマーカに対する平均は(+、+、+、+)、
[0198] クラスタ1について-(+、+、-、+)、
[0199] クラスタ2について-(+、+、+、-)となる。
【0167】
[0200] 次いで、二進化スコア(例えば、先に説明したようなハミング距離)または平均クラスタ・スコアとは異なるスコアの組み合わせを有するクラスタの数に基づいて、距離メトリックを計算することができる。
【0168】
[0201] ある実施形態では、インターマーカ異質性メトリックは、異なるクラスタにおける発現スコアのベクトルのばらつきを含む。
[0202] インターマーカ異質性の他の形態は、次のようにすることができる。マーカ毎に(異なるクラスタに跨がって)空間異質性を計算し、インターマーカ異質性は、個々のマーカ異質性スコアの和、ばらつき、二乗和のいずれかにすることができる。インターマーカ空間異質性の他の尺度は、全てのマーカからの発現スコアのベクトルの相関行列とすることができる。例えば、N個のクラスタがあり、したがってN個の発現スコア・ベクトルがあり、更にM個のマーカがある場合、相関行列はM×M行列となり、これは、値のスピアマン相関行列によって与えられる。スピアマン順位相関は、2つの変数間の関連度を測るために使用されるノンパラメトリック検査である。スピアマン順位相関検査は、データの分布について全く仮定を行わず、少なくとも序数である目盛り上で変数が測定されるときには、適した相関分析となる。
【0169】
[0203] 本開示の実施形態を実施するためのその他のコンポーネント
[0204] 本開示のシステム200は、組織標本上で1つ以上の調製プロセスを実行することができる標本処理装置に繋ぐことができる。調製プロセスは、限定ではなく、標本を脱パラフィンし、標本をコンディショニングし(例えば、細胞コンディショニング)、標本を染色し、抗原賦活化を実行し、免疫組織化学染色(標識付けを含む)または他の反応を実行し、および/またはイン・サイチュー・ハイブリダイゼーション(例えば、SISH、FISH等)染色(標識付けを含む)または他の反応を実行し、更には、顕微鏡撮影法、微細分析、質量分光分析法、または他の分析方法のために標本を調製する他のプロセスを実行することを含むことができる。
【0170】
[0205] 処理装置は、定着剤を標本に適用することができる。定着剤は、架橋剤(アルデヒド、例えば、ホルムアルデヒド、パラホルムアルデヒド、およびグルタルアルデヒド、ならびに非アルデヒド架橋剤のような)、酸化剤(例えば、四酸化オスミウムおよびクロム酸のような、金属イオンおよび複合体)、タンパク質変性剤(例えば、酢酸、メタノールおよびエタノール)、定着剤の未知のメカニズム(例えば、塩化第二水銀、アセトンおよびピクリン酸)、組合せ試薬(例えば、カルノア固定液、メタカーン、ブアン液、B5定着剤、ロスマンの液体およびジャンドルの液体)、マイクロ波および種々雑多な固定剤(例えば、体積固定および蒸気固定を除く)を含むことができる。
【0171】
[0206] 標本がパラフィン埋め込み試料である場合、適切な脱パラフィン液(1つまたは複数)を使用してこの試料を脱パラフィンすることができる。パラフィンが除去された後、任意の数の物質を連続的に標本に適用することができる。物質は、前処置(例えば、タンパク質架橋を逆にする、核酸を露出させる等のため)、変性、ハイブリダイゼーション、洗浄(例えば、ストリンジェンシ洗浄)、検出(例えば、視覚、またはマーカ分子をプローブにリンクする)、増幅(例えば、タンパク質、遺伝子等を増幅する)、対比染色、封入処理等のためとすることができる。
【0172】
[0207] 標本処理装置は、広範囲の物質を標本に適用することができる。物質は、限定ではなく、染料、プローブ、試薬、リンス、および/またはコンディショナを含む。物質は、流体(例えば、気体、液体、または気体/液体混合物)等とすることができる。流体は、溶媒(例えば、極性溶媒、非極性溶媒等)、溶液(例えば、水溶液または他のタイプの溶液)等とすることができる。試薬は、限定ではなく、 染料、湿潤剤、抗体(例えば、モノクロナール抗体、ポリクロナール抗体等)、抗原回復流体(例えば、水性または非水性系抗原光源緩衝液(retrieval solutions)、抗原光源回復緩衝剤(buffer)等)等を含むことができる。プローブは、検出可能な標識またはレポーター分子に付着した(attached)単離核酸または単離合成オリゴヌクレオチドとすることができる。標識は、放射性同位体、酵素基質、補因子、リガンド、化学発光または蛍光剤、ハプテン、および酵素を含むことができる。
【0173】
[0208] 標本処理装置は、Ventana Medical Systems,Inc.が販売するBENCHMARK XT機器(instrument)およびSYMPHONYC機器のような、自動装置とすることができる。Ventana Medical Systems,Inc.は、自動解析を行うためのシステムおよび方法を開示する多数の米国特許の譲受人であり、米国特許第5,650,327号、第5,654,200号、第6,296,809号、第6,352,861号、第6,827,901号、および第6,943,029号、および米国公開出願第2003/0211630号および第2004/0052685号を含む。これらの特許文書をここで引用したことにより、その内容全体が本願にも含まれるものとする。あるいは、標本を手作業で処理することもできる。
【0174】
[0209] 標本を処理した後、ユーザは、標本支持スライドを撮像装置に移送することができる。ある実施形態では、撮像装置は、明視野撮像スライド・スキャナである。明視野撮像装置の1つに、Ventana Medical Systems,Inc.が販売するiScan Coreo明視野スキャナがある。自動化された実施形態では、撮像装置は、IMAGING SYSTEM AND TECHNIQUES(撮像システムおよび技法)と題する国際特許出願第PCT/US2010/002772号(特許公報第WO/2011/049608号)、またはIMAGING SYSTEMS, CASSETTES, AND METHODS OF USING THE SAME(撮像システム、カセット、およびこれらの使用方法)と題する米国特許出願第61/533,114号、2011年9月9日出願に開示されているような、ディジタル病理デバイスである。国際特許出願第PCT/US2010/002772号および米国特許出願第61/533,114号をここで引用したことにより、その内容が本願にも含まれるものとする。
【0175】
[0210] 撮像システムまたは装置は、マルチスペクトル撮像(MSI)システムまたは蛍光顕微鏡システムであってもよい。本明細書において使用する撮像システムはMSIである。一般に、 MSIは、コンピュータ化顕微鏡に基づく撮像システムを病理標本の分析のために装備し、画素レベルにおける画像のスペクトル分布の利用法を提供する。種々のマルチスペクトル撮像システムが存在するが、これらのシステムの全てに共通する動作的態様はマルチスペクトル画像を形成する能力である。マルチスペクトル画像とは、電磁スペクトルにわたる特定の波長または特定のスペクトル帯域幅において画像データをキャプチャした画像である。これらの波長は、光学フィルタによって選別することができ、または、例えば、赤外線(IR)のような可視光範囲を超える波長における電磁放射光線を含む所定のスペクトル成分を選択することができる他の機器の使用によって選別することができる。
【0176】
[0211] MSIシステムは、光学撮像システムを含むことができ、その一部が、所定数Nの離散光帯域を定めるように調整可能な(tunable)スペクトル選択システムを内蔵する。この光学システムは、光検出器上に広帯域光源によって透過照明される組織試料を撮像するように構成する(adapt)ことができる。光学撮像システムは、一実施形態では、例えば、顕微鏡のような拡大システムを含むことができ、この光学システムの1つの光出力と空間的にほぼ一直線状である1本の光軸を有する。このシステムは、スペクトル選択システムが、異なる離散スペクトル帯域において画像が取得されることを確保するように調節または調整される(例えば、コンピュータ・プロセッサによって)に連れて、組織の画像のシーケンスを形成する。加えて、本装置はディスプレイも含むことができ、このディスプレイにおいて、取得された画像のシーケンスから、少なくとも1つの視覚的に知覚可能な組織の画像が現れる。スペクトル選択システムは、回折格子、薄膜干渉フィルタのような光学フィルタの集合体、あるいはユーザ入力または予めプログラミングされたプロセッサのコマンドのいずれかに応答して、光源から試料を透過して検出器に向かう光のスペクトルから特定の通過帯域を選択するように構成された任意の他のシステムのような、光分散エレメントを含むことができる。
【0177】
[0212] 代替実施態様では、スペクトル選択システムは、N個の離散スペクトル帯域に対応する様々な光出力を定める。この種のシステムは、光学システムからの透過光出力を取り込み、識別されたスペクトル帯域内の試料を、この識別されたスペクトル帯域に対応する光路に沿って、検出システム上に撮像するような方法で、この光出力の少なくとも一部を、N本の空間的に異なる光路に沿って空間的に方向転換させる。
【0178】
[0213] 本明細書において説明した主題および動作の実施形態は、ディジタル電子回路において、あるいは本明細書に開示する構造およびその構造的同等物を含めて、コンピュータ・ソフトウェア、ファームウェア、またはハードウェアにおいて、あるいは1つ以上のこれらの組み合わせにおいて、実現することができる。本明細書において説明した主題の実施形態は、1つ以上のコピュータ・プログラム、即ち、データ処理装置によって実行するためまたはデータ処理装置の動作を制御するために、コンピュータ記憶媒体上にエンコードされる1つ以上のコンピュータ・プログラム命令のモジュールとして実現することができる。本明細書において説明したモジュールはいずれも、プロセッサ(1つまたは複数)によって実行されるロジックを含むこともできる。「ロジック」とは、本明細書において使用する場合、プロセッサの動作に作用ために適用することができる命令信号および/またはデータの形態を有する任意の情報を指す。ソフトウェアは、ロジックの一例である。
【0179】
[0214] コンピュータ記憶媒体は、コンピュータ読み取り可能記憶デバイス、コンピュータ読み取り可能記憶基板、ランダムまたは連続アクセス・メモリ・アレイまたはデバイス、あるいはその1つ以上の組み合わせであること、あるいはこれらに含まれることも可能である。更に、コンピュータ記憶媒体は伝播信号ではないが、コンピュータ記憶媒体は、人工的に生成された伝播信号にエンコードされたコンピュータ・プログラム命令の供給源または宛先になることができる。また、コンピュータ記憶媒体は、1つ以上の別個の物理コンポーネントまたは媒体(例えば、複数のCD、ディスク、または他の記憶デバイス)であることもでき、あるいはこれらに含まれることも可能である。本明細書において説明した動作は、1つ以上のコンピュータ読み取り可能記憶デバイス上に格納されているデータ、または他のソースから受け取られたデータに対してデータ処理装置によって実行される動作として実現することができる。
【0180】
[0215] 「プログラミングされたプロセッサ」(programmed processor)という用語は、データを処理するためのあらゆる種類の装置、デバイス、および機械を包含し、例えば、プログラム可能なマイクロプロセッサ、コンピュータ、1つまたは複数のシステム・オン・チップ、あるいは以上のものの組み合わせを含む。前述の装置には、特殊用途のロジック回路、例えば、FPGA(フィールド・プログラマブル・ゲート・アレイ)またはASIC(特定用途集積回路)を含むことができる。また、前述の装置には、ハードウェアに加えて、対象のコンピュータ・プログラムのための実行環境を形成するコード、例えば、プロセッサ・ファームウェア、プロトコル・スタック、データベース管理システム、オペレーティング・システム、クロスプラットフォーム・ランタイム環境、仮想機械、あるいはこれらの1つ以上の組み合わせを構成するコードを含むことができる。前述の装置および実行環境は、ウェブ・サービス、分散型コンピューティング、およびグリッド・コンピューティング・インフラストラクチャのような、種々の異なるコンピューティング・モデル・インフラストラクチャを実現することができる。
【0181】
[0216] コンピュータ・プログラム(別名プログラム、ソフトウェア、ソフトウェア・アプリケーション、スクリプト、またはコード)は、コンパイラ型またはインタープリタ型言語、宣言型または手続き型言語を含む、任意の形式のプログラミング言語で書くことができ、更にこれは、単体プログラムとして、あるいはモジュール、コンポーネント、サブルーチン、オブジェクト、またはコンピューティング環境における使用に適した他のユニットとしてを含む、任意の形態でデプロイすることができる。コンピュータ・プログラムは、ファイル・システムにおけるファイルに対応することができるが、そうする必要はない。プログラムは、他のプログラムまたはデータ(例えば、マークアップ言語文書中に格納される1つ以上のスクリプト)を保持するファイルの一部に格納されてもよく、対象のプログラムに専用に割り当てられる1つのファイルに格納されてもよく、あるいは複数の調整されたファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部を格納するファイル)に格納されてもよい。コンピュータ・プログラムは、1つのコンピュータ上で実行されるように、あるいは1つのサイトに位置するか、または複数のサイトにまたがって分散され、そして通信ネットワークによって相互接続される、複数のコンピュータ上で実行されるように、デプロイすることもできる。
【0182】
[0217] 入力データに対して動作し、出力を生成することによって、アクションを実行する1つ以上のコンピュータ・プログラムを実行する1つ以上のプログララマブル・プロセッサによって、本明細書に記載したプロセスおよびロジック・フローを実行することができる。また、プロセスおよびロジック・フローは、特殊用途のロジック回路、例えば、FPGA(フィールド・プログラマブル・ゲート・アレイ)またはASIC(特定用途集積回路)によって実行することもでき、更に装置も、こうしたロジック回路として実装することができる。
【0183】
[0218] コンピュータ・プログラムの実行に適したプロセッサは、例えば、汎用および特殊用途マイクロプロセッサの双方、ならびに任意の種類のディジタル・コンピュータの任意の1つ以上のプロセッサも含まれる。一般に、プロセッサは、命令およびデータを読み取り専用メモリまたはランダム・アクセス・メモリあるいは両方から受け取る。コンピュータの必須要素は、命令にしたがって動作を実行するためのプロセッサ、ならびに命令およびデータを記憶するための1つ以上のメモリ・デバイスである。一般に、コンピュータはデータを記憶するための1つ以上の大容量記憶デバイス、例えば、磁気ディスク、光磁気ディスク、または光ディスクも含み、あるいはこのようなデバイスからデータを受け取るように、またはこのようなデバイスにデータを転送するように、あるいは双方を行うように動作可能に結合される。しかしながら、コンピュータはこのようなデバイスを有する必要はない。更に、数例をあげると、コンピュータは、他のデバイス、例えば、移動体電話、パーソナル・ディジタル・アシスタント(PDA)、移動体オーディオまたはビデオ・プレーヤ、ゲーム・コンソール、汎地球測位システム(GPS)受信機、あるいは携帯用記憶デバイス(例えば、ユニバーサル・シリアル・バス(USB)フラッシュ・ドライブ)に埋め込むことができる。コンピュータ・プログラム命令およびデータを記憶するのに適したデバイスには、すべての形式の不揮発性メモリ、媒体およびメモリ・デバイスが含まれ、一例として、半導体記憶デバイス、例えば、EPROM、EEPROM、およびフラッシュ・メモリ・デバイス、磁気ディスク、例えば、内部ハード・ディスクまたはリムーバブル・ディスク、光磁気ディスク、ならびにCD-ROMおよびDVD-ROMディスクが含まれる。プロセッサおよびメモリは、特殊用途ロジック回路によって補充すること、またはこのロジック回路に組み込むこともできる。
【0184】
[0219] ユーザとの対話処理に備えるため、本明細書において説明した主題の実施形態は、ユーザに情報を表示するためのディスプレイ・デバイス、例えば、LCD(液晶ディスプレイ)、LED(発光ダイオード)ディスプレイ、またはOLED(有機発光ダイオード)ディスプレイ、ならびにユーザがコンピュータに入力を供給することができるキーボードおよびポインティング・デバイス、例えば、マウスまたはトラックボールを有するコンピュータ上に実装することができる。ある実施態様では、タッチスクリーンを使用して情報を表示し、そしてユーザからの入力を受け取ることができる。また、他の種類のデバイスを使用して、ユーザとの対話処理に備えることもできる。例えば、ユーザに提供されるフィードバックは、任意の形式の感覚フィードバック、例えば、視覚的フィードバック、聴覚的フィードバック、または触覚的フィードバックとすることができ、そしてユーザからの入力を、音響入力、音声入力、または触覚入力を含む任意の形式で受け取ることができる。加えて、コンピュータは、ユーザが使用するデバイスに文書を送り、そしてこのデバイスから文書を受け取ることによって、例えば、ウェブ・ブラウザから受けた要求に応じて、ユーザのクライアント・デバイス上のウェブ・ブラウザにウェブ・ページを送ることによって、ユーザと対話処理することができる。
【0185】
[0220] 本明細書において説明した主題の実施形態は、例えば、データ・サーバのようなバック・エンド・コンポーネントを含むか、あるいはミドルウェア・コンポーネント、例えば、アプリケーション・サーバを含むか、あるいはフロント・エンド・コンポーネント、例えば、ユーザが本明細書において説明した主題の実施態様と相互作用することができるグラフィカル・ユーザ・インターフェースまたはウェブ・ブラウザを有するクライアント・コンピュータを含むコンピューティング・システム、あるいは1つ以上のこのようなバックエンド、ミドルウェアまたはフロント・エンド・コンポーネントの任意の組み合わせで実現することができる。任意の形式または媒体のディジタル・データ通信、例えば、通信ネットワークによって、本システムのコンポーネントを相互接続することができる。通信ネットワークの例には、ローカル・エリア・ネットワーク(「LAN」)およびワイド・エリア・ネットワーク(「WAN」)、相互ネットワーク(例えば、インターネット)、ならびにピア・ツー・ピア・ネットワーク(例えば、アドホック・ピア・ツー・ピア・ネットワーク)が含まれる。例えば、図1のネットワーク20には、1つ以上のローカル・エリア・ネットワークを含むことができる。
【0186】
[0221] コンピューティング・システムには、任意の数のクライアントおよびサーバ含むことができる。クライアントおよびサーバは、通常互いに離れており、そして通信ネットワークを通じて相互作用するのが通例である。クライアントおよびサーバの関係は、それぞれのコンピュータ上で実行され、そして互いにクライアント-サーバ関係を有するコンピュータ・プログラムによって生じる。ある実施形態では、サーバは、データ(例えば、HTMLページ)をクライアント・デバイスに(例えば、クライアント・デバイスと対話処理するユーザにデータを表示し、そしてこのユーザからユーザ入力を受け取る目的で)送信する。クライアント・デバイスにおいて生成されるデータ(例えば、ユーザ対話処理の結果)を、サーバにおいてクライアント・デバイスから受信することができる。
【0187】
[0222] 追加の実施形態
[0223] 本開示の他の態様は、細胞クラスタ間で異質性を比較するシステムである。このシステムは、(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合されたメモリであって、コンピュータ実行可能命令を格納する、メモリとを備える。コンピュータ実行可能命令が1つ以上のプロセッサによって実行されると、(i)第1染色を有する生体試料の第1画像内および一連の追加画像内において、細胞を検出および分類する動作であって、一連の追加画像における各画像が異なる染色を有する(即ち、異なるバイオマーカの存在を求めて染色される)、動作と、(ii)第1画像内において1つ以上の細胞クラスタを識別する動作であって、グラフ理論手法を使用して細胞クラスタを識別する、動作と、(iii)第1画像において識別された1つ以上のクラスタを一連の追加画像にマッピングして、写像クラスタが得られるように、第1画像および一連の追加画像を共通座標系に位置合わせする動作と、(iv)写像クラスタの各々における染色毎に発現スコアを導き出す動作と、(vi)異なるクラスタからの発現スコアの変動性を定量化するためのメトリックを計算する動作とを含む動作を、1つ以上のプロセッサに実行させる。ある実施形態では、このシステムは、更に、導き出した発現スコアに基づいて、1つ以上のインターマーカ異質性スコアを計算する命令も含む。
【0188】
[0224] ある実施形態では、細胞クラスタを識別するグラフ理論手法は、(i)細胞の空間隣接行列を構築するステップと、(ii)グラフ理論アルゴリズム、即ち、グラフにおいて「コミュニティ・ネットワーク」を検出するアルゴリズムを使用して、細胞の干渉クラスタを識別するステップとを含む。ある実施形態では、細胞の空間隣接行列の構築は、(i)各細胞をグラフにおけるノード/頂点として定めるステップと、(ii)互いに約30から約70ミクロン以内で離間された細胞ノードを接続ノードとして識別するステップと、(iii)2つの接続ノード間のリンクをエッジとして定めるステップと、(iv)全ての細胞/頂点に対して、その接続エッジ情報と共に、隣接行列を構築するステップとを含む。ある実施形態では、細胞の干渉クラスタを識別する手順は、(i)細胞のネットワークにおける全ての既存のエッジの「媒介性」を計算するステップと、(ii)最も高い「媒介性」を有するエッジを除去するステップと、(iii)この除去によって影響を受けた全てのエッジの「媒介性」を再計算するステップと、(iv)エッジがなくなるまでステップ(ii)および(iii)を繰り返すステップとを含む。ある実施形態では、細胞は、腫瘍細胞、間質細胞、またはリンパ球の内少なくとも1つとして分類される。ある実施形態では、第1画像はH&E画像であり、一連の追加画像はバイオマーカ画像、例えば、特異的バイオマーカを求めてIHCアッセイにおいて染色された画像である。ある実施形態では、このシステムは、更に、1つ以上の細胞クラスタの識別の前に、画像における腫瘍および腫瘍外周領域に電子的に注釈を付ける命令も含む。
【0189】
[0225] 本開示の他の態様は、細胞クラスタ間で異質性を比較するシステムである。このシステムは、(i)1つ以上のプロセッサと、(iii)1つ以上のプロセッサに結合されたメモリであって、コンピュータ実行可能命令を格納する、メモリとを備える。 コンピュータ実行可能命令が1つ以上のプロセッサによって実行されると、(i)第1染色を有する生体試料の第1画像内において細胞を分類する動作と、(ii)第1画像内において1つ以上の細胞クラスタを識別する動作であって、グラフ理論手法を使用して細胞クラスタを識別する、動作と、(iii)第1画像において識別された1つ以上のクラスタを一連の追加画像にマッピングして、写像クラスタが得られるように、第1画像および一連の追加画像を共通座標系に位置合わせする動作であって、一連の追加画像の各々が異なる染色を含む、動作と、(iv)写像クラスタの各々において各染色に対する発現スコアを導き出す動作とを含む動作を、1つ以上のプロセッサに実行させる。
【0190】
[0226] 本開示の他の態様は、クラスタ間細胞異質性に関連する1つ以上のメトリックを導き出すための非一時的コンピュータ読み取り可能媒体であり、(i)第1染色を有する第1画像から特徴を抽出する動作であって、抽出された特徴が、第1画像内において細胞を分類するために使用される、動作と、(ii)細胞分類に基づいて第1画像内において1つ以上の細胞クラスタを識別する動作であって、細胞クラスタが、(a)隣接行列を構築し、(b)コミュニティ・ネットワーク・アルゴリズムを使用して細胞の干渉クラスタを識別することによって、識別される、動作と、(iii)第1画像において識別された1つ以上のクラスタを一連の追加画像にマッピングして、写像クラスタが得られるように、第1画像および一連の追加画像を共通座標系に位置合わせする動作であって、一連の追加画像の各々が異なる染色を有する、動作と、(iv)写像クラスタの各々において各染色に対する発現スコアを導き出す動作と、(v)導き出した発現スコアに基づいて、1つ以上のインターマーカ異質性スコアを計算する動作とを含む。ある実施形態では、隣接行列の構築は、(a)細胞ノードを判定する動作と、(b)ノードの対間においてエッジを確定する動作とを含む。ある実施形態では、細胞ノードは互いに約50ミクロン以内に位置する。
【0191】
[0227] 本開示の他の態様は、インターマーカ異質性スコアを計算する方法であり、
(a)第1染色を有する第1画像内において細胞(例えば、腫瘍細胞、リンパ球、間質等)を識別するステップと、(b)細胞分類結果に基づいて、第1画像において空間異質性細胞クラスタを識別するステップと、(c)識別した空間異質性クラスタを第1画像から一連の追加画像の各々にマッピングして、各画像において写像クラスタを得るステップであって、一連の追加画像の各々が異なる染色を有する、ステップと、(d)第1画像の各クラスタにおいて、更に一連の追加画像の各写像クラスタにおいて、各染色に対する発現スコアを導き出すステップと、(e)1つ以上のインターマーカ異質性メトリックを計算するステップとを含む。
【0192】
[0228] 腫瘍内変動性を分析するシステムであって、1つ以上のプロセッサと、1つ以上のプロセッサに結合されたメモリとを備え、メモリがコンピュータ実行可能命令を格納し、コンピュータ実行可能命令が1つ以上のプロセッサによって実行されると、多重画像を一連の分離画像チャネル画像に分離する動作と、第1分離画像チャネル画像内において細胞を分類する動作と、第1分離画像チャネル画像内において1つ以上の細胞クラスタを識別する動作であって、グラフ理論手法を使用して細胞クラスタを識別する、動作と、残りの分離画像チャネル画像の各々において、各染色に対する発現スコアを導き出す動作とを含む動作を、1つ以上のプロセッサに実行させる。ある実施形態では、このシステムは、更に、導き出した発現スコアに基づいて、1つ以上のインターマーカ異質性スコアを計算する命令も含む。
【0193】
[0229] 複数の染色を有する生体試料に対してインターマーカ異質性スコアを計算する方法であって、多重画像を一連の分離画像チャネル画像に分離するステップと、分離画像チャネル画像の内第1のものにおいて細胞を検出および分類するステップと、細胞分類結果を使用して、分離画像チャネル画像の内第1のものにおいて、空間的に異質な細胞クラスタを識別するステップと、分離画像チャネル画像の内第1のものにおいて、更に残りの分離画像チャネル画像の各々において、各クラスタにおける各染色に対する発現スコアを導き出すステップと、識別したクラスタ間において1つ以上のインターマーカ異質性スコアを計算するステップとを含む。ある実施形態では、この方法は、更に、残りの分離画像チャネル画像の各々において細胞を検出し識別するステップを含む。
【0194】
[0230] 腫瘍内変動性を分析するシステムであって、このシステムが、(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合されたメモリであって、コンピュータ実行可能命令を格納する、メモリとを備え、コンピュータ実行可能命令が1つ以上のプロセッサによって実行されると、(i)第1染色を有する生体試料の第1画像内において細胞を分類する動作と、(ii)第1画像内において1つ以上の細胞クラスタを識別する動作であって、グラフ理論手法を使用して細胞クラスタを識別する、動作と、(iii)第1画像において識別された1つ以上のクラスタを一連の追加画像にマッピングして、写像クラスタが得られるように、第1画像および一連の追加画像を共通座標系に位置合わせする動作であって、一連の追加画像の各々が異なる染色を有する、動作と、(iv)一連の追加画像における画像毎に細胞を検出および分類する動作と、(v)第1画像の各クラスタにおいて、更に一連の追加画像の各写像クラスタにおいて、各染色に対応する発現スコアを導き出す動作と、(vi)導き出した発現スコアに基づいて、1つ以上のインターマーカ異質性スコアを計算する動作とを含む動作を、このシステムに実行させる。
【0195】
[0231] 腫瘍内変動性を分析するシステムであって、このシステムが、
(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合されたメモリであって、コンピュータ実行可能命令を格納する、メモリとを備え、コンピュータ実行可能命令が1つ以上のプロセッサによって実行されると、(i)第1染色を有する生体試料の第1画像内において細胞を分類する動作と、(ii)第1画像内に置いて1つ以上の細胞クラスタを識別する動作であって、グラフ理論手法を使用して細胞クラスタを識別する、動作と、(iii)第1画像において識別された1つ以上のクラスタを複数の追加画像にマッピングして、写像クラスタが得られるように、第1画像および複数の追加画像を共通座標系に位置合わせする動作であって、複数の追加画像の各々が異なる染色を有する、動作と、(iv)複数の追加画像における画像毎に細胞を検出および分類する動作と、(v)第1画像の各クラスタにおいて、更に複数の追加画像の各写像クラスタにおいて、各染色に対応する発現スコアを導き出す動作と、(vi)導き出した発現スコアに基づいて1つ以上のインターマーカ異質性スコアを計算する動作とを含む動作を、このシステムに実行させる。
【0196】
[0232] 本明細書において引用した、および/または出願データ・シートにおいて列挙した米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、および特許以外の刊行物の全ては、引用したことによって、その全体が本願にも含まれるものとする。実施形態の態様は、必要であれば、種々の特許、出願、および公開の概念を採用して、更に他の実施形態を提供するために変更することができる。
【0197】
[0233] 以上、多数の例示的な実施形態を参照しながら本開示について説明したが、本開示の原理の主旨および範囲に該当する数多くの他の変更や実施形態が、当業者によって考案できることは理解されてしかるべきである。更に特定すれば、以上の開示、図面、および添付した請求項の範囲内で、本開示の主旨から逸脱することなく、主題の組み合わせ構成のコンポーネント部分および/または配置において、合理的な変形および変更が可能である。コンポーネント部分および/または配置における変形ならびに変更に加えて、代替使用も当業者には明白であろう。
【0198】
[0234] 更に他の実施形態では、以上の動作は、更に、1つ以上の細胞クラスタの識別の前に、画像に電子的に注釈を付けるステップも含む。
図1
図2
図3A
図3B
図4A
図4B
図5
図6
図7A
図7B
図8A
図8B
図9A
図9B
図10A
図10B