(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-18
(54)【発明の名称】デジタル病理画像からのアクショナブル変異の予測
(51)【国際特許分類】
G01N 33/48 20060101AFI20240611BHJP
G06T 7/00 20170101ALI20240611BHJP
G01N 33/483 20060101ALI20240611BHJP
【FI】
G01N33/48 M
G06T7/00 630
G06T7/00 350B
G01N33/483 C
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023570307
(86)(22)【出願日】2022-05-14
(85)【翻訳文提出日】2023-12-28
(86)【国際出願番号】 US2022029329
(87)【国際公開番号】W WO2022241300
(87)【国際公開日】2022-11-17
(32)【優先日】2021-05-14
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-08-31
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2022-04-19
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】509012625
【氏名又は名称】ジェネンテック, インコーポレイテッド
(71)【出願人】
【識別番号】514099673
【氏名又は名称】エフ・ホフマン-ラ・ロシュ・アクチェンゲゼルシャフト
(71)【出願人】
【識別番号】511286517
【氏名又は名称】ヴェンタナ メディカル システムズ, インク.
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】オカンポ, パオロ サンティアーゴ シフーコ
(72)【発明者】
【氏名】シュティンペル, ベルンハルト
(72)【発明者】
【氏名】ポーワル, プラサンナ
(72)【発明者】
【氏名】ニエ, ヤオ
(72)【発明者】
【氏名】シェイクザデ, ファヒム
(72)【発明者】
【氏名】ショスタク, プシェミスワフ
(72)【発明者】
【氏名】アガエイ, ファラナク
(72)【発明者】
【氏名】リー, シアオ
【テーマコード(参考)】
2G045
5L096
【Fターム(参考)】
2G045AA24
2G045AA26
2G045BA14
2G045BB24
2G045CB02
2G045FA19
2G045JA01
5L096BA06
5L096BA13
5L096CA02
5L096DA02
5L096FA32
5L096FA33
5L096FA34
5L096FA39
5L096FA52
5L096FA55
5L096FA59
5L096FA66
5L096GA30
5L096GA34
5L096GA51
5L096HA11
5L096KA04
5L096MA07
(57)【要約】
本方法は、対象から採取された腫瘍細胞を示すデジタル病理画像にアクセスすることを含む。複数のパッチがデジタル病理画像から選択され得て、パッチのそれぞれは、腫瘍細胞を示す。変異予測は、パッチのそれぞれについて生成され得て、変異予測は、アクショナブル変異がパッチに出現する可能性の予測を表す。複数の変異予測に基づいて、対象についての1つまたは複数の処置レジメンに関連する予後予測が生成され得る。予後予測は、デジタル病理画像の1つまたは複数の変異状況を未知のドライバーまたは腫瘍抑制因子、癌遺伝子ドライバー変異、または遺伝子融合として判定することに基づき得る。
【選択図】
図10C
【特許請求の範囲】
【請求項1】
デジタル病理画像処理システムによって、
対象から採取された腫瘍細胞を示すデジタル病理画像にアクセスすることと、
前記デジタル病理画像から複数のパッチを選択することであって、前記パッチのそれぞれが腫瘍細胞を示す、複数のパッチを選択することと、
前記パッチのそれぞれについて変異予測を生成することであって、前記変異予測が、アクショナブル変異が前記パッチに出現する可能性の予測を表す、変異予測を生成することと、
複数の前記変異予測に基づいて、前記対象についての1つまたは複数の処置レジメンに関連する予後予測を生成することと
を含む、方法。
【請求項2】
前記変異予測を生成することが、
前記複数のパッチのそれぞれから1つまたは複数の特徴を検出することであって、前記1つまたは複数の特徴が、臨床的特徴または組織学的特徴のうちの1つまたは複数を含み、前記複数のパッチのそれぞれについてラベルを生成することが、前記1つまたは複数の特徴に基づいている、1つまたは複数の特徴を検出することを含む、請求項1に記載の方法。
【請求項3】
前記変異予測を生成することが腫瘍形態に基づいており、前記腫瘍形態が、印環細胞の存在、印環細胞の数、肝様細胞の存在、肝様細胞の数、細胞外ムチン、または腫瘍増殖パターンのうちの1つまたは複数の分析に基づいている、請求項1に記載の方法。
【請求項4】
前記変異予測を生成することが、1つまたは複数の機械学習モデルに基づいており、前記方法が、腫瘍細胞の1つまたは複数のラベル付けされた表示および他の組織学的特徴または臨床的特徴の1つまたは複数のラベル付けされた表示を含む複数の訓練データに基づいて、前記1つまたは複数の機械学習モデルを訓練することをさらに含む、請求項1に記載の方法。
【請求項5】
前記予後予測を生成することが、1つまたは複数の追加のデジタル病理画像からパッチについての変異予測を生成することに基づいており、前記1つまたは複数の追加のデジタル病理画像のそれぞれが、前記対象からの生物学的試料の追加の特定の試料を示し、前記分析が、
前記1つまたは複数の追加のデジタル病理画像から前記パッチのそれぞれについて変異予測を生成することと、
前記変異予測の全てに基づいて前記対象についての組み合わせ予後予測を生成することと
を含む、請求項1に記載の方法。
【請求項6】
グラフィカルユーザインターフェースを介して、前記予後予測を出力することであって、前記グラフィカルユーザインターフェースが、前記デジタル病理画像のグラフィカル表現を含み、前記グラフィカル表現が、前記複数のパッチのそれぞれについて生成された前記変異予測の指示と、前記予後予測に関連付けられた予測信頼度とを含む、前記予後予測を出力することをさらに含む、請求項1に記載の方法。
【請求項7】
前記1つまたは複数の処置レジメンの使用に関連付けられた推奨を生成することをさらに含む、請求項1に記載の方法。
【請求項8】
生物学的試料の特定の部分が1つまたは複数の染色剤によって染色されたものである、請求項1に記載の方法。
【請求項9】
前記予後予測を生成することが、前記パッチについて生成された前記変異予測の重み付けされた組み合わせにさらに基づいている、請求項1に記載の方法。
【請求項10】
腫瘍細胞を示すパッチについての変異予測を生成することが、
前記腫瘍細胞を表現型に分類することであって、前記表現型のそれぞれが異なる変異クラスに対応する、前記腫瘍細胞を表現型に分類することを含む、請求項1に記載の方法。
【請求項11】
前記腫瘍細胞を表現型に分類することが、
前記パッチにおける核不均一性を識別することと、
識別された前記核不均一性を定量することであって、前記変異予測を生成することが、定量された前記核不均一性にさらに基づいている、識別された前記核不均一性を定量することと
を含む、請求項10に記載の方法。
【請求項12】
前記変異予測を生成することが、
空間分布を評価するために細胞レベルの空間分析を行うことであって、前記空間分布が、クローン細胞の領域および前記クローン細胞の領域のそれぞれの内の細胞の空間的配置を示す、細胞レベルの空間分析を行うことを含む、請求項10に記載の方法。
【請求項13】
空間分布を評価することが、
前記腫瘍細胞の最小全域木のサブグラフ内のスペクトル距離を測定することであって、前記サブグラフのそれぞれが腫瘍巣を表す、スペクトル距離を測定することと、
全ての前記サブグラフにわたってペアワイズに隣接スペクトル距離を計算することと
を含む、請求項12に記載の方法。
【請求項14】
前記サブグラフのそれぞれが、外れ値検出を実行することによって定義される、請求項13に記載の方法。
【請求項15】
前記サブグラフのそれぞれが、検出された腫瘍巣のセグメンテーションに基づいて定義される、請求項13に記載の方法。
【請求項16】
前記変異予測を生成することが、
空間エントロピーを評価するために細胞レベルの空間分析を行うことによって、前記パッチにおける密接に隣接するクローン細胞の領域を識別することを含む、請求項10に記載の方法。
【請求項17】
空間エントロピーを評価することが、
別個の距離ビンのセットを指定することであって、前記距離ビンのそれぞれが、一対の腫瘍細胞間の距離の範囲に対応する、別個の距離ビンのセットを指定することと、
前記距離ビンのそれぞれについて、前記腫瘍細胞の対を識別することであって、前記対のそれぞれにおける前記腫瘍細胞間の前記距離が、前記距離ビンに対応する前記距離の範囲内にある、前記腫瘍細胞の対を識別することと、
前記距離ビンのそれぞれについて、形態学的に類似していると識別された腫瘍細胞の対の頻度を計算することと、
表現型に分類された腫瘍細胞の各可能な対について、前記腫瘍細胞の対を所定数のビンのうちの1つに分類することであって、前記ビンのそれぞれが、前記対における前記細胞のそれぞれの空間位置間の距離を表す、前記腫瘍細胞の対を所定数のビンのうちの1つに分類することと、
前記ビンのそれぞれについて、前記ビン中の前記腫瘍細胞の対の分類の頻度を計算することと
を含む、請求項16に記載の方法。
【請求項18】
各距離ビンに適用される重みが、前記距離ビン中の腫瘍細胞の対の数に対応し得る、請求項17に記載の方法。
【請求項19】
前記距離ビンのセットが、指定された閾値を下回る最大距離を有する距離範囲を表すビンのみに制限され得る、請求項17に記載の方法
【請求項20】
前記予後予測を生成することが、
前記デジタル病理画像の変異状況を未知のドライバーまたは腫瘍抑制因子であると判定することであって、前記腫瘍細胞のクラスタの不均一性のレベルが高く、前記予後予測が免疫療法を含む処置レジメンに関連する、前記デジタル病理画像の変異状況を未知のドライバーまたは腫瘍抑制因子であると判定することを含む、請求項1に記載の方法。
【請求項21】
前記予後予測を生成することが、
前記デジタル病理画像の変異状況を癌遺伝子ドライバー変異であると判定することであって、前記腫瘍細胞のクラスタの不均一性のレベルが中程度であり、前記予後予測が変異に対応する標的療法を含む処置レジメンに関連する、前記デジタル病理画像の変異状況を癌遺伝子ドライバー変異であると判定することを含む、請求項1に記載の方法。
【請求項22】
前記パッチの少なくとも1つにアクショナブル変異が出現した場合、前記1つまたは複数の処置レジメンが、前記アクショナブル変異に関連付けられた標的療法を含み、
そうでなければ、前記1つまたは複数の処置レジメンが免疫療法を含む、請求項1に記載の方法。
【請求項23】
ソフトウェアを具現化する1つまたは複数のコンピュータ可読非一時的記憶媒体であって、前記ソフトウェアが、実行されると、
対象から採取された腫瘍細胞を示すデジタル病理画像にアクセスすることと、
前記デジタル病理画像から複数のパッチを選択することであって、前記パッチのそれぞれが腫瘍細胞を示す、複数のパッチを選択することと、
前記パッチのそれぞれについて変異予測を生成することであって、前記変異予測が、アクショナブル変異が前記パッチに出現する可能性の予測を表す、変異予測を生成することと、
前記複数の変異予測に基づいて、前記対象についての1つまたは複数の処置レジメンに関連する予後予測を生成することと
を行うように動作可能である、コンピュータ可読非一時的記憶媒体。
【請求項24】
1つまたは複数のプロセッサと、前記プロセッサによって実行可能な命令を含む、前記プロセッサに結合された非一時的メモリと、を備えるシステムであって、前記プロセッサが、前記命令を実行すると、
対象から採取された腫瘍細胞を示すデジタル病理画像にアクセスすることと、
前記デジタル病理画像から複数のパッチを選択することであって、前記パッチのそれぞれが腫瘍細胞を示す、複数のパッチを選択することと、
前記パッチのそれぞれについて変異予測を生成することであって、前記変異予測が、アクショナブル変異が前記パッチに出現する可能性の予測を表す、変異予測を生成することと、
前記複数の変異予測に基づいて、前記対象についての1つまたは複数の処置レジメンに関連する予後予測を生成することと
を行うように動作可能である、システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、癌の診断、処置および予後に関する。
【背景技術】
【0002】
背景
癌処置を計画する際の1つの重要なステップは、疾患の進行および患者のアドヒアランスの可能性の両方を考慮して、最も有効である可能性が高い処置選択肢を識別することである。悪性腫瘍が特定のサイズを超えて増殖し、および/または転移した後、患者の選択肢は、化学療法、放射線療法、標的療法、および免疫療法などの処置に限定されることがある。患者を病気にする重度の副作用のために、患者のアドヒアランスは、化学療法および放射線療法では困難であることがある。患者はまた、癌細胞が変異し、全身療法に対して耐性になり得るリスクに直面している。これらの処置選択肢の中で最も新規な免疫療法は、患者自身の免疫系を活性化させ、癌の管理における重要な選択肢を表すが、腫瘍の20%~30%に対してのみ有効であり得る。一般に、様々な腫瘍タイプにわたって、即時の臨床的利益を最大化するために、ならびに患者の将来の処置選択肢を保護するために、以下の理論的根拠が適用される。第1のステップとして、高ステージの疾患を有する患者は、最初に標的療法の適格性についてスクリーニングされるべきである。変異標的が識別されない場合、患者には免疫療法が単独で、または従来の化学療法と組み合わせて提供される。最後の手段として、この組み合わせが失敗した場合、化学療法の組み合わせが考慮され得る。
【0003】
標的療法は好ましいかもしれないが、対処指定可能な変異が少ないため、腫瘍の小さなサブセットにのみ適している。現在承認されている治療法に基づいて、対処可能な変異は、異なる細胞機能を積極的に調節する遺伝子である癌遺伝子にのみ生じる。肺癌では、最も一般的でアクショナブル変異は、以下の癌遺伝子に見られる:EGFR、ALK、RET、ROS1、およびNTRK。癌遺伝子とは別に、腫瘍抑制因子として知られる第2のクラスの遺伝子もまた、変異した場合に癌をもたらす可能性がある。それらの名称が示唆するように、これらの遺伝子は、通常、細胞活性を抑制するように機能する。したがって、これらの遺伝子における変異は、抑制の喪失を介して癌をもたらすであろう。最後に、臨床診療では、次世代シーケンシング(NGS)パネルを使用して、腫瘍の最も包括的な分子特性評価が行われる。このアッセイは、遺伝子のサブセットにおける変異のみを検出し、一部のパネルは、25個程度の低い遺伝子を照会し、他のパネルは、500個までの遺伝子を照会することができる。これは、ヒトゲノム中の20,000~25,000個の全遺伝子の微小割合を表す。これは、NGS(未知のドライバー)によって検査された腫瘍試料の一部にドライバー変異が見出されない理由を説明することができる。
【0004】
標的療法は、上皮増殖因子受容体(EGFR)を標的とする医薬、ならびに未分化リンパ腫キナーゼ(ALK)、RET、ROS1および神経栄養性チロシン受容体キナーゼ(NTRK)を含む遺伝子融合を含み得る。EGFRの場合、最も一般的な変異体(例えば、最大97%のEGFR陽性肺腺癌患者をカバーする)を識別するために免疫組織化学的染色が使用され得るが、EGFRを標的とした治療に失敗した患者における耐性変異を識別するために分子検査が必要な場合がある。RETおよびROS1についてはそのような免疫組織化学的染色は開発されておらず、ALKおよびNTRKについての免疫組織化学的染色の性能は非常に可変的であり、解釈が困難であり得る。
【0005】
遺伝子融合は、限られた数の遺伝子座を検査する、より一般的に使用される「ホットスポット」アッセイよりもゲノムのカバレッジが高い、より洗練された分子アッセイをしばしば必要とする。遺伝子融合を標的とするためには、はるかに広いカバレッジを必要とし、はるかに高価な検査をもたらすことがあり、検査室が実行するためにはるかに高い技術的能力を必要とする。しかしながら、いくつかの遺伝子融合(例えば、NTRK融合)は、非常に稀であり得る。NTRK融合は、多種多様な腫瘍タイプで識別されているが、この特異的融合の頻度は、(例えば、肺腺癌、結腸直腸癌、および非分泌性乳癌などにおいて)最も一般的な癌適応症では1%未満であり得る。遺伝子融合の比較的希少性(例えば、肺腺癌におけるALKについての7%からNTRKについての0.3%未満の範囲)は、広範な検査に対する技術的および経済的な著しい阻害要因となる。現在、分子検査は、遺伝子融合が患者に存在するかどうかを判定するためにこれまで利用可能な唯一の方法である。しかしながら、分子検査は、高価であるため、患者は、患者が標的療法から利益を得られない可能性が高いことに起因して、分子検査のスケジューリングを避けることがある。結果として、かなりの割合の患者は、それらの腫瘍が遺伝子融合を有するかどうかを判定するために正しい検査を受ける可能性が低い可能性がある。したがって、最初の最良の全身処置選択肢を決定するために必要な検査のタイプによって腫瘍試料を分類するための迅速で堅牢で高感度のスクリーニングツールが望まれている。
【発明の概要】
【0006】
特別な実施形態の概要
本明細書では、デジタル病理技術を使用して、限定ではなく例として、癌遺伝子融合(例えば、ALK、ROS1、RETおよびNTRK)を含むアクショナブル変異を識別するシステムおよび方法が提供され、アクショナブル変異は、標的療法が利用可能な変異および処置応答の予後の予測である。
【0007】
いくつかの例では、開示される方法およびシステムは、遺伝子融合/再編成、多くの異なる癌タイプにわたって識別することができ、腫瘍組織試料中に存在する場合、特定の標的療法に対する堅牢な応答を示し得る特定のタイプの稀で創薬可能な発癌性変異事象の検出に適用され得る。遺伝子融合は、多くの異なる腫瘍タイプにわたって起こることができ、新規療法によってますます標的化される、稀で創薬可能な変異事象を含む。遺伝子融合の識別は、最終的にそのような遺伝子変化を有する少数の患者にしか利益をもたらさないことがある技術的に困難で高価で時間のかかるプロセスとすることができる。これらの理由から、広範な検査は、このプロセスに関与する技術的および財政的資源を吸収および提供する余裕を有することができる少数の病院に限定され得る。本明細書に開示される実施形態は、癌組織/細胞(例えば、肺腺癌)を示す走査染色された(例えば、ヘマトキシリンおよびエオシン(H&E)染色された)全スライド画像(WSI)などのデジタル病理画像から発癌性融合の存在を予測することができる機械学習モデル(例えば、デジタル病理スクリーニングモデル)の作成、訓練、および使用を通じてこの相違に対処し得る。さらに、本明細書に開示される実施形態は、(限定されるものではないが、肺腺癌患者を含む)患者の個体についての標的療法の使用に関する分子検査および意思決定を導くために使用され得る、迅速で、安価で、および十分に正確なスクリーニングツールを含み得る。
【0008】
特定の実施形態では、デジタル病理画像処理システムは、対象からの生物学的試料の特定の部分における癌細胞を示すデジタル病理画像にアクセスし得る。次いで、デジタル病理画像処理システムは、それぞれが腫瘍細胞の1つまたは複数のクラスタ(例えば、腫瘍細胞から完全に構成される領域、または間質によって取り囲まれた1つまたは複数の腫瘍巣構造を含む領域)を示す、デジタル病理画像から1つまたは複数の画像パッチを識別し得る。場合によっては、デジタル病理画像が複数のタイルに分割されている場合、画像パッチは、画像タイルの一部、複数の隣接タイル、または1つもしくは複数の隣接タイルとタイルの1つもしくは複数の隣接部分との組み合わせを含み得る。デジタル病理画像処理システムは、複数の画像パッチのそれぞれについて、画像パッチが腫瘍細胞のクラスタを示す可能性(例えば、バイナリ出力またはパーセンテージ出力)を示すラベルを生成し得る。特定の実施形態では、デジタル病理画像処理システムは、各パッチについて生成されたラベルに基づいて、デジタル病理画像が、生物学的試料中に存在する癌細胞における、例えば遺伝子融合の発生の表示を含むと判定し得る。デジタル病理画像処理システムは、例えば遺伝子融合の検出に基づいて、対象の予後予測をさらに生成し得る。いくつかの実施形態では、予後予測は、対象についての1つまたは複数の処置レジメン(例えば、化学療法または標的療法)の適用可能性の予測を含み得る。
【0009】
対象からの生物学的試料の特定の部分における癌細胞を示すデジタル病理画像にアクセスすることであって、示された特定の部分が1つまたは複数の染色剤によって染色されたものである、癌細胞を示すデジタル病理画像にアクセスすることと、デジタル病理画像を複数の画像パッチにセグメント化することと、複数の画像パッチのそれぞれについて、画像パッチが腫瘍細胞のクラスタを示す可能性を示すラベルを生成することと、各画像パッチについて生成されたラベルに基づいて、デジタル病理画像が、癌細胞に対する遺伝子融合の発生の表示を含むと判定することと、癌細胞に対する遺伝子融合の発生に基づいて、対象の予後予測を生成することであって、予後予測が、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含む、対象の予後予測生成することと、を含む、方法が本明細書に開示される。
【0010】
いくつかの実施形態では、本方法は、複数の画像パッチのそれぞれから1つまたは複数の特徴を検出することであって、1つまたは複数の特徴が、臨床的特徴または組織学的特徴のうちの1つまたは複数を含み、複数の画像パッチのそれぞれについてのラベルを生成することが、1つまたは複数の特徴に基づいている、1つまたは複数の特徴を検出することをさらに含む。
【0011】
いくつかの実施形態では、複数の画像パッチのそれぞれについてのラベルを生成することは、腫瘍形態に基づいており、腫瘍形態は、印環細胞の存在、印環細胞の数、肝様細胞の存在、肝様細胞の数、細胞外ムチン、または腫瘍増殖パターンのうちの1つまたは複数の分析に基づいている。
【0012】
いくつかの実施形態では、複数の画像パッチのそれぞれについてのラベルを生成することは、1つまたは複数の機械学習モデルに基づいており、本方法は、腫瘍細胞のクラスタの1つまたは複数のラベル付けされた表示および他の組織学的特徴または臨床的特徴の1つまたは複数のラベル付けされた表示を含む複数の訓練データに基づいて1つまたは複数の機械学習モデルを訓練することをさらに含む。
【0013】
いくつかの実施形態では、予後予測は、1つまたは複数の追加のデジタル病理画像の分析にさらに基づいて生成され、1つまたは複数の追加のデジタル病理画像のそれぞれは、対象からの生物学的試料の追加の特定の試料を表し、分析は、1つまたは複数の追加のデジタル病理画像のそれぞれが癌細胞に対する遺伝子融合の発生の表示を含む可能性を判定することと、1つまたは複数の追加のデジタル病理画像のそれぞれについて判定を組み合わせることと、を含む。
【0014】
いくつかの実施形態では、本方法は、グラフィカルユーザインターフェースを介して予後予測を出力することであって、グラフィカルユーザインターフェースが、デジタル病理画像のグラフィカル表現を含み、グラフィカル表現が、複数の画像パッチのそれぞれについて生成されたラベルの指示と、それぞれのラベルに関連付けられた予測信頼度とを含む、予後予測を出力することをさらに含む。
【0015】
いくつかの実施形態では、本方法は、1つまたは複数の処置レジメンの使用に関連付けられた推奨を生成することをさらに含む。
【0016】
いくつかの実施形態では、生物学的試料の特定の部分が1つまたは複数の染色剤によって染色されたものである。
【0017】
いくつかの実施形態では、デジタル病理画像が癌細胞についての遺伝子融合の発生の表示を含むと判定することは、各画像パッチについて生成されたラベルの重み付けされた組み合わせにさらに基づいている。
【0018】
いくつかの実施形態では、本方法は、デジタル病理画像から腫瘍不均一性を識別することと、識別された腫瘍不均一性を測定することと、をさらに含み、デジタル病理画像が遺伝子融合の発生の表示を含むと判定することは、測定された腫瘍不均一性にさらに基づいている。
【0019】
いくつかの実施形態では、腫瘍不均一性を識別することは、形態学的に類似した細胞を識別することによって、例えば核不均一性を評価することによって、変異腫瘍細胞を表現型に分類することを含む。いくつかの実施形態では、核不均一性を評価することは、核形態学的不均一性に基づいて変異細胞を区別するために細胞核の特定の特徴を定量することを含む。
【0020】
いくつかの実施形態では、腫瘍不均一性を識別することは、空間分布を評価するために細胞レベルの空間分析を行うことによってクローン細胞の領域を識別することを含む。いくつかの実施形態では、空間分布を評価することは、腫瘍細胞の最小全域木のサブグラフ内のスペクトル距離を測定することであって、サブグラフのそれぞれが隣接細胞のクラスタ(例えば、腫瘍巣)を表す、スペクトル距離を測定することと、全てのサブグラフにわたってペアワイズに隣接スペクトル距離を計算することと、を含む。いくつかの実施形態では、サブグラフのそれぞれは、外れ値検出を実行することによって定義され得る。いくつかの実施形態では、サブグラフのそれぞれは、検出された腫瘍巣のセグメンテーションに基づいて定義され得る。
【0021】
いくつかの実施形態では、腫瘍不均一性を識別することは、空間エントロピーを評価するために細胞レベルの空間分析を行うことによって密接に隣接するクローン細胞の領域を識別することを含む。いくつかの実施形態では、空間エントロピーを評価することは、所定数の距離ビンのそれぞれについて、形態学的に類似していると識別された細胞の対の頻度を計算することを含む。
【0022】
本明細書に開示される1つまたは複数の方法の一部または全部を実行するように実行されると動作可能なソフトウェアを具現化する1つまたは複数のコンピュータ可読非一時的記憶媒体が本明細書に開示される。
【0023】
1つまたは複数のプロセッサと、1つまたは複数のデータプロセッサによって実行されると、1つまたは複数のデータプロセッサに、本明細書に開示された1つまたは複数の方法の一部または全部を実行させる命令を含む非一時的メモリと、を備える、システムが本明細書に開示される。
【0024】
クライアントコンピューティングシステムからリモートコンピューティングシステムに、対象からの生物学的試料の特定の部分における癌細胞を示すデジタル病理画像を処理するための要求通信を送信することを含み、クライアントコンピューティングシステムから要求通信を受信することに応答して、リモートコンピューティングシステムが、デジタル病理画像にアクセスすることと、デジタル病理画像を複数の画像パッチにセグメント化することと、複数の画像パッチのそれぞれについて、画像パッチが腫瘍細胞のクラスタを示す可能性(例えば、バイナリ出力またはパーセンテージ出力)を示すラベルを生成することと、各画像パッチについて生成されたラベルに基づいて、デジタル病理画像が、癌細胞に対する遺伝子融合の発生の表示を含むと判定することと、癌細胞に対する遺伝子融合の発生に基づいて、対象の予後予測を生成することであって、予後予測が、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含む、対象の予後予測を生成することと、応答通信を介してクライアントコンピューティングシステムに予後予測を提供することと、クライアントコンピューティングシステムによって、応答通信を受信することに応答して、予後予測を出力することと、を含む動作を実行する、方法が本明細書に開示される。
【0025】
デジタル病理画像処理システムが、対象からの生物学的試料の特定の部分における癌細胞を示すデジタル病理画像にアクセスすることと、デジタル病理画像が、遺伝子融合の発生と相互に排他的である1つまたは複数の変異の表示を含むと判定することと、癌細胞に対する遺伝子融合の非存在を判定することと、癌細胞に対する遺伝子融合の非存在に基づいて、対象の予後予測を生成することであって、予後予測が、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含む、対象の予後予測を生成することと、を含む方法が本明細書に開示される。
【図面の簡単な説明】
【0026】
【
図1A-1D】腫瘍不均一性の非限定的な例を示している。
【0027】
【
図2】本開示のいくつかの実施形態にかかる、本明細書に記載のデジタル病理画像生成および処理に使用され得る相互作用コンピュータシステムのネットワークの非限定的な例を示している。
【0028】
【
図3】遺伝子融合を予測するための非限定的な例示的な方法についてのフローチャートである。
【0029】
【
図4】遺伝子融合を検出するための非限定的な例示的パイプラインについてのワークフロー図である。
【0030】
【
図5A】肺腺癌の病理スライド画像の非限定的な例を示している。
【0031】
【
図5B】品質管理の結果の非限定的な例を示している。
【0032】
【
図5C】腫瘍クラスタ検出の非限定的な例を示している。
【0033】
【
図5D】遺伝子融合状態の予測の非限定的な例を示している。
【0034】
【
図6】ROS1遺伝子融合状態の非限定的な例の予測を示している。
【0035】
【
図7】画像パッチベースの融合予測のためのROC曲線の非限定的な例を示している。
【0036】
【
図8】エンドユーザが予後予測を要求することを可能にするための非限定的な例示的な方法についてのフローチャートである。
【0037】
【
図9】遺伝子融合の欠如(または非存在)の識別に基づいて代替処置を予測するための非限定的な例示的な方法についてのフローチャートである。
【0038】
【
図10A】変異状況が、KEAP1、STK11またはTP53における病原性変異体などの腫瘍抑制因子単独、および/または未知のドライバーに対応する場合の腫瘍不均一性の概略図である。
【0039】
【
図10B】変異状況が、EGFR、KRAS、またはPIK3CAにおける病原性変異体などの癌遺伝子ドライバー変異に対応する場合の腫瘍不均一性の概略図である。
【0040】
【
図10C】変異状況が、ALK、RET、ROS1またはNTRKなどの癌遺伝子融合に対応する場合の腫瘍不均一性の概略図である。
【0041】
【
図11】腫瘍不均一性を識別するための非限定的な例示的な方法についてのフローチャートである。
【0042】
【
図12A-12C】腫瘍細胞注釈、核分割および核マスク生成の非限定的な例を示している。
【0043】
【
図13A-13E】特定の核形態学的特徴の定量に基づく遺伝子融合の識別の実験結果の非限定的な例を示している。
【0044】
【
図14A-14C】腫瘍抑制因子および/または未知のドライバーに対応する4つの異なる核形態学的特徴を示すデジタル病理画像の非限定的な例を示している。
【0045】
【
図15A-15C】癌遺伝子ドライバー変異に対応する4つの異なる核形態学的特徴を示すデジタル病理画像の非限定的な例を示している。
【0046】
【
図16A-16C】遺伝子融合に対応する4つの異なる核形態学的特徴を示すデジタル病理画像の非限定的な例を示している。
【0047】
【
図17A】WSIに示される腫瘍細胞の最小全域木のサブグラフの識別の非限定的な例を示している。
【0048】
【
図17B】サブグラフ間のような隣接スペクトル距離の定量に基づく遺伝子融合の識別の実験結果の非限定的な例を示している。
【0049】
【
図18A-18C】腫瘍細胞表現型の3つの異なる分布で測定される空間エントロピーの非限定的な例を示している。
【0050】
【
図18D】特定の距離内で共起し、特定の表現型に分類された腫瘍細胞のペアの識別の概略図である。
【0051】
【
図18E-18F】遺伝子融合、癌遺伝子ドライバー変異、ならびに腫瘍抑制因子および/または未知のドライバーの空間エントロピーの測定に基づく識別の実験結果の非限定的な例を示している。
【0052】
【
図19】コンピューティングシステムの例を示している。
【発明を実施するための形態】
【0053】
説明
どの患者が遺伝子融合の分子検査から利益を得ることがあるかを識別するために、病理学者は、腫瘍組織試料のスライド画像を検討して腫瘍不均一性の指標を評価し得る。腫瘍不均一性は、細胞を癌性にし、体内で増殖および拡散させる遺伝子変異に対応する異なる腫瘍細胞の異なる形態学的および表現型プロファイルから観察され得る。腫瘍不均一性は、例えば単一の腫瘍巣内の腫瘍内不均一性として、または例えば近くの腫瘍巣間のような腫瘍間不均一性として現れ得る。正常組織と腫瘍組織との間の分化因子として役立つことを超えて、腫瘍不均一性は、疾患重症度の指標として役立ち得て、高度に不均一な腫瘍(別名異常な腫瘍)は、遺伝子変異を介して獲得された薬物耐性に起因する治療失敗のために、予後不良を示し得る。
【0054】
図1A~
図1Dは、デジタル病理画像において視覚化された腫瘍不均一性の例を示している。
図1Aは、子宮平滑筋肉腫における腫瘍不均一性の例を示している。腫瘍細胞は、互いに非常に異なって見える。例えば、サイズに関して、他の腫瘍細胞に対して2倍、3倍または4倍のサイズの腫瘍細胞が存在する。曲率に関して、いくつかの腫瘍細胞は滑らかで丸みを帯びた輪郭を有するが、他の腫瘍細胞は角張っている(すなわち、少なくとも2つのreを有する)。換言すれば、それらは非常に不均一である。
図1Bは、隆起性皮膚線維肉腫における腫瘍不均一性の例を示している。
図1Aとは対照的に、集団としての
図1Bの腫瘍細胞は、それらの形状、有彩色強度、角張り度、およびサイズの点でより類似している。肉腫(例えば、
図1Aおよび
図1Bに示すもの)では、(例えば、
図1Aに示すような)高い不均一性は、染色体数の異常である異数性と関連していることが多く、(例えば、
図1Bに示すような)単調性、別名低い腫瘍不均一性は、遺伝子融合に関連付けられ得る。
図1Cは、肺扁平上皮癌試料における高い腫瘍不均一性の例を示している。
図1Dは、肺腺癌試料における高い腫瘍不均一性の例を示している。
【0055】
遺伝子融合を有する患者は、疾患の進行段階で存在することが多い。遺伝子融合/再編成は、多くの異なる癌タイプにわたって識別され得る稀なタイプの発癌性変異事象である。しかしながら、これらの変異は、腫瘍試料からの特定の遺伝子融合の存在が特定の標的療法に対する堅牢な応答の可能性を示すことができるため、ますます大きな重要性を有する。そのような遺伝子融合では、細胞レベルでは、細胞は低い不均一性を有するように見え得る(すなわち、クローン性であるように見える)が、群レベル(例えば、母集団レベル)では、それらの表現型(すなわち、形態学的特徴の共通のセットを共有する腫瘍細胞が単一の表現型に属すると言われる、形態学的特徴のセット)は、進行段階での診断に対応するように攻撃的であり得る。腫瘍不均一性と遺伝子融合との相関に関する少なくとも2つの仮説がある。1つの仮説は、遺伝子融合を示す視覚信号が主に腫瘍巣/細胞に存在し得るということであり得る。別の仮説は、遺伝子融合を示す視覚信号が強く、腫瘍領域の全ての部分にわたって拡散し得るということであり得る。さらに別の仮説は、低い腫瘍変異負荷が腫瘍形態学的不均一性の減少を示唆し得るということであり得る。したがって、いずれの場合も、攻撃的悪性腫瘍における腫瘍不均一性の欠如は、腫瘍タイプにわたる遺伝子融合のサインであり得る。しかしながら、いくつかの例では、ヒトの眼が腫瘍不均一性の欠如を観察することは困難であり得る。
【0056】
図2は、本開示のいくつかの実施形態にかかる、本明細書に記載のアクショナブル変異の予測を含む、デジタル病理画像生成および処理に使用され得る相互作用コンピュータシステムのネットワーク200を示している。
【0057】
デジタル病理画像生成システム220は、特定の試料に対応する、1つまたは複数の全スライド画像(WSI)または他の関連するデジタル病理画像を生成することができる。例えば、デジタル病理画像生成システム220によって生成された画像は、生検試料の染色された部分を含むことができる。別の例として、デジタル病理画像生成システム220によって生成された画像は、液体試料のスライド画像(例えば、血液フィルム)を含むことができる。別の例として、デジタル病理画像生成システム220によって生成された画像は、蛍光プローブが標的DNAまたはRNA配列に結合した後の蛍光インサイチュハイブリダイゼーション(FISH)を示すスライド画像などの蛍光顕微鏡法を含むことができる。
【0058】
いくつかのタイプの試料(例えば、生検、固体試料および/または組織を含む試料)は、試料を固定および/または包埋するために、試料調製システム221によって処理され得る。試料調製システム221は、固定剤(例えば、ホルムアルデヒド溶液などの液体固定剤)および/または包埋物質(例えば、組織学的ワックス)を試料に浸透させることを容易にすることができる。例えば、試料固定サブシステムは、少なくとも閾値時間(例えば、少なくとも3時間、少なくとも6時間、または少なくとも13時間)にわたって、試料を固定剤に曝すことによって試料を固定することができる。脱水サブシステムは、(例えば、固定試料および/または固定試料の一部を1つまたは複数のエタノール溶液に曝すことによって)試料を脱水し、潜在的に、(例えば、エタノールおよび組織学的ワックスを含む)透明化中間剤を使用して脱水された試料を透明化することができる。試料包埋サブシステムは、加熱された(例えば、液体の)組織学的ワックスを試料に浸透させることができる(例えば、対応する所定の期間の1回以上)。組織学的ワックスは、パラフィンワックスおよび潜在的に1種以上の樹脂(例えば、スチレンまたはポリエチレン)を含むことができる。次いで、試料およびワックスが冷却され、ワックス浸透試料がブロックされ得る。
【0059】
試料スライサー222は、固定されて包埋された試料を受け取り、切片のセットを作製することができる。試料スライサー222は、固定されて包埋された試料を低温またはさらなる低温に曝すことができる。次いで、試料スライサー222は、冷却された試料(またはそのトリミングされたバージョン)を切断して、切片のセットを作製することができる。各切片は、(例えば)100μm未満、50μm未満、10μm未満、または5μm未満の厚さを有することができる。各切片は、(例えば)0.1μmよりも大きい、1μmよりも大きい、2μmよりも大きい、または4μmよりも大きい厚さを有することができる。冷却された試料の切断は、温水浴(例えば、少なくとも30℃、少なくとも35℃または少なくとも40℃の温度で)中で行われ得る。
【0060】
自動染色システム223は、各切片を1つまたは複数の染色剤に曝すことによって、試料の切片の1つまたは複数の染色を容易にすることができる。各切片は、所定の期間にわたって所定量の染色剤に曝されることができる。場合によっては、単一の切片が複数の染色剤に同時にまたは連続的に曝される。
【0061】
1つまたは複数の染色された切片のそれぞれは、切片のデジタル画像を取り込むことができる画像スキャナ224に提示され得る。画像スキャナ224は、顕微鏡カメラを含むことができる。画像スキャナ224は、複数の倍率(例えば、10倍対物レンズ、20倍対物レンズ、40倍対物レンズなどを使用する)でデジタル画像を取り込むことができる。画像の操作を使用して、所望の倍率範囲で試料の選択された部分を取り込むことができる。画像スキャナ224は、人間のオペレータによって識別された注釈および/または形態素をさらに取り込むことができる。場合によっては、切片が洗浄され、1つまたは複数の他の染色剤に曝され、再びイメージングされ得るように、1つまたは複数の画像が取り込まれた後、切片は、自動染色システム223に戻される。複数の染色剤が使用される場合、第1の染色剤を大量に吸収した第1の切片に対応する画像の第1の領域を、第2の染色剤を大量に吸収した第2の切片に対応する画像の第2の領域(または異なる画像)と区別することができるように、異なる色プロファイルを有するように染色剤が選択され得る。
【0062】
デジタル病理画像生成システム220の1つまたは複数の構成要素は、場合によっては、人間のオペレータに関連して動作することができることが理解されよう。例えば、人間のオペレータは、様々なサブシステム(例えば、試料調製システム221またはデジタル病理画像生成システム220)にわたって試料を移動させ、および/またはデジタル病理画像生成システム220の1つまたは複数のサブシステム、システムまたは構成要素の動作を開始または終了させることができる。別の例として、デジタル病理画像生成システムの1つまたは複数の構成要素(例えば、試料調製システム221の1つまたは複数のサブシステム)の一部または全部は、人間のオペレータの動作によって部分的または全体的に置き換えられることが可能である。
【0063】
さらに、デジタル病理画像生成システム220の様々な説明および図示された機能および構成要素は、固体および/または生検試料の処理に関するが、他の実施形態は、液体試料(例えば、血液試料)に関することができることが理解されよう。例えば、デジタル病理画像生成システム220は、ベーススライド、汚れた液体試料およびカバーを含む液体試料(例えば、血液または尿)スライドを受け取ることができる。次いで、画像スキャナ224は、試料スライドの画像を取り込むことができる。デジタル病理画像生成システム220のさらなる実施形態は、本明細書に記載のFISHなどの高度なイメージング技術を使用して試料の画像を取り込むことに関することができる。例えば、蛍光プローブが試料に導入され、標的配列に結合することが可能にされると、さらなる分析のために試料の画像を取り込むために適切なイメージングが使用され得る。
【0064】
所与の試料は、処理およびイメージング中に1人または複数のユーザ(例えば、1人または複数の医師、検査技師および/または医療提供者)と関連付けられ得る。関連付けられたユーザは、限定ではなく例として、とりわけ、イメージングされている試料を生成した検査または生検を注文した人、検査または生検の結果を受け取る許可を得た人、または検査または生検試料の分析を行った人を含むことができる。例えば、ユーザは、医師、病理学者、臨床医、または対象に対応することができる。ユーザは、1つまたは複数のユーザ装置230を使用して、試料がデジタル病理画像生成システム220によって処理され、得られた画像がデジタル病理画像処理システム210によって処理されるという1つまたは複数の要求(例えば、対象を識別する)を提出することができる。
【0065】
デジタル病理画像生成システム220は、画像スキャナ224によって生成された画像をユーザ装置230に送り返すことができる。次いで、ユーザ装置230は、デジタル病理画像処理システム210と通信して、画像の自動処理を開始する。場合によっては、デジタル病理画像生成システム220は、画像スキャナ224によって生成された画像を、例えばユーザ装置230のユーザの指示において、デジタル病理画像処理システム210に直接提供する。図示しないが、他の中間装置(例えば、デジタル病理画像生成システム220またはデジタル病理画像処理システム210に接続されたサーバのデータストア)が使用され得る。さらに、簡単にするために、ネットワーク200には、ただ1つのデジタル病理画像処理システム210、画像生成システム220、およびユーザ装置230が示されている。本開示は、本開示の教示から必ずしも逸脱することなく、各種のシステムおよびその構成要素のうちの1つまたは複数の使用を予期する。
【0066】
図2に示すネットワーク200および関連するシステムは、WSIなどのデジタル病理画像の走査および評価が作業の不可欠な構成要素である様々な状況において使用され得る。例として、ネットワーク200は、ユーザが可能な診断目的で試料を評価している臨床環境に関連付けられ得る。ユーザは、デジタル病理画像処理システム210に画像を提供する前に、ユーザ装置230を使用して画像をレビューすることができる。ユーザは、デジタル病理画像処理システム210による画像の分析を案内または指示するために使用され得る追加の情報をデジタル病理画像処理システム210に提供することができる。例えば、ユーザは、走査内の特徴の予測診断または予備評価を提供することができる。ユーザはまた、レビューされる組織のタイプなどの追加のコンテキストを提供することができる。別の例として、ネットワーク200は、例えば、薬物の有効性または潜在的な副作用を判定するために組織が検査されている検査室環境に関連付けられ得る。これに関連して、前記薬物の全身に対する効果を判定するために、複数のタイプの組織がレビューのために提出されることは一般的とすることができる。これは、イメージングされている組織のタイプに大きく依存することができる画像の様々なコンテキストを判定する必要があり得る人間の走査検査者に特定の課題を提示する可能性がある。これらのコンテキストは、任意に、デジタル病理画像処理システム210に提供され得る。
【0067】
デジタル病理画像処理システム210は、WSIを含むデジタル病理画像を処理して、デジタル病理画像を分類し、デジタル病理画像および関連する出力の注釈を生成することができる。例として、デジタル病理画像処理システム210は、組織試料のWSI、またはデジタル病理画像処理システム210によって生成されたWSIの画像パッチを処理して、腫瘍細胞のクラスタにおいて観察され得る形態学的形質を識別し、識別された形態学的形質に基づいて遺伝子融合などの遺伝子変化事象の発生を判定することができる。デジタル病理画像処理システム210は、スライディングウィンドウを使用して、腫瘍細胞のクラスタ上にマスクを生成し得る。WSIにおける腫瘍細胞のクラスタを識別するためのマスクの使用に加えて、マスクはまた、厚さを測定し、異なる終点の長さを判定し、蛇行性の湾曲性を判定し、3次元イメージングまたは処理シナリオで体積を測定するためにも使用され得る。次いで、デジタル病理画像処理システム210は、クエリ画像を複数の画像パッチにトリミングしてもよい。パッチ生成モジュール211は、各デジタル病理画像に対して画像パッチのセットを定義することができる。画像パッチのセットを定義するために、パッチ生成モジュール211は、デジタル病理画像を画像パッチのセットにセグメント化することができる。本明細書において実施されるように、画像パッチは、非重複(例えば、各画像パッチは、他のいずれの画像パッチにも含まれない画像の画素を含む)または重複(例えば、各画像パッチは、少なくとも1つの他の画像パッチに含まれる画像の画素の一部を含む)とすることができる。各画像パッチのサイズおよびウィンドウのストライド(例えば、画像パッチと後続の画像パッチとの間の画像距離または画素数)に加えて、画像パッチが重複するかどうかなどの特徴は、分析のためのデータセットを増減することができ、より多くの画像パッチ(例えば、重複画像パッチまたはより小さい画像パッチの使用によって達成される)は、最終的な出力および視覚化の潜在的な解像度を高める。場合によっては、パッチ生成モジュール211は、各画像パッチが所定のサイズである、および/または画像パッチ間のオフセットが所定である、画像用の画像パッチのセットを定義する。遺伝子融合または他の遺伝子変化を検出する例を続けると、各病理スライド画像は、一定数の画素の幅および高さを有する画像パッチにトリミングされ得る。さらに、場合によっては、パッチ生成モジュール211は、各WSIについて、様々なサイズ、オーバーラップ、ステップサイズなどの画像パッチの複数のセットを作成することができる。例として、場合によっては、各画像パッチの幅および高さ(すなわち、固定されていない)は、手元の評価タスク、クエリ画像自体、または任意の適切な要因などの要因に基づいて動的に判定されてもよい。いくつかの実施形態では、デジタル病理画像自体は、イメージング技術から生じ得る画像パッチの重複を含むことができる。場合によっては、画像パッチの重複なしで実行されるセグメンテーションであっても、画像パッチ処理要件のバランスをとり、本明細書で説明する埋め込み生成および重み値生成に影響を及ぼすことを回避するために好ましい場合がある。画像パッチサイズまたは画像パッチオフセットは、例えば、各サイズ/オフセットについて1つまたは複数の性能メトリック(例えば、適合率、再現率、精度、および/または誤差)を計算し、所定の閾値を超える1つまたは複数の性能メトリックに関連付けられた、および/または1つまたは複数の性能メトリック(例えば、高適合率、高再現率、高精度、および/または低誤差)に関連付けられた画像パッチサイズおよび/またはオフセットを選択することによって判定され得る。
【0068】
パッチ生成モジュール211は、検出されている異常のタイプに応じて画像パッチサイズをさらに定義し得る。例えば、パッチ生成モジュール211は、デジタル病理画像処理システム210が探索することになる組織表現型形質または異常のタイプを認識して構成され得、検出を改善するために、組織表現型または異常にしたがって(場合によっては、組織試料のタイプにしたがって)画像パッチサイズをカスタマイズすることができる。例えば、画像生成モジュール211は、組織表現型または異常が肺組織の炎症または壊死を探索することを含む場合、画像パッチサイズを縮小して走査速度を増加させるべきであり、組織異常が肝臓組織のクッパー細胞の異常を含む場合、画像パッチサイズを拡大して、デジタル病理画像処理システム210がクッパー細胞を全体的に分析する機会を増加させるべきであると判定することができる。場合によっては、パッチ生成モジュール211は、画像パッチのセットを定義し、各WSIのセット内の画像パッチの数、セットの画像パッチのサイズ、セットの画像パッチの解像度、または他の関連するプロパティは、1つまたは複数の画像のそれぞれに対して定義され、一定に保持される。
【0069】
本明細書で実施されるように、パッチ生成モジュール211は、さらに、1つまたは複数のカラーチャネルまたは色の組み合わせに沿って各デジタル病理画像の画像パッチのセットを定義することができる。例として、デジタル病理画像処理システム210によって受信されたデジタル病理画像は、いくつかのカラーチャネルのうちの1つについて画像の各画素に対して指定された画素色値(例えば、強度に対応するビット値)を有する大きなフォーマットのマルチカラーチャネル画像を含むことができる。使用可能な色仕様または色空間の例は、RGB、CMYK、HSL、HSV、またはHSBの色仕様を含む。画像パッチのセットは、カラーチャネルをセグメント化すること、および/または各画像パッチの輝度マップまたはグレースケール等価物を生成することに基づいて定義され得る。例えば、画像の各セグメントについて、パッチ生成モジュール211は、赤色画像パッチ、青色画像パッチ、緑色画像パッチ、および/または輝度画像パッチ、または使用される色指定の等価物を提供することができる。本明細書で説明するように、画像のセグメントおよび/またはセグメントの色値に基づいてデジタル病理画像をセグメント化することは、画像パッチおよびデジタル病理画像の埋め込み(例えば、低次元空間)を生成し、デジタル病理画像の分類を生成するために使用されるモデル/ネットワークの精度および認識率を改善することができる。さらに、デジタル病理画像処理システム210は、例えば、パッチ生成モジュール211を使用して、色仕様間で変換し、および/または複数の色仕様を使用して画像パッチのコピーを準備することができる。色仕様変換は、所望のタイプの画像拡張(例えば、特定のカラーチャネル、飽和レベル、輝度レベルなどの強調または増強)に基づいて選択され得る。色仕様変換はまた、デジタル病理画像生成システム220とデジタル病理画像処理システム210との間の互換性を改善するように選択され得る。例えば、特定の画像走査コンポーネントは、HSL色仕様で出力を提供することができ、本明細書に記載のように、デジタル病理画像処理システム210において使用されるモデルは、RGB画像を使用して訓練され得る。画像パッチを互換性のある色仕様に変換することは、画像パッチが依然として分析され得ることを保証することができる。さらに、デジタル病理画像処理システムは、デジタル病理画像処理システムによって使用可能であるように特定の色深度(例えば、8ビット、1ビットなど)で提供される画像をアップサンプリングまたはダウンサンプリングすることができる。さらにまた、デジタル病理画像処理システム210は、イメージングされた画像のタイプ(例えば、蛍光画像は、より詳細な色強度またはより広い範囲の色を含み得る)に応じて画像パッチを変換させることができる。
【0070】
場合によっては、デジタル病理画像処理システム210は、複数の画像パッチのそれぞれから1つまたは複数の特徴を検出してもよい。1つまたは複数の特徴は、例えば、細胞型などの臨床的特徴または組織学的特徴の1つまたは複数を含み得る。したがって、複数の画像パッチのそれぞれのラベルを生成することは、1つまたは複数の特徴に基づき得る。限定ではなく、例として、臨床的特徴は、診断時の患者年齢、患者の性別、患者の身長、患者の体重、患者の病歴、患者の試料のタイプ、または患者の喫煙歴のうちの1つまたは複数を含み得る。限定ではなく、別の例として、組織学的特徴は、例えば、固体、篩状、微小乳頭状、乳頭状、腺房、または鱗状などの増殖パターンを含み得る。
【0071】
本明細書に記載されるように、パッチ埋め込みモジュール212は、対応する特徴埋め込み空間内の各画像パッチについて埋め込み(例えば、低次元表現空間)を生成することができる。埋め込みは、画像パッチについての特徴ベクトルとしてデジタル病理画像処理システム210によって表され得る。場合によっては、パッチ埋め込みモジュール212は、ニューラルネットワーク(例えば、畳み込みニューラルネットワーク)を使用して、画像の各画像パッチを表す特徴ベクトルを生成し得る。特定の実施形態では、パッチ埋め込みニューラルネットワークは、例えば、ImageNetデータセットなどの自然(例えば、非医療)画像に基づくデータセットで訓練されたResNet画像ネットワークに基づくことができる。特殊化されていないパッチ埋め込みネットワークを使用することにより、パッチ埋め込みモジュール212は、画像を効率的に処理して埋め込みを生成する際の既知の進歩を活用することができる。さらにまた、自然画像データセットを使用することは、埋め込みニューラルネットワークが、全体論的レベルで画像パッチセグメント間の違いを識別することを学習することを可能にする。
【0072】
他の実施形態では、パッチ埋め込みモジュール212によって使用されるパッチ埋め込みネットワークは、デジタル病理WSIなどの大きなフォーマットの画像の多数の画像パッチを処理するようにカスタマイズされた埋め込みネットワークとすることができる。さらに、パッチ埋め込みモジュール212によって使用されるパッチ埋め込みネットワークは、カスタムデータセットを使用して訓練され得る。例えば、パッチ埋め込みネットワークは、WSIの様々な試料を使用して訓練され得、または埋め込みネットワークが埋め込みを生成している主題に関連する試料を使用して訓練されることさえもできる(例えば、特定の組織型の走査)。画像の特殊なセットまたはカスタマイズされたセットを使用してパッチ埋め込みネットワークを訓練することは、パッチ埋め込みネットワークが画像パッチ間のより細かい(例えば、より微妙な)差を識別することを可能にすることができ、その結果、画像を取得するための追加の時間および/またはパッチ埋め込みモジュール212による使用のための複数のパッチ生成ネットワークを訓練するための計算コストおよび経済コストの潜在的なコストで、特徴埋め込み空間内の画像パッチ間のより詳細で正確な距離をもたらすことができる。場合によっては、パッチ埋め込みモジュール212は、デジタル病理画像処理システム210によって処理されている画像のタイプに基づいて、パッチ埋め込みネットワークのライブラリから選択することができる。
【0073】
本明細書で説明するように、画像パッチ埋め込み(例えば、低次元空間)は、画像パッチの視覚的特徴を使用することに基づいて、機械学習モデル、例えば深層学習ニューラルネットワークを使用して生成され得る。したがって、場合によっては、訓練された機械学習モデルは、例えば画像特徴抽出モデルとして機能し得る。画像パッチ埋め込みは、画像パッチに関連するコンテキスト情報から、または画像パッチに示されたコンテンツからさらに生成され得る。例えば、画像パッチ埋め込みは、示されたオブジェクトのサイズ(例えば、示された細胞のサイズまたは収差)および/または示されたオブジェクトの密度(例えば、示された細胞の密度または収差)を示すおよび/またはそれに対応する1つまたは複数の特徴を含むことができる。サイズおよび密度は、絶対的に(例えば、画素で表された、または画素からナノメートルに変換された寸法に基づいて)または同じデジタル病理画像から、デジタル病理画像のクラス(例えば、同様の技術を使用して、または単一のデジタル病理画像生成システムもしくはスキャナによって生成される)から、またはデジタル病理画像の関連ファミリーからの他の画像パッチに対して測定され得る。さらにまた、画像パッチは、画像パッチの埋め込みを生成するために、パッチ埋め込みモジュール212の前に分類され得、パッチ埋め込みモジュール212は、埋め込みを準備するときに分類を考慮する。
【0074】
一貫性のために、場合によっては、パッチ埋め込みモジュール212は、所定のサイズ(例えば、512要素の特徴ベクトル、2048バイトの特徴ベクトルなど)の埋め込みを生成し得る。場合によっては、パッチ埋め込みモジュール212は、様々な任意のサイズの埋め込みを生成し得る。パッチ埋め込みモジュール212は、ユーザ方向に基づいて埋め込みのサイズを調整することができ、または、サイズは、例えば、計算効率、精度、または他のパラメータに基づいて選択され得る。特定の実施形態では、埋め込みサイズは、埋め込みを生成した深層学習ニューラルネットワークの制限または仕様に基づくことができる。より大きい埋め込みサイズを使用して、埋め込みに取り込まれる情報の量を増加させ、結果の品質および精度を改善することができる一方で、より小さい埋め込みサイズを使用してされて計算効率を改善することができる。
【0075】
デジタル病理画像処理システム210は、1つまたは複数の機械学習モデルを埋め込みに適用すること、すなわち、埋め込みを機械学習モデルに入力することによって、異なる推論を導出することができる。例として、デジタル病理画像処理システム210は、そのような構造を識別するように訓練された機械学習モデルに基づいて、腫瘍細胞のクラスタを識別することができる。いくつかの実施形態では、画像を画像パッチにトリミングし、これらの画像パッチの埋め込みを生成し、次いでそのような埋め込みに基づいて推論を導出する必要がない場合がある。代わりに、場合によっては、十分なグラフィック処理ユニット(GPU)メモリを有するデジタル病理画像処理システム210は、推測を行うために機械学習モデルをWSIの埋め込みに直接適用することができる。場合によっては、機械学習モデルの出力は、入力画像の形状にサイズ変更されてもよい。
【0076】
WSIアクセスモジュール213は、デジタル病理画像処理システム210およびユーザ装置230の他のモジュールからのWSIにアクセスする要求を管理することができる。例えば、WSIアクセスモジュール213は、特定の画像パッチ、画像パッチの識別子、またはWSIの識別子に基づいてWSIを識別する要求を受信する。WSIアクセスモジュール213は、WSIが要求ユーザまたはモジュールにとって利用可能であることを確認し、要求されたWSIを取得するための適切なデータベースを識別し、要求ユーザまたはモジュールにとって関心があり得る任意の追加のメタデータを取得するタスクを実行することができる。さらに、WSIアクセスモジュール213は、要求装置への適切なデータの効率的なストリーミングを処理することができる。本明細書で説明するように、場合によっては、WSIは、ユーザがWSI全体またはWSIの一部を見ることを望む可能性に基づいて、部分的にユーザ装置に提供されてもよい。場合によっては、WSIアクセスモジュール213は、WSIのどの領域を提供するかを判定し、それらをどのように提供するかを判定し得る。さらにまた、場合によっては、WSIアクセスモジュール213は、個々の構成要素がデータベースまたはWSIをロックアップさせたり、そうでなければ他の構成要素またはユーザの不利益に誤用したりしないように、デジタル病理画像処理システム210内で権限を与えられてもよい。
【0077】
デジタル病理画像処理システム210の腫瘍不均一性評価モジュール214は、WSIのうちの1つまたは複数において識別された腫瘍細胞の不均一性を評価するために1つまたは複数の技術を適用し得る。いくつかの実施形態では、腫瘍不均一性を評価することは、形態学的に類似した細胞を識別することによって、例えば核不均一性を評価することによって、変異腫瘍細胞を表現型に分類することを含む。いくつかの実施形態では、核不均一性を評価することは、核形態学的不均一性に基づいて変異細胞を区別するために細胞核の特定の特徴を定量することを含む。
【0078】
いくつかの実施形態では、腫瘍不均一性を識別することは、空間分布を評価するために細胞レベルの空間分析を行うことによってクローン細胞の領域を識別することを含む。いくつかの実施形態では、空間分布を評価することは、腫瘍細胞の最小全域木のサブグラフ内のスペクトル距離を測定することであって、各サブグラフが隣接細胞のクラスタ(例えば、腫瘍巣)を表す、スペクトル距離を測定することと、全てのサブグラフにわたってペアワイズに隣接スペクトル距離を計算することとを含む。いくつかの実施形態では、サブグラフのそれぞれは、外れ値検出を実行することによって定義され得る。いくつかの実施形態では、サブグラフのそれぞれは、検出された腫瘍巣のセグメンテーションに基づいて定義され得る。
【0079】
いくつかの実施形態では、腫瘍不均一性を識別することは、空間エントロピーを評価するために細胞レベルの空間分析を行うことによって、密接に隣接するクローン細胞の領域を識別することを含む。いくつかの実施形態では、空間エントロピーを評価することは、所定数の距離ビンのそれぞれについて、形態学的に類似していると識別された細胞の対の頻度を計算することを含む。
【0080】
デジタル病理画像処理システム210の遺伝子融合予測モジュール215は、遺伝子融合が存在する可能性(例えば、バイナリ出力またはパーセンテージ出力)を予測するために、1つまたは複数の技術を適用し得る。いくつかの実施形態では、遺伝子融合予測モジュール215は、腫瘍不均一性を評価した結果、遺伝子融合のエンドツーエンド予測の結果、腫瘍形態を評価した結果、および/または予測に到達するための他のアプローチの結果(例えば、スコア)を評価および/または集約し得る。
【0081】
デジタル病理画像処理システム210の出力生成モジュール216は、ユーザ要求に基づいて、画像パッチおよび1つまたは複数のWSIデータセットのうちの1つまたは複数に対応する出力を生成することができる。本明細書で説明するように、出力は、要求のタイプおよび利用可能なデータのタイプに基づいて、様々な視覚化、対話型グラフィック、およびレポートを含むことができる。いくつかの実施形態では、出力は、表示のためにユーザ装置230に提供されるが、特定の実施形態では、出力は、デジタル病理画像処理システム210から直接アクセスされ得る。出力は、適切なデータの存在および適切なデータへのアクセスに基づくため、出力生成モジュールは、必要に応じて必要なメタデータおよび匿名化された患者情報にアクセスするように権限を与えられる。デジタル病理画像処理システム210の他のモジュールと同様に、出力生成モジュール214は、大幅なダウンタイムを必要とせずに新たな出力特徴をユーザに提供することができるように、モジュール式に更新および改善され得る。
【0082】
本明細書に記載の一般的な技術は、様々なツールおよび使用事例に統合され得る。例えば、上述したように、ユーザ(例えば、病理学または臨床医)は、デジタル病理画像処理システム210と通信するユーザ装置230にアクセスし、分析のためのクエリ画像を提供することができる。デジタル病理画像処理システム210、またはデジタル病理画像処理システムへの接続は、対応する一致を検索し、類似の特徴を識別し、要求に応じてユーザに適切な出力を生成するスタンドアロンのソフトウェアツールまたはパッケージとして提供され得る。合理化されたベースで購入またはライセンス付与され得るスタンドアロンツールまたはプラグインとして、ツールは、研究または臨床研究室の能力を増強するために使用され得る。さらに、ツールは、デジタル病理画像生成システムの顧客に利用可能にされたサービスに統合され得る。例えば、ツールは、提出された試料に対して作成されるWSIを実行または要求するユーザが、以前にインデックス付けされた画像および/または同様のWSI内の注目すべき特徴のレポートを自動的に受信する統合ワークフローとして提供され得る。したがって、WSIの分析を改善することに加えて、本技術を既存のシステムに統合して、以前には考慮されていなかった、または可能ではなかった追加の特徴を提供することができる。
【0083】
さらに、デジタル病理画像処理システム210は、特定の設定において使用するために訓練およびカスタマイズされ得る。例えば、デジタル病理画像処理システム210は、特定のタイプの組織(例えば、肺、心臓、血液、肝臓など)に関する洞察を提供する際に使用するために特別に訓練され得る。別の例として、デジタル病理画像処理システム210は、例えば、薬物または他の潜在的な治療処置に関連する毒性のレベルまたは程度を判定する際に、安全性評価を支援するように訓練され得る。特定の主題または使用事例における使用のために訓練されると、デジタル病理画像処理システム210は、必ずしもその使用事例に限定されない。訓練は、少なくとも部分的にラベル付けされたまたは注釈付けされた画像の比較的大きなセットのために、特定のコンテキスト、例えば毒性評価において実行され得る。
【0084】
本明細書に開示される方法およびシステムは、ユーザが、ユーザによって提供されたデジタル病理画像に基づいて予後予測を容易に要求することを可能にし得る。いくつかの例では、デジタル病理画像処理システム210は、クライアントコンピューティングシステムからリモートコンピューティングシステムに要求通信を送信して、対象からの生物学的試料の特定の部分の癌細胞を示すデジタル病理画像を処理し得る。クライアントコンピューティングシステムから要求通信を受信することに応答して、リモートコンピューティングシステムは、以下のステップを含む動作を実行し得る。リモートコンピューティングシステムは、最初にデジタル病理画像にアクセスし得る。次いで、リモートコンピューティングシステムは、デジタル病理画像を、それぞれが腫瘍細胞の1つまたは複数のクラスタを示す複数の画像パッチにセグメント化し得る。次いで、リモートコンピューティングシステムは、複数の画像パッチのそれぞれについて、画像パッチが腫瘍不均一性を示す可能性を示すラベルを生成し得る。次いで、リモートコンピューティングシステムは、各画像パッチに対して生成されたラベルに基づいて、デジタル病理画像が癌細胞に対するアクショナブル変異の発生の表示を含むと判定し得る。次いで、リモートコンピューティングシステムは、癌細胞に対する応答を伴う遺伝子融合の発生に基づいて、対象の予後予測を生成し得る。場合によっては、予後予測は、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含み得る。リモートコンピューティングシステムは、応答通信を介してクライアントコンピューティングシステムに予後予測をさらに提供し得る。場合によっては、クライアントコンピューティングシステムは、応答通信を受信することに応答して予後予測を出力し得る。
【0085】
図3は、遺伝子変化、例えば遺伝子融合を検出するための例示的な方法300を示している。この方法は、
図3に示すデジタル病理画像処理システム210が、対象からの生物学的試料の特定の部分における癌細胞を示すデジタル病理画像にアクセスし得るステップ310を含み得る。限定ではなく、例として、デジタル病理画像は、腫瘍細胞(例えば、肺腺癌)を含む走査染色された(例えば、ヘマトキシリンおよびエオシン染色)WSIであり得る。
【0086】
図3のステップ320において、デジタル病理画像処理システム210は、デジタル病理画像を、それぞれが腫瘍細胞の少なくとも1つのクラスタを示す複数の画像パッチにセグメント化し得る。特定の実施形態では、
図3に示すパッチ生成モジュール211が使用されて画像パッチを生成し得る。画像パッチは、重複していなくてもよく、または重複していてもよい。各画像パッチのサイズおよび画像パッチを作成するために使用されるウィンドウの段階的な変位に加えて、画像パッチが重複するかどうかなどの特徴は、分析のためのデータセットを増減することができ、より多くの画像パッチは、最終的な出力および視覚化の潜在的な解像度を増加させる。特定の実施形態では、各画像パッチは、所定のサイズであってもよく、および/または画像パッチ間のオフセットは、予め定義されてもよい。さらにまた、パッチ生成モジュール211は、画像ごとに、様々なサイズ、重複、ステップサイズなどの画像パッチの複数のセットを作成し得る。パッチ生成モジュール211は、各デジタル病理画像について、1つまたは複数のカラーチャネルで、または1つまたは複数の色の組み合わせで画像パッチを生成し得る。画像パッチは、カラーチャネルをセグメント化すること、および/または各画像パッチの輝度マップまたはグレースケール等価物を生成することに基づいて生成され得る。さらに、デジタル病理画像処理システム210は、デジタル病理画像処理システム210によって使用可能な特定の色深度で提供される画像をアップサンプリングまたはダウンサンプリングすることができる。さらにまた、デジタル病理画像処理システム210は、イメージングされた画像のタイプに応じて画像パッチを変換させることができる。
【0087】
図3のステップ330において、デジタル病理画像処理システム210は、複数の画像パッチのそれぞれについて、画像パッチがアクショナブル変異を示すものなどの腫瘍細胞のクラスタ(例えば、腫瘍領域または腫瘍巣構造)を示す可能性を示すラベルを生成し得る。限定ではなく、例として、デジタル病理画像処理システム210は、複数の画像パッチのそれぞれから1つまたは複数の特徴を検出してもよい。1つまたは複数の特徴は、例えば、細胞型もしくは細胞グループ、臨床的特徴、またはゲノム特徴などの組織学的特徴の1つまたは複数を含み得る。したがって、複数の画像パッチのそれぞれのラベルを生成することは、1つまたは複数の特徴に基づき得る。特定の実施形態では、複数の画像パッチのそれぞれに対するラベルを生成することは、画像パッチベースの分類またはマルチインスタンス学習(MIL)分類の1つまたは複数に基づき得る。複数の画像パッチのそれぞれのラベルを生成することは、1つまたは複数の訓練された機械学習モデルの使用に基づき得る。特定の実施形態では、デジタル病理画像処理システム210は、例えば腫瘍領域または腫瘍入れ子構造を含む試料の1つまたは複数のラベル付けされた表示と、腫瘍領域または腫瘍入れ子構造を含まない試料の1つまたは複数のラベル付けされた表示とを含む複数の訓練データに基づいて、1つまたは複数の機械学習モデルを訓練し得る。特定の実施形態では、複数の画像パッチのそれぞれに対するラベルの生成は、組織形態、例えば腫瘍形態に基づき得る。腫瘍形態は、例えば、以下の組織学的特徴の1つまたは複数の分析に基づいてもよい:印環細胞の存在または数、肝様細胞の存在または数、細胞外ムチン、または腫瘍増殖パターン。
【0088】
図3のステップ340において、デジタル病理画像処理システム210は、各画像パッチについて生成されたラベルに基づいて、デジタル病理画像が画像内の癌細胞に対する遺伝子融合の発生の表示を含むと判定し得る。特定の実施形態では、デジタル病理画像処理システム210は、存在する遺伝子融合を効果的に判定するための様々な異なるアプローチのいずれかを使用し得る。1つのアプローチは、例えば、標的遺伝子融合(例えば、NTRK融合物)を、ROS1融合物、ALK融合物およびRET融合物などの他の遺伝子融合物と組み合わせて、単一のアクショナブル遺伝子融合クラスタにすることを含み得る。クラスタは、検出を容易にするために単一の遺伝子融合カテゴリとして扱われ得る。このアプローチでは、各遺伝子融合を個別に識別しようとするのではなく、デジタル病理画像処理システム210は、代わりにそれらを単一の群として扱い、したがって、半パーセント未満の頻度で個別に生じる遺伝子融合を検出する必要はない。限定ではなく、例として、これらの遺伝子融合の発生頻度の合計は、約15%であり得る。
【0089】
アクショナブル遺伝子融合の検出は、以下のうちの1つまたは複数に基づき得る:(i)組織学的特徴の自動検出、(ii)相互に排他的な遺伝子変異の識別(それによって遺伝子融合の欠如(または非存在)を識別する)、(iii)NTRKとALK、ROS1、およびRETを単一の「アクショナブル遺伝子融合クラスタ」にグループ化し、クラスタを識別することによるNTRK遺伝子融合の検出、(iv)ALK、ROS1、およびRETに関連する組織学的特徴の自動検出(固形および篩状の増殖パターン、細胞外ムチン、印環細胞、杯細胞、および肝様細胞を含む)、(v)喫煙関連変異シグネチャの識別および排除、(vi)低い腫瘍変異負荷の識別、(vii)腫瘍異種性の評価、または(viii)1つまたは複数のエンドツーエンドのデータ駆動型機械学習モデルを使用した全腫瘍または腫瘍非認識的にアクショナブル遺伝子融合クラスタの識別。
【0090】
別のアプローチは、これらの腫瘍の分子的ランドスケープおよび分子的特徴を使用することを含み得る。特定の実施形態では、融合のための信号は、主に腫瘍の巣/細胞内にあり、強く、腫瘍領域全体に拡散し得る。したがって、スライドから直接遺伝子融合を識別することに加えて、デジタル病理画像処理システム210は、腫瘍にわたる分子的特徴の相互排他的分布に基づいて遺伝子融合を識別し得る。
【0091】
特定の実施形態では、デジタル病理画像処理システム210は、例えば、融合陽性スライド画像と、このスライドからの同じ視野との、遺伝子融合予測の重ね合わせヒートマップとの比較として、遺伝子融合の発生を病理学者に示し得る。2つを比較すると、病理学者は、本明細書に開示されるいくつかの実施形態における腫瘍検出アルゴリズムが、腫瘍を含まない画像パッチをどのように拒絶したかを確認し得る。さらに、(例えば、ヒートマップの強度によって示されるような)遺伝子融合の予測の信頼性メトリックは、腫瘍領域全体で変化し得る。信頼性メトリックは、印環細胞を有する領域において最も高くなり得る。
【0092】
ステップ350において、デジタル病理画像処理システム210は、癌細胞に対する遺伝子融合の検出された発生に基づいて、対象の予後予測を生成し得て、予後予測は、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含む。デジタル病理画像処理システム210は、例えば、グラフィカルユーザインターフェースを介して、予後予測を出力し得る。限定ではなく、例として、デジタル病理画像処理システム210は、処置レジメン評価を出力し得る。デジタル病理画像処理システム210は、1つまたは複数の処置レジメンの使用に関する推奨を生成し得る。例えば、評価は、この患者が遺伝子融合を有する可能性が高いということであり得る。後続のまたはさらなるステップとして、デジタル病理画像処理システム210は、次世代シーケンシングアッセイなどの追跡分子検査を実行する推奨を促し得る。いくつかの実施形態では、
図3に示す方法の1つまたは複数のステップは、適切な場合に繰り返されてもよい。本開示は、
図3の方法の特定のステップを特定の順序で発生するものとして説明および図示しているが、本開示は、任意の適切な順序で発生する
図3の方法の任意の適切なステップを想定している。さらに、本開示は、
図3に示される方法の特定のステップを含む、遺伝子融合(または他の遺伝子変化)を検出するための例示的な方法を記載および例示するが、本開示は、適切な場合には、
図3の方法のステップの全部、一部、またはいずれも含まれ得る任意の適切なステップを含む、遺伝子融合を検出するための任意の適切な方法を企図している。さらにまた、本開示は、
図3の方法の特定のステップを実行する特定の構成要素、装置、またはシステムを説明および図示しているが、本開示は、
図3の方法の任意の適切なステップを実行する任意の適切な構成要素、装置、またはシステムの任意の適切な組み合わせを想定している。
【0093】
いくつかの例では、開示される方法およびシステムは、遺伝子融合/再編成、多くの異なる癌タイプにわたって識別することができ、腫瘍組織試料中に存在する場合、特定の標的療法に対する堅牢な応答を示し得る特定のタイプの稀で創薬可能な発癌性変異事象の検出に適用され得る。遺伝子融合は、多くの異なる腫瘍タイプにわたって起こることができ、新規療法によってますます標的化される、稀で創薬可能な変異事象を含む。遺伝子融合の識別は、最終的にそのような遺伝子変化を有する少数の患者にしか利益をもたらさないことがある技術的に困難で高価で時間のかかるプロセスとすることができる。これらの理由から、広範な検査は、このプロセスに関与する技術的および財政的資源を吸収および提供する余裕を有することができる少数の病院に限定され得る。本明細書に開示される実施形態は、癌組織/細胞を示す走査染色された(例えば、ヘマトキシリンおよびエオシン染色)WSI(例えば、肺腺癌)などのデジタル病理画像から発癌性融合の存在を予測することができる機械学習モデル(例えば、デジタル病理スクリーニングモデル)の作成、訓練、および使用を通じてこの相違に対処し得る。さらに、本明細書に開示される実施形態は、個々の患者(限定されないが、肺腺癌患者を含む)のための標的療法の使用に関する分子検査および意思決定を導くために使用され得る、迅速で、安価で、十分に正確なスクリーニングツールを含み得る。
【0094】
いくつかの例では、本明細書の他の箇所で述べたように、開示された方法およびシステムが使用されて、新規療法によってますます標的化される遺伝子融合を識別し得る。腫瘍を有する患者についての標的療法は、上皮増殖因子受容体(EGFR)を標的とする医薬、ならびに未分化リンパ腫キナーゼ(ALK)、RET、ROS1および神経栄養性チロシン受容体キナーゼ(NTRK)を含む遺伝子融合を含み得る。EGFRの場合、最も一般的な変異体(例えば、最大97%のEGFR陽性肺腺癌患者をカバーする)を識別するために免疫組織化学的染色が使用され得るが、EGFRを標的とした治療に失敗した患者における耐性変異を識別するために分子検査が必要な場合がある。RETおよびROS1についてはそのような免疫組織化学的染色は開発されておらず、ALKおよびNTRKについての免疫組織化学的染色は非常に可変的であり、解釈が困難であり得る。さらにまた、遺伝子融合は、限られた数の遺伝子座を検査する、より一般的に使用される「ホットスポット」アッセイよりもゲノムのカバレッジが高い、より洗練された分子アッセイをしばしば必要とする。遺伝子融合を標的とするためには、はるかに広いカバレッジを必要とし、はるかに高価な検査をもたらすことがあり、検査室が実行するためにはるかに高い技術的能力を必要とする。結果として、かなりの割合の患者は、それらの腫瘍が遺伝子融合を有する可能性を判定するために正しい検査を受ける可能性が低い可能性がある。それとは別に、いくつかの遺伝子融合(例えば、NTRK融合)は、非常に稀であり得る。NTRK融合は、多種多様な腫瘍タイプで識別されているが、この特異的融合の頻度は、(例えば、肺腺癌、結腸直腸癌、および非分泌性乳癌などにおいて)最も一般的な癌適応症では1%未満であり得る。遺伝子融合の比較的希少性(例えば、肺腺癌におけるALKについての7%からNTRKについての0.3%未満の範囲)は、広範な検査に対する技術的および経済的な著しい阻害要因となる。実際に、これらの薬物から最も恩恵を受ける患者集団は、複雑な検査室検査を行うための専門知識、インフラストラクチャ、および予算を有する学術機関に近い人々であることが研究により示されている。現在、分子検査は、遺伝子融合が患者に存在する可能性を判定するためにこれまで利用可能な唯一の方法である。しかしながら、分子検査は高価であり、患者は、費用のために分子検査のスケジューリングを回避することがあり、および/または分子検査から利益を得る可能性がない患者には不必要な費用が発生する。現在の実施形態は、現在の実施形態を使用して分子検査から利益を得る可能性がある患者を識別し得るという点で、現在のシステムに対する改善を提示する。特に、本明細書に記載のデジタル病理画像処理システムは、デジタル病理機械学習モデルを使用して、遺伝子融合を有する可能性が高い患者をスクリーニングし、次いで、それらの患者が分子アッセイを使用して検査されるという推奨を提供し得る。結果として、開示されたデジタル病理画像処理システムは、患者間の遺伝子融合を検出する可能性を改善し得て、追跡分子検査のコストを削減し得て、それによって標的療法が存在する遺伝子融合を呈する患者のヘルスケア転帰をさらに有益にし、改善し得る。デジタル病理モデルは、任意の適切な腫瘍タイプに適用可能であり得るが、本明細書に開示される実施形態は、例示的な腫瘍タイプとして肺腺癌にデジタル病理モデルを適用することを企図している。
【0095】
特定の実施形態では、デジタル病理画像処理システム210は、遺伝子融合を効果的に検出するために異なる解決策を使用し得る。1つの解決策は、標的遺伝子融合(例えば、NTRK融合)をROS1、ALK、およびRETなどの他の遺伝子融合と組み合わせて、単一のアクショナブル遺伝子融合クラスタにすることであり得る。次いで、クラスタは、単一の遺伝子融合カテゴリとして扱われ得る。デジタル病理画像処理システム210は、これらの遺伝子融合物のそれぞれを個別に識別しようとするのではなく、それらを単一のグループとして扱うため、デジタル病理画像処理システム210は、各遺伝子融合物の半分未満の頻度にもはや対処し得ない。限定ではなく、例として、これらの遺伝子融合の組み合わせ頻度は、約15%であり得る。
【0096】
別のアプローチは、これらの腫瘍の分子的ランドスケープおよび分子的特徴を使用することを含み得る。特定の例では、融合のための信号は、主に腫瘍の巣/細胞内で生じ得て、強く、腫瘍領域全体に拡散し得る。したがって、スライドから直接融合物を識別することに加えて、デジタル病理画像処理システム210は、腫瘍にわたる分子的特徴の相互排他的分布に基づいて遺伝子融合物を識別し得る。限定ではなく、例として、肺腺癌の形態は、分子ランドスケープにマッピングされ得て、これは限定ではなく例として、17%のEGFR感作、7%のALK、4%のEGFRその他、>1変異を有する3%、2%のHER2、2%のROS1、2%のBRAF、2%のRET、1%のNTRK 1、1%のPIK3CA、1%のMEK1、31%の未知の発癌性ドライバー、および25%のKRASの変化を含み得る。肺腺癌の最も一般的なドライバー変異の中で、3パーセントのみが1つを超える変異を有し得て、これは、肺癌患者の97%が単一の変異を有することを意味する。したがって、ドライバー変異が相互排他性を示すことは著しくより一般的であり、この特徴は、癌患者の処置における臨床的意思決定を知らせるために様々な状況において使用され得る。いくつかの実施形態では、デジタル病理画像処理システム210は、対象からの生物学的試料の特定の部分における癌細胞を示すデジタル病理画像にアクセスし得る。次いで、デジタル病理画像処理システム210は、デジタル病理画像が遺伝子融合の発生と相互に排他的な1つまたは複数の変異の表示を含むと判定し、したがって癌細胞に対する遺伝子融合の非存在を判定し得る。場合によっては、デジタル病理画像処理システム210は、癌細胞に対する遺伝子融合の非存在に基づいて、対象の予後予測をさらに生成し得る。特定の実施形態では、デジタル病理画像処理システム210は、癌に対する遺伝子融合の非存在に基づいて、対象の予後予測をさらに生成し得る。予後予測は、例えば、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含み得る。この相互排他性のために、遺伝子融合を確実に識別することは別として、デジタル病理モデルは、KRASおよびEGFRなどのより一般的な変異を識別し得て、そうすることで、遺伝子融合の存在を除外し得る。
【0097】
特定の実施形態では、デジタル病理画像処理システム210は、複数の画像パッチのそれぞれから1つまたは複数の特徴を検出し得る。1つまたは複数の特徴は、細胞型などの臨床的特徴または組織学的特徴の1つまたは複数を含み得る。したがって、複数の画像パッチのそれぞれのラベルを生成することは、1つまたは複数の特徴に基づき得る。限定ではなく、例として、臨床的特徴は、診断時の若齢または喫煙歴の推定のうちの1つまたは複数を含み得る。特定の実施形態では、アクショナブル遺伝子融合を予測することは、喫煙関連変異シグネチャを識別および排除することに基づき得る。限定ではなく、別の例として、組織学的特徴は、固体、篩状、微小乳頭状、乳頭状、腺房状または鱗状などの増殖パターンを含み得る。特定の実施形態では、アクショナブル遺伝子融合が存在することを予測または判定することは、固体および篩状増殖パターン、および/または細胞外ムチンを含む、ALK、ROS1、およびRETに関連する組織学的特徴の検出に基づき得る。限定ではなく、別の例として、アクショナブル遺伝子融合を予測または判定することは、ALK、ROS1、およびRETに関連する細胞型の検出に基づき得る。これらの細胞型は、印環細胞、杯細胞または肝様細胞の1つまたは複数を含み得る。異なる特徴は、異なる腫瘍タイプに対して異なるレベルの重要性を有し得る。これらの視覚的特徴のそれぞれの自動検出および定量は、例えば肺腺癌における例えばALK、ROS1、RETおよびNTRKの予測を可能にし得る。
【0098】
特定の実施形態では、遺伝子変化、例えば遺伝子融合の存在を判定するためにデジタル病理画像処理システム210(またはそこに存在するデジタル病理機械学習モデル)によって使用され得る融合物および腫瘍の別の特徴は、腫瘍変異負荷(TMB)であり得る。いくつかの例では、例えば、キナーゼまたは癌遺伝子融合は、低い腫瘍変異負荷に関連付けられ得る。腫瘍の主な発癌要因は、単一遺伝子融合であり得る。したがって、単一の発癌性ドライバーに由来する形態学的信号が、スライド上の組織標本中の腫瘍細胞/領域の大部分にわたって存在することが予想され得る。エンドツーエンド遺伝子融合状態予測はまた、スライド全体にわたって強い均一な信号を示し得る。
【0099】
いくつかの例では、低い腫瘍変異負荷は、腫瘍形態学的不均一性の減少を示唆し得る。患者は、ドライバー変異、ドライバー遺伝子の変異、および/またはドライバー融合(例えば、ドライバー遺伝子を含む遺伝子融合物)を有すると特徴付けられ得る。いくつかの例では、癌における腫瘍変異負荷は、ドライバー変異によって推進され得る。いくつかの例では、癌の腫瘍変異負荷はまた、遺伝子融合によって推進され得る。いくつかの例では、遺伝子融合によって引き起こされる癌は、有意に低い腫瘍変異負荷を有し得る。したがって、低い腫瘍変異負荷は、低い腫瘍不均一性と関連付けられ得る。
【0100】
デジタル病理モデルは、異なる腫瘍タイプにわたって一般的であり得る。したがって、デジタル病理画像処理システム210は、デジタル病理モデルに基づいて、全腫瘍または腫瘍非認識的にアクショナブル遺伝子融合を識別および予測し得る。限定ではなく、例として、デジタル病理画像処理システム210は、それぞれALK融合およびROS1融合についてデジタル病理モデルを訓練し、性能は同じであった。別の例として、NTRKの信号は、ALK、ROS1、およびRETによってソートし得る。例えば、デジタル病理モデルは、訓練においてNTRKベースの訓練データを使用したことがないが、本明細書に開示される実施形態の実験においてROS1融合と同じ精度でNTRK融合を識別することができた。デジタル病理モデルの一般性は、特徴が異なる遺伝子融合および異なる腫瘍タイプにわたって一貫していることを示唆し得る。
【0101】
本明細書に開示される実施形態は、対応する分子検査よりも容易にアクセス可能で安価な材料を分析に使用するという技術的利点を有し得る。いくつかの実施形態では、生物学的試料の切片は、1つまたはそれを超える染色剤によって染色され得る。限定ではなく、例として、デジタル病理画像処理システムが使用されて、例えば、ヘマトキシリンおよびエオシン(H&E)染色スライドを走査し得る。元の組織標本スライドは、任意の新規または追跡診断分析における使用に容易に利用可能である。対照的に、分子検査は、いくらかの組織を犠牲にして配列決定に使用するために組織ブロックへの切断を必要とする場合があり、これは診断用組織材料の消費をもたらす。図から分かるように、デジタル病理機械学習モデルを使用して画像データを分析することによって組織が破壊されることはない。場合によっては、余分なスライドを必要とせずに、一次診断スライドのデジタル病理画像を分析に使用してもよい。いくつかの実施形態では、1つまたは複数の追加のデジタル病理画像のさらなる分析に基づいて予後予測が生成され得る。場合によっては、1つまたは複数の追加のデジタル病理画像のそれぞれは、対象由来の生物学的試料の追加の部分を示してもよい。いくつかの実施形態では、分析は、1つまたは複数の追加のデジタル病理画像のそれぞれが癌細胞に対する遺伝子融合の発生の表示を含む可能性を判定することと、1つまたは複数の追加のデジタル病理画像のそれぞれについての判定を組み合わせることとを含み得る。いくつかの例では、H&E染色標本スライドを用いて診断を行った後、分子検査を行うために、さらなる染色されていない標本スライド(例えば、少なくとも5、6、7、8、9、10または10個を超える未染色標本スライド)を犠牲にする必要があり得る。
【0102】
本明細書に開示される実施形態は、使いやすさという別の技術的利点を有し得る。病理標本スライドを走査し、走査された画像またはそこから導出された画像パッチデータをデジタル病理機械学習モデルに入力し得る。次いで、デジタル病理機械学習モデルが使用されて、遺伝子変化、例えば遺伝子融合が生物学的試料中に存在する可能性を予測し得る。場合によっては、プロセスは、病理学者による注釈を必要としないことがある。いくつかの例では、病理学者は、スライドを標的腫瘍タイプ、例えば肺腺癌として正確に識別するだけでよいことがある。本明細書に開示された実施形態は、効率の別の技術的利点を有し得る。限定ではなく、例として、遺伝子融合の予測は、数分、数時間、または数日で、例えば、60分未満、50分未満、40分未満、30分未満、25分未満、20分未満、15分未満、または10分未満で完了し得る。
【0103】
場合によっては、アクショナブル遺伝子融合が存在すると予測または判定することは、少なくとも部分的に、細胞外ムチンの検出に基づいてもよい。過剰な細胞外ムチンは融合状態を示すと報告されており、遺伝子融合状態予測のための開示された方法は、これらの知見を実証し得る。いくつかの例では、デジタル病理画像処理システム210は、遺伝子融合状態を詳細に予測し、例えば切除と生検との間の違いを識別し、領域の正確な分割を決定し、細胞外ムチンを含有する画像パッチの粗検出を行い、腫瘍領域検出から実際の遺伝子融合状態予測に移行し得る。限定ではなく、例として、いくつかの例では、腫瘍領域検出から実際の遺伝子融合状態予測に移行することは、検出されたムチンの割合を組織に対して決定すること、または検出されたムチンの割合を腫瘍に対して決定することを含み得る。
【0104】
場合によっては、デジタル病理機械学習モデルは、異なる腫瘍タイプにわたって一般的に適用可能であり得る。したがって、デジタル病理画像処理システム210は、デジタル病理機械学習モデルの使用に基づいて、全腫瘍または腫瘍非認識的にアクショナブル遺伝子融合を識別および予測するために使用され得る。例えば、それぞれALK融合またはROS1融合で訓練されたデジタル病理機械学習モデルを含むデジタル病理画像処理システム210の性能は同じであった。別の例として、NTRK融合の信号は、ALK、ROS1、およびRETでソートし得る。例えば、NTRKベースの訓練データを使用せずにデジタル病理機械学習モデルを訓練したとしても、本明細書に開示される方法を検査するための実験におけるROS1融合の検出と同じ精度でNTRK融合を識別することができた。デジタル病理機械学習モデルの一般的な適用可能性は、予測に使用される基礎となる画像パッチ特徴が、異なる遺伝子融合および異なる腫瘍タイプにわたって一貫していることを示唆し得る。
【0105】
図4は、生物学的試料、例えば組織標本中の遺伝子融合を検出するためのプロセス400の例示的なワークフロー図を示している。ワークフロー400は、組織選択410から開始し得る。組織選択410において、デジタル病理画像処理システム210は、品質管理および/または腫瘍検出を実行し得る。特定の実施形態では、品質管理および腫瘍領域検出は、教師あり分類タスクを実行することを含み得る。そのようなタスクの場合、画像パッチレベルの精度で十分であり得て、デジタル病理画像処理システム210は、例えば、タスクごとに1つのバイナリ分類器を使用し得る。次いで、組織選択410の結果は、エンドツーエンド分類ステップ420への入力として提供され得る。いくつかの実施形態では、エンドツーエンド分類420は、上述したような画像パッチベースの分類またはマルチインスタンス学習(MIL)分類技術のうちの1つまたは複数に基づき得る。エンドツーエンド分類420の一部として、複数の画像パッチのそれぞれに対するラベルを生成することは、1つまたは複数の機械学習モデルに基づき得る。いくつかの実施形態では、デジタル病理画像処理システム210は、例えば、腫瘍領域または腫瘍巣構造の1つまたは複数のラベル付けされた表示と、他の組織学的特徴または臨床的特徴の1つまたは複数のラベル付けされた表示とを含む複数の訓練データに基づいて、1つまたは複数の機械学習モデルを訓練し得る。
【0106】
エンドツーエンド分類420が実行されている間、デジタル病理画像処理システム210は、腫瘍形態分析430を実行し得る。いくつかの実施形態では、複数の画像パッチのそれぞれに対するラベルの生成は、腫瘍形態に基づき得る。腫瘍形態分析430は、印環細胞、肝様細胞、細胞外ムチン、または腫瘍増殖パターンのうちの1つまたは複数を識別するための分析を含み得る。いくつかの例では、増殖パターン分析は、遺伝子融合検出に有用であり得る。限定ではなく、例として、肺腺癌は、多数の増殖パターンおよびそれぞれの様々な割合で存在し得る。限定ではなく、別の例として、いくつかの例では、固体および篩状パターンが遺伝子融合に関連付けられ得る。場合によっては、デジタル病理画像処理システム210は、試料収集タイプ(例えば、切除対生検)が増殖パターンに及ぼす影響を判定し得る。増殖パターンは、多くの場合大きく均質な領域であるため、画像パッチレベル分類は、十分に正確であり得る。いくつかの実施形態では、印環細胞検出および肝様細胞検出の両方が、遺伝子融合の存在に関連付けられ得る。このような目的の細胞を検出するために、デジタル病理画像処理システム210は、物体の検出および位置特定に依存し得る。目的の細胞検出を含むいくつかの例では、デジタル病理画像処理システム210は、例えば、検出された細胞の数またはタイプに基づいて、検出された細胞と融合状態との間の関係を判定し得る。場合によっては、デジタル病理画像処理システム210は、細胞の精細な位置特定または画像パッチレベル検出をさらに実行し得る。
【0107】
デジタル病理画像処理システム210はまた、遺伝子融合検出のために他のアプローチ440を使用してもよい。限定ではなく、例として、場合によっては、デジタル病理画像処理システム210は、デジタル病理画像から腫瘍不均一性(腫瘍細胞のサイズ、形状および染色の変動性)を識別し、識別された腫瘍不均一性を測定し得る。これに対応して、いくつかの例では、デジタル病理画像が遺伝子融合の発生の表示を含み得ると判定することは、測定された腫瘍不均一性にさらに基づいてもよい。
【0108】
次いで、デジタル病理画像処理システム210は、腫瘍形態分析430、エンドツーエンド分類420、および他のアプローチ440からの結果に対して集約ステップ450を実行し得る。結果の集約は、任意の適切なアプローチを使用して(例えば、アンサンブル分類を使用して、または全てのサブタスクによって全ての中間結果を生成し、続いて、全ての中間結果を消費して共同予測を出力する別の分類モデルを訓練することによって)実行され得る。集約された結果が使用されて、組織標本の融合状態460を予測し得る。いくつかの実施形態では、融合状態予測は、(例えば、スライドレベルのラベルが利用可能であり得る)弱教師あり分類タスクであり得る。場合によっては、デジタル病理画像処理システム210は、複数の画像パッチを分類するためにマルチインスタンス学習(MIL)アプローチを使用してもよい。場合によっては、デジタル病理画像処理システム210は、全ての画像パッチへのスライドラベルの割り当てを含む単純化された戦略を使用してもよい。特定の実施形態では、デジタル病理画像が癌細胞に対する遺伝子融合の発生の表示を含むと判定することは、各画像パッチに対して生成されたラベルの重み付けされた組み合わせにさらに基づいてもよい。限定ではなく、例として、場合によっては、デジタル病理画像処理システム210は、バイナリ分類器を使用して画像パッチを分類し、次いで、全ての画像パッチ予測を組み合わせる(例えば、平均化する)ことによってスライドレベル予測を判定し得る。
【0109】
特定の実施形態では、デジタル病理画像処理システム210は、グラフィカルユーザインターフェースを介して、予後予測を出力し得る。場合によっては、グラフィカルユーザインターフェースは、デジタル病理画像のグラフィカル表現を含んでもよい。場合によっては、グラフィカル表現は、複数の画像パッチのそれぞれに対して生成されたラベルの指示と、それぞれのラベルに関連付けられた予測信頼度とを含んでもよい。場合によっては、デジタル病理画像処理システム210の出力はまた、以下のような他の情報を含んでもよい。限定ではなく、例として、デジタル病理画像処理システム210は、処置レジメン評価を出力し得る。デジタル病理画像処理システム210は、生物学的試料が由来する対象または患者のための1つまたは複数の処置レジメンの使用に関連する推奨を生成し得る。例えば、評価は、所与の対象または患者からの試料が遺伝子融合を有する可能性が高いことであり得るため、追跡分子アッセイによる確認が推奨される。限定ではなく、別の例として、デジタル病理画像処理システム210は、否定的な結果、すなわち、予測または検出された遺伝子融合がないことを出力してもよい。限定ではなく、さらに別の例として、デジタル病理画像処理システム210は、「分析に不十分」を出力してもよい。例えば、「分析に不十分」は、腫瘍サイズまたはスライド(例えば、腫瘍標本が小さすぎた、および/または病理スライドの品質が組織処理アーチファクトの量によって妨げられた)のいずれかに起因し得る。例えば、組織切片の切断に使用されるミクロトームブレードは、スライドを横切る一連の平行な裂け目を生成し得る。これらのタイプのサンプリング処理アーチファクトは、病理スライド画像を分析するために使用されるデジタル病理機械学習モデルが正確な予測を行うのを妨げることがある。
【0110】
本明細書に開示される実施形態は、ユーザがユーザエンドからデジタル病理画像に基づいて予後予測を容易に要求することを可能にし得る。特定の実施形態では、デジタル病理画像処理システム210は、クライアントコンピューティングシステムからリモートコンピューティングシステムに要求通信を送信して、対象からの生物学的試料の特定の部分の癌細胞を示すデジタル病理画像を処理し得る。クライアントコンピューティングシステムから要求通信を受信することに応答して、リモートコンピューティングシステムは、以下のステップを含む動作を実行し得る。リモートコンピューティングシステムは、最初にデジタル病理画像にアクセスし得る。次いで、リモートコンピューティングシステムは、デジタル病理画像を、それぞれが腫瘍細胞の1つまたは複数のクラスタを示す複数の画像パッチにセグメント化し得る。次いで、リモートコンピューティングシステムは、複数の画像パッチのそれぞれについて、画像パッチが腫瘍領域または腫瘍入れ子構造を示す可能性を示すラベルを生成し得る。次いで、リモートコンピューティングシステムは、各画像パッチについて生成されたラベルに基づいて、デジタル病理画像が癌細胞に対する遺伝子融合の発生の表示を含むと判定し得る。次いで、リモートコンピューティングシステムは、癌細胞に対する応答を伴う遺伝子融合の発生に基づいて、対象の予後予測を生成し得る。特定の実施形態では、予後予測は、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含み得る。リモートコンピューティングシステムは、応答通信を介してクライアントコンピューティングシステムに予後予測をさらに提供し得る。特定の実施形態は、応答通信を受信することに応答して、クライアントコンピューティングシステムによって予後予測をさらに出力し得る。
【0111】
図5A~
図5Dは、肺腺癌におけるアクショナブル融合予測の例を示している。
図5Aは、肺腺癌の病理スライド画像の非限定的な例を示している。左画像505は、ROS1融合を有する転移性肺腺癌のスライドである。右画像510は、EGFR変異を有する肺腺癌のスライドである。
図5Bは、品質管理の結果の非限定的な例を示している。
図5Bに示すように、品質管理プロセスは、組織515、マーカー520、ぼけ525、および結合画像特徴550を識別し得る。
図5Cは、腫瘍領域検出の非限定的な例を示している。
図5Cに示すように、領域が濃いほど腫瘍領域である可能性が高い。
図5Dは、融合状態の予測の非限定的な例を示している。
図5Dに示すように、領域が暗いほど遺伝子融合を含む可能性が高い。
【0112】
図6は、ROS1遺伝子融合状態の予測の非限定的な例を示している。
図6に示す画像は、病理学者に提供され得る最終出力の例である。左画像610は、ROS1融合を含む転移性肺腺癌の融合陽性スライドを示している。右画像620は、画像610からの同じ視野を、遺伝子融合予測の重ね合わせヒートマップとともに示している。2つの画像を比較すると、腫瘍検出アルゴリズムが腫瘍を含まない画像パッチをどのように拒絶したかを確認することができる。さらに、(ヒートマップの強度によって示されるような)予測の信頼性メトリックは、腫瘍領域にわたって変化し得る。信頼性メトリックは、印環細胞を有する領域において最も高くなり得る。図から分かるように、デジタル病理画像処理システム210は、デジタル病理モデルが解釈可能な形態学的特徴に基づいていることを病理学者に明らかにするフォーマットで出力を提供し得る。
【0113】
本明細書に開示されるデジタル病理モデルおよび方法を検証するために、肺腺癌におけるアクショナブル融合予測に関する実験を行った。
図7は、画像パッチベース融合予測のための受信者動作特性(ROC)曲線710の非限定的な例を示している。デジタル病理モデルの訓練セットは、270個の切除を含む。それらの18.5%は融合陽性であり、すなわち5人の患者に由来する50枚のスライドである。これらの融合陽性スライドのうち、5枚のスライドは、ALK融合陽性であり、45枚のスライドは、ROS1融合陽性である。検査セットは、598個の切除および生検を含む。それらの11%が融合陽性、すなわち68枚のスライドである。これらの融合陽性スライドのうち、8枚のスライドは、NTRK融合陽性であり、60枚のスライドは、ROS1融合陽性であった。0.5に設定されたカットオフについて、性能統計は以下の通りである:陽性予測値(PPV)は0.46であり、陰性予測値(NPV)は0.97であり、全体の曲線下面積(AUC)は0.89である。
【0114】
特定の実施形態では、エンドツーエンドの結果における細胞外ムチン信号は、以下の通りであり得る。過剰な細胞外ムチンは、融合状態を示すと報告されており、エンドツーエンド融合状態予測は、この仮定を実証し得る。ムチンプール中の強い信号が観察され得る。特定の実施形態では、デジタル病理画像処理システム210は、融合状態を詳細にさらに予測し、切除と生検との間の違いを識別し、領域の正確なセグメント化を判定し、細胞外ムチン含有画像パッチの粗検出を行い、領域から実際の融合状態予測に移行し得る。限定ではなく、例として、領域から実際の融合状態の予測に移行することは、ムチン対組織の割合を決定すること、またはムチン対腫瘍の割合を決定することを含み得る。
【0115】
特定の実施形態では、エンドツーエンド予測における拡散融合信号は、以下の通りであり得る。キナーゼまたは癌遺伝子融合物は、低い腫瘍変異負荷に関連し得る。腫瘍の主な発癌要因は、単一遺伝子融合であり得る。したがって、単一の発癌性ドライバーに由来する形態学的信号は、スライド上の腫瘍細胞/領域の大部分にわたって存在すると予想されるであろう。エンドツーエンド融合状態予測はまた、スライド全体にわたって強い均一な信号を示し得る。
【0116】
図8は、クライアントコンピューティングシステムを利用するエンドユーザが、デジタル病理画像の処理に基づいて(方法300のステップを実行するリモートコンピューティングシステムによって)デジタル病理画像処理システム210から予後予測を要求することを可能にする例示的な方法800を示している。本方法は、ステップ810において開始し得て、
図2に示すデジタル病理画像処理システム210は、クライアントコンピューティングシステムからリモートコンピューティングシステムに、患者からの生物学的試料の特定の部分における癌細胞を示すデジタル病理画像を処理するための要求通信を送信し得て、クライアントコンピューティングシステムからの要求通信を受信することに応答して、リモートコンピューティングシステムは、以下のサブステップを含む動作を実行する。サブステップ810aにおいて、リモートコンピューティングシステムは、デジタル病理画像にアクセスし得る。サブステップ810bにおいて、リモートコンピューティングシステムは、デジタル病理画像を複数の画像パッチにセグメント化し得る。サブステップ810cにおいて、リモートコンピューティングシステムは、複数の画像パッチのそれぞれについて、画像パッチが例えば腫瘍領域または腫瘍入れ子構造を示す可能性を示すラベルを生成し得る。サブステップ810dにおいて、リモートコンピューティングシステムは、各画像パッチについて生成されたラベルに基づいて、デジタル病理画像が癌細胞に対する遺伝子融合の発生の表示を含むと判定し得る。サブステップ810eにおいて、リモートコンピューティングシステムは、癌細胞に対する遺伝子融合の発生に基づいて、対象の予後予測を生成し得て、予後予測は、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含む。サブステップ810fにおいて、リモートコンピューティングシステムは、応答通信を介してクライアントコンピューティングシステムに予後予測を提供し得る。ステップ820において、コンピューティングシステムは、応答通信を受信することに応答して、予後予測を出力し得る。場合によっては、
図8に示す方法の1つまたは複数のステップは、適切な場合に繰り返され得る。本開示は、
図8の方法の特定のステップを特定の順序で発生するものとして説明および図示しているが、本開示は、任意の適切な順序で発生する
図8の方法の任意の適切なステップを想定している。さらに、本開示は、
図8の方法の特定のステップを含む、エンドユーザが予後予測を要求することを可能にするための例示的な方法を説明および図示しているが、本開示は、エンドユーザが予後予測を要求することを可能にするための任意の適切な方法を企図しており、適切な場合には、
図8の方法のステップの全て、一部、またはいずれも含まない任意の適切なステップを含む。さらにまた、本開示は、
図8の方法の特定のステップを実行する特定の構成要素、装置、またはシステムを説明および図示しているが、本開示は、
図8の方法の任意の適切なステップを実行する任意の適切な構成要素、装置、またはシステムの任意の適切な組み合わせを想定している。
【0117】
図9は、検出された癌細胞のセットに対する遺伝子融合の欠如を識別することに基づいて代替処置を予測するための例示的な方法900を示している。本方法は、ステップ910において開始し得て、
図2に示すデジタル病理画像処理システム210は、対象からの生物学的試料の特定の部分における癌細胞を示すデジタル病理画像にアクセスし得る。ステップ920において、デジタル病理画像処理システム210は、デジタル病理画像が、遺伝子融合の発生と相互に排他的な1つまたは複数の変異の表示を含むと判定し得る。ステップ930において、デジタル病理画像処理システム210は、癌細胞に対する遺伝子融合の非存在を判定し得る。ステップ940において、デジタル病理画像処理システム210は、癌細胞に対する遺伝子融合の非存在に基づいて、対象の予後予測を生成し得て、予後予測は、対象についての1つまたは複数の処置レジメンの適用可能性の予測を含む。場合によっては、
図9の方法の1つまたは複数のステップは、適切な場合に繰り返され得る。本開示は、
図9の方法の特定のステップを特定の順序で発生するものとして説明および図示しているが、本開示は、任意の適切な順序で発生する
図9の方法の任意の適切なステップを想定している。さらに、本開示は、
図9の方法の特定のステップを含む、遺伝子融合を排除するための例示的な方法を記載および図示しているが、本開示は、適切な場合には、
図9の方法のステップの全部、一部、またはいずれも含まない任意の適切なステップを含む、遺伝子融合の欠如(または非存在)を識別するための任意の適切な方法を企図している。さらにまた、本開示は、
図9の方法の特定のステップを実行する特定の構成要素、装置、またはシステムを説明および図示しているが、本開示は、
図9の方法の任意の適切なステップを実行する任意の適切な構成要素、装置、またはシステムの任意の適切な組み合わせを想定している。
【0118】
いくつかの実施形態では、腫瘍不均一性を識別することは、変異腫瘍細胞の形態学的特徴および各表現型における変異腫瘍細胞の空間分布の評価に基づいて、変異腫瘍細胞を表現型に分類することを含む。変異状況、または腫瘍細胞が変異している様式は、高不均一性変異状況(例えば、免疫療法に対する応答の予後予測であり得る腫瘍抑制因子および/または未知のドライバー)から、中間不均一性変異状況(例えば、癌遺伝子変異(癌遺伝子変異に対する標的化療法に対する応答の予後予測であり得る))から低不均一性、すなわち、均質またはクローン変異状況(例えば、特定の遺伝子融合のための特定のタイプの標的療法に対する応答の予後予測であり得る遺伝子融合)まで変化し得る。
【0119】
図10A~
図10Cは、上側のウィンドウに示されるような変異状況の例示的な表現の概略図であり、下側のウィンドウに示されるような対応する視覚的シグネチャ(例えば、WSIにおいて捕捉された腫瘍細胞のクラスタの形態学的特徴)の例示的な表現の上に示される。例示されるように、変異状況の表現は、腫瘍細胞が変異し、増殖するにつれて、どのように不均一性が増加または減少するか(全体的および腫瘍細胞の単一表現型クラスタ内の両方)を示している。異なる腫瘍細胞表現型は、異なる塗りつぶしパターンを有する円によって表される。
【0120】
図10Aは、変異状況1010-腫瘍抑制因子および/または未知のドライバー-およびその対応する視覚的シグネチャ1020の例示的表現の概略図である。腫瘍細胞間のような高レベルの不均一性は、形態学的特徴において観察され得る。腫瘍抑制因子および/または未知のドライバーの変異状況を他の変異状況から区別する例示的な視覚的特徴は、腫瘍細胞間の高度の表現型変異および異なる表現型間のような腫瘍細胞の不均一な空間分布を含む。腫瘍細胞1010aのクラスタ(破線で示す)によって示されるように、黒丸によって表される表現型は、限定ではなく例として、測定される特定の範囲の核領域および核境界に対する一定レベルの角張りを有する腫瘍細胞であり得る。視覚的シグネチャ1020の領域1020aは、その例示的表現型(すなわち、測定された特定の核領域および核境界に対する特定のレベルの角張りを有する腫瘍細胞)の対応する視覚的シグネチャの例示的表現を示す。
【0121】
図10Bは、変異状況1030-癌遺伝子ドライバー変異(例えば、EGFR変異)-およびその対応する視覚的シグネチャ1040の例示的表現の概略図である。腫瘍細胞間のような中程度レベルの不均一性は、形態学的特徴において観察され得る。癌遺伝子ドライバー変異の変異状況を他の変異状況と区別する例示的な視覚的シグネチャは、腫瘍細胞の様々な表現型のクラスタおよび腫瘍細胞の異なるクラスタ間のような空間分布における分散だけでなく、クラスタ内の腫瘍細胞間のような近い等距離の空間分布も含む。腫瘍細胞1030a、1030bおよび1030cのクラスタ(破線で示す)によって示されるように、これらのクラスタによって表される3つの表現型は、限定ではなく例として、視野の選択された領域内の境界ボックス内の画素に対する核内の画素の比の3つの異なる範囲を有する腫瘍細胞であり得る。視覚的シグネチャ1040(クラスタ1030a、1030b、および1030cにそれぞれ対応する)の領域1040a、1040b、および1040cは、それらの3つの例示的表現型の対応する視覚的シグネチャの例示的表現を示している。
【0122】
図10Cは、変異状況1050-癌遺伝子融合(例えば、ALK、NTRK、ROS1、RET)-およびその対応する視覚的シグネチャ1060の例示的表現の概略図である。腫瘍細胞間のような高度の均一性(すなわち、低いまたは存在しない不均一性、別名クローンの外観)は、形態学的特徴において観察され得る。癌遺伝子融合の変異状況を他の変異状況と区別する例示的な視覚的特徴は、腫瘍細胞における表現型の変動が低い(または存在しない)こと、および腫瘍細胞の近接した等距離の空間分布を含む。腫瘍細胞1050aのクラスタ(破線で示す)によって示されるように、そのクラスタによって表される表現型は、限定ではなく例として、特定の画素強度値を有する腫瘍細胞であり得る。視覚的シグネチャ1060は、その例示的表現型(すなわち、単一の表現型の細胞の均一なクラスタ)の対応する視覚的シグネチャの例示的表現を示している。
【0123】
図11は、腫瘍不均一性を識別するための非限定的な例示的な方法1100についてのフローチャートである。ステップ1110において、対象から採取された腫瘍細胞を示すデジタル病理画像は、取得(例えば、データベースまたはオンラインリポジトリから)によって、またはデジタル病理画像生成システム220を使用してWSIを走査することによってアクセスされ得る。デジタル病理画像は、腫瘍細胞を示すものとして以前に識別されていてもよい(例えば、人間の病理学者によって、またはデジタル病理画像処理システム210によって)。ステップ1120において、デジタル病理画像からパッチが選択され得る。これらのパッチでは、腫瘍細胞に注釈が付けられ、核がセグメント化され、核マスクが生成されていることがある。ステップ1130において、腫瘍細胞は、(例えば、以下に列挙するような)核形態学的特徴の評価に基づいて、共有された核形態学的特徴を含む表現型のクラスタに分類され得て、表現型のそれぞれは異なる変異に対応する。いくつかの実施形態では、腫瘍細胞、そのサブ構造、および/または間質もしくは他の近くの細胞の他の形態学的特徴も評価され得る。ステップ1140において、腫瘍細胞は、表現型および位置によって、腫瘍領域または巣を表すクラスタにグループ化され得る。表現型によって腫瘍細胞を分類することは、形態学的特徴に基づいて腫瘍細胞を評価することを含み得る。腫瘍細胞を位置によってグループ化することは、図示のように腫瘍巣をセグメント化すること、または任意の他の適切な技術によって、最小全域木を生成することおよび外れ値検出を使用して木をサブグラフに分割することを含み得る。ステップ1150において、各クラスタ内の細胞間の空間距離が定量され得る。空間距離は、WSI内の全てのグラフについてペアワイズに隣接スペクトル距離を計算することによって定量され得る。空間距離はまた、近接するクローン細胞を識別するために空間エントロピーを測定することによって定量され得る。ステップ1160において、分類された腫瘍細胞、識別されたクラスタ、または定量された空間距離に基づいて、アクショナブル変異が存在する可能性が予測され得る。ステップ1170において、パッチレベルの予測に基づいて、対象の予後予測が生成され得て、予後予測は、対象についての1つまたは複数の処置レジメンに対する応答の予測を含む。
【0124】
図12A~
図12Cは、腫瘍細胞注釈、核分割および核マスク生成の非限定的な例を示している。
図12Aに示すように、(例えば、単純な点を使用して)各腫瘍細胞核の位置に注釈を付けてもよく、その後、
図12Bに示すように、各核がセグメント化される。
図12Bのコールアウトに示すように、異なる核は、異なる核形態学的特徴を示し得る。例えば、核1210の境界は、核1220の卵形状の境界または核1230および1240の不規則な部分的に湾曲した部分的に角度のある境界と比較して比較的丸い。さらに、核1220の相対面積は、核1210の面積の約2倍、核1230の面積の約3倍に見える。次に、
図12Cに示すように、各核形態特徴内の境界を定義するために、各核についてマスクが生成され得る。
【0125】
いくつかの実施形態では、核不均一性を評価することによって腫瘍不均一性を識別する。いくつかの実施形態では、核不均一性を評価することは、核形態学的不均一性に基づいて変異細胞を区別するために細胞核の特定の特徴を定量することを含む。いくつかの実施形態では、デジタル病理画像処理システム210は、いくつかの異なるアプローチのいずれかを使用して、WSIにおいて識別された各腫瘍核を分析し得る。例えば、1つのアプローチでは、自動腫瘍核検出およびパラメータ化が実行され得て、訓練された機械学習モデルが使用されて、各腫瘍核を識別し、以下に説明するように、各核についての特定のパラメータまたは特徴のセットを測定し、次いで、これらの特定のパラメータまたは特徴の集団レベル分布を比較し得る。別の例では、アプローチは、画像パッチベースの評価であり得る腫瘍画像セグメンテーションを実行することを含み得る。いくつかの例では、腫瘍不均一性の判定は、スライド予測に基づいて実行され得る(これは、例えば、不均一であると予測された画像パッチの割合、または各スライドの予測スコアの平均を計算することを含み得る)。
【0126】
いくつかの例では、腫瘍不均一性は、遺伝子融合に関与する遺伝子のタイプによって推進され得る。腫瘍抑制遺伝子の場合、腫瘍形成は、機能の喪失によって媒介され得る。そのような変異は、細胞を細胞周期制御から解放し、これが次に間接的に増殖を促進し得る。時間が経つにつれて、このプロセスは、娘細胞の新たな世代ごとに癌促進変異の蓄積を可能にする。対照的に、癌遺伝子の場合、腫瘍形成は、機能獲得によって媒介され得る。例えば、増殖因子の過剰活性化は、増殖を直接促進し、それによって無制限の増殖をもたらし得る。このプロセスは、さらなる変異を必要としない即時増殖の利点をもたらすと予測される。この理論的根拠に基づいて、ALK、ROS1、RETおよびNTRKなどの癌遺伝子を含む融合を含む腫瘍では、低い腫瘍不均一性が予想され得る。
【0127】
腫瘍不均一性を評価するための1つのアプローチは、核などの腫瘍細胞における細胞レベルの構造の形態の評価を含み得る。核の形態は、限定ではなく例として、クロマチン特徴、幾何学的座標、基本形態特徴、2次元形状特徴、一次統計量、「グレーレベル」(例えば、「グレー」は画素強度レベルの空間分布を表す)共起行列特徴、グレーレベル依存性行列特徴、グレーレベルランレングス行列特徴、グレーレベルサイズゾーン行列特徴、隣接するグレートーン差分行列特徴、高度な核形態特徴、ならびに境界および湾曲特徴などの画像特徴のカテゴリに編成され得る複数の画像特徴によって表され得る。
【0128】
各タイプは、1つまたは複数の画像特徴を含み得る。例示的な画像特徴は、以下を含み得るが、これらに限定されるものではない:
● 以下のようなクロマチン特徴:
〇 核の不均一性(ヘテロ)、
〇 顆粒(塊)のサイズ分布、
〇 全核面積に対する大きい顆粒の割合(凝縮)、
〇 核膜またはマージンの周りの分布(辺縁);
● 以下のような幾何学的座標:
〇 領域座標(region_coords)、
〇 x座標(x)、
〇 y座標(y);
● 以下のような基本的な形態特徴:
〇 核の面積(area)、
〇 核の凸面積(convex_area)、
〇 核の偏心度(eccentricity)、
〇 核の直径(equivalent_diameter)、
〇 全視野もしくは視野または視野の選択された領域のいずれかにおける、境界ボックス内の画素に対する核内の画素の比(extent)、
〇 核の周囲(perimeter)、
〇 凸包の画素に対する核内の画素の比(solidity)、
〇 慣性テンソルの固有値によって測定される核の伸び(inertia_tensor_eigvals1、inertia_tensor_eigvals2)、
〇 核の長軸の長さ(major_axis_length)、
〇 核の短軸の長さ(minor_axis_length)、
〇 Huモーメント(特定の加重平均、別名画像画素の強度の「モーメント」、すなわち並進、回転、およびスケール不変のモーメント)(moments_hu0、moments_hu1、moments_hu2、moments_hu3、moments_hu4、moments_hu5、moments_hu6)、
〇 重み付きHuモーメント(weighted_moments_hu0、weighted_moments_hu1、weighted_moments_hu2、weighted_moments_hu3、weighted_moments_hu4、weighted_moments_hu5、weighted_moments_hu6);
● 以下のような2次元形状特徴:
〇 2次元形状伸長(original_shape2D_longation)、
〇 2次元形状最大径(original_shape2D_MaximumDiameter)、
〇 2次元形状メッシュ面(original_shape2D_MeshSurface)、
〇 2次元形状周辺対表面比(original_shape2D_PerimeterSurfaceRatio)、
〇 2次元形状画素面(original_shape2D_PixelSurface)、
〇 2次元形状真球度(original_shape2D_Sphericity)、
〇 2次元形状球面不均衡(original_shape2D_SphericalDisproportion);
● 以下のような一次統計量:
〇 一次10パーセンタイル(original_firstorder_10Percentile)、
〇 一次90パーセンタイル(original_firstorder_90Percentile)、
〇 一次エネルギー(original_first_order_Energy)、
〇 画像値の不確実性またはランダム性を指定する一次エントロピー(original_first_order_Entropy)、
〇 四分位分割に基づいて変動を測定する一次四分位範囲(original_firstorder_InterquartileRange)、
〇 値の分布の「ピークネス」を測定する一次尖度(original_first_order_Kurtosis)、
〇 一次最大値(original_first_Maximum)、
〇 一次平均絶対偏差(original_firstorder_MeanAbsoluteDeviation)、
〇 一次平均値(original_first_Mean)、
〇 一次中央値(original_first_Median)、
〇 一次最小値(original_firstorder_Minimum)、
〇 一次範囲(original_firstorder_Range)、
〇 平均値からの全ての強度値の平均距離である、一次ロバスト人絶対偏差(original_firstorder_RobustMeanAbsoluteDeviation)、
〇 全ての二乗強度値の平均である一次平均平方根(original_first_RootMeanSquared)
〇 平均値に関する値の分布の非対称性を測定する一次歪度(original_first_order_Skewness)、
〇 一次総エネルギー(original_firstorder_TotalEnergy)、
〇 一次均一性(original_firstorder_Uniformity)、
〇 一次分散(original_first_Variance);
● 以下のような(マスクによって制約された画像領域の二次結合確率関数を記述する)グレーレベル共起行列(GLCM)特徴、
〇 GLCM自己相関(original_glcm_Autocorrelation)、
〇 GLCMクラスタ隆起(original_glcm_ClusterProminence)、
〇 GLCMクラスタシェード(original_glcm_ClusterShade)、
〇 GLCMクラスタ傾向(original_glcm_ClusterTendency)、
〇 GLCMコントラスト(original_glcm_Contrast)、
〇 GLCM相関(original_glcm_Correlation)、
〇 GLCM差分平均(original_glcm_DifferenceAverage)、
〇 GLCM差分エントロピー(original_glcm_DifferenceEntropy)
〇 GLCM差分分散(original_glcm_DifferenceVariance)、
〇 GLCM逆差分(original_glcm_Id)、
〇 GLCM逆差分モーメント(original_glcm_Idm)、
〇 正規化されたGLCM逆差分モーメント(original_glcm_Idmn)、
〇 正規化されたGLCM逆差分(original_glcm_Idn)、
〇 相関のGLCM情報尺度(original_glcm_lmc1、original_glcm_lmc2)、
〇 GLCM逆分散(original_glcm_InverseVariance)、
〇 GLCMジョイント平均(original_glcm_JointAverage)、
〇 GLCMジョイントエネルギー(original_glcm_JointEnergy)、
〇 GLCMジョイントエントロピー(original_glcm_JointEntropy)、
〇 GLCM最大相関係数(original_glcm_MCC)、
〇 GLCM最大確率(original_glcm_MaximumProbability)、
〇 GLCM総和平均(original_glcm_SumAverage)、
〇 GLCMエントロピー和(original_glcm_Sumentropy)、
〇 GLCM二乗和(original_glcm_SumSquares);
● 以下のようなグレーレベル依存行列(画像内のグレーレベル依存性を定量し、グレーレベル依存性は、中心画素に依存する指定された距離内の接続された画素の数として定義される)特徴:
〇 GLDMグレーレベル依存エントロピー(original_gldm_DependenceEntropy)、
〇 GLDM依存性非均一性(original_gldm_DependenceNonUniformity)、
〇 GLDM依存性非均一性正規化(original_gldm_DependenceNonUniformityNormalized)、
〇 GLDM依存性分散(original_gldm_DependenceVariance)、
〇 GLDMグレーレベル非均一性(original_gldm_GrayLevelNonUniformity)、
〇 GLDMグレーレベル分散(original_gldm_GrayLevelVariance)、
〇 GLDM高グレーレベル強調(original_gldm_HighGrayLevelEmphasis)、
〇 GLDM大依存性強調(original_gldm_LargeDependenceEmphasis)、
〇 GLDM大依存性高グレーレベル強調(original_gldm_LargeDependenceHighGrayLevelEmphasis)、
〇 GLDM大依存性低グレーレベル強調(original_gldm_LargeDependenceLowGrayLevelEmphasis)、
〇 GLDM低グレーレベル強調(original_gldm_LowGrayLevelEmphasis)、
〇 GLDM小依存性強調(original_gldm_SmallDependenceEmphasis)、
〇 GLDM小依存性高グレーレベル強調(original_gldm_SmallDependenceHighGrayLevelEmphasis)、
〇 GLDM小依存性低グレーレベル強調(original_gldm_SmallDependenceLowGrayLevelEmphasis);
● 以下のようなグレーレベルランレングス行列(GLRLM)(同じグレーレベル値を有する連続する画素の画素数での長さとして定義されるグレーレベルランを定量する)特徴:
〇 GLRLMグレーレベル非均一性(original_glrlm_GrayLevelNonUniformity)、
〇 正規化されたGLRLMグレーレベル非均一性(original_glrlm_GrayLevelNonUniformityNormalized)、
〇 GLRLMグレーレベル分散(original_glrlm_GrayLevelVariance)、
〇 GLRLM高グレーレベルラン強調(original_glrlm_HighGrayLevelRunEmphasis)、
〇 GLRLMロングラン強調(LRE)(original_glrlm_LongRunEmphasis)、
〇 GLRLMロングラン高グレーレベル強調(original_glrlm_LongRunHighGrayLevelEmphasis)、
〇 GLRLMロングラン低グレーレベル強調(original_glrm_LongRunLowGrayLevelEmphasis)、
〇 GLRLM低グレーレベルラン強調(original_glrlm_LowGrayLevelRunEmphasis)、
〇 GLRMランエントロピー(original_glrm_RunEntropy)、
〇 GLRMランレングス非均一性)、(original_glrm_RunLengthNonuniformity)、
〇 GLRLMランレングス非均一性正規化(original_glrlm_RunLengthNonUniformityNormalized)、
〇 GLRLMランパーセンテージ(original_glrlm_RunPercentage)、
〇 GLRLMラン分散(original_glrlm_RunVariance)、
〇 GLRLMショートラン強調(original_glrlm_ShortRunEmphasis)、
〇 GLRLMショートラン高グレーレベル強調(original_glrlm_ShortRunHighGrayLevelEmphasis)、
〇 GLRLMショートラン低グレーレベル強調(original_glrlm_ShortRunLowGrayLevelEmphasis);
● 以下のようなグレーレベルサイズゾーン(GLSZM)(画像領域内のグレーレベルゾーンを表す)行列特徴:
〇 GLSZMグレーレベル非均一性(original_glszm_GrayLevelNonUniformity)、
〇 GLSZMグレーレベル非均一性正規化(original_glszm_GrayLevelNonUniformityNormalized)、
〇 GLSZMグレーレベル分散(original_glszm_GrayLevelVariance)、
〇 GLSZM高グレーレベルゾーン強調(original_glszm_HighGrayLevelZoneEmphasis)、
〇 GLSZM大面積強調(original_glszm_LargeAreaEmphasis)、
〇 GLSZM大面積高グレーレベル強調(original_glszm_LargeAreaHighGrayLevelEmphasis)、
〇 GLSZM大面積低グレーレベル強調(original_glszm_LargeAreaLowGrayLevelEmphasis)、
〇 GLSZM低グレーレベルゾーン強調(original_glszm_LowGrayLevelZoneEmphasis)、
〇 GLSZMサイズゾーン非均一性(original_glszm_SizeZoneNonUniformity)、
〇 GLSZMサイズゾーン非均一性正規化(original_glszm_SizeZoneNonUniformityNormalized)、
〇 GLSZM小面積強調(original_glszm_SmallAreaEmphasis)、
〇 GLSZM小面積強調高グレーレベル強調(original_glszm_SmallAreaHighGrayLevelEmphasis)、
〇 GLSZM小面積低グレーレベル強調(original_glszm_SmallAreaLowGrayLevelEmphasis)、
〇 GLSZMゾーンエントロピー(original_glszm_ZoneEntropy)、
〇 GLSZMゾーンパーセンテージ(original_glszm_ZonePercentage)、
〇 GLSZMゾーン分散(original_glszm_ZoneVariance);
● 以下のような隣接階調差行列(NGTDM)(特定の距離内の隣接者のグレー値と平均グレー値との間の差を記述する)特徴:
〇 NGTDM繁忙(original_ngtdm_Busyness)、
〇 NGTDM粗さ(original_ngtdm_Coarseness)、
〇 NGTDM複雑度(original_ngtdm_Complexity)、
〇 NGTDMコントラスト(original_ngtdm_Contrast)、
〇 NGTDM強度(original_ngtdm_Strength);
● 以下のような進行した核形態学的特徴:
〇 楕円形の核の半径(ellipse_R_index)、
〇 楕円形の核の長軸(ellipse_MA_index)、
〇 曲率の周囲長を測定する核の凸性周囲長(convexity_perimeter)、
〇 核の丸みを測定する核の真円度(circularity)、
〇 凸包から形状を減算したときに残る連結成分の正規化数(Ncce_index);
● 以下のような境界(核の境界シグネチャは、全ての境界座標から核の重心点までの距離プロファイルである)特徴:
〇 中央値(median(R))、
〇 モード(mode(R))、
〇 最大(max_v:maxR(R))、
〇 最小(min_v:min(R))、
〇 境界シグネチャの25パーセンタイル(percentile_25:25% percentile(R))、
〇 境界シグネチャの75パーセンタイル(percentile_75:75% percentile(R))、
〇 平均境界シグネチャの25パーセンタイル未満(mean_below_percentile_25:mean(R(R < percentile_25)))、
〇 平均境界シグネチャの75パーセンタイル超(mean_above_percentile_75:mean(R(R > percentile_75)))、
〇 境界シグネチャの合計距離(sum_dist:sum(R))、
〇 境界シグネチャの調和平均(harmonic_mean:harmonic mean(R))、
〇 3%のトリミングされた平均境界シグネチャ(trimmed_mean_3_percent:3% trimmed mean(R))、
〇 5%のトリミングされた平均境界シグネチャ(trimmed_mean_5_percent:5% trimmed mean(R))、
〇 15%のトリミングされた平均境界シグネチャ(trimmed_mean_15_percent:15% trimmed mean(R))、
〇 25%のトリミングされた平均境界シグネチャ(trimmed_mean_25_percent:25% trimmed mean(R))、
〇 平均による標準偏差(std_dev_by_mean:sR/|<R>|)、
〇 中央値による標準偏差(std_dev_by_median:sR/|median(R)|)、
〇 モードによる標準偏差(std_dev_by_mode:sR/|mode(R)|)、
〇 歪度(skewness(R))、
〇 尖度(kurtosis(R))、
〇 距離プロファイルの平均-境界シグネチャの平均(mean_dist_profile_minus_mean:mean(|R-<R>|))、
〇 範囲(range_v:range(X))
〇 四分位範囲(interquartile_range:interquartile range(X))、
〇 距離プロファイルの二乗和(sum_dist_profile_square:sum(R2))、
〇 三乗合計距離プロファイル(sum_dist_profile_cube:sum(R3))、
〇 二乗平均距離プロファイル(mean_dist_profile_square:mean(R2))、
〇 三乗平均距離プロファイル(mean_dist_profile_cube:mean(R3))、
〇 4に上げられた平均距離プロファイル(mean_dist_profile_raise_to_four:mean(R4))、
〇 5に上げられた平均距離プロファイル(mean_dist_profile_raise_to_five:mean(R5))、
〇 距離プロファイルの和-2の平均累乗(sum_dist_profile_minus_mean_pow2:sum(|R-<R>|2))、
〇 距離プロファイルの和-3の平均累乗(sum_dist_profile_minus_mean_pow3:sum(|R-<R>|3))、
〇 平均距離プロファイル-2の平均累乗(mean_dist_profile_minus_mean_pow2:mean(|R-<R>|2))、
〇 平均距離プロファイル-3の平均累乗(mean_dist_profile_minus_mean_pow3:mean(|R-<R>|3))、
〇 平均距離プロファイル-4の平均累乗(mean_dist_profile_minus_mean_pow4:mean(|R-<R>|4))、
〇 平均距離プロファイル-5の平均累乗(mean_dist_profile_minus_mean_pow5:mean(|R-<R>|5))、
〇 ピーク数(number_of_peaks)、
〇 gini係数(gini coefficient);
● 以下のような曲率特徴:
〇 中央値曲率(c_median:median(k))、
〇 モード曲率(c_mode:mode(k))、
〇 最大曲率(c_max_v:max(k))、
〇 最小曲率(c_min_v:min(k))、
〇 25パーセンタイル曲率(c_percentile_25:25% percentile(k))、
〇 75パーセンタイル曲率(c_percentile_75:75% percentile(k))、
〇 平均曲率の25パーセンタイル未満(c_mean_below_percentile_25:mean(k(k < c_percentile_25)))、
〇 平均曲率の75パーセンタイル超(c_mean_above_percentile_75:mean(k(k > c_percentile_75)))、
〇 合計距離(c_sum_dist:sum(k))、
〇 調和平均(c_harmonic_mean:harmonic mean(k))
〇 3%のトリミングされた平均曲率(c_trimmed_mean_3_percent:3% trimmed mean(k))、
〇 3%のトリミングされた平均曲率(c_trimmed_mean_5_percent:5% trimmed mean(k))、
〇 15%のトリミングされた平均曲率(c_trimmed_mean_15_percent:15% trimmed mean(k))、
〇 25%のトリミングされた平均曲率(c_trimmed_mean_25_percent:25% trimmed mean(k))、
〇 平均による標準偏差(c_std_dev_by_mean:sk/|<k>|)、
〇 中央値による標準偏差(c_std_dev_by_median:sk/|median(k)|)、
〇 モードによる標準偏差(c_std_dev_by_mode:sk/|mode(k)|)、
〇 歪度(c_skewness:skewness(k))、
〇 尖度(c_kurtosis:kurtosis(k))、
〇 平均曲率(c_mean:mean(|k-<k>|))、
〇 曲率範囲(c_range_v:range(k))、
〇 四分位範囲(c_interquartile_range:interquartile range(k))、
〇 曲率プロファイルの二乗和(c_sum_curvature_profile_square:sum(k2))、
〇 三乗合計曲率プロファイル(c_sum_curvature_profile_cube:sum(k3))、
〇 二乗平均曲率プロファイル(c_mean_curvature_profile_square:mean(k2))、
〇 三乗平均曲率プロファイル(c_mean_curvature_profile_cube:mean(k3))、
〇 4に上げられた平均曲率プロファイル(c_mean_curvature_profile_raise_to_four:mean(k4))、
〇 5に上げられた平均曲率プロファイル(c_mean_curvature_profile_raise_to_five:mean(k5))、
〇 曲率プロファイルの和-2の平均累乗(c_sum_curvature_profile_minus_mean_pow2:sum(|k-<k>|2))、
〇 曲率プロファイルの和-3の平均累乗(c_sum_curvature_profile_minus_mean_pow3:sum(|k-<k>|3))、
〇 平均曲率プロファイル-2の平均累乗(c_mean_curvature_profile_minus_mean_pow2:mean(|k-<k>|2))、
〇 平均曲率プロファイル-3の平均累乗(c_mean_curvature_profile_minus_mean_pow3:mean(|k-<k>|3))、
〇 平均曲率プロファイル-4の平均累乗(c_mean_curvature_profile_minus_mean_pow4:mean(|k-<k>|4))、
〇 平均曲率プロファイル-5の平均累乗(c_mean_curvature_profile_minus_mean_pow5:mean(|k-<k>|5))、
〇 ピーク数(c_number_of_peaks:number of peaks)、
〇 gini係数(c_gini_coefficient:gini coefficient(k))。
【0129】
画像特徴は、1つまたは複数の統計的メトリックを使用して評価され得る。1つまたは複数の特徴選択プロセスが使用されて、発癌性ドライバーに関連付けられた画像特徴を選択し得る。非限定的な例示的な統計的メトリックは、標準偏差、2つのランダムに引き出された試料間の差を平均する二次エントロピー、正規分布と試料の経験的分布関数との間の距離に基づくコルモゴロフ・スミルノフ、および外れ値パーセンテージ(例えば、平均から標準偏差の2倍の範囲外の値のパーセンテージ)である。いくつかの実施形態では、選択された画像特徴は、複数の画像特徴の中で発癌性ドライバーに対して最も高い関連性を有し得る。発癌性ドライバーは、融合、変異、または未知のドライバーであり得る。
【0130】
いくつかの実施形態では、例示的な選択された核形態画像特徴は、4つの例示的なカテゴリに含まれ得る。形状関連特徴のカテゴリは、細胞核の幾何学的形状を標的とする特徴を含み得る。捕捉された特性は、限定ではなく例として、個々の細胞核のサイズおよび形状ならびにその画像モーメント(画像画素強度の加重平均)を含み得る。このカテゴリの選択された特徴の例は、以下を含み得る:
● 核の面積(area)、
● 全視野もしくは視野または視野の選択された領域のいずれかにおける、境界ボックス内の画素に対する核内の画素の比(extent)、
● 凸包の画素に対する核内の画素の比(solidity)、
● Huモーメント(画像画素の強度の特定の加重平均、別名「モーメント」、すなわち並進、回転、およびスケール不変モーメント)(moments_hu0)、
● 重み付きHuモーメント(weighted_moments_hu0、weighted_moments_hu1、weighted_moments_hu2);
● 2次元形状周辺対表面比などの2次元形状特徴(original_shape2D_PerimeterSurfaceRatio);
● 楕円形の核の半径(ellipse_R_index)、
● 楕円形の核の長軸(ellipse_MA_index)
● 曲率の周囲長を測定する核の凸性周囲長(convexity_perimeter)、および
● 凸包から形状を減算したときに残る連結成分の正規化数(Ncce_index)。
【0131】
強度分布関連特徴のカテゴリは、個々の細胞核の画像における画像強度(画素値)の分布の統計的特性を捕捉する特徴を含み得る。このカテゴリの選択された特徴の例は、以下を含み得る:
● 一次90パーセンタイル(original_firstorder_90Percentile)、
● 一次最小値(original_firstorder_Minimum)、および
● 画像値の不確実性またはランダム性を指定する一次エントロピー(original_first_order_Entropy)。
【0132】
テクスチャ関連特徴のカテゴリは、画素間の空間的関係および細胞核画像の(サブ領域内の)それらの値を分析することによるテクスチャの定量を標的とする特徴を含み得る。後述するように、グレーレベル共起行列(GLCM)は、マスクによって制約される画像領域の二次結合確率関数を記述する。グレーレベル依存性行列(GLDM)は、画像内のグレーレベル依存性を定量し、グレーレベル依存性は、中心画素に依存する指定された距離内の接続された画素の数として定義される。グレーレベルランレングス行列(GLRLM)は、同じグレーレベル値を有する連続する画素の画素数での長さとして定義されるグレーレベルランを定量する。このカテゴリの選択された特徴の例は、以下を含み得る:
● GLCM逆差分(original_glcm_Id)、
● GLCMコントラスト(original_glcm_contrast)、
● GLCMジョイントエントロピー(original_glcm_JointEntropy)、
● GLCMエントロピー和(original_glcm_Sumentropy)、
● GLDMグレーレベル依存エントロピー(original_gldm_DependenceEntropy)、
● 画像を介して依存性の類似性を測定し、正規化されるGLDM依存性非均一性正規化(DNUN)(original_DependenceNonUniformityNormalized)、
● 依存性小の分布を測定する依存性小強調(SDE)(original_gldm_SmallDependenceEmphasis);
● GLRLMロングラン強調(LRE)(original_glrlm_LongRunEmphasis)、
● GLRLMロングラン低グレーレベル強調(original_glrm_LongRunLowGrayLevelEmphasis)、
● GLRMランレングス非均一性)(original_glrm_RunLengthNonuniformity)、
● GLRMランエントロピー(original_glrm_RunEntropy);
【0133】
境界曲率関連特徴のカテゴリは、異なる統計的方法を用いた細胞核の境界の曲率の分析から導出された特徴を含み得る。このカテゴリの選択された特徴の例は、以下を含み得る:
● 平均曲率(c_mean)、
● 中央値曲率(c_median)、
● 25パーセンタイル曲率(c_percentile_25)、
● 75パーセンタイル曲率(c_percentile_75)、
● 平均曲率の75パーセンタイル超(c_mean_above_percentile_75)、
● 3%のトリミングされた平均曲率(c_trimmed_mean_3_percent)、
● 5%のトリミングされた平均曲率(c_trimmed_mean_5_percent)、
● 15%のトリミングされた平均曲率(c_trimmed_mean_15_percent)、
● 25%のトリミングされた平均曲率(c_trimmed_mean_25_percent)、
● 四分位範囲曲率(c_interquartile_range)、および
● 曲率のgini係数(c_gini_coefficient)。
【0134】
図13A~
図13Eは、特定の核形態学的特徴の定量に基づく遺伝子融合の識別の実験結果の非限定的な例を示している。
図13A~
図13Eに示すように、これらの特定の核形態学的特徴の比較は、遺伝子融合、癌遺伝子ドライバー変異、ならびに腫瘍抑制因子および/または未知のドライバーの間の統計的に有意な区別を提供し得る。
【0135】
図14A~
図14Cは、腫瘍抑制因子および/または未知のドライバーに対応する4つの異なる核形態学的特徴を示すデジタル病理画像の非限定的な例を示している。
図14A~
図14Cは、それぞれ、「Area」、「First Order Entropy」および「RunLengthNonUniformity」の核形態学的特徴が、腫瘍抑制因子および/または未知のドライバーの変異状況において存在する可能性のある腫瘍不均一性の程度を高度に示す例示的なWSIを示している。「Area」は、観察された細胞核の表面積であり得る。「First Order Entropy」は、考慮される画像領域内の画素強度(すなわち、値)の分布を記述する一次統計量であり得る。それにより、エントロピーは、観測された画素値における不確実性/ランダム性を指定する。「RunLengthNonUniformity」は、画像内のグレーレベルランを定量するランレングスメトリックであり得る。グレーレベルランは、同じグレーレベル値を有する連続画素の画素数での長さとして定義される。グレーレベルランレングス行列p(i,j|θ)において、第(i,j)要素は、グレーレベルiがθによって特定される方向に連続して現れる回数jを記述する。RunLengthNonUniformity測定は、このグレーレベルのランレングス行列に基づいて、所与のランレングスで可能なランの分布を分析する。
【0136】
図15A~
図15Cは、癌遺伝子ドライバー変異に対応する4つの異なる核形態学的特徴を示すデジタル病理画像の非限定的な例を示している。
図15A~
図15Cは、それぞれ、「Area」、「First Order Entropy」および「RunLengthNonUniformity」の核形態学的特徴が、癌遺伝子ドライバー変異の変異状況において存在する可能性のある腫瘍不均一性の程度を高度に示す例示的なWSIを示している。
【0137】
図16A~
図16Cは、遺伝子融合に対応する4つの異なる核形態学的特徴を示すデジタル病理画像の非限定的な例を示している。
図16A~
図16Cは、それぞれ、「Area」、「First Order Entropy」および「RunLengthNonUniformity」の核形態学的特徴が、遺伝子融合の変異状況において存在する可能性のある腫瘍不均一性の程度を高度に示す例示的なWSIを示している。
【0138】
いくつかの実施形態では、腫瘍不均一性を識別することは、空間分布を評価するために細胞レベルの空間分析を行うことによってクローン細胞の領域を識別することを含む。いくつかの実施形態では、空間分布を評価することは、腫瘍細胞の最小全域木のサブグラフ内のスペクトル距離を測定することであって、各サブグラフが隣接細胞のクラスタ(例えば、腫瘍巣)を表す、スペクトル距離を測定することと、全てのサブグラフにわたってペアワイズに隣接スペクトル距離を計算することとを含む。
図17Aは、WSIに示される腫瘍細胞の最小全域木のサブグラフの識別の非限定的な例を示している。視野またはWSI内の全ての細胞を接続する最小全域木を生成した後、サブグラフ(例えば、腫瘍巣に対応する)が識別され得る。各サブグラフは、外れ値検出を実行することによって定義されてもよく、および/または検出された腫瘍巣のセグメンテーションに基づいて定義されてもよい。サブグラフの全てにわたってペアワイズに隣接スペクトル距離が変わると、腫瘍細胞の空間分布に関して評価が行われ得る。より等距離に分布した腫瘍細胞は、均一な腫瘍細胞の領域(すなわち、特定の遺伝子融合を有する細胞)に対応し得る。
図17Bは、サブグラフ間のような隣接スペクトル距離の定量に基づく遺伝子融合の識別の実験結果の非限定的な例を示している。
図17Bに示すように、サブグラフにわたる隣接スペクトル距離の比較は、遺伝子融合、癌遺伝子ドライバー変異、ならびに腫瘍抑制因子および/または未知のドライバーの間の統計的に有意な区別を提供し得る。
【0139】
いくつかの実施形態では、腫瘍不均一性を識別することは、空間エントロピーを評価するために細胞レベルの空間分析を行うことによって、密接に隣接するクローン細胞の領域を識別することを含む。
図18A~
図18Cは、腫瘍細胞表現型の3つの異なる分布で測定される空間エントロピーの非限定的な例を示している。
図18A~
図18Cに示すように、非空間エントロピー(すなわち、シャノンエントロピー)の尺度は、出現の分布の不均一性に対する位置の影響を反映することができないが、空間エントロピー(すなわち、アルティエリエントロピー)は、
図18A~
図18Cにおけるx軸およびy軸に沿って空間的にプロットされた出現間のように、不均一性の差を正確に反映する。
【0140】
いくつかの実施形態では、空間エントロピーを評価することは、別個の距離ビンのセット(各ビンは腫瘍細胞のペア間の距離の範囲を表す)を指定することと、各距離ビンに属する腫瘍細胞の全てのペアを識別することと、各距離ビンについて、形態学的に類似していると識別された腫瘍細胞のペアの頻度を計算することと、次いで、ビン頻度値の全ての加重和を計算することと、を含み得る。各距離ビンに適用される重みは、距離ビン中の腫瘍細胞の対の数に対応し得る。距離ビンのセットは、指定された閾値を下回る最大距離を有する距離範囲を表すビンのみに制限され得る。
図18Dは、特定の距離内で共起し、特定の表現型に分類された腫瘍細胞のペアの識別の概略図である。
【0141】
図18E~
図18Fは、遺伝子融合、癌遺伝子ドライバー変異、ならびに腫瘍抑制因子および/または未知のドライバーの空間エントロピーの測定に基づく識別の実験結果の非限定的な例を示している。
図18E~
図18Fに示すように、空間エントロピーは、遺伝子融合、癌遺伝子ドライバー変異、ならびに腫瘍抑制因子および/または未知のドライバーの間の統計的に有意な区別を提供し得る。
【0142】
図19は、例示的なコンピュータシステム1900を示している。特定の実施形態では、1つまたは複数のコンピュータシステム1900は、本明細書に記載または図示された1つまたは複数の方法の1つまたは複数のステップを実行する。特定の実施形態では、1つまたは複数のコンピュータシステム1900は、本明細書に記載または図示された機能を提供する。特定の実施形態では、1つまたは複数のコンピュータシステム1900上で実行されるソフトウェアは、本明細書に記載または図示された1つまたは複数の方法の1つまたは複数のステップを実行するか、または本明細書に記載または図示された機能を提供する。特定の実施形態は、1つまたは複数のコンピュータシステム1900の1つまたは複数の部分を含む。本明細書では、コンピュータシステムへの言及は、適切な場合には、コンピューティング装置を包含し得て、逆もまた同様である。さらに、コンピュータシステムへの言及は、適切な場合には、1つまたは複数のコンピュータシステムを包含し得る。
【0143】
本開示は、任意の適切な数のコンピュータシステム1900を想定している。本開示は、任意の適切な物理的形態をとるコンピュータシステム1900を想定している。限定ではなく、例として、コンピュータシステム1900は、組み込みコンピュータシステム、システム・オン・チップ(SOC)、シングルボードコンピュータシステム(SBC)(例えば、コンピュータ・オン・モジュール(COM)またはシステム・オン・モジュール(SOM))、デスクトップコンピュータシステム、ラップトップもしくはノートブックコンピュータシステム、インタラクティブキオスク、メインフレーム、コンピュータシステムのメッシュ、携帯電話、携帯情報端末(PDA)、サーバ、タブレットコンピュータシステム、またはこれらのうちの2つもしくはそれ以上の組み合わせであり得る。適切な場合には、コンピュータシステム1900は、1つまたは複数のコンピュータシステム1900を含んでもよく、単一であるかまたは分布し、複数の位置にまたがり、複数の機械にまたがり、複数のデータセンタにまたがり、1つまたは複数のネットワーク内の1つまたは複数のクラウドコンポーネントを含み得るクラウド内に存在する。適切な場合には、1つまたは複数のコンピュータシステム1900は、本明細書に記載または図示された1つまたは複数の方法の1つまたは複数のステップを実質的な空間的または時間的制限なしに実行し得る。限定ではなく、例として、1つまたは複数のコンピュータシステム1900は、本明細書に記載または図示された1つまたは複数の方法の1つまたは複数のステップをリアルタイムまたはバッチモードで実行し得る。1つまたは複数のコンピュータシステム1900は、適切な場合には、本明細書に記載または図示された1つまたは複数の方法の1つまたは複数のステップを異なる時間または異なる位置で実行し得る。
【0144】
特定の実施形態では、コンピュータシステム1900は、プロセッサ1902、メモリ1904、記憶装置1906、入力/出力(I/O)インターフェース1908、通信インターフェース1910、およびバス1912を含む。本開示は、特定の構成内の特定の数の特定の構成要素を有する特定のコンピュータシステムを記載および図示しているが、本開示は、任意の適切な構成内の任意の適切な数の任意の適切な構成要素を有する任意の適切なコンピュータシステムを想定している。
【0145】
特定の実施形態では、プロセッサ1902は、コンピュータプログラムを構成するものなどの命令を実行するためのハードウェアを含む。限定ではなく、例として、命令を実行するために、プロセッサ1902は、内部レジスタ、内部キャッシュ、メモリ1904、または記憶装置1906から命令を取り出し得て(またはフェッチする)、復号して実行し得て、次いで、内部レジスタ、内部キャッシュ、メモリ1904、または記憶装置1906に1つまたは複数の結果を書き込み得る。特定の実施形態では、プロセッサ1902は、データ、命令、またはアドレスのための1つまたは複数の内部キャッシュを含み得る。本開示は、適切な場合には、任意の適切な数の任意の適切な内部キャッシュを含むプロセッサ1902を想定している。限定ではなく、例として、プロセッサ1902は、1つまたは複数の命令キャッシュ、1つまたは複数のデータキャッシュ、および1つまたは複数の変換ルックアサイドバッファ(TLB)を含み得る。命令キャッシュ内の命令は、メモリ1904または記憶装置1906内の命令のコピーであり得て、命令キャッシュは、プロセッサ1902によるそれらの命令の取り出しを高速化し得る。データキャッシュ内のデータは、プロセッサ1902において実行して、プロセッサ1902において実行される後続の命令によるアクセスのため、またはメモリ1904もしくは記憶装置1906への書き込みのためにプロセッサ1902において実行される先行する命令の結果、または他の適切なデータに対して動作する命令のためのメモリ1904または記憶装置1906内のデータのコピーであり得る。データキャッシュは、プロセッサ1902による読み出し動作または書き込み動作を高速化し得る。TLBは、プロセッサ1902の仮想アドレス変換を高速化し得る。特定の実施形態では、プロセッサ1902は、データ、命令、またはアドレスのための1つまたは複数の内部レジスタを含み得る。本開示は、適切な場合には、任意の適切な数の任意の適切な内部レジスタを含むプロセッサ1902を想定している。適切な場合には、プロセッサ1902は、1つまたは複数の算術論理演算ユニット(ALU)を含み得るか、マルチコアプロセッサであり得るか、または1つまたは複数のプロセッサ1902を含み得る。本開示は、特定のプロセッサを記載および図示しているが、本開示は、任意の適切なプロセッサを想定している。
【0146】
特定の実施形態では、メモリ1904は、プロセッサ1902が実行するための命令またはプロセッサ1902が動作するためのデータを記憶するためのメインメモリを含む。限定ではなく、例として、コンピュータシステム1900は、記憶装置1906または別のソース(例えば、別のコンピュータシステム1900など)からメモリ1904に命令をロードし得る。次いで、プロセッサ1902は、メモリ1904から内部レジスタまたは内部キャッシュに命令をロードし得る。命令を実行するために、プロセッサ1902は、内部レジスタまたは内部キャッシュから命令を取り出し、それらを復号し得る。命令の実行中または実行後に、プロセッサ1902は、(中間結果または最終結果であり得る)1つまたは複数の結果を内部レジスタまたは内部キャッシュに書き込み得る。次いで、プロセッサ1902は、それらの結果のうちの1つまたは複数をメモリ1904に書き込み得る。特定の実施形態では、プロセッサ1902は、(記憶装置1906または他の位置とは対照的に)1つまたは複数の内部レジスタもしくは内部キャッシュまたはメモリ1904内の命令のみを実行し、(記憶装置1906または他の位置とは対照的に)1つまたは複数の内部レジスタもしくは内部キャッシュまたはメモリ1904内のデータのみに対して動作する。(それぞれがアドレスバスおよびデータバスを含み得る)1つまたは複数のメモリバスは、プロセッサ1902をメモリ1904に結合し得る。バス1912は、後述するように、1つまたは複数のメモリバスを含み得る。特定の実施形態では、1つまたは複数のメモリ管理ユニット(MMU)が、プロセッサ1902とメモリ1904との間に存在し、プロセッサ1902によって要求されるメモリ1904へのアクセスを容易にする。特定の実施形態では、メモリ1904は、ランダムアクセスメモリ(RAM)を含む。このRAMは、必要に応じて揮発性メモリであってもよい。適切な場合には、このRAMは、ダイナミックRAM(DRAM)またはスタティックRAM(SRAM)であってもよい。さらに、適切な場合には、このRAMは、シングルポートまたはマルチポートRAMであってもよい。本開示は、任意の適切なRAMを想定している。メモリ1904は、適切な場合には、1つまたは複数のメモリ1904を含み得る。本開示は、特定のメモリを記載および図示しているが、本開示は、任意の適切なメモリを想定している。
【0147】
特定の実施形態では、記憶装置1906は、データまたは命令のための大容量記憶装置を含む。限定ではなく、例として、記憶装置1906は、ハードディスクドライブ(HDD)、フロッピーディスクドライブ、フラッシュメモリ、光ディスク、光磁気ディスク、磁気テープ、もしくはユニバーサルシリアルバス(USB)ドライブ、またはこれらのうちの2つもしくはそれ以上の組み合わせを含み得る。記憶装置1906は、適切な場合には、取り外し可能または取り外し不可能な(または固定された)媒体を含み得る。記憶装置1906は、適切な場合には、コンピュータシステム1900の内部または外部にあってもよい。特定の実施形態では、記憶装置1906は、不揮発性ソリッドステートメモリである。特定の実施形態では、記憶装置1906は、読み出し専用メモリ(ROM)を含む。適切な場合には、このROMは、マスクプログラムROM、プログラマブルROM(PROM)、消去可能PROM(EPROM)、電気的消去可能PROM(EEPROM)、電気的変更可能ROM(EAROM)、またはフラッシュメモリ、またはこれらのうちの2つもしくはそれ以上の組み合わせであってもよい。本開示は、任意の適切な物理的形態をとる大容量記憶装置1906を想定している。記憶装置1906は、適切な場合には、プロセッサ1902と記憶装置1906との間の通信を容易にする1つまたは複数の記憶制御ユニットを含み得る。適切な場合には、記憶装置1906は、1つまたは複数の記憶装置1906を含み得る。本開示は、特定の記憶装置を記載および図示しているが、本開示は、任意の適切な記憶装置を想定している。
【0148】
特定の実施形態では、I/Oインターフェース1908は、コンピュータシステム1900と1つまたは複数のI/O装置との間の通信のための1つまたは複数のインターフェースを提供するハードウェア、ソフトウェア、またはその双方を含む。コンピュータシステム1900は、適切な場合には、これらのI/O装置のうちの1つまたは複数を含み得る。これらのI/O装置のうちの1つまたは複数は、人とコンピュータシステム1900との間の通信を可能にし得る。限定ではなく、例として、I/O装置は、キーボード、キーパッド、マイクロフォン、モニタ、マウス、プリンタ、スキャナ、スピーカ、スチルカメラ、スタイラス、タブレット、タッチスクリーン、トラックボール、ビデオカメラ、別の適切なI/O装置、またはこれらのうちの2つもしくはそれ以上の組み合わせを含み得る。I/O装置は、1つまたは複数のセンサを含み得る。本開示は、任意の適切なI/O装置およびそれらのための任意の適切なI/Oインターフェース1908を想定している。適切な場合には、I/Oインターフェース1908は、プロセッサ1902がこれらのI/O装置のうちの1つまたは複数を駆動することを可能にする1つまたは複数の装置ドライバーを含み得る。I/Oインターフェース1908は、適切な場合には、1つまたは複数のI/Oインターフェース1908を含み得る。本開示は、特定のI/Oインターフェースを記載および図示しているが、本開示は、任意の適切なI/Oインターフェースを想定している。
【0149】
特定の実施形態では、通信インターフェース1910は、コンピュータシステム1900と、1つまたは複数の他のコンピュータシステム1900または1つまたは複数のネットワークとの間の通信(例えば、パケットベースの通信など)のための1つまたは複数のインターフェースを提供するハードウェア、ソフトウェア、またはその双方を含む。限定ではなく、例として、通信インターフェース1910は、イーサネット(登録商標)もしくは他の有線ベースのネットワークと通信するためのネットワークインターフェースコントローラ(NIC)もしくはネットワークアダプタ、またはWI-FIネットワークなどの無線ネットワークと通信するための無線NIC(WNIC)もしくは無線アダプタを含み得る。本開示は、任意の適切なネットワークおよびそのための任意の適切な通信インターフェース1910を想定している。限定ではなく、例として、コンピュータシステム1900は、アドホックネットワーク、パーソナルエリアネットワーク(PAN)、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、またはインターネットの1つまたは複数の部分、またはこれらのうちの2つもしくはそれ以上の組み合わせと通信し得る。これらのネットワークのうちの1つまたは複数の1つまたは複数の部分は、有線または無線であり得る。例として、コンピュータシステム1900は、無線PAN(WPAN)(例えば、BLUETOOTH WPANなど)、WI-FIネットワーク、WI-MAXネットワーク、携帯電話ネットワーク(例えば、グローバル・システム・フォー・モバイル・コミュニケーションズ(GSM)ネットワーク)、またはその他の適切な無線ネットワーク、またはこれらのうちの2つもしくはそれ以上の組み合わせと通信し得る。コンピュータシステム1900は、適切な場合には、これらのネットワークのいずれかのための任意の適切な通信インターフェース1910を含み得る。通信インターフェース1910は、適切な場合には、1つまたは複数の通信インターフェース1910を含み得る。本開示は、特定の通信インターフェースを記載および図示しているが、本開示は、任意の適切な通信インターフェースを想定している。
【0150】
特定の実施形態では、バス1912は、コンピュータシステム1900の構成要素を互いに結合するハードウェア、ソフトウェア、またはその双方を含む。限定ではなく、例として、バス1912は、アクセラレーテッドグラフィクスポート(AGP)もしくは他のグラフィックスバス、エンハンストインダストリスタンダードアーキテクチャ(EISA)バス、フロントサイドバス(FSB)、ハイパートランスポート(HT)インターコネクト、インダストリスタンダードアーキテクチャ(ISA)バス、インフィニバンドインターコネクト、ローピンカウント(LPC)バス、メモリバス、マイクロチャネルアーキテクチャ(MCA)バス、ペリフェラルコンポーネントインターコネクト(PCI)バス、PCIエクスプレス(PCIe)バス、シリアルアドバンスドテクノロジーアタッチメント(SATA)バス、ビデオエレクトロニクススタンダーズアソシエーションローカル(VLB)バス、または別の適切なバス、またはこれらのうちの2つもしくはそれ以上の組み合わせを含み得る。バス1912は、適切な場合には、1つまたは複数のバス1912を含み得る。本開示は、特定のバスを記載および図示しているが、本開示は、任意の適切なバスまたは相互接続を想定している。
【0151】
本明細書では、コンピュータ可読非一時的記憶媒体は、1つまたは複数の半導体ベースもしくは他の集積回路(IC)(例えば、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向けIC(ASIC)など)、ハードディスクドライブ(HDD)、ハイブリッドハードドライブ(HHD)、光ディスク、光ディスクドライブ(ODD)、光磁気ディスク、光磁気ドライブ、フロッピーディスク、フロッピーディスクドライブ(FDD)、磁気テープ、ソリッドステートドライブ(SSD)、RAMドライブ、セキュアデジタルカードもしくはドライブ、任意の他の適切なコンピュータ可読非一時的記憶媒体、または適切な場合にはこれらのうちの2つもしくはそれ以上の任意の適切な組み合わせを含み得る。コンピュータ可読非一時的記憶媒体は、必要に応じて、揮発性、不揮発性、または揮発性と不揮発性との組み合わせであってもよい。
【0152】
本明細書では、「または」は包括的であり、排他的ではないが、他に明示的に示されているか、または文脈によって他に示されている場合は除く。したがって、本明細書では、「AまたはB」は、他に明示的に示されない限り、または文脈によって他に示されない限り、「A、B、またはその双方」を意味する。さらに、「および」は、明示的に別段の指示がない限り、または文脈によって別段の指示がない限り、結合およびいくつかの双方である。したがって、本明細書では、「AおよびB」は、他に明示的に示されない限り、または文脈によって他に示されない限り、「AおよびB、一緒にまたは別々に」を意味する。
【0153】
本開示の範囲は、当業者が理解するであろう、本明細書に記載または図示された例示的な実施形態に対する全ての変形、置換、バリエーション、代替、および変更を包含する。本開示の範囲は、本明細書に記載または図示された例示的な実施形態に限定されない。さらに、本開示は、特定の構成要素、要素、特徴、機能、動作、またはステップを含むものとして本明細書のそれぞれの実施形態を記載および図示しているが、これらの実施形態のいずれも、当業者が理解するであろう本明細書のどこかに記載または図示されている構成要素、要素、特徴、機能、動作、またはステップのいずれかの任意の組み合わせまたは順列を含んでもよい。さらにまた、特定の機能を実行するように適合され、配置され、可能にされ、構成され、有効にされ、動作可能にされ、または動作する装置またはシステムまたはシステムの構成要素に対する添付の特許請求の範囲における言及は、その装置、システムまたは構成要素がそのように適合され、配置され、可能にされ、構成され、有効にされ、動作可能にされ、または動作する限り、それまたはその特定の機能が起動され、オンにされ、またはロック解除されているか否かにかかわらず、その装置、システム、構成要素を包含する。さらに、本開示は、特定の利点を提供するものとして特定の実施形態を記載または図示しているが、特定の実施形態は、これらの利点の全てを提供しなくてもよく、いくつか、または全てを提供してもよい。
実施形態
1.デジタル病理画像処理システムによって、
対象から採取された腫瘍細胞を示すデジタル病理画像にアクセスすることと、
デジタル病理画像から複数のパッチを選択することであって、パッチのそれぞれが腫瘍細胞を示す、複数のパッチを選択することと、
パッチのそれぞれについて変異予測を生成することであって、変異予測が、アクショナブル変異がパッチに出現する可能性の予測を表す、変異予測を生成することと、
複数の変異予測に基づいて、対象についての1つまたは複数の処置レジメンに関連する予後予測を生成することと
を含む、方法。
2.変異予測を生成することが、
複数のパッチのそれぞれから1つまたは複数の特徴を検出することであって、1つまたは複数の特徴が、臨床的特徴または組織学的特徴のうちの1つまたは複数を含み、複数のパッチのそれぞれについてラベルを生成することが、1つまたは複数の特徴に基づいている、1つまたは複数の特徴を検出することを含む、請求項1に記載の方法。
3.変異予測を生成することが腫瘍形態に基づいており、腫瘍形態が、印環細胞の存在、印環細胞の数、肝様細胞の存在、肝様細胞の数、細胞外ムチン、または腫瘍増殖パターンのうちの1つまたは複数の分析に基づいている、請求項2または3に記載の方法。
4.変異予測を生成することが、1つまたは複数の機械学習モデルに基づいており、方法が、腫瘍細胞の1つまたは複数のラベル付けされた表示および他の組織学的特徴または臨床的特徴の1つまたは複数のラベル付けされた表示を含む複数の訓練データに基づいて1つまたは複数の機械学習モデルを訓練することをさらに含む、請求項1~3のいずれかに記載の方法。
5.予後予測を生成することが、1つまたは複数の追加のデジタル病理画像からパッチについての変異予測を生成することに基づいており、1つまたは複数の追加のデジタル病理画像のそれぞれが、対象からの生物学的試料の追加の特定の試料を示し、分析が、
1つまたは複数の追加のデジタル病理画像からパッチのそれぞれについて変異予測を生成することと、
変異予測の全てに基づいて対象についての組み合わせ予後予測を生成することと
を含む、請求項1~4のいずれかに記載の方法。
6.グラフィカルユーザインターフェースを介して、予後予測を出力することであって、グラフィカルユーザインターフェースが、デジタル病理画像のグラフィカル表現を含み、グラフィカル表現が、複数のパッチのそれぞれについて生成された変異予測の指示と、予後予測に関連付けられた予測信頼度とを含む、予後予測を出力することをさらに含む、請求項1~5のいずれかに記載の方法。
7.1つまたは複数の処置レジメンの使用に関連付けられた推奨を生成することをさらに含む、請求項1~6のいずれかに記載の方法。
8.生物学的試料の特定の部分が1つまたは複数の染色剤によって染色されたものである、請求項1~7のいずれかに記載の方法。
9.予後予測を生成することが、パッチについて生成された変異予測の重み付けされた組み合わせにさらに基づいている、請求項1~8のいずれかに記載の方法。
10.腫瘍細胞を示すパッチについての変異予測を生成することが、
腫瘍細胞を表現型に分類することであって、表現型のそれぞれが異なる変異クラスに対応する、腫瘍細胞を表現型に分類することを含む、請求項1~9のいずれかに記載の方法。
11.腫瘍細胞を表現型に分類することが、
パッチにおける核不均一性を識別することと、
識別された核不均一性を定量することであって、変異予測を生成することが、定量された核不均一性にさらに基づいている、識別された核不均一性を定量することと
を含む、請求項10に記載の方法。
12.変異予測を生成することが、
空間分布を評価するために細胞レベルの空間分析を行うことであって、空間分布が、クローン細胞の領域およびクローン細胞の領域のそれぞれの内の細胞の空間的配置を示す、細胞レベルの空間分析を行うことを含む、請求項10または11に記載の方法。
13.空間分布を評価することが、
腫瘍細胞の最小全域木のサブグラフ内のスペクトル距離を測定することであって、サブグラフのそれぞれが腫瘍巣を表す、スペクトル距離を測定することと、
全てのサブグラフにわたってペアワイズに隣接スペクトル距離を計算することと
を含む、請求項12に記載の方法。
14.サブグラフのそれぞれが、外れ値検出を実行することによって定義される、請求項13に記載の方法。
15.サブグラフのそれぞれが、検出された腫瘍巣のセグメンテーションに基づいて定義される、請求項13または14に記載の方法。
16.変異予測を生成することが、
空間エントロピーを評価するために細胞レベルの空間分析を行うことによって、パッチにおける密接に隣接するクローン細胞の領域を識別することを含む、請求項10~15のいずれかに記載の方法。
17.空間エントロピーを評価することが、
別個の距離ビンのセットを指定することであって、距離ビンのそれぞれが、一対の腫瘍細胞間の距離の範囲に対応する、別個の距離ビンのセットを指定することと、
距離ビンのそれぞれについて、腫瘍細胞の対を識別することであって、対のそれぞれにおける腫瘍細胞間の距離が、距離ビンに対応する距離の範囲内にある、腫瘍細胞の対を識別することと、
距離ビンのそれぞれについて、形態学的に類似していると識別された腫瘍細胞の対の頻度を計算することと、
表現型に分類された腫瘍細胞の各可能な対について、腫瘍細胞の対を所定数のビンのうちの1つに分類することであって、ビンのそれぞれが、対における細胞のそれぞれの空間位置間の距離を表す、腫瘍細胞の対を所定数のビンのうちの1つに分類することと、
ビンのそれぞれについて、ビン中の腫瘍細胞の対の分類の頻度を計算することと
を含む、請求項16に記載の方法。
18.各距離ビンに適用される重みが、距離ビン中の腫瘍細胞の対の数に対応し得る、請求項17に記載の方法。
19.距離ビンのセットが、指定された閾値を下回る最大距離を有する距離範囲を表すビンのみに制限され得る、請求項17または18に記載の方法。
20.予後予測を生成することが、
デジタル病理画像の変異状況を未知のドライバーまたは腫瘍抑制因子であると判定することであって、腫瘍細胞のクラスタの不均一性のレベルが高く、予後予測が免疫療法を含む処置レジメンに関連する、デジタル病理画像の変異状況を未知のドライバーまたは腫瘍抑制因子であると判定することを含む、請求項1~19のいずれかに記載の方法。
21.予後予測を生成することが、
デジタル病理画像の変異状況を癌遺伝子ドライバー変異であると判定することであって、腫瘍細胞のクラスタの不均一性のレベルが中程度であり、予後予測が変異に対応する標的療法を含む処置レジメンに関連する、デジタル病理画像の変異状況を癌遺伝子ドライバー変異であると判定することを含む、請求項1~20のいずれかに記載の方法。
22.パッチの少なくとも1つにアクショナブル変異が出現した場合、1つまたは複数の処置レジメンが、アクショナブル変異に関連付けられた標的療法を含み、
そうでなければ、1つまたは複数の処置レジメンが免疫療法を含む、請求項1~21のいずれかに記載の方法。
23.ソフトウェアを具現化する1つまたは複数のコンピュータ可読非一時的記憶媒体であって、ソフトウェアが、実行されると、
対象から採取された腫瘍細胞を示すデジタル病理画像にアクセスすることと、
デジタル病理画像から複数のパッチを選択することであって、パッチのそれぞれが腫瘍細胞を示す、複数のパッチを選択することと、
パッチのそれぞれについて変異予測を生成することであって、変異予測が、アクショナブル変異がパッチに出現する可能性の予測を表す、変異予測を生成することと、
複数の変異予測に基づいて、対象についての1つまたは複数の処置レジメンに関連する予後予測を生成することと
を行うように動作可能である、コンピュータ可読非一時的記憶媒体。
24.変異予測を生成することが、
複数のパッチのそれぞれから1つまたは複数の特徴を検出することであって、1つまたは複数の特徴が、臨床的特徴または組織学的特徴のうちの1つまたは複数を含み、複数のパッチのそれぞれについてラベルを生成することが、1つまたは複数の特徴に基づいている、1つまたは複数の特徴を検出することを含む、請求項23に記載のコンピュータ可読非一時的記憶媒体。
25.変異予測を生成することが腫瘍形態に基づいており、腫瘍形態が、印環細胞の存在、印環細胞の数、肝様細胞の存在、肝様細胞の数、細胞外ムチン、または腫瘍増殖パターンのうちの1つまたは複数の分析に基づいている、請求項23または24に記載のコンピュータ可読非一時的記憶媒体。
26.変異予測を生成することが、1つまたは複数の機械学習モデルに基づいており、コンピュータ可読非一時的記憶媒体が、腫瘍細胞の1つまたは複数のラベル付けされた表示および他の組織学的特徴または臨床的特徴の1つまたは複数のラベル付けされた表示を含む複数の訓練データに基づいて1つまたは複数の機械学習モデルを訓練することをさらに含む、請求項23~25のいずれかに記載のコンピュータ可読非一時的記憶媒体。
27.予後予測を生成することが、1つまたは複数の追加のデジタル病理画像からパッチについての変異予測を生成することに基づいており、1つまたは複数の追加のデジタル病理画像のそれぞれが、対象からの生物学的試料の追加の特定の試料を示し、分析が、
1つまたは複数の追加のデジタル病理画像からパッチのそれぞれについて変異予測を生成することと、
変異予測の全てに基づいて対象についての組み合わせ予後予測を生成することと
を含む、請求項23~26のいずれかに記載のコンピュータ可読非一時的記憶媒体。
28.グラフィカルユーザインターフェースを介して、予後予測を出力することであって、グラフィカルユーザインターフェースが、デジタル病理画像のグラフィカル表現を含み、グラフィカル表現が、複数のパッチのそれぞれについて生成された変異予測の指示と、予後予測に関連付けられた予測信頼度とを含む、予後予測を出力することをさらに含む、請求項23~27のいずれかに記載のコンピュータ可読非一時的記憶媒体。
29.1つまたは複数の処置レジメンの使用に関連付けられた推奨を生成することをさらに含む、請求項23~28のいずれかに記載のコンピュータ可読非一時的記憶媒体。
30.生物学的試料の特定の部分が1つまたは複数の染色剤によって染色されたものである、請求項23~29のいずれかに記載のコンピュータ可読非一時的記憶媒体。
31.予後予測を生成することが、パッチについて生成された変異予測の重み付けされた組み合わせにさらに基づいている、請求項23~30のいずれかに記載のコンピュータ可読非一時的記憶媒体。
32.腫瘍細胞を示すパッチについての変異予測を生成することが、
腫瘍細胞を表現型に分類することであって、表現型のそれぞれが異なる変異クラスに対応する、腫瘍細胞を表現型に分類することを含む、請求項23~31のいずれかに記載のコンピュータ可読非一時的記憶媒体。
33.前記腫瘍細胞を表現型に分類することが、
パッチにおける核不均一性を識別することと、
識別された核不均一性を定量することであって、変異予測を生成することが、定量された核不均一性にさらに基づいている、識別された核不均一性を定量することと
を含む、請求項32に記載のコンピュータ可読非一時的記憶媒体。
34.変異予測を生成することが、
空間分布を評価するために細胞レベルの空間分析を行うことであって、空間分布が、クローン細胞の領域およびクローン細胞の領域のそれぞれの内の細胞の空間的配置を示す、細胞レベルの空間分析を行うことを含む、請求項32または33に記載のコンピュータ可読非一時的記憶媒体。
35.空間分布を評価することが、
腫瘍細胞の最小全域木のサブグラフ内のスペクトル距離を測定することであって、サブグラフのそれぞれが腫瘍巣を表す、スペクトル距離を測定することと、
全てのサブグラフにわたってペアワイズに隣接スペクトル距離を計算することと
を含む、請求項34に記載のコンピュータ可読非一時的記憶媒体。
36.サブグラフのそれぞれが、外れ値検出を実行することによって定義される、請求項35に記載のコンピュータ可読非一時的記憶媒体。
37.サブグラフのそれぞれが、検出された腫瘍巣のセグメンテーションに基づいて定義される、請求項35または36に記載のコンピュータ可読非一時的記憶媒体。
38.変異予測を生成することが、
空間エントロピーを評価するために細胞レベルの空間分析を行うことによって、パッチにおける密接に隣接するクローン細胞の領域を識別することを含む、請求項32~37のいずれかに記載のコンピュータ可読非一時的記憶媒体。
39.空間エントロピーを評価することが、
別個の距離ビンのセットを指定することであって、距離ビンのそれぞれが、一対の腫瘍細胞間の距離の範囲に対応する、別個の距離ビンのセットを指定することと、
距離ビンのそれぞれについて、腫瘍細胞の対を識別することであって、対のそれぞれにおける腫瘍細胞間の距離が、距離ビンに対応する距離の範囲内にある、腫瘍細胞の対を識別することと、
距離ビンのそれぞれについて、形態学的に類似していると識別された腫瘍細胞の対の頻度を計算することと、
表現型に分類された腫瘍細胞の各可能な対について、腫瘍細胞の対を所定数のビンのうちの1つに分類することであって、ビンのそれぞれが、対における細胞のそれぞれの空間位置間の距離を表す、腫瘍細胞の対を所定数のビンのうちの1つに分類することと、
ビンのそれぞれについて、ビン中の腫瘍細胞の対の分類の頻度を計算することと
を含む、請求項38に記載のコンピュータ可読非一時的記憶媒体。
40.各距離ビンに適用される重みが、距離ビン中の腫瘍細胞の対の数に対応し得る、請求項39に記載のコンピュータ可読非一時的記憶媒体。
41.距離ビンのセットが、指定された閾値を下回る最大距離を有する距離範囲を表すビンのみに制限され得る、請求項39または40に記載のコンピュータ可読非一時的記憶媒体。
42.予後予測を生成することが、
デジタル病理画像の変異状況を未知のドライバーまたは腫瘍抑制因子であると判定することであって、腫瘍細胞のクラスタの不均一性のレベルが高く、予後予測が免疫療法を含む処置レジメンに関連する、デジタル病理画像の変異状況を未知のドライバーまたは腫瘍抑制因子であると判定することを含む、請求項23~41のいずれかに記載のコンピュータ可読非一時的記憶媒体。
43.予後予測を生成することが、
デジタル病理画像の変異状況を癌遺伝子ドライバー変異であると判定することであって、腫瘍細胞のクラスタの不均一性のレベルが中程度であり、予後予測が変異に対応する標的療法を含む処置レジメンに関連する、デジタル病理画像の変異状況を癌遺伝子ドライバー変異であると判定することを含む、請求項23~42のいずれかに記載のコンピュータ可読非一時的記憶媒体。
44.パッチの少なくとも1つにアクショナブル変異が出現した場合、1つまたは複数の処置レジメンが、アクショナブル変異に関連付けられた標的療法を含み、
そうでなければ、1つまたは複数の処置レジメンが免疫療法を含む、請求項23~43のいずれかに記載のコンピュータ可読非一時的記憶媒体。
45.1つまたは複数のプロセッサと、プロセッサによって実行可能な命令を含む、プロセッサに結合された非一時的メモリと、を備えるシステムであって、プロセッサが、命令を実行すると、
対象から採取された腫瘍細胞を示すデジタル病理画像にアクセスすることと、
デジタル病理画像から複数のパッチを選択することであって、パッチのそれぞれが腫瘍細胞を示す、複数のパッチを選択することと、
パッチのそれぞれについて変異予測を生成することであって、変異予測が、アクショナブル変異がパッチに出現する可能性の予測を表す、変異予測を生成することと、
複数の変異予測に基づいて、対象についての1つまたは複数の処置レジメンに関連する予後予測を生成することと
を行うように動作可能である、システム。
46.変異予測を生成することが、
複数のパッチのそれぞれから1つまたは複数の特徴を検出することであって、1つまたは複数の特徴が、臨床的特徴または組織学的特徴のうちの1つまたは複数を含み、複数のパッチのそれぞれについてラベルを生成することが、1つまたは複数の特徴に基づいている、1つまたは複数の特徴を検出することを含む、請求項45に記載のシステム。
47.変異予測を生成することが腫瘍形態に基づいており、腫瘍形態が、印環細胞の存在、印環細胞の数、肝様細胞の存在、肝様細胞の数、細胞外ムチン、または腫瘍増殖パターンのうちの1つまたは複数の分析に基づいている、請求項45または46に記載のシステム。
48.変異予測を生成することが、1つまたは複数の機械学習モデルに基づいており、システムが、腫瘍細胞の1つまたは複数のラベル付けされた表示および他の組織学的特徴または臨床的特徴の1つまたは複数のラベル付けされた表示を含む複数の訓練データに基づいて1つまたは複数の機械学習モデルを訓練することをさらに含む、請求項45~47のいずれかに記載のシステム。
49.予後予測を生成することが、1つまたは複数の追加のデジタル病理画像からパッチについての変異予測を生成することに基づいており、1つまたは複数の追加のデジタル病理画像のそれぞれが、対象からの生物学的試料の追加の特定の試料を示し、分析が、
1つまたは複数の追加のデジタル病理画像からパッチのそれぞれについて変異予測を生成することと、
変異予測の全てに基づいて対象についての組み合わせ予後予測を生成することと
を含む、請求項45~48のいずれかに記載のシステム。
50.グラフィカルユーザインターフェースを介して、予後予測を出力することであって、グラフィカルユーザインターフェースが、デジタル病理画像のグラフィカル表現を含み、グラフィカル表現が、複数のパッチのそれぞれについて生成された変異予測の指示と、予後予測に関連付けられた予測信頼度とを含む、予後予測を出力することをさらに含む、請求項45~49のいずれかに記載のシステム。
51.1つまたは複数の処置レジメンの使用に関連付けられた推奨を生成することをさらに含む、請求項45~50のいずれかに記載のシステム。
52.生物学的試料の特定の部分が1つまたは複数の染色剤によって染色されたものである、請求項45~51のいずれかに記載のシステム。
53.予後予測を生成することが、パッチについて生成された変異予測の重み付けされた組み合わせにさらに基づいている、請求項45~52のいずれかに記載のシステム。
54.腫瘍細胞を示すパッチについての変異予測を生成することが、
腫瘍細胞を表現型に分類することであって、表現型のそれぞれが異なる変異クラスに対応する、腫瘍細胞を表現型に分類することを含む、請求項45~53のいずれかに記載のシステム。
55.腫瘍細胞を表現型に分類することが、
パッチにおける核不均一性を識別することと、
識別された核不均一性を定量することであって、変異予測を生成することが、定量された核不均一性にさらに基づいている、識別された核不均一性を定量することと
を含む、請求項54に記載のシステム。
56.変異予測を生成することが、
空間分布を評価するために細胞レベルの空間分析を行うことであって、空間分布が、クローン細胞の領域およびクローン細胞の領域のそれぞれの内の細胞の空間的配置を示す、細胞レベルの空間分析を行うことを含む、請求項54または55に記載のシステム。
57.空間分布を評価することが、
腫瘍細胞の最小全域木のサブグラフ内のスペクトル距離を測定することであって、サブグラフのそれぞれが腫瘍巣を表す、スペクトル距離を測定することと、
全てのサブグラフにわたってペアワイズに隣接スペクトル距離を計算することと
を含む、請求項56に記載のシステム。
58.サブグラフのそれぞれが、外れ値検出を実行することによって定義される、請求項57に記載のシステム。
59.サブグラフのそれぞれが、検出された腫瘍巣のセグメンテーションに基づいて定義される、請求項57または58に記載のシステム。
60.変異予測を生成することが、
空間エントロピーを評価するために細胞レベルの空間分析を行うことによって、パッチにおける密接に隣接するクローン細胞の領域を識別することを含む、請求項54~59のいずれかに記載のシステム。
61.空間エントロピーを評価することが、
別個の距離ビンのセットを指定することであって、距離ビンのそれぞれが、一対の腫瘍細胞間の距離の範囲に対応する、別個の距離ビンのセットを指定することと、
距離ビンのそれぞれについて、腫瘍細胞の対を識別することであって、対のそれぞれにおける腫瘍細胞間の距離が、距離ビンに対応する距離の範囲内にある、腫瘍細胞の対を識別することと、
距離ビンのそれぞれについて、形態学的に類似していると識別された腫瘍細胞の対の頻度を計算することと、
表現型に分類された腫瘍細胞の各可能な対について、腫瘍細胞の対を所定数のビンのうちの1つに分類することであって、ビンのそれぞれが、対における細胞のそれぞれの空間位置間の距離を表す、腫瘍細胞の対を所定数のビンのうちの1つに分類することと、
ビンのそれぞれについて、ビン中の腫瘍細胞の対の分類の頻度を計算することと
を含む、請求項60に記載のシステム。
62.各距離ビンに適用される重みが、距離ビン中の腫瘍細胞の対の数に対応し得る、請求項61に記載のシステム。
63.距離ビンのセットが、指定された閾値を下回る最大距離を有する距離範囲を表すビンのみに制限され得る、請求項61または62に記載のシステム。
64.予後予測を生成することが、
デジタル病理画像の変異状況を未知のドライバーまたは腫瘍抑制因子であると判定することであって、腫瘍細胞のクラスタの不均一性のレベルが高く、予後予測が免疫療法を含む処置レジメンに関連する、デジタル病理画像の変異状況を未知のドライバーまたは腫瘍抑制因子であると判定することを含む、請求項45~63のいずれかに記載のシステム。
65.予後予測を生成することが、
デジタル病理画像の変異状況を癌遺伝子ドライバー変異であると判定することであって、腫瘍細胞のクラスタの不均一性のレベルが中程度であり、予後予測が変異に対応する標的療法を含む処置レジメンに関連する、デジタル病理画像の変異状況を癌遺伝子ドライバー変異であると判定することを含む、請求項45~64のいずれかに記載のシステム。
66.
パッチの少なくとも1つにアクショナブル変異が出現した場合、1つまたは複数の処置レジメンが、アクショナブル変異に関連付けられた標的療法を含み、
そうでなければ、1つまたは複数の処置レジメンが免疫療法を含む、請求項45~65のいずれかに記載のシステム。
【国際調査報告】