IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベンタナ メディカル システムズ, インコーポレイテッドの特許一覧

特許7505116デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正
<>
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図1
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図2A
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図2B
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図3
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図4
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図5
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図6
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図7
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図8
  • 特許-デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-14
(45)【発行日】2024-06-24
(54)【発明の名称】デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正
(51)【国際特許分類】
   G06T 1/40 20060101AFI20240617BHJP
   G06T 1/00 20060101ALI20240617BHJP
   G01N 33/48 20060101ALI20240617BHJP
   G01N 33/483 20060101ALI20240617BHJP
【FI】
G06T1/40
G06T1/00 290Z
G01N33/48 M
G01N33/483 C
【請求項の数】 18
(21)【出願番号】P 2023512309
(86)(22)【出願日】2021-08-19
(65)【公表番号】
(43)【公表日】2023-09-06
(86)【国際出願番号】 US2021046678
(87)【国際公開番号】W WO2022040418
(87)【国際公開日】2022-02-24
【審査請求日】2023-03-15
(31)【優先権主張番号】63/068,585
(32)【優先日】2020-08-21
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】507179346
【氏名又は名称】ベンタナ メディカル システムズ, インコーポレイテッド
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100173565
【弁理士】
【氏名又は名称】末松 亮太
(72)【発明者】
【氏名】ロルサクル,アウラヌチ
(72)【発明者】
【氏名】ヂャオ,ズオ
(72)【発明者】
【氏名】ニエ,ヤオ
(72)【発明者】
【氏名】ワーン,シンウェイ
(72)【発明者】
【氏名】グエン,キエン
【審査官】三沢 岳志
(56)【参考文献】
【文献】特表2020-502665(JP,A)
【文献】特開2018-192264(JP,A)
【文献】国際公開第2020/139835(WO,A1)
【文献】国際公開第2019/199699(WO,A1)
【文献】Tianyang ZHANG et al.,“Noise Adaptation Generative Adversarial Network for Medical Image Analysis”,IEEE Transactions on Medical Imaging,2020年04月,Vol. 39, No. 4,p.1149-1159,DOI: 10.1109/TMI.2019.2944488
【文献】古賀 諒一ほか,“病理画像の染色変換に本質的な特徴の抽出と可視化の試み”,電子情報通信学会技術研究報告 (IEICE Technical Report (Institute of Electronics, Information and Communication Engineers)),2020年01月22日,第119巻,p.215-218
【文献】Jian REN et al.,“Adversarial Domain Adaptation for Classification of Prostate Histopathology Whole-Slide Images”,Medical Image Computing and Computer Assisted Intervention MICCAI 2018,2018年06月06日,pp.201-209,DOI: 10.1007/978-3-030-00934-2_23
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/40
G06T 1/00
G01N 33/48
G01N 33/483
(57)【特許請求の範囲】
【請求項1】
生物学的標本のソース画像を取得することであって、前記ソース画像が、第1の種類のスキャナから生成される、ソース画像を取得することと、
前記ソース画像から導出される、ランダムに生成されたノイズベクトルおよび潜在特徴ベクトル生成器モデルに入力することであって、
前記ランダムに生成されたノイズベクトルおよび前記潜在特徴ベクトルが、前記生成器モデルへの入力データとして供する、
ランダムに生成されたノイズベクトルおよび潜在特徴ベクトルを生成器モデルに入力することと、
前記生成器モデルによって、前記入力データに基づいて新たな画像を生成することと、
前記新たな画像を識別器モデルに入力することと、
前記識別器モデルによって、前記新たな画像が真または偽である確率を生成することであって、
真が、前記新たな画像がターゲット画像の特性に類似する特性を有することを意味し、偽が、前記新たな画像が前記ターゲット画像の特性に類似する特性を有しないことを意味し、
前記ターゲット画像の前記特性が、前記第1の種類のスキャナとは異なる第2の種類のスキャナに関連付けられており、
前記識別器モデルが、訓練データの正規化されたサンプル画像から学習された前記ターゲット画像の特性の確率分布を、前記新たな画像の特性の確率分布と比較することに基づいて、前記新たな画像についての前記確率を生成する、
前記新たな画像が真または偽である確率生成することと、
生成された前記確率に基づいて、前記新たな画像が真であるか偽であるかを決定することと、
前記画像が真である場合に前記新たな画像を真のラベルとともに出力することと、
前記画像が偽である場合に、前記新たな画像を偽のラベルとともに出力することと、
を含む、方法。
【請求項2】
前記生物学的標本が病理スライドに載せられ、前記第1の種類のスキャナが第1の種類の全スライドイメージングスキャナであり、前記第2の種類のスキャナが第2の種類の全スライドイメージングスキャナである、請求項1に記載の方法。
【請求項3】
前記新たな画像を画像分析モデルに入力することであって、前記画像分析モデルが、前記第2の種類のスキャナと同じ種類のスキャナから取得された画像を含む訓練データのセットを使用して学習された複数のモデルパラメータを含む、前記新たな画像を画像分析モデルに入力することと、
前記画像分析モデルによって、前記新たな画像を分析することと、
前記画像分析モデルによって、前記新たな画像の前記分析に基づく分析結果を生成することと、
前記分析結果を出力することと、
をさらに含む、請求項1に記載の方法。
【請求項4】
前記画像分析モデルが、前記第1の種類のスキャナと同じ種類のスキャナから取得された画像に対しては訓練されない、請求項3に記載の方法。
【請求項5】
前記新たな画像を含む訓練データのセットを使用して画像分析モデルを訓練することをさらに含む、請求項1に記載の方法。
【請求項6】
前記生成器モデルおよび前記識別器モデルが、敵対的生成ネットワーク(GAN)モデルの一部である、請求項1に記載の方法。
【請求項7】
前記GANモデルが、1つ以上の画像のペアワイズセットを含む訓練データのセットを使用して学習された複数のモデルパラメータを含み、前記1つ以上の画像のペアワイズセット内の画像の各ペアが、前記第1の種類のスキャナによって生成された第1の画像と、前記第2の種類のスキャナによって生成された第2の画像とを含み、
前記複数のモデルパラメータが、前記訓練データのセットの確率を最大化するように前記識別器モデルを訓練するための第1の損失関数と、前記生成器モデルからサンプリングされた生成画像の確率を最小化するように前記識別器モデルを訓練し、かつ前記識別器モデルが前記生成画像に割り当てる確率を最大化するように前記生成器モデルを訓練するための第2の損失関数とを最小化することに基づいて、前記訓練データのセットを使用して学習される、請求項6に記載の方法。
【請求項8】
システムであって、
1つ以上のデータプロセッサと、
命令を含む非一時的コンピュータ可読記憶媒体であって、前記命令が、前記1つ以上のデータプロセッサ上で実行されると、前記1つ以上のデータプロセッサに、
生物学的標本のソース画像を取得することであって、前記ソース画像が、第1の種類のスキャナから生成される、ソース画像を取得することと、
前記ソース画像から導出される、ランダムに生成されたノイズベクトルおよび潜在特徴ベクトル生成器モデルに入力することであって、
前記ランダムに生成されたノイズベクトルおよび前記潜在特徴ベクトルが、前記生成器モデルへの入力データとして供する、
ランダムに生成されたノイズベクトルおよび潜在特徴ベクトルを生成器モデルに入力することと、
前記生成器モデルによって、前記入力データに基づいて新たな画像を生成することと、
前記新たな画像を識別器モデルに入力することと、
前記識別器モデルによって、前記新たな画像が真または偽である確率を生成することであって、
真が、前記新たな画像がターゲット画像の特性に類似する特性を有することを意味し、偽が、前記新たな画像が前記ターゲット画像の特性に類似する特性を有しないことを意味し、
前記ターゲット画像の前記特性が、前記第1の種類のスキャナとは異なる第2の種類のスキャナに関連付けられており、
前記識別器モデルが、訓練データ内の正規化されたサンプル画像から学習された前記ターゲット画像の特性の確率分布を、前記新たな画像の特性の確率分布と比較することに基づいて、前記新たな画像についての前記確率を生成する、
前記新たな画像が真または偽である確率生成することと、
生成された前記確率に基づいて、前記新たな画像が真であるか偽であるかを決定することと、
前記画像が真である場合に前記新たな画像を真のラベルとともに出力することと、
前記画像が偽である場合に、前記新たな画像を偽のラベルとともに出力することと、
を含む動作を実行させる、非一時的コンピュータ可読記憶媒体と、
を備える、システム。
【請求項9】
前記生物学的標本が病理スライドに載せられ、前記第1の種類のスキャナが第1の種類の全スライドイメージングスキャナであり、前記第2の種類のスキャナが第2の種類の全スライドイメージングスキャナである、請求項に記載のシステム。
【請求項10】
前記動作が、
前記新たな画像を画像分析モデルに入力することであって、前記画像分析モデルが、前記第2の種類のスキャナと同じ種類のスキャナから取得された画像を含む訓練データのセットを使用して学習された複数のモデルパラメータを含む、前記新たな画像を画像分析モデルに入力することと、
前記画像分析モデルによって、前記新たな画像を分析することと、
前記画像分析モデルによって、前記新たな画像の前記分析に基づく分析結果を生成することと、
前記分析結果を出力することと、
をさらに含む、請求項に記載のシステム。
【請求項11】
前記画像分析モデルが、前記第1の種類のスキャナと同じ種類のスキャナから取得された画像に対しては訓練されない、請求項10に記載のシステム。
【請求項12】
前記動作が、前記新たな画像を含む訓練データのセットを使用して画像分析モデルを訓練することをさらに含む、請求項11に記載のシステム。
【請求項13】
前記生成器モデルおよび前記識別器モデルが、敵対的生成ネットワーク(GAN)モデルの一部であり、
前記GANモデルが、1つ以上の画像のペアワイズセットを含む訓練データのセットを使用して学習された複数のモデルパラメータを含み、前記1つ以上の画像のペアワイズセット内の画像の各ペアが、前記第1の種類のスキャナによって生成された第1の画像と、前記第2の種類のスキャナによって生成された第2の画像とを含み、
前記複数のモデルパラメータが、前記訓練データのセットの確率を最大化するように前記識別器モデルを訓練するための第1の損失関数と、前記生成器モデルからサンプリングされた生成画像の確率を最小化するように前記識別器モデルを訓練し、かつ前記識別器モデルが前記生成画像に割り当てる前記確率を最大化するように前記生成器モデルを訓練するための第2の損失関数とを最小化することに基づいて、前記訓練データのセットを使用して学習される、請求項に記載のシステム。
【請求項14】
1つ以上のデータプロセッサに、
生物学的標本のソース画像を取得することであって、前記ソース画像が、第1の種類のスキャナから生成される、ソース画像を取得することと、
前記ソース画像から導出される、ランダムに生成されたノイズベクトルおよび潜在特徴ベクトル生成器モデルに入力することであって、
前記ランダムに生成されたノイズベクトルおよび前記潜在特徴ベクトルが、前記生成器モデルへの入力データとして供する、
ランダムに生成されたノイズベクトルおよび潜在特徴ベクトルを生成器モデルに入力することと、
前記生成器モデルによって、前記入力データに基づいて新たな画像を生成することと、
前記新たな画像を識別器モデルに入力することと、
前記識別器モデルによって、前記新たな画像が真または偽である確率を生成することであって、
真が、前記新たな画像がターゲット画像の特性に類似する特性を有することを意味し、偽が、前記新たな画像が前記ターゲット画像の特性に類似する特性を有しないことを意味し、
前記ターゲット画像の前記特性が、前記第1の種類のスキャナとは異なる第2の種類のスキャナに関連付けられており、
前記識別器モデルが、訓練データ内の正規化されたサンプル画像から学習された前記ターゲット画像の特性の確率分布を、前記新たな画像の特性の確率分布と比較することに基づいて、前記新たな画像についての前記確率を生成する、
前記新たな画像が真または偽である確率生成することと、
生成された前記確率に基づいて、前記新たな画像が真であるか偽であるかを決定することと、
前記画像が真である場合に前記新たな画像を真のラベルとともに出力することと、
前記画像が偽である場合に、前記新たな画像を偽のラベルとともに出力することと、
を含む動作を実行させるように構成された命令を含む、
非一時的機械可読記憶媒体に記録されたコンピュータプログラム。
【請求項15】
前記生物学的標本が病理スライドに載せられ、前記第1の種類のスキャナが第1の種類の全スライドイメージングスキャナであり、前記第2の種類のスキャナが第2の種類の全スライドイメージングスキャナである、請求項14に記載のコンピュータプログラム。
【請求項16】
前記動作が、
前記新たな画像を画像分析モデルに入力することであって、前記画像分析モデルが、前記第2の種類のスキャナと同じ種類のスキャナから取得された画像を含む訓練データのセットを使用して学習された複数のモデルパラメータを含む、前記新たな画像を画像分析モデルに入力することと、
前記画像分析モデルによって、前記新たな画像を分析することと、
前記画像分析モデルによって、前記新たな画像の前記分析に基づく分析結果を生成することと、
前記分析結果を出力することと、
をさらに含む、請求項14に記載のコンピュータプログラム。
【請求項17】
前記画像分析モデルが、前記第1の種類のスキャナと同じ種類のスキャナから取得された画像に対しては訓練されない、請求項16に記載のコンピュータプログラム。
【請求項18】
前記生成器モデルおよび前記識別器モデルが、敵対的生成ネットワーク(GAN)モデルの一部であり、
前記GANモデルが、1つ以上の画像のペアワイズセットを含む訓練データのセットを使用して学習された複数のモデルパラメータを含み、前記1つ以上の画像のペアワイズセット内の画像の各ペアが、前記第1の種類のスキャナによって生成された第1の画像と、前記第2の種類のスキャナによって生成された第2の画像とを含み、
前記複数のモデルパラメータが、前記訓練データのセットの確率を最大化するように前記識別器モデルを訓練するための第1の損失関数と、前記生成器モデルからサンプリングされた生成画像の確率を最小化するように前記識別器モデルを訓練し、かつ前記識別器モデルが前記生成画像に割り当てる前記確率を最大化するように前記生成器モデルを訓練するための第2の損失関数とを最小化することに基づいて、前記訓練データのセットを使用して学習される、請求項14に記載のコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年8月21日に出願された米国仮特許出願第63/068,585号の利益および優先権を主張するものであり、その全体があらゆる目的のために参照により本明細書に組み込まれる。
【0002】
分野
本開示は、デジタル病理学に関し、特に、異なるスライドスキャナによって取得されたデジタル病理画像を画像分析のための共通フォーマットに変換するための技術に関する。
【背景技術】
【0003】
背景
デジタル病理学は、患者を正確に診断し、治療上の意思決定を導くために、デジタル化された画像の解釈を伴う。全スライドイメージング(WSI)は、組織サンプル(例えば、組織病理または細胞病理ガラススライド)の予め選択された領域またはスライド全体を走査してデジタル画像にするデジタル病理学において使用されるイメージングモダリティである。デジタル化のプロセスは、画像取得(走査)、記憶、編集、および画像の表示の4つの連続した部分を含む。画像取得は、典型的には、光源、スライドステージ、対物レンズ、および画像キャプチャ用の高解像度カメラを有する全スライドスキャナによって実行される。全スライドスキャナは、タイルごとにまたはライン走査方式で組織切片の画像をキャプチャする。複数の画像(それぞれタイルまたはライン)は、予め選択された領域またはスライド全体のデジタル画像を生成するためにキャプチャされ、デジタル的に組み立てられる(「スティッチングされる」)。スキャナをスライド染色技術とペアリングする場合、WSIは、明視野、蛍光、およびマルチスペクトルとして分類されることができる。一部のスキャナは、例えば明視野走査と蛍光走査の双方を可能にするなど、複数のモダリティに対応することができる。明視野走査は、標準的な明視野顕微鏡法をエミュレートし、費用対効果の高い手法である。蛍光走査は、蛍光顕微鏡法に類似しており、蛍光標識スライド(例えば、蛍光免疫組織化学(IHC)、蛍光インサイチュハイブリダイゼーションなど)をデジタル化するために使用される。マルチスペクトルイメージングは、光のスペクトルにわたってスペクトル情報をキャプチャし、明視野および蛍光の双方の設定に適用されることができる。
【0004】
多くのWSIシステムは、ユーザコンピュータにローカルにインストールされることができる画像閲覧ソフトウェアを含む。他のベンダは、ネットワークサーバ上に存在するより大きなソフトウェアスイートの一部としてこの能力を提供し、ユーザがネットワーク接続を介して自身のデバイス上でスライド画像全体を見ることを可能にする。画像分析アルゴリズムをスライド画像全体に適用したいユーザのために、ベンダによって提供される画像閲覧ソフトウェアのいくつかは、ヘマトキシリン-エオシン(H&E)画像において細胞を検出し、陽性染色を計算し、領域分割を行い、または核分割を行うことができるアルゴリズムとともにパッケージ化される。スキャナベンダが提供するよりも高度なまたは特殊な画像分析アルゴリズムを探しているユーザのために、サードパーティベンダから様々な機能を備えた多数のソフトウェアソリューションが利用可能である。これらの画像分析アルゴリズムは、多くの場合、部門のワークフローに統合され、スライド全体の閲覧と併せてオンデマンド画像分析を提供することができる。しかしながら、ほとんどの画像分析アルゴリズムは、(すなわち、特定の全スライドスキャナのために開発された)特定の全スライドスキャナからの画像に対して訓練され、したがって、それらの全スライドスキャナからの特定の特性を有するデジタル画像に対してのみ動作することができる。異なる種類またはモデルのデジタルスライドスキャナによって生成されたいくつかのデジタル画像の特性は、画像分析アルゴリズムと互換性がない場合がある。したがって、画像分析アルゴリズムがスキャナに依存しない(任意の種類のスキャナによって取得された画像に対して動作する)ことが望まれている。
【発明の概要】
【0005】
概要
様々な実施形態では、生物学的標本のソース画像を取得することであって、ソース画像が第1の種類のスキャナから生成される、ソース画像を取得することと、ソース画像からランダムに生成されたノイズベクトルおよび潜在特徴ベクトルを入力データとして生成器モデルに入力することと、生成器モデルによって、入力データに基づいて新たな画像を生成することと、新たな画像を識別器モデルに入力すること、識別器モデルによって、新たな画像が真または偽である確率を生成することであって、真が、新たな画像がターゲット画像の特性に類似する特性を有することを意味し、偽が、新たな画像がターゲット画像の特性に類似する特性を有しないことを意味し、ターゲット画像の特性が、第1の種類のスキャナとは異なる第2の種類のスキャナに関連付けられる、新たな画像が真または偽である確率を生成することと、生成された確率に基づいて、新たな画像が真であるか偽であるかを決定することと、画像が真である場合に新たな画像を出力することと、を含むコンピュータ実装方法が提供される。
【0006】
いくつかの実施形態では、生物学的標本は、病理スライドに取り付けられ、第1の種類のスキャナは、第1の種類の全スライドイメージングスキャナであり、第2の種類のスキャナは、第2の種類の全スライドイメージングスキャナである。
【0007】
いくつかの実施形態では、コンピュータ実装方法は、新たな画像を画像分析モデルに入力することであって、画像分析モデルによって、第2の種類のスキャナと同じ種類のスキャナから取得された画像を含む訓練データのセットを使用して学習された複数のモデルパラメータを含む、新たな画像を画像分析モデルに入力することと、画像分析モデルによって、新たな画像を分析することと、画像分析モデルによって、新たな画像の分析に基づく分析結果を生成することと、分析結果を出力することと、をさらに含む。
【0008】
いくつかの実施形態では、画像分析モデルは、第1の種類のスキャナと同じ種類のスキャナから取得された画像に対しては訓練されない。
【0009】
いくつかの実施形態では、コンピュータ実装方法は、新たな画像を含む訓練データのセットを使用して画像分析モデルを訓練することをさらに含む。
【0010】
いくつかの実施形態では、GANモデルは、画像の1つ以上のペアワイズセットを含む訓練データのセットを使用して学習された複数のモデルパラメータを含み、画像の1つ以上のペアワイズセット内の画像の各ペアは、第1の種類のスキャナによって生成された第1の画像と、第2の種類のスキャナによって生成された第2の画像とを含み、複数のモデルパラメータは、訓練データのセットの確率を最大化するように識別器モデルを訓練するための第1の損失関数と、生成器モデルからサンプリングされた生成画像の確率を最小化するように識別器モデルを訓練し、かつ識別器モデルが生成画像に割り当てる確率を最大化するように生成器モデルを訓練するための第2の損失関数とを最小化することに基づいて、訓練データのセットを使用して学習される。
【0011】
いくつかの実施形態では、コンピュータ実装方法は、ユーザによって、分析結果に基づいて被験者の診断を決定することをさらに含む。
【0012】
いくつかの実施形態では、コンピュータ実装方法は、(i)分析結果、および/または(iii)被験者の診断に基づいて、化合物による治療をユーザによって投与することをさらに含む。
【0013】
いくつかの実施形態では、1つ以上のデータプロセッサと、命令を含む非一時的コンピュータ可読記憶媒体であって、該命令が、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部を実行させる、非一時的コンピュータ可読記憶媒体と、を備えるシステムが提供される。
【0014】
いくつかの実施形態では、非一時的機械可読記憶媒体に有形に具現化され、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部を実行させるように構成された命令を含む、コンピュータプログラム製品が提供される。
【0015】
本開示のいくつかの実施形態は、1つ以上のデータプロセッサを含むシステムを含む。いくつかの実施形態では、システムは、命令を含む非一時的コンピュータ可読記憶媒体であって、該命令が、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させる、非一時的コンピュータ可読記憶媒体を備える。本開示のいくつかの実施形態は、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させるように構成された命令を含む、非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品を含む。
【0016】
使用された用語および表現は、限定ではなく説明の用語として使用され、そのような用語および表現の使用において、示されて説明された任意の特徴の均等物またはその一部を除外する意図はないが、特許請求の範囲に記載された発明の範囲内で様々な変更が可能であることが認識される。したがって、特許請求の範囲に記載された本発明は、実施形態および任意の特徴によって具体的に開示されているが、本明細書に開示された概念の変更および変形は、当業者によってあてにされてもよく、そのような変更および変形は、添付の特許請求の範囲によって定義される本発明の範囲内にあると見なされることを理解されたい。
【0017】
様々な実施形態の態様および特徴は、添付の図面を参照して例を説明することによってより明らかになるであろう。
【図面の簡単な説明】
【0018】
図1】様々な実施形態にかかるデジタル病理学的ワークフローを示している。
図2A】様々な実施形態にかかる2つの異なるデジタル病理スキャナから取得されたデジタル画像の比較を示している。
図2B】様々な実施形態にかかる2つの異なるデジタル病理スキャナから取得されたデジタル画像の比較を示している。
図3】様々な実施形態にかかる代替的なデジタル病理学的ワークフローを示している。
図4】様々な実施形態にかかる関心のあるオブジェクトのインスタンスをセグメント化するための例示的なコンピューティング環境を示している。
図5】様々な実施形態にかかる敵対的生成ネットワーク(GAN)を示している。
図6】様々な実施形態にかかる位置合わせを伴う第1のデジタル病理スライドスキャナおよび第2のデジタル病理スライドスキャナからのペアの訓練画像の例を示している。
図7】様々な実施形態にかかる、第1のデジタル画像スキャナから取得された画像のソースセットを、画像のターゲットセットと同様の特性を有する画像の新たな生成されたセットに変換するためのプロセスを示している。
図8】様々な実施形態にかかる異なるバイオマーカーについて染色されたデジタル病理画像の例を示している。
図9】様々な実施形態にかかる、異なるバイオマーカーおよびその特性について染色されたデジタル病理画像のさらなる例を示している。
【発明を実施するための形態】
【0019】
詳細な説明
特定の実施形態が説明されているが、これらの実施形態は例としてのみ提示されており、保護の範囲を限定することを意図するものではない。本明細書に記載された装置、方法、およびシステムは、様々な他の形態で具現化されることができる。さらにまた、保護の範囲から逸脱することなく、本明細書に記載の例示的な方法およびシステムの形態の様々な省略、置換、および変更を行うことができる。
【0020】
I.概要
例えば疾患によって引き起こされる組織変化の評価は、薄い組織切片を検査することによって行われることができる。組織サンプルがスライスされて一連の切片(例えば、4~5μmの切片)を取得することができ、各組織切片は、異なる染色またはマーカーによって染色されて、組織の異なる特性を発現させることができる。各切片は、スライドに載せられ、走査されて、コンピュータ化されたデジタル病理画像分析アルゴリズムによる分析のためのデジタル画像を生成することができる。様々な種類またはモデルのデジタル病理スライドスキャナが使用されて、デジタル画像を走査および生成することができる。例えば、病変スライドのデジタル画像は、VENTANA(登録商標)DP 200スライドスキャナ、VENTANA iScan(登録商標)HTスライドスキャナ、Aperio AT2スライドスキャナ、または他の種類のスライドスキャナを使用して走査および生成されることができる。画像ビューアソフトウェアを使用してデジタル画像内の組織を手動で評価すること、または関心のある生物学的オブジェクトを検出および分類する画像分析アルゴリズムによってそれを自動的に分析することが可能である。
【0021】
デジタル病理学的ソリューションでは、画像分析ワークフローが確立されて、関心のある生物学的オブジェクト、例えば陽性、陰性腫瘍細胞などを自動的に検出または分類することができる。図1は、デジタル病理学的ソリューションのワークフロー100の例示的な図を示している。デジタル病理学的ソリューションワークフロー100は、ブロック105において組織スライドを取得することと、ブロック110においてデジタル画像を取得するためにデジタル画像スキャナ(例えば、WSIスキャナ)によって予め選択された領域または組織スライドの全体を走査することと、ブロック115において1つ以上の画像分析アルゴリズムを使用してデジタル画像に対して画像分析を実行することと、画像分析に基づいて関心のあるオブジェクトをスコアリング(例えば、陽性、陰性、中程度、弱いなどの定量的スコアリングまたは半定量的スコアリング)することと、を含む。
【0022】
多くの場合、図1に関して説明したデジタル病理学的ソリューションワークフローにおいて使用される画像分析アルゴリズムは、ハードウェア(例えば、デジタルスキャナ)または染色プロトコルの可能性のある変更のために変更される必要がある。例えば、高品質で高解像度のVENTANA(登録商標)DP 200スライドスキャナは、以前のVENTANA iScan(登録商標)HTスライドスキャナに徐々に取って代わった。図2は、それぞれVENTANA iScan(登録商標)HT(A)およびVENTANA(登録商標)DP 200(B)全スライドスキャナを使用して走査された組織スライドの例を示している。これらの2つのスキャナから取得された画像は異なることが示されている(すなわち、一方のスキャナから取得された画像は、他方のスキャナから取得された画像と比較して異なる特性(例えば、改善されたコントラストおよび/または解像度)を有する)。VENTANA iScan(登録商標)HTスキャナを使用して取得された画像に基づいて開発されたいくつかのレガシー画像分析アルゴリズムは、VENTANA(登録商標)DP 200スキャナから取得された画像を処理するためにそれらを適用するときに最良の性能を達成しない可能性がある。例えば、VENTANA iScan(登録商標)HTのために開発された元のアルゴリズムをVENTANA(登録商標)DP 200スキャナによって取得された画像に直接適用する場合、アルゴリズム結果の性能は、標準以下であり得ることが実験により示されている。結果として、画像分析アルゴリズムを継続的に更新または変更することが必要になり、追加のリソース、コスト、および時間を必要とする。一般に、新たなスキャナ用の画像分析アルゴリズムを開発するには6ヶ月以上かかる可能性があり、新たなスキャナによって複数の画像分析アルゴリズムが実装されている場合、問題の影響が複合される可能性がある。この問題は、最初は専用スキャナによって特定されていたが、デジタル病理業界の多くのデジタル病理スキャナおよびソリューションのワークフローは、この同じ問題に悩まされていることを理解されたい。
【0023】
これらの制限および他の制限を克服するために、敵対的生成ネットワーク(GAN)として知られる深層学習ベースの生成モデルを使用して、第1のデジタル画像スキャナ(例えば、VENTANA(登録商標)DP 200スキャナ)から取得された画像のソースセットを、第2の画像スキャナ(例えば、VENTANA iScan(登録商標)HT)から取得可能な画像のターゲットセットと同様の特性を有する新たに生成画像のセットに変換するための技術が本明細書に開示される。GANは、2つの分布(例えば、画像のソースセットからの特性および画像のターゲットセットからの特性)を推定することを学習することができ、これを使用して例を一方の分布(例えば、画像のソースセット)から他方の分布(例えば、画像のターゲットセット)に変換することができる。GANが、第1のデジタル画像スキャナから取得された画像のソースセットを、画像のターゲットセットと同様の特性を有する新たに生成画像のセットに変換するように訓練されると、新たに生成画像のセットは、画像分析アルゴリズムを再開発する必要なく、最小限のコストおよび時間で、第2のデジタル画像スキャナからの画像に対して訓練された画像分析アルゴリズムを使用して分析されることができる。
【0024】
図3は、本開示の態様にかかるデジタル病理学的ソリューションワークフロー300の例示的な図を示している。デジタル病理学的ソリューションワークフロー300は、ブロック305において組織スライドを取得することと、ブロック310においてソースデジタル画像のセットを生成するために予め選択された領域または組織スライドの全体を第1のデジタル画像スキャナ(第1のデジタル画像スキャナからの画像は、画像分析アルゴリズムを訓練するために使用されなかった)によって走査することと、を含む。第1のデジタル画像スキャナからの画像は、画像分析アルゴリズムを訓練するために使用されなかったため、ソースデジタル画像のセットは、ブロック315において取得され、ブロック320において深層学習ベースの生成モデルに入力されて、ソースデジタル画像のセットを、ブロック325において第2のデジタル画像スキャナ(第2のデジタルスキャナからの画像は、画像分析アルゴリズムを訓練するために使用された)から取得可能な画像のターゲットセットと同様の特性を有する新たな生成画像のセットに変換する。ブロック330において、画像分析アルゴリズムを使用して新たに生成画像のセットに対して画像分析が実行され、ブロック335において、画像分析に基づいて関心のあるオブジェクトがスコアリング(例えば、陽性、陰性、中程度、弱いなどの定量的スコアリングまたは半定量的スコアリング)される。したがって、これらの2つのデジタル画像スキャナ間の画像差分が正規化されることができ、レガシー画像分析アルゴリズムを訓練するために使用されなかったスキャナから取得された画像にレガシー画像分析アルゴリズムが適用されることができる。
【0025】
本開示の例示的な一実施形態は、生物学的標本のソース画像を取得することであって、ソース画像が第1の種類のスキャナから生成される、ソース画像を取得することと、ランダムに生成されたノイズベクトルと、ソース画像からの特徴の潜在特徴ベクトル(または1次元ベクトル)とを入力データとして生成器モデルに入力することと、生成器モデルによって、入力データに基づいて新たな画像を生成することと、新たな画像を識別器モデルに入力することと、識別器モデルによって、新たな画像が真または偽である確率を生成することであって、真が、新たな画像がターゲット画像の特性に類似する特性を有することを意味し、偽が、新たな画像がターゲット画像の特性に類似する特性を有しないことを意味し、ターゲット画像の特性が、第1の種類のスキャナとは異なる第2の種類のスキャナに関連付けられる、新たな画像が真または偽である確率を生成することと、生成された確率に基づいて、新たな画像が真であるか偽であるかを決定することと、画像が真である場合に新たな画像を出力することと、を含む、方法に関する。
【0026】
有利には、これらの技術は、異なるデジタルスキャナによって生成されたデジタル画像を、既存のコンピュータ化されたデジタル画像分析アルゴリズムを使用して分析されることができる画像に変換し、異なるイメージングサイトから取得された画像の画像変動を補正することによって、コンピュータ化されたデジタル画像分析アルゴリズムをスキャナに依存しないようにすることができる。これらの技術はまた、任意の新世代スキャナの将来のアルゴリズム開発に使用されることができ、その結果、他のスキャナによって走査された画像が変換され、新世代スキャナの訓練データとして利用されることができる。さらに、これらの技術が使用されて、異なるサイトからデータを転送し、画像分析アルゴリズムの開発の主な課題の1つである事前分析条件による変動を補正することができる。
【0027】
II.定義
本明細書で使用される場合、動作が何かに「基づく」場合、これは、動作が何かの少なくとも一部に少なくとも部分的に基づくことを意味する。
【0028】
本明細書で使用される場合、「実質的に(substantially)」、「およそ(approximately)」、および「約(about)」という用語は、当業者によって理解されるように、大部分が指定されるものであるが、必ずしも完全には指定されないもの(および完全に指定されるものを含む)として定義される。任意の開示された実施形態では、「実質的に」、「およそ」、または「約」という用語は、指定されたものの「[パーセンテージ]以内」で置き換えられることができ、パーセンテージは、0.1、1、5、および10%を含む。
【0029】
本明細書で使用される場合、「サンプル」、「生物学的サンプル」または「組織サンプル」という用語は、ウイルスを含む任意の生物から取得される生物学的分子(タンパク質、ペプチド、核酸、脂質、炭水化物、またはそれらの組み合わせなど)を含む任意のサンプルを指す。生物の他の例は、哺乳類(ヒト、ネコ、イヌ、ウマ、ウシ、およびブタなどの獣医動物、ならびにマウス、ラット、霊長類などの実験動物など)、昆虫、環形動物、クモ形類動物、有袋類、爬虫類、両生類、細菌、および菌類などを含む。生物学的サンプルは、組織サンプル(組織切片や組織の針生検など)、細胞サンプル(Pap塗抹標本もしくは血液塗抹標本などの細胞学的塗抹標本、またはマイクロダイセクションによって取得された細胞のサンプルなど)、または細胞分画、断片または細胞小器官(細胞を溶解し、遠心分離などによってそれらの成分を分離することによって取得される)を含む。生物学的サンプルの他の例は、血液、血清、尿、精液、糞便、脳脊髄液、間質液、粘膜、涙、汗、膿、生検組織(例えば、外科的生検または針生検によって取得される)、乳頭吸引物、耳垢、乳、膣液、唾液、ぬぐい液(頬スワブなど)、または最初の生物学的サンプルに由来する生物学的分子を含む任意の材料を含む。特定の実施形態では、本明細書で使用される「生物学的サンプル」という用語は、被験者から取得された腫瘍またはその一部から準備されたサンプル(均質化または液化されたサンプルなど)を指す。
【0030】
III.デジタル病理画像変換のための技術
コンピュータ化されたデジタル画像分析アルゴリズムは、特定のデジタル病理スライドスキャナ(特定の種類のスキャナ、例えば、特定の製造業者からの特定のスキャナ、または特定のスキャナモデル)から取得された病理画像を分析するために利用可能である。そのような場合、特定のデジタル病理スライドスキャナからの画像に対して訓練された画像分析アルゴリズムを使用した異なるデジタル病理スライドスキャナからのデジタル病理画像の分析は、所望の効果または精度を達成しない可能性がある。本開示の様々な態様によれば、異なるスライドスキャナから取得されたデジタル病理画像は、画像分析アルゴリズムを使用して所望の効果または精度を達成することができるように、特定のデジタル病理スライドスキャナからの画像と同様の特性を有する画像に変換される。
【0031】
図4は、様々な実施形態にかかる、第1のデジタル画像スキャナから取得されたソースデジタル画像のセットを、第2のデジタル画像スキャナから取得可能な画像のターゲットセットと同様の特性を有する新たに生成画像のセットに変換するための例示的なコンピューティング環境400(すなわち、データ処理システム)を示している。図4に示すように、この例においてコンピューティング環境400によって実行される画像のソースセットの変換は、いくつかの段階、すなわち、画像取得段階405、モデル訓練段階410、変換段階415、および分析段階420を含む。画像取得段階410は、生物学的サンプルスライド(例えば、組織スライド)の予め選択された領域または全体からデジタル画像430のソースセットおよびデジタル画像435のターゲットセットを取得するためのデジタル画像スキャナ425を含む。デジタル画像スキャナ425は、デジタル画像430のソースセットを取得するための第1の種類のデジタル画像スキャナと、デジタル画像435のターゲットセットを取得するための第2の種類のデジタル画像スキャナとを含む。
【0032】
モデル訓練段階410は、他の段階によって使用されるべき1つ以上のモデル440a~440n(「n」は任意の自然数を表す)(本明細書では個別にモデル440と呼ばれることがあり、またはまとめてモデル440と呼ばれることがある)を構築して訓練する。モデル440は、畳み込みニューラルネットワーク(「CNN」)、初期ニューラルネットワーク、残差ニューラルネットワーク(「Resnet」)、U-Net、V-Net、シングルショットマルチボックス検出器(「SSD」)ネットワーク、リカレントニューラルネットワーク(「RNN」)、正規化線形ユニット(「ReLU」)、ロングショートタームメモリ(「LSTM」)モデル、ゲーティッドリカレントユニット(「GRU」)モデルなど、またはそれらの任意の組み合わせなどの機械学習(「ML」)モデルとすることができる。様々な実施形態では、モデル440は、敵対的生成ネットワーク(「GAN」)、深層畳み込み敵対的生成ネットワーク(「DCGAN」)、変分自己符号化器(VAE)、隠れマルコフモデル(「HMM」)、ガウス混合モデル、ボルツマンマシンなど、またはそのような技術のうちの1つ以上、例えばVAE-GANの組み合わせなど、教師なし学習を使用して任意の種類のデータ分布を学習することができる生成モデルである。コンピューティング環境400は、ソース画像を生成画像に変換するために、同じ種類のモデルまたは異なる種類のモデルを使用することができる。特定の例では、モデル440は、出力画像が現実であるか偽であるかを分類しようとする損失関数によって構築されたGANであり、同時にこの損失を最小限に抑えるように生成モデルを訓練する。
【0033】
図5に示す例示的な実施形態では、モデルは、GANモデルの拡張である条件付きGAN(「CGAN」)500であり、特定の条件または属性を有する画像を生成する。CGANは、出力の結合構成にペナルティを課す構造化損失を学習する。図5を参照すると、CGAN500は、生成器510および識別器515を含む。生成器510は、ランダムに生成されたノイズベクトル520および潜在特徴ベクトル(または1次元ベクトル)525(条件、例えば、本例では、ソース画像)を入力データおよび識別器515からのフィードバックとして受け取り、できるだけ現実のターゲット画像535に近い新たな画像530を生成するニューラルネットワーク(例えば、CNN)である。場合によっては、生成器510は、ダウンサンプリング層とアップサンプリング層との間にスキップ層が追加された、エンコーダ-デコーダネットワークからなる「U-Net」アーキテクチャを利用する。識別器515は、生成器510からの生成画像530が現実画像であるか偽画像であるかを識別するための分類器として構成されたニューラルネットワーク(例えば、CNN)である。場合によっては、識別器は、パッチ単位による「PatchGAN」アーキテクチャを利用する。潜在特徴ベクトル525または条件は、ソース画像またはソース画像のセット540(例えば、第1のデジタルスキャナからの画像)から導出され、ソース画像540から期待されるクラス(例えば、n個のバイオマーカーまたは染色を有する組織サンプル)または特定の特性のセットを符号化する。ランダムに生成されたノイズベクトル520は、ガウス分布から生成されてもよく、ベクトル空間は、領域にとって重要であるが直接観測可能ではない潜在変数または隠れ変数から構成されてもよい。潜在特徴ベクトル525およびランダムノイズベクトル520は、生成器510への入力545として組み合わせられることができる。
【0034】
生成器510は、結合入力545を受け取り、問題領域(すなわち、ターゲット画像535に関連する特性の領域)における潜在特徴ベクトル525およびランダムノイズベクトル520に基づいて画像530を生成する。識別器515は、ターゲット画像535(例えば、第2のデジタルスキャナからの画像)および生成画像530の双方を入力として条件画像分類を実行し、生成画像530がターゲット画像535の現実の変換であるか偽の変換であるかの尤度を予測する550。識別器515の出力は、生成画像530のサイズに依存するが、単一の値または値の二乗活性化マップであってもよい。各値は、生成画像530内のパッチが実在する尤度の確率である。これらの値が平均化されて、必要に応じて全体的な尤度または分類スコアを得ることができる。生成器510および識別器515の双方の損失関数は、生成画像530がターゲット画像535の現実の変換であるか、または偽の変換であるかの尤度を予測するそのジョブ550を識別器515がどの程度良好に実行するかに大きく依存する。十分な訓練の後、生成器510は、より良くなり、生成画像530は、ターゲット画像535により近く見え始める。GAN500の訓練は、生成画像530がターゲット画像535と同様の特性を有し、識別器がもはや現実と偽とを識別することができない場合に完了することができる。訓練されると、第1のデジタル画像スキャナから取得された画像のソースセットは、GAN500に入力されて、画像のソースセットを、第2の画像スキャナから取得された画像のターゲットセットと同様の特性を有する新たに生成画像のセットに変換することができる。その後、新たな生成画像のセットは、現在利用可能なコンピュータ化されたデジタル病理画像分析アルゴリズムを使用して分析されることができる。
【0035】
図4に戻って参照すると、この例においてモデル440を訓練するために、サンプル445は、デジタル画像(デジタル画像430のソースセットおよびデジタル画像435のターゲットセット)を取得し、訓練(例えば、90%)のための画像445aのペアワイズサブセット(ソース画像およびターゲット画像のうちの少なくとも一方のペア)および検証(例えば、10%)のための画像445bのペアワイズサブセットに画像を分割し、画像445aのペアワイズサブセットおよび画像145bのペアワイズサブセットを前処理し、画像445aのペアワイズサブセットを増強し、場合によっては、ラベル450によって画像445aのペアワイズサブセットに注釈を付けることによって生成される。画像のペアワイズサブセット445aは、1つ以上のイメージングモダリティ(例えば、WSIスキャナ)から取得される。場合によっては、画像のペアワイズサブセット445aは、1つ以上のイメージングモダリティに関連付けられたデータベース、画像システム(例えば、デジタル画像スキャナ425)などのデータ記憶構造から取得される。各画像は、組織などの生物学的サンプルを示す。
【0036】
分割は、ランダムに(例えば、90/10%、80%/20%または70/30%)実行されてもよく、または、分割は、サンプリングバイアスおよびオーバーフィッティングを最小限に抑えるために、K-分割交差検証、一個抜き交差検証、一群抜き交差検証、入れ子交差検証などのより複雑な検証技術にしたがって実行されてもよい。前処理は、各画像が単一の関心のあるオブジェクトのみを含むように画像をトリミングすることを含むことができる。いくつかの例では、前処理は、全ての特徴を同じスケール(例えば、同じサイズスケールまたは同じカラースケールまたは彩度スケール)に置くための標準化または正規化をさらに含むことができる。特定の例では、画像は、所定の画素(例えば、2500画素)の最小サイズ(幅または高さ)または所定の画素(例えば、3000画素)の最大サイズ(幅または高さ)でサイズ変更され、元のアスペクト比を維持する。
【0037】
例えば、第1のスキャナおよび第2のスキャナからの多数のパッチ画像は、訓練データ用の画像の1つ以上のペアワイズサブセットとして準備されることができる。ペア画像の準備は、生物学的サンプルのスライド、例えば、CD34-aSMA、FAP/PanCK、Perforin/CD3、Ki67/CD8、FoxP3、PD1など、またはそれらの任意の組み合わせなどの1つ以上のバイオマーカー発現を有するIHCスライドを取得することを含むことができる。各スライドは、第1のスキャナおよび第2のスキャナの双方を使用して走査され、スライド画像全体を取得する。次に、スライド画像全体が所定のサイズ(例えば、128×128)にトリミングされて、第1のスキャナおよび第2のスキャナからのいくつかのパッチ画像のペアが選択されて位置合わせされる(同じオブジェクトまたはシーンの2つ以上の画像を位置合わせする)。位置合わせは、固定画像とも呼ばれる、一方のスキャナからの一方の画像を基準画像として指定することと、他方のスキャナからの他方の画像に幾何学的変換または局所変位を適用して、他方の画像を基準画像と位置合わせすることとを含むことができる。このプロセスは、訓練データのための画像の1つ以上のペアワイズサブセットをもたらす。
【0038】
図6は、本開示のいくつかの態様にかかる、位置合わせを伴う第1のデジタルスライドスキャナおよび第2のデジタルスライドスキャナからのペアの訓練画像600の例を示している。図6を参照すると、左側の列610の画像は、第1のデジタルスライドスキャナ(例えば、VENTANA(登録商標)DP 200)からのソース画像であり、右側の列620の画像は、第2のデジタルスライドスキャナ(例えば、VENTANA iScan(登録商標)HT)からのターゲット画像である。第1の行330は、訓練画像の第1のペアであり、第2の行340は、訓練画像の第2のペアであり、第3の行350は、訓練画像の第3のペアである。ソース画像およびターゲット画像は、それぞれ、128×128画素または別のサイズのパッチサイズを有することができる。128×128画素パッチは、深層学習ネットワークを訓練するためにGANまたはCGANに入力されることができる。
【0039】
図4に戻って参照すると、データセット内の画像の修正バージョンを作成することによって、画像445aのペアワイズサブセットのサイズを人工的に拡張するために増強が使用されることができる。画像データ増強は、元の画像と同じクラスに属するデータセット内の画像の変換バージョンを作成することによって実行されることができる。変換は、シフト、フリップ、ズームなどの画像操作の分野からの動作の範囲を含む。いくつかの例では、動作は、モデル440が画像のペアワイズサブセット445aから利用可能な状況外の状況下で実行することができることを保証するために、ランダム消去、シフト、輝度、回転、ガウスぼかし、および/または弾性変換を含む。
【0040】
モデル440の訓練プロセスは、モデル440のハイパーパラメータを選択することと、画像のペアワイズサブセット445aからモデル440に画像を入力して、モデル440の1つ以上の損失関数または誤差関数(例えば、画像訓練データの確率を最大化するように識別器を訓練するための第1の損失関数と、生成器からサンプリングされた生成画像の確率を最小化するように識別器を訓練し、識別器がそれ自体の生成画像に割り当てる確率を最大化するように生成器を訓練するための第2の損失関数)を最小化するモデルパラメータのセット(例えば、重みおよび/またはバイアス)を見つける反復動作を実行することと、を含む。ハイパーパラメータは、モデル440の挙動を制御するために調整または最適化されることができる設定である。ほとんどのモデルは、メモリまたは実行コストなどのモデルの異なる態様を制御するハイパーパラメータを明示的に定義する。しかしながら、モデルを特定のシナリオに適合させるために、追加のハイパーパラメータが定義されることができる。例えば、ハイパーパラメータは、モデルの隠れユニットの数、モデルの学習率、畳み込みカーネル幅、またはモデルのカーネルの数を含むことができる。訓練の各反復は、モデルパラメータのセットを使用する損失関数または誤差関数の値が、前の反復におけるモデルパラメータの異なるセットを使用する損失関数または誤差関数の値よりも小さくなるように、(ハイパーパラメータの定義されたセットによって構成された)モデル440のモデルパラメータのセットを見つけることを含むことができる。損失関数または誤差関数は、モデル440を使用して推論された出力と、ラベル450を使用したグラウンドトゥルースターゲット画像との間の差を測定するように構築されることができる。
【0041】
モデルパラメータのセットが識別されると、モデル440は、訓練されており、画像のペアワイズサブセット445b(試験または検証データセット)を使用して検証されることができる。検証プロセスは、ハイパーパラメータを調整し、最終的に最適なハイパーパラメータのセットを見つけるために、K-分割交差検証、一個抜き交差検証、一群抜き交差検証、入れ子交差検証などの検証技術を使用して、画像のペアワイズサブセット445bからモデル440に画像を入力する反復動作を含む。最適なハイパーパラメータのセットが取得されると、画像のサブセット445bからの画像の予約された試験セットがモデル445に入力されて出力(この例では、ターゲット画像と同様の特性を有する生成画像)を取得し、Bland-Altman法およびスピアマンのランク相関係数などの相関技術を使用し、誤差、精度、適合率、再現率、受信者動作特性曲線(ROC)などの性能メトリックを計算して、出力がグラウンドトゥルースターゲット画像に対して評価される。
【0042】
理解されるべきであるように、他の訓練/検証機構が想定され、コンピューティング環境400内に実装されてもよい。例えば、モデル440は、訓練されてもよく、ハイパーパラメータは、画像445aのペアワイズサブセットからの画像上で調整されてもよく、画像445bのペアワイズサブセットからの画像は、モデル440の性能を試験および評価するためにのみ使用されてもよい。さらに、本明細書において説明される訓練機構は、新たなモデル440を訓練することに焦点を当てている。これらの訓練機構はまた、他のデータセットから訓練された既存のモデル440を微調整するために利用されることができる。例えば、いくつかの例では、モデル440は、他のオブジェクトもしくは生物学的構造の画像を使用して、または他の被験者もしくは研究(例えば、ヒト試験またはマウス実験)からの切片から事前訓練されていてもよい。それらの場合、モデル440は、転移学習に使用され、画像430/435を使用して再訓練/検証されることができる。
【0043】
モデル訓練段階410は、1つ以上の訓練された変換モデル460および任意に1つ以上の画像分析モデル465を含む訓練されたモデルを出力する。場合によっては、第1のモデル460aは、生物学的標本のソース画像430を処理するように訓練される。ソース画像430は、全体スライドイメージングスキャナなどの第1の種類のスキャナから生成される。ソース画像430は、変換段階415内の変換コントローラ470によって取得される。変換コントローラ470は、1つ以上の訓練された変換モデル460を使用して、ソース画像430を、ターゲット画像の特性に対するそれらの特性を有する新たな画像475に変換するためのプログラム命令を含む。ターゲット画像の特性は、第1の種類のスキャナとは異なる第2の種類のスキャナに関連付けられる。変換は以下を含む:(i)ランダムに生成されたノイズベクトルと、ソース画像430からの潜在特徴ベクトルとを入力データとして生成器モデル(変換モデル460の一部)に入力すること、(ii)生成器モデルによって、新たな画像475を生成すること、(iii)識別器モデル(モデル460の別の部分)に新たな画像475を入力すること、識別器モデルによって、新たな画像475が真または偽である確率(例えば、1と0との間の数)を生成することであって、真が、画像がターゲット画像の特性に類似する特性を有することを意味し、偽が、画像がターゲット画像の特性に類似する特性を有しないことを意味する、新たな画像475が真または偽である確率(例えば、1と0との間の数)を生成すること。
【0044】
場合によっては、新たな画像475は、分析段階420内の分析コントローラ480に送信される。分析コントローラ480は、1つ以上の画像分析モデル465を使用して、新たな画像475内の生物学的サンプルを分析し、分析に基づく分析結果485を出力するためのプログラム命令を含む。場合によっては、1つ以上の画像分析モデル465は、第2の種類のスキャナがターゲット画像の特性と関連付けられるのと同じ種類のスキャナから取得された画像および/または異なる種類のスキャナから取得された画像に対して訓練されたが、ターゲット画像の特性と実質的に同様の特性を有する1つ以上の画像分析アルゴリズム(例えば、レガシー画像分析アルゴリズム)である。その結果、本明細書に記載の技術は、新たな画像分析アルゴリズムを再開発することなく、既存の画像分析アルゴリズム480を使用して変換されたソース画像430(すなわち、新たな画像475)を処理することができる。新たな画像475内の生物学的サンプルの分析は、新たな画像475内の領域、新たな画像475内の1つ以上の細胞、および/または細胞以外の新たな画像475内のオブジェクトに基づいて測定値を抽出することを含むことができる。面積ベースの測定は、最も基本的な評価、例えば、特定の染色(例えば、化学染色またはIHC染色)の面積(2次元)、脂肪小胞の面積、またはスライド上に存在する他の事象を定量化することを含む。細胞ベースの測定は、オブジェクト、例えば細胞の識別および列挙を目的とする。個々の細胞のこの特定は、細胞内区画のその後の評価を可能にする。最後に、個々の細胞から構成されることができない組織切片上に存在する事象またはオブジェクトを評価するために、アルゴリズムが利用されることができる。特定の例では、既存のイメージング分析アルゴリズムは、細胞または細胞内構造の位置を特定し、最終的に診断および予測を支援するために使用されることができる細胞染色、形態、および/または構造の定量的表現を提供するように構成される。
【0045】
明示的に示されていないが、コンピューティング環境400は、開発者に関連付けられた開発者デバイスをさらに含むことができることが理解されよう。開発者デバイスからコンピューティング環境400の構成要素への通信は、モデルに使用される入力画像の種類、使用されるモデルの数および種類、各モデルのハイパーパラメータ、例えば学習率および隠れ層の数、データ要求をフォーマットする方法、使用される訓練データ(例えば、および訓練データへのアクセス方法)および使用される検証技術、および/またはコントローラプロセスを構成する方法を示すことができる。
【0046】
図7は、第1のデジタル画像スキャナから取得されたソース画像(例えば、処理されるソース画像のセットからのソース画像)を、ターゲット画像と同様の特性を有する新たな画像(例えば、生成される新たな画像のセットの新たな画像)に変換する例示的なプロセス700のフローチャートを示している。プロセス700は、図1図5に関して本明細書において説明するように、1つ以上のコンピューティングシステム、モデル、およびネットワークを使用して実行されることができる。プロセスは、ブロック705において始まり、生物学的標本のソース画像が取得される。ソース画像は、第1の種類のスキャナ(例えば、特定の製造業者からの特定のスキャナまたは特定のスキャナモデル)から生成される。ブロック710において、ランダムに生成されたノイズベクトルおよびソース画像からの潜在特徴ベクトルが、入力データとして生成器モデルに入力される。ブロック715において、生成器モデルは、入力データに基づいて新たな画像を生成する。ブロック720において、新たな画像が識別器モデルに入力される。ブロック725において、識別器モデルは、新たな画像が真または偽である確率を生成する。真は、新たな画像がターゲット画像の特性に類似する特性(例えば、強度、コントラスト、解像度、形態境界/形状など)を有することを意味し、偽は、新たな画像がターゲット画像の特性に類似する特性を有しないことを意味する。識別器モデルは、新たな画像の特性の確率分布と比較して、訓練データセット内の正規化されたサンプル画像から学習されたターゲット画像の特性の確率分布を見て、新たな画像が、ターゲット画像が新たな画像を真の画像として分類する確率が高いかどうかを予測し、そうでない場合、識別器は、新たな画像を偽の画像として割り当てる。ターゲット画像および新たな画像の特性の確率分布間の類似性の決定は、相互相関、Bhattacharyya距離、または他の数学的アルゴリズム(ターゲット画像と新たな画像との間の平均二乗誤差など)を使用して行うことができる。ターゲット画像の特性は、第1の種類のスキャナとは異なる第2の種類のスキャナに関連付けられる。ブロック730において、生成された確率に基づいて、新たな画像が真であるか偽であるかに関する決定が行われる。ブロック735において、画像が真である場合、新たな画像が真のラベルとともに出力される。ステップ740において、画像が偽である場合、新たな画像が偽のラベルとともに出力される。
【0047】
場合によっては、生成器モデルおよび識別器モデルは、GANモデルの一部である。GANモデルは、画像の1つ以上のペアワイズセットを含む訓練データのセットを使用して学習された複数のモデルパラメータを含む。画像の1つ以上のペアワイズセット内の画像の各ペアは、第1の種類のスキャナによって生成された第1の画像と、第2の種類のスキャナによって生成された第2の画像とを含む。特定の例では、複数のモデルパラメータは、訓練データのセットの確率を最大化するように識別器モデルを訓練するための第1の損失関数と、生成器モデルからサンプリングされた生成画像の確率を最小化するように識別器モデルを訓練し、かつ識別器モデルが生成画像に割り当てる確率を最大化するように生成器モデルを訓練するための第2の損失関数とを最小化することに基づいて、訓練データのセットを使用して学習される。
【0048】
ブロック745において、ブロック735において出力された新たな画像を使用して動作が実行される。場合によっては、動作は、新たな画像を画像分析モデルに入力することを含む。画像分析モデルは、第2の種類のスキャナと同じ種類のスキャナから取得された画像を含む訓練データのセットを使用して学習された複数のモデルパラメータを含む。動作は、画像分析モデルによって新たな画像を分析することと、画像分析モデルによって、新たな画像の分析に基づく分析結果を生成することと、分析結果を出力することと、をさらに含む。例えば、画像分析モデルは、第2のデジタル画像スキャナ(例えば、iScanHT)を使用して特定のマーカー(CD8、Ki67など)を検出するように訓練されることができる。ここで、第1のデジタル画像スキャナ(例えばDP200)を使用して、スライドが走査され、取得された画像は、第2のデジタル画像スキャナ(例えば、iScanHT)から取得された画像と比較して異なる特性プロファイル(例えば、異なる色および/または解像度プロファイル)を有する。GANモデルを使用して、第1のデジタル画像スキャナ(例えばDP200)によって走査された画像は、第2のデジタル画像スキャナ(例えば、iScanHT)によって走査された画像と同様の特性プロファイルを有する画像に変換されることができる。したがって、画像分析モデル(例えば、CD8、Ki67、PanCk、CD3などを検出するなど)は、第2のデジタル画像スキャナ(例えば、iScanHT)によって走査された画像と同様の特性プロファイルを有するように変換された新たな画像を入力として取り込むことができ、画像分析モデルは再訓練される必要はない。画像分析モデルは、第1の種類のスキャナ(例えば、DP200)と同じ種類のスキャナから取得された画像に対して訓練されなくてもよい。他の例では、動作は、新たな画像を含む訓練データのセットを使用して画像分析モデルを訓練することを含む。したがって、GANによって生成された新たな画像では、画像分析モデルを変更することなく異なるマーカーを分類することが可能であり、画像は異なる種類のスキャナを介して取得されることができる。その後、ユーザは、分析結果に基づいて被験者の診断を決定することができる。ユーザは、(i)分析結果、および/または(iii)被験者の診断に基づいて化合物による治療を投与することができる。
【0049】
本開示にかかる方法は、デジタル画像分析アルゴリズムをスキャナに依存しないようにすることができ、任意のデジタル病理スライドスキャナによって生成されたデジタル病理画像は、デジタル画像分析アルゴリズムによる分析に適した画像に変換されることができる。開示された方法は、他のスキャナによって走査された画像を、新たなスキャナによって生成された画像とペアになった訓練データとして使用されることができる画像に変換することによって、新世代スキャナのための将来の画像分析アルゴリズム開発に適用可能であり得る。さらに、開示された方法は、例えば事前分析条件に起因する画像変動を補正するために、異なる地理的領域に位置する異なるイメージングサイトからデータを転送するために利用されることができる。
【0050】
図8は、本開示のいくつかの態様にかかる、異なるバイオマーカーについて染色されたデジタル病理画像の例を示している。画像は、4枚のスライドのデジタル病理画像である。第1の行820は、第1のスライドのソース画像、生成画像およびターゲット画像を含む。第2の行821は、第2のスライドのソース画像、生成画像およびターゲット画像を含む。第3の行822は、第3のスライドのソース画像、生成画像およびターゲット画像を含む。第4の行823は、第4のスライドのソース画像、生成画像およびターゲット画像を含む。各行は、異なるバイオマーカーを明らかにするために染色されたスライドのデジタル病理画像を示す。
【0051】
第1の列810内の4枚のスライドのソース画像は、第1のデジタル病理スライドスキャナから取得される。ソース画像は、利用可能なコンピュータ化されたデジタル病理画像分析アルゴリズムを使用した分析には適さない場合がある。第3の列812内のターゲット画像は、同じ4枚のスライドのデジタル病理画像であり、第2のデジタル病理スライドスキャナから取得されることができる。第3の列812内のターゲット画像(例えば、所望の画像)は、利用可能なコンピュータ化されたデジタル病理画像分析アルゴリズムを使用した分析に適している可能性がある。本開示の態様は、(第1の列810内の)ソースデジタル病理画像を、(第3の列812内の)ターゲットデジタル病理画像の特性を有する画像に変換することを可能にすることができる。
【0052】
本開示の態様によれば、ソースデジタル病理画像は、訓練されたGANに入力されてもよく、訓練されたGANは、既存のコンピュータ化されたデジタル病理画像分析アルゴリズムによる分析に適したターゲット画像の特性を有する生成された新たな画像を出力してもよい。図8を参照すると、第2の列811内の画像は、第1の列810内のソース画像をGANへの入力として使用して訓練されたGANによって生成された新たな画像である。図8から分かるように、第2の列811内の生成画像は、第3の列812内のターゲット画像と同様の特性を有する。したがって、第2の列811内の生成されたデジタル病理画像は、第3の列812内のデジタル病理画像を分析するために使用されることができるのと同じコンピュータ化されたデジタル病理画像分析アルゴリズムを使用して分析されることができる。
【0053】
図9は、本開示のいくつかの態様にかかる、異なるバイオマーカーについて染色されたデジタル病理画像のさらなる例を示している。画像は、2枚のスライドのデジタル病理画像である。第1の行920は、第1のスライドのソース画像、生成画像およびターゲット画像を含む。第2の行921は、第2のスライドのソース画像、生成画像およびターゲット画像を含む。第1の列910内の2枚のスライドのソース画像は、第1のデジタル病理スライドスキャナから取得される。ソース画像は、利用可能なコンピュータ化されたデジタル病理画像分析アルゴリズムを使用した分析には適さない場合がある。第3の列912内のターゲット画像は、同じ2枚のスライドのデジタル病理画像であり、第2のデジタル病理スライドスキャナから取得されることができる。第3の列912内のターゲット画像(例えば、所望の画像)は、利用可能なコンピュータ化されたデジタル病理画像分析アルゴリズムを使用した分析に適している可能性がある。本開示の態様は、(第1の列910内の)ソースデジタル病理画像を、(第3の列912内の)ターゲットデジタル病理画像の特性を有する画像に変換することを可能にすることができる。
【0054】
本開示の態様によれば、ソースデジタル病理画像は、訓練されたGANに入力されてもよく、訓練されたGANは、既存のコンピュータ化されたデジタル病理画像分析アルゴリズムによる分析に適したターゲット画像の特性を有する生成された新たな画像を出力してもよい。図9を参照すると、第2の列911内の画像は、第1の列910内のソース画像をGANへの入力として使用して訓練されたGANによって生成された新たな画像である。図9に見られるように、第2の列911内の生成画像は、第3の列912内のターゲット画像と同様の特性を有する(同様の位置の同様の特性を表す網掛けドットを参照)。したがって、第2の列911内の生成されたデジタル病理画像は、第3の列912内のデジタル病理画像を分析するために使用されることができるのと同じコンピュータ化されたデジタル病理画像分析アルゴリズムを使用して分析されることができる。
【0055】
V.実施例
実施例1.デジタル病理画像についてのマルチスキャナにおける相違の深層学習を使用した補正
CGANは、更新されたスキャナ(VENTANA DP200)から取得された6つの異なるバイオマーカー発現画像(DAB、マルチプレクサ-明視野-IHC)を、前世代のスキャナ(VENTANA iScanHT)を使用して走査されたものと同様の画像特性を有する新たな高品質の合成画像に変換するために開発された。128×128のパッチサイズを有する12,740枚の画像または6,370枚のペアリングされた画像を、バイオマーカー発現からなる訓練用のペアリングされたiScanHT/DP200画像として使用した:それぞれ、CD34-aSMA(DAB/red)、FAP/PanCK(黄色/紫色)、Perforin/CD3(DAB/red)、Ki67/CD8(黄色/紫色)、FoxP3(DAB)、およびPD1(DAB)。同じ組織スライドを、iScanHT-スキャナおよびDP200-スキャナの双方を使用して走査し、一方、パッチ画像を選択し、位置合わせして、ペアの画像が同じ組織切片に位置することを確実にした。
【0056】
視覚的評価は、入力-DP200画像が出力-iScanHT画像に変換され、異なるバイオマーカー画像のターゲット画像と同等の画像特性を有することを示した。オリジナルのiScanHTアルゴリズムをターゲットおよび生成されたiScanHT画像に適用した場合、出力画像とターゲット画像との間の検出された腫瘍細胞数の評価の結果、PD1、FoxP3、Ki67CD8、FAP/PanCK、CD34-aSMAおよびPerforin/CD3試験画像について、それぞれ0.86、0.93、0.95、0.82、0.80および0.97のLinの一致相関係数(CCC)が取得された。これは、マルチスキャナにおける相違を補償する可能性を実証し、新たな画像分析アルゴリズムを再開発することなく、レガシー-iScanHTアルゴリズムなどのアルゴリズムを変換されたDP200画像に適用する能力を示す。この画像-画像変換手法は、任意の新世代スキャナの将来のアルゴリズム開発のための大きなデータセットを生成する可能性を有し、それによって他のスキャナによって走査された画像が変換され、新たなスキャナの訓練データとして使用されることができる。
【0057】
VI.さらなる考察
本開示のいくつかの実施形態は、1つ以上のデータプロセッサを含むシステムを含む。いくつかの実施形態では、システムは、命令を含む非一時的コンピュータ可読記憶媒体であって、該命令が、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させる、非一時的コンピュータ可読記憶媒体を備える。本開示のいくつかの実施形態は、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させるように構成された命令を含む、非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品を含む。
【0058】
使用された用語および表現は、限定ではなく説明の用語として使用され、そのような用語および表現の使用において、示されて説明された任意の特徴の均等物またはその一部を除外する意図はないが、特許請求の範囲に記載された発明の範囲内で様々な変更が可能であることが認識される。したがって、特許請求の範囲に記載された本発明は、実施形態および任意の特徴によって具体的に開示されているが、本明細書に開示された概念の変更および変形は、当業者によってあてにされてもよく、そのような変更および変形は、添付の特許請求の範囲によって定義される本発明の範囲内にあると見なされることを理解されたい。
【0059】
後続の記載は、好ましい例示の実施形態のみを提供し、本開示の範囲、適用可能性、または構成を限定しようとするものではない。むしろ、好ましい例示的な実施形態のその後の説明は、様々な実施形態を実装するための可能な説明を当業者に提供する。添付の特許請求の範囲に記載の趣旨および範囲から逸脱することなく、要素の機能および配置に様々な変更を加えることができることが理解される。
【0060】
実施形態の徹底的な理解を提供するため、具体的な詳細が以下の記載において与えられる。しかしながら、これらの具体的な詳細なしで実施形態が実施されることができることが理解されよう。例えば、回路、システム、ネットワーク、プロセス、および他の構成要素は、実施形態を不必要に詳細に不明瞭にしないために、ブロック図形式の構成要素として示されてもよい。他の例では、実施形態を不明瞭にすることを避けるために、周知の回路、プロセス、アルゴリズム、構造、および技術が不必要な詳細なしに示されてもよい。
図1
図2A
図2B
図3
図4
図5
図6
図7
図8
図9