(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-04
(45)【発行日】2024-07-12
(54)【発明の名称】デジタル病理学のためのスライドの画像を処理し、スライドの処理された画像を自動的に優先順位付けするためのシステムおよび方法
(51)【国際特許分類】
G16H 30/00 20180101AFI20240705BHJP
【FI】
G16H30/00
(21)【出願番号】P 2022192745
(22)【出願日】2022-12-01
(62)【分割の表示】P 2021570178の分割
【原出願日】2020-05-29
【審査請求日】2022-12-01
(32)【優先日】2019-05-31
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518307592
【氏名又は名称】ペイジ.エーアイ インコーポレイテッド
【氏名又は名称原語表記】PAIGE.AI, Inc.
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ラン ゴッドリッチ
(72)【発明者】
【氏名】ジリアン スー
(72)【発明者】
【氏名】レオ グラディー
(72)【発明者】
【氏名】トーマス フックス
【審査官】吉田 誠
(56)【参考文献】
【文献】特表2018-504674(JP,A)
【文献】特表2003-524775(JP,A)
【文献】特開2016-126491(JP,A)
【文献】米国特許出願公開第2019/0164287(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00 - 80/00
(57)【特許請求の範囲】
【請求項1】
プロセッサを備えるコンピュータが実行する画像処理方法であって、前記方法は、
前記プロセッサが標的画像における複数の画像領域から抽出された微視的特徴を分析することによって、前記プロセッサが、機械学習システムを使用して、
複数のスライドのうちの1つのスライドに関連付けられた前記標的画像の着目エリアを識別することであって、前記機械学習システムは、前記プロセッサが複数の訓練画像を処理することによって発生させられ、前記複数の訓練画像の各々は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および分析難度のうちの少なくとも1つを特徴付ける診断標識とを備えて
おり、前記複数の訓練画像を処理することは、前記複数の訓練画像のうちの1つの訓練画像から標的特徴を抽出することと、前記標的特徴を分析することとを含む、ことと、
前記プロセッサが、前記機械学習システムを使用して、
前記複数のスライド内に前記標的特徴が存在する平均確率に基づいて前記標的画像の前記着目エリア内に
前記標的特徴が存在する確率を決定することと、
前記プロセッサが、前記機械学習システムを使用して、前記標的画像内に前記標的特徴が存在する前記確率に基づいて複数の優先順位付け値のうちの前記標的画像の優先順位付け値を決定することであって、前記優先順位付け値は、第1のユーザの選好に基づいて決定される第1の優先順位付け値と第2のユーザの選好に基づいて決定される第2の優先順位付け値とを備えている、ことと、
前記プロセッサが、前記機械学習システムを使用して、複数のデジタル化病理学画像に関連付けられた前記複数の優先順位付け値に基づいて前記デジタル化病理学画像を順序付けることと
を含み、
前記標的画像の配置は、前記標的特徴に基づく前記標的画像の前記優先順位付け値に基づく、方法。
【請求項2】
前記プロセッサが、さらなる調製が実施されることを示す前記標的画像内の特徴を前記標的特徴が備えていることを決定すると、前記プロセッサが、ユーザ精査に先立って前記標的画像のための新しいスライドを調製することをさらに含む、請求項1に記載の方法。
【請求項3】
前記診断
標識は、癌の存在、癌の悪性度、治療効果、前癌病変、治療選択のためのバイオマーカ、および/または感染性生物の存在のうちの少なくとも1つを備えている、請求項
2に記載の方法。
【請求項4】
前記診断標識は、走査線、欠落した組織、および/またはぼけのうちの少なくとも1つに対応するアーチファクト標識を備えている、請求項1に記載の方法。
【請求項5】
画像処理システムであって、前記システムは、
命令を記憶しているメモリと、
プロセッサと
を備え、
前記プロセッサは、
標的画像における複数の画像領域から抽出された微視的特徴を分析することによって、機械学習システムを使用して、
複数のスライドのうちの1つのスライドに関連付けられた前記標的画像の着目エリアを識別することであって、前記機械学習システムは、複数の訓練画像を処理することによって発生させられ、前記複数の訓練画像の各々は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および分析難度のうちの少なくとも1つを特徴付ける診断標識とを備えて
おり、前記複数の訓練画像を処理することは、前記複数の訓練画像のうちの1つの訓練画像から標的特徴を抽出することと、前記標的特徴を分析することとを含む、ことと、
前記機械学習システムを使用して、
前記複数のスライド内に前記標的特徴が存在する平均確率に基づいて前記標的画像の前記着目エリア内に
前記標的特徴が存在する確率を決定することと、
前記機械学習システムを使用して、前記標的画像内に前記標的特徴が存在する前記確率に基づいて複数の優先順位付け値のうちの前記標的画像の優先順位付け値を決定することであって、前記優先順位付け値は、第1のユーザの選好に基づいて決定される第1の優先順位付け値と第2のユーザの選好に基づいて決定される第2の優先順位付け値とを備えている、ことと、
前記機械学習システムを使用して、複数のデジタル化病理学画像に関連付けられた前記複数の優先順位付け値に基づいて前記デジタル化病理学画像を順序付けることと
を含む動作を実施するための前記命令を実行するように構成され、
前記標的画像の配置は、前記標的特徴に基づく前記標的画像の前記優先順位付け値に基づく、システム。
【請求項6】
前記診断標識は、前記標的画像の診断特徴を備えている、請求項
5に記載のシステム。
【請求項7】
前記診断特徴は、癌の存在、癌の悪性度、治療効果、前癌病変、治療選択のためのバイオマーカ、および
感染性生物の存在のうちの少なくとも1つを備えている、請求項
6に記載のシステム。
【請求項8】
前記診断標識は、走査線、欠落した組織、および
ぼけのうちの少なくとも1つに対応するアーチファクト標識を備えている、請求項
5に記載のシステム。
【請求項9】
命令を記憶している非一過性コンピュータ読み取り可能な媒体であって、前記命令は、少なくとも1つのプロセッサによって実行されると、画像処理方法を前記少なくとも1つのプロセッサに実施させ、前記方法は、
標的画像における複数の画像領域から抽出された微視的特徴を分析することによって、機械学習システムを使用して、
複数のスライドのうちの1つのスライドに関連付けられた前記標的画像の着目エリアを識別することであって、前記機械学習システムは、複数の訓練画像を処理することによって発生させられ、前記複数の訓練画像の各々は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および分析難度のうちの少なくとも1つを特徴付ける診断標識とを備えて
おり、前記複数の訓練画像を処理することは、前記複数の訓練画像のうちの1つの訓練画像から標的特徴を抽出することと、前記標的特徴を分析することとを含む、ことと、
前記機械学習システムを使用して、
前記複数のスライド内に前記標的特徴が存在する平均確率に基づいて前記標的画像の前記着目エリア内に
前記標的特徴が存在する確率を決定することと、
前記機械学習システムを使用して、前記標的画像内に前記標的特徴が存在する前記確率に基づいて複数の優先順位付け値のうちの前記標的画像の優先順位付け値を決定することであって、前記優先順位付け値は、第1のユーザの選好に基づいて決定される第1の優先順位付け値と第2のユーザの選好に基づいて決定される第2の優先順位付け値とを備えている、ことと、
前記機械学習システムを使用して、複数のデジタル化病理学画像に関連付けられた前記複数の優先順位付け値に基づいて前記デジタル化病理学画像を順序付けることと
を含み、
前記標的画像の配置は、前記標的特徴に基づく前記標的画像の前記優先順位付け値に基づく、非一過性コンピュータ読み取り可能な媒体。
【請求項10】
前記診断標識は、前記標的画像の診断特徴を備え、前記診断特徴は、癌の存在、癌の悪性度、治療効果、前癌病変、治療選択のためのバイオマーカ、および/または感染性生物の存在のうちの少なくとも1つを備えている、請求項
9に記載の非一過性コンピュータ読み取り可能な媒体。
【請求項11】
前記さらなる調製は、前記プロセッサが、試料再切断、免疫組織化学染色、追加の診断試験、追加の協議、および/または特殊な染色のうちの少なくとも1つに基づいて前記標的画像のための新しいスライドを調製することによって実施され、前記少なくとも1つは、前記ユーザ精査に先立って実施される、請求項2に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願)
本願は、その全開示が本明細書に参照することによってその全体として本明細書に組み込まれる2019年5月31日に出願された米国仮出願第62/855,199号の優先権を主張する。
【0002】
(開示の分野)
本開示の種々の実施形態は、概して、画像ベースのスライド優先順位付け、デジタル病理学ワークフローの合理化、および関連する画像処理方法に関する。より具体的に、本開示の特定の実施形態は、組織試料のスライドの画像を調製、処理、および精査するための自動的優先順位付けプロセスを提供するためのシステムおよび方法に関する。
【背景技術】
【0003】
病理学患者症例に関する組織試料の画像の精査を優先順位付けするためのいかなる標準化された、または効率的な方法も、存在しない。さらに、病理学スライドを精査するためのいかなる標準化されたプロセスも、存在しない。いくつかの学術機関では、病理学実習生は、患者症例の事前精査を実施し、症例をトリアージし、重要な所見を伴う、および/または追加の診断精密検査(例えば、免疫組織化学染色、再切断、分子研究、特殊な染色、部門内協議)を要求する症例を優先順位付けし得る。一方、患者診断は、一次診断のためにデジタル化病理学スライドを使用することを伴い得る。スライド調製プロセスを促進または合理化する方法に関する要求が、存在する。病理学スライドが、スライドが病理医によって精査されるときまでに、診断を下すために十分な情報を有することを確実にする方法に関する要求が、さらに存在する。
【発明の概要】
【課題を解決するための手段】
【0004】
本開示のある側面によると、試料に対応する電子画像を処理し、スライドの処理を自動的に優先順位付けするためのシステムおよび方法が、開示される。
【0005】
試料に対応する電子画像を処理し、電子画像の処理を自動的に優先順位付けするコンピュータ実装方法は、標的試料に対応するスライドの標的電子画像を受信することであって、標的試料は、患者の組織サンプルを含む、ことと、機械学習システムを使用して、標的電子画像の優先順位付け値を計算することであって、機械学習システムは、複数の訓練画像を処理することによって発生させられており、各訓練画像は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および/または分析難度のうちの少なくとも1つを特徴付ける標識とを含む、ことと、デジタル化病理学画像の一続きを出力することであって、一続きにおける標的電子画像の配置は、標的電子画像の優先順位付け値に基づく、こととを含む。
【0006】
試料に対応する電子画像を処理し、電子画像の処理を自動的に優先順位付けするためのシステムは、命令を記憶している少なくとも1つのメモリと、少なくとも1つのプロセッサとを含み、少なくとも1つのプロセッサは、標的試料に対応するスライドの標的電子画像を受信することであって、標的試料は、患者の組織サンプルを含む、ことと、機械学習システムを使用して、標的電子画像の優先順位付け値を計算することであって、機械学習システムは、複数の訓練画像を処理することによって発生させられており、各訓練画像は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および/または分析難度のうちの少なくとも1つを特徴付ける標識とを含む、ことと、デジタル化病理学画像の一続きを出力することであって、一続きにおける標的電子画像の配置は、標的電子画像の優先順位付け値に基づく、こととを含む動作を実施するための命令を実行するように構成されている。
【0007】
命令を記憶している非一過性コンピュータ読み取り可能な媒体であって、命令は、少なくとも1つのプロセッサによって実行されると、試料に対応する電子画像を処理し、画像の処理を自動的に優先順位付けする方法を少なくとも1つのプロセッサに実施させ、方法は、標的試料に対応するスライドの標的電子画像を受信することであって、標的試料は、患者の組織サンプルを含む、ことと、機械学習システムを使用して、標的電子画像の優先順位付け値を計算することであって、機械学習システムは、複数の訓練画像を処理することによって発生させられており、各訓練画像は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および/または分析難度のうちの少なくとも1つを特徴付ける標識とを含む、ことと、デジタル化病理学画像の一続きを出力することであって、一続きにおける標的電子画像の配置は、標的電子画像の優先順位付け値に基づく、こととを含む、非一過性コンピュータ読み取り可能な媒体。
【0008】
前述の一般的な説明および以下の発明を実施するための形態の両方が、例示的かつ解説的にすぎず、請求されるような開示される実施形態の制限ではないことを理解されたい。
本発明はさらに、例えば、以下を提供する。
(項目1)
試料に対応する電子画像を処理し、前記電子画像の処理を自動的に優先順位付けするコンピュータ実装方法であって、前記コンピュータ実装方法は、
標的試料に対応するスライドの標的電子画像を受信することであって、前記標的試料は、患者の組織サンプルを備えている、ことと、
機械学習システムを使用して、前記標的電子画像の優先順位付け値を計算することであって、前記機械学習システムは、複数の訓練画像を処理することによって発生させられており、各訓練画像は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および/または分析難度のうちの少なくとも1つを特徴付ける標識とを備えている、ことと、
デジタル化病理学画像の一続きを出力することと
を含み、
前記一続きにおける前記標的電子画像の配置は、前記標的電子画像の前記優先順位付け値に基づく、コンピュータ実装方法。
(項目2)
前記標識は、さらなる調製が前記標的電子画像に関して実施される可能性に対応する調製値を備えている、項目1に記載のコンピュータ実装方法。
(項目3)
前記標識は、さらなる調製が前記標的電子画像に関して実施される可能性に対応する調製値を備え、
前記さらなる調製は、試料再切断、免疫組織化学染色、追加の診断試験、追加の協議、および/または特殊な染色のうちの少なくとも1つに基づいて、前記標的電子画像に関して実施される、項目1に記載のコンピュータ実装方法。
(項目4)
前記標識は、前記標的電子画像の診断特徴を備え、前記診断特徴は、癌の存在、癌の悪性度、治療効果、前癌病変、治療選択のためのバイオマーカ、および/または感染性生物の存在のうちの少なくとも1つを備えている、項目1に記載のコンピュータ実装方法。
(項目5)
前記標的電子画像の前記優先順位付け値は、第1のユーザに関する前記標的電子画像の第1の優先順位付け値と、第2のユーザに関する前記標的電子画像の第2の優先順位付け値とを備えている、項目1に記載のコンピュータ実装方法。
(項目6)
前記標的電子画像の前記優先順位付け値は、第1のユーザに関する前記標的画像の第1の優先順位付け値と、第2のユーザに関する前記標的電子画像の第2の優先順位付け値とを備え、
前記第1の優先順位付け値は、前記第1のユーザの選好に基づいて決定され、前記第2の優先順位付け値は、前記第2のユーザの選好に基づいて決定される、項目1に記載のコンピュータ実装方法。
(項目7)
前記標識は、走査線、欠落した組織、および/またはぼけのうちの少なくとも1つに対応するアーチファクト標識を備えている、項目1に記載のコンピュータ実装方法。
(項目8)
試料に対応する電子画像を処理し、前記電子画像の処理を自動的に優先順位付けするためのシステムであって、前記システムは、
命令を記憶している少なくとも1つのメモリと、
少なくとも1つのプロセッサと
を備え、
前記少なくとも1つのプロセッサは、
標的試料に対応するスライドの標的電子画像を受信することであって、前記標的試料は、患者の組織サンプルを備えている、ことと、
機械学習システムを使用して、前記標的電子画像の優先順位付け値を計算することであって、前記機械学習システムは、複数の訓練画像を処理することによって発生させられており、各訓練画像は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および/または分析難度のうちの少なくとも1つを特徴付ける標識とを備えている、ことと、
デジタル化病理学画像の一続きを出力することと
を含む動作を実施するための前記命令を実行するように構成され、
前記一続きにおける前記標的電子画像の配置は、前記標的電子画像の前記優先順位付け値に基づく、システム。
(項目9)
前記標識は、さらなる調製が前記標的電子画像に関して実施される可能性に対応する調製値を備えている、項目8に記載のシステム。
(項目10)
前記標識は、さらなる調製が前記標的電子画像に関して実施される可能性に対応する調製値を備え、
前記さらなる調製は、試料再切断、免疫組織化学染色、追加の診断試験、追加の協議、および/または特殊な染色のうちの少なくとも1つに基づいて、前記標的電子画像に関して実施される、項目8に記載のシステム。
(項目11)
前記標識は、前記標的電子画像の診断特徴を備え、前記診断特徴は、癌の存在、癌の悪性度、治療効果、前癌病変、治療選択のためのバイオマーカ、および/または感染性生物の存在のうちの少なくとも1つを備えている、項目8に記載のシステム。
(項目12)
前記標的電子画像の前記優先順位付け値は、第1のユーザに関する前記標的電子画像の第1の優先順位付け値と、第2のユーザに関する前記標的電子画像の第2の優先順位付け値とを備えている、項目8に記載のシステム。
(項目13)
前記標的電子画像の前記優先順位付け値は、第1のユーザに関する前記標的画像の第1の優先順位付け値と、第2のユーザに関する前記標的電子画像の第2の優先順位付け値とを備え、
前記第1の優先順位付け値は、前記第1のユーザの選好に基づいて決定され、前記第2の優先順位付け値は、前記第2のユーザの選好に基づいて決定される、項目8に記載のシステム。
(項目14)
前記標識は、走査線、欠落した組織、および/またはぼけのうちの少なくとも1つに対応するアーチファクト標識を備えている、項目8に記載のシステム。
(項目15)
命令を記憶している非一過性コンピュータ読み取り可能な媒体であって、前記命令は、少なくとも1つのプロセッサによって実行されると、試料に対応する電子画像を処理し、前記画像の処理を自動的に優先順位付けする方法を前記少なくとも1つのプロセッサに実施させ、前記方法は、
標的試料に対応するスライドの標的電子画像を受信することであって、前記標的試料は、患者の組織サンプルを備えている、ことと、
機械学習システムを使用して、前記標的電子画像の優先順位付け値を計算することであって、前記機械学習システムは、複数の訓練画像を処理することによって発生させられており、各訓練画像は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および/または分析難度のうちの少なくとも1つを特徴付ける標識とを備えている、ことと、
デジタル化病理学画像の一続きを出力することと
を含み、
前記一続きにおける前記標的電子画像の配置は、前記標的電子画像の優先順位付け値に基づく、非一過性コンピュータ読み取り可能な媒体。
(項目16)
前記標識は、さらなる調製が前記標的電子画像に関して実施される可能性に対応する調製値を備えている、項目15に記載の非一過性コンピュータ読み取り可能な媒体。
(項目17)
前記標識は、さらなる調製が前記標的電子画像に関して実施される可能性に対応する調製値を備え、
前記さらなる調製は、試料再切断、免疫組織化学染色、追加の診断試験、追加の協議、および/または特殊な染色のうちの少なくとも1つに基づいて、前記標的電子画像に関して実施される、項目15に記載の非一過性コンピュータ読み取り可能な媒体。
(項目18)
前記標識は、前記標的電子画像の診断特徴を備え、前記診断特徴は、癌の存在、癌の悪性度、治療効果、前癌病変、治療選択のためのバイオマーカ、および/または感染性生物の存在のうちの少なくとも1つを備えている、項目15に記載の非一過性コンピュータ読み取り可能な媒体。
(項目19)
前記標的電子画像の前記優先順位付け値は、第1のユーザに関する前記標的電子画像の第1の優先順位付け値と、第2のユーザに関する前記標的電子画像の第2の優先順位付け値とを備えている、項目15に記載の非一過性コンピュータ読み取り可能な媒体。
(項目20)
前記標的電子画像の前記優先順位付け値は、第1のユーザに関する前記標的画像の第1の優先順位付け値と、第2のユーザに関する前記標的電子画像の第2の優先順位付け値とを備え、
前記第1の優先順位付け値は、前記第1のユーザの選好に基づいて決定され、前記第2の優先順位付け値は、前記第2のユーザの選好に基づいて決定される、項目15に記載の非一過性コンピュータ読み取り可能な媒体。
【図面の簡単な説明】
【0009】
本明細書に組み込まれ、その一部を成す付随の図面は、種々の例示的実施形態を図示し、説明とともに、開示される実施形態の原理を解説する役割を果たす。
【0010】
【
図1A】
図1Aは、本開示の例示的実施形態による、組織試料のスライドの画像を調製、処理、および精査するための自動的優先順位付けプロセスを提供するためのシステムおよびネットワークの例示的ブロック図である。
【0011】
【
図1B】
図1Bは、本開示の例示的実施形態による、疾患検出プラットフォーム100の例示的ブロック図である。
【0012】
【
図1C】
図1Cは、本開示の例示的実施形態による、スライド優先順位付けツール101の例示的ブロック図である。
【0013】
【
図1D】
図1Dは、本開示の例示的実施形態による、病理学スライド調製、処理、および精査に関する自動的優先順位付けプロセスのための例示的システムの略図である。
【0014】
【
図2】
図2は、本開示の例示的実施形態による、機械学習を使用して、試料に対応するスライドの画像を分析し、スライドの自動的に優先順位付けされた処理を提供する例示的方法のフローチャートである。
【0015】
【
図3】
図3は、本開示の例示的実施形態による、病理学スライド調製、処理、および精査を自動的に優先順位付けするための例示的実施形態のフローチャートである。
【0016】
【
図4】
図4は、本開示の例示的実施形態による、品質制御ベースの病理学スライド調製優先順位付けツールを発生させ、使用する例示的実施形態のフローチャートである。
【0017】
【
図5】
図5は、本開示の例示的実施形態による、品質制御に関する病理学スライド調製優先順位付けツールを発生させ、使用する例示的実施形態のフローチャートである。
【0018】
【
図6】
図6は、本開示の例示的実施形態による、診断特徴優先順位付けツールを発生させ、使用する例示的実施形態のフローチャートである。
【0019】
【
図7】
図7は、本開示の例示的実施形態による、病理学スライド処理優先順位付けツールを発生させ、使用する例示的実施形態のフローチャートである。
【0020】
【
図8】
図8は、本開示の例示的実施形態による、病理学スライド精査および割り当て優先順位付けツールを発生させ、使用する例示的実施形態のフローチャートである。
【0021】
【
図9】
図9は、本開示の例示的実施形態による、個人化された病理学スライド優先順位付けツールを発生させ、使用する例示的実施形態のフローチャートである。
【0022】
【
図10】
図10は、本開示の例示的実施形態による、教育的病理学スライド優先順位付けツールを発生させ、使用する例示的実施形態のフローチャートである。
【0023】
【
図11】
図11は、本明細書に提示される技法を実行し得る例示的システムを描写する。
【発明を実施するための形態】
【0024】
ここで、本開示の例示的実施形態が、詳細に参照され、その例が、付随の図面に図示される。可能であるときは常に、同一の参照番号は、図面全体を通して同一または同様の部分を指すように使用されるであろう。
【0025】
本明細書に開示されるシステム、デバイス、および方法は、例として、図を参照して詳細に説明される。本明細書に議論される例は、例にすぎず、本明細書に説明される装置、デバイス、システム、および方法の解説を支援するために提供される。図面に示される、または下記に議論される特徴またはコンポーネントのいずれも、必須であるとして具体的に指定されない限り、これらのデバイス、システム、または方法のうちのいずれかの任意の具体的実装のために必須であるとしてとられるべきではない。
【0026】
説明される任意の方法に関して、方法が、フロー図と併せて説明されるかどうかにかかわらず、文脈によって別様に規定または要求されない限り、方法の実行において実施されるステップのいかなる明示的または暗示的順序付けも、それらのステップが、提示される順序で実施されなければならないことを意味せず、代わりに、異なる順序で、または並行に実施され得ることを意味することも理解されたい。
【0027】
本明細書に使用される場合、用語「例示的」は、「理想的」ではなく、「例」の意味で使用される。また、本明細書の用語「a」および「an」は、数量の限定を表さず、むしろ、言及されるアイテムのうちの1つ以上のものの存在を表す。
【0028】
病理学は、疾患の研究を指す。より具体的に、病理学は、疾患を診断するために使用される試験および分析を実施することを指す。例えば、組織サンプルが、病理医(例えば、いずれかの異常が存在するかどうかを決定するために組織サンプルを分析することの専門家である医師)によって顕微鏡下で視認されるようにスライド上に配置され得る。すなわち、病理学試料が、複数の区分に切断され、染色され、病理医が検査し、診断を下すためのスライドとして調製され得る。スライド上の診断所見が不確かであるとき、病理医は、組織からより多くの情報を集めるために、追加の切断レベル、染色、または他の試験を指示し得る。技師が、次いで、病理医が診断を行うことにおいて使用するための追加の情報を含み得る新しいスライドを作成し得る。追加のスライドを作成するこのプロセスは、それが、組織のブロックを回収し、新しいスライドを作成するためにそれを切断し、次いで、スライドを染色することを伴い得るのみならず、それが、複数の指示に関してバッチ処理され得るので、時間がかかり得る。これは、病理医が下す最終診断を著しく遅延させ得る。加えて、遅延後であっても、新しいスライドが、診断を下すために十分な情報を有するであろういかなる保証も、依然として、存在しないこともある。
【0029】
病理医は、癌および他の疾患病理学スライドを単独で評価し得る。統合されたワークフローは、癌および他の疾患の診断を改良し得る。ワークフローは、例えば、スライド評価、タスク、画像分析および癌検出人工知能(AI)、注釈、協議、および推奨を1つのワークステーションにおいて統合し得る。特に、例示的ユーザインターフェースが、病理医の作業を促進および改良するために、ワークフローのみならず、ワークフローに統合され得るAIツールにおいても利用可能であり得る。
【0030】
例えば、コンピュータが、組織サンプルの画像を分析することによって、特定の組織サンプルについて追加の情報が必要とされ得るかどうかを迅速に識別するために、および/または病理医がより近接して見るべきであるエリアを病理医に強調するために、使用され得る。したがって、追加の染色されたスライドおよび試験を取得するプロセスは、病理医によって精査される前に自動的に行われ得る。自動的スライド分割機械および染色機械と対にされると、これは、完全に自動化されたスライド調製パイプラインを提供し得る。
【0031】
病理医を補助するためにコンピュータを使用するプロセスは、計算病理学として公知である。計算病理学のために使用される計算方法は、限定ではないが、統計分析、自律的または機械学習、およびAIを含み得る。AIは、限定ではないが、深層学習、ニューラルネットワーク、分類、クラスタリング、および回帰アルゴリズムを含み得る。計算病理学を使用することによって、命が、病理医が自身の診断正確度、信頼性、効率、およびアクセス性を改良することに役立つことによって救われ得る。例えば、計算病理学は、癌に関して疑わしいスライドの検出を支援し、それによって、病理医が、最終診断を下す前に自身の初期査定をチェックおよび確認することを可能にするために使用され得る。
【0032】
組織病理学は、スライド上に配置された試料の研究を指す。例えば、デジタル病理学画像が、試料(例えば、塗抹標本)を含む顕微鏡スライドのデジタル化画像から成り得る。病理医がスライド上の画像を分析するために使用し得る一方法は、核を識別し、核が正常(例えば、良性)であるか、異常(例えば、悪性)であるかを分類することである。核を識別および分類することにおいて病理医を支援するために、組織学的染色が、細胞を可視にするために使用され得る。周期的酸シッフ反応、マッソントリクローム、ニッスルおよびメチレンブルー、およびヘマトキシリンおよびエオジン(H&E)を含む多くの染料ベースの染色システムが、開発されている。医療診断に関して、H&Eは、広く使用される染料ベースの方法であり、ヘマトキシリンが、細胞核を青色に染色し、エオジンが、細胞質および細胞外マトリクスをピンク色に染色し、他の組織領域は、これらの色の変形を帯びる。しかしながら、多くの場合、H&E染色された組織学的調製物は、診断を支援する、または治療を誘導し得るバイオマーカを病理医が視覚的に識別するために十分な情報を提供しない。この状況では、免疫組織化学(IHC)、免疫蛍光、インサイツハイブリダイゼーション(ISH)、または蛍光インサイツハイブリダイゼーション(FISH)等の技法が、使用され得る。IHCおよび免疫蛍光は、例えば、組織内の特定の抗原に結合する抗体を使用し、特定の着目タンパク質を発現する細胞の視覚的検出を可能にすることを伴い、それは、H&E染色されたスライドの分析に基づいて、訓練された病理医に確実に識別可能ではないバイオマーカを明らかにすることができる。ISHおよびFISHは、採用されるプローブのタイプ(例えば、遺伝子コピー数のためのDNAプローブおよびRNA発現の査定のためのRNAプローブ)に応じて、遺伝子のコピー数または特定のRNA分子の存在量を査定するために採用され得る。これらの方法も、いくつかのバイオマーカを検出するために十分な情報を提供することができない場合、組織の遺伝子試験が、バイオマーカが存在するかどうか(例えば、腫瘍における特定のタンパク質または遺伝子産物の過剰発現、癌における所与の遺伝子の増幅)を確認するために使用され得る。
【0033】
デジタル化画像が、染色された顕微鏡スライドを示すために調製され得、それは、病理医がスライド上の画像を手動で視認し、画像内の染色された異常細胞の数を推定することを可能にし得る。しかしながら、このプロセスは、時間がかかり得、いくつかの異常が検出しにくいので、異常を識別することにおいてエラーにつながり得る。計算プロセスおよびデバイスが、そうでなければ検出しにくくあり得る異常を検出することにおいて病理医を支援するために使用され得る。例えば、AIが、H&Eおよび他の染料ベースの方法を使用して染色された組織のデジタル画像内の突起領域からバイオマーカ(タンパク質および/または遺伝子産物の過剰発現、特定の遺伝子の増幅または突然変異等)を予測するために使用され得る。組織の画像は、スライド全体画像(WSI)、マイクロアレイまたは組織区分内の選択された着目エリア内の組織コアの画像であり得る。H&Eのような染色方法を使用すると、これらのバイオマーカは、人間が追加の試験の支援を伴わずに視覚的に検出または定量化することが困難であり得る。組織のデジタル画像からこれらのバイオマーカを推論するためにAIを使用することは、患者処理を改良する潜在性を有する一方、より速くもあり、あまり高価でもない。
【0034】
検出されたバイオマーカまたは画像のみが、次いで、患者を治療するために使用されるべき特定の癌薬物または薬物組み合わせ療法を推奨するために使用され得、AIは、検出されたバイオマーカを治療選択肢のデータベースと互いに関係付けることによって、成功する可能性が低い薬物または薬物組み合わせを識別し得る。これは、患者の特定の癌を標的とするための免疫療法薬物の自動的推奨を促進するために使用されることができる。さらに、それは、患者の特定の一部および/またはより稀少な癌タイプに関する個人化された癌治療を可能にするために使用され得る。
【0035】
病理学の分野では、組織病理学ワークフロー全体を通して、病理学試料調製に関する系統的品質制御(「QC」)および診断の品質に関する品質保証(「QA」)を提供することは、困難であり得る。系統的品質保証は、それが2人の病理医による重複する労力を要求し得るので、それが、リソースおよび時間集約的であるので、困難である。品質保証のためのいくつかの方法は、(1)最初の診断癌症例の第2の精査、(2)品質保証委員会による一致しない、または変更された診断の周期的精査、および/または、(3)症例の一部のランダムな精査を含む。これらは、非網羅的であり、大部分がレトロスペクティブであり、手動である。自動化された系統的QCおよびQA機構では、品質が、全ての症例に関してワークフロー全体を通して確実にされることができる。実験室品質制御およびデジタル病理学品質制御は、患者試料の正常な取り込み、プロセス、診断、およびアーカイブに対して重要である。QCおよびQAに対する手動およびサンプリングアプローチは、実質的な利益をもたらす。系統的QCおよびQAは、効率を提供し、診断品質を改良する潜在性を有する。
【0036】
上で説明されるように、本明細書に説明される例示的実施形態は、統合されたプラットフォームを提供し、統合されたプラットフォームは、実験室情報システム(LIS)と一体化しながら、ウェブブラウザまたは他のユーザインターフェースを介して、デジタル病理学画像のデータ取り入れ、処理、および閲覧を含む完全に自動化されたプロセスを可能にする。さらに、臨床情報が、患者データのクラウドベースのデータ分析を使用して、集約され得る。データは、病院、診療所、現場の研究者等からのものであり得、複数の地理的特異性レベルにおいて健康パターンのリアルタイム監視および予想を行うために、機械学習、コンピュータビジョン、自然言語処理、および/または統計的アルゴリズムによって分析され得る。
【0037】
これまで、病理学スライドの生成または分析を優先順位付けするいかなる方法も、存在していなかった。故に、本明細書に説明される例示的実施形態は、デジタル化病理学画像ベースの診断を合理化および高速化するために、スライド調製、処理、および精査を自動的に優先順位付けする。
【0038】
この自動化は、少なくとも、(1)病理医がスライドを診断を行うために不十分であると決定することによって浪費される時間量を最小化すること、(2)追加の試験が指示されるときとそれらが生成されるときとの間の追加の時間を回避することによって、試料入手から診断までの時間(例えば、平均合計時間)を最小化すること、(3)より大量のスライドが、より短い時間量において病理医によって処理または精査されることを可能にすること、(4)病理医に対して追加の試験を要求する負荷を低減させることによってより情報に基づく/精密な診断に寄与すること、(5)デジタル病理学画像の(例えば、試料タイプに関連する)正しい特性を識別または検証すること、および/または、(6)病理医を訓練すること等の利益を有する。本開示は、デジタル化病理学スライドを伴う臨床デジタルワークフローに対して全ての病理学症例の自動化された検出、優先順位付け、およびトリアージを使用し、それによって、病理学スライド分析が、病理医による診断精査の前に優先順位付けされ得る。例えば、開示される実施形態は、症例レベル優先順位付けを提供し、各症例内で重要な所見を伴うスライドを優先順位付けし得る。これらの優先順位付け実施形態は、種々の設定(例えば、学術、商業的実験室、病院等)において病理学スライドのデジタル精査をより効率的にし得る。
【0039】
開示される実施形態の例示的全体的出力は、画像またはスライド全体についての情報またはスライドパラメータ、例えば、描写される試料タイプ、スライドの試料の切片の全体的品質、ガラス病理学スライド自体の全体的品質、または組織形態特性を含み得る。例示的ローカル出力は、画像またはスライドの特定の領域内の情報を示し得、例えば、特定のスライド領域が、ぼけている、または関連しない試料を含むと標識化され得る。本開示は、下記にさらに詳細に説明されるように、スライド調製、処理、および精査のための開示される自動的優先順位付けプロセスを開発することおよび使用することの両方に関する実施形態を含む。
【0040】
図1Aは、本開示の例示的実施形態による、機械学習を使用して組織試料のスライドの画像を調製、処理、および精査するための自動的優先順位付けプロセスを提供するためのシステムおよびネットワークのブロック図である。
【0041】
具体的に、
図1Aは、病院、実験室、および/または医師のオフィス等におけるサーバに接続され得る電子ネットワーク120を図示する。例えば、医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125等が、各々、1つ以上のコンピュータ、サーバ、および/またはハンドヘルドモバイルデバイスを通して、インターネット等の電子ネットワーク120に接続され得る。本願の例示的実施形態によると、電子ネットワーク120は、サーバシステム110にも接続され得、サーバシステム110は、疾患検出プラットフォーム100を実装するように構成される処理デバイスを含み得、疾患検出プラットフォーム100は、本開示の例示的実施形態による組織試料のスライドの画像を調製、処理、および精査するための自動的優先順位付けプロセスを提供するためのスライド優先順位付けツール101を含む。
【0042】
医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125は、1つ以上の患者の細胞学試料、組織病理学試料、細胞学試料のスライド、組織病理学試料のスライドのデジタル化画像、またはそれらの任意の組み合わせの画像を作成すまたは別様に取得し得る。医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125は、年齢、病歴、癌治療歴、家族歴、過去の生検または細胞学情報等の患者特有情報の任意の組み合わせも取得し得る。医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125は、デジタル化スライド画像および/または患者特有情報を電子ネットワーク120を経由してサーバシステム110に伝送し得る。サーバシステム110は、医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム(LIS)125のうちの少なくとも1つから受信された画像およびデータを記憶するための1つ以上の記憶デバイス109を含み得る。サーバシステム110は、記憶デバイス109内に記憶された画像およびデータを処理するための処理デバイスも含み得る。サーバシステム110は、1つ以上の機械学習ツールまたは能力をさらに含み得る。例えば、処理デバイスは、一実施形態による疾患検出プラットフォーム100のための機械学習ツールを含み得る。代替として、または加えて、本開示(または本開示のシステムおよび方法の一部)は、ローカル処理デバイス(例えば、ラップトップ)上で実施され得る。
【0043】
医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/またはLIS125は、スライドの画像を精査するために病理医によって使用されるシステムを指す。病院設定では、組織タイプ情報は、LIS125内に記憶され得る。本開示の例示的実施形態によると、スライドは、LIS125にアクセスすることを必要とすることなく、自動的に優先順位付けされ得る。例えば、第三者が、LIS内に記憶された対応する試料タイプ標識を伴わない画像コンテンツへの匿名アクセスを与えられ得る。加えて、LISコンテンツへのアクセスは、その機密性コンテンツに起因して、限定され得る。
【0044】
図1Bは、機械学習を使用して、組織試料のスライドの画像を調製、処理、および精査するための自動的優先順位付けプロセスを提供するための疾患検出プラットフォーム100の例示的ブロック図を図示する。
【0045】
具体的に、
図1Bは、一実施形態による、疾患検出プラットフォーム100のコンポーネントを描写する。例えば、疾患検出プラットフォーム100は、スライド優先順位付けツール101と、データ取り入れツール102と、スライド取り込みツール103と、スライド走査装置104と、スライドマネージャ105と、記憶装置106と、閲覧アプリケーションツール108とを含み得る。
【0046】
スライド優先順位付けツール101は、下記に説明されるように、例示的実施形態による、組織試料のスライドの画像を調製、処理、および精査するための自動的優先順位付けプロセスを提供するためのプロセスおよびシステムを指す。
【0047】
データ取り入れツール102は、例示的実施形態による、デジタル病理学画像を分類および処理するために使用される種々のツール、モジュール、コンポーネント、およびデバイスへのデジタル病理学画像の転送を促進するためのプロセスおよびシステムを指す。
【0048】
スライド取り込みツール103は、例示的実施形態による、病理学画像を走査し、それらをデジタル形態に変換するためのプロセスおよびシステムを指す。スライドは、スライド走査装置104を用いて走査され得、スライドマネージャ105は、スライド上の画像をデジタル化病理学画像に処理し、デジタル化画像を記憶装置106内に記憶し得る。
【0049】
閲覧アプリケーションツール108は、例示的実施形態による、デジタル病理学画像に関連する試料特性または画像特性情報をユーザ(例えば、病理医)に提供するためのプロセスおよびシステムを指す。情報は、種々の出力インターフェース(例えば、画面、モニタ、記憶デバイス、および/またはウェブブラウザ等)を通して提供され得る。
【0050】
スライド優先順位付けツール101およびそのコンポーネントの各々は、ネットワーク120を経由して、サーバシステム110、医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125に、および、それらから、デジタル化スライド画像および/または患者情報を伝送および/または受信し得る。さらに、サーバシステム110は、スライド優先順位付けツール101、データ取り入れツール102、スライド取り込みツール103、スライド走査装置104、スライドマネージャ105、および閲覧アプリケーションツール108のうちの少なくとも1つから受信された画像およびデータを記憶するための記憶デバイスを含み得る。サーバシステム110は、記憶デバイス内に記憶された画像およびデータを処理するための処理デバイスも含み得る。サーバシステム110は、例えば、処理デバイスに起因する1つ以上の機械学習ツールまたは能力をさらに含み得る。代替として、または加えて、本開示(または本開示のシステムおよび方法の一部)は、ローカル処理デバイス(例えば、ラップトップ)上で実施され得る。
【0051】
上記のデバイス、ツール、およびモジュールのうちのいずれかは、1つ以上のコンピュータ、サーバ、および/またはハンドヘルドモバイルデバイスを通して、インターネットまたはクラウドサービスプロバイダ等の電子ネットワーク120に接続され得るデバイス上に位置し得る。
【0052】
図1Cは、本開示の例示的実施形態による、スライド優先順位付けツール101の例示的ブロック図を図示する。スライド優先順位付けツール101は、訓練画像プラットフォーム131および/または標的画像プラットフォーム135を含み得る。
【0053】
訓練画像プラットフォーム131は、訓練画像取り込みモジュール132、標識処理モジュール133、および/または優先順位付けランクモジュール134を含み得る。
【0054】
訓練画像プラットフォーム131は、デジタル病理学画像を効果的に分析および分類するために、機械学習モデルおよび/またはシステムを訓練するために使用される訓練画像を作成または受信し得る。例えば、訓練画像は、サーバシステム110、医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125のうちのいずれか1つまたは任意の組み合わせから受信され得る。訓練のために使用される画像は、現実ソース(例えば、ヒト、動物等)からのものであり得るか、または、合成ソース(例えば、グラフィックスレンダリングエンジン、3Dモデル等)からのものであり得る。デジタル病理学画像の例は、(a)(限定ではないが)H&E、ヘマトキシリンのみ、IHC、分子病理学等の種々の染色を用いて染色されたデジタル化スライド、および/または、(b)マイクロCT等の3D撮像デバイスからのデジタル化組織サンプルを含み得る。
【0055】
訓練画像取り込みモジュール132は、ヒト組織の画像および/またはグラフィカルにレンダリングされた画像に対応する1つ以上の訓練画像を備えているデータセットを作成または受信し得る。例えば、訓練画像は、サーバシステム110、医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125のうちのいずれか1つまたは任意の組み合わせから受信され得る。このデータセットは、デジタル記憶デバイス上に保たれ得る。標識処理モジュール133は、各訓練画像に関して、スライド形態、診断値、病理医精査結果、および/または分析難度のうちの少なくとも1つを特徴付ける標識を決定し得る。優先順位付けランクモジュール134は、組織の画像を処理し、各訓練画像に関する予測される優先順位付けランクを決定し得る。
【0056】
一実施形態によると、標的画像プラットフォーム135は、標的画像取り込みモジュール136と、優先順位付け値モジュール137と、出力インターフェース138とを含み得る。標的画像プラットフォーム135は、標的画像を受信し、機械学習モデルを標的画像に適用し、標的画像に関する優先順位付け値を計算し得る。例えば、標的画像は、サーバシステム110、医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125のうちのいずれか1つまたは任意の組み合わせから受信され得る。標的画像取り込みモジュール136は、標的試料に対応する標的画像を受信し得る。優先順位付け値モジュール137は、機械学習モデルを標的画像に適用し、標的画像に関する優先順位付け値を計算し得る。
【0057】
出力インターフェース138は、標的画像および標的試料についての情報を(例えば、画面、モニタ、記憶デバイス、ウェブブラウザ等に)出力するために使用され得る。
【0058】
図1Dは、デジタル病理学ワークフローにおいてスライドを優先順位付けするための例示的システムおよびワークフローの概略図を描写する。このワークフローでは、機械学習モデル142が、入力としてデジタル化症例およびスライド140を受信し得る。デジタル化症例およびスライド140は、患者の病理学スライドの画像および/または患者特性、治療歴、患者コンテキスト、スライドデータ等に関する電子データから成り得る。患者特性は、患者の年齢、身長、体重、家族病歴、アレルギー等を含み得る。治療歴は、患者に対して実施された試験、患者に対して実施された過去の手技、患者の放射線暴露等を含み得る。症例コンテキストは、症例/スライドが臨床研究、実験的治療、フォローアップ報告等の一部であるかどうかを指し得る。スライドデータは、実施された染色、組織スライスの場所、スライドが作製された時間/日付、スライドを作製した実験室等を含み得る。
【0059】
機械学習モデル142は、デジタル化症例およびスライド140を使用して訓練され得る。訓練された機械学習モデル142は、1つ以上の優先順位付け値予測144を出力し得る。例えば、訓練された機械学習モデル142は、選択されたデジタル化症例/スライドに関する優先順位付け値144を発生させ得る。選択されたデジタル化症例/スライドは、入力されたデジタル化症例およびスライド140内に含まれない新しいまたは追加の症例/スライドであり得る。代替として、機械学習モデル142は、デジタル化症例およびスライド140の一部であった選択されたデジタル化症例/スライドに関する優先順位付け値を出力するためにも使用され得る。
【0060】
優先順位付け順序146が、発生させられた優先順位付け値144に基づいて発生させられ得る。例えば、優先順位付け値144は、症例/スライドの組における各症例/スライドに関して、機械学習モデル142によって出力され得る。優先順位付け順序146は、次いで、病理医が精査するための症例の一覧表または処理予定表から成り得、症例は、各症例の優先順位付け値144に基づく順序でリストアップされる。症例の本優先順位付けは、病理医が、自身の症例をトリアージし、より高い緊急性または優先順位の症例を最初に精査することを可能にし得る。ある場合、優先順位付け順序146は、病理医の精査に先立って、調節され得る。例えば、症例の優先順位付け値144は、症例がある時間量を過ぎて待ち行列内にあった場合、または、追加の情報がその症例について受信された場合、増加し得る。
図1Dの方法は、下記にさらに詳細に説明される。
【0061】
図2は、本開示の例示的実施形態による、試料に対応するスライドの画像を処理し、スライドの処理を自動的に優先順位付けするためのツールの例示的方法を図示するフローチャートである。例えば、例示的方法200(例えば、ステップ202-206)が、自動的に、またはユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。
【0062】
一実施形態によると、スライドの処理を自動的に優先順位付けする例示的方法200は、以下のステップのうちの1つ以上を含み得る。ステップ202において、方法は、標的試料に対応するスライドの標的画像を受信することを含み、標的試料は、患者の組織サンプルを備え得る。例えば、標的画像は、サーバシステム110、医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125のうちのいずれか1つまたは任意の組み合わせから受信され得る。
【0063】
ステップ204において、方法は、機械学習モデルを使用して、標的画像の優先順位付け値を計算することを含み、機械学習モデルは、複数の訓練画像を処理することによって発生させられており、各訓練画像は、ヒト組織の画像と、スライド形態、診断値、病理医精査結果、および/または分析難度のうちの少なくとも1つを特徴付ける標識とを備え得る。標識は、さらなる調製が標的電子画像に関して実施される可能性に対応する調製値を含み得る。さらなる調製は、試料再切断、免疫組織化学染色、追加の診断試験、追加の協議、および/または特殊な染色のうちの少なくとも1つに基づいて、標的画像に関して実施され得る。標識は、標的画像の診断特徴を含み、診断特徴は、癌の存在、癌の悪性度、治療効果、前癌病変、および/または感染性生物の存在のうちの少なくとも1つを備え得る。標的画像の優先順位付け値は、第1のユーザに関する標的画像の第1の優先順位付け値と、第2のユーザに関する標的画像の第2の優先順位付け値とを含み得、第1の優先順位付け値は、第1のユーザの選好に基づいて決定され得、第2の優先順位付け値は、第2のユーザの選好に基づいて決定され得る。標識は、走査線、欠落した組織、および/またはぼけのうちの少なくとも1つに対応するアーチファクト標識を含み得る。
【0064】
訓練画像は、サーバシステム110、医師サーバ121、病院サーバ122、臨床治験サーバ123、研究実験室サーバ124、および/または実験室情報システム125のうちのいずれか1つまたは任意の組み合わせから受信され得る。このデータセットは、デジタル記憶デバイス上に保たれ得る。訓練のために使用される画像は、現実ソース(例えば、ヒト、動物等)からのものであり得るか、または、合成ソース(例えば、グラフィックスレンダリングエンジン、3Dモデル等)からのものであり得る。デジタル病理学画像の例は、(a)(限定ではないが)H&E、ヘマトキシリンのみ、IHC、分子病理学等の種々の染色を用いて染色されたデジタル化スライド、および/または、(b)マイクロCT等の3D撮像デバイスからのデジタル化組織サンプルを含み得る。
【0065】
ステップ206において、方法は、デジタル化病理学画像の一続きを出力することを含み得、一続きにおける標的電子画像の配置は、標的電子画像の優先順位付け値に基づく。
【0066】
機械学習アルゴリズムおよび/またはアーキテクチャを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM(サポートベクターマシン)、MLP(多層パーセプトロン))、および/または次元削減技法(例えば、PCA(主成分分析)、LDA(線形判別分析)等)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施され得る。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0067】
1つ以上の実施形態によると、上記のアルゴリズム、アーキテクチャ、方法論、属性、および/または特徴のうちのいずれかが、他のアルゴリズム、アーキテクチャ、方法論、属性、および/または特徴のうちのいずれかまたは全てと組み合わせられ得る。例えば、機械学習アルゴリズムおよび/またはアーキテクチャ(例えば、ニューラルネットワーク方法、畳み込みニューラルネットワーク(CNN)、回帰型ニューラルネットワーク(RNN)等)のうちのいずれかは、訓練方法論(例えば、複数インスタンス学習、強化学習、能動学習等)のうちのいずれかを用いて訓練され得る。
【0068】
下記の用語の説明は、単に、例示的であり、いかようにも用語を限定することを意図していない。
【0069】
標識は、アルゴリズムが予測しようと試みている機械学習アルゴリズムへの入力についての情報を指し得る。
【0070】
サイズN×Mの所与の画像に関して、セグメンテーションは、元の画像における各ピクセルに関して、そのピクセルのクラスまたはタイプを記述する番号を割り当てるサイズN×Mの別の画像であり得る。例えば、WSIにおいて、マスクにおける要素は、例えば、背景、組織、および/または未知のクラスに属するものとして入力画像内の各ピクセルを分類し得る。
【0071】
スライドレベル情報は、一般に、スライドについての情報を指すが、必ずしも、スライド内のその情報の具体的場所を指すわけではないこともある。
【0072】
ヒューリスティックは、入力を前提として、出力を決定論的に生成する論理ルールまたは関数を指し得る。例えば、あるスライドが別のスライドより優先されるべきであるという予測が、32%以上の場合、1を出力し、該当しない場合、0を出力する。
【0073】
埋め込みは、低次元データの概念的高次元数値表現を指し得る。例えば、WSIが、組織タイプを分類するためにCNN訓練に通される場合、ネットワークの最後の層上の数字は、スライドについての情報(例えば、組織のタイプについての情報)を含む数字のアレイ(例えば、数千のオーダー)を提供し得る。
【0074】
スライドレベル予測は、全体としてのスライドについての具体的予測を指し得る。例えば、スライドレベル予測は、スライドが別のスライドより優先されるべきであることであり得る。さらに、スライドレベル予測は、定義されたクラスの組に対する個々の確率予測を指し得る。
【0075】
分類器は、入力データをとり、それをカテゴリに関連付けるように訓練されたモデルを指し得る。
【0076】
1つ以上の実施形態によると、機械学習モデルは、異なる方法で訓練され得る。例えば、機械学習モデルの訓練は、教師あり訓練、半教師あり訓練、教師なし訓練分類器訓練、混合訓練、および/または不確実性推定のうちのいずれか1つまたは任意の組み合わせによって実施され得る。使用される訓練のタイプは、データの量、データのタイプ、および/またはデータの品質に依存し得る。下記の表1は、いくつかのタイプの訓練および対応する特徴の非限定的リストを説明する。
【表1】
【0077】
教師あり訓練は、機械学習モデルに関するシードを提供するための少量のデータとともに使用され得る。教師あり訓練では、機械学習モデルは、特定のアイテム(例えば、気泡、組織ひだ等)を探し、スライドをフラグ付けし、特定のアイテムがスライド内に存在する量を定量化し得る。
【0078】
一実施形態によると、例示的完全教師あり訓練は、入力としてWSIをとり得、セグメンテーションの標識を含み得る。完全教師あり訓練に関するパイプラインは、(1)1;(2)1,ヒューリスティック;(3)1,4,ヒューリスティック;(4)1,4,5,ヒューリスティック;および/または、(5)1,5,ヒューリスティックを含み得る。完全教師あり訓練の利点は、(1)それがより少ないスライドを要求し得ること、および/または、(2)出力が解説可能であること((a)診断に寄与した画像のエリアが把握され得、(b)あるスライドが別のものより優先される理由(例えば、診断値、分析難度等)が把握され得るので)であり得る。完全教師あり訓練を使用する不利点は、それが、入手することが困難であり得る大量のセグメンテーションを要求し得ることであり得る。
【0079】
一実施形態によると、例示的半教師あり(例えば、弱教師あり)学習が、入力としてWSIをとり得、スライドレベル情報の標識を含み得る。半教師あり訓練に関するパイプラインは、(1)2;(2)2,ヒューリスティック;(3)2,4,ヒューリスティック;(4)2,4,5,ヒューリスティック;および/または、(5)2,5,ヒューリスティックを含み得る。半教師あり訓練を使用する利点は、(1)要求される標識のタイプが、多くの病院記録に存在し得ること、および、(2)出力が解説可能であること((a)診断に最も寄与した画像の面積が把握され得、(b)あるスライドが別のものより優先された理由(例えば、診断値、分析難度等)が把握され得るので)であり得る。半教師あり訓練を使用する不利点は、それが訓練しにくくあり得ることである。例えば、モデルは、決定につながるはずである情報が存在するスライド内の場所についての限定された情報が、存在するという事実を考慮するために、複数インスタンス学習、能動学習、および/または分散訓練等の訓練スキームを使用する必要があり得る。
【0080】
一実施形態によると、例示的教師なし訓練は、入力としてWSIをとり得、いかなる標識も要求しないこともある。教師なし訓練に関するパイプラインは、(1)3,4;および/または、(2)3,4,ヒューリスティックを含み得る。教師なし訓練の利点は、それがいかなる標識も要求しないことであり得る。教師なし訓練を使用する不利点は、(1)これが訓練しにくくあり得ることであり得る。例えば、それは、決定につながるはずである情報が存在するスライド内の場所についての限定された情報が、存在する、(2)それが、追加のスライドを要求し得る、および/または、(3)それが、予測が行われた理由を解説することなく、その予測および確率を出力し得るので、それが、あまり解説可能ではないこともあるという事実を考慮するために、複数インスタンス学習、能動学習、および/または分散訓練等の訓練スキームを使用する必要があり得る。
【0081】
一実施形態によると、例示的混合訓練は、完全教師あり訓練、半教師あり訓練、および/または教師なし訓練に関して上で説明される例示的パイプラインのうちのいずれかを訓練することを含み、次いで、結果として生じるモデルを、訓練方法のうちのいずれかに関する初期点として使用し得る。混合訓練の利点は、(1)それがより少ないデータを要求し得ること、(2)それが改良された性能を有し得ること、および/または、(3)それが異なるレベルの標識(例えば、セグメンテーション、スライドレベル情報、情報なし)の混合を可能にし得ることであり得る。混合訓練の不利点は、(1)それがより複雑であること、および/または訓練することが高価であり得ること、および/または、(2)それが、潜在的バグの数および複雑性を増加させ得るより多くのコードを要求し得ることであり得る。
【0082】
一実施形態によると、例示的不確実性推定は、パイプラインの末端において不確実性推定を使用して、スライドデータに関連する任意のタスクに関して、完全教師あり訓練、半教師あり訓練、および/または教師なし訓練に関して上で説明される例示的パイプラインのうちのいずれかを訓練すること含み得る。さらに、ヒューリスティックまたは分類器が、試験の予測における不確実性の量に基づいて、あるスライドが別のものより優先されるべきであるかどうかを予測するために使用され得る。不確定性推定の利点は、それが分布外データに対してロバストであることであり得る。例えば、見慣れないデータが、提示されるとき、それは、依然として、それが不確実であることを正しく予測し得る。不確定性推定の不利点は、(1)それがより多くのデータを必要とし得ること、(2)それが不良な全体的性能を有し得ること、および/または、(3)モデルが必ずしもスライドまたはスライド埋め込みが異常である程度を識別しないこともあるので、それがあまり解説可能ではないこともあることであり得る。
【0083】
一実施形態によると、アンサンブル訓練は、上で説明される例示的パイプラインのうちのいずれかによって生成されるモデルを同時に実行することと、ヒューリスティックまたは分類器による出力を組み合わせ、ロバストかつ正確な結果を生成することとを含み得る。アンサンブル訓練の利点は、(1)それが分布外データに対してロバストであること、および/または、(2)それが他のモデルの利点および不利点を組み合わせ、不利点の最小化をもたらし得ること(例えば、不確定性推定モデルと組み合わせられる教師あり訓練モデル、および着信データが分布内にあるときに教師ありモデルを使用し、データが分布外にあるときに不確実性モデルを使用するヒューリスティック等)であり得る。アンサンブル訓練の不利点は、(1)それがより複雑であり得ること、および/または、(2)それが訓練および実行することが高価であり得ることであり得る。
【0084】
本明細書に議論される訓練技法は、段階的にも進み得、より多くの注釈を伴う画像(それらは、より少ない注釈を有するスライドを使用するより効果的な後の訓練を可能にし得る)が、訓練のために最初に使用され、あまり監督されない、等。
【0085】
訓練は、使用され得る全ての訓練スライド画像に対して、最も徹底的に注釈を付けられたスライドを使用して開始され得る。例えば、訓練は、教師あり学習を使用して開始され得る。スライド画像の第1の組が、関連付けられた注釈とともに、受信または決定され得る。各スライドは、マーキングおよび/またはマスクされた領域を有し得、スライドが別のものより優先されるべきかどうか等の情報を含み得る。スライドの第1の組は、スライドの第1の組とそれらの関連付けられた注釈との間の相関を決定し得る訓練アルゴリズム、例えば、CNNに提供され得る。
【0086】
画像の第1の組を用いた訓練が、完了された後、第1の組より少ない注釈を有する、例えば、部分的注釈を伴うスライド画像の第2の組が、受信または決定され得る。一実施形態では、注釈は、スライドが診断またはこれに関連付けられた品質問題点を有することを示すのみであり得、見出され得る疾患の内容または場所等を規定しないこともある。スライド画像の第2の組は、第1のものと異なる訓練アルゴリズム、例えば、複数インスタンス学習を使用して訓練され得る。訓練データの第1の組は、システムを部分的に訓練するために使用され得、第2の訓練ラウンドを正確なアルゴリズムを生成することにおいてより効果的にし得る。
【0087】
このように、訓練は、訓練スライド画像の品質およびタイプに基づいて、任意の数のアルゴリズムを使用して、任意の数の段階において進み得る。これらの技法は、様々な品質、注釈レベル、および/または注釈タイプであり得る画像の複数の訓練組が受信される状況において利用され得る。
【0088】
図3は、複数の病理学スライドを分析する順序を決定する例示的方法を図示する。例えば、例示的方法300および320(例えば、ステップ301-325)は、自動的に、またはユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。
【0089】
一実施形態によると、複数の病理学スライドを分析する順序を決定する例示的方法300は、下記のステップのうちの1つ以上を含み得る。ステップ301において、方法は、癌サブタイプおよび組織試料(例えば、組織学、細胞学、血液学、マイクロCT等)にわたる1つ以上のデジタル化病理学画像のデータセットを作成することを含み得る。ステップ303において、方法は、データセットの各病理学画像に関する1つ以上の標識(例えば、スライド形態、診断、結果、難度等)を受信または決定することを含み得る。ステップ305において、方法は、デジタル記憶デバイス(例えば、ハードドライブ、ネットワークドライブ、クラウド記憶装置、RAM等)内に各画像およびその対応する標識を記憶することを含み得る。
【0090】
ステップ307において、方法は、入力として病理学試料の1つ以上のデジタル画像をとり、各デジタル画像に関する優先順位付けランクを予測するための計算病理学ベースの機械学習アルゴリズムを訓練することを含み得る。機械学習アルゴリズムを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM、MLP)、および/または次元削減技法(例えば、PCA、LDA)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施される傾向がある。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0091】
図2(例えば、表1および対応する説明)に関する機械学習アルゴリズムの上記説明は、
図3の機械学習アルゴリズムにも適用され得る。
【0092】
スライド優先順位付けツールを使用する例示的方法320は、下記のステップのうちの1つ以上を含み得る。ステップ321において、方法は、ユーザに対応するデジタル病理学画像を受信することを含み得る。ステップ323において、方法は、受信されたデジタル病理学画像に関連付けられたスライドおよび/または症例に関するランク順序または統計値を決定することを含み得る。ランク順序または統計値は、訓練された計算病理学機械学習アルゴリズム(例えば、方法300のもの)を受信された画像に適用することによって決定され得る。ランク順序または統計値は、受信された画像に関連付けられたスライドまたは受信された画像に関連付けられた症例に関する精査または追加のスライド調製を優先順位付けするために使用され得る。
【0093】
ステップ325において、方法は、ランク順序または統計値を出力することを含み得る。1つの出力は、選好、ヒューリスティック、統計、ユーザの目的(例えば、効率、難度、緊急性等)に基づく順序における1つ以上の変化の決定および/または表示を含み得る。代替として、または加えて、出力は、発生させられた順序に基づく症例レベルにおける受信された画像の視覚的ソートを含み得る。例えば、そのような視覚的ソートは、標的特徴に関する最大または最小スライド確率に基づいて、標的特徴に関する全てのスライドにわたる平均確率に基づいて、標的特徴を示すスライドの未加工の数に基づいて順序付けられる症例のソート等を備えている表示を含み得る。なお別の出力は、発生させられた順序に基づく各症例内のスライドレベルまたは組織ブロックレベルにおけるソートの可視化を含み得る。視覚的ソートは、ユーザによって、および/または計算的に実施され得る。
【0094】
上で説明されるスライド優先順位付けツールは、研究および/または生産/臨床/産業設定において使用可能な特定の用途または実施形態を含み得る。実施形態は、開発および使用の種々の段階において生じ得る。ツールは、下記の実施形態のうちの1つ以上を採用し得る。
【0095】
一実施形態によると、優先順位付けは、品質制御に基づき得る。品質制御問題点は、診断を下す病理医の能力に影響を及ぼし得る。言い換えると、品質制御問題点は、症例に関する検査所要時間を増加させ得る。例えば、不良に調製および走査されたスライドが、品質制御問題点が見出される前、病理医の待ち行列に送信され得る。一実施形態によると、検査所要時間は、それが病理医の待ち行列に到達する前、品質制御問題点を識別することによって短縮され、したがって、病理学診断ワークフローにおいて時間を節約し得る。例えば、本実施形態は、品質制御問題点を伴う症例/スライドを識別およびトリアージし、スライドが病理医に到達する前、問題を実験室および走査装置技師にシグナリングし得る。ワークフローにおけるより早期のこの品質制御捕捉は、効率を改良し得る。
【0096】
図4は、品質制御優先順位付けツールを開発する例示的方法を図示する。例えば、例示的方法400および420(例えば、ステップ401-425)は、自動的に、またはユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。
【0097】
一実施形態によると、品質制御優先順位付けツールを開発する例示的方法400は、下記のステップのうちの1つ以上を含み得る。ステップ401において、方法は、癌サブタイプおよび組織試料(例えば、組織学、細胞学、血液学、マイクロCT等)にわたるデジタル化病理学画像のデータセットを作成することを含み得る。ステップ403において、方法は、データセットの各病理学画像に関する1つ以上の標識(例えば、スライド形態、診断、結果、難度等)を受信または決定することを含み得る。追加の例示的標識は、限定ではないが、走査アーチファクト(例えば、走査線、欠落した組織、ぼけ等)およびスライド調製アーチファクト(例えば、折り畳まれた組織、不良な染色、損傷したスライド、マーキング等)を含み得る。ステップ405において、方法は、デジタル記憶デバイス(例えば、ハードドライブ、ネットワークドライブ、クラウド記憶装置、RAM等)内に各画像およびその対応する標識を記憶することを含み得る。
【0098】
ステップ407において、方法は、入力として病理学試料の1つ以上のデジタル画像をとる計算病理学ベースの機械学習アルゴリズムを訓練し、各デジタル画像に関する優先順位付けランクを予測することを含み得る。機械学習アルゴリズムを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM、MLP)、および/または次元削減技法(例えば、PCA、LDA)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施される傾向がある。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0099】
図2(例えば、表1および対応する説明)に関する機械学習アルゴリズムの上記説明は、
図4の機械学習アルゴリズムにも適用され得る。
【0100】
品質制御優先順位付けツールを使用する例示的方法420は、下記のステップのうちの1つ以上を含み得る。ステップ421において、方法は、ユーザに対応するデジタル病理学画像を受信することを含み得る。ステップ423において、方法は、受信されたデジタル病理学画像に関連付けられたスライドおよび/または症例に関するランク順序または統計値を決定することを含み得る。ランク順序または統計値は、訓練された計算病理学機械学習アルゴリズム(例えば、方法400のもの)を受信された画像に適用することによって決定され得る。ランク順序または統計値は、受信された画像に関連付けられたスライドまたは受信された画像に関連付けられた症例に関する精査または追加のスライド調製を優先順位付けするために使用され得る。
【0101】
ステップ425において、方法は、ランク順序または統計値を出力することを含み得る。1つの出力は、選好、ヒューリスティック、統計、ユーザの目的(例えば、効率、難度、緊急性等)に基づく順序における1つ以上の変化の決定および/または表示を含み得る。代替として、または加えて、出力は、発生させられた順序に基づく症例レベルにおける受信された画像の視覚的ソートを含み得る。例えば、そのような視覚的ソートは、標的特徴に関する最大または最小スライド確率に基づいて、標的特徴に関する全てのスライドにわたる平均確率に基づいて、標的特徴を示すスライドの未加工の数に基づいて順序付けられる症例のソート等を備えている表示を含み得る。別の出力は、発生させられた順序に基づく各症例内のスライドレベルまたは組織ブロックレベルにおけるソートの可視化を含み得る。視覚的ソートは、ユーザによって、および/または計算的に実施され得る。なお別の出力は、具体的品質制御問題点の識別および/または識別された品質制御問題点に対処するためのアラートを含み得る。例えば、品質制御メトリックが、各スライドに関して計算され得る。品質制御メトリックは、品質制御問題点の存在および/または重大度を示し得る。アラートは、特定の人員に伝送され得る。例えば、このステップは、識別された品質制御問題点に関連付けられた人員を識別し、識別された人員のためのアラートを発生させることを含み得る。アラートの別の側面は、品質制御問題点が診断を下すことに影響を及ぼすかどうかを判別するステップを含み得る。いくつかの実施形態では、アラートは、識別された品質制御問題点が、診断を下すことに影響を及ぼす場合にのみ発生またはプロンプトされ得る。例えば、アラートは、品質制御問題点に関連付けられた品質制御メトリックが所定の品質制御メトリック閾値を超える場合にのみ、発生させられ得る。
【0102】
一実施形態によると、優先順位付けが、効率を増加させるように設計され得る。現在、殆どの機関および実験室は、各病理医に関して標準化された検査所要時間期待値を有する。時間は、病理学試料の到達の時点から、一次病理医によるサインアウトまで測定され得る。実践では、病理医は、最終診断を下す前、いくつかの症例に関するより多くの情報に関する追加の染色または再切断を指示し得る。追加の染色または再切断指示は、ある病理学下位専門領域においてより多数であり得る。追加の指示は、検査所要時間を増加させ、したがって、患者に影響を及ぼし得る。本実施形態は、例えば、追加の染色または再切断が、病理医精査に先立って順序付けられ得るように、または、病理医が、そのようなスライドをより早く精査し、追加の染色または再切断をより早く順序付けし得るように、精査のためにこれらのタイプの下位専門領域症例を優先順位付けし得る。そのような優先順位付けは、検査所要時間を短縮し、スライド精査の効率を上げ得る。
【0103】
図5は、効率優先順位付けツールを開発する例示的方法を図示する。例えば、例示的方法500および520(例えば、ステップ501-525)は、自動的に、またはユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。
【0104】
一実施形態によると、効率優先順位付けツールを開発する例示的方法500は、下記のステップのうちの1つ以上を含み得る。ステップ501において、方法は、癌サブタイプおよび組織試料(例えば、組織学、細胞学、血液学、マイクロCT等)にわたるデジタル化病理学画像のデータセットを作成することを含み得る。ステップ503において、方法は、データセットの各病理学画像に関する1つ以上の標識(例えば、スライド形態、診断、結果、難度等)を受信または決定することを含み得る。追加の例示的標識は、限定ではないが、以下のスライド調製標識を含み得る:(1)試料再切断の可能性の高い必要性、(2)免疫組織化学染色の可能性の高い必要性、(3)追加の診断試験(例えば、ゲノム試験)の可能性の高い必要性、(4)セカンドオピニオン(協議)の可能性の高い必要性、および/または、(5)特殊な染色の可能性の高い必要性。
【0105】
ステップ505において、方法は、デジタル記憶デバイス(例えば、ハードドライブ、ネットワークドライブ、クラウド記憶装置、RAM等)内に各画像およびその対応する標識を記憶することを含み得る。ステップ507において、方法は、入力として病理学試料の1つ以上のデジタル画像をとり、次いで、各デジタル画像に関する優先順位付けランクを予測する計算病理学ベースの機械学習アルゴリズムを訓練することを含み得る。機械学習アルゴリズムを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM、MLP)、および/または次元削減技法(例えば、PCA、LDA)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施される傾向がある。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0106】
図2(例えば、表1および対応する説明)に関する機械学習アルゴリズムの上記説明は、
図5の機械学習アルゴリズムにも適用され得る。
【0107】
効率優先順位付けツールを使用する例示的方法520は、下記のステップのうちの1つ以上を含み得る。ステップ521において、方法は、ユーザに対応するデジタル病理学画像を受信することを含み得る。ステップ523において、方法は、受信されたデジタル病理学画像に関連付けられたスライドおよび/または症例に関するランク順序または統計値を決定することを含み得る。ランク順序または統計値は、訓練された計算病理学機械学習アルゴリズム(例えば、方法500のもの)を受信された画像に適用することによって決定され得る。ランク順序または統計値は、受信された画像に関連付けられたスライドまたは受信された画像に関連付けられた症例に関する精査または追加のスライド調製を優先順位付けするために使用され得る。
【0108】
ステップ525において、方法は、ランク順序または統計値を出力することを含み得る。1つの出力は、選好、ヒューリスティック、統計、ユーザの目的(例えば、効率、難度、緊急性等)に基づく順序における1つ以上の変化の決定および/または表示を含み得る。代替として、または加えて、出力は、発生させられた順序に基づく症例レベルにおける受信された画像の視覚的ソートを含み得る。例えば、そのような視覚的ソートは、標的特徴に関する最大または最小スライド確率に基づいて、標的特徴に関する全てのスライドにわたる平均確率に基づいて、標的特徴を示すスライドの未加工の数に基づいて順序付けられる症例のソート等を備えている表示を含み得る。視覚的ソートは、ユーザによって、および/または計算的に実施され得る。別の出力は、発生させられた順序に基づく各症例内のスライドレベルまたはブロックレベルにおけるソートの可視化を含み得る。なお別の出力は、染色または再切断場所推奨を含み得る。なお別の出力は、予測される染色順序、再切断順序、試験、または協議の順序または「前順序」を発生させることを含み得る。
【0109】
一実施形態によると、スライド優先順位付けは、診断特徴に基づき得る。病理医は、様々な経験の年数およびタイプおよびリソースへのアクセスのレベルを有し得る。一般的な病理医は、例えば、多様な診断を伴う幅広い範囲の試料タイプを精査し得る。症例数の増加および新しい病理医の減少とともに、現場の病理医は、多様かつ大量の症例を精査することを強制され得る。以下の実施形態は、症例/スライドをトリアージすることにおいて病理医を支援するための特徴識別を含み得る。特徴識別は、そうでなければ見落とされ得る、または見過ごされ得る画像特徴であるデジタル化病理学スライド/症例画像における画像特徴に関する視覚的支援を含み得る。
【0110】
図6は、診断特徴優先順位付けツールを開発する例示的方法を図示する。例えば、例示的方法600および620(例えば、ステップ601-625)は、自動的に、またはユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。
【0111】
一実施形態によると、診断特徴優先順位付けツールを開発する例示的方法600は、下記のステップのうちの1つ以上を含み得る。ステップ601において、方法は、癌サブタイプおよび組織試料(例えば、組織学、細胞学、血液学、マイクロCT等)にわたるデジタル化病理学画像のデータセットを作成することを含み得る。ステップ603において、方法は、データセットの各病理学画像に関する1つ以上の標識(例えば、スライド形態、診断、結果、難度等)を含み得る。追加の例示的診断特徴標識は、限定ではないが、癌の存在、癌の悪性度、外科手術マージンに近接する癌、治療効果、前癌病変、および感染性生物(例えば、ウイルス、真菌、細菌、寄生虫等)の存在を示唆する特徴を含み得る。ステップ605において、方法は、デジタル記憶デバイス(例えば、ハードドライブ、ネットワークドライブ、クラウド記憶装置、RAM等)内に各画像およびその対応する標識を記憶することを含み得る。
【0112】
ステップ607において、方法は、入力として病理学試料の1つ以上のデジタル画像をとり、次いで、各デジタル画像に関する優先順位付けランクを予測する計算病理学ベースの機械学習アルゴリズムを訓練することを含み得る。機械学習アルゴリズムを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM、MLP)、および/または次元削減技法(例えば、PCA、LDA)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施される傾向がある。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0113】
図2(例えば、表1および対応する説明)に関する機械学習アルゴリズムの上記説明は、
図6の機械学習アルゴリズムにも適用され得る。
【0114】
診断特徴優先順位付けツールを使用する例示的方法620は、下記のステップのうちの1つ以上を含み得る。ステップ621において、方法は、ユーザに対応するデジタル病理学画像を受信することを含み得る。ステップ623において、方法は、受信されたデジタル病理学画像に関連付けられたスライドおよび/または症例に関するランク順序または統計値を決定することを含み得る。ランク順序または統計値は、訓練された計算病理学機械学習アルゴリズム(例えば、方法600のもの)を受信された画像に適用することによって決定され得る。ランク順序または統計値は、受信された画像に関連付けられたスライドまたは受信された画像に関連付けられた症例に関する精査または追加のスライド調製を優先順位付けするために使用され得る。この症例におけるランク順序または統計値は、デジタル病理学画像内で検出される診断特徴に関連付けられた統計値を含み得る。
【0115】
ステップ625において、方法は、ランク順序または統計値を出力することを含み得る。1つの出力は、選好、ヒューリスティック、統計、ユーザの目的(例えば、効率、難度、緊急性等)に基づく順序における1つ以上の変化の決定および/または表示を含み得る。代替として、または加えて、出力は、発生させられた順序に基づく症例レベルにおける受信された画像の視覚的ソートを含み得る。例えば、そのような視覚的ソートは、標的特徴に関する最大または最小スライド確率に基づいて、標的特徴に関する全てのスライドにわたる平均確率に基づいて、標的特徴を示すスライドの未加工の数に基づいて順序付けられる症例のソート等を備えている表示を含み得る。視覚的ソートは、ユーザによって、および/または計算的に実施され得る。別の出力は、発生させられた順序に基づく各症例内のスライドレベルまたはブロックレベルにおけるソートの可視化を含み得る。なお別の出力は、1つ以上の識別された診断特徴に関するリスト、視覚的指示、またはアラートを含み得る。一実施形態は、ユーザが精査の優先順位付けのために診断特徴のうちの1つ(または任意の組み合わせ)を選択するためのオプションまたはメニューインターフェースを含み得る。
【0116】
一実施形態によると、スライド優先順位付けは、緊急性に基づき得る。診断は、患者の医療プロセスに対して重要であり得る。症例の臨床緊急性に基づいて病理学精査/診断を優先順位付けすることは、外科医と、病理医と、臨床医と、患者との間のやり取りを合理化し得る。緊急性は、多くの臨床シナリオが、自身の身体における「腫瘤」を提示する、いかなる癌の既往歴も伴わない患者を伴うので、検出しにくくあり得る。結果は、初めての予期せぬ癌診断であり得る。いかなる知識も存在しない、または利用不可能であるような場合、「ユーザ入力」が、症例が「緊急」と見なされるときを定義し得る。例えば、臨床医が、病理医に電話し、所与の症例が緊急であることを示し得る。そのような状況では、人物/臨床医は、症例が急を要することを要求していることもある。現在、臨床医は、「急を要する」ステータスを有するものとして試料を手動で標識化し得る。試料は、新しく疑わしい癌診断を伴う患者からの「腫瘤」を備え得る。急を要するステータスは、試料/症例を取り扱う病理医に伝えられ得る。病理医が、完成されたスライドの組を受け取ると、病理医は、「急を要する」試料に関連付けられたスライドを精査することを優先し得る。
【0117】
図7は、ユーザ入力ベースの優先順位付けツールを開発する例示的方法を図示する。例えば、例示的方法700および720(例えば、ステップ701-725)は、自動的に、またはユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。
【0118】
一実施形態によると、ユーザ入力ベースの優先順位付けツールを開発する例示的方法700は、下記のステップのうちの1つ以上を含み得る。ステップ701において、方法は、癌サブタイプおよび組織試料(例えば、組織学、細胞学、血液学、マイクロCT等)にわたるデジタル化病理学画像のデータセットを作成することを含み得る。ステップ703において、方法は、データセットの各病理学画像に関する1つ以上の標識(例えば、スライド形態、診断、結果、難度等)を受信または決定することを含み得る。追加の例示的ユーザベースの優先順位標識は、患者緊急性、臨床的問題に対する診断関連性、臨床治験登録、提示されるリスク因子、および/またはユーザ入力を含み得る。ステップ705において、方法は、デジタル記憶デバイス(例えば、ハードドライブ、ネットワークドライブ、クラウド記憶装置、RAM等)内に各画像およびその対応する標識を記憶することを含み得る。
【0119】
ステップ707において、方法は、入力として病理学試料の1つ以上のデジタル画像をとり、次いで、各デジタル画像に関する優先順位付けランクを予測する計算病理学ベースの機械学習アルゴリズムを訓練することを含み得る。機械学習アルゴリズムを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM、MLP)、および/または次元削減技法(例えば、PCA、LDA)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施される傾向がある。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0120】
図2(例えば、表1および対応する説明)に関する機械学習アルゴリズムの上記説明は
図7の機械学習アルゴリズムにも適用され得る。
【0121】
ユーザ入力ベースの優先順位付けツールを使用するための例示的720は、下記のステップのうちの1つ以上を含み得る。ステップ721において、方法は、ユーザに対応するデジタル病理学画像を受信することを含み得る。ステップ723において、方法は、受信されたデジタル病理学画像に関連付けられたスライドおよび/または症例に関するランク順序または統計値を決定することを含み得る。ランク順序または統計値は、訓練された計算病理学機械学習アルゴリズム(例えば、方法700のもの)を受信された画像に適用することによって決定され得る。ランク順序または統計値は、受信された画像に関連付けられたスライドまたは受信された画像に関連付けられた症例に関する精査または追加のスライド調製を優先順位付けするために使用され得る。この症例におけるランク順序または統計値は、デジタル病理学画像内で検出される診断特徴に関連付けられた統計値を含み得る。
【0122】
ステップ725において、方法は、ランク順序または統計値を出力することを含み得る。1つの出力は、選好、ヒューリスティック、統計、ユーザの目的(例えば、効率、難度、緊急性等)に基づく順序における1つ以上の変化の決定および/または表示を含み得る。代替として、または加えて、出力は、発生させられた順序に基づく症例レベルにおける受信された画像の視覚的ソートを含み得る。例えば、そのような視覚的ソートは、標的特徴に関する最大または最小スライド確率に基づいて、標的特徴に関する全てのスライドにわたる平均確率に基づいて、標的特徴を示すスライドの未加工の数に基づいて順序付けられる症例のソート等を備えている表示を含み得る。視覚的ソートは、ユーザによって、および/または計算的に実施され得る。別の出力は、発生させられた順序に基づく各症例内のスライドレベルまたはブロックレベルにおけるソートの可視化を含み得る。なお別の出力は、決定されたランク順序または統計値(例えば、ステップ725)に基づく、症例完了に関する時間推定値を含み得る。時間推定値は、方法700のアルゴリズムおよびスライド調製または処理に関する待ち行列内の他のスライド/症例に基づき得る。出力は、時間推定値を医師に提供することを含み得る。さらなる実施形態は、報告、診断、またはスライド調製が完了されると、委託医師に通知することを含み得る。
【0123】
図8は、本開示の例示的実施形態による、機関の要求される症例あたり検査所要時間(例えば、48時間)、患者緊急性必要性、スタッフ配置制約等を満たすために症例を優先順位付けし、病理医に分配する例示的方法を図示する。例えば、例示的方法800および820(例えば、ステップ801-825)は、自動的に、ユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。
【0124】
一実施形態によると、方法は、機関の要求される症例あたり検査所要時間(例えば、48時間)、患者緊急性必要性、スタッフ配置制約等を満たすために症例を優先順位付けし、病理医に分配することを含み得る。
図8に図示されるように、症例割り当て優先順位付けツールを開発する例示的方法800は、下記のステップのうちの1つ以上を含み得る。ステップ801において、方法は、癌サブタイプおよび組織試料(例えば、組織学、細胞学、血液学、マイクロCT等)にわたるデジタル化病理学画像のデータセットを作成することを含み得る。ステップ803において、方法は、データセットの各病理学画像に関する1つ以上の標識(例えば、スライド形態、診断、結果、難度等)を受信または決定することを含み得る。ステップ803は、追加の入力、例えば、機関/実験室ネットワーク/組織学実験室/病理医要件および/または制約を受信することを含み得る。ステップ805において、方法は、デジタル記憶デバイス(例えば、ハードドライブ、ネットワークドライブ、クラウド記憶装置、RAM等)内に各画像およびその対応する標識を記憶することを含み得る。
【0125】
ステップ807において、方法は、入力として、(1)病理学試料の1つ以上のデジタル画像、および/または、(2)システム/ワークフロー要件/制約をとり、次いで、各デジタル画像(例えば、ステップ807)に関して優先順位付けランクを予測する計算病理学ベースの機械学習アルゴリズムを訓練することを含み得る。機械学習アルゴリズムを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM、MLP)、および/または次元削減技法(例えば、PCA、LDA)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施される傾向がある。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0126】
図2(例えば、表1および対応する説明)に関する機械学習アルゴリズムの上記説明は、
図8の機械学習アルゴリズムにも適用され得る。
【0127】
症例割り当て優先順位付けツールを使用する例示的方法820は、下記のステップのうちの1つ以上を含み得る。ステップ821において、方法は、ユーザに対応するデジタル病理学画像を受信することを含み得る。ステップ823において、方法は、受信されたデジタル病理学画像に関連付けられたスライドおよび/または症例に関するランク順序または統計値を決定することを含み得る。ランク順序または統計値は、訓練された計算病理学機械学習アルゴリズム(例えば、方法800のもの)を受信された画像に適用することによって決定され得る。ランク順序または統計値は、受信された画像に関連付けられたスライドまたは受信された画像に関連付けられた症例に関する精査または追加のスライド調製を優先順位付けするために使用され得る。この症例におけるランク順序または統計値は、デジタル病理学画像内で検出される診断特徴に関連付けられた統計値を含み得る。
【0128】
ステップ825において、方法は、ランク順序または統計値を出力することを含み得る。1つの出力は、選好、ヒューリスティック、統計、ユーザの目的(例えば、効率、難度、緊急性等)に基づく順序における1つ以上の変化の決定および/または表示を含み得る。代替として、または加えて、出力は、発生させられた順序に基づく症例レベルにおける受信された画像の視覚的ソートを含み得る。例えば、そのような視覚的ソートは、標的特徴に関する最大または最小スライド確率に基づいて、標的特徴に関する全てのスライドにわたる平均確率に基づいて、標的特徴を示すスライドの未加工の数に基づいて順序付けられる症例のソート等を備えている表示を含み得る。視覚的ソートは、ユーザによって、および/または計算的に実施され得る。別の出力は、発生させられた順序に基づく各症例内のスライドレベルまたはブロックレベルにおけるソートの可視化を含み得る。なお別の出力は、病理学または下位専門領域医療チーム内または病理医のネットワーク内で症例の分配および/または割り当てを発生させることを含み得る。さらなる実施形態は、症例を具体的病理医または病理医の組に割り当てることを含み得る。発生させられた分配または割り当ては、医師利用可能性、以前の経験レベル、医療専門分野、患者名簿、および/または機関/実験室要件および制約に基づいて、最適化され得る。
【0129】
図9は、本開示の例示的実施形態による、それが病理医から学習するパターンに基づいて、優先順位付けシステムを継続的に学習および最適化する例示的方法を図示する。例えば、例示的方法900および920(例えば、ステップ901-925)は、自動的に、またはユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。この学習および最適化プロセスは、ツールが使用されている間に行われ得る。そのような継続的学習および最適化は、病理医が、自身の選好(例えば、容易な症例の前に困難な症例を閲覧すること)および習慣(例えば、特定の試料に関してある染色の指示をすること)に合わせられた優先順位付けツールを体験することを可能にし得る。
【0130】
一実施形態によると、個人化されたツールを開発する例示的方法900は、下記のステップのうちの1つ以上を含む。ステップ901において、方法は、癌サブタイプおよび組織試料(例えば、組織学、細胞学、血液学、マイクロCT等)にわたるデジタル化病理学画像のデータセットを作成することを含み得る。ステップ903において、方法は、データセットの各病理学画像に関する1つ以上の標識(例えば、スライド形態、診断、結果、難度等)を受信または決定することを含み得る。ステップ903は、追加の入力、例えば、ユーザアクション、入力(例えば、選好)、またはパターンを受信または検出することを含み得る。ステップ905において、方法は、デジタル記憶デバイス(例えば、ハードドライブ、ネットワークドライブ、クラウド記憶装置、RAM等)内に各画像およびその対応する標識を記憶することを含み得る。
【0131】
ステップ907において、方法は、入力として、(1)病理学試料の1つ以上のデジタル画像、および/または、(2)ユーザアクション、入力、またはパターンをとり、次いで、各デジタル画像(例えば、ステップ907)に関して優先順位付けランクを予測する計算病理学ベースの機械学習アルゴリズムを訓練することを含み得る。機械学習アルゴリズムを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM、MLP)、および/または次元削減技法(例えば、PCA、LDA)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施される傾向がある。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0132】
図2(例えば、表1および対応する説明)に関する機械学習アルゴリズムの上記説明は、
図9の機械学習アルゴリズムにも適用され得る。
【0133】
ツールを使用する例示的方法920は、下記のステップのうちの1つ以上を含み得る。ステップ921において、方法は、ユーザに対応するデジタル病理学画像を受信することを含み得る。ステップ923において、方法は、受信されたデジタル病理学画像に関連付けられたスライドおよび/または症例に関するランク順序または統計値を決定することを含み得る。ランク順序または統計値は、訓練された計算病理学機械学習アルゴリズム(例えば、方法900のもの)を受信された画像に適用することによって決定され得る。ランク順序または統計値は、受信された画像に関連付けられたスライドまたは受信された画像に関連付けられた症例に関する精査または追加のスライド調製を優先順位付けするために使用され得る。この症例におけるランク順序または統計値は、デジタル病理学画像内で検出される診断特徴に関連付けられた統計値を含み得る。
【0134】
ステップ925において、方法は、ランク順序または統計値を出力することを含み得る。1つの出力は、選好、ヒューリスティック、統計、ユーザの目的(例えば、効率、難度、緊急性等)に基づく順序における1つ以上の変化の決定および/または表示を含み得る。代替として、または加えて、出力は、発生させられた順序に基づく症例レベルにおける受信された画像の視覚的ソートを含み得る。例えば、そのような視覚的ソートは、標的特徴に関する最大または最小スライド確率に基づいて、標的特徴に関する全てのスライドにわたる平均確率に基づいて、標的特徴を示すスライドの未加工の数に基づいて順序付けられる症例のソート等を備えている表示を含み得る。視覚的ソートは、ユーザによって、および/または計算的に実施され得る。別の出力は、発生させられた順序に基づく各症例内のスライドレベルまたはブロックレベルにおけるソートの可視化を含み得る。なお別の出力は、例えば、個々の病理医の選好、強み、弱み、利用可能性等に基づいて、病理医または下位専門領域医療チーム内または病理医のネットワーク内で症例の分配および/または割り当てを発生させることを含み得る。
【0135】
一実施形態によると、方法は、病理医、医学生、病理学研修医、研究者等を教育および評価するために最適化することを含み得る。熟練した病理医になるために、医学生および病理学研修医は、この技能において熟達した状態になるために多くのスライドまたはスライド画像を見ることもある。本実施形態は、最も教育的な利益を提供するデジタル病理学画像をユーザに提示することによって、この学習プロセスをより効率的にすることを目標とする。例えば、提示される病理学画像は、ある疾患の原型、または疾患を検出することにおける混乱/エラーの共通点を表示し得る。本実施形態は、医師が間隔反復機構から、またはそれを使用することによって最も学習する必要性があり得る画像を予測および選択することを対象とし得る。画像に関する予測される教育的価値が、画像を分類することの困難の程度、ユーザが以前に画像の画像特性を識別することにおいて、または画像に基づく自身の診断において誤ったかどうか、ユーザがその画像に関する自身の知識を新たにするべきかどうか、機械学習モデル(例えば、能動学習またはユーザのモデル)を使用すること等の関数に基づいて計算され得る。
【0136】
図10は、本開示の例示的実施形態による、教育的病理学スライド優先順位付けツールを発生させ、使用する例示的方法を図示する。例えば、例示的方法1000および1020(例えば、ステップ1001-1027)は、自動的に、またはユーザ(例えば、医師、病理医等)からの要求に応答して、スライド優先順位付けツール101によって実施され得る。
【0137】
一実施形態によると、教育的ツールを開発する例示的方法1000は、下記のステップのうちの1つ以上を含み得る。ステップ1001において、方法は、癌サブタイプおよび組織試料(例えば、組織学、細胞学、血液学、マイクロCT等)にわたるデジタル化病理学画像のデータセットを作成することを含み得る。ステップ1003において、方法は、データセットの各病理学画像に関する1つ以上の画像特性標識(例えば、スライド形態、診断、結果、難度等)を受信または決定することを含み得る。ステップ1005において、方法は、デジタル記憶デバイス(例えば、ハードドライブ、ネットワークドライブ、クラウド記憶装置、RAM等)内に各画像およびその対応する標識を記憶することを含み得る。ステップ1007において、方法は、入力として、病理学試料の1つ以上のデジタル画像をとり、次いで、各デジタル画像に関する教育的価値を予測する計算病理学ベースの機械学習アルゴリズムを訓練することを含み得る。機械学習アルゴリズムを実装するための異なる方法は、限定ではないが、(1)CNN(畳み込みニューラルネットワーク)、(2)MIL(複数インスタンス学習)、(3)RNN(回帰型ニューラルネットワーク)、(4)CNNを介した特徴集約、および/または、(5)特徴抽出を含み、アンサンブル方法(例えば、ランダムフォレスト)、線形/非線形分類器(例えば、SVM、MLP)、および/または次元削減技法(例えば、PCA、LDA)が続き得る。例示的特徴は、CNNからのベクトル埋め込み、CNNからの単一/多クラス出力、および/またはCNNからの多次元出力(例えば、元の画像のマスクオーバーレイ)を含み得る。CNNは、ピクセルから直接分類タスクに関する特徴表現を学習し得、それは、より良好な診断性能につながり得る。領域またはピクセル毎の標識に関する詳細な注釈が利用可能であるとき、CNNは、大量の標識化されたデータが存在する場合、直接訓練され得る。しかしながら、標識が全体的スライドレベルにおいて、またはグループ(病理学では、「パート」と呼ばれ得る)内のスライドの集合にわたってしかないとき、MILは、CNNまたは別のニューラルネットワーク分類器を訓練するために使用され得、MILは、網羅的な注釈を伴わずに学習する能力につながる分類タスクに関する診断である画像領域を学習する。RNNは、それが、次いで、予測を行うために処理する複数の画像領域(例えば、タイル)から抽出される特徴上で使用され得る。他の機械学習方法、例えば、ランダムフォレスト、SVM、および多数のその他が、CNN、MILを伴うCNNによって学習された特徴または手作りの画像特徴(例えば、SIFTまたはSURF)の使用のいずれかとともに使用され、分類タスクを行い得るが、それらは、ピクセルから直接訓練されるとき、不良に実施され得る。これらの方法は、利用可能な大量の注釈付き訓練データが存在するとき、CNNベースのシステムと比較して、不良に実施される傾向がある。次元削減技法は、言及される分類器のうちのいずれかを使用する前、前処理ステップとして使用され得、それは、利用可能なデータが殆ど存在しない場合、有用であり得る。
【0138】
図2(例えば、表1および対応する説明)に関する機械学習アルゴリズムの上記説明は、
図10の機械学習アルゴリズムにも適用され得る。
【0139】
教育的ツールを使用する例示的方法1020は、下記のステップのうちの1つ以上を含み得る。ステップ1021において、方法は、ユーザ(例えば、病理学実習生)に、教育的価値を有することが予測される病理学画像を表示することを含み得る。ステップ1023において、方法は、画像の1つ以上の特性を表すユーザ入力を受信することを含み得る。ユーザ入力は、画像特性、例えば、癌の悪性度の推定値を含み得る。ステップ1025において、方法は、ユーザの入力を記憶することおよび/または表示される画像に関連付けられる画像難度メトリックを改訂することを含み得る。ツールは、記憶された画像特性に対するユーザの入力のスコアをさらに記憶し得る。
【0140】
ステップ1027において、ツールは、ユーザ入力が正しかったかどうかに関するフィードバックをユーザに提供し得る。フィードバックは、画像特性の自身の識別を改良することにおいてユーザを支援するためのインジケータをさらに含み得る。記憶された画像特性の例示的インジケータは、例えば、癌を伴う領域を強調することによって、ユーザが重要な画像特性を識別するために見るべきであった場所を表し得る。これらのインジケータは、ユーザが、ユーザが見ておくべきであった場所を学習することに役立ち得る。フィードバックはさらに、ユーザが改良を加え得る診断エリア、例えば、ユーザが一貫して重要な画像特性を識別することができない場所を識別し得る。このツール使用は、反復性であり得る。例えば、ツールは、記憶された画像特性を識別するユーザの能力(または無能)に基づいて、ユーザコマンドに基づいて、またはそれらの組み合わせのいずれかで、別の画像を表示することによってユーザを訓練し得る。
【0141】
図11に示されるように、デバイス1100は、中央処理ユニット(CPU)1120を含み得る。CPU1120は、例えば、任意のタイプの専用または汎用マイクロプロセッサデバイスを含む任意のタイプのプロセッサデバイスであり得る。当業者によって理解されるであろうように、CPU1120は、マルチコア/マルチプロセッサシステムにおけるシングルプロセッサでもあり、そのようなシステムは、単独で、またはクラスタまたはサーバファームにおいて動作するコンピューティングデバイスのクラスタにおいて動作し得る。CPU1120は、データ通信インフラストラクチャ1110、例えば、バス、メッセージキュー、ネットワーク、またはマルチコアメッセージパッシングスキームに接続され得る。
【0142】
デバイス1100は、主要メモリ1140、例えば、ランダムアクセスメモリ(RAM)も含み得、デバイス1100は、二次メモリ1130も含み得る。二次メモリ1130、例えば、読み取り専用メモリ(ROM)は、例えば、ハードディスクドライブまたはリムーバブル記憶ドライブであり得る。そのようなリムーバブル記憶ドライブは、例えば、フロッピー(登録商標)ディスクドライブ、磁気テープドライブ、光学ディスクドライブ、フラッシュメモリ、または同等物を備え得る。この例におけるリムーバブル記憶ドライブは、周知の様式でリムーバブル記憶ユニットから読み取る、および/またはそれに書き込む。リムーバブル記憶ユニットは、リムーバブル記憶ドライブによって読み取られ、それに書き込まれる、フロッピー(登録商標)ディスク、磁気テープ、光学ディスク等を備え得る。当業者によって理解されるであろうように、そのようなリムーバブル記憶ユニットは、概して、その中にコンピュータソフトウェアおよび/またはデータを記憶したコンピュータ使用可能記憶媒体を含む。
【0143】
代替実装では、二次メモリ1130は、コンピュータプログラムまたは他の命令がデバイス1100にロードされることを可能にするための他の類似する手段を含み得る。そのような手段の例は、ソフトウェアおよびデータが、リムーバブル記憶ユニットからデバイス1100に転送されることを可能にするプログラムカートリッジおよびカートリッジインターフェース(ビデオゲームデバイスにおいて見出されるもの等)、リムーバブルメモリチップ(EPROMまたはPROM等)および関連付けられたソケット、および他のリムーバブル記憶ユニットおよびインターフェースを含み得る。
【0144】
デバイス1100はまた、通信インターフェース(「COM」)1160を含み得る。通信インターフェース1160は、ソフトウェアおよびデータが、デバイス1100と外部デバイスとの間で転送されることを可能にする。通信インターフェース1160は、モデム、ネットワークインターフェース(イーサネット(登録商標)カード等)、通信ポート、PCMCIAスロットおよびカード等を含み得る。通信インターフェース1160を介して転送されるソフトウェアおよびデータは、通信インターフェース1160によって受信されることが可能な電子、電磁、光学、または他の信号であり得る信号の形態であり得る。これらの信号は、例えば、ワイヤまたはケーブル、光ファイバ、電話回線、セルラー電話リンク、RFリンク、または他の通信チャネルを使用して実装され得るデバイス1100の通信経路を介して通信インターフェース1160に提供され得る。
【0145】
デバイス1100は、キーボード、マウス、タッチスクリーン、モニタ、ディスプレイ等の入力および出力デバイスと接続するための入力および出力ポート1150も含み得る。当然ながら、種々のサーバ機能は、処理負荷を分散させるために、いくつかの類似するプラットフォーム上で分散方式で実装され得る。代替として、サーバは、1つのコンピュータハードウェアプラットフォームの適切なプログラミングによって実装され得る。
【0146】
本開示全体を通して、コンポーネントまたはモジュールの言及は、概して、機能または関連する機能の群を実施するために論理的に一緒に群化され得るアイテムを指す。同様の参照番号は、概して、同一または類似するコンポーネントを指すことを意図している。コンポーネントおよびモジュールは、ソフトウェア、ハードウェア、またはソフトウェアおよびハードウェアの組み合わせにおいて実装されることができる。
【0147】
上で説明されるツール、モジュール、および機能は、1つ以上のプロセッサによって実施され得る。「記憶」タイプ媒体は、ソフトウェアプログラミングのために任意の時点で非一過性記憶を提供し得る種々の半導体メモリ、テープドライブ、ディスクドライブ等、コンピュータ、プロセッサ等の有形メモリ、またはそれらの関連付けられるモジュールのうちのいずれかまたは全てを含み得る。
【0148】
ソフトウェアは、インターネット、クラウドサービスプロバイダ、または他の電気通信ネットワークを通して通信され得る。例えば、通信は、1つのコンピュータまたはプロセッサから別のものにソフトウェアをロードすることが可能であり得る。本明細書に使用される場合、非一過性有形「記憶」媒体に制限されない限り、コンピュータまたは機械「読み取り可能な媒体」等の用語は、実行のためにプロセッサに命令を提供することに関与する任意の媒体を指す。
【0149】
前述の一般的な説明は、例示的かつ解説的にすぎず、本開示の制限ではない。本発明の他の実施形態も、本明細書の検討および本明細書に開示される本発明の実践から当業者に明白となるであろう。本明細書および例が、例示的にすぎないと見なされることを意図している。