(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025006739
(43)【公開日】2025-01-17
(54)【発明の名称】ホルモン受容体状態を識別する方法及びシステム
(51)【国際特許分類】
G16H 10/40 20180101AFI20250109BHJP
【FI】
G16H10/40
【審査請求】有
【請求項の数】18
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023107720
(22)【出願日】2023-06-30
(71)【出願人】
【識別番号】519316988
【氏名又は名称】台湾基督長老教会馬偕医療財団法人馬偕紀念医院
【氏名又は名称原語表記】MacKay Memorial Hospital
【住所又は居所原語表記】No.92, Sec. 2, Zhongshan N Rd., Zhongshan District, Taipei City 104, Taiwan
(71)【出願人】
【識別番号】504007741
【氏名又は名称】國立中央大學
【住所又は居所原語表記】NO.300, Jhongda Road, Jhongli District, Taoyuan City, TAIWAN
(74)【代理人】
【識別番号】100167689
【弁理士】
【氏名又は名称】松本 征二
(72)【発明者】
【氏名】ワン, ジャー・チン
(72)【発明者】
【氏名】シュー, イ・チョン
(72)【発明者】
【氏名】フワン, エン・ジャン
(72)【発明者】
【氏名】ファム, バク・トゥン
(72)【発明者】
【氏名】リー, フォン・ティ
(72)【発明者】
【氏名】ヤン, ポー・シェン
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA03
(57)【要約】 (修正有)
【課題】被検体のホルモン受容体状態を彼/彼女のバイオプシーのヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)によって識別することができるモデルを学習させるシステム及び方法並びに該方法及びモデルを用いて被検体のホルモン受容体状態を識別する方法を提供する。
【解決手段】方法は、既知のホルモン受容体情報を有する複数のWSIを取得するステップS101と、WSIの各々を複数のパッチに分割するステップS102と、異常H&E染色を発現するパッチを選択して合成画像に合成するステップS104と、WSIの既知のホルモン受容体情報を用いて独立して複数の合成画像を学習させることでモデルを構築するステップS105と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
被検体のバイオプシーのヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)によってホルモン受容体状態を判定するためのモデルを構築する方法であって、
(a)前記バイオプシーのH&E染色の複数のWSIを取得するステップであって、各WSIはホルモン受容体情報を含む、ステップと、
(b)ステップ(a)の前記WSIの各々を複数のパッチに分割するステップと、
(c)タイル抽出を実行することによってステップ(b)の前記パッチの各々における正常H&E染色と異常H&E染色とを分類するステップと、
(d)ステップ(c)の前記異常H&E染色を示す分類された前記パッチを選択及び合成して、前記H&E染色のWSIの各々の合成画像を生成するステップと、
(e)ステップ(d)とは独立して生成された複数の合成画像を、ステップ(a)の前記ホルモン受容体情報を用いて学習させることで前記モデルを確立するステップと、
を備え、
ステップ(a)の前記ホルモン受容体情報は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現を含む、方法。
【請求項2】
ステップ(e)において、前記複数の合成画像は、
(e-1)各合成画像の複素数値から複素行列を取得するステップと、
(e-2)各合成画像について前記複素行列を複素列ベクトルに変換するステップと、
(e-3)ステップ(e-2)において取得された前記複素列ベクトル間の類似度に基づいて各合成画像を前記ホルモン受容体の陽性発現又は陰性発現に分類するステップと、
を備えるベクトル正則化複素行列因子分解(CMF)法を実行することによって学習される、請求項1に記載の方法。
【請求項3】
ステップ(e-3)は、k-近傍法(k-NN)アルゴリズムを実行することによって行われる、請求項2に記載の方法。
【請求項4】
ステップ(c)、(d)及び(e)は、深層学習アルゴリズムによって行われる、請求項1に記載の方法。
【請求項5】
前記被検体は、乳癌を有し、又は有していると疑われる、請求項1に記載の方法。
【請求項6】
被検体のバイオプシーのヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)に基づいてホルモン受容体状態を判定する方法であって、
(a)前記H&E染色のWSIを複数のパッチに分割するステップと、
(b)タイル抽出を実行することによって、異常H&E染色を示すパッチを選択及び合成してテスト画像を生成するステップと、
(c)請求項1に記載の方法によって確立された前記モデル内で、ステップ(b)で生成された前記テスト画像を処理することによって前記ホルモン受容体状態を判定するステップと、
を備え、
前記ホルモン受容体状態は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現を含む、方法。
【請求項7】
ステップ(c)において、前記テスト画像は、
(c-1)前記テスト画像の複素数値から複素行列を取得するステップと、
(c-2)前記テスト画像について前記複素行列を複素列ベクトルに変換するステップと、
(c-3)ステップ(c-2)で取得された前記テスト画像の前記複素列ベクトルと、請求項1に記載の方法によって確立された前記モデルにおける前記合成画像の複素列ベクトルとの間の絶対距離に基づいて前記テスト画像を前記ホルモン受容体の陽性発現又は陰性発現に分類するステップと、
を備えるベクトル正則化複素行列因子分解(CMF)法を実行することによって処理される、請求項6に記載の方法。
【請求項8】
ステップ(c-3)は、k-近傍法(k-NN)アルゴリズムを実行することによって行われる、請求項7に記載の方法。
【請求項9】
前記ホルモン受容体状態は、前記ホルモン受容体の発現強度をさらに含む、請求項8に記載の方法。
【請求項10】
前記ベクトル正則化CMF法は、(c-4)請求項1に記載の方法によって確立された前記モデルの前記合成画像における陽性発現及び陰性発現にそれぞれ対応する複素列ベクトル数間の比に基づいて前記テスト画像における前記ホルモン受容体の発現強度を判定するステップをさらに備える、請求項9に記載の方法。
【請求項11】
ステップ(b)及び(c)は、深層学習アルゴリズムによって行われる、請求項6に記載の方法。
【請求項12】
前記被検体は、乳癌を有し、又は有していると疑われる、請求項6に記載の方法。
【請求項13】
被検体のホルモン受容体状態を識別するシステムであって、
前記被検体からバイオプシーのヘマトキシリン及びエオジン(H&E)染色の1以上の候補ホールスライドイメージ(WSI)を収集するように構成された画像収集部と、
請求項1に記載の方法によって確立されたモデルを記憶し、前記画像収集部から送信された前記H&E染色の1以上の候補WSIを受信するように構成されたサーバと、
前記サーバから送信された前記H&E染色の1以上の候補WSIの前記ホルモン受容体状態を判定する方法を実行する命令によってプログラムされたプロセッサと、
を備え、前記方法は、
(a)前記H&E染色の候補WSIの各々を複数のパッチに分割するステップと、
(b)タイル抽出を実行することによって、それぞれ異常H&E染色を発現するパッチを選択及び合成してテスト画像を生成するステップと、
(c)前記サーバに記憶された前記モデルを用いて、ステップ(b)で生成された前記テスト画像を処理することによって前記ホルモン受容体状態を判定するステップであって、前記ホルモン受容体状態は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現を含む、ステップと、を備える、システム。
【請求項14】
前記方法のステップ(c)において、前記テスト画像は、
(c-1)前記テスト画像の複素数値から複素行列を取得するステップと、
(c-2)前記テスト画像について前記複素行列を複素列ベクトルに変換するステップと、
(c-3)ステップ(c-2)で取得された前記テスト画像の前記複素列ベクトルと、前記サーバに記憶された前記モデルにおける前記合成画像の複素列ベクトルとの間の絶対距離に基づいて前記テスト画像を前記ホルモン受容体の陽性発現又は陰性発現に分類するステップと、
を備えるベクトル正則化複素行列因子分解(CMF)法を実行することによって処理される、請求項13に記載のシステム。
【請求項15】
ステップ(c-3)は、k-近傍法(k-NN)アルゴリズムを実行することによって行われる、請求項14に記載のシステム。
【請求項16】
前記ホルモン受容体状態は、前記ホルモン受容体の発現強度をさらに含む、請求項14に記載のシステム。
【請求項17】
前記ベクトル正則化CMF法は、(c-4)前記サーバに記憶された前記モデル内の前記合成画像における陽性発現及び陰性発現にそれぞれ対応する複素列ベクトル数間の比に基づいて前記テスト画像における前記ホルモン受容体の発現強度を判定するステップをさらに備える、請求項16に記載のシステム。
【請求項18】
ステップ(b)及び(c)は、深層学習アルゴリズムによって行われる、請求項13に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、癌の診断及び処置の分野に関する。より具体的には、開示する発明は、被検体のホルモン受容体状態を、彼/彼女のバイオプシーのヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)に基づいて判定及び識別し、識別されたホルモン受容体状態に基づいて被検体を処置する方法及びシステムに関する。
【背景技術】
【0002】
乳癌(BC)は、全世界で女性が罹患する最も一般的な癌であり、かつ最も頻度の高い女性の癌の死因である。2020年には、世界中で2百万人を超える女性がBCと診断され、全世界で68万人を超えるBCによる死亡例があった。マンモグラフィ、磁気共鳴イメージング、超音波、コンピュータ断層撮影、陽電子放出断層撮影及びバイオプシーを含む早期診断アプローチでの近年の進歩は、BC関連の死亡率及び罹患率を改善してきた。しかし、これらの技術には、高価であること及び時間がかかることといった制約があるために、これを汎用的に適用することができない。早期BCを診断するための効率的かつ非常に高感度の方法を開発することは急務である。
【0003】
種々のバイオマーカーが、BCの検出のために開発されてきた。浸潤性乳癌の大部分はホルモン受容体陽性である--腫瘍細胞はエストロゲン(ER)及び/又はプロゲステロン(PR)の存在下で成長する。ホルモン受容体陽性の腫瘍を有する患者は、ER/PRシグナル伝達経路を標的とするホルモン療法を受けることから臨床的恩恵を受けることが多い。従来の診断ワークフローでは、患者から収集されたバイオプシーサンプルは、染色のために顕微鏡スライド上に薄く切片化されてから病理医による目視診断が行われる。一般的に、ヘマトキシリン及びエオジン(H&E)染色が主な診断に使用され、その後に免疫組織化学(IHC)染色が診断確認及びバイオプシーのホルモン受容体状態(HRS)を測定するためのサブタイプ分類に使用される。ホルモン受容体状態は、予後予測目的のための重要なツールであるとともに内分泌療法反応の予測因子であるが、スライドの目視検査によるHRS判定のプロセスには限界がある。高価であること及び時間がかかることといった不利益に加えて、IHCの試験出力は色の観点で表現されるので、サンプル品質、抗体源及びクローン並びに技師の熟練度に起因して変動する。また、病理医の意思決定プロセスは、元々主観的であり、ヒューマンエラーをもたらし得る。これらの要因はERS判定における不一致につながり、ER及びPR試験の現在のIHCに基づく判定の推定20%は不正確となる可能性があり、これらの患者を最適ではない処置のリスクに晒すことになる。
【0004】
上記に鑑み、関連技術において、被検体のホルモン受容体状態を、彼/彼女のバイオプシーのヘマトキシリン及びエオジン(H&E)のホールスライドイメージ(WSI)によって判定するための改善された方法及びシステムに対するニーズがある。
【発明の概要】
【0005】
以下に、基本的理解を読者に与えるために、本開示の簡略な概要を提示する。この概要は、本開示の網羅的な概観ではなく、本発明の主要/重要な要素を特定するものでも、本発明の範囲を規定するものでもない。その専らの目的は、ここに開示される幾つかのコンセプトを、後に提示される、より詳細な説明の序章として簡略な態様で提示することである。
【0006】
ここに具体化されて広義に記載されるように、本開示の目的は、乳癌の診断の効率及び精度が大幅に向上可能となるように、被検体のホルモン受容体状態を識別するシステムによって実施される診断システム及び方法を提供することである。
【0007】
一態様において、本開示は、バイオプシーのヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)によってホルモン受容体状態を判定するためのモデルを構築する方法に向けられる。その方法は、(a)バイオプシーのH&E染色の複数のWSIを取得するステップであって、各WSIはホルモン受容体情報を含む、ステップと、(b)ステップ(a)のWSIの各々を複数のパッチに分割するステップと、(c)タイル抽出を実行することによってステップ(b)のパッチの各々における正常H&E染色と異常H&E染色とを分類するステップと、(d)ステップ(c)の異常H&E染色を示す分類されたパッチを選択及び合成して、H&E染色のWSIの各々の合成画像を生成するステップと、(e)ステップ(d)とは独立して生成された複数の合成画像を、ステップ(a)のホルモン受容体情報を用いて学習させることでモデルを確立するステップと、を備える。この方法のステップ(a)において、ホルモン受容体情報は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現を含む。
【0008】
本開示のある実施形態によると、本方法のステップ(e)において、複数の合成画像は、ベクトル正則化複素行列因子分解(CMF)法を実行することによって学習される。ベクトル正則化CMF法は、以下の(e-1)各合成画像の複素数値から複素行列を取得するステップと、(e-2)各合成画像について複素行列を複素列ベクトルに変換するステップと、(e-3)ステップ(e-2)において取得された複素列ベクトル間の類似度に基づいて各合成画像をホルモン受容体の陽性発現又は陰性発現に分類するステップと、を備える。
【0009】
ある実施例では、上記ステップ(e-3)は、k-近傍法(k-NN)アルゴリズムを実行することによって行われる。
【0010】
本開示のある実施形態によると、本方法のステップ(c)、(d)及び(e)は、深層学習アルゴリズムによって行われる。
【0011】
本開示のある実施形態によると、被検体は、乳癌を有し、又は有していると疑われるものとする。
【0012】
他の態様では、本開示は、被検体のバイオプシーのヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)に基づいてホルモン受容体状態を判定する方法に関する。当該方法は、(a)H&E染色のWSIを複数のパッチに分割するステップと、(b)タイル抽出を実行することによって、異常H&E染色を示すパッチを選択及び合成してテスト画像を生成するステップと、(c)上記方法によって確立されたモデル内で、ステップ(b)で生成されたテスト画像を処理することによってホルモン受容体状態を判定するステップと、を備える。この方法では、ホルモン受容体状態は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現を含む。
【0013】
本開示のある実施形態によると、本方法のステップ(c)において、テスト画像は、(c-1)テスト画像の複素数値から複素行列を取得するステップと、(c-2)テスト画像について複素行列を複素列ベクトルに変換するステップと、(c-3)ステップ(c-2)で取得されたテスト画像の複素列ベクトルと、上記方法によって確立されたモデルにおける合成画像の複素列ベクトルとの間の絶対距離に基づいてテスト画像をホルモン受容体の陽性発現又は陰性発現に分類するステップと、を備えるベクトル正則化複素行列因子分解(CMF)法を実行することによって処理される。
【0014】
ある実施例では、上記ステップ(c-3)は、k-近傍法(k-NN)アルゴリズムを実行することによって行われる。
【0015】
好適な実施形態では、ホルモン受容体状態は、ホルモン受容体の発現強度をさらに含む。
【0016】
代替的に又は任意選択的に、ベクトル正則化CMF法は、(c-4)上記方法によって確立されたモデル内の合成画像における陽性発現及び陰性発現にそれぞれ対応する複素列ベクトル間の比に基づいてテスト画像におけるホルモン受容体の発現強度を判定するステップをさらに備える。
【0017】
本開示のある実施形態によると、本方法のステップ(b)及び(c)は、深層学習アルゴリズムによって行われる。
【0018】
本開示のある実施形態によると、被検体は、乳癌を有し、又は有していると疑われるものとする。
【0019】
さらに他の態様では、本開示は、本方法を実施するように構成された画像収集部、サーバ及びプロセッサを含むシステムに向けられる。
【0020】
より具体的には、画像収集部は、被検体からバイオプシーのヘマトキシリン及びエオジン(H&E)染色の1以上の候補ホールスライドイメージ(WSI)を収集するように構成される。サーバは、上記方法によって確立されたモデルを記憶し、画像収集部から送信されたH&E染色の1以上の候補WSIを受信するように構成される。さらに、プロセッサは、サーバから送信されたH&E染色の1以上の候補WSIのホルモン受容体状態を判定する方法を実行する命令によってプログラムされ、その方法は、(a)H&E染色の候補WSIの各々を複数のパッチに分割するステップと、(b)タイル抽出を実行することによって、それぞれ異常H&E染色を示すパッチを選択及び合成してテスト画像を生成するステップと、(c)サーバに記憶されたモデルを用いて、ステップ(b)で生成されたテスト画像を処理することによってホルモン受容体状態を判定するステップと、を備え、ホルモン受容体状態は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現を含む。
【0021】
本開示のある実施形態では、本方法のステップ(c)において、テスト画像は、(c-1)テスト画像の複素数値から複素行列を取得するステップと、(c-2)テスト画像について複素行列を複素列ベクトルに変換するステップと、(c-3)ステップ(c-2)で取得されたテスト画像の複素列ベクトルと、サーバに記憶されたモデルにおける合成画像の複素列ベクトルとの間の絶対距離に基づいてテスト画像をホルモン受容体の陽性発現又は陰性発現に分類するステップと、を備えるベクトル正則化複素行列因子分解(CMF)法を実行することによって処理される。
【0022】
ある実施例では、本方法のステップ(c-3)は、k-近傍法(k-NN)アルゴリズムを実行することによって行われる。
【0023】
本開示のある実施形態では、ホルモン受容体状態は、ホルモン受容体の発現強度をさらに含む。
【0024】
代替的に又は任意選択的に、ベクトル正則化CMF法は、(c-4)サーバに記憶されたモデル内の合成画像における陽性発現及び陰性発現にそれぞれ対応する複素列ベクトル間の比に基づいてテスト画像におけるホルモン受容体の発現強度を判定するステップをさらに備える。
【0025】
ある実施例では、本方法のステップ(b)及び(c)は、深層学習アルゴリズムによって行われ得る。
【0026】
さらに他の態様では、本開示は、それを必要とする被検体における乳癌を判定及び処置する方法に向けられる。その方法は、(a)被検体のバイオプシーからヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)を取得するステップと、(b)上記方法を用いて被検体のホルモン受容体状態を判定するステップと、(c)ステップ(b)のホルモン受容体状態に基づいて被検体に抗癌処置を施すステップと、を備え、ホルモン受容体状態はエストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現、並びにその発現強度を含み、抗癌処置は、外科手術、高周波アブレーション、全身化学療法、肝動脈的化学塞栓療法(TACE)、免疫療法、標的薬物療法、ホルモン療法及びこれらの組合せからなる群から選択される。
【0027】
本開示のある実施形態によると、被検体はヒトである。
【0028】
上記構成によって、被検体のホルモン受容体状態を判定及び識別する方法及びシステムは、迅速な態様で実行され、それにより、乳癌の診断の効率及び精度を向上することができる。
【0029】
本開示の付随する特徴及び有利な効果の多くは、添付図面に関連して検討される以下の詳細な説明を参照してより深く理解されることになる。
【0030】
本説明は、添付図面に照らして読まれる以下の詳細な説明からより深く理解されることになる。
【図面の簡単な説明】
【0031】
【
図1】
図1は、本開示の一実施形態に係る方法10のフローチャートである。
【
図2】
図2は、本開示の他の実施形態に係るシステム20を示す図である。
【
図3】
図3は、本開示の他の実施形態に係るシステム20において実施される方法30のフローチャートである。
【発明を実施するための形態】
【0032】
一般的な慣例に従って、記載される種々の構成/要素は、縮尺通りに描かれていないが、代わりに本発明に関連する特定の構成/要素を最良に示すように描かれている。また、種々の図面における同様の符号及び指定が、同様の要素/部分を示すのに使用される。
【0033】
添付図面に関連して以下に与えられる詳細な説明は、本実施例の説明としてのものであり、本実施例が構成又は利用され得る唯一の形態を表すものではない。この説明は、本実施例の機能及び本実施例を構成して動作させるためのステップの順序を説明する。ただし、同一又は同等の機能及び順序が、異なる実施例によって実現され得る。
【0034】
1.定義
説明の便宜上、明細書、実施例及び付随する特許請求の範囲において採用される特定の用語をここにまとめる。特に断りがない限り、ここで使用される全ての技術的及び科学的用語は、本発明が属する技術における当業者によって一般的に理解されるものと同じ意味を有する。
【0035】
単数形「a」、「an」及び「the」は、ここでは文脈が明示的に否定しない限り複数形のものを含むように使用される。
【0036】
ここで使用される用語「ホルモン受容体情報」とは、これらに限定されないが、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及びこれらの組合せを含む1以上のホルモン受容体の発現状態をいう。本開示によると、発現状態は、ホルモン受容体の陽性発現若しくは陰性発現及び/又は発現強度であり得る。
【0037】
ここで互換可能に使用される用語「バイオプシー」又は「バイオプシー標本」とは、正常な及び/又は異常な皮膚及び臓器を含む被検体の身体上又は身体内のいずれかの箇所から採取された組織サンプル及び/又は細胞サンプルをいう。実際に、バイオプシーは、バイオプシーの充分な標本が準備されて顕微鏡下で検査される病理評価のために得られることが多い。したがって、本開示によると、バイオプシーは、乳癌、好ましくはER/PR陽性乳癌及びER/PR陰性乳癌を含む腫瘍又は癌組織に由来する任意の標本を含む。
【0038】
ここで使用される用語「合成画像」とは、特徴抽出のために複数のパッチに分割されてから特徴のないものを除去するように処理された後に、再編成及び合体された画像をいう。本開示によると、機械学習モデルを学習させるために使用される合成画像は「参照画像」となるが、彼/彼女のホルモン受容体状態を識別するために被検体から取得される合成画像は「テスト画像」となる。
【0039】
ここで使用される用語「ベクトル正則化複素行列因子分解(CMF)」とは、画像表現のための複素領域上の行列因子分解法をいう。実数値データは複素領域に変換され、それにより、複素数値行列が、一般的には複素領域での制約なし最適化問題に対する解から導出される基底及び係数の2つの行列に分解される。本開示によると、ベクトル正則化CMFは複素行列を単純化し、最終的には特徴ベクトルを識別性の高い実画像データから抽出するのに使用される。
【0040】
用語「複素数」及び「複素数値」はここでは互換可能に使用され、iで表記され、虚数単位と称され、式i2=-1を満たす特定の要素で実数を拡張する数体系の要素をいい、各複素数又は複素数値は、a及びbを実数として、a+biの形式で表現可能である。
【0041】
ここで使用されるように、用語「処置する」、「処置している」及び「処置」は互換可能であり、部分的又は完全に、乳癌に関する症状、二次障害又は状態を予防、改善、軽減及び/又は管理することを包含する。
【0042】
2.本発明の説明
ヘマトキシリン及びエオジン(H&E)染色において捕捉される腫瘍の形態は、その腫瘍の分子マーカー状態についての予測的シグナルを含むこと及びパターン認識アルゴリズムが分子マーカー状態をH&E染色画像から直接判定するのに適用可能であることが、報告されている。パターン認識の分野では、関連する情報を強調する態様で画像が表現されること及び高次元のデータ空間が低次元の特徴部分空間に変換されることが重要である。異なる態様の画像表示は、異なる認識結果を生成する。したがって、適切な表現は、データの潜在構造を明示的に表現し、冗長性及び計算コストを低減し得る。本発明は、上述の問題に対処する改善された方法及びシステムを提供することを目的とする。さらに、本発明は、ホルモン受容体状態の発現強度を定量化するようにH&E染色画像におけるパターン認識のための複素行列因子分解(CMF)の改善された方法を開発することも目的とする。
【0043】
2.1 ホルモン受容体状態の判定のためのモデルを構築する方法
本開示の第1の態様は、バイオプシーのヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)によってホルモン受容体状態を判定するためのモデルを構築する方法に向けられる。
図1を参照する。
【0044】
図1は、本開示の一実施形態に係るコンピュータ又はプロセッサにおいて実施される方法10のフローチャートである。方法10は、
図1の符号S101~S105によってそれぞれ示される以下のステップを備える。
S101:バイオプシーのH&E染色の複数のWSIを取得するステップであって、各WSIがホルモン受容体情報を含む、ステップ;
S102:ステップS101でのWSIの各々を複数のパッチに分割するステップ;
S103:タイル抽出を実行することによってステップS102でのパッチの各々における正常H&E染色と異常H&E染色とを分類するステップ;
S104:ステップS103での異常H&E染色を示す分類されたパッチを選択及び合成してH&E染色のWSIの各々の合成画像を生成するステップ;並びに
S105:ステップS104とは独立して生成された複数の合成画像を、ステップS101のホルモン受容体情報を用いて学習させることでモデルを確立するステップ。
【0045】
本方法10のバイオプシーは、概略として人体から取得される組織片又は細胞のサンプルである。例示的な一実施形態によると、バイオプシーは、健常な又は罹患した被検体から取得する胸部組織片である。モデルを構築して学習させるために、被検体に由来し、既知のホルモン受容体情報を独立して含む複数のWSIが、本学習方法10において使用される。実際に、バイオプシーのH&E染色の複数のホールスライドイメージ(WSI)は、医療センターの既存のデータベースから収集されてもよい(S101)。本開示によると、ホルモン受容体情報は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現を含む。追加的に又は任意選択的に、各被検体に対応する診断情報(例えば、癌ステージ)が収集されてもよい。その後、WSIは、後続のステップ(S102~S105)を実行するためにそこに組み込まれた命令を有するデバイス及び/又はシステム(例えば、コンピュータ又はプロセッサ)に自動的に転送される。ステップS102及びS103では、WSIの各々が複数のパッチ(すなわち、WSIの小片)に分割され、各パッチはパッチの各々について示す正常H&E染色と異常H&E染色とを分類するようにタイル抽出を受ける。タイル抽出は、異常H&E染色を有するパッチを正常H&E染色を示すパッチから区別して取り出すように、当技術で周知の予め設定された病理学的基準を用いてアルゴリズムによって実行され得る。その後、異常H&E染色を示す分類されたパッチは、H&E染色のWSIの各々の合成画像の生成につながる合成プロセスを受ける(S104)。なお、1つの合成画像におけるパッチは、各合成画像が既知のホルモン受容体情報及びステップS105で説明した学習プロセスをいつ受けたのかを示す臨床診断情報を有するように、全て1個体に由来する。
【0046】
その後、ステップS105において、複数の合成画像が、上述したホルモン受容体情報を用いてコンピュータ(例えば、プロセッサ)に組み込まれた機械学習アルゴリズムを学習させ、それにより所望のモデルを確立するのに使用される。
【0047】
本開示のある実施形態によると、合成画像は、
図1の符号S105a~S105cで示すステップを備えるベクトル正則化複素行列因子分解(CMF)法によって学習される。
S105a:各合成画像の複素数値から複素行列を取得するステップ;
S105b:各合成画像について複素行列を複素列ベクトルに変換するステップ;及び
S105c:ステップS105bで取得された複素列ベクトル間の類似度に基づいて各合成画像をホルモン受容体の陽性発現又は陰性発現に分類するステップ。
【0048】
各合成画像が画素当たりの複数の実数によって構成されて画素の実データ行列Xを保有するとすると、ステップS105aの最終的な目的は、実データ行列Xを正規化して複素数値に変換し、それにより、1つの合成画像について複素行列Zを得ることである。なお、合成画像における複素数値はフーリエ変換によって得ることができ、直交座標の点を極座標に変換するのにオイラーの公式が利用される。この手法では、画素強度の値のベクトルが最初に正規化された後に、式(1)を用いてN次元実空間からN次元複素空間にfをマッピングすることによってオイラーの公式を用いて単位球に変換される。
【数1】
なお、x
tは、辞書式順序付での発現画像X
tを備えるN次元ベクトルを示し、x
t(c)∈[0,1]及びα∈R
+である。
【0049】
本開示によると、学習されるN個のパッチ(又は画像)があり、各パッチはM個の実画素を含み、これはM個の複素数値があることを意味する。式(1)を用いて、実画素の複素数値Mに対応する列ベクトル(すなわち、
【数2】
によって示すように、式(1)の右側)が得られる。
【0050】
複素行列Zから各合成画像について複素列ベクトルを得ることを目的とするステップS105bに進む。なお、N個のパッチ及びM個の複素数値があり、合成画像についての複素行列ZはZ∈C
N×Mによって与えられる。目的関数を最小化するために、2つの部分行列W∈C
N×K及びV∈C
K×Mが、複素行列Zから因子分解される。なお、Kは、定数を示す。したがって、2つの部分行列W及びVは、式(2)を用いて算出される。
【数3】
なお、V
HLVは実領域(すなわち、合成画像)における複素グラフ正則化を表し、λは正則化パラメータ
【数4】
であり、αは行列Vの因子の精度と行列の疎密との間のバランスを調整する。複素行列Zを分解することによって、両W及びV部分行列は、複数のパッチ(又は画像)が学習された後に学習及び取得可能となる。
【0051】
最終的に、複素行列Zと部分行列W及びVとの間の関係が得られ、式(3)及び(4)によって示される。
Z=WV (3)
z=Wv (4)
【0052】
なお、式(3)は、zを式(1)に代入することによって式(4)に変換可能である。なお、vは、画像の複素列ベクトルを表す。これにより、各合成画像に対する複素列ベクトルvは、最終的に複素行列Z又は部分行列Vから変換される(S105b)。ある好適な実施形態では、複素列ベクトルvは各合成画像の特徴ベクトルであり、それにより、合成画像のそれらの特徴ベクトルによる更なる解析が可能となる。まとめると、N個のパッチを学習させるとともに複素行列Zを分解することによって、合成画像の複素列ベクトルv(すなわち、特徴ベクトル)が得られる。
【0053】
複素列ベクトルvが得られると、ベクトル正則化CMF法は、分類ステップ(S105c)に進む。ステップS105cにおいて、各合成画像は、その複素列ベクトルv、及びホルモン受容体の発現を含む既知のホルモン受容体情報を有するので、複数の複素列ベクトルv間の類似度を比較することによって、合成画像におけるホルモン受容体の発現パターンは陽性群又は陰性群のいずれかに分類可能となる。あるいは、バイオプシー源に対応する現在の診断情報は、二重確認の目的を果たす。したがって、ステップS101での既知のホルモン受容体情報及び/又は診断情報を用いて、画像は、ホルモン受容体の陽性発現又は陰性発現を認識及び分類し、それにより、H&E染色によるバイオプシーに主に基づいてホルモン受容体状態を判定するためのモデルをまとめて確立するように学習される。本方法のステップS105cにおける使用に適したアルゴリズムは任意の周知の分類アルゴリズムであり得ることが注目に値する。一実施例では、ステップS105cは、k-近傍法(k-NN)アルゴリズムを実行することによって行われる。
【0054】
本方法又はシステム、特にステップS103~S105での使用に適した学習アルゴリズムは深層学習アルゴリズムであってもよく、その例は、これらに限定されないが、畳み込みニューラルネットワーク(CNN)、長短期記憶ネットワーク(LSTM)、再帰型ニューラルネットワーク(RNN)、敵対的生成ネットワーク(GAN)、動径基底関数ネットワーク(RBFN)、多層パーセプトロン(MtLP)、自己組織化マップ(SOM)、深層信念ネットワーク(DBN)、制限ボルツマンマシン(RBM)及びオートエンコーダを含み得る。
【0055】
上述したステップS101~S105を実行することによって、バイオプシーのH&E染色からホルモン受容体状態を直接判定するための充分学習されたモデルが確立される。
【0056】
2.2 被検体のホルモン受容体状態を識別するシステム及び方法
本開示の第2の態様は、被検体から収集されたバイオプシーのH&E染色の候補WSIに基づいてホルモン受容体状態を判定する方法及びシステムに向けられる。
図2及び3を参照する。
【0057】
図2は、画像収集部210、サーバ220及びプロセッサ230を備えるシステム20を示し、画像収集部210及びサーバ220はそれぞれプロセッサ230に結合される。本開示によると、画像収集部210は、被検体からバイオプシーのH&E染色の1以上の候補WSIを収集するように構成される。実施例では、画像収集部210は、顕微鏡カメラ又はホールスライドスキャナである。サーバ220は、上述した本方法10(すなわち、ステップS101~S105)によって確立されたモデル2201を記憶するように構成される。プロセッサ230は、ホルモン受容体状態識別のための本方法の画像認識を実施するように構成される。
【0058】
ある実施形態では、サーバ220及びプロセッサ230は、2つの個々のデバイスとして別個に配置され、あるいは、同じハードウェア内に配置されてもよい。ある実施形態では、サーバ220は、画像収集部210及びプロセッサ230に通信可能に接続され、画像収集部210から受信されてプロセッサ230に解析されるH&E染色の1以上の候補WSIを記憶するように構成される。プロセッサ230は、サーバ220において構築したモデル2201を用いてH&E染色の候補WSIのホルモン受容体状態を判定する方法を実行する命令でプログラムされる。
【0059】
本開示のある実施形態によると、画像収集部210、サーバ220及びプロセッサ230は、相互に通信可能に接続される。画像収集部210、サーバ220及びプロセッサ230の間の通信は、種々の技術を用いて実現され得る。例えば、本サーバ220は、画像収集部210及びプロセッサ230と(ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAM)、インターネット又は無線ネットワークなどの)ネットワークを介して通信するクラウドサーバであってもよい。
【0060】
図3を参照すると、それは、乳癌を有している又は有していると疑われる被検体から収集されたバイオプシーのH&E染色の候補WSIのホルモン受容体状態を判定するためにプロセッサ230上で実施される方法30のフローチャートを示す。方法30は、以下のステップを含む(
図3に示す符号S301~S303を参照)。
S301:H&E染色の候補WSIを複数のパッチに分割するステップ;
S302:タイル抽出を実行することによって異常H&E染色を示すパッチを選択及び合成してテスト画像を生成するステップ;並びに
S303:本方法10によって確立されたモデル2201を用いてステップS302で生成されたテスト画像を処理することによってホルモン受容体状態を判定するステップ。
【0061】
本開示によると、ホルモン受容体状態は、ホルモン受容体の陽性発現又は陰性発現を含む。ある代替実施形態では、ホルモン受容体状態は、ホルモン受容体の発現強度をさらに含む。本方法で使用するホルモン受容体は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択される。
【0062】
H&E染色の候補WSIが得られると、プロセッサ230はタイル抽出を実行し、そこでH&E染色の候補WSIが複数のパッチに分割された後に、異常H&E染色を示すパッチが選択されて1つのテスト画像に合成される(ステップS301~S302)。方法10のステップS102及びS103と同様に、ステップS301及びS302で利用される戦略は、当技術で周知のアルゴリズム及び予め設定された病理学的基準、好ましくは、これらに限定されないが、畳み込みニューラルネットワーク(CNN)、長短期記憶ネットワーク(LSTM)、再帰型ニューラルネットワーク(RNN)、敵対的生成ネットワーク(GAN)、動径基底関数ネットワーク(RBFN)、多層パーセプトロン(MtLP)、自己組織化マップ(SOM)、深層信念ネットワーク(DBN)、制限ボルツマンマシン(RBM)及びオートエンコーダを含む深層学習アルゴリズムによって実行可能である。簡明化のために、ステップS301及びS302については、ここでは再度言及しない。
【0063】
ステップS303に進み、テスト画像が処理され、そのホルモン受容体状態を判定するように、モデル2201に記憶された参照情報と比較される。本開示の一実施形態によると、テスト画像は、プロセッサ230によって行われるベクトル正則化複素行列因子分解(CMF)法を実行することによって処理される。
図3に示すように、ベクトル正則化CMF法は、概略として、(S303a)テスト画像の複素数値から複素行列を取得するステップ、(S303b)テスト画像について複素行列を複素列ベクトルに変換するステップ、及び(S303c)ステップS303bで取得されたテスト画像の複素列ベクトルと、サーバ220に記憶されたモデル2201における合成画像の複素列ベクトルとの間の絶対距離に基づいてテスト画像をホルモン受容体の陽性発現又は陰性発現に分類するステップを含む。
【0064】
テスト画像について複素列ベクトルを取得した後に、分類ステップ(S303c)が進行する。ステップS303cを除いて、ステップS303a及びS303bで利用される戦略は、画像認識のために実画像(すなわち、テスト画像)の特徴ベクトル(すなわち、複素列ベクトル)を取得することも目的とする方法10のステップS105a及びS105bにおいて説明した戦略と類似する。実データの複素数値への変換は、ステップS105a~S105bで詳述したので、簡明化のためにここでは省略する。
【0065】
ステップS105cとステップS303cとの主な相違は、テスト画像に適用される分類戦略である。ステップS105とは異なり、ステップS303cでは、テスト画像の複素列ベクトルは、モデル2201における合成画像のものと、その間の絶対距離を計算することによって、比較するように利用される。一般的に、2つの画像の複素列ベクトル間の距離が近いほど、それらの画像はより類似する。好ましくは、上記計算は、k-近傍法(k-NN)アルゴリズムを実行することによって行われる。テスト画像の複素列ベクトルが陰性発現合成画像の複素列ベクトルに対するよりも陽性発現合成画像の複素列ベクトルに対して近い場合、テスト画像の複素列ベクトルは陽性発現ベクトルと識別される。逆に、それが陰性発現合成画像に近い場合、それは陰性発現ベクトルと識別される。実際に、モデル2201では、テスト画像の複素列ベクトルは、全ての合成画像のものと比較される。各比較は、単一の識別結果をもたらし、1つのテスト画像の全体比較に対して複数の識別結果を生成する。陽性ホルモン受容体発現に対応する複素列ベクトルの数は陰性発現のものよりも大きい場合、テスト画像は陽性ホルモン受容体発現を保有するものと判定される。逆に、陰性発現に対応する複素列ベクトルの数の方が大きい場合、テスト画像は陰性ホルモン受容体発現を示すものと判定される。したがって、ステップS303cは、被検体に由来するテスト画像におけるホルモン受容体の陽性発現又は陰性発現を正確に判定する。
【0066】
好適な一実施形態では、テスト画像を処理するためのベクトル正則化CMF法は、発現強度判定のステップ(ステップS303d)をさらに備える。ステップS303cにおける比較は陽性及び陰性ホルモン受容体発現について複数の識別数となるので、発現強度は、それらの数の比としてさらに計算され、それにより、陽性発現又は陰性発現の割合を表す。例えば、モデルが参照画像として使用される合計15個の合成画像を有する場合、これらの合成画像とテスト画像との比較は、15個のうち10個の陽性発現及び5個の陰性発現をもたらす。結果として、ホルモン受容体状態は陽性とみなされ、その発現強度は10/15(15個のうちの10個の発現)として表される。この計算を行うことによって、ステップS303dは、被検体からテスト画像におけるホルモン受容体発現の強度をさらに判定する。
【0067】
2.3 癌を判定及び処置する方法
本開示は、乳癌を患い又はそれを発症していると疑われる被検体に診断及び処置を提供することも目的とする。この目的のため、上述した方法、モデル及びシステムは、ホルモン受容体状態の正確な判定によって臨床医を支援するのに利用され得る。したがって、本開示は、被検体における乳癌を判定及び処置する方法に向けられる他の態様を包含する。
【0068】
本開示のある実施形態によると、その方法は、
(a)被検体のバイオプシーからヘマトキシリン及びエオジン(H&E)染色のホールスライドイメージ(WSI)を取得するステップと、
(b)上述した方法及びシステムを用いて被検体のホルモン受容体状態を判定するステップと、
(c)ステップ(b)のホルモン受容体状態に基づいて被検体に抗癌処置を施すステップと、を備える。
【0069】
本方法は、哺乳動物、例えば、ヒト、マウス、ラット、ハムスター、モルモット、ウサギ、イヌ、ネコ、ウシ、ヤギ、ヒツジ、サル又はウマであり得る被検体のバイオプシーからH&E染色のホールスライドイメージ(WSI)を取得することによって開始する。好ましくは、被検体はヒトである。適切なツール及び/又は手順が、バイオプシー及びそのWSIを得るのに実行され得る。一実施例では、バイオプシーはヘマトキシリン及びエオジンによって染色された胸部バイオプシーであり、そのWSIは、本システム20の画像収集部210(例えば、顕微鏡カメラ又はホールスライドスキャナ)などの画像収集デバイスによって撮像及び収集される。
【0070】
その後、被検体のホルモン受容体の状態が、上述した方法30によって判定可能となる。本開示によると、ホルモン受容体状態は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び/又はそれらの組合せからなる群から選択されたホルモン受容体の陽性発現又は陰性発現並びにその発現強度を含む。
【0071】
被検体のホルモン受容体状態が判定され、任意選択的に確認されると、それは、抗癌処置が被検体に施されるべきか否かの判定のための指標として使用され得る。ある実施形態では、WSIが陽性ER/PR発現を示すと判定される場合、被検体はER/PR陽性の乳癌を発症している可能性があり又はそのリスクを有するので、ER/PR陽性の乳癌に関連する症状を予防又は改善するために抗癌処置が被検体に施される。他の実施形態では、WSIが陰性ER/PR発現を示すと判定される場合、被検体はER/PR陰性の乳癌を発症している可能性があり又はそのリスクを有するので、ER/PR陰性の乳癌に関連する症状を予防又は改善するために抗癌処置が被検体に施される。
【0072】
本方法での使用に適した(すなわち、ホルモン受容体状態が陽性発現又は陰性発現を示す被検体に施すための)抗癌処置の例は、これらに限定されないが、外科手術、高周波アブレーション、全身化学療法、肝動脈的化学塞栓療法(TACE)、免疫療法、標的薬物療法、ホルモン療法及びこれらの組合せを含む。いずれの臨床技師も、処置されている特定の状態、状態の重症度、個々の患者パラメータ(年齢、体調、体格、性別及び体重を含む)、治療の継続期間、併用治療の性質(もしあれば)、投与の具体的経路、並びに医療従事者の知識及び専門知識内の同様の要因などの要因に基づいて本方法での使用に適した処置を選択し得る。
【0073】
上記特徴によって、本方法は、免疫組織化学(IHC)染色なしでH&E染色のWSIに主に基づくホルモン受容体状態の正確な判定及び識別を提供し、それにより、乳癌の診断の精度及び効率を向上し、識別された患者が適切に処置されることを可能とすることができる。
【実施例0074】
材料及び方法
データ収集
胸部バイオプシーのH&E染色の合計166個のエストロゲン受容体(ER)発現ホールスライドイメージ(WSI)及びH&E染色の合計163個のプロゲステロン受容体(PR)WSIを、Mackay Memorial病院(台北市)の胸部外科手術の部署から取得し、画像認識及び検証のモデルを構築するために使用した。
【0075】
画像処理及びタイル抽出
データベースから得られた各WSIを8倍の正則化画素サイズとした後、CNNモデルを利用することによる更なる深層学習処理のために256×256個のパッチに分割した。
【0076】
パターン認識のためのベクトル正則化複素行列因子分解(CMF)
本ベクトル正則化CMF法は、制約最適化問題を非制約最適化問題に直接変換することを目的とした。オイラーの公式の原理に基づいて、画素強度の値のベクトルを正規化した後に、以下の式
【数5】
を用いてN次元実空間からN次元複素空間にfをマッピングすることによって単位球に変換した。なお、x
tは、辞書式順序付での発現画像X
tを備えるN次元ベクトルを示し、x
t(c)∈[0,1]及びα∈R
+である。
【0077】
次に、行列Z∈C
N×Mを条件として、以下の目標関数
【数6】
を最小化する2つの行列W∈C
N×K及びV∈C
K×Mを求める。なお、λは正則化パラメータ
【数7】
であり、λは行列Vの因子の精度と行列の疎密との間のバランスを調整する。特に、
【数8】
である。
【0078】
実施例1 本開示の画像認識モデルの構築
この実験は、WSI認識のために学習された機械学習モデルを与えることを目的とした。この目的のため、エストロゲン受容体(ER)認識及びプロゲステロン受容体(PR)認識のための2つのモデルを、「材料及び方法」の章で説明した手順に従ってそれぞれ確立した。具体的には、ER認識(モデルI)については、陽性ER発現を示す107個のWSI及び陰性ER発現を示す26個のWSIを含む合計133個のWSIを使用し、PR認識(モデルII)については、陽性PR発現の91個及び陰性PR発現の39個を含む合計130個のWSIを使用した。
【0079】
実施例2 本画像認識モデルの評価
次に、実施例1のホルモン受容体状態判定のための学習されたモデル及び方法の画像認識効率を検証した。この目的のため、ER発現及びPR発現を含む33個の候補WSIを処理して本ベクトル正則化CMF法を利用する本モデル(すなわち、上述したモデルI及びII)に入力した。式(1)及び(2)において、2つのパラメータα及びλの値を、それぞれ間隔[0,2]及び0.01に調整した。
【0080】
本モデルによるER識別及びPR識別に対する識別率はそれぞれ86%及び81%であることが分かった。
【0081】
患者から取得される病理学的バイオプシーは、本方法及びシステムを用いて、追加のIHC検査なく自動的に解釈及び識別され、それにより乳癌診断の効率及び精度を向上することができる。
【0082】
実施形態の上記説明は例としてのみ与えられるものであること、及び種々の変形が当業者によってなされ得ることが理解されるはずである。上記仕様、例示及びデータは、本発明の例示的な実施形態の構造及び使用の完全な説明を与える。本発明の種々の実施形態をある程度の特殊性により又は1以上の個々の実施形態を参照して上述したが、当業者であれば、本発明の主旨又は範囲から逸脱することなく開示の実施形態に対する多数の変更を行い得る。
前記ベクトル正則化CMF法は、(c-4)請求項1に記載の方法によって確立された前記モデルの前記合成画像における陽性発現及び陰性発現にそれぞれ対応する複素列ベクトル数間の比に基づいて前記テスト画像における前記ホルモン受容体の発現強度を判定するステップをさらに備える、請求項9に記載の方法。
前記ベクトル正則化CMF法は、(c-4)前記サーバに記憶された前記モデル内の前記合成画像における陽性発現及び陰性発現にそれぞれ対応する複素列ベクトル数間の比に基づいて前記テスト画像における前記ホルモン受容体の発現強度を判定するステップをさらに備える、請求項16に記載のシステム。