IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌイーシー ラボラトリーズ アメリカ インクの特許一覧

<>
  • 特表-腫瘍細胞等値線 図1
  • 特表-腫瘍細胞等値線 図2
  • 特表-腫瘍細胞等値線 図3
  • 特表-腫瘍細胞等値線 図4
  • 特表-腫瘍細胞等値線 図5
  • 特表-腫瘍細胞等値線 図6
  • 特表-腫瘍細胞等値線 図7
  • 特表-腫瘍細胞等値線 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-05-02
(54)【発明の名称】腫瘍細胞等値線
(51)【国際特許分類】
   G01N 33/48 20060101AFI20240424BHJP
   G06T 7/00 20170101ALI20240424BHJP
   G06V 10/82 20220101ALI20240424BHJP
   G01N 33/483 20060101ALI20240424BHJP
   C12Q 1/04 20060101ALI20240424BHJP
【FI】
G01N33/48 M
G06T7/00 630
G06T7/00 350C
G06V10/82
G01N33/483 C
G01N33/48 Z
C12Q1/04
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023561301
(86)(22)【出願日】2022-04-04
(85)【翻訳文提出日】2023-10-19
(86)【国際出願番号】 US2022023266
(87)【国際公開番号】W WO2022216585
(87)【国際公開日】2022-10-13
(31)【優先権主張番号】63/170,649
(32)【優先日】2021-04-05
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/711,475
(32)【優先日】2022-04-01
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】504080663
【氏名又は名称】エヌイーシー ラボラトリーズ アメリカ インク
【氏名又は名称原語表記】NEC Laboratories America, Inc.
(74)【代理人】
【識別番号】100123788
【弁理士】
【氏名又は名称】宮崎 昭夫
(74)【代理人】
【識別番号】100127454
【弁理士】
【氏名又は名称】緒方 雅昭
(72)【発明者】
【氏名】コサット、 エリック
【テーマコード(参考)】
2G045
4B063
5L096
【Fターム(参考)】
2G045AA26
2G045CB02
2G045FA19
2G045JA01
2G045JA03
4B063QA01
4B063QA18
4B063QQ02
4B063QS28
4B063QX01
5L096BA06
5L096BA13
5L096EA06
5L096FA32
5L096FA69
5L096GA51
5L096HA11
5L096JA22
5L096KA04
(57)【要約】
スキャンされた組織切片を処理するための方法とシステムには、スキャンされた組織内の細胞の位置を特定する(210)ことが含まれる。スキャンされた組織内の細胞は、分類モデルを用いて分類される(214)。分類された正常細胞と腫瘍細胞に基づいて、腫瘍細胞比(TCR)マップが作成される(508)。TCRマップを用いて、目標TCR値に対するTCR等値線を生成し(510)、TCRが目標TCR値以上である組織切片の領域をマークする。は、等値線によって特定された領域を単離するために組織サンプルに対して解剖が行われる(311)。
【選択図】図1
【特許請求の範囲】
【請求項1】
スキャンされた組織切片を処理するための、コンピュータに実装された方法であって、
スキャンされた組織内の細胞の位置を特定する(210)ことと、
分類モデルを使用して、前記スキャンされた組織内の細胞を分類する(214)ことと、
分類された正常細胞と腫瘍細胞とに基づいて、腫瘍細胞比(TCR)マップを生成する(508)ことと、
前記TCRマップを用いて目標TCR値のTCR等値線を生成し(510)、TCRが前記目標TCR値以上である前記組織切片の領域をマーキングすることと、
前記等値線によって特定される領域を単離するために、前記組織のサンプルを解剖する(311)こととを含む方法。
【請求項2】
前記分類モデルが完全畳み込みニューラルネットワークモデルである、請求項1に記載の方法。
【請求項3】
前記TCRマップを生成することは
前記組織切片の第1のマップにおいてすべての細胞位置を特定することと、
前記組織切片の第2のマップにおいて腫瘍細胞の位置を特定することと、
前記第1のマップと前記第2のマップとを平滑化することと、
前記第1のマップに対する前記第2のマップの成分別比率を用いてTCRマップを生成することとを含む、請求項1に記載の方法。
【請求項4】
前記第1のマップおよび前記第2のマップは、1画素当たり1細胞の解像度を有する、請求項3に記載の方法。
【請求項5】
前記第1のマップおよび前記第2のマップは、1画素当たり1細胞未満の解像度を有し、細胞位置および腫瘍細胞位置を特定することは、それぞれの細胞の座標位置に対応する画素に小数値を累積することを含む、請求項3に記載の方法。
【請求項6】
前記第1のマップと前記第2のマップとを平滑化することは、局所平均化を含む、請求項3に記載の方法。
【請求項7】
前記第1のマップと前記第2のマップとを平滑化することは、平均化カーネルを畳み込むことを含む、請求項3に記載の方法。
【請求項8】
前記平均化カーネルがガウスカーネルである、請求項7に記載の方法。
【請求項9】
最小画素値を0とし、最大画素値を1とするように、前記TCRマップを正規化することをさらに含む、請求項3に記載の方法。
【請求項10】
前記目標TCR値の等値線を生成することは、
閾値を用いて前記TCRマップ上に等値線を設定することと、
前記等値線によって選択された細胞の実際のTCRを決定することと、
前記実際のTCRと前記目標TCR値との比較に応じて、閾値TCR値を調整することとを含む反復工程を含む、請求項1に記載の方法。
【請求項11】
スキャンされた組織の切片を処理するシステムであって、
ハードウェアプロセッサ(602)と、
マイクロダイセクション装置(614)と、
コンピュータプログラムを記憶するメモリ(604)とを有し、
前記コンピュータプログラムは、前記ハードウェアプロセッサに、
スキャンされた組織内の細胞の位置を特定する(210)手順と、
分類モデルを使用して、前記スキャンされた組織のサンプル内の前記スキャンされた組織内の細胞を分類する(214)手順と、
分類された正常細胞と腫瘍細胞とに基づいて、腫瘍細胞比(TCR)マップを生成する(508)手順と、
前記TCRマップを用いて目標TCR値のTCR等値線を生成し(510)、TCRが前記目標TCR値以上である前記組織切片の領域をマーキングする手順と、
前記マイクロダイセクション装置を使用して、前記等値線によって特定される領域を単離するために、前記組織のサンプルを解剖する(311)手順とを実行させるためのコンピュータプログラムであるシステム。
【請求項12】
前記分類モデルが完全畳み込みニューラルネットワークモデルである、請求項11に記載のシステム。
【請求項13】
前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、
前記組織切片の第1のマップにおいてすべての細胞の位置を特定する手順と、
前記組織切片の第2のマップにおいて腫瘍細胞の位置を特定する手順と、
前記第1のマップと前記第2のマップとを平滑化する手順と、
前記第1のマップに対する前記第2のマップの成分別比率を用いてTCRマップを生成する手順とを実行させる、請求項11に記載のシステム。
【請求項14】
前記第1のマップおよび前記第2のマップは、1画素当たり1細胞の解像度を有する、請求項13に記載のシステム。
【請求項15】
前記第1のマップおよび前記第2のマップは、1画素当たり1細胞未満の解像度を有し、前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、細胞を特定するために、それぞれの細胞の座標位置に対応する画素に小数値を累積する手順を実行させる、請求項13に記載のシステム。
【請求項16】
前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、局所平均を用いて、前記第1のマップと前記第2のマップとを平滑化する手順を実行させる、請求項13に記載のシステム。
【請求項17】
前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、平均化カーネルの畳み込みを用いて、前記第1のマップと前記第2のマップとを平滑化する手順を実行させる、請求項13記載のシステム。
【請求項18】
前記平均化カーネルがガウスカーネルである、請求項17記載のシステム。
【請求項19】
前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、最小画素値を0とし、最大画素値を1とするように、前記TCRマップを正規化する手順を実行させる、請求項13に記載のシステム。
【請求項20】
前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、
閾値を用いて前記TCRマップ上に等値線を設定する手順と、
前記等値線によって選択された細胞の実際のTCRを決定する手順と、
前記実際のTCRと前記目標TCR値との比較に応じて、閾値TCR値を調整する手順とを反復させて実行させる、請求項11記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願情報
本出願は、2022年4月1日に出願された米国非仮特許出願第17/711,475号および2021年4月5日に出願された米国仮特許出願第63/170,649号の優先権を主張し、その全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
技術分野
本発明は、腫瘍細胞の検出および分類に関し、より詳細には、スライド画像内でそれぞれの密度の腫瘍細胞に関連する領域を識別することに関する。
【0003】
関連技術の説明
癌の攻撃性の指標である腫瘍細胞比を得るには、腫瘍領域の細胞数を数える必要がある。組織サンプルによっては、細胞の数が数百万個になることもある。これほど多くの細胞を数えることは人間には不可能であり、推定技術も不正確になりがちである。
【発明の概要】
【0004】
スキャンした組織切片を処理する方法は、スキャンした組織内の細胞の位置を特定することを含む。スキャンされた組織内の細胞は、分類モデルを用いて分類される。分類された正常細胞と腫瘍細胞とに基づいて腫瘍細胞比(TCR)マップが作成される。TCRマップを用いて、TCRが目標TCR値以上である組織切片の領域をマークし、目標TCR値に対するTCR等値線を作成する。組織サンプルを解剖し、等値線で特定された部位を分離する。
【0005】
スキャンされた組織切片を処理するシステムは、ハードウェアプロセッサ、マイクロダイセクション装置、およびコンピュータプログラムを格納するメモリを含む。ハードウェアプロセッサによって実行されると、コンピュータプログラムは、ハードウェアプロセッサに、スキャンされた組織内の細胞の位置を特定することと、スキャンされた組織サンプル内のスキャンされた組織内の細胞を分類器モデルを用いて分類することと、分類された正常細胞と腫瘍細胞とに基づいて腫瘍細胞比(TCR)マップを生成することと、TCRマップを使用してTCR値に対するTCR等値線を生成し、TCRがTCR値以上である組織切片の領域をマーキングし、マイクロダイセクション装置を用いて、等値線によって特定された領域を分離するために組織サンプルに対して解剖を実行することとを実行させる。
【0006】
これらおよび他の特徴および利点は、添付図面と関連して読まれる、その例示的実施形態の以下の詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0007】
本開示は、以下の図を参照して、好ましい実施形態の以下の説明において詳細を提供する。
【0008】
図1】本発明の一実施形態による、ホールスライドスキャナと腫瘍細胞比(TCR)等値線とを用いた組織サンプルの処理のブロック図である。
【0009】
図2】本発明の一実施形態による、TCR等値線を生成するためにスキャンした組織サンプルを分析する方法のブロック/フロー図である。
【0010】
図3】本発明の一実施形態による、組織サンプル内の細胞を分類し、組織サンプルのマイクロダイセクションで使用するために組織サンプル内の等値線を特定するためにモデルを訓練し使用する方法のブロック/フロー図である。
【0011】
図4】本発明の一実施形態による、様々な異なるTCR値の等値線を含む組織サンプルの画像である。
【0012】
図5】本発明の一実施形態による、TCR等値線の生成方法のブロック/フロー図である。
【0013】
図6】本発明の一実施形態による、TCR等値線を特定し、さらに特定されたTCR等値線を用いてマイクロダイセクションを行うスライド分析システムのブロック図である。
【0014】
図7】本発明の一実施形態による、ニューラルネットワークモデルの一部として使用され得る例示的なニューラルネットワークアーキテクチャの図である。
【0015】
図8】本発明の一実施形態による、ニューラルネットワークモードの一部として使用され得る例示的な深層ニューラルネットワークアーキテクチャの図である。
【発明を実施するための形態】
【0016】
腫瘍細胞比(TCR)を特定するために、組織サンプルの所定領域について正常細胞と腫瘍細胞とを自動的にカウントすることができる。高倍率の画像は個々の細胞の詳細を示すために使用され、低倍率の画像は腺などの大きな構造において細胞がどのように配置されているかを明らかにする。癌細胞は、個々の細胞の特徴、細胞の並び方、あるいはその両方によって、健康な細胞と対比することができる。
【0017】
TCRを特定することは、遺伝子パネル検査のための組織部位の選択に役立つ。このような検査では、遺伝子配列決定が成功するためには、腫瘍細胞の割合が最低限(例えば、少なくとも約25%)必要な場合がある。遺伝子検査は高価で、時間がかかり、破壊的であるため、検査を実施するのに十分な腫瘍細胞がある組織の一部を選択することが重要である。スライドのマークされた領域を使用して、組織を微小解剖し、検査に必要な領域を分離することができる。このマイクロダイセクションは、例えばレーザを使ってマークされた領域を分離するなど、自動的に行うことができる。
【0018】
組織の選択は、例えば目視による推定など、手作業で行うことができるが、人間のオペレータは、特に全体的なTCRが低い組織の領域については、TCRの推定が不正確になる可能性がある。しかし、機械学習モデルを用いれば、領域内のすべての細胞を検出・分類し、スライド上の各位置におけるTCRを定量的に算出することが可能になる。そして、TCRが所定の値以上である領域を決定することができる。例えば、少なくとも30%の腫瘍細胞を含む領域が特定される。これらの領域は、TCRが一定値にとどまる等高線(地形図における等高線のようなもの)によって定義することができる。これらの等高線は、本明細書では「等値線」と呼ばれ、TCRが所定の値以上である領域を特定するために使用される。
【0019】
このようなTCR等値線を用いれば、病理医や技師はTCRの高い領域を目で見て推定する必要がなくなり、組織領域の選択がより客観的で正確になる。その後、特定された組織領域は手動で切断されるか、自動的にマイクロダイセクション装置に送られる。マイクロダイセクション装置はマスクから操作し、単一細胞ほどの小さな領域をレーザで切断することができるが、本明細書で生成されたTCR等値線は、人間でも機械でも容易に解釈することができる。
【0020】
機械学習モデルへの入力には、例えばホールスライドイメージング(WSI)スキャナによって生成されたスライドファイルを含めることができる。スライド画像は、処理ハードウェアに最適なタイルのグリッドに分割することができる。出力には、すべての癌細胞と正常細胞との位置、各タイルのTCR、特定領域またはスライド全体のTCRの集計のレポートが含まれる。等値線は、TCRが所与の値にあるか、または所与の値よりも大きな領域を特定するために計算することができる。例えば、赤は腫瘍細胞の比率が比較的高いことを示し、青は腫瘍細胞の比率が低いことを示す。個々の腫瘍細胞はハイライトされ、腫瘍細胞が増殖している場所を示すことができる。等値線は、等高線または領域ハッチングのオーバーレイとして描かれ、色分け(またはダッシュ/ハッチングスタイルのコード化)され、それらに囲まれた領域内のTCRを示す。
【0021】
ここで、同様の数字が同一または類似の要素を表す図を詳細に参照し、最初に図1を参照すると、組織サンプルを分析し、TCR報告書を提供するシステムが示されている。組織サンプル102を採取し、スライドにのせる。スライドはホールスライドスキャナでスキャンされ、スライド画像が生成され、スライドデータベース106に保存される。
【0022】
スライド分析108は、各画像を処理タイルに分割してもよく、この処理タイルは、規則的なグリッドに従って細胞および腫瘍細胞を特定するために分析されてもよく、および/または、スライド画像の注目すべき切片のユーザの指示に従って決定されてもよい。
【0023】
スライド分析108は、例えばTCR、癌細胞の位置などを含む、スライド102から得られた情報を特徴付ける報告書110を生成することができる。この報告書110は、医療専門家が患者の診断に役立てたり、癌の種類や程度を特定したり、治療方針を特定したりするためなどに使用することができる。報告書110はさらに、TCRが所定の値以上である組織の領域を特定する分離情報を含むことがある。
【0024】
一旦報告書110が作成されると、マイクロダイセクションのためにスライド102の領域を特定するために使用することができる。例えば、マイクロダイセクション装置112は、等値線に基づいて、高いTCR値を有する領域を自動的に単離することができ、単離された領域は、その後、遺伝子検査に使用することができる。
【0025】
次に図2を参照すると、スキャンしたスライドに対して分析200を実行する方法が示されている。ブロック202は、スライド画像内の組織サンプルを特定する。これには、例えば、比較的低い解像度でスライド全体を分析し、例えば境界検出によって組織サンプルを特定することが含まれる。これには、スライド102自体にマーカを使用して付けられたマークや、スライド画像上にデジタル的に付けられたマークなど、フォーカスすべき画像の領域を示す、ユーザによって付けられたマークを特定することも含まれる。
【0026】
ブロック204は、特定された組織サンプルから処理タイルを生成する。これは、例えば、正方形の領域の規則的なグリッドを生成することを含むが、画像の任意の適切な細分化が使用されてもよいことが理解されるべきである。ユーザは、さらにタイルの一部を削除して、それらの領域のさらなる分析を防ぐことができる。タイルは、複数のプロセッサまたはプロセッサコアに作業負荷を分割するために使用されることがあり、それによって処理速度が向上する。
【0027】
処理タイルは、ブロック208でニューラルネットワークモデルへの入力として供給される。このモデルは、細胞を検出し、正常か癌かを分類するように訓練された完全畳み込みニューラルネットワークであっても良い。モデルのアーキテクチャは、関連する任意の配置で任意の数の層を含むことができる。完全畳み込みモデルは入力画像を受け取り、細胞の位置を特定し分類するために解釈できるマップのセットを出力として生成する。
【0028】
モデルの訓練により、閾値を持つ訓練されたモデルが生成される。訓練されたモデルは、訓練された閾値を使用して、入力画像内のすべての細胞の位置を特定して分類し、正常または癌として分類するために解釈できるマップを出力することができる。ブロック210では、出力マップと検出閾値を用いて細胞の位置を特定する。ブロック212では、検出された細胞の位置と出力マップとを使用して各細胞にスコアが割り当てられる。このスコアは与えられた細胞が癌である可能性の確率的値を表す。例えば、確率的値は0から1までの範囲で、ブロック214で計算される。0に近い値は正常細胞である可能性が高いことを示し、反対に1に近い値は癌細胞である可能性が高いことを示す。モデルの訓練中に得られた分類の閾値は、各細胞を、確率スコアが閾値よりも低い正常細胞、または確率スコアが閾値以上の癌細胞として分類するために使用されても良い。ブロック214でセルが分類されると、ブロック216は等値線を生成する。等値線は、TCRが一定値である輪郭を決定することによって形成される。各等値線は、スライド画像の1つ以上の領域を囲んでも良い。
【0029】
次に図3を参照すると、全体的なプロセスが示されている。ブロック302は、機械学習モデルの訓練データを生成する。この訓練データには、臨床で遭遇する特定の状態を代表する、患者のスキャンした組織サンプルスライドからの関心領域のセットを含めることができる。関心領域は、腫瘍を含む領域の特定を含むすべての細胞の位置を特定するために、病理学者などの領域専門家によって注釈付けされても良い。細胞の位置は、各細胞核の中心にあるそれぞれの点によってラベル付けされても良く、腫瘍領域はフリーハンドの輪郭によって描かれても良い。ブロック304は、生成された訓練パッチを使用して、完全畳み込みニューラルネットワークモデルを訓練する。モデルには、適切な完全畳み込みアーキテクチャを使用することができる。
【0030】
ブロック306は、患者から組織サンプルを採取する。場合によっては、この組織サンプルは、癌が疑われる組織の生検サンプルであることもある。組織サンプルはスライドに載せられ、ブロック308で全スライドイメージングを用いてスキャンされる。
【0031】
ブロック200は、次に、例えば図2に関連して上述したように、スキャンされたサンプルを分析することができる。この解析により、特定のTCR値を持つ領域を特定する等値線が生成されても良い。ブロック311は、例えば比較的高いTCRを有する組織サンプルの一部を単離するために、組織サンプルのマイクロダイセクションを実行する。このマイクロ解剖されたサンプルは、ブロック312において、患者に治療薬を作成し投与するために使用される。
【0032】
例えば、ブロック312は、癌の種類や潜在的な治療法を特定するのに役立つ癌組織に関する情報を決定することができる。このような治療には、手術や化学療法などの医薬品の投与が含まれる。
【0033】
次に図4を参照すると、ブロック204で処理タイルが生成された後の例示的なスライド画像400が示されている。スライド画像400には、スキャンされた組織サンプル402が含まれる。この場合、スキャンされた組織画像402の上にグリッドを適用することによって、画像内で多数のタイル404が特定され、それぞれのグリッド内にある画素がそれぞれのタイルを構成する。タイル404がマーカ406によって確立された境界内にのみ決定されるように、タイルを制限するために、人間のオペレータによって提供された一組のマーカ406も示されている。
【0034】
各タイル404は、例えば、複数のプロセッサまたはプロセッサコアにわたる並列処理を使用して、別々に処理され得る。タイルの総数は、利用可能な処理スレッドの数で分割して、タイルのセットを形成することができる。各セットは、それぞれのスレッドによって直列に処理される。
【0035】
等値線408は破線で示されている。異なる破線の等値線408は、TCR値が異なる領域を示す。したがって、第1の等値線(比較的長いダッシュで示す)は、比較的低いTCR値の領域(例えば、約20%)を表し、第2の等値線(中程度のダッシュで示す)は、中間のTCR値の領域(例えば、約25%)を表し、第3の等値線(比較的短いダッシュで示す)は、比較的高いTCR値の領域(例えば、約30%)を表すことができる。
【0036】
次に図5を参照すると、ブロック216における等値線の生成について、さらなる詳細が示されている。このプロセスは地形図の作成に似ており、等高線(または等値線)は高度が一定である経路を表している。スライドTCRマップは、TCRが一定値である経路を表し、TCRがその値以上である領域を境界とする等値線を計算するために使用することができる。したがって、最初のステップはTCRマップを作成することである。
【0037】
例示的なアプローチでは、ブロック502は、2つのオーバービューマップを初期化する(例えば、マップのすべての画素を0に設定する)。各オーバービューマップは、元画像よりも低い解像度で、スライドの分析領域全体を表している。分解能は、精度に対するランシング速度によって選択することができる。解像度が低いと粗い等値線が素早く生成され、解像度が高いと計算に時間がかかるが、滑らかで正確な等値線が生成される。最も有効な解像度は、細胞のサイズが約1画素の場合であり、それ以上の解像度では精度の向上は望めない。最初のオーバービューマップは全細胞を対象としたもので、2つ目は腫瘍細胞のみを対象としたものである。
【0038】
ブロック504はマップ上に細胞を描く。正常細胞は最初のマップにのみ描画され、腫瘍細胞は両方のマップに描画される。最高の解像度(例えば、1画素に1細胞)で細胞を描画する処理は、その細胞の位置の値を1に設定することを含んでも良い。低解像度のマップでは、細胞のサイズに対応する小数が計算され、細胞の位置に累積される。ブロック506は、平滑化を行ってそれぞれのマップを計算する。平滑化は、局所的な平均化またはガウスカーネルをマップに畳み込むことによって行うことができる。
【0039】
平滑化は、結果として得られるTCRマップが、意味のある輪郭の等値線の抽出を妨げる可能性のある、過度にノイズの多いものにならないようにするのに役立つ。レーザマイクロダイセクション装置は、あらゆる形状のマスクファイルから直接組織領域をマイクロ解剖することができるが、穴のないTCRの高い領域を包含する単純な滑らかな等値線を生成することができる。マイクロダイセクション装置が利用できない場合、人間の技術者が解剖を行うことがあり、シンプルで解釈しやすいガイドが有益であろう。
【0040】
平滑化は局所平均に似ており、その強度は平均化カーネルのサイズによって制御できる。3×3カーネルのような小さなサイズのカーネルは、非常に局所的な平滑化を行い、結果として非常にノイズの多いマップになる。一方、100×100のような大きなカーネルサイズでは、非常に滑らかなマップになるが、有用な特徴が失われる可能性がある。カーネルサイズは、意味のある平均を得るのに十分な細胞を含むべきで、例えば100から400細胞の間である。したがって、細胞当たり1画素の解像度で、10×10~約20×20のカーネルサイズを使用することができる。
【0041】
次にブロック508は、腫瘍細胞マップと全細胞マップとの間の比を決定し、値を0と1との間の範囲に正規化してTCRマップを生成する。これは、全細胞マップに対する腫瘍細胞マップの成分別比率を取ることによって行うことができる。
【0042】
ブロック510では、平滑化および正規化されたTCRマップをガイドとして使用して候補等値線を生成し、特定されたTCRが目標TCRに近い等値線を検索することにより、1つ以上の与えられた目標TCR値に対して1つ以上の等値線を反復的に見つけることができる。TCRマップは平滑化され正規化されているため、その値はもはや実際のTCR値ではないかもしれない。また、平滑化されたTCRマップは、多くの山や谷を含むことがあり、等値線等高線は谷を完全に含み、等高線内に穴ができることがある。従って、所望の目標実TCR値に対応するTCR等値線が特定される可能性がある。
【0043】
例えば、少なくとも25%の腫瘍細胞を有するスライド領域が注目され、その許容範囲は約1%である。平滑化TCRマップ上の最初の等値線候補は、この値(25%)で抽出される。平滑化されたTCRマップからの等値線抽出には、与えられた値でマップを閾値処理し、連結された画素の輪郭を抽出することが含まれる。この操作によって、画素がつながった複数の異なる領域が生成されることがあり、そのため等値線は複数の輪郭で表されることがある。等値線輪郭を使って、輪郭内にあるすべての細胞を選択する。そして、選択された細胞の実際のTCRを計算することができる。
【0044】
例えば、実際のTCRが22%の場合を考えてみよう。これは望ましいTCRの25%よりも小さく、許容範囲外である。作業値は、5%などの増分dTだけ増加させることができる。その後、作業用TCRを30%にし、TCRマップの閾値処理を繰り返して等値線を抽出することができる。実際のTCRを計算すると、27%という模範的な値が得られ、これは目標値より大きくなっている。増分を例えば半分に調整し、このプロセスを繰り返しても良い。したがって、dT=-2.5%の例に従えば、実用TCRは30%-2.5%=27.5%となる。実際のTCRは再度計算され、この例では25.5%となり、目標TCRの1%許容範囲内となる。これでブロック510の反復処理が停止し、ブロック512で等値線が出力される。ブロック510は、追加の等値線の値について繰り返すことができる。状況によっては、実際のTCRが安定したままであるにもかかわらずターゲットに十分に近づけない場合、この探索がいつまでも続く可能性がある。この場合、別の停止基準として、dTの最小値に達したときに停止することもできる。等値線は、その輪郭を定義する二次元スライド座標のベクトルの形で、例えば、マイクロダイセクション装置で使用できるフォーマットを有するファイルに出力しても良い。等値線は、病理医や技師が手作業で組織をマイクロダイセクションする際の視覚的ガイドとして、スライド画像の概観上に描画することもできる。
【0045】
本明細書に記載する実施形態は、完全にハードウェアであってもよく、完全にソフトウェアであってもよく、または、ハードウェア要素とソフトウェア要素との両方を含むものであってもよい。好ましい実施形態では、本発明は、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むがこれらに限定されないソフトウェアで実施される。
【0046】
実施形態は、コンピュータまたは任意の命令実行システムによって、またはそれに関連して使用するためのプログラムコードを提供する、コンピュータ使用可能またはコンピュータ可読媒体からアクセス可能なコンピュータプログラム製品を含むことができる。コンピュータ使用可能媒体またはコンピュータ可読媒体は、命令実行システム、装置、またはデバイスによって、またはそれに関連して使用するためのプログラムを格納、通信、伝搬、またはトランスポートする任意の装置を含むことができる。媒体は、磁気、光学、電子、電磁気、赤外線、または半導体システム(または装置またはデバイス)、または伝搬媒体とすることができる。媒体は、半導体または固体ステートメモリ、磁気テープ、リムーバブルコンピュータディスケット、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、リジッド磁気ディスクおよび光ディスクなどのコンピュータ読み取り可能な記憶媒体を含むことができる。
【0047】
各コンピュータプログラムは、本明細書に記載する手順を実行するために、記憶媒体または装置がコンピュータによって読み取られるときに、コンピュータの操作を構成し制御するために、汎用または特殊目的のプログラム可能コンピュータによって読み取り可能な、機械読み取り可能な記憶媒体または装置(例えば、プログラムメモリまたは磁気ディスク)に実体的に記憶することができる。本発明のシステムはまた、コンピュータプログラムで構成された、コンピュータ読み取り可能な記憶媒体で実施されるものと考えることができ、その場合、構成された記憶媒体は、コンピュータを特定の所定の方法で動作させて、本明細書に記載する機能を実行させる。
【0048】
プログラムコードを記憶および/または実行するのに適したデータ処理システムは、システムバスを介してメモリ要素に直接的または間接的に結合された少なくとも1つのプロセッサを含んでもよい。メモリ要素は、プログラムコードの実際の実行中に採用されるローカルメモリ、バルクストレージ、および実行中にバルクストレージからコードが検索される回数を減らすために少なくとも何らかのプログラムコードの一時記憶を提供するキャッシュメモリを含むことができる。入力/出力またはI/O装置(キーボード、ディスプレイ、ポインティング装置などを含むが、これらに限定されない)は、直接または介在するI/Oコントローラを介してシステムに結合され得る。
【0049】
ネットワークアダプタは、データ処理システムが、介在するプライベートまたはパブリックネットワークを介して他のデータ処理システムまたはリモートプリンタまたはストレージデバイスに結合されるようになることを可能にするために、システムに結合されることもできる。モデム、ケーブルモデム、イーサネットカードは、現在利用可能なネットワークアダプタの種類のほんの一部に過ぎない。
【0050】
本明細書で採用されるように、「ハードウェアプロセッササブシステム」または「ハードウェアプロセッサ」という用語は、1つ以上の特定のタスクを実行するために協働するプロセッサ、メモリ、ソフトウェアまたはそれらの組み合わせを指すことができる。有用な実施形態では、ハードウェアプロセッササブシステムは、1つまたは複数のデータ処理要素(例えば、論理回路、処理回路、命令実行デバイスなど)を含むことができる。1つまたは複数のデータ処理要素は、中央処理ユニット、画像処理ユニットおよび/または別個のプロセッサまたはコンピューティング要素ベースのコントローラ(たとえば、論理ゲートなど)に含めることができる。ハードウェアプロセッササブシステムは、1つ以上のオンボードメモリ(例えば、キャッシュ、専用メモリアレイ、読み出し専用メモリなど)を含むことができる。いくつかの実施形態では、ハードウェアプロセッササブシステムは、オンボードまたはオフボードにすることができるか、またはハードウェアプロセッササブシステム(例えば、ROM、RAM、基本入出力システム(BIOS)など)によって使用するために専用にすることができる1つ以上のメモリを含むことができる。
【0051】
ある実施形態では、ハードウェアプロセッササブシステムは、1つ以上のソフトウェア要素を含むことができ、実行することができる。1つ以上のソフトウェア要素は、特定の結果を達成するために、オペレーティングシステムおよび/または1つ以上のアプリケーションおよび/または特定のコードを含むことができる。
【0052】
他の実施形態では、ハードウェアプロセッササブシステムは、指定された結果を達成するために1つまたは複数の電子処理機能を実行する専用の専用回路を含むことができる。そのような回路は、1つまたは複数のアプリケーション専用集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、および/またはプログラマブルロジックアレイ(PLA)を含むことができる。
【0053】
ハードウェアプロセッササブシステムのこれらおよび他の変形もまた、本発明の実施形態に従って企図される。
【0054】
次に図6を参照すると、スライド分析システム600が示されている。システム600は、ハードウェアプロセッサ602とメモリ604とを含む。システム600は、メモリ604に格納され、ハードウェアプロセッサ602によって実行されるソフトウェアとして実装され得る多数の機能モジュールを含み得る。場合によっては、機能モジュールのいくつかは、例えばASICやFPGAのような形態のディスクリートハードウェア構成要素として実装されることもある。
【0055】
スライドデータベース606はメモリ604に格納され、モデル訓練器608が完全畳み込みモデルを訓練するために使用することができる。スライドデータベース606は、スキャンされ、注釈が付けられた画像で構成されることがある。
【0056】
ネットワークインターフェース605は、適切な有線または無線の通信媒体またはプロトコルによって新たなスライド画像を受信する。例えば、新たなスライド画像をホールスライドスキャナ104から受信しても良い。汎用のコンピュータネットワークインターフェイスや、ホールスライドスキャナ104専用のインターフェイスなど、適切なタイプのインターフェイスを実装することができる。
【0057】
新たなスライド画像はスライド分析610で処理される。報告書生成器612は、スライド分析610の出力を使用し、例えば、出力マップを使用して等値線を特定し、等値線を画像上にオーバーレイとしてレンダリングする。次いで、マイクロダイセクタ614は、特定された等値線を用いて、適切なTCRを有する組織サンプルの一部を単離するために、サンプルに対してマイクロ解剖を行うことができる。
【0058】
人工ニューラルネットワーク(ANN)は、脳などの生物学的な神経系にヒントを得た情報処理システムである。ANNの重要な要素は、特定の問題を解決するために並行して働く、高度に相互接続された多数の処理要素(「ニューロン」と呼ばれる)を含む情報処理システムの構造である。ANNはさらに、ニューロン間に存在する重みの調整を伴う学習によって、一組の学習データを使って訓練される。ANNは、このような学習プロセスを通じて、パターン認識やデータ分類などの特定の用途向けに構成される。
【0059】
次に図7図8とを参照する。図7図8とを参照すると、例示的なニューラルネットワークアーキテクチャが示されており、これらは本モデルの一部を実装するために使用することができる。ニューラルネットワークは汎化されたシステムであり、追加的な経験的データにさらされることでその機能と精度が向上する。ニューラルネットワークは、経験的データにさらされることによって学習される。訓練中、ニューラルネットワークは、入力される経験的データに適用される複数の重みを記憶し、調整する。調整された重みをデータに適用することで、データがクラスの集合からあらかじめ定義された特定のクラスに属することを識別したり、入力されたデータが各クラスに属する確率を出力したりすることができる。
【0060】
一連の例から得られた経験的データ(訓練データとも呼ばれる)は、値の文字列としてフォーマットされ、ニューラルネットワークの入力に供給される。各例は、既知の結果または出力と関連付けられる。各列は、(x,y)の組として表され、xは入力データ、yは既知の出力を表す。入力データには様々なデータタイプがあり、複数の異なる値が含まれていても良い。ネットワークは、例の入力データを構成する各値に対して1つの入力ノードを持つことができ、各入力値には別々の重みを適用することができる。入力データは、例えば、構築され訓練されるニューラルネットワークのアーキテクチャに応じて、ベクトル、配列、または文字列としてフォーマットすることができる。
【0061】
ニューラルネットワークは、入力データから生成されたニューラルネットワーク出力を例の既知の値と比較し、記憶された重みを調整して出力値と既知の値の差を最小にすることで「学習」する。調整は、逆伝搬を通じて記憶された重みに対して行うことができ、出力値に対する重みの影響は、数学的勾配を計算し、出力を最小差にシフトさせる方法で重みを調整することによって決定される。勾配降下法と呼ばれるこの最適化は、訓練がどのように行われるかの非限定的な例である。訓練に使用されなかった既知の値を持つ例のサブセットは、ニューラルネットワークの精度をテストし、検証するために使用することができる。
【0062】
運用中、訓練されたニューラルネットワークは、汎化によって、以前に訓練や検証に使用されなかった新たなデータに使用することができる。調整されたニューラルネットワークの重みは、新たなデータに適用することができ、重みは訓練例から開発された関数を推定する。重みによって捕捉される推定関数のパラメータは、統計的推論に基づいている。
【0063】
レイヤードニューラルネットワークでは、ノードは層の形で配置される。例示的な単純ニューラルネットワークは、ソースノード722の入力層720と、出力ノードとしても機能する1つまたは複数の計算ノード732を有する単一の計算層730とを有し、入力例が分類され得る各可能なカテゴリに対して単一の計算ノード732が存在する。入力層720は、入力データ710のデータ値712の数に等しい数のソースノード722を有することができる。入力データ710のデータ値712は列ベクトルとして表すことができる。計算層730の各計算ノード732は、入力ノード720に供給された入力データ710から重み付けされた値の線形結合を生成し、合計に微分可能な非線形活性化関数を適用する。例示的な単純ニューラルネットワークは、線形分離可能な例(例えば、パターン)に対して分類を実行することができる。
【0064】
多層パーセプトロンなどの深層ニューラルネットワークは、ソースノード722の入力層720、1つまたは複数の計算ノード732を有する1つまたは複数の計算層730、および入力例が分類される可能性のあるカテゴリごとに1つの出力ノード742がある出力層740を有することができる。入力層720は、入力データ710のデータ値712の数に等しい数のソースノード722を有することができる。計算層730の計算ノード732は、ソースノード722と出力ノード742との間にあり、直接観察されないため、隠れ層とも呼ばれる。計算層の各ノード732,742は、前の層のノードから出力された値から重み付けされた値の線形結合を生成し、線形結合の範囲にわたって微分可能な非線形活性化関数を適用する。各前のノードからの値に適用される重みは、例えばw1,w2,...wn-i,wnで表すことができる。出力層は、入力されたデータに対するネットワークの全体的な応答を提供する。深層ニューラルネットワークは、計算レイヤの各ノードが前のレイヤのすべてのノードに接続されている完全接続の場合もあれば、レイヤ間の接続が他の構成になっている場合もある。ノード間のリンクが欠落している場合、ネットワークは部分的に接続されていると呼ばれる。
【0065】
深層ニューラルネットワークの訓練には、各ノードの重みを固定し、入力をネットワークに伝搬させるフォワードフェーズと、エラー値をネットワークに逆伝搬させ、重み値を更新するバックワードフェーズの2つのフェーズがある。
【0066】
1つ以上の計算(隠れ)層730の計算ノード732は、特徴空間を生成する入力データ712に対して非線形変換を実行する。クラスやカテゴリは、元のデータ空間よりも特徴空間の方がより簡単に分離できるかもしれない。
【0067】
明細書において、本発明の「一実施形態」または「一実施形態」、およびその他の変形例への言及は、実施形態に関連して説明した特定の特徴、構造、特性などが、本発明の少なくとも一実施形態に含まれることを意味する。したがって、本明細書中の各所に現れる「一実施形態において」または「一実施形態において」という表現、および他の任意の変形は、必ずしもすべてが同じ実施形態を指すとは限らない。しかしながら、本明細書で提供される本発明の教示を考慮して、1つ以上の実施形態の特徴を組み合わせることができることは理解されるであろう。
【0068】
例えば「A/B」の場合、「Aおよび/またはB」、「AとBとの少なくとも1つ」のような、以下の「/」、「および/または」、「少なくとも1つ」のいずれかの使用は、第1のリストされた選択肢(A)のみの選択、または第2のリストされた選択肢(B)のみの選択、または両方の選択肢(AおよびB)の選択を包含すると意図していると理解されよう。さらなる例として、「A、B、および/またはC」および「A、B、およびCの少なくとも1つ」の場合、かかる表現は、第1のリストされた選択肢(A)のみの選択、または第2のリストされた選択肢(B)のみの選択、または第3のリストされた選択肢(C)のみの選択、または第1および第2のリストされた選択肢(AおよびB)のみの選択、第1および第3のリストされた選択肢(AおよびC)のみの選択、第2および第3のリストされた選択肢(BおよびC)のみの選択、または3つすべての選択肢(AおよびBおよびC)の選択を包含すると意図されている。このことは、記載された項目の数だけ拡張することができる。
【0069】
上記は、あらゆる点で例示的かつ例示的であるが、制限的なものではないと理解され、ここに開示された発明の範囲は、詳細な説明からではなく、特許法によって許される全幅に従って解釈された請求項から決定されるものである。本明細書に示され説明された実施形態は、本発明の例示に過ぎず、当業者は、本発明の範囲及び精神から逸脱することなく、様々な修正を実施することができることを理解されたい。当業者であれば、本発明の範囲と精神から逸脱することなく、様々な他の特徴の組み合わせを実施することができる。このように、特許法が要求する詳細さと特殊性をもって本発明の側面を説明したが、特許状によって請求され、保護されることを望むものは、添付の特許請求の範囲に記載されているとおりである。
図1
図2
図3
図4
図5
図6
図7
図8
【国際調査報告】