(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023098658
(43)【公開日】2023-07-10
(54)【発明の名称】病理スライド画像に基づいて腫瘍純度を予測する方法および装置
(51)【国際特許分類】
G16H 50/00 20180101AFI20230703BHJP
【FI】
G16H50/00
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022201573
(22)【出願日】2022-12-16
(31)【優先権主張番号】10-2021-0190443
(32)【優先日】2021-12-28
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2022-0022290
(32)【優先日】2022-02-21
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2022-0071642
(32)【優先日】2022-06-13
(33)【優先権主張国・地域又は機関】KR
(71)【出願人】
【識別番号】520159215
【氏名又は名称】ルニット・インコーポレイテッド
【氏名又は名称原語表記】LUNIT INC.
【住所又は居所原語表記】4F,5F,6F,7F,8F,9F, 374 Gangnam-daero, Gangnam-gu, Seoul 06241 Republic of Korea
(74)【代理人】
【識別番号】110001139
【氏名又は名称】SK弁理士法人
(74)【代理人】
【識別番号】100130328
【弁理士】
【氏名又は名称】奥野 彰彦
(74)【代理人】
【識別番号】100130672
【弁理士】
【氏名又は名称】伊藤 寛之
(72)【発明者】
【氏名】パク、ガヒ
(72)【発明者】
【氏名】オク、チャンニョン
(72)【発明者】
【氏名】ペン、キョンヒョン
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】 (修正有)
【課題】病理スライド画像に基づいて腫瘍純度を予測する方法、コンピューティング装置及び記憶媒体を提供する。
【解決手段】コンピューティング装置は、少なくとも1つのメモリと、少なくとも1つのプロセッサと、を含む。プロセッサによる病理スライド画像を解析する方法は、病理スライド画像を分析して前記病理スライド画像に表された複数の組織に対して第1分類を行い、病理スライド画像を分析して病理スライド画像に表された複数の細胞に対して第2分類を行い、第1分類の結果および前記第2分類の結果を組み合わせて前記病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
少なくとも1つのメモリと、
少なくとも1つのプロセッサとを含み、
前記プロセッサは、
病理スライド画像を分析して前記病理スライド画像に表された複数の組織に対して第1分類を行い、前記病理スライド画像を分析して前記病理スライド画像に表された複数の細胞に対して第2分類を行い、前記第1分類の結果および前記第2分類の結果を組み合わせて前記病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算する、コンピューティング装置。
【請求項2】
前記ノイズに関する情報は、
前記病理スライド画像に含まれる生物学的ノイズに関する情報および技術的ノイズに関する情報の少なくとも1つを含む、請求項1に記載のコンピューティング装置。
【請求項3】
前記プロセッサは、
前記病理スライド画像を癌領域、癌基質領域、壊死領域およびバックグラウンド領域の少なくとも1つに分類する、請求項1に記載のコンピューティング装置。
【請求項4】
前記プロセッサは、
前記病理スライド画像に表された複数の細胞を腫瘍細胞、リンパ球細胞およびその他の細胞の少なくとも1つに分類する、請求項1に記載のコンピューティング装置。
【請求項5】
前記プロセッサは、
前記病理スライド画像に含まれる全細胞の数に対する癌領域に含まれる腫瘍細胞の数の第1割合、または前記病理スライド画像に含まれる全領域に対する前記癌領域の第2割合の少なくとも1つを演算する、請求項1に記載のコンピューティング装置。
【請求項6】
前記プロセッサは、
前記第1分類の結果および前記第2分類の結果を用いて、予想癌信号を示す少なくとも1つの指数を演算する、請求項1に記載のコンピューティング装置。
【請求項7】
前記プロセッサは、
全細胞の予想DNA収率および腫瘍細胞の予想腫瘍DNA収率の少なくとも1つを演算する、請求項6に記載のコンピューティング装置。
【請求項8】
前記プロセッサは、
前記腫瘍純度および前記少なくとも1つの指数を出力するように表示装置を制御する、請求項6に記載のコンピューティング装置。
【請求項9】
前記プロセッサは、
前記少なくとも1つの指数と予め設定された閾値とを比較して、さらなる実験を行うか否かのガイドを提供する、請求項6に記載のコンピューティング装置。
【請求項10】
前記プロセッサは、
前記病理スライド画像の少なくとも一部の領域における予想核酸収率から次世代シーケンシングカバレッジおよび深度を推定して出力するように構成される、請求項1に記載のコンピューティング装置。
【請求項11】
病理スライド画像を分析して前記病理スライド画像に表された複数の組織に対して第1分類を行うステップと、
前記病理スライド画像を分析して前記病理スライド画像に表された複数の細胞に対して第2分類を行うステップと、
前記第1分類の結果および前記第2分類の結果を組み合わせて前記病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算するステップとを含む、病理スライド画像を解析する方法。
【請求項12】
前記ノイズに関する情報は、
前記病理スライド画像に含まれる生物学的ノイズに関する情報および技術的ノイズに関する情報の少なくとも1つを含む、請求項11に記載の方法。
【請求項13】
前記第1分類を行うステップは、
前記病理スライド画像を癌領域、癌基質領域、壊死領域およびバックグラウンド領域の少なくとも1つに分類する、請求項11に記載の方法。
【請求項14】
前記第2分類を行うステップは、
前記病理スライド画像に表された複数の細胞を腫瘍細胞、リンパ球細胞およびその他の細胞の少なくとも1つに分類する、請求項11に記載の方法。
【請求項15】
前記腫瘍純度を演算するステップは、
前記病理スライド画像に含まれる全細胞の数に対する癌領域に含まれる腫瘍細胞の数の第1割合、または前記病理スライド画像に含まれる全領域に対する前記癌領域の第2割合の少なくとも1つを演算する、請求項11に記載の方法。
【請求項16】
前記第1分類の結果および前記第2分類の結果を用いて、予想癌信号を示す少なくとも1つの指数を演算するステップをさらに含む、請求項11に記載の方法。
【請求項17】
前記少なくとも1つの指数を演算するステップは、
全細胞の予想DNA収率および腫瘍細胞の予想腫瘍DNA収率の少なくとも1つを演算する、請求項16に記載の方法。
【請求項18】
前記腫瘍純度および前記少なくとも1つの指数を出力するステップをさらに含む、請求項16に記載の方法。
【請求項19】
前記少なくとも1つの指数と予め設定された閾値とを比較して、さらなる実験を行うか否かのガイドを提供するステップをさらに含む、請求項16に記載の方法。
【請求項20】
請求項11に記載の方法をコンピュータで実行するためのプログラムを記録した、コンピュータで読み取り可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、病理スライド画像に基づいて腫瘍純度を予測する方法および装置に関する。
【背景技術】
【0002】
デジタル病理学(digital pathology)分野は、病理スライド画像(pathological slide image)をスキャンすることによって生成された全スライド画像(Whole Slide Image,WSI)を用いて該当患者の組織学的情報を取得したり予後を予測する分野である。
【0003】
病理スライド画像は、対象の染色された組織サンプルから取得することができる。例えば、組織サンプルは、ヘマトキシリン・エオジン(hematoxylin and eosin)、トリクローム(trichrome)、過ヨウ素酸シッフ(periodic acid schiff)、オートラジオグラフィー(autoradiography)、酵素組織化学(enzyme histochemistry)、免疫蛍光(immuno-fluorescence)、免疫組織化学(immunohistochemistry)など、様々な染色方式で染色することができる。染色された組織サンプルは、組織学および生検評価に用いられることによって、疾患状態を理解するために分子プロファイル分析に進むか否かを判断する根拠となり得る。
【0004】
ただし、病理スライド画像の分析を用いた従来の腫瘍純度(tumor purity)の演算は、低下した核酸の品質(degraded nucleic acid quality)、断片化(fragmentation)、シトシン塩基の脱アミノ化(deamination of cytosine bases)などに影響を及ぼす様々な生物学的ノイズ(biological noise)および技術的ノイズ(technical noise)を考慮しないという限界がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
解決しようとする技術的課題は、病理スライド画像に基づいて腫瘍純度を予測する方法および装置を提供することにある。また、解決しようとする技術的課題は、上記方法をコンピュータで実行するためのプログラムを記録した、コンピュータで読み取り可能な記録媒体を提供することにある。解決しようとする技術的課題は、上記技術的課題に限定されず、他の技術的課題が存在し得る。
【課題を解決するための手段】
【0006】
一態様によるコンピューティング装置は、少なくとも1つのメモリと、少なくとも1つのプロセッサとを含み、前記プロセッサは、病理スライド画像を分析して前記病理スライド画像に表された複数の組織に対して第1分類を行い、前記病理スライド画像を分析して前記病理スライド画像に表された複数の細胞に対して第2分類を行い、前記第1分類の結果および前記第2分類の結果を組み合わせて前記病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算する。
【0007】
他の態様による病理スライド画像を解析する方法は、病理スライド画像を分析して前記病理スライド画像に表された複数の組織に対して第1分類を行うステップと、前記病理スライド画像を分析して前記病理スライド画像に表された複数の細胞に対して第2分類を行うステップと、前記第1分類の結果および前記第2分類の結果を組み合わせて前記病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算するステップとを含む。
【0008】
さらに他の態様によるコンピュータで読み取り可能な記録媒体は、上記方法をコンピュータで実行するための方法を記録した記録媒体を含む。
【図面の簡単な説明】
【0009】
【
図1】一実施形態による病理スライド画像を解析するシステムの一例を説明するための図である。
【
図2A】一実施形態によるユーザ端末の一例を示す構成図である。
【
図2B】一実施形態によるサーバの一例を示す構成図である。
【
図3】一実施形態による病理スライド画像を解析する方法の一例を説明するためのフローチャートである。
【
図4】一実施形態によるプロセッサが複数の組織に対して第1分類を行う一例を説明するための図である。
【
図5】一実施形態によるプロセッサが複数の細胞に対して第2分類を行う一例を説明するための図である。
【
図6】一実施形態による病理スライド画像を解析する方法の他の例を説明するためのフローチャートである。
【
図7】一実施形態による病理スライド画像を解析する方法のさらに他の例を説明するためのフローチャートである。
【
図8A】一実施形態による腫瘍純度および少なくとも1つの指数が出力された一例を説明するための図である。
【
図8B】一実施形態による腫瘍純度および少なくとも1つの指数が出力された後にカバレッジ最小要件(coverage minimum requirement)の理論最大深度を解析する方法の一例を説明するための図である。
【
図9】一実施形態による病理スライド画像を解析する方法のさらに他の例を説明するためのフローチャートである。
【
図10】一実施形態によるプロセッサにより提供されるガイドの一例を説明するための図である。
【
図11A】一実施形態による病理スライド画像および様々な情報が出力された一例を示す図である。
【
図11B】一実施形態による病理スライド画像および様々な情報が出力された他の例を示す図である。
【発明を実施するための形態】
【0010】
実施形態で用いられる用語としては、できるだけ現在広く用いられている一般的な用語を選択したが、これは、当該技術分野に従事する技術者の意図または判例、新しい技術の出現などによって異なり得る。また、特定の場合は、出願人が任意に選定した用語もあり、この場合、該当する説明部分にその意味を詳細に記載する。よって、明細書で用いられる用語は、単なる用語の名称ではなく、その用語が有する意味と明細書全般にわたる内容に基づいて定義されるべきである。
【0011】
明細書全体において、ある部分がある構成要素を「含む」というと、それは、特に反対の記載がない限り、他の構成要素を除くのではなく、他の構成要素をさらに含み得ることを意味する。また、明細書に記載された「・・・ユニット」、「・・・モジュール」などの用語は、少なくとも1つの機能または動作を処理する単位を意味し、これは、ハードウェアまたはソフトウェアで実現されてもよく、ハードウェアとソフトウェアとの組み合わせで実現されてもよい。
【0012】
さらに、明細書で用いられる「第1」または「第2」などの序数を含む用語は、様々な構成要素を説明するために用いることができるが、上記構成要素は上記用語により限定されるべきではない。上記用語は、ある構成要素を他の構成要素と区別する目的で用いることができる。
【0013】
一実施形態によれば、「病理スライド画像」は、人体から採取された組織などに対して一連の化学処理工程を行って固定および染色された病理スライドを撮影した画像を指すことができる。 また、病理スライド画像は、全スライドの高解像度の画像を含む全スライド画像を指すことができ、全スライドの一部、例えば1つ以上のパッチを指すこともできる。 例えば、病理スライド画像は、スキャン装置(例えば、デジタルスキャナなど)により撮影またはスキャンされたデジタル画像を指すことができ、人体内の特定のタンパク質、細胞(cell)、組織(tissue)および/または構造(structure)に関する情報を含むことができる。 さらに、病理スライド画像は、1つ以上のパッチを含むことができ、1つ以上のパッチには、アノテーション作業により組織学的情報を適用(例えば、タギング)することができる。
【0014】
一実施形態によれば、「医学情報」は、医療画像から抽出できる医学的に意味のある任意の情報を指すことができ、例えば、医療画像内の腫瘍細胞の領域、位置、サイズ、癌の診断情報、患者の発癌の可能性に関連する情報、および/または癌の治療に関連する医学的結論などを含むことができるが、これらに限定されない。 また、医学情報は、医療画像から得られる定量化された数値だけでなく、数値を可視化した情報、数値に応じた予測情報、画像情報、統計学的情報などを含むことができる。 このようにして生成された医学情報は、ユーザ端末に提供するか、表示装置に出力または伝達し、表示することができる。
【0015】
以下、添付の図面を参照して、実施形態について詳細に説明する。しかし、実施形態は、様々な異なる形態で実現することができ、本明細書で説明する例に限定されない。
【0016】
図1は、一実施形態による病理スライド画像を解析するシステムの一例を説明するための図である。
【0017】
図1を参照すると、システム1は、ユーザ端末10およびサーバ20を含む。例えば、ユーザ端末10とサーバ20とは、有線または無線通信方式で接続され、互いにデータ(例えば、画像データなど)を送受信することができる。
【0018】
説明の便宜のために、
図1には、システム1がユーザ端末10およびサーバ20を含むものとして示されているが、これに限定されない。例えば、システム1は、他の外部装置(図示せず)を含むことができ、以下に説明されるユーザ端末10およびサーバ20の動作は、単一の装置(例えば、ユーザ端末10もしくはサーバ20)またはより多くの装置により実現することもできる。
【0019】
ユーザ端末10は、表示装置およびユーザ入力を受信する装置(例えば、キーボード、マウスなど)を備え、メモリおよびプロセッサを含むコンピューティング装置であってもよい。例えば、ユーザ端末10としては、ノートパソコン(notebook PC)、デスクトップパソコン(desktop PC)、ラップトップコンピュータ(laptop computer)、タブレットコンピュータ(tablet computer)、スマートフォンなどが挙げられるが、これらに限定されない。
【0020】
サーバ20は、
図1に示すユーザ端末10を含む外部装置(図示せず)と通信する装置であってもよい。一例として、サーバ20は、病理スライド画像や腫瘍純度に関する情報を含む様々なデータを記憶する装置であってもよい。あるいは、サーバ20は、メモリおよびプロセッサを含み、独自の演算能力を有するコンピューティング装置であってもよい。サーバ20がコンピューティング装置である場合、サーバ20は、
図1~
図11を参照して後述するユーザ端末10の動作の少なくとも一部を行うことができる。例えば、サーバ20は、クラウド(cloud)サーバであってもよいが、これに限定されない。
【0021】
ユーザ端末10は、病理スライド画像および/または腫瘍純度に関する情報40を出力する。ここで、腫瘍純度に関する情報40は、ユーザ端末10が病理スライド画像を解析することによって導出された数値を含む。
【0022】
病理スライド画像は、人体から採取された組織などを顕微鏡で観察するために一連の化学処理工程を行って固定および染色された病理スライドを撮影した画像を指すことができる。一例として、病理スライド画像は、全スライドの高解像度の画像を含む全スライド画像を指すことができる。他の例として、病理スライド画像は、そのような高解像度の全スライド画像の一部を指すことができる。
【0023】
一方、病理スライド画像は、全スライド画像においてパッチ単位に分割されたパッチ領域を指すことができる。例えば、パッチは、所定の領域のサイズを有することができる。あるいは、パッチは、全スライド内に含まれるオブジェクトのそれぞれを含む領域を指すことができる。
【0024】
また、病理スライド画像は、顕微鏡を用いて撮影されたデジタル画像を指すことができ、人体内の細胞、組織および/または構造に関する情報を含むことができる。
【0025】
腫瘍純度に関する情報40は、病理スライド画像に表された癌領域(cancer area)および腫瘍細胞(tumor cell)に関する情報だけでなく、腫瘍に関連しない領域および細胞に関する情報も含むことができる。本開示において、腫瘍に関連しない領域および細胞に関する情報は、疾患状態の判断に不要なノイズと称すことができる。例えば、ノイズは、病理スライド画像に含まれる生物学的ノイズ(例えば、病理スライド画像の正常(normal)領域など)および技術的ノイズ(例えば、低下(degraded)領域など)の少なくとも1つを含む。ただし、ノイズの種類は上述したものに限定されない。言い換えれば、病理スライド画像内において、腫瘍に関連しない領域および細胞に対応する領域であれば、制限なくノイズに該当する。
【0026】
従来は、腫瘍純度の演算において、病理スライド画像内の癌領域および腫瘍細胞についてのみ注目していた。具体的には、従来は、病理スライド画像において、特定のパターンに染色された組織または細胞に対して腫瘍純度を演算していた。これにより、従来技術によれば、低下した核酸の品質、断片化、シトシン塩基の脱アミノ化などに影響を及ぼす様々なノイズを考慮しないという限界があり、ユーザ30に腫瘍純度に関する正確な情報を提供することが困難である。すなわち、従来技術による腫瘍純度の情報によれば、偽陽性(false positive)または偽陰性(false negative)と判定される可能性がある。
【0027】
一実施形態によるシステム1は、病理スライド画像内の癌領域および腫瘍細胞だけでなく、ノイズも併せて考慮して、腫瘍純度に関する情報40を生成する。具体的には、ユーザ端末10は、病理スライド画像を分析して、病理スライド画像に表された複数の組織に対して第1分類を行い、病理スライド画像を分析して、病理スライド画像に表された複数の細胞に対して第2分類を行う。そして、ユーザ端末10は、第1分類の結果および第2分類の結果を組み合わせて、病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算する。よって、ユーザ30は、病理スライド画像に表された組織および細胞に対して正確な腫瘍純度の情報を確認することができる。
【0028】
一実施形態によるユーザ端末10は、TCGA(The Cancer Genome Atlas)の癌種全体の腫瘍純度を演算する。具体的には、ユーザ端末10は、TCGA(The Cancer Genome Atlas)の32種類の腫瘍サンプルを予測するように訓練されたAIモデルを用いる。よって、ユーザ30は、一実施形態によるユーザ端末10により演算された腫瘍純度に関する情報に基づいて、あらゆる種類の癌を正確に診断することができる。
【0029】
また、一実施形態によるユーザ端末10は、予想癌信号(expected cancer signal)を示す指数を演算することができる。ここで、予想癌信号を示す指数は、全細胞の予想DNA収率(expected DNA yield)および腫瘍細胞の予想腫瘍DNA収率(expected tumor DNA yield)の少なくとも1つを含む。これにより、ユーザ30は、疾患の判定のためにさらなる実験(experiment)を行うか否かを判断することができる。
【0030】
以下、ユーザ端末10が病理スライド画像を解析して腫瘍純度を演算したり予想癌信号を示す少なくとも1つの指数を演算する例を説明する。
【0031】
一方、説明の便宜のために、明細書全般にわたって、ユーザ端末10が病理スライド画像を解析して腫瘍純度を演算したり予想癌信号を示す少なくとも1つの指数を演算することを説明するが、これに限定されない。例えば、ユーザ端末10により行われる動作の少なくとも一部は、サーバ20により行うこともできる。
【0032】
言い換えれば、
図1~
図11を参照して説明するユーザ端末10の動作の少なくとも一部は、サーバ20により行うこともできる。例えば、サーバ20は、病理スライド画像を解析して腫瘍純度を演算したり予想癌信号を示す少なくとも1つの指数を演算し、演算結果をユーザ端末10に送信することができる。そして、ユーザ端末10は、サーバ20から送信された情報(例えば、病理スライド画像、腫瘍純度に関する情報、予想癌信号を示す指数など)を出力したり、送信された情報を加工して生成された医学情報を提供することができる。ただし、サーバ20の動作は上述したものに限定されない。
【0033】
図2Aは、一実施形態によるユーザ端末の一例を示す構成図である。
【0034】
図2Aを参照すると、ユーザ端末100は、プロセッサ110、メモリ120、入出力インターフェース130および通信モジュール140を含む。説明の便宜のために、
図2Aには、本発明に関連する構成要素のみが示されている。よって、ユーザ端末100は、
図2Aに示す構成要素に加えて、他の汎用の構成要素をさらに含むことができる。また、
図2Aに示されるプロセッサ110、メモリ120、入出力インターフェース130および通信モジュール140を独立した装置として実現できることは、本発明に関連する技術分野における通常の知識を有する者にとって自明である。
【0035】
プロセッサ110は、基本的な算術、ロジックおよび入出力演算を行うことにより、コンピュータプログラムの命令を処理することができる。ここで、命令は、メモリ120または外部装置(例えば、サーバ20など)から提供することができる。また、プロセッサ110は、ユーザ端末100に含まれる他の構成要素の動作を全般的に制御することができる。
【0036】
特に、プロセッサ110は、病理スライド画像を解析して腫瘍純度を演算する。具体的には、プロセッサ110は、病理スライド画像を分析して、病理スライド画像に表された複数の組織に対して第1分類を行う。そして、プロセッサ110は、病理スライド画像を分析して、病理スライド画像に表された複数の細胞に対して第2分類を行う。そして、プロセッサ110は、第1分類の結果および第2分類の結果を組み合わせて、病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算する。
【0037】
さらに、プロセッサ110は、病理スライド画像を解析して、予想癌信号を示す少なくとも1つの指数を演算する。具体的には、プロセッサ110は、全細胞の予想DNA収率および腫瘍細胞の予想腫瘍DNA収率の少なくとも1つを演算する。
【0038】
さらに、プロセッサ110は、腫瘍純度および予想癌信号を示す指数を出力するように、表示装置を制御する。さらに、プロセッサ110は、予想癌信号を示す指数と予め設定された閾値とを比較して、さらなる実験を行うか否かのガイドを提供する。
【0039】
一実施形態によるプロセッサ110が動作する具体例は、
図3~
図11を参照して説明する。
【0040】
プロセッサ110は、複数の論理ゲートのアレイで実現されてもよく、汎用マイクロプロセッサと当該マイクロプロセッサで実行できるプログラムが記憶されたメモリとの組み合わせで実現されてもよい。例えば、プロセッサ110は、汎用プロセッサ、中央処理装置(CPU)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、コントローラ、マイクロコントローラ、状態機械などを含むことができる。一部の環境で、プロセッサ110は、特定用途向け半導体(ASIC)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)などを含むこともできる。例えば、プロセッサ110は、デジタル信号プロセッサ(DSP)とマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサの組み合わせ、デジタル信号プロセッサ(DSP)コアに結合された1つ以上のマイクロプロセッサの組み合わせ、または任意の他のそのような構成の組み合わせなどの処理装置の組み合わせを指すこともできる。
【0041】
メモリ120は、非一時的な任意のコンピュータで読み取り可能な記録媒体を含むことができる。 一例として、メモリ120は、RAM(Random Access Memory)、ROM(Read Only Memory)、ディスクドライブ、SSD(Solid State Drive)、フラッシュメモリ(flash memory)などの永久大容量記憶装置(permanent mass storage device)を含むことができる。 他の例として、ROM、SSD、フラッシュメモリ、ディスクドライブなどの永久大容量記憶装置は、メモリとは別の独立した永久記憶装置であってもよい。また、メモリ120には、オペレーティングシステム(OS)と少なくとも1つのプログラムコード(例えば、プロセッサ110が
図3~
図11を参照して後述する動作を行うためのコード)を記憶することができる。
【0042】
そのようなソフトウェアコンポーネントは、メモリ120とは別のコンピュータで読み取り可能な記録媒体からロードすることができる。そのような別のコンピュータで読み取り可能な記録媒体は、ユーザ端末100に直接接続できる記録媒体であってもよく、例えば、フロッピードライブ、ディスク、テープ、DVD/CD-ROMドライブ、メモリカードなどのコンピュータで読み取り可能な記録媒体を含むことができる。 あるいは、ソフトウェアコンポーネントは、コンピュータで読み取り可能な記録媒体ではなく、通信モジュール140を介してメモリ120にロードすることができる。例えば、少なくとも1つのプログラムは、開発者またはアプリケーションのインストールファイルを配布するファイル配布システムが通信モジュール140を介して提供するファイルによりインストールされるコンピュータプログラム(例えば、プロセッサ110が
図3~
図11を参照して後述する動作を行うためのコンピュータプログラムなど)に基づいて、メモリ120にロードすることができる。
【0043】
入出力インターフェース130は、ユーザ端末100に接続されるかまたはユーザ端末100に含まれる入力または出力のための装置(例えば、キーボード、マウスなど)とのインターフェースのための手段であってもよい。
図2Aには、入出力インターフェース130がプロセッサ110とは別に構成された要素として示されているが、これに限定されず、入出力インターフェース130がプロセッサ110に含まれるように構成されてもよい。
【0044】
通信モジュール140は、ネットワークを介してサーバ20とユーザ端末100とが互いに通信するための構成または機能を提供することができる。また、通信モジュール140は、ユーザ端末100が他の外部装置と通信するための構成または機能を提供することができる。例えば、プロセッサ110の制御に従って提供される制御信号、命令、データなどが通信モジュール140とネットワークを介してサーバ20および/または外部装置に送信される。
【0045】
一方、
図2Aには示されていないが、ユーザ端末100は、表示装置をさらに含んでもよい。あるいは、ユーザ端末100は、独立した表示装置と有線または無線通信方式で接続され、互いにデータを送受信することができる。
【0046】
例えば、表示装置を介して病理スライド画像、病理スライド画像の解析により演算された値(例えば、腫瘍純度、予想癌信号を示す指数など)、演算された値から生成された医学情報などがユーザ30に提供される。
【0047】
図2Bは、一実施形態によるサーバの一例を示す構成図である。
【0048】
図2Bを参照すると、サーバ200は、プロセッサ210、メモリ220および通信モジュール230を含む。説明の便宜のために、
図2Bには、本発明に関連する構成要素のみが示されている。よって、サーバ200は、
図2Bに示す構成要素に加えて、他の汎用の構成要素をさらに含むことができる。また、
図2Bに示されるプロセッサ210、メモリ220および通信モジュール230を独立した装置として実現できることは、本発明に関連する技術分野における通常の知識を有する者にとって自明である。
【0049】
プロセッサ210は、内部メモリ220、外部メモリ(図示せず)、ユーザ端末100または外部装置の少なくとも1つから病理スライド画像を取得することができる。プロセッサ210は、病理スライド画像を解析して、腫瘍純度および/または予想癌信号を示す少なくとも1つの指数を演算する。言い換えれば、
図2Aを参照して上述したプロセッサ110の動作は、プロセッサ210により行うことができる。この場合、ユーザ端末100は、サーバ200から送信された情報を表示装置を介して出力することができる。
【0050】
一方、プロセッサ210の実現例は、
図2Aを参照して上述したプロセッサ110の実現例と同様であるので、具体的な説明は省略する。
【0051】
メモリ220には、病理スライド画像、プロセッサ210の動作によって生成されたデータなど、様々なデータを記憶することができる。また、メモリ220には、オペレーティングシステム(OS)と少なくとも1つのプログラム(例えば、プロセッサ210の動作に必要なプログラムなど)を記憶することができる。
【0052】
一方、メモリ220の実現例は、
図2Aを参照して上述したメモリ220の実現例と同様であるので、具体的な説明は省略する。
【0053】
通信モジュール230は、ネットワークを介してサーバ200とユーザ端末100とが互いに通信するための構成または機能を提供することができる。また、通信モジュール230は、サーバ200が他の外部装置と通信するための構成または機能を提供することができる。例えば、プロセッサ210の制御に従って提供される制御信号、命令、データなどが通信モジュール230とネットワークを介してユーザ端末100および/または外部装置に送信される。
【0054】
図3は、一実施形態による病理スライド画像を解析する方法の一例を説明するためのフローチャートである。
【0055】
図3を参照すると、病理スライド画像を出力する方法は、
図1および
図2Aに示すユーザ端末10、100またはプロセッサ110で時系列的に処理されるステップから構成される。よって、以下で省略された内容であっても、
図1および
図2Aに示すユーザ端末10、100またはプロセッサ110について上述した内容は、
図3の病理スライド画像を出力する方法にも適用することができる。
【0056】
ステップ310において、プロセッサ110は、病理スライド画像を分析して、病理スライド画像に表された複数の組織に対して第1分類を行う。病理スライド画像は、内部メモリ120、外部メモリ(図示せず)、サーバ20、200または外部入出力装置の少なくとも1つから取得することができる。
【0057】
まず、プロセッサ110は、病理スライド画像を分析する。一例として、プロセッサ110は、所定の画像処理技術を用いて病理スライド画像を分析することにより、病理スライド画像から組織に対応する領域を検出し、組織を示す層を分離することができる。他の例として、プロセッサ110は、機械学習モデルを用いて、病理スライド画像からの組織に対応する領域の検出および組織を示す層の分離を行うことができる。この場合、機械学習モデルは、複数の参照病理スライド画像および複数の参照ラベル情報を含む学習データを用いて、参照病理スライド画像内の組織に対応する領域を検出し、組織を示す層を分離するように学習されてもよい。
【0058】
そして、プロセッサ110は、病理スライド画像に表された複数の組織に対して第1分類を行う。具体的には、プロセッサ110は、病理スライド画像を癌領域(cancer area)、癌基質領域(cancer stroma area)、壊死領域(necrosis area)およびバックグラウンド領域(background)の少なくとも1つに分類することができる。ここで、バックグラウンド領域は、生物学的ノイズを示す領域および/または技術的ノイズを示す領域を含むことができる。例えば、生物学的ノイズを示す領域は正常領域を含み、技術的ノイズを示す領域は低下領域を含むことができる。
【0059】
ただし、プロセッサ110が病理スライド画像に表された少なくとも一部の領域を分類する例は、上述した例に限定されない。言い換えれば、上述した4種類の領域(癌領域、癌基質領域、壊死領域およびバックグラウンド領域)に限定されず、プロセッサ110は、様々な基準によって、病理スライド画像に表された少なくとも1つの領域を複数のカテゴリに分類することができる。病理スライド画像に表された少なくとも1つの領域は、予め設定された基準またはユーザにより設定された基準によって、複数のカテゴリに分類することができる。なお、ノイズの種類が生物学的ノイズおよび技術的ノイズに限定されないことは、
図1を参照して上述した通りである。
【0060】
以下、
図4を参照して、プロセッサ110が複数の組織に対して第1分類を行う例を説明する。
【0061】
図4は、一実施形態によるプロセッサが複数の組織に対して第1分類を行う一例を説明するための図である。
【0062】
図4を参照すると、プロセッサ110は、病理スライド画像410を分析して組織420を示す領域を検出し、組織420を示す層を分離する。病理スライド画像410の組織420は、様々な領域431~435を含むことができ、プロセッサ110は、領域431~435を分類する。具体的には、プロセッサ110は、領域431~435を癌領域431、癌基質領域432、壊死領域433、低下領域434および正常領域435に分類する。
【0063】
図1を参照して上述したように、プロセッサ110は、病理スライド画像410においてノイズに対応する低下領域434および正常領域435を確認し、低下領域434および正常領域435を考慮して腫瘍純度を演算する。したがって、従来技術と比較して正確な腫瘍純度に関する情報をユーザ30に伝達することができるので、ユーザ30は病理スライド画像410に基づく疾患の診断またはさらなる実験の必要性の判断をより正確に行うことができる。
【0064】
再び
図3を参照すると、ステップ320において、プロセッサ110は、病理スライド画像を分析して、病理スライド画像に表された複数の細胞に対して第2分類を行う。
【0065】
まず、プロセッサ110は、病理スライド画像を分析して、病理スライド画像から細胞を検出し、細胞を示す層を分離する。プロセッサ110が病理スライド画像を分析する具体的な方法は、ステップ310を参照して上述した通りである。
【0066】
そして、プロセッサ110は、病理スライド画像に表された複数の細胞に対して第2分類を行う。具体的には、プロセッサ110は、病理スライド画像に表された細胞を腫瘍細胞(tumor cell)、リンパ球細胞(lymphocytes cell)およびその他の細胞の少なくとも1つに分類する。ただし、プロセッサ110が病理スライド画像に表された細胞を分類する例は、上述した例に限定されない。言い換えれば、プロセッサ110は、異なる種類の細胞を分類する様々な基準によって、病理スライド画像に表された細胞をグループ化することができる。
【0067】
以下、
図5を参照して、プロセッサ110が複数の細胞に対して第2分類を行う例を説明する。
【0068】
図5は、一実施形態によるプロセッサが複数の細胞に対して第2分類を行う一例を説明するための図である。
【0069】
図5を参照すると、プロセッサ110は、病理スライド画像510を分析して組織520内の細胞を確認する。具体的には、プロセッサ110は、病理スライド画像510から細胞を示す部分を検出し、細胞を示す層を分離する。
【0070】
組織520は、複数の細胞から構成され、細胞は、様々な種類で構成される。プロセッサ110は、細胞を腫瘍細胞531、リンパ球細胞532およびその他の細胞533の少なくとも1つに分類する。ここで、その他の細胞533は、正常細胞を含む。例えば、その他の細胞533は、上皮細胞、神経細胞、筋肉細胞および結合組織細胞(connective tissue cell)の少なくとも1つを含むことができるが、これらに限定されない。
【0071】
プロセッサ110は、上述した基準で細胞を分類することにより、組織520の領域の分類結果と共に、正確な腫瘍純度の演算に用いることができる。
【0072】
再び
図3を参照すると、ステップ330において、プロセッサ110は、第1分類の結果および第2分類の結果を組み合わせて、病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算する。
【0073】
プロセッサ110は、組織の領域の分類結果と細胞の分類結果を用いて腫瘍純度を演算する。ステップ310およびステップ320を参照して上述したように、プロセッサ110は、病理スライド画像内のノイズに対しても確認および分類を行うので、腫瘍純度の演算結果にはノイズに関する情報も含まれる。
【0074】
プロセッサ110は、ステップ310およびステップ320により、組織に含まれる各領域の広さおよび各領域内の細胞の数を演算することができる。具体的には、プロセッサ110は、癌領域(CA)の広さ、癌基質領域(CS)の広さ、壊死領域(NC)の広さ、低下領域(DA)の広さ、およびバックグラウンド領域(BG)の広さを演算することができる。また、プロセッサ110は、癌領域(CA)内の腫瘍細胞(CAt)の数、癌基質領域(CS)内の腫瘍細胞(CSt)の数、壊死領域(NC)内の腫瘍細胞(NCt)の数、低下領域(DA)内の腫瘍細胞(DAt)の数、およびバックグラウンド領域(BG)内の腫瘍細胞(BGt)の数を演算することができる。さらに、プロセッサ110は、癌領域(CA)内のリンパ球細胞(CAl)の数、癌基質領域(CS)内のリンパ球細胞(CSl)の数、壊死領域(NC)内のリンパ球細胞(NCl)の数、低下領域(DA)内のリンパ球細胞(DAl)の数、およびバックグラウンド領域(BG)内のリンパ球細胞(BGl)の数を演算することができる。さらに、プロセッサ110は、癌領域(CA)内のその他の細胞(CAb)の数、癌基質領域(CS)内のその他の細胞(CSb)の数、壊死領域(NC)内のその他の細胞(NCb)の数、低下領域(DA)内のその他の細胞(DAb)の数、およびバックグラウンド領域(BG)内のその他の細胞(BGb)の数を演算することができる。
【0075】
一例として、プロセッサ110は、病理スライド画像に含まれる全細胞の数に対する癌領域に含まれる腫瘍細胞の数の割合を演算することができる。例えば、プロセッサ110は、下記数式1により、上記割合(AI-P)を演算することができる。
【0076】
【0077】
数式1を参照すると、プロセッサ110は、癌領域(CA)、癌基質領域(CS)およびバックグラウンド領域(BG)のそれぞれに含まれる腫瘍細胞(CAt、CSt、BGt)の数、リンパ球細胞(CAl、CSl、BGl)の数、およびその他の細胞(CAb、CSb、BGb)の数を用いて、腫瘍純度の第1値(AI-P)を演算することができる。
【0078】
他の例として、プロセッサ110は、病理スライド画像に含まれる全領域に対する癌領域の割合を演算することができる。例えば、プロセッサ110は、下記数式2により、上記割合(CEA)を演算することができる。
【0079】
【0080】
数式2を参照すると、プロセッサ110は、癌領域(CA)の広さ、癌基質領域(CS)の広さ、およびバックグラウンド領域(BG)の広さを用いて、腫瘍純度の第2値(CEA)を演算することができる。
【0081】
また、プロセッサ110は、生物学的ノイズに関連する様々な値を演算することができる。具体的には、プロセッサ110は、非癌領域(すなわち、正常領域)の割合、壊死領域の割合、および癌領域における予想される生物学的ノイズの割合を演算することができる。ここで、非癌領域(すなわち、正常領域)の割合とは、全面積に対するバックグラウンド領域の面積の割合を意味し、壊死領域の割合とは、全面積に対する壊死領域の面積の割合を意味し、癌領域における予想される生物学的ノイズの割合とは、全細胞の数に対する癌領域内のその他の細胞の数の割合を意味する。
【0082】
例えば、プロセッサ110は、下記数式3~数式5により、生物学的ノイズに関連する様々な値を演算することができる。
【0083】
【0084】
数式3を参照すると、プロセッサ110は、癌領域(CA)の広さ、癌基質領域(CS)の広さ、およびバックグラウンド領域(BG)の広さを用いて、非癌領域(すなわち、正常領域)の割合を演算することができる。
【0085】
【0086】
数式4を参照すると、プロセッサ110は、癌領域(CA)の広さ、癌基質領域(CS)の広さ、バックグラウンド領域(BG)の広さ、および壊死領域(NC)の広さを用いて、壊死領域の割合を演算することができる。
【0087】
【0088】
数式5を参照すると、プロセッサ110は、癌領域(CA)、癌基質領域(CS)およびバックグラウンド領域(BG)のそれぞれに含まれる腫瘍細胞(CAt、CSt、BGt)の数、リンパ球細胞(CAl、CSl、BGl)の数、およびその他の細胞(CAb、CSb、BGb)の数を用いて、癌領域における予想される生物学的ノイズの割合を演算することができる。
【0089】
また、プロセッサ110は、技術的ノイズに関連する値を演算することができる。ここで、技術的ノイズに関連する値には、全面積に対する低下領域の面積の割合が含まれる。例えば、プロセッサ110は、下記数式6により、技術的ノイズに関連する値を演算することができる。
【0090】
【0091】
数式6を参照すると、プロセッサ110は、癌領域(CA)の広さ、癌基質領域(CS)の広さ、バックグラウンド領域(BG)の広さ、および低下領域(DA)の広さを用いて、技術的ノイズに関連する値を演算することができる。
【0092】
数式1~数式6を参照して上述した様々な腫瘍純度に関する情報は、ユーザ30が疾患の正確な診断またはさらなる実験の必要性の正確な判断を行えるように助ける。言い換えれば、一実施形態によるプロセッサ110は、病理スライド画像410においてノイズに対応する情報を含んで腫瘍純度を演算することにより、従来技術より正確な情報をユーザ30に提供することができる。
【0093】
図6は、一実施形態による病理スライド画像を解析する方法の他の例を説明するためのフローチャートである。
【0094】
図6を参照すると、ステップ610~ステップ630は、
図3のステップ310~ステップ330に対応する。よって、以下、ステップ610~ステップ630についての具体的な説明は省略する。
【0095】
ステップ640において、プロセッサ110は、第1分類の結果および第2分類の結果を用いて、予想癌信号を示す少なくとも1つの指数を演算する。
【0096】
図3のステップ310およびステップ320を参照して上述したように、プロセッサ110は、組織に含まれる各領域の広さおよび各領域内の細胞の数を演算することができる。プロセッサ110は、各領域内の細胞の数を用いて、予想癌信号を示す指数を演算することができる。
【0097】
例えば、プロセッサ110は、全細胞の予想DNA収率を演算することができる。具体的には、プロセッサ110は、病理スライド画像に含まれる全細胞の数を用いて、病理スライド画像に対応する分子量を演算することができる。例えば、プロセッサ110は、単一細胞のDNA重量(例えば、6ピコグラム(pg))に全細胞の数を掛け、それを総DNA量のナノグラム(ng)に変換することにより、全細胞の予想DNA収率を演算することができる。
【0098】
一方、腫瘍細胞の予想腫瘍DNA収率は、スライドから得られた腫瘍細胞の数に単一細胞のDNA重量を掛けて計算することができる。一方、数式1を参照して上述した腫瘍純度の第1値(AI-P)も導出することができる。
【0099】
予想癌信号は、ユーザ30が核酸分離過程でどれだけの体積を溶出したかに応じて推定することができる。例えば、ユーザ30が50μLの溶出緩衝液の総体積でDNAを分離した場合、腫瘍信号の割合は、腫瘍純度の第1値(AI-P)を49(1:49)で割った割合で希釈される。一方、特定の百分率未満の予想癌信号の場合、ユーザ30にさらなる実験を行うか否かのガイドを提供する基礎となり得る。プロセッサ110がユーザにガイドを提供する例は、
図9および
図10を参照して後述する。
【0100】
図7は、一実施形態による病理スライド画像を解析する方法のさらに他の例を説明するためのフローチャートである。
【0101】
図7を参照すると、ステップ710~ステップ740は、
図6のステップ610~ステップ640に対応する。よって、以下、ステップ710~ステップ740についての具体的な説明は省略する。
【0102】
ステップ750において、プロセッサ110は、腫瘍純度および少なくとも1つの指数を出力する。例えば、プロセッサ110は、
図3~
図6を参照して上述した演算値および/または上述した演算値に基づいて作成された医学情報を出力するように、表示装置を制御することができる。
【0103】
また、
図7には示されていないが、プロセッサ110は、上述した演算値および/または演算値に基づいて作成された医学情報をサーバまたは他の外部装置に送信するように、通信モジュール140を制御することができる。さらに、プロセッサ110は、上述した演算値および/または演算値に基づいて作成された医学情報をメモリ120に記憶することもできる。
【0104】
図8Aは、一実施形態による腫瘍純度および少なくとも1つの指数が出力された一例を説明するための図である。
【0105】
図8Aを参照すると、プロセッサ110は、
図3~
図5を参照して上述した腫瘍純度を示す値810、および
図6を参照して上述した指数に関連する値820が出力されるように、表示装置を制御することができる。
【0106】
これにより、ユーザ30は、病理スライド画像に含まれる様々な情報を確認することができ、特にノイズに分類される情報も確認することができる。よって、ユーザ30は、病理スライド画像に表された組織および細胞に対して正確な腫瘍純度の情報を確認することができる。また、ユーザ30は、疾患の判定のためにさらなる実験を行うか否かを判断することができる。
【0107】
図8Bは、一実施形態による腫瘍純度および少なくとも1つの指数が出力された後にカバレッジ最小要件の理論最大深度を解析する方法の一例を説明するための図である。
【0108】
一実施形態によれば、腫瘍純度の第1値(AI-P)は、予想核酸収率(expected nucleic acid yield)からスライド画像の数を提供するように構成されてもよい。さらに、腫瘍純度の第1値(AI-P)は、スライド画像の全領域または関心領域における予想核酸収率から次世代シーケンシングカバレッジおよび深度(next-generation sequencing coverage and depth)を推定するように構成されてもよい。一般に、シーケンシング深度は、下記数式7により演算される。すなわち、一般的なシーケンシング深度は、固有の変異体の数(number of unique variants)、対立遺伝子頻度(allele frequency)、および読み取られた増幅ファミリーのおおよその数(approximate number of amplification family read)により演算することができる。
【0109】
【0110】
例えば、腫瘍純度の第1値(AI-P)が総予想DNA収率(total expected yield of DNA)を1ngであるものと決定した場合、半数体ゲノムコピー(haploid genome copies)は合計330個と予想することができる。これは、対立遺伝子頻度の1%での3つのコピーであることを示す((3/0.01)×10=3000X)。よって、ユーザ30には3000Xのシーケンス深度が推奨される。また、これを通して、ユーザ30は、下記数式8により、対象強化の平均読み取り値(average reads for target enrichment)を推定することができる。
【0111】
【0112】
シーケンシング方法は、様々なシーケンシングプラットフォームで利用することができる。よって、腫瘍純度の第1値(AI-P)は、予想DNA収率の推定に限らず、NGS技術に関するDNAおよびRNA応用分野をカバーできるRNAも含むことができる。
【0113】
説明の便宜上、以下ではDNAに限定して説明する。しかし、後述する内容は、DNAだけでなく、RNA関連技術にも適用できることは明らかである。
【0114】
一方、ヒト半数体ゲノム等価性(hGE)とは、DNA分離後にすべての遺伝子が存在することを保証することを意味する。シーケンシングカバレッジの理論最大深度(theoretical maximum depth of sequencing coverage)は、ヒトゲノム等価物の量と等しいので、総予想DNA収率は、シーケンシングカバレッジの理論最大深度を推定することができる。ヒト単一細胞のサイズは、1つのヒトゲノムに相当する33億塩基対(bp)であり、ヒトゲノム1当量は、3ピコグラムである。例えば、合計1ナノグラムのDNAには約330個のゲノム等価物が含まれている。また、合計100ngのDNAには33,000個のヒトゲノム等価物(hGE)が含まれている。よって、1ngのDNAの理論最大シーケンシングカバレッジは330Xである。一方、ユーザ30は、NGSベースの技術の機器の種類、ターゲットパネルのサイズ、ライブラリの複雑性、および追加考慮事項のためにライブラリを準備する間、エラー率に応じて最小シーケンス深度を考慮すべきこともある。ここで、ユーザ30は、ライブラリの準備中に、DNAのインプット量、多重化サンプルの数、および予想サンプル損失を考慮することができる。
【0115】
図8Bには、ユーザが、スライド画像からの予想DNA収率(expected DNA yields)および予想ライブラリ準備収率と多重化するサンプルの数(desired number of samples to be multiplexed with the expected library preparation yield)に応じて、所望量のインプットDNAを入力する例が示されている。例えば、下記数式9および数式10によれば、ユーザ30は、所望の出発物質(例えば、所望量のインプットDNA)に応じたカバレッジの理論最大深度を確認することができる。
【0116】
【0117】
【0118】
図8Bを参照すると、ユーザ30は、スライド画像からの予想DNA収率に応じて、所望のDNA量として「100ng」を入力することができる。そして、ユーザ30は、予想ライブラリ準備収率「32.5%」に多重化するサンプルの所望の数として「12」を入力することができる。プロセッサ110は、ユーザ30の入力に応じて、カバレッジの理論最大深度をユーザに提供することができる。
図8Bに示す例を参照すると、プロセッサ110は、カバレッジの理論最大深度(894X)を下記数式11のように計算することができる。
【0119】
【0120】
図9は、一実施形態による病理スライド画像を解析する方法のさらに他の例を説明するためのフローチャートである。
【0121】
図9を参照すると、ステップ910~ステップ940は、
図6のステップ610~ステップ640に対応する。よって、以下、ステップ910~ステップ940についての具体的な説明は省略する。
【0122】
ステップ950において、プロセッサ110は、少なくとも1つの指数と予め設定された閾値とを比較して、さらなる実験を行うか否かのガイドを提供する。
【0123】
図6のステップ640を参照して上述したように、プロセッサ110は、ユーザ30が核酸分離過程でどれだけの体積を溶出したかに応じて予想癌信号を推定することができる。
【0124】
一方、特定の百分率未満の予想癌信号は、予め設定された閾値によって、定量的PCR(qPCR)または検出限界未満の他の実験に対して「さらに行わない(no-go)」に分類されるべきこともある。ここで、予め設定された閾値は、ユーザ30により設定可能であり、設定された値の調整も可能である。
【0125】
例えば、ユーザ30が定量的PCR(qPCR)で実験を設計し、閾値が1%に設定されていると仮定する。DNAのインプット量が47μLである場合に予想癌信号が1%以上になるとすると、DNAのインプット量が47μL未満である実験は、「さらに行わない(no-go)」に分類されるべきである。
【0126】
プロセッサ110が予想癌信号と閾値とを比較してさらなる実験を行うか否かのガイドを提供することにより、ユーザ30は単一のスライドで検出できる限界値を設計するのに有用になり得る。
【0127】
図10は、一実施形態によるプロセッサにより提供されるガイドの一例を説明するための図である。
【0128】
図10を参照すると、プロセッサ110は、DNAのインプット量に対する予想癌信号を示すグラフを生成することができる。しかし、プロセッサ110が生成するガイドは、
図10に示すグラフに限定されず、様々な方式のガイド(例えば、テーブルなど)を適用することができる。
【0129】
例えば、閾値として予想癌信号が0.2%であるものが設定されていると仮定すると、プロセッサ110は、予想癌信号が0.2%未満である値1010と、予想癌信号が0.2%以上である値1020とを区別して出力することができる。これにより、ユーザ30は、出力されたガイドを検討し、さらなる実験を行うか否かを判断することができる。
【0130】
図11Aは、一実施形態による病理スライド画像および様々な情報が出力された一例を示す図である。
【0131】
図11Aには、表示装置に出力された画像1100の一例が示されている。例えば、画像1100には、病理スライド画像1110およびサムネイル画像1120が含まれる。病理スライド画像1110は、ユーザ30の操作によって拡大または縮小することができる。サムネイル画像1120には、ユーザ30により観察された領域と、未観察領域とが区別して表示されてもよい。また、サムネイル画像1120には、ユーザ30による観察が必要な関心領域が表示されてもよい。
【0132】
また、画像1100には、病理スライド画像1100の解析に応じた様々な情報1130、1140、1150が含まれてもよい。具体的には、画像1100には、
図3~
図10を参照して上述した様々な演算値1130、1140が含まれてもよく、また、病理スライド画像1100に対応する癌の種類1150が含まれてもよい。
【0133】
さらに、画像1100には、病理スライド画像1100の解析に応じて分類された領域および細胞を選択できる領域1160が含まれてもよい。ユーザ30は、領域1160に出力された一部または全部を選択することにより、病理スライド画像1100の中でユーザ自身が望むオブジェクトに対してのみ観察を行うこともできる。
【0134】
図11Bは、一実施形態による病理スライド画像および様々な情報が出力された他の例を示す図である。
【0135】
図11Bには、表示装置に出力される画像1200の一例が示されている。画像1200には、病理スライド画像1210の解析に応じた様々な情報が含まれてもよい。一実施形態において、プロセッサ110は、腫瘍純度の第1値(AI-P)を評価することにより、予想癌信号を計算および出力することができる。
【0136】
腫瘍細胞の予想腫瘍DNA収率をすべての細胞の予想DNA収率で割ると、数式1を参照して上述した腫瘍純度の第1値(AI-P)も導出することができる。
【0137】
ユーザが核酸を分離する過程で溶出される体積に応じて、予想癌信号を推定することができる。例えば、ユーザは、総体積が50μLの溶出緩衝液であるDNAを分離する際に、腫瘍純度の第1値(AI-P)を49(1:49)で割って腫瘍信号の割合を希釈することができる。予想癌信号が特定の百分率未満であるか否かは、ユーザにさらなる実験を行うか否かをガイドする基準となり得る。プロセッサ110は、予想癌信号を示す指標を計算し、疾患の診断のためのさらなる実験を行うか否かを決定することができる。
【0138】
図11Bを参照すると、プロセッサ110は、計算された腫瘍純度に基づいて、核酸分離過程の間、溶出の体積量に応じて、NGSの最小要求シーケンシング深度(minimum required sequencing depths)をユーザにさらに提供することができる。
【0139】
上述したように、プロセッサ110は、病理スライド画像に含まれるノイズに関する情報を含む腫瘍純度を演算する。よって、ユーザ30は、病理スライド画像に表された組織および細胞に対して正確な腫瘍純度の情報を確認することができる。
【0140】
また、プロセッサ110は、TCGA(The Cancer Genome Atlas)の32種類の腫瘍サンプルを予測するように訓練されたAIモデルを用いて、腫瘍純度を演算する。よって、ユーザ30は、あらゆる種類の癌の診断を正確に行うことができる。
【0141】
さらに、プロセッサ110は、予想癌信号を示す指数を演算することができる。よって、ユーザ30は、疾患の判定のためにさらなる実験を行うか否かを判断することができる。
【0142】
一方、上述した方法は、コンピュータで実行可能なプログラムで作成することができ、コンピュータで読み取り可能な記録媒体を用いて前記プログラムを動作させる汎用デジタルコンピュータで実現することができる。また、上述した方法で用いられたデータの構造は、コンピュータで読み取り可能な記録媒体に様々な手段を介して記録することができる。前記コンピュータで読み取り可能な記録媒体は、磁気記録媒体(例えば、ROM、RAM、USB、フロッピーディスク、ハードディスクなど)、光学読取媒体(例えば、CD-ROM、DVDなど)などの記憶媒体を含む。
【0143】
本実施形態に関連する技術分野における通常の知識を有する者であれば、上記記載の本質的な特性から逸脱しない範囲で変形した形態で実現できることが理解できるであろう。よって、開示された方法は、限定的な観点ではなく、説明的な観点から考慮されるべきであり、権利範囲は、上記説明ではなく、特許請求の範囲に示されており、それと同等の範囲内にあるすべての相違点を含むものと解釈されるべきである。