(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-04
(45)【発行日】2023-08-15
(54)【発明の名称】細胞学的試料中の少なくとも1つの異常を有する細胞を検出するための方法
(51)【国際特許分類】
G01N 33/48 20060101AFI20230807BHJP
C12Q 1/04 20060101ALI20230807BHJP
【FI】
G01N33/48 M
G01N33/48 Z
C12Q1/04
(21)【出願番号】P 2020552248
(86)(22)【出願日】2019-03-28
(86)【国際出願番号】 FR2019050718
(87)【国際公開番号】W WO2019186073
(87)【国際公開日】2019-10-03
【審査請求日】2021-12-27
(32)【優先日】2018-03-29
(33)【優先権主張国・地域又は機関】FR
(73)【特許権者】
【識別番号】518023164
【氏名又は名称】オフィス ナショナル デテュード エ ドゥ ルシェルシュ アエロスパシアル
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】ハダッド,ゼイラ
(72)【発明者】
【氏名】エルバン,ステファヌ
(72)【発明者】
【氏名】チャン-ホン-トン,アドリアン
【審査官】北条 弥作子
(56)【参考文献】
【文献】特表2009-511002(JP,A)
【文献】国際公開第2017/194556(WO,A1)
【文献】米国特許第05933519(US,A)
【文献】米国特許出願公開第2005/0136549(US,A1)
【文献】特表2002-520595(JP,A)
【文献】小椋俊彦,大気圧電子顕微鏡ASEMによる水中観察法の開発,Synthesiology,2015年08月,Vol.8 No.3,pp.116-126
【文献】早川正道,上部尿路上皮性腫瘍の臨床的ならびに細胞学的研究,日泌尿会誌,1978年,69巻11号,pp.1439-1456
【文献】鈴木徹,尿細胞診の研究(第2報) 尿路疾患患者に於ける走査電顕での尿中剥離細胞診,日泌尿会誌,1986年,77巻2号,pp.233-242
【文献】大貫泰佳,細胞診断のための細胞核画像の輪郭複雑度による定量的評価法の検討,FIT2013 (第12回情報科学技術フォーラム),第2分冊,pp.401-402
【文献】塚田裕也,CNN特徴量を利用した細胞核の抽出及び分類,平成29年度修士論文概要,2017年,pp.1-2
【文献】山本修,解説 電子顕微鏡はまだまだ活躍できる,顕微鏡,2017年,Vol. 52, No. 2,pp.90-97
(58)【調査した分野】(Int.Cl.,DB名)
G01N 33/48
G01N 15/14
G06V 20/69
(57)【特許請求の範囲】
【請求項1】
細胞学的試料の少なくとも1つの第1のデジタル化された電子顕微鏡画像(1)に基づき、前記
細胞学的試料中の少なくとも1つの異常を有する細胞を検出するための方法であって、前記方法は、コンピュータ実行処理モジュールを用いて行われ、
前記方法は、以下のサブ工程を含む、前記第1の
デジタル化された電子顕微鏡画像
(1)を処理する工程(110)を含み:
-前記第1の
デジタル化された電子顕微鏡画像(1)から開始して、比色検出を用いて、前記
細胞学的試料中に存在する各要素(4)を検出し(工程112)、次いで、少なくとも1つの孤立した細胞(10)又は1つの細胞群(14)から選択された各要素(4)をフィルターする;
-検出された各細胞群(14)から開始して、前記細胞群(14)の輪郭の検出に基づく少なくとも1つのセグメンテーション法を用いて、核を有する少なくとも1つの細胞を個別化する(工程116);
前記方法は、以下のサブ工程を含む、細胞の異常を検出する工程(工程140)をさらに含み:
-先行する工程における孤立した各細胞(10)又は個別化された各細胞について、「異常のエキスパート特性」と呼ばれる別個の異常の2つの特性に関するデータを計算し、これらの計算されたデータを参照データと比較する(工程142)ことによって、前記細胞が少なくとも1つの異常を有するかを判定する(工程144);
-次いで、前記
細胞学的試料中の少なくとも1つの異常を有する細胞の総数を数える(工程146);
前記方法は、以下のサブ工程を含む、前記
細胞学的試料の異常レベルにしたがって、前記
細胞学的試料を特性付ける第1の工程(工程150)をさらに含み:
-少なくとも1つの異常を有する細胞の前記総数を、前記異常レベルの閾値
と比較する;
-少なくとも1つの異常を有する細胞の前記総数が前記異常レベルの前記閾値未満である場合には、異常レベルがゼロである試料を表すクラスに前記
細胞学的試料を分類する(152);
-少なくとも1つの異常を有する細胞の前記総数が前記異常レベルの前記閾値を超える場合には、異常レベルが証明された試料を表すクラスに前記
細胞学的試料を分類する(154);
前記方法は、以下のサブ工程を含む、類型選択する工程(工程130)をさらに含む:
-前記
細胞学的試料の前記第1のデジタル化された
電子顕微鏡画像(1)から開始して、前記細胞のサイズを測定し、次いで、前記細胞のサイズにしたがって前記細胞を分類する(工程132);
-測定された細胞の各クラスを対応する細胞型と一致させ、次いで
、少なくとも1つの選択された細胞型を選択する(工程134);
前記方法は、以下のサブ工程をさらに含む、前記細胞学的試料からの前記細胞の異常レベルにしたがって、前記細胞学的試料を特性付ける第2の工程(工程160)を含む:
-前記細胞学的試料の第2のデジタル化された蛍光画像(2)から開始して、選択された細胞型の全ての前記細胞を、前記第1のデジタル化された電子顕微鏡画像(1)において予め定義された(工程134)前記細胞学的試料における細胞の位置にしたがって、選択する(工程162);
-予め選択された各細胞の周りの蛍光の広がりのレベルを測定する;
-測定された前記蛍光の広がりのレベルが前記蛍光の最小の広がりのレベルを超える場合には、低い細胞の異常レベルを有する試料を表すクラスに前記試料を分類する(168);
ことを特徴とする方法。
【請求項2】
少なくとも1つの前記異常のエキスパート特性は、前記細胞中の前記核の表面積比、又は前記核の不規則性、又は前記核の斑状比色、又は前記核のハイパー比色であることを特徴とする、請求項1に記載の方法。
【請求項3】
少なくとも1つの前記異常のエキスパート特性は、前記核の不規則性であり、前記核の前記不規則性の計算は、分析された各細胞の核と「参照」と呼ばれる細胞の核型との間の比較に対応する偏差計算であり、この偏差計算は、以下のリスト:表面の差、周の差、前記核の凸性の差、重心の差、検出された各核の前記輪郭の長さの差、前記核の輪郭の不規則性の差、各核内の画素数の差、及び前記細胞内の前記核の偏心の差から選択されることを特徴とする、請求項1又は2に記載の方法。
【請求項4】
核を含む細胞の数にしたがって、及び最小の有用性閾値にしたがって、前記細胞学的試料の有用性をリコメンドする工程(工程120)を含
む、
ことを特徴とする、請求項1~3の何れか一項に記載の方法。
【請求項5】
前記最小の有用性閾値は、核を含む前記第1の
デジタル化された電子顕微鏡画像(1)において検出された少なくとも7つの細胞に等しいことを特徴とする、請求項
4に記載の方法。
【請求項6】
前記方法は、前記処理モジュールを用いて、全ての結果データを結合し、前記第1の
デジタル化された電子顕微鏡画像(1)及び前記第2の
デジタル化された蛍光画像(2)に基づいて分析された前記細胞学的試料を、前記
細胞学的試料の細胞の異常レベルに関連する3つのクラス、すなわち、0、低、又は高、のうちの1つに分類することを特徴とする、請求項4
または5に記載
の方法。
【請求項7】
前記細胞学的試料は、自然排尿からの尿試料であることを特徴とする
、請求項
1~6の何れか一項に記載の方法。
【請求項8】
前記少なくとも1つの選択された細胞型は、尿路上皮細胞型である、請求項1~7の何れか一項に記載の方法。
【請求項9】
前記異常レベルの閾値は、各々が少なくとも1つの異常を有する少なくとも3つの細胞に等しい、請求項1~8の何れか一項に記載の方法。
【発明の詳細な説明】
【発明の詳細な説明】
【0001】
本発明は、細胞学的試料の1つのデジタル化された画像、又はいくつかのデジタル化された画像に基づき、同じ試料中の少なくとも1つの異常を有する細胞を検出するための方法に関する。本発明はまた、この方法を実行する装置に関する。
【0002】
本発明は、スライド上に固定した後の細胞学的試料からの細胞の微視的研究である細胞学の分野に関する。より正確には、当該研究は、正常な細胞の、又は少なくとも1つの異常を有する細胞を意味する異常な細胞の、形態学的、放射分析的、又は生化学的側面の研究を含む。
【0003】
癌スクリーニングは、細胞学の応用分野の1つであり、被験者から採取した細胞学的試料を用いて癌を探索、及び発見することからなる。スクリーニングは、部分的には、解剖学-病理学的試験室で、異常な細胞を検出するための方法について訓練された細胞技師及び細胞病理学者によって、行われる。細胞学は、例えば「低悪性度」と呼ばれる早期段階の癌、及び「高悪性度」と呼ばれるより進行した段階の癌等、様々な段階での癌の診断が可能となるため、一部の癌の検出に非常に有用である(悪性度はまた、癌の種類に対応し得る。)。癌の早期診断は、罹患患者の生存率、及び対応する罹患患者の看護費に重大な影響を及ぼす、明らかに重要な事項である。例えば、毎年、膀胱癌に関して、膀胱癌診断を補助するための1000万件の尿の細胞学的研究が世界中で行われた;自然排尿から得られた細胞学的スライド上の試料の分析は、膀胱癌を診断するための最新の手法である。
【0004】
しかしながら、細胞学的試料の分析によるこの診断方法は、細胞病理学者及び細胞技師の経験、及び人数の減少を意味する人間的側面、また、特定の癌に対する感度の低さの両方から制限される。典型的には、異常な細胞又は正常でない細胞はまだ顕著な形態学的変形を受けておらず、したがって人間の眼による検出が困難であるため、低悪性度の膀胱癌の診断に関する感度は非常に低い。したがって、この手法全体の性能、また信頼性も向上させることに役立ち得る、日常的にかつ低コストで使用することができる手順を探す必要がある。
【0005】
この状況に基づいて、本発明の目的の1つは、続く癌、特に膀胱癌の検出を補助するために、デジタル化されたスライド画像に基づき、細胞学的試料中の少なくとも1つの細胞の異常を有する細胞を検出するための方法を提供することからなる。有利には、本発明は、コンピュータ実行処理モジュールを用いた、スライド上に存在する試料からの細胞の自動化された網羅的な分析を提供する。したがって、細胞学的試料の分析、及び潜在的には正常でない全ての細胞の分析は、完全であり、迅速であり、より正確であり、細胞病理学者及び細胞技師の一般的な分析エラーを克服するために役立つ。さらに、この方法は、試料の細胞学的分析結果の標準化を保証する。しかし、この方法はさらに、小さな異常を有する細胞を検出することによって、低悪性度と呼ばれる癌、特に低悪性度の膀胱癌の早期診断に役立つ。
【0006】
本発明は、前述した最新技術の欠点を改善することを目的とし、代替的な解決策がないことによって動機付けられる。この目的、又は他の目的を達成するために、本発明の第1の態様は、細胞学的試料の少なくとも1つの第1のデジタル化された電子顕微鏡画像(1)に基づき、前記試料中の少なくとも1つの異常を有する細胞を検出するための方法を提案し、前記方法は、コンピュータ実行処理モジュールを用いて行われ、特に、完全にコンピュータ実行処理モジュールを用いて行われることを特徴とする。
【0007】
前記方法は、以下のサブ工程を含む、前記第1の画像を処理する工程を含む:
-前記第1の画像から開始して、比色検出を用いて、少なくとも1つの孤立した細胞又は1つの細胞群から選択された、前記試料中に存在する各要素を検出する;
-比色検出を用いて、孤立した各細胞及び/又は各細胞群をフィルターする;
-検出された各細胞群から開始して、前記細胞群の輪郭の検出に基づく少なくとも1つのセグメンテーション法を用いて、核を有する少なくとも1つの細胞を個別化する。
【0008】
さらに、前記方法は、以下のサブ工程を含む、細胞の異常を検出する工程をさらに含む:
-先行する工程における孤立した各細胞又は個別化された各細胞について、「異常のエキスパート特性」と呼ばれる別個の異常の2つの特性に関するデータを計算し、これらの計算されたデータを参照データと比較することによって、前記細胞が少なくとも1つの異常を有するかを判定する;
-次いで、前記試料中の少なくとも1つの異常を有する細胞の総数を数える。
【0009】
最後に、前記方法は、以下のサブ工程を含む、前記試料の異常レベルにしたがって、前記試料を特性付ける第1の工程をさらに含む:
-少なくとも1つの異常を有する細胞の前記総数を、前記異常レベルの閾値と、好ましくは各々が少なくとも1つの異常を有する少なくとも3つの細胞に等しい閾値と比較する;
-少なくとも1つの異常を有する細胞の前記総数が前記異常レベルの前記閾値未満である場合には、異常レベルがゼロである試料を表すクラスに前記試料を分類する;
-少なくとも1つの異常を有する細胞の前記総数が前記異常レベルの前記閾値よりも高い場合には、異常レベルが証明された試料を表し、異常レベルが低いこと又は異常レベルが高いことを意味するクラスに前記試料を分類する。
【0010】
本発明のこの態様によれば、本検出方法は最後に、少なくとも1つの第1の画像に基づき、好ましくはさらに第2の画像の分析にも基づき、細胞の異常レベルにしたがって細胞学的試料を分類する。本発明で使用される処理モジュールは、試料の第1のデジタル化された透過型電子顕微鏡画像及び/又は試料の第2のデジタル化された蛍光顕微鏡画像から計算されたデータを、細胞学で公知の参照データと組み合わせることができる。
【0011】
前述の第1の画像を処理する工程中には、第1の画像からのいくつかの構成要素、特に孤立した細胞、細胞群、除去されるべき要素、又は分析することができないため本方法を進めるために除外される細胞クラスタが検出されることが理解されるであろう。
【0012】
本解決策によって、2つのクラスにしたがって試料を分類することにより恩恵を受けることができるようになり、試料の細胞の異常レベルがゼロであるか、又は試料が証明された細胞の異常レベルを有するかどうかを診断することができるようになる。次いで、この結果は、専門医による癌か否かの診断を大いに助けるであろう。
【0013】
さらに、本発明によれば、細胞の異常のエキスパート特性を、細胞の適合性(conformity)の優れた指標として見なすことができることに留意されたい。
【0014】
好ましくは、前記異常のエキスパート特性の1つは、前記細胞中の前記核の表面積比、又は前記核の不規則性、又は前記核の斑状比色(mottled colorimetry)、又は前記核のハイパー比色(hyper-colorimetry)である。「斑状比色」とは、特定の点又はスポットの色強度を測定することを意味すると理解される。
【0015】
さらに好ましくは、異常のエキスパート特性は、核の特性、特に細胞のサイズに照らした核のサイズ比、細胞中の核の位置、又は核の比色特性である。より正確には、異常のエキスパート特性は、細胞中の核の表面積比、又は核の不規則性、又は斑状比色、又は核のハイパー比色である。
【0016】
有利には、少なくとも1つの前記異常のエキスパート特性は、前記核の不規則性であり、前記核の前記不規則性の計算は、分析された各細胞の核と細胞学において「参照」と呼ばれる細胞の参照と呼ばれる核型との間の比較に対応する偏差計算である。この偏差計算は、以下のリスト:表面の差、周の差、前記核の凸性の差、重心の差、検出された各核の前記輪郭の長さの差、前記核の輪郭の不規則性の差、各核内の画素数の差、及び前記細胞内の前記核の偏心の差から選択される。
【0017】
特定の実施形態によれば、少なくとも1つの異常のエキスパート特性は、核の輪郭の長さであり、この特性の計算は、以下のサブ工程をさらに含む:
-核の輪郭抽出法を使用することによって、実際の核の輪郭を計算する;
-核の境界包絡線(bounding envelope)をトレースすることによって、核の直径、好ましくは最大直径を決定する;
-参照核の境界包絡線であるC2ランクの閉じた凸曲線境界包絡線(C2 rank closed convex curve bounding envelope)をトレースする;
-実際の核の輪郭と、参照核の輪郭を表すトレースされた凸曲線との間の差を計算する。
【0018】
特定の実施形態によれば、少なくとも1つの異常のエキスパート特性は、核の輪郭の不規則性であり、この特性の計算は、以下のサブ工程をさらに含む:
-検出された核の輪郭における少なくとも1つの角点を検出する;
-核の輪郭における角点の総数を計算する;
-対応する各角点について角度を測定する;次いで、
-核当たりの検出された角点の数及びそれらの角度についてのデータを組み合わせることによって、核の輪郭の不規則性の程度を決定する。
【0019】
特定の実施形態によれば、本発明に係る方法は、以下のサブ工程を含む、類型選択する工程を含む:
-前記試料の前記第1のデジタル化された画像から開始して、前記細胞のサイズを測定し、次いで、前記細胞のサイズにしたがって前記細胞を分類する;
-細胞の各クラスを対応する細胞型と一致させ、次いで、細胞のサイズに対応して選択された、尿路上皮細胞型等の、少なくとも1つの細胞型を選択する。
【0020】
特定の実施形態によれば、本発明は、前記試料からの前記細胞の前記異常レベルにしたがって、前記試料を特性付ける第2の工程をさらに含んでもよい。この第2の工程は、以下のサブ工程をさらに含む:
-前記試料の第2のデジタル化された蛍光画像から開始して、尿路上皮等の選択された細胞型の全ての前記細胞を、前記第1のデジタル化された画像において予め定義された前記試料における細胞の位置にしたがって、選択する;
-予め選択された各細胞の周りの蛍光ハローの存在を検出する、好ましくは前記蛍光のレベルを測定する、さらに好ましくは前記蛍光の広がりのレベルを測定する;
-蛍光ハローが検出される場合には、好ましくは最小の蛍光のレベルが測定された場合には、また好ましくは前記蛍光の最小の広がりのレベルが測定された場合には、低い異常レベルを有する試料を表すクラスに前記試料を分類する。
【0021】
別の特定の実施形態によれば、本発明は、核を含む細胞の数にしたがって、及び最小の有用性閾値にしたがって、前記試料の有用性をリコメンドする工程を含み、好ましくは前記最小の有用性閾値は、核を含む前記第1の画像における少なくとも7つの細胞に等しい。
【0022】
本発明によれば、本方法は、前記処理モジュールを用いて、全ての結果データを結合し、前記第1の画像及び前記第2の画像に基づいて分析された前記細胞学的試料を、前記細胞の異常レベルに関連する3つのクラス、すなわち、0、低、又は高、のうちの1つに分類する。
【0023】
本発明の第2の態様は、第1の画像及び/又は第2の画像に基づき、深層学習法を用いて、細胞学的試料中の少なくとも1つの異常を有する細胞を検出するための方法であって、コンピュータによって実行される処理モジュールを用いて、試料を、試料の細胞の異常レベルに関連する3つのクラス、すなわち、0、低、又は高、のうちの1つに割り当てる方法を提案する。
【0024】
この方法は、本発明の第1の態様のうちの少なくとも1つの変形例によって提供されるデータを使用するという点で有利である。
【0025】
好ましくは、前記細胞学的試料は、自然排尿からの尿試料である。
【0026】
本発明の第3の態様は、前述のような方法を実行する装置を提案する。
【0027】
本発明の第4の態様は、膀胱癌の診断を補助するための、以下に記載されるような方法の使用を提案する。
【0028】
本発明の他の詳細及び利点は、添付の図面を参照してなされる非限定的な実行例の以下の説明において、明らかになるであろう。
【0029】
図1は、本発明の好ましいモードにしたがって実施される方法の様々な工程を示す図である。
【0030】
図2は、処理する工程の前後の、試料のデジタル化された電子顕微鏡像の第1の例を示す。ここで、第1の画像は特に、孤立した細胞、細胞クラスタ、細胞群、及び除去されるべき要素を含む。
【0031】
図3は、第1の画像を処理する工程の前後の、第2の試料のデジタル化された電子顕微鏡画像の第2の例を示す。ここで、第1の画像は特に、孤立した細胞、細胞クラスタ、細胞群、及び除去されるべき要素を含む。
【0032】
図4は、孤立した細胞の2つの電子顕微鏡画像と、コンピュータによって実行される処理モジュールを用いて抽出された細胞の核の2つの電子顕微鏡画像とを表す。
【0033】
図5は、孤立した細胞、その抽出された核、及びコンピュータによって実行される処理モジュールを用いて核細胞のサイズ比を測定するためのトレースの一例を表す。
【0034】
図6は、第2のデジタル化された画像に基づき、試料を特性付ける第2の工程を含む、別の実施形態にしたがって実施される方法の様々な段階を示す図である。
【0035】
図7は、本発明の第2の態様、より正確には、画像断片のセットに対応する少なくとも1つの細胞学的試料の画像の分類に適用される、深層学習のための実行方法を示す図である。
【0036】
最初に、図面は、本発明を概略的に開示するものであることに注意しなければならない。これらの図面は、限定することなく与えられた実行例を表し、必ずしも特定の時系列に従うものではない。
【0037】
本発明は、複雑で多数の対象のデジタル化された画像のコンピュータビジョンの用途の一般的なカテゴリに属する。本発明は、第1のデジタル化された画像に基づき、好ましくは同じ試料の第2のデジタル化された画像を使用して、細胞学的試料中の少なくとも1つの異常を有する細胞を検出するための独自の方法を取り扱う。第1の画像は透過型電子顕微鏡により得られ、第2の画像は蛍光顕微鏡により得られる。使用される画像は、本方法に適した調製をされ、次いで、細胞学的スライド上に広げられた細胞学的試料の特定のデジタル化から得られる。本発明に係る方法は、所望の分析にしたがって、区別無く、体液に由来する、又は人体からの要素の採取に由来する細胞学的試料を使用することができる。ここで提示される実施形態では、自然排尿からの尿試料が採取される。この文脈においては、細胞学的試料中の少なくとも1つの異常を有する細胞を検出するためのこの方法の結果は、膀胱癌、特に早期段階の膀胱癌、又はいわゆる低悪性度の膀胱癌の診断を助けることに役立つであろう。
【0038】
以下の説明では、
図1に示すように、予備工程、中間工程、又は後続工程であり得るいくつかの工程を含む、好ましい実施形態を説明していく。選択された実施形態によれば、これらの工程のうちの1つ以上が、本発明に係る方法に追加され得るか、又は本発明に係る方法から除外され得ることは理解されるであろう。
【0039】
有利には、本発明に係る検出方法は、試料から計算されたデータと細胞学から公知の参照データとを組み合わせることができるコンピュータによって実行される処理モジュールを用いて実行される工程を含む。計算されたデータと呼ばれるデータは、少なくとも1つの試料のスライドの少なくとも1つのデジタル化された画像から、処理モジュールによって計算され、収集される。したがって、学習法を使用して、処理モジュールは、試料から又はいくつかの試料から計算され、収集された全てのデータと、細胞学から公知の参照データとを組み合わせることができる。
【0040】
ここで提示される好ましい実施形態によれば、本発明に係る検出方法は、予備画像処理工程110を含む。この予備画像処理工程110の目的は、
図1~
図3に示すように、特に検出方法の結果に干渉し精密度を下げる可能性がある第1のデジタル化された画像1を構成する要素4を無視することによって、細胞の開始選択を可能な限り改善することである。これを行うために、この予備処理工程110は、第1の画像1中に存在する要素4を検出するサブ工程112を含む。この検出するサブ工程112は、少なくとも部分的に比色検出に基づく。当該比色検出は、少なくとも部分的に、第1の画像1からの色の全範囲をいくつかのグループにセグメンテーションすることから構成され得る。最も明るく最も広いグループは画像の背景の色6に対応し、最も暗いグループは細胞核の色に対応する。画像の背景6からの画素ではない画素はいずれも、要素4からの画素であり、生物学的物体からの画素を意味すると考えられる。したがって、画像の背景6が決定され、画像の背景6の部分ではない全てのものが、要素4、すなわち、細胞、細胞群、細胞クラスタ、又は除去されるべき要素に対応する。次に、セグメンテーション法を用いていくつかの画像断片8を生成することによって、画像の背景6から要素4全てが抽出される。検出された様々な要素4を分類するために、核を検出するこの比色検出がさらに使用され、ここでは、このサブ工程は「粗いサブ工程」と呼ばれる。
【0041】
さらに、比色検出を意味する、この核を検出する第1のサブ工程は、検出された各要素4の寸法の測定と組み合わせることができる。例えば、いくつかの核が比色検出によって検出される場合、この要素の測定は、検出された要素4の型を同定することに役立つ。
【0042】
したがって、検出するサブ工程112の結果として、核の比色検出を用いて、場合によってはこれらの要素4の測定から、第1の画像1を構成する要素4の、以下のような様々な予備クラスを同定することができる:
-除去されるべき要素:これは、核を有する細胞を構成しない全てのものである。実際に、核を有していない要素はいずれも、判断できず、これは無駄であるか、又は誤った検出であるかのいずれかであり得るので、除去される。
-孤立した細胞:これらは、単一の核のみを含み、結果として孤立した細胞である画像断片である。
-細胞群:これらは、群を成す(接触するか、又は重なり合う)細胞であり、したがっていくつかの核を含む。
-クラスタ:これらは、非常に密な(非常に暗い)細胞の特定の群であり、細胞が非常にはっきりと重なり合う。クラスタを従来の細胞群と区別するのは、クラスタの中に「核」クラスのより大きな表面積を有するという事実である。
【0043】
より詳細には、
図3は、予備処理工程110を受ける試料の第1の画像1を示す。前述したように、この工程110の間に、第1の画像1は、暗色を有する要素4を取り囲む画像断片8を得るためにセグメンテーションされ、これらの画像断片8は次いで、4つのクラス、すなわち、除去されるべき要素12、孤立した細胞10、細胞群14、及び細胞クラスタ16(これらもまた除去される)に予め分類される。本発明の良好な操作のために、本発明に係る検出方法は、細胞から開始して行われなければならず、当該細胞は、核を含む、孤立した細胞、又は細胞群から個別化された細胞でなければならない。孤立した細胞10及び細胞群14は、フィルタリングサブ工程114の間に、比色検出を使用してフィルターされる。
【0044】
結果として、予め分類された細胞群14は、フィルタリングサブ工程114の後に、個別化するサブ工程116を受ける。このサブ工程116は、細胞群14から細胞を個別化することからなる。「個別化する」とは、細胞群14から、核を含む少なくとも1つの細胞を抽出することを意味すると理解される。この個別化するサブ工程116は、「細胞クラスタ」16として予め分類されたものに対しては実行されないことに留意されたい。実際、細胞クラスタ16は、個別化するには複雑すぎる構造であり、それらを考慮すると、使用可能な関連情報よりも多くのエラーが生じることになる。このため、本発明によれば、クラスタ16は使用されない。細胞を個別化するサブ工程116は、第1の画像の勾配の計算を介した輪郭の検出に基づくか、又はラドン(Radon)、ガボール(Gabor)、若しくは多方向多重スケール変換のような多方向性の態様を有する数学的変換の使用を介した輪郭の検出に基づく、新しいセグメンテーションを用いて行われる。場合によっては数理形態学的手法を用いて輪郭を決定した後、閉輪郭に含まれ、したがって細胞に対応するあらゆる構造が抽出される。それは、個別化された細胞であり、本発明に係る方法の以降の工程の対象となるものとして定義される。
【0045】
ここで好ましい実施形態によれば、潜在的に癌性である細胞を検出するための、試料の有用性をリコメンドする任意の工程120を行ってもよい。本実施形態によれば、この有用性をリコメンドする工程120は、本発明に係る方法の進行中に、好ましくは予備処理工程110の最後に、いくつかのレベルで1回以上行うことができる。この有用性をリコメンドする工程120は、試料中での検出に偏りがないように、第1の画像1が核を含む細胞を十分な数含むかどうかを推定することに相当する。これを行うために、第1の画像1中に存在する核を有する細胞の総数が決定される。この細胞の総数は、本発明に係る方法を継続するか否かを決定するユーザに伝達される。好ましくは、この核を有する細胞の総数は、ユーザによって事前に決定される最小の有用性閾値の値と比較される。変形例として、ユーザは、本発明による方法を自動的に継続するか否かを許可するために、処理モジュール内の試料についての最小の有用性閾値の所望の値を再入力してもよい。したがって、本検出方法は、第1の画像1中の核を有する細胞が非常に少ない場合であっても、これらの細胞の総数が最小の有用性閾値の値以上である限り、継続してもよい。例えば、最小の有用性閾値の値は、試料中で検出された核を有する少なくとも7つの細胞に等しく、したがって、核を有する細胞の総数が7以上である場合、本方法は継続する。逆に、核を有する細胞の数が不十分である場合、有用性をリコメンドする工程120は、本検出方法を中断することができる。
【0046】
ここで好ましい実施形態によれば、試料中の、少なくとも1つの細胞の異常を有する細胞、より正確には潜在的に癌性である細胞を、選択された細胞型から検出するために、類型選択する任意の予備工程130を行うことができる。これを行うために、第1の画像1から開始して、試料からの細胞が測定され、次いで、それらのサイズにしたがって分類される(工程132)。処理モジュールを用いて、それらのサイズにしたがって分類された細胞は、細胞型によってグループ化され、次いで、例えば尿路上皮細胞型又は任意の他の細胞型等の、選択された細胞型にしたがって選択される(工程134)。選択された細胞型について、細胞の異常レベルは、癌の型と相関し得る。変形例によれば、ユーザは、好ましい細胞型自体を定義してもよい。例えば、膀胱癌の診断を補助するために尿の細胞学的試料に適用される検出方法については、好ましい細胞型は、尿路上皮型である。一般に、尿路上皮細胞の調査は、特に遭遇する異常に基づいて癌の段階を決定するために、膀胱癌の診断を補助するための良い指標である。
【0047】
予備画像処理工程110、試料の有用性をリコメンドする任意の工程120、及び類型分類の任意の予備工程130の後に、1つの核を含み、1つの選択された細胞型を含む、孤立した細胞、又は個別化された細胞の精密な選択が達成される。
【0048】
思い出されるように、本発明に係る方法は、少なくとも1つの第1の画像に基づき、細胞学的試料中の少なくとも1つの異常を有する細胞の検出をもたらす。試料の細胞の異常レベルは、細胞学的試料で遭遇する細胞の異常の数及び型と相関している。言い換えれば、本発明に係る方法は、証明された異常レベルと呼ばれる細胞の異常レベルのクラス、又はゼロと呼ばれる細胞の異常レベルのクラスのいずれかに試料を分類することに役立てることができる。
【0049】
これを行うために、
図1に示される好ましい実施形態は、試料中の細胞の異常を検出する工程140をさらに含む。本発明によれば、異常を有する細胞は、参照と呼ばれるデータから逸脱した、すなわち基準から逸脱した異常のエキスパート特性を有する細胞として定義される。言い換えれば、それは少なくとも1つの異常を有する細胞を含み、1つの異常のエキスパート特性が正常でないことを意味する。したがって、1つの異常のエキスパート特性の計算は、基準からの偏差を決定し、したがって異常の有無を決定することに役立つデータを得ることに役立つ。異常のエキスパート特性の計算は、測定、又は任意の他の型の数学的方法を意味すると理解される。本発明によれば、計算される異常のエキスパート特性は、核の特性であり、特に、細胞の核と細胞質との間のサイズ比、又は核の位置の測定、又は核の比色測定に対応する。より正確には、異常のエキスパート特性は、細胞中の核の表面積比、又は核の不規則性、又は斑状比色、又は核のハイパー比色に対応する。前述した様々な異常のエキスパート特性は、限定するものではないが、試料において計算された値にしたがって異常を発見することができる。他の型の異常のエキスパート特性を計算し、区別することなく、細胞を分類するためのパラメータとして使用してもよいことを理解されたい。
【0050】
各細胞において探索され検出された異常は、より具体的には、各細胞の核に関連している。そのためには、それに関連する異常を検出できるようにするために、核の精密な検出が必要である。
【0051】
核の精密な検出は、セグメンテーションによって行われる。このセグメンテーションは特に、比色のみを使用した粗いセグメンテーションを改善することによって行うことができる。本明細書で先に説明したこの技術は、境界包絡線に基づき、核の周りに矩形を形成することからなることが好ましい。この境界包絡線は、常に細胞に含まれ、(核の全表面の)10~40%、好ましくは20~30%だけ核を越えて延在する、核の周りの区域の境界を定める。
図4及び5は、それぞれ、精密な核の検出結果を示す。
【0052】
本実施形態によれば、核は、第1のセグメンテーションを用いた核の粗い検出の間の予備画像処理工程110の間にすでに検出されていてもよい。実行例は、核の粗い検出に使用される境界包絡線を考慮することと、ガウス混合モデルを使用することによって、この包絡線内の核の色分布及び背景の色分布を推定することと、からなる。その後、同じラベルを有する連結領域を好むエネルギー関数を用いて画素のラベル上にランダムマルコフ連鎖を構築し、その値を干渉するためにグラフカットに基づいて最適化を実行するために使用される。この推定は、バウンディングボックスから抽出されたオリジナルよりも正確であり得るので、これらの2つの工程は収束するまで繰り返される。
【0053】
試料からの細胞における細胞の異常を検出する工程140は、部分的には、少なくとも2つの別個の異常のエキスパート特性の計算によって、行われる(工程142)。
【0054】
以下の説明では、それぞれ形態学的な細胞の異常の有無を示す4つの型の異常のエキスパート特性の計算について説明する。
【0055】
第1に、細胞内の核/細胞質の比率の異常のエキスパート特性の計算について説明していく。
【0056】
自動処理モジュールを用いてNCR(Nucleus Cell Ratio(核細胞比率))を計算することが提案される。当該比率は、以下の式によって定義される:
NCR=核の最大直径の長さ/対応する細胞の最大直径の長さ。
【0057】
図5は、NCR比率の計算の実行例を示す。以下は、処理モジュールによる計算の工程である:
1.細胞に対応する最長軸をトレースする;
2.細胞によって区切られた軸の長さを計算する;
3.核によって区切られたこの同じ軸の長さを計算する。
【0058】
この比率を計算する別の方法も、表面積の計算に基づき提案される。
NCR=(核の表面積/細胞の表面積)1/2
式中:
細胞の表面積=細胞中の画素数;核の表面積=核中の画素数。
【0059】
この比率は、核が細胞内にあるので、1未満の数である。NCRが1に非常に近い場合、細胞は「裸核」であると見なされ、したがって、本方法の間に処理モジュールによって除去され得る。したがって、それを超えると細胞が「裸核」と見なされる閾値を入力することができるように、ユーザに制御させることが提案される。正常なNCR、臨界のNCR、又は正常でないNCRを示す閾値についても、同じことが提案される。これらの閾値は、デフォルトで以下の値に初期化され得る:
a)NCR<0.5 正常なNCRに対応する
b)0.5<NCR<0.7 臨界のNCRに対応する
c)NCR>0.7 正常でないNCRに対応する
d)NCR>0.9 裸核に対応し、カウントされず、「除去されるべき」
より正確には、核/細胞比率は、細胞の最大直径と核の最大直径との間の比率から計算される。細胞があまり球形でない場合、実際の直径は使用されず、代わりに、細胞の最大直径に対応する、細胞の端から端までの距離又は長さが使用される。0.9~1の間に含まれる全ての比率は、裸核に対応するので、解釈不可能である。0.7を超える比率は、大きな異常に対応し、0.5~0.7の間に含まれる比率は、小さな異常に対応する。
【0060】
第2に、別の異常のエキスパート特性、核の不規則性の計算を説明していく。
【0061】
不規則な核とは、その輪郭が、参照と呼ばれる非常に滑らかで規則的な従来の核輪郭形状から逸脱する、任意の核を意味すると理解される。それは、角点又はコーナー(corner)を有する輪郭とみなすこともできる。
【0062】
これを行うために、3つの方法を介して核の不規則性を計算することが提案される。記載される第3の方法は、他の2つの方法を合わせたものである。
【0063】
最初に、参照細胞からの参照核からの差の計算に基づく第1の方法を説明する。
【0064】
計算される差は、表面積の差、又は周の差、又は重心の差、核の各領域における画素の差、各核(参照の核および実際の核)の輪郭の長さの間の差、各核の重心の間の線形差、各核にリンクする凸領域の画素数の間の差、実際の核の偏心と参照の核の偏心との間の差等の任意の他の差であり得る。円の場合は偏心e=0、楕円(ellipse)の場合は0<e<1、放物線の場合はe=1であり、凸領域に関しての違いを思い出してほしい。
【0065】
とりわけ、この方法は、核の実際の輪郭と、核の境界包絡線に含まれるC2ランクの閉じた凸曲線に対応する核の参照輪郭との間の差の計算に基づく。核の参照輪郭を決定するために、核の境界包絡線は、トレースされた長さが核の最大直径に対応する境界矩形として定義される。境界矩形を使用して、処理モジュールは、核の輪郭を形成するその内側のC2曲線を決定していく。
【0066】
例えば、楕円(oval)はC2ランクの閉じた凸曲線である。同様に、円又は楕円(ellipse)は、楕円(oval)型のC2の閉じた凸曲線の特定の場合である。
【0067】
次に、線形フィルタリング又はマスキング(Sobel、Prewitt、又はRoberts等)による勾配検出器、輪郭の抽出のための解析的アプローチ(canny又はDericheフィルタ等)、初期輪郭として以前に見られた境界包絡線をとることによる活性輪郭、レベルセット、多重スケール及び多方向変換によって抽出された輪郭等の、輪郭の抽出のための任意の方法によって、核の輪郭が抽出される。核の輪郭の計算を用いた核の不規則性の異常のエキスパート特性を計算するための工程は、以下に要約される:
1.輪郭抽出法を使用することによって核の実際の輪郭を計算する;
2.核の最大直径を決定する;
3.長さが核の最大直径に等しい、核を囲む矩形を意味する、核の境界包絡線をトレースする;
4.境界包絡線に基づいて、推定される輪郭を形成するC2ランクの閉じた凸曲線をトレースする;
5.核の実際の輪郭と、対応する工程4でトレースされた曲線に対応する参照核の参照輪郭との間の差の値を、試料からのデータと、様々な形状の異常のエキスパート特性からの参照データとを計算および結合することによって計算する;
6.核の参照輪郭と実際の輪郭との間の値の差を使用して、ユーザによって予め定められた若しくは入力された閾値の関数として異常の存在を決定するか、又はこのデータを異常のエキスパート特性における他のデータと組み合わせ、ユーザによって予め定められた若しくは入力された閾値の関数として異常の存在を決定する。
【0068】
これらの特性は、ラージマージンセパレータ型分類器(large margin separator type classifier)(マージンの最大化に基づく教師あり学習技術。マージンとは、サポートベクトルと呼ばれる、分離境界と、最も近い試料との間の距離である。この技術は、学習例に基づいて最大マージン分離境界を見つけることからなる。)、及び/又は学習によって核の不規則性を決定し得るニューラルネットワークによる入力で使用することができることが理解されよう。
【0069】
次に、核の輪郭内の角点の検出に基づいて、核の不規則性を計算する第2の方法を説明していく。
【0070】
ここでの目的は、「コーナー」型の特性点を検出し、対応する形成された角度を計算し、検出されたコーナーの数とそれに対応する角度を考慮して核の不規則性の程度を推定することにより、角点を検出することである。
【0071】
ここで、コーナーは、核膜輪郭の角度として定義される。コーナーは、核膜の2つの線の交点、又は核膜の2つの輪郭の交点に対応し、コーナーの近傍とは十分に異なる方位を有する。
【0072】
コーナーは一般に、ハリス検出器(Harris detector)によって検出されるが、これはスケール不変性の特性を検証せず、単一スケール内のコーナーのみを検出することができ、特に画像が低コントラストである場合に、誤ったコーナーを検出するか、又はいくつかの重要なコーナーを無視することにつながり得る場合を除く。
【0073】
ハリス検出器の別の大きな欠点は、一般的にコーナーの過剰検出を生じることである。これを改善するために、ハリス検出器の後に、Edward Roston及びTom Drummondによって最初に開発されたFASTアルゴリズム(Accelerated Segment Testの機能)を使用することが提案される。実際、この後者のアルゴリズムは、余分なコーナーを除去するのに有用であることが分かる。その結果、それは、ハリス検出器によって検出された誤ったコーナーを除去するために適用され得る。
【0074】
さらに、本発明の範囲で提案される独創的で進歩性があるアイデアは、輪郭変換(多重スケール多方位変換)、核の輪郭に対応するコーナーを検出し、次いで方位を抽出し、核の不規則性を推定するためのハリス検出器及びFASTアルゴリズム(Accelerated Segment Testの機能)を組み合わせることである。目的は、核膜を定義する核の輪郭の不規則性を適切に推定することである。当該独創的なアイデアは、核の輪郭の不規則性を適切に推定することができるように、輪郭を明らかにし、輪郭を完全に強調することに優れた変換を使用することである。そのようにして、推定は、従来通り初期の画像領域で行われるのではなく、核の輪郭の不規則性を適切に検出するために、輪郭が明瞭に示され、十分に強調され得る様々なスケールで構成される領域で行われ得る。したがって、変換は、曲線及び輪郭を完全に表す輪郭型の多重スケール及び多方向の変換である。これは、各スケールに対して様々な方位角に沿った分解を可能にする多重スケール幾何解析ツールである。従来の波型変換とは異なり、輪郭型は画像の異方性の特性(輪郭、端及びテクスチャ情報)を完全に捉える。したがって、核の輪郭の不規則性を明らかにするためのその使用は、明らかに非常に適切である。
【0075】
以下の説明は、この第2の方法の範囲において提案される核の不規則性の計算のための工程を詳述する:
1.輪郭変換を使用することによって第1の画像を分解する。様々なスケール及び様々な方位に対応するいくつかの画像が存在し得る;
2.各スケールの各画素について、相関行列Me(ハリス検出器に関連する行列)を計算する;
3.下記式によって推定される、各スケールに対応する各画素についてのコーナーの強度(コーナー応答関数)の推定:
【数1】
より正確には、コーナーの強度は、コーナーの検出時に高い値を返す関数である「コーナー応答関数」を介して検出される。ある点におけるこの関数の値が大きいほど、又は強いほど、それがコーナーである可能性が高くなる。係数αは、検出器の感度を定義する。αが大きくなるにつれて、感度は低くなり、コーナーの数は少なくなる。一般に、αの値は、0.04~0.06に設定される。この値は、より大きくてもよいが、0.25を超えない。
4.各画素のコーナー強度を計算した後、検出されたコーナーに対応し得る高い値のR
θを有する点の位置を保存する。この第1の検出は、実際のコーナーと誤ったコーナーの両方が含まれている可能性があるため(コーナーの過剰検出の問題)、後で改善され得る;
5.検出された点pを囲む円の周りの密度を判定する目的で、FASTアルゴリズムを適用する。円の中に、全ての点が強度(p)+tより明るい、又は終点(end)強度(p)-tより暗い(tは閾値)、n個の連続する点のセットがあるかどうかを検証する。pがコーナーである場合;
6.互いに隣接する検出されたコーナーを除去するために、ノンマキシマルサプレッション(non-maximal suppression)を使用する:
6.1.全ての検出されたコーナーについてスコア関数Vを算出する。ここで、Vは、コーナーpとそれを取り囲む16画素との間の絶対差の和である;
6.2.最も低いスコアVを有するコーナーを除去するために、隣接するコーナーのスコアVを比較する。
7.それをなす2つのセグメント間の方位の差を計算することによって、検出された各コーナー又は角点の角度を計算する;
例えば、1つ目のセグメントの方位が60°であり、2つ目のセグメントの方位が45°である場合、絶対値の差は60°-45°=15°である。
あるいは、角度の計算は、推定されたセグメントからではなく、第1の画像1の画素の値を直接使用して行われてもよい。
8.検出された角点又はコーナーの数からのデータとそれぞれの角度からのデータとを組み合わせることにより、核の不規則性の程度を計算する;
不規則性の程度の計算の例:
【数2】
9.工程9で得られた結果に基づき、核の不規則性のレベルを、ユーザによって予め決定された、又は入力された閾値の関数として、決定する。
【0076】
次に、核の不規則性を計算する第1の方法及び第2の方法を合わせることからなる第3の方法を説明する。
【0077】
2つの前述の方法を合わせることが提案される。2つの前述の方法からの結果は、例えばファジー論理のようなデータマージ手法によって、組み合わせられてもよい。ここで、以下では、適用可能なルールの例を示す。
【0078】
1.第1の方法が結果として「規則的な核」を与え、第2の方法が結果として「低い程度の不規則性を有する核」を与える場合、最終決定は「規則的な核」となる;
2.第1の方法が結果として「不規則な核」を与え、第2の方法が結果として「中程度の不規則性を有する核」を与える場合、最終決定は「不規則な核」となる;
3.第1の方法が結果として「不規則な核」を与え、第2の方法が結果として「不規則性がゼロの核」を与える場合、最終決定は「規則的な核」となる。
【0079】
第3に、別の異常のエキスパート特性、核のハイパー比色の計算を説明していく。
【0080】
ここでは、核のハイパー比色の程度を計算することが提案される。以下は、工程である:
1.各細胞について、核を構成する画素の光強度の和を核内の画素数で割ったものに対応する、その核の平均光強度を計算する;
2.第1の画像1に存在する全ての細胞の核の平均光強度の平均Irefを計算する。Irefは、細胞の全ての核の平均光強度の和を細胞の数で割ったものである;
3.チェックされる細胞の核の平均光強度とIrefとの間の差として、ハイパー比色の強度を計算する:
ハイパー比色閾値は、分類方法によって(例えば、SVM又はニューラルネットワーク型学習によって)決定される。このようにして、得られた値及びハイパー比色閾値にしたがって、細胞がハイパー比色であるか否かが決定される。
【0081】
核のハイパー比色を計算するために、前述の一連の工程において、平均の計算は、中央値の計算によって任意に置き換えることができる。
【0082】
第4に、別の異常のエキスパート特性の計算、核の斑状比色について説明していく。
【0083】
これを行うために、核の斑状比色を推定するための3つの方法が提案される。第1の方法は、画像からの画素の光強度の値に基づいている。第2の方法は、変換された領域における推定に基づいており、画像領域における推定には基づかない(言い換えれば、画像からの画素の値には適用されず、変換された領域における係数の値に適用される)。第3の方法は、前述の2つの方法を合わせることからなる。
【0084】
まず、画像領域における推定に基づく第1の方法を説明していく:
1.分散Vを計算する;
2.画像のヒストグラムを計算し、ヒストグラム内の多数のピーク(Num peaks)を検出する(2つ以上のピークがある場合、核は均一な色を有していないことを意味する);
3.コヒーレンスマップを形成するために、画像(又はブロック)からの各画素について、勾配に基づいてテンソルを計算する。画素が位置するゾーンに対するコヒーレンスの平均よりも大きなコヒーレンスを画素が有する場合、それは不均一ゾーンの特性である:
コヒーレンス(x,y)>平均((x,y)を囲むゾーン)+3*標準偏差((x,y)を囲むゾーン)である場合、(x,y)は不均一ゾーンに属する;
コヒーレンスによって検出された不均一点(又はブロック)の和(Num coh)を計算する;
4.これらの特性[V、Num peaks及びNum coh]を合わせ、それらを用いて核の斑状比色を検出する。
【0085】
これらの特性は、SVM又はニューラルネットワーク型分類器への入力として使用され得ることが理解される。
【0086】
次に、変換された領域における推定に基づく第2の方法を説明していく:
罹患したゾーン(核を意味する)中の最低3つの斑点の存在によって斑状比色を定義する。ここで、目的は、ゾーン内の最低3つの閉じた輪郭を検出することである。そのために、輪郭変換等の適切な変換によって輪郭を検出することが提案される。この変換は、均一ゾーンでは低いエネルギー係数(0近傍)を有し、一般的に画像輪郭に対応する異方性ゾーン(不均一)では非常に高いエネルギー係数を有する、という違いを有する。斑状比色の推定は、以下の工程によって行われる:
1.輪郭変換又は波動原子変換(wave atom transformation)等の、適切な多重スケール、多方向の変換により画像を分解する;
2.画像の輪郭に対応する係数のみを維持するために閾値処理を適用することにより、高エネルギー成分ゾーンを検出する;
3.輪郭において選択された(閾値処理された)係数に非線形コントラスト強調関数を適用する;
4.逆変換を使用することによって、選択された係数から輪郭画像を再構成する;
5.輪郭画像内の閉輪郭を検出し、それらをカウントする;
6.3つより多い閉輪郭がある場合、核は斑状比色を有すると結論づけられる。
【0087】
次に、斑状比色を計算する第1の方法及び第2の方法を合わせることからなる第3の方法を説明する。
【0088】
核の不規則性の計算と同様に、各細胞の核に対する斑状比色の異常のエキスパート特性のための精密な結果を得るために、前述の2つの方法それぞれによって得られた結果を組み合わせることが、ここで提案される。
【0089】
処理モジュールを用いて、一連の計算された異常のエキスパート特性(核/細胞比率、核の不規則性、ハイパー比色、及び斑状比色)は、細胞学から公知の参照データからなる参照データと組み合わされることが理解されるであろう。特に、これらの計算されたデータは、細胞が正常であるか、又は少なくとも1つの異常を有するかどうかを判定する(工程144)ために、そのままで、又は分類器によって、又は深層学習によって計算され生成された他の特性と合わせて、使用され得る。試料が少なくとも1つの異常を有する少なくとも1つの細胞を含まない場合、本検出方法はここで停止し、試料が少なくとも1つの異常を有する少なくとも1つの細胞を有する場合、本検出方法は継続する。
【0090】
細胞の異常を検出する工程140の最後に、処理モジュールは、細胞学的試料中の少なくとも1つの異常を有する細胞の総数を決定する(工程146)。
【0091】
次に、ここでは、全体としての試料の異常レベルにしたがって、試料を特性付ける第1の工程150を含んでもよい。これを行うために、検出された少なくとも1つの異常を有する細胞の総数は、試料の異常レベルの閾値と比較される。この試料の異常レベルの閾値は、本方法のためにユーザによって予め定義される。閾値は、各々が少なくとも1つの異常を有する少なくとも3つの細胞に対応する。この異常レベルの閾値は、分類結果の所望の精密度に応じて、ユーザによって予め任意の方法で定義されてもよい。
【0092】
本発明によれば、少なくとも1つの異常を有する細胞の総数が異常レベルの閾値未満である場合、細胞学的試料は、異常レベルがゼロである試料を表すクラス152に分類され、少なくとも1つの異常を有する細胞の総数が異常レベルの閾値以上である場合、細胞学的試料は、無視できない異常レベルを有するクラスである試料を表すクラス154に分類され、これは低い異常レベル及び高い異常レベルを意味する(154)。
【0093】
端的には、別の態様によれば、本発明は、この段階でこのようにして、細胞学的試料を、細胞の異常レベルがゼロであるクラス152と、無視できない細胞の異常レベルを有するクラス154と、の2つのクラスにしたがって分類することに役立つ。この結果は、癌性細胞の特性である細胞の異常を指摘することに役立つ。このように、迅速かつ信頼性の高い標準化された結果を提供することで、細胞技師及び細胞病理学者が癌を診断することに役立つ。
【0094】
図6に示されるように、本検出方法は、試料の細胞の異常レベルにしたがって、特に試料中の細胞の異常レベルが低いことを具体的に示す、試料を特性付ける第2の工程160を含んでもよい。この異常レベルは、まだ顕著な形態学的変形を受けていない細胞に対応する。好ましくは、この特定の実施形態によれば、本発明は、「低」と呼ばれる細胞の異常レベルのクラス、又は「高」と呼ばれる細胞の異常クラス、又は「ゼロ」と呼ばれる細胞の異常レベルのクラスのいずれかに、試料をより正確に分類することに役立つ。
【0095】
正常でない細胞の検出の後の、試料からのこれらの細胞の形態学的異常レベル又は放射分析的異常レベルによる試料の分類は、癌の診断に関連する医師のための確かな助けとなる。実際、「低」と呼ばれる細胞の異常レベルは、「低悪性度」呼ばれる早期段階の癌と関連し、「高」と呼ばれる異常レベルは、「高悪性度」と呼ばれる進行した段階の癌と関連している可能性がある。
【0096】
この目的のために、低と呼ばれるレベルで異常を検出するために、本発明は、蛍光画像をデジタル化した第2の画像2を使用する。この第2の画像2に基づいて、尿路上皮等の、少なくとも1つの選択された細胞型からの細胞は、第1のデジタル化された画像1において予め定義された試料における細胞の位置のために、類型選択する工程162において選択される。次に、第1の画像1及び第2の画像は、場合によってはコンピュータによって実行される従来の位置合わせ法を用いて、位置合わせされる。
【0097】
この特性付ける第2の工程160を実行するためには、第1の画像1に基づき類型選択する予備工程130は、選択された細胞型の細胞を位置付けることができるようにするために、本発明に係る方法において必然的により以前に行われていなければならないことが理解されるであろう。
【0098】
細胞型の類型選択をするサブ工程162の後に、予め選択された各細胞の周りの蛍光ハローを検出するサブ工程164が続く。用語「ハロー」は、細胞を取り囲み、鮮明なコントラストを有する蛍光オーラ(fluorescent aura)の存在によって見られる現象として定義される。一実施態様では、ハロー強度、蛍光レベル、又は蛍光の広がりのレベルが測定される。このようにして、蛍光ハローが検出される場合には、好ましくは最小の蛍光のレベルが検出される場合には、また好ましくは最小の蛍光の広がりのレベルが検出される場合には、試料は、低い異常レベルを有する試料を表すクラス168に分類される。逆に、蛍光を有さない細胞は、異常レベルがゼロのクラス及び高い異常レベルのクラス166に分類される。
【0099】
本発明によれば、処理モジュールを用いて試料を特性付ける第2の工程160を行うために、3つの方法が提案される。
【0100】
試料を特性付ける第2の工程160のサブ工程は、第1の方法に関連して、以下に詳細に与えられる:
-第1の画像1を使用して、選択された細胞型の各細胞の中心を、細胞の重心の計算を使用して検出する;
-各直線セグメントに沿って、細胞の中心から始まり、様々な角度に沿って、各細胞の境界までの強度プロファイルをトレースする。例えば、8つの角度:0°、45°、90°、135°、180°、225°、270°及び315°に沿って;
-各プロファイルのピークPmax(最大点)、及び最大値より前の窪み(trough)Pmin(最小点)を検出する;
-ピークPmaxの右側の窪みPminから始まり、ピークPmaxの左側の強度プロファイルの曲線との交点Pintまで、強度プロファイルの曲線上の水平線をトレースする;
-ピークの横座標であるXmaxと、点Pintの横座標であるXintと、の間の(横座標に沿った)水平線の距離dxを計算する;
-ピークの縦座標であるYmaxと、Pint及びPmaxの縦座標Yint=Yminと、の間の(縦座標に沿った)垂直距離dyを計算する;
-各細胞について、8つの角度に沿ったdx及びdyの平均である検出されたDx及びDyを計算する。Dyはハローの蛍光ハローの強度の第1の推定値を表し、Dxはハローの広がりの第1の推定値を表す。
【0101】
試料を特性付ける第2の工程160のサブ工程は、第2の方法に関連して、以下に詳細に与えられる:
ここでは、細胞の画像断片のラドンプロファイルから蛍光ハローの広がりを測定し、計算することが提案される。
【0102】
ラドン変換は、様々な方向の投影の収集として画像を表す。線に沿った各投影は、ラドンプロファイルを表す。
【0103】
以下は、第2の方法に従うべき工程である:
-第1の画像1において、選択された細胞型の各細胞の位置を特定する;
-選択された細胞型の各細胞に対応する画像断片を抽出するために、第2の画像2において、各核の周りの長さ及び幅を10~30%超えることによって、対応させる;
-様々な角度について、好ましくは第1の方法で使用される角度と同じ角度について、画像断片に対応するラドンプロファイルを計算する;
-各プロファイルについて、核の周りの長さ及び幅を10~30%超えて延びた各画像の各ラドンプロファイルの2つのピークPmin及びPmaxを検出し、次いで、ハロー強度及びその広がりの第2の推定値を計算するための第1の方法の工程に続く。
【0104】
あるいは、第3の方法に関連して、処理モジュールによって行われる試料を特性付ける第2の工程160は、存在する蛍光「ハロー」の輪郭の不規則性の計算に基づく方法にある。換言すれば、細胞が高いレベルのハローの輪郭の不規則性を有する場合、それは蛍光ハローを有することを意味する。これを行うために、この第3の方法は、先に示した核の不規則性の計算の3つの方法のうちの1つにある。
【0105】
一連の、前述した第2の試料の特性付け160の3つの実行方法について、限定されないが、試料のクラスを決定するために得られた結果は、ユーザによって予め決定された、又は予め入力された蛍光強度及び/又は広がりのレベルの閾値と比較される。
【0106】
記載したこれら3つの方法は、精密な結果を得るために、学習方法によって組み合わされ、処理され得ることが理解されるであろう。
【0107】
したがって、この試料を特性付ける第2の工程160は、最終的に試料のスライドの分類、したがって試料の分類を、3つのあり得るクラスへと分類することを可能にし、これは、健康な被験者からの試料に関連し得る異常レベルがゼロであるクラス、又は早期段階の癌性細胞、若しくは「低悪性度」の癌と呼ばれる癌性細胞を有する試料に関連し得る細胞の異常レベルが低であるクラス、又は進行した段階の癌性細胞、若しくは「高悪性度」の癌と呼ばれる癌性細胞を有する試料に関連し得る細胞の異常レベルが高であるクラス、のいずれかを意味する。
【0108】
本発明の第2の態様は、発見された細胞の異常レベルにしたがって細胞学的試料のスライド画像の直接的分類を行うために深層学習法を使用して、細胞学的試料において細胞の異常を検出する第2の方法の使用を提案する。一般に、深層学習法は、画像からの直接的分類等のタスクを実行する方法をコンピュータモデルに教示する。深層学習及び画像処理の分野で通常行われるものとは異なり、この第2の方法の独自性は、画像の全体を構成する画像断片の各々を予め分類すること無く、画像断片のセットを分類することにある。より正確には、この方法は、試料からの各画像断片又は各細胞の分類を経ることなく、試料の画像に含まれる細胞のセットを意味する、スライドからの細胞学的試料の画像の分類を直接可能にする。本発明によるこの分類方法は、異常又は病状の検出がスライド又はスライドの画像の全体を見ることによってのみ行うことができ、各細胞を他の細胞からは独立して見ることによっては行えない場合に、特に有用であることに留意されたい。これを行うために、試料中の少なくとも1つの異常を有する細胞を検出するこの第2の検出方法は、深層学習コンピュータモデルを使用し、観察のセットを入力として行い、このセットの分類を出力上に生成する。これらの観察は、細胞学的試料の直接的な生の画像、及び/又は画像断片(又は記述データ)を特性付ける値のリスト、例えば第1の方法を使用して計算された値であり得る(これらの記述データは、コンピュータモジュールに学習させることにおいて有用性を有することが理解されるであろう)。これを行うために、この第2の方法は、ディープニューラルネットワーク(deep neural network)(NN)アーキテクチャを使用する深層学習法を使用する。このディープニューラルネットワーク(NN)が生の画像断片に使用されるとき、それはディープコンボリューショナルニューラルネットワーク(deep convolutional neural network)(CNN)を含む。CNNは、学習された特性を記述子からの入力データと畳み込み、画像等の2Dデータの処理に完全に適した2D畳み込みレイヤを使用する。コンボリューショナルニューラルネットワークは、学習を介して画像のエキスパート表示を直接抽出することができる。同様に、深層学習法は、かなりの計算能力を必要とする。計算は高度に並列化可能であるので、計算は一般にグラフィックプロセッサ又はGPU上で行われる。GPUは高性能であり、この学習法を実行することに有効な並列アーキテクチャを備える。GPUは、プロセスユニット又はCPUに統合されている。同様に、メモリからCPU及びGPUへのデータの転送は、依然として時間の点で最もコストがかかる操作の1つであるため、各エントリの処理にGPUを独立して使用することはできない。一般に、この問題を改善するために、深層学習法は、一般にパケット又はバッチによってエントリを処理するために、4次元テンソル(4次元テーブル)を使用する。
【0109】
4次元テンソルのこの独自の使用により、細胞の異常を検出するこの第2の方法は、画像断片のセットを意味する画像を、それらの各々を予め検出することなく、分類する。換言すれば、この第2の検出方法は、少なくとも1つの細胞の異常を有する細胞を検出し、画像断片ではなく、細胞学的試料のスライドの画像(スライド)を表す画像断片(別の方法で計算された値によって特性付けられた生の画像断片及び/又は画像断片)のセットを、直接分類することを提案する。この第2の方法を実行するために、深層学習コンピュータモデルの訓練は、ラベル付けされたスライドの大きなセットを使用して行われる。この訓練がなければ、第2の分類方法は機能しない。この場合、入力は(生の、及び/又は第1の方法によって特性付けられた)画像断片のセットであり、出力は、分析された試料からの画像断片のセットの各画像にクラスを最終的に割り当てるためのクラス間の確率分布である。本発明によれば、クラスは、細胞の異常レベルが低であるクラス、細胞の異常レベルが高であるクラス、及び/又は細胞の異常レベルがゼロであるクラスの中から選択される。
【0110】
さらに、この方法は、細胞学的試料の画像からの各画像断片の分析の中間段階を経ることなく、入力を出力に直接結びつけることを意味する「エンドツーエンド」訓練を行う。より正確には、細胞学的試料からの細胞の画像断片のセットから開始して、ネットワークは達成されるべきタスク(例えば、分類)を割り当て、それらをどのように自動化するかを学習する。この方法の別の主要な利点には、学習法からのアルゴリズムがデータと共に発展し、データ量が増加することにつれて改善し続けるという事実がある。好ましくは、少なくとも部分的には、これらのデータは、前述の第1の態様による検出方法を通して得られたデータから得られる。さらに好ましくは、検出方法のこの第2の態様は、有利には1つの透過画像及び1つの蛍光画像(1つの第1の画像、及び1つの第2の画像を意味する)からのデータを結合することができる。
【0111】
ここで提案した検出方法の第2の態様は、セットを処理できるようにするためのバッチ機能性は別として、深層学習法の実行である。
【0112】
従来、4次元テンソルは、画像の空間成分についての2次元(画像の高さに関する1次元、及び幅に関する1次元)、チャネルに関する1次元(赤、緑、青が使用される場合にはRGB)、及びバッチ「B」に関する1次元(B:バッチ又はパケットを構築するための画像の数に対応する)、から構成される。
【0113】
一般に、4次元テンソルを使用することの唯一の有用性は、計算を加速させることである。我々の方法の独自性は、母集団、ここでは画像断片のセットを分類するという別の目的でこのテンソルを使用することにある。画像のバッチBを取得し、B個の決定を生成する:各画像について1つの決定(B>1を取得するという事実は、時間を節約することのみに役立つ)という他の学習法が従来行うものとは異なり、画像断片のセットに基づいて1つの決定のみを与えるために、B個の画像断片のバッチ(B:画像の全体を構成する画像断片の数に対応する)を取得する。ここで提案される独自性は、計算時間の都合で実際にはこの機能を使用して最初に存在するロットを作り、別の目標及び別の目的のためにそれを使用することによってその機能を取っておくことである。
【0114】
数B(Bは、メモリが限定されているGPUへとバッチが転送されることができるように十分に小さくなければならない)に対応する画像断片のセットを考える。従来、学習法は、計算時間を加速させるために選択される32~64個の画像断片のバッチを使用する。本発明の文脈において、この数は、対象の画像断片の数、例えばスライド画像当たりの尿路上皮細胞の画像断片の数として使用されるので、所定の数Bは選択されず、この数は(スライド上の細胞学的試料中に存在する尿路上皮細胞の数にしたがって)スライド画像ごとに異なる。したがって、これらのB個の画像断片:B×RGB×H×W(B:画像断片の数;RGB:3つのカラーチャネル赤緑青;H及びW:それぞれ画像の高さ及び幅)を用いて4次元テンソルを形成することが可能である。また、透過型電子顕微鏡のための任意の数の従来のRGBチャネル、及び、例えばRGB(赤緑蛍光)等の、透過型電子顕微鏡及び蛍光顕微鏡画像のペアのためのF(F:蛍光)に関連する任意の数のRGBチャネルを考慮することも可能である。次に、このバッチを完全に接続された層(前の層の空間的側面を考慮せず、そのため画像断片当たり1次元ベクトルしか生成しないニューロンの層を意味する)までニューラルネットワークに転送する場合、出力はしたがって、サイズB×Fを有することになり、ここで、Fはこの完全に接続された層のサイズである(したがって、4次元テンソルは2次元テンソルに変換された)。
【0115】
ここで、この2次元テンソルB×Fを1×F×Bテンソルに転置し、Bに対して対称操作、例えば1次元プール(最大又は平均)を適用することが可能である。完全に接続された層を使用する必要性は、実際には転置のためにこれらの3次元及び4次元を解除することであるので、この転置は、1次元ではなく3次元及び4次元で行われるために対称操作が元々プログラムされる限り、有用である。したがって、この結果は、1×Fテンソルを与え、指標Fは画像断片のセットに関する情報を含むはずである。この1は、このセットがB個の画像のバッチに関連する1つの単一分類ディジットをもたらすに違いないという事実から生じることが理解されるであろう。このようにして、細胞学的試料の画像(画像のセットを意味する)の分類問題のためのエンドツーエンドネットワークを形成するために、従来の深層学習法を使用することが可能である。
【0116】
図7は、画像断片のセットに対応する細胞学試料の画像の分類に適用される深層学習のための実行方法を要約する。
【0117】
最終的なクラスは、画像断片のセットに割り当てられる。この実行方法は、ここでは細胞学的試料の画像分類に適用されるが、限定することなく、他の分野に任意に適用することができることが理解されるであろう。
【0118】
第2の態様によれば、本発明は、コンピュータビジョンを用いて、癌診断に寄与するために、試料中に存在する細胞の異常のエキスパート特性を抽出し計算する、細胞学的試料の分類を提案する。ここで、本発明はまた、第2の態様によれば、コンピュータビジョンを用いて、癌診断に寄与することができる深層学習法を使用することによって、試料中で遭遇する細胞の異常レベルにしたがって細胞学的試料を分類する、第2の方法を提案する。本発明はまた、このような方法を実行するのに適した、少なくとも1つのデジタル化された画像に基づく細胞学的試料の分類のための装置に関する。各ユーザは、分類方法を実行するために考慮する閾値を定義してもよい。さらに、各ユーザのニーズにしたがって、すなわち、適用分野及び分類結果の所望の精密度にしたがって、各ユーザに適応可能な一般的なアプローチが提案される。
【図面の簡単な説明】
【0119】
【
図1】
図1は、本発明の好ましいモードにしたがって実施される方法の様々な工程を示す図である。
【
図2】
図2は、処理する工程の前後の、試料のデジタル化された電子顕微鏡像の第1の例を示す。ここで、第1の画像は特に、孤立した細胞、細胞クラスタ、細胞群、及び除去されるべき要素を含む。
【
図3】
図3は、第1の画像を処理する工程の前後の、第2の試料のデジタル化された電子顕微鏡画像の第2の例を示す。ここで、第1の画像は特に、孤立した細胞、細胞クラスタ、細胞群、及び除去されるべき要素を含む。
【
図4】
図4は、孤立した細胞の2つの電子顕微鏡画像と、コンピュータによって実行される処理モジュールを用いて抽出された細胞の核の2つの電子顕微鏡画像とを表す。
【
図5】
図5は、孤立した細胞、その抽出された核、及びコンピュータによって実行される処理モジュールを用いて核細胞のサイズ比を測定するためのトレースの一例を表す。
【
図6】
図6は、第2のデジタル化された画像に基づき、試料を特性付ける第2の工程を含む、別の実施形態にしたがって実施される方法の様々な段階を示す図である。
【
図7】
図7は、本発明の第2の態様、より正確には、画像断片のセットに対応する少なくとも1つの細胞学的試料の画像の分類に適用される、深層学習のための実行方法を示す図である。