IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヴィタディーエックス インターナショナルの特許一覧

特表2023-513022生体試料中のオブジェクトの体系的特性評価
<>
  • 特表-生体試料中のオブジェクトの体系的特性評価 図1
  • 特表-生体試料中のオブジェクトの体系的特性評価 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-03-30
(54)【発明の名称】生体試料中のオブジェクトの体系的特性評価
(51)【国際特許分類】
   G06T 7/11 20170101AFI20230323BHJP
   G06T 7/00 20170101ALI20230323BHJP
   G06V 10/82 20220101ALI20230323BHJP
【FI】
G06T7/11
G06T7/00 630
G06T7/00 350C
G06V10/82
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022546073
(86)(22)【出願日】2021-01-29
(85)【翻訳文提出日】2022-09-13
(86)【国際出願番号】 EP2021052105
(87)【国際公開番号】W WO2021152089
(87)【国際公開日】2021-08-05
(31)【優先権主張番号】20305082.8
(32)【優先日】2020-01-30
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】522300776
【氏名又は名称】ヴィタディーエックス インターナショナル
(74)【代理人】
【識別番号】100114775
【弁理士】
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【弁理士】
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【弁理士】
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【弁理士】
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【弁理士】
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】トルード,ティボー
(72)【発明者】
【氏名】クジニー-デヴィ,フローラン
(72)【発明者】
【氏名】フェッツァーニ,リアド
(72)【発明者】
【氏名】スカルベール,マリン
(72)【発明者】
【氏名】リ,シューシャン
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA06
5L096BA13
5L096DA02
5L096FA02
5L096FA16
5L096FA52
5L096FA54
5L096FA59
5L096GA10
5L096HA11
5L096KA04
(57)【要約】
本発明は、スライド上に処理された尿試料から回収可能なオブジェクトを分類及び計数するための方法であって、以下の工程:スライド全体の少なくとも1つのデジタル化画像を受信する工程;スライド全体の画像のセグメンテーションによって結合成分を検出する工程;検出された結合成分を、分類器を用いて可算結合成分及び不可算結合成分に分類する工程;可算結合成分の場合には、オブジェクト検出モデルを用いて、各クラスのオブジェクト数を得る工程;不可算成分の場合には、セマンティックセグメンテーションモデルを用いて、各クラスのオブジェクト数を得る工程;セマンティックセグメンテーションモデル及びオブジェクト検出モデルから得られた各クラスのオブジェクト数を合計し、各クラスのオブジェクト数を出力する工程を含む方法に関する。
【選択図】図1
【特許請求の範囲】
【請求項1】
スライド上に処理された尿試料から回収可能なオブジェクトを分類及び計数するための方法(100)であって、
-前記スライド全体の少なくとも1つのデジタル化画像を受信する工程(110);
-前記スライド全体の画像のセグメンテーションによって結合成分を検出する工程(120);
-検出された結合成分を、分類器を用いて可算結合成分及び不可算結合成分に分類する工程(130);
-可算結合成分の場合:
・オブジェクトを検出し、検出された各オブジェクトの境界ボックス及び関連するクラスを含む出力を得るために、オブジェクト検出モデルに各可算結合成分を入力する工程(140);
・各クラスに関連する境界ボックスを計数し、各クラスのオブジェクト数を得る工程(150);
-不可算成分の場合:
・各不可算結合成分をセマンティックセグメンテーションモデルに入力し、全ての画素が定義済みの利用可能なクラスの中の1つのクラスに分類されるセグメンテーションマスクを出力として得る工程(160);
・各クラスについて、前記クラスに関連するセグメンテーションマスクの画素数として得られた前記クラスの総画素面積と、前記クラスのオブジェクトの平均面積との比率としてオブジェクト数を計数する工程(170);
-前記セマンティックセグメンテーションモデル及び前記オブジェクト検出モデルから得られた各クラスのオブジェクト数を合計する工程;
-各クラスのオブジェクト数を出力する工程
を含み、前記セマンティックセグメンテーションモデル及び前記オブジェクト検出モデルの前記クラスが同じである方法。
【請求項2】
前記セマンティックセグメンテーションモデルがU-Netである、請求項1に記載の方法。
【請求項3】
前記オブジェクト検出モデルが、Faster R-CNN、CenterNet、SOLO又はYOLOである、請求項1又は2のいずれか一項に記載の方法。
【請求項4】
前記受信されたデジタル化画像が明視野光学システムから生じる、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記セマンティックセグメンテーションモデル及び前記オブジェクト検出モデルが、ラベルされたデジタル化画像のデータセットを用いて訓練される、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記セマンティックセグメンテーションモデル及び前記オブジェクト検出モデルが確率論的勾配降下訓練方法を用いて訓練される、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記セマンティックセグメンテーションモデル及び前記オブジェクト検出モデルの各クラスが、以下のリスト:
-白血球:好塩基球、好中球、マクロファージ、単球及び好酸球;
-赤血球;
-細菌;
-尿結晶;
-円柱類;
-健康で非定型の尿路上皮細胞;
-扁平上皮細胞;
-反応性尿路上皮細胞、及び/又は
-酵母
の中のオブジェクトの少なくとも1つに関連する、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記スライド全体の少なくとも1つの部分のデジタル化画像に沿った各クラスのオブジェクトの総数を表示することをさらに含む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記デジタル化画像にクラス内のオブジェクトの有無に関する情報を提供する少なくとも1つの文字列を表示することをさらに含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記試料がPap染色剤により着色されている、請求項1~9のいずれか一項に記載の方法。
【請求項11】
スライド上に処理された尿試料から回収可能なオブジェクトを分類及び計数するためのシステムであって、
-複数のオブジェクトを含むスライド全体の少なくとも1つのデジタル化画像を受信するように適合させた少なくとも1つの入力;
-以下のように構成された少なくとも1つのプロセッサ:
・前記スライド全体の画像のセグメンテーションによって結合成分を検出する;
・前記検出された結合成分を、分類器を用いて可算結合成分と不可算結合成分に分類する;
・可算結合成分の場合:
i.オブジェクトを検出し、各オブジェクトについて1つの境界ボックス及び関連するクラスを出力するように構成されたオブジェクト検出モデルに各可算結合成分を入力する;
ii.各クラスに関連する境界ボックスを計数し、各クラスのオブジェクト数を得る;
・不可算成分の場合:
i.各不可算結合成分をセマンティックセグメンテーションモデルに入力し、全ての画素が定義済みの利用可能なクラスのうちの1つのクラスに分類されるセグメンテーションマスクを出力として得る;
ii.各クラスについて、前記クラスに関連するセグメンテーションマスクの画素数として得られた前記クラスの総画素面積と、前記クラスのオブジェクトの平均面積との比率としてオブジェクト数を計数する;
・前記セマンティックセグメンテーションモデル及び前記オブジェクト検出モデルから得られた各クラスのオブジェクト数を合計する;
その際、前記セマンティックセグメンテーションモデルと前記オブジェクト検出モデルの前記クラスは同じである、
-各クラスにオブジェクト数を提供するように適合させた少なくとも1つの出力、
を含むシステム。
【請求項12】
前記オブジェクト検出モデルが、Faster R-CNN 、CenterNet、SOLO又はYOLOである、請求項11に記載のシステム。
【請求項13】
前記セマンティックセグメンテーションモデル及び前記オブジェクト検出モデルが、ラベルされたデジタル化画像のデータセットを用いて訓練される、請求項11又は12のいずれかに記載のシステム。
【請求項14】
尿試料から回収可能なオブジェクトを分類及び計数するためのコンピュータプログラム製品であって、前記プログラムがコンピュータによって実行されるときに、請求項1~10のいずれか一項に記載の方法を前記コンピュータに実行させる命令を含むコンピュータプログラム製品。
【請求項15】
前記プログラムがコンピュータによって実行されるときに、請求項1~10のいずれか一項に記載の方法を前記コンピュータに実行させる命令を含むコンピュータ可読可能記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、特に泌尿器病態の検出のための生物学的分析の分野に関する。より特には、本発明は、対象の体液試料、特に尿試料中に見出すことができる少なくとも1つ、好ましくは複数のオブジェクトの特性評価に関する正確な情報を提供する方法に関する。
【0002】
この発明は、好ましくは尿試料である体液試料中の関連オブジェクトを分析するための方法及びシステムに関する。本発明の方法及びシステムは、例えば、細胞又は細菌を含む少なくとも1つの試料中のオブジェクトを検出、識別及び/又は計数するのに有用であり得る。
【0003】
この発明はまた、生体試料、特に尿試料中のオブジェクトの体系的な調査及び特性評価から生じる信頼できる情報の提示に関する。
【背景技術】
【0004】
発明の背景
試料分析は、対象の健康状態の概要を提供するための最も一般的な試験の1つである。試料中のある特徴的なオブジェクトの出現は、臨床的に有意であり、かつ/又は対象における病理学的状態を示すものであり得る。
【0005】
尿試料は、細胞の集塊、凝集塊又はシート;血液細胞、例えば、赤血球(erythrocyte)又は赤血球(red blood cell(RBC));尿路上皮細胞、特に、非定型尿路上皮細胞;結晶;リンパ球、白血球(leukocyte)又は白血球(white blood cell(WBC));好中球、単球、好酸球;又は微生物、例えば、細菌などの様々なオブジェクトを含み得る。
【0006】
尿沈渣分析を行う一般的な方法は、明視野光学技術を使用して、試料に存在する尿細胞を顕微鏡スライド上に堆積させ、次いで、スライドをデジタル化することである。しかし、スライド上に細胞を堆積させる際に注意を払ったにもかかわらず、細胞、集塊及び他の細胞スタックの不規則な層がスライド上に現れることがある。
【0007】
この問題は従来技術で既に提起された。
【0008】
従来技術の試料中の細胞分析の一例として、FR2996036は、生体組織中の細胞を同定する方法であって、各細胞が細胞膜で区切られた細胞質を含み、以下の工程:a)異なる強度の値の複数の画素を含む、同定される細胞を含む生体組織の切片の生デジタル画像を取得する工程;b)少なくとも1つの閾値画像を自動的に生成する工程;c)閾値画像において、同じ定義済みの強度値を有する複数の連続した画素から形成された表面を自動的に検索し、このように見出された細胞表面が細胞候補を構成する工程、を含む方法を報告している。本発明によれば、定義済みの強度値は、細胞質に対応する第1及び第2の強度値のことである。
【0009】
しかしながら、この方法は、細胞の重なり合い、スタック、堆積及び/又は集塊を有する試料では正確ではない。
【0010】
WO2015102948は、周囲光及びデフォーカスノイズの影響を除去した後、周辺領域の平均画素値と中央領域の平均画素値との差を計算することにより、尿形成要素の分類精度を向上させることを目的としている。
【0011】
しかし、この技術は細胞集塊の処理には役立たない。
【0012】
WO2015168365は、尿沈渣画像の処理対象のブロックを処理する方法であって、以下の工程:
-処理対象のブロック内の画素の色を、コードブック内のkc色の1つに近似させる工程(コードブックは、尿試料ブロックのセットで生成されたkc色のセットである);
-kc色の各色に当たる色近似結果の画素数の分布ヒストグラムを得る工程;
-出現頻度補正係数を用いて、分布ヒストグラムの各色に当たる色近似結果の画素数を補正する工程;
-分布ヒストグラムの各色に当たる色近似結果の補正された画素数を標準化する工程;及び標準化分布ヒストグラムをブロック処理の特徴セットの特徴として得て、処理対象のブロックを処理する工程
を含む方法を説明している。
【0013】
この手法は、ブロックが十分に定義されている場合に特に有用であるが、画像がぼやけている場合、又は問題のブロックに完全に焦点が合っていない場合には、正確な結果が得られない場合がある。
【0014】
さらに、この方法は、回転、スケーリング、平行移動、トリミング、ミラーリング、弾性変形のうちの少なくとも1つを含むデータ強化及び前処理の工程を必要とする。
【0015】
結果的に、大規模な集団、特に年齢、喫煙習慣又は産業物質の曝露に関連する泌尿器病態を発症するリスクのある集団をスクリーニングするのに適する尿試料スクリーニングの方法を提案するために、明視野イメージングによって取得された重い画像に対処できる費用対効果が高く、単純で信頼性が高く、再現可能な方法及びシステムを見つける必要がある。
【0016】
これは、本発明が尿試料のオブジェクトを特定して計数し、かつ瞬時に前記数を表示するために、デジタル化画像を計算するための費用対効果が高く、再現性があり、正確な手段を用いて、上記の満たされていないニーズを満たす方法に関する理由である。本発明はまた、多数の試料を次々に迅速に操作するプロセスも含む。
【発明の概要】
【0017】
この発明は、スライド上に処理された尿試料から回収可能なオブジェクトを分類及び計数するための方法であって、以下の工程:
-スライド全体の少なくとも1つのデジタル化画像を受信する工程;
-スライド全体の画像のセグメンテーションによって結合成分を検出する工程;
-検出された結合成分を、分類器を用いて可算結合成分及び不可算結合成分に分類する工程;
-可算結合成分の場合:
・オブジェクトを検出し、検出された各オブジェクトの境界ボックス及び関連するクラスを含む出力を得るために、オブジェクト検出モデルに各可算結合成分を入力する工程;
・各クラスに関連する境界ボックスを計数し、各クラスのオブジェクト数を得る工程;
-不可算成分の場合:
・各不可算結合成分をセマンティックセグメンテーションモデルに入力し、全ての画素が定義済みの利用可能なクラスの中の1つのクラスに分類されるセグメンテーションマスクを出力として得る工程;
・各オブジェクトクラスについて、前記クラスに関連するセグメンテーションマスクの画素数として得られた、該クラスの総画素面積と、前記クラスのオブジェクトの平均面積との比率としてオブジェクト数を計数する工程;
その際、該セマンティックセグメンテーションモデル及び該オブジェクト検出モデルの前記クラスが同じであり、
-セマンティックセグメンテーションモデル及びオブジェクト検出モデルから得られた各クラスのオブジェクト数を合計する工程;
-各クラスのオブジェクト数を出力する工程
を含む方法に関する。
【0018】
都合の良いことに、本発明の方法は、焦点の合っていない画像又はスライド上のオブジェクトの厚さのために、オブジェクトの境界が検出しにくい場合オブジェクト、実際、単一のオブジェクト又は重なり合ったオブジェクトが顕著な厚さを有する場合に、オブジェクトのいくつかの部分は、焦点が合わずに、画像がぼやける/ノイジーになり得る場合であっても、オブジェクトの正確な計数を可能にする。この方法は、不正確なセグメンテーションによる不正確さを大幅に低減する。
【0019】
一実施形態では、セマンティックセグメンテーションモデルは、U-Netである。
【0020】
一実施形態によれば、オブジェクト検出ニューラルネットワークは、Faster-RCNN、CenterNet、SOLO又はYOLOである。
【0021】
一実施形態によれば、受信されたデジタル化画像は、明視野光学システムから生じる。
【0022】
一実施形態によれば、該モデルは、ラベルされたデジタル化画像のデータセットを用いて訓練される。
【0023】
一実施形態では、セマンティックセグメンテーションモデル及びオブジェクト検出モデルは、臨床医によってラベルされたデジタル化画像のデータセットを用いて訓練される。
【0024】
一実施形態では、セマンティックセグメンテーションモデル及びオブジェクト検出モデルは、確率論的勾配降下訓練方法を用いて訓練される。確率論的勾配降下最適化法は、都合の良いことに、あらゆる最適化工程で計算時間を節約することを可能にする。
【0025】
これは、実際の勾配(訓練データセット全体から計算される)を推定値(データのランダムに選択されたサブセットから計算される)に置き換えることからなる。これは、本発明におけるもののような大規模な機械学習問題の場合に非常に有効である。
【0026】
一実施形態では、各クラスは、以下のリスト:
-白血球:好塩基球、好中球、マクロファージ、単球及び好酸球;
-赤血球;
-細菌;
-尿結晶;
-円柱類;
-健康で非定型の尿路上皮細胞;
-扁平上皮細胞;
-反応性尿路上皮細胞
-酵母
の中のオブジェクトの少なくとも1つに関連する。
【0027】
一実施形態によれば、本方法はさらに、スライド全体の少なくとも1つの部分のデジタル化画像に沿った各クラスのオブジェクトの総数を表示する工程を含む。
【0028】
一実施形態によれば、本方法はさらに、デジタル化画像の中のクラス内のオブジェクトの有無に関する情報を提供する少なくとも1つの文字列を表示する工程を含む。
【0029】
一実施形態では、試料は、パパニコロウ(又はPap)染色剤又は当業者に公知の任意の他の多色性細胞学的染色剤によって着色される。
【0030】
本発明はまた、スライド上に処理された尿試料から回収可能なオブジェクトを分類及び計数するためのシステムであって、
-複数のオブジェクトを含むスライド全体の少なくとも1つのデジタル化画像を受信するように適合させた少なくとも1つの入力;
-以下のように構成された少なくとも1つのプロセッサ:
・スライド全体の画像のセグメンテーションによって結合成分を検出する;
・検出された結合成分を、分類器を用いて可算結合成分と不可算結合成分に分類する;
・可算結合成分の場合:
i.オブジェクトを検出し、各オブジェクトについて1つの境界ボックス及び関連するクラスを出力するように構成されたオブジェクト検出モデルに各可算結合成分を入力する;
ii.各クラスに関連する境界ボックスを計数し、各クラスのオブジェクト数を得る;
・不可算成分の場合:
i.各不可算結合成分をセマンティックセグメンテーションモデルに入力し、全ての画素が定義済みの利用可能なクラスのうちの1つのクラスに分類されるセグメンテーションマスクを出力として得る;
ii.各クラスについて、前記クラスに関連するセグメンテーションマスクの画素数として得られた該クラスの総画素面積と、前記クラスのオブジェクトの平均面積との比率としてオブジェクト数を計数する;
・セマンティックセグメンテーションモデル及びオブジェクト検出モデルから得られた各クラスのオブジェクト数を合計する;
その際、前記セマンティックセグメンテーションモデルとオブジェクト検出モデルの前記クラスは同じである、
-各クラスのオブジェクト数を提供するように適合させた少なくとも1つの出力、
を含むシステムにも関する。
【0031】
同等の方法で、該システムは、
-複数のオブジェクトを含むスライド全体の少なくとも1つのデジタル化画像を受信するように構成された取得モジュール;
-以下のように構成された計算モジュール:
・スライド全体の画像のセグメンテーションによって結合成分を検出する;
・検出された結合成分を、分類器を用いて可算結合成分と不可算結合成分に分類する;
・可算結合成分の場合:
■オブジェクトを検出し、各オブジェクトについて1つの境界ボックス及び関連するクラスを出力するように構成されたオブジェクト検出モデルに各可算結合成分を入力する;
■各クラスに関連する境界ボックスを計数し、各クラスのオブジェクト数を得る
・不可算結合成分の場合:
■各不可算結合成分をセマンティックセグメンテーションモデルに入力し、全ての画素が、定義済みの利用可能なクラスのうちの1つのクラスに分類されているセグメンテーションマスクを出力として得る;
■各クラスについて、前記クラスに関連するセグメンテーションマスクの画素数として得られた、該クラスの総画素面積と前記クラスのオブジェクトの平均面積との比率としてオブジェクト数を計数する;
その際、前記セマンティックセグメンテーションモデルと前記オブジェクト検出モデルの前記クラスが同じである、
-セマンティックセグメンテーションモデル及びオブジェクト検出モデルから得られた各クラスのオブジェクト数を合計する;
-各クラスのオブジェクト数を出力するように構成された出力モジュール、
を含み得る。
【0032】
本発明はまた、尿試料から回収可能なオブジェクトを分類及び計数するためのコンピュータプログラム製品であって、プログラムがコンピュータによって実行されるときに、上記の実施形態のいずれか1つによる方法の工程をコンピュータに実行させる命令を含むコンピュータプログラム製品に関する。
【0033】
本発明はまた、プログラムがコンピュータによって実行されるときに、上記の実施形態のいずれか1つによる方法の工程をコンピュータに実行させる命令を含むコンピュータ可読記憶媒体にも関する。
【0034】
定義
本発明において、以下の用語は、以下の意味を有する:
・細胞についての「非定型」は、非病理学的状況において報告されていない細胞の少なくとも1つの特徴を有することを意味する。
・「非定型尿路上皮細胞」(AUC)は、尿細胞診報告様式パリシステム(TPSRUC)を参照して本明細書で定義される。
・「明視野光学システム」は、試料全体を均一に照らすことによって画像が生成され、その結果、明るく照らされた背景に対して、検体が暗い画像として見えるイメージング技術を指す。明視野イメージングは、試料の観察及び検査のための一般的なイメージング技術として使用される。
・「分類する」は、対象の試料中のオブジェクトを、例えば赤血球などの目的の異なるクラスに分類することを指す。
・「結合成分」は、全ての画素が類似の画素強度値を共有し、何らかの形で互いに結合されている1つのオブジェクト又はオブジェクトのグループを指す。結合成分の例を図2に示す。
・「計数する」とは、対象の試料中の関心のある各クラスのオブジェクト数を列挙することを指す。
・「可算結合成分」は、本発明の場合、成分のグループを指し、これらの成分は、訓練を受けた医師が各単一オブジェクトを識別することができ、したがって彼/彼女がグループに含まれるオブジェクト数を計数することができるグループとして識別するオブジェクト(すなわち、白血球、細胞、細菌など)と呼ばれる。一方、「不可算結合成分」は、訓練を受けた医師がオブジェクトのグループを識別するが、グループ内の単一のオブジェクトを識別することができない、可算結合成分に関して反対の状況を指す。可算成分と不可算成分の例を図2に提供する。結合成分の客観的尺度は、典型的には、訓練を受けた医師のパネルによって定義され、この尺度は、標準に類似しており、細胞学的画像分析の当業者によって受け入れられる。
・「データセット」は、データ駆動型の予測又は決定を行うために、機械学習(ML)の数学的モデルを構築するために使用されるデータの集合を指す。教師あり学習(すなわち、ラベルされた訓練データの形態で既知の入出力例から関数を推論する)では、3つのタイプのMLデータセット(MLセットとしても指定される)は、典型的には、3つのそれぞれの種類のタスク、すなわち訓練、すなわちパラメータのフィッティング、検証、すなわち、MLハイパーパラメータ(学習プロセスを制御するために使用されるパラメータである)のチューニング、及び試験、すなわち、数学的モデルを構築するために利用される訓練データセットとは無関係に、後者のモデルが満足のいく結果を提供することを確認することの専用である。
・「ニューラルネットワーク又は人工ニューラルネットワーク(ANN)」は、ノード(ニューロンと呼ばれる)と、重みによってモデル化されたニューロン間の結合を含むMLのカテゴリを指定する。各ニューロンについて、出力は、入力の関数又は活性化関数による入力のセットで与えられる。ニューロンは一般に、複数の層に組織化されるため、1層のニューロンは直前及び直後の層のニューロンにのみ結合する。
・「YOLO」すなわち「You Only Look Once」は、そのアーキテクチャが特にオブジェクト検出用に構成されている単一の畳み込みネットワークを指す。
・「SOLO」(場所によるオブジェクトのセグメント化(Segmenting Objects by Locations))は、自己組織化特徴マップ(SOFM)、主成分分析、及び多変量線形回帰を組み合わせて、堅牢で、安定であり、高品質の予測を与えるネットワークアーキテクチャを生成する人工ニューラルネットワーク(ANN)の一種を指す。
・「Faster R-CNN」:2段階のオブジェクト検出器のファミリーに属するオブジェクト検出モデルを指す。Faster R-CNNの2つの段階は、それぞれ2つのニューラルネットワークに対応する。第1のものは、領域提案ネットワーク(RPN)と呼ばれ、境界ボックス候補のセットを出力する。第2のものは、境界ボックスの座標を絞り込み、境界ボックスを定義済みのクラスに分類する。
・用語「プロセッサ」は、ソフトウェアを実行することができるハードウェアに限定されると解釈されるべきではなく、一般的な方法で、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブルロジックデバイス(PLD)を含むことができる処理デバイスを指す。プロセッサはまた、コンピュータグラフィックス及び画像処理又は他の機能のために利用されるかどうかにかかわらず、1以上のグラフィックス処理ユニット(GPU)を包含し得る。さらに、関連する機能及び/又は結果として生じる機能を実行することを可能にする命令及び/又はデータは、例えば、集積回路、ハードディスク、CD(コンパクトディスク)、DVD(デジタル汎用ディスク)などの光ディスク、RAM(ランダムアクセスメモリ)又はROM(読み取り専用メモリ)などの任意のプロセッサ可読媒体に格納され得る。命令は、特にハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせに格納され得る。
・「セマンティックセグメンテーション」:画像の各画素を定義済みのクラスに個別に分類するように構成されたアルゴリズムを指す。
・用語「適合された」及び「構成された」は、材料又はソフトウェア手段(ファームウェアを含む)を介してもたらされるかどうかにかかわらず、本装置の初期構成、後の適応若しくは補完、又はそれらの任意の組み合わせを同様に広く包含するとして本開示で使用される。
【0035】
図面の簡単な説明
本発明の特徴及び利点は、以下の説明に現れる。本発明に関して、装置及び方法の実現のいくつかの様式について説明する。
【図面の簡単な説明】
【0036】
図1図1は、一実施形態による本発明の方法の工程を表すブロック図である。
図2図2は、結合成分を含むデジタルスライド画像全体の図と、結合成分が可算結合成分と不可算結合成分の間でどのように分類されるかの例示的な例を提供する。
【発明を実施するための形態】
【0037】
詳細な説明
本発明は、生体試料、特にスライドに処理された尿試料をスクリーニングするための費用対効果の高いハイスループット方法に関する。より正確には、本発明の方法は、対象の生体試料中に存在するオブジェクトを識別及び計数することを目的とする。
【0038】
尿試料は対象から得られる。試料はまた、血液、血漿、血清、リンパ液、腹水(ascetic fluid)、嚢胞液、尿、胆汁、乳頭滲出液、滑液、気管支肺胞洗浄液、喀痰、羊水、腹膜水、脳脊髄液、胸水、心膜液、精液、唾液、汗、糞便、便、及び肺胞マクロファージなどの別の体液であってよい。試料は、濃縮又は濃化されてよい。
【0039】
一実施形態では、本発明の方法は、対象から試料を得ることを含まない。一実施形態では、対象の試料は、対象から予め得られた試料である。前記試料は、本発明の方法に従って使用される前に適切な条件で保存されてよい。
【0040】
試料は、腫瘍様細胞を提示するか、若しくは尿路病態を発症するリスクのある健康な対象又は不健康な対象から収集され得る。本発明の方法は、多数の対象に適用されるように設計されている。
【0041】
一実施形態では、試料をホモジナイズし、フィルター上に堆積させ、次いで、その中に細胞を沈着させるためにスライドガラスに接触させる。スライドの材料はガラスであることが好ましいが、例えばポリカーボネートなどの他の材料でもあり得る。材料は、単回使用材料であってよい。
【0042】
スライド堆積物を、癌リスクの指標である細胞の形態学的変化を検出するためにパパニコロウ染色プロトコルに従って染色する。あるいは、異なる着色手段を一緒に使用してよい。
【0043】
染色後、スライドを覆う。スライドは、例えばカバーガラス又はプラスチックフィルムで覆ってよい。
【0044】
一実施形態によれば、尿試料のスライドの画像を、全スライドスキャナなどの明視野光学システムから得る。
【0045】
走査工程については、取り付けたスライドを、例えば、Hamamatsu Nanozoomer-S60スライドスキャナなどの任意の適切な明視野光学システムを用いてデジタル化してよい。データ取得は、Hamamatsu Nanozoomer-S360スライドスキャナ又は3DHistechのP250又はP1000でも実現できる。
【0046】
スライドのデジタル化画像は長方形であってよい。解析対象のデジタル化画像をトリミングして、各標的領域が解析に供される標的領域を定義してよい。感度の高い領域は、分析の精度を高めるために、標的領域内で分割することができる。
【0047】
本明細書に開示される実施形態は、この明細書に記載されている様々な動作を含む。動作は、ハードウェア構成要素によって実行されてもよく、かつ/又は機械実行可能命令で具現化されてもよく、これは、命令でプログラムされた汎用又は特殊用途プロセッサに動作を実行させるために使用され得る。あるいは、動作は、ハードウェア、ソフトウェア、及び/又はファームウェアの組み合わせによって実行され得る。
【0048】
本明細書に記載の1以上の動作の性能は、1以上のプロセッサ間で分散されてもよく、単一の機械内に存在するだけでなく、多数の機械に配置されてよい。場合によって、1以上のプロセッサ又はプロセッサ実装モジュールは、単一の地理的位置(例えば、家庭環境、オフィス環境、又はサーバファーム内)に配置され得る。他の実施形態では、1以上のプロセッサ又はプロセッサ実装モジュールは、多数の地理的位置に分散されてよい。
【0049】
図1に示すように、一実施形態によれば、方法100の第1工程110は、スライド全体又はスライド全体の少なくとも1つの部分の少なくとも1つのデジタル化画像を受信することからなる。
【0050】
一実施形態では、本方法はさらに、スライド全体又はスライド全体の少なくとも1つの部分の画像のセグメンテーションによる工程120結合成分で構成される。セグメンテーション法は、前景を背景から分離することを可能にする閾値ベースの方法であり得る。最前面の結合成分をセグメンテーションマスクから回収してよい。結合成分は、1つのオブジェクト又はオブジェクトのグループで構成される。
【0051】
一実施形態では、検出された結合成分は、例えば、畳み込みニューラルネットワークなどの分類器を用いて、可算結合成分及び不可算結合成分に分類される(工程130)。可算結合成分は、それに含まれる各オブジェクトを人間が視覚的に特定できる結合成分である。逆に、不可算結合成分は、人間が視覚的に特定できないオブジェクトである。これらの可算及び不可算結合成分の例を図2に提供する。
【0052】
一実施形態によれば、本発明の方法は、可算結合成分の場合、各可算結合成分をオブジェクト検出モデルに入力する工程140を含む。オブジェクト検出モデルは、可算結合成分で構成されるオブジェクトを検出し、各検出されたオブジェクトについて1つの境界ボックス及び関連するクラスを出力として得るように構成され、定義済みの利用可能なクラスの中からクラスが選択される。したがって、この工程は、オブジェクト検出モデルから検出された各オブジェクトについて境界ボックス及び1つの関連するクラスを出力することを含む。
【0053】
一実施形態によれば、オブジェクト検出モデルは、Faster-RCNN、CenterNet、SOLO又はYOLOである。
【0054】
Faster R-CNNでは、画像は畳み込みフィーチャマップを提供する畳み込みネットワークへの入力として提供される。Faster R-CNNは、2つのモジュールで構成されている。第1のモジュールは、領域を提案する深い完全畳み込みネットワークであり、第2のモジュールは、提案された領域を使用するFaster R-CNN検出器である。システム全体は、オブジェクト検出のための単一の統一されたネットワークである。「注意」メカニズムを有するニューラルネットワーク、領域提案を生成するためのRPNモジュール。Faster R-CNNとの主な違いは、後者が選択的検索を用いて領域提案を生成することである。RPNでは、領域提案を生成するための時間コストは、RPNがオブジェクト検出ネットワークと最も多くの計算を共有する場合、選択的検索よりもはるかに小さくなる。簡単に説明すると、RPNは領域ボックス(アンカーと呼ばれる)をランク付けし、オブジェクトを含む可能性が最も高いボックスを提案する。
【0055】
他の2つのオブジェクト検出モデル(CenterNet、YOLO)とは異なり、Faster R-CNNは、境界ボックスが最初に提案され、次に精密化されることを意味する2段階のオブジェクト検出器である。1段階検出器では、境界ボックスは精密化されない。したがって、このモデルの性能は、通常、単段階オブジェクト検出器よりも優れている。
【0056】
CenterNetは、各オブジェクトをキーポイントのペアではなくトリプレットとして検出するため、精度と再現率の両方が向上する。CenterNetは、提案の中央部分、すなわち、幾何学的中心に近い領域を1つの追加キーポイントで探索する。CenterNetのアーキテクチャは、カスケードコーナープーリング及びセンタープーリングを、それぞれ2つのコーナーヒートマップ及びセンターキーポイントヒートマップに適用する畳み込みバックボーンネットワークを含む。CornerNetと同様に、検出されたコーナーのペアと類似の埋め込みを用いて、潜在的な境界ボックスを検出する。次に、検出された中心キーポイントを用いて、最終的な境界ボックスを決定する。他のモデルに対するCenterNetの利点は、通常、実装が容易で、訓練が速く、推論時間中に高速であることである。
【0057】
YOLOは、回帰及び分類を行うために、より少ないアンカーボックスを使用する(入力画像をS×Sグリッドに分割する)。より詳細には、YOLOはGoogleNetに「触発された」ネットワークである。それは、特徴抽出器として機能する24の畳み込み層、及び予測を行うための2つの完全結合層を有する。特徴抽出器のアーキテクチャをダークネットと呼ぶ。要約すると、入力画像は、形状S×Sの特徴マップを出力する特徴抽出器(ダークネット)に供給される。そのため、画像はS×Sセルのグリッドに分割される。特徴マップの各セルは、Kクラスに対する信頼度スコアとクラス確率でB境界ボックスを予測する2つの連続した完全結合層のブロックに供給される。信頼度スコアは、基本的に検出されたオブジェクトがグランドトゥルースオブジェクトとどの程度重複しているかを測定するIOU(intersection over union)メトリックの観点から与えられる。アルゴリズムが最小化する損失は、境界ボックスの位置(x、y)の予測、それらのサイズ(h、w)、前記予測の信頼度スコア(objスコア)及び予測クラス(クラス確率)を考慮に入れる。
【0058】
一方、SOLOは、インスタンスの位置とサイズに応じてインスタンス内の各画素にカテゴリを割り当てる「インスタンスカテゴリ」を用いるため、インスタンスのセグメンテーションをシングルショット分類可解問題(single-shot classification-solvable problem)に変換する。都合の良いことに、SOLOは、強力な性能を備えたはるかにシンプルで柔軟なインスタンスセグメンテーションフレームワークを提供し、Mask R-CNNと同等の精度を達成し、精度は近のシングルショットインスタンスセグメンターを上回る。
【0059】
YOLOとSOLOのよりシンプルなアーキテクチャは、訓練データセットに少量のデータしか利用できず、さらに、分析する各単一スライド上に数千のセルル(cellule)が存在する場合に重要なより速い推論を提供する医療分野での実装に特に都合がよい。
【0060】
一実施形態によれば、本方法はさらに、各クラスのオブジェクトの総数を得るために、オブジェクト検出モデルの出力として得られた各クラスに関連する境界ボックスを計数する工程150を含む。
【0061】
一実施形態によれば、本方法は、各不可算結合成分をセマンティックセグメンテーションモデルに入力し、全ての画素が定義済み利用可能なクラスのうちの1つのクラスに分類されるセグメンテーションマスクを出力として得る工程160を含む。場合によっては、オブジェクト間に深刻な重複がある場合、人間はオブジェクトを個別に識別できない。それゆえ、このような場合には、オブジェクト検出モデルは各個々のオブジェクトを検出できない。したがって、セグメンテーションモデルは、都合の良いことに、オブジェクトのおおよその数を計算することを可能にする。
【0062】
一実施形態によれば、セマンティックセグメンテーションモデルはU-Netである。U-Netのアーキテクチャは、その名前を正当化する「U」のように見える。このアーキテクチャは、(1)収縮セクション、(2)ボトルネックセクション及び(3)拡張セクションの3つのセクションからなる。
【0063】
収縮セクションは、いくつかの収縮ブロックで構成されている。各ブロックは、入力を受け取り、2つの3×3畳み込み層を適用し、その後に2×2マックスプーリングを適用する。各ブロックの後のカーネル又は特徴マップの数は2倍になり、その結果、アーキテクチャは複雑な構造を効果的に学習することができる。
【0064】
ボトルネックは、収縮セクションと拡張セクションの間を仲介する。2つの3×3畳み込み層に続いて2×2アップサンプリング層を使用する。
【0065】
収縮セクションと同様に、拡張セクションはいくつかの拡張ブロックからなる。各拡張ブロックの先頭で、対応する収縮ブロックの出力特徴マップと前の拡張ブロックの出力を結び付ける。次に、この結び付けられたブロックを、2つの3×3畳み込み層及び1つの2×2アップサンプリング層の中に通過させる。各拡大ブロックについて、第1の3×3畳み込み層の後に、特徴マップの数を2で除算する。
【0066】
最後に、得られた特徴マップを、得られた特徴マップの数がクラスの数と等しい最後の1×1畳み込み層の中に通過させる。
【0067】
一実施形態によれば、本方法は、セマンティックセグメンテーションモデルの各クラスについて、前記クラスに関連するセグメンテーションマスクの画素数として得られるクラスの総画素面積と、前記クラスのオブジェクトの平均面積との比率としてオブジェクト数を計数する工程170を含む。
【0068】
一実施形態によれば、セマンティックセグメンテーションモデル及びオブジェクト検出モデルの定義済みクラスは同じである。
【0069】
一実施形態によれば、セマンティックセグメンテーションモデル及びオブジェクト検出モデルは、ラベルされたデジタル化画像のデータセットを用いて訓練される。
【0070】
一実施形態によれば、セマンティックセグメンテーションモデル及びオブジェクト検出モデルは、確率論的勾配降下訓練方法を用いて訓練される。
【0071】
一実施形態によれば、各クラスは、以下のリスト:
-白血球:好塩基球、好中球、マクロファージ、単球及び好酸球;
-赤血球;
-細菌;
-尿結晶;
-円柱類;
-健康で非定型の尿路上皮細胞;
-扁平上皮細胞;
-反応性尿路上皮細胞、及び/又は
-酵母
の中のオブジェクトの少なくとも1つに関連する。
【0072】
一実施形態によれば、本方法はさらに、スライド全体の少なくとも1つの部分のデジタル化画像に沿った各クラスのオブジェクトの総数を表示する工程を含む。この中で、ユーザは、都合の良いことに、本方法を用いて得られたオブジェクト数の結果並びにデジタル化画像を視覚化することができる。
【0073】
一実施形態によれば、本方法はさらに、デジタル化画像の中のクラス内のオブジェクトの有無に関する情報を提供する少なくとも1つの文字列を表示する工程を含む。文字列は、デジタル化画像に沿った表示されてよい。
【0074】
本発明はさらに、スライド上に処理された尿試料から回収可能なオブジェクトを分類及び計数するためのシステムに関する。以下では、モジュールは、材料、物理的に異なる成分ではなく、機能的な実体として理解されるべきである。その結果、それらは、同じ有形かつ具体的な成分にグループ化されるか、又はいくつかのそのような成分に分配されるものとして具現化することができる。また、これらの各モジュールはそれ自体、おそらく少なくとも2つの物理的成分間で共有されている。加えて、モジュールは、ハードウェア、ソフトウェア、ファームウェア、又はそれらの混合形態でも実装される。それらは、好ましくは、システムの少なくとも1つのプロセッサ内で具現化される。
【0075】
本発明のシステムは、複数のオブジェクトを含むスライド全体の少なくとも1つのデジタル化画像を受信するように構成された取得モジュールを備えてもよい。取得モジュールは、スライド全体の少なくとも1つの画像を取得するように構成された明視野光学システムに接続されてよい。
【0076】
一実施形態では、該システムは、
-スライド全体の画像のセグメンテーションによって結合成分を検出する;
-検出された結合成分を、分類器を用いて可算結合成分と不可算結合成分に分類する;
-可算結合成分の場合:
・オブジェクトを検出し、各オブジェクトについて1つの境界ボックス及び関連するクラスを出力するように構成されたオブジェクト検出モデルに各可算結合成分を入力する;
・各クラスに関連する境界ボックスを計数し、各クラスのオブジェクト数を得る;
-不可算成分の場合:
・各不可算結合成分をセマンティックセグメンテーションモデルに入力し、全ての画素が定義済みの利用可能なクラスのうちの1つのクラスに分類されるセグメンテーションマスクを出力として得る;
・各クラスについて、前記クラスに関連するセグメンテーションマスクの画素数として得られた該クラスの総画素面積と、前記クラスのオブジェクトの平均面積との比率としてオブジェクト数を計数する;
その際、セマンティックセグメンテーションモデルとオブジェクト検出モデルの定義済みクラスは同じである、
-セマンティックセグメンテーションモデル及びオブジェクト検出モデルから取得した各クラスのオブジェクト数を合計する
ように構成された計算モジュールを備える。
【0077】
一実施形態によれば、該システムは、各クラスについてオブジェクト数を出力するように構成された出力モジュールを備える。
【0078】
本発明はさらに、尿試料から回収可能なオブジェクトを分類及び計数するためのコンピュータプログラム製品を含み、該コンピュータプログラム製品は、プログラムがコンピュータによって実行されるときに、本明細書に記載の実施形態のいずれか1つによる方法の工程をコンピュータに実行させる命令を含む。
【0079】
上記の方法を実行するコンピュータプログラム製品は、ハードウェア構成要素によって実行される動作を実行するための機械又は特殊目的コンピュータとして動作するようにプロセッサ又はコンピュータを個々に若しくは集合的に指示するか又は構成するための、コンピュータプログラム、コードセグメント、命令、又はそれらの任意の組み合わせとして記述され得る。一例では、該コンピュータプログラム製品は、コンパイラによって生成されるマシンコードなどの、プロセッサ又はコンピュータによって直接実行されるマシンコードを含む。別の例では、該コンピュータプログラム製品は、インタプリタを用いてプロセッサ又はコンピュータによって実行される高レベルのコードを含む。当業者プログラマは、図面に例示されるブロック図及びフローチャート、並びに上記の方法の動作を実行するためのアルゴリズムを開示する本明細書中の対応する説明に基づいて命令又はソフトウェアを容易に書くことができる。
【0080】
本発明はさらに、プログラムがコンピュータによって実行されるときに、上記の実施形態のいずれか1つによる方法の工程をコンピュータに実行させる命令を含むコンピュータ可読可能記憶媒体を含む。
【0081】
一実施形態によれば、コンピュータ可読記憶媒体は、非一時的コンピュータ可読記憶媒体である。
【0082】
本実施形態の方法を実装するコンピュータプログラムは、一般に、限定されないが、SDカード、外部記憶装置、マイクロチップ、フラッシュメモリ装置、ポータブルハードドライブ及びソフトウェアウェブサイトなどの配布コンピュータ可読記憶媒体上でユーザに配布することができる。分配媒体から、コンピュータプログラムは、ハードディスク又は類似の中間記憶媒体にコピーされ得る。コンピュータプログラムは、それらの分配媒体又はそれらの中間記憶媒体のいずれかからコンピュータの実行メモリにコンピュータ命令をロードすることによって実行することができ、この発明の方法に従って作用するようにコンピュータを構成する。これらの動作は全て、コンピュータシステムの当業者に周知である。
【0083】
ハードウェア構成要素を実装し、上記の方法を実行するプロセッサ若しくはコンピュータを制御する命令又はソフトウェア、並びに任意の関連データ、データファイル、及びデータ構造は、1以上の非一時的なコンピュータ可読記憶媒体の中若しくは上に記録、保存、又は固定される。非一時的コンピュータ可読可能記憶媒体の例には、プロセッサ又はコンピュータが命令を実行できるように、命令又はソフトウェア及び任意の関連データ、データファイル、及びデータ構造を非一時的方法で格納し、命令又はソフトウェア及び任意の関連データ、データファイル、及びデータ構造をプロセッサ又はコンピュータに提供することができる読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、フラッシュメモリ、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、磁気テープ、フロッピーディスク、光磁気データ記憶装置、光データ記憶装置、ハードディスク、ソリッドステートディスク、及び当業者に公知の任意のデバイスが含まれる。一例では、命令及びソフトウェア及び任意の関連データ、データファイル、及びデータ構造がプロセッサ又はコンピュータによって分散形式で格納、アクセス、及び実行されるように、命令又はソフトウェア及び任意の関連データ、データファイル、及びデータ構造はネットワーク接続コンピュータシステム上に分散される。
図1
図2
【国際調査報告】