IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アイリス インターナショナル インコーポレイテッドの特許一覧

<>
  • 特許-生体粒子の分類のシステム及び方法 図1A
  • 特許-生体粒子の分類のシステム及び方法 図1B
  • 特許-生体粒子の分類のシステム及び方法 図2
  • 特許-生体粒子の分類のシステム及び方法 図3
  • 特許-生体粒子の分類のシステム及び方法 図4
  • 特許-生体粒子の分類のシステム及び方法 図5
  • 特許-生体粒子の分類のシステム及び方法 図6A
  • 特許-生体粒子の分類のシステム及び方法 図6B
  • 特許-生体粒子の分類のシステム及び方法 図7
  • 特許-生体粒子の分類のシステム及び方法 図8
  • 特許-生体粒子の分類のシステム及び方法 図9
  • 特許-生体粒子の分類のシステム及び方法 図10
  • 特許-生体粒子の分類のシステム及び方法 図11
  • 特許-生体粒子の分類のシステム及び方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-03
(45)【発行日】2024-04-11
(54)【発明の名称】生体粒子の分類のシステム及び方法
(51)【国際特許分類】
   G01N 33/49 20060101AFI20240404BHJP
   G01N 15/0227 20240101ALI20240404BHJP
【FI】
G01N33/49 K
G01N15/0227
【請求項の数】 16
(21)【出願番号】P 2022110246
(22)【出願日】2022-07-08
(62)【分割の表示】P 2019510405の分割
【原出願日】2017-08-22
(65)【公開番号】P2022137166
(43)【公開日】2022-09-21
【審査請求日】2022-07-08
(31)【優先権主張番号】62/377,851
(32)【優先日】2016-08-22
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】510227148
【氏名又は名称】アイリス インターナショナル, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】カルロス ラミレス
(72)【発明者】
【氏名】スティーブン カダヴィド
(72)【発明者】
【氏名】ジンダン ジョウ
【審査官】海野 佳子
(56)【参考文献】
【文献】米国特許出願公開第2004/0126008(US,A1)
【文献】米国特許出願公開第2015/0110348(US,A1)
【文献】特表2004-505233(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 33/48-33/98
(57)【特許請求の範囲】
【請求項1】
生体試料中の粒子の分類を決定する方法であって、前記方法は、
デジタルカメラを用いて前記粒子の画像を取得することと、
プロセッサシステムにおいて前記粒子の前記画像を受信することと、
前記プロセッサシステムを利用して、非一時的なコンピュータ可読媒体上に記憶されたコンピュータ実行可能コードを実行することと
を含み、
前記コンピュータ実行可能コードは、命令を含み、前記命令は、前記プロセッサシステム上で実行されると、
第1のマスクを前記画像に適用することと、
前記第1のマスクを適用することに基づいて前記画像から第1の組の画素を取得することと、
第2のマスクを前記画像に適用することであって、前記第2のマスクを適用することは、前記第1のマスクとは異なる画素を明らかにする、ことと、
前記第2のマスクを適用することに基づいて第2の組の画素を取得することと、
前記第1の組の画素および前記第2の組の画素から複数の特徴を抽出することと、
少なくとも前記抽出された特徴のサブセットに基づいて前記分類を決定することと
を前記プロセッサシステムに行わせ
各マスクの適用は、異なる画素を、前記画像の中心の外側で同心円状に明らかにする、方法。
【請求項2】
生体試料中の粒子の分類を決定する方法であって、前記方法は、
デジタルカメラを用いて前記粒子の画像を取得することと、
プロセッサシステムにおいて前記粒子の前記画像を受信することと、
前記プロセッサシステムを利用して、非一時的なコンピュータ可読媒体上に記憶されたコンピュータ実行可能コードを実行することと
を含み、
前記コンピュータ実行可能コードは、命令を含み、前記命令は、前記プロセッサシステム上で実行されると、
第1のマスクを前記画像に適用することと、
前記第1のマスクを適用することに基づいて前記画像から第1の組の画素を取得することと、
第2のマスクを前記画像に適用することであって、前記第2のマスクを適用することは、前記第1のマスクとは異なる画素を明らかにする、ことと、
前記第2のマスクを適用することに基づいて第2の組の画素を取得することと、
前記第1の組の画素および前記第2の組の画素から複数の特徴を抽出することと、
少なくとも前記抽出された特徴のサブセットに基づいて前記分類を決定することと
を前記プロセッサシステムに行わせ、
前記方法は、
前記画像の中心を定義することを更に含む方法。
【請求項3】
前記画像を前記第1のマスクのサイズに正規化することを更に含む、請求項1に記載の方法。
【請求項4】
生体試料中の粒子の分類を決定する方法であって、前記方法は、
デジタルカメラを用いて前記粒子の画像を取得することと、
プロセッサシステムにおいて前記粒子の前記画像を受信することと、
前記プロセッサシステムを利用して、非一時的なコンピュータ可読媒体上に記憶されたコンピュータ実行可能コードを実行することと
を含み、
前記コンピュータ実行可能コードは、命令を含み、前記命令は、前記プロセッサシステム上で実行されると、
1のマスクを、実質的に、前記画像の中心に適用することであって、前記画像は、前記第1のマスクのサイズに正規化される、ことと、
前記第1のマスクを適用することに基づいて前記画像から第1の組の画素を取得することと、
第2のマスクを前記画像に適用することであって、前記第2のマスクを適用することは、前記第1のマスクとは異なる画素を明らかにする、ことと、
前記第2のマスクを適用することに基づいて第2の組の画素を取得することと、
前記第1の組の画素および前記第2の組の画素から複数の特徴を抽出することと、
少なくとも前記抽出された特徴のサブセットに基づいて前記分類を決定することと
を前記プロセッサシステムに行わせる、方法。
【請求項5】
前記第1のマスクおよび前記第2のマスクは、円形またはリング形状である、請求項1に記載の方法。
【請求項6】
前記抽出することは、前記第1の組の画素を群へとクラスタ化すること、前記クラスタ化された画素の群からカラーパレットを作成すること、前記カラーパレットに部分的に基づいて前記画像のラベルを決定すること、またはその任意の組み合わせを含む、請求項1に記載の方法。
【請求項7】
生体試料中の粒子の分類を決定する方法であって、前記方法は、
デジタルカメラを用いて前記粒子の画像を取得することと、
プロセッサシステムにおいて前記粒子の前記画像を受信することと、
前記プロセッサシステムを利用して、非一時的なコンピュータ可読媒体上に記憶されたコンピュータ実行可能コードを実行することと
を含み、
前記コンピュータ実行可能コードは、命令を含み、前記命令は、前記プロセッサシステム上で実行されると、
第1のマスクを前記画像に適用することと、
前記第1のマスクを適用することに基づいて前記画像から第1の組の画素を取得することと、
第2のマスクを前記画像に適用することであって、前記第2のマスクを適用することは、前記第1のマスクとは異なる画素を明らかにする、ことと、
前記第2のマスクを適用することに基づいて第2の組の画素を取得することと、
前記第1の組の画素および前記第2の組の画素から複数の特徴を抽出することと、
少なくとも前記抽出された特徴のサブセットに基づいて前記分類を決定することと
を前記プロセッサシステムに行わせ、
前記抽出することは、前記第1のマスクを単位大きさに正規化すること、赤色緑色青色(RGB)色相彩度値(HSV)、色相彩度明度(HSL)、または色相彩度明度(HSB)を含む選択された色空間を使用すること、またはその任意の組み合わせを含む、方法。
【請求項8】
前記抽出された特徴の前記サブセットを以前記憶されたデータセットと比較するために第1のレベルモデルを使用することと、前記抽出された特徴の前記サブセットと前記以前記憶されたデータセットとの前記比較に基づいて予備分類を同定することと、第1のレベルモデルを使用して前記予備分類が正しい確率値を算出することと、前記確率値が閾値以上であるとき、前記予備分類に基づいて前記分類を決定することとを更に含む、請求項1に記載の方法。
【請求項9】
前記第1のレベルモデルは、機械学習モデルである、請求項に記載の方法。
【請求項10】
前記確率値が前記閾値未満であるとき、前記粒子分類を決定するために第2のレベルモデルを使用することを更に含む、請求項に記載の方法。
【請求項11】
前記第2のレベルモデルは、機械学習モデルである、請求項10に記載の方法。
【請求項12】
前記第2のレベルモデルは、
前記確率値を前記第2のレベルモデルで受信することと、
粒子カテゴリに関する分類性能に従ってソートされた値のリストを作成することと、
第2のレベルの確率値を作成するために前記確率値と前記ソートされたリストとを組み合わせることと、
前記粒子分類を決定するために前記第1のレベルの確率値と前記第2のレベルの確率値とを使用することと
を更に含む、請求項11に記載の方法。
【請求項13】
前記抽出された特徴の前記サブセットは、訓練特徴、検証特徴、またはテスト特徴を含む、請求項1に記載の方法。
【請求項14】
前記抽出された特徴の前記サブセットは、カスケード分類機アーキテクチャにマッピングされる、請求項1に記載の方法。
【請求項15】
前記粒子は、好中球、リンパ球、単球、好酸球、好塩基球、未成熟白血球、網状赤血球、有核赤血球、赤血球、上皮細胞、細菌、酵母、または寄生虫からなる群から選択されるメンバーを含む、請求項1に記載の方法。
【請求項16】
抽出ルーチンおよびマッピングルーチンを更に含み、前記抽出ルーチンおよび前記マッピングルーチンの両方は、前記プロセッサシステムによって実行され、前記第1の組の画素および前記第2の組の画素から前記複数の特徴を抽出することは、前記抽出ルーチンの一部であり、少なくとも前記抽出された特徴の前記サブセットを分類機にマッピングすることにより、前記分類を決定することは、前記マッピングルーチンの一部である、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
血液学的条件の検出を含む多くの研究及び臨床用途において有用な細胞及び粒子を含む、生体粒子の同定及び列挙。
【背景技術】
【0002】
自動化された生体粒子の認識は、複雑な動作が時間に敏感な様式で、しばしば限られた計算資源を有するハードウェア上で、実行されることを要求するタスクである。したがって、システムの各フェーズが効率的であることが重要である。特に血球については、自動化された生体粒子認識は、従来、高度な前処理を必要とする技術を使用して行われてきた。これは、計算効率と記述力の間の妥協の必要性をもたらす。更に、このような複雑な演算に必要とされる要因が多いため、従来システムの分析及び故障診断は、不可能ではないにせよ煩雑であり得る。
【0003】
したがって、自動化された生体粒子分類の効率及び精度を増大させながら、計算要件を低下させる改善された方法に対するニーズが依然としてある。本開示の実施形態は、この問題及び他の問題に対処する。
【発明の概要】
【課題を解決するための手段】
【0004】
本開示は、生体試料中の細胞及び他の粒子を含む生体粒子のリアルタイム分類に好適な、自動化された画像ベースの特徴抽出及び分類アーキテクチャを含むシステムに関する。このシステムは、医療診断ツールとして使用され得、細胞及び/又は粒子の同定及び定量を向上させ得る。開示される画像ベースの分類システムは、画像取得、特徴抽出、特徴選択、及びカスケード分類機アーキテクチャを使用した細胞又は粒子の分類の決定、という4つの主要なステップを含む。生体試料内に含まれる細胞及び/又は粒子を分析するために、細胞又は粒子の画像がまず収集又は取得されてもよい。次いでシステムは、これらの画像を使用して、「特徴」と呼ばれる特定の数値若しくはカテゴリ値又は特性を個々の画像から抽出し得る。次いでシステムは、抽出された特徴の分析において、階層的又はカスケード型分類アーキテクチャを使用し得る。様々な実施形態によれば、決定ステップで使用されるカスケード分類機アーキテクチャは、2つのレベルの分析を含み得る。第1のレベルの分析の結果が確定的ではない場合、生体試料(例えば血液試料)の抽出された特徴のうちの選択したものに対して、第2のレベルの分析を遂行してもよい。
【0005】
例示的なアーキテクチャにおいて、生体試料の一組の選択された抽出された特徴は、既知の特性を有する細胞又は粒子から抽出された一組の選択された特徴と比較され得る。多くの場合、比較(「第1のレベルモデル」)は、細胞又は粒子の正確な同定を提供する。少数のケースにおいて、細胞又は粒子の分類は、細胞又は粒子を分類する更なるステップ(「第2のレベルモデル」)を必要とする。このステップは、第1のレベルの数値又はカテゴリ値を第2のレベルモデルと組み合わせて使用することを含んでもよい。この2レベル式アーキテクチャは、第1のレベルの後又は第2のレベルの後のいずれかに、システムが各画像を分類又はカテゴリに正確に割り振ることを可能にする。
【0006】
本明細書で論じる血液粒子特徴選択及び画像分類アーキテクチャシステム並びに方法は、他の伝統的な手法と比較すると、様々な利益及び恩恵を提供することができる。例えば、本発明の実施形態は、特徴抽出計算量を最小値に保つことができるシステム及び方法を提供する。場合によっては、特定の特徴を必要とするアーキテクチャ内の特定の分類機に細胞イベントが到達するまで、複雑かつ高価な特徴計算を延期することができる。多くの場合には、特徴の大部分は計算する必要がないであろう。特徴抽出は、いずれの自動化された分類システムでも高価な段階であり得る。本明細書で開示されるアーキテクチャシステム及び方法は、複雑度と性能のバランスをとるための単純だが強力な手法を導入する。その上、カスケードアーキテクチャの分類機システムは、モジュール式で、スケーラブルであり、事後分析するのが簡単であり得る。システムの出力は、個々の分類機に容易にトレースバックすることができる。個々の分類機は、アーキテクチャの残部を手つかずの状態に維持しながら、容易に再訓練又はアップグレードすることができる。対照的に、多くの伝統的な手法は、多数の特徴を有する単一の分類機から構成され、これは、アーキテクチャの分析及び故障診断を不可能ではないにせよ煩雑にする。本明細書で開示される例示的なシステム及び方法は、特徴選択段階において定義されるカスケードアーキテクチャ内の処理順序を提供することができ、これは、訓練データ中の全てのカテゴリにおける分離性の測定値を使用する。分離性のメトリックは、分類ワークフローの最初にどのカテゴリが最も処理しやすいかを決定するために使用することができる。分離性が複雑なものは、カスケードの最後に残すことができる。例示的なシステム及び方法の実施形態によれば、分類機内の低レベル複雑度(レベル1)と高レベル複雑度(レベル2)との間の伝達関数の特徴は、両レベル間の滑らかな遷移を可能にする。これにより、特徴量の変化が少ない類似画像が処理される場合、2つのレベル間に確かな閾値が存在せず、むしろ連続的な遷移があることにより、システム応答のばらつきを低減することができる。
【0007】
一態様では、生体試料中の粒子の分類を決定する方法が提供され、方法は、粒子の画像を取得することと、プロセッサシステムで粒子の画像を受信することと、非一時的なコンピュータ可読媒体上に記憶されたコンピュータ実行可能コードをプロセッサシステムを使用して実行することとを含み、コンピュータ実行可能コードは、プロセッサシステム上の命令を含む。いくつかの例では、プロセッサシステム上で実行されるとき、命令は、画像の画素の内容及び位置に基づいて画像から複数の特徴を抽出することを含み得る抽出ルーチンをプロセッサシステムに遂行させる。いくつかの例では、抽出することは、画像に第1のマスクを適用し、第1のマスクを適用することに基づいて画像から第1の組の画素を取得し、第1の組の画素から複数の特徴を決定することを含む。いくつかの例では、マッピングすることは、抽出された特徴のサブセットを分類機アーキテクチャにマッピングすることを含むマッピングルーチンを遂行することを含む。いくつかの例では、マッピングすることは、第1のレベルモデルを使用して、抽出された特徴のサブセットを以前記憶されたデータセットと比較し、抽出された特徴のサブセットと以前記憶されたデータセットとの比較に基づいて予備分類を同定することを含む。いくつかの例では、マッピングすることは、第1のレベルモデルを使用して予備分類が正しい確率値を算出することを含み、確率値が閾値以上であるとき、予備分類に基づいて分類を決定することも含み得る。
【0008】
一態様では、生体試料中の粒子の分類を決定する方法が提供され、方法は、粒子の画像を取得することと、画像の画素の内容及び位置に基づいて画像から複数の特徴を抽出することと、抽出された特徴のサブセットを選択することと、抽出された特徴のサブセットをカスケード分類機アーキテクチャにマッピングすることと、第1のレベルモデルを使用して予備分類が正しい確率値を算出することと、確率値が閾値以上であるとき、予備分類に基づいて分類を決定することと、を含む。いくつかの例では、抽出することは、画像に第1のマスクを適用し、第1のマスクを適用することに基づいて画像から第1の組の画素を取得し、第1の組の画素から複数の特徴を決定することを含む。いくつかの例では、マッピングすることは、第1のレベルモデルを使用して、抽出された特徴のサブセットを以前記憶されたデータセットと比較し、抽出された特徴のサブセットと以前記憶されたデータセットとの比較に基づいて予備分類を同定することを含む。いくつかの例では、マッピングすることは、第1のレベルモデルを使用して予備分類が正しい確率値を算出することを含み、確率値が閾値以上であるとき、予備分類に基づいて分類を決定することも含み得る。
【0009】
いくつかの例では、抽出方法は、第2の組の画素を取得するために第2のマスクを画像に適用することを含む。いくつかの例では、第1のマスク及び第2のマスクは、円形又はリング形状であってよい。いくつかの例では、異なるマスクの適用は、異なる画素を明らかにする。いくつかの例では、第1のマスク及び第2のマスクは、所定の順序で適用してもよい。
【0010】
いくつかの例では、抽出方法は、第1の組の画素を群へとクラスタ化することを含む。
【0011】
いくつかの例では、抽出方法は、クラスタ化された画素群からカラーパレットを作成することを含む。
【0012】
いくつかの例では、抽出方法は、カラーパレットに部分的に基づいて画像のラベルを決定することを含む。
【0013】
いくつかの例では、抽出方法は、画像をマスクサイズに正規化することを含む。
【0014】
いくつかの例では、抽出方法は、第1のマスクを単位大きさに正規化することを含む。
【0015】
いくつかの例では、抽出方法は、赤色緑色青色(red-green-blue、RGB)色相彩度値(hue-saturation-value、HSV)、色相彩度明度(hue-saturation-lightness、HSL)、又は色相彩度明度(hue-saturation-brightness、HSB)を含む選択され
た色空間を使用することを含む。
【0016】
いくつかの例では、抽出された特徴の選択されたサブセットは、訓練特徴、検証特徴、又はテスト特徴を含む。いくつかの例では、抽出された特徴のサブセットは、カスケード分類機アーキテクチャにマッピングされる。
【0017】
いくつかの例では、第1のレベルモデルは機械学習モデルである。
【0018】
いくつかの例では、マッピング方法は、確率値が閾値未満であるとき、細胞又は粒子分類を決定するために第2のレベルモデルを使用することを含む。いくつかの例では、第2のレベルモデルは機械学習モデルである。
【0019】
いくつかの例では、粒子は、好中球、リンパ球、単球、好酸球、好塩基球、未成熟白血球、網状赤血球、有核赤血球、赤血球、上皮細胞、細菌、酵母、又は寄生虫であってもよい。
【0020】
別の態様では、生体試料中の粒子の分類を決定する方法が提供され、この方法は、第2のレベルモデルを含む。いくつかの例では、第2のレベルモデルは、確率値を第2のレベルモデルで受信することと、粒子カテゴリに関する分類性能に従ってソートされた値のリストを作成することと、第2のレベルの確率値を作成するために確率値とソートされたリストとを組み合わせることと、細胞又は粒子分類を決定するために第1のレベルモデルで決定された確率値と第2のレベルモデルで決定された確率値とを使用することと、を含む。
【0021】
別の態様では、生体試料中の粒子の分類を決定するシステムが提供され、システムは、プロセッサ及びプロセッサに連結されたコンピュータ可読記憶媒体を含み、コンピュータ可読記憶媒体は、方法を実装するためにプロセッサによって実行可能なコードを含み、方法は、粒子の画像を取得することと、画像の画素の内容及び位置に基づいて画像から複数の特徴を抽出することと、抽出された特徴のサブセットを選択することと、抽出された特徴のサブセットをカスケード分類機アーキテクチャにマッピングすることと、を含む。いくつかの例では、抽出することは、画像に第1のマスクを適用し、第1のマスクを適用することに基づいて画像から第1の組の画素を取得し、第1の組の画素から複数の特徴を決定することを含む。いくつかの例では、マッピングすることは、抽出された特徴のサブセットを以前記憶されたデータセットと比較するために第1のレベルモデルを使用することと、抽出された特徴のサブセットと以前記憶されたデータセットとの比較に基づいて予備分類を同定することと、第1のレベルモデルを使用して予備分類が正しい確率値を算出することと、確率値が閾値以上であるとき、予備分類に基づいて分類を決定することと、を含む。場合によっては、コンピュータ可読記憶媒体は、本明細書で開示される方法のいずれかを実装するためのプロセッサによって実行可能なコードを含む。いくつかの例では、システムは、デジタル顕微鏡カメラを使用する。本発明の実施形態はまた、1つ以上のプロセッサによって実行可能なプログラム命令を含む非一時的コンピュータ可読記憶媒体であって、プログラム命令は、実行されると、1つ以上のプロセッサに動作を遂行させ、動作は、本明細書で開示される方法のいずれかを含む、非一時的コンピュータ可読記憶媒体、を包含する。
【0022】
別の態様では、抽出された特徴のサブセットを分類機アーキテクチャにマッピングすることによって生体試料中の粒子の分類を決定する方法であって、マッピングすることは、抽出された特徴のサブセットを以前記憶されたデータセットと比較するために第1のレベルの機械学習モデルを使用することであって、抽出された特徴は画像から抽出される、使用することと、第1のレベルの機械学習モデルを使用して確率値を算出することと、確率値を所定の比較表と比較することと、確率値が閾値以上である場合、粒子分類を決定することと、確率値が当該閾値未満である場合、第2のレベルの機械学習モデルを使用することと、第2のレベルの機械学習モデルを使用して細胞又は粒子カテゴリに関する分類性能に従って昇順にソートされた値のリストを作成することと、第2のレベルのスコアを作成するために確率値とソートされた値のリストとを組み合わせることと、粒子分類を決定するために第2のレベルのスコアを使用することと、を含む、方法、が提供される。
【0023】
上述のことは、他の特徴及び実施形態と共に、以下の明細書、特許請求の範囲、及び図面を参照するとより明らかになるであろう。
本発明は、例えば、以下を提供する。
(項目1)
生体試料中の粒子の分類を決定する方法であって、前記方法は、
前記粒子の画像を取得することと、
プロセッサシステムにおいて前記粒子の前記画像を受信することと、
非一時的なコンピュータ可読媒体上に記憶されたコンピュータ実行可能コードを前記プロセッサシステムを使用して実行することと
を含み、
前記コンピュータ実行可能コードは、命令を含み、前記命令は、前記プロセッサシステム上で実行されると、
抽出ルーチンを遂行することであって、前記抽出ルーチンは、前記画像の画素の内容及び位置に基づいて前記画像から複数の特徴を抽出することを含み、前記抽出することは、
第1のマスクを前記画像に適用すること、
前記第1のマスクを適用することに基づいて前記画像から第1の組の画素を取得すること、及び
前記第1の組の画素から前記複数の特徴を決定すること
を含む、ことと、
前記抽出された特徴のサブセットを選択することと、
マッピングルーチンを遂行することであって、前記マッピングルーチンは、前記抽出された特徴の前記サブセットを分類機アーキテクチャにマッピングすることを含み、前記マッピングすることは、
前記抽出された特徴の前記サブセットを以前記憶されたデータセットと比較するために第1のレベルモデルを使用すること、
前記抽出された特徴の前記サブセットと前記以前記憶されたデータセットとの前記比較に基づいて予備分類を同定すること、
前記第1のレベルモデルを使用して前記予備分類が正しい確率値を算出すること、及び
前記確率値が閾値以上であるとき、前記予備分類に基づいて前記分類を決定すること
を含む、ことと
を前記プロセッサシステムに行わせる、方法。
(項目2)
前記抽出することは、第2の組の画素を取得するために第2のマスクを前記画像に適用することを含む、項目1に記載の方法。
(項目3)
前記第1のマスク及び前記第2のマスクは、円形又はリング形状である、項目2に記載の方法。
(項目4)
前記異なるマスクの適用は、異なる画素を明らかにする、項目2又は3に記載の方法。
(項目5)
前記第1のマスク及び前記第2のマスクは、所定の順序で適用される、項目2~4のいずれか一項に記載の方法。
(項目6)
前記抽出することは、前記第1の組の画素を群へとクラスタ化することを含む、項目1~5のいずれか一項に記載の方法。
(項目7)
前記抽出することは、前記クラスタ化された画素群からカラーパレットを作成することを含む、項目6に記載の方法。
(項目8)
前記抽出することは、前記カラーパレットに部分的に基づいて前記画像のラベルを決定することを含む、項目7に記載の方法。
(項目9)
前記抽出することは、前記画像をマスクサイズに正規化することを含む、項目1~8のいずれか一項に記載の方法。
(項目10)
前記抽出することは、前記第1のマスクを単位大きさに正規化することを含む、項目1~9のいずれか一項に記載の方法。
(項目11)
前記抽出することは、赤色緑色青色(RGB)色相彩度値(HSV)、色相彩度明度(HSL)、又は色相彩度明度(HSB)を含む選択された色空間を使用することを含む、項目1~10のいずれか一項に記載の方法。
(項目12)
前記抽出された特徴の前記選択されたサブセットは、訓練特徴、検証特徴、又はテスト特徴を含む、項目1~11のいずれか一項に記載の方法。
(項目13)
前記抽出された特徴の前記サブセットは、カスケード分類機アーキテクチャにマッピングされる、項目1~12のいずれか一項に記載の方法。
(項目14)
前記第1のレベルモデルは、機械学習モデルである、項目1~13のいずれか一項に記載の方法。
(項目15)
前記マッピングすることは更に、
前記確率値が前記閾値未満であるとき、前記粒子分類を決定するために第2のレベルモデルを使用することを含む、項目1~14のいずれか一項に記載の方法。
(項目16)
前記第2のレベルモデルは、機械学習モデルである、項目15に記載の方法。
(項目17)
前記第2のレベルモデルを使用することは、
前記確率値を前記第2のレベルモデルで受信することと、
粒子カテゴリに関する分類性能に従ってソートされた値のリストを作成することと、
第2のレベルの確率値を作成するために前記確率値と前記ソートされたリストとを組み合わせることと、
前記粒子分類を決定するために前記第1のレベルの確率値と前記第2のレベルの確率値とを使用することとを更に含む、項目15又は16に記載の方法。
(項目18)
前記粒子は、好中球、リンパ球、単球、好酸球、好塩基球、未成熟白血球、網状赤血球、有核赤血球、赤血球、上皮細胞、細菌、酵母、又は寄生虫からなる群から選択されるメンバーを含む、項目1~17のいずれか一項に記載の方法。
(項目19)
生体試料中の粒子の分類を決定するシステムであって、前記システムは、
プロセッサ及び前記プロセッサに連結されたコンピュータ可読記憶媒体を含み、前記コンピュータ可読記憶媒体は、
前記粒子の画像を取得することと、
前記画像の画素の内容及び位置に基づいて前記画像から複数の特徴を抽出することであって、前記抽出することは、
第1のマスクを前記画像に適用すること、
前記第1のマスクを適用することに基づいて前記画像から第1の組の画素を取得すること、及び
前記第1の組の画素から前記複数の特徴を決定すること
を含む、ことと、
前記抽出された特徴のサブセットを選択することと、
前記抽出された特徴の前記サブセットを分類機アーキテクチャにマッピングすることであって、前記マッピングすることは、
前記抽出された特徴の前記サブセットを以前記憶されたデータセットと比較するために第1のレベルモデルを使用すること、
前記抽出された特徴の前記サブセットと前記以前記憶されたデータセットとの前記比較に基づいて予備分類を同定すること、
前記第1のレベルモデルを使用して前記予備分類が正しい確率値を算出すること、及び
前記確率値が閾値以上であるとき、前記予備分類に基づいて前記分類を決定すること
を含む、ことと
を含む方法を実装するための前記プロセッサによって実行可能なコードを含む、システム。
(項目20)
前記システムは、デジタル顕微鏡カメラを使用する、項目19に記載のシステム。
(項目21)
抽出された特徴のサブセットを分類機アーキテクチャにマッピングすることによって生体試料中の粒子の分類を決定する方法であって、前記マッピングすることは、
前記抽出された特徴のサブセットを以前記憶されたデータセットと比較するために第1のレベルの機械学習モデルを使用することであって、前記抽出された特徴は画像から抽出される、使用することと、
前記第1のレベルの機械学習モデルを使用して確率値を算出することと、
前記確率値を所定の比較表と比較することと、
前記確率値が閾値以上である場合、粒子分類を決定することと、
前記確率値が前記閾値未満である場合、第2のレベルの機械学習モデルを使用することと、
前記第2のレベルの機械学習モデルを使用して粒子カテゴリに関する分類性能に従って昇順にソートされた値のリストを作成することと、
第2のレベルのスコアを作成するために前記確率値と前記ソートされた値のリストとを組み合わせることと、
粒子分類を決定するために前記第2のレベルのスコアを使用することと、を含む、方法。
(項目22)
生体試料中の粒子の分類を決定する方法であって、前記方法は、
前記粒子の画像を取得することと、
前記画像の画素の内容及び位置に基づいて前記画像から複数の特徴を抽出することであって、前記抽出することは、
第1のマスクを前記画像に適用すること、
前記第1のマスクを適用することに基づいて前記画像から第1の組の画素を取得すること、及び
前記第1の組の画素から前記複数の特徴を決定すること
を含む、ことと、
前記抽出された特徴のサブセットを選択することと、
前記抽出された特徴の前記サブセットを分類機アーキテクチャにマッピングすることであって、前記マッピングすることは、
前記抽出された特徴の前記サブセットを以前記憶されたデータセットと比較するために第1のレベルモデルを使用すること、
前記抽出された特徴の前記サブセットと前記以前記憶されたデータセットとの前記比較に基づいて予備分類を同定すること、
前記第1のレベルモデルを使用して前記予備分類が正しい確率値を算出すること、及び
前記確率値が閾値以上であるとき、前記予備分類に基づいて前記分類を決定すること
を含む、ことと
を含む、方法。
(項目23)
前記抽出することは、第2の組の画素を取得するために第2のマスクを前記画像に適用することを含む、項目22に記載の方法。
(項目24)
前記第1のマスク及び前記第2のマスクは、円形又はリング形状である、項目23に記載の方法。
(項目25)
前記異なるマスクの適用は、異なる画素を明らかにする、項目23又は24に記載の方法。
(項目26)
前記第1のマスク及び前記第2のマスクは、所定の順序で適用される、項目23~25のいずれか一項に記載の方法。
(項目27)
前記抽出することは、前記第1の組の画素を群へとクラスタ化することを含む、項目22~26のいずれか一項に記載の方法。
(項目28)
前記抽出することは、前記クラスタ化された画素群からカラーパレットを作成することを含む、項目27に記載の方法。
(項目29)
前記抽出することは、前記カラーパレットに部分的に基づいて前記画像のラベルを決定することを含む、項目28に記載の方法。
(項目30)
前記抽出することは、前記画像をマスクサイズに正規化することを含む、項目22~29のいずれか一項に記載の方法。
(項目31)
前記抽出することは、前記第1のマスクを単位大きさに正規化することを含む、項目22~30のいずれか一項に記載の方法。
(項目32)
前記抽出することは、赤色緑色青色(RGB)色相彩度値(HSV)、色相彩度明度(HSL)、又は色相彩度明度(HSB)を含む選択された色空間を使用することを含む、項目22~31のいずれか一項に記載の方法。
(項目33)
前記抽出された特徴の前記選択されたサブセットは、訓練特徴、検証特徴、又はテスト特徴を含む、項目22~32のいずれか一項に記載の方法。
(項目34)
前記抽出された特徴の前記サブセットは、カスケード分類機アーキテクチャにマッピングされる、項目22~33のいずれか一項に記載の方法。
(項目35)
前記第1のレベルモデルは、機械学習モデルである、項目22~34のいずれか一項に記載の方法。
(項目36)
前記マッピングすることは、
前記確率値が前記閾値未満であるとき、前記粒子分類を決定するために第2のレベルモデルを使用することを更に含む、項目22~35のいずれか一項に記載の方法。
(項目37)
前記第2のレベルモデルは、機械学習モデルである、項目36に記載の方法。
(項目38)
前記第2のレベルモデルを使用することは、
前記確率値を前記第2のレベルモデルで受信することと、
粒子カテゴリに関する分類性能に従ってソートされた値のリストを作成することと、
第2のレベルの確率値を作成するために前記確率値と前記ソートされたリストとを組み合わせることと、
前記粒子分類を決定するために前記第1のレベルの確率値と前記第2のレベルの確率値とを使用することと
を更に含む、項目36又は37に記載の方法。
(項目39)
前記粒子は、好中球、リンパ球、単球、好酸球、好塩基球、未成熟白血球、網状赤血球、有核赤血球、赤血球、上皮細胞、細菌、酵母、又は寄生虫からなる群から選択されるメンバーを含む、項目22~38のいずれか一項に記載の方法。
(項目40)
前記コンピュータ可読記憶媒体は、項目1~18のいずれか1つの方法を実装するための前記プロセッサによって実行可能なコードを含む、項目19又は20に記載のシステム。
(項目41)
1つ以上のプロセッサによって実行可能なプログラム命令を含む非一時的コンピュータ可読記憶媒体であって、前記プログラム命令は、実行されると、前記1つ以上のプロセッサに動作を遂行させ、前記動作は、項目1~18のいずれか一項に記載の方法を含む、非一時的コンピュータ可読記憶媒体。
【図面の簡単な説明】
【0024】
図1A】本明細書で開示される実施形態を実装するために使用され得る例示的なシステム及びアーキテクチャのブロック図を図示する。
図1B】本明細書で開示される実施形態を実装するために使用され得る例示的なシステム及びアーキテクチャのブロック図を図示する。
【0025】
図2】本発明のいくつかの実施形態による例示的な血球画像を図示する。
【0026】
図3】本発明のいくつかの実施形態による例示的な一組の二値同心リングマスクを図示する。
【0027】
図4】本発明のいくつかの実施形態による単一の二値リングマスクのための例示的なクラスタ化を図示する。
【0028】
図5】本発明のいくつかの実施形態による白血球型塩基球及び好酸球の例示的な特徴ヒストグラムを図示する。
【0029】
図6A】本発明のいくつかの実施形態による細胞分類システムの例示的なアーキテクチャモデルを図示する。
図6B】本発明のいくつかの実施形態による細胞分類システムの例示的なアーキテクチャモデルを図示する。
【0030】
図7】本発明のいくつかの実施形態による生体試料中の粒子の分類を決定する方法の一例を図示するフローチャートである。
【0031】
図8】本発明のいくつかの実施形態による血液粒子画像、血液粒子カテゴリ、及び抽出した特徴の態様を図示する。
【0032】
図9】本発明のいくつかの実施形態によるカスケードモデル分類機アーキテクチャを図示する。
【0033】
図10】本発明の実施形態による分類機Cljのための提案された内部構造を図示する。
【0034】
図11】本発明の実施形態による2つの特徴F及びFが付与された例示的なレベル1分類機を図示する。
【0035】
図12】本発明の実施形態によるレベル1分類機出力とレベル2分類機出力の間の例示的な遷移関数を例示する。
【発明を実施するための形態】
【0036】
以下の記載においては、説明の適用上、具体的詳細が本発明の実施形態の完全な理解を提供するために示される。しかしながら、様々な実施形態は、これらの具体的詳細なしに実施されてもよいことが明らかである。例えば、回路、システム、アルゴリズム、構造、技術、ネットワーク、プロセス、及び他のコンポーネントは、非必要な詳細さで実施形態を不明瞭にしないために、ブロック図の構成要素として示されてもよい。
【0037】
本発明の実施形態は、個別に図に示されるよりも多い又は少ない構成要素を含んでもよいことが理解されるべきである。図面及び説明は、限定することを意図していない。
【0038】
なお、個々の実施形態は、流れ図、フロー図、データフロー図、構造図、又はブロック図として記述されていてもよい。フローチャートは、動作を逐次プロセスとして記述してもよいが、動作の多くは、並行して又は同時に遂行してもよい。加えて、操作順で再配置にしてもよい。プロセスは、その動作が完了したとき終了するが、図に含まれていない追加のステップを有し得る。プロセスは、方法、機能、手順、サブルーチン、及びサブプログラムなどに対応し得る。プロセスが機能に対応するとき、その終了は、呼び出し機能又は主要機能への機能の戻りに対応する。
【0039】
本開示は、生体試料中の細胞及び/又は粒子のリアルタイム分類に好適な、自動化された画像ベースの特徴抽出及び分類アーキテクチャを含むシステムに関する。
【0040】
自動化された粒子分類システムは、生体試料を分析して試料に含まれる1タイプ以上の細胞及び/又は粒子の組成及び/又は数を決定するために使用されてもよい。これらのシステムは、一般的に血液分析装置及びフローサイトメーターを含む。例えば、末梢血中の細胞集団の分析は、好中球、リンパ球、単核球、好酸球、及び好塩基球を含む白血球(white blood cell、WBC)の5つの主要なサブタイプを検出及び列挙する能力を含む。例えば、末梢血液中の主な赤血球(red blood cell、RBC)は、網状赤血球及び有核赤血球である。これらの細胞集団は、異なる形状及び機能を有し、試料中のこれらの集団の数及び存在は、病理学的状態、細胞成熟度、及び他の要因によって異なってもよい。細胞分類システムは、1つ以上の器具によって監視される小開口又は測定領域を細胞が通過するときに生成される信号を収集及び分析することによって様々なタイプの細胞を弁別することができる。自動化された細胞分類システムの有利な態様としては、複数のタイプの細胞をそれらのアーキテクチャに基づいて同定し、また細胞プロセス又は画像取得プロセスに起因するアーチファクト(例えば、古い又は損傷した細胞を描いた画像及びピンぼけの画像)を同定する能力が挙げられる。
血液学
【0041】
血球分析は、患者の健康状態の概観を提供するために最も一般的に行われる医療検査の1つである。血液試料は、患者の体内から抜き出し、凝固を防止する抗凝固剤を含有した試験管に格納することができる。全血試料は、通常、赤血球(red blood cells、erythrocytes)、白血球(white blood cells、leukocytes)、及び血小板(platelets、thrombocytes)を含む、3つの主要な分類の血球を含む。各分類は、下位分類の構成物に更に分けることができる。例えば、白血球(WBC)の5つの主要なタイプ又は下位分類は、異なる形状及び機能を有する。白血球は、好中球、リンパ球、単球、好酸球、及び好塩基球を含み得る。また、赤血球タイプの下位分類も存在する。試料内の粒子の外観は、病態、細胞成熟度、及び他の要因によって異なり得る。赤血球の下位分類は、網赤血球及び有核赤血球を含み得る。
【0042】
いくつかの実施形態では、粒子は、好中球、リンパ球、単球、好酸球、好塩基球、血小板、網赤血球、有核赤血球(RBC)、芽球、前骨髄球、骨髄球、後骨髄球、赤血球(RBC)、血小板、細胞、細菌、粒子状物質、細胞凝集、又は細胞破片若しくは成分の少なくとも1つから選択される。
【0043】
明示的に別段の定めをした場合を除き、本開示でなされる「粒子」又は「複数の粒子」への言及は、流体中に分散された任意の離散した、又は形成された物体を包含することを理解する。本明細書で用いるとき、「粒子」は、生体液中の全ての測定可能で検出可能な(例えば、画像及び/又は他の測定可能パラメータにより)構成要素を含むことができる。粒子は、任意の物質、任意の形状、及び任意のサイズのものである。特定の実施形態では、粒子は、細胞を含むことができる。粒子の例は、限定するものではないが、血球、胎児細胞、上皮細胞、幹細胞、腫瘍細胞を含む細胞、又は細菌、寄生虫、又は先述のいずれかの破片若しくは生体液中の別の破片を含む。血球は、潜在的に生体液中に存在する任意の正常又は異常、成熟又は未熟細胞を含む任意の血球、例えば赤血球(RBC)、白血球(WBC)、血小板(PLT)、及び他の細胞であってもよい。構成物は、更に未熟又は異常細胞を含む。未熟WBCとしては、後骨髄球、骨髄球、前骨髄球、及び芽球が挙げられる。成熟RBCに加えて、RBCの構成物としては、有核RBC(NRBC)及び網赤血球が挙げられる。PLTは、「巨大」PLT及びPLT凝集を含んでもよい。本明細書を通して、画像は細胞又は粒子の画像であるものとして記載される。多くの場合、細胞として参照されるが、画像は任意の粒子のものであり得る。
【0044】
例示的な粒子は、例えば球状粒子及び非球状粒子を含む、生体液試料中で形成された要素を含み得る。特定の実施形態では、粒子は、非球状成分を含んでもよい。いくつかの実施形態では、血小板、網赤血球、有核RBC、並びに好中球、リンパ球、単球、好酸球、好塩基球を含むWBC、及び、芽球、前骨髄球、骨髄球又は後骨髄球を含む未熟WBCは、粒子として計数されて分析される。
尿検査
【0045】
例示的な尿粒子は、尿沈渣粒子を含み得る。例示的な尿沈渣粒子は、赤血球(RBC)、変形赤血球、白血球(WBC)、好中球、リンパ球、食細胞、好酸球、好塩基球、扁平上皮細胞、移行上皮細胞、デコイ細胞、腎尿細管上皮細胞、円柱、結晶、細菌、酵母、寄生虫、卵円形脂肪体、脂肪小滴、精子、粘液、トリコモナス、細胞凝集及び細胞破片を含み得る。例示的な細胞は、赤血球、白血球及び上皮を含み得る。例示的な円柱は、無細胞色素円柱、分類不能円柱(例えば、顆粒円柱)を含み得る。例示的な無細胞円柱は、例えば、ろう様円柱、幅広円柱、脂肪円柱及び結晶円柱を含み得る。例示的な細胞性円柱は、例えば、RBC円柱、WBC円柱及び細胞性円柱を含み得る。例示的な結晶は、例えば、シュウ酸カルシウム、トリプルリン酸、カルシウムリン酸、尿酸、炭酸カルシウム、ロイシン、シスチン、チロシン及び無晶性結晶を含み得る。例示的な非扁平上皮細胞は、例えば、腎上皮及び移行上皮を含み得る。例示的な酵母は、例えば、出芽酵母及び仮性菌糸を有する酵母を含み得る。例示的な尿沈渣粒子はまた、RBC凝集、脂肪、卵円形脂肪体及びトリコモナスを含み得る。
【0046】
システムは、例えば、赤血球(RBC)、変形赤血球、白血球(WBC)、好中球、リンパ球、食細胞、好酸球、好塩基球、扁平上皮細胞、移行上皮細胞、デコイ細胞、腎尿細管上皮細胞、円柱、結晶、細菌、酵母、寄生虫、卵円形脂肪体、脂肪小滴、精子、粘液、トリコモナス、細胞凝集及び細胞破片の検出と定量化のような生体液中の粒子の特徴付け、分類と下位分類、計数と分析に有用であり得る。
【0047】
異なる分類又はカテゴリへの細胞及び/又は粒子画像の割り振りは、複雑な計算タスクであり得る。いくらかの分析及び比較は、自動化されたシステムを通して行うことができるが、自動化が適切若しくは効果的に機能するように細胞及び/又は粒子の全ての画像が十分に鮮明であるとは限らず、又は既知の特徴及び/若しくは特性を有する細胞及び/若しくは粒子の画像に十分に類似しているとは限らない。抽出された特徴は、異なる程度の計算量を有し得る。多くの場合、細胞及び/又は粒子は、例えば色ベースの特徴を使用して、抽出された特徴の少ない数又は複雑度を用いて分類されてもよい。典型的には、色ベースの特徴は高速な計算タスクである一方、テクスチャ及び形状の特徴は低速な計算タスクであり、リアルタイム分類に対して制約を課し得る。リアルタイム分析の制約は、取得システムが予め定義されたスループット要件を満たすために、粒子のストリームの処理が一定の予想時間内に終わる必要があり得ることに関係する。しかしながら、一定の疾患状態又はシステム関連の変化(汚れ、フォーカス、細胞老化、その他)の下では、適切な細胞及び/又は粒子カテゴリを正しく同定するために、より高い複雑度を有する追加の特徴、したがってより大きな計算タスクを必要とする特徴が必要とされることがある。同定を必要とする全ての粒子に対して高い複雑度の特徴を使用することは、時間及び/又は計算上の制約のため、必ずしも常に実行可能ではない。本明細書の実施形態は、細胞及び/又は粒子、例えば血球及び/又は粒子のリアルタイム分類に好適であり得る分類アーキテクチャを提供する。
【0048】
より具体的には、実施形態は、医療診断ツールとして使用され得、細胞及び/又は粒子の同定及び定量を向上させ得るシステムを提供し得る。開示される画像ベースの分類システムは、画像取得、特徴抽出、特徴選択、及びカスケード分類機アーキテクチャを使用した細胞又は粒子の分類の決定、という4つの主要なステップを含む。生体試料内に含まれる細胞及び/又は粒子を分析するために、細胞及び/又は粒子の画像がまず収集又は取得されてもよい。次いでシステムは、これらの画像を使用して、「特徴」と呼ばれる特定の数値若しくはカテゴリ値又は特性を個々の画像から抽出し得る。次いでシステムは、抽出された特徴の分析において、階層的又はカスケード型分類アーキテクチャを使用し得る。様々な実施形態によれば、決定ステップで使用されるカスケード分類機アーキテクチャは、2つのレベルの分析を含み得る。第1のレベルモデルの結果が確定的ではない場合、生体試料(例えば血液試料)の抽出された特徴のうちの選択したものに対して、第2のレベルの分析を遂行してもよい。
【0049】
例示的なアーキテクチャにおいて、生体試料の一組の選択された抽出された特徴は、既知の特性を有する細胞又は粒子から抽出された一組の選択された特徴と比較され得る。多くの場合、比較(「第1のレベルモデル」)は、細胞又は粒子の正確な同定を提供する。少数のケースにおいて、細胞又は粒子の分類は、細胞又は粒子を分類する更なるステップ(「第2のレベルモデル」)を必要とする。このステップは、第1のレベルの数値又はカテゴリ値を第2のレベルモデルと組み合わせて使用することを含んでもよい。この2レベル式アーキテクチャは、第1のレベルの後又は第2のレベルの後のいずれかに、システムが各画像を分類又はカテゴリに正確に割り振ることを可能にする。
画像取得
【0050】
いくつかの実施形態では、システムは、粒子の画像を収集又は取得するための分析装置を含み得る。いくつかの実施形態では、分析装置は、視覚的分析装置であってよい。一態様では、本開示は、高光学解像度撮像装置が画像を取り込むビューポートを有するフローセルに関心粒子を含む液体試料を流す、自動化された粒子イメージングシステムに関する。いくつかの態様では、高光学解像度撮像装置は、デジタルカメラなどのカメラを含む。一態様では、高光学解像度撮像装置は、対物レンズを含む。高レベルの解像度を有する画像の取り込みを容易にする例示的な画像取得技術は、2014年3月17日に出願された特許出願第14/216,811号、名称「ANALYSIS OF PARTICLES IN FLUID SAMPLES」及び2015年9月11日に出願された特許出願第14/775,448号、名称「HEMATOLOGY SYSTEMS AND METHODS」を含む他の出願に記載されており、その全体が参照により組み込まれる。画像取得の追加の態様としては、ノイズを除去及び/又は照明の変化を補償するための画像の前処理が挙げられるが、限定されない。
【0051】
図1Aは、本発明の実施形態による自動化された細胞又は粒子認識を遂行するために使用可能な例示的なシステム100のブロック図を図示する。システム100は、コンピューティングデバイス110及び分析装置115を含む様々な構成要素を含んでもよい。分析装置115は、例えば、2015年9月11日に出願された特許出願第14/775,448号、名称「HEMATOLOGY SYSTEMS AND METHODS」に詳細に記載されているように、体液細胞の画像を取り込む体液システムを通して、生体粒子及び/又は細胞の画像を収集し得る。システム100は、カスケード分類機アーキテクチャを介して特徴抽出、特徴選択、及び分類を遂行し、この分析において決定された情報を使用して細胞及び/又は粒子を分類することができる。分類のための画像は、記憶装置180に記憶されてもよく、かつ/又は外部装置又はデータベースからコンピュータによって受信されてもよい。例えば、分析装置115は、画像を収集してそれらを記憶装置180に記憶してもよい。基準画像を、比較のために、分析装置115を通じて、かつ/又は他の取り込み方法を通じて収集してもよく、記憶装置180に記憶してもよい。システム100は、例えば、デスクトップコンピュータ、ラップトップコンピュータ、タブレット、eリーダー、スマートフォン若しくはモバイルデバイス、スマートウォッチ、携帯情報端末(personal data assistant、PDA)、又は他の電子機器であり得るコンピュ
ーティングデバイス110を含み得る。コンピューティングデバイス110は、クラウドコンピューティング環境内にあってもよい。コンピューティングデバイス110は、ユーザにより利用されてもよい。コンピューティングデバイス110は、バス130を介して他のハードウェアとインターフェース接続されたプロセッサ120を含み得る。システム100は、好ましくは、コンピューティングデバイス110のメモリ140上に記憶された1つ以上のソフトウェアプログラム又は命令145を含む。命令145は、図1Bに図示するカスケード分類機アーキテクチャ185などのカスケード分類機アーキテクチャを遂行するように動作可能であり得る。ソフトウェアプログラムは、システム100の機械可読メモリ140内に記憶されてもよい。「メモリ」という用語は、本明細書において、インストール媒体、例えばCD-ROM若しくはフロッピー(登録商標)ディスク、DRAM、SRAM、EDO RAM、Rambus RAMなどのコンピュータシステムメモリ、又は磁気媒体、例えばハードドライブ、若しくは光記憶装置などの不揮発性メモリ、を含む様々なタイプのメモリを含むことを意図する。メモリ140は、他のタイプのメモリ又はそれらの組み合わせも含んでもよい。メモリ140は、コンピューティングデバイス110の動作を構成するプログラムコンポーネント(例えば、命令145及び/又はカスケード分類機アーキテクチャ185)を具現化し得る。いくつかの例では、コンピューティングデバイス110は、入力/出力(「I/O」)インターフェース構成要素150(例えば、ディスプレイ160、キーボード170、モニタ165、又はキーボード170、若しくはマウスとのインターフェース接続用)、及び記憶装置180を含み得る。記憶装置180は、カメラ入力からの試料画像及び分析用の基準画像を記憶してもよい。いくつかの実施形態では、基準画像は、カスケード分類機アーキテクチャのニューラルネットワーク実装のための訓練データとして使用され得る。記憶装置180は、例えば、Microsoft(登録商標)SQL Server(登録商標)データベース、Oracle(登録商標)データベース、又はMicrosoft(登録商標)Excel(登録商標)スプレッドシートを含む、任意の好適なデータベースであり得る。
【0052】
コンピューティングデバイス110は、ネットワーク構成要素190を更に含み得る。ネットワーク構成要素190は、ネットワーク接続を容易にする任意の構成要素のうちの1つ以上を表し得る。いくつかの例では、ネットワーク構成要素190は、無線接続を容易にし得、IEEE802.11、Bluetooth(登録商標)のような無線インターフェース、又は携帯電話ネットワークにアクセスするための無線インターフェース(例えば、CDMA、GSM(登録商標)、UMTS、若しくは他のモバイル通信ネットワークにアクセスするためのトランシーバ/アンテナ)を含み得る。別の例では、ネットワーク構成要素190は、有線であり得、Ethernet(登録商標)、USB、又はIEEE1394のようなインターフェースを含み得る。
また、記憶媒体180は、プログラムが実行され得る第1のコンピュータに位置してもよく、又はネットワーク190を通じて第1のコンピュータに接続する第2の異なるコンピュータに位置してもよい。ネットワーク190の例では、第2のコンピュータは、プログラム命令145を実行のために第1のコンピュータに提供してもよい。図1Aは、単一のプロセッサ120を有する単一のコンピューティングデバイス110を示しているが、システム100は、任意の数のコンピューティングデバイス110及び任意の数のプロセッサ120を含み得る。例えば、複数のコンピューティングデバイス110又は複数のプロセッサ120が、有線又は無線ネットワーク(例えば、広域ネットワーク、ローカルエリアネットワーク、又はインターネット)上に分散され得る。複数のコンピューティングデバイス110又は複数のプロセッサ120は、本開示の任意のステップを個別に、又は互いに連携して遂行し得る。
【0053】
図1Bは、例示的なカスケード分類機アーキテクチャ185を図示している。カスケード分類機アーキテクチャは、2つのレベルモデルを含み得、2つのレベルの分析を遂行し得る。一例では、第1のレベルモデル187が細胞若しくは粒子の正確な同定を提供し得るか、又はカスケード分類機アーキテクチャ185が第2のレベルのモデル189を更に使用して細胞又は粒子の正確な同定を提供し得る。第2のレベルモデル189は、第1のレベルモデル187の数値又はカテゴリ値を第2のレベルモデル189と組み合わせて使用することを含んでもよい。第1のレベルモデル187の出力が不明瞭又は不確定である場合、第2のレベルモデル189を使用してもよい。カスケード分類機アーキテクチャ185での分析用の画像は、記憶装置180から来てもよく、又は分析装置115から第1のレベルモデル187に直接入力されてもよい。必要に応じて、同じものが第2のレベルモデルに入力されてもよい。第1のレベルモデル187の出力は、第2のレベルモデル189に入力されてもよい。
【0054】
図2は、本明細書で開示されるシステム及び方法で使用され得る試料血球画像200~270を図示する。本明細書で用いるとき、nは、対応するカテゴリの各粒子を同定する対応するターゲットラベルTを有する第1の列205に図示される血液粒子画像Pのデータセットを指す。本明細書で用いるとき、mは、画像Pが割り振られ得る第2の列215に図示される異なる血液粒子カテゴリC(すなわち、NRBC、リンパ球、RBC、好中球など)を指し、1≦i≦nである。本明細書で用いるとき、文字「k」は、「m」の利用可能なカテゴリの集合に属する単一のカテゴリを指すために使用される。
特徴抽出
【0055】
特徴抽出は、一組のカテゴリの中で分析及び識別するために必要とされるデータ量を低減することを意図する。このプロセスは、大量の情報を、後で決定を下すために使用され得る値として解釈又は要約し得る。抽出された特徴は、データの特定の特性に相関する数値を含み得る。例えば、画像中において、全ての色をカスケード分類機アーキテクチャへの入力として使用する代わりに、全ての色に沿った平均及び標準偏差を、特徴として抽出してもよい。画像処理において、特徴抽出は、異なる程度の計算量を有し得る。高度に複雑な抽出手順は、関心領域を分離し、依然として意味のある情報を抽出しながらその区域における長い計算動作を防止するための画像のセグメント化を伴い得る。簡単な抽出手順は、面積、周囲長、真円度などを含むがこれらに限定されない形状特徴を含み得る。抽出手順は、縁部を検出するための勾配プロファイルを含み得る。抽出プロファイルは、色強度、ヒストグラム色平均、モード、標準偏差、又は色閾値化を伴ってもよい。抽出手順は、ヒストグラムの差、又はチャネル赤色とチャネル緑色、チャネル赤色とチャネル青色、及び/又はチャネル緑色とチャネル青色の間の比率を意味し得る。
【0056】
いくつかの例では、画像は、数千個の情報(例えば、データ点)を有してもよく、これらは特徴として抽出されてもよい。いくつかの例では、画像は、1つが赤色、1つが緑色、及び1つが青色の、3つの着色画像から構成されてもよい。
【0057】
生体試料中の細胞又は粒子の分類を決定するためのシステム100において、本明細書に記載のように、画像の特徴は、抽出されてコンピューティングデバイスのメモリ140に記憶されてもよく、ゆえに元画像は、分析装置115内に長期間記憶される必要はない。したがって、細胞又は粒子タイプの決定が行われるとき、画像は、を抽出された特徴のみによって表され得る。本明細書に記載の特徴抽出方法によれば、色空間量子化方法を使用して一組の固有の色特徴を画像から抽出してもよい。この方法は、計算の大部分を非リアルタイムで行ってもよく、オフライン段階としても知られている。オフライン段階では、画像は、画像が取得されたときよりも後の時間に記憶され分析され得る。これは、オフライン処理は計算タスクエネルギーを使用せず、より高速なオンライン処理時間をもたらすので、他の特徴抽出方法よりも有利である。オフライン処理は時間によって大きく制約されないので、計算的に高価な複雑な数学的変換の計算及び抽出は、より良好な識別特徴をもたらし得る。いくつかの例では、特徴抽出は、一部又は全部がオフラインで行われ得る。いくつかの例では、特徴抽出は、一部又は全部がオンラインで行われ得る。
【0058】
特徴抽出方法は、画像内の色の位置及び値に基づいて「色特徴署名」を作成し得る。色特徴署名は、パレット色の各々に属する画素の数を累積することによって得られたヒストグラムを含み得る。各生体粒子の色特徴署名を抽出するために、異なる生体粒子タイプの画像の選択された領域内の最も代表的な色に対応する色のパレットを構築してもよい。
いくつかの例では、特徴抽出は、一組の画素を群へとクラスタ化することを含み得る。各画素は、パレット内の最も近い色に割り振ってもよい。得られた色特徴シグネチャは、パレット内の各色の振幅値を有するヒストグラムであってもよい。
【0059】
一実施形態では、位置及び色情報の両方を組み込むために、色空間量子化手法は、個々の同心円リングから構成される一組のR二値マスクを作成してもよい。図3は、R360の一例を示す。同心円リングマスク300~350を使用するとき、細胞の得られる画像の平面投影は、一般的に円形になる。リングマスク300~350は等方性であってもよく、したがって、リングを使用して導出された特徴署名は回転不変であってもよい。撮像システムでは、撮像される細胞及び/又は粒子への距離が固定である場合、スケール不変性は、持ち前のものであり得る。各リングマスク100~150の重心は、動的であってもよく、強度又はエントロピーなどの画像内の特徴によって決定されてもよい。最も単純な場合、位置は、画像100の中心として固定され、定義されてもよい。これにより、特徴署名の翻訳不変が可能となる。
【0060】
R360におけるリングマスク300~350の幅及び数rは、最終分類性能に基づいてヒューリスティックに選択されてもよい。各リングマスク300~350は、元細胞画像から画素をフィルタリングするために使用してもよい。セット360中のマスクは任意の順序で適用されてもよい。セット360についてマスクの順序が選択されると、同じ所定の順序が使用され画像分析に適用され得る。セット360中のマスクは、必ずしも画像の隣接する領域を明らかにしないが、画像の隣接する区域を明らかにすることがある。リングマスク300~350を細胞画像に適用するために、細胞画像は、まずリングマスク300~350の大きさに正規化され得る。次いで、各リングマスク300~350に属する画素が、抽出されてよく、選択された色空間(すなわち、赤色緑色青色(「RGB」)色相彩度値(「HSV」)、色相彩度明度(「HSL」)など)で分析される。
【0061】
一実施形態では、RGB色空間は、マスクされた細胞画像の分析空間として選択されてもよい。このような実施形態では、一組のリングマスク300~350を与えられたカラーパレットを抽出するプロセスは、マスクの細胞画像への適用を可能にするために、全ての細胞画像PをリングマスクRのサイズに正規化することによって始まる。この正規化において、PCjは、全ての正規化された細胞画像Pの集合を表し、訓練セット中の対応するターゲットラベルTは、血球カテゴリC、1≦j≦mに等しい。
【0062】
各血球カテゴリCについて、各PCj中の細胞画像の可変カウントによるバイアスを回避するために、細胞画像のランダムなサブセットがPCj
【数1】

において選択され得、式中、サブセットnγのサイズは、全PCjにわたって最小数の細胞画像に等しい。
【0063】
各リングマスクRについて、1≦l≦rである。
γCj中の全ての細胞をリングマスクRでマスクする。
マスクされた細胞画像内の保持された画素から一組のRGB画素Vを形成する。
【0064】
各リングマスクRについて、1≦l≦rである。
中の各組の画素Vについて
をhグループにクラスタ化すると、一組のhクラスタセンタ
【数2】

が得られる
リングカラーパレットを作成する
【数3】

最終パレットを作成するPLT={PLT,PLT,...,PLT
【0065】
図4は、HSV色空間における所与のリングマスクに対するクラスタ化処理の例を示し、チャート内のX 400はクラスタの中心を表し、各色は細胞カテゴリに属する画素に関連付けられ、s軸410は彩度成分を表し、h軸420は色相成分を表し、v軸430は明度又は明度を表す。所与のカテゴリに属する画素は更に、色などの他の視覚的合図を使用することによって同定されてもよい。各細胞カテゴリは、訓練セット中の異なる数の画像(例えば、基準画像)によって表され得る。訓練セット中により多く含まれる特定の細胞タイプに偏るバイアスを低減するために、クラスタ化に使用される色サンプルは、細胞カテゴリにわたって等しい数の訓練セット画像から採取されてもよい。この例では、異なる細胞カテゴリ(異なる色により同定される)は色空間において他の細胞カテゴリとは異なる位置を占め、更に各細胞カテゴリは、チャート内で異なる分布を有する。
【0066】
訓練セット又は訓練特徴は、各画像について対応する色ヒストグラムを作成するように、カラーパレットに照らして評価され得る。訓練データ又は基準画像は、以前記憶されたデータセットであってもよい。図5は、白血球型塩基球500及び好酸球510についての特徴ヒストグラムの例を示している。データは、ビンと呼ばれる間隔に分割されてもよく、これは、ヒストグラム上の棒グラフで表され得る。各組のクラスタセンタ
【数4】

に対応するヒストグラム中の各ビンは、カスケード分類機アーキテクチャ185の入力特徴となり得る(例えば図6Aの入力特徴610)。オンライン(リアルタイム処理としても知られる)特徴抽出プロセス中、ルックアップテーブル又は他の索引付け方法(例えば、k次元木)を使用して色空間と生成されたパレットとの間のマッピングを記憶することによって、色量子化は加速され得る。いくつかの例では、マスク300~350内のリングが大径になるにつれて、より多くの画素が保持され、対応するヒストグラムに寄与し得る。この結果、リングマスク300~350は、異なる試料カウントを有するヒストグラムを生み出し得る。このようなヒストグラムを分流のために使用することは、これらのリングマスク300~350の試料カウントがより大きいことがあるので、
より大径を有するリングマスク300~350に向かってバイアスを導入し得る。この問題に対処するために、各ヒストグラムベクトルは単位大きさに正規化されてもよい。
【0067】
特徴正規化
【0068】
特徴ベクトル正規化スキームの例としては、L2-ノルム、L1-ノルム、クリッピングが後に続くL2-ノルム、及び平方根が後に続くL1-ノルムなどが挙げられる。アウト実施では、ヒストグラムベクトル正規化のためにL2-ノルムスキームが選択される。hを非正規化ヒストグラムベクトルとすると、正規化ヒストグラムベクトルは
【数5】

として定義され、式中、
【数6】

は、ベクトルhのL2-ノルムである。
【0069】
画像を共通のマスクサイズに正規化することは、画像間の相対的サイズ情報を破棄し得る。細胞又は粒子サイズ情報を保存するために、画像の幅が、最終特徴として特徴ベクトルに付加されてもよい。抽出された特徴は、色空間内で入手可能な抽出された情報を補完するために、勾配、エントロピーなどの追加の形態特徴で拡張されてもよい。
特徴選択
【0070】
サブセット選択又は変数選択としても知られる特徴選択は、データセット内で入手可能な全ての特徴から特徴のサブセットを選択するために機械学習で使用される方法である。これは、データセット内の全ての入手可能な特徴を使用することが計算上不可能であるために、学習アルゴリズムを適用する前に機械学習に利用される。特徴選択は、データセットが多数の特徴を含む限られたデータサンプルを含む場合に、推定及び過剰適合の問題を最小化し得る。例えば、細胞画像は数千の特徴を含み得るが、これは分析のために全て良好であるとは限らない。特定の特徴の選択は、システムの仕様に依存してもよい。特定の特徴の選択は、特定のシステム内での抽出の速度要件に依存してもよい。抽出された特徴は、訓練、検証、及び/又は試験のために使用される特徴(すなわち、「訓練特徴、検証特徴、又は試験特徴」)を含んでもよい。
分類機アーキテクチャ
【0071】
分類機アーキテクチャは、分類状態間の遷移を支配する一組の規則である。いくつかの例では、分類機は、第1のレベルモデル及び第2のレベルモデルなどの評価又は処理段階のカスケードを含み得る。例示的な実施形態では、第1のレベルモデルは、ゼロ~1の信頼水準の形で意見を生成してもよい。信頼水準が一定の閾値以上であれば、撮像された粒子又は細胞の同一性に関して判定がなされ得る。例示的な実施形態では、信頼水準が一定の閾値未満であれば、情報が第2のレベルモデルに送信されてもよい。第2のレベルモデルは、第1のレベルモデルからの信頼水準と組み合わせて、いくつかの場合には決定木のランダムフォレストを含む、第1のレベルモデルより複雑なレベルの特徴を使用して、撮像された粒子又は細胞の同一性に関する判定を行ってもよい。第1のレベルモデル600及び第2のレベルモデル640を含む例示的なカスケード分類機アーキテクチャ650が、図6Aに図示されている。
【0072】
分類機アーキテクチャ(例えば例示的なカスケード分類機アーキテクチャ650)では、抽出された特徴のサブセットが、適切な分離性手段を使用して選択されてもよく、最終データセットが構築されてもよい。例示的な表1に示すように、データは、各行が特定の細胞(及びしたがって細胞画像)に対応する表に統合されてもよく、特徴列は、対応する細胞カテゴリに関連付けられた独特の特徴に対応する。表1において、カテゴリ列は、各細胞の「真」ラベル又は分類を定義する目的を果たす。
【表1】
【0073】
例示的な実施形態では、データセットは、訓練セット、検証セット、及び試験セットの3つのサブセットに分離してもよい。訓練セットは、1人以上の人間の専門家によって分類され符号化された画像からの訓練特徴を含んでもよい。この符号化(人間参照符号化と称する)は、分類機(訓練データセット)を訓練するために利用されてもよく、かつ/又は検証データセットとして使用されてもよい。第1のレベルモデル600を訓練した後、訓練及び検証の特徴又はデータを使用して、CL第1のレベルモデル600の性能を評価してもよい。試験セットは、特徴づけられていない細胞及び/又は粒子の画像を含んでもよい。
【0074】
図6Aに図示するアーキテクチャモデル650の例示的な実施形態では、データは、その複雑度に基づいてアーキテクチャの構成要素を定義するので、中核的な役割を果たす。図6Aに図示する例示的な実施形態では、アーキテクチャは、2つのレベルの分析構成要素から構成されている。第1のレベルモデル600では、一般的な分類機を、訓練データに一致するように訓練する。第2のレベルモデル640では、特化型分類機が、第1のレベルモデルの検証中に特定された分類するのが困難な試料630についてセカンドオピニオンを提供する。
分類機アーキテクチャの第1のレベルモデル
【0075】
例示的な実施形態では、アーキテクチャの第1のレベル(L1)モデル600は、分類機モデルCLから構成され得る。分類機CLは、訓練データセットによって定義される既知の分類ラベルに一組の入力特徴610をマッピングすることができる任意の機械学習モデルであってもよい。このアーキテクチャに好適な機械学習モデルの例は、ランダムフォレスト、マルチクラスサポートベクトルマシン(Support Vector Machine、SVM)、フィードフォワードニューラルネットワーク(Feedforward Neural Network、FNN)などであり得る。
【0076】
例示的な実施形態では、ランダムフォレスト機械学習モデルが、入力特徴ベクトルを訓練データセット内で定義された血球カテゴリの1つC、1≦j≦mにマッピングするために選択され得る。いくつかの例では、ランダムフォレストは、訓練セットの異なる部分上でそれぞれ訓練され得る多数の決定木から構成されるアンサンブル分類機であってよい。ランダムフォレストの最終的な分類決定は、個々の樹木の分類決定のモードであってもよい。単一決定木分類機に対するランダムフォレストの利点は、ランダムフォレスト分類決定は複数の独立して訓練された決定木の集合的応答であるので、ランダムフォレストが訓練セットに対する過剰適合に陥りにくいことである。いくつかの例では、ランダムフォレストマシンの木は、データの80%を使用して訓練され得る。いくつかの例では、ランダムフォレストは、64本の木を含む。
【0077】
いくつかの例では、ランダムフォレストは、ブートストラップ集計(バギング)技術図6Bを使用して訓練されてもよい。細胞画像P及び対応するターゲットラベルTの訓練セットが与えられると、バギング技術は、B回の繰り返しにわたって、ランダムな試料を繰り返し選択し、訓練セットを置換する。結果として得られるB試料セットは、B決定木を訓練してランダムフォレストCLを形成するために使用され得る。置換を伴うサンプリングにより、いくつかの訓練試料が試料セットにわたって繰り返され得る。このサンプリング戦略は、ブートストラップサンプリングとして知られ、偏りを増大させることなく、訓練された分類機の分散(すなわち、過剰適合への陥りやすさ)を低減する。いくつかの例では、CLの出力は、一組のスコアM={μ,μ,...,μ...,μ}625、カテゴリごと1つであり、式中、μは実数である。大きな値のμは、特定の細胞分類への帰属を示す。この文脈では、スコアμが高いほど、入力特徴610が細胞カテゴリjに属する可能性が高く、この評価に関する不確実性が低い。したがって、入力特徴610の予備カテゴリラベルは、M625における最大値μに対応するカテゴリによって当初与えられてもよい。
【0078】
第1のレベルモデル600を訓練した後、訓練データ及び検証データの両方を使用して、CL第1のレベルモデル600の性能を評価してもよい。所与の入力特徴ベクトルFについて、各入力細胞画像Pの予想される分類ラベルL及び対応するMスコアが取得され得る。この情報は、次いで、第2のレベルモデル640の設計プロセスへの入力として使用され得る。
分類機アーキテクチャの第2のレベルモデル
【0079】
一組のMスコア625を分析して、第1のレベルモデル600による正しい予備分類の確率を確立してもよい。正しい予備分類の確率は、レベル1の予想される分類ラベルL、人間の専門家の目標ラベルT、及びレベル1のMスコア625を使用することによって推定してもよい。最大μが0.5に近いMスコア625はレベル1において正しい予備分類の低確率に関連付けられるであろうと期待される。
【0080】
下記の式を適用して一対のカテゴリ{C,C}の正しい予備分類確率Prの行列を算出し得る。
一対のカテゴリ{C,C}、1≦j≦m,1≦k≦m,j≠kが与えられる。
正しい分類の確率は以下のように計算され得る。
【数7】
【0081】
低ΣPos値における結果の偏りを回避するためにΣPosの最小値を採用してもよい。表2は、所与の訓練及び検証データセットにおける2つの細胞カテゴリ(すなわち、好中球及び好酸球)のPr{Cj,Ck}の計算の例を提供する。データの全ての正の好中球及び好酸球のサブセットのサブセットが、対応する予想される分類ラベルL、そのサブセットの標的ラベルT及びMスコアと共に入手可能であると想定すると、ΣTP
os及びΣPosの行列を構築してPr{Neutrophil,Eosinophil}を見出してもよい。
【表2】
【0082】
表2の例では、確率が98%以上である場合にM個のスコア625を生成する細胞、第2のレベルモデル640を使用する必要はない。更に、0.5に近いM個のスコア625を生成する細胞は、第1のレベルモデルにおいて正しい予備分類を生成させにくい。レベル1のCL分類機600によって提供される好中球スコア=0.5及び好酸球スコア=0.4は、感度率40.6%での判定において最高レベルの不確実性を生成する。好中球及び好酸球のスコアは、ビニングのために丸められている。
【0083】
表2に例示される確率マトリクスPr{Cj,Ck}は、少なくとも2つの主目的を有する。第一に、行列を使用して、一対のカテゴリ{Cj,Ck}の不確実性の全体的な測定を確立することができる。第二に、Pr{Cj,Ck}における低又は高確率値に関連付けられた訓練及び検証データセット中の細胞画像が、カスケード分類機アーキテクチャの第2のレベルコンポーネント640を訓練するための候補として選択されてもよい。不確実性の総合的な測定を確立するために、各Pr{Cj,Ck}について全ての確率値の和を算出することが可能である。和値がより大きいカテゴリのペアは、その識別に関する不確実性がより少ない。より詳細には、各カテゴリCについて、ΣPr{Cj,Ck}値の昇順にソートされたリストDCjが、1≦k≦m,j≠kについて作成される。ソートされたリストの一番上のカテゴリは、カテゴリCに関して最低の分類性能を有するものに対応する。場合によっては、特定の組み合わせのペアが容易に識別され、訓練又は検証データセットに分類エラーが見られない場合、空のリストを有することが可能である。ソートされたリストDCjの例を表3に示す。
【表3】
【0084】
表3の例では、レベル1の分類機は、好中球と核濃縮(加齢)細胞とを識別しようとするとより高いエラー率を生成し、単球又は好酸球に対するより少ない予備分類エラーを生成する。
【0085】
Pr{Cj,Ck}及びDCjによって提供される情報を使用すると、第2のレベルモデル640を定義することが可能になる。各非空リストDCjについては、データの利用可能性に応じて第2のレベルモデル640が作成される。各特化型分類機は、Pr{Cj,Ck}に定義される低分類レートに関連するデータのみで訓練される。訓練に先立ち、選択された訓練データのサブセットを用いて新たな特徴選択プロセスが実行される。第2のレベルモデル640で使用される特徴は、第1のレベルモデル600で使用される特徴とは異なり得る。それらの複雑度及び計算コストは、ほとんどの場合、より詳細に画像を取り込むためにより高いことがある。この複雑度の増加は、第1のレベルモデル600を大部分の細胞を取り扱うことができるようにし、第2のレベルモデル640を最も困難だが希少な場合のためにとっておくことにより、相殺される。実務において、これらの場合のために利用可能なデータは十分ではないことがあり、第2のレベルモデル640の性能は第1のレベルモデル600の性能を改善しないことがあるので、全てのカテゴリが第2のレベルモデル640特化型分類機を有するわけではない。
【0086】
訓練が完了した後に、特化型第2のレベルモデル640は、最終分類ラベル670を提供するために第1のレベルモデル600の予備分類スコア625と660を組み合わせ得る第2のスコアM2,kを提供してもよい。図6Bは、例示的なカスケード分類機のアーキテクチャを示す。
【0087】
例示的なアーキテクチャでは、各レベルの2つの分類機は、第2のレベルモデル640と関連付けられたCL2,j645及び伝達関数f660から構成され得る。分類機CL2,j645は、新たな入力特徴セットを既知の分類ラベルにマッピングすることができる任意の機械学習モデルであってよい。このアーキテクチャの下で好適な機械学習モデルの例は、サポートベクトルマシン(SVM)、フィードフォワードニューラルネットワーク(FNN)、ランダムフォレストなどであり得る。分球機CL2,j645は、入力特徴ベクトルをDCj細胞カテゴリのうちのいずれかに割り振るように訓練され得る。CL2,j645の出力は、各分類機の伝達関数f660の値によって決定され得る。
【0088】
伝達関数f660は、第1のレベルモデル600からのMスコア625、Pr{Cj,Ck}確率値、及びCL2,j645出力スコアを組み合わせるという目的を果たし得る。関数f660は、第1のレベルモデル600と第2のレベルモデル640の両方からの分類スコアを考慮に入れる連続的な実数値を提供するように設計されてもよい。関数f660の高い値は、最終分類ラベル670としての予備カテゴリラベルjの確認として解釈され得る。以下は、レベル1分類機とレベル2分類機との間の伝達関数の例である。
f=(Pr{Cj,Ck}(M)×max(M1))+((1-Pr{Cj,Ck}(M))×max(M))
【0089】
本開示の方法及びシステムを更に説明するために、システム100上で遂行される例示的な方法が、図7に図表で描かれている。図7では、画像が取得され710、抽出された特徴720のサブセットが選択され750、第1のレベルモデルアーキテクチャ760にマッピングされる。第1のレベルモデルアーキテクチャ760は、確率値を所定の比較値と比較し、確率値が閾値以上である場合、細胞分類770を決定し、又は確率値が閾値未満である場合、第2のレベルモデルアーキテクチャ780を使用する。第2のレベルモデルアーキテクチャは、血球カテゴリに関する分類性能に従ってソートされた値のリストを組み合わせ作成し、確率値とソートされたリストを組み合わせて第2のレベルの確率値を作成し、第1のレベルの確率値及び第2のレベルの確率値を使用して細胞分類790を決定し得る。図7の特徴抽出720は、図3~6に描かれているか、又はそれらを参照して記載されたものを含む、本開示で上記した方法のいずれであってもよい。同様に、図7の第1の760、及び第2の780レベル分類機は、図6A~6Bに描かれているか、又はそれらを参照して記載されたものを含む、本開示で上記した分類機のいずれであってもよい。
【0090】
場合によっては、本発明のシステム及び方法の実施形態は、本明細書の他所に記載されているものなどの粒子画像分類技術を包含する。
【0091】
本開示の階層的又はカスケード型モデルの利点は、分析をより小さい特徴のサブセットに限定するという恩恵を含む。これは、より少ない特徴抽出を必要とし得、誤分類の理由をより容易に特定することを可能にし得る。本開示では、低次元(すなわち少数の入力特徴)分類機から構成されるアーキテクチャの観点から分類問題を解くことは、2D又は3Dプロットにおける特徴値の相互作用の視覚化(すなわち、描画)を潜在的に可能にし得、これはまた、分類機設計者がSVM及びFNNを含むがこれらに限定されない訓練アルゴリズムから得られる決定機能をよりよく理解し把握するのを助ける。2ステップ型アーキテクチャのシステムは、より重点的な、より高速な処理を可能にし、更にシステムが他の動作のために処理リソースを予約することを可能にする。
【0092】
本開示の別の利点は、アーキテクチャの複雑性をより良好に制御し得ることである。アーキテクチャの複雑度は、分類タスクの早期段階又は後期段階において導入されてもよい。ほとんどの場合、画像の特徴の大部分が抽出又は決定される必要はないであろう。ほとんどの場合、特徴選択は、カスケード型アーキテクチャ内で後に延期されてもよい。分類問題を正確に解くために、単一の複雑な分類機は、単一のステップ又はパスに識別特徴の全てを含めるか、又は使用しなければならないことがある。分類機モデルのその後の組み合わせ及び/又はそれらの特徴の最適な方法での使用は、したがって必然的に複雑になり得、線形ではないことがある。この手法では、大きな割合の生体粒子を分類するために、計算的に安価な(単純又は廉価とも呼ばれる)特徴が使用されてもよい。場合によっては、計算的に安価な特徴を使用することが、粒子を分類するために必要な全てであり得る。一部の生体粒子について分類誤差が存在する場合、計算的に安価な特徴を同定することができないものについては、より洗練された(複雑とも呼ばれる)特徴(これは、「より容易な」大きなグループに対して実際は有用ではない可能性がある)が選択され抽出されてもよい。一般に、これはまた、理解するのがより容易なアーキテクチャを可能にする。モデルは、複雑度を更に低減するために、分類機にわたって共通又は共有の特徴を使用してもよい。
【0093】
本開示の別の利点は、カスケード型アーキテクチャの分類機システムがモジュール式で、スケーラブルであり、事後分析するのが簡単であり得ることである。システムの出力は、個々の分類機にトレースバックされてもよい。個々の分類機は、アーキテクチャの残部を手つかずの状態に維持しながら、再訓練又はアップグレードされ得る。専用の分類モジュールを有することにより、必要に応じて、一度に1つの特定のモデルずつ、再訓練することが可能である。例えば、特定の細胞状態に関連する新たなデータを収集する場合(すなわち、核濃縮好中球)、核濃縮好中球-好酸球レベル2分類機は、アーキテクチャ内の他のモジュールに影響を及ぼすことなく、再訓練され得る。
【0094】
本開示の別の利点は、第1のレベルの分類機と第2のレベルの分類機の間の伝達関数の概念が両レベル間の滑らかな遷移を可能にすることである。これにより、特徴量の変化が少ない類似画像が処理される場合、2つのレベル間に確かな閾値が存在せず、むしろ連続的な遷移があることにより、システム応答のばらつきが低減される。
【0095】
更なる及び関連の例示的な実施形態
【0096】
血液粒子画像は、デジタル顕微鏡カメラを用いて取り込まれ、更に分類目的のために分析され得る。異なる分類又はカテゴリへの血液粒子画像の割り振りは、コストの高い計算タスクであり得る。血液粒子画像から特徴として知られている数値又はカテゴリ値を抽出することを含み得る。これらの特徴は、異なる程度の計算量を有し得る。典型的には、色ベースの特徴は計算するのが高速である一方、テクスチャ及び形状の特徴は低速であり、リアルタイム分類に対して制約を課し得る。リアルタイム分析の制約は、取得システムが予め定義されたスループット要件を満たすために、血球粒子のストリームの処理がしばしば一定の予想時間内に終わらなければならないことに関係し得る。
【0097】
多くの場合には、色ベースの特徴のような低複雑度情報を使用して、血球粒子を正確に分類することができる。しかしながら、特定の疾患状態又はシステム関連の変化(汚れ、フォーカス、細胞老化、その他)の下では、適切な細胞カテゴリを正確に同定するためにより高い複雑度を有する追加の特徴を含めることが有用であり得る。しかしながら、全ての粒子について高い複雑度の特徴を計算し適用することは、時間及び計算上の制約のため実行可能ではないことがある。
【0098】
本発明の実施形態は、血液粒子画像のリアルタイム分類に好適な分類アーキテクチャを包含する。
【0099】
血球認識は、時間に敏感な様式で、しばしば計算資源が限られたハードウェア上で実行されるセグメント化、特徴抽出、及び分類フェーズを含む複雑なタスクであり得る。したがって、システム内の各フェーズが効率的であると、助けになる。特徴抽出コンポーネントは、典型的には最も影響を受け、しばしば特徴の複雑度及び記述力と計算効率との間で妥協する。
【0100】
本発明の実施形態は、より容易かつより一般的な分類イベントのためにより単純かつ効率的な特徴の使用を活用し、より困難かつより希少なイベントのためにより複雑かつより高価な特徴の使用を活用する階層的分類モデルを用いる。また、本発明の実施形態は、分類信頼性及びイベントの難易度の確率を考慮することを含み、これにより計算効率を改善することができる。
【0101】
本発明の実施形態は、訓練された分類機の潜在的な誤分類及び欠点を故障診断及び調査する能力を拡張するモジュール性を提供する。本発明の実施形態は、入力特徴空間を可視化し、潜在的な誤分類の理由を認識することも可能にする。ここで開示されるアーキテクチャなどのカスケード型モデルは、分類問題を、より低次元の、視覚的に検査可能な入力特徴空間を有する分類機のアンサンブルへとモジュール化する利点を有する。このようなモデルでは、誤分類の理由を特定することを容易に遂行することができる。
【0102】
本開示のモジュール性の別の利点は、アンサンブル中の各低次元分類機をより簡単にすることができることである。例えば、単一の高次元分類機を用いる場合、各細胞画像は典型的には分類ラベルを生み出すように全ての入力にわたってその分類機により処理される。カスケード型モデルでは、細胞画像はアンサンブルのサブセットのみによって処理され、各分類機は比較的低い入力次元を有し、画像当たりの計算動作は少なくなる。更に、特徴計算は、その特定の特徴を必要とする細胞イベントがカスケード内の特定の分類機に到達するまで延期することができる。ほとんどの場合、特徴の大部分は計算する必要がないであろう。モデルは、分類機にわたって共有の特徴を活用することもでき、更に複雑度を低減する。
【0103】
いくつかの実施形態では、本開示は、血液粒子画像のリアルタイム分類に好適な分類アーキテクチャを提供する。典型的な画像ベースの分類は、4つの主要ステップ、画像取得、特徴抽出、特徴選択、及び分類機アーキテクチャから構成され得る。本開示の全体にわたって、技術的説明は、特徴選択及び分類機アーキテクチャに焦点を当てていることが多い。場合によっては、血液粒子画像を取り込むための画像取得が適所にあることが想定されている。異なる程度の識別特徴及び異なるレベルの計算量を有する特徴のプールが、提案されるアーキテクチャ内の個々の分類機を設計及び訓練するために利用可能であることも想定されてもよい。特徴は、画像から直接得られてもよいし、主成分分析などの追加の次元低減技術の副生成物であってもよい。
【0104】
この文脈において、特徴選択は、大きな特徴のプールから1つ以上の血液粒子間の最大の識別力を提供するものを選択するプロセスとして理解することができる。伝統的な画像ベースの分類システムでは、特徴選択及び分類機アーキテクチャ設計は、一般的に、2つの独立したプロセスである。特徴は、予め定義された性能基準に基づいて選択され、分類機アーキテクチャは、選択された特徴を用いて設計及び訓練される。しかしながら、本発明の実施例では、特徴選択プロセスとアーキテクチャとを密に結合することができる。特徴選択プロセスは、分類機アーキテクチャ設計を先導することができる。図8は、本発明の実施形態による血液粒子画像、血液粒子カテゴリ、及び抽出した特徴の態様を描いている。
【0105】
1つの単純な形態では、特徴選択プロセスは、特徴ごとに以下の方法で行うことができる。より複雑な形態では、2つ以上の特徴の組み合わせを選択してその識別力を評価することができる。特徴の組み合わせが評価されると、それらの特徴を最終的に使用する分類方法を訓練することができ、その出力を、選択された識別係数を計算するために使用することができる。
【0106】
血液カテゴリC、1≦j≦mについて
を、血液カテゴリCに一致するラベルT、1≦i≦nを有する画像Pのサブセットとして定義する
全ての特徴F、1≦s≦mについて
とデータセット内の残りの粒子画像との間の特徴Fの識別係数Ds,jを計算する。
計数Dは、受信機動作曲線(Receiver Operating Curve、ROC)の曲線下面積(Area Under the Curve、AUC)、情報エントロピー、又は他の利用可能な方法などの様々な方法によって計算することができる。
終了
終了
【0107】
最高のDs,jを有するカテゴリCを、j=1に始まる分類機Cl,1≦j≦mのラベルとして別個のリストにログ記録し、残りのカテゴリの識別において複雑度を低減するために分析から除去する。カテゴリラベルClが最終的に提案されるアーキテクチャ内の第1の分類機となる一方、Clは最後の分類機となる。全てのカテゴリCが分析されCl集合に入るまで、上記のプロセスが繰り返される。
【0108】
一般に、開示される方法の一実施形態は、カテゴリの残りからの分離性に関して各カテゴリCをランク付けすることを可能にする。このソートされたリストは、分類機のアーキテクチャ足場を定義するために使用される。最高レベルの分離性を有するカテゴリ(すなわち、残りから分類することがより容易である)が、分類機アーキテクチャによって最初に評価されることになる。識別係数Ds,j及び複雑度指数Oが、更なる分類機特徴割り振りのために記憶される。
【0109】
一実施形態では、分類機アーキテクチャは、図9に示すように、カスケードモデルに従ってもよい。入力画像が与えられると、分類機Clは、画像が分類機に関連付けられたカテゴリに属するかどうか同定しようと試みる。分類機Clの出力がそのカテゴリに対して好意的である場合、入力画像はClとして分類され、分類は終了する。そうでない場合には、全ての分類機が尽きるまで、画像はClなどに渡される。
【0110】
各分類機Clの内部構造は、複雑度と性能との間のバランスを提供するので独特である。この手法は、他の代替的手法には見られなかった。図10は、本発明の実施形態による分類機Clの提案された内部構造を描いている。一実施形態では、分類機Clは2つの分類機から構成される。レベル1分類機として知られる第1のものは、一般的に、少数の特徴(特徴空間の容易な視覚化を可能にするために通常3つ以下)を使用する単純線形分類機モデルである。このレベル1分類機の特徴選択は、上記で得られたDs,j特徴識別係数と、各特徴に関連付けられた計算量のレベルOとの重み付き組み合わせによって与えられる。高い識別係数と低い計算量を有する無相関の特徴が、レベル1のための理想的な候補である。サポートベクトルマシン、パーセプトロン、又は他の単純なモデルなどの機械学習分類機モデルを、レベル1分類機を自動的に訓練するために使用することができる。
【0111】
一実施形態では、レベル2分類機は、より複雑な分類機モデルである。一般的に、複雑な構造を有する非線形モデルに基づいて、特徴間の非顕在関係を取り扱う。このレベル2分類機の特徴選択は、上記で得られたDs,j特徴識別係数と、各特徴に関連付けられた計算量のレベルOとの重み付き組み合わせによって与えられる。高い識別係数と高い計算量を有する特徴が、レベル2のための理想的な候補である。特徴の数は一般的に4つ以上であるため、特徴空間の視覚化は、もはや可能ではない。多層フィードフォワードニューラルネットワーク、ブートストラップ、又は他の任意の複雑なモデルなどの機械学習分類機モデルを、モデルパラメータを自動的に推定するために使用することができる。
【0112】
提案されるアーキテクチャの一実施形態では、レベル1分類機が大多数の入力画像を取り扱い、このようにして計算時間を低下させ、分類フローの分析を簡略化する。レベル2分類機は、レベル1分類機の決定が不確実であり、信頼できない場合にのみ従事する。レベル1分類機の不確実性を評価し、レベル1及びレベル2分類機のClの最終結果に対する寄与を制御するために、次の手法が提案される。
【0113】
一例では、図11に示すように、2つの与えられた特徴F及びFが、カテゴリClの同定を担当する分類機1への入力として使用される。レベル1分類機モデル出力
【数8】

は、特徴F及びFと、モデル係数α,β及びバイアス項γとの線形結合として定義される。入力特徴の数が増加するにつれて、より多くの数のモデル係数が存在することになる。モデル係数は、線形識別分析、サポートベクトルマシン、又は他の任意の好適な手法などの機械学習アルゴリズムによって得ることができる。
【0114】
ゼロに等しい線形結合値(すなわち、
【数9】

)は、Clを血液粒子カテゴリの残り(すなわち、「その他」)から分離する境界の正確な位置に対応する。線形結合値
【数10】

は、
【数11】

への垂直距離に比例して増加又は減少する。図の左上隅付近のCl中の血液粒子は、境界付近のものよりも大きい正の
【数12】

値を有することになる。一方、図の右下隅付近の「その他」領域内の血中粒子は、大きい負の
【数13】

値を有することになる。
【0115】
上記のように、
【数14】

により定義される線は、Clを残りの血液粒子カテゴリから分離する境界に対応するが、それに加えて、これは、分類機決定に関する不確実性が最高レベルにある点に対応する。特徴F値及びF値の小さな変化は、この区域の周囲で何らかの形で分類機決定を変更し得る。レベル1分類機モデル、特徴値F及びF、並びに対応する目標ラベルT,1≦i≦nを使用すると、境界
【数15】

の周囲の不確実性領域を画定して、分類機から高度に不確実な応答を生み出す特徴値F及びFの組み合わせを同定することが可能である。
【0116】
この例では、不確実性領域は、境界の周囲にオフセット
【数16】

を設定することによって画定することができる。最も単純な実施では、オフセットは同じ値を有し得る。オフセットの実際の値は、レベル1分類機の任意の性能メトリックを設定することによって定義することができる。例えば、非不確実性領域では高い特異度を有することが望ましいことがあるが、これは、不確定領域の外側で血液粒子が検出された場合、血液粒子が正しく分類されるという高い信頼性があることを意味する。
【0117】
一実施形態では、血液粒子の特徴の特定の組み合わせ(例ではF及びF)がレベル1不確実性領域の内側にあるとき、レベル2分類機のみが呼び出され、それに対応する入力特徴(一般的にレベル1特徴とは異なる)が計算される。この独特の設計は、分類システム全体が、分類するのが容易な血液粒子に対しては単純かつ高速であるが、必要に応じてより複雑なシナリオを取り扱うのに十分に柔軟であり続けることを可能にする。
【0118】
一実施形態では、レベル2不確定性領域を作成するための同じ手法をレベル2分類機に適用して、そのオフセットを画定することができる。オフセット
【数17】

が決定されると、一対の遷移関数
【数18】

図12に描かれるように定義することができ、式中、
【数19】

である。この一組の関数は、各分類機の不確実性値に従ってそれらの応答を線形結合することによって、レベル1分類機出力とレベル2分類機出力との間の円滑な遷移を可能にする。なお、関数
【数20】

は、レベル2分類機の複雑な性質のため、一般的に不確実性領域において非線形の挙動を有する。以下の式は、最終分類機Cl出力がどのように生成されるかを記述している。
【数21】
【0119】
以下のワークフローは、リアルタイム処理のための提案される分類機アーキテクチャによる単一画像Pの処理を要約している(リコールフェーズ)。
入力画像Pが与えられる
全ての分類機Clについて
画像Pを分析して、Clレベル1分類機に必要な特徴Fを抽出する
特徴Fをレベル1分類機に入力して
【数22】

(レベル1出力)を計算する
【数23】

である場合、入力画像Pを血液粒子カテゴリClとして分類し、入力画像Pの分類タスクを完了する
【数24】

である場合、入力画像Pを血液粒子カテゴリ「その他」として分類し、分類機Clj+1へと続ける。
【数25】

である場合、
レベル1分類機の遷移関数
【数26】

を計算する
画像Pを分析して、Clレベル2分類機に必要な特徴Fを抽出する
特徴Fをレベル2分類機に入力して
【数27】

(レベル2出力)を計算する
【数28】

である場合、入力画像Pを血液粒子カテゴリClとして分類し、入力画像Pの分類タスクを完了する
【数29】

である場合、入力画像Pを血液粒子カテゴリ「その他」として分類し、分類機Clj+1へと続ける。
【数30】

である場合、
レベル2分類機の遷移関数
【数31】

を計算する
上記の
【数32】

の線形結合を使用して最終Cl分類機応答を計算する
Cl分類機応答>0である場合、入力画像Pを血液粒子カテゴリClとして分類し、入力画像Pの分類タスクを完了する
Cl分類機応答<0である場合、入力画像Pを血液粒子カテゴリ「その他」として分類し、分類機Clj+1へと続ける。
終了
終了
終了
入力画像PがいずれのCl分類機によっても分類されなかった場合、画像Pに不明とラベル付けする。
【0120】
記載されたシステムの全ての特徴は、記載されたシステムに変更を加えて適用可能であり、またその逆も適用可能である。
【0121】
本明細書に示される実施例は、本発明の潜在的かつ特定の実施例を例示することを意図している。当業者には、実施例は、主に説明を目的としていると理解され得る。本発明の趣旨から逸脱することなく、本明細書に記載されるこれらの図又は操作に対して変更があってもよい。例えば、特定の場合では、方法工程又は操作が異なる順序で実施、つまり実行されてよく、あるいは、操作を追加、削除、又は変更してもよい。
【0122】
本開示で論じた全ての特許、特許公開、特許出願、雑誌論文、書籍、技術文献などは、それらの全体があらゆる目的で参照により本明細書に組み込まれる。
【0123】
当然のことながら、本開示の図及び説明を簡略化して、本開示の明確な理解に関連する要素を説明している。当然のことながら、図は、組立図としてではなく、例示目的で示されている。省略された詳細点及び変更点、又は別の実施形態は、当業者の専門範囲内である。更に、本発明の特定の態様では、ある要素若しくは構造を提供するため、又は、ある機能を遂行するために、単一の構成要素を複数の構成要素と置き換えてよく、複数の構成要素を単一の構成要素と置き換えてよいことが理解され得る。かかる置換が特定の実施形態の実行に有効でない場合を除き、かかる置換は本開示の範囲内であると見なされる。
【0124】
図に描写する又は上述する構成要素の異なる配置は、示していない又は記載していない構成要素及び工程と同様に可能である。同様に、いくつかの特徴及び部分的組み合わせが有益であり、他の特徴及び部分的組み合わせへの参照なしに用いられてもよい。本発明の態様及び実施形態は、限定目的ではなく例示目的で説明しており、本特許の読者には、代替的な実施形態が明らかになるであろう。したがって、本発明は上記又は図に描写の実施形態に制限されず、下記の特許請求の範囲から逸脱することなく様々な実施形態及び修正がなされ得る。
【0125】
例示的な実施形態が例及び明快な理解のためにいく分詳細に記載されてきた一方で、当業者は様々な修正、応用、及び変化が用いられてもよいということを認識するだろう。したがって、本発明の範囲は、請求項によってのみ制限されるべきである。
図1A
図1B
図2
図3
図4
図5
図6A
図6B
図7
図8
図9
図10
図11
図12