(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-15
(54)【発明の名称】画像内の注釈付きの関心領域の検出
(51)【国際特許分類】
G06T 7/90 20170101AFI20240105BHJP
G06T 7/00 20170101ALI20240105BHJP
【FI】
G06T7/90 C
G06T7/00 630
G06T7/00 350B
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023536508
(86)(22)【出願日】2021-12-16
(85)【翻訳文提出日】2023-07-26
(86)【国際出願番号】 US2021063837
(87)【国際公開番号】W WO2022133104
(87)【国際公開日】2022-06-23
(32)【優先日】2020-12-16
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】500213834
【氏名又は名称】メモリアル スローン-ケタリング キャンサー センター
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100141553
【氏名又は名称】鈴木 信彦
(74)【代理人】
【識別番号】100176418
【氏名又は名称】工藤 嘉晃
(72)【発明者】
【氏名】フックス トーマス
(72)【発明者】
【氏名】シュフラー ペーター ジェイ
(72)【発明者】
【氏名】ヤーラガッダ ディグ ヴィジャイ クマール
(72)【発明者】
【氏名】ヴァンダービルト チャド
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096AA06
5L096BA06
5L096BA13
5L096CA24
5L096EA02
5L096EA05
5L096EA39
5L096FA06
5L096GA10
5L096GA30
5L096GA34
5L096GA40
5L096GA41
5L096GA51
5L096GA55
5L096HA11
5L096KA04
5L096MA07
(57)【要約】
本開示は、画像内の関心領域(ROI)を特定するためのシステム及び方法を対象とする。コンピューティングシステムは、ROIを画定する注釈を含む画像を特定し得る。画像は、第1の色空間内の複数のピクセルを有し得る。コンピューティングシステムは、複数のピクセルを第1の色空間から第2の色空間に変換して、注釈をROIから区別し得る。コンピューティングシステムは、注釈に対応するピクセルの第1のサブセットを、第2の色空間内のピクセルの第1のサブセットの色値に少なくとも基づいて選択し得る。コンピューティングシステムは、ピクセルの第1のサブセットを使用して、画像から、ROIに含まれるピクセルの第2のサブセットを特定し得る。コンピューティングシステムは、ピクセルの第2のサブセットと画像内の注釈によって画定されるROIとの間の関連付けを記憶し得る。
【選択図】
図7
【特許請求の範囲】
【請求項1】
画像内の関心領域(ROI)を特定する方法であって、
コンピューティングシステムによって、ROIを画定する注釈を含む画像を特定することであって、前記画像が、第1の色空間内の複数のピクセルを有する、特定することと、
前記コンピューティングシステムによって、前記複数のピクセルを前記第1の色空間から第2の色空間に変換して、前記注釈を前記ROIから区別することと、
前記コンピューティングシステムによって、前記複数のピクセルから、前記注釈に対応するピクセルの第1のサブセットを、前記第2の色空間内の前記ピクセルの第1のサブセット内の少なくとも1つのピクセルの色値に少なくとも基づいて選択することと、
前記コンピューティングシステムによって、前記ピクセルの第1のサブセットを使用して、前記画像から、前記ROIに含まれるピクセルの第2のサブセットを特定することと、
前記コンピューティングシステムによって、1つ以上のデータ構造に、前記ピクセルの第2のサブセットと前記画像内の前記注釈によって画定される前記ROIとの間の関連付けを記憶することと、を含む、方法。
【請求項2】
前記コンピューティングシステムによって、前記ピクセルの第2のサブセットを前記ROIとして特定する前記画像を提供して、画像分割、画像位置特定、又は画像分類のうちの少なくとも1つのために機械学習モデルをトレーニングすることを更に含む、請求項1に記載の方法。
【請求項3】
前記コンピューティングシステムによって、前記ピクセルの第2のサブセットと前記画像から特定される前景部分とに少なくとも基づいて、前記画像内の前記ROIのために定義するマスクを生成することを更に含む、請求項1に記載の方法。
【請求項4】
前記コンピューティングシステムによって、ピクセルの第4のサブセットを部分的に取り囲み、前記注釈に対応するピクセルの第3のサブセットにカーネルを適用して、前記ROIに対応する前記ピクセルの第4のサブセットを完全に取り囲む前記ピクセルの第1のサブセットを選択することを更に含む、請求項1に記載の方法。
【請求項5】
前記コンピューティングシステムによって、前記注釈のピクセルの閾値数を下回るピクセルの第3のサブセット内のピクセル数に少なくとも基づいて、前記ピクセルの第3のサブセットが、対応するものとして特定から除去されるべきであることを決定することを更に含む、請求項1に記載の方法。
【請求項6】
前記コンピューティングシステムによって、前記第1の色空間内の前記複数のピクセルを含む前記画像にフィルタを適用して、ノイズを低減するか又は前記画像の背景部分から前景部分を区別することを更に含む、請求項1に記載の方法。
【請求項7】
前記ピクセルの第1のサブセットを選択することが、前記第2の色空間内の前記ピクセルのサブセット内の少なくとも1つのピクセルの前記色値が、前記注釈の複数の閾値範囲のうちの少なくとも1つを満たすと判定することを更に含む、請求項1に記載の方法。
【請求項8】
前記ピクセルの第2のサブセットを特定することが、前記ピクセルの第1のサブセットによって画定された境界を抽出して、前記ピクセルの第1のサブセットによって取り囲まれた前記ピクセルの第2のサブセットを特定することを更に含む、請求項1に記載の方法。
【請求項9】
前記画像を特定することが、前記画像を第1の倍率レベルで特定することを更に含み、前記第1の倍率レベルが、前記第1の倍率レベルよりも大きい第2の倍率レベルの第2の画像から導出されたものである、請求項1に記載の方法。
【請求項10】
前記画像が、組織学的画像作製器を介したスライド上の試料組織の生物医学的画像を含み、前記試料組織が、前記ROIに対応する特徴を有し、前記スライドが、前記注釈を画定するマーカを使用して作られた指示を有する、請求項1に記載の方法。
【請求項11】
画像内の関心領域(ROI)を特定するためのシステムであって、
メモリと結合された1つ以上のプロセッサを有するコンピューティングシステムを備え、前記コンピューティングシステムが、
ROIを画定する注釈を含む画像を特定することであって、前記画像が、第1の色空間内の複数のピクセルを有する、特定することと、
前記複数のピクセルを前記第1の色空間から第2の色空間に変換して、前記注釈を前記ROIから区別することと、
前記複数のピクセルから、前記注釈に対応するピクセルの第1のサブセットを、前記第2の色空間内の前記ピクセルの第1のサブセット内の少なくとも1つのピクセルの色値に少なくとも基づいて選択することと、
前記ピクセルの第1のサブセットを使用して、前記画像から、前記ROIに含まれるピクセルの第2のサブセットを特定することと、
1つ以上のデータ構造に、前記ピクセルの第2のサブセットと前記画像内の前記注釈によって画定される前記ROIとの間の関連付けを記憶することと、を行うように構成されている、システム。
【請求項12】
前記コンピューティングシステムが、前記ピクセルの第2のサブセットを前記ROIとして特定する前記画像を提供して、画像分割、画像位置特定、又は画像分類のうちの少なくとも1つのために機械学習モデルをトレーニングするように更に構成されている、請求項11に記載のシステム。
【請求項13】
前記コンピューティングシステムが、前記ピクセルの第2のサブセットと前記画像から特定される前景部分とに少なくとも基づいて、前記画像内の前記ROIのために定義するマスクを生成するように更に構成されている、請求項11に記載のシステム。
【請求項14】
前記コンピューティングシステムが、ピクセルの第4のサブセットを部分的に取り囲み、前記注釈に対応するピクセルの第3のサブセットにカーネルを適用して、前記ROIに対応する前記ピクセルの第4のサブセットを完全に取り囲む前記ピクセルの第1のサブセットを選択するように更に構成されている、請求項11に記載のシステム。
【請求項15】
前記コンピューティングシステムが、前記注釈のピクセルの閾値数を下回るピクセルの第3のサブセット内のピクセル数に少なくとも基づいて、前記ピクセルの第3のサブセットが、前記注釈に対応するものとして特定から除去されるべきであることを決定するように更に構成されている、請求項11に記載のシステム。
【請求項16】
前記コンピューティングシステムが、前記第1の色空間内の前記複数のピクセルを含む前記画像にフィルタを適用して、ノイズを低減するか又は前記画像の背景部分から前景部分を区別するように更に構成されている、請求項11に記載のシステム。
【請求項17】
前記コンピューティングシステムが、前記第2の色空間内の前記ピクセルのサブセット内の少なくとも1つのピクセルの前記色値が、前記注釈の複数の閾値範囲のうちの少なくとも1つを満たすと判定するように更に構成されている、請求項11に記載のシステム。
【請求項18】
前記コンピューティングシステムが、前記ピクセルの第1のサブセットによって画定された境界を抽出して、前記ピクセルの第1のサブセットによって取り囲まれた前記ピクセルの第2のサブセットを特定するように更に構成されている、請求項11に記載のシステム。
【請求項19】
前記コンピューティングシステムが、前記画像を第1の倍率レベルで特定するように更に構成され、前記第1の倍率レベルが、前記第1の倍率レベルよりも大きい第2の倍率レベルの第2の画像から導出されたものである、請求項11に記載のシステム。
【請求項20】
前記画像が、組織学的画像作製器を介したスライド上の試料組織の生物医学的画像を含み、前記試料組織が、前記ROIに対応する特徴を有し、前記スライドが、前記注釈を画定するマーカを使用して作られた指示を有する、請求項11に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年12月16日に出願された「Tool to Detect and Extract Pen Annotated Areas in Digital Slides Images into a Digital Format」と題された米国仮特許出願第63/126,298号の優先権の利益を主張し、その全体は参照により本明細書に組み込まれる。
【背景技術】
【0002】
画像は、内部に1つ以上の特徴を含み得る。画像内からそれらの特徴を自動的に検出するために、様々なコンピュータビジョン技術が使用され得る。
【発明の概要】
【0003】
本開示の態様は、画像内の関心領域(ROI)を特定するためのシステム、方法、及びコンピュータ可読媒体を対象とする。コンピューティングシステムは、ROIを画定する注釈を含む画像を特定し得る。画像は、第1の色空間内の複数のピクセルを有し得る。コンピューティングシステムは、複数のピクセルを第1の色空間から第2の色空間に変換して、注釈をROIから区別し得る。コンピューティングシステムは、複数のピクセルから、注釈に対応するピクセルの第1のサブセットを、第2の色空間内のピクセルの第1のサブセット内の少なくとも1つのピクセルの色値に少なくとも基づいて選択し得る。コンピューティングシステムは、ピクセルの第1のサブセットを使用して、画像から、ROIに含まれるピクセルの第2のサブセットを特定し得る。コンピューティングシステムは、1つ以上のデータ構造に、ピクセルの第2のサブセットと画像内の注釈によって画定されるROIとの間の関連付けを記憶し得る。
【0004】
いくつかの実施形態では、コンピューティングシステムは、ピクセルの第2のサブセットをROIとして特定する画像を提供して、画像分割、画像位置特定、又は画像分類のうちの少なくとも1つのために機械学習モデルをトレーニングし得る。いくつかの実施形態では、コンピューティングシステムは、ピクセルの第2のサブセットと画像から特定される前景部分とに少なくとも基づいて、画像内のROIのために定義するマスクを生成し得る。
【0005】
いくつかの実施形態では、コンピューティングシステムは、ピクセルの第4のサブセットを部分的に取り囲み、注釈に対応するピクセルの第3のサブセットにカーネルを適用して、ROIに対応するピクセルの第4のサブセットを完全に取り囲むピクセルの第1のサブセットを選択し得る。いくつかの実施形態では、コンピューティングシステムは、注釈のピクセルの閾値数を下回るピクセルの第3のサブセット内のピクセル数に少なくとも基づいて、ピクセルの第3のサブセットが、対応するものとして特定から除去されるべきであることを決定し得る。
【0006】
いくつかの実施形態では、コンピューティングシステムは、第1の色空間内の複数のピクセルを含む画像にフィルタを適用して、ノイズを低減するか又は画像の背景部分から前景部分を区別し得る。いくつかの実施形態では、コンピューティングシステムは、第2の色空間内のピクセルのサブセット内の少なくとも1つのピクセルの色値が、注釈の複数の閾値範囲のうちの少なくとも1つを満たすと判定し得る。
【0007】
いくつかの実施形態では、コンピューティングシステムは、ピクセルの第1のサブセットによって画定された境界を抽出して、ピクセルの第1のサブセットによって取り囲まれたピクセルの第2のサブセットを特定し得る。いくつかの実施形態では、コンピューティングシステムは、画像を第1の倍率レベルで特定し得、第1の倍率レベルは、第1の倍率レベルよりも大きい第2の倍率レベルの第2の画像から導出されたものである。いくつかの実施形態では、画像は、組織学的画像作製器を介した、スライド上の試料組織の生物医学的画像を含み得る。試料組織は、ROIに対応する特徴を有し得る。スライドは、注釈を画定するマーカを使用して作られた指示を有し得る。
【図面の簡単な説明】
【0008】
【
図1】デジタル化されたペン注釈の例。左:元のスライドガラス、スライドガラス上に、病理医によってペンで手動の注釈(青色)が付けられている。中央:ペン及び組織領域に基づく手順によって自動的に特定され注釈が付けられている。右:比較のために、病理医によってデジタルツールを用いて手動で、デジタルで注釈が付けられた領域(赤色)。この手動のデジタル注釈は時間がかかり冗長である。
【
図2】注釈抽出パイプライン。上段左:入力として、デジタルペンのサムネイルが与えられる。ガウス平滑化フィルタが適用される。上段中央:画像はグレースケールされ、前景はOtsu閾値法を使用して背景から分離される。下段左から右:画像はHSV色空間に変換される。ペン色のピクセルが残りのピクセルから分離され、ペンの輪郭線は小さな隙間を閉じるために伸張する。輪郭フィルタは、「内側」領域を特定する閉じた輪郭を塗りつぶす。ノイズフィルタが、サイズに基づいて小さい領域を除去する。次いで、ペンマスクが、注釈付きの領域の内容のみを取得するために輪郭マスクから取り去られる。上段右:出力は、前景マスクと注釈マスクとの組み合わせである。
【
図3】デジタル化されたペン注釈の例。左:元のスライドガラス、スライドガラスに、病理医によって青色のペンを用いた手動の注釈が付けられている。中央:ペンと組織領域とに基づいた手順を用いて自動的に分割された、注釈付きの領域。右:比較のために、病理医によってデジタルツールを用いて作られたデジタルスライドの手動注釈(赤色)。この手動のデジタル注釈付けは時間がかかり冗長である。
【
図4】注釈抽出パイプライン。上段左:WSIから、サムネイルは入力フォルダに抽出される必要がある。ステップ1:ガウス平滑化フィルタがサムネイルに適用される。ステップ2:画像がHSV色空間に変換される。ステップ3:閾値を使用して、組織が背景から分離される。ステップ4:ペン色のピクセルが残りのピクセルから分離され、ペンの輪郭線は小さな隙間を閉じるために伸張する。ステップ5:輪郭フィルタは、「内側」領域を特定する閉じた輪郭を塗りつぶす。ノイズフィルタが、サイズに基づいて小さい領域を除去する。ステップ6:次いで、ペンマスクが、注釈付きの領域の内容のみを取得するために輪郭マスクから取り去られる。ステップ7:組織マスク(ステップ3)と注釈マスク(ステップ6)とを乗算して、最終出力マスクを形成する。
【
図5】提案された注釈抽出方法の性能メトリック。左:自動的に分割された注釈付きの領域の、病理医による手描きのマスクと比較したDice係数(中央値=0.942)、Jaccard指数(中央値=0.891)、適合率(中央値=0.955)、再現率(中央値=0.943)、及びKappa(中央値=0.932)。右:自動的に生成された注釈マスクと手描きの注釈マスクとの適合率/再現率曲線。すべての測定値は、ピクセルワイズで計算される。N=319である。
【
図6】2つの高スコア抽出の例(上段、Dice0.983及び0.981)、2つの中スコア抽出の例(中段、0.755及び0.728)、及び2つの低スコア抽出の例(下段、0.070及び0)。左:元の画像。注釈はスライドガラスにペンで描かれている。中央:自動的に分割された注釈。右:手動で分割された注釈。この方法は、テキストと組織の輪郭線とを区別できることに留意のこと。中スコアの注釈は、概して良好な分割を示すが、まばらな組織及び粗い手動のデジタル注釈に起因してスコアが低下する。2つの低スコアの例は、破損したカバースリップ、又はリング形状のペン注釈に起因して難解である。
【
図7】例示的な実施形態による、画像内の関心領域(ROI)を特定するためのシステムのブロック図を描写する。
【
図8A】例示的な実施形態による、ROIを特定するためのシステム内の画像の色空間を変換するためのプロセスのブロック図を描写する。
【
図8B】例示的な実施形態による、ROIを特定するためのシステム内のROIマスクを導出するためのプロセスのブロック図を描写する。
【
図8C】例示的な実施形態による、ROIを特定するためのシステム内で注釈マークを作るためのプロセスのブロック図を描写する。
【
図9】例示的な実施形態による、画像内の関心領域(ROI)を特定する方法のフロー図を描写する。
【
図10】例示的な実施形態による、サーバシステム及びクライアントコンピュータシステムのブロック図を描写する。
【発明を実施するための形態】
【0009】
以下は、画像内の注釈付きの関心領域(ROI)を特定するためのシステム及び方法に関連する様々な概念並びにそれらの実施形態の、より詳細な記載である。上記で紹介し、以下で更に詳しく論じる様々な概念は、開示された概念が実装形態の特定の様式に限定されないため、数多くの方法の実装形態のいずれかで実施することができる。特定の実装形態及び用途の例は、主に例示的な目的のために提供される。
【0010】
セクションAでは、デジタルスライド画像内のペン注釈付きのエリアを検出し、デジタルフォーマットに抽出するためのツールを記載する。
【0011】
セクションBでは、画像内のマーク付き関心領域(ROI)を特定するためのシステム及び方法を記載する。
【0012】
セクションCでは、本明細書に記載される様々なコンピューティング関連の実施形態を実践するために有用であり得る、ネットワーク環境及びコンピューティング環境を記載する。
【0013】
A.デジタルスライド画像内のペン注釈付きのエリアを検出し、デジタルフォーマットに抽出するためのツール
病理学における人工知能(AI)の開発は、しばしばデジタル注釈付きの全スライド画像(WSI)に依存している。デジタルスライドビューアで病理医によって手描きされるこれらの注釈を作ることには、時間及び費用がかかる。それと同時に、病理医は、例えば組織の分子評価のために、がん領域に輪郭線を付けるためにスライドガラスにペンで注釈を付ける。いくつかのアプローチ下では、これらのペン注釈は、アーチファクトとみなされ計算モデリングから除外される可能性がある。
【0014】
本明細書に提示されるのは、以下を可能にする画像処理パイプラインである。(i)デジタル化された病理スライド上のペン注釈を、色(例えば、とりわけ、黒色、青色、緑色、紫色、及び赤色のマーカ)にかかわらず検出すること、(ii)注釈が領域を一周している場合、その注釈の「内側」部分を分割すること、(iii)スライド上の前景(組織)及び背景(非組織、白いエリア)を特定すること、(iv)前景と注釈付きのエリアとを組み合わせること、及び(v)「注釈マスク」として注釈が付けられた前景エリアをエクスポートすること。ステップ(v)からの注釈マスクは、次いで、機械学習及びコンピュータビジョンパイプラインに使用することができる。
【0015】
ここで
図1を参照すると、提案されたパイプラインは、ペン注釈付きの病理スライド(左)から、「内側」部分を電子フォーマット(すなわち、中央の、マスク)で検出し、分割することができる。比較のため及び代替として、病理医は、同じ結果を取り出すために、電子ツールを用いてこの内側部分に注釈を付ける(右)。この手動注釈付けは冗長かつ手間である。
【0016】
ここで
図2を参照すると、注釈を抽出する個々のステップが強調されている。このパイプラインは、既に手動で注釈が付けられている多数の病理スライドを、電子ツールを用いて手動で再注釈を付ける必要なく使用することを可能にする。これらのペン注釈は、典型的にはがんの領域を強調し、したがって、このツールを使用して、より多くの注釈が付けられたデータへのアクセスを提供することによって、がん分類モデルをより迅速に開発することができる。
【0017】
1.導入
病理学における人工知能(AI)の開発は、しばしばデジタル注釈付きの全スライド画像(WSI)に依存している。デジタルスライドビューアで病理医によって手描きされるこれらの注釈を作ることには、時間及び費用がかかる。それと同時に、病理医は、例えば組織の分子評価のために、がん領域に輪郭線を付けるためにスライドガラスにペンで注釈を付ける。これらのペン注釈は、いくつかのアプローチ下ではアーチファクトとみなされ、計算モデリングから除外される。
【0018】
A.方法
提案されているのは、手描きのペン注釈を分割して塗りつぶし、それらをデジタルフォーマットに変換して、計算モデルにアクセスできるようにするための新しい方法である。この方法は、オープンソースで公開されているソフトウェアツールとしてPythonで実装されている。
【0019】
B.結果
この方法は、WSIからペン注釈を抽出し、それらのペン注釈を注釈マスクとして保存することができる。ペンマーカを含む319個のWSIのデータセットでは、注釈を分割するアルゴリズムは、全体的なDiceメトリックが0.942、適合率が0.955、及び再現率が0.943で検証された。すべての画像の処理にかかった時間は、手動のデジタル注釈付けの時間が5時間であるのとは対照的に、15分であった。更に、このアプローチは、テキスト注釈に対してロバストである。
【0020】
C.結論
この方法では、注釈が計算モデルのトレーニングに役立つであろうシナリオにおいて、既にペン注釈が付けられたスライドを利用できることが想定されている。デジタル化されている多くの病理学部門の大規模なアーカイブを考慮すると、この方法はそれらのデータから大量のトレーニング試料を回収するのに役立つことになる。
【0021】
2.コンテキスト
計算病理学におけるアルゴリズムは、注釈付きの画像データセットの助けによってトレーニングすることができる。いくつかのシナリオでは、モデルががん組織と周囲の正常組織との違いを学習するように設計されているため、画像上の腫瘍領域を知ることが有益である。したがって、病理学AI開発のための対応するパイプラインの大部分は、がん領域がデジタルアクセス可能となるように、スキャンされたWSIに注釈付きのデータセットを作ることである。注釈は通常、病理医の助けによって取得され、コンピュータ画面のスキャンされた全スライド画像(WSI)上にデジタルツールを用いて描かれる。機械学習パイプラインでは、それらの注釈付きのデータセットを生成することは、注釈の粒度のレベルに応じて、時間がかかり、煩雑で、誤差が発生しやすいため、ボトルネックを引き起こす可能性がある。
【0022】
それと同時に、多くのスライドガラスは、腫瘍領域又は他の関心領域に輪郭線を付けるために、病理医によってペンを用いて既に物理的に注釈が付けられている。例として、スライドガラスは一般に、分子評価のために、遺伝子分析及び配列決定用にサンプリングされる腫瘍領域に輪郭線を付けるために注釈が付けられる。したがって、元のパラフィン包埋検体からの組織は、スライドを検査した後に病理医がスライドガラスに示したのと同じ領域からサンプリングすることができる。しかしながら、これらのペン注釈は、スライドガラス上ではアナログであり、デジタルアルゴリズムによって利用可能なアドホックではない。これらの手描きのペン注釈はまだデジタル化されていない。
【0023】
本開示では、WSIからペン注釈を抽出し、それらを下流のデジタル処理のために利用できるようにするための方法が本明細書において提示される。
図3に示されるように、スキャンされたWSIのペン注釈(左)を用いて、この方法は、輪郭線が付けられた領域(中央、青のマスク)のバイナリデジタルマスクを抽出する。したがって、それにより、熟練した病理医から既に施された注釈を利用することが可能となり、
図3の右(赤色の手描きのデジタル注釈)に示されるような、新たな手描きの注釈を回収する必要性を低減する。病理部門でアーカイブされた膨大な画像データを考慮すると、この方法により、何千ものそのような手描きの注釈にアクセスすることが可能となり、これらの注釈を初めて計算病理学のために利用できるようになる。
【0024】
いくつかのアプローチ下では、デジタルWSIのペン注釈は通常アーチファクトとみなされ、下層組織を覆うか又は染色するため、下流の計算分析を妨げる。したがって、組織ひだ、焦点外れエリア、気泡、及び他のアーチファクトとともに、WSIのペン注釈を自動的に検出して分析から除外することを目的とした研究が存在する。代わりに、既に注釈が付けられたスライドガラスを利用し、抑制された情報をデジタル化して、計算アルゴリズムにアクセスできるようにすることが提案されている。
【0025】
3.方法
A.ペン注釈の抽出
注釈抽出部は、Python 3においてコマンドラインスクリプトとして実装されている。注釈抽出部の入力は、処理されるすべてのWSIのサムネイル画像を含むフォルダである。記憶されたサムネイルは、処理前にWSIにおいて抽出される。出力は、それらの画像のペン注釈マスクを検出した異なるフォルダであり、各マスクは、対応するサムネイル画像と同じ寸法である。
図4に示されるように、7つの処理ステップが、入力フォルダ内のサムネイル画像ごとにワークフローを構成する。
【0026】
ステップ1では、不特定のノイズを低減するために、半径3のガウスぼかしフィルタがサムネイル画像に適用される。ステップ2では、ぼかされた画像がHSV(色相、彩度、明度)色空間に変換される。HSV色空間を使用するのは、RGB色空間が染色及びスキャン中に導入されたすべてのバリエーションを検出するのに十分ロバストではないことが判明したためである。更に、HSVは、生の輝度値に対処することによってマーカを分離するのにより適している。ステップ3では、HSV画像を使用して、H&E関連の色閾値で組織をマスクする。[135,10,30]~[170,255,255]のピクセル値は、ペンなしの組織とみなされる。
【0027】
ステップ4では、ペン色関連の閾値に基づいて、ペンストロークのマスクがHSV画像から抽出される。このデータセットは、黒色、青色、緑色の3つのペン色で構成されている。[0,0,0]~[180,255,125]のピクセル値は、黒色のペンに由来するとみなされる。[100,125,30]~[130,255,255]のピクセル値は、青色のペンに由来するとみなされる。そして、[40,125,30]~[70,255,255]のピクセル値は、緑色のペンに由来するとみなされる。これらのHSV値は、対応する色のスペクトルを記述し、ペン注釈付きのピクセルをキャプチャするためにうまく機能していた。ペン色間の区別が実施されないため、3つの個々の色マスクは全体的なペンマスクに結び付けられる。他のペン色を追加するには、この方法の拡張として特定の色閾値を追加する必要があろうことに留意のこと。
【0028】
注釈付きのペン輪郭の隙間を閉じるために、円形のカーネルによる形態学的伸張がペンマスク全体に用いられる。この伸張により、所与のカーネルサイズだけペンの輪郭が太くなり、それによってマスクの穴が閉じられる。このステップは、細いペンの線、及び描かれた線の小さな隙間、例えば、円のほぼ閉じた端の隙間を考慮するために必要である。隙間が大きいほど、形状を閉じるためにカーネルサイズを大きくしなくてはならない。このアルゴリズムは、カーネルサイズを5、10、15、及び20ピクセルに増やしながら、4ラウンドで実行される。各ラウンドにおいて、ペン注釈の隙間が大きすぎると空のマスクとなり(次のステップにおいて閉じた輪郭が見つからないため)、それらの画像はより大きなカーネルサイズによる次の実行に供される。
【0029】
ステップ5では、伸張したマスクは、輪郭抽出及び塗りつぶしに供される。塗りつぶされた輪郭のノイズを低減するために、3,000ピクセル未満の構成要素はフィルタリングされる。この閾値は、組織の注釈を通過させながら、無関係なピクセル、小さな輪郭、及びテキスト領域などの小さな領域をフィルタリングすることによって、データセットで最も良好に機能したために選択された。ただし、サムネイルの寸法及び解像度に基づいて、可変フィルタサイズを探索することが提案されている。次いで、得られたマスクは、ステップ6で、内側領域のみを保存するために、塗りつぶされた輪郭マスクから取り去られる。
【0030】
ステップ6では、内側領域マスクは、組織ではない背景領域を除外するために、組織マスクと乗算される。ここでもノイズフィルタを適用して、注釈マスク生成時に入り込んだ小さな領域を除去し、その結果、ペン注釈が付けられた領域の最終的なマスクが生じる。
【0031】
最初の段階でスライドにペン注釈がない場合、最終的なペン注釈マスクは空になることに留意のこと。
【0032】
B.検証データセット及び手動注釈
本方法を評価するために、Aperio AT2スキャナ(Leica Biosystems,Buffalo Grove,Illinois,USA)でスキャンされたペンマーカの付いたWSIを利用する。WSIは、Microsoft Surface Studioにおいて社内開発されたデジタルスライドビューアを使用して、入力デバイスとしてデジタルペンを使用して病理医によって手動で注釈が付けられている。病理医は、完全なWSIに可視ペンマーカの内側領域の概略を示した。病理医は、ビューア内の任意の倍率レベルを使用してWSIに注釈を付けることができることに留意のこと。ペンの形状が粗いときは、WSIの低い倍率レベルでデジタルの手動注釈が付けられた。ペンの形状が細い又は狭い場合、病理医はWSIに注釈を付けるためにより高い倍率レベルに拡大した。いずれの事例も、デジタル注釈マスクは、視認者によってWSIの元の寸法で内部的に保存される。次いで手動注釈を、サムネイル画像のサイズにダウンスケールした。
【0033】
本方法の性能を評価するために、4つの類似性メトリック(例えば、自動的に生成された注釈マスクAと手描きの注釈マスクMとの間のDice係数(又はFスコア)、Jaccard指数(又は、共通部分/和集合(IoU、Intersection over Union))、適合率、再現率、及びCohenのKappa)が計算される。
【数1】
式中、p
0は、ピクセルに割り当てられたラベルの一致の確率であり、p
eは、両方の注釈がランダムに割り当てられている場合に予想される一致である。すべてのメトリックは、PythonのScikit学習パッケージを使用して計算した。これらの指標は類似しているが、わずかに異なる側面を強調している。Dice及びJaccardは、自動的に分割された領域と手動で分割された領域との間の相対的な重なり量を表す。適合率は、ペン注釈を有しないエリアを除外する機能を表す。再現率は、ペン注釈によって領域を含める機能を定量化する。Kappa値は、自動的に分割された領域と手動で分割された領域との間の一致を確率として表す。Kappaを除くすべての値は、0(不完全な自動分割)~1(完全な自動分割)の範囲である。Kappa値は-1~1の範囲にあり、0は、手動分割と自動分割との間に偶然レベルよりも良い一致がないことを意味し、1及び-1は、それぞれ完全な一致又は不一致を意味する。
【0034】
4.結果
319個のWSIのデータセットにおける、自動分割の手描きとの類似性を定量化する。WSIのサムネイルは、485~1024px(中央値=1024px)の幅、及び382~768px(中央値=749px)の高さを有する。
図5の左、及び表1に示されるように、自動的に分割されたペンマスクと手動ペンマスクとの間の、Dice係数の中央値は、0.942(平均値0.865±0.207)、Jaccard指数の中央値は、0.891(平均値0.803±0.227)、適合率の中央値は、0.955(平均値0.926±0.148)、再現率の中央値は、0.943(平均値0.844±0.237)、及びKappa値の中央値は、0.932(平均値0.852±0.216)である。
図5の右は、それらのデータセットを説明する適合率/再現率曲線の概略を示している。適合率は、概して非常に高く(0.90超)、再現率は、中央値0.943でより大きな範囲に分布することに留意のこと。これは、一部の手動注釈が見逃されていることを意味する。適合率及び再現率がゼロの極端な外れ値は、切り離された注釈を示し、次のセクションで論じられる。
【0035】
図6は、高スコアの2つの例(Dice0.983及び0.981、上段)、中スコアの2つの例(0.755及び0.728、中段)、及び低スコアの2つの例(0.070及び0、下段)を示す。最も簡単な注釈は、円又は多角形などの閉じた形状を有するものである。依然として、本方法によって注釈が処理しやすい場合でも、2つの中間の例に図示されるように、注釈内の組織がまばらであり、手動のデジタル注釈が粗い場合、スコアが低下する可能性がある。本方法の難解な注釈は、閉じていない、ひいては塗りつぶすことができない形状、破損したカバースリップ(
図6の下から2段目)などのアーチファクトを有するスライド、又はリング形状の対象物(
図6の下段)などの複雑な注釈である。これらの難解な事例は、
図5の統計で示されているような、データセットの外れ値である。
【0036】
興味深い観察は、
図6の上段に示されるように、テキスト注釈が、本方法によるすべての試料を通してロバストに無視されることである。これは、丸みを帯びた文字の小さな閉じたエリアを除去するサイズに基づいたノイズフィルタによって達成される。特定のテキスト認識プログラムは組み込まれていない。
【0037】
A.注釈付けの時間
すべてのWSIでの手動の粗いデジタル注釈付けに必要な時間は約5時間であり、スライド当たり平均1分であった。
【0038】
対照的に、本方法は、すべてのパラメータを確定した後、全スライドで、15分で実行される。画像は順次処理されており、スクリプトは並列処理によって更に最適化され得ることに留意のこと。したがって、本方法を使用して利用可能な粗い注釈を抽出することが提案されている。
【0039】
この比較には制限があることに留意のこと。病理医は、例えば微細な切片を説明するために任意の倍率レベルで、ビューア内で注釈を付けることができるが、本方法は、微細な注釈のオプションなしでサムネイル上でのみ実行される。また、スライドガラス自体にペンで注釈を付けるのに必要な時間は不明であるため、ペンの注釈付けの時間と手動のデジタル注釈付けの時間との比較はできない。
【0040】
B.結論
全スライド画像には、病理医からのアナログの手描きのペン注釈が含まれる場合がある。これらの注釈は、一般に、分子フォローアップ又は遺伝子配列決定の対象となるがんエリアに輪郭線を粗く付けるために使用される。したがって、これらの注釈は、計算病理学における様々ながん分類モデルにとって非常に有益であり得る。しかしながら、ペン注釈は通常、不要な画像アーチファクトとみなされ、分析から除外される対象となる。代わりに、アルゴリズムによってアクセスできる場合にこれらの注釈が分類器にとって有益であろうシナリオが考慮される。このために、本明細書で提示されるのは、手描きのペン注釈の内側部分のデジタル抽出を可能にするツールである。本方法は、ペン領域を特定して分割し、輪郭を閉じて塗りつぶし、最終的に、取得したマスクをエクスポートする。
【0041】
アルゴリズムの性能を、319個のWSIのペン注釈付きのデータセットで評価し、全体的なDiceメトリックは0.942、全体的な適合率及び再現率はそれぞれ0.955及び0.943という結果であった。最も適したペン形状は、本方法によって容易に抽出可能であるため、閉じたエリアである。しかしながら、問題のあるペン注釈には、不適切に閉じられているか又は本質的に複雑な形状(例えば、それらの中央に穴がある)が含まれる。不適切に閉じられた形状は、希釈半径を手動で調整することで対処できる。ドーナツ形状の注釈などのより複雑な形状は、本方法の更なる改善を必要とするであろう。
【0042】
概して、アプローチは、他のデータセットに拡張することができ、例えば、ヘマトキシリン・エオジン(H&E)とは異なる染色(例えば、hemosiderin染色、Sudan染色、Schiff染色、Congo赤染色、Gram染色、Ziehl-Neelsen染色、Auramine-rhodamine染色、trichrome染色、Silver染色、及びWright染色)でWSIを処理するために、又はより多くのペン色を考慮するために、拡張することができる。これは、使用されるパラメータの潜在的な調整を必要とするため、完全に自動的なペン注釈抽出方法ではない。それでも、手描きをするのにより多くの時間を必要とするであろう一般的な注釈の大部分を取り込むことができることが示されている。更に、潜在的なパラメータを微調整するためのガイダンスが提供される。
【0043】
ペン注釈は非常に多様であり、様々な意味を有する可能性がある。本方法はテキストに対してロバストであるように見えた。これはおそらく、テキストには大きな閉じた形状が含まれず、典型的には組織ではなく白い背景上にあるからである。更に、本方法は、単純で閉じた形状で最もうまく機能するように見えた。
【0044】
しかしながら、ペン注釈はガラスに直接描かれるため、非常に不正確になる可能性があり、これが制限となる可能性がある。拡大せずにがん領域の正確な下宿人に輪郭線を描くことはほぼ不可能である。このツールを使用して注釈を抽出すると、同じ適合率でデジタル領域がもたらされることに留意する必要がある。
【0045】
本発明者らは、本方法の主要な使用事例は、ペン注釈付きの腫瘍領域が利用可能なシナリオでの病理AIのトレーニング又は微調整のための濃縮腫瘍試料の収集であり得ると結論付ける。
表及びキャプション
【表1】
【0046】
B.画像内のマーク付き関心領域(RoI)を特定するためのシステム及び方法
病理医は、腫瘍領域に輪郭線を付けるために、ガラスのスライドにペンで描くことがある。スライドをスキャンした後、ペン注釈がスライドでスキャンされる。しかし、機械学習又はコンピュータビジョンの場合、これらの注釈の「内側」及び「外側」を評価する必要があり、これは些細なことではない。したがって、病理医は、冗長で時間がかかるデジタルツールでスライドに再び注釈を付ける。本明細書に提示されるのは、デジタルスライド画像のペン注釈を検出し、「内側」領域(輪郭線が付けられた腫瘍領域)を特定し、この領域をデジタルフォーマットでエクスポートして、他の計算分析にアクセスできるようにすることができる、コンピュータ実装ツールである。
【0047】
ここで
図7を参照すると、画像内の関心領域(ROI)を特定するためのシステム700のブロック図が描写されている。概説すると、システム700は、少なくとも1つの画像処理システム705(本明細書ではコンピューティングシステムと称されることもある)、少なくとも1つのモデルトレーナシステム710、及び少なくとも1つの撮像デバイス715を含み得る。システム700の構成要素は、少なくとも1つのネットワーク720を介して互いに通信可能に結合され得る。画像処理システム705は、とりわけ、少なくとも1つの画像プレッパー725、少なくとも1つの色解釈器730、少なくとも1つのマーク認識器735、少なくとも1つの領域探索器740、少なくとも1つの前景検出器745、少なくとも1つの注釈生成器750、及び少なくとも1つのデータベース755を含み得る。データベース755は、少なくとも1つのトレーニングデータセット760を有し得る。モデルトレーナシステム710は、少なくとも1つのモデル765を有し得る。システム700内の構成要素(例えば、画像処理システム705及びそのサブ構成要素、並びにモデルトレーナシステム710及びそのサブ構成要素)の各々は、本明細書のセクションCで詳述されるシステム1000のような、ハードウェア、又はハードウェアとソフトウェアとの組み合わせを使用して、実行、処理、又は実装され得る。
【0048】
ここで、とりわけ
図8Aを参照すると、ROIを特定するためにシステム内の画像の色空間を変換するためのプロセス800のブロック図が描写されている。プロセス800は、画像を作製し、色空間を変換するためにシステム700で実施される動作に対応し得る。プロセス800の下で、画像処理システム700で実行される画像作製器725は、ROIを検出又は特定するための少なくとも1つの画像802を取り出し、受信し、又は別様に特定し得る。いくつかの実施形態では、画像作製器725は、撮像デバイス715を介して取得された画像802を取り出すか又は受信し得る。撮像デバイス715は、画像処理システム705に送信するための画像802を取得又は生成し得る。撮像デバイス715による画像802の取得は、任意の倍率係数(例えば、2倍、4倍、10倍、又は25倍)での顕微鏡技術に従ってもよい。例えば、撮像デバイス715は、とりわけ、光学顕微鏡、共焦点顕微鏡、蛍光顕微鏡、リン光顕微鏡、電子顕微鏡を使用するなどの組織病理学的画像作製器であってもよい。いくつかの実施形態では、画像作製器725は、データベース755にアクセスして、トレーニングデータセット760をフェッチするか又は特定し得る。トレーニングデータセット760は、モデルトレーナシステム710上でモデル765をトレーニングするために使用される情報を含み得、撮像デバイス715を用いるのと同様に取得された画像802を特定するか又は含み得る。トレーニングデータセット760から、画像作製器725は、画像802を抽出又は特定し得る。画像802は、維持され、ファイルの形態(例えば、とりわけ、BMP、TIFF、又はPNG)で記憶され得る。
【0049】
いくつかの実施形態では、画像作製器725は、元の画像の倍率係数とは異なる倍率係数で画像802を生成又は特定してもよい。元の画像は、撮像デバイス715を介して取得されてもよく、又はデータベース755上に維持されたトレーニングデータセット760から取得されてもよい。例えば、画像作製器725は、元の画像のサムネイルを画像802として生成して、画像処理システム705の他の構成要素に供給してもよい。サムネイルは、元の画像のリスケールされたバージョンであってもよく、寸法は、元の画像の寸法の2~500倍小さい範囲である。倍率係数又はスケールを縮小することにより、画像802のより速い処理を容易にし得る。いくつかの実施形態では、撮像デバイス715から提供されるか又はデータベース755上のトレーニングデータセット760内にある画像802は、既に元の画像とは異なる倍率係数によるものであり得る。いくつかの実施形態では、元の画像の特定により、画像作製器725は、その倍率係数で(例えば、寸法縮小又はリスケーリングを使用して)画像802を生成し得る。
【0050】
画像802は、生体医学的画像などの、任意のタイプの画像であってもよい。本明細書では主に生物医学的画像として論じられるが、画像802は、任意のモダリティによる任意のタイプの画像であってもよい。いくつかの実施形態では、画像802の生物医学的画像は、少なくとも1つのスライド806上の少なくとも1つの試料804から導出されてもよい。例えば、画像802は、スライド806上の試料804に対応する試料組織のデジタル病理学のための全スライド画像(WSI)であってもよい。試料804は、スライド806の一方の側に置かれても、位置しても、又は別様に配置されてもよい。スライド806は、試料804を保持、収容、又は別様に据えるための任意の材料(例えば、ガラス、金属、又はプラスチック)で構成され得る。例えば、スライド806は、試料804を一方の側に沿って保持するための顕微鏡スライドであってもよい。
【0051】
スライド806上で、試料804は、少なくとも1つの組織切片808(又は他の生物学的材料)を含み得る。組織切片808は、とりわけ、ヒト、動物、又は植物などの対象の任意の部分に由来してもよい。組織切片808は、撮像を容易にするために染色されてもよい。例えば、組織切片808は、とりわけ、ヘマトキシリン・エオジン(H&E)染色、Gram染色、内胞子染色、Ziehl-Neelsen染色、Silver染色、又はSudanステートを用いた組織学的切片であってもよい。組織切片808は、少なくとも1つの特徴810を含み得る。特徴810は、特定の状態又はその他の関心のある組織切片808の一部分に対応し得る。状態は、試料804の組織切片808内の病変又は腫瘍(例えば、がん腫組織、良性上皮組織、間質組織、壊死組織、及び脂肪組織)などの様々な組織病理学的特徴に対応し得る。
【0052】
加えて、スライド806は、少なくとも1つのマーク付きインジケータ812(本明細書ではペンマーク又は注釈と呼ばれることもある)を有し得る。マーク付きインジケータ812は、試料804の組織切片808内の特徴810に対応する領域又はエリアを示すか又はそれらにラベル付けするためのマークであり得る。マーク付きインジケータ812は、組織切片808内の特徴810に対応するエリアを、少なくとも部分的に囲んでもよく、境界付けてもよく、又は別様に取り囲んでもよい。マーク付きインジケータ812は、特徴810に対応するエリアを実質的に(例えば、少なくとも80%)取り囲んでもよく、又は完全に取り囲んでもよい。マーク付きインジケータ812は、組織切片808内の状態について試料804(又は画像802)を調べる視認者によって、手動で作製されてもよい。例えば、試料804を調べる臨床医(例えば、病理医)は、ペン又はマーカを使用して、組織切片808内の特徴810のエリアの周りに部分的に線を手描きすることができる。臨床医によって描かれた線は、マーク付きインジケータ812に対応し得る。マーク付きインジケータ812は、とりわけ、赤色、青色、緑色、又は黒色などの任意の色のものであり得る。マーク付きインジケータ812の色は、組織切片808、特徴810、及び試料804又はスライド806の残りの部分の色とは異なってもよい。いくつかの実施形態では、マーク付きインジケータ812は、スライド806の、試料804の組織切片808と対向する側にあってもよい。いくつかの実施形態では、マーク付きインジケータ812は、スライド806の、試料804の組織切片808と同じ側にあってもよい。加えて、スライド806は、マーク付きインジケータ812と同様に、ペン又はマーカを使用して作られた無関係なマークを有し得る。無関係なマークは、スライド806上のマーク付きインジケータ812から離れて位置してもよい。
【0053】
画像802は、ピクセル814A~N(以下、ピクセル814と称する)のセットを有し得る。各ピクセル814は、画像802の一部分又は要素に対応し得る。画像802のピクセル814は、(例えば、描写されているように)二次元、又は三次元で配置されてもよい。画像802は、単一のサンプリング(例えば、スナップショット)又はビデオの少なくとも1つのフレーム画像に対応し得る。画像802のピクセル814の色値は、色空間に従ってもよい。色空間は、画像802内のピクセル814の色値の組織、範囲、又はパレットを指定、特定、又は画定し得る。画像802のピクセル814の初期色空間は、とりわけ、赤色、緑色、青色(RGB)色モデル、シアン、マゼンタ、イエロー、及びキー(CMYK)色モデル、並びにYCbCr色モデルなど、取得時の元の色空間であってもよい。各ピクセル814の色値は、試料804の対応するサンプリングされた部分の色に対応し得る。
【0054】
画像802は、少なくとも1つの関心領域(ROI)816を有し得る。ROI816は、画像802内の対象物の様々な特徴を含む(contain)、包含する、又は含む(include)画像802内のエリア、セクション、又は体積に対応し得る。試料804に関連して、ROI816は、組織切片808の特徴810に対応し得る。ピクセル814に関連して、ROI816は、組織切片808内の特徴810を示すピクセル814内の色値に対応し得る。加えて、画像802は、少なくとも1つの注釈818を有し得る。注釈818は、ROI816を少なくとも部分的に囲む囲い、境界、又は輪郭に対応し得る。注釈818は、画像802上のROI816を、実質的に(例えば、少なくとも80%だけ)又は完全に取り囲み得る。試料804に関連して、注釈818は、組織切片808内の特徴810を示す、スライド806上のマーク付きインジケータ812に対応し得る。ピクセル814に関して、注釈818は、マーク付きインジケータ812を示すピクセル814内の色値に対応し得る。ROI816及び注釈818のピクセル位置は、画像処理システム705内の様々な構成要素を通して処理する前に、画像処理システム705に未知であってもよく、又は特定されなくてもよい。
【0055】
この特定により、画像作製器725は、画像802を初期化し、配置し、又は別様に修正するための1つ以上の前処理動作を実施して、画像処理システム705の他の構成要素に供給する少なくとも1つの画像802’を生成し得る。いくつかの実施形態では、画像作製器725は、画像802’を生成するために、画像802に少なくとも1つのフィルタを適用し得る。フィルタとは、画像802をノイズ除去するか、平滑化するか、又はぼかすことであり得る。フィルタは、とりわけ、ノイズ除去関数(例えば、トータルバリエーションノイズ除去又はウェーブレットノイズ除去)又はぼかしフィルタ(例えば、ガウスぼかし、Anisotropic拡散、又はバイラテラルフィルタ)、又はそれらの任意の組み合わせであってもよい。適用する際に、画像作製器725は、画像802をフィルタに供給して、画像802’を作るか又は出力し得る。フィルタ動作により、画像802’内のピクセル814の色値は、画像802内のピクセル814の元の色値とは異なってもよい。結果として、画像802’は、画像802よりもノイズが少ない場合がある。加えて、画像802’内の前景部分は、画像802内の対応する前景及び背景部分と相対して、画像802’の背景部分からより区別され得る。
【0056】
画像処理システム700上で実行される色解釈器730は、画像802’内のピクセル814を初期色空間から異なる色空間に変形し、解釈し、又は別様に変換して、画像802”を作るか、出力するか、又は生成し得る。新たな色空間は、画像802”内の注釈818をROI816から区別するものであり得る。概して、新たな色空間は、注釈818に対応するピクセル814の色値を変更して、画像802’内のROI816に対応するピクセル814の色値からの色差を強調又は増加させ得る。色差は、注釈814に対するピクセル814内の2セットの色値と、ROI816に対するピクセル814との間の距離に対応し得る。新たな色空間は、例えば、とりわけ、色相、彩度、明度(lightness)(HSL)色モデル、色相、彩度、明度(value)(HSV)色モデル、又は色相、彩度、輝度(HCL)色モデルなどであり得る。画像802”内のピクセル814の色値は、新たな色空間に従ってもよい。
【0057】
変換中、色解釈器730は、色マッピングを適用又は使用して、画像802’内のピクセル814の元の色値に基づいて、ピクセル814の新たな色値を割り当ててもよい。色マッピングは、元の色空間(例えば、RGB)内の各対応する色値について、新たな色空間(例えば、HSV)内の色値を指定し、特定し、又は画定し得る。色解釈器730は、画像802’のピクセル814のセットを横断してもよい。各ピクセル814について、色解釈器730は、元の色空間内のピクセル814の色値を特定し得る。色解釈器730は、特定された色値の色マッピングから新たな色値を特定し得る。この特定により、色解釈器730は、画像802’内のピクセル814に対応する(例えば、同じ位置にある)画像802”内のピクセル814に新たな色値を設定又は割り当てることができる。色解釈器730は、画像802’内のピクセル814のセットを通して特定及び割り当てのプロセスを繰り返して、画像802”を作ってもよい。完了すると、色解釈器730は、画像処理システム705内の他の構成要素による処理のために、新たな色空間内のピクセル814を画像802”に提供してもよい。
【0058】
ここで、とりわけ
図8Bを参照すると、ROIを特定するためのシステム700内のROIマスクを導出するためのプロセス830のブロック図が描写されている。プロセス830は、画像802”から注釈818及びROI816を検出するためにシステム700で実施される動作に対応し得る。プロセス830の下で、画像処理システム705上で実行されるマーク認識器735は、画像802”のピクセル814のセットから注釈ピクセル832A~N(以下、概して注釈ピクセル832と称する)のセットを検出し、決定し、又は別様に選択し得る。注釈ピクセル832のセットは、注釈818に対応するピクセル814の総セットからサブセットを特定し得る。注釈ピクセル832のセットはまた、マーク付きインジケータ812と同様に、マーカを使用して作られた無関係なマークを最初に含み得る。注釈ピクセル832の選択は、変換された色空間内のピクセル814の1つ以上のピクセルの色値に基づいてもよい。注釈ピクセル832を使用して、画像802”内のROI816のピクセル位置を取り囲み、境界付け、又は別様に画定してもよい。
【0059】
選択するために、マーク認識器735は、画像802”内の各ピクセル814の色値を、試料806内のマーク付きインジケータ812又は画像802”内の注釈818の1つ以上の閾値範囲と比較してもよい。閾値範囲は、スライド上のマーク付きインジケータ812に関連付けられた色値に基づいて設定され得る。上で論じたように、マーク付きインジケータ812は、スライド806上のマーカを使用して、視認者(例えば、臨床医)によって生成され得る。マーク付きインジケータ812の色は、組織切片808、特徴810、又は試料804若しくはスライド806の残りの部分とは異なる特定の色値(例えば、赤色、青色、緑色、又は黒色)であってもよい。新たな色空間内では、マーク付きインジケータ812に対応するピクセル814の色値は、ROI816及び画像802”の残りの部分に対応するピクセル814の色値と更に区別され得る。ピクセル814の色値と比較するための各閾値範囲は、マーク付きインジケータ812に関連付けられた色値のうちの1つに対応してもよい。閾値範囲は、新たな色空間内で定義されてもよい。例えば、HSV色空間内における黒色ペンの閾値範囲は、[0,0,0]~[180,255,125]の間であってもよく、青色ペンの閾値範囲は、[100,125,30]~[130,255,及び255]の間であってもよく、緑色ペンの閾値範囲は、[40,125,30]~[70,255,255]の間であってもよい。
【0060】
この比較に基づいて、マーク認識器735は、画像802”内のピクセル814が注釈ピクセル832のうちの1つとして含まれるべきか又は選択されるべきかを決定し得る。比較する際に、マーク認識器735は、画像802”内のピクセル814のセットを横断してもよい。各ピクセル814について、マーク認識器735は、変換された色空間内の色値(例えば、HSV値)を特定してもよい。この特定により、マーク認識器735は、色値が注釈818の閾値範囲のうちの少なくとも1つ内にあるかどうかを判定し得る。色値が閾値範囲のうちの少なくとも1つ内にある場合、マーク認識器735は、ピクセル814が注釈ピクセル832の一部であると判定し得る。いくつかの実施形態では、マーク認識器735は、注釈ピクセル832に含めるようにピクセル814を選択してもよい。一方、色値がすべての閾値範囲外にある場合、マーク認識器735は、ピクセル814が注釈ピクセル832の一部ではないと判定し得る。いくつかの実施形態では、マーク認識器735は、注釈ピクセル832からピクセル814を除外してもよい。マーク認識器735は、画像802”内のピクセル814のセットを通して、比較及び選択プロセスを繰り返してもよい。
【0061】
いくつかの実施形態では、マーク認識器735は、注釈ピクセル832の少なくとも1つの境界拡張834を決定又は生成し得る。境界拡張834は、ROI816を画定又は包み込むために注釈ピクセル832の一部として含むための、追加のピクセル814に対応し得る。上述したように、画像802”において注釈818がROI816を部分的に境界付けるか又は取り囲んでいる場合がある。境界拡張834は、マーク認識器735によって生成されて、注釈ピクセル832を伸張、拡大、又は別様に増加させて、ROI816を完全に画定又は境界付けることができる。いくつかの実施形態では、マーク認識器735は、境界拡張834を生成するために、少なくとも1つのカーネル(又はフィルタ、又は関数)を少なくとも注釈ピクセル832に使用又は適用してもよい。カーネルは、注釈ピクセル832内の色値が、カーネルのサイズによって画定される画像802”内の隣接するピクセル814の数に割り当てられることを定義し得る。例えば、カーネルは、注釈ピクセル832の色値を隣接するピクセル814に拡大するために、5×5、10×10、15×15、又は20×20のピクセルサイズを有する円形フィルタであってもよい。マーク認識器735は、注釈ピクセル832を横断してカーネルを適用してもよい。適用する際に、マーク認識器735は、注釈ピクセル832の一部として含むように、カーネルに従って、隣接するピクセルの数を増加又は拡大してもよい。
【0062】
カーネルの適用により、マーク認識器735は、注釈ピクセル832が画像802”の一部分を完全に境界付けているか、又は取り囲んでいるかを判定することができる。注釈ピクセル832がROI818を完全に境界付けている場合、画像802”は、少なくとも2つの部分に分けられ得、一方の部分は、注釈ピクセル832の境界内にあり、ROI816に対応しており、もう一方の部分は、注釈ピクセル832の境界外にあり、画像802”の残りに対応している。マーク認識器735は、注釈ピクセル832を使用して、画像802”の部分を分け、区分化し、又は別様に特定し得る。注釈ピクセル832によって境界付けられた少なくとも1つの部分がある場合、マーク認識器735は、注釈ピクセル832がその部分を完全に取り囲んでいると判定し得る。それ以外の場合、注釈ピクセル832によって境界付けられた部分がない場合、マーク認識器735は、注釈ピクセル832がいかなる部分も完全に取り囲んでいないと判定し得る。マーク認識器735は、より大きいサイズのカーネルを再適用してもよく、判定を繰り返してもよい。
【0063】
いくつかの実施形態では、マーク認識器735は、注釈ピクセル832からピクセルのサブセットを選択解除、除外、又は別様に除去し得る。ピクセルのサブセットは、スライド806上の無関係なマークに対応し得る。上で論じたように、無関係なマークは、マーク付きインジケータ812を用いたのと同様にマーカで作られ得、したがって、閾値範囲に基づいて注釈ピクセル832のセットに最初に含まれ得る。無関係なマークに対応するピクセルのサブセットは、画像802”において注釈818に対応する注釈ピクセル832の残りの部分から離れて位置してもよい。ピクセルのサブセットを除去するために、マーク認識器735は、注釈ピクセル832のグループを計算、決定、又は特定し得る。各グループは、注釈ピクセル832の連続したサブセットを形成し得る。各サブセットについて、マーク認識器735は、グループ内のピクセル数を特定し得る。
【0064】
この特定により、マーク認識器735は、ピクセル数を注釈818の閾値数と比較してもよい。閾値数は、対応するピクセルのサブセットを注釈ピクセル832に含めるか又は注釈ピクセル832から除外するピクセル数の値を描写し得る。ピクセル数が閾値数を上回った(例えば、閾値以上の)場合、マーク認識器735は、注釈ピクセル832内の対応するピクセルのサブセットの包含を維持し得る。それ以外の場合、ピクセル数が閾値数を下回った(例えば、閾値未満の)場合、マーク認識器735は、注釈ピクセル832からピクセルのサブセットを除去し得る。
【0065】
注釈ピクセル832の特定により、マーク認識器735は、少なくとも1つのマーカマスク836を出力するか、作るか、又は別様に生成し得る。マーカマスク836の生成は、画像802”に基づいていてもよい。マーカマスク836は、画像802”上の注釈ピクセル832のピクセル位置を画定し得る。マーカマスク836内のピクセル位置の画定は、少なくとも1つの色値に従ってもよい。例えば、マーカマスク836は、注釈ピクセル832に対応する1つの色(例えば、黒色)と、注釈ピクセル832の外側のピクセル814に対応する別の色(例えば、無色又は白色)の、二色(例えば、黒色及び白色)であってもよい。いくつかの実施形態では、マーカマスク836は、画像802”と同じ寸法であり得る。いくつかの実施形態では、マーカマスク836は、画像802”の寸法とは異なる(例えば、画像802”より小さい)寸法であり得る。いくつかの実施形態では、マーク認識器735は、上で論じた画像802”の代わりに、マーカマスク836内の注釈ピクセル832にカーネルの適用を実施してもよい。
【0066】
いくつかの実施形態では、マーク認識器735は、マーカマスク836上で少なくとも1つのフィルタを使用又は適用し得る。フィルタとは、マーカマスク836をノイズ除去するか、平滑化するか、又はぼかすことであり得る。フィルタは、とりわけ、ノイズ除去関数(例えば、トータルバリエーションノイズ除去又はウェーブレットノイズ除去)又はぼかしフィルタ(例えば、ガウスぼかし、Anisotropic拡散、又はバイラテラルフィルタ)、又はそれらの任意の組み合わせであってもよい。適用する際に、画像作製器725は、マーカマスク836をフィルタに供給し得る。フィルタ動作に起因して、マーカマスク836内のノイズは更に低減され得る。この動作の結果、マーカマスク836内の注釈ピクセル832の画定は、マーカマスク836の残りの部分とより区別され得る。いくつかの実施形態では、マーク認識器735は、注釈ピクセル832からスライド上の無関係なマークに対応するピクセルを除去するためにフィルタを適用し得る。いくつかの実施形態では、マーク認識器735は、マーカマスク836又は注釈ピクセル832をデータベース755に記憶し、維持し得る。
【0067】
画像処理システム705上で実行される領域探索器740は、注釈ピクセル834を使用して、ROIピクセル838A~N(以下、概してROIピクセル838と称する)のセットを検出、選択、又は別様に特定し得る。注釈ピクセル832(境界拡張834を含む)は、ROI816に対応する画像802”の一部分を境界付けるピクセルを特定し得る。注釈ピクセル834を使用して、領域探索器740は、注釈ピクセル834によって境界付けられた画像802”内の一部分を特定し得る。特定された部分は、画像802”内のピクセル814の異なるサブセットに対応し得る。領域探索器740は、画像802”から特定された部分を、ROIマーカマスク840として割り当てるか又は使用してもよい。いくつかの実施形態では、領域探索器740は、注釈ピクセル832によって境界付けられたマーカマスク836の一部分を特定し得る。領域探索器740は、特定された部分を、ROIピクセル838として割り当てるか又は使用してもよい。
【0068】
注釈ピクセル834の特定により、領域探索器740は、少なくとも1つのROIマーカマスク840を出力するか、作るか、又は別様に生成し得る。ROIマーカマスク840は、画像802”内の注釈ピクセル832及びROIピクセル838の位置をピクセル化し得る。マーカマスク836内のピクセル位置の画定は、少なくとも1つの色値に従ってもよい。例えば、ROIマーカマスク836は、注釈ピクセル832又はROIピクセル838に対応する1つの色(例えば、黒色)と、注釈ピクセル832とROIピクセル838との外側のピクセル814に対応する別の色(例えば、無色又は白色)の、二色(例えば、黒色及び白色)であってもよい。ROIマーカマスク840を生成するために、領域探索器740は、マーカマスク836内にROIピクセル838を含んでもよい。いくつかの実施形態では、領域探索器740は、マーカマスク836内のピクセル位置に色値を設定又は割り当てて、ROIマーカマスク840を作るためのROIピクセル838を示し得る。いくつかの実施形態では、ROIマーカマスク840は、画像802”と同じ寸法であり得る。いくつかの実施形態では、ROIマーカマスク840は、画像802”の寸法とは異なる(例えば、画像802”より小さい)寸法であり得る。いくつかの実施形態では、領域探索器740は、データベース755に、ROIマーカマスク840、注釈ピクセル834、又はROIピクセル838を記憶し、維持し得る。
【0069】
ROIマーカマスク840を使用して、領域探索器740は、少なくとも1つのROIマスク842を出力するか、作るか、又は別様に生成し得る。ROIマスク842は、画像802”内のROIピクセル838の位置をピクセル化し得る。ROIマーカマスク836内のピクセル位置の画定は、少なくとも1つの色値に従ってもよい。例えば、ROIマーカマスク836は、ROIピクセル838に対応する1つの色(例えば、黒色)と、ROIピクセル838の外側のピクセル814に対応する別の色(例えば、無色又は白色)の、二色(例えば、黒色及び白色)であってもよい。ROIマスク842を生成するために、領域探索器740は、ROIマーカマスク840内の境界を削除、除去、又は別様に抽出し得る。境界は、ROIピクセル838を取り囲む注釈ピクセル834に対応してもよく、又は注釈ピクセル834によって画定され得る。いくつかの実施形態では、領域探索器740は、ROIマーカマスク840内のピクセル位置に色値を設定又は割り当てて、注釈ピクセル834を除去して、ROIマスク842を生成し得る。いくつかの実施形態では、ROIマスク842は、画像802”と同じ寸法であり得る。いくつかの実施形態では、ROIマスク842は、画像802”の寸法とは異なる(例えば、画像802”より小さい)寸法であり得る。いくつかの実施形態では、領域探索器740は、ROIマスク842又は注釈ピクセル834を、データベース755に記憶し、維持し得る。
【0070】
ここで、とりわけ
図8Cを参照すると、ROIを特定するためのシステム700内で注釈マークを作るためのプロセス860のブロック図が描写されている。プロセス860は、注釈818の特定を提供するためにシステム700で実施される動作に対応し得る。プロセス860の下で、画像処理システム705上で実行される前景検出器745は、画像802’から少なくとも1つの前景862を検出し、決定し、又は別様に特定し得る。前景862は、概して、試料804内の組織切片808、特徴810、及びマーク付きインジケータ812に対応する、画像802’の1つ以上の部分に対応し得る。いくつかの実施形態では、前景検出器745は、画像802’から少なくとも1つの背景864を検出し、決定し、又は別様に特定し得る。背景864は、試料804内の組織切片808、特徴810、及びマーク付きインジケータ812の、外側の部分など、画像802’の前景862の外側の部分に対応し得る。前景862又は背景864の特定は、元の色空間内の画像802又は変換された色空間内の画像802”からであってもよい。
【0071】
前景862又は背景864(又はその両方)を特定するために、前景検出器745は、画像802’(又は画像802若しくは802”)に画像閾値化動作を適用又は使用し得る。閾値化動作は、とりわけ、Otsu方式、バランスのとれたヒストグラム閾値化、又は適応閾値化を含み得る。例えば、前景検出器745は、Otsu方式を使用して、前景862に対応するピクセル814を、画像802’内の背景864に対応するピクセル814から区別してもよい。例えば、Otsu方式は、画像802’から前景862と背景864にピクセル814を分離する、単一の強度閾値を返すことができる。この閾値は、分類内の強度分散を最小化することによって、又は同等に、クラス間の分散を最大化することによって、決定され得る。
【0072】
この特定により、前景検出器745は、少なくとも1つの前景マスク866を出力するか、作るか、又は別様に生成し得る。前景マスク866は、画像802’(又は画像802若しくは802”)内の前景862のピクセル位置を画定し得る。前景マスク866内のピクセル位置の画定は、少なくとも1つの色値に従ってもよい。例えば、前景マスク866は、前景862に対応する1つの色(例えば、黒色)と、背景864(又は前景862以外)の外側のピクセル814に対応する別の色(例えば、無色又は白色)の、二色(例えば、黒色及び白色)であってもよい。いくつかの実施形態では、前景マスク866は、画像802”と同じ寸法であり得る。いくつかの実施形態では、前景マスク866は、画像802”の寸法とは異なる(例えば、画像802”より小さい)寸法であり得る。いくつかの実施形態では、マーク認識器735は、上で論じた画像802の代わりに、前景マスク866にフィルタの適用を実施して、ノイズ除去するか又はぼかしてもよい。
【0073】
画像処理システム705上で実行される注釈生成器750は、前景マスク866及びROIマスク842に基づいて、少なくとも1つの注釈マスク868を出力するか、作るか、又は別様に生成し得る。いくつかの実施形態では、注釈生成器750は、前景862及びROIピクセル838に対応するように特定されたピクセルに基づいて、注釈マスク868を生成し得る。注釈マスク868は、画像802(又は画像802若しくは802”)内のROI818のピクセル位置、及び拡張により、試料804の組織切片808内の特徴810を画定し得る。注釈マスク868は、ROIピクセル838との共通部分である画像802’に反映されるように、特徴810内のヌル部分を含み得る。いくつかの実施形態では、注釈生成器750は、前景マスク866とROIマスク842とを組み合わせて、注釈マスク868を生成し得る。
【0074】
注釈マスク868は、画像802”上の注釈ピクセル832のピクセル位置を画定し得る。注釈マスク868内のピクセル位置の画定は、少なくとも1つの色値に従ってもよい。例えば、注釈マスク868は、ROIピクセル838と前景862との共通部分に対応する1つの色(例えば、黒色)と、ROIピクセル838の外側のピクセル814に対応する別の色(例えば、無色又は白色)の、二色(例えば、黒色及び白色)であってもよい。いくつかの実施形態では、注釈マスク868は、画像802”と同じ寸法であり得る。いくつかの実施形態では、注釈マスク868は、画像802”の寸法とは異なる(例えば、画像802”より小さい)寸法であり得る。
【0075】
この生成により、注釈生成器750は、1つ以上のデータ構造(例えば、テーブル、ヒープ、リンクされたリスト、配列、又はツリー)を使用して、注釈マスク868をデータベース755に記憶し、維持し得る。いくつかの実施形態では、注釈生成器750は、画像802内のROIピクセル838とROI816との間の関連付けを生成し得る。関連付けはまた、とりわけ、ROIピクセル838、ROI816、及び注釈マスク868のうちの2つ以上と画像802との間のものであり得る。関連付けは、とりわけ、試料808、スライド806、組織切片808、又は特徴810のうちの2つ以上の特定と、ROI816、ROIピクセル838、画像802、又は注釈マスク868との間のものであり得る。生成されると、注釈生成器750は、データ構造を使用してデータベース755に関連付けを記憶し、維持し得る。いくつかの実施形態では、注釈生成器750は、データベース755にトレーニングデータセット760を備えた、データ構造を記憶し得る。加えて、注釈生成器750は、注釈マスク868をモデルトレーナシステム710に伝達し、送信し、又は別様に提供して、モデル760をトレーニングし得る。いくつかの実施形態では、注釈生成器750は、特定されたROIピクセル838をモデルトレーナシステム710に提供し得る。
【0076】
受信すると、モデルトレーナシステム710は、画像分割、画像位置特定、又は画像分類を実施することを学習するようにモデル760をトレーニングし得る。モデル760は、とりわけ、クラスタリングアルゴリズム(例えば、k近傍アルゴリズム、階層クラスタリング、分布ベースのクラスタリング)、回帰モデル(例えば、線形回帰又はロジスティック回帰)、サポートベクタマシン(SVM)、Bayesianモデル、又は人工ニューラルネットワーク(例えば、畳み込みニューラルネットワーク(CNN)、敵対的生成ネットワーク(GAN)、再帰ニューラルネットワーク(RNN)、又はトランスフォーマ)などの、機械学習(ML)モデル若しくは人工知能(AI)アルゴリズムであってもよい。概して、モデル760は、重みのセットを介して互いに関連する、入力のセット及び出力のセットを有し得る。入力は、画像802などの少なくとも1つの画像を含み得る。モデル760によって実行される機能のタイプに基づいて、出力は、とりわけ、ROI816と同様の画像内の関心領域(ROI)を特定する分割された画像、画像内にROIが存在することを特定するエリア(例えば、境界ボックス)、又は画像が導出される試料の分類を含み得る。モデルトレーナシステム710は、注釈マスク868(又はROIピクセル838)とともにトレーニングデータセット760を使用して、重みを設定し、修正し、又は別様に更新し得る。例えば、モデルトレーナシステム710は、出力とトレーニングデータセット760又は注釈マスク868との間の損失メトリックを計算してもよい。損失メトリックを使用して、モデルトレーナシステム710は、モデル760の重みを更新してもよい。
【0077】
異なる色空間及び閾値範囲を使用することによって、画像処理システム705は、画像802内のROI816を特定し、画像802の注釈マスク868を作り得る。この特定及び製作は、とりわけ、エッジ検出、ブロブ検出、アフィン不変特徴検出、又は人工ニューラルネットワーク(ANN)に依存するモデルなどの他のコンピュータビジョン技術と相対的に、計算上安価であり得る。画像処理システム705はまた、注釈818又はマーク付きインジケータ812をピクセルごとに手動で特定する必要性からユーザを解放し得る。これは、マーク付きインジケータ812を有するスライド806上のより多くの数の試料804、ひいては画像802を、様々なタスクを実施するためにモデル760をトレーニングする際に使用することを可能にし得、それにより、そのようなモデル760の性能を向上させる。
【0078】
ここで
図9を参照すると、画像内の関心領域(ROI)を特定する方法900のフロー図が描写されている。方法900は、本明細書に記載のシステム700を、
図7~
図8C又は本明細書のセクションCに詳述されているシステム1000と併せて使用して実施されてもよく、又は実装されてもよい。方法900の下で、コンピューティングシステム(例えば、画像処理システム705)は、画像(例えば、画像802)を特定し得る(905)。コンピューティングシステムは、画像を作製し得る(910)。コンピューティングシステムは、画像の色空間を変換し得る(915)。コンピューティングシステムは、ピクセル(例えば、ピクセル814)を特定し得る(920)。コンピューティングシステムは、ピクセルの色値が注釈(例えば、注釈818)の範囲内であるかどうかを判定し得る(925)。色値が範囲内である場合、コンピューティングシステムは、ピクセルを注釈の一部として選択し得る(930)。それ以外の場合、色値が範囲外である場合、コンピューティングシステムは、ピクセルを注釈の一部ではないと特定し得る(935)。
【0079】
続いて、コンピューティングシステムは、調べるための更なるピクセルが存在するかどうかを判定し得る(940)。更に存在する場合、コンピューティングシステムは、アクション(920)~(935)を繰り返し得る。そうでない場合、更なるピクセルが存在しない場合、コンピューティングシステムは、注釈の輪郭を拡張し得る(945)。コンピューティングシステムは、画像から前景(例えば、前景864)を特定し得る(950)。コンピューティングシステムは、輪郭内のピクセルを関心領域(ROI)(例えば、ROI816)として特定し得る(955)。コンピューティングシステムは、前景と組み合わせ得る(960)。コンピューティングシステムは、モデル(例えば、モデル760)をトレーニングするためのマスク(例えば、注釈マスク866)を生成し得る(965)。
【0080】
C.コンピューティング及びネットワーク環境
本明細書に記載される様々な動作は、コンピュータシステムで実装することができる。
図10は、本開示の特定の実施形態を実装するために使用可能な代表的なサーバシステム1000、クライアントコンピューティングシステム1014、及びネットワーク1026の簡略化されたブロック図を示す。様々な実施形態では、サーバシステム1000又は同様のシステムは、本明細書に記載されるサービス又はサーバ又はその一部分を実装することができる。クライアントコンピューティングシステム1014又は同様のシステムは、本明細書に記載されるクライアントを実装することができる。本明細書に記載されるシステム600は、サーバシステム1000と同様であり得る。サーバシステム1000は、いくつかのモジュール1002(例えば、ブレードサーバの実施形態におけるブレード)を組み込むモジュール設計を有することができ、2つのモジュール1002が示されているが、任意の数を提供することができる。各モジュール1002は、処理ユニット1004及びローカル記憶装置1006を含むことができる。
【0081】
処理ユニット1004は、1つ以上のコアを有することができる単一のプロセッサ、又は複数のプロセッサを含むことができる。いくつかの実施形態では、処理ユニット1004は、汎用プライマリプロセッサ、並びにグラフィックプロセッサ、デジタル信号プロセッサなどの1つ以上の特殊目的コプロセッサを含むことができる。いくつかの実施形態では、一部又はすべての処理ユニット1004は、特定用途向け集積回路(ASIC)又はフィールドプログラマブルゲートアレイ(FPGA)などのカスタマイズされた回路を使用して実装することができる。いくつかの実施形態では、そのような集積回路は、回路自体に記憶された命令を実行する。他の実施形態では、処理ユニット1004は、ローカル記憶装置1006に記憶された命令を実行することができる。任意のタイプのプロセッサは任意の組み合わせで、処理ユニット1004に含めることができる。
【0082】
ローカル記憶装置1006は、揮発性記憶媒体(例えば、DRAM、SRAM、SDRAMなど)及び/又は不揮発性記憶媒体(例えば、磁気又は光ディスク、フラッシュメモリなど)を含むことができる。ローカル記憶装置1006に組み込まれた記憶媒体は、必要に応じて、固定されていても、取り外し可能であっても、又はアップグレード可能であってもよい。ローカル記憶装置1006は、物理的又は論理的に、システムメモリ、読み取り専用メモリ(ROM)、及び永久記憶デバイスなどの様々なサブユニットに分けられ得る。システムメモリは、読み取り及び書き込みメモリデバイス、又は動的ランダムアクセスメモリなどの揮発性読み取り及び書き込みメモリであり得る。システムメモリは、処理ユニット1004が実行時に必要とする命令及びデータの一部又はすべてを記憶することができる。ROMは、処理ユニット1004によって必要とされる静的データ及び命令を記憶することができる。永久記憶装置は、モジュール1002が電源を切られたときも依然として命令及びデータを記憶することができる、不揮発性読み取り及び書き込みメモリデバイスであることができる。本明細書で使用される場合、用語「記憶媒体」には、データが無期限に記憶され得る(上書き、電気的妨害、電力損失などの影響を受ける)任意の媒体が含まれ、無線で又は有線接続を介して伝播する搬送波及び一時的な電子信号は含まれない。
【0083】
いくつかの実施形態では、ローカル記憶装置1006は、
図5のシステム500又は本明細書に記載される他のシステムの機能、又はシステム500若しくは本明細書に記載される他のシステムに関連付けられた他のサーバなどの様々なサーバ機能を実装するオペレーティングシステム及び/又はプログラムなど、処理ユニット1004によって実行される1つ以上のソフトウェアプログラムを記憶することができる。
【0084】
「ソフトウェア」は、概して、処理ユニット1004によって実行されたときに、サーバシステム1000(又はその部分)に様々な動作を実施させ、したがって、ソフトウェアプログラムの動作を実行し実施する1つ以上の特定のマシン実施形態を定義する一連の命令を指す。命令は、処理ユニット1004による実行のために揮発性作業メモリに読み込むことができる不揮発性記憶媒体に記憶された読み取り専用メモリ及び/又はプログラムコードに常駐する、ファームウェアとして記憶することができる。ソフトウェアは、単一のプログラムとして、又は必要に応じてインタラクションする別個のプログラム若しくはプログラムモジュールの集合として実装することができる。処理ユニット1004は、ローカル記憶装置1006(又は以下で記載される非ローカル記憶装置)から、上述した様々な動作を実行するために、実行するプログラム命令及び処理するデータを取得することができる。
【0085】
いくつかのサーバシステム1000において、複数のモジュール1002は、バス又は他の相互接続1008を介して相互接続され得、モジュール1002とサーバシステム1000の他の構成要素との間の通信をサポートするローカルエリアネットワークを形成する。相互接続1008は、サーバラック、ハブ、ルータなどを含む様々な技術を使用して実装することができる。
【0086】
ワイドエリアネットワーク(WAN)インターフェース1010は、ローカルエリアネットワーク(相互接続1008)と、インターネットのようなネットワーク1026との間のデータ通信能力を提供することができる。有線(例えば、イーサネット、IEEE1002.3規格)及び/又は無線技術(例えば、Wi-Fi、IEEE1002.11規格)を含む技術を使用することができる。
【0087】
いくつかの実施形態では、ローカル記憶装置1006は、相互接続1008上のトラフィックを低減しながら、処理されるプログラム及び/又はデータへの高速アクセスを提供する、処理ユニット1004に作業メモリを提供することを意図している。相互接続1008に接続することができる1つ以上の大容量記憶サブシステム1012によって、より大量のデータ向けの記憶域がローカルエリアネットワーク上に提供され得る。大容量記憶サブシステム1012は、磁気、光学、半導体、又は他のデータ記憶媒体に基づくことができる。ダイレクトアタッチドストレージ、ストレージエリアネットワーク、ネットワークアタッチドストレージなどを使用することができる。サービス又はサーバによって作られ、消費され、又は維持されるものとして本明細書に記載される任意のデータストア又は他のデータ集合体は、大容量記憶サブシステム1012に記憶され得る。いくつかの実施形態では、追加のデータ記憶リソースは、WANインターフェース1010を介してアクセスされ得る(潜在的にレイテンシが増加する)。
【0088】
サーバシステム1000は、WANインターフェース1010を介して受信された要求に応答して動作することができる。例えば、モジュール1002の1つは、受信された要求に応答して、監督機能を実装し、個別のタスクを他のモジュール1002に割り当てることができる。作業割り当て技術が使用されてもよい。要求が処理されると、結果は、WANインターフェース1010を介して要求者に返され得る。そのような動作は、概して自動化することができる。更に、いくつかの実施形態では、WANインターフェース1010は、複数のサーバシステム1000を互いに接続することができ、大量の活動を管理することができるスケーラブルなシステムを提供する。動的リソース割り当て及び再割り当てを含む、サーバシステム及びサーバファーム(協働するサーバシステムの集合)を管理するための他の技術を使用することができる。
【0089】
サーバシステム1000は、インターネットなどの広域ネットワークを介して、様々なユーザ所有又はユーザ操作のデバイスとインタラクションすることができる。ユーザ操作デバイスの一例は、
図10にクライアントコンピューティングシステム1014として示される。クライアントコンピューティングシステム1014は、例えば、スマートフォン、他の携帯電話、タブレットコンピュータ、ウェアラブルコンピューティングデバイス(例えば、スマートウォッチ、眼鏡)、デスクトップコンピュータ、ラップトップコンピュータなどの消費者デバイスとして実装され得る。
【0090】
例えば、クライアントコンピューティングシステム1014は、WANインターフェース1010を介して通信することができる。クライアントコンピューティングシステム1014は、処理ユニット1016、記憶デバイス1018、ネットワークインターフェース1020、ユーザ入力デバイス1022、及びユーザ出力デバイス1024などのコンピュータ構成要素を含むことができる。クライアントコンピューティングシステム1014は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、他のモバイルコンピューティングデバイス、ウェアラブルコンピューティングデバイスなどの様々なフォームファクタで実装されるコンピューティングデバイスであり得る。
【0091】
処理ユニット1016及び記憶デバイス1018は、上述した処理ユニット1004及びローカル記憶装置1006と同様であり得る。好適なデバイスは、クライアントコンピューティングシステム1014で発行される要望に基づいて選択されてもよく、例えば、クライアントコンピューティングシステム1014は、処理能力が限られた「シン(thin)」クライアントとして、又はハイパワーコンピューティングデバイスとして実施されてもよい。クライアントコンピューティングシステム1014は、処理ユニット1016によって実行可能なプログラムコードでプロビジョニングされて、サーバシステム1000との様々なインタラクションを可能にすることができる。
【0092】
ネットワークインターフェース1020は、サーバシステム1000のWANインターフェース1010も接続されている広域ネットワーク(例えば、インターネット)などのネットワーク1026への接続を提供することができる。様々な実施形態では、ネットワークインターフェース1020は、有線インターフェース(例えば、イーサネット)及び/又はWi-Fi、Bluetooth、若しくはセルラデータネットワーク規格(例えば、3G、4G、LTEなど)といった様々なRFデータ通信規格を実装する無線インターフェースを含むことができる。
【0093】
ユーザ入力デバイス1022は、任意のデバイス(又は複数のデバイス)を含むことができ、それを介してユーザはクライアントコンピューティングシステム1014に信号を提供することができ、クライアントコンピューティングシステム1014は、特定のユーザ要求又は情報を示すものとして信号を解釈することができる。様々な実施形態では、ユーザ入力デバイス1022は、キーボード、タッチパッド、タッチスクリーン、マウス又は他のポインティングデバイス、スクロールホイール、クリックホイール、ダイヤル、ボタン、スイッチ、キーパッド、マイクなどのいずれか又はすべてを含むことができる。
【0094】
ユーザ出力デバイス1024は、クライアントコンピューティングシステム1014がユーザに情報を提供することができる任意のデバイスを含むことができる。例えば、ユーザ出力デバイス1024は、クライアントコンピューティングシステム1014によって生成された、又はクライアントコンピューティングシステム1014に配信された画像を表示するための表示装置を含むことができる。表示装置は、様々な画像生成技術、例えば、液晶表示装置(LCD)、有機発光ダイオード(OLED)を含む発光ダイオード(LED)、投影システム、陰極線管(CRT)などを、支持電子機器(例えば、デジタル-アナログ又はアナログ-デジタル変換器、信号プロセッサなど)とともに組み込むことができる。いくつかの実施形態は、入力及び出力デバイスの両方として機能するタッチスクリーンなどのデバイスを含み得る。いくつかの実施形態では、表示装置に加えて、又は表示装置の代わりに、他のユーザ出力デバイス1024が提供され得る。例として、インジケータライト、スピーカ、触覚「ディスプレイ」デバイス、プリンタなどが挙げられる。
【0095】
いくつかの実施形態は、コンピュータ可読記憶媒体にコンピュータプログラム命令を記憶するマイクロプロセッサ、記憶装置及びメモリなどの電子構成要素を含む。本明細書に記載される特徴の多くは、コンピュータ可読記憶媒体上に符号化されたプログラム命令のセットとして指定されたプロセスとして実施することができる。これらのプログラム命令が1つ以上の処理ユニットによって実行されたときに、それらの処理ユニットは、処理ユニットに、プログラム命令に示される様々な動作を実施させる。プログラム命令又はコンピュータコードの例として、コンパイラによって作られるようなマシンコード、及びインタプリタを使用してコンピュータ、電子構成要素、若しくはマイクロプロセッサによって実行される高レベルコードを含むファイルが挙げられる。好適なプログラミングを通じて、処理ユニット1004及び1016は、サーバシステム1000及びクライアントコンピューティングシステム1014に、サーバ若しくはクライアントによって実施されているものとして本明細書に記載される機能又は他の機能のいずれかを含む様々な機能を提供することができる。
【0096】
サーバシステム1000及びクライアントコンピューティングシステム1014は例示的であり、変形形態及び修正形態が可能であることが理解されるであろう。本開示の実施形態に関連して使用されるコンピュータシステムは、本明細書に具体的に記載されていない他の能力を有することができる。更に、サーバシステム1000及びクライアントコンピューティングシステム1014が特定のブロックを参照して記載されているが、これらのブロックが説明の便宜のために定義されており、構成要素部分の特定の物理的配置を暗示することを意図したものではないことが理解されよう。例えば、異なるブロックを同じ施設、同じサーバラック、又は同じマザーボードに位置させることができるが、必ずしもそこに位置させる必要はない。更に、ブロックは、物理的に別個の構成要素に対応する必要はない。ブロックは、例えば、プロセッサをプログラミングすることによって、又は適切な制御回路を提供することによって、様々な動作を実施するように構成することができ、様々なブロックは、初期構成が取得される方法に応じて再構成可能であっても、再構成可能でなくてもよい。本開示の実施形態は、回路及びソフトウェアの任意の組み合わせを使用して実装される電子デバイスを含む様々な装置において実現することができる。
【0097】
本開示は、特定の実施形態に関して説明されてきたが、当業者であれば、多数の修正が可能であることを認識するであろう。本開示の実施形態は、本明細書に記載される特定の実施例を含むがこれらに限定されない、様々なコンピュータシステム及び通信技術を使用して実現することができる。本開示の実施形態は、専用構成要素及び/又はプログラマブルプロセッサ及び/又は他のプログラマブルデバイスの任意の組み合わせを使用して実現することができる。本明細書に記載される様々なプロセスは、任意の組み合わせで同じプロセッサ又は異なるプロセッサで実施され得る。構成要素が特定の動作を実施するように構成されている、と記載される場合、そのような構成は、例えば、動作を実施するように電子回路を設計することによって、動作を実施するようにプログラム可能な電子回路(マイクロプロセッサなど)をプログラミングすることによって、又はそれらの任意の組み合わせによって達成することができる。更に、上述した実施形態は、特定のハードウェア及びソフトウェア構成要素を参照し得るが、当業者であれば、ハードウェア及び/又はソフトウェア構成要素の異なる組み合わせもまた使用され得ること、及びハードウェアに実装されていると記載される特定の動作が、ソフトウェアでも実装され得るかその逆もまた同様であり得ることを理解するであろう。
【0098】
本開示の様々な特徴を組み込んだコンピュータプログラムは、様々なコンピュータ可読記憶媒体に符号化され、記憶されてもよく、好適な媒体として、磁気ディスク又はテープ、コンパクトディスク(CD)若しくはDVD(デジタル多用途ディスク)などの光学記憶媒体、フラッシュメモリ、及び他の非一時的媒体が挙げられる。プログラムコードで符号化されたコンピュータ可読媒体は、互換性のある電子デバイスとともにパッケージ化されてもよく、又はプログラムコードは、電子デバイスとは別に(例えば、インターネットダウンロードを介して、又は別々にパッケージ化されたコンピュータ可読記憶媒体として)提供されてもよい。
【0099】
このように、本開示を特定の実施形態に関して説明してきたが、本開示が添付の特許請求の範囲内のすべての修正形態及び等価物を網羅することを意図していることが理解されるであろう。
【国際調査報告】