(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】特表2018-532441(P2018-532441A)
(43)【公表日】2018年11月8日
(54)【発明の名称】脳腫瘍を分類するための視覚表現学習
(51)【国際特許分類】
A61B 1/045 20060101AFI20181012BHJP
G06T 7/00 20170101ALI20181012BHJP
A61B 5/00 20060101ALI20181012BHJP
G06N 99/00 20100101ALI20181012BHJP
A61B 10/00 20060101ALI20181012BHJP
A61B 1/00 20060101ALI20181012BHJP
【FI】
A61B1/045 614
G06T7/00 350B
G06T7/00 614
A61B5/00 G
G06N99/00 153
A61B10/00 T
A61B1/00 525
【審査請求】有
【予備審査請求】未請求
【全頁数】26
(21)【出願番号】特願2018-505708(P2018-505708)
(86)(22)【出願日】2016年7月22日
(85)【翻訳文提出日】2018年3月1日
(86)【国際出願番号】US2016043466
(87)【国際公開番号】WO2017023569
(87)【国際公開日】20170209
(31)【優先権主張番号】62/200,678
(32)【優先日】2015年8月4日
(33)【優先権主張国】US
(81)【指定国】
AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JP,KE,KG,KN,KP,KR,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT,TZ,UA,UG,US
(71)【出願人】
【識別番号】517298149
【氏名又は名称】シーメンス アクティエンゲゼルシャフト
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(72)【発明者】
【氏名】サブハブラタ・バッタチャリヤ
(72)【発明者】
【氏名】テレンス・チェン
(72)【発明者】
【氏名】アリ・カーメン
(72)【発明者】
【氏名】シャンフイ・スン
【テーマコード(参考)】
4C117
4C161
5L096
【Fターム(参考)】
4C117XB09
4C117XD03
4C117XE42
4C117XF12
4C117XF13
4C117XG01
4C117XG02
4C117XJ17
4C117XL01
4C161AA23
4C161JJ08
4C161YY07
4C161YY12
5L096AA06
5L096BA06
5L096BA13
5L096CA01
5L096GA55
5L096HA09
5L096JA11
5L096KA04
5L096MA07
(57)【要約】
独立部分空間解析(ISA)を使用して、脳腫瘍分類のCLE画像に対してフィルタカーネルを学習させる(42)。畳み込み(46)およびスタッキングを、ISAを用いた教師なし学習(44、48)に使用して、フィルタカーネルを抽出する。分類器は、フィルタカーネルを使用して抽出した特徴に基づいて、CLE脳画像を分類するようにトレーニングされる(56)。結果として得られたフィルタカーネルおよびトレーニング済みの分類器を使用して(60、64)、神経外科的切除中の、またはその一部としての、脳腫瘍発生の診断を支援する。分類は、CLEで検査した脳組織が健康であるか否か、および/または腫瘍の種類を医師が検出するのを支援してもよい。
【特許請求の範囲】
【請求項1】
医用画像システムにおいて脳腫瘍を分類する方法であって、
患者の脳の共焦点レーザー顕微内視鏡画像から局所的特徴を抽出するステップ(60)であって、前記局所的特徴が、第1の層および第2の層それぞれにおける独立部分空間解析から学習したフィルタを使用して抽出され、前記第2の層が、前記第1の層からの出力と前記画像との畳み込みに基づく、ステップ(60)と、
前記局所的特徴をコード化するステップ(62)と、
前記コード化した局所的特徴からの機械学習済みの分類器を用いて、前記画像が腫瘍を含むか否かを示す分類を行うステップ(64)と、
前記分類を表す画像を生成するステップ(66)とを含む、方法。
【請求項2】
抽出するステップ(60)がフィルタ処理済み画像を生成するステップ(66)を含み、コード化するステップ(62)が、前記フィルタ処理済み画像に対して主成分解析、k平均解析、クラスタ化、またはbag-of-wordsを実施するステップを含む、請求項1に記載の方法。
【請求項3】
分類を行うステップ(64)が、サポートベクターマシン分類器を含む前記機械学習済みの分類器を用いて分類を行うステップ(64)を含む、請求項1に記載の方法。
【請求項4】
分類を行うステップ(64)が、前記画像が多形神経膠芽腫、髄膜腫、または多形神経膠芽腫および髄膜腫を含むか否かを分類するステップ(64)を含む、請求項1に記載の方法。
【請求項5】
前記画像を生成するステップ(66)が、前記腫瘍を有する画像を示すステップを含む、請求項1に記載の方法。
【請求項6】
独立部分空間解析から学習したものとして抽出するステップ(60)が、前記フィルタのフィルタカーネルを用いて前記画像をフィルタ処理するステップを含み、前記フィルタ処理の出力が前記局所的特徴である、請求項1に記載の方法。
【請求項7】
独立部分空間解析から学習したものとして抽出するステップ(60)が、前記第1の層および第2の層で逐次的に学習させた前記フィルタを用いてフィルタ処理するステップを含み、前記第1の層が、前記独立部分空間解析を用いて学習させた出力としてのパッチを含み、前記パッチに前記画像が畳み込まれ、前記畳み込みの結果が前記第2の層に入力される、請求項1に記載の方法。
【請求項8】
複数の共焦点レーザー顕微内視鏡画像の1つとして前記画像を獲得するステップ(58)であって、前記1つの画像がフレームエントロピーに基づいて前記複数の画像から選択される、ステップ(58)を更に含む、請求項1に記載の方法。
【請求項9】
医療システムにおいて脳腫瘍分類を学習する方法であって、
1つ以上の共焦点レーザー顕微内視鏡を用いて、腫瘍状脳組織および健康な脳組織を表す共焦点レーザー顕微内視鏡画像を獲得するステップ(40)と、
前記医療システムの機械学習コンピュータによって、独立部分空間解析を用いて複数の層それぞれの画像に対する教師なし学習を実施するステップ(42)であって、前記層中の前記学習が貪欲に実施される、ステップ(42)と、
フィルタによって、前記教師なし学習からのフィルタカーネル出力を用いて前記画像をフィルタ処理するステップ(50)と、
前記画像をフィルタ処理済みとしてコード化するステップ(52)と、
前記コード化(52)の出力をプーリングするステップ(54)と、
前記医療システムの前記機械学習コンピュータによって、機械学習を用いて、入力ベクトルとしての前記出力の前記プーリングに基づいて、前記腫瘍状脳組織を表す前記画像と、前記健康な脳組織を表す前記画像とを区別するように分類器をトレーニングするステップ(56)とを含む、方法。
【請求項10】
獲得するステップ(40)が、前記共焦点レーザー顕微内視鏡のうち異なるものを用いて異なる患者から獲得するステップ(40)を含む、請求項9に記載の方法。
【請求項11】
実施するステップ(42)が、前記入力ベクトルについての特徴を抽出するステップを含む、請求項9に記載の方法。
【請求項12】
実施するステップ(42)が、前記画像の階層表現を学習させるステップ(44、48)を含む、請求項9に記載の方法。
【請求項13】
実施するステップ(42)が、前記層のうち第1の層において前記独立部分空間解析を用いて前記画像から複数のパッチを学習させるステップ(44)と、前記パッチに前記画像を畳み込むステップ(46)と、前記独立部分空間解析を用いて前記畳み込みの結果から前記フィルタカーネルを学習させるステップ(48)とを含む、請求項9に記載の方法。
【請求項14】
前記独立部分空間解析を用いて前記フィルタカーネルおよび前記パッチを学習させるステップ(44、48)がそれぞれ、多層ネットワークにおける平方および平方根の非線形性を用いて学習させるステップを含む、請求項13に記載の方法。
【請求項15】
前記第2の層における前記教師なし学習の前に、主成分解析を用いて前記教師なし学習の第1の層の出力を白色化するステップを更に含む、請求項9に記載の方法。
【請求項16】
フィルタ処理するステップ(50)が畳み込むステップを含み、コード化するステップ(52)が、クラスタ化するかまたは主成分解析を実施するステップを含む、請求項9に記載の方法。
【請求項17】
コード化するステップ(52)が語彙を抽出するステップを含み、プーリングするステップが、前記語彙を用いてフィルタ処理したものとして前記画像を定量化するステップを含む、請求項9に記載の方法。
【請求項18】
トレーニングするステップ(56)が、粗いグリッド検索を使用して選ばれたパラメータを使用して、放射基底関数カーネルを用いてサポートベクターマシンをトレーニングするステップ(56)を含む、請求項9に記載の方法。
【請求項19】
患者の脳組織の画像を獲得するように構成された共焦点レーザー顕微内視鏡(12)と、
前記画像に複数のフィルタカーネルを畳み込むように構成されたフィルタ(14)であって、前記フィルタカーネルが、第1の段階に対する学習済みカーネルの階層からの機械学習済みカーネルを含み、前記畳み込みが、前記画像と、前記第1の段階からの前記学習済みカーネルとの畳み込みであり、前記フィルタカーネルが前記畳み込みの結果の入力から学習している、フィルタ(14)と、
前記画像と前記フィルタカーネルとの前記畳み込みに基づいて、前記画像を分類するように構成された、機械学習済みの分類器(16)と、
前記分類の結果を表示するように構成されたディスプレイ(18)とを備える、医療システム(11)。
【請求項20】
前記学習済みカーネルおよび前記フィルタカーネルが、独立部分空間解析を学習させたカーネルを含む、請求項19に記載の医療システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本特許文書は、米国特許法第119条(e)項に基づき、2015年8月4日出願の米国仮特許出願第62/200,678号の出願日の利益を主張し、該出願を参照により本明細書に組み込む。
【背景技術】
【0002】
本実施形態は、脳腫瘍の画像の分類に関する。共焦点レーザー顕微内視鏡(CLE)は、腫瘍に関して脳組織を検査するインビボ画像診断技術に代わるものである。CLEによって、従来は組織学的スライスに対してのみ可能であった規模で、身体組織のリアルタイム検査が可能になる。神経外科的切除はこの技術を初期に採択した分野の1つであり、ここでは、プローブまたは顕微内視鏡を使用してヒトの脳内の腫瘍(例えば、硬膜、後頭葉皮質、頭頂葉皮質、もしくは他の場所)を手作業で特定することがタスクである。しかしながら、このタスクは、現在の技術が発生期状態であることを考慮すると、非常に時間がかかりエラーを起こしやすい。
【0003】
更に、多形神経膠芽腫は生存率がわずか5%の侵襲性悪性小脳腫瘍であるため、小脳組織分類に自動画像認識技術を採用することの要求が高まってきている。膠芽腫および髄膜腫に冒された組織はそれぞれ、通常、鋭い顆粒状パターンおよび平滑な均質パターンによって特徴付けられる。しかしながら、現在のCLE画像診断システムは解像度が低く、また両方の種類のパターンが探索範囲の健康な組織に存在することと相まって、共通の画像分類アルゴリズムで腫瘍の種類ならびに/または腫瘍性組織および健康な組織を区別することは非常に困難である。
図1Aおよび
図1Bは、それぞれ多形神経膠芽腫および髄膜腫と診断された異なる患者の小脳組織から得た、CLE画像サンプルを示している。
図1Cは、健康な死体の小脳組織のCLE画像サンプルを示している。
図1A〜
図1Cで分かるように、顆粒状パターンおよび均質パターンの両方が異なる画像に存在するので、CLE画像の限定下での視覚的な違いは明白ではない。
【0004】
CLE画像の自動解析は、bag-of-visual wordsに基づいた一般画像分類技術を採用している。この技術においては、異なる腫瘍を含む画像が収集され、トレーニングステップの一部として、それらから低レベルの特徴(画像パッチの特徴的な性質)が抽出される。トレーニングセットにおける全ての画像から、次に、視覚単語としても知られる代表的な特徴が、語彙または辞書学習を使用して、通常は教師なしクラスタ化または教師あり辞書学習技術のどちらかによって取得される。その後、収集されたトレーニング画像それぞれを、語彙中の視覚単語のバッグまたは集合として、統一された形で表す。これに続いて、サポートベクターマシン(SVM)またはランダムフォレスト(RF)などのトレーニング分類器が、各画像の統一された表現を使用する。ラベルなしの画像を所与として、特徴が抽出され、次いで画像が、既に学習済みの視覚単語の形で表される。最後に、表現が事前トレーニング済みの分類器に入力され、その分類器が、事前に観察されたトレーニング画像との類似性に基づいて所与の画像のラベルを予測する。しかしながら、分類の精度は要求されるよりも低い。
【発明の概要】
【課題を解決するための手段】
【0005】
脳腫瘍分類のためのシステム、方法、およびコンピュータ可読媒体が提供される。独立部分空間解析(ISA)を使用して、CLE画像のフィルタカーネルが学習される。畳み込みおよびスタッキングを、ISAを用いた教師なし学習に使用して、フィルタカーネルが抽出される。分類器は、フィルタカーネルを使用して抽出した特徴に基づいて、CLE画像を分類するようにトレーニングされる。結果として得られたフィルタカーネルおよびトレーニング済みの分類器を使用して、神経外科的切除中の、またはその一部としての、脳腫瘍発生の診断を支援する。分類は、CLEで検査した脳組織が健康であるか否か、および/または腫瘍の種類を医師が検出するのを支援してもよい。
【0006】
第1の態様では、医用画像システムにおいて脳腫瘍を分類する方法が提供される。局所的特徴が、患者の脳の共焦点レーザー顕微内視鏡画像から抽出される。局所的特徴は、第1および第2の層それぞれにおける独立部分空間解析から学習したフィルタを使用して抽出され、第2の層は、第1の層からの出力と画像との畳み込みに基づく。局所的特徴はコード化される。機械学習済みの分類器が、コード化された局所的特徴から分類を行う。分類は、画像が腫瘍を含むか否かを示す。分類を表す画像が生成される。
【0007】
第2の態様では、医療システムにおいて脳腫瘍分類を学習する方法が提供される。1つ以上の共焦点レーザー顕微内視鏡が、腫瘍状脳組織および健康な脳組織を表す共焦点レーザー顕微内視鏡画像を獲得する。医療システムの機械学習コンピュータが、独立部分空間解析を用いて複数の層それぞれの画像に対する教師なし学習を実施する。層内の学習は貪欲(greedily)に実施される。フィルタが、教師なし学習からのフィルタカーネル出力を用いて画像をフィルタ処理する。一実施形態では、フィルタ処理済みの画像はコード化される。コード化の出力はプールされる。別の実施形態では、フィルタ処理済みの出力はコード化なしでプールされる。医療システムの機械学習コンピュータは、機械学習を用いて、入力ベクトルとしての出力のプーリングに基づいて、腫瘍状脳組織を表す画像と、健康な脳組織を表す画像とを区別するように、分類器をトレーニングする。
【0008】
第3の態様では、医療システムは、患者の脳組織の画像を獲得するように構成された共焦点レーザー顕微内視鏡を含む。フィルタは、画像に複数のフィルタカーネルを畳み込むように構成される。フィルタカーネルは、第1の段階に対する学習済みフィルタカーネルの階層からの機械学習済みカーネルであり、畳み込みは第1の段階からの学習済みフィルタカーネルとの畳み込みであり、フィルタカーネルは畳み込みの結果の入力から学習している。機械学習済みの分類器は、画像とフィルタカーネルとの畳み込みに基づいて、画像を分類するように構成される。ディスプレイは、分類の結果を表示するように構成される。
【0009】
上述した態様のうち任意の1つ以上を単独で、または組み合わせで使用してもよい。これらおよび他の態様、特徴、ならびに利点は、以下の好ましい実施形態の詳細な説明を添付図面と併せ読むことによって明白となるであろう。本発明は、以下の特許請求の範囲によって定義され、このセクションにおけるいかなるものも、それらの特許請求の範囲に対する限定と見なされるべきではない。本発明の更なる態様および利点について、好ましい実施形態と併せて以下で考察するが、後述において独立してまたは組み合わせで請求されることがある。
【0010】
構成要素および図面は必ずしも縮尺通りではなく、その代わりに、実施形態の原理を例証するために強調がなされている。更に、図面中では、様々な図全てを通して、同様の参照番号は対応する部分を指定する。
【図面の簡単な説明】
【0011】
【
図1A】多形神経膠芽腫を含むCLE画像の例を示す図である。
【
図1B】髄膜腫を含むCLE画像の例を示す図である。
【
図1C】健康な組織を含むCLE画像の例を示す図である。
【
図2】教師なし学習を用いて特徴を学習し、学習した特徴に基づいて分類器をトレーニングする方法の一実施形態を示すフローチャートである。
【
図4】CLEに基づく分類器トレーニングの入力データの例を示す表である。
【
図5】異なるフィルタカーネルサイズと関連付けられた学習済みフィルタカーネルの例を示す模式図である。
【
図6】異なるフィルタカーネルサイズと関連付けられた学習済みフィルタカーネルの例を示す模式図である。
【
図7】CLE画像の脳腫瘍分類に対して、学習済みの入力特徴を使用して学習済み分類器を適用する方法の一実施形態を示すフローチャートである。
【
図8】異なる分類に対する結果の比較を示す図である。
【
図9】異なる分類に対する結果の比較を示す図である。
【
図10】脳腫瘍分類に関する医療システムの一実施形態を示すブロック図である。
【発明を実施するための形態】
【0012】
CLE画像の現在の制限下で腫瘍に冒された領域の視覚的特性を明確に理解することは非常に困難であるため、より効率的なデータ駆動の視覚表現学習戦略が使用される。類似性が低い画像であっても画像を効率的に表すために使用されるフィルタの網羅的なセットが、トレーニングデータから暗黙的に学習される。学習済みの表現は、パラメータを更に調整することなく、任意の分類器の入力として使用される。
【0013】
1つ以上の特徴の質は、多くの画像解析タスクにとって重要である。有用な特徴は、機械学習を使用して生データから構築されてもよい。機械の関与によって、人間と比較して有用な特徴をより良好に区別または特定することができる。画像に関する多量の可能な特徴および様々な画像源を所与として、機械学習のアプローチは手動プログラミングよりも堅牢である。
【0014】
生画像データから特徴を構築するために、ネットワークフレームワークが提供される。抽出されたハールウェーブレットまたは局所二値パターン(LBP)など、事前プログラミングされた特徴のみを使用するのではなく、分類に関して特徴を学習するのにネットワークフレームワークが使用される。例えば、腫瘍状脳組織の検出では、局所的特徴を学習させる。局所的特徴を強化するフィルタは、任意の数の層において学習させる。1つの層からの出力に入力画像が畳み込まれて、次の層に対する入力が提供される。各連続層の入力がその前の層からの結果である場合、第3、第4、または第5の層を貪欲に追加するなど、2つ以上の層が使用される。畳み込みを用いて層間を遷移するように異なる層の教師なし学習をスタッキングすることによって、認識タスクに有効なデータの堅牢な階層表現を学習させる。学習プロセスは、任意の数の層または深さを有するネットワークを用いて実施される。最後に、1つ以上の層からの学習済みフィルタを使用して、分類のための入力ベクトルとして情報を抽出する。脳腫瘍分類に関する最適な視覚表現は、教師なし技術を使用して学習させる。分類器は、学習済みフィルタからの入力ベクトルに基づいて、脳組織の画像を分類するようにトレーニングされる。
【0015】
一実施形態では、CLE画像の分類によって外科医を支援して、外科的切除中に組織学的スケールで脳組織をリアルタイムで検査してもよい。腫瘍がある組織領域と健康な組織領域との信号対雑音比が低いため、CLE画像の分類は困難な問題である。更に、分類アルゴリズムをトレーニングするのに現在利用可能な臨床データは明確な注釈が付けられていない。したがって、市販の画像表現アルゴリズムは、分類のために必要とされる重要な情報を取り込めないことがある。この仮説は、一般的な視覚認識の問題における顕著な成功を実証する、教師なし画像表現学習を調査する動機付けとなる。データ駆動の表現は教師なし技術を使用して学習され、それによって明確な注釈付きデータの必要性が軽減される。例えば、独立部分空間解析と呼ばれる教師なしアルゴリズムを畳み込みニューラルネットワークフレームワークに使用して、学習済み表現の堅牢性を向上させる。予備実験は、計算効率に対する犠牲は無視できる程度で、脳腫瘍分類タスクに対する最新のアルゴリズムに対して5〜8%の改善を示している。
【0016】
図2は、医療システムにおいて脳腫瘍分類を学習する方法を示している。
図3は、
図2の方法の一実施形態を示している。CLE画像における様々な種類の腫瘍と健康な組織との類似性に対処するために、分類器をトレーニングする入力ベクトルを導き出すように1つ以上のフィルタを学習する。分類のための入力ベクトルのこの教師なし学習により、腫瘍の種類、ならびに/または健康な組織および腫瘍を互いにより良好に区別する分類が可能になり得る。弁別的表現は画像から学習させる。
【0017】
図2および
図3は、医療システムの機械によって、脳組織の状態を区別する1つ以上の特徴を学習する方法、ならびに/または1つ以上の特徴に基づいて分類器を学習する方法を示している。この学習された1つ以上の特徴、および/またはトレーニング済みの分類器は、機械が分類を行うのに使用されてもよい(
図7を参照)。
【0018】
機械学習プロセッサ、コンピュータ、またはサーバなどの機械が、動作のいくつかまたは全てを実現する。1つ以上のCLE画像を獲得するためにCLEプローブが使用される。機械は次に、CLE画像および/またはグラウンドトゥルース(注釈付きの腫瘍があるかどうか)から学習する。
図10のシステムは一実施形態における方法を実現する。ユーザは、プロセッサによるトレーニング用の画像ファイルを選択するか、またはプロセッサによる特徴および分類器の学習に用いる画像を選択してもよい。機械の使用によって、人間では効率的に扱えないことがあるか、必要な時間フレーム内で人間が扱うことが現実的ではないことがあるか、または更には微細な点および/もしくはタイミングが理由で人間には不可能なことがある、多量の情報(例えば、ピクセル数の多い画像および/または多数の画像)を処理することが可能になる。
【0019】
方法は図示される順序で提供されるが、他の順序が提供されてもよい。追加の、異なる、またはより少数の動作が提供されてもよい。例えば、
図1の動作44、46、および/または48が提供されない。別の例として、動作56が提供されない。更なる他の例として、画像を捕捉する動作および/または検出した情報を使用する動作が提供される。別の実施形態では、動作52および54は提供されない。その代わりに、分類器は、フィルタ処理済み画像、またはフィルタ処理済み画像から抽出した他の特徴を使用してトレーニングされる。動作52は、フィルタ処理済み画像がコード化なしでプールされる場合など、他の実施形態では実施されなくてもよい。
【0020】
動作40で、CLE画像を獲得する。画像は、データベース、複数の患者記録、CLEプローブ、および/または他の供給源から獲得される。画像は、メモリからロードされるか、またはメモリ内でアクセスされる。別の方法として、またはそれに加えて、CLEプローブまたは画像保管通信サーバ(PACS)などの任意の供給源から、ネットワークインターフェースを通じて画像を受信する。
【0021】
画像は、患者をスキャンすることによって、ならびに/または過去のスキャンから受信されてもよい。同じまたは異なるCLEプローブが画像を獲得するのに使用される。画像は生きている患者からのものである。あるいは、トレーニング用の画像の一部または全ては死体からのものである。死体のCLE画像診断は、同じまたは異なるプローブを用いて実施される。画像は、多くの異なる人間および/または多くの脳組織画像診断サンプルからのものである。画像は脳組織を表す。画像の異なる部分集合は、(1)健康な脳組織および腫瘍状脳組織、ならびに/または(2)異なるタイプの腫瘍状脳組織など、異なる状態の脳組織を表す。
【0022】
一実施形態では、市販の臨床用顕微内視鏡(例えば、フランス国パリ所在のMauna Kea Technologies製のCellvizio)が、CLE画像診断用として使用される。レーザー走査ユニット、ソフトウェア、フラットパネルディスプレイ、および光ファイバープローブは、直径160μmの円形視野を提供するが、他の構造および/または視野が使用されてもよい。CLEデバイスは、内視鏡によってアクセスされる解剖学的管路内の組織の内部微細構造を画像診断するためのものである。システムは、光学生検と呼ばれる、疑わしい病変の表面下構造を解析するために、内視鏡処置中に臨床的に使用される。外科的切除用途では、神経外科医は、手持ち式のプローブを手術層(例えば、対象の脳組織)に挿入して、切除すべき腫瘍組織の残りを検査する。過去の切除の間に獲得された画像がトレーニングデータとして蓄積されてもよい。
【0023】
図4は、トレーニング用に獲得されたCLE画像の集合の一例を説明する表である。画像は4つのバッチで収集されているが、他のバッチ数が使用されてもよい。最初の3つのバッチは、膠芽腫(GBM)および髄膜腫(MNG)の発生を描写するビデオサンプルを含む。最後のバッチは、死体の頭部から収集した健康な組織サンプルを有する。他の腫瘍源および/または他の種類の腫瘍が使用されてもよい。トレーニングの場合、注釈はフレームレベルでのみ利用可能であり(即ち、腫瘍に冒された領域は画像内で注釈を付けられない)、パターン認識アルゴリズムが局所化された弁別情報を活用することが、より一層困難になっている。任意の数のビデオが各バッチに提供される。各ビデオの任意の数の画像フレームが提供されてもよい。
【0024】
ビデオが使用される場合、画像のいくつかは有用な情報を含まないことがある。CLEデバイスの画像診断能力が限定されているため、または脳腫瘍組織の本質的な性質により、結果として得られる画像は、カテゴリー的情報をほとんど含まない場合が多く、認識アルゴリズムにとって有用ではない。一実施形態では、これらの画像の影響を限定するために、画像が除去される。所望の画像が選択される。画像エントロピーを使用して、画像の情報コンテンツが定量的に決定される。低エントロピー画像は、コントラストが低く、画素の連なりが大きく、その値は高エントロピー画像と同じまたは同様である。情報価値がないビデオフレームをフィルタ処理するために、各フレームまたは画像のエントロピーが計算され、エントロピー閾値と比較される。任意の閾値が使用されてもよい。例えば、データセットにわたるエントロピー分布が使用される。閾値は、トレーニング用に十分な(例えば、数百もしくは数千の)画像またはフレームを残すように選択される。例えば、
図4のデータセットでは、4.05の閾値が使用される。代替実施形態では、画像またはフレームの低減は提供されず、または他のアプローチが使用される。
【0025】
動作42で、医療システムの機械学習コンピュータ、プロセッサ、または他の機械が、画像に対して教師なし学習を実施する。画像は、教師なし学習に対する入力として、特徴を決定するのに使用される。ハールウェーブレットもしくは他の特徴を抽出するのではなく、またはそれに加えて、機械学習は、脳組織のCLE画像に特異的な特徴を決定する。データ駆動の方法論は、その後分類タスクにおいて有効である画像表現を学習する。計算パイプライン(
図3を参照)における特徴抽出段階は、この動作42を包含する。
【0026】
図2は、動作42の教師なし学習を実現する、3つの動作44、46、および48を示している。他の学習層、および層間の畳み込みを含むなど、追加の、異なる、またはより少数の動作が提供されてもよい。他の非ISAおよび/または非畳み込み動作が使用されてもよい。
【0027】
図2の実施形態では、動作44および48で複数の層がトレーニングされ、動作46の畳み込みは、層のスタックを互いに関係付けるのに使用される。この層構造は、CLE画像から弁別的表現を学習する。
【0028】
任意の教師なし学習が使用されてもよい。学習は、グラウンドトゥルース情報を有さない(例えば、腫瘍または健康な組織のラベルを有さない)入力、この場合はCLE画像を使用する。その代わりに、学習は、画像に共通の、ならびに/または入力画像間の差を最大限にする、コントラストもしくはばらつきを強調する。機械学習は、画像の特徴を強調する、ならびに/またはコンテンツが少ない情報の強調をやめるフィルタを作成するように機械によってトレーニングされる。
【0029】
一実施形態では、教師なし学習は、独立部分空間解析(ISA)または他の形態の独立成分解析(ICA)である。自然画像統計が、機械学習によって入力画像から抽出される。ICAまたはISAを用いて学習した自然画像統計は、自然なビジョンをエミュレートする。ICAおよびISAは両方とも、静止画像に適用されたときの視覚皮質のV1範囲と同様の受容野を学習するのに使用されてもよい。ICAとは対照的に、ISAは、擬似変換に対して堅牢な特徴表現を学習することができる。主成分解析など、他の分解のアプローチが使用されてもよい。ディープラーニングなど、他のタイプの教師なし学習が使用されてもよい。
【0030】
ICAおよびISAは、入力されたトレーニングデータが大きすぎる場合、計算的に非効率であることがある。画素が多い大型画像は計算の非効率をもたらすことがある。ISAの定式化は、より大きい入力データに対応するように調整される。各入力画像に対する直接のISAではなく、様々なパッチまたはより小さい(例えば、16×16画素)フィルタカーネルを学習させる。畳み込みニューラルネットワークタイプのアプローチは畳み込みおよびスタッキングを使用する。動作44で、1つの層においてISAを用いた入力またはトレーニング画像から、異なるフィルタカーネルを学習させる。これらの学習済みのフィルタカーネルに、動作46で、入力またはトレーニング画像が畳み込まれる。画像は、画像の各画素をフィルタ処理するようにウィンドウが開けられたフィルタ処理カーネルを使用して、空間的にフィルタ処理される。畳み込みによって得られたフィルタ処理済み画像を次に、別の層でISAに入力する。動作48で、畳み込みによって得られるフィルタ処理済み画像から、異なるフィルタカーネルを学習させる。プロセスは、更なる畳み込みおよび学習を用いて繰り返してもよく、または繰り返さなくてもよい。
【0031】
出力パッチは、分類における特徴抽出に使用されるフィルタカーネルである。特徴抽出のための畳み込みニューラルネットワークのアプローチには、小さい入力フィルタカーネルを用いて特徴を学習することが関与し、それに、次いで、入力データのより大きい領域が畳み込まれる。入力画像は、学習済みのフィルタカーネルを用いてフィルタ処理される。この畳み込みの出力は、上層に対する入力として使用される。この畳み込みに続くスタッキング技術によって、認識タスクに有効なデータの堅牢な階層表現を学習することが容易になる。
【0032】
任意の数のフィルタカーネルまたはパッチが学習によって作成されてもよい。
図5および
図6はそれぞれ100個のフィルタカーネルを示しているが、より多数またはより少数が提供されてもよい。フィルタカーネルのサイズによって、異なるフィルタカーネルがもたらされてもよい。
図5は、16×16画素としてフィルタカーネルを示している。
図6は、同じ入力画像を使用して学習させたが、フィルタカーネルサイズが20×20画素であるフィルタカーネルを示している。フィルタカーネルのサイズが大きいほど、計算の非効率性が大きくなる。異なるフィルタカーネルサイズは、画像からの弁別パターンの学習に影響を及ぼす。
【0033】
所与の層に対して、ISA学習が適用される。任意の現在知られているまたは後に開発されるISAが使用されてもよい。一実施形態では、ISA学習は、動作44および48のスタッキングされた層の1つまたはそれぞれにおける多層ネットワークなどの多層ネットワークを使用する。例えば、ISAの所与の性能に対する多層ネットワークの学習において、平方および平方根の非線形性が使用される。ISA実現例の多層ネットワークの一層で平方が使用され、別の層で平方根が使用される。
【0034】
一実施形態では、第1の層単位は単純な単位であり、第2の層単位はプーリング単位である。k個の単純な単位およびm個のプーリング単位が多層ISAネットワークに存在する。ベクトル化した入力フィルタカーネルx∈R
nで、nが入力寸法(フィルタカーネルにおけるピクセル数)である場合、第1の層における重みW∈R
m×kが学習されるが、第2の層の重みV∈R
k×nは固定であり、第1の層における神経の部分空間構造を表す。換言すれば、第1の層が学習され、次に第2の層が学習される。具体的には、第2の層の隠れた単位はそれぞれ、隣接した第1の層単位の小さい近傍にわたってプールする。各プーリング単位の作動は次式によって与えられる。
【0036】
式中、pは第2の層の出力の作動、Wは第1の層の重みパラメータ、Vは第2の層の重みパラメータ、jおよびkはインデックスである。パラメータWは、T個全ての入力サンプルにわたる次の最適化問題を解決することで、プーリング層における粗い特徴表現を見つけることによって学習される。
【0038】
式中、Tはインデックスであり、直交制約条件WW
T=1によって特徴が多様であることが担保される。
図5および
図6は、異なる入力フィルタカーネル寸法を使用して式(2)の問題を解決した後で学習される、特徴の部分集合を示している。他のISAのアプローチ、層単位、非線形性、および/または多層ISAネットワークが使用されてもよい。
【0039】
経験的解析の場合、フィルタは、異なる入力フィルタカーネル寸法から学習される。しかしながら、投影勾配降下の各ステップに対して入力フィルタカーネルが大きいとき、標準的なISAトレーニングアルゴリズムは効率が下がるので、直交化方法に関して計算のオーバーヘッドがある。このオーバーヘッドコストは、フィルタカーネルサイズの入力寸法の三次関数とともに増大する。PCAおよびISAを教師なし学習のサブユニットとして漸進的に利用する畳み込みニューラルネットワークアーキテクチャを使用することによって、計算の非効率を少なくとも部分的に克服することができる。
【0040】
スタッキングの層のうち1つの出力(例えば、動作44の出力)は、後続の層における畳み込みおよび/または学習で使用する前に、主成分解析(PCA)の場合のように白色化されてもよい。最初に、小入力フィルタカーネルに対してISAアルゴリズムをトレーニングする。次に、この学習済みネットワークに、入力画像のより大きい領域を畳み込む。次に、畳み込みステップの組み合わされた応答を、同様にPCAを事前処理ステップとして用いて別のISAアルゴリズムによって実現される、次の層への入力として与える。PCA事前処理は白色化して、次に続くISAトレーニングステップが低次元の入力のみを受信することが担保される。
【0041】
動作44および48で実施される学習は貪欲に実施される。画像の階層表現は、ディープラーニングで行われるように、層ごとに学習される。動作44における第1の層の学習は、動作48で第2の層のトレーニングを行う前に収束するまで実施される。貪欲なトレーニングにより、
図4のデータセットを所与として、トレーニング時間の要件が、標準的なラップトップハードウェアではわずか2時間未満に低減される。
【0042】
パッチまたはフィルタカーネルを、入力トレーニング画像を使用して機械学習によって学習させると、視覚認識システムが、フィルタカーネルを用いて抽出した入力特徴から分類するようにトレーニングされる。分類を学習する機械のための入力トレーニング画像は、動作50でフィルタカーネルを用いてフィルタ処理される。フィルタは、各トレーニング画像に、教師なし学習から出力された各フィルタカーネルまたはパッチを畳み込む。最終層(例えば、動作48の層2)によって出力されるフィルタカーネルが使用されるが、最初の層(例えば、動作44の層1)または中間層からのフィルタカーネルが同様に使用されてもよい。
【0043】
各入力トレーニング画像に対して、複数のフィルタ処理済み画像が出力される。この複数とは、使用されるフィルタカーネルの数に対応するものである。これらのフィルタ処理済み画像は、フィルタ処理なしの画像を使用した場合よりも良好な分類に使用され得る視覚表現である。
【0044】
入力されたフィルタ処理済み画像から直接分類するなど、任意の視覚認識システムが使用されてもよい。一実施形態では、特徴は、フィルタ処理済み画像から更に抽出され、入力として使用される。
図2および
図3の実施形態では、入力データの次元数または量は、動作52のコード化および動作54におけるコードのプーリングによって低減される。
【0045】
動作52で、フィルタ処理済み画像をコード化する。コード化によって、分類器のトレーニングに使用されるデータが低減される。例えば、フィルタ処理済み画像はそれぞれ数千画素を有し、各画素は複数のビットによって表される。コード化によって、わずか数百画素サイズのデータを提供するなど、所与の画像の表現が半分以上低減される。
【0046】
任意のコード化が使用されてよい。例えば、クラスタ化(例えば、k平均クラスタ化)またはPCAがフィルタ処理済み画像に対して実施される。別の例として、語彙をフィルタ処理済み画像から学習させる。それにより、フィルタ処理済み画像は語彙を使用して表される。他の辞書学習アプローチが使用されてもよい。
【0047】
一実施形態では、認識パイプラインはbag-of-wordsに基づく方法と同様にコード化を行う。10%または他の数の記述子(即ち、フィルタ処理済み画像、および/またはフィルタ処理に使用するフィルタカーネル)が、トレーニングスプリットから無作為に選択され、k平均(k=512が、トレーニング試験スプリットの1つから経験的に決定される)クラスタ化が、4つまたは他の数の異なる語彙を構築するために実施される。次に、各フレームからの特徴が、これらの異なる語彙の組を使用して量子化される。
【0048】
動作54で、プロセッサまたはコンピュータはコード化の出力をプールする。プーリング動作は、全ての符号化された局所的特徴から、統計値、例えば平均値(平均プーリング)または最大値(最大プーリング)を計算する。これは、次元数を更に低減し、特定の変動、例えば翻訳に対する堅牢性を改善するのに使用される。k平均に基づくコード化の例では、畳み込み後の局所的特徴がk平均に基づく語彙の1つのエントリに投影される。この実施形態におけるプーリング動作は、全ての局所的特徴の同じエントリに、例えば平均動作に適用される。プーリングされた特徴は、トレーニング画像および試験画像それぞれに提供される。プーリングは、動作52のコード化なしで提供されてもよい。
【0049】
動作56で、医療システムの機械学習コンピュータは、腫瘍状脳組織を表す画像と健康な脳組織を表す画像、および/または様々な種類の腫瘍を表す画像を区別するように分類器をトレーニングする。機械学習は、画像のコンテンツを区別するように分類器をトレーニングするのに使用される。入力値の組み合わせを各クラスに対して統計的に関連させるために、各クラスの多くの例が提供される。
【0050】
任意のタイプの機械学習が使用されてよい。例えば、ランダムフォレストまたはサポートベクターマシン(SVM)が使用される。他の例では、ニューラルネットワーク、ベイジアンネットワーク、または他の機械学習が使用される。トレーニングデータが結果またはクラスによって注釈を付けられる際に、学習は監督される。医療専門家、過去の診断、または他の供給源によるグラウンドトゥルースが、トレーニング用の各画像に対して提供される。
【0051】
分類器をトレーニングするのに使用される入力ベクトルは、プーリングされたコードである。プーリング、コード化、および/またはフィルタ処理の出力は、分類器のトレーニングに対する入力として使用される。患者の年齢、性別、家族歴、画像の特徴(例えば、ハールウェーブレット)、または他の臨床情報などの他の入力を、教師なし学習から抽出した特徴に加えて使用してもよい。各画像に対する入力ベクトルおよびグラウンドトゥルースは、分類器をトレーニングするトレーニングデータとして使用される。例えば、サポートベクターマシンは、画像のダウンサンプリングまたは今後のデータ整理のためのコード化など、粗いグリッド検索を用いて選んだパラメータを使用して、放射基底関数(RBF)カーネルを用いてトレーニングする。プーリングしたコードから結果として得られる量子化表現は、RBFカーネルを用いてSVM分類器をトレーニングするのに使用される。代替実施形態では、線形カーネルが使用される。
【0052】
トレーニングされた分類器は行列である。この行列およびフィルタカーネルまたはパッチは、
図2および
図3のトレーニングによる出力である。これらの抽出されたフィルタおよび分類器は、所与の患者に関する分類の用途で使用される。
図7は、医用画像診断システムにおける脳腫瘍分類の方法の一実施形態を示している。方法は、学習済みのパッチおよびトレーニング済みの分類器を使用して、所与の患者の診断を支援する。他の事例の診断を支援するのに分類器を使用できるようにトレーニングするのに、多くのトレーニング例が使用される。
【0053】
トレーニングに使用されるのと同じまたは異なる医用画像診断システムが適用に使用される。クラウドまたはサーバベースのシステムの場合、同じコンピュータまたはプロセッサが、学習済みのフィルタカーネルおよび分類器の学習および適用の両方を行ってもよい。あるいは、学習にはワークステーションを用い、適用にはサーバを用いるなど、異なるコンピュータまたはプロセッサが使用される。局所ベースの適用の場合、トレーニングに使用されるワークステーションまたはコンピュータとは異なるワークステーションまたはコンピュータが、学習済みのフィルタカーネルおよび分類器に適用される。
【0054】
方法は、図示される順序または異なる順序で実施される。追加の、異なる、またはより少数の動作が提供されてもよい。例えば、分類が、コード化を伴わずにフィルタ処理済み画像情報から直接トレーニングされる場合、動作62は実施されなくてもよい。別の例として、分類は、動作66で画像を生成することなく、ネットワークを通じて出力されるかまたはメモリに格納される。更に別の例では、CLEを用いたスキャンのための動作が提供される。
【0055】
動作58で、脳の1つ以上のCLE画像がCLEを用いて獲得される。1つ以上の画像は、患者をCLEでスキャンすることによるか、ネットワーク送信から、および/またはメモリから獲得される。一実施形態では、切除の間、CLEプローブは患者の頭部内に位置付けられる。CLEは手術中に実施される。結果として得られるCLE画像が生成される。
【0056】
任意の数のCLE画像が受信されてもよい。受信したCLE画像がビデオの一部である場合、ビデオの画像の全てが受信され使用されてもよい。あるいは、画像の部分集合が分類のために選択される。例えば、分類のために1つ以上の画像の部分集合を選択するのに、フレームエントロピーが使用される(例えば、エントロピーが計算され、閾値が適用される)。
【0057】
動作60で、フィルタおよび/または分類器コンピュータは、患者に対して1つ以上のCLE画像から局所的特徴を抽出する。フィルタは、過去に学習したフィルタカーネルを用いてCLE画像をフィルタ処理して、各フィルタカーネルに対するフィルタ処理済み画像を生成する。スタッキングされ(例えば、ISAの複数層)、畳み込まれた(例えば、次の層に対する入力を作成するために、1つの層によって出力されたフィルタを用いたトレーニング画像の畳み込み)状態のISAによって学習したフィルタを使用して、分類のために、所与の患者からの画像をフィルタ処理する。逐次的に学習させたフィルタまたはパッチがISAによって作成される。最終層のフィルタまたはパッチは、今後の抽出に使用されるフィルタカーネルとして出力される。これらの出力フィルタカーネルは、患者のCLE画像に適用される。
【0058】
学習済みのフィルタカーネル全て、または分類器のトレーニングにおいて特定された確定的なフィルタカーネルに基づいて、より少数など、任意の数のフィルタカーネルまたはパッチが使用されてもよい。各フィルタカーネルは、各画素または画素の他のサンプリングを通じて中心に置かれ、新しい画素値が、カーネルによって重み付けされたものとして、周囲の画素に基づいて計算される。
【0059】
フィルタ処理の出力は局所的特徴である。これらの局所的特徴はフィルタ処理済み画像である。フィルタ処理は、患者のCLE画像のいくつかの態様を向上し、ならびに/あるいは他の態様を低減する。向上および/または低減する態様、またその程度は、フィルタカーネルを作成する際に学習させたものである。
【0060】
動作62で、フィルタ処理済み画像に表される局所的特徴をコード化する。特徴を定量化する。画像処理を使用して、分類プロセッサは、フィルタ処理済み画像の特徴を表す値を決定する。主成分解析、k平均解析、クラスタ化、またはbag-of-wordsをフィルタ処理済み画像に適用するなど、任意のコード化が使用されてもよい。トレーニングで使用されるのと同じコード化が、所与の患者に対する適用に使用される。例えば、学習済みの語彙を使用して、フィルタ処理済み画像をbag-of-wordsとしてコード化する。コード化によって、データの量または次元数が低減される。各フィルタ処理済み画像に対する画素値ではなく、コード化は、分類器に入力する値の数を低減する。
【0061】
各フィルタ処理済み画像をコード化する。患者のCLE画像から作成されたフィルタ処理済み画像の全てまたはいくつかからのコードをプーリングする。代替実施形態では、プーリングは使用されない。更に他の実施形態では、プーリングはコード化なしで提供される。
【0062】
動作64で、機械学習済みの分類器は、コード化された局所的特徴からCLE画像を分類する。分類器プロセッサは、様々なフィルタ処理済み画像に対するコードまたは値を受信する。これらのコードは、機械学習済みの分類器に対する入力ベクトルである。患者の臨床データなど、他の入力が含まれてもよい。
【0063】
機械学習済みの分類器は、行列、またはクラスに対する入力ベクトルの統計的関係の他の表現である。過去に学習させた分類器が使用される。例えば、機械学習済みの分類器は、トレーニングデータから学習させたSVMまたはランダムフォレスト分類器である。
【0064】
分類器は、入力ベクトルに基づいてクラスを出力する。入力ベクトルの値は組み合わさって、クラスにおけるメンバーシップを示す。分類器は、二値分類(例えば、CLE画像がメンバーであるかないか、腫瘍状であるかないか)を出力し、2つのクラス(例えば、健康もしくは腫瘍状)の間で選択し、または3つ以上のクラスの間で選択する(例えば、CLE画像が多形神経膠芽腫、髄膜腫、もしくは健康な組織を含むか否かを分類する)。階層状の決定木、または他の分類器構成を使用して、健康なもの、多形神経膠芽腫、および/または髄膜腫を区別してもよい。他の種類の腫瘍、および/またはCLE画像に関する他の診断上有用な情報が分類されてもよい。
【0065】
分類器は、CLE画像全体に関するクラスを示す。画像中における腫瘍の場所を特定するのではなく、分類器は、画像が腫瘍を表すか否かを示す。代替実施形態では、分類器または更なる分類器は、疑われる脳腫瘍の場所を示す。
【0066】
動作66で、分類器プロセッサは分類を表す画像を生成する。生成された画像は、CLE画像が腫瘍を有するか否か、または脳組織状態を示す。例えば、CLE画像は、分類の結果を示す注釈、ラベル、または色分け(例えば、色相)と共に出力される。分類器が結果に関する確率を出力する場合、腫瘍の種類、およびその種類の腫瘍がCLE画像によって表されると推定される割合などの確率が示されてもよい。
【0067】
低レベルの特徴表現は、自動画像認識タスクまたは分類における決定因子であってもよい。ISAに基づくスタッキングおよび畳み込みが特徴表現を導き出す性能は、他の異なる特徴表現ベースラインに対して評価される。各アプローチに関して、全ての特徴記述子にわたる公正な比較を担保するために、特徴抽出フェーズ中に密なサンプリング戦略が使用される。内視鏡レンズとほぼ同じ半径で円形の対象領域を適用した後、各CLE画像フレームから、500個のサンプル点またはキーポイントが均一にサンプリングされる。
【0068】
各キーポイントは、スタッキングされ畳み込まれたISA、スケール不変の特徴変換(SIFT)、および局所二値パターン(LBP)といった記述子タイプを使用して記述される(即ち、低レベルの特徴表現に対するアプローチ)。これらの記述子は、局所的近隣における画素強度の量子化された勾配配向を捕捉する。
【0069】
認識パイプラインは、bag-of-words(BOW)に基づく方法と同様に、密なSIFT特徴モダリティに対して次のように実現される。記述子の10%がトレーニングスプリットから無作為に選択され、k平均(k=512がトレーニング試験スプリットの1つから経験的に決定される)クラスタ化が、4つの異なる語彙を構築するために実施される。次に、各フレームからの特徴が、これらの異なる語彙の組を使用して量子化される。局所的に制約された線形コード化(LLC)が代わりに使用されてもよい。結果として得られる量子化表現は、RBFカーネルを用いてSVM分類器をトレーニングするのに使用される。SVM分類器のパラメータは、粗いグリッド検索アルゴリズムを使用して選ばれる。
【0070】
LBP特徴を用いた分類の場合、各木の最大深度が16レベルである8つの木を用いてランダムフォレスト分類器をトレーニングするために、LBPヒストグラムを直接使用する。次に、表現と分類器の各組み合わせによる出力の信頼度を、単純な乗法的融合アルゴリズムを使用してマージする。このようにして、フレームに対する決定が得られる。
【0071】
詳細な比較を行うためには、SIFTまたはLBP記述子を、事前トレーニングした二層のISAネットワーク(即ち、スタッキングし畳み込んだISA)を使用して学習させた特徴記述子と置き換える。ベクトル量子化および分類器トレーニングを含む計算パイプラインは、ベースライン(SIFTおよびLBP)アプローチと概念的に類似している。
【0072】
図8は、二クラス(即ち、二値)分類実験に対する性能計量としての平均の精度、感度、および特異性を示している。膠芽腫は陽性クラス、髄膜腫は陰性クラスである。これは、具体的には、異なる方法が、3つのクラス間の区別に比べて比較的単純なタスクでどのように比較を行うかを見つけるために実施される。精度は、全てのサンプルに対する全ての真の分類(陽性または陰性)の比によって与えられる。他方で、感度は、陽性(例えば、膠芽腫)として検出される陽性サンプルの比率である。最後に、特異性は、分類フレームワークが陰性(例えば、髄膜腫)サンプルを正確に特定する能力に関する。最後の列は、1秒当たりに分類されるフレームにおける全ての方法の計算速度を報告している。
【0073】
図9は、3つのクラス(膠芽腫(GBM)、髄膜腫(MNG)、および健康な組織(HLT))それぞれに対する個々の分類精度を報告している。1秒当たりに分類されるフレームにおける速度も比較している。ISAアプローチにおける畳み込み動作は、速度に関して最適化されていないが、ハードウェア(例えば、並列処理)および/またはソフトウェアを介することができる。全ての場合において、SIFTおよびLBPアプローチに対して平均6%の改善がISAアプローチによって提供される。
【0074】
ISAは、スタック内のスタッキングおよび畳み込みの有無にかかわらず、より低速であるが効率的な特徴抽出の戦略を提供し、それによって教師なしでデータから直接効率的に表現を学習することが可能になる。CLE画像から脳腫瘍を分類する非常に困難なタスクに対して、最新技術の従来方法(SIFTおよびLBP)を上回る顕著な性能改善が示される。
【0075】
図10は、医療システム11を示している。医療システム11は、共焦点レーザー顕微内視鏡(CLE)12と、フィルタ14と、分類器16と、ディスプレイ18と、メモリ20とを含むが、追加の、異なる、またはより少数の構成要素が提供されてもよい。例えば、分類器16に対する入力ベクトルを形成するための、フィルタ14の出力をコード化する符号化器が提供される。別の例として、分類器に入力された値(例えば、患者の年齢)をマイニングするか、またはそれにアクセスする患者データベースが提供される。更に別の例では、フィルタ14および/または分類器16は、分類器コンピュータまたはプロセッサによって実現される。他の例では、機械学習プロセッサまたはコンピュータがトレーニングに使用される場合など、分類器16は提供されない。その代わりに、フィルタ14は畳み込みを実現し、機械学習プロセッサは、画像特徴の教師なし学習(例えば、ISA)および/または分類器16のトレーニングを実施する。
【0076】
医療システム11は、
図2、
図3、および/または
図7の方法を実現する。医療システム11は、トレーニングの実施および/または分類を行う。トレーニングは、フィルタまたは他の局所的特徴を分類に使用されるように学習させるものである。別の方法として、またはそれに加えて、トレーニングは、教師なし学習によって学習させた入力特徴に基づいた、脳組織のCLE画像の分類器のものである。分類は、機械学習済みのフィルタおよび/または分類器を使用する。同じまたは異なる医療システム11が、トレーニングおよび適用(即ち、分類)に使用される。トレーニング時には、同じまたは異なる医療システム11が、フィルタ14を学習させる教師なしトレーニングおよび分類器16のトレーニングに使用される。適用時には、同じまたは異なる医療システム11が、学習済みのフィルタを用いたフィルタ処理および分類に使用される。
図10の例は適用の場合である。トレーニングの場合、フィルタ14および/または分類器16を作成するのに機械学習プロセッサが提供される。
【0077】
医療システム11は、ホストコンピュータ、制御ステーション、ワークステーション、サーバ、または他の装置を含む。システムは、ディスプレイ18と、メモリ20と、プロセッサとを含む。追加の、異なる、またはより少数の構成要素が提供されてもよい。ディスプレイ18、プロセッサ、およびメモリ20は、コンピュータ、サーバ、またはCLE 12からの画像を画像処理する他のシステムの一部であってもよい。CLE 12のためのワークステーションまたは制御ステーションは、医療システム11の残りに対して使用されてもよい。あるいは、CLE 12の一部ではない別個のまたは遠隔のデバイスが使用される。その代わりに、トレーニングおよび/または適用は遠隔で実施される。一実施形態では、プロセッサおよびメモリ20は、クライアントとしてのCLE 12のオペレータによって使用される、トレーニングまたは適用をホストするサーバの一部である。クライアントおよびサーバは、イントラネットまたはインターネットなどのネットワークによって相互接続される。クライアントはCLE 12のコンピュータであってもよく、サーバは、医療システム11のメーカー、プロバイダ、ホスト、または作者によって提供されてもよい。
【0078】
CLE 12は、脳組織を画像診断する顕微内視鏡である。蛍光共焦点顕微鏡法、多光子顕微鏡法、光干渉断層撮影法、または他の種類の顕微鏡法が使用されてもよい。一実施形態では、脳組織内の蛍光体を励起するのにレーザー光が使用される。共焦点原理は、組織の上でレーザースポットを走査し、画像を捕捉するなど、組織を走査するのに使用される。走査のために内視鏡を形成するのにファイバーまたはファイバー束が使用される。他のCLEデバイスが使用されてもよい。
【0079】
CLE 12は、患者の脳組織の画像を獲得するように構成される。CLE 12は、脳手術中に患者の頭部に挿入され、隣接組織が画像診断される。CLE 12は、脳組織のビデオを作成するように移動させてもよい。
【0080】
CLE 12は、1つ以上の画像をフィルタ14および/またはメモリ20に出力する。トレーニングの場合、CLE 12または複数のCLE 12が画像をプロセッサに提供する。
図10の適用の例の場合、所与の患者に対する1つ以上のCLE画像が、直接またはメモリ20を通してフィルタ14に提供される。
【0081】
フィルタ14はデジタルまたはアナログフィルタである。デジタルフィルタとしては、グラフィック処理装置、プロセッサ、コンピュータ、個別の構成要素、および/または他のデバイスが、フィルタ14を実現するのに使用される。1つのフィルタ14が示されているが、他の実施形態では、フィルタ14のバンクまたは複数のフィルタ14が提供されてもよい。
【0082】
フィルタ14は、CLE 12からのCLE画像に、複数のフィルタカーネルそれぞれを畳み込むように構成される。フィルタカーネルは機械学習済みカーネルである。トレーニングにおける階層を使用して、第1の段階ではISAを使用してフィルタカーネルを学習させ、次に学習済みのフィルタカーネルに、第1の段階に入力された画像を畳み込み、次に第2の段階でISAを使用してフィルタカーネルを学習させ、入力画像は畳み込みの結果である。代替実施形態では、PCAまたはICAなど、ISA以外の成分解析が使用される。他の実施形態では、畳み込みおよびスタッキングは使用されない。
【0083】
教師なし学習の結果はフィルタカーネルである。フィルタ14は、学習済みのフィルタカーネルを、CLE 12からのCLE画像に適用する。任意のサンプリングまたは解像度で、学習済みのフィルタカーネルの1つを使用してCLE画像をフィルタ処理する。フィルタ処理は、フィルタカーネルそれぞれに対してフィルタ14によって繰り返されるかまたは並行して実施されて、各フィルタカーネルに対するフィルタ処理済み画像がもたらされる。
【0084】
機械学習済みの分類器16は、メモリ20からの行列を用いて構成されたプロセッサである。構成は、出力クラスに対する入力の学習済みの関係である。過去に学習したSVMまたは他の分類器16が適用のために実現される。
【0085】
分類器16は、フィルタカーネルを用い画像の畳み込みに基づいて、CLE 12からのCLE画像を分類するように構成される。フィルタ14の出力は、入力ベクトルを作成するのに使用される。プロセッサまたは他のデバイスは、辞書の適用、局所制約線形コード化、PCA、bag-of-words、クラスタ化、または他のアプローチなど、フィルタ処理済み画像を定量化してもよい。例えば、分類器16を実現するプロセッサは、フィルタ14からのフィルタ処理済み画像をコード化する。メモリ20からなど、他の入力情報が集められてもよい。
【0086】
入力情報は、入力ベクトルとして分類器に入力される。入力値に応答して、分類器16はCLE画像のクラスを出力する。クラスは、二値、階層、または多クラスであってもよい。10%健康、85% GBM、および5% MNGなど、1つ以上の確率がクラスと共に出力されてもよい。
【0087】
ディスプレイ18は、CRT、LCD、プロジェクタ、プラズマ、プリンタ、スマートフォン、または分類の結果を表示する、他の現在知られているかもしくは今後開発される表示デバイスである。結果は、CLE画像と共に表示されてもよい。例えば、ディスプレイ18は、CLE画像をクラスの注釈と共に表示する。別の例として、健康ではないものと、または他のラベルで分類された、任意の画像に対するタブまたは他の参照が提供される。ユーザ選択に応答して、所与のタブに対して健康ではないと分類されたCLE画像が表示される。ユーザは、腫瘍状CLE画像を循環して、分類された診断を確認するか、または分類された診断をセカンドオピニオンとして使用してもよい。
【0088】
メモリ20は、外部記憶デバイス、RAM、ROM、データベース、および/またはローカルメモリ(例えば、固体ドライブもしくはハードドライブ)である。メモリ20は、プロセッサによって管理され、ハードディスク、RAM、またはリムーバブルメディアなどのメモリに常駐する、データベース管理システム(DBMS)を使用して実現されてもよい。あるいは、メモリ20はプロセッサの内部にある(例えば、キャッシュ)。
【0089】
フィルタ処理の出力、フィルタカーネル、CLE画像、分類器16の行列、および/または分類が、メモリ20に格納されてもよい。入力、結果、および/または中間処理として使用される任意のデータが、メモリ20に格納されてもよい。
【0090】
本明細書で考察するトレーニングもしくは適用プロセス、方法、および/または技術を実現するための命令が、メモリ20に格納される。メモリ20は、キャッシュ、バッファ、RAM、リムーバブルメディア、ハードドライブ、または他のコンピュータ可読記憶媒体など、非一時的なコンピュータ可読記憶媒体またはメモリである。同じまたは異なる非一時的なコンピュータ可読媒体が、命令および他のデータに使用されてもよい。コンピュータ可読記憶媒体は、様々な種類の揮発性および不揮発性記憶媒体を含む。図面に示されるかまたは本明細書に記載される機能、作用、もしくはタスクは、コンピュータ可読記憶媒体に格納された1つ以上の命令セットに応答して実行される。機能、作用、もしくはタスクは、特定の種類の命令セット、記憶媒体、プロセッサまたは処理戦略とは独立しており、単独または組み合わせで動作する、ソフトウェア、ハードウェア、集積回路、ファームウェア、マイクロコードなどによって実施されてもよい。
【0091】
一実施形態では、命令は、ローカルまたは遠隔システムが読み取るように、リムーバブルメディアデバイスに格納される。他の実施形態では、命令は、コンピュータネットワークを通して転送するように、遠隔位置に格納される。更に他の実施形態では、命令は、所与のコンピュータ、CPU、GPU、またはシステム内に格納される。添付図面に示される構成システムコンポーネントおよび方法ステップの一部はソフトウェアの形で実現されてもよいので、システムコンポーネント(またはプロセスステップ)間の実際の接続は、本発明の実施形態がプログラミングされる方式に応じて異なってもよい。
【0092】
コンピュータ、サーバ、ワークステーション、または他のデバイスのプロセッサは、フィルタ14および/または分類器16を実現する。プログラムは、任意の適切なアーキテクチャを備えるプロセッサにアップロードされ、それによって実行されてもよい。同様に、処理戦略は、マルチ処理、マルチタスキング、並列処理などを含んでもよい。プロセッサは、1つ以上の中央処理装置(CPU)、ランダムアクセスメモリ(RAM)、および入出力(I/O)インターフェースなど、ハードウェアを有するコンピュータプラットフォーム上で実現される。コンピュータプラットフォームはまた、オペレーティングシステムおよびマイクロ命令コードを含む。本明細書に記載する様々なプロセスおよび機能は、オペレーティングシステムを介して実行される、マイクロ命令コードの一部またはプログラム(もしくはその組み合わせ)の一部のどちらかであってもよい。あるいは、プロセッサは、ネットワーク中の1つ以上のプロセッサである。
【0093】
本明細書に記載した様々な改善は、共にまたは別個に使用されてもよい。本発明の例示的実施形態について添付図面を参照して本明細書に記載してきたが、本発明はそれらの実施形態そのものに限定されず、本発明の範囲または趣旨から逸脱することなく、他の様々な変更および修正が当業者によって本発明において影響を受けてもよいことが理解されるべきである。
【符号の説明】
【0094】
11 医療システム
14 フィルタ
16 分類器
18 ディスプレイ
20 メモリ
【手続補正書】
【提出日】2018年4月3日
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
医療システムにおいて脳腫瘍を分類する方法であって、
1つ以上の共焦点レーザー顕微内視鏡を用いて、腫瘍状脳組織および健康な脳組織を表す共焦点レーザー顕微内視鏡画像を獲得するステップ(40)と、
前記医療システムの機械学習コンピュータによって、独立部分空間解析を用いて複数の層それぞれの画像に対する教師なし学習を実施するステップ(42)であって、前記層中の前記学習が貪欲に実施される、ステップ(42)と、
フィルタによって、前記教師なし学習からのフィルタカーネル出力を用いて前記画像をフィルタ処理するステップ(50)と、
前記画像をフィルタ処理済みとしてコード化するステップ(52)と、
前記コード化(52)の出力をプーリングするステップ(54)と、
前記医療システムの前記機械学習コンピュータによって、機械学習を用いて、入力ベクトルとしての前記出力の前記プーリングに基づいて、前記腫瘍状脳組織を表す前記画像の特徴と、前記健康な脳組織を表す前記画像の特徴とを区別するように分類器をトレーニングするステップ(56)とを含む、方法。
【請求項2】
実施するステップ(42)が、前記画像の階層表現を学習させるステップ(44、48)を含む、請求項1に記載の方法。
【請求項3】
実施するステップ(42)が、前記層のうち第1の層において前記独立部分空間解析を用いて前記画像から複数のパッチを学習させるステップ(44)と、前記パッチに前記画像を畳み込むステップ(46)と、前記独立部分空間解析を用いて前記畳み込みの結果から前記フィルタカーネルを学習させるステップ(48)とを含む、請求項1に記載の方法。
【請求項4】
前記独立部分空間解析を用いて前記フィルタカーネルおよび前記パッチを学習させるステップ(44、48)がそれぞれ、多層ネットワークにおける平方および平方根の非線形性を用いて学習させるステップを含む、請求項3に記載の方法。
【請求項5】
前記第2の層における前記教師なし学習の前に、主成分解析を用いて前記教師なし学習の第1の層の出力を白色化するステップを更に含む、請求項1に記載の方法。
【請求項6】
フィルタ処理するステップ(50)が畳み込むステップを含み、コード化するステップ(52)が、k平均クラスタ化、主成分解析、またはbag-of-wordsのうちの1つを前記フィルタ処理済み画像に適用するステップを含む、請求項1に記載の方法。
【請求項7】
コード化するステップ(52)が語彙を抽出するステップを含み、プーリングするステップが、前記語彙を用いてフィルタ処理したものとして前記画像を定量化するステップを含む、請求項1に記載の方法。
【請求項8】
トレーニングするステップ(56)が、粗いグリッド検索を使用して選ばれたパラメータを使用して、放射基底関数カーネルを用いてサポートベクターマシンをトレーニングするステップ(56)を含む、請求項1に記載の方法。
【請求項9】
患者の脳の共焦点レーザー顕微内視鏡画像から局所的特徴を抽出するステップ(60)であって、前記局所的特徴が、第1の層および第2の層それぞれにおける独立部分空間解析から学習したフィルタを使用して抽出され、前記第2の層が、前記第1の層からの出力と前記画像との畳み込みに基づく、ステップ(60)と、
前記局所的特徴をコード化するステップ(62)と、
前記コード化した局所的特徴からの機械学習済みの分類器を用いて、前記画像が腫瘍を含むか否かを示す分類を行うステップ(64)と、
前記分類を表す画像を生成するステップ(66)とを更に含む、請求項1に記載の方法。
【請求項10】
抽出するステップ(60)がフィルタ処理済み画像を生成するステップ(66)を含み、コード化するステップ(62)が、前記フィルタ処理済み画像に対して主成分解析、k平均解析、クラスタ化、またはbag-of-wordsを実施するステップを含む、請求項9に記載の方法。
【請求項11】
分類を行うステップ(64)が、前記画像が多形神経膠芽腫、髄膜腫、または多形神経膠芽腫および髄膜腫を含むか否かを分類するステップ(64)を含む、請求項9に記載の方法。
【請求項12】
独立部分空間解析から学習したものとして抽出するステップ(60)が、前記フィルタのフィルタカーネルを用いて前記画像をフィルタ処理するステップを含み、前記フィルタ処理の出力が前記局所的特徴である、請求項9に記載の方法。
【請求項13】
独立部分空間解析から学習したものとして抽出するステップ(60)が、前記第1の層および第2の層で逐次的に学習させた前記フィルタを用いてフィルタ処理するステップを含み、前記第1の層が、前記独立部分空間解析を用いて学習させた出力としてのパッチを含み、前記パッチに前記画像が畳み込まれ、前記畳み込みの結果が前記第2の層に入力される、請求項9に記載の方法。
【請求項14】
患者の脳組織の画像を獲得するように構成された共焦点レーザー顕微内視鏡(12)と、
前記画像と複数のフィルタカーネルとの畳み込みを実施するように構成されたフィルタ(14)を実行するプロセッサであって、前記フィルタカーネルが、第1の段階に対する学習済みカーネルの階層からの機械学習済みカーネルを含み、前記フィルタカーネルが前記畳み込みの結果の入力から学習しており、前記プロセッサは、前記画像と前記複数のフィルタカーネルとの前記畳み込みに基づいて、前記画像を分類するように構成された機械学習済みの分類器(16)を実行する、プロセッサと、
健康な脳組織と様々な種類の腫瘍状脳組織とを区別する、前記分類を表示するように構成されたディスプレイ(18)とを備える、医療システム(11)。
【請求項15】
前記学習済みカーネルおよび前記フィルタカーネルが、独立部分空間解析を学習させたカーネルを含む、請求項14に記載の医療システム。
【手続補正書】
【提出日】2018年4月10日
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
医療システムにおいて脳腫瘍を分類する方法であって、
1つ以上の共焦点レーザー顕微内視鏡を用いて、腫瘍状脳組織および健康な脳組織を表す共焦点レーザー顕微内視鏡画像を獲得するステップ(40)と、
前記医療システムの機械学習コンピュータによって、独立部分空間解析を用いて複数の層それぞれの画像に対する教師なし学習を実施するステップ(42)であって、前記層中の前記学習が貪欲に実施される、ステップ(42)と、
フィルタによって、前記教師なし学習から出力されたフィルタカーネルを用いて前記画像をフィルタ処理するステップ(50)と、
前記画像をフィルタ処理済みとしてコード化するステップ(52)と、
前記コード化(52)の出力をプーリングするステップ(54)と、
前記医療システムの前記機械学習コンピュータによって、機械学習を用いて、入力ベクトルとしての前記出力の前記プーリングに基づいて、前記腫瘍状脳組織を表す前記画像の特徴と、前記健康な脳組織を表す前記画像の特徴とを区別するように分類器をトレーニングするステップ(56)とを含む、方法。
【請求項2】
実施するステップ(42)が、前記画像の階層表現を学習させるステップ(44、48)を含む、請求項1に記載の方法。
【請求項3】
実施するステップ(42)が、前記層のうち第1の層において前記独立部分空間解析を用いて前記画像から複数のパッチを学習させるステップ(44)と、前記パッチに前記画像を畳み込むステップ(46)と、前記独立部分空間解析を用いて前記畳み込みの結果から前記フィルタカーネルを学習させるステップ(48)とを含む、請求項1に記載の方法。
【請求項4】
前記独立部分空間解析を用いて前記フィルタカーネルおよび前記パッチを学習させるステップ(44、48)がそれぞれ、多層ネットワークにおける平方および平方根の非線形性を用いて学習させるステップを含む、請求項3に記載の方法。
【請求項5】
前記層のうち第2の層における前記教師なし学習の前に、主成分解析を用いて前記教師なし学習の第1の層の出力を白色化するステップを更に含む、請求項1に記載の方法。
【請求項6】
フィルタ処理するステップ(50)が畳み込むステップを含み、コード化するステップ(52)が、k平均クラスタ化、主成分解析、またはbag-of-wordsのうちの1つを前記フィルタ処理済み画像に適用するステップを含む、請求項1に記載の方法。
【請求項7】
コード化するステップ(52)が語彙を抽出するステップを含み、プーリングするステップが、前記語彙を用いてフィルタ処理したものとして前記画像を定量化するステップを含む、請求項1に記載の方法。
【請求項8】
トレーニングするステップ(56)が、粗いグリッド検索を使用して選ばれたパラメータを使用して、放射基底関数カーネルを用いてサポートベクターマシンをトレーニングするステップ(56)を含む、請求項1に記載の方法。
【請求項9】
患者の脳の共焦点レーザー顕微内視鏡画像から局所的特徴を抽出するステップ(60)であって、前記局所的特徴が、第1の層および第2の層それぞれにおける独立部分空間解析から学習したフィルタを使用して抽出され、前記第2の層が、前記第1の層からの出力と前記画像との畳み込みに基づく、ステップ(60)と、
前記局所的特徴をコード化するステップ(62)と、
前記コード化した局所的特徴からの機械学習済みの分類器を用いて、前記画像が腫瘍を含むか否かを示す分類を行うステップ(64)と、
前記分類を表す画像を生成するステップ(66)とを更に含む、請求項1に記載の方法。
【請求項10】
抽出するステップ(60)がフィルタ処理済み画像を生成するステップ(66)を含み、コード化するステップ(62)が、前記フィルタ処理済み画像に対して主成分解析、k平均解析、クラスタ化、またはbag-of-wordsを実施するステップを含む、請求項9に記載の方法。
【請求項11】
分類を行うステップ(64)が、前記画像が多形神経膠芽腫、髄膜腫、または多形神経膠芽腫および髄膜腫を含むか否かを分類するステップ(64)を含む、請求項9に記載の方法。
【請求項12】
独立部分空間解析から学習したものとして抽出するステップ(60)が、前記フィルタのフィルタカーネルを用いて前記画像をフィルタ処理するステップを含み、前記フィルタ処理の出力が前記局所的特徴である、請求項9に記載の方法。
【請求項13】
独立部分空間解析から学習したものとして抽出するステップ(60)が、前記第1の層および第2の層で逐次的に学習させた前記フィルタを用いてフィルタ処理するステップを含み、前記第1の層が、前記独立部分空間解析を用いて学習させた出力としてのパッチを含み、前記パッチに前記画像が畳み込まれ、前記畳み込みの結果が前記第2の層に入力される、請求項9に記載の方法。
【請求項14】
医療システム(11)であって、
患者の脳組織の画像を獲得するように構成された共焦点レーザー顕微内視鏡(12)と、
前記画像と複数のフィルタカーネルとの畳み込みを実施するように構成されたフィルタ(14)を実行するプロセッサであって、前記フィルタカーネルが、第1の段階に対する学習済みカーネルの階層からの機械学習済みカーネルを含み、前記フィルタカーネルが前記畳み込みの結果の入力から学習しており、前記プロセッサは、前記画像と前記複数のフィルタカーネルとの前記畳み込みに基づいて、前記画像を分類するように構成された機械学習済みの分類器(16)を実行する、プロセッサと、
健康な脳組織と様々な種類の腫瘍状脳組織とを区別する、前記分類を表示するように構成されたディスプレイ(18)とを備える、医療システム。
【請求項15】
前記学習済みカーネルおよび前記フィルタカーネルが、独立部分空間解析を学習させたカーネルを含む、請求項14に記載の医療システム。
【国際調査報告】