IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 公益財団法人がん研究会の特許一覧

特許7004871AIを用いた病理診断支援方法、及び支援装置
<>
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図1
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図2
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図3
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図4
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図5
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図6
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図7
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図8
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図9
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図10
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図11
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図12
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図13
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図14
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図15
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図16
  • 特許-AIを用いた病理診断支援方法、及び支援装置 図17
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-06
(45)【発行日】2022-02-10
(54)【発明の名称】AIを用いた病理診断支援方法、及び支援装置
(51)【国際特許分類】
   G01N 33/48 20060101AFI20220203BHJP
   G01N 33/483 20060101ALI20220203BHJP
   G01N 33/574 20060101ALI20220203BHJP
   G06T 7/00 20170101ALI20220203BHJP
【FI】
G01N33/48 M
G01N33/483 C
G01N33/574 D
G06T7/00 350B
G06T7/00 630
【請求項の数】 16
(21)【出願番号】P 2021553077
(86)(22)【出願日】2020-12-25
(86)【国際出願番号】 JP2020048926
(87)【国際公開番号】W WO2021132633
(87)【国際公開日】2021-07-01
【審査請求日】2021-09-07
(31)【優先権主張番号】P 2019236352
(32)【優先日】2019-12-26
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】000173588
【氏名又は名称】公益財団法人がん研究会
(74)【代理人】
【識別番号】100179431
【弁理士】
【氏名又は名称】白形 由美子
(72)【発明者】
【氏名】山本 智理子
【審査官】海野 佳子
(56)【参考文献】
【文献】特開2012-073179(JP,A)
【文献】特開2012-008027(JP,A)
【文献】特開2009-009290(JP,A)
【文献】国際公開第2010/087112(WO,A1)
【文献】小野裕之ほか,胃癌に対するESD/EMRガイドライン,日本消化器内視鏡学会雑誌,第56巻第2号,第310~323頁
(58)【調査した分野】(Int.Cl.,DB名)
G01N 33/48-33/98
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
組織標本の顕微鏡観察画像データを連続して取得する画像取得工程と、
前記画像データを標本全体での位置情報と組織画像上での位置情報を保持したまま所定のサイズに分割し画像パッチを得る工程と、
画像パッチ毎に学習用データから機械学習により抽出された特徴量によってクラスを判定する判定工程と、
判定されたクラスを組織画像の各位置で表示し、標本全体に再構築する再構築工程とを備えた病理診断支援方法。
【請求項2】
機械学習によって判定されたクラスを各位置で表示し、標本全体に再構築する前記再構築工程
瘍の不均一性を表示することを特徴とする請求項1記載の病理診断支援方法。
【請求項3】
前記機械学習が、
ニューラルネットワークによることを特徴とする請求項1、又は2記載の病理診断支援方法。
【請求項4】
前記ニューラルネットワークが、
学習用画像として解像度0.1μm/pixel~4μm/pixelの画像を用いることを特徴とする請求項3記載の病理診断支援方法。
【請求項5】
前記組織標本が癌組織に由来するものであり、
癌の病理診断を支援することを特徴とする請求項1~4いずれか1項記載の病理診断支援方法。
【請求項6】
前記組織標本がHE染色、又は免疫組織化学染色標本であることを特徴とする請求項1~5いずれか1項記載の病理診断支援方法。
【請求項7】
前記HE染色標本が標準化されていない標本の場合、
Neural style transfer手法を用い、
擬似的な免疫組織化学染色標本を作成し、
免疫組織化学標本像を学習させた学習モデルによってクラスを判定することを特徴とする請求項6記載の病理診断支援方法。
【請求項8】
組織標本の顕微鏡観察画像データを連続して取得する画像取得手段と、
前記画像データを標本全体での位置情報と組織画像上での位置情報を保持したまま所定のサイズの画像パッチに分割する画像処理手段と、
分割された画像パッチ毎に学習用データから機械学習により抽出された特徴量によってクラスを判定する分類手段と、
分類されたクラスを各位置で表示し、標本全体に再構築する再構築手段とを備えた病理診断支援システム。
【請求項9】
前記画像処理手段が、
組織染色標本を標準化する手段を含むことを特徴とする請求項8記載の病理診断支援システム。
【請求項10】
前記機械学習が、
ニューラルネットワークであることを特徴とする請求項8又は9記載の病理診断支援システム。
【請求項11】
前記ニューラルネットワークが、
転移学習で予め得られたパラメータ値を用いることを特徴とする請求項10記載の病理診断支援システム。
【請求項12】
病理診断支援する疾患が、
癌であることを特徴とする請求項8~11いずれか1項記載の病理診断支援システム。
【請求項13】
取得された画像データを標本全体での位置情報と組織画像上での位置情報を保持したまま所定のサイズに分割し、
学習用データを用いて学習させた学習モデルを用い、
分割した画像パッチ毎に学習用データから機械学習により抽出された特徴量によってクラスを判定し、
判定されたクラス組織画像の各位置で表示し、標本全体に再構成させる処理をコンピューターに実行させる病理診断支援プログラム。
【請求項14】
組織標本の顕微鏡観察画像を連続して取得させる処理を含む請求項13記載の病理診断支援プログラム。
【請求項15】
組織標本の顕微鏡観察画像データに基いて、画像データのクラスを判定するための学習済みモデルであって、
対象となる組織標本の顕微鏡観察画像データを所定のサイズに分割して入力する入力層と、
分割された画像データのクラス判定結果を組織標本の各位置で表示する出力層を備え、
学習用データから機械学習によって抽出された特徴量によって前記クラスを分類する分類器を備え、
入力され所定のサイズに分割された顕微鏡観察画像データのクラスを判定し、組織標本の各位置で表示し、標本全体に再構築するコンピューターを機能させるための学習済みモデル。
【請求項16】
前記学習用データが画像の前処理を行ったものであることを特徴とする請求項15記載の学習済みモデル。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、AIを用いた病理診断支援方法、及び支援装置に関する。また、治療の方針を決定するために腫瘍の病理切片から腫瘍を分類する方法に関する。
【背景技術】
【0002】
患者から採取された組織や細胞を主として光学顕微鏡を用いて検索し診断を行う病理診断は、最終診断として大きな役割を担っている。特に、腫瘍においては、治療方針の決定や、治療効果の評価、予後判定を行う重要な診断となる。
【0003】
例えば胃癌の場合、病理診断によって早期と判断された場合には、EMR(endoscopic mucosal resection)や、ESD(endoscopic submucosal dissection)といった内視鏡的治療が推奨されている。早期胃癌の内視鏡治療は、外科手術と比較して、患者の負担が軽く、術後の回復も良いなどの利点から、外科治療よりQOLが良好であるというデータが得られている。そのため、内視鏡治療で根治が得られる可能性が高い病巣に対しては、内視鏡治療を行うことが推奨されている。
【0004】
内視鏡的切除は早期胃癌においては推奨される治療法であるが、適応は原則として(1)リンパ節転移のリスクが極めて低く、(2)腫瘍が一括切除できる大きさと部位にあるという、2点を満たしていることが必要である。
【0005】
ガイドライン(非特許文献1、2)では、リンパ節転移の危険性が1%未満と推定される病変では内視鏡的摘除と外科的切除で同等の成績が得られるとしており、そのような症例では内視鏡治療を選択することのメリットが大きい。さらに、リンパ節転移のリスクが1%未満である粘膜内癌の大きさは、胃癌の組織型、なかでも分化度によって異なることがエビデンスとして知られているため、組織型を判断するための病理診断が重要となる。
【0006】
胃癌の組織型は、本邦では日本胃癌学会分類である分化型癌、未分化型癌の大きく2つに区分されている。これは、国際的に用いられるLauren分類のIntestinal(腸型)、Diffuse(びまん型)に概ね相当する。胃癌の組織型は日本胃癌学会分類、Lauren分類の他、WHO分類などがあるが、ここでは特に断りにない限り、日本胃癌学会分類を用いている。分化型癌では大きさが3cmを超えるまでリンパ節転移のリスクがないが、未分化型では2cmを超えるとリンパ節転移のリスクがある(非特許文献1、2)。これらのエビデンスを踏まえ、早期胃癌に対する内視鏡治療のガイドラインが構築されている。ただし、癌病巣内では、分化型と未分化型が同一病変内に混在する不均一性(heterogeneity)がしばしば存在し、治療方針の選択に大きな影響を及ぼす。
【0007】
そのため内視鏡的切除を行う前には、まず生検組織を採取して癌の組織型や分化度の情報を得るとともに、内視鏡所見から大きさを判定する術前診断が行われる。術前診断により、内視鏡治療が適応か否かの判断と、適応の場合の切除範囲が決定され、治療適応と判断されると施術が行われる。しかし、施術前の内視鏡所見では正確な大きさや深達度を計測することは困難なので、内視鏡的切除された標本を病理組織学的に検索して治療の根治性が判定されることになる。
【0008】
内視鏡的切除標本の組織学的所見によって根治切除でないと判定されると、追加外科切除の対象となる。具体的には、切除標本の組織型として、分化型癌が優位の病変内に未分化型癌が大きさ2cmを超えて混在していた場合は、非治癒切除として扱い、追加外科切除の適応となり、リンパ節の郭清が行われる。また、分化型優位の病変であっても、粘膜下層(Submucosal layer:SM)浸潤部に未分化型病変があるものは非治癒切除として扱われ、追加外科切除の適応となる。
【0009】
こうした根治性の判定を行うために、病理医は病変全体における分化型、未分化型それぞれの成分の分布、深達度を判断し、病変全体図を再構築し、総合判断を行う。具体的には、以下の手順により総合判断を行い、診断を行っている(図17)。
【0010】
(1)組織標本の作製
内視鏡的切除標本はホルマリン固定の後、病理医が組織標本を切り出す。切除組織片を2~3mmの間隔で平行に切り出し、切り出した割線の入った固定標本の肉眼写真を撮影する。
【0011】
標本処理(組織の脱水、透徹、パラフィン浸漬)を経てパラフィンブロックを作製し、薄切、染色、封入により検体プレパラートが作製される。作製された検体プレパラートでは、切り出された組織スライスが平行に配置されている(図17、検体プレパラート参照)。
【0012】
(2)組織標本の顕微鏡観察及び診断
顕微鏡観察を行い、組織型を記録する。複数の組織型が併存する場合は、各組織型を優位な順に、例えば、tub1(管状腺癌 高分化型)>por(低分化腺癌)などのように全て記載する。病理組織標本の全スライスを顕微鏡的に観察して癌の分化度(分化型・未分化型)判定を行う。
【0013】
顕微鏡観察の結果を、割線を入れた肉眼写真での当該スライスの割線上に、分化型の分布する範囲を赤線、未分化型を青線などに色わけして記入する(図17、Integration参照)。
【0014】
スライスごとに分化度が記入されることにより、病変全体図が再構築される。再構築図を用いて、未分化型成分の分布やその大きさが2cmを超えていないか、粘膜下層(Submucosal layer:SM)浸潤部に未分化型があるかなどの総合判断を行う。
【0015】
すなわち、パラフィン切片から検体プレパラート作製後、顕微鏡下で組織型を判定して分類を行い(Classification)、その結果を病変全体図に再構築し(Integration)、標本全体から総合的に判断する(Decision)、以上の3つの段階を経て総合判断が行われる。
【0016】
プレパラートの検鏡から総合判断し診断を行うには、一定の時間と経験が必要とされる。例えば、内視鏡切除された早期胃癌の場合、ClassificationからDecisionまでのステップは熟練した病理医であっても通常30分程度を要する。また、一定の経験を経た熟練した病理医となるためには12、3年程度の経験が必要であると言われている。そのため、熟練した病理医の診断を効率化しDecisionまでの時間を短縮する、あるいは経験の浅い病理医を補助して正確な診断を行うことのできる方法やシステムが必要とされている。
【0017】
近年、機械学習による画像認識の精度が飛躍的に向上したAI(Artificial Intelligence、人工知能)を画像診断の支援に利用しようとする試みが始められ、内視鏡画像や眼底検査などにおいては、病変部位の検出を補助するための支援装置の実用化が進められている。
【0018】
病理組織の診断支援においても、コンピューターシステムを用いて診断を支援する装置が開示されている(特許文献1~3)。これらの装置は、いずれも主に局所の組織画像から病変に特徴的な領域を検出し、病理診断を支援する装置や方法である。
【先行技術文献】
【特許文献】
【0019】
【文献】特開平10-197522号公報
【文献】特開2012-8027号公報
【文献】特開2012-73179号公報
【非特許文献】
【0020】
【文献】胃癌治療ガイドライン 医師用 改訂第5版、2018年1月、日本胃癌学会編、金原出版株式会社
【文献】小野 裕之ら、胃癌に対するESD/EMRガイドライン(第2版)、2020年2月、日本消化器内視鏡学会雑誌、第62巻、第275~290頁
【文献】Schlegl,T. et al., IPMI2017: Information Processing in Medical Imaging pp. 146-157
【文献】TheCancer Genome Atlas Research Network, 2014,Nature, Vol.513, pp.203-209
【文献】Kather,J.N., et al., 2019, Nature Medicine, Vol.25, pp.1054-1056.
【文献】Gatys, L. A. et al., Journal of Vision September2016, Vol.16, 326. doi:https://doi.org/10.1167/16.12.326
【発明の概要】
【発明が解決しようとする課題】
【0021】
しかし、いずれの文献も病変に特徴的な部位を探索し、病変の有無を検出するにとどまる。すなわち「癌(悪性腫瘍)」か「非癌(非悪性腫瘍)」かの判定を行う。言い換えるとAIによる癌か非癌かの判定結果をマッピングしたものである。本発明ではこれとは異なって、AIを用いて癌をさらに臨床的エビデンスに基づいて分類した判定結果をマッピングすることで、癌の中にある不均一性を可視化する。すなわち、癌か非癌かの判断だけではなく、管状腺癌や低分化腺癌などのように病変内の詳細な分類(Classification)を連続的に行い、病変全体の再構築(Integration)をした後に総合判定する(Decision)までの全工程を備えたシステムを構築する。上述のように内視鏡治療で根治の可能性が高いか、追加外科切除が必要かといった判断においては、病変部位において単に癌か癌でないかを判定するだけではなく、病変内の連続的で不均一な分化度の程度を考慮しつつ、病変内における細分類とその分布と割合を認識し、総合評価する必要がある。
【0022】
本発明は、その病変内での位置を記録しながら病変部位内における精密分析を行い、病変領域にマッピングし、病変全体の再構成をすることによって、腫瘍内の分化度の変化と腫瘍の不均一性を可視化し、診断を支援するシステム、及び方法を提供することを課題とする。本発明のシステム、及び方法により、病理医の熟練度に依存することなく、病変内の不均一性を可視化し、診断を効率よく実施するシステム、及び方法を提供することができる。
【課題を解決するための手段】
【0023】
本発明は、以下の病理診断支援方法、システム、プログラム、及び学習済みモデルに関する。
(1)組織標本の顕微鏡観察画像データを連続して取得する画像取得工程と、前記画像データを位置情報を保持したまま所定のサイズに分割し画像パッチを得る工程と、画像パッチ毎に機械学習による学習データをもとに組織型を判定する判定工程と、判定された組織型を各位置で表示する再構築工程とを備えた病理診断支援方法。
(2)機械学習によって判定された組織型を各位置で表示する前記再構築工程が腫瘍内の分化度の変化と腫瘍の不均一性を表示することを特徴とする(1)記載の病理診断支援方法。
(3)前記機械学習が、ニューラルネットワークによることを特徴とする(1)、又は(2)記載の病理診断支援方法。
(4)前記ニューラルネットワークが、学習用画像として解像度0.1μm/pixel~4μm/pixelの画像を用いることを特徴とする(3)記載の病理診断支援方法。
(5)前記組織標本が癌組織に由来するものであり、癌の病理診断を支援することを特徴とする(1)~(4)いずれか1つ記載の病理診断支援方法。
(6)前記組織標本がHE染色、又は免疫組織化学染色標本であることを特徴とする(1)~(5)いずれか1つ記載の病理診断支援方法。
(7)前記HE染色標本が標準化されていない標本の場合、Neural style transfer手法を用い、擬似的な免疫組織化学染色標本を作成し、免疫組織化学標本像を学習させた学習モデルによって組織型を判定することを特徴とする(6)記載の病理診断支援方法。
(8)組織標本の顕微鏡観察画像データを連続して取得する画像取得手段と、前記画像データを位置情報を保持したまま所定のサイズの画像パッチに分割する画像処理手段と、分割された画像毎に機械学習による学習データをもとに組織型を判定する分類手段と、分類された組織型を各位置で表示する再構築手段とを備えた病理診断支援システム。
(9)前記画像処理手段が、組織染色標本を標準化する手段を含むことを特徴とする(8)記載の病理診断支援システム。
(10)前記機械学習が、ニューラルネットワークであることを特徴とする(8)又は(9)記載の病理診断支援システム。
(11)前記ニューラルネットワークが、転移学習で予め得られた組織型のパラメータ値を用いることを特徴とする(10)記載の病理診断支援システム。
(12)病理診断支援する疾患が、癌であることを特徴とする(8)~(11)いずれか1つ記載の病理診断支援システム。
(13)取得された画像データを位置情報を保持したまま所定のサイズに分割し、教師データを用いて学習させた学習モデルを用い、分割した画像毎に機械学習によって組織型を判定し、判定された組織型を各位置で表示し再構成させる処理をコンピューターに実行させる病理診断支援プログラム。
(14)組織標本の顕微鏡観察画像を連続して取得させる処理を含む(13)記載の病理診断支援プログラム。
(15)組織標本の顕微鏡観察画像データに基いて、画像データの組織型を判定するための学習済みモデルであって、対象となる組織標本の顕微鏡観察画像データを所定のサイズに分割して入力する入力層と、分割された画像データの組織型判定結果を組織標本の各位置で表示する出力層を備え、教師データとして医師によって組織型を判断された画像に基いて学習されたデータをもとに前記組織型を分類する分類器を備え、入力され所定のサイズに分割された顕微鏡観察画像データの組織型を判定し、組織標本の各位置で表示するコンピューターを機能させるための学習済みモデル。
(16)前記教師データが画像の前処理を行ったものであることを特徴とする(15)記載の学習済みモデル。
(17)(1)~(7)いずれか1つ記載の病理診断支援方法を用いて、分析結果が表出された再構築図に基づいて患者を診断する方法。
(18)患者を治療する方法であって、(8)~(12)いずれか1つ記載の病理診断支援システムを用い、得られた再構築図に基づいて治療方針を決定することを特徴とする患者の治療方法。
【図面の簡単な説明】
【0024】
図1】病理診断支援システムの一実施態様を示す図。
図2】病理診断支援システムの別の実施態様を示す図。
図3】病理診断支援方法の実施態様の流れを示す図。
図4】画像パッチの作成方法の例を示す図。
図5】正常組織のDCGANをベースとした異常検知による判定系の例を示す図。
図6】学習を行うために用意した画像データセットの例を示す図。
図7】分化型/未分化型の画像データセットを用いたScratch学習、ファインチューニングによるトレーニング、バリデーションのAccuracyを示す図。
図8】分化型と未分化型の混在なし/混在ありの画像データセットを用いたScratch学習、ファインチューニングによるトレーニング、バリデーションのAccuracyを示す図。
図9】診断用画像の画像パッチから形態特徴量の2次元での分布を散布図として可視化し、散布図の点が由来する画像パッチの病変全体での局在を表すことを模式的に示した図。
図10】病理診断支援装置を用いた病理診断支援の流れを示す図。
図11】HE染色標本を用いた胃癌の2クラス分類器の構築及び結果を示す図。(A)は学習用画像データの例を示す。(B)~(D)は学習曲線の例を示し、(B)はbaselineの検討、(C)、(D)は調整結果を示す。
図12】HE染色標本を用いた胃癌の3クラス分類器の構築及び結果を示す図。(A)は学習用画像データの例を示す。(B)はResenet18、(C)はInceptionv3、(D)はVgg-11 with batch normalization(Vgg-11_BN)、(E)はDensenet121、(F)はSqueezenet1(Squeezenet version1.0)、(G)はAlexnetを用いた結果を示す。
図13】HE染色標本を用いた甲状腺癌の3クラス分類器の構築及び結果を示す図。(A)は学習用画像データの例を示す。(B)はDensenet121、(C)はResenet18、(D)はSqueezenet1、(EはInceptionv3、(F)はVgg-11_BNを用いた結果を示す。
図14】遺伝子の変化や発現に関連した特徴的な病理組織像を用いた分類器の構築及び結果を示す図。
図15】粘膜の厚さを考慮して組織型を分類する方法を示す図。(A)は粘膜の厚さに応じて縦方向に3枚の画像パッチが得られた例を示す。(B)は画像パッチの分類結果をもとにマップを作成する手順を示す。
図16】Neural style transferを用いた画像の加工を示す図。
図17】従来技術による病理診断の流れを示す図。
【発明を実施するための形態】
【0025】
最初に本発明に係る病理診断支援システムの実施形態について説明する(図1、2)。病理診断を補助するために必要な装置は、光学系、画像処理系、学習系、分類系、再構築系、統括・判定系のシステムである。具体的には、顕微鏡、及び顕微鏡に接続された撮像装置、画像処理を行う装置、画像処理後の画像を用いて学習させパラメータを決定する学習装置、また、画像処理後の診断用画像を用いて学習装置で決定されたパラメータによる分類判定、分類判定された画像を再構築するコンピューターシステムである。画像処理系、分類系、学習系、再構築系、統括・判定系のコンピューターシステムは、図1に例示するように、サーバー内のシステムとして構築することができる。ここでは異なるサーバー上でシステムを構築した例を示しているが、一つのサーバー上において、別個のプログラムによって制御されるシステムとして構築してもよい。
【0026】
また、図2に例示するように高性能のCPUやGPUを備えたPCを用いれば、画像処理、学習、分類、再構築、判定の機能は、1つのPC内で順を追って行うことが十分に可能である。あるいは、ここでは示さないが、画像処理系、学習系、分類系、再構築系、統括・判定系、それぞれを別個のPCで行うように構築してもよい。また、これらに限らず、各施設の状況に即したシステムを構築することが可能であることは言うまでもない。以下に、実施態様を示し説明する。
【0027】
[実施態様1]
サーバーを用いたシステムについて説明する。統括・判定PC以外のコンピューターシステムは、サーバー上におかれ構築されている(図1)。光学系は明視野光学顕微鏡と撮像装置からなり、操作者が光学顕微鏡下で撮影視野を設定し、撮像装置で病理組織画像を取得する。連続した画像の取得は、手動で視野を移動することにより取得しても、電動ステージを用いて取得してもよい。また、組織標本のWSI(Whole Slide Image)、いわゆるヴァーチャルスライドから画像を取得してもよい。撮像装置で取得した画像は画像処理系サーバーに送られ、画像処理が行われる。
【0028】
画像処理系サーバーでは、RGBのチャンネル分離や画像のヒストグラム解析、画像の2値化のような一般的な画像処理や、後述のHE染色画像から上皮性組織の識別、抽出を行う処理の後、画像を適切な大きさに分割して画像パッチ(なお、画像パッチは、画像タイル、画像グリッドとも称される。)を作成する。その後、学習用画像の場合は、非腫瘍(正常)、分化、未分化などのラベルを付与して学習系サーバーに送られ、診断用画像の場合はラベルの付与なく分類系サーバーに送られる。
【0029】
学習系サーバーとしては自施設のローカルサーバーだけでなく、クラウドサービスやデータセンターを使用することができる。学習系システムでは、分類系システムで用いるためのパラメータを決定し、分類系サーバーに送る。
【0030】
図1に示したようにクラウドサービスやデータセンターを使用する実施形態では、高性能のGPU資源を活用して大規模な画像データセットを用いた学習が可能となる。例えば、多くの施設から画像とともにどの領域を疾患領域として判断したか等のアノテーションをアップロードすることにより、多施設の病理医が分類基準の作成に参加することができ、診断基準の均一化を図ることができる。また、質の高い判定系を作るためには、病理医の経験度や専門性に応じて画像とアノテーションのアップロードへの参加を制限することにより、分類基準の精度管理が可能になる。
【0031】
分類系サーバーでは、画像処理系システムから受け取った診断用画像に対して、学習系システムで決定されたパラメータを用いた分類判定を行い、結果データを再構築系システムに送る機能を有する。
【0032】
診断用画像は粘膜の厚さに応じて縦方向に複数枚、通常3~5枚の画像パッチが得られる。この縦方向の順序と共に、標本全体での位置を示す組織標本スライスの水平方向での順序を保持した番号が付与されているので、その画像が分析により分化型、未分化型、非腫瘍(正常)のどのクラスに判定されたかの結果(0、1、2で出力)をスライス毎に保存し、再構築系に送る。
【0033】
再構築系では、縦の1列ごとに、縦方向の3個の画像パッチのうち1個でも未分化と判定された部分は未分化と判定することによりスライス毎の1次元ベクトルを得て、グレースケールに変換し、分化型を黒、未分化型を白で対応させ画像として描出し、白と黒により分化型、未分化型を表示した直線を得る。この直線を、各スライスの開始点の座標と癌部の開始点の座標をもとに配置して、分析結果の再構築図を得る。
【0034】
[実施態様2]
PC内で、画像処理系、分類系、再構築系、判定系、学習系の演算を行うシステムについて説明する(図2)。光学系は実施態様1と同様だが、画像処理系、分類系、再構築系、判定系、学習系の演算を行うシステムはすべて単一のPC内に構築されたシステムとなっている。単一のPC内で演算を行っているが、行われる基本的な処理は、実施態様1と同様である。
【0035】
ニューラルネットワークを用いた深層学習では、データテンソルに対して繰返し行われる演算の処理に当たって、GPUを演算器として用いる技術;GPGPU(General-purpose computing on graphics processing units)により時間の短縮と性能が飛躍的に向上されてきた。自施設ローカル内のサーバー、あるいは図2に示すPCを用いたシステム、いずれの場合であっても、高性能のGPUを導入することにより自施設内で大量の画像データで学習することが可能となっている。
【実施例
【0036】
最初に胃癌を例として説明するが、病理診断が必要とされる疾患であれば、適切な分類器を用い適切な画像を学習させることによって、どのような疾患であっても適用できることは言うまでもない。また、後述のように、臓器によって適切なモデルを選択することによって高い正解率を得ることができる。ここでは、画像認識力の高いニューラルネットワーク、特に畳み込みニューラルネットワークを用いて解析を行っているが、EfficinentNetやBig Transfer(BiT)、ResNeStなどの画像認識用の新しいモデルも使用することができる。また、自然言語処理の分野で用いられるTransformer、Self-AttentionやBERT(Bidirectional Encoder Representations from transformers)が画像系に応用されたVision Transformer(ViT)などのモデルを使用してもよい。さらに、今後開発される画像認識力の高いモデルを使用できることは言うまでもない。
【0037】
[病理診断支援方法]
内視鏡的切除が行われた胃癌組織標本を例に、病理診断支援方法について説明する(図3)。従来と同様に光学系装置により組織画像を連続して取得する。この際に位置情報は標本上での座標として取得し再構築系サーバーに送られる。取得した画像は、画像処理系システムにおいて画像処理ののち、分割処理を行って適当な大きさに分割して画像パッチを作成する。画像パッチを作成して学習させる手法は、アノテーションに必要な時間や労力を大幅に削減できるため、モデルの選択や調整を含めた開発サイクルの効率化に非常に役立つ。
【0038】
画像パッチとは、ここでは腫瘍内に存在する全ての形態が網羅されている画像データをいう。図4に示した例は、採取した元の画像から、上下の余白部を切り取って組織の部分のみとし、それを左から3分割して1~3の3枚の小画像とし、さらにそれぞれを縦横2分割して4枚とすることで3X4=12枚の画像パッチを作る例を示している。3分割したうちの小画像1についていえば、縦横2分割することによって、4つの小パッチが得られることになる。小画像1が512×512pixelであれば、256×256pixelの画像パッチが4枚得られることになる。高い正解率を得るためには、1つ1つの学習データに含まれる組織成分を単一化することが非常に重要である。画像パッチを用いる方法は、1つの画像パッチ内の組織像が均一になり得ることから、質の高い学習データを得ることが可能となり、高性能のモデルを得るために非常に有効である。
【0039】
原画像上での位置情報は再構築系に送られている。分類系システムにおいては、各画像パッチについて、学習用画像によって作成されたパラメータをもとに分析と判定が行われる。判定結果は、再構築系システムに送られ、原画像上にマッピングされる。判定系システムでは再構築系システムの結果に基づき、追加外科切除の必要性の有無を判定し、モニタ上に表示する。医師は自身の検鏡結果を元にAIによる再構築図の修正を行って判定結果を確認し、診断を行う(図3)。
【0040】
[組織型の分類・判定系の構築]
1.開発環境
開発環境はプログラミング言語にPythonを用い、深層学習フレームワーク(Framework)としてはPytorch、及びTensorFlowをバックエンドとしたKerasにより開発を行なった。
【0041】
2.学習用データ
AIを用いた診断支援システムを構築するためには、新しく組織標本画像データが入力された場合に、組織型が正確に分類できるように予め学習させておく必要がある。そのために、学習用データとして、熟練した病理医によって、各組織型が判断された学習用データを用意する必要がある。この学習用データは、学習用画像と病理医が判断した非腫瘍(正常)、腫瘍、腫瘍の組織型などのラベルからなり、教師あり学習として利用される。
【0042】
分化型胃癌と未分化型胃癌の病理組織画像を用い、学習用画像を作成した。胃癌の組織内には癌細胞とともに非癌細胞が混在し、そのほとんどはリンパ球やマクロファージなどの炎症細胞、繊維芽細胞などの非上皮性細胞である。ここで作成する分化型、未分化型の分類系は癌の形態や構築に基づいて行うので、非上皮性細胞は必要ない。そこでまず、一般的な日常診断に用いるヘマトキシリン・エオジン(HE)染色標本ではなく、上皮細胞が有する細胞内タンパク質サイトケラチン(Cytokeratin)による免疫組織化学染色(Immunohistochemistry、IHC)を行った組織標本を用いている。
【0043】
サイトケラチンは、20種類のサブタイプに分類され、全ての上皮に存在して、腫瘍化しても安定した発現がみられる。たとえば、食道、胃、大腸、肝、胆管、乳腺、前立腺などの癌に発現している。上皮性細胞に発現しているサイトケラチンに対する抗体を組織切片上で結合させ、発色させることで上皮性細胞のみが着色された組織標本を得る。着色された組織標本から画像を取得することで、上皮性組織のみに対する形態学的分類判別が可能となる。
【0044】
サイトケラチンによる免疫組織化学染色は、上皮性組織のみを染色できるため、上皮性組織の構築のみを使って形態学的分類判別を行う際の画像データとして有効である。したがって、上皮組織由来の癌であれば、ほとんどの癌にサイトケラチンによる免疫組織化学染色を用いた病理診断支援方法が適用可能である。特に有効であるのは腺癌であり、胃癌、大腸癌、膵癌、胆管癌、乳癌、肺癌などはサイトケラチンによる免疫組織化学染色を好適に適用できる上皮組織由来の癌として挙げられる。すなわちサイトケラチンによる免疫組織化学染色を用いて分類する方法は、多くの癌に応用することができる。
【0045】
一方で、実臨床での病理診断は主としてHE染色標本を用いて行われている。病理医が、光学顕微鏡を用いて組織標本を観察する際には、HE染色標本の組織画像から上皮性組織と非上皮性組織とを無意識のうちに識別、抽出して視認し、上皮性組織のみに対して形態学的な判断をし、癌の診断を行っている。病理医が無意識のうちに行なっているこのステップは、AIを用いてHE染色標本に画像処理による変換を行ったり、深層学習を用いた画像変換や画像生成を行えば、サイトケラチンによる免疫組織化学染色と同等の画像に変換、生成することができる。実臨床で用いている標本と同じHE標本を元に画像変換や画像生成を行うことによって、AIに画像を学習させたり分析することができる。HE染色標本を使用することにより、腫瘍の種類を問わず適用することが可能となる。また、後述するように、褪色化が進んだ標本、染色の薄い標本、施設間により標本色に差がある場合など、HE染色画像をそのまま使用できない場合には、Neural style transfer手法を用いて、HE染色画像を擬似サイトケラチン染色画像に加工すれば、病理診断支援システムにより判定することができる。
【0046】
一般的な画像処理の手法、例えばRGBのチャンネル分離や画像のヒストグラム解析、画像の2値化などを組み合わることによっても上皮性組織の形態分類に適した画像を得ることができる。また、GAN(Generative Adversarial Network)を初めとする深層学習の手法を用いた画像生成により形態分類に適した学習用画像を生成することができる。深層学習を用いる場合には、HE染色標本と連続したサイトケラチンの免疫組織化学染色標本とをペアで学習させることにより、画像のpixel単位で対応した変換画像を得ることが可能となる。このような画像の前処理は、学習の効率とスピードアップに最も重要であるとともに、施設間での染色状態の違いや、標本の厚さの違いなどから来る画像の色の差異を補正し標準化することになり学習画像や診断画像の標準化にもつながる。
【0047】
GANによる画像生成を用いることにより、未だ頻度の低い病変を判定する事も可能になる。頻度の低い病変では大量の学習用画像を用意することが難しいため、従来のような分類モデルで判定をすることが難しい。しかしながらGANと機械学習による異常検知を組み合わせた方法(AnoGAN等)では、正常組織を学習させておいたGANモデルを利用して画像の異常度を数値化して判定することができる。図5では、正常胃底腺組織画像のみを畳み込みニューラルネットワークモデルで学習させたGANモデル(DCGAN;Deep Convolutional GAN)を用いて、異常検知を行うAnoGANモデルによる判定を行った(非特許文献3)。異常度を数値化した結果は、学習された正常胃底腺組織(4、5)に対しては1200台の数値となっているが、学習したことのない腺窩上皮(1、2)や低分化腺癌(3)の画像に対しては、大きな数値となる。正常組織の画像を用いて機械学習を行う異常検知の手法を用いれば、大量の学習用画像を用意することが難しい病変であっても、正常組織との差異として検出することが可能となる。
【0048】
なお、いずれの染色方法を用いる場合であっても、用いる病理標本は、均一的な切片作成に加えて、染色の色調や濃淡も判別できるように、品質管理された機器・試薬と手順で行うことが重要である。
【0049】
分類系の性能はニューラルネットワークモデルの性能と学習画像の2つで決定されることから、学習画像は分類系の構築において重要な役割を果たす。転位学習は大規模な画像データを用いたコンペティションで工夫を重ねた優秀なモデルを利用することができるが、学習させる画像は利用者が自身の問題に照らし合わせて用意しなければならない。利用者は各分野で実現すべき課題に適した学習用画像を工夫する必要がある。以下の胃癌の内視鏡切除検体での例は、粘膜の正常部、癌部から取得した画像をもとに、概ね正常粘膜部、分化型癌、未分化型癌と識別できるように画像パッチを作成した。
【0050】
画像の解像度は、対物レンズ、撮影レンズの組み合わせにより概ね0.1μm/pixel~4μm/pixel程度の範囲で、好ましくは、0.2μm/pixel~4μm/pixel、より好ましくは、0.25~2μm/pixelが通常用いられている顕微鏡の解像度から好ましく用いることができる。画像の大きさとしては概ね34x34pixelから1024x1024pixelの範囲を用いた。非常に小さな領域に限局した形態を識別したい場合は、解像度の高い、小さな画像を用いて学習を行うことができる。また、サイトケラチン免疫組織化学標本による実施例では256x256pixelの大きさの画像をもとに学習を行ったが、学習に使用するモデルによっては、より大きい画像を用いることも必要となる。画像の大きさは、実現すべき課題、組織の状態、学習モデルによって適宜選択することができる。
【0051】
ここで学習用や診断用に用いている画像パッチは、目視で認識可能な限りできるだけ小さくしている。画像パッチを小さくすることにより、ひとつの画像パッチ内に含まれる組織の形態を単一に近づけることが可能となる。さらに、単一な形態のみを含んだ小さな画像パッチを用いると、従来の分化・未分化による2分法での判定が困難であった境界的形態をとる腫瘍を新しい観点から解析することも可能となる。診断用画像について作成される画像パッチでは、個々の腫瘍内に含まれる全ての病理組織形態を網羅したものがその腫瘍組織内での位置データと共に得られる。
【0052】
3.深層学習
抗サイトケラチン抗体を用いた免疫組織化学染色を行った標本から癌部の組織画像を取得し、画像の回転や分割などの増幅処理を行い、256x256pixelの画像を各セット644枚作成して学習用データセットとした。実際の情報量は、色情報も含まれることから、256x256x3のデータ量となる。データセットは、分化型、未分化型がはっきり区別できるセットa、未分化型成分が分化型成分に混在している未分化型成分なし/ありのセットbを用意した(図6)。
【0053】
ここで用いる深層学習は、画像処理に適したネットワークであれば、特に限定されない。画像認識力の高いニューラルネットワークとしては、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)や、あるいは自然言語処理の分野で用いられるTransformer、Self-AttentionやBERT(Bidirectional Encoder Representations from transformers)が画像系に応用されたVision Transformer(ViT)などのモデルを例示できる。畳み込みニューラルネットワークの例としては大規模物体認識データセット(ImageNet)を用いた画像認識コンペティション(ILSVRC)で開発されたものが多く、ResNet、Inception-v3、VGG、AlexNet、U-Net、SegNet、Densenet、Squeezenetなどが挙げられ、EfficinentNetやBig Transfer(BiT)、ResNeStなどの画像認識用の新しいモデルも用いることができる。さらに、今後開発される画像認識力の高いモデルを使用できることは言うまでもない。
【0054】
[実施例1]
まず、サイトケラチンの免疫組織化学染色標本を用い、Set a(図6)に示す判定の容易な分化型、未分化型のデータセットによって、ResNetで転移学習を行った。転移学習は、学習済のネットワークとパラメータ値を利用して、新たなタスクに活用するものである。ResNetが大規模なデータセットで学習したパラメーター(重み)の初期値を利用し、自前の画像データで学習させた転移学習と、学習済みのパラメータの初期値を用いずに、モデルの構造のみを利用して自前の画像データをモデルに学習させるScratch学習の両方によって学習を行わせた。
【0055】
本発明では、以下の機器システムを用いた。
A;CPU;Intel corei7 GPUなし
B;CPU;Intel corei7, GPU NVIDIA GeForce 1080-Ti
C;CPU;Intel Xeon GPU NVIDIA GeForce RTX 2080-Ti
D;CPU;Intel corei9, GPU NVIDIA Titan-V
分化型/未分化型胃癌のサイトケラチン免疫組織化学染色標本から作成したデータセットaを用いた学習では、認識精度は、Scratch学習により0.9609、転移学習(ファインチューニング)により0.9883と、充分な認識精度が得られた(図7)。
【0056】
次に、未分化型成分の混在なし/ありの胃癌のサイトケラチン免疫組織化学染色標本であるSet b(図6)を用いた学習では、Scratch学習により0.9219、転移学習(ファインチューニング)により0.9102と、こちらのデータセットでも診断支援に用いるための充分な認識精度が得られた(図8)。未分化成分の混在なし/ありの標本は、病理医にとっても難易度の高い組織像である。病理医にとっても判断が難しいデータセットに関してはAIによる正答率も低くなるものの、その場合であっても90%以上の正答率を出せることから、充分な精度があるものと考えられる。
【0057】
過学習は訓練データに特化したパラメータが学習されてしまうことで汎化性能が低下し、検証データでの精度が低下してしまうことである。過学習を防ぐには、訓練データを増やすことが最善の解決方法であるが、少ないデータをもとに効率よく訓練データを増やす方法として、データ拡張(Data Augmentation)がある。データ拡張は、訓練データの画像に回転、変形、中心部切り出し、拡大、縮小などの加工を行なって訓練データを増やす方法である。ここでも学習用画像に対してはこれらの処理によるデータ拡張を行なっている。
【0058】
深層ニューラルネットワークにかけることにより、データの次元は順次に削減されながら、入力画像の持つ本質的な特徴量(潜在表現、内部表現とも呼ばれる)が抽出される。特徴量(潜在表現、内部表現)をデータから得る方法の一つとして自己符号化器(Autoencoder)がある。これはEncoder(符号化器)により、元のデータから特徴量(潜在表現、内部表現)を抽出し、これをもとにDecoder(復号化器)により元のデータへの復元を行うものである。画像データの場合は、符号化器の部分に畳み込みニューラルネットワークを用いることができるが、これは潜在表現の抽出の方法としてニューラルネットワークを用いていると見ることもできる。転移学習で作成した分類器を特徴抽出器として用いることで、診断用画像について作成される画像パッチから特徴量を抽出し、さらに2次元まで次元削減することで、組織形態から得られた特徴量の分布図を散布図として可視化することができる。分化型と未分化型胃癌の組織標本から作成した画像パッチから特徴量をさらに2次元まで次元削減することで、形態特徴量の2次元での分布を散布図として可視化することができる。
【0059】
図9左は、腫瘍に存在する形態特徴量の次元削減による2次元での散布図を示している。診断用画像について作成される画像パッチでは、個々の組織内に含まれる病理組織形態の網羅的画像パッチがその組織内での位置データと共に得られている。そのため、散布図を用いて従来の分化・未分化による2分法での判定が困難であった境界的形態をとる腫瘍をクラスタリングすることが可能となる。さらに散布図の個々の点が由来する画像パッチが病変内のどこに存在していたかをたどることにより、特徴量クラスターが実際の腫瘍内でどの様に分布しているのかを知ることもできる(図9右)。
【0060】
病理組織画像から抽出された特徴量、潜在表現を用いることで、画像以外の型式の異なる他のモダリティのデータから得られた特徴量との結合(concatenation)や融合(fusion)が可能となる。これにより異なったモダリティの特徴量同士を結合して、結果の推論を行うマルチモーダル学習に用いることができる。分化型、未分化型といった従来の分類カテゴリーではなく、病理組織画像の持つ特徴量そのものを、型式の異なる他のモダリティのデータから抽出された特徴量と結合することで、異なったモダリティの情報が結果の推論に対して相補的に働くことを利用できるようになる。例えば治療方針決定のような臨床での意思決定では、性別などのカテゴリカルデータや、検査データなどの数値データ、放射線画像などの画像データ、遺伝子変化の情報などの形式の異なるデータを融合して判断を形成するシステムが構築できる。
【0061】
[実施例2]
[再構築マップの作成]
上記で構築された判定系を用いて、分化型と未分化型成分の混在する胃癌の組織標本を用いた解析と再構築を行った(図10)。この例では、サイトケラチンによる免疫組織化学染色標本を用いて学習させたモデルを構築し、判定に用いている。
【0062】
検体プレパラート上には、切り出された組織スライスが平行に配置されている。組織検体の1スライスの長さがスライドガラスよりも大きい場合は、図10に示すようにスライドガラスに収めるために、長短の2本(AとB)に切断されて標本が作成されている。サイトケラチン染色標本上のAとBから合成される1本のスライスから、撮影視野を移動させながら、組織画像を連続して取得する。ここでは連続する3枚の画像を示している。画像取得とともに、組織標本の各スライスの開始点の座標、癌部の開始点の座標を採取する。上記の連続した画像を分割処理し、256x256pixelの画像を生成する。また、サイトケラチンによる免疫組織化学染色標本を用いた分類器では、学習画像に多少異なる組織成分が含まれていても高い正解率が得られたため、弱拡大画像による解析が可能であった。そのため、この例では縦方向(粘膜の厚み方向)は1列の画像パッチでカバーすることができた。
【0063】
分割した画像には水平方向に番号を付与して、元の標本スライス上での順序を保持させる。上記の画像セットを、すでに作成した分類、判定系で分析する。分析結果は分化型、未分化型のどちらに判定されたかを、0と1で結果出力させ、1次元ベクトルとして保存する。1つのスライスから得られた1次元ベクトルを二次元化し、ベクトルの値1を値255に変換することで、0が黒、255が白、の2色に対応させる。得られた二次元ベクトルを画像として描出、黒、白により分化型、未分化型を表示した直線を得る。この例では、白が未分化型、黒を分化型に対応させている。
【0064】
ここでは、NumPyを用いて同じ1次元ベクトルを二重にネストすることで2次元化し、続いてNumPyのもとで機能するグラフ描画パッケージMatplotlibのpyplotモジュールを用いて、2次元化されたベクトルを直線として描出している。なお、NumPyはPython言語での開発環境下において、多次元配列の操作と数値演算機能を提供するライブラリである。ここでは判定系で出力された分析結果の1次元ベクトルを、NumPyを用いて二重にネストして2次元化し、pyplotモジュールを用いて直線として描出している。
【0065】
各スライスから得られた直線を、各スライスの開始点の座標、癌部の開始点の座標をもとに配置することにより、検体組織全体についての分析結果の再構築図が得られる。従来、病変の存在判定だけであった深層学習の利用をさらに発展させ、本実施例で示すように癌病巣の分化度と位置の情報で癌病巣を総合判定可能なパターンへと再構築している。その結果、癌病巣の未分化度マップを描出し、未分化型成分の位置や大きさを一目で判断し、迅速に転移のリスク等について判定することが可能となる。
【0066】
また、病理医が顕微鏡下の観察により判断した分化度の結果を精密に検体全体図の割線上に描出するには限界があり、とりわけ非常に狭い範囲に分化度の異なる組織が混在している場合には、分布を忠実にマップして再現することは難しい。従ってヒトが作成する再構築図には精密度の点で自ずと限界があり、再構築図の作成にも多大な時間を要する。今回開発した方法を用いれば精密なマップの作成が可能であり、治療法の選択に大きく貢献できる。
【0067】
本システムを用いて病理医が実際の標本を検鏡する際には、AIが作成した再構築図を参照しながら、自身の検鏡結果をもとにAIによる再構築図の修正を行って、診断報告用の再構築図を完成する。これにより再構築図の精密度が格段に向上するだけでなく診断報告の作成に要する時間が大幅に短縮できる。
【0068】
[実施例3]
HE染色画像による病理診断支援方法について説明する。実臨床での病理診断は主としてHE染色標本を用いて行われる。サイトケラチンの免疫組織化学染色標本で構築した分類器を、さらに汎用性の高いものとするためにはHE染色標本による分類器が必要である。HE染色標本での学習用データセットを作成し、まず胃癌の分化・未分化の2クラス分類器を構築した(図11)。
【0069】
正解率の高い分類器を作るためには、学習用画像データセットが重要である。図11(A)に示すような分化型、未分化型の2クラスの学習用画像データセットを多数用意した。学習用画像1枚に含まれる組織形態学的な成分は可能な限り単一とし、複数の成分が含まれないように学習用画像を準備する。しかしながら画像そのものの大きさは、分類器に用いる畳み込みニューラルネットにより、224x224pixelや299x299pixelなどの指定があるので、その大きさに単一の形態学的成分のみからなる小さな領域が収まるように画像を準備する。大きな画像を分割して規程サイズの画像を得る場合も、分割した画像が上記の条件を満たすように、分割のサイズを検討する。
【0070】
次に、一つのモデルについて、学習の条件を変えながら、検証データで正解率が高くなるように調整を行なっていく。図11ではモデルにResnet18を用いた場合の学習曲線の例を示した。baselineの検討では、エポックごとの検証用データ(val)での正解率の変動が大きい(図11(B))。そこで学習率の調整とバッチサイズの調整により、学習曲線はbaselineから1(図11(C))、2(図11(D))へと改良された。2の学習曲線では、概ね過学習の傾向は見られず、検証用データでの正解率の最高値は0.9683が得られた。
【0071】
[実施例4]
胃癌の分化型、未分化型に正常組織を加えた3クラスの学習用データセットを用いて、6個のモデルを比較しながら、正解率の高い分類器を作成した(図12)。分化型、未分化型、正常の典型的な組織像を図12(A)に示す。これらの学習用画像データセットを用い、6つのモデルを使用して、分類器の作成を行った。転移学習による画像分類に用いることのできるモデルは多数あり、いずれもImageNetデータセットを用いた画像認識のコンペティションで評価されたモデルやその改良版である。Resnet18(図12(B))及びInceptionV3(図12(C))では検証用データでの正解率の最高値は0.93および0.92以上が得られ、Alexnet(図12(G))では0.9639の正解率が得られた。この他、Densenet121(図12(E))では100エポックの学習ではようやく汎化性能が出始めるところにあり、100エポックを超えて学習すれば、充分な汎化性能を得る可能性がある。一方でVgg11_BN(図12(D))での60エポック以降やSqueezenet1(図12(F))では過学習の傾向が認められる。このように、学習曲線を見ながら、過学習に陥らずに汎化性能をえられる最適なモデルとエポックでパラメータを取得し、実臨床に応用することができる。
【0072】
[実施例5]
次に、実施例で示してきた病理診断支援方法は、胃癌だけではなく、様々な癌においても適用可能であることを示す。本明細書では、学習データセットを準備し、その学習データセットに適したモデルを選択して転移学習を行い、パラメータを保存して分類系で用いる病理診断支援方法を示している。この一連の方法は、胃癌の分化・未分化に限らず他臓器の癌にも用いることができる。胃癌以外の様々な癌において、同一の腫瘍内に組織型の混在があることが知られ、取り扱い規約に記載のあるものの例として、子宮内膜癌、甲状腺癌、乳癌などがある。例えば甲状腺癌では高分化型の成分(乳頭癌や濾胞癌)と低分化型の成分が混在した場合、50%以上を低分化型が占める場合に低分化型として記載される。子宮内膜癌では腫瘍内に占める割合により3段階に分類されている。このような場合にも高分化型と低分化型のそれぞれの学習用画像データセットを構築して分類器を作成すれば、高分化・低分化のマップを作成することが可能となる。
【0073】
甲状腺癌での学習モデル構築の例を示す(図13)。甲状腺の高分化型(乳頭癌)と低分化型、正常甲状腺組織の3クラス分類(図13(A))でモデルを構築した。この甲状腺でのデータセットでは、Resnet18(図13(C))やInceptionV3(図13(E))、Squeezenet1(図13(D))などで過学習に陥りやすい傾向にあるが、Densenet121(図13(B))では40エポック程度までで学習を終了してパラメータを得ることで正解率90%程度のモデルを得ることが可能である。またVgg11_BN(図13(F))では検証データでの正解率はわずかながら増加傾向にあるので、さらにエポック数を増やして学習することにより正解率が向上することが考えられる。胃癌、甲状腺癌の例で示すように、臓器毎に最適なモデルは異なっている。したがって、各臓器毎にモデルを選択し、正解率の高いモデルを選択する必要がある。
【0074】
[実施例6]
遺伝子の変化や発現に関連した特徴的な病理組織像が知られている腫瘍についても、学習データセットを準備し、その学習データセットに適したモデルを選択して、パラメータを保存して分類系で用いる病理診断支援方法を用いることができる。癌に関連した遺伝子やタンパクの変化は膨大な情報が蓄積しているが、そのうち組織形態学的な情報との関連が知られているものについては、特徴的な病理組織像を基盤として分類することにより、どのような遺伝子や細胞生物学的な検索をさらに行なっていくかの方針を決めることができる。また、さらなる検査のオーダーを推奨する上でも補助になると考えられる。
【0075】
NCI(National Cancer Institute)によるThe Cancer Genome Atras(TCGA)では胃癌が以下の4つのmolecular subtypeに大別されることが知られている(非特許文献4)。
Chromosomal Instability(CIN)
Genomically stable(GS)
Microsatellite instability(MSI)
Epstein-Barr Virus(EBV)
このうちMSIやEBVのタイプの胃癌では腫瘍内へのリンパ球の浸潤が著しいという特徴的組織像が知られている。また、GSに含まれる癌は組織学的にびまん型(低分化型腺癌)が多くを占め、その中にもいくつかの遺伝子の変化を伴う群が知られている。
【0076】
すでに、深層学習を用いて、HE染色画像からMSIを推定する方法が報告されている(非特許文献5)。HER2タンパクの過剰発現/遺伝子増幅を伴う胃癌では分子標的薬による治療が行われ、免疫組織化学やFISH法によるコンパニオン診断が確立している。したがって、MSIに加えてHER2タンパクの過剰発現/遺伝子増幅に関しても、HE染色で推定することができれば、HER2陽性胃癌をHE染色による病理診断の段階で見逃すことなく、より適切な治療を行い得る。こうしたHER2陽性胃癌では、Lauren分類による腸管型(管状腺癌)とびまん型(低分化型腺癌など)のうち、腸管型(管状腺癌)のほうが有意にHER2タンパクの過剰発現の頻度が高いことが知られ、腸管型(管状腺癌)とびまん型の組織像が混在する場合には、腸管型が多く含まれる標本でのコンパニオン診断が推奨されている。
【0077】
図14では、HER2 タンパクの過剰発現/遺伝子増幅のある癌組織からの組織画像(A)、MSIの確認された癌組織からの組織画像(B)、びまん型の癌にみられる遺伝子に変異のある癌組織からの組織画像(C)を用いて学習画像データセットを作成し、3クラスの分類を行なった。3つのクラスに分類した画像を学習させ、分類器を作成し、診断用画像で検証した。Alexnetでは0.9656の正解率が得られ、Resnet18では、Alexnetの倍のエポックを学習に要するが、0.9089の正解率が得られた。
【0078】
遺伝子の変異や発現に関連した特徴的な病理組織像が知られている場合には、病理画像から遺伝子の変異や発現の変化を推測することができる。実施例で示したように、HER2タンパクの過剰発現/遺伝子増幅の可能性をHE染色による病理診断の際に指摘することができれば、免疫組織化学染色により確定診断を行い、HER2を標的とした治療を行うことができる。このような遺伝子の変異や発現に関連した病理組織像は、症例数の多い施設(High volume center)の病理医はおおよその特徴を把握していることが多い。このようなエキスパートの経験による蓄積を分類器として病理診断支援システムに実装することが可能となる。さらに、診断精度が高くなれば、HE染色をコンパニオン診断として分子標的薬の選択を行うことも可能となる。実施例では、上記の3クラスとして分類を行なっているが、新しく遺伝子の変化や変化と関連した特徴的な組織像がわかれば新しいクラスを順次追加して分類器を作成していくことができる。
【0079】
[実施例7]
HE染色標本の画像データセットから作成した分類器を用いて、実際に内視鏡切除標本から分化・未分化マップを作成する際には、粘膜の厚さに応じて縦方向に3~5枚の画像パッチが得られる。図15(A)に、縦方向に3枚の画像パッチが得られた例を示す。この例は、HE標本での胃粘膜固有層の縦方向が3枚横方向が10枚の画像パッチである。
【0080】
図15(B)中段には、この画像パッチにおいて分類結果が正常と判定されたパッチを灰色、分化型を黒、未分化型を白で示している。縦の1列ごとに、縦方向の3個の画像パッチのうち1個でも未分化と判定された部分は未分化と判定するマップを下段に示した。ここでは縦1列ごと、すなわち厚み方向に1個でも未分化と判定されたパッチがある場合には、未分化と判定する基準を設けているが、厚み方向のパッチのうち何個が未分化とされた場合にその列を未分化として水平方向のマップを作るかの基準は自由に変更することが出来る。このような処理を行うことにより、隆起のある病変の場合や小さい画像パッチを使用する場合でも判定を行うことが可能となる。
【0081】
[実施例8]
実臨床での病理診断は主としてHE染色標本を用いて行われるが、経年により褪色の進んでしまった標本や、染色の薄い標本、標本色の施設間差への対策として、畳み込みニューラルネットワークを用いたNeural style transfer(非特許文献6)の活用がある。画像の大域的な構図に当たるcontent imageに対し、画像内の位置によらない特徴、色やテクスチャーをstyle imageとして、Neural-Style algorithmなどの手法を用い加工するものである。例としては褪色の進んでしまった標本をNeural style transferによりサイトケラチンの免疫組織化学染色標本に画像変換した例を示した(図16)。変換により擬似サイトケラチン(IHC)化された画像は、サイトケラチン染色標本で構築した分類器により判定しマップの作成を行うことができる。
【0082】
本明細書では、胃癌、甲状腺癌のHE染色標本を用い、本診断支援方法を適用可能であることを示したが、適切なモデルを選択すればあらゆる臓器で癌の組織型を判定し、腫瘍内の不均一性を可視化して俯瞰することで病理診断支援に利用することができる。また、胃癌においてサイトケラチンの免疫組織化学染色の画像による組織型による判定を示したが、サイトケラチンに限らず、癌の悪性度の指標となるタンパク質や治療への反応性を示すタンパク質(バイオマーカー)による免疫組織化学染色の画像を利用すれば、腫瘍の悪性度マップや治療反応性マップを作成して腫瘍内の不均一性を俯瞰することが可能である。また、実施例で示したように、HE画像からHER2の過剰発現が疑われる癌を判断できることは、デジタルコンパニオン診断へと応用できることを示している。
【0083】
病理診断が根拠としている形態学、すなわち典型的な正常組織、良性腫瘍、悪性腫瘍(癌、肉腫)などの組織所見は、組織学や病理診断学の成書に記載され共有されている。組織所見は、さらに病理専門医となるまでの研修の過程で指導継承され、また癌取り扱い規約やWHO分類として明示され、学会や症例検討会などの場で共有されている。しかしながら組織の形態の違いは連続的であり、正常組織と腫瘍、腫瘍の中の分化型・未分化型など、実臨床での診断困難例は少なくなく、微妙な判断は突き詰めれば個々の病理医に委ねられている。胃癌では日本と欧米で粘膜内癌の判断が異なることもよく知られている。コンセンサスが一定でない組織所見についても、この方法であれば、過去のデータをもとに、本システムの結果と予後の関係を容易に再度検討し、過去の病理データとリンパ節転移率などの再発率を確認することにより予後を検討する事もできる。その結果、治療法の選択と予後の関係から、患者に適切な治療法を提供することができ、これまで判定が難しかった腫瘍内が不均一な癌の治療法の確立に寄与することができる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17