IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人大阪大学の特許一覧

特許7594783推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム
<>
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図1
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図2
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図3
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図4
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図5
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図6
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図7
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図8
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図9
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図10
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図11
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図12
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図13
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図14
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図15
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図16
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図17
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図18
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図19
  • 特許-推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム 図20
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-27
(45)【発行日】2024-12-05
(54)【発明の名称】推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラム
(51)【国際特許分類】
   A61B 5/00 20060101AFI20241128BHJP
【FI】
A61B5/00 G
【請求項の数】 9
(21)【出願番号】P 2020567715
(86)(22)【出願日】2020-01-24
(86)【国際出願番号】 JP2020002491
(87)【国際公開番号】W WO2020153471
(87)【国際公開日】2020-07-30
【審査請求日】2022-10-26
【審判番号】
【審判請求日】2024-06-04
(31)【優先権主張番号】PCT/JP2019/002196
(32)【優先日】2019-01-24
(33)【優先権主張国・地域又は機関】JP
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年 1月25日に、第36回日本口腔腫瘍学会総会・学術大会にて公開 [刊行物等] 平成30年 2月12日に、読売新聞 朝刊28面、朝刊32面にて公開 [刊行物等] 平成30年 2月13日に、株式会社読売新聞のウェブサイトにて公開 (https://yomidr.yomiuri.co.jp/article/20180213-OYTET50000/) [刊行物等] 平成30年 2月13日に、やまもと歯科医院のウェブサイトにて公開(https://yamamoto-dc.com/blog/1768/) [刊行物等] 平成30年 2月20日に、日本電気株式会社のウェブサイトにて公開 (https://jpn.nec.com/press/201802/20180220_01.html) [刊行物等] 平成30年 2月21日に、合同会社ソシオタンクが運営するMed IT Techのウェブサイトにて公開 (https://medit.tech/osaka-university-and-nec-announced-smart-oral-health-care-with-three-ai/) [刊行物等] 平成30年 3月 9日に、S2DH/キックオフシンポジウム/プログラムにて公開 [刊行物等] 平成30年11月 3日に、第63回公益社団法人日本口腔外科学会総会・学術大会にて公開
【早期審理対象出願】
(73)【特許権者】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】平岡 慎一郎
【合議体】
【審判長】南 宏輔
【審判官】瓦井 秀憲
【審判官】萩田 裕介
(56)【参考文献】
【文献】特許第6392476(JP,B1)
【文献】特開2018-175227(JP,A)
【文献】特開2019-118807(JP,A)
【文献】ANANTHARAMAN,R.,et al., Utilizing Mask R-CNN for Detection and Segmentation of Oral Diseases, 2018 IEEE International Conference on Bioinformatics and Biomedicine(BIBM), IEEE, 2018年12月3日, pp.2197-2204
(58)【調査した分野】(Int.Cl.,DB名)
A61B 5/00 A61B 1/00-1/32
(57)【特許請求の範囲】
【請求項1】
被検者の口腔内を撮像して得られる口腔画像(上皮細胞核の形状を観察できる程度に観察対象部位を拡大して撮像される拡大画像を除く)を取得する取得部と
腔悪性腫瘍、前癌病変、良性腫瘍、外傷性潰瘍、炎症性疾患、ウイルス性疾患、真菌感染症、自己免疫疾患、口内炎、口角炎、褥瘡性潰瘍、舌表面粘膜の器質的変化、及び移植片対宿主病のうちの少なくとも1つのカテゴリに分類される病変を含む口腔画像、口腔内に病変が無いことを示す正常な口腔画像、並びに、各口腔画像に対するアノテーションを訓練データに用いて、口腔画像の入力に対して、該口腔画像における病変の有無に関する情報と、前記口腔画像に病変が含まれる場合における前記病変のカテゴリ及び位置の情報とを出力するように学習された学習モデルを用いて、前記取得部が取得した口腔画像から、被検者の口腔粘膜における病変の有無、病変のカテゴリ、及び病変の位置を推定する推定部と、
該推定部により推定された病変の有無、並びに、前記口腔粘膜に病変が有ると推定された場合における前記病変のカテゴリ及び位置の推定結果を出力する出力部と
を備える推定装置。
【請求項2】
前記口腔画像から前記被検者の口腔粘膜に対応する領域を抽出する領域抽出部
を更に備え、
前記推定部は、前記領域抽出部が抽出した領域の口腔画像から、前記被検者の口腔粘膜における病変の有無を推定する
請求項1に記載の推定装置。
【請求項3】
前記口腔画像に前処理を施す画像処理部
を更に備え、
前記推定部は、前記画像処理部により前処理が施された口腔画像を前記学習モデルに入力する
請求項1又は請求項2に記載の推定装置。
【請求項4】
前記アノテーションは、各口腔画像における病変の有無に関する情報、並びに前記口腔画像に病変が含まれる場合における前記病変のカテゴリ及び位置の情報を含む
請求項1から請求項3の何れか1つに記載の推定装置。
【請求項5】
前記学習モデルは、畳み込みニューラルネットワークを用いて学習した学習モデルである
請求項1から請求項4の何れか1つに記載の推定装置。
【請求項6】
被検者の口腔内を撮像して得られる口腔画像(上皮細胞核の形状を観察できる程度に観察対象部位を拡大して撮像される拡大画像を除く)を取得し
腔悪性腫瘍、前癌病変、良性腫瘍、外傷性潰瘍、炎症性疾患、ウイルス性疾患、真菌感染症、自己免疫疾患、口内炎、口角炎、褥瘡性潰瘍、舌表面粘膜の器質的変化、及び移植片対宿主病のうちの少なくとも1つのカテゴリに分類される病変を含む口腔画像、口腔内に病変が無いことを示す正常な口腔画像、並びに、各口腔画像に対するアノテーションを訓練データに用いて、口腔画像の入力に対して、該口腔画像における病変の有無に関する情報と、前記口腔画像に病変が含まれる場合における前記病変のカテゴリ及び位置の情報とを出力するように学習された学習モデルを用いて、取得した口腔画像から、被検者の口腔粘膜における病変の有無、病変のカテゴリ、及び病変の位置を推定し、
病変の有無、並びに、前記口腔粘膜に病変が有ると推定した場合における前記病変のカテゴリ及び位置の推定結果を出力する
処理をコンピュータにより実行する推定方法。
【請求項7】
被検者の口腔内を撮像して得られる口腔画像(上皮細胞核の形状を観察できる程度に観察対象部位を拡大して撮像される拡大画像を除く)が入力される入力層、
口腔画像の入力に対して、前記口腔画像における病変の有無に関する情報と、前記口腔画像に病変が含まれる場合における前記病変のカテゴリ及び位置の情報とを出力する出力層、及び
口腔悪性腫瘍、前癌病変、良性腫瘍、外傷性潰瘍、炎症性疾患、ウイルス性疾患、真菌感染症、自己免疫疾患、口内炎、口角炎、褥瘡性潰瘍、舌表面粘膜の器質的変化、及び移植片対宿主病のうちの少なくとも1つのカテゴリに分類される病変を含む口腔画像、口腔内に病変が無いことを示す正常な口腔画像、並びに、各口腔画像に対するアノテーションを訓練データに用いて、前記入力層に入力される口腔画像と前記出力層が出力する情報との関係を学習した中間層
を備え、
前記入力層に口腔画像が入力された場合、前記中間層にて演算し、前記病変の有無に関する情報と、前記口腔画像に病変が含まれる場合における前記病変のカテゴリ及び位置の情報とを前記出力層から出力するようコンピュータを機能させる
学習モデル。
【請求項8】
コンピュータを用いて、
被検者の口腔内を撮像して得られる口腔画像(上皮細胞核の形状を観察できる程度に観察対象部位を拡大して撮像される拡大画像を除く)と、該口腔画像に対するアノテーションとを含む訓練データとして、口腔悪性腫瘍、前癌病変、良性腫瘍、外傷性潰瘍、炎症性疾患、ウイルス性疾患、真菌感染症、自己免疫疾患、口内炎、口角炎、褥瘡性潰瘍、舌表面粘膜の器質的変化、及び移植片対宿主病のうちの少なくとも1つのカテゴリに分類される病変を含む口腔画像、口腔内に病変が無いことを示す正常な口腔画像、並びに、各口腔画像に対するアノテーションを含む訓練データを取得し、
取得した訓練データに基づき、口腔画像の入力に対して、前記口腔画像における病変の有無に関する情報と、前記口腔画像に病変が含まれる場合における前記病変のカテゴリ及び位置の情報とを出力する学習モデルを生成する
学習モデルの生成方法。
【請求項9】
コンピュータに、
被検者の口腔内を撮像して得られる口腔画像(上皮細胞核の形状を観察できる程度に観察対象部位を拡大して撮像される拡大画像を除く)を取得し
腔悪性腫瘍、前癌病変、良性腫瘍、外傷性潰瘍、炎症性疾患、ウイルス性疾患、真菌感染症、自己免疫疾患、口内炎、口角炎、褥瘡性潰瘍、舌表面粘膜の器質的変化、及び移植片対宿主病のうちの少なくとも1つのカテゴリに分類される病変を含む口腔画像、口腔内に病変が無いことを示す正常な口腔画像、並びに、各口腔画像に対するアノテーションを訓練データに用いて、口腔画像の入力に対して、該口腔画像における病変の有無に関する情報と、前記口腔画像に病変が含まれる場合における前記病変のカテゴリ及び位置の情報とを出力するように学習された学習モデルを用いて、取得した口腔画像から、口腔粘膜における病変の有無、病変のカテゴリ、及び病変の位置を推定し、
推定された病変の有無、並びに、前記口腔粘膜に病変が有ると推定された場合における前記病変のカテゴリ及び位置の推定結果を出力する
処理を実行させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラムに関する。
【背景技術】
【0002】
口腔粘膜疾患には、口腔悪性腫瘍、口内炎等の様々なものがあるが、診断に苦慮することが多い。特に、初期の口腔悪性腫瘍については、口内炎に似た臨床所見を呈することも多く、専門外の医療従事者による見落としも多く経験する。口腔悪性腫瘍については、現在多くの施設で原因遺伝子や予後因子についての研究が進められており、発明者らも口腔悪性腫瘍の病理学的予後予測因子について報告している(例えば、非特許文献1を参照)。
【先行技術文献】
【非特許文献】
【0003】
【文献】Al-Shareef H, Hiraoka S, et al. ONCOLOGY REPORTS:2016
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、他領域に比較して口腔領域は研究が遅れており、実用化できる簡便な診断支援システム確立の目処は立っていない。
【0005】
本発明は、口腔粘膜における病変を推定できる推定装置、推定方法、学習モデル、学習モデルの生成方法、及びコンピュータプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一態様に係る推定装置は、被検者の口腔内を撮像して得られる口腔画像を取得する取得部と、口腔画像の入力に対して口腔粘膜における病変に関する情報を出力するように構成された学習モデルを用いて、前記取得部が取得した口腔画像から、被検者の口腔粘膜における病変の有無を推定する推定部と、該推定部の推定結果を出力する出力部とを備える。
【0007】
本発明の一態様に係る学習モデルは、被検者の口腔内を撮像して得られる口腔画像が入力される入力層、口腔粘膜における病変に関する情報を出力する出力層、及び口腔画像と該口腔画像に対するアノテーションとを訓練データに用いて、前記入力層に入力される口腔画像と前記出力層が出力する情報との関係を学習した中間層を備え、前記入力層に口腔画像が入力された場合、前記中間層にて演算し、口腔粘膜における病変に関する情報を前記出力層から出力するようコンピュータを機能させる。
【0008】
本発明の一態様に係る学習モデルの生成方法は、コンピュータを用いて、被検者の口腔内を撮像して得られる口腔画像と、該口腔画像に対するアノテーションとを含む訓練データを取得し、取得した訓練データに基づき、口腔画像の入力に対して口腔粘膜における病変に関する情報を出力する学習モデルを生成する。
【0009】
本発明の一態様に係るコンピュータプログラムは、コンピュータに、被検者の口腔内を撮像して得られる口腔画像を取得し、口腔画像の入力に対して口腔粘膜における病変に関する情報を出力するように構成された学習モデルを用いて、取得した口腔画像から、口腔粘膜における病変の有無を推定し、推定結果を出力する処理を実行させるためのコンピュータプログラムである。
【発明の効果】
【0010】
本願によれば、口腔粘膜における病変を推定できる。
【図面の簡単な説明】
【0011】
図1】実施の形態1に係る推定装置の構成を説明するブロック図である。
図2】口腔画像の一例を示す模式図である。
図3】学習モデルの構成例を示す模式図である。
図4】実施の形態1に係る推定装置が実行する処理の手順を説明するフローチャートである。
図5】推定装置の出力例を示す模式図である。
図6】実施の形態2に係る推定装置1が実行する処理の手順を説明するフローチャートである。
図7】実施の形態3に係る推定装置の構成を説明するブロック図である。
図8】抽出例を示す模式図である。
図9】実施の形態3に係る推定装置が実行する処理の手順を説明するフローチャートである。
図10】サーバ装置の構成を説明するブロック図である。
図11】口腔画像データベースの一例を示す概念図である。
図12】学習モデルの生成手順を説明するフローチャートである。
図13】実施の形態5に係る推定装置の構成を説明するブロック図である。
図14】拡大画像の一例を示す模式図である。
図15】学習モデルの構成例を示す模式図である。
図16】実施の形態5における口腔画像データベースの一例を示す概念図である。
図17】学習モデルの生成手順を説明するフローチャートである。
図18】学習モデルを用いた推定手順を示すフローチャートである。
図19】観察部位の提示例を示す模式図である。
図20】対象部位の指定を受付けるインタフェース画面の一例を示す模式図である。
【発明を実施するための形態】
【0012】
以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。
(実施の形態1)
図1は実施の形態1に係る推定装置1の構成を説明するブロック図である。推定装置1は、病院等の施設に設置されるコンピュータ装置であり、被検者の口腔内を撮像して得られる口腔画像から、被検者の口腔粘膜における病変の有無を推定する。推定装置1は、診断者である医師等に推定結果を提示することによって診断支援を行う。
【0013】
推定装置1は、入力部11、制御部12、記憶部13、出力部14、通信部15、及び操作部16を備える。
【0014】
入力部11は、口腔画像の画像データが入力される入力インタフェースを備える。入力インタフェースは、例えば、被検者の口腔内を撮像するための撮像装置を接続するインタフェースである。撮像装置は、デジタルカメラ又はデジタルビデオカメラであり、例えば、各画素がRGBの階調値により表現される画像データを出力する。入力部11は、入力インタフェースに接続された撮像装置から口腔画像の画像データを取得する。入力インタフェースは、撮像済みの画像データが記録されている記録媒体にアクセスするためのインタフェースであってもよい。入力部11は、記録媒体に記録されている画像データを読み出すことによって、口腔画像に係る画像データを取得する。入力部11が取得した画像データは、制御部12へ出力され、制御部12を介して記憶部13に記憶される。
【0015】
制御部12は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを備える。制御部12が備えるROMには、推定装置1が備えるハードウェア各部の動作を制御する制御プログラム等が記憶される。制御部12内のCPUは、ROMに記憶された制御プログラムや後述する記憶部13に記憶された各種コンピュータプログラムを実行し、ハードウェア各部の動作を制御することによって、口腔画像から口腔粘膜における病変の有無を推定する機能を実現する。制御部12が備えるRAMには、演算の実行中に利用されるデータが一時的に記憶される。
【0016】
制御部12は、CPU、ROM、及びRAMを備える構成としたが、GPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)、DSP(Digital Signal Processor)、量子プロセッサ、揮発性又は不揮発性のメモリ等を備える1又は複数の演算回路であってもよい。また、制御部12は、日時情報を出力するクロック、計測開始指示を与えてから計測終了指示を与えるまでの経過時間を計測するタイマ、数をカウントするカウンタ等の機能を備えていてもよい。
【0017】
記憶部13は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、EEPROM(Electronically Erasable Programmable Read Only Memory)などの記憶装置を備える。記憶部13には、制御部12によって実行されるコンピュータプログラム、口腔粘膜における病変の有無を推定する処理に用いられる学習モデル130等が記憶される。
【0018】
記憶部13に記憶されるコンピュータプログラムは、取得した口腔画像から、学習モデル130を用いて、口腔粘膜における病変の有無を推定する処理を推定装置1に実行させるための推定処理プログラムP1を含む。
【0019】
記憶部13に記憶されるコンピュータプログラムは、このコンピュータプログラムを読み取り可能に記録した非一時的な記録媒体M1により提供されてもよい。記録媒体M1は、例えば、CD-ROM、USBメモリ、SD(Secure Digital)カード、マイクロSDカード、コンパクトフラッシュ(登録商標)などの可搬型メモリである。制御部12は、例えば入力部11を通じて、記録媒体M1から各種プログラムを読み取り、読み取った各種プログラムを記憶部13にインストールする。
【0020】
学習モデル130は、口腔画像の入力に対して口腔粘膜における病変に関する情報を出力するように構成された学習モデルである。学習モデル130は、その定義情報によって記述される。学習モデル130の定義情報は、学習モデル130の構造情報、学習モデル130で用いられるノード間の重み及びバイアスなどの各種パラメータ等を含む。本実施の形態では、口腔画像と、この口腔画像に対するアノテーションとを訓練データに用いて、所定の学習アルゴリズムによって予め学習された学習モデル130が記憶部13に記憶される。
【0021】
制御部12は、記憶部13に記憶されている推定処理プログラムP1を実行し、口腔画像の画像データを学習モデル130に与えることによって、学習モデル130から病変に関する情報を取得する。制御部12は、学習モデル130から取得した病変に関する情報を基に口腔粘膜における病変の有無を推定する。
【0022】
出力部14は、出力装置を接続する出力インタフェースを備える。出力装置の一例は、液晶パネル又は有機EL(Electro-Luminescence)パネル等を備えた表示装置140である。制御部12は、推定結果を出力する際、表示装置140に表示させる表示データを生成し、生成した表示データを出力部14を通じて表示装置140へ出力することによって、表示装置140に推定結果を表示させる。
【0023】
通信部15は、各種データを送受信する通信インタフェースを備える。通信部15が備える通信インタフェースは、例えば、WiFi(登録商標)やイーサネット(登録商標)で用いられるLAN(Local Area Network)の通信規格に準じた通信インタフェースである。通信部15は、送信すべきデータが制御部12から入力された場合、指定された宛先へ送信すべきデータを送信する。また、通信部15は、外部装置から送信されたデータを受信した場合、受信したデータを制御部12へ出力する。
【0024】
操作部16は、各種操作ボタン、スイッチ、タッチパネル等の入力インタフェースを備えており、各種の操作情報及び設定情報を受付ける。制御部12は、操作部16から入力される操作情報に基づき適宜の制御を行い、必要に応じて設定情報を記憶部13に記憶させる。
【0025】
次に、推定装置1に入力される口腔画像について説明する。
図2は口腔画像の一例を示す模式図である。本実施の形態における口腔画像は、被検者の口腔内を撮像装置により撮像して得られる画像である。図2の例では、被検者の舌の左側面を含むように撮像した口腔画像を示している。
【0026】
本実施の形態では、口腔粘膜の少なくとも一部が口腔画像に含まれていればよい。口腔粘膜は、被検者の舌、上唇、硬口蓋、軟口蓋、口蓋垂、口蓋扁桃、頬粘膜、口腔底、歯肉、及び下唇の少なくとも一部を含む。また、口腔画像には、被検者の歯、撮像者の指、その他の構造物等の口腔粘膜以外のものが含まれていてもよい。
【0027】
次に、推定装置1において用いられる学習モデル130について説明する。
図3は学習モデル130の構成例を示す模式図である。学習モデル130は、例えば、CNN(Convolutional Neural Networks)による学習モデルであり、入力層131、中間層132、及び、出力層133を備える。学習モデル130は、口腔画像の入力に対して、口腔粘膜における病変に関する情報を出力するように予め学習される。
【0028】
入力層131には、口腔画像の画像データが入力される。入力層131に入力された口腔画像の画像データは、中間層132へ送出される。
【0029】
中間層132は、例えば、畳み込み層132a、プーリング層132b、及び全結合層132cにより構成される。畳み込み層132a及びプーリング層132bは交互に複数設けられてもよい。畳み込み層132a及びプーリング層132bは、各層のノードを用いた演算によって、入力層131を通じて入力される口腔画像の特徴を抽出する。全結合層132cは、畳み込み層132a及びプーリング層132bによって特徴部分が抽出されたデータを1つのノードに結合し、活性化関数によって変換された特徴変数を出力する。特徴変数は、全結合層132cを通じて出力層133へ出力される。
【0030】
出力層133は、1つ又は複数のノードを備える。出力層133は、中間層132の全結合層132cから入力される特徴変数を基に、ソフトマックス関数を用いて確率に変換し、口腔画像が各カテゴリに該当する確率を各ノードから出力する。すなわち、本実施の形態では、病変に関する情報として口腔画像が各カテゴリに属する確立を出力する。口腔画像を分類するカテゴリは、口腔悪性腫瘍、前癌病変、良性腫瘍、外傷性潰瘍、炎症性疾患、ウイルス性疾患、真菌感染症、自己免疫疾患、口内炎、口角炎、褥瘡性潰瘍、舌表面粘膜の器質的変化、又は移植片対宿主病に属する少なくとも1つの病変を含むように任意に設定することができる。例えば、分類するカテゴリは、口腔悪性腫瘍に属する口腔癌及び口腔肉腫、前癌病変に属する白板症、紅班症、及び扁平苔癬、炎症性疾患に属する歯肉炎、歯周炎、顎炎、顎骨骨髄炎、及び薬剤性顎骨壊死、ウイルス性疾患に属するヘルペス、帯状疱疹、ヘルパンギーナ、及び手足口病、真菌感染症に属する口腔カンジダ症、自己免疫疾患に属する天疱瘡、類天疱瘡、及びBehcet病、並びに、舌表面粘膜の器質的変化に属する地図状舌、溝状舌、黒毛舌、及び正中菱形舌炎の少なくとも1つを含んでもよい。更に、分類するカテゴリは、病変に属さない色素沈着を含んでもよく、病変及び色素沈着に属さない正常状態を含んでもよい。
【0031】
図3の例は、口腔画像を分類するカテゴリとして、n個のカテゴリを設定した学習モデル130を示している。この学習モデル130は、出力層133の各ノードから、口腔悪性腫瘍である確率X1,白板症である確率X2,扁平苔癬である確率X3,…,正常である確率Xnを出力するように構成されている。なお、設定するカテゴリの数(=n)は、1個であってもよく、複数個であってもよい。
【0032】
推定装置1の制御部12は、学習モデル130の出力層133から、分類すべきカテゴリとして設定された病変のそれぞれについての確率を取得し、取得した確率に基づき、口腔粘膜における病変の有無を推定する。例えば、口腔悪性腫瘍である確率X1のみが閾値(例えば80%)を超える場合、制御部12は、被検者の口腔内に悪性腫瘍が発症していると推定することができる。確率X2,X3,…,Xn-1の何れか1つが閾値を超える場合についても同様である。一方、確率X1,X2,…,Xn-1の何れも閾値を超えない場合、若しくは、正常であることを示す確率Xnが閾値を超える場合、制御部12は、被検者の口腔内に病変が存在しないと推定できる。
【0033】
なお、図3の例ではCNNによる学習モデル130を示したが、学習モデル130を構築する機械学習のモデルは任意に設定することができる。例えば、CNNに代えて、R-CNN(Region-based CNN)、YOLO(You Only Look Once)、SSD(Single Shot Detector)等に基づく学習モデルを設定してもよい。また、U-Netなどのアルゴリズムを利用して、病変と推定した領域の情報を出力してもよい。
【0034】
図4は実施の形態1に係る推定装置1が実行する処理の手順を説明するフローチャートである。推定装置1の制御部12は、記憶部13に記憶されている推定処理プログラムP1を実行することにより、以下の推定処理を実行する。
【0035】
制御部12は、入力部11を通じて口腔画像を取得し(ステップS101)、取得した口腔画像を学習モデル130の入力層131に与えることによって、学習モデル130を用いた演算を実行する(ステップS102)。学習モデル130の入力層131に与えられた口腔画像の画像データは中間層132へ送出される。中間層132では、ノード間の重み及びバイアスを含む活性化関数を用いた演算が実行される。中間層132の畳み込み層132a及びプーリング層132bでは画像の特徴が抽出される。畳み込み層132a及びプーリング層132bによって抽出された特徴部分のデータは、全結合層132cの構成する各ノードに結合され、活性化関数によって特徴変数に変換される。変換された特徴変数は、全結合層132cを通じて出力層133へ出力される。出力層133は、中間層132の全結合層132cから入力される特徴変数を基に、ソフトマックス関数を用いて確率に変換し、各カテゴリに属する確率を各ノードから出力する。
【0036】
制御部12は、学習モデル130から演算結果を取得し、取得した演算結果を基に口腔粘膜における病変の有無を推定する(ステップS103)。上述したように、学習モデル130の出力層133を構成する各ノードからは、分類すべきカテゴリとして設定された病変のそれぞれについての確率が出力される。制御部12は、出力層133の各ノードから出力される確率に基づき、病変の有無を推定できる。
【0037】
制御部12は、出力部14を通じて、推定結果を出力する(ステップS104)。具体的には、制御部12は、推定結果を表示装置140に表示させるための表示データを生成し、生成した表示データを表示装置140へ出力することによって、推定結果を表示装置140に表示させる。推定結果の表示態様は任意に設定することができる。例えば、制御部12は、特定の病変(例えば口腔悪性腫瘍)の有無を表す文字又は図形を含んだ表示データを生成して表示装置140へ出力し、表示装置140において特定の病変の有無を文字又は図形により表示してもよい。また、制御部12は、各病変に該当する確率の値を含んだ表示データを生成して表示装置140へ出力し、表示装置140において各病変に該当する確率の値を数字情報として表示してもよい。
【0038】
図5は推定装置1の出力例を示す模式図である。図5の例では、被検者を識別する被検者ID、被検者の氏名、推定処理に用いた口腔画像、各カテゴリに該当する確率、及び推定結果を示す文字情報を表示装置140に表示させた状態を示している。また、学習モデル130を用いて、口腔画像内の病変部の位置を特定し、特定した病変部の位置の情報を併せて表示してもよい。
【0039】
以上のように、本実施の形態では、深層学習を含む機械学習の学習モデル130を用いて口腔粘膜における病変の有無を推定し、推定結果を出力するので、推定結果を診断支援に用いることによって、病変の見落としが発生する可能性を低減できる。
【0040】
なお、本実施の形態では、推定装置1を病院等の施設に設置されるコンピュータ装置として説明したが、推定装置1を病院等の施設に設置されるコンピュータ装置から通信によってアクセス可能なサーバ装置としてもよい。この場合、推定装置1は、病院等のコンピュータ装置から、被検者の口腔内を撮像した口腔画像を通信により取得し、取得した口腔画像に基づき、口腔粘膜における病変の有無を推定する。推定装置1は、推定結果を通信により病院等のコンピュータ装置へ送信する。コンピュータ装置は、推定装置1から受信した推定結果を表示装置に表示することによって、医師等に対する診断支援を行う。
【0041】
(実施の形態2)
実施の形態2では、学習モデル130を用いた演算を実行する前に、口腔画像に対して前処理を施す構成について説明する。
【0042】
図6は実施の形態2に係る推定装置1が実行する処理の手順を説明するフローチャートである。推定装置1の制御部12は、記憶部13に記憶されている推定処理プログラムP1を実行することにより、以下の推定処理を実行する。
【0043】
制御部12は、入力部11を通じて口腔画像を取得し(ステップS201)、取得した口腔画像に対して前処理を施す(ステップS202)。制御部12は、口腔画像に対する前処理として、例えばガンマ補正を施すことが可能である。すなわち、補正前の各画素における輝度値をx、補正後の各画素における輝度値をy、ガンマ値をγとして、制御部12は、補正後の各画素の輝度値y=x1/γ により計算する。撮像装置を用いて口腔内を撮像する際、ストロボ光等のように発光時間が短く、かつ、強い光を照射する場合がある。この場合、口腔画像の全体が不必要に明るくなり(白っぽくなり)、またストロボ光等が口腔内の粘膜により反射されて、明るい部分の階調が失われる現象(白飛び)も発生するため、病変部を的確に判別することが困難となる可能性がある。一方、ガンマ値を例えば0.2未満の小さな値に設定すると、画像全体が暗くなり過ぎて病変部を見出すことが困難となる。このため、ガンマ値は、0.2以上、1.0未満の値に設定することが好ましい。なお、制御部12は、補正前の口腔画像に関して各画素の輝度値を統計的に解析し、例えば輝度値の中央値に基づきガンマ値を設定してもよい。また、制御部12は、口腔内を撮像する際に用いた撮像装置やストロボ等の機種情報を取得し、取得した機種情報に応じて設定してもよい。後者の場合、撮像装置の機種情報とガンマ値との対応関係を定めたテーブルを記憶部13に用意しておき、このテーブルを参照してガンマ値を決定すればよい。
【0044】
また、口腔画像に対する前処理としてレベル補正を行ってもよい。補正対象の口腔画像が、例えば、0~255の入力レベルのうち、100~240の範囲にヒストグラムの山がある画像である場合、シャドウポイントをそのヒストグラムの山の内側(例えば110)に変更する補正を行えばよい。このような前処理により、ストロボ光等の影響により全体的に白っぽく撮像された画像の階調値を補正することができ、補正後の口腔画像を用いることにより、病変部を良好に判別することが可能となる。なお、ハイライトポイントについては補正を行わなくてもよい。
【0045】
制御部12は、前処理を施した口腔画像を学習モデル130の入力層131に与えることによって、学習モデル130による演算を実行する(ステップS203)。すなわち、制御部12は、実施の形態1と同様に、学習モデル130を構成する入力層131、中間層132、及び出力層133の各ノードにおいて、重み及びバイアスを用いた演算を実行する。
【0046】
制御部12は、学習モデル130から演算結果を取得し、取得した演算結果を基に口腔粘膜における病変の有無を推定する(ステップS204)。学習モデル130の出力層133を構成する各ノードからは、分類すべきカテゴリとして設定された病変のそれぞれについての確率が出力される。制御部12は、出力層133の各ノードから出力される確率に基づき、病変の有無を推定する。
【0047】
制御部12は、出力部14を通じて、推定結果を出力する(ステップS205)。具体的には、制御部12は、推定結果を表示装置140に表示させるための表示データを生成し、生成した表示データを表示装置140へ出力することにより、推定結果を表示装置140に表示させる。推定結果の表示態様は実施の形態1と同様である。
【0048】
なお、本実施の形態では、口腔画像の前処理としてガンマ補正を行う構成について説明したが、ガンマ補正に限らず、予め設定したトーンカーブに従って、輝度補正を行う構成としてもよい。また、輝度補正に限らず、コントラスト補正、彩度補正などの前処理を行ってもよい。
【0049】
(実施の形態3)
実施の形態3では、推定装置1において、口腔画像から口腔粘膜に対応する領域を抽出し、抽出した領域の口腔画像から、口腔粘膜における病変の有無を推定する構成について説明する。
【0050】
図7は実施の形態3に係る推定装置1の構成を説明するブロック図である。推定装置1は、入力部11、制御部12、記憶部13、出力部14、通信部15、及び操作部16を備える。これらの構成は、実施の形態1と同様であるため、その詳細な説明を省略することとする。
【0051】
記憶部13には、前述の学習モデル130及び推定処理プログラムP1に加え、領域抽出プログラムP2が記憶される。領域抽出プログラムP2は、口腔画像から、被検者の口腔粘膜に対応する領域を抽出する処理を推定装置1に実行させるためのコンピュータプログラムである。領域抽出プログラムP2には、公知の領域抽出アルゴリズムが用いられる。
【0052】
領域抽出アルゴリズムの一例はGrabCutアルゴリズムである。GrabCutアルゴリズムでは、混合正規分布モデル(GMM : Gaussian Mixture Model)を用いて前景領域及び背景領域の画素値の分布を学習し、未知の領域として設定された画素に対して、画素値の統計値を基に前景領域及び背景領域の関係から前景らしさ及び背景らしさを計算することによって、前景領域及び背景領域を分離して抽出する。
【0053】
本実施の形態に係る推定装置1は、口腔画像の全画像領域のうち口腔粘膜に対応する領域を前景領域として抽出し、全画像領域のうち口腔粘膜に対応する領域を除いた領域を背景領域として抽出する。背景領域には、被検者の歯、撮影者の指、様々な器具などが写り込んでいる可能性があるが、GrabCutアルゴリズム等の領域抽出アルゴリズムを用いることによって、前景領域を背景領域から分離して抽出することができる。
【0054】
なお、本実施の形態では、口腔粘膜に対応する領域(前景領域)と、それ以外の領域(背景領域)とを分離する構成としたが、特定の口腔粘膜(例えば舌)に対応する領域を前景領域として抽出し、それ以外の口腔粘膜を含む領域を背景領域として抽出してもよい。
【0055】
図8は抽出例を示す模式図である。図8の例は、口腔画像の全画像領域を、被検者の口腔粘膜に対応する領域(前景領域)と、それ以外の領域(背景領域)とに分離した結果を示している。図8において、背景領域はハッチングを付した領域として示されている。背景領域には、被検者の歯に対応する領域、及び口腔外の領域が含まれていることが分かる。推定装置1は、被検者の口腔粘膜に対応する領域(前景領域)の口腔画像を学習モデル130へ引き渡すことによって、口腔粘膜における病変の有無を推定する。
【0056】
図9は実施の形態3に係る推定装置1が実行する処理の手順を説明するフローチャートである。推定装置1の制御部12は、記憶部13に記憶されている推定処理プログラムP1及び領域抽出プログラムP2を実行することにより、以下の推定処理を実行する。
【0057】
制御部12は、入力部11を通じて口腔画像を取得し(ステップS301)、取得した口腔画像の全画像領域から、口腔粘膜に対応する領域を抽出する(ステップS302)。ステップS302の処理によって、口腔画像からは、被検者の歯、撮像者の指、様々な器具に対応する部分が除去される。
【0058】
次いで、制御部12は、口腔領域に対応する領域が抽出された口腔画像(被検者の歯等に対応した部分を除去した画像)を学習モデル130の入力層131に与えることによって、学習モデル130を用いた演算を実行する(ステップS303)。学習モデル130の入力層131に与えられた口腔画像のデータは中間層132へ送出される。中間層132では、ノード間の重み及びバイアスを含む活性化関数を用いた演算が実行される。中間層132の畳み込み層132a及びプーリング層132bにおいて画像の特徴が抽出される。畳み込み層132a及びプーリング層132bによって抽出された特徴部分のデータは、全結合層132cの構成する各ノードに結合され、活性化関数によって特徴変数に変換される。変換された特徴変数は、全結合層132cを通じて出力層133へ出力される。出力層133は、中間層132の全結合層132cから入力される特徴変数を基に、ソフトマックス関数を用いて確率に変換し、各カテゴリに属する確率を各ノードから出力する。
【0059】
制御部12は、学習モデル130から演算結果を取得し、取得した演算結果を基に口腔粘膜における病変の有無を推定する(ステップS304)。上述したように、学習モデル130の出力層133を構成する各ノードからは、分類すべきカテゴリとして設定された病変のそれぞれについての確率が出力される。制御部12は、出力層133の各ノードから出力される確率に基づき、病変の有無を推定できる。
【0060】
制御部12は、出力部14を通じて、推定結果を出力する(ステップS305)。具体的には、制御部12は、推定結果を表示装置140に表示させるための表示データを生成し、生成した表示データを表示装置140へ出力することによって、推定結果を表示装置140に表示させる。推定結果の表示態様は任意に設定することができる。例えば、制御部12は、特定の病変(例えば口腔悪性腫瘍)の有無を表す文字又は図形を含んだ表示データを生成して表示装置140へ出力し、表示装置140において特定の病変の有無を文字又は図形により表示してもよい。また、制御部12は、各病変に該当する確率の値を含んだ表示データを生成して表示装置140へ出力し、表示装置140において各病変に該当する確率の値を数字情報として表示してもよい。
【0061】
以上のように、実施の形態3では、病変の推定に不要な部分を除去した上で、推定処理を実行できるので、推定精度の向上を図ることができる。
【0062】
なお、実施の形態3においても、学習モデル130に口腔画像を入力する前処理として、ガンマ補正などの画像処理を施してもよい。
【0063】
(実施の形態4)
実施の形態4では、学習モデル130の生成方法について説明する。
【0064】
推定装置1において使用される学習モデル130は、例えば、推定装置1と通信可能に接続されるサーバ装置2において生成される。
【0065】
図10はサーバ装置2の構成を説明するブロック図である。サーバ装置2は、制御部21、記憶部22、入力部23、通信部24、操作部25、及び表示部26を備える。
【0066】
制御部21は、例えば、CPU、ROM、RAMなどを備える。制御部21が備えるROMには、サーバ装置2が備えるハードウェア各部の動作を制御するための制御プログラム等が記憶される。制御部21内のCPUは、ROMに記憶された制御プログラム、及び記憶部22に記憶された各種プログラムを実行し、ハードウェア各部の動作を制御する。
【0067】
制御部21は上述の構成に限定されない。制御部21は、CPU、ROM及びRAMを備えた構成に限定されない。制御部21は、例えば、GPU、FPGA、DSP、揮発性または不揮発性のメモリ等を含む1又は複数の制御回路または演算回路であってもよい。また、制御部21は、日時情報を出力するクロック、計測開始指示を与えてから計測終了指示を与えるまでの経過時間を計測するタイマ、数をカウントするカウンタ等の機能を備えていてもよい。
【0068】
記憶部22は、ハードディスクドライブなどの記憶装置を備える。記憶部22には、制御部21によって実行される各種コンピュータプログラム、当該コンピュータプログラムによって利用される各種データ、外部から取得したデータ等が記憶される。記憶部22に記憶されるコンピュータプログラムの一例は、学習モデルを生成するためのモデル生成プログラムP3である。また、記憶部22は、口腔画像と口腔画像のアノテーションとを関連付けて記憶する口腔画像データベース(口腔画像DB)220を備える。
【0069】
入力部23は、各種データ又はプログラムを記録した記録媒体から、データ及びプログラムを取得するための入力インタフェースを備える。入力部23を通じて入力された各種データ及びプログラムは、記憶部22に記憶される。
【0070】
通信部24は、通信ネットワークNに接続する通信インタフェースを備える。通信ネットワークNは、インターネット網、特定用途向けのLAN又はWAN(Wide Area Network)などである。通信部24は、推定装置1へ送信すべきデータを、通信ネットワークNを介して推定装置1へ送信する。また、通信部24は、サーバ装置2を宛先として推定装置1から送信されるデータを、通信ネットワークNを介して受信する。
【0071】
操作部25は、キーボードやマウスなどの入力インタフェースを備えており、各種の操作情報や設定情報を受付ける。制御部21は、操作部25から入力される操作情報に基づき適宜の制御を行い、必要に応じて設定情報を記憶部22に記憶させる。
【0072】
表示部26は、液晶表示パネル、有機EL表示パネル等の表示デバイスを備えており、制御部21から出力される制御信号に基づいて、サーバ装置2の管理者等に通知すべき情報を表示する。
【0073】
なお、本実施の形態では、サーバ装置2が操作部25及び表示部26を備える構成としたが、操作部25及び表示部26は必須ではなく、外部に接続されたコンピュータを通じて操作を受付け、通知すべき情報を外部のコンピュータへ出力する構成であってもよい。
【0074】
図11は口腔画像データベース220の一例を示す概念図である。口腔画像データベース220では、口腔画像と、口腔画像に対するアノテーションとを関連付けて記憶する。口腔画像は、例えば、悪性腫瘍が発症している口腔の画像、口腔粘膜疾患に特異的な形態(例えば、潰瘍、びらん、膨隆など)を有する口腔の画像等を含む。アノテーションには医師の診断結果が含まれる。診断結果は、病理診断結果若しくは確定診断結果を含み、本実施の形態では、関連付けて記憶される口腔画像が正常であることを示すラベルデータ、又は何れの病変であるのかを示すラベルデータとして用いられる。また、アノテーションには、被検者ID及び被検者氏名等の情報が含まれていてもよい。
【0075】
以下、サーバ装置2にて学習モデルを生成する手順について説明する。
図12は学習モデルの生成手順を説明するフローチャートである。サーバ装置2の制御部21は、記憶部22の口腔画像データベース220にアクセスし、学習モデルの生成に用いる訓練データを取得する(ステップS401)。訓練データは、例えば、口腔画像と、口腔画像に対するアノテーションとを含む。学習モデルを生成する初期段階では、訓練データは、サーバ装置2の運営者等によって用意されたものが設定される。また、学習が進めば、学習モデル130による推定結果と、推定処理に用いた口腔画像とを推定装置1から取得し、取得したデータを訓練データとして設定してもよい。
【0076】
次いで、制御部21は、訓練データとして含まれる画像データを学習用の学習モデルへ入力し(ステップS402)、学習モデルから演算結果を取得する(ステップS403)。学習が開始される前の段階では、学習モデルを記述する定義情報には、初期設定値が与えられているものとする。この学習モデルによる演算は、推定処理における学習モデル130の演算と同様である。
【0077】
次いで、制御部21は、ステップS403で得られた演算結果を評価し(ステップS404)、学習が完了したか否かを判断する(ステップS405)。具体的には、制御部21は、ステップS403で得られる演算結果と訓練データとに基づく誤差関数(目的関数、損失関数、コスト関数ともいう)を用いて、演算結果を評価することができる。制御部21は、最急降下法などの勾配降下法により誤差関数を最適化(最小化又は最大化)する課程で、誤差関数が閾値以下(又は閾値以上)となった場合、学習が完了したと判断する。なお、過学習の問題を避けるために、交差検定、早期打ち切りなどの手法を取り入れ、適切なタイミングにて学習を終了させてもよい。
【0078】
学習が完了していないと判断した場合(S405:NO)、制御部21は、学習モデルのノード間の重み及びバイアスを更新し(ステップS406)、処理をステップS401へ戻す。制御部21は、学習モデルの出力層から入力層に向かって、ノード間の重み及びバイアスを順次更新する誤差逆伝搬法を用いて、各ノード間の重み及びバイアスを更新することができる。
【0079】
学習が完了したと判断した場合(S405:YES)、制御部21は、学習済みの学習モデルとして記憶部22に記憶させ(ステップS407)、本フローチャートによる処理を終了する。
【0080】
以上のように、本実施の形態では、推定装置1において用いられる学習モデル130をサーバ装置2において生成することができる。サーバ装置2は、推定装置1からの要求に応じて、生成した学習モデルを推定装置1へ送信する。推定装置1は、サーバ装置2から学習モデルを受信し、記憶部13に記憶させた後、推定処理プログラムP1を実行することによって、病変の推定処理を実行することができる。
【0081】
更に、サーバ装置2は、学習完了後の適宜のタイミングで、新たに口腔画像と、口腔画像に対するアノテーションとを収集し、これらのデータを用いて学習モデルを再学習する構成としてもよい。口腔画像は、口腔粘膜の少なくとも一部を含むように撮像して得られる口腔画像(図2を参照)であってもよく、口腔粘膜に対応する領域を抽出して得られる口腔画像(図8を参照)であってもよい。また、推定装置1は、推定結果を表示する際に、その推定結果が正しいか否かの選択(診断結果)を受付け、受付けた診断結果をアノテーションとしてサーバ装置2へ送信してもよい。再学習の手順は、学習モデルの生成手順と全く同様であり、訓練データに含まれる口腔画像を学習モデルへ入力し、学習モデルの出力として得られる演算結果と訓練データに含まれるアノテーションとの間の誤差を評価することによって、再学習が実行される。
【0082】
(実施の形態5)
実施の形態5では、口腔内の拡大画像を用いて、口腔粘膜における病変の有無を推定する構成について説明する。
【0083】
図13は実施の形態5に係る推定装置1の構成を説明するブロック図である。推定装置1は、入力部11、制御部12、記憶部13、出力部14、通信部15、及び操作部16を備える。これらの構成は、実施の形態1と同様であるため、その詳細な説明を省略することとする。
【0084】
実施の形態5では、舌、上唇、硬口蓋、軟口蓋、口蓋垂、口蓋扁桃、頬粘膜、口腔底、歯肉、下唇などの口腔の部位毎に学習モデルが用意される。部位毎の学習モデル130-k(k=1,2,…,m;mは1以上の整数)は、記憶部13に記憶される。学習モデル130-kは、後述する拡大画像の入力に応じて、口腔粘膜における病変に関する情報を出力するように構成される。なお、本実施の形態では、口腔の部位毎に学習モデル130-kを用意する構成としたが、幾つかの部位に対して共通の学習モデルを用いてもよい。例えば、硬口蓋及び軟口蓋について共通の学習モデルを用意し、上唇及び下唇について共通の学習モデルを用意してもよい。また、特定の部位を分割した分割領域毎に異なる学習モデルを用いてもよい。例えば、舌の上面領域と下面領域とで異なる学習モデルを用意してもよい。
【0085】
図14は拡大画像の一例を示す模式図である。本実施の形態における拡大画像は、被検者の口腔内を拡大して撮像した口腔画像である。このような拡大画像は、例えば接触型内視鏡システムなどの接触型細胞観察装置を用いて被検者の口腔内を撮像することにより得られる。本実施の形態では、上皮細胞核の形状や分布を観察するために、メチレンブルーなどの染色剤により観察部位を染色し、接触型細胞観察装置の撮像部を観察部位に圧接させた状態にて500倍程度の拡大倍率で観察部位を撮像した。
【0086】
図14の例は被検者の舌の一部を500倍に拡大して撮像した拡大画像を示している。紙面の都合上、拡大画像をグレースケールで示しているが、接触型細胞観察装置から得られる実際の拡大画像はカラー画像である。拡大画像では、染色剤により染色された上皮細胞核が観察される。図14の例は、円形状、若しくは、円形状が細長くつぶれた長円形状の小領域として、上皮細胞核が多数観察されている様子を示している。本実施の形態では、正常な上皮細胞核の形状、染色性、分布や配列、核/細胞質比などの特徴と、病変領域の上皮細胞核の形状、染色性、分布や配列、核/細胞質比などの特徴とを上述した部位毎に学習することにより、学習モデル130-kが生成される。学習モデル130-kの生成方法については後に詳述する。
【0087】
図15は学習モデル130-kの構成例を示す模式図である。学習モデル130-kの構成は、実施の形態1で説明した学習モデル130の構成と同様である。すなわち学習モデル130-kは、CNNによる学習モデルであり、入力層131、中間層132、及び、出力層133を備える。学習モデル130は、上述した拡大画像が入力層131に入力された場合、中間層132にて演算を行い、口腔粘膜における病変に関する情報を出力層133から出力するよう構成される。
【0088】
図15の例は、拡大画像を分類するカテゴリとして、n個のカテゴリを設定した学習モデル130-kを示している。この学習モデル130-kは、出力層133の各ノードから、口腔悪性腫瘍である確率X1,白板症である確率X2,扁平苔癬である確率X3,…,正常である確率Xnを出力するように構成されている。なお、設定するカテゴリの数(=n)は、1個であってもよく、複数個であってもよい。また、拡大画像を分類するカテゴリは、対象の部位毎に設定すればよい。例えば、対象部位が舌である場合、口腔悪性腫瘍、白板症、扁平苔癬のほか、地図状舌、溝状舌、黒毛舌、及び正中菱形舌炎など舌表面粘膜の器質的変化に属する病変を分類するカテゴリとして設定してもよい。また、対象部位が歯肉である場合、口腔悪性腫瘍、白板症、扁平苔癬のほか、歯肉炎や歯周炎などを分類するカテゴリとして設定してもよい。他の対象部位についても同様であり、対象部位毎に分類するカテゴリを設定すればよい。
【0089】
なお、図15の例ではCNNによる学習モデル130を示したが、学習モデル130-kを構築する機械学習のモデルは任意に設定することができる。例えば、CNNに代えて、R-CNN、YOLO、SSD等に基づく学習モデルを設定してもよい。また、U-Netなどのアルゴリズムを利用して、病変と推定した領域の情報を出力してもよい。
【0090】
学習モデル130-kは、例えば、推定装置1からアクセス可能なサーバ装置2において生成される。サーバ装置2は、学習モデル130-kの生成に先立ち、対象部位毎に拡大画像、被検者ID、被検者氏名、及び医師の診断結果を含むデータを収集し、これらの情報を関連付けて口腔画像データベース220に登録する。図16は実施の形態5における口腔画像データベース220の一例を示す概念図である。
【0091】
サーバ装置2は、口腔画像データベース220に登録されたデータを訓練データに用いて学習モデル130-kを生成する。図17は学習モデル130-kの生成手順を説明するフローチャートである。サーバ装置2の制御部21は、例えば操作部25を通じて対象部位の指定を受付け(ステップS501)、指定された対象部位に関連付けられて口腔画像データベース220に記憶されている拡大画像、拡大画像に対するアノテーション(診断結果)等のデータを訓練データとして選択する(ステップS502)。学習モデル130-kを生成する初期段階では、訓練データは、サーバ装置2の運営者等によって用意されたものが設定される。また、学習が進めば、学習モデル130-kによる推定結果と、推定処理に用いた拡大画像とを推定装置1から取得し、取得したデータを訓練データとして設定してもよい。
【0092】
制御部21は、訓練データとして選択した拡大画像の画像データを学習用の学習モデル130-kへ入力し(ステップS503)、学習モデル130-kから演算結果を取得する(ステップS504)。学習が開始される前の段階では、学習モデル130-kを記述する定義情報には、初期設定値が与えられているものとする。この学習モデル130-kを用いた演算手順は、実施の形態4と同様である。
【0093】
次いで、制御部21は、ステップS504で得られた演算結果を評価し(ステップS505)、学習が完了したか否かを判断する(ステップS506)。具体的には、制御部21は、ステップS504で得られる演算結果と訓練データとに基づく誤差関数(目的関数、損失関数、コスト関数ともいう)を用いて、演算結果を評価することができる。制御部21は、最急降下法などの勾配降下法により誤差関数を最適化(最小化又は最大化)する課程で、誤差関数が閾値以下(又は閾値以上)となった場合、学習が完了したと判断する。なお、過学習の問題を避けるために、交差検定、早期打ち切りなどの手法を取り入れ、適切なタイミングにて学習を終了させてもよい。
【0094】
学習が完了していないと判断した場合(S506:NO)、制御部21は、学習モデルのノード間の重み及びバイアスを更新し(ステップS507)、処理をステップS502へ戻す。制御部21は、学習モデルの出力層から入力層に向かって、ノード間の重み及びバイアスを順次更新する誤差逆伝搬法を用いて、各ノード間の重み及びバイアスを更新することができる。
【0095】
学習が完了したと判断した場合(S506:YES)、制御部21は、学習済みの学習モデル130-kとして記憶部22に記憶させ(ステップS508)、本フローチャートによる処理を終了する。
【0096】
サーバ装置2は、生成した学習モデル130-kを対象部位の情報と共に、推定装置1へ送信する。推定装置1は、サーバ装置2から送信されてきた学習モデル130-kを対象部位の情報に関連付けて記憶部13に記憶させる。
【0097】
図18は学習モデル130-kを用いた推定手順を示すフローチャートである。推定装置1の制御部12は、記憶部13に記憶されている推定処理プログラムP1を実行することにより、以下の推定処理を実行する。
【0098】
制御部12は、例えば接触型細胞観察装置を用いて口腔内を撮像することにより得られる拡大画像を取得する(ステップS511)。制御部12は、入力部11を通じて拡大画像を取得してもよく、通信部15を通じて拡大画像を取得してもよい。なお、通常倍率の口腔画像を用いた推定結果(例えば図5に示すような推定結果)が事前に得られている場合、接触型細胞観察装置を用いた観察を行う際に、制御部12は、被検者ID、被検者氏名、推定された病変名、病変の位置を表示装置140に表示させ、観察者に観察部位の情報を提示してもよい。例えば、一次診療機関において、通常倍率の口腔画像を学習モデル130へ与えることにより事前推定を行い、二次診療機関において、接触型細胞観察装置を用いた観察を行う際に、一次診療機関において得られた推定結果を二次診療機関に提示してもよい。この場合、学習モデル130がインストールされた推定装置1を一次診療機関に設け、学習モデル130-kがインストールされた推定装置1を二次診療機関に設けてもよい。また、一次診療機関及び二次診療機関の双方からアクセス可能なサーバ装置に学習モデル130及び学習モデル130-kをインストールする構成としてもよい。図19は観察部位の提示例を示す模式図である。観察者は、表示装置140に提示される観察部位の情報に基づき、観察位置を調整し、接触型細胞観察装置を用いて口腔内を撮像すればよい。
【0099】
次いで、制御部12は、対象部位の指定を受付ける(ステップS512)。制御部12は、対象部位の指定を受付ける際にインタフェース画面を表示装置140に表示させてもよい。図20は対象部位の指定を受付けるインタフェース画面1400の一例を示す模式図である。インタフェース画面1400には、例えば、対象部位の選択を受付けるためのプルダウンメニュー1401と、推定処理の開始指示を受付けるための開始ボタン1402とが配置される。プルダウンメニュー1401は、操作部16を用いた操作により、指定可能な対象部位の名称(舌、上唇、硬口蓋、軟口蓋、口蓋垂、口蓋扁桃、頬粘膜、口腔底、歯肉、下唇など)を表示させ、表示させた対象部位の名称から推定対象の部位の指定を受付けるように構成されている。開始ボタン1402は、操作部16を用いた操作により、推定処理の開始指示を受付けるように構成されている。なお、図20の例では、通常倍率で撮像された口腔画像を示しているが、接触型細胞観察装置を用いて撮像された拡大画像をインタフェース画面1400に表示させてもよい。
【0100】
ステップS512において対象部位の指定を受付け、推定処理の開始指示を受付けた場合、制御部12は、指定された対象部位に応じて学習モデル130-kを選択し(ステップS513)、選択した学習モデル130-kにステップS511で取得した拡大画像を与えることにより、学習モデル130-kによる演算を実行する(ステップS514)。学習モデル130-kを用いた演算手順は実施の形態1と同様である。
【0101】
制御部12は、学習モデル130-kから演算結果を取得し、取得した演算結果を基に口腔粘膜における病変の有無を推定する(ステップS515)。上述したように、学習モデル130-kの出力層133を構成する各ノードからは、分類すべきカテゴリとして設定された病変のそれぞれについての確率が出力される。制御部12は、出力層133の各ノードから出力される確率に基づき、病変の有無を推定できる。
【0102】
制御部12は、出力部14を通じて、推定結果を出力する(ステップS516)。具体的には、制御部12は、推定結果を表示装置140に表示させるための表示データを生成し、生成した表示データを表示装置140へ出力することによって、推定結果を表示装置140に表示させる。推定結果の表示態様は任意に設定することができる。例えば、制御部12は、特定の病変(例えば口腔悪性腫瘍)の有無を表す文字又は図形を含んだ表示データを生成して表示装置140へ出力し、表示装置140において特定の病変の有無を文字又は図形により表示してもよい。また、制御部12は、各病変に該当する確率の値を含んだ表示データを生成して表示装置140へ出力し、表示装置140において各病変に該当する確率の値を数字情報として表示してもよい。推定装置1の出力例は図5と同様である。
【0103】
以上のように、実施の形態5では、学習モデル130-kを用いることにより、拡大画像により観察される上皮細胞核の形状、染色性、分布や配列、核/細胞質比などの特徴に基づき、口腔粘膜における病変の有無を推定することができる。また、このような学習モデル130-kを用いて病変の有無を推定することにより、低侵襲かつ的確な診断が可能であり、生検診断に引けを取らない組織診断が行える可能性が示唆されている。また、学習モデル130による診断結果を記憶部13に蓄積し、口腔粘膜における病変の発現リスク、予後予測因子等の開明に役立ててもよい。
【0104】
今回開示された実施形態は、全ての点において例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述した意味ではなく、請求の範囲によって示され、請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。
【符号の説明】
【0105】
1 推定装置
2 サーバ装置
11 入力部
12 制御部
13 記憶部
14 出力部
15 通信部
16 操作部
21 制御部
22 記憶部
23 入力部
24 通信部
25 操作部
26 表示部
130 学習モデル
130-1,130-2,…,130-m 学習モデル
220 口腔画像データベース
P1 推定処理プログラム
P2 領域抽出プログラム
P3 モデル生成プログラム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20