(58)【調査した分野】(Int.Cl.,DB名)
前記画像処理部は、前記第一画像の処理対象帯域における空間周波数の規定の周波数成分を抑制する処理、又は前記第一画像の処理対象帯域における空間周波数の規定の周波数成分を強調する処理を施す請求項1に記載の医用画像学習装置。
前記学習部は、前記第一画像群、前記第三画像群、前記第一画像群の正解データ、及び前記第三画像群の正解データを用いた学習済の認識器、又は前記第三画像群及び前記第三画像群の正解データを用いた学習済の認識器に対して、前記第二画像群及び前記第二画像群の正解データを用いた学習を実施する請求項12又は13に記載の医用画像学習装置。
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、学習モデルの開発には大量の正解データセットを必要とする。なお、ここでいう正解データセットとは、画像及び画像の認識結果の組を意味する。医療分野においては、正解データセットの収集が学習モデルの開発の障壁となる。内視鏡装置を用いた観察には、通常光を用いた観察だけでなく、BLI(Blue LAZER Imaging)等の特殊光を用いた観察が存在する。複数のモードに対応可能なAIの開発は、さらに、大量の正解データセットを収集する必要が生じる。
【0007】
ここでいう通常光の一例として白色光が挙げられる。白色光は複数の波長帯域の光を含み得る。また、特殊光の一例として、白色光の波長帯域よりも狭い帯域の光が挙げられる。特殊光は複数の波長帯域の光を含み得る。
【0008】
特許文献1には、学習に関する記載はない。また、特許文献1には、輝度の調整等の記載はあるものの、分光分布における帯域成分の違いに注目した処理の切り替えに関する記載はない。
【0009】
特許文献2には、分光データのスペクトル成分を保持したまま、その他の波長成分をランダムに変化させて生成される学習用の仮想データセットについて記載されている。一方、特許文献2には、分光分布が異なる複数の画像群において、対応する帯域における帯域成分を学習に利用する旨の記載はない。
【0010】
本発明はこのような事情に鑑みてなされたもので、分光分布が異なる画像ごとに大量の正解画像の収集を行うことなく、分光分布が異なる複数の画像に対応した学習を実現し得る、医用画像学習装置、医用画像学習方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
上記目的を達成するために、次の発明態様を提供する。
【0012】
第1態様に係る医用画像学習装置は、互いに分光分布が異なる第一画像及び第二画像を取得する画像取得部と、第一画像に画像処理を施して第三画像を生成する画像処理部と、複数の第一画像を含む第一画像群、複数の第二画像を含む第二画像群、及び複数の第三画像を含む第三画像群、並びに第一画像群、第二画像群、及び第三画像群のそれぞれの正解データを用いて、自動認識に適用する認識器を学習させる学習部と、を備え、画像処理部は、第一画像の分光分布に含まれる帯域のうち第二画像の対応する帯域と特性が異なる帯域の信号を抑制する画像処理、及び第一画像に含まれる帯域のうち第二画像の対応する帯域と特性が同一の帯域の信号又は類似する帯域の信号を強調する画像処理の少なくともいずれかを施して、第一画像から第三画像を生成する医用画像学習装置である。
【0013】
第1態様によれば、分光分布が異なる第一画像及び第二画像について、第一画像の分光分布に含まれる帯域のうち、第二画像の対応する帯域との特性が同一の帯域の信号又は類似する帯域の信号を強調するか、又は第二画像の対応する帯域との特性が相違する帯域の信号を抑制して第三画像を生成する。複数の第一画像を含む第一画像群、複数の第二画像を含む第二画像群、及び複数の第三画像を含む第三画像群、並びに各画像群の正解データを用いて、自動認識に適用する分類器を学習させる。これにより、分光分布が異なる画像群ごとに大量の正解画像の収集を行うことなく、分光分布が異なる画像群ごとの学習を実現し得る。
【0014】
分光分布が異なる画像の一例として、異なる観察モードが適用された画像が挙げられる。観察モードの一例として、照明光が異なるモードが挙げられる。
【0015】
第2態様は、第1態様の医用画像学習装置において、画像処理部は、第一画像に対して、輝度分散を変換する処理を施す構成としてもよい。
【0016】
第2態様によれば、第一画像に輝度分散を変換する処理を適用して、第一画像から第三画像を生成し得る。
【0017】
第3態様は、第1態様の医用画像学習装置において、画像処理部は、第一画像に対して、輝度を規定の輝度値に変更する処理を施す構成としてもよい。
【0018】
第3態様によれば、第一画像に輝度を規定の輝度値に変更する処理を適用して、第一画像から第三画像を生成し得る。
【0019】
第4態様は、第1態様の医用画像学習装置において、画像処理部は、第一画像に対して、輝度をランダムな輝度値に変更する処理を施す構成としてもよい。
【0020】
第4態様によれば、第一画像に輝度をランダムな輝度値に変更する処理を適用して、第一画像から第三画像を生成し得る。
【0021】
第5態様は、第1態様の医用画像学習装置において、第一画像は通常光を用いて撮像した通常光画像であり、第二画像は通常光よりも狭帯域の特殊光を用いて撮像した特殊光画像である構成としてもよい。
【0022】
第5態様によれば、通常光観察モードを適用して第一画像を生成し得る。また、特殊光観察モードを適用して第二画像を生成し得る。
【0023】
第6態様は、第5態様の医用画像学習装置において、画像処理部は、通常光画像に対して、Bチャネル成分を抑制する処理を施す構成としてもよい。
【0024】
第6態様によれば、通常光画像のBチャネル成分を抑制して、第三画像を生成し得る。
【0025】
第7態様は、第5態様の医用画像学習装置において、画像処理部は、通常光画像に対して、Rチャネル成分及びGチャネル成分の少なくともいずれか一方を強調する処理を施す構成としてもよい。
【0026】
第7態様によれば、通常光画像のRチャネル成分及びGチャネル成分の少なくともいずれか一方を強調して、第三画像を生成し得る。
【0027】
第8態様は、第5態様の医用画像学習装置において、画像処理部は、通常光画像に対して、Rチャネル成分を抑制する処理を施す構成としてもよい。
【0028】
第8態様によれば、通常光画像のRチャネル成分を抑制して、第三画像を生成し得る。
【0029】
第8態様における特殊光画像の例として、通常光画像のRチャネル成分が欠落した画像が挙げられる。
【0030】
第9態様は、第5態様の医用画像学習装置において、画像処理部は、通常光画像に対して、Bチャネル成分及びGチャネル成分を強調する処理を施す構成としてもよい。
【0031】
第9態様によれば、通常光画像のBチャネル成分及びGチャネル成分を強調して、第三画像を生成し得る。
【0032】
第9態様における特殊光画像の例として、通常光画像のRチャネル成分が欠落した画像が挙げられる。
【0033】
第10態様は、第1態様の医用画像学習装置において、画像処理部は、第一画像の処理対象帯域における空間周波数の規定の周波数成分を抑制する処理、又は第一画像の処理対象帯域における空間周波数の規定の周波数成分を強調する処理を施す構成としてもよい。
【0034】
第10態様によれば、第一画像の空間周波数のうち、第二画像と相違する周波数成分を抑制するか、第二画像と同一又は類似する周波数成分を強調して、第一画像から第三画像を生成し得る。
【0035】
第11態様は、第10態様の医用画像学習装置において、第一画像は通常光を用いて撮像した通常光画像であり、第二画像は通常光よりも狭帯域の特殊光を用いて撮像した特殊光画像であり、画像処理部は、通常光画像のBチャネル成分の高周波成分を強調する処理を施す構成としてもよい。
【0036】
第11態様によれば、通常光画像のBチャネル成分における空間周波数のうち高周波成分を強調して、通常光画像から第三画像を生成し得る。
【0037】
第12態様は、第1態様から第11態様のいずれか一態様の医用画像学習装置において、学習部は、第一画像群の学習と第二画像群の学習との学習方法を切り替える構成としてもよい。
【0038】
第12態様によれば、学習の精度が向上し得る。
【0039】
第13態様は、第1態様から第11態様のいずれか一態様の医用画像学習装置において、学習部は、前記第二画像群の学習と前記第三画像群の学習との学習方法を切り替える構成としてもよい。
【0040】
第13態様によれば、学習の精度が向上し得る。
【0041】
第14態様は、第12態様又は第13態様の医用画像学習装置において、学習部は、学習における第三画像の影響を抑制又は強調する学習方法を適用する構成としてもよい。
【0042】
第14態様によれば、学習における第三画像の影響を抑制又は強調し得る。これにより、学習の精度が向上し得る。
【0043】
第15態様は、第12態様又は第13態様の医用画像学習装置において、学習部は、第一画像群、第三画像群、第一画像群の正解データ、及び第三画像群の正解データを用いた学習済の認識器、又は第三画像群及び第三画像群の正解データを用いた学習済の学習器に対して、第二画像群及び第二画像群の正解データを用いた学習を実施する構成としてもよい。
【0044】
第15態様によれば、少なくとも第三画像群を用いた学習済の認識器に対して、第三画像群よりも信頼性が高い真のデータである第二画像群及び第二画像群の正解データを用いた再学習を実施する。これにより、学習の精度が向上し、認識器の精度が向上し得る。
【0045】
第16態様に係る医用画像学習方法は、互いに分光分布が異なる第一画像及び第二画像を取得する画像取得工程と、第一画像に画像処理を施して第三画像を生成する画像処理工程と、複数の第一画像を含む第一画像群、複数の第二画像を含む第二画像群、及び複数の第三画像を含む第三画像群、並びに第一画像群、第二画像群、及び第三画像群のそれぞれの正解データを用いて、自動認識に適用する認識器を学習させる学習工程と、を含み、画像処理工程は、第一画像の分光分布に含まれる帯域のうち第二画像の対応する帯域と特性が異なる帯域の信号を抑制する画像処理、及び第一画像に含まれる帯域のうち第二画像の対応する帯域と特性が同一の帯域の信号又は類似する帯域の信号を強調する画像処理の少なくともいずれかを施して、第一画像から第三画像を生成する医用画像学習方法である。
【0046】
第16態様によれば、第1態様と同様の効果を得ることができる。
【0047】
第16態様において、第2態様から第15態様で特定した事項と同様の事項を適宜組み合わせることができる。その場合、医用画像学習装置において特定される処理や機能を担う構成要素は、これに対応する処理や機能を担う医用画像学習方法の構成要素として把握することができる。
【0048】
第17態様に係るプログラムは、コンピュータに、互いに分光分布が異なる第一画像及び第二画像を取得する画像取得機能、第一画像に画像処理を施して第三画像を生成する画像処理機能、及び複数の第一画像を含む第一画像群、複数の第二画像を含む第二画像群、及び複数の第三画像を含む第三画像群、並びに第一画像群、第二画像群、及び第三画像群のそれぞれの正解データを用いて、自動認識に適用する認識器を学習させる学習機能を実現させるプログラムであって、画像処理機能は、第一画像の分光分布に含まれる帯域のうち第二画像の対応する帯域と特性が異なる帯域の信号を抑制する画像処理、及び第一画像に含まれる帯域のうち第二画像の対応する帯域と特性が同一の帯域の信号又は類似する帯域の信号を強調する画像処理の少なくともいずれかを施して、第一画像から第三画像を生成するプログラムである。
【0049】
第17態様によれば、第1態様と同様の効果を得ることができる。
【0050】
第17態様において、第2態様から第15態様で特定した事項と同様の事項を適宜組み合わせることができる。その場合、医用画像学習装置において特定される処理や機能を担う構成要素は、これに対応する処理や機能を担うプログラムの構成要素として把握することができる。
【発明の効果】
【0051】
本発明によれば、分光分布が異なる第一画像及び第二画像について、第一画像の分光分布に含まれる帯域のうち、第二画像の対応する帯域との特性が同一の帯域の信号又は類似する帯域の信号を強調するか、又は第二画像の対応する帯域との特性が相違する帯域の信号を抑制して第三画像を生成する。複数の第一画像を含む第一画像群、複数の第二画像を含む第二画像群、及び複数の第三画像を含む第三画像群、並びに各画像群の正解データを用いて、自動認識に適用する分類器を学習する。これにより、分光分布が異なる画像群ごとに大量の正解画像の収集を行うことなく、分光分布が異なる画像群ごとの学習を実現し得る。
【発明を実施するための形態】
【0053】
以下、添付図面に従って本発明の好ましい実施の形態について詳説する。本明細書では、同一の構成要素には同一の参照符号を付して、重複する説明は適宜省略することとする。
【0054】
[内視鏡画像学習装置]
本実施形態に示す内視鏡画像学習装置は、異なる観察モードにおいて取得された画像を組み合わせて学習データの数を拡張している。異なる観察モードにおいて取得された画像を学習に利用することにより、特定の観察モードにおいて取得された画像の数が十分でない場合にも、精度の高い学習が実現可能である。これにより、精度の高いAI技術の実現が可能となる。なお、実施形態に示す内視鏡画像学習装置は、医用画像学習装置の一例である。
【0055】
本実施形態では、LCI(Linked Color Imaging)を用いた注目領域の自動認識システムに適用される学習を例示する。なお、LCIは特殊光色彩強調機能を意味する。以下の説明において、学習という用語と、機械学習という用語は同義として取り扱うこととする。
【0056】
〔内視鏡画像学習装置のハードウェア構成〕
図1は実施形態に係る内視鏡画像学習装置のハードウェア構成の一例を示すブロック図である。内視鏡画像学習装置10は、パーソナルコンピュータ又はワークステーションを適用し得る。
【0057】
内視鏡画像学習装置10は、通信部12、第一記憶装置14、第二記憶装置16、第三記憶装置17、操作部18、CPU20、RAM22、ROM24、及び表示部26を備える。なお、CPUはCentral Processing Unitの省略語である。RAMはRandom Access Memoryの省略語である。ROMはRead Only Memoryの省略語である。
【0058】
通信部12は、外部装置との通信を処理するインターフェースである。通信部12は、汎用の通信インターフェースを適用し得る。通信部12は、有線又は無線のいずれも適用可能である。
【0059】
第一記憶装置14は、通常光観察モードを適用して撮像された複数の通常光画像を含む通常光画像群及び各通常光画像の正しい画像認識結果を示す正解データからなる第一データセットが記憶される。
【0060】
第二記憶装置16は、特殊光観察モードを適用して複数の特殊光画像を含む特殊光画像群及び各特殊光画像の正しい画像認識結果を示す正解データからなる第二データセットが記憶される。
【0061】
第三記憶装置17は、通常光画像又は特殊光画像に画像処理を施した複数の処理画像を含む処理画像群、及び各処理画像群の正しい画像認識結果を示す正解データからなる第三データセットが記憶される。
【0062】
本実施形態では、通常光画像から処理画像を生成し、学習に使用する例を説明する。処理画像の正しい認識結果を表す正解データは、第一データセットから抽出し得る。なお、特殊光画像から処理画像を生成し、第二データセットから処理画像の正解データを抽出してもよい。
【0063】
第一記憶装置14、第二記憶装置16、及び第三記憶装置17は、大容量のストレージ装置を適用し得る。第一記憶装置14、第二記憶装置16、及び第三記憶装置17は、内視鏡画像学習装置10の外部に配置される記憶装置を適用し得る。第一記憶装置14、第二記憶装置16、及び第三記憶装置17は、ネットワークを介して内視鏡画像学習装置10と通信可能に接続されてもよい。
【0064】
なお、実施形態に示す通常光画像は第一画像の一例である。実施形態に示す通常光画像群は第一画像群の一例である。実施形態に示す特殊光画像は第二画像の一例である。実施形態に示す特殊光画像群は第二画像群の一例である。
【0065】
通常光画像は、内視鏡装置を用いた体腔内の観察において、通常光を照射して撮像して得られたカラー画像である。特殊光画像は、内視鏡装置を用いた体腔内の観察において、特殊光を照射して撮像して得られたカラー画像である。
【0066】
通常光は、可視光の全ての波長帯域の光がほぼ均等に混ざった光である。通常光画像は、通常観察に使用される。通常光の一例として、白色光が挙げられる。通常光画像群は、比較的多く集めることができる。
【0067】
特殊光は、一つの特定の波長帯域の光、又は複数の特定の波長帯域の光の組み合わせた、観察目的に応じた各種の波長帯域の光である。特殊光は、白色の波長帯域よりも狭い帯域を有し、NBI(Narrow band imaging)、LCI、及びFICE(Flexible spectral imaging color enhancement)等に使用される。NBIは狭帯域観察を意味する。
【0068】
特定の波長帯域の第一例は、例えば可視域の青色帯域又は緑色帯域である。第一例の波長帯域は、390ナノメートル以上450ナノメートル以下、又は530ナノメートル以上550ナノメートル以下の波長帯域を含む。第一例の光は、390ナノメートル以上450ナノメートル以下、又は530ナノメートル以上550ナノメートル以下の波長帯域内にピーク波長を有する。
【0069】
特定の波長帯域の第二例は、例えば可視域の赤色帯域である。第二例の波長帯域は、585ナノメートル以上615ナノメートル以下、又は610ナノメートル以上730ナノメートル以下の波長帯域を含む。第二例の光は、585ナノメートル以上615ナノメートル以下又は610ナノメートル以上730ナノメートル以下の波長帯域内にピーク波長を有する。
【0070】
特定の波長帯域の第三例は、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域を含み、且つ第三例の光は、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域にピーク波長を有する。第三例の波長帯域は、400±10ナノメートル、440±10ナノメートル、470±10ナノメートル、又は600ナノメートル以上750ナノメートル以下の波長帯域を含む。第三例の光は、400±10ナノメートル、440±10ナノメートル、470±10ナノメートル、又は600ナノメートル以上750ナノメートル以下の波長帯域にピーク波長を有する。
【0071】
特定の波長帯域の第四例は、生体内の蛍光物質が発する蛍光の観察である蛍光観察に用いられる。第四例の波長帯域は、蛍光物質を励起させる励起光の波長帯域であり、例えば390ナノメートルから470ナノメートルまでの波長帯域である。
【0072】
特定の波長帯域の第五例は、赤外光の波長帯域である。第五例の波長帯域は、790ナノメートル以上820ナノメートル以下、又は905ナノメートル以上970ナノメートル以下の波長帯域を含む。第五例の光は、790ナノメートル以上820ナノメートル以下、又は905ナノメートル以上970ナノメートル以下の波長帯域にピーク波長を有する。
【0073】
このような特定の波長帯域を有する特殊光の下で撮像された特殊光画像は、病変の観察目的に応じた見やすい画像を得るためのものであり、例えば、表面構造を観察したい等の観察目的に応じた場合にしか使用されず、データ数が多くない。
【0074】
本実施形態では、第一記憶装置14に記憶されている通常光画像群の第一データセットは、第二記憶装置16に保存されている特殊光画像群の第二データセットよりも多く準備されているものとする。第三データセットは第二データセットの不足を補う数が準備される。
【0075】
また、第一記憶装置14、第二記憶装置16、及び第三記憶装置17において、各通常光画像、各特殊光画像、及び各処理画像に関連付けて保存されている正解データの一例として、通常光画像及び特殊光画像内に写っている病変の種類、病変の位置を示したデータ及び症例固有の識別情報などが挙げられる。病変の分類の一例として、腫瘍性、又は非腫瘍性の二分類、若しくはNICE分類などが挙げられる。病変の位置を示すデータは、病変を囲む矩形の情報や、病変を覆い隠すようなマスクデータなどが考えられる。なお、NICEは、NBI International Colorectal Endoscopic Classificationの省略語である。
【0076】
第一記憶装置14、第二記憶装置16、及び第三記憶装置17は、内視鏡画像学習装置10が備えているが、第一記憶装置14、第二記憶装置16、及び第三記憶装置17は、内視鏡画像学習装置10の外部に配置されてもよい。この場合、通信部12を介して、内視鏡画像学習装置10の外部のデータベースから学習用のデータセットを取得することができる。
【0077】
操作部18は、内視鏡画像学習装置10に適用されるコンピュータに有線接続又は無線接続されるキーボード及びマウス等が用いられる。操作部18は、学習に当たって各種の操作入力を受け付ける。すなわち、操作部18はユーザインターフェースの一部として使用される。
【0078】
CPU20は、ROM24又は図示しないハードディスク装置等に記憶された各種のプログラムを読み出し、各種の処理を実行する。読み出されるプログラムの一例として、内視鏡画像学習プログラムが挙げられる。
【0079】
RAM22は、CPU20の作業領域として使用される。また、RAM22は、読み出されたプログラムや各種のデータを一時的に記憶する記憶部として用いられる。
【0080】
表示部26は、内視鏡画像学習装置10に適用されるコンピュータに接続可能な液晶モニタ等の各種モニタが用いられる。表示部26は、ユーザインターフェースの一部として使用される。タッチパネル方式のモニタ装置を表示部26に適用して、表示部26及び操作部18を一体に構成してもよい。
【0081】
内視鏡画像学習装置10は、操作部18から送信される指示信号に基づき、ROM24及びハードディスク装置等に記憶されている内視鏡画像学習プログラムをCPU20が読み出す。CPU20は内視鏡画像学習プログラムを実行する。
【0082】
〔内視鏡画像学習装置の機能〕
〈概要〉
図2は実施形態に係る内視鏡画像学習装置の機能ブロック図である。
図2は
図1に示す内視鏡画像学習装置10の主要な機能を示す機能ブロック図である。内視鏡画像学習装置10は、学習部30及び画像生成部40を備える。
【0083】
学習部30は、第一記憶装置14に記憶される第一データセット、第二記憶装置16に記憶される第二データセット、及び第三記憶装置17に記憶される第三データセットを用いて学習し、画像認識用の学習モデルを生成する。本実施形態では、学習モデルの一つである畳み込みニューラルネットワークを構築する。以下、CNN(Convolution Neural Network)は畳み込みニューラルネットワークを表すこととする。
【0084】
画像生成部40は、通常光画像から処理画像を生成する。具体的には、通常光画像の分光分布と特殊光画像の分光分布との間の対応する波長帯域について、帯域成分同士が同一又は類似する場合に帯域成分を強調する処理を実施するか、又は帯域成分同士が相違する場合に帯域成分を抑制する処理を実施する。画像生成部40における画像処理の詳細は後述する。なお、学習部30及び画像生成部40は、通常光画像及び特殊光画像を取得する画像取得部の機能を備え得る。
【0085】
〈学習部〉
図3は
図2に示す学習部の機能ブロック図である。学習部30は、CNN32、誤差算出部34、及びパラメータ更新部36を備える。
【0086】
CNN32は、例えば、内視鏡画像に写っている病変の種類を画像認識する認識器に対応する部分である。CNN32は、複数のレイヤー構造を有し、複数の重みパラメータを保持している。CNN32は、重みパラメータが初期値から最適値に更新されることで、未学習モデルから学習済みモデルに変化し得る。
【0087】
CNN32は、入力層32a、中間層32b及び出力層32cを備える。中間層32bは、畳み込み層32d及びプーリング層32eから構成されたセット32f、全結合層32gを備える。学習部30の各層は、エッジを用いて複数のノードが結ばれる構造を有する。
【0088】
入力層32aは、学習対象である通常光画像14a、特殊光画像16a、及び処理画像17aが入力される。通常光画像14a、特殊光画像16a、及び処理画像17aはCNN32へ送信される。
【0089】
中間層32bは、入力層32aを用いて入力した画像から特徴を抽出する部分である。畳み込み層32dは、前の層で近くにあるノードにフィルタ処理を実施し、特徴マップを取得する。フィルタ処理はフィルタを使用した畳み込み演算が適用される。
【0090】
プーリング層32eは、畳み込み層32dから出力された特徴マップを縮小して新たな特徴マップとする。畳み込み層32dは、画像からのエッジ抽出等の特徴抽出の役割を担う。プーリング層32eは抽出された特徴が、平行移動などによる影響を受けないようにロバスト性を与える役割を担う。
【0091】
なお、中間層32bは、畳み込み層32dとプーリング層32eとを一セットとする場合に限定されない。例えば、畳み込み層32dが連続する場合及び図示しない正規化層を含む場合もあり得る。
【0092】
出力層32cは、中間層32bを用いて抽出された特徴に基づき内視鏡画像に写っている病変の種類を分類する認識結果を出力する。学習済みのCNN32は、例えば、内視鏡画像を、腫瘍性、非腫瘍性、及びその他の三つのカテゴリに分類し得る。学習済みのCNN32は、認識結果として、腫瘍性に対応するスコア、非腫瘍性に対応するスコア、及びその他に対応するスコアを出力し得る。なお、三つのスコアの合計は100パーセントとなる。
【0093】
学習前のCNN32の各畳み込み層32dに適用されるフィルタの係数、オフセット値、及び図示しない全結合層における次の層との接続の重みは、任意の初期値がセットされる。
【0094】
誤差算出部34は、CNN32の出力層32cから出力される認識結果、並びに通常光画像14aに対する正解データ14b、及び特殊光画像16aに対する正解データ16bを取得する。なお、処理画像17aに対応する正解データは、通常光画像14aに対する正解データ14bを適用し得る。
【0095】
誤差算出部34は、認識結果と正解データとの間の誤差を算出する。誤差の算出方法の一例として、ソフトマックスクロスエントロピー及びシグモイド等が挙げられる。
【0096】
パラメータ更新部36は、誤差算出部34を用いて算出された誤差を元に、誤差逆伝播法を適用してCNN32の重みパラメータを調整する。CNN32の重みパラメータの調整処理を繰り返し行い、CNN32の出力と正解データとの差が小さくなるまで繰り返し学習を行う。
【0097】
学習部30は、通常光画像群の全てのデータセット、特殊光画像群の全てのデータセット、及び処理画像群の全てのデータセットを使用し、CNN32の各パラメータを最適化する学習を行い、学習済みモデルを生成する。なお、実施形態に示す内視鏡画像は医用画像の一例である。
【0098】
〔内視鏡画像学習方法の手順〕
図4は実施形態に係る内視鏡画像学習方法の手順を示すフローチャートである。
図4に示す内視鏡画像学習方法は、通常光画像取得工程S10、特殊光画像取得工程S12、画像処理工程S14、処理画像記憶工程S16、学習工程S18、及び認識器更新工程S20が含まれる。実施形態に示す内視鏡画像学習方法は、医用画像学習方法の一例である。
【0099】
通常光画像取得工程S10では、
図2に示す学習部30及び画像生成部40は第一記憶装置14から通常光画像14aを読み出す。特殊光画像取得工程S12では、学習部30は第二記憶装置16から特殊光画像16aを読み出す。なお、特殊光画像取得工程S12は学習工程S18までに実施されればよい。
【0100】
画像処理工程S14では、画像生成部40は通常光画像14aに画像処理を施して処理画像を生成する。処理画像記憶工程S16では、画像生成部40は処理画像17aを第三記憶装置17へ記憶する。
【0101】
学習工程S18では、学習部30は第三記憶装置17から処理画像17aを読み出し、通常光画像14a、特殊光画像16a、及び処理画像17aを用いて学習を実施する。認識器更新工程S20では、学習部30は認識器を更新する。
【0102】
[画像生成部を用いた画像処理の具体例]
次に、
図2に示す画像生成部40に適用される画像処理について詳細に説明する。画像生成部40は、通常光画像14aの分光分布における波長帯域の信号を強調する処理、又は抑制する処理を施して処理画像17aを生成する。
【0103】
画像生成部40は、通常光画像14aと特殊光画像16aとの間で、両者間の対応する波長帯域における帯域成分同士が相違する場合は、通常光画像14aにおける該当する波長帯域の信号を抑制する。
【0104】
一方、画像生成部40は、通常光画像14aと特殊光画像16aとの間で、両者間の対応する波長帯域における帯域成分同士が同一又は類似する場合は、通常光画像14aにおける該当する波長帯域の信号を強調してもよい。これにより、特殊光画像16aの学習に適用可能な学習データの数を増やすことが可能となる。
【0105】
画像生成部40は、波長依存とは異なる、観察モード間の処理の違いに起因する画像差について、逆処理を適用した補正等の後処理を実施し得る。学習部30は補正後の画像を学習に適用し得る。観察モード間の処理の一例として、リニアマトリックス及びルックアップテーブルなどが挙げられる。
【0106】
〈第一実施形態〉
図5は撮像素子の分光感度の説明図である。撮像素子は内視鏡画像を取得する内視鏡に具備される。撮像素子は符号328を付して
図8に図示する。内視鏡は符号302を付して
図8に図示する。
【0107】
図5に示す分光感度特性100の横軸は波長を表す。分光感度特性100の縦軸は感度を表す。分光感度特性100はBチャネルの波長帯域にBチャネル成分102を有する。分光感度特性100はGチャネルの波長帯域にGチャネル成分104を有する。分光感度特性100はRチャネルの波長帯域にRチャネル成分106を有する。なお、Bは青を表す。Gは緑を表す。Rは赤を表す。
【0108】
図6は照明光の強度分布と内視鏡画像の分光分布との関係を示す説明図である。
図6に示す符号120は通常光の強度分布を表す。符号160はLCIにおける照明光の強度分布を表す。通常光の強度分布120及びLCIにおける照明光の強度分布160の横軸は波長を表す。縦軸は照明光の強度を表す。なお、LCIにおける照明光は特殊光の一例である。
【0109】
符号140は通常光画像14aの分光分布を示す。通常光画像14aの分光分布140の横軸は波長を表す。縦軸は信号強度を表す。
【0110】
通常光画像14aの分光分布140は、Bチャネルの波長帯域にBチャネル成分142を有する。通常光画像14aの分光分布140はGチャネルの波長帯域にGチャネル成分144を有する。通常光画像14aの分光分布140はRチャネルの波長帯域にRチャネル成分146を有する。
【0111】
符号180はLCIにおける特殊光画像16aの分光分布を表す。LCIにおける特殊光画像16aの分光分布180の横軸は波長を表す。縦軸は信号強度を表す。LCIにおける特殊光画像16aの分光分布180は、Bチャネルの波長帯域にBチャネル成分182を有する。LCIにおける特殊光画像16aの分光分布180は、Gチャネルの波長帯域にGチャネル成分184を有する。LCIにおける特殊光画像16aの分光分布180は、Rチャネルの波長帯域にRチャネル成分186を有する。
【0112】
通常光画像14aの分光分布140と、LCIにおける特殊光画像16aの分光分布180とは、Bチャネル成分の特性が相違する。すなわち、通常光画像14aのBチャネル成分及びLCIにおける特殊光画像16aのBチャネル成分は、いずれもの二つのピークが存在する一方、二つのピークにおける感度の大きさが相違している。換言すると、通常光画像14aとLCIにおける特殊光画像16aとは、Bチャネル成分同士が相違している。
【0113】
一方、両者におけるGチャネル成分及びRチャネル成分は絶対値の差を除けば等しい。すなわち、Gチャネル成分及びRチャネル成分のみの画像は、Bチャネル成分のみの画像と比較して、通常光画像14aとLCIにおける特殊光画像16aとの間で差が小さい。換言すると、通常光画像14aとLCIにおける特殊光画像16aとの間において、Gチャネル成分の特性及びRチャネル成分は類似している。
【0114】
このような性質から、通常光画像14aにおけるGチャネル成分の画像情報及び通常光画像14aにおけるRチャネル成分の画像情報は、LCIにおける特殊光画像16aの学習においても有用である。一方、通常光画像14aにおけるBチャネル成分の画像情報は、LCIにおける特殊光画像16aの学習において不必要又は悪影響を与えると考えられる。
【0115】
そこで、画像生成部40は、通常光画像14aにおけるBチャネル成分の画像情報を抑制する処理を実施して処理画像17aを生成する。学習部30は通常光画像14a及び特殊光画像16aに処理画像17aを加えて、LCIにおける特殊光画像16aの学習を実施する。
【0116】
通常光画像14aにおけるBチャネル成分の画像情報を抑制する処理の一例として、通常光画像14aにおける輝度値を1/α倍する処理が挙げられる。なお、αは1を超える任意の定数である。通常光画像14aにおけるBチャネル成分の画像情報を抑制する処理の他の例として、輝度値を規定の値とする処理が挙げられる。規定の値の一例として輝度を最小とする輝度値が挙げられる。Bチャネル成分の画像情報を抑制する処理は、各画素の輝度値をランダムに与える処理を適用してもよい。
【0117】
通常光画像14aにおける輝度値を1/α倍する処理と併用して、通常光画像14aにおける輝度値をシフトさせてもよい。なお、実施形態に示す輝度値を1/α倍する処理は、輝度分散を変換する処理の一例である。輝度分散を変換する処理は、通常光画像14aにおける輝度値をシフトさせる処理を含み得る。
【0118】
通常光画像14aにおけるBチャネル成分の画像情報を抑制する処理に代わり、通常光画像14aにおけるGチャネル成分の画像情報及びRチャネル成分の画像情報の少なくともいずれかを強調して、相対的にBチャネル成分の画像情報の影響を下げてもよい。
【0119】
通常光画像14aにおけるGチャネル成分の画像情報及びRチャネル成分の画像情報を強調する処理の一例として、通常光画像14aにおける輝度値をβ倍する処理が挙げられる。なお、βは1を超える任意の定数である。
【0120】
通常光画像14aにおける輝度値をβ倍する処理と併用して、通常光画像14aにおける輝度値をシフトさせてもよい。なお、実施形態に示す輝度値をβ倍する処理は、輝度分散を変換する処理の一例である。輝度分散を変換する処理は、通常光画像14aにおける輝度値をシフトさせる処理を含み得る。
【0121】
〈作用効果〉
第一実施形態に係る画像処理によれば、通常光画像14aに対して、分光分布におけるBチャネル成分の抑制処理、又はGチャネル成分及びRチャネル成分の少なくともいずれかを強調する処理を施す。これにより、LCIにおける特殊光画像16aの学習に適用可能な学習データの拡充が可能となる。
【0122】
〈第二実施形態〉
第二実施形態に係る画像処理は、第一実施形態に係る画像処理と同様に、LCIにおける特殊光画像16aの学習に、通常光画像14aを利用する場合に適用される。第二実施形態では、通常光画像14a及び特殊光画像16aにおけるBチャネル成分同士の違いに着目した画像処理を実施する。
【0123】
LCIにおける特殊光画像16aのBチャネル成分は、通常光画像14aのBチャネル成分と比較して短波長成分を多く含む。これにより、LCIにおける特殊光画像16aは、通常光画像14aと比較して高いコントラストで微小な血管構造などを表す性質を持つ。
【0124】
微小な血管構造などは、LCIにおける特殊光画像16aの空間周波数の高周波成分に対応する。そこで、画像生成部40は、通常光画像14aのBチャネル成分の画像に対して、空間周波数の高周波成分を強調する処理を施した処理画像17aを生成する。これにより、通常光画像14aのBチャネル成分の画像を特殊光画像16aのBチャネル成分の画像に近づけることが可能となる。よって、LCIにおける特殊光画像16aの学習データの拡充を行うことが可能となる。
【0125】
高周波成分を規定する一例として、高周波成分を多く含む特殊光画像16aを周波数解析し、周波数分布に基づいて強調する周波数又は周波数帯域を規定する例が挙げられる。例えば、基準周波数を算出して、処理対象画像の空間周波数成分のうち、基準周波数以上の周波数成分を高周波成分とし得る。基準周波数は、処理対象画像に含まれる周波数成分のうち、全体に対してある割合以上の周波数成分が含まれる範囲の下限として算出し得る。
【0126】
空間周波数の高周波成分を強調する処理の一例として、アンシャープマスクを用いたマスク処理が挙げられる。空間周波数の高周波成分を抑制する処理の一例として、ローパスフィルタを用いたフィルタ処理が挙げられる。実施形態に示す空間周波数の高周波成分は、空間周波数の規定の周波数成分の一例である。実施形態に示すBチャネル成分の画像は、処理対象帯域の一例である。
【0127】
〈作用効果〉
第二実施形態に係る画像処理によれば、通常光画像14aのBチャネル成分の画像に対して、空間周波数の高周波成分を強調する処理を施す。処理画像17aは通常光画像14aと比較して高いコントラストで微小な血管構造などが表される。これにより、LCIにおける特殊光画像16aの学習に適用可能な学習データの拡充が可能となる。
【0128】
〈第三実施形態〉
第三実施形態に係る画像処理は、通常光画像14aを用いた注目領域の自動認識システムに適用される学習において、NBIにおける特殊光画像16aを利用する場合に適用される。
【0129】
図7は通常光画像の分光分布とNBIにおける特殊光画像の分光分布との関係を示す説明図である。符号200は通常光画像14aの分光分布を示す。通常光画像14aの分光分布200の横軸は波長を表す。縦軸は信号強度を表す。
【0130】
通常光画像14aの分光分布200は、Bチャネルの波長帯域にBチャネル成分202を有する。通常光画像14aの分光分布200は、Gチャネルの波長帯域にGチャネル成分204を有する。通常光画像14aの分光分布200は、Rチャネルの波長帯域にRチャネル成分206を有する。
【0131】
符号220は、NBIにおける特殊光画像16aの分光分布特性を示す。NBIにおける特殊光画像16aの分光分布220の横軸は波長を表す。縦軸は信号強度を表す。NBIにおける特殊光画像16aは、Bチャネルの波長帯域にBチャネル成分222を有する。NBIにおける特殊光画像16aは、Gチャネルの波長帯域にGチャネル成分224を有する。
【0132】
一方、NBIにおける特殊光画像16aは、受光の際にRチャネル成分が失われている。
図7に示すNBIにおける特殊光画像16aの分光分布220には、一点鎖線を用いて失われているRチャネル成分を示す。すなわち、通常光画像14a及びNBIにおける特殊光画像16aにおいて、Rチャネル成分同士は相違する。
【0133】
一方、NBIにおける特殊光画像16aのBチャネル成分222及びGチャネル成分224は、通常光画像14aのBチャネル成分202及びGチャネル成分204と帯域幅が相違するものの、重複する帯域が存在する。
【0134】
通常光画像14a及びNBIにおける特殊光画像16aにおいて、Bチャネル成分及びGチャネル成分同士は、Rチャネル成分同士と比較して近い性質を持っている。すなわち、通常光画像14a及びBIにおける特殊光画像16aにおいて、Bチャネル成分同士及びGチャネル成分同士は類似する。
【0135】
そこで、画像生成部40は、通常光画像14aにおけるRチャネル成分206を抑制する処理を実施し処理画像17aを生成する。学習部30はNBIにおける特殊光画像16aの学習に処理画像を適用し得る。
【0136】
画像生成部40は、通常光画像14aのBチャネル成分202及びGチャネル成分204の少なくともいずれかを強調する処理を施して処理画像17aを生成してもよい。学習部30はNBIにおける特殊光画像16aの学習に処理画像17aを適用し得る。通常光画像14aの処理対象の帯域成分を抑制する処理、及び処理対象の帯域成分を強調する処理は第一実施形態と同様である。ここでの説明は省略する。
【0137】
〈作用効果〉
第三実施形態に係る画像処理によれば、通常光画像14aに対して、Rチャネル成分の抑制処理又はGチャネル成分及びBチャネル成分の少なくともいずれかの強調処理を施す。これにより、NBIにおける特殊光画像16aの学習に適用可能な学習データの拡充が可能となる。
【0138】
〈第三実施形態の応用例〉
NBIにおける特殊光画像16aのBチャネル成分222又はGチャネル成分224は、通常光画像14aのBチャネル成分222又はGチャネル成分224と比較してヘモグロビンの吸収係数が大きい帯域成分が大きいため、NBIにおける特殊光画像16aは通常光画像14aと比較して高いコントラストで血管構造等を表す性質を持つ。そこで、第二実施形態に係る画像処理と同様に、画像生成部40は、通常光画像14aのBチャネル成分222の画像又はGチャネル成分224の画像について、空間周波数における高周波成分を強調する処理を行い、処理画像17aを生成し得る。処理画像17aは、通常光画像14aと比較して高いコントラストで微小な血管構造などが表される。これにより、NBIにおける特殊光画像16aの学習に適用可能な学習データの拡充が可能となる。
【0139】
〈第四実施形態〉
第四実施形態に係る画像処理は、互いに異なる観察モードを適用して取得した複数の画像群を適用して学習を行う場合に適用される。第一実施形態から第三実施形態に示す画像処理は、本来とは異なる観察モードを適用して取得した内視鏡画像を、擬似的に本来の観察モードを適用して取得した内視鏡画像に近づける処理である。
【0140】
そうすると、別の観察モードの影響が大きくなり過ぎると、学習精度の向上が期待を下回る可能性がある。そこで、学習部30に適用される学習方法を工夫して、複数の画像群のバランスの調整を図る。具体的には、通常光画像群の学習と特殊光画像群の学習との学習方法を切り替える。通常光画像群の学習と特殊光画像群の学習との学習方法を切り替えには、通常光画像14aから生成した処理画像17aの学習と特殊光画像16aの学習との学習方法を切り替えが含まれる。以下に、学習方法の切り替えの具体例について説明する。
【0141】
《重み係数の導入》
CNNを含む学習手法の多くは、特定の目的関数を最小化又は最大化する学習を実施する。そこで、本来の観察モードが適用された画像群のみから計算される目的関数をL_maimとし、本来とは異なる観察モードが適用された画像群のみから計算される目的関数をL_subとする。式1を用いて表される目的関数Lを最小化又は最大化する学習を実施する。
【0142】
L=L_maim+λ×L_sub …式1
なお、式1のλは設計パラメータである。設計パラメータλは1未満の任意の定数が適用される。設計パラメータλの値をより小さくすると、目的関数Lにおいて本来の観察モードの影響を表す第一項に対して、本来とは異なる観察モードの影響を表す第二項の影響がより抑制され得る。
【0143】
通常光画像14aの画像群とLCIにおける特殊光画像16aの画像群とを用いて学習を実施する場合は以下のとおりである。特殊光画像16aの画像群のみから計算される目的関数をL_maimとする。通常光画像14aの画像群のみから計算される目的関数をL_subとする。設計パラメータλを適宜設定して、式1の目的関数Lを最小化又は最大化する学習を実施し得る。
【0144】
図2に示す内視鏡画像学習装置10は、設計パラメータλを設定する設計パラメータ設定部を備え得る。また、内視鏡画像学習装置10は、目的関数Lを記憶する目的関数記憶部を備え得る。学習部30は、目的関数L及び設計パラメータλを読み出し、学習を実施し得る。
【0145】
《転移学習》
まず、観察モードが互いに異なる複数の画像群を用いてCNNを学習させる。その後に学習済みパラメータを初期値として、本来の観察モードが適用された画像群のみを用いてCNNを再学習させる。
【0146】
具体的には、通常光画像14a及び処理画像17aを用いた学習済みのCNN、又は処理画像17aを用いた学習済みのCNNに対して、特殊光画像16aを用いて再学習を実施する。
【0147】
これにより、本来とは異なる観察モードが適用された画像群の情報を利用した上で、本来の観察モードが適用された画像群に、より近づけることが可能となる。
【0148】
学習部30は、観察モードが互いに異なる複数の画像群を用いてCNNを学習させる第一学習部、及び本来の観察モードが適用された画像群のみを用いてCNNを再学習させる第二学習部を備え得る。
【0149】
〈作用効果〉
第四実施形態に係る画像処理によれば、本来とは異なる観察モードが適用された画像群の情報を利用した上で、本来とは異なる観察モードが適用された画像群の影響が抑制される学習を実施し得る。
【0150】
[内視鏡画像を取得する内視鏡システムの全体構成]
図8は内視鏡システムの全体構成図である。
図8に示す内視鏡システム300は、内視鏡302、光源装置311、プロセッサ装置312、表示装置313、画像処理装置314、入力装置315、及びモニタ装置316を備える。
【0151】
内視鏡302は電子内視鏡である。また、内視鏡302は軟性内視鏡である。内視鏡302は挿入部320、操作部321、及びユニバーサルコード322を備える。挿入部320は被検体内に挿入される。挿入部320は、全体が細径で長尺状に形成されている。
【0152】
挿入部320は、軟性部325、湾曲部326、及び先端部327を備える。挿入部320は、軟性部325、湾曲部326、及び先端部327が連設されて構成される。軟性部325は、挿入部320の基端側から先端側に向けて順に可撓性を有する。湾曲部326は、操作部321が操作された場合に湾曲可能な構造を有する。先端部327は、図示しない撮像光学系及び撮像素子328等が内蔵される。
【0153】
撮像素子328は、CMOS型撮像素子又はCCD型撮像素子が適用される。CMOSは、Complementary Metal Oxide Semiconductorの省略語である。CCDは、Charge Coupled Deviceの省略語である。
【0154】
先端部327の先端面327aは、図示しない観察窓が配置される。観察窓は、先端部327の先端面327aに形成された開口である。観察窓は図示しないカバーが取り付けられる。観察窓の後方には、図示しない撮像光学系が配置される。撮像素子328の撮像面は、観察窓及び撮像光学系等を介して、被観察部位の像光が入射する。撮像素子328は、撮像素子328の撮像面に入射した被観察部位の像光を撮像して、撮像信号を出力する。ここでいう撮像は、被観察部位からの反射光を電気信号へ変換するという意味が含まれる。
【0155】
操作部321は挿入部320の基端側に連設される。操作部321は、術者が操作する各種操作部材を備える。具体的には、操作部321は、二種類の湾曲操作ノブ329を備える。湾曲操作ノブ329は、湾曲部326の湾曲操作の際に用いられる。なお、術者は、医師、操作者、観察者、及びユーザなどと呼ばれることがあり得る。
【0156】
操作部321は、送気送水ボタン330及び吸引ボタン331を備える。送気送水ボタン330は、術者が送気送水操作を行う際に用いられる。吸引ボタン331は、術者が吸引操作を行う際に用いられる。
【0157】
操作部321は、静止画像撮像指示部332及び処置具導入口333を備える。静止画像撮像指示部332は、被観察部位の静止画像を撮像する際に、術者が操作する。処置具導入口333は、挿入部320の内部を挿通している処置具挿通路の内部に処置具を挿入する開口である。なお、処置具挿通路及び処置具の図示は省略する。
【0158】
ユニバーサルコード322は、内視鏡302を光源装置311に接続する接続コードである。ユニバーサルコード322は、挿入部320の内部を挿通しているライトガイド335、信号ケーブル336、及び図示しない流体チューブを内包している。
【0159】
また、ユニバーサルコード322の先端部は、光源装置311に接続されるコネクタ337a、及びコネクタ337aから分岐され、かつプロセッサ装置312に接続されるコネクタ337bを備える。
【0160】
コネクタ337aを光源装置311に接続すると、ライトガイド335及び図示しない流体チューブが光源装置311に挿入される。これにより、ライトガイド335及び図示しない流体チューブを介して、光源装置311から内視鏡302に対して必要な照明光と水と気体とが供給される。
【0161】
その結果、先端部327の先端面327aの図示しない照明窓から被観察部位に向けて照明光が照射される。また、送気送水ボタン330の押下操作に応じて、先端部327の先端面327aの図示しない送気送水ノズルから先端面327aの図示しない観察窓に向けて気体又は水が噴射される。
【0162】
コネクタ337bをプロセッサ装置312に接続すると、信号ケーブル336とプロセッサ装置312とが電気的に接続される。これにより、信号ケーブル336を介して、内視鏡302の撮像素子328からプロセッサ装置312へ被観察部位の撮像信号が出力され、かつプロセッサ装置312から内視鏡302へ制御信号が出力される。
【0163】
本実施形態では、内視鏡302として軟性内視鏡を例に挙げて説明を行ったが、内視鏡302として、硬性内視鏡等の被観察部位の動画撮像を可能な各種の電子内視鏡を用いてもよい。
【0164】
光源装置311は、コネクタ337aを介して、内視鏡302のライトガイド335へ照明光を供給する。照明光は、白色光又は特定の波長帯域の光を適用可能である。照明光は、白色光及び特定の波長帯域の光を組み合わせてもよい。光源装置311は、観察目的に応じた波長帯域の光を、照明光として適宜選択可能に構成される。
【0165】
白色光は、白色の波長帯域の光又は複数の波長帯域の光のいずれでもよい。特定の波長帯域は、白色の波長帯域よりも狭い帯域である。特定の波長帯域の光は、一種類の波長帯域の光を適用してもよいし、複数の波長帯域の光を適用してもよい。特定の波長帯域は、特殊光と呼ばれる場合がある。
【0166】
プロセッサ装置312は、コネクタ337b及び信号ケーブル336を介して、内視鏡302の動作を制御する。また、プロセッサ装置312は、コネクタ337b及び信号ケーブル336を介して、内視鏡302の撮像素子328から撮像信号を取得する。プロセッサ装置312は規定のフレームレートを適用して内視鏡302から出力された撮像信号を取得する。
【0167】
プロセッサ装置312は、内視鏡302から取得した撮像信号に基づき、被観察部位の観察画像である内視鏡画像を生成する。ここでいう内視鏡画像338には動画像が含まれる。内視鏡画像338は静止画像339が含まれてもよい。
【0168】
プロセッサ装置312は、操作部321の静止画像撮像指示部332が操作された場合、動画像の生成と並行して、撮像素子328から取得した撮像信号に基づき被観察部位の静止画像339を生成する。静止画像339は、動画像の解像度に対して高解像度に生成されていてもよい。
【0169】
内視鏡画像338の生成の際に、プロセッサ装置312はホワイトバランス調整及びシェーディング補正等のデジタル信号処理を適用した画質の補正を行う。プロセッサ装置312はDICOM規格で規定された付帯情報を内視鏡画像338へ付加してもよい。なお、DICOMは、Digital Imaging and Communications in Medicineの省略語である。
【0170】
内視鏡画像338は、被検体内、すなわち生体内を撮像した生体内画像である。内視鏡画像338が、特定の波長帯域の光を用いて撮像して得られた画像である場合、両者は特殊光画像である。そして、プロセッサ装置312は、生成した内視鏡画像338を表示装置313と画像処理装置314とのそれぞれに出力する。プロセッサ装置312は、DICOM規格に準拠した通信プロトコルに従って、図示しないネットワークを介して内視鏡画像338を、図示しない記憶装置へ出力してもよい。
【0171】
表示装置313は、プロセッサ装置312に接続される。表示装置313は、プロセッサ装置312から送信された内視鏡画像338を表示する。術者は、表示装置313に表示される内視鏡画像338を確認しながら、挿入部320の進退操作等をし得る。術者は、被観察部位に病変等を検出した場合に、静止画像撮像指示部332を操作して被観察部位の静止画を撮像し得る。
【0172】
画像処理装置314は、コンピュータが用いられる。入力装置315はコンピュータに接続可能なキーボード及びマウス等が用いられる。入力装置315とコンピュータとの接続は有線接続、又は無線接続のいずれでもよい。モニタ装置316は、コンピュータに接続可能な各種モニタが用いられる。
【0173】
画像処理装置314として、ワークステーション及びサーバ装置等の診断支援装置を用いてもよい。この場合、入力装置315及びモニタ装置316は、それぞれワークステーション等に接続した複数の端末ごとに設けられる。更に、画像処理装置314として、医療レポート等の作成支援を行う診療業務支援装置を用いてもよい。
【0174】
画像処理装置314は、内視鏡画像338の取得及び内視鏡画像338の記憶を行う。画像処理装置314は、モニタ装置316の再生制御を行う。
図8に示す画像処理装置314は、
図1から
図7までの各図を用いて説明した内視鏡画像学習装置10の機能を備え得る。また、
図8に示す入力装置315は
図1に示す操作部18に相当する。
図8に示すモニタ装置316は
図1に示す表示部26に相当する。
【0175】
なお、本明細書における画像という用語は、画像を表す電気信号及び画像を表す情報等の静止画像339の意味が含まれている。本明細書における画像という用語は、画像自身及び画像データの少なくともいずれかを意味している。
【0176】
また、画像の記憶という用語は、画像の保存と読み替えることが可能である。ここでいう画像の記憶は、画像の非一時的記憶を意味する。画像処理装置314は画像を一時記憶する一時記憶用のメモリを備えてもよい。
【0177】
入力装置315は、画像処理装置314に対する操作指示の入力に用いられる。モニタ装置316は、画像処理装置314の制御の下、内視鏡画像338の表示を行う。モニタ装置316は、画像処理装置314における各種情報の表示部として機能してもよい。
【0178】
画像処理装置314は、図示しないネットワークを介して、図示しない記憶装置と接続され得る。画像の格納形式及びネットワークを経由した各装置間の通信は、DICOM規格及びDICOM規格に準拠したプロトコル等を適用可能である。
【0179】
図示しない記憶装置は、データを非一時的に記憶するストレージ等を適用可能である。記憶装置は、図示しないサーバ装置を用いて管理されてもよい。サーバ装置は、各種データを記憶して管理するコンピュータを適用可能である。
【0180】
[内視鏡システムの観察モード]
図9は内視鏡システムの機能ブロック図である。内視鏡システム300は通常光観察モードと特殊光観察モードとの切り替えが可能に構成される。操作者は図示しない観察モード切替ボタンを操作して、通常光観察モードと特殊光観察モードとの切り替えを実施し得る。
【0181】
光源装置311は、第一レーザ光源400、第二レーザ光源402、及び光源制御部404を備える。第一レーザ光源400は、中心波長445nmの青色レーザ光源である。第二レーザ光源402は、中心波長405nmの紫色レーザ光源である。第一レーザ光源400及び第二レーザ光源402として、レーザダイオードを用いることができる。第一レーザ光源400及び第二レーザ光源402の発光は、光源制御部404を用いて個別に制御される。第一レーザ光源400と第二レーザ光源402との発光強度比は変更自在になっている。
【0182】
内視鏡302は、第一光ファイバ410、第二光ファイバ412、蛍光体414、拡散部材416、撮像レンズ418、撮像素子328、及びアナログデジタル変換部420を備える。
【0183】
第一レーザ光源400、第二レーザ光源402、第一光ファイバ410、第二光ファイバ412、蛍光体414、及び拡散部材416を用いて照射部が構成される。
【0184】
第一レーザ光源400から出射されるレーザ光は、第一光ファイバ410を介して内視鏡302の先端部327に配置された蛍光体414に照射される。蛍光体414は、第一レーザ光源400からの青色レーザ光の一部を吸収して緑色から黄色まで範囲に励起発光する複数種の蛍光体を含んで構成される。これにより、蛍光体414から出射する光は、第一レーザ光源400からの青色レーザ光を励起光とする緑色から黄色まで範囲の励起光L
11及び蛍光体414に吸収されずに透過した青色のレーザ光L
12が合わされて、白色又は疑似白色の光L
1となる。
【0185】
なお、ここで言う白色光とは、厳密に可視光の全ての波長成分を含むものに限らない。例えば、R、G、及びBなど、特定の波長帯域の光を含むものであればよく、緑色から赤色にかけての波長成分を含む光、又は青色から緑色にかけての波長成分を含む光等も広義に含むものとする。
【0186】
一方、第二レーザ光源402から出射されるレーザ光は、第二光ファイバ412を介して内視鏡302の先端部327に配置された拡散部材416に照射される。拡散部材416は、透光性を有する樹脂材料等を用いることができる。拡散部材416から出射する光は、照射領域内において光量が均一化された狭帯域波長の光L
2となる。
【0187】
図10は光の強度分布を示すグラフである。光源制御部404は、第一レーザ光源400と第二レーザ光源402との光量比を変更する。これにより、光L
1と光L
2との光量比が変更され、光L
1と光L
2との合成光である照射光L
0の波長パターンが変更され、観察モードに応じて異なる波長パターンの照射光L
0を照射することができる。
【0188】
図9に示す内視鏡システム300は、撮像レンズ418、撮像素子328、アナログデジタル変換部420を含む撮像部を備える。
図8に示すように撮像部は、内視鏡302の先端部327に配置される。
【0189】
図9に示す撮像レンズ418は、入射した光を撮像素子328に結像させる。撮像素子328は、受光した光に応じたアナログ信号を生成する。撮像素子328から出力されるアナログ信号は、アナログデジタル変換部420を用いてデジタル信号に変換され、プロセッサ装置312に入力される。
【0190】
プロセッサ装置312は、撮像制御部440、画像処理部442、画像取得部444、及び画像認識部446を備える。
【0191】
撮像制御部440は、光源装置311の光源制御部404、内視鏡302の撮像素子328及びアナログデジタル変換部420、並びにプロセッサ装置312の画像処理部442を制御し、内視鏡システム300を用いた動画及び静止画の撮像を統括制御する。
【0192】
画像処理部442は、内視鏡302のアナログデジタル変換部420から入力されたデジタル信号に画像処理を施し画像を生成する。画像処理部442は、撮像時の照射光の波長パターンに応じた画像処理を施す。
【0193】
画像取得部444は、画像処理部442が生成した画像を取得する。すなわち、画像取得部444は、被験者の体腔内を一定のフレームレートを適用して時系列的に撮像した複数の画像を順次取得する。なお、画像取得部444は、入力部447から入力された画像、又は記憶部468に記憶された画像を取得してもよい。また、不図示のネットワークに接続されたサーバ等の外部装置から画像を取得してもよい。これらの場合の画像も、時系列的に撮像した複数の画像であることが好ましい。
【0194】
画像認識部446は、内視鏡画像学習装置10によって学習された学習モデルを用いて、画像取得部444が取得した画像の画像認識を行う。本実施形態では、画像取得部444が取得した画像から病変を認識する。病変とは、病気が原因のものに限定されず、外観上正常な状態とは異なる状態の領域を含んでいる。
【0195】
病変の一例として、ポリープ、癌、大腸憩室、炎症、治療痕、クリップ箇所、出血点、穿孔、及び血管異型性等が挙げられる。治療痕の一例として、EMR瘢痕及びESD瘢痕等が挙げられる。EMRはEndoscopic Mucosal Resectionの省略語である。ESDはEndoscopic Submucosal Dissectionの省略語である。
【0196】
表示制御部450は、画像処理部442を用いて生成された画像を表示装置313に表示させる。表示制御部450は、画像認識部446を用いて認識した病変を認識可能に画像に重畳表示してもよい。
【0197】
記憶制御部452は、画像処理部442を用いて生成された画像を記憶部468に記憶させる。例えば、静止画の取得指示に従って撮像された画像及び画像を撮像した際の照射光L
0の波長パターンの情報等を記憶部468に記憶させる。
【0198】
記憶部468の一例として、ハードディスク等のストレージ装置が挙げられる。なお、記憶部468は、プロセッサ装置312に内蔵されたものに限定されない。例えば、プロセッサ装置312に接続される不図示の外部記憶装置であってもよい。外部記憶装置は、不図示のネットワークを介して接続されていてもよい。
【0199】
このように構成された内視鏡システム300は、通常は一定のフレームレートで動画撮像を行い、撮像した画像を表示装置313に表示する。また、撮像された動画から、病変を検出し、検出した病変を認識可能に動画に重畳して表示装置313に表示する。
【0200】
内視鏡システム300によれば、内視鏡画像学習装置10によって学習された学習モデルを用いた画像認識部446を適用して内視鏡画像の自動認識を行い、特殊光画像の画像認識を適切に行うことができる。
【0201】
図8から
図10を用いて説明した内視鏡システム300は、通常光画像14a及び特殊光画像16aを取得し得る。
【0202】
[内視鏡システムの変形例]
〔プロセッサ装置の変形例〕
プロセッサ装置312は、画像処理装置314の機能を有してもよい。すなわち、プロセッサ装置312は、画像処理装置314と一体に構成されてもよい。かかる態様では、表示装置313はモニタ装置316と兼用し得る。プロセッサ装置312は入力装置315を接続させる接続端子を備え得る。
【0203】
〔特徴量画像の生成例〕
医用画像として、白色帯域の光、又は白色帯域の光として複数の波長帯域の光を照射して得る通常画像、並びに特定の波長帯域の光を照射して得る特殊光画像の少なくともいずれかに基づく演算を用いて、特徴量画像を生成し得る。
【0204】
[コンピュータを画像処理装置として機能させるプログラムへの適用例]
上述した内視鏡画像学習方法は、コンピュータを用いて、内視鏡画像学習方法における各工程に対応する機能を実現させるプログラムとして構成可能である。例えば、コンピュータに、互いに分光分布が異なる第一画像及び第二画像を取得する画像取得機能、第一画像に画像処理を施して第三画像を生成する画像処理機能、及び複数の第一画像を含む第一画像群、複数の第二画像を含む第二画像群、及び複数の第三画像を含む第三画像群、並びに第一画像群、第二画像群、及び第三画像群のそれぞれの正しい認識結果である正解データを用いて、自動認識に適用する認識器を学習する学習機能を実現させるプログラムであって、画像処理機能は、第一画像の分光分布に含まれる帯域のうち第二画像の対応する帯域と特性が異なる帯域の信号を抑制する画像処理、及び第一画像に含まれる帯域のうち第二画像の対応する帯域と特性が同一の帯域の信号又は類似する帯域の信号を強調する画像処理の少なくともいずれかを施して、第一画像から第三画像を生成するプログラムを実現し得る。
【0205】
上述した内視鏡画像学習機能をコンピュータに実現させるプログラムを、有体物である非一時的な情報記憶媒体である、コンピュータが読取可能な情報記憶媒体に記憶し、情報記憶媒体を通じてプログラムを提供することが可能である。
【0206】
また、非一時的な情報記憶媒体にプログラムを記憶して提供する態様に代えて、ネットワークを介してプログラム信号を提供する態様も可能である。
【0207】
[実施形態及び変形例等の組み合わせについて]
上述した実施形態で説明した構成要素及び変形例で説明した構成要素は、適宜組み合わせて用いることができ、また、一部の構成要素を置き換えることもできる。
【0208】
以上説明した本発明の実施形態は、本発明の趣旨を逸脱しない範囲で、適宜構成要件を変更、追加、削除することが可能である。本発明は以上説明した実施形態に限定されるものではなく、本発明の技術的思想内で当該分野の通常の知識を有する者により、多くの変形が可能である。