(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-20
(45)【発行日】2025-03-03
(54)【発明の名称】内視鏡画像処理装置および内視鏡画像処理方法
(51)【国際特許分類】
A61B 1/045 20060101AFI20250221BHJP
A61B 1/00 20060101ALI20250221BHJP
【FI】
A61B1/045 610
A61B1/045 614
A61B1/00 552
A61B1/045 623
(21)【出願番号】P 2023501930
(86)(22)【出願日】2021-02-25
(86)【国際出願番号】 JP2021007222
(87)【国際公開番号】W WO2022180753
(87)【国際公開日】2022-09-01
【審査請求日】2023-07-12
(73)【特許権者】
【識別番号】304050923
【氏名又は名称】オリンパスメディカルシステムズ株式会社
(74)【代理人】
【識別番号】100105924
【氏名又は名称】森下 賢樹
(74)【代理人】
【識別番号】100109047
【氏名又は名称】村田 雄祐
(74)【代理人】
【識別番号】100109081
【氏名又は名称】三木 友由
(72)【発明者】
【氏名】西村 博一
【審査官】廣崎 拓登
(56)【参考文献】
【文献】国際公開第2019/155617(WO,A1)
【文献】国際公開第2008/155828(WO,A1)
【文献】特開2007-282857(JP,A)
【文献】特開平02-182231(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
A61B 1/00 - 1/32
G02B 23/24 -23/26
(57)【特許請求の範囲】
【請求項1】
内視鏡が撮影した内視鏡画像を取得する画像取得部と、
前記画像取得部が取得した内視鏡画像を、複数の
構造に対応する領域に分割する領域分割部と、
前記画像取得部が取得した内視鏡画像の奥行を示す奥行情報を生成する奥行情報生成部と、
前記領域分割部が領域分割した結果を示す領域情報および前記奥行情報生成部が生成した内視鏡画像の奥行情報にもとづいて、
管腔に対応する領域と、管腔とは異なる構造に対応する領域を、奥行方向の位置関係とともに認識して、内視鏡が進行可能な方向を特定する認識部と、
を備えることを特徴とする内視鏡画像処理装置。
【請求項2】
前記複数の構造の領域の1つは、内視鏡が進行可能な領域であ
り、
前記認識部は、内視鏡が進行可能な管腔に対応する領域より手前側に存在する構造に対応する領域が、内視鏡の進行に対して障害となる構造に対応する領域であることを認識する、
ことを特徴とする請求項1に記載の内視鏡画像処理装置。
【請求項3】
前記認識部は、内視鏡が進行可能な管腔に対応する領域および内視鏡の進行に対して障害となる構造に対応する領域から、内視鏡が進行可能な方向および進行してはいけない方向を特定するものであって、
前記認識部が特定した内視鏡が進行可能な方向および進行してはいけない方向にもとづいて、内視鏡の進行方向に関する情報を生成する動作決定部を、さらに備える、
ことを特徴とする請求項2に記載の内視鏡画像処理装置。
【請求項4】
内視鏡が撮影した内視鏡画像を取得する画像取得部と、
前記画像取得部が取得した内視鏡画像にもとづいて、所定の複数の操作内容の中から1つ以上の操作内容を選択する操作内容選択部と、
前記画像取得部が取得した内視鏡画像を、複数の
構造に対応する領域に分割する領域分割部と、
前記領域分割部が領域分割した結果を示す領域情報にもとづいて、
管腔に対応する領域と、管腔とは異なる構造に対応する領域を認識する認識部と、
前記認識部による認識結果にもとづいて、前記操作内容選択部により選択された操作内容
が適切であるか否かを判断し、適切でないと判断した場合には、前記操作内容選択部により選択された操作内容を変更する操作内容決定部と、
を備えることを特徴とする内視鏡画像処理装置。
【請求項5】
前記操作内容選択部により選択された操作内容が内視鏡を前進させる前進操作である場合、前記操作内容決定部は、
前記操作内容選択部により選択された前進操作が適切でないと判断すると、前進操作を別の操作内容に変更する、
ことを特徴とする請求項4に記載の内視鏡画像処理装置。
【請求項6】
前記操作内容選択部は、過去に撮影された内視鏡画像である学習用画像と前記学習用画像を撮影した内視鏡に対する操作内容を示すラベルとを教師データとして用いた機械学習により生成された1つ以上の操作選択モデルに、前記画像取得部において取得した内視鏡画像から取得される入力データを入力することで、前記1つ以上の操作内容を選択する、
ことを特徴とする請求項4または5に記載の内視鏡画像処理装置。
【請求項7】
前記画像取得部が取得した内視鏡画像の奥行を示す奥行情報を生成する奥行情報生成部を、さらに備え、
前記認識部は、前記領域分割部が領域分割した結果を示す領域情報および前記奥行情報生成部が生成した内視鏡画像の奥行情報にもとづいて、
管腔に対応する領域と、管腔とは異なる構造に対応する領域を、奥行方向の位置関係とともに認識して、内視鏡が進行可能な方向を特定する、
ことを特徴とする請求項4から6のいずれかに記載の内視鏡画像処理装置。
【請求項8】
内視鏡画像処理装置の動作方法であって、
前記内視鏡画像処理装置は、
内視鏡が撮影した内視鏡画像を取得する画像取得部と、
前記画像取得部が取得した内視鏡画像を、複数の領域に分割する領域分割部と、
前記画像取得部が取得した内視鏡画像の奥行を示す奥行情報を生成する奥行情報生成部と、
前記領域分割部が領域分割した結果を示す領域情報および前記奥行情報生成部が生成した内視鏡画像の奥行情報にもとづいて、内視鏡が進行可能な方向を特定する認識部と、を備え、
前記画像取得部が、前記内視鏡が撮影した内視鏡画像を取得する動作と、
前記領域分割部が、取得した内視鏡画像を、複数の
構造に対応する領域に分割する動作と、
前記奥行情報生成部が、取得した内視鏡画像の奥行を示す奥行情報を生成する動作と、
前記認識部が、複数の
構造に対応する領域に分割した結果を示す領域情報および内視鏡画像の奥行情報にもとづいて、
管腔に対応する領域と、管腔とは異なる構造に対応する領域を、奥行方向の位置関係とともに認識して、内視鏡が進行可能な方向を特定する動作と、
を含む、内視鏡画像処理装置の動作方法。
【請求項9】
コンピュータに、
内視鏡が撮影した内視鏡画像を取得する機能と、
取得した内視鏡画像を、複数の
構造に対応する領域に分割する機能と、
取得した内視鏡画像の奥行を示す奥行情報を生成する機能と、
領域分割した結果を示す領域情報および内視鏡画像の奥行情報にもとづいて、
管腔に対応する領域と、管腔とは異なる構造に対応する領域を、奥行方向の位置関係とともに認識して、内視鏡が進行可能な方向を特定する機能と、
を実現させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、内視鏡が撮影した画像を処理する技術に関する。
【背景技術】
【0002】
内視鏡観察では、可撓性を有する細長い挿入部を被検体内に挿入し、被検体内を撮影する。近年、挿入部の操作を自動化する研究が行われており、特許文献1は、上下左右に湾曲可能な湾曲部を設けた電子内視鏡装置において、撮影されている管腔の中心を挿入部の先端部が向くように、湾曲部の湾曲角度を制御する技術を開示する。
【0003】
近年、ディープラーニングに関する技術として、画像から奥行方向の情報を推定する手法が提案されており(非特許文献1)、内視鏡画像から奥行方向の情報を生成する研究も行われている(非特許文献2)。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【文献】Lei He, Guanghui Wang and Zhanyi Hu,“Learning Depth from Single Images with Deep Neural Network Embedding Focal Length”, 27 Mar 2018 <URL:https://arxiv.org/pdf/1803.10039.pdf>
【文献】Faisal Mahmood, Richard Chen, Nicholas J. Durr, “Unsupervised Reverse Domain Adaptation for Synthetic Medical Images via Adversarial Training”, 29 Nov 2017 <URL:https://arxiv.org/pdf/1711.06606.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1では、映像出力信号において最も暗い部分を管腔中心と判断し、内視鏡先端部が当該管腔中心を向くように、湾曲部の湾曲角度を制御する。そのため内視鏡先端部に対して張り出した構造(たとえば襞)により影になっている暗部が管腔中心と判断されて、内視鏡先端部を当該暗部に向けてしまう可能性がある。また管腔中心が正確に特定された場合であっても、内視鏡先端部周辺の状況から、内視鏡先端部を管腔中心に向けて前進させることが好ましくないケースも存在する。
【0007】
本開示は、前述した事情に鑑みてなされたものであり、内視鏡画像にもとづいて内視鏡の動作または操作に関する適切な情報を生成するための技術を提供することを目的としている。
【課題を解決するための手段】
【0008】
上記課題を解決するために、本開示のある態様の内視鏡画像処理装置は、内視鏡が撮影した内視鏡画像を取得する画像取得部と、画像取得部が取得した内視鏡画像を、複数の領域に分割する領域分割部と、画像取得部が取得した内視鏡画像の奥行を示す奥行情報を生成する奥行情報生成部と、領域分割部が領域分割した結果を示す領域情報および奥行情報生成部が生成した内視鏡画像の奥行情報にもとづいて、内視鏡が進行可能な方向を特定する認識部と、を備える。
【0009】
本開示の別の態様の内視鏡画像処理装置は、内視鏡が撮影した内視鏡画像を取得する画像取得部と、画像取得部が取得した内視鏡画像にもとづいて、所定の複数の操作内容の中から1つ以上の操作内容を選択する操作内容選択部と、画像取得部が取得した内視鏡画像を、複数の領域に分割する領域分割部と、領域分割部が領域分割した結果を示す領域情報にもとづいて、内視鏡先端部周辺の状況を認識する認識部と、操作内容選択部により選択された操作内容と、認識部により認識された状況にもとづいて、実施する操作内容を決定する操作内容決定部とを備える。
【0010】
本開示のさらに別の態様の内視鏡画像を処理する方法は、内視鏡が撮影した内視鏡画像を取得し、取得した内視鏡画像を、複数の領域に分割し、取得した内視鏡画像の奥行を示す奥行情報を生成し、領域分割した結果を示す領域情報および内視鏡画像の奥行情報にもとづいて、内視鏡が進行可能な方向を特定する。
【0011】
なお、以上の構成要素の任意の組み合わせ、本開示の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本開示の態様として有効である。
【図面の簡単な説明】
【0012】
【
図1】実施形態の内視鏡システムの構成を示す図である。
【
図2】実施形態の内視鏡システムの機能ブロックを示す図である。
【
図4】実施例1の制御部の機能ブロックを示す図である。
【
図8】領域分割結果画像と奥行推定結果画像とを重ね合わせた重畳画像の例を示す図である。
【
図9】重畳画像における認識結果の例を示す図である。
【
図19】実施例2の制御部の機能ブロックを示す図である。
【
図31】(a)は内視鏡画像の一例を示し、(b)は領域分割結果画像の一例を示す図である。
【
図32】領域分割結果画像を複数の部分領域に分割した状態を示す図である。
【
図33】(a)は内視鏡画像の一例を示し、(b)は領域分割結果画像の一例を示す図である。
【
図34】領域分割結果画像を複数の部分領域に分割した状態を示す図である。
【
図35】(a)は内視鏡画像の一例を示し、(b)は領域分割結果画像の一例を示す図である。
【
図36】領域分割結果画像を複数の部分領域に分割した状態を示す図である。
【
図37】屈曲部の襞エッジの2つの端点と、その中間点を示す図である。
【
図41】奥行推定結果画像の認識例を示す図である。
【発明を実施するための形態】
【0013】
以下、本開示の実施形態について、図面を参照しつつ説明を行う。
図1は、実施形態の内視鏡システム1の構成を示す。内視鏡システム1は内視鏡検査室に設けられ、内視鏡制御装置2、内視鏡10、入力装置50および表示装置60を備える。内視鏡制御装置2は、処理装置20、挿入形状検出装置30および外力情報取得装置40を有し、被検者の体内に挿入された内視鏡10を自動操作する機能を有する。内視鏡10の自動操作は、1つ以上のプロセッサ22および記憶媒体24を備える処理装置20によって実施される。
【0014】
入力装置50は、ユーザにより操作される入力インターフェースであって、ユーザの操作に応じた指示を処理装置20へ出力するように構成されている。入力装置50は、たとえばマウス、キーボード、タッチパネル等のような操作装置を含んでよい。表示装置60は、処理装置20から出力される内視鏡画像等を画面表示する機器であり、液晶ディスプレイや有機ELディスプレイであってよい。
【0015】
内視鏡10は、固体撮像素子(たとえばCCDイメージセンサまたはCMOSイメージセンサ)を含む撮像部を備える。固体撮像素子は入射光を電気信号に変換して、処理装置20に出力する。処理装置20は、固体撮像素子により光電変換された撮像信号に対して、A/D変換、ノイズ除去などの信号処理を施す信号処理部を有し、内視鏡画像を生成する。なお信号処理部は内視鏡10側に設けられて、内視鏡10が内視鏡画像を生成してもよい。処理装置20は、内視鏡10により撮影される映像を表示装置60にリアルタイムで表示させる。
【0016】
内視鏡10は、被検体内に挿入される挿入部11と、挿入部11の基端側に設けられた操作部16と、操作部16から延設されたユニバーサルコード17とを備える。内視鏡10は、ユニバーサルコード17の端部に設けられたスコープコネクタ(不図示)により、処理装置20に対して着脱自在に接続される。
【0017】
細長形状の挿入部11は、硬質の先端部12と、湾曲自在に形成された湾曲部13と、可撓性を有する長尺な可撓管部14とを、先端側から基端側に向けて順に有する。先端部12、湾曲部13および可撓管部14の内部には、複数のソースコイル18が、挿入部11の長手方向に沿って所定の間隔で配置されており、ソースコイル18は、処理装置20から供給されるコイル駆動信号に応じた磁界を発生する。
【0018】
内視鏡10が被検体内に挿入された状態で、医師等のユーザが操作部16のレリーズスイッチを操作すると、処理装置20は内視鏡画像をキャプチャし、画像サーバ(不図示)に送信して記録させる。レリーズスイッチは入力装置50に設けられてもよい。内視鏡10の内部には、処理装置20から供給される照明光を伝送して、被検体内を照明するためのライトガイド(不図示)が設けられ、先端部12には、ライトガイドにより伝送される照明光を被写体へ出射するための照明窓と、被写体を所定の周期で撮影して撮像信号を処理装置20に出力する撮像部が設けられる。
【0019】
実施形態の内視鏡システム1では、処理装置20が内視鏡10を自動操作して、被検体内における内視鏡10の動作を自動制御するが、ユーザが操作部16を把持して、内視鏡10を手動で操作することも可能である。
【0020】
操作部16は、ユーザが内視鏡10を操作するための操作部材を備えてよい。操作部16は、挿入部11の長手軸に対して交差する8方向に湾曲部13を湾曲させるためのアングルノブを少なくとも含む。
以下、内視鏡10の基本操作例を示す。
・挿入部11を前進させるための“前進操作(押し操作)”
・挿入部11を後退させるための“後退操作(引き操作)”
・湾曲部13を湾曲させるための“アングル操作”
・挿入部11を挿入軸周りに回転させるための“捻り操作”
・先端部12の前方へ気体を噴出させるための“送気操作”
・先端部12の前方へ液体を噴出させるための“送水操作”
・先端部12の近傍に存在する組織片等の物体を吸引させるための“吸引操作”
・湾曲部13を複数の方向に湾曲させて先端部12を複数の方向に向け、管腔中心を探索するための“探索操作”
【0021】
なお実施形態において、先端部12の上下方向は、挿入部11の挿入軸に対して直交する方向として設定されるとともに、撮像部に設けられた固体撮像素子の垂直方向に対応する方向として設定される。また先端部12の左右方向は、挿入部11の挿入軸に対して直交する方向として設定されるとともに、撮像部に設けられた固体撮像素子の水平方向に対応する方向として設定される。したがって実施形態においては、先端部12の上下方向と信号処理部220から出力される内視鏡画像の上下方向とが一致し、先端部12の左右方向と当該内視鏡画像の左右方向とが一致する。
【0022】
処理装置20は、挿入形状検出装置30、外力情報取得装置40、入力装置50および表示装置60の各構成に対して着脱自在に接続される。処理装置20は、入力装置50から入力されたユーザによる指示を受け付け、当該指示に対応する処理を実施する。また処理装置20は、内視鏡10から周期的に出力される撮像信号を取得して、内視鏡画像を表示装置60に表示させる。
【0023】
挿入形状検出装置30は、挿入部11に設けられた複数のソースコイル18のそれぞれが発生する磁界を検出し、当該検出した磁界の強度に基づいて複数のソースコイル18のそれぞれの位置を取得する機能をもつ。挿入形状検出装置30は、取得した複数のソースコイル18の位置を示す挿入形状情報を生成し、処理装置20および外力情報取得装置40に出力する。
【0024】
外力情報取得装置40は、外力が加えられていない状態における挿入部11の所定の複数の位置の曲率(または曲率半径)および湾曲角度のデータと、想定されるあらゆる方向から挿入部11の任意の位置に所定の外力を加えた状態で取得した当該所定の複数の位置の曲率(または曲率半径)および湾曲角度のデータとを格納している。外力情報取得装置40は、挿入形状検出装置30から出力される挿入形状情報に基づいて挿入部11に設けられた複数のソースコイル18の位置を特定し、当該複数のソースコイル18のそれぞれの位置における曲率(または曲率半径)および湾曲角度を取得する。外力情報取得装置40は、取得した曲率(または曲率半径)および湾曲角度と、予め格納している各種データとから、当該複数のソースコイル18のそれぞれの位置における外力の大きさ及び方向を示す外力情報を取得してよい。外力情報取得装置40は、取得した外力情報を処理装置20に出力する。
【0025】
図2は、実施形態に係る内視鏡システム1の機能ブロックを示す。内視鏡システム1は、内視鏡10、処理装置20、挿入形状検出装置30、外力情報取得装置40、入力装置50および表示装置60を備える。
【0026】
内視鏡10は、ソースコイル18、撮像部110、進退機構141、湾曲機構142、AWS機構143および回転機構144を備える。進退機構141、湾曲機構142、AWS機構143および回転機構144は、内視鏡10における動作機構を構成する。
【0027】
撮像部110は、照明光により照明された被写体からの戻り光が入射される観察窓と、当該戻り光を撮影して撮像信号を出力する固体撮像素子(たとえばCCDイメージセンサまたはCMOSイメージセンサ)とを有する。
【0028】
進退機構141は、挿入部11を前進および後退させる動作を実現するための機構を有する。たとえば進退機構141は、挿入部11を挟んで対向する位置に配置された一対のローラと、当該一対のローラを回転させるモータとを有して構成されてよい。進退機構141は、処理装置20から出力される進退制御信号に応じてモータを駆動して、一対のローラを回転させることにより、挿入部11を前進させる動作および挿入部11を後退させる動作のいずれか一方を実行する。
【0029】
湾曲機構142は、湾曲部13を曲げる動作を実現するための機構を有する。たとえば湾曲機構142は、湾曲部13に設けられた複数の湾曲駒と、当該複数の湾曲駒に連結された複数のワイヤと、当該複数のワイヤを牽引するためモータとを有して構成されてよい。湾曲機構142は、処理装置20から出力される湾曲制御信号に応じてモータを駆動して、複数のワイヤの牽引量を変化させることにより、挿入部11の長手軸に対して交差する8方向のいずれかに湾曲部13を湾曲させることができる。
【0030】
AWS(Air feeding, Water feeding, and Suction)機構143は、送気動作、送水動作および吸引動作を実現するための機構を有する。たとえばAWS機構143は、挿入部11、操作部16およびユニバーサルコード17の内部に設けられた送気送水管路および吸引管路の2つの管路と、当該2つの管路のうちの一方を開放しつつ他方を閉塞する動作を行う電磁弁とを有して構成されてよい。
【0031】
AWS機構143は、処理装置20から出力されるAWS制御信号に応じて送気送水管路を開放するように電磁弁を動作した場合、処理装置20から供給される水及び空気の少なくとも一方を含む流体を当該送気送水管路に流通させ、先端部12に形成された排出口から当該流体を排出させる。またAWS機構143は、処理装置20から出力されるAWS制御信号に応じて吸引管路を開放するように電磁弁を動作した場合、処理装置20において発生した吸引力を当該吸引管路に作用し、先端部12に形成された吸引口付近に存在する物体を当該吸引力により吸引する。
【0032】
回転機構144は、挿入部11の挿入軸を回転軸として、挿入部11を回転する動作を実現するための機構を有する。たとえば回転機構144は、可撓管部14の基端側において挿入部11を回転可能に支持する支持部材と、当該支持部材を回転させるためのモータとを有して構成されてよい。回転機構144は、処理装置20から出力される回転制御信号に応じてモータを駆動して、支持部材を回転させることにより、挿入部11を挿入軸周りに回転させる。
【0033】
挿入形状検出装置30は、受信アンテナ310および挿入形状情報取得部320を備える。受信アンテナ310は、複数のソースコイル18のそれぞれが発生する磁界を3次元的に検出する複数のコイルを有して構成されている。受信アンテナ310は、複数のソースコイル18のそれぞれが発生する磁界を検出すると、当該検出した磁界の強度に応じた磁界検出信号を挿入形状情報取得部320に出力する。
【0034】
挿入形状情報取得部320は、受信アンテナ310から出力される磁界検出信号に基づき、複数のソースコイル18のそれぞれの位置を取得する。具体的に挿入形状情報取得部320は、複数のソースコイル18の位置として、被検体の所定の位置(肛門等)を原点または基準点とする仮想的な空間座標系における複数の3次元座標値を取得する。挿入形状情報取得部320は、複数のソースコイル18の3次元座標値を含む挿入形状情報を生成し、制御部260および外力情報取得装置40に出力する。
【0035】
外力情報取得装置40は、挿入形状検出装置30から出力される挿入形状情報に基づいて、当該複数のソースコイル18のそれぞれの位置における曲率(または曲率半径)および湾曲角度を取得する。外力情報取得装置40は、取得した曲率(または曲率半径)および湾曲角度と、予め格納している各種データとから、当該複数のソースコイル18のそれぞれの位置における外力の大きさ及び方向を示す外力情報を取得してよい。外力情報取得装置40は、取得した外力情報を制御部260へ出力する。
【0036】
処理装置20は、光源部210、信号処理部220、コイル駆動信号生成部230、駆動部240、表示処理部250および制御部260を備える。実施形態において処理装置20は、内視鏡画像を処理する画像処理装置としての役割をもつ。具体的に処理装置20は、内視鏡画像にもとづいて内視鏡10の動作または操作に関する情報を生成し、内視鏡10の動作を自動制御する。
【0037】
光源部210は、被検体内を照明するための照明光を生成して、当該照明光を内視鏡10に供給する。光源部210は、1つ以上のLEDまたは1つ以上のランプを光源として有してよい。光源部210は、制御部260から供給される動作制御信号に応じて照明光の光量を変化させてよい。
【0038】
信号処理部220は信号処理回路を有し、内視鏡10から出力される撮像信号に対して所定の処理を施して内視鏡画像を生成し、当該生成した内視鏡画像を表示処理部250および制御部260へ出力する。
【0039】
コイル駆動信号生成部230は、ソースコイル18を駆動させるためのコイル駆動信号を生成する。コイル駆動信号生成部230はドライブ回路を有し、制御部260から供給される動作制御信号にもとづいてコイル駆動信号を生成して、ソースコイル18に供給する。
【0040】
駆動部240は、制御部260から供給される動作制御信号に基づき、内視鏡10の基本操作に対応する制御信号を生成して、内視鏡10の動作機構を駆動する。具体的に駆動部240は、進退機構141による進退動作、湾曲機構142による湾曲動作、AWS機構143によるAWS動作および回転機構144による回転動作のうちの少なくとも1つの動作を制御する。駆動部240は、進退駆動部241、湾曲駆動部242、AWS駆動部243および回転駆動部244を備える。
【0041】
進退駆動部241は、制御部260から供給される動作制御信号に基づき、進退機構141の動作を制御するための進退制御信号を生成して出力する。具体的に進退駆動部241は、制御部260から供給される動作制御信号に基づき、進退機構141に設けられたモータの回転を制御するための進退制御信号を生成して出力する。
【0042】
湾曲駆動部242は、制御部260から供給される動作制御信号に基づき、湾曲機構142の動作を制御するための湾曲制御信号を生成して出力する。具体的に湾曲駆動部242は、制御部260から供給される動作制御信号に基づき、湾曲機構142に設けられたモータの回転を制御するための湾曲制御信号を生成して出力する。
【0043】
AWS駆動部243は、制御部260から供給される動作制御信号に基づき、AWS機構143の動作を制御するためのAWS制御信号を生成して出力する。具体的にAWS駆動部243は、制御部260から供給される動作制御信号に基づいて、AWS機構143に設けられた電磁弁の動作状態を制御するためのAWS制御信号を生成して出力する。
【0044】
回転駆動部244は、制御部260から供給される動作制御信号に基づき、回転機構144の動作を制御するための回転制御信号を生成して出力する。具体的に回転駆動部244は、制御部260から供給される動作制御信号に基づき、回転機構144に設けられたモータの回転を制御するための回転制御信号を生成して出力する。
【0045】
表示処理部250は、信号処理部220から出力される内視鏡画像を含む表示画像を生成し、当該生成した表示画像を表示装置60に表示させる。なお表示処理部250は、制御部260が内視鏡画像を処理した結果画像を表示装置60に表示させてもよい。
【0046】
制御部260は、内視鏡10の手動挿入モードがオンに設定されている場合に、操作部16および入力装置50からの指示等に応じた動作を内視鏡10に行わせるための動作制御信号を生成して、駆動部240に出力する機能を有する。また制御部260は、内視鏡10の自動挿入モードがオンに設定されている場合に、信号処理部220で生成された内視鏡画像に基づいて、内視鏡10の動作を自動制御する機能を有する。以下、実施形態における自動操作制御について説明する前に、医師による内視鏡の手動操作について説明する。
【0047】
手動挿入モードにおいて、医師は様々な判断にもとづいて内視鏡を操作する。医師は内視鏡画像を見て、たとえば、内視鏡先端部の近くに存在する障害物を回避する、粘膜表面に内視鏡先端部を接触させない、腸管に負荷を与えない、より先の経路を想定して今回の経路を決める等のことを瞬時に判断して、内視鏡を操作している。
【0048】
図3(a)は、内視鏡画像の一例を示す。内視鏡画像70aは、ゴムで形成した腸管(ゴム腸管)を内視鏡で撮影した画像である。医師は、内視鏡画像70aを見て、管腔(つまりは管腔の中心、換言すると管腔方向)が画像中央に存在することを確認すると、内視鏡先端部を前進させてよいことを判断し、内視鏡先端部を前方に進行させる。
【0049】
図3(b)は、内視鏡画像の別の例を示す。内視鏡画像70bも同じく、ゴム腸管を撮影した画像である。医師は、内視鏡画像70bを見て、管腔中心が画像上部に存在することを確認し、この状態で内視鏡先端部を前進させると画像中央部の襞に接触することを判断する。そこで医師は、湾曲部13を上方に湾曲させるようにアングルノブを操作して、管腔中心が画像中央に撮影されるようにする。管腔中心が画像中央で撮影されると、
図2(a)に示す内視鏡画像70aと同様の状態になるため、医師は、内視鏡先端部を前進させてよいことを判断し、内視鏡先端部を前方に進行させる。
【0050】
以上の判断および操作は、医師であればこそ簡単に実施できるのであり、これを装置で実現しようとすると、内視鏡画像から管腔中心を特定しつつ、内視鏡先端部周辺の状況を認識して把握する必要がある。そこで実施形態では、内視鏡画像にもとづいて、内視鏡10の動作を適切に決定するための技術を提案する。
【0051】
<実施例1>
図4は、実施例1における制御部260の機能ブロックを示す。制御部260は、画像取得部261、領域分割部262、奥行情報生成部263、認識部264、動作決定部265、動作制御部266および駆動判定部267を備える。
【0052】
図4に示す制御部260は、ハードウエア的には、1以上のプロセッサ22、メモリ、補助記憶装置、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。たとえば制御部260の少なくとも一部の機能を実行させるためのプログラムが記憶媒体24に記憶されており、プロセッサ22が、記憶媒体24からプログラムをメモリにロードして、制御部260の各機能を実現してもよい。
【0053】
画像取得部261は、信号処理部220から、被検体内に挿入されている内視鏡10が撮影した内視鏡画像を取得する。内視鏡10の撮像部110は、所定の周期(たとえば30フレーム/秒)で撮像信号を信号処理部220に供給し、信号処理部220は、撮像信号から内視鏡画像を生成して、画像取得部261に供給する。したがって画像取得部261は、所定の周期で内視鏡画像を取得する。画像取得部261は、取得した内視鏡画像を、領域分割部262および奥行情報生成部263に供給する。
【0054】
(内視鏡画像の領域分割処理)
領域分割部262は、画像取得部261が取得した内視鏡画像を、複数の領域に分割する機能をもつ。具体的に領域分割部262は、内視鏡画像内の各画素にラベルを付けるセマンティックセグメンテーションを実行して、内視鏡画像を所定の複数の構造に対応する領域に分割する。領域分割部262は、分割したい種別(クラス)の構造をもつ領域を定義し、各種構造の画素にラベル付けを行った領域分割結果を生成する。セマンティックセグメンテーションは、FCN(Fully Convolutional Neural Network)やBiSeNet(Bilateral Segmentation Network)等を用いて実現されるが、実施例1における領域分割部262はFCNを利用して、セマンティックセグメンテーションを実行してよい。
【0055】
分割する領域の種別(クラス)として、0~255までのラベル値が用意されてよい。実施例1では、以下の構造に対して、ラベル値が割り当てられる。
ラベル値0:背景画素
ラベル値1:通常管腔
ラベル値2:襞エッジ(輪郭)
ラベル値3:屈曲部の管腔
ラベル値4:屈曲部の襞エッジ
を設定する。
【0056】
セマンティックセグメンテーションにおいて、ラベル値0は一般に“抽出しない領域”を意味するが、実施例1で定義されるラベル値0は、粘膜表面を意味する。ラベル値1を割り当てられる“通常管腔”は、内視鏡画像において内視鏡が進行可能な構造を意味し、内視鏡先端部の進行方向を示す構造として定義される。具体的に“通常管腔”として定義される構造は、管腔の延伸方向を表現する。なお、これらのクラスに加えて、大腸内視鏡検査で出現する残渣、ポリープ、血管等の構造にクラスを設定し、それらのクラスに、それぞれラベル値を割り当ててもよい。
【0057】
(内視鏡画像の奥行情報生成処理)
奥行情報生成部263は、画像取得部261が取得した内視鏡画像の奥行を示す情報を生成する機能をもつ。画像に含まれる画素ないしはブロックの奥行を推定する手法は従来より様々提案されている。非特許文献2は、距離情報の教師データとして、CTコロノグラフィによる3次元情報を利用しているが、奥行情報生成部263は、非特許文献2に開示された技術を利用して、内視鏡画像の各画素の奥行を示す情報を生成してよい。
【0058】
なお奥行情報生成部263は、奥行推定処理のための学習モデルを、簡易に作成した教師データをもとに生成してもよい。たとえば教師データの作成者は、目視により画像の各領域に対して奥行方向の位置関係に応じたラベル値0~4の各段階を指定することで、教師データを作成してよい。この場合、人間の感覚に基づく相対的な奥行方向の位置関係が得られる。通常の内視鏡画像から絶対的な数値としての距離情報を得ることは容易でないが、内視鏡画像を見ることに熟練した者が感覚的に近接ないし遠景であることを判断することは容易であり、また実際に医師は画像から得られる感覚的な距離情報を用いて挿入操作を実施しているため、このように作成した教師データの信頼性は高く、正確な奥行を推定可能な学習モデルを生成することが可能となる。
【0059】
奥行情報生成部263による奥行推定手法においては、内視鏡先端部12からの距離範囲に応じたクラスを設定する。実施例1では、各距離範囲に対して、ラベル値が割り当てられる。
ラベル値0: 奥行<第1距離
ラベル値1:第1距離≦奥行<第2距離
ラベル値2:第2距離≦奥行<第3距離
ラベル値3:第3距離≦奥行<第4距離
ラベル値4:第4距離≦奥行
ラベル値0は、先端部12からの距離が最も近い領域であり、ラベル値4は、先端部12からの距離が最も遠い領域であることを意味する。
【0060】
図5は、内視鏡画像の一例を示す。内視鏡画像は720×480のサイズをもち、RGBの各画素が8ビットで表現される。この内視鏡画像において管腔は奥行方向に直線的に撮影されており、複数の襞が管腔を囲んでいる。このうち右下に撮影されている襞は、内視鏡先端部に近い距離に存在している。
【0061】
画像取得部261は信号処理部220から、内視鏡10が撮影した内視鏡画像を取得すると、領域分割部262および奥行情報生成部263に供給する。領域分割部262は、セマンティックセグメンテーションを実行して、内視鏡画像を複数の領域に分割する。同時に奥行情報生成部263は、奥行推定処理を実行して、内視鏡画像の奥行を示す奥行情報を生成する。
【0062】
図6は、領域分割部262による領域分割結果の例を示す。領域分割部262は、内視鏡画像を複数の領域に分割し、領域分割した結果を示す領域情報を導出する。ここで領域情報は、構造に関する各画素のラベル値として導出されてよい。実施例1で領域分割部262は、導出したラベル値を用いて、領域分割結果画像を生成している。後述するが、領域分割結果画像は、表示装置60に表示されて、ユーザに提示されてよい。
【0063】
領域分割部262は、分割領域のラベル値に対応する(R,G,B)の画素値を、以下のように設定してよい。なお奥行情報に関するラベル値と区別するために、以下では、分割領域のラベル値0~4を、ラベル値a0~a4と表現する。
ラベル値a0(背景画素)→(0,0,0)
ラベル値a1(通常管腔)→(128,0,0)
ラベル値a2(襞エッジ)→(0,0,128)
ラベル値a3(屈曲部の管腔)→(192,0,0)
ラベル値a4(屈曲部の襞エッジ)→(128,128,128)
【0064】
領域分割部262は、このように画素値を設定することで、大部分を占める粘膜表面(ラベル値e0)が黒塗りされ、抽出された構造部分が色塗りされた領域分割結果画像を生成する。領域分割部262は、領域分割結果画像を、領域分割した結果を示す領域情報として認識部264に供給する。
図6に示す例では、同心円状の襞エッジの領域と、通常管腔の領域とが、ユーザが視認できるように表示されている。なお別の例では、領域分割部262は、各画素のラベル値を、領域分割した結果を示す領域情報として認識部264に供給してもよい。
【0065】
図7は、奥行情報生成部263による奥行情報推定結果の例を示す。奥行情報生成部263は、内視鏡画像に対して奥行推定処理を実行して、内視鏡画像の奥行を示す奥行情報を生成する。ここで奥行情報は、奥行(内視鏡先端部からの距離)に関する各画素のラベル値として導出されてよい。実施例1で奥行情報生成部263は、導出したラベル値を用いて、奥行推定結果画像を生成している。後述するが、奥行推定結果画像は、領域分割結果画像とともに表示装置60に表示されて、ユーザに提示されてよい。
【0066】
奥行情報生成部263は、奥行の段階を表現するラベル値に対応する(R,G,B)の画素値を、以下のように設定してよい。なお分割領域に関するラベル値と区別するために、以下では、奥行情報のラベル値0~4を、ラベル値d0~d4と表現する。
ラベル値d0(第1距離未満)→(40,0,0)
ラベル値d1(第1距離以上、第2距離未満)→(80,0,0)
ラベル値d2(第2距離以上、第3距離未満)→(120,0,0)
ラベル値d3(第3距離以上、第4距離未満)→(160,0,0)
ラベル値d4(第4距離以上)→(200,0,0)
【0067】
奥行情報生成部263は、このように画素値を設定することで、深い領域ほど、明るい赤色を付けられた奥行推定結果画像を生成する。奥行情報生成部263は、奥行推定結果画像を、内視鏡画像の奥行情報として認識部264に供給する。なお別の例では、奥行情報生成部263は、各画素のラベル値を、内視鏡画像の奥行情報として認識部264に供給してもよい。
【0068】
認識部264は、領域分割部262から内視鏡画像の領域情報を受け取り、奥行情報生成部263から内視鏡画像の奥行情報を受け取って、内視鏡先端部周辺の状況を認識する。具体的に認識部264は、領域情報と奥行情報とを用いて、内視鏡画像に含まれる管腔方向、襞等の構造を、奥行方向の位置関係とともに認識する。
【0069】
図8は、領域分割結果画像と奥行推定結果画像とを重ね合わせた重畳画像の例を示す。領域分割結果画像および奥行推定結果画像が高精度に生成されている場合、領域分割結果画像において抽出される襞エッジと、奥行推定結果画像に示される境界線は、基本的に一致する。また領域分割結果画像において抽出される通常管腔領域と、奥行推定結果画像に示される最深部領域も、基本的に一致する。認識部264は重畳画像から、領域分割部262により分割された各種構造に対応する領域の各々が奥行方向においてどの程度の深さに位置しているかを認識できる。
【0070】
次に、奥行方向の位置関係をともなう各種構造の認識について説明する。
図9は、
図8に示した重畳画像における認識結果の例を示す。
図9に示す重畳画像では、奥行方向に関する情報として、領域にラベル値d0~d4を付加している。また領域分割部262により襞エッジとして抽出された領域(ラベル値a2)に、e1~e5の符号を割り振っている。
【0071】
図6に示す領域分割結果画像を参照すると、襞エッジe2、e3、e4は連続しているため、領域分割結果画像の情報のみにもとづけば、襞エッジe2、e3、e4に対して、1つの符号が割り振られる。しかしながら認識部264は、内視鏡画像の奥行情報を参照して、各画素の奥行に関するラベル値d0~d4を特定することで、襞エッジe2、e3、e4が互いに異なるものであることを認識できる。なお襞エッジが奥行に関する異なるラベル値の境界に存在する場合、認識部264は、より浅い方のラベル値を適用することが好ましい。
【0072】
任意の画素p(x,y)の状況を認識する手法を説明する。なお0≦x<720,0≦y<480である。画素p(x,y)について、領域分割に関するラベル値pa(x,y)が“a2”であり、奥行に関するラベル値pd(x,y)が“d0”であったとする。ここでラベル値a2は、襞エッジであることを示し、ラベル値d0は、奥行方向において内視鏡先端部に最も近接していると推定された領域であることを示す。認識部264は、このような画素pが襞エッジe1またはe3を構成する画素であることを認識する。また認識部264は、領域d0が、襞エッジe1およびe3を含んでいることから、襞を含む粘膜表面を撮影した領域と認識する。襞エッジe2、e4、e5の奥行に関するラベル値pd(x,y)は、それぞれ“d1”、“d2”、“d3”であり、したがって認識部264は、領域d1、d2およびd3も、深さの異なる襞を含む粘膜表面を撮影した領域と認識する。
【0073】
認識部264は、最深部領域を示すラベル値d4をもつ画素p(x,y)を特定して、当該画素p(x,y)に割り当てられた領域分割に関するラベル値pa(x,y)を参照する。このときラベル値d4をもつ領域と、ラベル値a1をもつ領域とが実質的に一致していれば、認識部264は、ラベル値d4およびラベル値a1をもつ領域が、最深部であるとともに、進行方向を示す構造を示すことを認識する。またラベル値d4の最深部領域の境界となる襞エッジe3が、ラベル値d0の最も浅い領域に属していることから、認識部264は、画像右下に内視鏡先端部の前進動作に対して障害となり得る襞が存在することを認識する。つまり認識部264は、画像右下に示す方向が、内視鏡が進行してはいけない方向であることを認識する。
【0074】
以上のように認識部264は、領域分割部262が領域分割した結果を示す領域情報および奥行情報生成部263が生成した内視鏡画像の奥行情報にもとづいて、内視鏡画像に含まれる各種構造を、奥行方向の位置関係とともに認識する。これにより認識部264は、内視鏡が進行可能な方向および進行してはいけない方向を特定するとともに、内視鏡が進行したときに障害となりうる構造の存在位置を特定する。認識部264は、これらの認識結果を示す情報を、動作決定部265に供給する。
【0075】
動作決定部265は、認識部264における認識結果にもとづいて、内視鏡10の進行方向に関する情報を生成する。具体的に動作決定部265は、内視鏡先端部を進行可能な方向および進行してはいけない方向から、内視鏡10の進行方向に関する情報を生成してよい。この例で動作決定部265は、最深部の通常管腔領域よりも手前側に存在する襞を避けて先端部12を上向きに前進させるように、内視鏡10の進行方向に関する情報を生成してよい。
【0076】
図10は、内視鏡画像の別の例を示す。この内視鏡画像においては、大腸の屈曲部が撮影されている。画像取得部261は信号処理部220から、内視鏡10が撮影した内視鏡画像を取得すると、領域分割部262および奥行情報生成部263に供給する。領域分割部262は、内視鏡画像を複数の領域に分割して、領域分割結果画像を生成する。同時に奥行情報生成部263は、奥行推定処理を実行して、内視鏡画像の奥行を示す奥行情報を生成し、奥行情報にもとづいて奥行推定結果画像を生成する。
【0077】
図11は、領域分割部262による領域分割結果の例を示す。領域分割部262は、内視鏡画像を複数の領域に分割し、領域分割した結果を示す領域情報を導出する。領域情報は、構造に関する各画素のラベル値pa(x,y)として導出され、領域分割部262は、導出したラベル値を用いて、領域分割結果画像を生成する。この領域分割結果画像には、中央付近で縦方向に延びる屈曲部の襞エッジの領域と、屈曲部の襞エッジの上部に沿って抽出された屈曲部の管腔の領域が含まれる。領域分割部262は、領域分割結果画像を、領域分割した結果を示す領域情報として認識部264に供給する。
【0078】
図12は、奥行情報生成部263による奥行情報推定結果の例を示す。奥行情報生成部263は、内視鏡画像に対して奥行推定処理を実行して、内視鏡画像の奥行を示す奥行情報を生成する。奥行情報は、奥行に関する各画素のラベル値pd(x,y)として導出され、奥行情報生成部263は、導出したラベル値を用いて、奥行推定結果画像を生成する。奥行情報生成部263は、奥行推定結果画像を、内視鏡画像の奥行情報として認識部264に供給する。
【0079】
認識部264は、領域分割部262から内視鏡画像の領域情報を受け取り、奥行情報生成部263から内視鏡画像の奥行情報を受け取って、内視鏡先端部周辺の状況を認識する。具体的に認識部264は、領域情報と奥行情報とを用いて、内視鏡画像に含まれる管腔方向、襞等の構造を、奥行方向の位置関係とともに認識する。これにより認識部264は、内視鏡が前進したときに障害となりうる構造の存在位置を特定し、内視鏡が進行可能な方向および進行してはいけない方向を特定する。この例で認識部264は、画像左側が進行可能な方向であり、画像右側が進行してはいけない方向であることを認識するとともに、管腔が右方向に続いていることを認識する。認識部264は、認識結果を動作決定部265に供給し、動作決定部265は、内視鏡が進行可能な方向および進行してはいけない方向にもとづいて、内視鏡の進行方向に関する情報を生成する。具体的に動作決定部265は、内視鏡先端部を左に向けて、向けた方向に前進させるように、内視鏡先端部の進行方向を決定する。
【0080】
図13は、内視鏡画像の別の例を示す。この内視鏡画像においては、右側に大きな襞が撮影されている。画像取得部261は信号処理部220から内視鏡画像を取得すると、領域分割部262および奥行情報生成部263に供給する。
【0081】
図14は、領域分割部262による領域分割結果の例を示す。領域分割部262は、内視鏡画像を複数の領域に分割し、領域分割した結果を示す領域情報を導出して、領域分割結果画像を生成する。この領域分割結果画像には、襞エッジの領域と、通常管腔の領域が含まれる。領域分割部262は、領域分割結果画像を、領域分割した結果を示す領域情報として認識部264に供給する。
【0082】
図15は、奥行情報生成部263による奥行情報推定結果の例を示す。奥行情報生成部263は、内視鏡画像に対して奥行推定処理を実行して、内視鏡画像の奥行を示す奥行情報を生成し、奥行推定結果画像を生成する。奥行情報生成部263は、奥行推定結果画像を、内視鏡画像の奥行情報として認識部264に供給する。
【0083】
認識部264は、領域分割部262から内視鏡画像の領域情報を受け取り、奥行情報生成部263から内視鏡画像の奥行情報を受け取って、内視鏡先端部周辺の状況を認識する。この例で認識部264は、画像の右側に大きな襞が存在し、内視鏡の前進動作に障害となることを認識して、画像左側が進行可能な方向であり、画像右側が進行してはいけない方向であることを認識する。認識部264は、認識結果を動作決定部265に供給し、動作決定部265は、内視鏡が進行可能な方向および進行してはいけない方向にもとづいて、内視鏡の進行方向に関する情報を生成する。具体的に動作決定部265は、内視鏡先端部を左に向けて、向けた方向に前進させるように、内視鏡先端部の進行方向を決定する。
【0084】
図16は、内視鏡画像の別の例を示す。この内視鏡画像においては、上側から左側にかけて大きな襞が撮影されている。画像取得部261は信号処理部220から内視鏡画像を取得すると、領域分割部262および奥行情報生成部263に供給する。
【0085】
図17は、領域分割部262による領域分割結果の例を示す。領域分割部262は、内視鏡画像を複数の領域に分割し、領域分割した結果を示す領域情報を導出して、領域分割結果画像を生成する。この領域分割結果画像には、襞エッジの領域と、通常管腔の領域が含まれる。領域分割部262は、領域分割結果画像を、領域分割した結果を示す領域情報として認識部264に供給する。
【0086】
図18は、奥行情報生成部263による奥行情報推定結果の例を示す。奥行情報生成部263は、内視鏡画像に対して奥行推定処理を実行して、内視鏡画像の奥行を示す奥行情報を生成し、奥行推定結果画像を生成する。奥行情報生成部263は、奥行推定結果画像を、内視鏡画像の奥行情報として認識部264に供給する。
【0087】
認識部264は、領域分割部262から内視鏡画像の領域情報を受け取り、奥行情報生成部263から内視鏡画像の奥行情報を受け取って、内視鏡先端部周辺の状況を認識する。
図17に示す領域分割結果画像と
図18に示す奥行推定結果画像とを比較すると、領域分割結果画像において通常管腔(ラベル値a1)として抽出された領域が、奥行推定結果画像においては、ラベル値d3とd4の領域にまたがっている。そこで認識部264は、領域分割結果画像におけるラベル値a1の領域と、奥行推定結果画像におけるラベル値d4の領域との重複領域を、内視鏡が進行可能な領域として特定する。認識部264は、認識結果を動作決定部265に供給し、動作決定部265は、内視鏡の進行方向に関する情報を生成する。具体的に動作決定部265は、内視鏡先端部を右に向けて、向けた方向に前進させるように、内視鏡先端部の進行方向を決定する。
【0088】
実施例1では、画像取得部261が内視鏡画像を取得するタイミング毎に、動作決定部265が、内視鏡10の動作内容を決定し、動作制御部266が、決定した動作内容に応じた動作制御信号を生成して、駆動部240に供給してよい。
【0089】
なお別のタイミング例として、駆動部240が、動作制御部266による動作制御信号にもとづいて内視鏡10の動作機構を駆動し、その駆動を終了したタイミングで、動作決定部265が、内視鏡10の動作内容を決定し、動作制御部266が動作制御信号を生成してもよい。
【0090】
たとえば駆動部240が内視鏡10の動作機構を駆動しているとき、駆動判定部267は、駆動部240が動作機構を駆動中であることを判定する。駆動部240による駆動が終了すると、駆動判定部267は、動作機構の駆動が終了したことを判定する。このとき駆動判定部267は、認識部264に新たな動作内容を決定するべきであることを通知する。認識部264は、内視鏡画像に含まれる各種構造の認識結果を生成し、動作決定部265は、認識結果にもとづいて内視鏡10の動作内容を決定する。動作決定部265は、動作機構の駆動が完了した後または完了直前に、内視鏡10の動作内容を決定してよい。
【0091】
実施例1において、領域分割部262による領域分割処理結果および奥行情報生成部263による奥行推定処理結果は、周波数成分情報や画素値の明るさ情報等を用いた各種の公知技術により補正されたうえで、認識部264に提供されてもよい。
【0092】
動作制御部266は、動作決定部265において決定した動作内容に基づいて、内視鏡10の動作を制御する機能を有する。動作制御部266は、挿入形状検出装置30から出力される挿入形状情報と、外力情報取得装置40から出力される外力情報のうちの少なくとも1つに基づき、決定された動作内容における動作量を設定してもよい。動作制御部266は、動作決定部265により決定された動作内容と、当該動作内容における動作量とに応じた動作制御信号を生成し、駆動部240に出力する。
【0093】
実施例1の作用について説明する。以下においては、肛門から大腸の腸管内に挿入された挿入部11の挿入操作に係る制御について説明する。
ユーザは、内視鏡システム1の各部を接続して電源を投入した後、内視鏡10の先端部12を被検体の肛門に挿入する。このときユーザは、入力装置50を操作して内視鏡10の自動挿入モードをオンに設定し、これにより処理装置20は、内視鏡10の自動操作機能を実行する。
【0094】
光源部210は、内視鏡10に照明光を供給し、撮像部110は、当該照明光が照射された被写体を所定の周期で撮像して、撮像信号を処理装置20に送信する。信号処理部220は、撮像信号から内視鏡画像を生成して、表示処理部250および画像取得部261に供給する。
【0095】
コイル駆動信号生成部230はコイル駆動信号を複数のソースコイル18に供給し、受信アンテナ310は、複数のソースコイル18のそれぞれで発生した磁界を検出して、挿入形状情報取得部320が、挿入部11の挿入形状情報を生成する。挿入形状情報は、制御部260および外力情報取得装置40に供給される。外力情報取得装置40は、挿入形状情報から、複数のソースコイル18のそれぞれの位置における外力情報を生成して、制御部260に供給する。
【0096】
領域分割部262は、画像取得部261が取得した内視鏡画像を、複数の領域に分割して、内視鏡画像の領域情報を生成する。奥行情報生成部263は、画像取得部261が取得した内視鏡画像の奥行を示す情報を生成する。認識部264は、領域分割部262から内視鏡画像の領域情報を受け取り、奥行情報生成部263から内視鏡画像の奥行情報を受け取って、内視鏡先端部周辺の状況を認識する。認識部264は、内視鏡画像の領域情報と、内視鏡画像の奥行情報とを用いて、内視鏡画像に含まれる管腔方向、襞等の構造を、奥行方向の位置関係とともに認識する。
【0097】
動作決定部265は、認識部264が認識した内視鏡先端部周辺の状況にもとづいて、内視鏡の進行方向に関する情報を生成する。具体的に動作決定部265は、認識部264が認識した、内視鏡先端部が進行可能な方向および進行してはいけない方向にもとづいて、内視鏡の進行方向に関する情報を生成して、内視鏡先端部の動作内容を決定する。
【0098】
動作制御部266は、動作決定部265において決定した動作内容に基づいて、内視鏡10の動作を制御する動作制御信号を生成する。このとき動作制御部266は、挿入形状検出装置30から出力される挿入形状情報と、外力情報取得装置40から出力される外力情報の少なくとも1つに基づき、決定した動作内容における動作量を設定するための処理を行ってよい。動作制御部266は、決定した動作内容と、設定した動作量とに応じた動作制御信号を生成して駆動部240へ出力する。
【0099】
動作制御部266は、動作決定部265において決定した操作内容に基づいて、内視鏡10の動作を制御する動作制御信号を生成する。このとき動作制御部266は、挿入形状検出装置30から出力される挿入形状情報と、外力情報取得装置40から出力される外力情報の少なくとも1つに基づき、決定した操作内容における動作量を設定するための処理を行ってよい。動作制御部266は、決定した操作内容と、設定した動作量とに応じた動作制御を行うための動作制御信号を生成して駆動部240へ出力する。
【0100】
動作制御部266は、動作決定部265により決定された動作内容がアングル操作である場合に、当該操作内容における動作量として、湾曲部13の湾曲角度CDSを設定する。そして動作制御部266は、湾曲部13を湾曲角度CDSだけ湾曲させる制御を実行させる動作制御信号を生成して、駆動部240へ出力する。
【0101】
動作制御部266は、動作決定部265により決定された動作内容が前進操作である場合に、当該操作内容における動作量として、挿入部11の移動量MESを設定する。そして動作制御部266は、挿入部11を移動量MESだけ前進させる制御を実行させる動作制御信号を生成して、駆動部240へ出力する。なお移動量MESは、腸管内に挿入されている挿入部11を安全に前進させることが可能な範囲内の値として設定されることが好ましい。
【0102】
動作制御部266は、動作決定部265により決定された動作内容が後退操作である場合に、当該操作内容における動作量として、挿入部11の移動量MFSを設定する。そして動作制御部266は、挿入部11を移動量MFSだけ後退させる制御を実行させる動作制御信号を生成して、駆動部240へ出力する。なお移動量MFSは、腸管内に挿入されている挿入部11を安全に後退させることが可能な範囲内の値として設定されることが好ましい。
【0103】
動作制御部266は、動作決定部265により決定された操作内容が探索操作である場合に、当該操作内容における動作量として、挿入部11の移動量MGSを設定する。そして動作制御部266は、挿入部11を移動量MGSだけ後退させてから先端部12を複数の方向に向ける制御を実行させる動作制御信号を生成して、駆動部240へ出力する。このとき動作制御部266は、先端部12を4つ又は8つの方向に向ける制御を実行させる動作制御信号を生成してよい。探索操作SESに関する処理では、先端部12を複数方向に向け、それぞれの方向で撮影された内視鏡画像から通常管腔を見つける処理が実施される。
【0104】
動作制御部266は、挿入形状検出装置30から出力される挿入形状情報と、外力情報取得装置40から出力される外力情報の少なくとも1つに基づいて動作量を設定するが、記憶媒体24に予め格納された設定値を読み込んで動作量を設定するものであってもよい。
【0105】
<実施例2>
図19は、実施例2における制御部260の機能ブロックを示す。制御部260は、画像取得部261、操作内容選択部270、領域分割部262、奥行情報生成部263、認識部264、操作内容決定部271、動作制御部266、駆動判定部267および操作選択モデル272を備える。
【0106】
図19に示す制御部260は、ハードウエア的には、1以上のプロセッサ22、メモリ、補助記憶装置、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。たとえば制御部260の少なくとも一部の機能を実行させるためのプログラムが記憶媒体24に記憶されており、プロセッサ22が、記憶媒体24からプログラムをメモリにロードして、制御部260の各機能を実現してもよい。
【0107】
実施例2における画像取得部261、領域分割部262、奥行情報生成部263、認識部264、動作制御部266および駆動判定部267は、実施例1で説明した画像取得部261、領域分割部262、奥行情報生成部263、認識部264、動作制御部266および駆動判定部267と同一または同様の機能を有しているため、以下、重複する説明は適宜省略する。
【0108】
画像取得部261は、信号処理部220から、被検体内に挿入されている内視鏡10が撮影した内視鏡画像を取得する。実施例2において画像取得部261は、取得した内視鏡画像を、操作内容選択部270、領域分割部262および奥行情報生成部263に供給する。
【0109】
操作内容選択部270は、画像取得部261が取得した内視鏡画像にもとづいて、所定の複数の操作内容の中から1つ以上の操作内容を選択する機能を有する。換言すると、操作内容選択部270は、被検体内を撮影した内視鏡画像に基づき、内視鏡操作の複数の選択肢の中から、これから実施するべき操作内容を選択する。所定の複数の操作内容は、前進操作、後退操作、アングル操作、捻り操作、送気操作、送水操作、吸引操作の少なくとも1種類の操作から構成されてよい。
【0110】
操作内容選択部270は、操作選択モデル272に、画像取得部261において取得した内視鏡画像から取得される入力データを入力することで、当該内視鏡画像を撮影している内視鏡10に対して推奨される操作内容を選択する。操作選択モデル272は、過去に撮影された内視鏡画像である学習用画像と、学習用画像を撮影した内視鏡に対する操作内容を示すラベルとを教師データとして用いた機械学習により生成された学習済みモデルである。
【0111】
実施例2において、操作選択モデル272は、入力層と、1つ以上の畳み込み層と、出力層と、を含む多層のニューラルネットワークに相当するCNN(Convolutional Neural Network)における各結合係数(重み)をディープラーニング等の学習手法で学習させることにより生成される。
【0112】
領域分割部262は、画像取得部261が取得した内視鏡画像を、複数の領域に分割する機能をもつ。具体的に領域分割部262は、内視鏡画像内の各画素にラベルを付けるセマンティックセグメンテーションを実行して、内視鏡画像を各構造の領域に分割する。領域分割部262は、分割したい種別(クラス)の構造をもつ領域を定義し、各種構造の画素にラベル付けを行った領域分割結果を生成する。領域分割部262は、領域分割した結果を示す領域情報を、認識部264に供給する。
【0113】
奥行情報生成部263は、画像取得部261が取得した内視鏡画像の奥行を示す情報を生成する機能をもつ。画像に含まれる画素ないしはブロックの奥行を推定する手法は従来より様々提案されている。奥行情報生成部263は、たとえば非特許文献2に開示された技術を利用して、内視鏡画像の各画素の奥行を示す情報を生成してよい。奥行情報生成部263は、内視鏡画像の奥行情報を、認識部264に供給する。
【0114】
認識部264は、領域分割部262が領域分割した結果を示す領域情報および/または奥行情報生成部263が生成した内視鏡画像の奥行情報にもとづいて、内視鏡先端部周辺の状況を認識する。具体的に認識部264は、内視鏡先端部周辺の状況として、少なくとも内視鏡10が進行可能な方向および進行してはいけない方向を特定する。
【0115】
操作内容決定部271は、操作内容選択部270において選択された操作内容と、認識部264により認識された内視鏡先端部周辺の状況にもとづいて、実施する操作内容を決定する。
【0116】
実施例2では、画像取得部261が内視鏡画像を取得するタイミング毎に、操作内容決定部271が、内視鏡10の操作内容を決定し、動作制御部266が、決定した操作内容に応じた動作制御信号を生成して、駆動部240に供給してよい。なお別のタイミング例として、駆動部240が、動作制御部266による動作制御信号にもとづいて内視鏡10の動作機構を駆動し、その駆動を終了したタイミングで、操作内容決定部271が内視鏡10の操作内容を決定し、動作制御部266が動作制御信号を生成してもよい。
【0117】
(操作内容の選択処理)
操作選択モデル272の生成にあたり、腸管またはコロンモデルの内部を過去に内視鏡で撮影した内視鏡画像である学習用画像と、当該学習用画像により示される状況に最も適した操作内容が12個の操作内容のうちのどれであるかを示すラベルと、を含む教師データを用いた機械学習が行われる。
【0118】
ここで12個の操作内容は、以下のものを含む。
・湾曲部13を湾曲させて先端部12を上方向に向けるためのアングル操作UPS
・湾曲部13を湾曲させて先端部12を右方向に向けるためのアングル操作RIS
・湾曲部13を湾曲させて先端部12を下方向に向けるためのアングル操作DOS
・湾曲部13を湾曲させて先端部12を左方向に向けるためのアングル操作LES
・湾曲部13を湾曲させて先端部12を右上方向に向けるためのアングル操作URS
・湾曲部13を湾曲させて先端部12を右下方向に向けるためのアングル操作DRS
・湾曲部13を湾曲させて先端部12を左下方向に向けるためのアングル操作DLS
・湾曲部13を湾曲させて先端部12を左上方向に向けるためのアングル操作ULS
・先端部12を前進させる前進操作PSS
・先端部12を後退させる後退操作PLS
・先端部12を複数方向に向けて管腔を探索させるための探索操作SES
・湾曲部13の湾曲角度を固定して先端部12の向きを現在の向きに維持させるためのアングル維持操作AMS
【0119】
教師データの作成時、識者は、学習用画像を見て、当該学習用画像に示される状況において最も行われうる一つの操作内容を、上記した12個の操作内容の中から主観的に選択し、選択した操作内容のラベルを、当該学習用画像に付与する。識者は、医師であってよい。たとえば
図3(b)に示した内視鏡画像70bが学習用画像である場合、管腔中心が画像上部に存在していることから、識者は、内視鏡先端部を上方向に向ける操作、つまりアングル操作UPSをするべきであることを決定し、内視鏡画像70bに、アングル操作UPSのラベルを付与する。このラベル付与作業が多数の過去の内視鏡画像に対して実施されることで、教師データが作成される。
【0120】
以下、学習用画像およびラベルを含む教師データの例を示す。
図20は、教師データの例を示す。
図20に示す学習用画像には、いずれも上方向のアングル操作を示す「アングル操作UPSのラベル」が付与される。
図20に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を上方向に湾曲させるべきことを判断された画像である。
【0121】
図21は、教師データの別の例を示す。
図21に示す学習用画像には、いずれも右方向のアングル操作を示す「アングル操作RISのラベル」が付与されている。
図21に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を右方向に湾曲させるべきことを判断された画像である。
【0122】
図22は、教師データの別の例を示す。
図22に示す学習用画像には、いずれも下方向のアングル操作を示す「アングル操作DOSのラベル」が付与されている。
図22に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を下方向に湾曲させるべきことを判断された画像である。
【0123】
図23は、教師データの別の例を示す。
図23に示す学習用画像には、いずれも左方向のアングル操作を示す「アングル操作LESのラベル」が付与されている。
図23に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を左方向に湾曲させるべきことを判断された画像である。
【0124】
図24は、教師データの別の例を示す。
図24に示す学習用画像には、いずれも右上方向のアングル操作を示す「アングル操作URSのラベル」が付与される。
図24に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を右上方向に湾曲させるべきことを判断された画像である。
【0125】
図25は、教師データの別の例を示す。
図25に示す学習用画像には、いずれも右下方向のアングル操作を示す「アングル操作DRSのラベル」が付与されている。
図25に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を右下方向に湾曲させるべきことを判断された画像である。
【0126】
図26は、教師データの別の例を示す。
図26に示す学習用画像には、いずれも左下方向のアングル操作を示す「アングル操作DLSのラベル」が付与されている。
図26に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を左下方向に湾曲させるべきことを判断された画像である。
【0127】
図27は、教師データの別の例を示す。
図27に示す学習用画像には、いずれも左上方向のアングル操作を示す「アングル操作ULSのラベル」が付与されている。
図27に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を左上方向に湾曲させるべきことを判断された画像である。
【0128】
図28は、教師データの別の例を示す。
図28に示す学習用画像には、いずれも前進操作を示す「押し操作(前進操作)PSSのラベル」が付与される。
図28に示す学習用画像は、これから行う内視鏡操作として、先端部12を前進させるべきことを判断された画像である。
【0129】
図29は、教師データの別の例を示す。
図29に示す学習用画像には、いずれも後退操作を示す「引き操作(後退操作)PLSのラベル」が付与されている。
図29に示す学習用画像は、これから行う内視鏡操作として、先端部12を後退させるべきことを判断された画像である。ここで後退操作が必要な状況の典型例としては、大腸の粘膜表面に先端部12が過剰に近接した状況や、また内視鏡医の間で俗に「赤玉」と称される先端部12が粘膜表面に接してしまった状況などがある。
【0130】
図30は、教師データの別の例を示す。
図30に示す学習用画像には、いずれも探索操作を示す「探索操作SESのラベル」が付与される。
図30に示す学習用画像は、これから行う内視鏡操作として、湾曲部13を複数方向に湾曲させて複数方向を撮影させるべきことを判断された画像である。
【0131】
湾曲部13の湾曲角度を固定して先端部12の向きを現在の向きに維持させるためのアングル維持操作AMSの教師データについては図示を省略するが、たとえば、
図28に示す学習用画像に、「アングル維持操作AMS」のラベルを付与してもよい。
実施例2の操作選択モデル272は、
図20~
図30に示す教師データを用いて機械学習することにより生成される。
【0132】
操作内容選択部270は、学習用画像と、学習用画像を撮影した内視鏡に対する操作内容を示すラベルとを教師データとして用いた機械学習により生成された1つ以上の操作選択モデル272に、画像取得部261において取得した内視鏡画像から取得される入力データを入力することで、1つ以上の操作内容を選択する。具体的に操作内容選択部270は、画像取得部261において取得された内視鏡画像に含まれる各画素の画素値等の多次元データを取得し、当該多次元データを入力データとして操作選択モデル272のニューラルネットワークの入力層に入力する。操作選択モデル272は、内視鏡10の操作内容として選択され得る12個の操作内容のそれぞれに対応する12個の尤度を、ニューラルネットワークの出力層から出力する。操作内容選択部270は、出力データに含まれる12個の尤度の中で最も高い1つの尤度に対応する操作内容を、内視鏡10の操作内容の選択結果として得ることができる。
【0133】
以上のように操作内容選択部270は、画像取得部261において取得した内視鏡画像から取得される入力データを操作選択モデル272に入力して処理させることにより、先端部12の向きを挿入部11の挿入軸に対して直交する8方向に向けるための操作と、先端部12を前進または後退させるための操作と、先端部12の向きを現在の向きに維持させるための操作と、先端部12の近傍の管腔を探索するための操作とを含む12個の操作内容の中から選択した1つの操作内容を示す選択結果を得るように構成されている。操作内容選択部270は、選択した操作内容を、操作内容決定部271に供給する。
【0134】
操作選択モデル272は、適切な操作内容を出力できるように、十分な学習により構築されていることが好ましいが、その精度は、教師データに依存する。そこで実施例2では、操作内容選択部270により選択された操作内容が適切であるか否かを、認識部264が認識する内視鏡先端部周辺の状況をもとに判断する手法を実現する。
【0135】
(内視鏡画像の領域分割処理)
操作内容選択部270における処理と並行して、領域分割部262は、画像取得部261が取得した内視鏡画像を、複数の領域に分割する。実施例1で説明したように領域分割部262は、内視鏡画像内の各画素にラベルを付けるセマンティックセグメンテーションを実行して、内視鏡画像を各構造の領域に分割する。領域分割部262は、FCNを利用して、セマンティックセグメンテーションを実行してよい。
【0136】
図31(a)は、内視鏡画像の一例を示す。画像取得部261は信号処理部220から、内視鏡10が撮影した内視鏡画像を取得すると、操作内容選択部270および領域分割部262に供給する。操作内容選択部270は、
図31(a)の内視鏡画像から取得される入力データを操作選択モデル272に入力した結果、操作内容として、先端部12を前進させる“前進操作PSS”を選択したものとする。操作内容選択部270は、選択した操作内容を操作内容決定部271に供給する。
【0137】
領域分割部262は、セマンティックセグメンテーションを実行して、内視鏡画像を複数の領域に分割する。
図31(b)は、領域分割部262による領域分割結果の例を示す。領域分割部262は、内視鏡画像を複数の領域に分割し、領域分割した結果を示す領域情報を導出する。ここで領域情報は、構造に関する各画素のラベル値pa(x,y)として導出されてよい。領域分割部262は、導出したラベル値を用いて、領域分割結果画像を生成している。実施例2において内視鏡画像は720×480のサイズをもち、領域分割結果画像も、同じく720×480のサイズをもつ。領域分割部262は、領域分割結果画像を、領域分割した結果を示す領域情報として認識部264に供給する。この領域分割結果画像においては、同心円状の襞エッジの領域と、通常管腔の領域とが含まれている。なお別の例では、領域分割部262は、各画素のラベル値を、領域分割した結果を示す領域情報として認識部264に供給してもよい。
【0138】
認識部264は、720×480のサイズの領域分割結果画像を複数の部分領域に分割して、各部分領域に含まれる通常管腔領域の割合を認識する。実施例2では、内視鏡画像を、水平方向と垂直方向にそれぞれ5等分して、5×5の部分領域に分割し、各部分領域をsub(i,j)で表現する。なおi,j=1,2,3,4,5である。別の例で認識部264は、5×5以外の分割数で、領域分割結果画像を分割してもよい。
【0139】
図32は、領域分割結果画像を複数の部分領域に分割した状態を示す。この例では、通常管腔として抽出された領域が、部分領域sub(3,2)、sub(2,3)、sub(3,3)、sub(2,4)、sub(3,4)にまたがって存在している。認識部264は、各部分領域sub(i,j)において、通常管腔の画素数が占める割合を導出する。この割合は、以下の式により算出される。ここで部分領域の総画素数を、anと表現し、この例でan=144×96である。
通常管腔割合(a)=(部分領域における通常管腔領域の画素数)/an
【0140】
認識部264は、この割合(a)が所定の閾値(たとえば0.4)を超えている部分領域に含まれる通常管腔領域を、内視鏡が進行可能な領域であると判定してよい。この例では、sub(3,3)について算出された通常管腔割合(a)が閾値を超えており、したがって認識部264は、内視鏡画像におけるsub(3,3)に、内視鏡が進行可能な領域が存在することを認識する。認識部264は、内視鏡が進行可能な領域を特定することで、内視鏡が進行可能な方向を認識する。認識部264は、この認識結果を、操作内容決定部271に供給する。
【0141】
なお上記例では、認識部264が、各部分領域sub(i,j)において通常管腔の画素数が占める割合から、内視鏡が進行可能な領域を判定している。別の例では、認識部264が、通常管腔の総画素数のうち所定の割合以上が含まれる部分領域sub(i,j)を、内視鏡が進行可能な部分領域として認識してもよい。この場合、認識部264は、通常管腔として領域分割された画素数plをカウントする。認識部264は、各部分領域sub(i,j)に含まれる通常管腔領域が、通常管腔領域全体に対して占める割合を導出する。この割合は、以下の式により導出される。
通常管腔割合(b)=(部分領域における通常管腔領域の画素数)/pl
【0142】
認識部264は、この割合(b)が所定の閾値(たとえば0.6)を超えている部分領域を、内視鏡が進行可能な領域であると判定してよい。この例では、sub(3,3)について算出された通常管腔割合(b)が閾値を超えており、したがって認識部264は、内視鏡画像におけるsub(3,3)に、内視鏡が進行可能な領域が存在することを認識する。なお認識部264は、割合(b)が最大となる部分領域を、内視鏡が進行可能な領域であると特定してもよい。認識部264は、内視鏡が進行可能な領域を特定することで、内視鏡が進行可能な方向を認識する。認識部264は、この認識結果を、操作内容決定部271に供給する。認識部264は、通常管腔割合(a)または通常管腔割合(b)のいずれかにもとづいて、内視鏡が進行可能な領域および方向を特定してよい。
【0143】
操作内容決定部271は、操作内容選択部270から選択された操作内容を受け取り、認識部264から先端部周辺の状況の認識結果を受け取る。操作内容決定部271は、操作内容選択部270により選択された操作内容が適切であるか否かを、認識部264により認識された状況にもとづいて判断する。ここで操作内容決定部271は、操作内容として、先端部12を前進させる“前進操作PSS”を選択しており、認識部264は、内視鏡画像の中央に位置するsub(3,3)に、内視鏡先端部が進行可能な領域が存在することを認識している。sub(3,3)は、内視鏡先端部の前進方向に存在するため、操作内容決定部271は、操作内容選択部270により選択された前進操作PSSは適切であることを判断し、前進操作PSSを、実施する操作内容として決定する。
【0144】
図33(a)は、内視鏡画像の別の例を示す。画像取得部261は信号処理部220から、内視鏡10が撮影した内視鏡画像を取得すると、操作内容選択部270および領域分割部262に供給する。操作内容選択部270は、
図33(a)の内視鏡画像から取得される入力データを操作選択モデル272に入力した結果、操作内容として、先端部12を前進させる“前進操作PSS”を選択したものとする。操作内容選択部270は、選択した操作内容を操作内容決定部271に供給する。
【0145】
図33(b)は、領域分割部262による領域分割結果の例を示す。領域分割部262は、内視鏡画像を複数の領域に分割し、領域分割した結果を示す領域情報を導出する。領域情報は、構造に関する各画素のラベル値pa(x,y)として導出され、領域分割部262は、導出したラベル値を用いて、領域分割結果画像を生成する。領域分割部262は、領域分割結果画像を、領域分割した結果を示す領域情報として認識部264に供給する。認識部264は、領域分割結果画像を5×5の部分領域に分割して、各部分領域に含まれる通常管腔領域の割合を認識する。
【0146】
図34は、領域分割結果画像を複数の部分領域に分割した状態を示す。この例では、通常管腔として抽出された領域が、部分領域sub(2,2)、sub(3,2)、sub(2,3)、sub(3,3)にまたがって存在している。認識部264は、各部分領域sub(i,j)において、通常管腔の画素数が占める割合を導出する。この例では、認識部264が、通常管腔割合(b)を算出し、sub(3,2)において、通常管腔割合(b)が所定の閾値(たとえば0.6)を超えていることを認識する。したがって認識部264は、内視鏡画像におけるsub(3,2)に、内視鏡が進行可能な領域が存在することを認識する。認識部264は、この認識結果を、操作内容決定部271に供給する。
【0147】
操作内容決定部271は、操作内容選択部270から選択された操作内容を受け取り、認識部264から先端部周辺の状況の認識結果を受け取る。ここで操作内容選択部270は、操作内容として、先端部12を前進させる“前進操作PSS”を選択しており、認識部264は、内視鏡画像の中央部分より高い位置に存在するsub(3,2)に、内視鏡が進行可能な領域が存在することを認識している。sub(3,2)は、内視鏡先端部の前進方向よりも上側に存在するため、操作内容決定部271は、操作内容選択部270により選択された前進操作PSSが適切でないことを判断する。選択された前進操作PSSが適切でないことを判断した場合、操作内容決定部271は、内視鏡10の操作の自動制御を強制的に終了(中断)してよい。
【0148】
このとき操作内容決定部271は、湾曲部13を湾曲させて先端部12を上方向に向けるための“アングル操作UPS”を、実施する操作内容として決定してもよい。または操作内容決定部271は、“アングル操作UPS”のあと、“前進操作PSS”を行うことを、実施する操作内容として決定してよい。このように操作内容決定部271は、操作内容選択部270により選択された操作内容が適切であるか否かを、認識部264による認識結果にもとづいて判断することで、内視鏡先端部の状況に不適切な操作内容を補正できる。
【0149】
図35(a)は、内視鏡画像の別の例を示す。画像取得部261は信号処理部220から、内視鏡10が撮影した内視鏡画像を取得すると、操作内容選択部270および領域分割部262に供給する。操作内容選択部270は、
図35(a)の内視鏡画像から取得される入力データを操作選択モデル272に入力した結果、操作内容として、先端部12を前進させる“前進操作PSS”を選択したものとする。操作内容選択部270は、選択した操作内容を操作内容決定部271に供給する。
【0150】
図35(b)は、領域分割部262による領域分割結果の例を示す。領域分割部262は領域分割結果画像を生成して、認識部264に供給する。認識部264は、領域分割結果画像を5×5の部分領域に分割して、各部分領域に含まれる通常管腔領域の割合を認識する。
【0151】
図36は、領域分割結果画像を複数の部分領域に分割した状態を示す。この例では、通常管腔として抽出された領域は存在せず、屈曲部の襞エッジの領域と、屈曲部の襞エッジに沿った屈曲部の管腔の領域とが抽出されている。認識部264は、各部分領域sub(i,j)において通常管腔領域が存在していないこと、および屈曲部の管腔領域が存在していることを認識する。
【0152】
まず認識部264は、屈曲部の管腔と抽出された領域を含む部分領域を抽出する。この例で認識部264は、屈曲部の管腔領域が、部分領域sub(2,2)、sub(3,2)、sub(4,2)、sub(2,3)、sub(3,3)、sub(4,3)、sub(5,3)、sub(5,4)にまたがって存在することを認識する。このことから認識部264は、屈曲部の管腔領域が垂直方向における中央部分に存在していることを認識する。
【0153】
続いて認識部264は、屈曲部の襞エッジの画素を抽出して、2つの端点と、その中間点から、屈曲部の管腔の円弧の向きを特定する。
図37は、屈曲部の襞エッジの2つの端点と、その中間点を示す。認識部264は、2つの端点k1、k2を結ぶ線分に対して中間点cから下ろす垂線の向きを特定することで、屈曲部の襞エッジにより形成される円弧の向きを特定する。この例では、端点k1、k2を結ぶ線分に対して、中間点cから垂線が左下方向に引けるため、認識部264は、屈曲部の襞エッジが、中間点cに対して左下方向に向く開口部を持つこと、つまり管腔の延伸方向が内視鏡画像の右上方向であることを認識する。
【0154】
以上のように認識部264は、
図37に示す領域分割結果画像から、内視鏡画像のほぼ中央部に管腔の屈曲部が存在し、管腔延伸方向は画像右上方向であることを認識し、認識結果を操作内容決定部271に供給する。
【0155】
操作内容決定部271は、認識部264から認識結果を受け取ると、操作内容選択部270が選択した前進操作PSSは適切でないことを判断する。操作内容決定部271は、認識結果から、屈曲部に対して先端部12を左下に向ける操作が好ましいことを確認する。そこで操作内容決定部271は、湾曲部13を湾曲させて先端部12を左下方向に向けるための“アングル操作DLS”を、実施する操作内容として決定してよい。または操作内容決定部271は、“アングル操作DLS”のあと、“前進操作PSS”を行うことを、実施する操作内容として決定してよい。このように操作内容決定部271は、操作内容選択部270により選択された操作内容が適切であるか否かを、認識部264による認識結果にもとづいて判断することで、内視鏡先端部の状況に不適切な操作内容を補正できる。
【0156】
以上は、操作内容決定部271が、認識部264が領域分割部262による領域分析結果を認識した結果にもとづいて、操作内容選択部270が選択した操作内容が適切であるか否かを判断する手法を説明した。以下では、さらに奥行情報生成部263が生成する内視鏡画像の奥行情報を加味して、操作内容決定部271が、操作内容選択部270が選択した操作内容が適切であるか否かを判断する手法を説明する。
【0157】
図38は、内視鏡画像の別の例を示す。この内視鏡画像の下部には、管腔が奥行方向に直線的に撮影されており、複数の襞が管腔を囲んで存在している。画像取得部261は信号処理部220から、内視鏡10が撮影した内視鏡画像を取得すると、操作内容選択部270、領域分割部262および奥行情報生成部263に供給する。操作内容選択部270は、
図38の内視鏡画像から取得される入力データを操作選択モデル272に入力した結果、操作内容として、湾曲部13を湾曲させて先端部12を下方向に向ける“アングル操作DOS”を選択したものとする。操作内容選択部270は、選択した操作内容を、操作内容決定部271に供給する。
【0158】
図39は、領域分割部262による領域分割結果の例を示す。領域分割部262は、内視鏡画像を複数の領域に分割し、領域分割した結果を示す領域情報を導出して、領域分割結果画像を生成する。
図39に示す領域分割結果画像においては、襞エッジの領域と、通常管腔の領域とが含まれている。領域分割部262は、領域分割結果画像を、領域分割した結果を示す領域情報として認識部264に供給する。
【0159】
図40は、奥行情報生成部263による奥行情報推定結果の例を示す。奥行情報生成部263は、内視鏡画像に対して奥行推定処理を実行して、内視鏡画像の奥行を示す奥行情報を生成し、奥行推定結果画像を生成する。奥行情報生成部263は、奥行推定結果画像を、内視鏡画像の奥行情報として認識部264に供給する。
【0160】
認識部264は、領域分割部262から内視鏡画像の領域情報を受け取り、奥行情報生成部263から内視鏡画像の奥行情報を受け取って、内視鏡先端部周辺の状況を認識する。
図41は、奥行推定結果画像の認識例を示す。認識部264は領域分割結果画像から、通常管腔領域が、画像中央下部に存在していることを認識する。また認識部264は奥行推定結果画像から、画像右下に、内視鏡先端部に最も近い領域Nが存在し、その領域Nに隣接して、内視鏡先端部から最も遠い領域Fが存在することを認識する。また認識部264は、領域分割結果画像と奥行推定結果画像とを参照して、領域Nと領域Fの境界には襞エッジ領域が存在し、また領域Fには通常管腔領域が存在していることを認識する。
【0161】
以上のように認識部264は、
図39に示す領域分割結果画像および
図40に示す奥行推定結果画像から、内視鏡画像の中央下部に通常管腔領域が存在し、その右側に、内視鏡先端部との距離が非常に近い襞領域が隣接していることを認識し、認識結果を操作内容決定部271に供給する。
【0162】
操作内容決定部271は、操作内容選択部270から選択された操作内容を受け取り、認識部264から先端部周辺の状況の認識結果を受け取る。ここで操作内容決定部271は、操作内容として、先端部12を下方向に向ける“アングル操作DOS”を選択している。操作内容決定部271は、認識部264から受け取った認識結果から、内視鏡画像の右下部に、先端部12を下方向に向けた際に接触する可能性のある襞が存在することを確認する。操作内容決定部271は、ラベル値d0を割り当てられた襞領域は接触可能性の高いことを予め把握しておいてよい。そこで操作内容決定部271は、操作内容選択部270により選択されたアングル操作DOSが適切でないことを判断し、操作内容を、先端部12を左下方向に向けるアングル操作DLSに変更する。なお操作内容決定部271は、右下に存在する襞を越えるように、上方向にアングル操作を行ってから前進する操作内容を決定してもよい。
【0163】
以上は、操作内容決定部271が、認識部264が領域分割部262による領域分析結果および奥行情報生成部263による奥行推定処理結果を認識したく結果にもとづいて、操作内容選択部270が選択した操作内容が適切であるか否かを判断する手法を説明した。別の例では、操作内容決定部271は、認識部264が奥行情報生成部263による奥行推定処理結果を認識した結果にもとづいて、操作内容選択部270が選択した操作内容が適切であるか否かを判断することも可能である。このように実施例2においては、操作内容決定部271が、認識部264による内視鏡先端部周辺の認識状況にもとづいて、操作内容選択部270が選択した操作内容が適切であるか否かを判断してよい。
【0164】
以上、本開示を複数の実施例をもとに説明した。これらの実施形態および実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本開示の範囲にあることは当業者に理解されるところである。実施例では、内視鏡10を大腸に挿入するときの画像処理について説明したが、内視鏡10は他の臓器に挿入されてもよく、また配管などに挿入されてもよい。
【0165】
実施例では、内視鏡画像を処理して内視鏡10の動作内容または操作内容を決定し、自動挿入制御の応用する例を説明した。変形例では、決定した動作内容または操作内容が、医師が内視鏡10を手動操作する際のガイド情報として、表示装置60に表示されてもよい。また決定された動作内容または操作内容は、ログ情報として記録されてよい。
【産業上の利用可能性】
【0166】
本開示は、内視鏡画像を処理する技術分野に利用できる。
【符号の説明】
【0167】
1・・・内視鏡システム、2・・・内視鏡制御装置、10・・・内視鏡、20・・・処理装置、22・・・プロセッサ、24・・・記憶媒体、260・・・制御部、261・・・画像取得部、262・・・領域分割部、263・・・奥行情報生成部、264・・・認識部、265・・・動作決定部、266・・・動作制御部、267・・・駆動判定部、270・・・操作内容選択部、271・・・操作内容決定部、272・・・操作選択モデル。