IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社エビデントの特許一覧 ▶ 国立大学法人東京工業大学の特許一覧

特許7515795画像処理システム、及び、画像処理方法、並びに、画像処理プログラム
<>
  • 特許-画像処理システム、及び、画像処理方法、並びに、画像処理プログラム 図1
  • 特許-画像処理システム、及び、画像処理方法、並びに、画像処理プログラム 図2
  • 特許-画像処理システム、及び、画像処理方法、並びに、画像処理プログラム 図3
  • 特許-画像処理システム、及び、画像処理方法、並びに、画像処理プログラム 図4
  • 特許-画像処理システム、及び、画像処理方法、並びに、画像処理プログラム 図5
  • 特許-画像処理システム、及び、画像処理方法、並びに、画像処理プログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-05
(45)【発行日】2024-07-16
(54)【発明の名称】画像処理システム、及び、画像処理方法、並びに、画像処理プログラム
(51)【国際特許分類】
   G06T 7/70 20170101AFI20240708BHJP
   G06T 7/60 20170101ALI20240708BHJP
   H04N 7/18 20060101ALI20240708BHJP
   H04N 23/60 20230101ALI20240708BHJP
【FI】
G06T7/70 Z
G06T7/60 150S
H04N7/18 M
H04N23/60
【請求項の数】 10
(21)【出願番号】P 2020095271
(22)【出願日】2020-06-01
(65)【公開番号】P2021189822
(43)【公開日】2021-12-13
【審査請求日】2023-02-21
(73)【特許権者】
【識別番号】322004393
【氏名又は名称】株式会社エビデント
(73)【特許権者】
【識別番号】304021417
【氏名又は名称】国立大学法人東京工業大学
(74)【代理人】
【識別番号】110004185
【氏名又は名称】インフォート弁理士法人
(74)【代理人】
【識別番号】110002907
【氏名又は名称】弁理士法人イトーシン国際特許事務所
(72)【発明者】
【氏名】宮下 尚之
(72)【発明者】
【氏名】奥富 正敏
(72)【発明者】
【氏名】加賀美 翔
【審査官】山田 辰美
(56)【参考文献】
【文献】特開2014-109555(JP,A)
【文献】特開2019-150574(JP,A)
【文献】Peter Hansen, et al,Pipe mapping with monocular fisheye imagery,2013 IEEE/RSJ International Conference on Intelligent Robots and Systems,米国,IEEE,2014年,p.5180-p.5185,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6697105
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/70
G06T 7/60
H04N 7/18
H04N 23/60
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理システムであって、
前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定する推定部と、
前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正するバンドル調整部と、を有し、
前記推定部は、前記三次元点群から、前記半径と前記距離との差が所定の範囲内若しくは範囲外にある前記三次元点を抽出し、抽出した前記三次元点の数と前記三次元点群に対する割合との少なくとも一方に基づいて、前記第1中心軸とは異なる第2中心軸を推定するか否かを判定する、
画像処理システム。
【請求項2】
カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理システムであって、
前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定する推定部と、
前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正するバンドル調整部と、を有し、
前記半径は、前記推定部より推定された値が用いられることを特徴とする、
画像処理システム。
【請求項3】
前記推定部は、前記三次元点群から円錐を検出し、検出した前記円錐から、前記第1中心軸を推定することを特徴とする、請求項1または請求項2に記載の画像処理システム。
【請求項4】
前記半径は、前記被写体の実測値に基づき予め設定された値が用いられることを特徴とする、請求項1または請求項2に記載の画像処理システム。
【請求項5】
カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理方法であって、 前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定し、
前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正し、
前記三次元点群から、前記半径と前記距離との差が所定の範囲内若しくは範囲外にある前記三次元点を抽出し、
抽出した前記三次元点の数と前記三次元点群に対する割合との少なくとも一方に基づいて、前記第1中心軸とは異なる第2中心軸を推定するか否かを判定する、
画像処理方法。
【請求項6】
カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理方法であって、
前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定し、
前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正する画像処理方法であって、
前記半径は、前記第1中心軸を推定する推定部より推定された値が用いられることを特徴とする、画像処理方法。
【請求項7】
カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理プログラムであって、
前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定するステップと、
前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正するステップと、
前記三次元点群から、前記半径と前記距離との差が所定の範囲内若しくは範囲外にある前記三次元点を抽出するステップと、
抽出した前記三次元点の数と前記三次元点群に対する割合との少なくとも一方に基づいて、前記第1中心軸とは異なる第2中心軸を推定するか否かを判定するステップと、
をコンピュータに実行させることを特徴とする画像処理プログラム。
【請求項8】
カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理プログラムであって、
前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定するステップと、
前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正するステップと、
をコンピュータに実行させる画像処理プログラムであって、
前記半径は、前記第1中心軸を推定する推定部より推定された値が用いられることを特徴とする、画像処理プログラム。
【請求項9】
カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理システムであって、
前記撮影画像から抽出された局所的特徴を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定する推定部と、
前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離とに基づく拘束条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正する補正部と、を有し、
前記推定部は、前記三次元点群から、前記半径と前記距離との差が所定の範囲内若しくは範囲外にある前記三次元点を抽出し、抽出した前記三次元点の数と前記三次元点群に対する割合との少なくとも一方に基づいて、前記第1中心軸とは異なる第2中心軸を推定するか否かを判定する、
画像処理システム。
【請求項10】
カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理システムであって、
前記撮影画像から抽出された局所的特徴を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定する推定部と、
前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離とに基づく拘束条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正する補正部と、を有し、
前記半径は、前記推定部より推定された値が用いられることを特徴とする、
画像処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理システム、及び、画像処理方法、並びに、画像処理プログラムに関する。
【背景技術】
【0002】
化学精製、ガス供給、下水道のメンテナンスなど配管内部の検査を非破壊で行うために工業用内視鏡が広く用いられている。傷および腐食のような不具合が発見された際、その程度に応じて対策方法を切り替える必要がある。そのため、配管内部における不具合箇所の大きさや位置を正確に知ることが重要である。
内視鏡検査では、プローブ先端に備えられた撮像光学系により被写体内部を撮像し検査画像を得る。ここで、プローブの直径は通常数ミリ程度であり、測距や姿勢検出のための物理的な構成要素(モーションセンサ等)を設けることは、実装面積やコストの観点から望ましくない。
一方、内視鏡に限らず、撮像装置から得られた画像を用いて被写体形状やカメラ位置を得る手法として、SfМ(Strucure-from-Motion)やVisual-SLAM(Simultaneous Localization and Mapping)に係る手法の採用が近年盛んである(例えば、非特許文献1、非特許文献2参照)。
【0003】
工業用内視鏡を用いた配管検査においてSfMやV-SLAMに係る手法を用いた場合には、例えば、実空間に存在する被検体である配管と、配管の内部に挿入される内視鏡に設けられた撮像部と、の間の相対的な位置関係に応じた情報が取得されるとともに、当該取得した情報に基づいて配管の3次元形状が順次復元される。特に、逐次更新型のSfMであるインクリメンタル SfМ や V-SLAM は、工業用内視鏡により連続的に撮像された画像を用いて、リアルタイムに配管の三次元形状を復元することができるため検査効率の向上に寄与し得る。
【先行技術文献】
【特許文献】
【0004】
【文献】Schonberger, Johannes L., and Jan-Michael Frahm. "Structure-from-motion revisited."Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.
【文献】Mur-Artal, Raul, Jose Maria Martinez Montiel, and Juan D. Tardos. "ORB-SLAM: a versatile and accurate monocular SLAM system."IEEE transactions on robotics 31.5 (2015): pp.1147-1163.
【発明の概要】
【発明が解決しようとする課題】
【0005】
工業用内視鏡による画像検査では、観察視野を確保するため単眼カメラが用いられることが一般的である。単眼カメラで撮像された画像を用いて、SfMやSLAMといった手法を用いて被写体を三次元復元する場合、ステレオカメラのような既知の基線長(基準距離)が存在しないため、被写体の形状を相対的なスケールでしか求めることができない。よって、三次元復元の過程で生じる誤差が蓄積することで、被写体の形状が実際のスケールと異なって復元される現象が生じてしまう(スケールドリフト)。
【0006】
スケールドリフトを解消する手法としてループクロージング処理が知られている。ループクロージング処理とは、被写体における環状の経路を始点から終点まで撮像していき、復元した始点の位置と復元した終点の位置が一致するように復元結果を補正することで、スケールドリフトによる誤差を軽減する手法である。しかしながら、配管検査の対象となる配管に環状経路が存在することは少ないため、ループクロージング処理による補正を適用することは現実的でない。故に、三次元復元による被写体形状やカメラ位置を正しく推定することができないという問題があった。
【0007】
そこで、本発明は、被写体である配管を撮像した画像に対し、スケールドリフトを抑制して精度の高い三次元復元を行うことができる、画像処理システム、及び、画像処理方法、並びに、画像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の一態様の画像処理システムは、カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理システムである。画像処理システムは、前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定する推定部を有する。また、前記筒形状の半径と、前記第1中心軸から前記三次元点群を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正するバンドル調整部とも有する。前記推定部は、前記三次元点群から、前記半径と前記距離との差が所定の範囲内若しくは範囲外にある前記三次元点を抽出し、抽出した前記三次元点の数と前記三次元点群に対する割合との少なくとも一方に基づいて、前記第1中心軸とは異なる第2中心軸を推定するか否かを判定する。
【0009】
本発明の一態様の画像処理方法は、カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理方法であって、前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定し、前記筒形状の半径と、前記第1中心軸から前記三次元点を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正する。また、前記三次元点群から、前記半径と前記距離との差が所定の範囲内若しくは範囲外にある前記三次元点を抽出し、抽出した前記三次元点の数と前記三次元点群に対する割合との少なくとも一方に基づいて、前記第1中心軸とは異なる第2中心軸を推定するか否かを判定する。
【0010】
本発明の一態様の画像処理プログラムは、カメラにより筒形状の被写体の内部を撮影して得られた撮影画像を用いて、前記カメラの位置および姿勢を推定し、前記被写体の三次元復元処理を行う画像処理プログラムであって、前記撮影画像から抽出された特徴点群を、三次元空間に復元して得られる三次元点群を用い、前記筒形状の第1中心軸を推定するステップと、前記三次元点群を構成する個々の三次元点について、前記筒形状の半径と、前記第1中心軸から前記三元点群を構成する個々の三次元点までの距離との差の総和を最小化する条件を用いて、前記カメラの位置および姿勢と前記三次元点群の座標を補正するステップと、前記三次元点群から、前記半径と前記距離との差が所定の範囲内若しくは範囲外にある前記三次元点を抽出するステップと、抽出した前記三次元点の数と前記三次元点群に対する割合との少なくとも一方に基づいて、前記第1中心軸とは異なる第2中心軸を推定するか否かを判定するステップと、をコンピュータに実行させる
【発明の効果】
【0011】
本発明の一態様によれば、被写体である配管を撮像した画像に対し、スケールドリフトを抑制して精度の高い三次元復元を行うことができる、画像処理システム、及び、画像処理方法、並びに、画像処理プログラムを提供することができる。
【図面の簡単な説明】
【0012】
図1】実施形態に係わる画像処理システムを用いた配管検査システムの構成を示す構成図の一例。
図2】実施形態に係る内視鏡システムの構成を説明するためのブロック図。
図3】実施形態に係る画像処理システムの機能構成を説明するためのブロック図。
図4】バンドル調整に用いる誤差関数の円筒拘束項を説明するための図。
図5】実施形態に係る画像処理システムにおいて行われる処理等を説明するためのフローチャート。
図6図5における円錐検出処理を説明するためのフローチャート。
【発明を実施するための形態】
【0013】
以下、図面を参照して本発明の実施の形態を説明する。
【0014】
図1は、実施形態に係わる画像処理システムを用いた配管検査システムの構成を示す構成図の一例である。配管検査システム100は、例えば図1に示すように、画像処理システム51と、内視鏡システム1とから構成される。
【0015】
内視鏡システム1は、例えば、図1に示すように、内視鏡2と、内視鏡2を接続可能な本体装置3と、を有して構成されている。また、本体装置3には、画像等を表示可能な表示部35が設けられている。更に、本体装置3には、USBメモリなどの外部記憶装置39を接続可能な接続ポート40が設けられている。なお、接続ポート40には、通信ケーブルも接続可能になされている。すなわち、内視鏡システム1と画像処理システム51とは、通信ケーブルを経由して直接的にデータを送受信することも可能であるし、外部記憶装置39を経由してデータをやり取りすることも可能になされている。
【0016】
内視鏡2は、タービン及びエンジン等の被検体の内部に挿入可能な細長形状を具備して形成された挿入部5と、挿入部5の基端側に設けられた操作部6と、操作部6から延出したユニバーサルコード7と、を有して構成されている。また、内視鏡2は、ユニバーサルコード7により、本体装置3に対して着脱自在に接続されるように構成されている。
【0017】
挿入部5は、先端部11と、湾曲自在に形成された湾曲部12と、可撓性を有する長尺な可撓管部13と、を先端側から順に設けて構成されている。
【0018】
操作部6には、湾曲部12を所望の方向に湾曲させるための操作を行うことが可能なジョイスティックを有して構成された湾曲操作子6aが設けられている。また、操作部6には、図示しないが、例えば、フリーズボタン、湾曲ロックボタン、及び、記録指示ボタン等のような、内視鏡システム1において利用可能な機能に応じた1つ以上の操作ボタンが設けられている。
【0019】
先端部11には、図2に示すように、1つ以上の光源部21と、撮像部22と、が設けられている。なお、図2においては、図示の便宜上、2つの光源部21が先端部11に設けられている場合を例示している。図2は、実施形態に係る内視鏡システムの構成を説明するためのブロック図である。
【0020】
光源部21は、発光素子21aと、照明光学系21bと、を有して構成されている。
【0021】
発光素子21aは、例えば、LEDを有して構成されている。また、発光素子21aは、本体装置3から供給される発光素子駆動信号に応じた光量を有する照明光を発生するように構成されている。
【0022】
照明光学系21bは、例えば、照明レンズを含む光学系として構成されている。また、照明光学系21bは、発光素子21aから発せられた照明光を先端部11の外部の被写体へ照射するように構成されている。
【0023】
撮像部22は、観察光学系22aと、撮像素子22bと、を有するカメラとして構成されている。
【0024】
観察光学系22aは、例えば、結像レンズを含む光学系として構成されている。また、観察光学系22aは、光源部21からの照明光の照射に応じて先端部11の外部の被写体から発せられる戻り光(反射光)が入射されるとともに、当該戻り光を撮像素子22bの撮像面上に結像するように構成されている。
【0025】
撮像素子22bは、例えば、CCDまたはCMOSのようなイメージセンサを有して構成されている。また、撮像素子22bは、本体装置3から供給される撮像素子駆動信号に応じて駆動するように構成されている。また、撮像素子22bは、観察光学系22aにより結像された戻り光を撮像することにより撮像信号を生成し、当該生成した撮像信号を本体装置3へ出力するように構成されている。
【0026】
湾曲部12は、例えば、複数の湾曲駒を有して構成されている。また、湾曲部12は、可撓管部13、操作部6及びユニバーサルコード7の内部に挿通された複数の湾曲用ワイヤBW各々の先端部に接続されている。また、湾曲部12は、複数の湾曲用ワイヤBW各々の牽引状態に応じて湾曲することにより、先端部11を挿入部5の長手軸方向に対して交差する方向へ向けることができるように構成されている。
【0027】
すなわち、内視鏡2は、細長な挿入部5の先端部11に設けられた撮像部22により被検体の内部を撮像するように構成されている。
【0028】
本体装置3は、図2に示すように、光源駆動部31と、撮像素子駆動部32と、湾曲駆動部33と、画像生成部34と、表示部35と、記憶部36と、入力I/F(インターフェース)部37と、制御部38と、を有して構成されている。また、本体装置3には、USBメモリ等のような可搬型の外部記憶装置61を接続するための接続ポート40が設けられている。なお、接続ポート40は通信ケーブル(図示せず)を接続することも可能になされており、通信ケーブルを経由して画像処理システム51との間でデータを送受信することも可能である。
【0029】
光源駆動部31は、例えば、光源駆動回路を具備して構成されている。また、光源駆動部31は、制御部38の制御に応じ、発光素子21aを駆動させるための発光素子駆動信号を生成して出力するように構成されている。
【0030】
撮像素子駆動部32は、例えば、撮像素子駆動回路を具備して構成されている。また、撮像素子駆動部32は、制御部38の制御に応じ、撮像素子22bを駆動させるための撮像素子駆動信号を生成して出力するように構成されている。
【0031】
湾曲駆動部33は、例えば、モータ等を有して構成されている。また、湾曲駆動部33は、複数の湾曲用ワイヤBW各々の基端部に接続されている。また、湾曲駆動部33は、制御部38の制御に応じ、複数の湾曲用ワイヤBWの牽引量を個別に変化させることができるように構成されている。すなわち、湾曲駆動部33は、制御部38の制御に応じ、当該複数の湾曲用ワイヤBW各々の牽引状態を変化させることができるように構成されている。
【0032】
画像生成部34は、例えば、FPGA(Field Programmable Gate Array)等の集積回路により構成されている。また、画像生成部34は、撮像素子22bから出力される撮像信号に対して所定の信号処理を施すことにより内視鏡画像を生成するとともに、当該生成した内視鏡画像を制御部38へ順次出力するように構成されている。
【0033】
表示部35は、例えば、液晶パネルを具備して構成されている。また、表示部35は、制御部38から出力される表示画像を表示画面に表示するように構成されている。また、表示部35は、表示画面に表示されるGUI(グラフィカルユーザインターフェース)ボタン等に対するタッチ操作を検出するとともに、当該検出したタッチ操作に応じた指示を制御部38へ出力するタッチパネル35aを有して構成されている。
【0034】
記憶部36は、例えば、メモリ等のような記憶媒体を具備して構成されている。また、記憶部36には、例えば、内視鏡システム1の各部の制御に用いられるプログラム、及び、制御部38の動作に対応する種々のプログラムが格納されている。また、記憶部36には、画像生成部34において生成された内視鏡画像等を格納することができるように構成されている。
【0035】
入力I/F部37は、ユーザの入力操作に応じた指示を制御部38に対して行うことが可能なスイッチ等を具備して構成されている。
【0036】
制御部38は、例えば、CPU等のような1つ以上のプロセッサ38aを有して構成されている。また、制御部38は、タッチパネル35aまたは入力I/F部37の操作に応じてなされた指示に基づき、光源駆動部31及び撮像素子駆動部32に対する制御を行うことができるように構成されている。また、制御部38は、湾曲操作子6aの操作に応じてなされた指示に基づき、湾曲部12を湾曲させるための制御を湾曲駆動部33に対して行うことができるように構成されている。また、制御部38は、画像生成部34から出力される内視鏡画像等に対してGUIボタン等を重畳した表示画像を生成して表示部35へ出力することができるように構成されている。また、制御部38は、画像生成部34から出力される内視鏡画像をJPEG等の静止画像用のフォーマット、及び、MPEG4等の動画像用のフォーマットを用いてエンコードして外部記憶装置61に格納させることができるように構成されている。また、制御部38は、タッチパネル35aまたは入力I/F部37の操作に応じてなされた指示に基づき、外部記憶装置61に格納された画像を読み込むとともに、当該読み込んだ画像に応じた表示画像を生成して表示部35へ出力することができるように構成されている。また、制御部38は、表示部35へ出力する表示画像に対して色空間変換、インターレース/プログレッシブ変換及びガンマ補正等の所定の画像処理を施すように構成されている。
【0037】
本実施形態においては、プロセッサ38aが、記憶部36から読み込んだプログラムを実行することにより、制御部38と同様の処理及び動作等を行うものであってもよい。また、本実施形態においては、制御部38が、プロセッサ38aの代わりに、例えば、FPGA等の集積回路を有して構成されていてもよい。
【0038】
画像処理システム51は、プロセッサ52と、記憶装置53と、通信ユニット54とを含む。プロセッサ52は、中央処置装置(以下、CPUという)52a、ROM、RAMなどのハードウエア回路52bを有する。なお、プロセッサ52は、CPUに代えて、あるいはCPUとは別のFPGA等の集積回路を含んでもよい。
【0039】
記憶装置53は、各種ソフトウエアプログラムを記憶している。各ソフトウエアプログラムは、プロセッサ52のCPU52aにより読み出されて実行される。なお、各種プログラムの全部あるいは一部は、プロセッサ52のROMに格納されていてもよい。
【0040】
記憶装置53には、画像処理システム51の動作制御に用いられるプログラム、及び、被検体の三次元復元に係る処理を行うためのプログラムが記憶されている。また、記憶装置53には、被検体の三次元復元に係る処理に必要な各種設定値やパラメータなども記憶されている。また、記憶装置53には、内視鏡システム1など外部機器から取得する内視鏡画像等を格納することができるように構成されている。更に、記憶装置53には、被検体の三次元復元に係る処理の結果(以下、三次元復元結果と示す)も格納される。記憶装置53に格納された三次元復元結果は、内視鏡システム1などの外部機器により、通信ユニット54を経由してアクセス可能である。
【0041】
図3は、実施形態に係る画像処理システムの機能構成を説明するためのブロック図である。図3には、入力画像を用いて被検体である配管の三次元復元に係る処理に関する機能構成のみを示している。なお、本実施形態では、インクリメンタルSfМの手法を用いて三次元復元に係る処理行う場合について、以下に説明する。
【0042】
配管の三次元復元に係る処理は、画像処理システム51に設けられた画像処理部51aにおいて行われる。画像処理部51aは、画像取得部511と、特徴点対応付け部512と、初期化部513と、三次元復元部514と、円錐検出部515と、バンドル調整部516と、結果出力部517とを有して構成される。
【0043】
画像取得部511は、内視鏡システム1において連続的に撮像された配管の内視鏡画像など、配管の撮影画像を時系列に取得する。撮影画像は、一定時間間隔で時系列に順次取得される。配管の撮影画像は、配管検査中にリアルタイムで内視鏡システム1から取得してもよいし、過去の検査において取得し記憶された時系列の撮影画像を、外部記憶装置や記憶装置53などから取得してもよい。また、撮影画像のファイル形式や、サンプリングレートは特に限定されない。以下の説明において、時系列に入力される個々の撮影画像をフレームと示す。また、内視鏡システム1において撮影画像を撮像した時刻を、撮像した順に、0、1、2、…、t-1、t、t+1、…のように番号で表す。また、時刻tの撮影画像をフレームtと呼ぶ。
【0044】
特徴点対応付け部512は、画像取得部511において取得された各フレームから、例えばSIFT(Scaled Invariance Feature Transform)のようなアルゴリズムを用いて画像の局所的特徴を、二次元特徴点として抽出する。二次元特徴点は、通常、各フレームにおいて多数抽出される。抽出された複数の二次元特徴点を、二次元特徴点群と示す。そして、複数のフレーム間(例えば、フレームt-1とフレームt)において二次元特徴点同士の対応付けを行う。
【0045】
初期化部513は、初期画像ペアとして2つのフレームを選択する。初期画像ペアは、例えば、フレーム番号が最小のフレームと、2番目に小さいフレームが選択される。そして、初期画像ペアを用いて、三次元空間における初期画像ペアのカメラ位置姿勢を推定する。カメラ位置姿勢は、例えば、2フレーム間の5点以上の対応関係から、2フレームのカメラの相対的な位置姿勢(三次元空間での回転運動と並進運動)を推定するアルゴリズムなどを用いて推定する。また、初期化部513は、初期画像ペアにおいて推定されたカメラ位置姿勢、初期画像ペアにおける二次元特徴点の対応関係、及び、初期画像ペアの各フレームにおける二次元特徴点の撮影画像上での座標、の各情報に基づき、三次元空間における二次元特徴点の座標(三次元点座標)を算出する。三次元点座標の算出には、三角測量などの一般的な三次元座標算出手法を用いる。なお、二次元特徴点群に含まれる複数の二次元特徴点のそれぞれに対応する三次元点をまとめて、三次元点群と示す。なお、初期化における初期画像ペアの選択方法、カメラ位置姿勢推定および三次元点の座標算出方法等は、記載の手法に限らず、先行技術文献に記載の様に種々安定化手法を取り入れてよい。
【0046】
三次元復元部514は、入力フレーム(例えば、フレームt)の二次元特徴点と、既に復元済の三次元点との対応付け情報から、入力フレームのカメラ位置姿勢を推定する。カメラ位置姿勢の推定は、例えば、公知の手法であるPnP(Perspective-n-Points)問題を解くことにより推定することができる。また、三次元復元部514は、入力フレームを用いて三次元点座標を算出し、新たな三次元点を復元する。
【0047】
推定部としての円錐検出部515は、新たな三次元点を含む三次元点群を用い円錐を検出する。一般的なインクリメンタルSfMに係る処理では、逐次誤差の蓄積によってスケールドリフトが発生し、三次元復元結果に大きな誤差や歪みが生じてしまう。そこで、本実施形態では、被検体が配管、すなわち、一定の内径を有する筒形であることに着目し、該筒型の内壁に三次元点が位置することを利用して、三次元点の位置補正を行う。入力フレームにおいて円錐を検出し、円錐の軸(円錐の頂点から底辺の円の中心を結ぶ線)を、配管の中心軸として推定する。そして、円錐の軸から配管の半径(内径)の距離にある位置に三次元点をフィッティングすることにより、スケールドリフトを抑制する。なお、本実施形態では、配管の形状である筒型の中心軸を、スケールドリフトにより三次元点群に拡縮が生じた場合でも安定して推定するために、円錐を検出しているが、円錐のかわりに円筒など中心軸が特定できる形状を検出してもよい。また、配管が長手方向である被写体であることを利用して、三次元点群に主成分分析(PCA)を適用し、その主軸を中心軸としても良い。
【0048】
円錐検出部515は、円錐検出と帰属判定とを行う。まず、円錐検出について説明する。円錐検出は、例えば、D. Lopez-Escogido and L. G. de la Fraga, “Automatic extraction of geometric models from 3D point cloud datasets,” in Proc. Electrical Engineering, Computing Science and Automatic Control (CCE), 2014.に開示されている手法を用いる。同次座標系の三次元点X=[x,y,z,l]が以下に示す(1)式を満たす場合、円錐の表面を表すと仮定する。
【0049】
なお、Cは対称行列であり、以下に示す(2)式のように分解できる。
【0050】
なお、cは円錐の傾きを表す定数(パラメータ)である。また、[R,t]は、z軸を円錐の主軸に揃える座標変換を表す三次元回転及び並進移動を表している。すなわち、[R,t]は、検出された円錐の軸(円錐の頂点から底辺の円の中心を結ぶ線)を表している。上記(1)式は、次に示す(3)式のように書き換えることができる。
【0051】
なお、verh()は行列の下三角部分をベクトル化することにより得られる対称行列の半ベクトル化変換である。従って、(3)式の最小解は、9つの点で与えられる。このように、新たに復元された三次元点をフィッティングさせることにより、円錐形状を検出して円錐の軸を算出する。また、ノイズ点の影響を軽減するため、例えば、M. A. Fischler and R. C. Bolles, “Random sample consensus: a paradigm for model fitting with applications to image analysis and automated
cartography,” Comm. ACM, vol. 24, no. 6, pp. 381-395, 1981. に開示されている RANSACの手法を用いる。検出された円錐は、円錐モデルとして登録される。なお、被検体である配管が複数の直管を組み合わせて構成されている場合、各直管に対応する複数の異なる円錐が検出される。この場合、円錐モデルには識別子(IDなど)を付与し、異なる円錐に対応する円錐モデルには異なる識別子を付与する。例えば、検査開始後、最初に検出され登録された円錐モデルにはID=0を付与する。次に新しく検出され登録された円錐モデルにはID=1、その次に検出され登録された円錐モデルにはID=2…のように、異なる円錐モデルが登録される都度、ID番号をインクリメントして付与する。
【0052】
次に、帰属判定について説明する。帰属判定とは、入力フレームが既に検出されている円錐に属するか否の判定である。具体的には、入力フレームにおいて復元された複数の三次元点のうち、既に検出されている円錐の内表面に位置すると判定される三次元点の数や割合(既に検出されている円錐への三次元点のインライヤ数や割合)に基づき判定される。インライヤ数や割合が所定の閾値を超える場合、当該フレームは既に検出されている円錐に帰属すると判定される。インライヤ数や割合が所定の閾値以下である場合、当該フレームは既に検出されている円錐には帰属しないと判定される。既に検出されている円錐に属すると判定されたフレームや三次元点は、当該円錐に対応する円錐モデルに付与されているIDに紐づけられる。なお、帰属判定は、入力フレームにおいて復元された複数の三次元点のうち、既に検出されている円錐の内表面に位置しないと判定される三次元点の数や割合(既に検出されている円錐への三次元点のアウトライヤ数や割合)に基づき判定してもよい。
【0053】
バンドル調整部516は、復元された三次元点やカメラ位置姿勢を補正する。バンドル調整部516は、再投影誤差と、円筒との誤差とを同時に最小化(最適化)することによりスケールドリフトを抑制する。ことにより、復元にかかる誤差を小さくする。バンドル調整部516は、具体的には、以下に示す(4)式を最小化するように、復元された三次元点やカメラ位置姿勢を補正する。
【0054】
なお、Xは、三次元点の座標、Pは、登録された画像のカメラ位置姿勢、Kは、カメラの内部パラメータ、Cは、検出された円錐パラメータを示す変数である。(4)式の右辺第1項であるErep(X,P,K)は、一般的なバンドル調整で用いられる再投影誤差項である。また、(4)式の右辺第2項であるEcly(X,C)は、円筒拘束項である。αは、再投影誤差項と円筒拘束項の重みを制御する定数スカラーである。
【0055】
再投影誤差項は、次の(5)式のように表される。
【0056】
なお、ρはロバスト関数であり、qijは、Xに対応する二次元点を表している。(Xは、j番目の三次元点を表す。)また、π(P,K,X)は、三次元点の画像面への投影関数を示しており、Pはi番目のカメラ姿勢、Kはi番目のカメラ内部パラメータを表している。すなわち、再投影誤差とは,画像上の特徴点の二次元座標と、該特徴点を三次元復元して得られた三次元点を、画像上に再投影して得られる二次元座標との差である。再投影誤差項の値が小さいほど、カメラ位置姿勢の推定精度や三次元点の復元精度がよいといえる。
【0057】
円筒拘束項は、次の(6)式のように表される。
【0058】
なお、rは既知の円筒半径値(配管の半径、円筒の中心軸から内表面までの距離)である。d(X, [R,t])は、j番目の三次元点であるXの、円筒軸からの距離を算出する関数であり、[R,t]は、検出した円錐の軸を表している。ここで、図4を用いて、関数dの具体的な算出方法について説明する。図4は、バンドル調整に用いる誤差関数の円筒拘束項を説明するための図である。図4において、太線は、被検体である配管をモデル化した円筒の表面を表している。また、二点鎖線で示す直線は、該円筒の延伸方向における中心軸(円筒軸)を表している。ここで、中心軸(円筒軸)は先に検出した円錐の軸に等しい。また、Vは、円筒軸上の任意点を表しており、ベクトルnは、円筒軸方向の単位ベクトルを表している。
【0059】
図4において、三次元点Xの円筒軸からの距離dは、ベクトルVとベクトルnとの外積で算出される。すなわち、関数dは、次の(7)式のように表される。
【0060】
基準スケールとして用いられる、既知の円筒半径値rと、(7)式で算出される三次元点Xの円筒軸からの距離dとの差が小さいほど、三次元点の復元精度がよいといえる。
【0061】
バンドル調整部516は、既に検出されている円錐モデルに帰属するフレームや三次元点については、(4)式(再投影誤差項と円筒拘束項とを含む式)を用いてバンドル調整を行う。一方、いずれの円錐モデルにも帰属しないフレームや三次元点については、(5)式(再投影誤差項のみの式)を用いてバンドル調整を行う。すなわち、円錐モデルに帰属するフレームや三次元点については、再投影誤差最小化の観点に加え、既知のスケール(筒状の配管における配管延伸方向と平行な中心軸から配管内面までの距離)と、復元後の三次元点の円錐の軸からの距離の誤差の総和を最小化するように、カメラ位置姿勢及び三次元点座標が補正される。従って、スケールドリフトを抑制することができ、復元された配管の形状が先細りになるのを防止したり、延伸方向のずれを小さくしたりすることができるため、精度よく三次元復元することができる。
【0062】
結果出力部517は、1フレーム分のバンドル調整が終了するたびに、三次元復元結果(具体的には、バンドル調整後の三次元点座標、及び、カメラ位置姿勢)を、記憶装置53や内視鏡システム1、外部記憶装置などに対して出力する。
【0063】
このように構成された画像処理システム51における、三次元復元に係る処理の詳細について、図5を用いて説明する。図5は、実施形態に係る画像処理システムにおいて行われる処理等を説明するためのフローチャートである。
【0064】
画像取得部511は、内視鏡システム1において連続的に撮像された配管の撮影画像を、時系列に取得する(図5、ステップS1)。少なくとも最初の2フレーム(フレーム0、フレーム1)を取得すると、特徴点対応付け部512において、最後に入力されたフレームと、その直前に入力されたフレームについて二次元特徴点を抽出し、二次元特徴点同士の対応付けを行う(図5、ステップS2)。
【0065】
カメラ姿勢位置が推定されていない場合(図5、ステップS3、No)、初期化部513は、入力された2つのフレームであって、二次元特徴点同士に対応付けがなされているものを選択し初期化を行う(図5、ステップS4)。具体的には、選択した2つのフレームを初期画像ペアとし、三次元空間における初期画像ペアのカメラ位置姿勢を推定する。また、初期化部513は、三次元空間における二次元特徴点の座標(三次元点座標)を算出する。
【0066】
ステップS4において初期化が終了すると、処理対象かつ未取得のフレームが存在する場合(図5、ステップS10、Yes)、ステップS1に戻り次のフレーム(フレーム2)を取得する。続いて、特徴点対応付け部512において、取得したフレームにおける二次元特徴点を抽出し、直前に取得したフレームとの間で二次元特徴点同士の対応付けを行う(図5、ステップ2)。
【0067】
カメラ姿勢位置の推定などの初期化は既に完了しているので(図5、ステップS3、Yes)、三次元復元部514は、最新の取得フレームの二次元特徴点と、既に復元済の三次元点との対応付け情報から、最新の取得フレームのカメラ位置姿勢を推定する。また、三次元復元部514は、入力フレームを用いて三次元点座標を算出し、新たな三次元点の復元を行う(図5、ステップS5)。
【0068】
続いて、円錐検出部515は、入力フレームにおいて検出された三次元点を用い、円錐を検出する(図5、ステップS6)。ステップS6における円錐検出処理の具体的な手順を、図6に示すフローチャートを用いて説明する。図6は、図5における円錐検出処理を説明するためのフローチャートである。
【0069】
まず、円錐検出部515は、帰属判定を行う(図6、ステップS61)。フレーム2の処理時点では、円錐検出は行われておらず、円錐自体が未検出であるので、帰属判定対象の円錐が存在しない。従って、帰属判定結果としては「円錐に帰属しない」となる。既に他のフレームから1つ以上の円錐が検出されており円錐モデルとして登録されている場合、登録されている円錐モデルに対し、ステップS5において復元された三次元点について、登録されている円錐モデルに対する帰属判定を行う。帰属判定は、円錐モデルへの復元された三次元点のインライヤ数と割合を基準に判定する。インライヤ数や割合が基準として設定されている閾値より大きい場合、最新の取得フレームは「円錐に帰属する」と判定する。この場合、当該フレーム、及び、インライヤの三次元点を、帰属する円錐モデルのIDにラベリングし、帰属関係を明確にする。一方、インライヤ数や割合が基準として設定されている閾値以下の場合、当該フレームは「円錐に帰属しない」と判定する。ここでは、帰属判定を、円錐から判定しているが、円筒半径値と推定した中心軸とで構成される円筒から判定してもよい。
【0070】
次に、円錐検出部515は、円錐検出を行う(図6、ステップS62)。ステップS61において、「円錐に帰属しない」と判定されたフレームは、いずれの円錐モデルにも帰属していない三次元点に対して、新たな円錐検出を行う。新たに検出した円錐に関し、円錐検出に用いた三次元点のインライヤ数と割合を求める。これらが基準として設定されている閾値よりも大きい場合、円錐検出に成功したと判定し、検出した円錐を新たな円錐モデルとして登録する。そして、当該フレームを、「円錐に帰属する」と判定する。この場合、当該フレーム、及び、インライヤの三次元点を、新規に登録した円錐モデルのIDにラベリングし、帰属関係を明確にする。
【0071】
一方、ステップS61において、「円錐に帰属する」と判定されたフレームは、当該フレームにおいて新たに復元した三次元点の中から、円錐モデルについてインライヤと判定された三次元点を抽出する。抽出された三次元点を、当該円錐モデルに既に帰属する三次元点に加えて、円錐検出を再度行い、当該円錐モデルの円錐パラメータを更新する。
【0072】
以上、図6のフローチャートに示す手順を実行し、図5のステップS6における円錐検出処理を終了すると、バンドル調整部516は、最新の取得フレームが登録されている円錐モデルのいずれかに帰属しているか否かを判定する(図5、ステップS7)。図5にステップS6において、当該フレームが「円錐に帰属する」と判定されている場合(図5、ステップS7、Yes)、バンドル調整部516は、円錐モデルに帰属するフレームや三次元点については、(4)式(再投影誤差項と円筒拘束項とを含む式)を用いて円筒拘束バンドル調整を行う(図5、ステップS8)。一方、当該フレームが「円錐に帰属しない」と判定されている場合(図5、ステップS7、No)、いずれの円錐モデルにも帰属しないフレームや三次元点については、(5)式(円筒拘束項がない再投影誤差項のみの式)を用いてバンドル調整を行う(図5、ステップS9)。
【0073】
なお、図5のステップS8における円筒拘束バンドル調整、及び、ステップS9におけるバンドル調整の適用範囲は、以下の二種類がある。すなわち、最新の取得フレームの近傍範囲のみを適用範囲とするものと、全ての取得フレームを適用範囲とするものである。前者は、ローカルバンドル調整と呼ばれ、通常、フレームを取得する都度実行される。後者は、グローバルバンドル調整と呼ばれ、一定間隔ごとに(例えば、所定数のフレームが追加されたタイミングで)実行される。ローカルバンドル調整とグローバルバンドル調整とを適切な頻度で組み合わせて実行することで、処理コストの増大を抑制しつつ復元精度を向上させることができる。
【0074】
図5のステップS8における円筒拘束バンドル調整、または、ステップS9におけるバンドル調整が終了すると、処理対象かつ未取得のフレームが存在するか否かを判定する(図5、ステップS10)。処理対象のフレームが存在する場合(図5、ステップS10、Yes)、ステップS1に戻り次のフレーム(フレーム3)を取得し、当該フレームについて、ステップS2からステップS8(またはステップS9)の一例の処理を実行する。一方、全てのフレームについて処理が完了し、所定対象のフレームが存在しない場合(図5、ステップS10、No)、画像処理システム51における、三次元復元に係る一連の処理を終了する。なお、上述に示す一連の処理により算出された、三次元復元結果(複数の三次元点座標、及び、カメラ位置姿勢)を1つに統合するための高密度化処理を行うことにより、被検体の三次元形状モデルを作成することも可能である。
【0075】
バンドル調整により補正された三次元点座標、及び、カメラ位置姿勢は、結果出力部517から記憶装置53や内視鏡システム1、外部記憶装置などに対し、所定のタイミングで出力される。所定のタイミングとは、例えば、1フレーム分のバンドル調整が終了する都度としてもよいし、全てのフレームの処理後としてもよい。
【0076】
以上のように、上述した実施形態によれば、再投影誤差を最小化する条件に加え、配管の中心軸からの距離の誤差(配管の半径(内径)からの誤差)を最小化する円筒拘束条件を用いて、復元した三次元点座標のバンドル調整を行う。これにより、被写体である配管を撮像した画像に対し、スケールドリフトを抑制して精度の高い三次元復元を行うことができる、画像処理システム、及び、画像処理方法、並びに、画像処理プログラムを提供することができる。
【0077】
なお、バンドル調整の円筒拘束条件で用いる円筒半径値rは、設定値として検査者などにより予め与えられた値を用いることが望ましいが、三次元復元に係る上述の処理の初期段階において、例えば、円錐検出部515が、復元された三次元点座標と円錐の軸(推定した中心軸)との距離から推定した値を用いてもよい。
【0078】
また、図1に示すように、画像処理システム51は、インターネット70を含むネットワークを経由してクラウド80上のサーバ81と接続され、画像処理システム51の画像処理部51aにおける1つ以上の機能がサーバ81上で実行されるように構成してもよい。また、画像処理システム51は、記憶装置61と接続され、記憶装置61から入力画像を取得したり、記憶装置61へ三次元復元結果を出力したりすることが可能な構成にしてもよい。この場合、画像処理システム51と記憶装置61とは、直接的に接続されていてもよいし、インターネット70やLAN、WIFIなどの通信網を含むネットワークを経由して情報を送受信可能に接続されていてもよい。
【0079】
本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を変えない範囲において、種々の変更、改変等が可能である。
【符号の説明】
【0080】
1 内視鏡システム、2 内視鏡、3 本体装置、5 挿入部、6 操作部、6a 湾曲操作子、7 ユニバーサルコード、11 先端部、12 湾曲部、13 可撓管部、21 光源部、21a 発光素子、21b 照明光学系、22 撮像部、22a 観察光学系、22b 撮像素子、31 光源駆動部、32 撮像素子駆動部、33 湾曲駆動部、34 画像生成部、35 表示部、35a タッチパネル、36 記憶部、37 入力I/F部、38 制御部、38a プロセッサ、39 外部記憶装置、40 接続ポート、51 画像処理システム、51a 画像処理部、52 プロセッサ、52a 中央処理装置(CPU)、52b ハードウエア回路、53 記憶装置、54 通信ユニット、61 記憶装置、70 インターネット、80 クラウド、81 サーバ、100 配管検査システム、511 画像取得部、512 特徴点対応付け部、513 初期化部、514 三次元復元部、515 円錐検出部、516 バンドル調整部、517 結果出力部。
図1
図2
図3
図4
図5
図6