IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サージビジョン・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングの特許一覧

特表2024-533111異なる内視鏡ユニットを用いて取得した画像の位置合わせ
<>
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図1
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図2
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図3
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図4
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図5
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図6
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図7
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図8
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図9A
  • 特表-異なる内視鏡ユニットを用いて取得した画像の位置合わせ 図9B
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-12
(54)【発明の名称】異なる内視鏡ユニットを用いて取得した画像の位置合わせ
(51)【国際特許分類】
   A61B 1/045 20060101AFI20240905BHJP
   A61B 1/00 20060101ALI20240905BHJP
【FI】
A61B1/045 622
A61B1/00 511
A61B1/045 614
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024513706
(86)(22)【出願日】2022-09-12
(85)【翻訳文提出日】2024-04-24
(86)【国際出願番号】 EP2022075238
(87)【国際公開番号】W WO2023041469
(87)【国際公開日】2023-03-23
(31)【優先権主張番号】21197266.6
(32)【優先日】2021-09-16
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】522166138
【氏名又は名称】サージビジョン・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング
【氏名又は名称原語表記】SurgVision GmbH
(74)【代理人】
【識別番号】100145403
【弁理士】
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100189555
【弁理士】
【氏名又は名称】徳山 英浩
(74)【代理人】
【識別番号】100100479
【弁理士】
【氏名又は名称】竹内 三喜夫
(72)【発明者】
【氏名】タルティス,アドリアン
(72)【発明者】
【氏名】コッホ,マクシミリアン
(72)【発明者】
【氏名】ボズコ,ドミトリー
(72)【発明者】
【氏名】クラトゥンチェヴァ,ゲルガナ
【テーマコード(参考)】
4C161
【Fターム(参考)】
4C161CC06
4C161DD03
4C161NN01
4C161NN05
4C161NN09
4C161QQ02
4C161QQ04
4C161QQ07
4C161WW03
4C161WW04
4C161WW06
4C161WW17
(57)【要約】
内視鏡システム(100)を用いて患者(106)の身体部分(103)を撮像するための手法が提案される。対応する方法(500)が、両者間で移動可能な対応する内視鏡ユニット(115m,115b)の異なるプローブ(127n,127b)を用いて2つの一連の画像を取得するステップ(509~515)を含む。2つのシーケンスにおける各ペアの対応する画像は、例えば、対応する画像に従ってそれぞれ独立して推定される、これらのプローブ(127n,127b)の対応する動きに従って位置合わせされる(518~584)。画像を位置合わせするために使用できるニューラルネットワーク(439)を訓練するための方法(800)も提案される。内視鏡システム(100)を動作させ、ニューラルネットワーク(439)を訓練するための対応するコンピュータプログラム(400;700)およびコンピュータプログラム製品が提案される。
【特許請求の範囲】
【請求項1】
内視鏡システム(100)を用いて患者(106)の身体部分(103)を撮像するための方法(500)であって、
内視鏡システム(100)の第1内視鏡ユニット(115m)を用いて、第1内視鏡ユニット(115m)の第1プローブ(127m)を介して、身体部分(103)の少なくとも一部を含む第1視野(221m)の複数の第1画像の第1シーケンスを取得するステップ(515)と、
内視鏡システム(100)の第2内視鏡ユニット(115b)を用いて、第1プローブ(127m)に対して移動可能である第2内視鏡ユニット(115b)の第2プローブ(127b)を介して、第1画像に対応する複数の第2画像セットの第2シーケンスを取得するステップ(509~512)であって、第2画像セットの各々は、身体部分(103)の少なくとも一部を含む第2視野(221b)の1つ以上の第2画像を含む、ステップ(509~512)と、
コンピュータデバイス(242b)によって、複数の第1画像のうちの第1画像および対応する第2画像セットの第2画像の各位置合わせペアを位置合わせするステップ(518~584)と、
出力ユニット(121b)に、位置合わせ済みの各位置合わせペアの第1画像および第2画像に基づいて身体部分(103)の表現を出力するステップ(587)と、含む方法。
【請求項2】
方法(500)は、第2内視鏡ユニット(115b)を用いて、第1内視鏡ユニット(115m)の作業チャネル(112)の中に取り外し可能に挿入された第2プローブ(127b)を介して、第2画像セットの第2シーケンスを取得するステップ(509~512)を含む、請求項1に記載の方法(500)。
【請求項3】
コンピュータデバイス(242b)は、第1内視鏡ユニット(115m)と第2内視鏡ユニット(115b)の間の一方(115b)に含まれており、
方法(500)は、コンピュータデバイス(242b)によって、第1内視鏡ユニット(115m)および第2内視鏡ユニット(115b)の他方(115m)から、対応する第1画像セットの第1シーケンスまたは第2画像セットの第2シーケンスを受信するステップ(115)を含む、請求項1または2に記載の方法(500)。
【請求項4】
方法(500)は、コンピュータデバイス(242b)によって、第1プローブ(127m)と第2プローブ(127b)の対応する相対運動に起因した第1画像および第2画像の各位置合わせペアのための少なくとも1つの補正を決定するステップ(539~542;554~563;578~581)と、
コンピュータデバイス(242b)によって、対応する前記補正に従って、第1画像および第2画像の各位置合わせペアを位置合わせするステップ(548;569;584)と、を含む、請求項1~3のいずれかに記載の方法(500)。
【請求項5】
方法(500)は、コンピュータデバイス(242b)によって、複数の第1画像のうちの各現在画像について、および複数の第2画像セットのうちの各現在画像の現在の第2画像についてそれぞれ独立して、第1プローブ(115m)の第1動きおよび第2プローブ(115b)の第2動きを推定するステップ(554~557;539~542)であって、第1動きは、現在の第1画像に対応する複数の第1画像の推定セットに従って推定され、第2動きは、現在の第2画像に対応する複数の第2画像の推定セットに従って推定される、ステップ(554~557;539~542)と、
コンピュータデバイス(242b)によって、第1画像および第2画像のペアに対応して、それぞれ複数の第1画像および複数の第2画像のうちの1つ以上の計算セットの第1動きおよび第2動きに従って、第1画像および第2画像の各位置合わせペアのための補正を決定するステップ(560~563;539~542)と、を含む、請求項4に記載の方法(500)。
【請求項6】
方法(500)は、コンピュータデバイス(242b)によって、対応する第1画像の推定セットに従って、現在の第1画像ごとに第1動きを示す第1動きベクトルおよび、対応する第2画像の推定セットに従って、現在の第2画像ごとに第2動きを示す第2動きベクトルを推定するステップ(554~557)を含む、請求項5に記載の方法(500)。
【請求項7】
方法(500)は、コンピュータデバイス(242b)によって、対応する第1動きおよび第2動きに従って、対応する現在の第1画像および現在の第2画像の各ペアのミスアライメントを計算するステップ(560)と、
コンピュータデバイス(242b)によって、第1画像および第2画像の位置合わせペアから、対応する範囲および/または対応する時間的距離とともに減少して重み付けされた、第1画像および第2画像の対応する計算セットのミスアライメントに従って、第1画像および第2画像の各位置合わせペアのための補正を計算するステップ(563)とを含む、請求項5または6に記載の方法(500)。
【請求項8】
方法(500)は、コンピュータデバイス(242b)によって、第1画像および第2画像の各位置合わせペアについての第1画像の更なる推定セットおよび第2画像の更なる推定セットに基づいた入力データをニューラルネットワークに供給するステップ(539)と、
コンピュータデバイス(242b)によって、ニューラルネットワークから、第1画像および第2画像の各位置合わせペアのための補正を受信するステップ(542)と、を含む、請求項4~7のいずれかに記載の方法(500)。
【請求項9】
方法(500)は、ニューラルネットワーク(439)によって、複数の予め定義された補正の中から、第1画像および第2画像の各位置合わせペアのための補正を選択するステップ(542)を含む、請求項8に記載の方法(500)。
【請求項10】
ニューラルネットワーク(439)は、畳み込みニューラルネットワークであり、
該畳み込みニューラルネットワーク(439)は、畳み込みニューラルネットワーク(439)の処理方向に沿って複数のグループを含み、各グループは、1つ以上の畳み込み層と、これに続く最大値プーリング層と、予め定義された補正の対応する確率を提供する複数の全結合層とを含む、請求項8または9に記載の方法(500)。
【請求項11】
方法(500)は、第1内視鏡ユニット(115m)を用いて、第1視野(221m)の対応する場所を表す複数の第1値をそれぞれ含む第1画像の第1シーケンスを取得するステップ(515)と、
第2内視鏡ユニット(115b)を用いて、第2視野(221b)の対応する場所を表す複数の第2値をそれぞれ含む第2画像セットの第2シーケンスを取得するステップ(509~512)と、
コンピュータデバイス(242b)によって、各場所について更なる推定セットの第1画像の第1値および、更なる推定セットの第2画像の第2値を連結することによって得られる、第1画像および第2画像の各位置合わせペアのための入力データを、ニューラルネットワークに供給するステップ(539)と、含む、請求項8~10のいずれかに記載の方法(500)。
【請求項12】
方法(500)は、コンピュータデバイス(242b)によって、第1画像および前記第2画像の表示に従って、手動で入力される補正を受信するステップ(578~581)を含む、請求項4に記載の方法(500)。
【請求項13】
方法(500)は、第1内視鏡ユニット(115m)を用いて、第1視野(221m)の内容によって反射された可視光を表す対応する反射率画像である第1画像の第1シーケンスを取得するステップ(515)と、
第2内視鏡ユニット(115b)を用いて、第2視野(221b)内で発光物質によって放射された発光光を表す対応する発光画像および、第2視野(221b)の内容によって反射された可視光を表す対応する更なる反射率画像である、第2画像セットの第2シーケンスを取得するステップ(509~512)と、
コンピュータデバイス(242b)によって、対応する反射率画像および更なる反射率画像に従って、反射率画像および発光画像の各位置合わせペアのための補正を決定するステップ(539~542;554~563)と、
コンピュータデバイス(242b)によって、対応する補正に従って、反射率画像および発光画像の各位置合わせペアを位置合わせするステップ(548;569)と、
出力ユニット(121b)に、位置合わせされる各位置合わせペアの反射率画像および発光画像に基づいて身体部分(103)の表現を出力するステップ(587)と、含む、請求項4~12のいずれかに記載の方法(500)。
【請求項14】
方法(500)は、第1内視鏡ユニット(115m)を用いて、第1視野(221m)の内容によって反射された可視光を表す対応する反射率画像である第1画像の第1シーケンスを取得するステップ(515)と、
第2内視鏡ユニット(115b)を用いて、第2視野(221b)内で発光物質によって放射された発光光を表す対応する発光画像である第2画像セットの第2シーケンスを取得するステップ(509)と、を含む、請求項1~12のいずれかに記載の方法(500)。
【請求項15】
方法(500)は、第2内視鏡ユニット(115b)によって、蛍光物質である発光物質のための励起光を用いて第2視野(221b)を照射するステップ(506)と、
第2内視鏡ユニット(115b)を用いて、励起光に応答して、蛍光物質によって第2視野内で放射された蛍光光である発光光を表す対応する蛍光画像である対応する発光画像を含む第2画像セットの第2シーケンスを取得するステップ(509)と、を含む、請求項13または14に記載の方法(500)。
【請求項16】
発光物質は、方法(500)を実施する前に患者(106)に事前投与された発光剤である、請求項13~15のいずれかに記載の方法(500)。
【請求項17】
方法(500)は、第1内視鏡ユニット(115m)を用いて、カラーである第1画像の第1シーケンスを取得するステップ(515)と、
第2内視鏡ユニット(115b)を用いて、カラーである第2画像の第2シーケンスを取得するステップ(509~512)と、
コンピュータデバイス(242b)によって、グレースケールへの変換、ダウンサンプリング、および/または、対応する中央部分への限定によって、前記位置合わせ(536~572)のための第1画像および第2画像を準備するステップ(533)と、を含む、請求項1~16のいずれかに記載の方法(500)。
【請求項18】
請求項8~11のいずれかに記載の方法(500)で使用するニューラルネットワーク(439)を訓練するための方法(800)であって、
方法(800)は、コンピュータシステム(600)の制御の下で、
コンピュータシステム(600)に、少なくとも1人のサンプル患者(106)の少なくとも1つのサンプル身体部分(103)の複数の第1サンプル画像を提供するステップ(810)と、
コンピュータシステム(600)によって、対応する第1サンプル画像の形状を変化させ、その解像度を減少させ、そのコントラストを減少させ、それをズームインし、それを並進し、および/または、それにノイズを追加することによって、第1サンプル画像から、対応する合成画像を合成するステップ(815)と、
コンピュータシステム(600)によって、対応する基準動きを合成画像の1つにそれぞれ適用することによって、複数の第2サンプル画像を生成するステップ(820)と、
コンピュータシステム(600)によって、第2サンプル画像、対応する第1サンプル画像、および対応する参照動きのうちの1つをそれぞれ含む複数のトレーニングセットに従って、ニューラルネットワーク(439)を訓練するステップ(825~880)と、を含む、方法(800)。
【請求項19】
コンピュータプログラムがコンピュータデバイス(242b)上で実行された場合、内視鏡システム(100)を動作させて、患者(106)の身体部分(103)を撮像する方法(500)をコンピュータデバイス(242b)に実行させるように構成されたコンピュータプログラム(400)であって、該方法(500)は、
身体部分(103)の少なくとも一部を含む第1視野(221m)の複数の第1画像の第1シーケンスを受信するステップ(515)と、
第1画像に対応する複数の第2画像セットの第2シーケンスを受信するステップ(509~512)であって、第2画像セットの各々は、身体部分(103)の少なくとも一部を含む第2視野(221b)の1つ以上の第2画像を含む、ステップ(509~512)と、
複数の第1画像のうちの各現在画像について、および複数の第2画像セットのうちの各現在画像の現在の第2画像についてそれぞれ独立して、第1画像の第1シーケンスを取得するために使用される第1内視鏡ユニット(115m)の、第1プローブ(115m)の第1動きおよび、第2画像セットの第2シーケンスを取得するために使用される第2内視鏡ユニット(115b)の、第2プローブ(115b)の第2動きを推定するステップ(554~557;539~542)であって、第1動きは、現在の第1画像に対応する複数の第1画像の推定セットに従って推定され、第2動きは、現在の第2画像に対応する複数の第2画像の推定セットに従って推定される、ステップ(554~557;539~542)と、
第1画像および第2画像のペアに対応して、それぞれ複数の第1画像および複数の第2画像のうちの1つ以上の計算セットの第1動きおよび第2動きに従って、複数の第1画像のうちの第1画像および対応する第2画像セットのうちの第2画像の各位置合わせペアのための少なくとも1つの補正を決定するステップ(560~563;539~542)と、
対応する前記補正に従って、第1画像および第2画像の各位置合わせペアを位置合わせするステップ(548;569)と、
位置合わせされた各位置合わせペアの第1画像および第2画像に基づいて、身体部分(103)の表現を出力するステップ(587)と、を含む、コンピュータプログラム。
【請求項20】
コンピュータプログラムを具体化するコンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、
コンピュータプログラムは、コンピュータデバイスのワーキングメモリにロード可能であり、それにより、コンピュータプログラムがコンピュータデバイス上で実行された場合、内視鏡システムを動作させて、患者の身体部分を撮像する方法をコンピュータデバイスに実行するようにコンピュータデバイスを構成するものであり、
該方法は、身体部分の少なくとも一部を含む第1視野の複数の第1画像の第1シーケンスを受信するステップと、
第1画像に対応する複数の第2画像セットの第2シーケンスを受信するステップであって、第2画像セットの各々は、身体部分の少なくとも一部を含む第2視野の1つ以上の第2画像を含む、ステップと、
複数の第1画像のうちの各現在画像について、および複数の第2画像セットのうちの各現在画像の現在の第2画像についてそれぞれ独立して、第1画像の第1シーケンスを取得するために使用される第1内視鏡ユニットの、第1プローブの第1動きおよび、第2画像セットの第2シーケンスを取得するために使用される第2内視鏡ユニットの、第2プローブの第2動きを推定するステップであって、第1動きは、現在の第1画像に対応する複数の第1画像の推定セットに従って推定され、第2動きは、現在の第2画像に対応する複数の第2画像の推定セットに従って推定される、ステップと、
第1画像および第2画像のペアに対応して、それぞれ複数の第1画像および複数の第2画像のうちの1つ以上の計算セットの第1動きおよび第2動きに従って、複数の第1画像のうちの第1画像および対応する第2画像セットのうちの第2画像の各位置合わせペアのための少なくとも1つの補正を決定するステップと、
対応する前記補正に従って、第1画像および第2画像の各位置合わせペアを位置合わせするステップと、
位置合わせされた各位置合わせペアの第1画像および第2画像に基づいて、身体部分の表現を出力するステップと、を含むコンピュータプログラム製品。
【請求項21】
コンピュータプログラムがコンピュータシステム(600)上で実行された場合、コンピュータシステム(600)に、請求項18に記載の方法(800)を実行させるように構成されたコンピュータプログラム(700)。
【請求項22】
コンピュータプログラムを具体化するコンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、
コンピュータプログラムは、コンピュータシステムのワーキングメモリにロード可能であり、それにより、コンピュータプログラムがコンピュータシステム上で実行された場合、請求項18に記載の方法を実行するようにコンピュータシステムを構成する、コンピュータプログラム製品。
【請求項23】
請求項1~17のいずれかに記載の方法(500)のステップを実行するための内視鏡システム(100)であって、
第1画像の第1シーケンスを取得するための第1内視鏡ユニット(115m)と、
第2画像セットの第2シーケンスを取得するための第2内視鏡ユニット(115b)と、
第1画像および第2画像の各位置合わせペアを位置合わせするためのコンピュータデバイス(242b)と、
身体部分(103)の表現を出力するための出力ユニット(121b)と、を備える内視鏡システム(100)。
【請求項24】
請求項23に記載の内視鏡システムにおいて使用される内視鏡装置(115b)であって、
内視鏡装置(115b)は、第1内視鏡ユニット(115m)と第2内視鏡ユニット(115b)との間の一方(125b)を備え、
前記内視鏡ユニット(115b)は、
第1画像の第1シーケンスと第2画像セットの第2シーケンスとの間の対応する一方を取得するための取得ユニット(224b~239b)と、
第1内視鏡ユニット(115m)および第2内視鏡ユニット(115b)の他方(115m)から、第1画像の第1シーケンスおよび第2画像セットの第2シーケンスの他方を受信するためのインタフェース(124b)と、
第1画像および第2画像の各位置合わせペアを位置合わせするためのコンピュータデバイス(242b)と、
位置合わせされている各位置合わせペアの第1画像および第2画像に基づいて身体部分(103)の表現を出力するための出力ユニット(121b)と、を備える内視鏡装置(115b)。
【請求項25】
患者(106)の身体部分(103)を撮像するために内視鏡システム(100)を動作させるためのコンピュータデバイス(242b)であって、コンピュータデバイス(242b)は、
身体部分(103)の少なくとも一部を含む第1視野(221m)の複数の第1画像の第1シーケンスを受信(515)するための手段(412)と、
第1画像に対応する複数の第2画像セットの第2シーケンスを受信(509~512)するための手段(403)であって、第2画像セットの各々は、身体部分(103)の少なくとも一部を含む第2視野(221b)の1つ以上の第2画像を含む、手段(403)と、
複数の第1画像のうちの各現在画像について、および複数の第2画像セットのうちの各現在画像の現在の第2画像についてそれぞれ独立して、第1画像の第1シーケンスを取得するために使用される第1内視鏡ユニット(115m)の、第1プローブ(115m)の第1動きおよび、第2画像セットの第2シーケンスを取得するために使用される第2内視鏡ユニット(115b)の、第2プローブ(115b)の第2動きを推定(554~557;539~542)するための手段(427;439)であって、第1動きは、現在の第1画像に対応する複数の第1画像の推定セットに従って推定され、第2動きは、現在の第2画像に対応する複数の第2画像の推定セットに従って推定される、手段(427;439)と、
第1画像および第2画像のペアに対応して、それぞれ複数の第1画像および複数の第2画像のうちの1つ以上の計算セットの第1動きおよび第2動きに従って、複数の第1画像のうちの第1画像および対応する第2画像セットのうちの第2画像の各位置合わせペアのための少なくとも1つの補正を決定(560~563;539~542)するための手段(426;439)と、
対応する前記補正に従って、第1画像および第2画像の各位置合わせペアを位置合わせ(548;569)するための手段(448)と、
位置合わせされた各位置合わせペアの第1画像および第2画像に基づいて、身体部分(103)の表現を出力(587)するための手段(454)と、を備えるコンピュータデバイス(242b)。
【請求項26】
患者の身体部分を撮像するために内視鏡システムを動作させるためのコンピュータデバイスであって、コンピュータデバイスは、
身体部分の少なくとも一部を含む第1視野の複数の第1画像の第1シーケンスを受信するための回路と、
第1画像に対応する複数の第2画像セットの第2シーケンスを受信するための回路であって、第2画像セットの各々は、身体部分(103)の少なくとも一部を含む第2視野(221b)の1つ以上の第2画像を含む、回路と、
複数の第1画像のうちの各現在画像について、および複数の第2画像セットのうちの各現在画像の現在の第2画像についてそれぞれ独立して、第1画像の第1シーケンスを取得するために使用される第1内視鏡ユニットの、第1プローブの第1動きおよび、第2画像セットの第2シーケンスを取得するために使用される第2内視鏡ユニットの、第2プローブの第2動きを推定するための回路であって、第1動きは、現在の第1画像に対応する複数の第1画像の推定セットに従って推定され、第2動きは、現在の第2画像に対応する複数の第2画像の推定セットに従って推定される、回路と、
第1画像および第2画像のペアに対応して、それぞれ複数の第1画像および複数の第2画像のうちの1つ以上の計算セットの第1動きおよび第2動きに従って、複数の第1画像のうちの第1画像および対応する第2画像セットのうちの第2画像の各位置合わせペアのための少なくとも1つの補正を決定するための回路と、
対応する前記補正に従って、第1画像および第2画像の各位置合わせペアを位置合わせするための回路と、
位置合わせされた各位置合わせペアの第1画像および第2画像に基づいて、身体部分(103)の表現を出力(587)するための回路と、を備えるコンピュータデバイス(242b)。
【請求項27】
請求項18に記載の方法(800)のステップを実行するように構成された手段(700)を含むコンピュータシステム(600)。
【請求項28】
請求項18に記載の方法の各ステップを実行するように構成された回路を備えるコンピュータシステム(600)。
【請求項29】
請求項1~17のいずれかに記載の方法に従って、患者の身体部分を撮像し、これにより身体部分の手術処置中に、身体部分の表現を出力するステップと、
その表現の出力に従って、身体部分を手術するステップと、を含む手術方法。
【請求項30】
請求項1~17のいずれかに記載の方法を実行することによって、患者の身体部分を撮像し、これにより患者の診断処置中に、身体部分の表現を出力するステップと、
その表現の出力に従って、身体部分の健康状態を評価するステップと、を含む診断方法。
【請求項31】
請求項1~17のいずれかに記載の方法を実行することによって、患者の身体部分を撮像し、これにより身体部分の治療処置中に身体部分の表現を出力するステップと、
その表現の出力に従って、患者を治療するステップと、を含む治療方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、医療機器の分野に関する。より具体的には、本開示は、内視鏡に関する。
【背景技術】
【0002】
本開示の背景を、その文脈に関連する技術の議論とともに以下に紹介する。しかしながら、この議論が文書、行為、成果物などを参照する場合でも、それは、議論される技術が先行技術の一部であること、または本開示に関連する分野における共通の一般知識であることを示唆したり表現したりするものではない。
【0003】
内視鏡は、例えば、診断、手術、治療の目的(例えば、消化管に影響を与える症状を調査し、可能ならば腫瘍を切除するための胃内視鏡検査など)のため、通常は目に見えない患者の身体部分を撮像するために、いくつかの医療処置(内視鏡検査)で一般に使用される。
【0004】
この目的のために、内視鏡が、患者の身体部分によって画定される空洞の中に(自然開口または小さな切開を経由して)直接に挿入される(一般に可撓性)細長いプローブを備える。プローブの先端が、対応する医療処置のために身体部分の関心領域(問題の例では可能性のある腫瘍を備えた消化管の部分)に到達するために使用される。プローブの先端は、対象領域を照射して、その画像を取得することを可能にし、その画像は、その表示のためにモニタに提供される。プローブはまた、1つ以上の作業チャネルを有し、それを経由して医療処置中に使用するための様々なツールが挿入できます(例えば、(疑わしい)腫瘍のサンプルを採取したり、(特定された)腫瘍を切除したりするため)。内視鏡により、医師が医療処置中に空洞を内部観察でき、同時に患者にとって最小限の外傷を伴う。
【0005】
最近、蛍光イメージングをベースとした内視鏡技術が臨床研究に導入されている(例えば、腫瘍の早期検出を改善するため)。蛍光イメージングは、蛍光現象を利用しており、これは、照射されると蛍光光を放射する蛍光物質(蛍光色素分子(fluorophore)と称される)で発生する。この場合、蛍光剤(特定のターゲット(この場合は腫瘍)に到達し、そしてそこに固定された状態になるように構成される)が患者に投与される。そして、身体部分の関心領域の画像が取得され、表示のためにモニタに提供される。この場合、画像は、身体部分の関心領域から放射される蛍光光によって定義され、そしてそこに存在する蛍光色素分子を表現する。従って、これらの画像における(固定化された)蛍光剤の表現により、ターゲットの識別(および定量化)を容易にする。
【0006】
標準の(内視鏡)技術と蛍光(内視鏡)技術としてそれぞれ区別される上述の内視鏡技術を一緒に利用することも可能である。特に、標準技術をベースとした内視鏡が、(反射率)画像を取得してモニタ上に表示するために使用でき、蛍光技術をベースとした内視鏡が、(蛍光)画像を取得してモニタ上に表示するために使用できる。
【0007】
さらに、蛍光技術をベースとした簡素化内視鏡ユニット(ベビースコープと称される)を、標準技術をベースとした内視鏡(マザースコープと称される)の作業チャネルの中に挿入できる。これは、費用対効果が高い。理由は、マザースコープの他の機能(例えば、空洞内でのステアリングなど)を利用する(より簡単な)ベビースコープの追加とともに、既に利用可能なマザースコープを使用できるためである。さらに、これにより、マザースコープ(ビデオスコープ)で利用されるチップオンチップイメージング技術と、ベビースコープで利用されるファイババンドルを経由したイメージング(改善した感度を提供する)との組合せが可能になる。さらに、同じマザースコープ(患者の空洞に既に挿入されている)を、他の異なる医療処置に使用できる。例えば、可能性のある腫瘍を解析するために、ベビースコープをマザースコープの作業チャネルの中に挿入するのを開始することが可能である。その後、ベビースコープは取り外され、他のツールが同じ作業チャネルの中に挿入され、または、ベビースコープはマザースコープ内に維持され、別のツールが追加の作業チャネルの中に挿入される。前記更なるツールは、例えば、(疑いのある)腫瘍のサンプルを採取したり、(識別された)腫瘍を切除するために使用される。この場合も、マザースコープで取得した反射率画像はモニタ上に表示され、ベビースコープで取得した蛍光画像はモニタ上に表示される。
【0008】
しかしながら、異なるモニタ上に表示される反射率画像および蛍光画像によって提供される情報の相関関係は、困難である場合がある。これは、反射率画像および蛍光画像が、例えば、形状、ズーミング(拡大縮小)、解像度、コントラスト、ノイズなどの観点で著しく異なるという事実によってさらに邪魔される。さらに、ベビースコープは、一般に、マザースコープの作業チャネル内に固定されていないため、医療処置中に、例えば、患者の蠕動運動や不可避の動きに起因して、ベビースコープとマザースコープの間の未知の動き(例えば、往復回転、並進)が発生する。その結果、発光画像と反射率画像との間に対応するミスアライメント(位置ずれ)が生じ、医師の判断を誤らせることになる。
【発明の概要】
【課題を解決するための手段】
【0009】
本開示の簡略化した要旨は、ここでは、その基本的な理解を提供するために提示している。しかしながら、この要旨の唯一の目的は、本開示のいくつかの概念を、下記のより詳細な説明の前置きとして簡略化した形態で導入することである。それは、そのキー要素の識別としてもその範囲の描写としても解釈されるべきでない。
【0010】
一般論として、本開示は、異なる内視鏡ユニットで取得された画像を位置合わせするアイデアをベースとしている。
【0011】
特に、一態様が、内視鏡システムを用いて患者の身体部分を撮像するための方法を提供する。この方法は、両者間で移動可能である(対応する内視鏡ユニットの)異なるプローブを用いて2つの画像シーケンスを取得するステップを含む。2つのシーケンスにおける各ペアの対応する画像は、例えば、対応する画像に従ってそれぞれ独立して推定されるこれらのプローブの対応する動きに従って位置合わせされる。
【0012】
更なる態様が、画像を位置合わせするために使用できるニューラルネットワークを訓練するための方法を提供する。
【0013】
更なる態様が、内視鏡システムを動作させるためのコンピュータプログラムを提供する。
【0014】
更なる態様が、対応するコンピュータプログラム製品を提供する。
【0015】
更なる態様が、ニューラルネットワークを訓練するためのコンピュータプログラムを提供する。
【0016】
更なる態様が、対応するコンピュータプログラム製品を提供する。
【0017】
更なる態様が、身体部分を撮像化するための対応する内視鏡システムを提供する。
【0018】
更なる態様が、内視鏡ユニットのうちの1つを備える内視鏡装置を提供する。
【0019】
更なる態様が、内視鏡システムを動作させるためのコンピュータデバイスを提供する。
【0020】
更なる態様が、ニューラルネットワークを訓練するためのコンピュータシステムを提供する。
【0021】
更なる態様が、対応する手術方法を提供する。
【0022】
更なる態様が、対応する診断方法を提供する。
【0023】
更なる態様が、対応する治療方法を提供する。
【0024】
より詳細には、本開示の1つ以上の態様が独立請求項に記述され、その有利な特徴が従属請求項に記述されており、全ての請求項の言い回しは、参照により文字どおりにここに組み込まれている(他の全ての態様に準用される任意の特定の態様を参照して提供される任意の有利な特徴を備える)。
【図面の簡単な説明】
【0025】
本開示の手法、そしてその追加の特徴および利点は、下記詳細な説明を参照して、添付図面と関連して読まれる非限定的な表示を単に用いて、最善に理解されるであろう(ここで、簡略化のために、対応する要素は等しいまたは類似の参照符号が付与され、それらの説明は繰り返さず、各実体の名前は、一般にそのタイプおよびその属性(例えば、値、内容および表現)の両方を示すために使用される)。
【0026】
図1】本開示の一実施形態による内視鏡システムの図解表現を示す。
図2】本開示の一実施形態による手法を実施するために使用できる内視鏡システムの機能ブロック図を示す。
図3】本開示の一実施形態による手法の一般原理を示す。
図4】本開示の一実施形態による手法を実装するために使用できる主要なソフトウェアコンポーネントを示す。
図5】本開示の一実施形態による手法の実装に関連する動作のフローを説明する動作図を示す。
図6】本開示の一実施形態による手法のニューラルネットワークを訓練するために使用できるコンピュータシステムの概略ブロック図を示す。
図7】本開示の一実施形態による手法においてニューラルネットワークを訓練するために使用できる主要なソフトウェアコンポーネントを示す。
図8】本開示の一実施形態による手法におけるニューラルネットワークの訓練に関連する動作のフローを説明する動作図を示す。
図9A】本開示の一実施形態による手法の様々な適用例を示す。
図9B】本開示の一実施形態による手法の様々な適用例を示す。
【発明を実施するための形態】
【0027】
特に図1を参照すると、本開示の一実施形態による内視鏡システム100の図解表現を示している。
【0028】
内視鏡システム、または単に内視鏡100は、それによって画定される空洞(身体部分103の空洞は通常は見えない)内の患者106の身体部分103を撮像するための医療処置において使用される。身体部分103は、医療処置のターゲット、例えば、検査、切除または治療の対象となる腫瘍109などの病変を含む。身体部分103の空洞は、患者106の天然開口部または皮膚の小さな切開部である開口112を経由してアクセス可能である。例えば、診断用途では、内視鏡100により病変を発見/監視することが可能になり、(低侵襲性)手術用途では、内視鏡100により、切除すべき病変を識別することが可能になり、治療用途では、内視鏡100により、治療すべき病変を描写することが可能になる。これらの医療処置の例は、診断用途については胃カメラ検査、結腸内視鏡検査、食道鏡検査などがあり、手術用途については関節鏡検査、腹腔鏡検査、胸腔鏡検査などがあり、治療用途では焼灼、拡張、ステント留置などがある。
【0029】
内視鏡100は、標準(内視鏡)技術(人間の目に見えるものを表示するため)と組み合わせて、蛍光(内視鏡)技術(例えば、患者106に事前投与された、腫瘍内に蓄積するように適合した蛍光剤などの蛍光物質を表示するため)を適用するために使用される従来にない構造を有する。この目的のために、内視鏡100は、2つの内視鏡ユニット、即ち、(第1)メイン内視鏡ユニット115m(これ自体は臨床現場で使用される従来の装置である)と、(第2)補助内視鏡ユニット115bとで構成される。
【0030】
メイン内視鏡ユニット、または単にマザースコープ115mは、下記のコンポーネントを備える。マザースコープ115mの中央ユニットが、その動作を管理するために使用される。例えば、中央ユニットは、台車(トロリー)118mとして実装され、4つのキャスターが、その対応する下隅に配置され、その移動を容易にする(フットブレーキ(不図示)が台車118mを所定位置に固定するために設けられる)。モニタ121m(例えば、台車118mの上部に搭載される)が、医療処置中に身体部分103の画像を表示するために使用される。ビデオインタフェース124m(例えば、台車118mの背面にあるシリアルデジタルインタフェース(SDI)ポート)が、外部とビデオ情報を交換するために使用される。プローブ127m(例えば、ケーブルを介して台車118mに接続される)が、患者106に作用するために使用される。例えば、プローブ127mは、身体部分103の空洞の中に挿入するための細長いシャフトとして実装される。プローブ127mのシャフトは、剛性または好ましくは可撓性でもよく、身体部分103の空洞が湾曲した経路を有する場合でも、身体部分103の空洞を通って摺動するのを可能にする。プローブ127mの遠位端、または先端130mが、身体部分103の空洞内の医療処置の関心領域に到達して、それを照射し、その(反射)画像を取得するために使用される(下記に説明するように)。プローブ127mの近位端(空洞103の外側)には、先端130mを駆動するためのハンドル133mが設けられる(制御ケーブルを介して、不図示)。プローブ127mは、1つ以上の作業チャネル(その近位端に近い、対応する1つ以上の作業ポートを経由してアクセス可能)を有し、図では1つだけが参照符号136mで示されている。作業チャネルにより、医療処置中に使用される様々なツール(例えば、スネア、鉗子、ナイフ、クリップアプライヤなど)を挿入することを可能する。専用の作業チャネルが、医療処置中に先端130mおよび身体部分103の空洞を洗浄するために、液体注入器/抽出器(不図示)に接続できる。
【0031】
補助内視鏡ユニット、または単にベビースコープ115bは、下記のコンポーネントを備える。上述のように、ベビースコープ115bの中央ユニットが、その動作を管理するために使用される。例えば、中央ユニットは、台車118bとして実装される(その移動を容易にする4つのキャスターと、台車118bを所定位置に固定するためのフットブレーキとを備える)。モニタ121b(例えば、台車118bの上部に搭載される)が、医療処置中に身体部分103の空洞の(更なる)画像を表示するために使用される。ビデオインタフェース124b(例えば、台車118mの背面にあるSDIポート)が、外部とビデオ情報を交換するために使用される。プローブ127b(例えば、ケーブルを介して台車118bに接続される)は、患者106に作用するために使用される。例えば、プローブは、(好ましくは可撓性の)細長いシャフトとして実装される。プローブ127bの遠位端または先端130bが、身体部分103の空洞内の医療処置の同じ関心領域に到達して、それ照射し、その(蛍光および、可能ならば反射率)画像を取得するために使用される(下記に説明するように)。
【0032】
本開示の一実施形態による手法の特定の実装では、プローブ127bは、プローブ127mよりも薄い。プローブ127bは、その先端130bがプローブ127mの先端130mに到達するまで(そのサイズおよび可撓性に起因してプローブ127mの操作性を損なうことなく)作業チャネル136mの中に挿入される。さらに、台車118mと台車118bは、例えば、ケーブル139を介して互いに接続され、医療処置中に情報を交換する。
【0033】
ここで図2を参照すると、本開示の実施形態による手法を実施するために使用できる内視鏡100の機能ブロック図が示される。
【0034】
ベビースコープ115bから開始して、下記のコンポーネントを備える。照明ユニットが、空洞103の関心領域を照明するために使用される。この目的のために、励起光源203b(ベビースコープ115bの台車の内部、不図示)、例えば、レーザ方式のものは、蛍光物質の励起光を発生する。特に、励起光は、蛍光剤(例えば、近赤外線(NIR)タイプ)の蛍光体を励起するのに適した波長およびエネルギーを有する。必要に応じて、白色光源209b(台車の内部)、例えば、キセノンタイプのものは、白色光(人間には実質的に無色に見える。例えば、人間の目に見えるスペクトルの全ての波長を同じ強度で含む)を発生する。この白色光は、励起光とともに混合される。配送光学系212b(ベビースコープ115bのプローブの先端において、不図示)は、励起光および可能性のある白色光を身体部分103の関心領域に配送する。インコヒーレントの光ファイバのバンドル(束)218b(プローブに沿って)は、励起光源203bからの励起光を、可能ならば白色光源209bからの白色光と混合して、配送光学系212bに伝送する(代替として、不図示であるが、対応するインコヒーレントの光ファイバのバンドルを備えた2つの別個の配送光学系が使用され、励起光と白色光を独立して配送する)。取得ユニットを使用して、懸案の例においてターゲット109を含む、その視野221b(即ち、取得ユニットが感知できる立体角内の世界の一部)内の身体部分103の関心領域の(蛍光および可能ならば反射)画像を取得する。この目的のために、回収光学系224bは、視野221bからの光を回収する(落射照明幾何形状)。回収された光は、(励起光によって照射された)視野221b内に存在する蛍光分子によって放射される蛍光光を含む。実際、蛍光分子は、励起光を吸収すると、励起(電子)状態になり、励起状態は不安定であるため、蛍光分子は極めて短時間にそこから基底(電子)状態に減衰し、それによって蛍光を放射し(励起状態で熱として散逸されるエネルギーのため、励起光のものよりも長い固有波長で)、強度が、照射される蛍光分子の量に主に依存する。さらに、回収された光は、(白色光によって照射された)視野221b内に存在する任意の物体によって反射された可視光(可視スペクトル内)を含む。ビームスプリッタ227bが、回収された光を2つのチャネルに分割する。例えば、ビームスプリッタ227bは、可視光のスペクトルと蛍光光のスペクトルとの間の閾値波長よりも上下の波長で回収された光をそれぞれ透過し反射するダイクロイックミラーである(またはその逆も同様)。コヒーレントの光ファイバ230bの束(プローブに沿った)が、回収光学系224bから回収された光をビームスプリッタ227bに伝送する。そのスペクトルにおいて回収された光の一部によって定義される蛍光光を伴うビームスプリッタ227bの(透過)チャネルでは、発光フィルタ233bが、蛍光光をフィルタ処理して、蛍光光のスペクトルの外部にある残留成分を除去する。蛍光カメラ236b(例えば、EMCCDタイプのもの)が、発光フィルタ233bから蛍光光を受信し、視野221b内の蛍光分子の分布を表現する対応の蛍光(デジタル)画像を生成する。必要に応じて、そのスペクトル、反射率、または写真において回収された光の一部によって定義される可視光を伴うビームスプリッタ227bの他方の(反射)チャネルでは、カメラ239b(例えば、CCDタイプのもの)が可視光を受信し、視野221b内で人間の目に見えるものを表現する対応の反射率(デジタル)画像を生成する。
【0035】
マザースコープ115mに移って、それは、下記のコンポーネントを備える。上述のように、照明ユニットは、身体部分103の関心領域を照明するために使用される。この目的のために、白色光源209m(マザースコープ115bの台車の内部、不図示)例えば、キセノンタイプのものが白色光を発生する。配送光学系212m(マザースコープ115mのプローブの先端にある、不図示)は、白色光を身体部分103の関心領域に配送する。インコヒーレントの光ファイバの束218m(プローブに沿って)は、白色光源209mからの白色光を配送光学系212mに伝送する。取得ユニットを使用して、懸案の例ではターゲット109を含む、その視野221m内の身体部分103の関心領域の(反射率)画像を取得する。この目的のために、回収光学系224mは、白色光(落射照明幾何形状)によって照明された視野221m内に存在する任意の物体によって反射された可視光(可視スペクトル内)を回収する。反射カメラまたは写真カメラ239m(例えば、CCDタイプのもの)は、可視光を受信して、視野221m内の人間の目に見えるものを表現する対応の反射(デジタル)画像を生成する。ビデオスコープ構成では、反射カメラ239mは、プローブの先端に配置される。この場合、デジタル接続部240mが、反射率画像を台車に送信する(代替として、不図示であるが、反射率カメラが台車の内部に配置され、コヒーレントの光ファイバの束が回収光学系からの可視光を反射率カメラに送信する)。
【0036】
中央ユニット242bおよび中央ユニット242mを使用して、ベビースコープ115bおよびマザースコープ115mの動作をそれぞれ制御する。中央ユニット242b,242mは、バス構造245b,245mを経由してこれらの間で接続されたいくつかのユニットを備える。特に、マイクロプロセッサ(μP)248b,248mなどは、中央ユニット242b,242mの論理機能を提供する。不揮発性メモリ(ROM)251b,251mは、中央ユニット242b,242mのブートストラップのための基本コードを格納し、揮発性メモリ(RAM)254b,254mは、マイクロプロセッサ248b,248mによってワーキングメモリとして使用される。中央ユニット242b,242mには、プログラムおよびデータを格納するための大容量メモリ257b,257m、例えば、ソリッドステートディスク(SSD)が設けられる。さらに、中央ユニット242b,242mは、周辺機器または入力/出力(I/O)ユニットのための複数のコントローラ260b,260mを備える。特に、ベビースコープ115bのコントローラ260bは、励起光源203b、蛍光カメラ236b、(可能性のある)白色光源209b、(可能性のある)反射カメラ239b、モニタ121b、およびビデオインタフェ-ス124bを制御する。さらに、コントローラ260bは、ベビースコープ115bの画像およびマザースコープ115mの画像を手動で位置合わせするために使用する補正を設定するために使用される設定デバイス263bも制御でき、例えば、ベビースコープ115bのプローブまたは台車に搭載された回転/直線ダイヤル、足で操作する回転/直線ダイヤルまたは足パドルを備えており、これらの全ては、連続モードまたはトグルモードなどのいずれかで動作する。代わりに、マザースコープ115のコントローラ260mは、白色光源209m、反射カメラ239m、モニタ121m、およびビデオインタフェース124mを制御する。両方の場合も、コントローラ260b,260mは、更なる周辺機器(不図示)、例えば、キーボード、トラックボール、リムーバブルストレージユニット(USBキーなど)の読み取り/書き込み用ドライブ、および(通信)ネットワーク(例えば、ローカルエリアネットワーク(LAN)など)に接続するためのネットワークインタフェースカード(NIC)などを制御できる。
【0037】
一般に、ベビースコープ115bの視野221bとマザースコープ115mの視野221mは異なる。例えば、視野221bは、視野221mよりも小さく、視野221bと視野221mは少なくとも部分的に重なり合う(図に示す例では、視野221bと視野221mの両方はターゲット109を含む)。いずれの場合もベビースコープ115bの画像とマザースコープ115mの画像は、一般には、形状、ズーミング、解像度、コントラスト、ノイズ等の観点で異なる特性を有しており、これらの異なる特性は、これらの異なる性質のため、ベビースコープ115bの蛍光画像とマザースコープ115mの反射画像との間ではるかにより明白である。さらに、ベビースコープ115bのプローブは、一般にはマザースコープ115nの作業チャネル内に固定されておらず(不図示)、それに対して移動可能である(その長手軸に沿って、特にその周りに)。マザースコープ115mの取得ユニットに対するベビースコープ115bの取得ユニットの不可避の(先験的には未知の)動きが、例えば、患者の蠕動、呼吸および心拍に起因して(マザースコープ115mおよびベビースコープ115bのプローブの柔軟性のある性質と組み合わせて)通常は発生する。その結果、ベビースコープ115bの画像とマザースコープ115mの画像との間に、対応するミスアラインメント(位置ずれ)(例えば、並進(平行移動)、特に回転)が生成される。
【0038】
ここで図3を参照すると、本開示の一実施形態による手法の一般原理が示される。
【0039】
特に、マザースコープは、時間経過とともに取得された一連の反射率画像(マザースコープ画像)305mを提供し、図には305mおよび305m-1を付与した最後の2つだけが図示される。同様に、ベビースコープは、対応する一連の蛍光画像および場合によっては反射率画像(ベビースコープ画像)305bを提供する。簡単化のために、蛍光画像のみが考慮される場合、図は、マザースコープ画像305mおよび305m-1と実質的に同時にそれぞれ取得された、305bおよび305b-1を付与した最後の2つのベビースコープ(蛍光)画像を示している。
【0040】
本開示の一実施形態による手法では、コンピュータデバイスは、マザースコープ画像305mとベビースコープ画像305bの両方を受信する。例えば、ベビースコープの中央ユニットは、マザースコープから送信されたマザースコープ画像305mおよびベビースコープによって取得されたベビースコープ画像305bを受信する(またはその逆も同様)。対応するマザースコープ画像305mとベビースコープ画像305bの各(位置合わせ(registration))ペアは、マザースコープ画像305mおよびベビースコープ画像305bを空間的に対応させるように位置合わせされる。例えば、マザースコープ画像305mおよびベビースコープ画像305bは、ベビースコープのプローブとマザースコープのプローブとの間の動きに起因したミスアラインメントを補正するために位置合わせされる。この動作は、手動または自動的に実行できる(詳細は以下で説明する)。そして、このように位置合わせされたマザースコープ画像305mとベビースコープ画像305bの各ペアに基づいた身体部分の表現が出力され、例えば、(位置合わせされた)マザースコープ画像305mおよびベビースコープ画像305bは、コンピュータデバイスに接続されたモニタ(この場合はベビースコープのモニタ)上に重ね合わされて表示される。
【0041】
その結果、ベビースコープの蛍光画像(医療処置のターゲットの正確な表現を提供する)と、マザースコープの反射画像(医療処置の対象領域の高品質表現を提供する)を組み合わせることが可能である。これにより、医師のタスクが大幅に容易になり、医療処置の結果を改善して、患者の健康に有益な効果をもたらす。
【0042】
本開示の一実施形態による手法の具体的な実装では、マザースコープ画像305mおよびベビースコープ画像305bの各位置合わせペアについて、マザースコープの(マザースコープ)動きが、マザースコープ画像305mに従って推定され、ベビースコープの(ベビースコープ)動きが、ベビースコープ画像305bに従って推定され、これらは互いに独立しており、マザースコープ動きは、位置合わせされるもの)に対応する複数のマザースコープ画像305mに従って推定され(例えば、マザースコープ画像305mについてはマザースコープ画像305m,305m-1)、ベビースコープの動きは、位置合わせされるものに対応する複数のベビースコープ画像305に従って推定される(例えば、ベビースコープ画像305bについてはベビースコープ画像305b,305b-1)。例えば、図に示すような簡単な並進の場合、マザースコープ動きおよびベビースコープ動き(方向および大きさ)は、ベクトル310mおよびベクトル310bによってそれぞれ定義される。
【0043】
そして、マザースコープ画像305mとベビースコープ画像305bが、マザースコープ動き310mとベビースコープ動き310bに従って位置合わせされる。例えば、マザースコープとベビースコープとの間の相対的な動きに起因したミスアラインメントは、マザースコープ動き310mとベビースコープ動き310bとの比較によって判定される。問題の例では、マザースコープに対するベビースコープの相対的な回転は、ベクトル310bとベクトル310mの差に等しい角度310mbによって定義され、そして、この角度310mbの反対角度によって与えられる補正310bmがベビースコープ画像305boに適用され(それを回転することによって)、対応するマザースコープ画像305mとより良く位置合わせされた、対応する(位置合わせ済み)ベビースコープ画像305b0Rが得られる。
【0044】
このようにして、ベビースコープ画像とマザースコープ画像は連続的に補正され、最終的に、ベビースコープとマザースコープの間の相対的移動の影響が除去される。その結果、ベビースコープ画像とマザースコープ画像は、開始条件とは独立して位置合わせされるようになる。実際、マザースコープおよびベビースコープの視野の見かけ動きは、これらの相対的位置を推定するのに役立つ。例えば、図に示す状況では、マザースコープを基準としたベビースコープの並進により、これらの相対的回転を徐々に補正する。
【0045】
より一般には、マザースコープ画像305mおよびベビースコープ画像305bの位置合わせは、これらを空間的な対応関係をもたらす(即ち、これらを共通の基準空間に参照する)任意の他の変換(transformation)、例えば、並進、回転、ズーミングなどを含んでもよい。特に(不図示)、マザースコープおよびベビースコープの対応する回転中心点を決定し、そして、マザースコープの回転中心点からベビースコープの回転中心点までの距離によって定義される、マザースコープを基準としたベビースコープの相対的並進を計算することが可能であり、そして、ベビースコープ画像は、得られたベクトルの逆によって並進される。
【0046】
さらに他の例として(これも不図示)、マザースコープおよびベビースコープの対応するズームベクトルフィールドを決定し、そして、マザースコープのズームベクトルフィールドとベビースコープのズームベクトルフィールドの差によって定義される、マザースコープを基準としたベビースコープの倍率差(ズーム)を計算することが可能であり、ベビースコープ画像は、得られた倍率差の逆によって拡大縮小される。
【0047】
上述した手法により、ベビースコープ画像およびマザースコープ画像を本質的に堅牢な方法で自動的に位置合わせすることが可能になる。実際、提案された手法は、ベビースコープ画像とマザースコープ画像との間の比較を含まない。従って、ベビースコープ/マザースコープ画像が極めて限定され、容易に区別できない特徴を有するという事実(既知の特徴方式の方法では異なる画像内でマッチさせることが難しい、低コントラストを備えた滑らかなパッチを主に含むため)とは関係なく、有効な位置合わせが可能である。さらに、ベビースコープ画像およびマザースコープ画像の様々な特徴は、得られる結果には完全に無関係である。ベビースコープ画像およびマザースコープ画像が著しく異なる場合、特にベビースコープが蛍光画像を提供するだけの場合でも、有効な位置合わせが可能である。換言すると、ベビースコープ画像およびマザースコープ画像を直接に位置合わせするのではなく、ベビースコープ画像およびマザースコープ画像を別個に動作させすることによって、望ましい結果が間接的に達成される。この目的のために、ベビースコープの視野内およびマザースコープの視野内の物体の不可避の相対的移動が利点に転換され、従って、ベビースコープ画像とマザースコープ画像との間のミスアラインメントの原因自体(ベビースコープとマザースコープとの間の固有の動き)が、ミスアラインメントを除去する(または少なくとも低減する)ために利用される。
【0048】
ここで図4を参照すると、本開示の一実施形態による手法を実装するために使用できる主要なソフトウェアコンポーネントが示される。
【0049】
全てのソフトウェアコンポーネント(プログラムとデータ)は、全体として参照番号400で示している。特定の実装では、ソフトウェアコンポーネント400は、大容量メモリに格納され、プログラムが実行する場合に、オペレーティングシステムおよび、本開示の手法に直接には関連しない(よって簡略化のために図では省略される)他のアプリケーションプログラムとともに、ベビースコープの中央ユニットのワーキングメモリに(少なくとも部分的に)ロードされる。プログラムは、最初に、例えば、リムーバブルストレージユニットから、またはネットワークなどから大容量メモリにインストールされる。この点で、各プログラムは、モジュール、セグメント、またはコードの一部でもよく、これは指定された論理機能を実装するための1つ以上の実行可能命令を含む。
【0050】
特に、取得器403は、医療処置中にこの目的のために適切に照明されたベビースコープの視野の(ベビースコープ)蛍光画像および可能性のある(ベビースコープ)反射率画像を取得する専用のベビースコープのコンポーネントを駆動する。取得器403は、(ベビースコープ)蛍光画像リポジトリ(保存場所)406および(ベビースコープ)反射率画像リポジトリ409に書き込み、これらは、医療処置中に連続してそれぞれ取得されたベビースコープ蛍光画像およびベビースコープ反射率画像の対応するシーケンスを含む。ベビースコープ蛍光画像リポジトリ406およびベビースコープ反射率画像リポジトリ409は、同じ取得時間に取得されるベビースコープ蛍光画像およびベビースコープ反射率画像の各ペアのための対応するエントリを含む。このエントリは、対応するベビースコープ(蛍光/反射率)画像のビットマップを格納し、これは、セルのマトリックス(例えば、512個の行と512個の列)によって定義され、それぞれが画素、即ち、ベビースコープの視野の対応する場所を表現する基本画素の(カラー)値を含む。ベビースコープの蛍光画像の各画素値は、その場所によって放射される蛍光光の強度の関数として画素の明るさを定義し、一方、ベビースコープの反射率画像の各画素値は、その場所で反射された可視光の強度の関数として画素の明るさを定義する(例えば、その各RGB成分について0から256まで)。ビデオインタフェ-スドライブ412が、ベビースコープのビデオインタフェ-スを駆動し、特に、本開示に関連する限りにおいて、ビデオインタフェ-スドライブ412は、医療処置中にマザースコープによって取得された(マザースコープ)反射率画像を受信する(そのビデオインタフェ-スから)。ビデオインタフェースドライブ412は、(マザースコープ)反射率画像リポジトリ415に書き込み、これは、ベビースコープの蛍光/反射率画像と実質的に同期してマザースコープによって医療処置中に連続して取得された一連のマザースコープ反射率画像を含む。上述のように、マザースコープ反射率画像リポジトリ415は、マザースコープ反射率画像ごとにエントリを含む。エントリは、マザースコープ反射率画像のビットマップを格納し、これは、セルのマトリックス(典型的にはより高い解像度、例えば、2048個の行と2048個の列を備える)によって定義され、それぞれが画素の(色)値(マザースコープの視野の対応する場所を表す)を含み、その場所で反射された可視光の強度の関数として画素の明るさを定義する(例えば、そのRGB成分ごとに0から256まで)。
【0051】
準備器(プレパレータ)418が、(ベビースコープ/マザースコープ)反射率画像をその位置合わせ操作のために前処理することによって準備する。準備器418は、ベビースコープ反射率画像リポジトリ409およびマザースコープ反射率画像リポジトリ415を読み出して、(ベビースコープ)準備済み画像リポジトリ421および(マザースコープ)準備済み画像リポジトリ424に書き込む。ベビースコープ準備済み画像リポジトリ421およびマザースコープ準備済み画像リポジトリ424は、対応するリポジトリ409内の各ベビースコープ反射率画像および対応するリポジトリ415内の各マザースコープ反射率画像のエントリをそれぞれ含む。エントリは、対応するベビースコープ/マザースコープ準備済み(反射率)画像を格納する。ベビースコープ/マザースコープ準備済み画像は、セルのマトリクス(一般に、対応するベビースコープ/マザースコープ反射率画像に比べてより小さいサイズを備える)によって形成され、それぞれが、対応する画素値(例えば、白の0から黒の256まで範囲に及ぶグレースケール値)を保存する。ベビースコープ反射率画像が利用できない場合、上述した同じ動作がベビースコープ蛍光画像に対して実行され(マザースコープ反射率画像に加えて)、対応するベビースコープ準備済み(蛍光)画像を取得する。従って、この場合、準備器418は、ベビースコープ反射率画像リポジトリ409の代わりに、ベビースコープ蛍光画像リポジトリ406(図中破線で示す)を読み出す。
【0052】
補正器(コレクタ)は、ベビースコープおよびマザースコープによって提供される画像に適用すべき補正(即ち、変換)を決定し、独立に推定されたこれらの動きに従って自動的に画像を位置合わせする。補正器は、オプティカルフロー技術、深層学習技術、またはこれらの両方の組み合わせが実装できる。オプティカルフロー技術をベースとした補正器は、各ベビースコープ/マザースコープ準備済み画像のオプティカルフローを推定する推定器427を備える。ベビースコープ/マザースコープ準備済み画像のオプティカルフローは、その運動に起因したベビースコープ/マザースコープの視野の内容の見かけ動きを表す。推定器427は、ベビースコープ準備済み画像リポジトリ421およびマザースコープ準備済み画像リポジトリ424を読み出し、(ベビースコープ)動きベクトルリポジトリ430および(マザースコープ)動きベクトルリポジトリ433に書き込む。ベビースコープ動きベクトルリポジトリ430およびマザースコープ動きベクトルリポジトリ433は、対応するリポジトリ421,424内の各ベビースコープ/マザースコープ準備済み画像(最初のものとは異なる)のエントリを含む。このエントリは、ベビースコープ/マザースコープ準備済み画像のオプティカルフローを定義する、対応するベビースコープ/マザースコープ動きベクトルを格納する(例えば、変換)。補正器はさらに、対応するベビースコープ/マザースコープ動きベクトルに従って、対応するベビースコープ準備済み画像およびマザースコープ準備済み画像の各(位置合わせ)ペアの補正を計算する計算機436を備える。計算機436は、ベビースコープ動きベクトルリポジトリ430およびマザースコープ動きベクトルリポジトリ433を読み出す。代わりに、深層学習技術をベースとした補正器は、ベビースコープ準備済み画像およびマザースコープ準備済み画像の各位置合わせペアの補正を直接に決定するニューラルネットワーク439を備える。ニューラルネットワーク439は、ベビースコープ準備済み画像リポジトリ421およびマザースコープ準備済み画像リポジトリ424を読み出す。代わりに、設定器(セッター)442を使用して、手動で補正(画像を位置合わせするために、ベビースコープおよびマザースコープによって提供される画像に適用される)を設定する。この目的のために、設定器442は、1つ以上の(ソフトウェア)ダイヤル(例えば、マウス、キーボードおよび/またはトラックボールによって制御されるように設計された回転/直線スライダ、入力ボックス、ホットキーなど)を提供するユーザインタフェース、および/または、補正(例えば、回転角度、並進方向および距離、ズーミング係数など)の入力を許容する設定デバイス用のドライブを公開する。計算器436、ニューラルネットワーク439、および設定器442は、補正リポジトリ445に書き込む。特に、計算機436およびニューラルネットワーク439(自動位置合わせ)の場合、補正リポジトリ445は、ベビースコープ/マザースコープ準備済み画像の各位置合わせペアのためのエントリを含み、このエントリは、対応する補正を格納し、一方、設定器442(手動位置合わせ)の場合、補正リポジトリ445は、(オリジナル)ベビースコープ/マザースコープ画像の(共通)補正を格納する(両方の場合には、問題の例では回転角度によって定義される各補正を備える)。
【0053】
アライナー(整列器)448が、ベビースコープおよびマザースコープによって提供される画像を、対応する補正に従って位置合わせする。特に、アライナー448は、対応する補正に従って、対応するベビースコープ蛍光画像およびマザースコープ反射率画像の各(位置合わせ)ペアを常に位置合わせする。この目的のために、アライナー448は、ベビースコープ蛍光画像リポジトリ406および補正リポジトリ445を読み出して、(ベビースコープ)位置合わせ済み蛍光画像リポジトリ451に書き込む。ベビースコープ位置合わせ済み蛍光画像リポジトリ451は、対応するリポジトリ406内の各ベビースコープ蛍光画像のエントリを含む。エントリは、対応する(ベビースコープ)位置合わせ済み蛍光画像を格納する。ベビースコープ位置合わせ済み蛍光画像は、セルのマトリックス(ベビースコープ蛍光画像と同じサイズを備える)によって形成され、それぞれが対応する(カラー)画素値を格納する。さらに、補正器がオプティカルフロー技術および深層学習技術の両方をベースとする場合(補正を段階的に決定するため)、アライナー448はさらに、これらの(粗い)補正に従って、対応するベビースコープ準備済み画像およびマザースコープ準備済み画像の各(位置合わせ)ペアをさらに(事前に)位置合わせする。この目的のために、アライナー448はさらに、ベビースコープ準備済み画像リポジトリ421を読み書きする。
【0054】
表示器454は、ベビースコープ位置合わせ済み蛍光画像およびマザースコープ反射率画像(例えば、互いに重ね合わされる)に基づいて、身体部分の表現を表示するためにベビースコープのモニタを駆動する。表示器454は、ベビースコープ位置合わせ済み蛍光画像リポジトリ451およびマザースコープ反射率画像リポジトリ415を読み出す。
【0055】
ここで図5を参照すると、本開示の一実施形態による手法の実装に関連する動作(アクティビティ)のフローを説明する動作図が示される。この点において、各ブロックが、ベビースコープの中央ユニット上に所定の論理機能を実装するための1つ以上の実行可能命令に対応できる。
【0056】
特に、動作図は、方法500を用いた上述の内視鏡を用いた医療処置(内視鏡処置)中に患者を撮像するために使用できる例示的なプロセスを表す。
【0057】
内視鏡処置の前に、医療従事者(例えば、看護師)が患者に蛍光剤を投与する。蛍光剤(例えば、インドシアニングリーン、メチレンブルーなど)は、検査/切除/治療対象の腫瘍など、特定の(生物学的)ターゲットに到達し、その中に実質的に固定された状態になるように構成される。この結果は、非標的化蛍光剤(受動的蓄積など、特異的相互作用なしにターゲット内に蓄積するように構成される)、または標的化蛍光剤(特異的相互作用によってターゲットに付着するように構成される、例えば、様々な組織、血管特性、代謝特性などと相互作用できる化学的結合特性および/または物理的構造に基づいて、標的特異的リガンドを蛍光剤の製剤に組み込むことによって達成される)のいずれかを使用することによって達成できる。例えば、蛍光剤は、ボーラスとして(例えば、シリンジを用いて)患者に静脈内投与される。その結果、蛍光剤は、ターゲットに到達してこれに結合するまで、患者の血管系内を循環する。残りの(未結合)蛍光剤は、その代わりに血液プールから除去される。蛍光剤が(可能性のある)腫瘍に蓄積し、患者の残部から洗い流されるまでの待機時間(例えば、数分から24~72時間まで)の後、内視鏡処置が開始できる。従って、必要に応じて、医師は患者に(完全または部分的に)麻酔をかける。いずれの場合も、医師は、(医療)オペレータによってスイッチオンになったマザースコープのプローブを、患者の体腔内に(その開口を経由して)その先端が腫瘍が存在する可能性のある身体部分の関心領域に到達するまで挿入する。これに応答して、マザースコープの白色光源は、その視野を照明し、マザースコープの反射率カメラはその視野のマザースコープ反射率画像を連続的に取得し、マザースコープのモニター上にリアルタイムで表示される(不図示)。
【0058】
本開示の一実施形態による手法に関連する限り、内視鏡処置のある時点において、医師は、その先端が身体部分の同じ関心領域(マザースコープのプローブの先端)に到達するまで、ベビースコープのプローブをマザースコープの作業チャネルに(その作業ポートを経由して)挿入する。医師は、いつでもベビースコープをスイッチオンにして、撮像プロセス(対応する位置合わせ操作を伴う)を開始することを決定してもよい。例えば、これは、ベビースコープをマザースコープの作業チャネルに挿入する前に、または、ベビースコープのプローブの先端がマザースコープのプローブの先端に到達した後に、行ってもよい。いずれの場合も、これに応答して、(撮像)プロセスは、黒い開始円503からブロック506に進行することによって開始する。この時点で、取得器は、励起光源および、ベビースコープの視野を照射するための白色光源をオンにする。そして、動作のフローは、同時に実行される様々な動作に分岐する。特に、取得器は、ブロック509において、新しいベビースコープ蛍光画像を取得し、それを対応するリポジトリに追加する。必要に応じて、取得器は、ブロック512において、新しいベビースコープ反射率画像を取得し、それを対応するリポジトリに追加する。さらに、ビデオインタフェースは、ブロック515において(マザースコープから送信されるマザースコープ反射率画像を連続的に受信する)、これらの最後の1つを対応するリポジトリに追加する。このようにしてベビースコープ蛍光画像およびベビースコープ反射率画像(利用可能な場合)はほぼ同時に取得され、これらは、空間的にコヒーレントである(即ち、完全同一性に至るまで、これらの画素間に予測可能な相関関係が存在する)ベビースコープの同じ視野の様々な表現(それぞれ蛍光光と可視光の観点で)を提供する。さらに、マザースコープ反射率画像も、ベビースコープおよびマザースコープの取得速度間の位相シフトとは別に(実際には無視できる)、実質的に同時に取得されたものとみなすことができる。
【0059】
動作のフローは、ブロック509、ブロック512、ブロック515からブロック518において再び合流する。この時点で、プロセスは、ベビースコープの位置合わせ動作のモード(手動/自動)(例えば、手動設定、デフォルトで定義されたもの、または、利用可能な唯一のもの)に従って分岐する。位置合わせ動作の自動モードの場合、プロセスは、ベビースコープの構造に従ってブロック521においてさらに分岐する。ベビースコープが、蛍光画像および反射率画像の両方を取得するように構成される場合、準備器は、ブロック524において、対応するリポジトリに直ちに追加された(最後の)ベビースコープ反射率画像を検索する。逆に、ベビースコープが蛍光画像のみを取得するように構成される場合、準備器は、ブロック527において、対応するリポジトリに直ちに追加された(最後の)ベビースコープ蛍光画像を検索する。どちらの場合も、プロセスは、ブロック530に進み、準備器は、対応するリポジトリに直ちに追加された(最後の)マザースコープ反射率画像を検索する。準備器は、ブロック533において、対応する位置合わせ動作のために直ちに検索されたベビースコープ(反射率または蛍光)画像およびマザースコープ(反射率)画像を準備する。例えば、準備器は、ベビースコープ/マザースコープ画像の各境界から、その(最も外側の)画素の15~25%、例えば20%によって定義される中央領域を囲むその部分を廃棄することによって、各ベビースコープ/マザースコープ画像をその中央領域に縮小できる。このようにしてベビースコープ/マザースコープ画像の最も有用な部分だけが考慮され、位置合わせ動作の相応の精度向上および計算時間の短縮を伴う。追加または代替として、準備器は、各(可能ならば縮小された)ベビースコープ/マザースコープ画像を、例えば、そのサイズを40~60%まで、例えば、50%に縮小することによって(例えば、ローパスフィルタと、それに続くサブサンプリングを用いて)、サイズ縮小できる。これにより、位置合わせ動作の計算時間を低減し(例えば、3~4倍だけ)、同時にその精度に悪影響を与えることなく、むしろわずかに向上させる(最小の運動の検出が容易になるため)。追加または代替として、準備器は、各画素値のRGB成分を、対応する光強度(例えば、黒の0から白の255までなど)を表す単一のグレースケール成分に置換することによって、各(可能性として縮小および/またはダウンスケールされた)ベビースコープ/マザースコープ画像をグレースケールに変換でき、例えば、グレースケール成分は、RGB成分の加重平均として計算される(知覚的輝度を維持するため)。これにより、位置合わせ動作の計算時間が減少し、同時にその精度が向上し、環境条件(例えば、照明、コントラスト、機器など)に対する感度が減少する。いずれの場合も、準備器は、そのように取得されたベビースコープ/マザースコープ準備済み画像を、対応するリポジトリに追加する。位置合わせ動作にとって充分な数のベビースコープ/マザースコープ準備済み画像(例えば、2~5)を有するために必要な遷移時間の後、ベビースコープ蛍光画像およびマザースコープ反射率画像の(位置合わせ)ペア(最初に取得された)が位置合わせされる。この目的のために、動作のフローは、ベビースコープの構成(例えば、手動で設定、デフォルトで定義、または利用可能な唯一のもの)に従ってブロック536において分岐する。
【0060】
位置合わせが深層学習技術のみまたは予備的に基づく場合、ニューラルネットワークを使用して、対応する補正を決定する。基本的には、ニューラルネットワークは、人間の脳の動作を近似したデータ処理システムである。ニューラルネットワークは、基本的な処理エレメント(ニューロン)を含み、これは、対応する重みに基づいて演算を実行する。ニューロンは、一方向チャネル(シナプス)を介して接続されており、これは、これらの間でデータを転送する。ニューロンは、様々な動作を実行する複数層に編成されており、常に、ニューラルネットワークの入力データを受信する入力層と、出力データを提供する出力層とを含む。本開示の一実施形態では、ニューラルネットワークは、畳み込みニューラルネットワーク(CNN)、即ち、特定タイプのディープニューラルネットワーク(1つ以上の隠れ層が、ニューラルネットワークの処理方向に沿って入力層と出力層の間に連続して配置される)であり、その1つ以上の隠れ層が(クロス)畳み込み演算を実行する。例えば、ニューラルネットワークは、VGG-16モデルの修正バージョンに基づいている。より詳細には、入力層は、ベビースコープ準備済み画像の(推定)セットおよび準備済みマザースコープ画像の(推定)セットを連結することによって生成される入力画像を受信するように構成される。各推定セットは、複数の最後のベビースコープ/マザースコープ準備済み画像(例えば、最後の2~10個)を含み、入力画像は、ベビースコープ/マザースコープ準備済み画像と同じサイズ、およびベビースコープ/マザースコープ準備済み画像の画素値の成分によって与えられるチャネルの数(各セルの値)を有する(例えば、2個のベビースコープ準備済み画像および2個のマザースコープ準備済み画像について4チャネル。それぞれが各画素値ごとに1つのグレースケール成分を備える)。隠れ層は、最初に、それぞれ1つ以上の畳み込み層からなる5個のグループ(例えば、2個の畳み込み層からなる第1グループ、2個の畳み込み層からなる第2グループ、3個の畳み込み層からなる第3グループ、3個の畳み込み層からなる第4グループ、および3個の畳み込み層からなる第5グループ)を備え、そして、対応する最大値プーリング層が続く。一般に、各畳み込み層は、対応する重み(各チャネルごとに、対応する適用データとフィルタの間で同じ数)によって定義された畳み込み行列(フィルタまたはカーネル)を通じて畳み込み演算を実行する。この畳み込み演算は、選択したセル数(ストライド)だけ、適用データ全体でフィルタをシフトすることによって、適用データの限られた部分(受容野)について連続して実行され、適用データの境界の周りに内容ゼロのセルの追加も可能であり(パディング)、これにもフィルタを適用することが可能であり(これにバイアス値を追加して、それを変換し、そして活性化関数を適用して非線形係数を導入できる)、対応するフィルタ済みデータを取得できる。畳み込み層のフィルタ済みデータの各要素は、適用データ内の小さな領域(受容野)のみを調べ、空間的に左右の他のニューロンとパラメータを共有する(畳み込み層の全てのニューロン間で共有されるフィルタのストライドに従って)、ニューロンの出力としても解釈できる。VGG-16モデルでは、畳み込み層は、パディング1およびストライド1の3×3の極めて小さいフィルタを適用し(適用データのサイズを維持するため)、その各ニューロンは、正規化線形関数(ReLU)活性化関数を適用する。各最大値プーリング層は、プーリング層(小さい変位に起因した差に対する感度を減少させるために、その適用データをダウンサンプリングする)であり、これは、適用データ全体でウィンドウを、選択したセル数(ストライド)だけシフトすることによって、適用データの各限定部分(ウィンドウ)の値をそれらの最大値に置換する。VGG-16モデルでは、最大値プーリング層は、ストライド2を備えた2×2のウィンドウを有する。 全体として、上述した隠れ層のグループは、適用データのサイズを1×1にまで減少させ、これらのチャネルを4096まで増加させる。そして隠れ層は、3つの完全に接続された(または緻密な)層を備える。各完全接続層は、先行層の全てのニューロンに接続されたニューロンを有する。完全接続層は、チャネルの数を、入力データの全ての可能なクラスに対応する数にまで段階的に減少させる。VGG-16モデルでは、完全接続層は、ReLU活性化関数を適用し、ILSVRC分類でチャネルを1000に減少させる。本開示の一実施形態では、チャネルは削減され、最後のベビースコープ準備済み画像と、最後のマザースコープ準備済み画像との(位置合わせ)ペアの間のミスアライメントの回転角の程度(0°から359°まで)について360個のチャネルを提供する。これは、ニューラルネットワークの低い複雑さ(トレーニングと応答時間に影響する)と、高い解像度(精度に影響する)という相反する要件の間の良好な妥協点である。さらに、最初の2つの完全接続層では、ReLU活性化関数が、線形活性化関数に置換される。最終的に、隠れ層は、ソフトマックス層を備え、これは、適用データを確率分布に正規化する(各値は、0から1までの範囲にあり、全ての値の合計は1になる)。そして、出力層は、最も高い確率を有する回転角の反対に設定された、位置合わせペアのための補正を決定する。この深層学習技術をベースとした実装では、プロセスは、ブロック536からブロック539に進み、ベビースコープ画像の推定セットおよびマザースコープ画像の推定セットは、ニューラルネットワークの入力画像に連結され、それに適用される。ブロック542に移って、ニューラルネットワークは、ベビースコープ/マザースコープ準備済み画像の対応する位置合わせペアのための補正を直接に出力する。この補正は、対応するリポジトリの最後のエントリに存在する値に追加される(0に初期化され、場合によっては、以下で説明するオプティカルフロー技術を用いた予備セット)。その結果、深層学習技術をベースとした実装だけが適用される場合、それで決定された補正は、位置合わせ動作の最終値を直接に定義する。逆に、オプティカルフロー技術をベースとした実装が前回適用されている場合、深層学習技術で決定された補正は、オプティカルフロー技術で決定されたその予備値を改善する。動作のフローはさらに、ベビースコープの構成に従ってブロック545において分岐する。こうして得られた補正が、最初に取得されたようなベビースコープ蛍光画像とマザースコープ反射率画像の位置合わせペアに適用される最終値である場合(オプティカルフロー技術をベースとした実装は、後に適用されない)、アライナーは、ブロック548において、これらを相応に位置合わせする。例えば、アライナーは、ベビースコープ蛍光画像に補正を適用し(問題の例ではそれを回転することによって)、そして、こうして得られたベビースコープ位置合わせ済み蛍光画像を対応するリポジトリに追加する。深層学習技術をベースとする実装は極めて高速であるため、内視鏡処置中にこれらの表示が可能なように、ベビースコープ蛍光画像およびマザースコープ反射画像は、これらの取得から短い遅延で位置合わせされるリアルタイムアプリケーションによく適している。さらに、オプティカルフロー技術をベースとする実装の後に、深層学習技術をベースとする実装が適用される場合、ニューラルネットワークは、はるかに少ない数の回転角の値(例えば、0°から9°までの10個の値)を提供するように構成できる。この場合、ニューラルネットワークは、より広範囲にトレーニングすることができ、はるかにより正確になる。ブロック545に戻って参照すると、こうして得られた補正が、オプティカルフロー技術を適用することによってまだ調整すべき予備値である場合、アライナーは、ブロック551において、同様に、準備済みベビースコープ画像に補正を適用し、それを対応するリポジトリの中に置換することによって、準備済みベビースコープ/マザースコープ画像の位置合わせペアを位置合わせする。そして、プロセスは、ブロック554に進む。
【0061】
位置合わせが、オプティカルフロー技術単独または予備的に基づいている場合、ブロック536から同じポイントに直接到達する。両方の場合、推定器は、複数の最後のベビースコープ準備済み画像を含むベビースコープ準備済み画像の(推定)セット、例えば、最後から2番目のベビースコープ準備済み画像(対応するリポジトリから抽出される)を基準とした最後のベビースコープ準備済み画像、のベビースコープ動きベクトル(例えば、並進)を決定し、こうして取得した値を、対応するリポジトリに追加する。同様に、推定器は、ブロック557において、複数の最後のマザースコープ準備済み画像を含むマザースコープ準備済み画像の(推定)セット、例えば、最後から2番目のマザースコープ準備済み画像(対応するリポジトリから抽出される)を基準とした最後のマザースコープ準備済み画像、のマザースコープ動きベクトル(例えば、再び並進)を決定し、こうして取得した値を、対応するリポジトリに追加する。この目的のために、推定器は、任意の既知の技術を適用でき、例えば、1つ以上の画素グループのレベルでローカル動きベクトルを計算することが可能である(例えば、ブロックマッチングアルゴリズム、あるいは、密または疎のベクトルフィールドの推定などを用いて)。これらの各々は、最後から2番目のベビースコープ/マザースコープ準備済み画像から最後のベビースコープ/マザースコープ準備済み画像までの対応する画素グループのオフセットを表す。そして、(グローバル)動きベクトルは、これらのローカル動きベクトルに従って決定される(例えば、その平均に設定される)。計算機は、ブロック560において、対応する動きベクトル(例えば、ベビースコープ準備済み画像の動きベクトルからマザースコープ準備済み画像の動きベクトルまでの角度に等しい)に従って、最後の準備済みベビースコープ/マザースコープ画像の位置合わせペア間のミスアライメント(問題の例では回転角)を計算し、それを対応するリポジトリに追加する。計算機は、ブロック563において、複数の最後のミスアライメント(例えば、最後の2~10)の(計算)セットに従って、ベビースコープ/マザースコープ準備済み画像の位置合わせペアのための補正を計算する。特に、補正は、計算セットのミスアライメントの加重平均の逆として計算される。例えば、重みが、その経過時間および/または程度とともに(例えば、指数関数的に)減少する各ミスアライメントに割り当てられる。経過時間とともに減少する重みは(ジッターの影響を低減することによって)補正を滑らかにし、程度とともに減少する重みは(誤解を招く動きがない、または極めて小さい動きの影響を低減することによって)精度を改善する。そして、計算機は、こうして得られた補正を、対応するリポジトリの最後のエントリに存在する値に追加する(0に、そして可能ならば上述のような深層学習技術を用いて事前に設定されたものに初期化される)。その結果、オプティカルフロー技術をベースとした実装だけが適用される場合、それを用いて決定された補正は、位置合わせ動作のための最終値を直接に定義する。反対に、深層学習技術をベースとした実装が前回適用されていた場合、オプティカルフロー技術を用いて決定された補正は、深層学習技術を用いて決定されたその予備値を調整する。動作のフローはさらに、ベビースコープの構成に従ってブロック566において分岐する。こうして得られた補正が、最初に取得されたようなベビースコープ蛍光画像およびマザースコープ反射率画像の位置合わせペアに適用すべき最終値である場合(深層学習技術をベースとした実装は後で適用されない)、アライナーは、ブロック569において、補正をベビースコープ蛍光画像に適用し、こうして得られたベビースコープ位置合わせ済み蛍光画像を、対応するリポジトリに追加することによって、ベビースコープ蛍光画像およびマザースコープ反射率画像(最初に取得されたもの)の位置合わせペアを位置合わせする。モーションフロー技術をベースとした実装は、極めて精密であり、従って、それは、オフラインアプリケーション(必要な計算時間は重要ではない)、または深層学習技術をベースとした実装によって提供される予備の位置合わせを調整するためのリアルタイムアプリケーション(後者は、その計算時間を大幅に短縮する)によく適している。ブロック566に戻って、こうして得られた補正が、深層学習技術を適用することによってまだ調整すべき予備値である場合、アライナーは、ブロック572において、同様に、準備済みベビースコープ画像に補正を適用し、それを対応するリポジトリに置換することによって、準備済みベビースコープ/マザースコープ画像の位置合わせペアを位置合わせする。そして、プロセスは、ブロック539に戻る。
【0062】
ブロック518に戻って、位置合わせ動作の手動モードの場合、設定器は、ブロック575において、補正(最初に取得されたベビースコープ/マザースコープ画像の位置合わせペアに適用される)を設定する必要があるか否かを検証する。特に、これは常に内視鏡処置の開始時に発生し(補正を初期化するため)、可能性としては、その間に医師が補正がもはや正確でないと判断した場合に(補正を更新するために)発生する。補正を設定する必要があれば、プロセスは、ブロック578に進み、医師は、設定器を介して補正を入力する。例えば、表示器は、マザースコープ反射率画像およびベビースコープ反射率画像を共にベビースコープのモニタに連続的に表示する(ベビースコープ反射率画像が利用できない場合は、ベビースコープ蛍光画像を用いて同じ動作を行う)。医師は、内視鏡処置の(比較的)安定した状態に達するまで待機する(表示されたマザースコープ/ベビースコープ反射率画像によって示すように)。例えば、これは、マザースコープのプローブの先端が身体部位の関心領域に到達し、そしてベビースコープのプローブが、その先端が身体部位の同じ関心領域に到達した状態でマザースコープの作業チャネルの中に挿入された場合に発生する。ここで医師は、これらが位置合わせされているように見えるまで、マザースコープ/ベビースコープ反射率画像に作用する(ユーザインタフェ-スまたは設定デバイスを介して)。この動作は、その取得中に再生されたり、医師によってベビースコープに(たとえば、そのキーボードを用いて)入力される対応コマンドに応じて一時停止したりしながら、マザースコープ/ベビースコープ反射率画像に対して実行できる。いったん動作が完了すると、医師は、対応するコマンドをベビースコープに(例えば、そのキーボードを用いて)入力することによって、こうして得られたマザースコープ/ベビースコープ反射率画像の(手動)位置合わせを確認する。これに応答して、設定器は、ブロック581において、この手動位置合わせに対応する補正を決定し、それを、対応するリポジトリに保存する(ヌルに初期化された前回の値を置換する)。そしてプロセスは、ブロック584に進む。補正の設定が必要でない場合にも、ブロック575から直接に同じポイントに到達する。この時点で、アライナーは、この補正(対応するリポジトリから抽出される)をベビースコープ蛍光画像に適用し、こうして得られたベビースコープ位置合わせ済み蛍光画像を対応するリポジトリに追加することによって、ベビースコープ蛍光画像およびマザースコープ反射率画像(最初に取得したもの)の位置合わせペアを位置合わせする。
【0063】
そして、動作のフローは、ブロック587において、ブロック548(深層学習技術単独または追加でベースとした自動モード)から、ブロック569(オプティカルフロー技術単独または追加でベースとした自動モード)、またはブロック584(手動モード)から、再び合流する。この時点で、表示器は、マザースコープ反射率画像およびベビースコープ位置合わせ済み蛍光画像に基づいて身体部分の表現を表示する。例えば、表示器は、ベビースコープ位置合わせ済み蛍光画像をマザースコープ反射率画像に重ね合わせることによって生成される重ね合わせ画像を表示してもよい(重ね合わせ画像の各画素値は、その明るさが、閾値(例えば、最大値の5~10%)よりも高い場合(可能ならば厳密に)、または、それ以外にはマザースコープの反射率画像の対応する画素値に等しい場合、ベビースコープ位置合わせ済み蛍光画像の対応する画素値に等しい)。
【0064】
ここでブロック590を参照すると、イメージングプロセスがまだ進行中である場合、動作のフローは、ブロック509~515の前に戻って、同じ動作を連続して繰り返す。逆に、オペレータによってベビースコープに(例えば、そのキーボードを用いて)入力された終了コマンドによって示されるように、撮像プロセスが終了した場合、プロセスは、同心円の白/黒ストップ円593で終了する(取得器によって励起光源および白色光源をターンオフした後)。
【0065】
ここで図6を参照すると、本開示の一実施形態による手法のニューラルネットワークを訓練するために使用できる(トレーニング)コンピュータシステム600の概略ブロック図を示す。
【0066】
トレーニング(コンピュータ)システム600(例えば、パーソナルコンピュータ(PC))は、バス構造605を介して相互に接続された複数のユニットを備える。特に、マイクロプロセッサ(μP)610またはそれ以上が、トレーニングシステム600の論理能力を提供する。不揮発性メモリ(ROM)615が、トレーニングシステム600のブートストラップのための基本コードを格納し、揮発性メモリ(RAM)620が、マイクロプロセッサ610によってワーキングメモリとして使用される。トレーニングシステム600には、プログラムおよびデータを格納するための大容量メモリ625、例えば、半導体ディスク(SSD)が設けられる。さらに、トレーニングシステム600は、周辺機器または入力/出力(I/O)ユニットのための複数のコントローラ630を備える。例えば、周辺機器は、キーボード、マウス、モニタ、通信ネットワーク(例えば、インターネット)に接続するためのネットワークアダプタ(NIC)、リムーバブルストレージユニット(例えば、USBタイプ)を読み書きするためのドライブを含む。
【0067】
ここで図7を参照すると、本開示の一実施形態による手法においてニューラルネットワークを訓練するために使用できる主要なソフトウェアコンポーネントを示す。
【0068】
全てのソフトウェアコンポーネント(プログラムおよびデータ)は、全体として参照番号700で示す。ソフトウェアコンポーネント700は、大容量メモリに格納され、プログラムが実行している場合、オペレーティングシステムおよび、本開示の手法に直接に関係しない他のアプリケーションプログラム(簡単化のために図では省略)とともに、トレーニングシステムのワーキングメモリに(少なくとも部分的に)ロードされる。プログラムは、最初に、例えば、リムーバブルストレージユニットまたはネットワークから大容量メモリにインストールされる。これに関して、各プログラムは、特定の論理機能を実装するための1つ以上の実行可能命令を含む、コードのモジュール、セグメントまたは一部でもよい。
【0069】
ローダー705は、サンプル内視鏡処置などの際に上述のように取得された複数のサンプルマザースコープ(反射率)画像を、対応するサンプルマザースコープ(例えば、腫瘍を持つ患者の結腸を撮像することによって)とともにロード(読み込み)する。もし可能であれば、(サンプル)マザースコープ画像は、サンプルマザースコープの様々なモデルを用いて取得され、現実に使用されるマザースコープの実際のモデルに対してニューラルネットワークの感度を低くする。ローダー705は、マザースコープ画像を格納する(サンプル)マザースコープ画像リポジトリ710に書き込む。合成器715が、マザースコープ画像から対応する(ベビースコープ)合成画像を合成する。この合成画像は、サンプルマザースコープの作業チャネルを経由して挿入されたベビースコープなどによって取得される、対応する反射率画像を模倣する。合成器715は、マザースコープ画像リポジトリ710を読み出し、合成画像を格納する合成画像リポジトリ720に書き込む。発生器725が、様々なミスアライメント(例えば、各画像にランダムに選択された複数の回転)を適用することによって、合成画像から複数の(サンプル)ベビースコープ(反射率)画像を生成する。発生器725は、合成画像リポジトリ720を読み出し、(サンプル)ベビースコープ画像リポジトリ730に書き込む。ベビースコープ画像リポジトリ730は、各ベビースコープ画像のエントリを含む。このエントリは、ベビースコープ画像、対応する合成画像を合成するために使用されるマザースコープ画像の指示(例えば、対応するリポジトリ710内のそのインデックス)、およびベビースコープ画像(その金の価値を表す)を生成するために使用されるミスアライメントの逆に等しい(基準)補正を格納する。訓練器735が、ニューラルネットワーク439を訓練する。訓練器735は、マザースコープ画像リポジトリ710およびベビースコープ画像リポジトリ730を読み出す。さらに、訓練器735は、同じ参照番号439で示されるニューラルネットワークのコピーを実行し(入力データを適用し、出力データを受信する)、その重みを書き込む。
【0070】
ここで図8を参照すると、本開示の一実施形態による手法におけるニューラルネットワークの訓練に関連する動作のフローを説明する動作図を示す。
【0071】
特に、動作図は、方法800を用いてニューラルネットワークを訓練するために使用できる例示のプロセスを表す(ベビースコープの開発中に、場合によってはその次回メンテナンス中に)。上述のように、各ブロックは、トレーニングシステム上で特定の論理機能を実装するための1つ以上の実行可能命令に対応する。
【0072】
プロセスは、黒いスタート円805で開始し、ブロック810に進み、訓練器は、マザースコープ画像を、対応するリポジトリに(例えば、リムーバブルストレージユニットまたはネットワークを介して)ロードする。合成器は、ブロック815において、(対応するリポジトリから検索される)各マザースコープ画像から、対応する合成画像を合成する。この目的のために、合成器は、ベビースコープを用いて取得した現実の反射率画像に似せることを目的として、マザースコープ画像に複数の更新を適用する。特に、マザースコープ画像(一般に、長方形または八角形などの多角形を有する)は、(例えば、マザースコープ画像に内接する小さい円の外側にある画素の値をゼロにリセットすることによって)円形状に変換される。追加または代替として、マザースコープ画像の解像度が減少する(例えば、それを30~70%、例えば、50%だけダウンサンプリングすることによって)。追加または代替として、マザースコープのコントラストが減少する(例えば、低コントラストのフィルタを適用することによって)。追加または代替として、マザースコープの画像をズームインして、より小さい視野をシミュレーションする(例えば、中央ゾーンの画素の値を複製することによって)。追加または代替として、マザースコープ画像が変換される(例えば、ランダムな値によって)。追加または代替として、マザースコープ画像にノイズが追加される(例えば、その画素値にランダムノイズを追加することによって)。合成器は、こうして得られた合成画像を、対応するリポジトリに追加する(そのリポジトリ内で対応するマザースコープ画像の同じ位置に関連付けるように)。生成器は、ブロック820において、合成画像からベビースコープ画像を生成する。特に、各合成画像(対応するリポジトリから検索された)ごとに、生成器は、回転角の複数の擬似ランダム値(例えば、100~400)を生成し、そしてこれらを合成画像に適用する。生成器は、こうして取得した各ベビースコープ画像を、対応するマザースコープ画像の指示(例えば、これらのリポジトリ内の合成/マザースコープ画像の共通インデックスに等しい)および、対応する基準補正(適用された回転角の反対の値に等しい)とともに、対応するリポジトリに追加する。
【0073】
訓練器は、ニューラルネットワークのトレーニング動作を実行し、その重みの(最適化)値を見つけて、可能ならばそのパラメーターを見つけて、パフォーマンスを最適化する。この目的のために、訓練器は、ブロック825において、複数のトレーニングセットを選択し、各々はベビースコープ画像、対応するマザースコープ画像、および対応する基準補正によって形成される。トレーニングセットは、ベビースコープ画像をサンプリングし、その百分率(例えば、ランダムに選択された50%)を選択することによって定義される。訓練器は、ブロック830において、ニューラルネットワークの重みをランダムに初期化する。そして、ブロック835においてループに入り、訓練器は、各トレーニングセットのベビースコープ画像を連続的に(任意の順序で)ニューラルネットワークに供給し、対応する(推定された)補正を取得する。訓練器は、ブロック840において、トレーニングセットの推定された補正と基準補正との差に基づいて損失値を計算する(例えば、外れ値に対する感度を制限するためにフーバー(Huber)関数を適用することによって)。訓練器は、ブロック845において、損失値が許容可能ではなく、依然として著しく改善するかどうかを検証する。この動作は、反復モード(その損失値について各トレーニングセットを処理した後)、またはバッチモード(損失値の累積値、例えば、その平均について全てのトレーニングセットを処理した後)のいずれかで実行できる。そうである場合、訓練器は、ブロック850において、ニューラルネットワークのパフォーマンスを改善させるために、ニューラルネットワークの重みを更新する。例えば、確率的勾配降下法(SGD)アルゴリズムをベースとしたプロセスでは、変化の方向および量が、誤差逆伝播法(バックプロパゲーション)アルゴリズムを用いて近似される重みの関数として、損失値を表す損失関数の勾配によって与えられる。そして、プロセスは、ブロック835に戻り、同じ動作を繰り返す。再びブロック845を参照すると、損失値が許容可能になった場合、または重みの変化が著しい改善を提供しない場合(損失関数の最小値、少なくとも局所または平坦な領域が見つかったことを意味する)、ループは終了する。上述のループは、ランダムノイズを重みに追加することによって実行でき、および/または、それは、ニューラルネットワークの様々な初期化から開始して反復でき、様々な(場合によってはより良好な)極小値を見つけて、損失関数の平坦領域を識別できる。
【0074】
いったん損失関数の最適な最小値を提供するニューラルネットワークの構成が見つかると、プロセスは、ブロック855に続く。この時点で、訓練器は、こうして得られたニューラルネットワークのパフォーマンスの検証操作を実行する。この目的のために、訓練器は、複数の検証セットを選択し、各々は、ベビースコープ画像、対応するマザースコープ画像、および対応する基準補正によって形成される。例えば、検証セットは、トレーニングセットのものとは異なるベビースコープ画像によって定義される。そして、ブロック860においてループに入り、訓練器は、(現在の)検証セットのベビースコープ画像(任意の順序で最初のものから開始して)をニューラルネットワークに供給し、対応する(推定された)補正を取得する。訓練器は、ブロック865において、検証セットの推定された補正と基準補正との差に基づいて、上記のような損失値を計算する。訓練器は、ブロック870において、最後の検証セットが処理されたかどうかを検証する。そうでない場合、動作のフローはブロック860に戻り、次の検証セットに対して同じ動作を繰り返す。逆に(全ての検証セットが処理されると)、ブロック875に進むことによってループは終了する。この時点で、訓練器は、上述の検証の包括的損失(例えば、全ての検証セットの損失値の平均に等しい)を決定する。動作のフローは、包括的損失に従ってブロック880において分岐する。包括的損失が許容値よりも高い場合(可能ならば厳密に)、これは、ニューラルネットワークの一般化の能力(トレーニングセットから学習された構成から検証セットまで)が低すぎることを意味する。この場合、プロセスは、ブロック825に戻り、異なるトレーニングセット、トレーニングパラメータ(例えば、学習率、エポック数など)および/または、ニューラルネットワークパラメータ(例えば、補正値の数、活性化関数など)を用いて同じ動作を繰り返し、あるいは、ブロック820に進んでベビースコープ画像(不図示)を増加させる。反対に、包括的損失が許容値よりも低い場合(可能ならば厳密に)、これは、ニューラルネットワークの一般化の能力が満足できることを意味する。この場合、訓練器は、ブロック885において、ベビースコープのインスタンスのバッチに展開するためのニューラルネットワークの構成を受け入れる。
そして、プロセスは、同心の白/黒のストップ円890で終了する。
【0075】
ここで図9A図9Bを参照すると、本開示の一実施形態による手法の様々な適用例を示す。
【0076】
図9Aから開始すると、これは、内視鏡処置中の例示的な位置合わせに関する。特に、図は、位置合わせペアのベビースコープ(反射率)画像905bおよびマザースコープ(反射率)画像905mを示し、対応するローカル動きベクトルの追加を伴う。ベビースコープ画像905bおよびマザースコープ画像905mについて、ベビースコープ動きベクトル910bおよびマザースコープ動きベクトル910mがそれぞれ決定される(ローカル動きベクトルから)。補正(回転角)910bmが、マザースコープ動きベクトル910mからベビースコープ動きベクトル910bを減算したものとして計算される。そして、ベビースコープ画像905bは、補正910bmに従って位置合わせされ(対応する角度だけ回転する)、見て判るように、対応するベビースコープ位置合わせ済み(蛍光)画像910brが得られる。ここでベビースコープの位置合わせ済み画像910brは、マザースコープ画像905m(ローカル動きベクトルなしで再び示している)と実質的に位置合わせされている。
【0077】
図9Bに移ると、これは、ニューラルネットワークの例示のトレーニングに関する。特に、この図は、サンプル内視鏡処置中に取得された2つのマザースコープ(反射率)画像915m,920mを示す。2つの合成(反射率)画像915s,920s(対応するベビースコープ反射率画像を模倣する)は、マザースコープ画像915m,920mからそれぞれ合成される(これらを円形形状に変換し、解像度/コントラストを低下させ、ズームイン(拡大)することによって)。
【0078】
(変形例)
局所的および特定の要件を満たすために、当業者は、多くの論理的および/または物理的な変形および変更を本開示に適用できる。より詳細には、本開示は、その1つ以上の実施形態を参照して、ある程度の詳細さで説明しているが、形態、詳細そして他の実施形態における種々の省略、置換および変更が可能であることは理解すべきである。特に、本開示の様々な実施形態が、前述の説明に記載された特定の詳細(例えば、数値)なしで実施でき、より完全な理解を提供できるが、逆に、不必要な詳細についての説明を不明瞭にしないために、周知の特徴を省略または簡略化していることがある。さらに、本開示の任意の実施形態に関連して説明した特定の要素および/または方法ステップは、他の任意の実施形態において、一般的な設計選択の事項として組み込み可能であることを明確に意図している。さらに、同じグループおよび様々な実施形態、例または代替例で提示されるアイテムは、事実上互いに等価であると解釈されるべきではない(しかし、それらは別個で自律的な実体である)。いずれの場合も、各数値は、適用可能な許容誤差に従って修正されるものとして読むべきであり、特に他に示していない限り、用語「実質的に(substantially)」、「約(about)」、「おおよそ(approximately)」は、10%の範囲内、好ましくは5%の範囲内、さらにより好ましくは1%の範囲内であると理解すべきである。さらに、数値の各範囲は、(その端点を含む)範囲内の連続体に沿った任意の可能な数を明示的に特定するものとして意図すべきである。序数または他の修飾子は、単に、同じ名前を備えた要素を区別するラベルとして使用しており、それ自体、優先度、優先権または順序を暗示していない。用語「含む(include)」、「備える(comprise)」、「有する(have」、「収容する(contain)」、「含む(involve)」等は、オープンで完全網羅でない意味を伴うと意図すべであり(即ち、記載したアイテムに限定されない)、用語「に基づいて(based on)」、「に応じて(dependent on)」、「に従って(according to)」、「に応じて(function of)」等は、完全網羅でない関係として意図すべきであり(即ち、可能性ある追加の変数が含まれる)、用語"a/an"は、1つ以上のアイテムとして意図すべきであり(他の明示していない限り)、用語「ための手段(means for)」(または任意のミーンズプラスファンクション形式)は、関連する機能を実行するように適応または構成される任意の構造として意図すべきである。
【0079】
例えば、一実施形態は、内視鏡システムを用いて患者の身体部分を撮像するための方法を提供する。しかしながら、この(撮像)方法は、内視鏡システムを用いて、任意の身体部分(例えば、胃腸管、気道、尿路、子宮、内部関節などの1つ以上の器官、領域、組織など)および任意の患者(例えば、人間、動物など)のものを撮像するために使用できる(以下を参照)。さらに、この方法は、任意の医療処置(例えば、手術、診断、治療など)に使用できる。この方法は、患者との相互作用とは独立して(または、熟練の医学的専門知識を必要としたり、患者にとって健康リスクを伴うような患者への実質的な物理的介入をせいぜい伴わずに)、内視鏡システムを制御するための動作に関するだけのものである。いずれの場合も、この方法は、医師のタスクを容易にできるが、それは、彼らを支援できる中間結果を提供するだけでなく、厳密には、医師自身が常に行われる医療行為を伴う。
【0080】
一実施形態では、この方法は、身体部分の少なくとも一部を含む第1視野の複数の第1画像の第1シーケンスを取得するステップを含む(内視鏡システムの第1内視鏡ユニットを用いて)。しかしながら、第1画像は、任意の数および任意のタイプ(例えば、身体部分全体またはその一部のみを表す反射率画像、発光画像、超音波画像など)でもよく、これらは、任意の第1内視鏡ユニットを用いて取得してもよい(下記を参照)。
【0081】
一実施形態では、第1画像の第1シーケンスは、第1内視鏡ユニットの第1プローブを介して取得される。しかしながら、第1プローブは、任意のタイプ(例えば、ファイババンドル、チップオンチップ(chip-on tip)などをベースとしたもの)にできる。
【0082】
一実施形態では、この方法は、第1画像に対応する複数の第2画像セットの第2シーケンスを(内視鏡システムの第2内視鏡ユニットを用いて)取得するステップを含む。しかしながら、第1画像セットおよび第2画像セットは、任意の方法も対応することができる(例えば、異なる開始時間と周波数でこれらを独立に取得し、そしてシーケンスの各画像を、利用可能な他のシーケンスの最後の画像と、または、これに近い他のシーケンスの前後画像と関連付けることによって、第1画像および第2画像を同期して取得することによって、あるシーケンスの画像を受信し、その位相および周波数を決定し、そして同期して他方のシーケンスの画像の取得を開始することによってなど)、第2画像は、任意の第2内視鏡ユニットを用いて取得できる(以下を参照)。
【0083】
一実施形態では、第2画像セットの各々は、身体部分の少なくとも一部を含む第2視野の1つ以上の第2画像を含む。しかしながら、各第2画像セットは、任意のタイプの任意の数の第2画像(例えば、身体部分全体またはその一部だけを表す、発光画像、反射率画像、超音波画像、これらの任意の組合せ)を含んでもよい。第1視野および第2視野は、任意のタイプ(例えば、互いに異なるもの、例えば、ある程度重なり合ったり、または離散していたり、例えば、胆管鏡検査の場合のように、より厚い中空器官から分岐したより薄い中空器官を撮像するため、互いに等しいものなど)でもよい。
【0084】
一実施形態では、第2画像の第2シーケンスは、第1プローブに対して移動可能である第2内視鏡ユニットの第2プローブを介して取得される。しかしながら、第2プローブは、任意のタイプ(例えば、チップオンチップ、ファイババンドルなどをベースとするものなど)でもよい。さらに、2つのプローブは、先験的に知られていない任意の方法(例えば、回転、並進、これらの任意の組み合わせ、常にまたは結合前だけなど)でこれらの間で移動可能でもよい。
【0085】
一実施形態では、この方法は、(コンピュータデバイスによって)複数の第1画像のうちの第1画像および、対応する第2画像セットの第2画像の各位置合わせペアを位置合わせするステップを含む。しかしながら、位置合わせは、任意のタイプ(例えば、回転、並進、これらの両方などのアフィン(affine)変換、ズーミング、ワーピングなどの非剛体変換)でもよい。さらに、位置合わせは、任意のコンピュータデバイスによって(下記参照)、任意の方法(例えば、自動、半自動、または手動で、第1画像だけ、第2画像だけ、またはこれらの両方を更新することによって)で、いつの時でも(例えば、2つのプローブが両者間で常に移動可能である場合、連続的に適用される補正を決定することによって、その後これらが互いに固定される場合は、2つのプローブの結合時だけなど)実行できる。
【0086】
一実施形態では、この方法は、位置合わせされている各位置合わせペアの第1画像および第2画像に基づいて、身体部分の表現を(出力ユニットに)出力するステップを含む。しかしながら、身体部分の表現は、任意の出力ユニット(下記参照)に、任意の方法(例えば、表示、印刷、リモート送信、リアルタイムまたはオフラインなど)で出力できる。さらに、身体部分の表現は、任意の方法(例えば、各位置合わせペアの画像を重ねたり、並べたりして出力することによって)で位置合わせ済み画像をベースとしてもよい。
【0087】
さらなる実施形態は、追加の有利な特徴を提供するが、これらは基本的な実装では全て省略されてもよい。
【0088】
特に、一実施形態では、この方法は、(第2内視鏡ユニットを用いて)第1内視鏡ユニットの作業チャネルの中に取り外し可能に挿入された第2プローブを介して、第2画像セットの第2シーケンスを取得するステップを含む。しかしながら、第2プローブは、任意の方法(例えば、マザースコープを空洞の中に挿入する後または前等)で作業チャネルの中に挿入できる。いずれの場合も、マザースコープおよびベビースコープを他の任意の方法(例えば、独立して空洞内に挿入され、ベビースコープは腹腔鏡のトロカール(trocar)ポートに挿入される等)で配置する可能性は排除されない。
【0089】
一実施形態では、コンピュータデバイスは、第1内視鏡ユニットと第2内視鏡ユニットとの間の一方に含まれる。しかしながら、コンピュータデバイスは、内視鏡ユニットのいずれか一方に含まれてもよい。
【0090】
一実施形態では、この方法は、(コンピュータデバイスによって)第1内視鏡ユニットおよび第2内視鏡ユニットの他方から、対応する第1画像の第1シーケンスまたは第2画像セットの第2シーケンスを受信するステップを含む。しかしながら、これらの(第1または第2)画像は、任意の方法(例えば、プッシュモード、プルモード、任意の有線/無線通信チャネルを介して、リムーバブルストレージユニットから、ネットワークからダウンロードして等)で受信してもよい。
【0091】
一実施形態では、この方法は、(コンピュータデバイスによって)第1プローブと第2プローブの対応する相対運動に起因した第1画像と第2画像の各位置合わせペアのための少なくとも1つの補正を決定するステップを含む。しかしながら、補正は、任意のタイプ(例えば、位置合わせペアの第1画像または第2画像のための1つの補正値、位置合わせペアの第1画像および第2画像のための2つの対応する補正値等)でもよく、それは、任意の方法(例えば、オプティカルフロー技術だけを用いて、深層学習技術だけを用いて、これらの両方を任意の順序で用いて、手動で等)で決定してもよい。
【0092】
一実施形態では、この方法は、(コンピュータデバイスによって)対応する補正に従って、第1画像および第2画像の各位置合わせペアを位置合わせするステップを含む。しかしながら、第1画像および第2画像の位置合わせペアは、補正に従って任意の方法(例えば、それを完全に適用したり、段階的に適用する等)で位置合わせしてもよい。
【0093】
一実施形態では、この方法は、(コンピュータデバイスによって)、複数の第1画像のうちの各現在画像について、および複数の第2画像セットのうちの各現在画像の現在の第2画像についてそれぞれ独立して、第1プローブの第1動きおよび第2プローブの第2動きを推定するステップであって、第1動きは、現在の第1画像に対応する複数の第1画像の推定セットに従って推定され、第2動きは、現在の第2画像に対応する複数の第2画像の推定セットに従って推定される。しかしながら、この動きは、任意のタイプ(例えば、回転、並進、これらの両方等)でもよく、任意の方法(例えば、動きベクトル、回転中心点、ズーミングベクトル場等)でしてもよい。この動きは、第1/第2画像の任意のタイプの推定セット(例えば、任意の数の画像を含み、全ての先行画像の中から選択され、または、何らかの時間的サブサンプリングを用いて等)に従って、任意の方法(例えば、オプティカルフロー技術、深層学習技術、これらの任意の組合せ等)で推定してもよい。
【0094】
一実施形態では、この方法は、(コンピュータデバイスによって)第1画像および第2画像のペアに対応して、それぞれ複数の第1画像および複数の第2画像のうちの1つ以上の計算セットの第1動きおよび第2動きに従って、第1画像および第2画像の各位置合わせペアのための補正を決定するステップを含む。しかしながら、補正は、任意の方法(例えば、対応する第1画像および第2画像の各ペアの間のミスアライメントを計算し、そして計算セットのミスアライメントから補正を計算し、計算セットの第1動きおよび第2動きから第1変位および第2変位をそれぞれ計算し、そして第1変位および第2変位から補正を計算することによって等)で、計算セットの第1/第2動きに従って(例えば、任意の方法で、あるいはそのままで重み付けされた、関連する値の平均、中央値(median)、最頻値(mode)等として)決定してもよい。
【0095】
一実施形態では、この方法は、(コンピュータデバイスによって)対応する第1画像の推定セットに従って、現在の第1画像ごとに第1動きを示す第1動きベクトルおよび、対応する第2画像の推定セットに従って、現在の第2画像ごとに第2動きを示す第2動きベクトルを推定するステップを含む。しかしながら、動きベクトルは、任意のタイプ(例えば、各場所に2つの成分を備えた密ベクトルフィールド、場所のいくつかにベクトル成分を備えた疎ベクトルフィールド等)のものでもよく、これらは任意の方法(例えば、ブロックマッチング、位相相関、微分等の方法を適用することによって、その場所またはそのグループのローカル値を、平均や支配的動きなどに従って任意の方法で集約することによって、全体画像のレベルで直接に等)で推定してもよい。
【0096】
一実施形態では、この方法は(コンピュータデバイスによって)対応する第1動きおよび第2動きに従って、対応する現在の第1画像および現在の第2画像の各ペアのミスアライメントを計算するステップを含む。しかしながら、ミスアライメントは、任意の方法(例えば、動きベクトルの差、回転中心点の距離、ズーミングベクトルフィールド間の差等)で計算してもよい。
【0097】
一実施形態では、この方法は、(コンピュータデバイスによって)第1画像および第2画像の対応する計算セットのミスアライメントに従って、第1画像および第2画像の各位置合わせペアの補正を計算するステップを含む。しかしながら、補正は、ミスアライメントに応じて任意の方法(例えば、任意の方法で、あるいはそのままで重み付けされた、ミスアライメントの平均、中央値(median)、最頻値(mode)等として)で計算してもよい。
【0098】
一実施形態では、この目的のために、ミスアライメントは、対応する範囲とともに減少して重み付けされる。しかしながら、ミスアライメントは、その範囲に従って任意の方法(例えば、連続関数または離散関数、指数関数的、線形関数などに従って、閾値以下のものを単に無視することによって等)で重み付けしてもよい。
【0099】
一実施形態では、この目的のために、ミスアライメントは、第1画像および第2画像の位置合わせペアからの対応する時間的距離とともに減少して重み付けされる。しかしながら、ミスアライメントは、これらの時間的距離に従って任意の方法(例えば、上記のものに対して同じまたは異なる方法)で重み付けしてもよい。
【0100】
一実施形態では、この方法は、(コンピュータデバイスによって)第1画像および第2画像の各位置合わせペアについての第1画像の更なる推定セットおよび第2画像の更なる推定セットに基づいた入力データをニューラルネットワークに供給するステップを含む。しかしながら、ニューラルネットワークは、任意のタイプ(例えば、畳み込みニューラルネットワーク、時間遅延ニューラルネットワーク、回帰型ニューラルネットワーク、モジュラーニューラルネットワーク等)でもよく、それは、任意の数の第1/第2画像に基づいた入力データを任意の方法(例えば、第1画像および第2の画像の共通連結、第1画像の連結、第2画像の連結、第1/第2画像を別個に等)で供給してもよい。
【0101】
一実施形態では、この方法は、(コンピュータデバイスによって)第1画像および第2画像の各位置合わせペアのための補正をニューラルネットワークから受信するステップを含む。しかしながら、ニューラルネットワークは、任意の方法(例えば、分類結果、回帰結果を定義する等)で補正を提供してもよい。
【0102】
一実施形態では、この方法は、(ニューラルネットワークによって)複数の予め定義された補正の中から、第1画像および第2画像の各位置合わせペアのための補正を選択するステップを含む。しかしながら、予め定義された修正は、任意の数および任意のタイプ(例えば、均一に分布していたり、特定の範囲により集中している等)でもよい。
【0103】
一実施形態では、ニューラルネットワークは、畳み込みニューラルネットワークである。しかしながら、畳み込みニューラルネットワークは、任意のタイプ(例えば、既知のモデル、例えば、VGG-16、VGG-19、ResNet50などから派生したもの、カスタムのもの等)でもよい。
【0104】
一実施形態では、畳み込みニューラルネットワークは、(畳み込みニューラルネットワークの処理方向に沿って)複数のグループを含み、各グループは、1つ以上の畳み込み層と、これに続く最大値プーリング層とを含む。しかしながら、グループは、任意の数でもよく、それぞれが任意の数およびタイプの畳み込み層と、これに続く任意のタイプの最大値プーリング層(例えば、任意の受容野、ストライド、パディング、活性化関数などを備える)を含む。
【0105】
一実施形態では、畳み込みニューラルネットワークは、(畳み込みニューラルネットワークの処理方向に沿って)予め定義された補正の対応する確率を提供する複数の全結合層(fully connected layers)を含む。しかしながら、全結合層は、任意の数および任意のタイプ(例えば、任意の数のチャネル、活性化関数などを備える)でもよい。
【0106】
一実施形態では、この方法は、(第1内視鏡ユニットを用いて)第1視野の対応する場所を表す複数の第1値をそれぞれ含む第1画像の第1シーケンスを取得するステップを含む。しかしながら、各第1値は、任意の数およびタイプの成分(例えば、RBG、XYZ、CMYK、グレースケール等)を含んでもよい。
【0107】
一実施形態では、この方法は、(第2内視鏡ユニットを用いて)第2視野の対応する場所を表す複数の第2値をそれぞれ含む第2画像セットの第2シーケンスを取得するステップ)を含む。しかしながら、各第2値は、任意の数およびタイプの成分(例えば、第1成分に対して同じまたは異なるもの)を含んでもよい。
【0108】
一実施形態では、この方法は、(コンピュータデバイスによって)各場所について更なる推定セットの第1画像の第1値および、更なる推定セットの第2画像の第2値を連結することによって得られる、第1画像および第2画像の各位置合わせペアのための入力データを、ニューラルネットワークに供給するステップを含む。しかしながら、画像は、任意の方法(例えば、第1画像に続いて第2画像が続く、その逆も同様等)で連結してもよい。
【0109】
一実施形態では、この方法は、(コンピュータデバイスによって)手動で入力される補正を受信するステップを含む。しかしながら、補正は、任意の方法(例えば、上記のものに対して部分的、異なる、および/または追加のソフトウェアおよび/またはハードウェアコマンドを介して)で入力してもよい。
【0110】
一実施形態では、この方法は、(第1内視鏡ユニットを用いて)第1視野の内容によって反射された可視光を表す対応する反射率画像である第1画像の第1シーケンスを取得するステップを含む。しかしながら、反射画像は、任意のタイプ(例えば、カラー、白黒、ハイパースペクトルなど)でもよい。
【0111】
一実施形態では、この方法は、(第2内視鏡ユニットを用いて)(第2視野内で発光物質によって放射された発光光を表す)対応する発光画像および、(第2視野の内容によって反射された可視光を表す)対応する更なる反射率画像である、第2画像セットの第2シーケンスを取得するステップを含む。しかしながら、発光光は、任意のタイプ(例えば、NIR、赤外線(IR)、可視光など)でもよく、そしてそれは、任意の方法(例えば、対応する励起光、またはより一般には加熱とは異なる任意の他の励起に応答して)で、任意の外因性/内因性または外因性/内因性の発光物質(例えば、任意の発光現象、例えば、蛍光、燐光、化学発光、生物発光、ラマン放射線等に基づいた、任意の発光剤、任意の天然発光成分など)によって放射されてもよい。さらに、更なる反射率画像は、任意のタイプ(例えば、反射率画像に対して同じまたは異なるもの)でもよい。
【0112】
一実施形態では、この方法は、(コンピュータデバイスによって)対応する反射率画像および更なる反射率画像に従って、反射率画像および発光画像の各位置合わせペアのための補正を決定するステップを含む。しかしながら、反射率画像および発光画像に従って補正を決定する可能性は排除されない。
【0113】
一実施形態では、この方法は、(コンピュータデバイスによって)対応する補正に従って、反射率画像および発光画像の各位置合わせペアを位置合わせするステップを含む。しかしながら、反射率画像および更なる反射率画像の各位置合わせペアを位置合わせする可能性も排除されない。
【0114】
一実施形態では、この方法は、(出力ユニットに)位置合わせされる各位置合わせペアの反射率画像および発光画像に基づいて身体部分の表現を出力するステップを含む。しかしながら、(位置合わせ済み)更なる反射率画像に基づいて身体部分の表現を出力する可能性も排除されない。
【0115】
一実施形態では、この方法は、(第2内視鏡ユニットを用いて)第2視野内で発光物質によって放射された発光光を表す対応する発光画像である第2画像セットの第2シーケンスを取得するステップを含む。しかしながら、発光画像は、任意のタイプ(上記を参照)でもよい。
【0116】
一実施形態では、この方法は、(第2内視鏡ユニットによって)蛍光物質である発光物質のための励起光を用いて第2視野を照射するステップを含む。しかしながら、励起光は、任意の蛍光物質(例えば、外因性または内因性、外因性または内因性など)について任意のタイプ(例えば、NIR、可視光など)でもよい。
【0117】
一実施形態では、この方法は、(第2内視鏡ユニットを用いて)励起光に応答して、第2視野内で発光物質によって放射された蛍光光である発光光を表す対応する発光画像である対応する発光画像を含む第2画像セットの第2シーケンスを取得するステップを含む。しかしながら、蛍光光は、任意のタイプ(例えば、NIR、赤外線(IR)、可視など)でもよい。
【0118】
一実施形態では、発光物質は、方法を実施する前に患者に事前投与された発光剤である。しかしながら、発光剤は、任意のタイプ(例えば、特異的または非特異的な相互作用に基づく標的発光剤、任意の他の非標的発光剤など)でもよく、それは、任意の方法(例えば、シリンジ、注入ポンプなど)で、任意の時期(例えば、数時間/数日前に、方法を実行する直前、方法の間に連続的になど)でも事前投与されてもよい。さらに、発光剤は、非侵襲的方法(例えば、胃腸管を撮像するための経口投与、気道へのネブライザーにより、外科手術中の局所スプレー塗布または局所導入など)で患者に投与してもよい。いずれの場合も、専門的な医学的専門知識を必要としたり、患者の健康リスクを伴うような患者への実質的な身体的介入(例えば、筋肉内投与)はない。
【0119】
一実施形態では、補正は、第1画像および第2画像の表示に従って手動で入力される。しかしながら、補正は、第1/第2画像の任意の表示に従って入力されてもよい(例えば、第1/第2の画像は、開始時、可能性として次の任意の時点で、取得中に再生されたり、または一時停止されるなど)。
【0120】
一実施形態では、この方法は、(第1内視鏡ユニットを用いて)カラーである第1画像の第1シーケンスを取得するステップを含む。しかしながら、第1画像は、任意の方法(例えば、任意の色空間、任意のカラーモデルなど)でカラーで表現してもよい。
【0121】
一実施形態では、この方法は、(第2内視鏡ユニットを用いて)カラーである第2画像セットの第2シーケンスを取得するステップを含む。しかしながら、第2画像は、任意の方法(例えば、第1画像に対して同じまたは異なる)でカラーで表現してもよい。
【0122】
一実施形態では、この方法は、(コンピュータデバイスによって)グレースケールへの変換によって、前記位置合わせのための第1画像および第2画像を準備するステップを含む。しかしながら、画像は、任意の方法(例えば、平均法、重み付け法などに基づいて)グレースケールに変換してもよい。
【0123】
一実施形態では、この方法は、(コンピュータデバイスによって)ダウンサンプリングによって、前記位置合わせのための第1画像および第2画像を準備するステップを含む。しかしながら、画像は、任意のレートおよび任意の方法(例えば、これらの値を単に平均化したり、平滑化フィルタを適用したりするなど)でダウンサンプリングしてもよい。
【0124】
一実施形態では、この方法は、(コンピュータデバイスによって)対応する中央部分への限定によって、前記位置合わせのための第1画像および第2画像を準備するステップを含む。しかしながら、画像は、任意の中央部分(例えば、任意のサイズ、形状など)に限定されてもよい。
【0125】
一実施形態は、上記のニューラルネットワークを訓練するための方法を提供する。しかしながら、この(訓練)方法は、任意の目的(例えば、その開発、保守、検証など)でニューラルネットワークに適用してもよい。
【0126】
一実施形態では、この方法は、コンピュータシステムの制御下で下記ステップを含む。しかしながら、コンピュータシステムは、任意のタイプ(以下を参照)でもよい。
【0127】
一実施形態では、この方法は、(コンピュータシステムに)少なくとも1人のサンプル患者の少なくとも1つのサンプル身体部分の複数の第1サンプル画像を提供するステップを含む。しかしながら、第1サンプル画像は、任意の数およびタイプのサンプル患者の任意の数およびタイプのサンプル身体部分に関連する任意の数でもよく、サンプル身体部分の任意の数のサンプル空洞の中に挿入された任意の数およびタイプのサンプル内視鏡ユニットを用いて取得されてもよい(例えば、上記に対して同じまたは異なる)。
【0128】
一実施形態では、この方法は、(コンピュータシステムによって)第1サンプル画像から対応する合成画像を合成するステップを含む。しかしながら、合成画像は、任意の方法(例えば、形状の変化、解像度の変化、コントラストの変化、ズームイン/アウト、並進、ノイズの追加/除去、これらの任意の組み合わせなど)で合成されてもよい。
【0129】
一実施形態では、この方法は、(コンピュータシステムによって)対応する第1サンプル画像の形状を変化させることによって合成画像を合成するステップを含む。しかしながら、形状は、任意の方法(例えば、長方形、多角形、円形等から、円形、長方形、多角形等へ)で変化してもよい。
【0130】
一実施形態では、この方法は、(コンピュータシステムによって)対応する第1サンプル画像の解像度を減少させることによって合成画像を合成するステップを含む。しかしながら、解像度は、任意の程度で任意の方法(例えば、ダウンサンプリング、フィルタリングなどにより)で減少してもよい。
【0131】
一実施形態では、この方法は、(コンピュータシステムによって)対応する第1サンプル画像のコントラストを減少させることによって合成画像を合成するステップを含む。しかしながら、コントラストは、任意の程度で任意の方法(例えば、画像全体またはその小さなタイルのレベルで、飽和させたり、悪化する分布を用いてヒストグラム均等化を適用することなど)で減少してもよい。
【0132】
一実施形態では、この方法は、(コンピュータシステムによって)対応する第1サンプル画像をズームイン(拡大)することによって合成画像を合成するステップを含む。しかしながら、第1サンプル画像は、任意の範囲で任意の方法(例えば、値を複製したり、円滑化フィルタを適用したりするなど)でズームイン(拡大)できる。
【0133】
一実施形態では、この方法は、(コンピュータシステムによって)対応する第1サンプル画像を並進することによって合成画像を合成するステップを含む。しかしながら、第1サンプル画像は、任意の範囲(例えば、予め定めた定義された値によって、ランダムな方法などで)並進してもよい。
【0134】
一実施形態では、この方法は、(コンピュータシステムによって)対応する第1サンプル画像にノイズを追加することによって合成画像を合成するステップを含む。しかしながら、ノイズは、任意の方法(例えば、第1サンプル画像に予め定めた定義されたノイズ、またはランダムなノイズを均一にまたはランダムに追加するなど)で追加してもよい。
【0135】
一実施形態では、この方法は、(コンピュータシステムによって)対応する基準動きを合成画像の1つにそれぞれ適用することによって、複数の第2サンプル画像を生成するステップを含む。しかしながら、第2サンプル画像は、任意の数で任意の方法(例えば、並進、回転、これらの組合せなど、任意の数およびタイプの基準動きを使用することによって、すべての可能な基準動きまたは、ランダムに選択されたその対応するサブセットを各合成画像に適用することによって等)で生成してもよい。
【0136】
一実施形態では、この方法は、(コンピュータシステムによって)第2サンプル画像、対応する第1サンプル画像、および対応する参照動きのうちの1つをそれぞれ含む複数のトレーニングセットに従って、ニューラルネットワークを訓練するステップを含む。しかしながら、トレーニングセットは、任意の数および任意の方法(例えば、ランダム、均一など)で選択してもよく、これらは、任意の方法(例えば、確率的勾配降下法、リアルタイム反復学習、高次勾配降下法、拡張カルマンフィルタリングなどのアルゴリズム)に基づく)でニューラルネットワークを訓練するために使用してもよい。より一般には、トレーニングセットは、任意の他の方法で提供されてもよい(例えば、対応するサンプル内視鏡ユニットを用いて第1および第2サンプル画像の両方を取得し、そして、これらの各ペアを、他の方法、例えば、上記のオプティカルフロー技術に基づいたものなどで手動、自動、または半自動で再位置合わせすることによって、ランダム動きを適用することによって生成されたサンプル画像の更なるペアを用いてこれらの数を増加させる可能性とともに、第1サンプル画像および第2サンプル画像の両方を合成し、ランダム動きを適用するなどして)。
【0137】
一般に、同じ手法が、同等の撮像/訓練方法とともに実装された場合、同様の検討内容が適用される(より多くのステップまたはその一部の同じ機能を持つ同様のステップを使用し、必須ではないいくつかのステップを削除し、または更なるオプションのステップを追加することによって)。さらに、ステップは、異なる順序で、同時に、または交互の方法で(少なくとも部分的に)実行してもよい。
【0138】
一実施形態が、コンピュータプログラムを提供しており、これは、コンピュータプログラムがコンピュータデバイス上で実行された場合、内視鏡システムを動作させて、患者の身体部分を撮像する方法をコンピュータデバイスに実行させるように構成される。しかしながら、この(動作)方法は、任意の医療処置において任意の患者の任意の身体部分を撮像するために使用できる(上記を参照)。さらに、コンピュータプログラムは、任意のコンピュータデバイス上で実行できる(下記を参照)。
【0139】
一実施形態では、この方法は、身体部分の少なくとも一部を含む第1視野の複数の第1画像の第1シーケンスを受信するステップを含む。しかしながら、第1画像は、任意の数および任意のタイプでもよい(上記を参照)。さらに、第1画像は、任意の方法(例えば、有線/無線インタフェースを介して転送され、直接取得され、リムーバブルストレージユニットを用いて転送され、ネットワークからダウンロードされるなど)で受信してもよい。
【0140】
一実施形態では、この方法は、第1画像に対応する複数の第2画像セットの第2シーケンスを受信するステップを含み、第2画像セットの各々は、身体部分の少なくとも一部を含む第2視野の1つ以上の第2の画像を含む。しかしながら、第1画像および第2画像セットは、任意の方法で対応してもよく、各第2画像セットは、任意のタイプの任意の数の第2画像を含んでよく、第1視野および第2視野は、任意のタイプでもよい(上記参照)。さらに、第2画像は、任意の方法(例えば、直接取得したり、有線/無線インタフェースを介してまたはリムーバブルストレージユニットを用いて転送したり、ネットワークからダウンロードしたりなど)で受信してもよい。
【0141】
一実施形態では、この方法は、複数の第1画像のうちの各現在画像について、および複数の第2画像セットのうちの各現在画像の現在の第2画像についてそれぞれ独立して、第1画像の第1シーケンスを取得するために使用される第1内視鏡ユニットの、第1プローブの第1動きおよび、第2画像セットの第2シーケンスを取得するために使用される第2内視鏡ユニットの、第2プローブの第2動きを推定するステップを含み、第1動きは、現在の第1画像に対応する複数の第1画像の推定セットに従って推定され、第2動きは、現在の第2画像に対応する複数の第2画像の推定セットに従って推定される。しかしながら、これらの動きは、任意のタイプでもよく、任意の方法で示され、任意のタイプの第1/第2画像の推定セットに従って任意の方法で推定してもよい(上記参照)。
【0142】
一実施形態では、この方法は、第1画像および第2画像のペアに対応して、それぞれ複数の第1画像および複数の第2画像のうちの1つ以上の計算セットの第1動きおよび第2動きに従って、複数の第1画像のうちの第1画像および対応する第2画像セットのうちの第2画像の各位置合わせペアのための少なくとも1つの補正を決定するステップを含む。しかしながら、補正は、任意のタイプでもよく、それは、任意の方法で決定されてもよい(上記を参照)。
【0143】
一実施形態では、この方法は、対応する補正に従って第1画像および第2画像の各位置合わせを位置合わせするステップを含む。しかしながら、位置合わせは、任意のタイプでもよく、任意の方法で任意の時間で実行してもよい(上記を参照)。
【0144】
一実施形態では、この方法は、位置合わせされた各位置合わせペアの第1画像および第2画像に基づいて、身体部分の表現を出力するステップを含む。しかしながら、身体部分の表現は、任意の方法で、任意の出力ユニットに、任意の方法で位置合わせされた画像に基づいて出力してもよい(上記を参照)。
【0145】
一実施形態が、コンピュータプログラムを具体化するコンピュータ可読記憶媒体を備えるコンピュータプログラム製品を提供する。コンピュータプログラムは、コンピュータデバイスのワーキングメモリにロード可能であり、それにより、コンピュータプログラムがコンピュータデバイス上で実行された場合、同じ(動作)方法を実行するようにコンピュータデバイスを構成する。
【0146】
一実施形態が、コンピュータプログラムがコンピュータシステム上で実行された場合、コンピュータシステムに上記の(訓練)方法を実行させるように構成されたコンピュータプログラムを提供する。しかしながら、コンピュータプログラムは、任意のコンピュータシステム上で実行できる(下記を参照)。
【0147】
一実施形態が、コンピュータプログラムを具体化するコンピュータ可読記憶媒体を備えるコンピュータプログラム製品を提供しており、コンピュータプログラムは、コンピュータシステムのワーキングメモリにロード可能であり、それにより、コンピュータプログラムがコンピュータシステム上で実行された場合、同じ(訓練)方法を実行するようにコンピュータシステムを構成する。
【0148】
一般に、各(コンピュータ)プログラムは、既存のソフトウェアプログラム(例えば、動作方法のためのコンピュータデバイスの撮像アプリケーション、または訓練方法のためのコンピュータシステムの構成アプリケーション)にとってスタンドアロンモジュールとして、プラグインとして、または後者では直接にでも実装してもよい。いずれの場合も、プログラムが異なる方法で構成される場合、または追加のモジュールまたは機能が提供される場合、同様の検討が適用される。同様に、メモリ構造は、他のタイプのものでもよく、または同等のエンティティ(実体)(必ずしも物理的記憶媒体から構成されない)と置換してもよい。プログラムは、任意のコンピュータデバイス/システム(下記参照)によって使用するのに適した任意の形態をとってもよく、それによりコンピュータデバイス/システムを所望の動作を実行するように構成できる。特に、プログラムは、外部または常駐のソフトウェア、ファームウェアまたはマイクロコード(オブジェクトコードまたはソースコードのいずれか、例えば、コンパイル式またはインタープリ式で)の形態でもよい。さらに、任意のコンピュータ可読記憶媒体上にコンピュータプログラムを提供することが可能である。記憶媒体は、コンピュータデバイス/システムによって使用される命令を保持し保存できる任意の有形媒体(それ自体は一時的な信号とは異なる)である。例えば、記憶媒体は、電子、磁気、光学、電磁気、赤外線または半導の体タイプのものでもよい。こうした記憶媒体の例は、固定ディスク(プログラムがプリロードされてもよい)、取り外し可能なディスク、メモリキー(例えば、USBタイプ)などである。プログラムは、記憶媒体から、またはネットワーク(例えば、伝送ケーブル、光ファイバ、無線接続、ネットワークデバイスを含む、インターネット、ワイドエリアネットワーク、および/またはローカルエリアネットワーク)を介して、コンピュータデバイス/システムにダウンロードしてもよい。コンピュータデバイス/システム内の1つ以上のネットワークアダプタが、ネットワークからプログラムを受信し、コンピュータデバイス/システムの1つ以上の記憶デバイスに保存用にそれを転送する。いずれの場合も、本開示の一実施形態に係る手法は、ハードウェア構造(例えば、半導体材料の1つ以上のチップ内に集積された電子回路、例えば、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向け集積回路(ASIC)などによって)、または適切にプログラム設定されまたは他の方法で構成されたソフトウェアおよびハードウェアとの組合せで実装するのに役立つ。
【0149】
一実施形態が、上記の(撮像)方法のステップを実行するための内視鏡システムを提供する。しかしながら、内視鏡システムは、任意のタイプでもよい(例えば、内視鏡ユニットは、共に接続され、そのうちの1つがコンピュータデバイスおよび出力ユニットを備えており、内視鏡ユニットは、別個のコンピュータデバイスおよび出力ユニットに接続され、全てのコンポーネントが共に統合されているなど)。
【0150】
一実施形態では、内視鏡システムは、第1画像の第1シーケンスを取得するための第1内視鏡ユニットを備える。しかしながら、第1内視鏡ユニットは、任意のタイプ(例えば、マザースコープ、任意の数およびタイプのレンズ、導波路、ミラー、センサなどをベースとした独立した内視鏡)でもよい。
【0151】
一実施形態では、内視鏡システムは、第2画像セットの第2シーケンスを取得するための第2内視鏡ユニットを備える。しかしながら、第2内視鏡ユニットは、任意のタイプ(例えば、ベビースコープ、任意の数およびタイプのレンズ、導波路、ミラー、センサなどをベースとした独立した内視鏡)でもよい。
【0152】
一実施形態では、内視鏡システムは、第1画像および第2画像の各位置合わせペアを位置合わせするためのコンピュータデバイスを備える。しかしながら、コンピュータデバイスは、任意のタイプでもよい(下記を参照)。
【0153】
一実施形態では、内視鏡システムは、身体部分の表現を出力するための出力ユニットを備える。しかしながら、出力ユニットは、任意のタイプでもよい(例えば、モニタ、仮想現実メガネ、プリンタなど)。
【0154】
一実施形態が、(上記の内視鏡システムで使用するための)内視鏡装置を提供しており、これは、第1内視鏡ユニットと第2内視鏡ユニットとの間の一方を備える。しかしながら、内視鏡装置は、任意のタイプでもよい(例えば、ベビースコープ、マザースコープなどを備える)。
【0155】
一実施形態では、前記内視鏡ユニットは、第1画像セットの第1シーケンスと第2画像セットの第2シーケンスとの間の対応する一方を取得するための取得ユニットを備える。しかしながら、取得ユニットは、任意のタイプ(例えば、CCD、ICCD、EMCCD、CMOS、InGaAs、またはPMTセンサをベースとしたもの、身体部分に励起光を印加するための任意の照明ユニット、例えば、レーザ、LED、UVランプなどをベースとしたもの、および/または、白色光、例えば、LED、ハロゲン/キセノンランプなど)でもよい。
【0156】
一実施形態では、前記内視鏡ユニットは、第1内視鏡ユニットおよび第2内視鏡ユニットの他方から、第1画像セットの第1シーケンスおよび第2画像セットの第2シーケンスの間の他方を受信するためのインタフェースを備える。しかしながら、インタフェ-スは、任意のタイプ(たとえば、有線、無線、シリアル、パラレルなど)でもよい。
【0157】
一実施形態では、前記内視鏡ユニットは、第1画像および第2画像の各位置合わせペアを位置合わせするためのコンピュータデバイスを備える。しかしながら、コンピュータデバイスは、任意のタイプでもよい(下記を参照)。
【0158】
一実施形態では、前記内視鏡ユニットは、身体部分の表現を出力するための出力ユニットを備える。しかしながら、出力ユニットは、任意のタイプでもよい(上記を参照)。
【0159】
一実施形態が、コンピュータデバイスを提供しており、これは、上記の(動作)方法のステップを実行するように構成された手段を備える。一実施形態が、同じ(動作)方法の各ステップを実行するための回路(即ち、例えばソフトウェアによって適切に構成された任意のハードウェア)を備えるコンピュータデバイスを提供する。しかしながら、コンピュータデバイスは、任意のタイプでもよい(例えば、他方の内視鏡ユニットから他の画像を受信する各内視鏡ユニットの中央ユニット、両方の内視鏡ユニットのための内視鏡システムの共通の中央ユニット、2つの内視鏡ユニットから対応する画像を受信し、または内視鏡システムから全ての画像を受信する別個のコンピュータなど)。
【0160】
一実施形態が、上記の(訓練)方法のステップを実行するように構成された手段を備えるコンピュータシステムを提供する。一実施形態が、同じ(訓練)方法の各ステップを実行するための回路(即ち、例えば、ソフトウェアによって適切に構成された任意のハードウェア)を含むコンピュータシステムを提供する。しかしながら、コンピュータシステムは、任意のタイプでもよい(例えば、パーソナルコンピュータ、サーバ、例えば、クラウド環境に提供される仮想マシンなど)。
【0161】
一般に、内視鏡システム、内視鏡機器、コンピュータデバイスおよびコンピュータシステムがそれぞれ異なる構造を有し、または同等のコンポーネントを備える場合、または、それが他の動作特性を有する場合にも同様の検討が適用される。いずれの場合も、その全コンポーネントは、より多くのエレメントに分離してもよく、または2つ以上のコンポーネントが単一エレメントに統合されてもよい。さらに、各コンポーネントは、対応する動作の実行を並列的にサポートするように複製されてもよい。さらに、他に指定されない限り、異なるコンポーネント間の任意の相互作用は、一般に、連続的である必要はなく、1つ以上の仲介者を介して直接的または間接的でもよい。
【0162】
一実施形態が、下記ステップを含む手術方法を提供する。患者の身体部分が、上記(撮像)方法を実行することによって撮像され、これにより身体部分の手術処置中に身体部分の表現を出力する。身体部分は、その表現の出力に従って手術される。しかしながら、提案された方法は、任意の種類の手術方法において、用語の最も広い意味で用途を見出すことができ(例えば、治療目的のため、予防目的のため、審美的目的のためになど)、そして任意の患者の任意の種類の身体部分に作用するために(上記参照)。
【0163】
一実施形態が、下記ステップを含む診断方法を提供する。患者の身体部分が、上記(撮像)方法を実行することによって撮像され、これにより身体部分の診断処置中に身体部分の表現を出力する。身体部分の健康状態が、その表現の出力に従って評価される。しかしながら、提案された方法は、任意の種類の診断方法において、用語の最も広い意味で用途を見出すことができ(例えば、新しい病変を発見するため、既知の病変を監視するためなど)、そして任意の患者の任意の種類の身体部分を解析するために(上記参照)。
【0164】
一実施形態が、下記ステップを含む治療方法を提供する。患者の身体部分が、上記(撮像)方法を実行することによって撮像され、これにより身体部分の治療処置中に身体部分の表現を出力する。身体部分は、その表現の出力に従って治療される。しかしながら、提案された方法は、任意の種類の治療方法において、用語の最も広い意味で用途を見出すことができ(例えば、病理学的状態を治療するため、その進行を回避するため、病理学的状態の発生を防止するため、または単に患者の快適性の改善するため)、そして任意の患者の任意の種類の身体部分に作用するために(上記参照)。
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
【国際調査報告】