(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025054262
(43)【公開日】2025-04-07
(54)【発明の名称】制御装置、学習済みモデル生成装置、内視鏡システム、医療支援方法、学習済みモデル生成方法およびプログラム
(51)【国際特許分類】
A61B 1/00 20060101AFI20250328BHJP
A61B 1/045 20060101ALI20250328BHJP
【FI】
A61B1/00 522
A61B1/045 614
A61B1/00 553
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2024163583
(22)【出願日】2024-09-20
(31)【優先権主張番号】63/540,171
(32)【優先日】2023-09-25
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】304050923
【氏名又は名称】オリンパスメディカルシステムズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】渡邊 大智
【テーマコード(参考)】
4C161
【Fターム(参考)】
4C161CC06
4C161HH52
4C161NN01
4C161PP13
(57)【要約】
【課題】光学系から被写体等の測定対象物までの距離の検出精度をさらに向上することができる制御装置、学習済みモデル生成装置、内視鏡システム、医療支援方法、学習済みモデル生成方法およびプログラムを提供する。
【解決手段】光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、前記被写体のデプスマップを出力する。
【選択図】
図9
【特許請求の範囲】
【請求項1】
プロセッサを備える制御装置であって、
前記プロセッサは、
焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、
前記光学系の近点側において前記撮像素子が被写体を撮像して生成した第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記被写体を撮像して生成した第2の画像と、
前記光学系の遠点側において前記撮像素子が前記被写体を撮像して生成した第3の画像と、
を取得し、
前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、
前記被写体のデプスマップを出力する、
制御装置。
【請求項2】
請求項1に記載の制御装置であって、
前記第2の画像は、
前記焦点調整機構が前記近点側と前記遠点側との間で焦点距離を変化させる期間に、前記撮像素子が時間的に連続する画像群で構成される動画における、少なくとも1枚のフレーム画像である、
制御装置。
【請求項3】
請求項2に記載の制御装置であって、
前記プロセッサは、
前記光学系のカメラパラメータを取得し、
前記カメラパラメータと、前記被写体のデプスマップと、に基づいて、前記被写体の形状を推定する、
制御装置。
【請求項4】
請求項3に記載の制御装置であって、
前記プロセッサは、
前記光学系を近点端および遠点端それぞれで停止するように前記焦点調整機構を制御する、
制御装置。
【請求項5】
請求項3に記載の制御装置であって、
前記プロセッサは、
前記光学系を近点端から遠点端へ直線的に移動するように前記焦点調整機構を制御する、
制御装置。
【請求項6】
請求項3に記載の制御装置であって、
前記プロセッサは、
前記光学系を近点端および遠点端それぞれにおいて一定時間内で停止するように前記焦点調整機構を制御する、
制御装置。
【請求項7】
プロセッサを備える学習済みモデル生成装置であって、
前記プロセッサは、
焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、
前記光学系の近点側において前記撮像素子が複数の対象物をそれぞれ撮像して生成した複数の第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記複数の対象物をそれぞれ撮像して生成した複数の第2の画像と、
前記光学系の遠点側において前記撮像素子が前記複数の対象物それぞれを撮像して生成した複数の第3の画像と、
前記光学系から前記複数の対象物それぞれの距離に関するデプスマップの正解値と、
を前記複数の対象物それぞれに組み合わせた学習データを取得し、
前記学習データを用いて学習することによって、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとし、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルを生成する、
学習済みモデル生成装置。
【請求項8】
被検体の体内を撮像可能な内視鏡と、
プロセッサを備え、前記内視鏡が接続可能な制御装置と、
を備え、
前記内視鏡は、
焦点距離を変更可能な光学系と、
前記光学系が結像した像を露光して静止画を生成する撮像素子と、
前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、
を備え、
前記プロセッサは、
前記内視鏡から、
前記光学系の近点側において前記撮像素子が被写体を撮像して生成した第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記被写体を撮像して生成した第2の画像と、
前記光学系の遠点側において前記撮像素子が前記被写体を撮像して生成した第3の画像と、
を取得し、
前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、
前記被写体のデプスマップを出力する、
内視鏡システム。
【請求項9】
プロセッサを備える制御装置が実行する医療支援方法であって、
前記プロセッサが、
焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、
前記光学系の近点側において前記撮像素子が被写体を撮像して生成した第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記被写体を撮像して生成した第2の画像と、
前記光学系の遠点側において前記撮像素子が前記被写体を撮像して生成した第3の画像と、
を取得し、
前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、
前記被写体のデプスマップを出力する、
ことを含む、
医療支援方法。
【請求項10】
プロセッサを備える学習済みモデル生成装置が実行する学習方法であって、
前記プロセッサが、
焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、
前記光学系の近点側において前記撮像素子が複数の対象物をそれぞれ撮像して生成した複数の第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記複数の対象物をそれぞれ撮像して生成した複数の第2の画像と、
前記光学系の遠点側において前記撮像素子が前記複数の対象物それぞれを撮像して生成した複数の第3の画像と、
前記光学系から前記複数の対象物それぞれの距離に関するデプスマップの正解値と、
を前記複数の対象物それぞれに組み合わせた学習データを取得し、
前記学習データを用いて学習することによって、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとし、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルを生成する、
ことを含む、
学習方法。
【請求項11】
プロセッサを備える制御装置が実行するプログラムであって、
前記プロセッサが、
焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、
前記光学系の近点側において前記撮像素子が被写体を撮像して生成した第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記被写体を撮像して生成した第2の画像と、
前記光学系の遠点側において前記撮像素子が前記被写体を撮像して生成した第3の画像と、
を取得し、
前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、
前記被写体のデプスマップを出力する、
プログラム。
【請求項12】
プロセッサを備える学習済みモデル生成装置が実行するプログラムであって、
前記プロセッサが、
焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、
前記光学系の近点側において前記撮像素子が複数の対象物をそれぞれ撮像して生成した複数の第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記複数の対象物をそれぞれ撮像して生成した複数の第2の画像と、
前記光学系の遠点側において前記撮像素子が前記複数の対象物それぞれを撮像して生成した複数の第3の画像と、
前記光学系から前記複数の対象物それぞれの距離に関するデプスマップの正解値と、
を前記複数の対象物それぞれに組み合わせた学習データを取得し、
前記学習データを用いて学習することによって、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとし、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルを生成する、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、制御装置、学習済みモデル生成装置、内視鏡システム、医療支援方法、学習済みモデル生成方法およびプログラムに関する。
【背景技術】
【0002】
従来、デジタルカメラ等の撮像装置において、撮像した画像のボケ具合から被写体と撮像装置との距離を推定する技術が知られている。例えば、特許文献1では、光学系の収差の影響を受けた第1画像に生じる被写体までの距離に応じて非線形に変化するボケを学習することによって生成された統計モデルに、光学系の収差の影響を受けた第2画像を入力し、第2画像中の被写体までの距離を示す距離情報を取得する。
【0003】
また、特許文献2では、レンズの焦点距離を近端から望端まで連続して移動させながらイメージセンサが露光して撮像したスイープ画像における全焦点画像に対する各画像領域のボケ量と、レンズの焦点距離を含む撮像装置の光学的係数値と、に基づいて、スイープ画像における各画像領域における撮像装置と被写体との距離を算出し、この距離を各画像領域における画素値で示すデプスマップ(距離マップ)を生成する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020-148483号公報
【特許文献2】特許第5868183号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、上述した引用文献1,2では、フォーカス駆動中に撮像されたデータを有効活用していないため、光学系から被写体等の測定対象物までの距離の検出精度をさらに向上させる余地があった。
【0006】
本開示は、上記に鑑みてなされたものであって、光学系から被写体等の測定対象物までの距離の検出精度をさらに向上することができる制御装置、学習済みモデル生成装置、内視鏡システム、医療支援方法、学習済みモデル生成方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本開示に係る制御装置は、プロセッサを備える制御装置であって、前記プロセッサは、焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、前記光学系の近点側において前記撮像素子が被写体を撮像して生成した第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記被写体を撮像して生成した第2の画像と、前記光学系の遠点側において前記撮像素子が前記被写体を撮像して生成した第3の画像と、を取得し、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、前記被写体のデプスマップを出力する。
【0008】
また、本開示に係る制御装置は、上記開示において、前記第2の画像は、前記焦点調整機構が前記近点側と前記遠点側との間で焦点距離を変化させる期間に、前記撮像素子が時間的に連続する画像群で構成される動画における、少なくとも1枚のフレーム画像である。
【0009】
また、本開示に係る制御装置は、上記開示において、前記プロセッサは、前記光学系のカメラパラメータを取得し、前記カメラパラメータと、前記被写体のデプスマップと、に基づいて、前記被写体の形状を推定する。
【0010】
また、本開示に係る制御装置は、上記開示において、前記プロセッサは、前記光学系を近点端および遠点端それぞれで停止するように前記焦点調整機構を制御する。
【0011】
また、本開示に係る制御装置は、上記開示において、前記プロセッサは、前記光学系を近点端から遠点端へ直線的に移動するように前記焦点調整機構を制御する。
【0012】
また、本開示に係る制御装置は、上記開示において、前記プロセッサは、前記光学系を近点端および遠点端それぞれにおいて一定時間内で停止するように前記焦点調整機構を制御する。
【0013】
また、本開示に係る学習済みモデル生成装置は、プロセッサを備える学習済みモデル生成装置であって、前記プロセッサは、焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、前記光学系の近点側において前記撮像素子が複数の対象物をそれぞれ撮像して生成した複数の第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記複数の対象物をそれぞれ撮像して生成した複数の第2の画像と、前記光学系の遠点側において前記撮像素子が前記複数の対象物それぞれを撮像して生成した複数の第3の画像と、前記光学系から前記複数の対象物それぞれの距離に関するデプスマップの正解値と、を前記複数の対象物それぞれに組み合わせた学習データを取得し、前記学習データを用いて学習することによって、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとし、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルを生成する。
【0014】
また、本開示に係る内視鏡システムは、被検体の体内を撮像可能な内視鏡と、プロセッサを備え、前記内視鏡が接続可能な制御装置と、を備え、前記内視鏡は、焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備え、前記プロセッサは、前記内視鏡から、前記光学系の近点側において前記撮像素子が被写体を撮像して生成した第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記被写体を撮像して生成した第2の画像と、前記光学系の遠点側において前記撮像素子が前記被写体を撮像して生成した第3の画像と、を取得し、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、前記被写体のデプスマップを出力する。
【0015】
また、本開示に係る医療支援方法は、プロセッサを備える制御装置が実行する医療支援方法であって、前記プロセッサが、焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、前記光学系の近点側において前記撮像素子が被写体を撮像して生成した第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記被写体を撮像して生成した第2の画像と、前記光学系の遠点側において前記撮像素子が前記被写体を撮像して生成した第3の画像と、を取得し、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、前記被写体のデプスマップを出力する、ことを含む。
【0016】
また、本開示に係る学習方法は、プロセッサを備える学習済みモデル生成装置が実行する学習方法であって、前記プロセッサが、焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、前記光学系の近点側において前記撮像素子が複数の対象物をそれぞれ撮像して生成した複数の第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記複数の対象物をそれぞれ撮像して生成した複数の第2の画像と、前記光学系の遠点側において前記撮像素子が前記複数の対象物それぞれを撮像して生成した複数の第3の画像と、前記光学系から前記複数の対象物それぞれの距離に関するデプスマップの正解値と、を前記複数の対象物それぞれに組み合わせた学習データを取得し、前記学習データを用いて学習することによって、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとし、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルを生成する、ことを含む。
【0017】
また、本開示に係るプログラムは、プロセッサを備える制御装置が実行するプログラムであって、前記プログラムは、焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、前記光学系の近点側において前記撮像素子が被写体を撮像して生成した第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記被写体を撮像して生成した第2の画像と、前記光学系の遠点側において前記撮像素子が前記被写体を撮像して生成した第3の画像と、を取得し、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルに、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとして入力することによって前記被写体のデプスマップを推論し、前記被写体のデプスマップを出力する。
【0018】
また、本開示に係るプログラムは、プロセッサを備える学習済みモデル生成装置が実行するプログラムであって、前記プログラムは、焦点距離を変更可能な光学系と、前記光学系が結像した像を露光して静止画を生成する撮像素子と、前記光学系を前記光学系の光軸方向に沿って移動させて前記焦点距離を変更する焦点調整機構と、を備える撮像装置から、前記光学系の近点側において前記撮像素子が複数の対象物をそれぞれ撮像して生成した複数の第1の画像と、前記焦点調整機構によって前記光学系を近点側と遠点側との間において焦点距離を変化させて移動させている期間に前記撮像素子が前記複数の対象物をそれぞれ撮像して生成した複数の第2の画像と、前記光学系の遠点側において前記撮像素子が前記複数の対象物それぞれを撮像して生成した複数の第3の画像と、前記光学系から前記複数の対象物それぞれの距離に関するデプスマップの正解値と、を前記複数の対象物それぞれに組み合わせた学習データを取得し、前記学習データを用いて学習することによって、前記第1の画像、前記第2の画像および前記第3の画像を入力パラメータとし、前記光学系から被写体までの距離を示すデプスマップを出力パラメータとして出力する学習済みモデルを生成する。
【発明の効果】
【0019】
本開示によれば、測定対象物における3次元形状の推定精度をさらに向上することができるという効果を奏する。
【図面の簡単な説明】
【0020】
【
図1】
図1は、一実施の形態に係る学習済みモデル生成装置の機能構成を示すブロック図である。
【
図2】
図2は、一実施の形態に係る学習済みモデル生成装置の光学系におけるフォーカスレンズの移動を模式的に説明する図である。
【
図3】
図3は、一実施の形態に係る内視鏡システムの全体構成を示す図である。
【
図4】
図4は、一実施の形態に係る内視鏡および制御装置の要部の機能構成を示すブロック図である。
【
図5】
図5は、一実施の形態に係る学習済みモデル生成装置が実行する処理の概要を示すフローチャートである。
【
図6】
図6は、一実施の形態に係る学習部が学習モデルに入力する学習データセットを模式的に示す図である。
【
図7】
図7は、デプブマップと画像との紐付けを模式的に説明する図である。
【
図8】
図8は、一実施の形態に係る内視鏡システムが実行する処理の概要を示すフローチャートである。
【
図9】
図9は、
図8における計測モード処理の概要を示すフローチャートである。
【
図10】
図10は、一実施の形態に係る内視鏡システムが実行する計測モード処理時における内視鏡が備えるフォーカスレンズの光軸上における位置および撮像素子の露光タイミングを示すタイミングチャートである。
【
図11】
図11は、内視鏡が撮像する被写体の一例を示す図である。
【
図12】
図12は、内視鏡が撮像した画像データの一例を示す図である。
【
図13】
図13は、内視鏡が撮像した画像データの別の一例を示す図である。
【
図14】
図14は、内視鏡が撮像した画像データの別の一例を示す図である。
【
図15】
図15は、算出部が被写体の形状を推定する推定方法を模式的に説明する図である。
【
図16】
図16は、被写体の形状に対応する画像の一例を示す図である。
【
図17】
図17は、一実施の形態の変形例1に係る内視鏡システムが実行する計測モード処理時における内視鏡が備えるフォーカスレンズの光軸上における位置および撮像素子の露光タイミングを示すタイミングチャートである。
【
図18】
図18は、一実施の形態の変形例1に係る内視鏡システムが実行する計測モード処理時における内視鏡が備えるフォーカスレンズの光軸上における位置および撮像素子の露光タイミングを示すタイミングチャートである。
【発明を実施するための形態】
【0021】
以下、本開示に係る学習済みモデル生成装置および内視鏡システムについて、図面とともに詳細に説明する。なお、以下の実施の形態により本開示が限定されるものではない。また、以下の説明において参照する各図は、本開示の内容を理解でき得る程度に形状、大きさ、および位置関係を概略的に示してあるに過ぎない。即ち、本開示は、各図で例示された形状、大きさおよび位置関係のみに限定されるものではない。さらに、図面の記載において、同一の部分には同一の符号を付して説明する。また、以下においては、本開示に係る学習済みモデル生成装置の構成を説明後、内視鏡システムの構成について説明する。
【0022】
〔学習済みモデル生成装置の構成〕
図1は、一実施の形態に係る学習済みモデル生成装置の機能構成を示すブロック図である。
図1に示す学習済みモデル生成装置1は、被写体毎に、合焦位置(フォーカルポイント)が互いに異なる複数の画像と、画素毎の被写体と光学系との距離を示すデプブマップ(正解値)と、を対応付けた複数の組合せの学習データを所定の学習モデルに入力して学習済みモデルを生成する装置である。
【0023】
図1に示す学習済みモデル生成装置1は、撮像装置11と、表示部12と、入力部13と、通信部14と、記録部15と、第1の制御部16と、を備える。
【0024】
撮像装置11は、第1の制御部16の制御のもと、所定の視野領域から光を集光して受光することによって被写体像の画像データ(RAWデータ)を生成して、第1の制御部16へ出力する。撮像装置11は、光学系101と、撮像素子102と、焦点調整機構103と、を有する。
【0025】
光学系101は、レンズL1~L10と、絞りDiと、を用いて構成される。光学系101は、被写体像を撮像素子102の受光面に結像する。また、光学系101は、レンズL1~L10のうち、光軸O1方向に沿って移動可能なフォーカスレンズL5を有する。フォーカスレンズL5は、後述する焦点調整機構103によって光軸O1方向に沿って前後に移動する。
【0026】
撮像素子102は、光学系101が結像した被写体像を受光することによって画像データを生成する。撮像素子102は、例えばCMOS(Complementary Metal Oxide Semiconductor)センサまたはCCD(Charge Coupled Device)センサのイメージセンサを用いて構成される。
【0027】
焦点調整機構103は、第1の制御部16の制御のもと、光学系101のフォーカスレンズL5を光軸O1に沿って移動させることによって光学系101の合焦位置(フォーカルポイント)を変更する。焦点調整機構103は、焦点駆動部103aと、検出部103bと、を有する。
【0028】
焦点駆動部103aは、例えばステッピングモータやボイスコイルモータ等を含むアクチュエータを用いて構成され、第1の制御部16の制御のもと、駆動することによってフォーカスレンズL5を光軸O1上における所定の位置に移動する。
【0029】
検出部103bは、光学系101におけるフォーカスレンズL5の位置または焦点距離に関する焦点距離情報を検出し、この検出結果を第1の制御部16へ出力する。検出部103bは、例えばエンコーダやフォトカプラ等を用いて構成される。なお、検出部103bは、焦点駆動部103aの駆動量に基づいて、フォーカスレンズL5の光軸O1上における位置を検出するものであってもよい。
【0030】
図2は、光学系101におけるフォーカスレンズL5の移動を模式的に説明する図である。
図2の(a)および(b)に示すように、焦点駆動部103aは、第1の制御部16の制御のもと、駆動することによってフォーカスレンズL5を光軸O1上における所定の位置に移動させることによって、光学系101の合焦位置P1(フォーカルポイント)を変更する(
図2の(a)→
図2の(b))。これにより、光学系101は、合焦位置P1を遠点端から近点端の間で変更することができる。
【0031】
図1に戻り、学習済みモデル生成装置1の構成の説明を続ける。
表示部12は、第1の制御部16から入力される各種情報および画像データに対応する表示画像を表示する。表示部12は、有機ELディスプレイ(Organic Electroluminescent Display)または液晶ディスプレイ等を用いて構成される。
【0032】
入力部13は、ユーザの各種操作の入力を受け付け、この受け付けた各種操作に応じた情報を第1の制御部16へ出力する。入力部13は、キーボード、マウス、タッチパネル等の入力インターフェースを用いて構成される。
【0033】
通信部14は、第1の制御部16から入力される各種情報を外部へ送信するとともに、外部から受信した各種情報を第1の制御部16へ出力する。通信部14は、例えばWi-Fi(登録商標)やBluetooth(登録商標)が可能な通信モジュール等を用いて構成される。
【0034】
記録部15は、学習済みモデル生成装置1に関する各種情報を記録する。記録部15は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ、揮発性メモリおよび不揮発性メモリ等を用いて構成される。記録部15は、プログラム記録部151と、学習モデル記録部152と、学習済みモデル記録部153と、を有する。
【0035】
プログラム記録部151は、学習済みモデル生成装置1が実行する各種のプログラム、例えば学習モデル済みモデルを生成するためのプログラムを記録する。
【0036】
学習モデル記録部152は、後述する第1の制御部16が入力パラメータを入力するための学習モデルを記録する。
【0037】
学習済みモデル記録部153は、学習データを用いて学習された複数の学習済みモデルを記録する。
【0038】
第1の制御部16は、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)またはCPU(Central Processing Unit)等のハードウェアを有するプロセッサと、当該プロセッサが使用する一時的な記憶域であるメモリを用いて実現される。第1の制御部16は、駆動制御部161と、撮像制御部162と、取得部163と、判定部164と、学習部165と、出力制御部166と、を有する。
【0039】
駆動制御部161は、焦点調整機構103を駆動してフォーカスレンズL5を光学系101における近点端へ移動させる。
【0040】
撮像制御部162は、撮像素子102にフォーカスレンズL5の近点端、近点端から遠点端に移動中および遠点端それぞれ撮像させる。
【0041】
取得部163は、撮像素子102が生成した画像データを取得する。具体的には、取得部163は、撮像素子102がフォーカスレンズL5の近点端で撮像して生成した画像データ(以下、単に「第1の画像」という)を取得する。また、取得部163は、フォーカスレンズL5が近点端から遠点端へ移動する移動期間中に、撮像素子102が複数撮像することによって生成した複数の画像データ(以下、単に「複数の第2の画像」)を取得する。取得部163は、撮像素子102がフォーカスレンズL5の遠点端で撮像して生成した画像データ(以下、単に「第3の画像」という)を取得する。
【0042】
判定部164は、学習するために必要となる画像の枚数が所定枚数取得することができたか否かを判定する。
【0043】
学習部165は、所定の学習モデルと、取得部163が取得した被写体毎の複数の画像であって、互いに合焦位置が異なる複数の画像とデプブマップとを組み合わせた学習データを用いて学習する。具体的には、学習部165は、人工知能(AI(Artificial Intelligence))を用いた機械学習によって生成される学習モデルを用いて学習する。学習部165で用いる学習モデルを構築する手法は、特に限定されることなく、例えばニューラルネットワークを用いた深層学習、サポートベクターマシン、決定木、単純ベイズ、k近傍法等の種々の機械学習手法を用いることができる。また、デプスマップとは、撮像素子203の位置(先端部24の位置)から撮像画像における画素位置に対応する観察対象上の対応位置までの被写体距離が画素位置毎に検出された情報である。
【0044】
出力制御部166は、学習部165が生成した学習済みモデルを学習済みモデル記録部153に出力する。
【0045】
〔内視鏡システムの概略構成〕
次に、内視鏡システム100の構成について説明する。
図3は、一実施の形態に係る内視鏡システム100の全体構成を示す図である。
【0046】
図3に示す内視鏡システム100は、内視鏡2の挿入部21を、人または動物等の被検体の口から食道または被検体の肛門から大腸へ挿入することによって被検体内を連続的に撮像し、この撮像した画像データ群を時系列に沿って表示装置3に表示する。さらに、内視鏡システム100は、画像診断装置5(CAD:Computer Aided Detection)が制御装置4から入力される画像データ群と、予め被検体の臓器、部位および病変等を撮像した学習データを用いて学習された推論モデル(学習済みモデル)と、に基づいて、画像データに写る複数の観察部位の臓器、部位、ポリープまたは癌等を含む特徴領域および鉗子やスネア等の処置具による生体への処置を検出(認識または推定)し、この検出結果情報を制御装置4へ出力する。医者等の術者は、表示装置3に表示される表示画像および画像診断装置5の検出結果(推定結果)を確認しながら、被検体の観察および処置を行う。
【0047】
図3に示すように、内視鏡システム100は、内視鏡2と、表示装置3と、制御装置4と、画像診断装置5と、を備える。
【0048】
内視鏡2は、被検体内を撮像することによって画像データ(RAWデータ)を連続的に生成し、この画像データを制御装置4へ順次出力する。内視鏡2は、
図1に示すように、挿入部21と、操作部22と、ユニバーサルコード23と、を備える。
【0049】
挿入部21は、少なくとも一部が可撓性を有し、被検体内に挿入される。挿入部21は、
図1に示すように、当該挿入部21の先端に設けられた先端部24と、当該先端部24の基端側(操作部22側)に連結され、湾曲可能に構成された湾曲部25と、当該湾曲部25の基端側に連結され、可撓性を有する長尺状の可撓管部26と、を備える。
【0050】
操作部22は、挿入部21における基端部分に対して接続されている。操作部22は、内視鏡2に対する各種の操作を受け付ける。この操作部22には、
図1に示すように、湾曲ノブ221と、挿入口222と、複数の操作部材223と、が設けられている。
【0051】
湾曲ノブ221は、術者等のユーザによるユーザ操作に応じて回動可能に構成されている。そして、湾曲ノブ221は、回動することによって、挿入部21内に配設された金属製または樹脂製のワイヤ等の湾曲機構(図示略)を動作させる。これによって、湾曲部25は、湾曲する。
【0052】
挿入口222は、挿入部21の先端から延在した管路である処置具チャンネル(図示略)に連通し、内視鏡2の外部から当該処置具チャンネルに対して処置具等を挿通するための挿入口である。
【0053】
複数の操作部材223は、術者等のユーザによる各種操作を受け付けるボタン等によって構成され、ユニバーサルコード23を経由することによって、当該各種操作に応じた操作信号を制御装置4へ出力する。当該各種操作としては、内視鏡2による静止画像の撮像を指示するレリーズ操作、内視鏡2の観察モードを通常光観察モード、または、特殊観察モードに切り替える操作等を例示することができる。
【0054】
ユニバーサルコード23は、操作部22から挿入部21の延在方向とは異なる方向に延在し、光ファイバ等によって構成されたライトガイド231(
図2参照)、および、上述した画像データを伝送する第1の信号線232(
図2参照)、上述した操作信号等を伝送する第2の信号線233(
図2参照)等が配設されたコードである。そして、ユニバーサルコード23の基端には、
図1に示すように、第1のコネクタ部27が設けられている。第1のコネクタ部27は、制御装置4に対して着脱自在に接続される。
【0055】
表示装置3は、液晶または有機EL等の表示モニタによって構成され、制御装置4による制御の下、当該制御装置4において画像処理が施された画像データに基づく表示画像、および内視鏡2に関する各種情報を表示する。
【0056】
制御装置4は、GPU、FPGA、またはCPU等のハードウェアを有する処理装置であるプロセッサと、当該プロセッサが使用する一時的な記憶域であるメモリと、を用いて実現される。制御装置4は、メモリに記録されたプログラムに従って、内視鏡2の各部の動作を統括的に制御する。
【0057】
画像診断装置5(CAD)は、制御装置4から入力される画像データ群と、予め学習データで学習された学習済みモデルと、を用いて画像データに写る臓器、部位、挿入部21の挿入速度、ポリープまたは癌等を含む特徴領域(異常領域または病変候補領域)および鉗子やスネア等の処置具による生体への処置を検出(推定)し、この検出結果と検出時刻とを対応付けた検出結果情報を制御装置4へ出力する。画像診断装置5は、GPU、FPGA、またはCPU等のハードウェアを有する処理装置であるプロセッサと、当該プロセッサが使用する一時的な記憶域であるメモリと、を用いて実現される。
【0058】
〔医療支援システムの要部の機能構成〕
次に、上述した内視鏡システム100の要部の機能構成について説明する。
図4は、内視鏡2および制御装置4の要部の機能構成を示すブロック図である。以下では、内視鏡2および制御装置4の順で説明する。
【0059】
〔内視鏡の機能構成〕
まず、内視鏡2の構成について説明する。
図4に示すように、内視鏡2は、照明光学系201と、光学系202と、撮像素子203と、A/D変換部204と、P/S変換部205と、焦点調整機構206と、撮像制御部207と、を備える。ここで、照明光学系201、光学系202、撮像素子203、A/D変換部204、P/S変換部205、焦点調整機構206および撮像制御部207の各々は、先端部24内に配置されている。
【0060】
照明光学系201は、1または複数のレンズ等によって構成され、ライトガイド231から供給された照明光を被写体に向けて照射する。
【0061】
光学系202は、レンズL1~L10と、絞りDiと、を用いて構成される。光学系202は、被写体像を撮像素子203の受光面に結像する。また、光学系202は、レンズL1~L10のうち、光軸O1方向に沿って移動可能なフォーカスレンズL5を有する。フォーカスレンズL5は、焦点調整機構206によって光軸O1方向に沿って前後に移動する。一実施の形態では、光学系202は、中遠景の観察に適した合焦位置と近点観察に適した合焦位置を切り替えることができる。もちろん、光学系202は、合焦位置を2値で離散的に切り替えさせる必要がなく、連続的に複数の所望の位置へ変更可能なものであってもよい。
【0062】
撮像素子203は、2次元マトリクス状に配置されてなる複数の画素の各々に、ベイヤー配列(RGGB)を構成するカラーフィルタのいずれか1つが配置されてなるCCDまたはCMOS(のイメージセンサを用いて構成される。撮像素子203は、撮像制御部207による制御のもと、光学系202によって結像された被写体像を受光し、光電変換を行って撮像画像(アナログ信号)を生成する。なお、一実施の形態では、撮像素子203は、イメージセンサとTOF(Time Of Flight)方式でデプスマップ(被写体距離情報)を取得するTOFセンサとが一体的に構成されたものであってもよい。なお、デプスマップを生成する構成としては、上述したTOFセンサに限らず、位相差センサを含むイメージセンサ等を採用しても構わない。以下では、デプスマップおよび撮像画像を纏めて画像データと記載する。撮像素子203は、画像データをA/D変換部204へ出力する。
【0063】
A/D変換部204は、A/D変換回路等を用いて構成される。A/D変換部204は、撮像制御部207による制御のもと、撮像素子203から入力されたアナログの画像データに対してA/D変換処理を行い、P/S変換部205へ出力する。
【0064】
P/S変換部205は、P/S変換回路等を用いて構成され、撮像制御部207による制御の下、A/D変換部204から入力されたデジタルの画像データをパラレル/シリアル変換を行い、第1の信号線232を経由することによって制御装置4へ出力する。
なお、P/S変換部205の代わりに、画像データを光信号に変換するE/O変換部を設け、当該光信号によって制御装置4へ画像データを出力する構成としてもよい。また、例えばWi-Fi(Wireless Fidelity)(登録商標)等の無線通信によって画像データを制御装置4へ送信する構成としても構わない。
【0065】
焦点調整機構206は、第2の制御部410または撮像制御部207の制御のもと、光学系101のフォーカスレンズL5を光軸O1に沿って移動させることによって光学系101のフォーカルポイント(合焦位置)を変更する。焦点調整機構206は、焦点駆動部206aと、検出部206bと、を有する。
【0066】
焦点駆動部206aは、例えばステッピングモータやボイスコイルモータ等を含むアクチュエータを用いて構成され、第2の制御部410または撮像制御部207の制御のもと、駆動することによってフォーカスレンズL5を光軸O1上における所定の位置に移動する。
【0067】
検出部206bは、光学系202におけるフォーカスレンズL5の位置または焦点距離に関する焦点距離情報を検出し、この検出結果を第2の制御部410へ出力する。検出部206bは、例えばエンコーダやフォトカプラ等を用いて構成される。なお、検出部206bは、焦点駆動部206aの駆動量に基づいて、フォーカスレンズL5の光軸O1上における位置を検出するものであってもよい。
【0068】
撮像制御部207は、TG(Timing Generator)と、CPU等のハードウェアを有する処理装置であるプロセッサと、当該プロセッサが使用する一時的な記憶域であるメモリを用いて実現される。撮像制御部207は、第2の信号線233を経由することによって制御装置4から受信した設定データに基づいて、撮像素子203、A/D変換部204、およびP/S変換部205の各々の動作を制御する。
【0069】
〔制御装置の構成〕
次に、制御装置4の構成について説明する。
図2に示すように、制御装置4は、集光レンズ401と、第1の光源部402と、第2の光源部403と、光源制御部404と、S/P変換部405と、画像処理部406と、入力部407と、記録部408と、通信部409と、第2の制御部410と、を備える。
【0070】
集光レンズ401は、第1の光源部402および第2の光源部403の各々が発光した光を集光し、ライトガイド231へ出射する。
【0071】
第1の光源部402は、光源制御部404による制御のもと、可視光である白色光(通常光)を発光することによってライトガイド231へ当該白色光を照明光として供給する。この第1の光源部402は、コリメートレンズ、白色LED(Light Emitting Diode)ランプ、および駆動ドライバ等を用いて構成される。なお、第1の光源部402としては、赤色LEDランプ、緑色LEDランプ、および青色LEDランプを用いて同時に発光することによって可視光の白色光を供給しても構わない。また、第1の光源部402としては、ハロゲンランプやキセノンランプ等によって構成しても構わない。
【0072】
第2の光源部403は、光源制御部404による制御の下、所定の波長帯域を有する特殊光を発光することによってライトガイド231へ特殊光を照明光として供給する。ここで、特殊光とは、390~445nmおよび530~550nmを含む狭帯域光による狭帯域光観察(NBI:Narrow band Imaging)に用いられる光である。もちろん、特殊光として、狭帯域光以外にも、赤色光観察(RDI:Red dichromatic Imaging)に用いられるアンバー色の光(600nmおよび630nm)であってもよい。
【0073】
光源制御部404は、FPGAまたはCPU等のハードウェアを有するプロセッサと、当該プロセッサが使用する一時的な記憶域であるメモリを用いて実現される。光源制御部404は、第2の制御部410から入力される制御データに基づいて、第1の光源部402および第2の光源部403の各々の発光タイミングおよび発光時間等を制御する。
【0074】
S/P変換部405は、第2の制御部410による制御のもと、第1の信号線232を経由することによって内視鏡2から受信した画像データに対してシリアル/パラレル変換を行い、画像処理部406へ出力する。なお、内視鏡2が光信号で画像データを出力する場合、S/P変換部405の代わりに、光信号を電気信号に変換するO/E変換部を設けても構わない。また、内視鏡2が無線通信によって画像データを送信する場合、S/P変換部405の代わりに、無線信号を受信可能な通信モジュールを設けても構わない。
【0075】
画像処理部406は、GPUまたはFPGA等のハードウェアを有するプロセッサと、当該プロセッサが使用する一時的な記憶域であるメモリを用いて実現される。画像処理部406は、第2の制御部410による制御の下、S/P変換部405から入力されたパラレルデータの画像データに所定の画像処理を施し、表示装置3へ出力する。ここで、所定の画像処理としては、デモザイク処理、ホワイトバランス処理、ゲイン調整処理、γ補正処理、およびフォーマット変換処理等を例示することができる。
【0076】
入力部407は、マウス、フットスイッチ、キーボード、ボタン、スイッチ、およびタッチパネル等を用いて構成され、術者等のユーザによるユーザ操作を受け付け、当該ユーザ操作に応じた操作信号を第2の制御部410へ出力する。
【0077】
記録部408は、揮発性メモリ、不揮発性メモリ、SSD(Solid State Drive)およびHDD(Hard Disk Drive)等やメモリカード等の記録媒体を用いて構成される。そして、記録部408は、制御装置4および内視鏡2の動作に必要な各種パラメータ等を含むデータを記録する。また、記録部408は、内視鏡2および制御装置4を動作させるための各種プログラムを記録するプログラム記録部408aと、画像データに対応する画像を格納する画像ファイルを記録する画像データ記録部408bと、学習済みモデルを記録する学習済みモデル記録部408cと、カメラパラメータ記録部408dと、を有する。
【0078】
画像データ記録部408bは、第2の制御部410の制御のもと、内視鏡2が被検体に対して複数の観察部位を連続的に撮像することによって生成した画像データ群および静止画像データに対応する画像(内視鏡画像)を、患者情報等に対応付けて記録する。ここで、静止画像データとは、操作部22から入力されるレリーズ信号によって撮像を指示された際に、撮像素子203が撮像した画像データであって、撮像素子203が順次生成するライブビュー画像より解像度が高い画像データである。
【0079】
学習済みモデル記録部408cは、互いに合焦位置が異なる複数の画像を入力パラメータとし、出力パラメータとして光学系202から被写体までの距離を示すデプスマップを出力する学習済みモデルを記録する。
【0080】
カメラパラメータ記録部408dは、光学系202のカメラパラメータを記録する。具体的には、カメラパラメータは、画像平面(撮像素子203の画素の位置)と物体(被写体の位置)を紐づける変換係数である。例えば、市松模様の平板を用いてカメラキャリブレーションを行うことで取得することができる変換行列である。また、カメラパラメータ記録部408dは、撮像素子203の画素毎にデプスzに応じた画像上の点(x,y)の値をルックアップテーブルとして記録してもよい。この場合、後述する第2の制御部410は、推定したデプスzに応じて画像上の点(x,y)を導出してもよい。また、カメラパラメータ記録部408dは、撮像素子203の画素毎にデプスzに応じた画像上の点(x,y)の近似式を記録してもよい。この場合、後述する第2の制御部410は、推定したデプスzに応じて画像上の点(x,y)を導出してもよい。
【0081】
通信部409は、第2の制御部410の制御のもと、画像診断装置5または学習済みモデル生成装置1へ各種情報を送信するとともに、画像診断装置5または学習済みモデル生成装置1から各種情報を受信して第2の制御部410へ出力する。具体的には、通信部409は、第2の制御部410の制御のもと、画像処理部406が画像処理を施した時間的に連続する画像データ群を画像診断装置5へ送信し、画像診断装置5において検出された臓器、部位、および特徴領域等を含む検出結果を受信して第2の制御部410へ出力する。また、通信部409は、第2の制御部410の制御のもと、学習済みモデル生成装置1から受信した学習済みモデルを受信して学習済みモデル記録部408cへ出力する。通信部409は、通信モジュール等を用いて構成される。
【0082】
第2の制御部410は、本開示に係る第2のプロセッサに相当する。この第2の制御部410は、FPGAまたはCPU等のハードウェアを有する処理装置である第2のプロセッサと、当該第2のプロセッサが使用する一時的な記憶域であるメモリを用いて実現される。そして、第2の制御部410は、内視鏡2および制御装置4を構成する各部を統括的に制御する。第2の制御部410は、駆動制御部410aと、撮像制御部410bと、取得部410cと、推論部410dと、算出部410eと、出力制御部410fと、を有する。
【0083】
駆動制御部410aは、焦点調整機構206を駆動してフォーカスレンズL5を近点側または遠点端へ移動させる。
【0084】
撮像制御部410bは、撮像素子203にフォーカスレンズL5が近点端または遠点端で集光した被写体像を露光させて撮像させる。さらに、撮像制御部410bは、フォーカスレンズL5が近点端から遠点端に移動する移動期間中に、撮像素子203に集光した被写体像を露光させて撮像させる。
【0085】
取得部410cは、フォーカスレンズL5の近点側において撮像素子203が被写体を撮像して生成した第1の画像を取得する。また、取得部410cは、焦点調整機構206によるフォーカスレンズL5の近点側と遠点側との間において焦点距離を変化させて移動させている期間に撮像素子203が被写体を撮像して生成した複数の第2の画像のいずれか1つ以上を取得する。また、取得部410cは、フォーカスレンズL5の遠点側において撮像素子203が被写体を撮像して生成した第3の画像を取得する。
【0086】
推論部410dは、取得部410cが取得した第1の画像、第2の画像および第3の画像と、学習済みモデル記録部408cが記録する学習済みモデルと、を用いて、被写体のデプスマップを推定する。
【0087】
算出部410eは、算出部410eは、推論部410dが推定した被写体のデプブマップと、カメラパラメータ記録部408dが記録する光学系202のカメラパラメータと、に基づいて、被写体の形状を推定する。
【0088】
出力制御部410fは、算出部410eが推定した被写体の形状を表示装置3に出力する。
【0089】
〔学習済みモデル生成装置による処理〕
次に、学習済みモデル生成装置1が実行する処理について説明する。
図5は、学習済みモデル生成装置1が実行する処理の概要を示すフローチャートである。ここで、被写体距離とは、光学系101の先端から被写体K1までの距離である。また、以下においては、被写体は、光学系101に正対した凹凸がない平面被写体として説明する。学習させる平面被写体の距離範囲は合焦位置における近点端および遠点端よりも広くする。例えば、合焦位置における近点端を4mm、遠点端を20mmとしたとき、学習させる被写体の距離を2mm~40mmとして説明する。これにより合焦位置よりも近点または遠点に位置する被写体に対してデプスを推定することが可能となる。
【0090】
図5に示すように、まず、学習済みモデル生成装置1は、被写体を設定する(ステップS100)。具体的には、学習済みモデル生成装置1は、ユーザが入力部13を経由して入力した操作情報に基づいて、被写体を設定する。この場合、ユーザは、液晶モニタの場合、絵柄の種別内容、液晶モニタと学習済みモデル生成装置1までの距離を、入力部13を用いて入力する。
【0091】
その後、駆動制御部161は、焦点調整機構103を駆動してフォーカスレンズL5を光学系101における近点端へ移動させる(ステップS101)。
【0092】
続いて、撮像制御部162は、撮像素子102にフォーカスレンズL5の近点端で撮像させる(ステップS102)。
【0093】
その後、取得部163は、撮像素子102がフォーカスレンズL5の近点端で撮像して生成した第1の画像を取得する(ステップS103)。
【0094】
続いて、駆動制御部161は、焦点調整機構103を駆動してフォーカスレンズL5を近点端から遠点端へ移動させる(ステップS104)。
【0095】
その後、撮像制御部162は、フォーカスレンズL5が近点端から遠点端へ移動する移動期間中に、撮像素子102に複数撮像させる(ステップS105)。
【0096】
続いて、取得部163は、フォーカスレンズL5が近点端から遠点端へ移動する移動期間中に、撮像素子102が複数撮像することによって生成した複数の第2の画像を取得する(ステップS106)。なお、取得部163は、フォーカスレンズL5が近点端から遠点端へ移動する移動期間中に、撮像素子102が複数撮像することによって生成した複数の第2の画像を全て取得しているが、これに限定されることなく、フォーカスレンズL5が近点端から遠点端へ移動する移動期間中に1つ以上を取得すればよい。
【0097】
その後、撮像制御部162は、撮像素子102にフォーカスレンズL5の遠点端で撮像させる(ステップS107)。
【0098】
続いて、取得部163は、撮像素子102がフォーカスレンズL5の遠点端で撮像して生成した第3の画像を取得する(ステップS108)。
【0099】
その後、判定部164は、学習するために必要となる画像の枚数が所定枚数取得することができたか否かを判定する(ステップS109)。具体的には、
図6~
図9に示すように、判定部164は、複数の被写体それぞれに対して、複数の合焦位置それぞれで撮像して生成して取得した複数の画像が所定枚数(例えば10000枚)を超えたか否かを判定する。判定部164によって学習するために必要となる画像の枚数が所定枚数を取得することができたと判定された場合(ステップS109:Yes)、学習済みモデル生成装置1は、後述するステップS110へ移行する。これに対して、判定部164によって学習するために必要となる画像の枚数が所定枚数を取得できていないと判定された場合(ステップS109:No)、学習済みモデル生成装置1は、ステップS101へ戻る。
【0100】
ステップS110において、取得部163は、通信部14を経由して外部装置または記録部15から被写体毎のデプスマップを取得する。デプブマップ(デプス分布)とは、各被写体画像の各画素に対して光学系101からの被写体までの距離の正解値を付加したものである。もちろん、取得部163は、ユーザが入力部13を経由して入力したデプブマップを取得してもよい。
【0101】
続いて、学習部165は、所定の学習モデルと、取得部163が取得した被写体毎の複数の画像であって、互いに合焦位置が異なる複数の画像とデプブマップとを組み合わせた学習データを用いて学習する(ステップS111)。具体的には、学習部165は、人工知能(AI(Artificial Intelligence))を用いた機械学習によって生成される学習モデルを用いて学習する。学習部165で用いる学習モデルを構築する手法は、特に限定されることなく、例えばニューラルネットワークを用いた深層学習、サポートベクターマシン、決定木、単純ベイズ、k近傍法等の種々の機械学習手法を用いることができる。
【0102】
図6は、学習部165が学習モデルに入力する学習データセットを模式的に示す図である。
図6に示すように、学習部165は、所定の学習モデルと、取得部163が取得した被写体毎の複数の画像FP1~FP4であって、互いに合焦位置が異なる複数の画像FP1~FP4とデプブマップとを組み合わせた学習データを用いて学習して学習済みモデルを生成する。即ち、学習部165は、第1の画像、第2の画像および第3の画像を入力パラメータとし、被写体と光学系101との距離情報を出力パラメータとして出力する学習済みモデルを生成する。
【0103】
なお、一実施の形態では、デプブマップと画像との紐付けは、複数の画像のうち、近点端の第1の画像または遠点端の第2の画像の少なくとも一方であればよい。
図7は、デプブマップと画像との紐付けを模式的に説明する図である。なお、
図7では、光学系101の合焦位置(フォーカルポイント)が異なる第1の画像P100、第3の画像P101および第2の画像P102それぞれについて説明する。さらに、
図7では、第1の画像P100の枠W1が第3の画像P101に対応する画角となり、枠W2が第2の画像P102に対応する画角となる。さらに、領域D1がデプスマップ推定可能な領域となる。
【0104】
図7に示すように、一実施の形態では、第1の画像P100および第3の画像P101それぞれに所定の特徴、例えば特徴的な絵柄が含まれるため、第1の画像P100および第3の画像P101との画像間で対応付けを行うことができるので、他の画像、例えば第2の画像P102へのデプスマップの紐付けを行うことができる。このため、一実施の形態では、デプスマップを紐付ける場合、画角が広い画像、例えば第1の画像P100に紐付けることが望ましい。
【0105】
図5に戻り、ステップS112以降の説明を続ける。
ステップS102において、出力制御部166は、学習部165が生成した学習済みモデルを学習済みモデル記録部153に出力する(ステップS112)。この場合、出力制御部166は、通信部14を経由して、外部装置、例えば後述する内視鏡システム100に、学習済みモデルを出力してもよい。ステップS111の後、学習済みモデル生成装置1は、本処理を終了する。
【0106】
〔医療支援システムが実行する処理〕
次に、内視鏡システム100が実行する処理について説明する。
図8は、内視鏡システム100が実行する処理の概要を示すフローチャートである。
【0107】
図8に示すように、第2の制御部410は、内視鏡2の操作部22から内視鏡2の観察モードを、被検体の形状を計測する計測モードに指示する指示信号が入力されたか否かを判定する(ステップS201)。第2の制御部410によって内視鏡2の操作部22から内視鏡2の観察モードを、被検体の形状を計測する計測モードに指示する指示信号が入力されたと判定された場合(ステップS201:Yes)、内視鏡システム100は、後述するステップS202へ移行する。これに対して、第2の制御部410によって内視鏡2の操作部22から内視鏡2の観察モードを、被検体の形状を計測する計測モードに指示する指示信号が入力されていないと判定された場合(ステップS201:No)、内視鏡システム100は、後述するステップS204へ移行する。
【0108】
ステップS202において、内視鏡システム100は、被検体内における所定の被写体の形状を計測する計測モード処理を実行する。なお、計測モード処理の詳細は、後述する。
【0109】
続いて、第2の制御部410は、内視鏡2の操作部22から内視鏡2による観察を終了する指示信号が入力されたか否かを判定する(ステップS203)。第2の制御部410によって内視鏡2の操作部22から内視鏡2による観察を終了する指示信号が入力されたと判定された場合(ステップS203:Yes)、内視鏡システム100は、本処理を終了する。これに対して、第2の制御部410によって内視鏡2の操作部22から内視鏡2による観察を終了する指示信号が入力されていないと判定された場合(ステップS203:No)、内視鏡システム100は、上述したステップS201へ戻る。
【0110】
ステップS204において、内視鏡システム100は、被検体に対する通常観察を行う。具体的には、第2の制御部410は、光源制御部404を制御し、第1の光源部402または第2の光源部403を発光させ、被写体からの反射光を撮像素子203に撮像させて画像データを生成させる。そして、第2の制御部410は、撮像素子203が生成した画像データを画像処理部406に画像処理を施させて表示装置3に表示させることによって、被検体に対する通常観察を行う。ステップS204の後、内視鏡システム100は、ステップS203へ移行する。
【0111】
〔計測モード処理の概要〕
次に、
図8のステップS202において説明した計測モード処理の詳細について説明する。
図9は、計測モード処理の概要を示すフローチャートである。
図10は、計測モード処理時における内視鏡2が備えるフォーカスレンズL5の光軸O1上における位置および撮像素子203の露光タイミングを示すタイミングチャートである。なお、
図10において、
図10の(a)がフォーカスレンズL5の位置を示し、
図10の(b)が撮像素子203の露光タイミングを示す。
【0112】
図10に示すように、まず、駆動制御部410aは、焦点調整機構206を制御し、焦点調整機構206によるAF駆動を停止する(ステップS301)。
【0113】
続いて、駆動制御部410aは、焦点調整機構206を駆動してフォーカスレンズL5を近点側へ移動させ(ステップS302)、フォーカスレンズL5を近点端で停止させる(ステップS303)。具体的には、
図10の(a)に示すように、駆動制御部410aは、焦点調整機構206を駆動してフォーカスレンズL5を近点側へ移動させ、フォーカスレンズL5を近点端で停止させる。
【0114】
その後、撮像制御部410bは、撮像素子203にフォーカスレンズL5が近点端で集光した被写体像を露光させて撮像させる(ステップS304)。具体的には、
図10および
図11に示すように、撮像制御部410bは、撮像素子203にフォーカスレンズL5が近点端で集光した被写体K1の被写体像を露光させて撮像させる。この場合、
図12に示すように、取得部410cは、撮像素子203が生成した画像データを第1の画像P200として取得する。
【0115】
続いて、駆動制御部410aは、焦点調整機構206を駆動してフォーカスレンズL5を遠点側へ移動させる(ステップS302)。
【0116】
その後、撮像制御部410bは、フォーカスレンズL5が近点端から遠点端へ移動している移動期間中に、撮像素子203に所定のフレームレートに従って被写体像を露光させて撮像させる(ステップS306)。具体的には、
図10の(b)に示すように、撮像制御部410bは、フォーカスレンズL5が近点端から遠点端へ移動している移動期間中に、撮像素子203に所定のフレームレート、例えば60FPSに従って被写体像を露光させて撮像させることによって複数の画像データを生成させる。この場合、
図13に示すように、取得部410cは、撮像素子203が生成した複数の画像データのいずれか1つ以上を第2の画像P201として取得する。
【0117】
続いて、駆動制御部410aは、焦点調整機構206を駆動してフォーカスレンズL5を遠点端で停止させる(ステップS307)。具体的には、
図10の(a)に示すように、駆動制御部410aは、焦点調整機構206を駆動してフォーカスレンズL5を遠点端で停止させる。
【0118】
その後、撮像制御部410bは、撮像素子203にフォーカスレンズL5が遠点端で集光した被写体像を露光させて撮像させる(ステップS308)。具体的には、
図10(b)に示すように、撮像制御部410bは、撮像素子203にフォーカスレンズL5が遠点端で集光した被写体像を露光させて撮像させる。この場合、
図14に示すように、取得部410cは、撮像素子203が生成した画像データを第3の画像P202として取得する。
【0119】
続いて、駆動制御部410aは、焦点調整機構206を制御し、フォーカスレンズL5をAF駆動の停止位置した位置へ移動させ(ステップS309)、焦点調整機構206によるAF駆動を開始する(ステップS310)。
【0120】
その後、推論部410dは、取得部410cが取得した第1の画像、第2の画像および第3の画像と、学習済みモデル記録部408cが記録する学習済みモデルと、を用いて、被写体のデプスマップを推定する(ステップS311)。具体的には、推論部410dは、取得部410cが取得した第1の画像、第2の画像および第3の画像を入力パラメータとして学習済みモデルに入力し、学習済みモデルが出力パラメータとして出力する被写体のデプスマップを推定する。
【0121】
続いて、算出部410eは、推論部410dが推定した被写体のデプブマップと、カメラパラメータ記録部408dが記録する光学系202のカメラパラメータと、に基づいて、被写体の形状を推定する(ステップS312)。
【0122】
図15は、算出部410eが被写体の形状を推定する推定方法を模式的に説明する図である。
図15に示すように、算出部410eは、撮像素子203における所定の画素の位置をx_imager、光学系202の光軸O1と所定の被写体の位置Q1および撮像素子203の位置xを結ぶ直線とが交差する角度をθ、光学系202から所定の被写体の位置Q1までのデプスマップに基づく距離をzとした場合、以下の式(1)が成り立つ。
x=z×tanθ ・・・(1)
算出部410eは、撮像素子203の画素毎に上記の式(1)を用いて、被写体の形状を推定する。
【0123】
その後、出力制御部410fは、算出部410eが推定した被写体の形状を表示装置3に出力する(ステップS313)。具体的には、
図16に示すように、出力制御部410fは、算出部410eが推定した被写体の形状に対応する画像P203を出力する。ステップS313の後、内視鏡システム100は、
図8のメインルーチンへ戻る。
【0124】
以上説明した一実施の形態によれば、推論部410dが取得部410cによって取得された第1の画像、第2の画像および第3の画像と、学習済みモデル記録部408cが記録する学習済みモデルと、を用いて、被写体のデプスマップを推定するため、光学系から測定対象物である被写体までの距離の検出精度を向上させることができる。
【0125】
また、一実施の形態によれば、算出部410eが推論部410dによって推定された被写体のデプブマップと、カメラパラメータ記録部408dが記録する光学系202のカメラパラメータと、に基づいて、被写体の形状を推定するため、測定対象物である被写体の3次元形状の推定精度をさらに向上することができる。
【0126】
なお、一実施の形態では、フォーカスレンズL5が近点端から遠点端へ移動する移動期間中に、取得部163が撮像素子102によって生成された動画を構成する複数の第2の画像を取得していたが、これに限定されることなく、例えば動画を構成するフレームに代えて、フォーカルスイーブ画像であってもよい。
【0127】
また、一実施の形態では、制御装置4に取得部410c、推論部410d、算出部410eおよび出力制御部410fを設けていたが、これに限定されることなく、画像診断装置5に推論部410d、算出部410eおよび出力制御部410fの機能を設けてもよい。また、一実施の形態では、画像診断装置5以外に、推論部410d、算出部410eおよび出力制御部410fの機能を外部サーバ等に設けてもよい。
【0128】
(変形例1)
次に、一実施の形態の変形例1について説明する。変形例1では、上述した一実施の形態に係る内視鏡システム100と同一の構成を有し、実行する処理が異なる。具体的には、上述した一実施の形態では、フォーカスレンズL5を近点端および遠点端で停止した状態で撮像素子203に露光させて第1の画像および第3の画像を生成させていたが、変形例1では、フォーカスレンズL5が近点端および遠点端に到達したタイミングで撮像素子203に露光させて第1の画像および第3の画像を生成させる。このため、以下においては、一実施の形態の変形例1に係る内視鏡システム100が実行する処理について説明する。
【0129】
図17は、計測モード処理時における内視鏡2が備えるフォーカスレンズL5の光軸O1上における位置および撮像素子203の露光タイミングを示すタイミングチャートである。なお、
図17において、
図17の(a)がフォーカスレンズL5の位置を示し、
図17の(b)が撮像素子203の露光タイミングを示す。
【0130】
図17に示すように、駆動制御部410aは、焦点調整機構206を駆動してフォーカスレンズL5を現在位置から近点側へ移動させ近点端に到達後、遠点側へフォーカスレンズL5を直線的に移動させる。この場合において、撮像制御部410bは、撮像素子203にフォーカスレンズL5が近点端で集光した被写体像を露光させて撮像させる。このとき、取得部410cは、撮像素子203が生成した画像データを第1の画像として取得する。
【0131】
続いて、駆動制御部410aは、フォーカスレンズL5を遠点端に到着後、AF停止位置までフォーカスレンズL5を移動させる。この場合において、撮像制御部410bは、撮像素子203にフォーカスレンズL5が近点端から遠点端の移動中に集光した被写体像を露光させて撮像させる。このとき、取得部410cは、撮像素子203が生成した画像データを第2の画像として取得する。さらに、撮像制御部410bは、撮像素子203にフォーカスレンズL5が遠点端で集光した被写体像を露光させて撮像させる。このとき、取得部410cは、撮像素子203が生成した画像データを第3の画像として取得する。
【0132】
このように駆動制御部410aは、フォーカスレンズL5を近点端から遠点端に向けてリニアに移動させる。これにより、計測モードから通常モードに復帰する際の時間を短縮することができる。
【0133】
以上説明した変形例1によれば、被写体のデプスマップを推定するため、光学系から測定対象物である被写体までの距離の検出精度を向上させることができる。
【0134】
(変形例2)
次に、一実施の形態の変形例2について説明する。変形例2では、上述した一実施の形態に係る内視鏡システム100と同一の構成を有し、実行する処理が異なる。このため、以下においては、一実施の形態の変形例1に係る内視鏡システム100が実行する処理について説明する。
【0135】
図18は、計測モード処理時における内視鏡2が備えるフォーカスレンズL5の光軸O1上における位置および撮像素子203の露光タイミングを示すタイミングチャートである。なお、
図18において、
図18の(a)がフォーカスレンズL5の位置を示し、
図18の(b)が撮像素子203の露光タイミングを示す。
【0136】
図22に示すように、駆動制御部410aは、焦点調整機構206を駆動してフォーカスレンズL5を現在位置から近点側へ移動させ近点端に一定時間内で停止するように移動させて近点端に到達後、遠点側へフォーカスレンズL5を移動させる。この場合において、撮像制御部410bは、撮像素子203にフォーカスレンズL5が近点端で集光した被写体像を露光させて撮像させる。このとき、取得部410cは、撮像素子203が生成した画像データを第1の画像として取得する。
【0137】
続いて、駆動制御部410aは、フォーカスレンズL5を遠点端に一定時間内で停止するように移動させて遠点端に到着後、AF停止位置までフォーカスレンズL5を移動させる。この場合において、撮像制御部410bは、撮像素子203にフォーカスレンズL5が近点端から遠点端の移動中に集光した被写体像を露光させて撮像させる。このとき、取得部410cは、撮像素子203が生成した画像データを第2の画像として取得する。さらに、撮像制御部410bは、撮像素子203にフォーカスレンズL5が遠点端で集光した被写体像を露光させて撮像させる。このとき、取得部410cは、撮像素子203が生成した画像データを第3の画像として取得する。
【0138】
このように駆動制御部410aは、フォーカスレンズL5を近点端から遠点端に向けて正弦波に滑らかに移動させる。これにより、フォーカスレンズL5の微動によるボケを抑制した第1の画像および第3の画像を得ることができる。
【0139】
以上説明した変形例2によれば、被写体のデプスマップを推定するため、光学系から測定対象物である被写体までの距離の検出精度を向上させることができる。
【0140】
(その他の実施の形態)
上述した本開示の一実施の形態に係る内視鏡システムに開示されている複数の構成要素を適宜組み合わせることによって、種々の発明を形成することができる。例えば、上述した本開示の実施の形態に係る内視鏡システムに記載した全構成要素からいくつかの構成要素を削除してもよい。さらに、上述した本開示の実施の形態に係る内視鏡システムで説明した構成要素を適宜組み合わせてもよい。
【0141】
また、本開示の一実施の形態に係る内視鏡システムでは、上述してきた「部」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。
【0142】
また、本開示の一実施の形態に係る内視鏡システムに実行させるプログラムは、インストール可能な形式または実行可能な形式のファイルデータでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)、USB媒体、フラッシュメモリ等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
【0143】
また、本開示の一実施の形態に係る内視鏡システムに実行させるプログラムは、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。
【0144】
なお、本明細書におけるフローチャートの説明では、「まず」、「その後」、「続いて」等の表現を用いてステップ間の処理の前後関係を明示していたが、本発明を実施するために必要な処理の順序は、それらの表現によって一意的に定められるわけではない。即ち、本明細書で記載したフローチャートにおける処理の順序は、矛盾のない範囲で変更することができる。
【0145】
以上、本願の実施の形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、本発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【符号の説明】
【0146】
1 学習済みモデル生成装置
2 内視鏡
3 表示装置
4 制御装置
5 画像診断装置
11 撮像装置
12 表示部
13,407 入力部
14,409 通信部
15,408 記録部
16 第1の制御部
100 内視鏡システム
101,202 光学系
102,203 撮像素子
103,206 焦点調整機構
103a,206a 焦点駆動部
103b,206b 検出部
151,408a プログラム記録部
152 学習モデル記録部
153,408b 学習済みモデル記録部
161,410a 駆動制御部
162,207,410b 撮像制御部
163,410c 取得部
164 判定部
165 学習部
166,410f 出力制御部
201 照明光学系
408b 画像データ記録部
408d カメラパラメータ記録部
410 第2の制御部
410d 推論部
410e 算出部
410f 出力制御部
L1~L4,L6~L10 レンズ
L5 フォーカスレンズ