(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024150410
(43)【公開日】2024-10-23
(54)【発明の名称】動画処理の方法、装置、電子デバイス及び媒体
(51)【国際特許分類】
A61B 1/045 20060101AFI20241016BHJP
【FI】
A61B1/045 610
【審査請求】未請求
【請求項の数】19
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024048885
(22)【出願日】2024-03-26
(31)【優先権主張番号】202310318499.X
(32)【優先日】2023-03-28
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】リー ヤンリー
(72)【発明者】
【氏名】ジャン ニー
(57)【要約】 (修正有)
【課題】内視鏡動画における血管または病変部位に対して検出および強調し、病巣に対して局所ヒントを出して、医師の検査を支援する方法を提供する。
【解決手段】動画の第1のフレームの第1のエッジと、第1のフレームの少なくとも1つの隣接領域フレームの第2のエッジとを取得することを含む。方法は、第1のフレームと少なくとも1つの隣接領域フレームとの間のレジストレーションに基づいて、第1のエッジの画素から第2のエッジの対応する画素への空間オフセットを決定することをさらに含む。方法は、少なくとも第2のエッジの対応する画素の第2のエッジ属性と空間オフセットとに基づいて、第1のエッジの前記画素の第1のエッジ属性を更新することをさらに含む。動画の時空間手がかりを利用してエッジ検出および強調の正確性および信頼性を向上させ、動画における低品質画像による悪影響を低減して、動画処理のロバスト性を向上させる。
【選択図】
図2
【特許請求の範囲】
【請求項1】
動画処理の方法であって、
前記動画の第1のフレームの第1のエッジと、前記第1のフレームの少なくとも1つの隣接領域フレームの第2のエッジとを取得することと、
前記第1のフレームと前記少なくとも1つの隣接領域フレームとの間のレジストレーションに基づいて、前記第1のエッジの画素から前記第2のエッジの対応する画素への空間オフセットを決定することと、
少なくとも前記第2のエッジの前記対応する画素の第2のエッジ属性と前記空間オフセットとに基づいて、前記第1のエッジの前記画素の第1のエッジ属性を更新することと、を含む、
方法。
【請求項2】
前記動画の前記第1のフレームの第1のエッジと、前記少なくとも1つの隣接領域フレームの第2のエッジとを取得することは、
前記第1のフレームと前記少なくとも1つの隣接領域フレームとの各画素のエッジ属性を決定することであって、前記エッジ属性は、画素がエッジに属する確率を示すことと、
前記第1のフレームと前記少なくとも1つの隣接領域フレームにおいて、エッジ属性が閾値より大きい画素を決定することによって、前記第1のエッジと前記第2のエッジを決定することと、を含む、
請求項1に記載の方法。
【請求項3】
前記第1のエッジの前記画素の前記第1のエッジ属性を更新することは、
前記少なくとも1つの隣接領域フレームが予め設定された条件を満たしているか否かを決定することと、
前記少なくとも1つの隣接領域フレームが予め設定された条件を満たしていると決定したことに応答して、前記第2のエッジの前記対応する画素の前記第2のエッジ属性と前記空間オフセットとに基づいて、前記第1のエッジの前記画素の前記第1のエッジ属性を更新することと、を含む、
請求項1に記載の方法。
【請求項4】
前記少なくとも1つの隣接領域フレームが予め設定された条件を満たしているか否かを決定することは、
前記少なくとも1つの隣接領域フレームの画像品質レベルが品質閾値を超えているか否かを決定することと、
前記第1のエッジの画素から前記第2のエッジの対応する画素への前記空間オフセットの平均値が予め設定された範囲内にあるか否かを決定することと、のうちの少なくとも一項を含む、
請求項3に記載の方法。
【請求項5】
前記第1のエッジの前記画素の更新後の第1のエッジ属性に基づいて、前記第1のフレームにおける関心がある対象の輪郭セグメントを決定することと、
前記第1のフレームと前記第1のフレームの後続フレームとの間のレジストレーションに基づいて、前記輪郭セグメントから前記後続フレームへの全体的な空間オフセットを決定することと、
前記全体的な空間オフセットに基づいて、前記後続フレームにおいて前記輪郭セグメントとマッチングする別の輪郭セグメントを検索することと、をさらに含む、
請求項1に記載の方法。
【請求項6】
前記第1のフレームにおける関心がある対象の輪郭セグメントを決定することは、
前記更新後の第1のエッジ属性に基づいて、前記第1のフレームのスーパー画素輪郭を生成することと、
前記スーパー画素輪郭に基づいて、前記関心がある対象の前記輪郭セグメントを生成することと、を含む、
請求項5に記載の方法。
【請求項7】
前記関心がある対象の前記輪郭セグメントを生成することは、
前記スーパー画素輪郭における交差点に基づいて、前記スーパー画素輪郭を1セットのセグメントに分割することと、
前記1セットのセグメントをマージすることによって、前記輪郭セグメントを生成することと、を含む、
請求項6に記載の方法。
【請求項8】
前記1セットのセグメントをマージすることによって前記輪郭セグメントを生成することは、
前記1セットのセグメントのうちの2つの隣接するセグメント間の類似度を決定することと、
前記類似度が閾値を超えていることに応答して、前記2つの隣接するセグメントをマージして前記輪郭セグメントを生成することと、を含む、
請求項7に記載の方法。
【請求項9】
前記1セットのセグメントのうちの2つの隣接するセグメント間の類似度を決定することは、
前記2つの隣接するセグメントの画素の平均勾配の間の差と、
前記2つの隣接するセグメントの画素の平均エッジ確率の間の差と、
前記2つの隣接するセグメントの画素から隣接領域フレームへの平均空間オフセットの間の差と、のうちのいずれか一項を決定することを含む、
請求項8に記載の方法。
【請求項10】
前記全体的な空間オフセットに基づいて、前記後続フレームにおいて前記輪郭セグメントとマッチングする別の輪郭セグメントを検索することは、
前記全体的な空間オフセットに基づいて、前記後続フレームへの前記輪郭セグメントの投影を取得することと、
前記後続フレームにおける複数の候補輪郭セグメントを決定することと、
前記複数の候補輪郭セグメントにおいて前記投影に距離が最も近い前記別の輪郭セグメントを検索することと、を含む、
請求項7に記載の方法。
【請求項11】
前記後続フレームにおける複数の候補輪郭セグメントを決定することは、
前記後続フレームにおける前記投影の位置に基づいて、前記後続フレームの領域を決定することと、
前記後続フレームの、少なくとも部分的に前記領域内にある前記複数の候補輪郭セグメントを決定することと、を含む、
請求項10に記載の方法。
【請求項12】
前記投影に距離が最も近い前記別の輪郭セグメントを検索することは、
前記複数の候補輪郭セグメントのそれぞれについて、前記投影の各画素と前記候補輪郭セグメントの画素との最小距離を決定することによって、前記投影と前記候補輪郭セグメントとの距離を決定することと、
決定された距離が最も小さい候補輪郭セグメントを、前記別の輪郭セグメントとして決定することと、を含む、
請求項10に記載の方法。
【請求項13】
追跡のために、前記動画の再生中に、前記輪郭セグメントと前記別の輪郭セグメントをハイライト表示することをさらに含む、
請求項5に記載の方法。
【請求項14】
前記第1のエッジと前記第2のエッジはそれぞれ、
微小構造のエッジと、
病巣のエッジと、のうちの少なくとも一項を含む、
請求項1に記載の方法。
【請求項15】
前記動画は狭帯域結像(NBI)と拡大内視鏡(ME)動画とを含む、
請求項1に記載の方法。
【請求項16】
動画処理装置であって、
前記動画の第1のフレームの第1のエッジと、前記第1のフレームの少なくとも1つの隣接領域フレームの第2のエッジとを取得するように構成されるエッジ取得ユニットと、
前記第1のフレームと前記少なくとも1つの隣接領域フレームとの間のレジストレーションに基づいて、前記第1のエッジの画素から前記第2のエッジの対応する画素への空間オフセットを決定するように構成される空間オフセット決定ユニットと、
少なくとも前記対応する画素の第2のエッジ属性と前記空間オフセットとに基づいて、前記第1のエッジの前記画素の第1のエッジ属性を更新するように構成される更新ユニットと、を備える、
動画処理装置。
【請求項17】
少なくとも1つの処理ユニットと、
前記少なくとも1つの処理ユニットに結合され、前記少なくとも1つの処理ユニットによって実行される命令が格納されたメモリと、を備え、前記命令が前記少なくとも1つの処理ユニットによって実行されると、請求項1から15のいずれか一項に記載の方法を実行する、
電子デバイス。
【請求項18】
デバイスによって実行されるときに、請求項1から15のいずれか一項に記載の方法を前記デバイスに実行させる機械実行可能命令を含む、
コンピュータ読み取り可能な記憶媒体。
【請求項19】
デバイスによって実行されるときに、請求項1から15のいずれか一項に記載の方法を前記デバイスに実行させる機械実行可能命令を含む、
コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施例は、画像処理技術の分野に関するものであり、より具体的には、動画処理の方法、装置、電子デバイス、コンピュータ読み取り可能な記憶媒体、およびコンピュータプログラム製品に関するものである。
【背景技術】
【0002】
内視鏡検査は、体外から人体の自然管腔を経て体内に送り込まれ、体内の疾患を検査する光学設備検査の1種である。医師は、使用時に内視鏡を検査対象臓器に導入し、内視鏡を操作して動かし、関わる部位を直接に覗き、画像や動画を記録することができる。
【0003】
一部の内視鏡システムは血管と周囲とのコントラストを高めることができるとともに、数十倍から百倍に拡大して、医師が血管構造や病変をよりはっきり観察できるように支援することもできる。しかしながら、血管構造や病変を内視鏡システムで直接観察するには、医師の強大で豊富な経験が必要となる。したがって、内視鏡動画における血管または病変部位に対して検出および強調し、病巣に対して局所ヒントを出して、医師が検査を完了するのを支援する改善案を提供することが必要である。
【発明の概要】
【発明が解決しようとする課題】
【0004】
このようなことに鑑みて、本開示の実施例は、動画処理の技術案を提出する。
【課題を解決するための手段】
【0005】
本開示の第1の形態によれば、動画処理方法を提供する。方法は、動画の第1のフレームの第1のエッジと、第1のフレームの少なくとも1つの隣接領域フレームの第2のエッジとを取得することを含む。方法は、第1のフレームと少なくとも1つの隣接領域フレームとの間のレジストレーションに基づいて、第1のエッジの画素から第2のエッジの対応する画素への空間オフセットを決定することをさらに含む。方法は、少なくとも第2のエッジの対応する画素の第2のエッジ属性と空間オフセットとに基づいて、第1のエッジの画素の第1のエッジ属性を更新することをさらに含む。
【0006】
本開示の第2の形態によれば、動画処理装置を提供する。装置は、エッジ取得ユニットと、空間オフセット決定ユニットと、更新ユニットとを備える。エッジ取得ユニットは、動画の第1のフレームの第1のエッジと、第1のフレームの少なくとも1つの隣接領域フレームの第2のエッジとを取得するように構成される。空間オフセット決定ユニットは、第1のフレームと少なくとも1つの隣接領域フレームとの間のレジストレーションに基づいて、第1のエッジの画素から第2のエッジの対応する画素への空間オフセットを決定するように構成される。更新ユニットは、少なくとも対応する画素の第2のエッジ属性と空間オフセットとに基づいて、第1のエッジの画素の第1のエッジ属性を更新するように構成される。
【0007】
本開示の第3の形態によれば、電子デバイスを提供する。電子デバイスは、少なくとも1つの処理ユニットと、前記少なくとも1つの処理ユニットに結合され、前記少なくとも1つの処理ユニットによって実行される命令が格納されたメモリとを備え、前記命令が前記少なくとも1つの処理ユニットによって実行されると、本開示の第1の形態を実行する。
【0008】
本開示の第4の形態によれば、デバイスによって実行されると、本開示の第1の形態に記載の方法を前記デバイスに実行させる機械実行可能命令を含む、コンピュータ読み取り可能な記憶媒体を提供する。
【0009】
本開示の第5の形態によれば、デバイスによって実行されると、本開示の第1の形態に記載の方法を前記デバイスに実行させる機械実行可能命令を含む、コンピュータプログラム製品を提供する。
【0010】
発明内容の部分は、以下の具体的な実施形態でさらに説明される概念に対する選択を簡略化した形で紹介するために提供される。発明内容の部分は、本開示のクリティカルな特徴又は必要な特徴を指示することを意図せず、また、本開示の範囲を限定することも意図しない。
【図面の簡単な説明】
【0011】
添付の図面を参照して、本開示の例示的な実施例をより詳細に説明することによって、本開示の上述および他の目的、特徴、および利点がより明らかになり、このうち、本開示の例示的な実施例においては、通常、同じ参照符号が同じ部品を表す。
【
図1A】本開示の複数の実施例が実装され得る例示的な環境の模式図を示している。
【
図1B】本開示の実施例が適用され得る例示的な動画のスクリーンショットを示している。
【
図2】本開示の実施例に係る動画処理方法の模式的なフローチャートを示している。
【
図3】本開示の実施例に係る動画処理システムの模式図を示している。
【
図4A】本開示の実施例に係る動画に対してエッジ検出を適用する模式図を示している。
【
図4B】本開示の実施例に係る動画に対して画像レジストレーションを適用する模式図を示している。
【
図5】本開示の実施例に係るエッジ強調のためのプロセスの模式的なフローチャートを示している。
【
図6】本開示の実施例に係る輪郭追跡のためのプロセスの模式的なフローチャートを示している。
【
図7】本開示の実施例に係る輪郭セグメントを生成するためのプロセスの模式的なフローチャートを示している。
【
図8】本開示の実施例に係る輪郭マッチングのためのプロセスの模式的なフローチャートを示している。
【
図9】本開示の実施例に係る動画処理装置の模式的なブロック図を示している。
【
図10】本開示の内容の実施例を実施するために使用され得る例示的なデバイスの模式的なブロック図を示している。
【発明を実施するための形態】
【0012】
以下、添付の図面を参照して、本開示の好ましい実施例についてより詳細に説明する。添付の図面に本開示の好ましい実施例が示されているが、本開示は、ここに記述された実施例によって限定されるべきではなく、様々な形で実装され得ることが理解されるべきである。むしろ、これらの実施例は、本開示をより明瞭かつ完全なものとし、本開示の範囲を当業者に完全に伝えることを可能にするために提供される。
【0013】
本文で使用される「含む」という用語およびその変形は、開放的な包含、すなわち「包含するが、これに限定されるものではない」を表す。特に明記されない限り、「または」という用語は、「および/または」を表す。「に基づく」という用語は、「少なくとも部分的に基づく」を表す。「1つの例示的な実施例」および「1つの実施例」という用語は、「少なくとも1つの例示的な実施例」を表す。「別の実施例」という用語は、「少なくとも1つの別の実施例」を表す。「第1」、「第2」などの用語は、異なるオブジェクトまたは同じオブジェクトを指すことができる。以下に、他の明示的な定義と暗黙的な定義を含めることもある。
【0014】
上記に言及したように、一部の内視鏡システムは血管と周囲とのコントラストを高めることができ、血管の観察に役立つとともに、数十倍から百倍に拡大して、血管構造や病変をよりはっきり観察できるようにすることもできる。例えば、狭帯域撮像(NBI:narrow band imaging)+拡大内視鏡(ME:magnifying endoscopy)の胃内視鏡或いは腸内視鏡があり、そのうち、NBIは毛細血管を強調表示することができ、MEは毛細血管を拡大することができる。普通の白色光内視鏡に比べ、NBI+MEは近年続々と使用されてきている病変検査手段であり、微小構造から粘膜表層の病変情況を観察することができる。しかしながら、NBI+MEで毛細血管のエッジの病変を直接観察するには、医師の強大で豊富な経験が必要となり、毛細血管に対してエッジ強調を行い、病巣に対して局所ヒントを出せば、有益なことである。
【0015】
いくつかの方法において、ディープラーニング技術を用いて、NBI+ME画像から微小血管や微小構造の特徴を抽出し、特徴化された画像を内視鏡医に提示する。しかしながら、これらの方法は単一フレーム画像に焦点を合わせて血管の特徴を抽出するものであり、内視鏡検査で得られる動画形式の画像データには適さない。例えば、ぼけやライティングなどの画像品質の影響により、単一フレーム画像のエッジ強調は実際のシーンと一致しなくなる。そして、これらの方法はフレームごとに画像強調を行うだけであり、時空間手がかりに乏しく、同一のエッジが動画フレーム間で保持されておらず、時空間整合性分析を順に行うことが困難である。
【0016】
このことに鑑み、動画のエッジの特徴を効果的に強調して医師が検査によって得た動画データを閲覧するのを支援するために、内視鏡検査の実際のシーンにより良くマッチングした画像強調方法が必要とされている。本開示の実施例によれば、動画処理方法を提供する。この方法は、エッジ検出によって、動画の所与のフレームのエッジと、当該所与のフレームの隣接領域フレームのエッジとを取得する。エッジ検出によって、エッジにおける各画素はいずれも、それぞれのエッジ属性を有する。いくつかの実施例において、エッジ属性は、例えば、確率の形式で示された画像の色の変化の幅であってもよく、あるいは、概念の形式で示された病巣の変化度であってもよい。その後、所与のフレームと隣接領域フレームとの間のレジストレーションを行い、所与のフレームのエッジにおける各画素の、隣接領域フレームのエッジにおける対応する画素を決定し、すなわち、2つのフレーム間の画素間のマッピングを確立し、よって、所与のフレームの画素からその隣接領域フレームの対応する画素への空間オフセットが得られる。空間オフセットは、例えば、画素の座標の間の差によって示されてもよい。次に、隣接領域フレームのエッジ属性と決定された空間オフセットとに応じて、所与のフレームのエッジにおける画素のエッジ属性を調整する。このような方式によって、動画の時空間手がかりを利用してエッジ検出および強調の正確性および信頼性を向上させ、動画における低品質画像による悪影響を低減して、動画処理のロバスト性を向上させることができる。以下、
図1~
図8を参照して、本開示の実施例の実装の詳細について詳細に説明する。
【0017】
図1Aは本開示の複数の実施例が実装され得る例示的な環境100の模式図を示している。図示のように、環境100は、操作者が操作可能なオプションの制御デバイス101を含む内視鏡システムに関するものであり、操作者は、制御デバイス101を操作して、内視鏡のレンズ102の人体内の移動を制御し、画像及び動画を採集することができる。採集された画像および動画は、送信されてコンピューティングデバイス105において記憶されることができる。ディスプレイ103は、コンピューティングデバイス105に結合され、レンズ102を介して採集された画像および動画をリアルタイムで表示することができる。いくつかの実施例において、内視鏡システムは狭帯域撮像および拡大内視鏡(NBI+ME)であってもよく、得られる動画はNBI+ME動画であってもよい。
図1は胃内視鏡システムを例示的に示しているが、本開示の実施例は、耳鼻咽喉科内視鏡、口腔内視鏡、歯科内視鏡、神経鏡、尿道膀胱鏡、電気切開鏡、腹腔鏡、関節鏡、副鼻腔鏡、喉頭鏡、腸鏡などを含むがこれらに限定されない他の内視鏡システムにも適用可能であることが理解されるべきである。
【0018】
コンピューティングデバイス105は、汎用的なコンピューティングデバイスであってもよく、内視鏡検査専用のデバイスであってもよく、画像処理及び動画処理、特に医用画像処理に適するように構成される。コンピューティングデバイス105は、端末またはサーバデバイスであってもよい。コンピューティングデバイス105がサーバである場合には、独立したサーバであってもよく、コンピュータ、ネットワークホスト、単一のネットワークサーバ、複数のネットワークサーバセット、または複数のサーバで構築されるクラウドサーバを含むがこれらに限定されない、サーバからなるサーバネットワークまたはサーバクラスタであってもよい。コンピューティングデバイス105は、デスクトップ端末またはモバイル端末、例えば、デスクトップ、携帯電話、タブレット、ノートパソコン、医療支援計器などを備えてもよいが、これらに限定されない。
【0019】
上記に言及したように、従来の案では、動画における微小構造のエッジ(例えば毛細血管や病巣のエッジ)に対して安定的かつ正確な検査および提示を行うことができず、医師の専門的な技術的知識と経験が高く要求される。本開示の実施例によれば、コンピューティングデバイス105は、内視鏡動画に対してエッジ強調し、病巣に対して局所ヒントを出し、医師がより効果的な医療検査を行うのを支援することができる。
【0020】
以上、
図1Aを参照して、本開示の実施例を実施することができる例示的な環境について説明した。
図1Aは模式的なものにすぎず、環境はさらに多くのモジュールまたはシステムを備えてもよく、または一部のモジュールまたはシステムを省略してもよく、または示されたモジュールまたはシステムを改めて組み合わせてもよいことが理解されるべきである。本開示の実施例は、
図1Aに示されている環境とは異なる環境で実施してもよく、本開示はこれに限定しない。
【0021】
図1Bは本開示の実施例が適用され得る例示的な動画のスクリーンショットを示している。
図1Bのスクリーンショットは、NBI+MEシステムによって取得した胃腸内視鏡画像である。図示のように、画像には豊富な毛細血管構造と、病巣の可能性のある領域とが含まれており、そして、低品質の動画フレームが存在する可能性があり、医師が関心のある領域をそこから正確かつ迅速に位置付けることが困難になる。本開示の実施例は、そのような動画に対するエッジ検出および強調に適しており、対応する局所ヒント(例えば、関心のあるエッジを追跡する)を出して、動画を閲覧することの難しさを低減する。
【0022】
なお、NBI+ME動画を参照して本開示の実施例に係る動画処理方法およびシステムを説明しているが、本開示の実施例は、他の任意のタイプの動画または画像に対して同様の処理を行う場合にも同様に適用され、本開示ではこれに限定されるものではない。
【0023】
図2は、本開示の実施例に係る動画処理方法200の模式的なフローチャートを示している。方法200は、例えば、
図1に示されるコンピューティングデバイス105によって実装されてもよい。方法200はまた、図示されていない追加の動作を含んでもよく、および/または図示されている動作を省略してもよく、本開示の範囲はこれについて限定されないことが理解されるべきである。以下、
図1Aを参照して方法200を詳細に説明する。
【0024】
方法200は、コンピューティングデバイス105によって実装される動画処理に関する。動画は、例えば狭帯域撮像(NBI)および拡大内視鏡(ME)動画のような、内視鏡採集操作によって得られた内視鏡動画であり、または他のタイプの動画であってもよい。いくつかの実施例において、コンピューティングデバイス105は、内視鏡検査中にリアルタイムまたはほぼリアルタイムで動画を受信し、動画を処理してもよい。あるいは、コンピューティングデバイス105は、動画を受信して格納し、一時的に処理せずに、完全な動画を受信した後に処理してもよい。
【0025】
ブロック210において、動画の第1のフレームの第1のエッジと、第1のフレームの少なくとも1つの隣接領域フレームの第2のエッジとを取得する。ここで、隣接領域フレームは、第1のフレームの前または後に設置されるいくつかのフレームとして定義されてもよい。例えば、第1のフレーム(すなわち、現在フレーム)の前後の1、2、5、10、20、または任意の他の数のフレームを隣接領域フレームとして定義してもよく、そして、前後のフレームの数は、同一であっても異なっていてもよく、本開示では限定されるものではない。いくつかの実装において、隣接領域フレームは、第1のフレームの前、後、または前後の2つの方向のフレームを含んでもよい。
【0026】
コンピューティングデバイス105は、動画に対してエッジ検出を行い、動画の各フレームのエッジを生成する。エッジ検出は、複数の異なる目的に対してもよく、そして、異なるアルゴリズムを使用してもよい。例えば、エッジ検出アルゴリズムは、微小構造のエッジ(例えば毛細血管)または病巣のエッジに対するアルゴリズムを含んでもよい。したがって、得られた第1のエッジおよび第2のエッジは、微小構造のエッジまたは病巣のエッジであってもよい。いくつかの実装において、エッジ検出は、ディープネットワークの予測に基づいてもよい。例えば、注釈サンプルを収集してディープネットワークを訓練し、その後、訓練されたディープネットワークを使用して各フレームのエッジ属性の予測を生成してもよい。あるいは、特徴抽出分類器(例えば、サポートベクトルマシン)を採用して訓練および予測を行ってもよく、または、画像特徴を抽出し、重み付け方式を採用してカテゴリ確率を取得するとともに、閾値と比較するなどの方式によってもよい。
【0027】
エッジ検出によって、動画の第1のフレームおよび第1のフレームの隣接領域フレームにおける各画素についてエッジ属性を生成することができ、エッジ属性は、対応する画素がエッジに属する確率を示すことができる。例えば、微小構造のエッジ検出について、エッジ属性は0~255の範囲を有してもよく、小さいものから大きいものまでは、弱い微小構造のエッジから強い微小構造のエッジまでを表す。病巣検出について、エッジ属性も同様に0~255の範囲を有してもよい。本開示は、エッジ属性の範囲を限定しない。その後、コンピューティングデバイス105は、第1のフレームおよび隣接領域フレームにおける、エッジ属性が閾値(例えば、0または他の値)よりも大きい画素を、それぞれ第1のエッジおよび第2のエッジにおける画素として決定することで、第1のエッジおよび第2のエッジを決定しても良い。なお、ここで得られるエッジ属性またはエッジ確率は、単一フレームに基づいてコンピューティングデバイス105によって算出されるものであり、動画の時空間情報を利用して調整または最適化してもよい。
【0028】
ブロック220において、第1のフレームと少なくとも1つの隣接領域フレームとのレジストレーションに基づいて、第1のエッジの画素から第2のエッジの対応する画素への空間オフセットを決定する。ここで、コンピューティングデバイス105は、画像レジストレーションを採用してフレーム間のエッジ点のマッピング関係を取得し、エッジ点の空間オフセットを得る。空間オフセットは、各画素が2つのフレーム間の座標の差、例えば2次元ベクトルを表すことができる。
【0029】
いくつかの実施例において、コンピューティングデバイス105は、算出効率を向上させてリアルタイム性を保証するために、隣接するフレーム(例えば、第1のフレームにすぐ隣接する後続フレーム)のみに対してレジストレーションしてもよい。隣接していないフレーム間については、隣接するフレームの空間オフセットを累積してもよい。いくつかの実施例において、算出効率をさらに向上させるために、エッジのみに対してマッチングしてもよい。エッジテクスチャの特徴がはっきりしているため、マッチング度が高い。これにより、第1のエッジにおける各画素を、隣接領域フレームの第2のエッジにおけるある画素にマッピングすることができる。
【0030】
フレーム間レジストレーションに用いられる方法は、例えばKLT法のような、疎なオプティカルフロー場を含んでもよく、エッジ点に焦点を合わせた後、局所的な勾配変化を使用して画素のマッピング点を算出する。あるいは、レジストレーション方法は、例えばFlowNetなどのような、ディープラーニング法を含んでもよく、ディープラーニングネットワークを用いて画素の空間オフセットを自動的に取得する。
【0031】
ブロック230において、少なくとも第2のエッジの対応する画素の第2のエッジ属性と空間オフセットとに基づいて、第1のエッジの画素の第1のエッジ属性を更新する。コンピューティングデバイス105は、単一フレームのエッジ検出が画像品質の影響を受けやすく、露光、弱光、汚れ、ぼやけの場合に取得されるエッジ属性と真の属性とのずれを考慮して、第1フレームの隣接領域フレームを用いて、第1フレームの第1エッジのエッジ属性を強調する。
【0032】
いくつかの実施例において、コンピューティングデバイス105は、第1のフレームの先行および後続の隣接領域フレームから、例えば高品質で、オフセットの程度を満たしているフレームなど、予め設定された条件に適合するいくつかのフレームを検索し、これらのフレームを利用して第1のフレームのエッジを強調しても良い。具体的には、コンピューティングデバイス105は、第1のフレームの第1のエッジにおける第1のエッジ属性を有する所与の画素について、その画素の隣接領域フレームにおける対応する画素の第2のエッジ属性を第1のエッジ属性に累積して、所与の画素のエッジ属性を調整してもよい。例えば、重み付け加算の方式を使用して第1のエッジのエッジ属性を調整してもよい。隣接領域フレームのエッジ属性についての重みは、画素間の空間オフセットに依存してもよい。重みは、隣接領域フレームと所与のフレームとの間の時間にも依存してもよい。
【0033】
このような方式によって、動画のエッジに関する時空間整合性情報が導入され、第1フレームのエッジ画素のエッジ属性にはその隣接領域フレームのエッジ属性が含まれ、隣接領域フレームのエッジ情報は高品質フレームから取得されたので、動画における低品質画像による悪影響を低減し、エッジ検出および強調の正確性及び信頼性を向上させることができる。
【0034】
図3は本開示の実施例に係る動画処理システム300の模式図を示している。動画処理システム300は、ソフトウェアまたはハードウェアの形式でコンピューティングデバイス105に実装されてもよく、
図2を参照して説明した方法200を実装するのに適している。
図3に示された動画処理システム300は例示的なものにすぎず、より多くまたはより少ないモジュールまたはユニットを備えてもよく、そして、
図3に示されたいくつかのモジュールは複数のモジュールに分割されてもよく、そして、2つ以上のモジュールが同一のモジュールに実装されることが理解されるべきである。
【0035】
動画処理システム300は、内視鏡動画フレーム301、302、303等を入力としてリアルタイムに受信することができ、時間の順に従って、フレーム301はフレーム302の前のフレームであり、フレーム302はフレーム303の前のフレームであり、以下同様である。あるいは、動画処理システム300は、コンピューティングデバイス105の記憶デバイスに記憶された動画を読み取ることもできる。
【0036】
動画処理システム300は、エッジ検出モジュール310と、フレーム間レジストレーションモジュール320と、時空間エッジ更新およびベクトル化モジュール330とを備える。エッジ検出モジュール310は、単一フレームにおけるエッジを抽出するために使用される。エッジ検出アルゴリズムを適用することによって、エッジ検出モジュール310は、フレームの各画素について、例えば、その画素がエッジに属する可能性の確率を示すエッジ属性を生成してもよい。このような確率は相対的であって絶対的ではないことが理解されるべきである。動画処理のリアルタイム性能を向上させるために、エッジ検出モジュール310は、より少ない算出リソースを必要とするエッジ検出アルゴリズムを使用してもよい。いくつかの実施例において、エッジ検出モジュール310は、複数のエッジ検出アルゴリズムを適用して、例えば、微小構造のエッジ、病巣のエッジなど、複数のタイプのエッジを生成してもよい。これによって、エッジ検出モジュール310は、フレーム301、フレーム302、フレーム303等についてのエッジ属性を生成する。
【0037】
図4Aは本開示の実施例に係る動画に対してエッジ検出を適用する模式図を示している。エッジ検出モジュール310は、
図4Aの左側に示すような動画の所与のフレームに対してエッジ検出を行い、各画素についてのエッジ属性を得て、その後、エッジ属性に基づいて、
図4Aの右側に示すようなエッジ検出結果を生成する。
【0038】
フレーム間レジストレーションモジュール320は、動画のフレームシーケンスにおいて、画像レジストレーションを用いて、画素に対するフレーム間オフセットを取得するために使用され、フレーム間のエッジ間のマッピング関係を確立する。エッジテクスチャの特徴がはっきりしており、マッチング度が高いことを考慮し、フレームのエッジのみに対してマッチングを行ってもよい。すなわち、所与のフレームのエッジにおける画素は、隣接領域フレームのエッジにおける対応する画素にマッピングされる。いくつかの実施例において、リアルタイム性を保証するために、フレーム間レジストレーションモジュール320は、隣接する2つのフレームのみに対してレジストレーションを行ってもよい。例えば、フレーム間レジストレーションモジュール320は、フレーム301とフレーム302との間のレジストレーションを実行し、フレーム301のエッジの画素をフレーム302のエッジのある画素にマッピングしてもよく、フレーム302とフレーム302との間のレジストレーションを実行し、フレーム302のエッジの画素をフレーム303のエッジのある画素にマッピングしてもよく、以下同様である。
【0039】
フレーム間レジストレーションを用いて、エッジマッピング関係を取得することができる。エッジマッピング関係は、例えば座標の間の差のような、2つの画素間の空間オフセットとして示してもよい。隣接するフレームの画素間の空間オフセットの重畳(例えば、ベクトル加算)に基づいて、任意の隣接領域フレームにおける所与のフレームのエッジの画素の空間オフセットを取得することができる。
【0040】
図4Bは本開示の実施例に係る動画に対して画像レジストレーションを適用するスクリーンショットを示している。フレーム間レジストレーションモジュール320は、
図4Bの左側の一連の隣接するフレームに対して順次にレジストレーションを実行し、次のフレームにおける所与の画素の対応する画素を得て、この2つの画素の空間オフセットを決定する。
図4Bに示すように、所与の画素は、得られた空間オフセットを用いて、フレーム間の動き(矢印で示すように)として提示されてもよい。
【0041】
時空間エッジ更新およびベクトル化モジュール330は、動画の時空間整合性情報に応じて、隣接領域フレームの情報(例えば、画素の時間に伴う空間オフセット、エッジ属性など)を利用し、フレームのエッジ属性を調整して、動画におけるエッジを強調するために使用される。追加的に、時空間エッジ更新およびベクトル化モジュール330は、エッジから関心のあるオブジェクトの輪郭セグメントを確立し、追跡するためにも使用される。
【0042】
図5は本開示の実施例に係るエッジ強調のためのプロセス500の模式的なフローチャートを示している。プロセス500は、
図2に示すブロック230の例示的な実施形態であってもよく、そして、
図3に示す時空間エッジ更新およびベクトル化モジュール330によって実装されてもよい。
【0043】
プロセス500は、隣接領域フレームに基づいて所与のフレーム(すなわち「第1のフレーム」)のエッジを強調するために使用される。隣接領域フレームは、エッジ属性が更新される所与のフレームの近傍の少なくとも1つのフレームであってもよい。隣接領域フレームの範囲は、第1のフレームに先行するいくつかのフレーム、後続するいくつかのフレームで構成または示してもよい。いくつかの実装において、隣接領域フレームは、第1のフレームの前のフレームを含んでもよく、または、第1のフレームの後のフレームを含んでもよく、または、その両方を含んでもよい。本開示は、隣接領域フレームの範囲を限定しない。全体的に、プロセス500は、第1のフレームの近傍範囲から、高品質でオフセット度を有するフレームをマッチングフレームとして検索し、これらのマッチングフレームを利用して第1のフレームのエッジ属性を更新し、エッジ強調を実現する。
【0044】
ブロック501において、第1のフレームの1つの隣接領域フレームを取得する。いくつかの実施例において、ある順序で第1のフレームの隣接領域を検索してもよい。例えば、フレームの時間に応じて、最も早い隣接領域フレームから最も遅い隣接領域フレームまで検索する。あるいは、隣接領域フレームと第1のフレームとの時間的距離に基づいて検索を行い、第1のフレームから最も近い隣接領域フレームから検索し始め、より遠くの隣接領域フレームを逐次に検索し、隣接領域フレームを1つ取得してもよい。
【0045】
ブロック502において、取得された隣接領域フレームの品質が閾値を超えているか否かを判断する。品質はディープラーニングの方式で得てもよく、あるいは特徴抽出分類器の方式で得てもよい。品質が閾値を超えている場合、プロセス500はブロック503に進み、そうでない場合、この隣接領域フレームは低品質フレームであると考えられ、第1のフレームを強調するためにこのフレームを使用することをあきらめ、プロセス500はブロック505に進んでもよい。
【0046】
ブロック503において、隣接領域フレームのエッジと第1のフレームのエッジとの平均空間オフセットが、予め設定された範囲内にあるか否かを判断する。平均空間オフセットは、第1のフレームのエッジにおける画素と、この隣接領域フレームにおける対応する画素との空間オフセットの平均値を指す。例えば、各画素の空間オフセットの大きさを算出し、空間オフセットの大きさの平均値を算出してもよい。予め設定された範囲は、下限閾値および上限閾値を含んでもよく、平均空間オフセットが下限閾値よりも大きく、上限閾値よりも小さい場合、プロセス500はブロック504に進む。そうでない場合、このフレームはエッジ強調のために使用されるのに適していないと考えられてもよく、このフレームを使用することをあきらめ、プロセス500はブロック505に進んでもよい。
【0047】
ブロック504において、隣接領域フレームを選択する。選択された隣接領域フレームは、第1のフレームのエッジ強調に使用される。選択された隣接領域フレームのフレームを記録し、すべての隣接領域フレームが処理済みであることを待ってから、選択されたすべての隣接領域フレームに応じて、第1のフレームのエッジのエッジ属性を更新してもよい。
【0048】
ブロック505において、すべての隣接領域フレームがトラバースされたか否かを判断する。いくつかの実施例において、隣接領域範囲内のフレームの総数に対応する閾値を設定してもよく、処理済みの隣接領域フレームの数がこの閾値に達した場合、第1のフレームの隣接領域範囲内のすべてのフレームが処理済みとみなされる。ブロック505において未処理の隣接領域フレームが存在しないと決定した場合、プロセス500はブロック506に進み、選択されたマッチングフレームを使用して第1のフレームの第1のエッジのエッジ属性を更新する。未処理の隣接領域フレームが存在すると決定した場合、プロセス500はブロック501に戻る。
【0049】
すべての隣接領域フレームが処理され、選択されたすべての隣接領域フレームが決定されたことに応答して、ブロック506において、第1のフレームのエッジ画素のエッジ属性を更新する。第1のフレームの第1のエッジにおける各画素について、その対応する画素および対応する空間オフセットを、選択された隣接領域フレームから決定し、以下の等式に基づいて更新後の画素のエッジ属性を決定する。
そのうち、Edge()’は画素の更新後のエッジ属性、Edge()はエッジ検出によって得られたエッジ属性、Piは第1のフレームのエッジにおける画素、P
jは隣接領域フレームのエッジにおける対応する画素、Djは空間オフセットの距離を表し、δおよびσは経験パラメータである。
【0050】
図6は本開示の実施例に係る輪郭追跡のためのプロセス600の模式的なフローチャートを示している。プロセス600は、
図2に示す方法200の追加動作であってもよく、そして、
図3に示す時空間エッジ更新およびベクトル化モジュール330によって実装されてもよい。
【0051】
エッジのマッチングで取得された画素間のマッピング関係および更新後のエッジ属性は、離散的で不規則な特徴である。しかしながら、通常、医者は病変の輪郭セグメントに関心があり、このような輪郭セグメントは同じ属性の画素点を直列に接続して追跡し、統一的な分析に役立つ。
【0052】
ブロック610において、更新後のエッジ属性に基づいて、第1のフレームにおける関心がある対象の輪郭セグメントを決定する。輪郭セグメントは、例えば、検出されたエッジセグメントの組み合わせであり、臨床的な意義を有する構造または病巣を反映してもよい。その後の追跡を容易にするために、エッジ属性に応じて、エッジの画素点を、輪郭セグメントにベクトル化してもよい。動画におけるすべてのフレームについて、フレーム内の輪郭セグメントを決定し、動画全体にわたって追跡してもよい。あるいは、第1のフレームの隣接領域範囲の一部のフレームに対して、輪郭セグメントを決定し、動画の一部において追跡してもよい。各フレームについて、1つ以上の輪郭セグメントを決定してもよい。いくつかの実装において、単一フレーム内に複数の輪郭セグメントが存在してもよく、そして、ユーザ入力に応じて、追跡対象の輪郭セグメントを選択して追跡する。
【0053】
ブロック620において、第1のフレームと第1のフレームの後続フレームとの間のレジストレーションに基づいて、輪郭セグメントから後続フレームへの全体的な空間オフセットを決定する。実装によって、後続フレームは、第1のフレームにすぐ隣接する隣接領域フレームであってもよい。このような場合、隣接するフレームのレジストレーションをして輪郭セグメントにおける画素から対応する画素への空間オフセットを得て、輪郭セグメントのすべての画素の空間オフセットの平均値を全体的な空間オフセットとして決定してもよい。あるいは、後続フレームは、第1のフレームからある距離だけ離れた後の隣接領域フレームであってもよい。隣接するフレームのレジストレーションにより得られた空間オフセットの累積によって、第1のフレームの輪郭セグメントの画素から後続フレームの対応する画素への空間オフセットを取得し、ひいては全体的な空間オフセットを決定してもよい。
【0054】
ブロック630において、全体的な空間オフセットに基づいて、後続フレームにおいて第1のフレームにおける輪郭セグメントとマッチングする別の輪郭セグメントを検索する。いくつかの実施例において、マッチングされる別の輪郭セグメントは、後続フレームにおいて第1のフレームの輪郭セグメントからの距離が最も小さい輪郭セグメントである。
【0055】
動画におけるフレームについて、時間の順に従ってプロセス600を実行して、関心のある対象を追跡してもよい。いくつかの実施例において、動画の再生中に、第1のフレームの輪郭セグメント、後続フレームにおける別の輪郭セグメントをハイライト表示してもよく、以下同様である。これにより、視覚支援を実現し、医師が動画における関心のある対象を追跡するのを支援する。
【0056】
図7は本開示の実施例に係る輪郭セグメントを生成するためのプロセス700の模式図を示している。プロセス700は、
図6のブロック610で示す動作の例示的な実装であってもよい。
【0057】
ブロック710において、第1のフレームに対してスーパー画素抽出を実行する。第1のフレームにおいて、更新後のエッジ属性をガイドとしてスーパー画素抽出を行い、スーパー画素輪郭を得る。スーパー画素抽出の方式には、単純線形反復クラスタリング(SLIC)などが含まれるが、これらに限定されるものではない。ここで、スーパー画素抽出の元の勾配計算を更新後のエッジ属性に置き換えることにより、スーパー画素の輪郭が高い確率のエッジに近接することを保証する。その後、スーパー画素輪郭に基づいて関心がある対象の輪郭セグメントを生成してもよい。
【0058】
具体的には、ブロック720において、エッジベクトル化によってセグメントを得る。いくつかの実施例において、抽出済みのスーパー画素輪郭における交差点に基づいて、スーパー画素輪郭を1セットのセグメントに分割してもよい。各セグメントは、画素のシーケンスを含んでもよい。
【0059】
ブロック730において、セグメントをマージすることによって、関心がある対象の輪郭セグメントを得る。得られた1セットのセグメントに対して、どの隣接するセグメントが類似しているかを分析し、類似している隣接セグメントを組み合わせ、関心がある対象の輪郭セグメントを形成する。具体的には、2つの隣接するセグメントに対して、この2つのセグメント間の類似度を算出し、類似度が閾値を超えている場合には、マージして輪郭セグメントを生成してもよい。
【0060】
いくつかの実施例において、隣接するセグメントの類似度を決定するための手がかりは、フレーム内手がかりおよびフレーム間手がかりを含んでもよい。フレーム内手がかりは、2つの隣接するセグメントの勾配の間の差の絶対値を含んでもよい。セグメント勾配は、セグメントf内のすべての画素の平均勾配{gx(f),gy(f)}として定義してもよく、そのうち、画素の勾配方向は、この画素の上下隣接領域画素のオフセット量である。いくつかの実施例において、セグメント勾配のユークリッド距離の間の差を、対応するフレーム間手がかりとしてもよく、そのうち、ユークリッド距離は、セグメント勾配{gx(f),gy(f)}のユークリッドノルムである。フレーム間手がかりは、2つの隣接するセグメントのエッジ確率Edge(f)の間の差の絶対値をさらに含んでもよく、そのうち、Edge(f)は、セグメント上のすべての画素のエッジ確率の平均値である。ここで、エッジ確率は、微小構造のエッジのエッジ確率と、病巣のエッジのエッジ確率とを含んでもよい。
【0061】
フレーム間手がかりは、2つの隣接するセグメントの空間オフセット{dx(f),dy(f)}の間の差を含んでもよい。セグメントの空間オフセットは、セグメントf内のすべての画素から隣接領域フレームの対応する画素への空間オフセットの平均値として定義してもよい。
【0062】
いくつかの実施例において、隣接するセグメントの類似度は、以下の等式によって決定してもよい。
そのうち、Err
gradはセグメント勾配の差、Err
edgeはセグメントのエッジ確率の差、Err
diseaseはセグメントの病巣確率の差、Err
offsetはセグメントの空間オフセットの差、r
1、r
2、r
3、r
4は各手がかりの重み、δ
1、δ
2、δ
3、δ
4は正規化パラメータである。E
rrがある閾値より大きい場合は、2つの隣接するセグメントをマージする。
【0063】
図8は本開示の実施例に係る輪郭マッチングのためのプロセス800の模式図を示している。プロセス800は、
図6のブロック630で示す動作の例示的な実装であってもよい。輪郭セグメントにおける画素は、隣接領域において対応する空間オフセットを有するので、すべての画素の空間オフセットの平均値を全体的なオフセット量とし、その後、全体的なオフセット量に基づいて隣接領域における距離が最も近い輪郭を検索してもよい。
【0064】
ブロック810において、全体的なオフセット量に基づいて、後続フレームへの輪郭セグメントの投影を決定する。仮に現在の輪郭セグメントをFrag_t1とし、それが隣接領域フレームにおける全体的なオフセットを{dx,dy}とする。これにより、全体的なオフセット量に応じて、この後続フレームへの現在の輪郭セグメントの投影を取得してもよく、すなわちFrag_t1’=Frag_t1+{dx,dy}。
【0065】
ブロック820において、後続フレームにおける複数の候補輪郭セグメントを決定する。輪郭セグメントの局所性を考慮すると、後続フレームにおける投影近傍の輪郭セグメントのみを考慮してもよい。いくつかの実施例において、後続フレームにおける投影の位置に基づいて、後続フレームにおける1つの領域を決定してもよい。この領域は、投影の最大の外接矩形であってもよい。算出を容易にし、動作効率を向上させるために、矩形の辺をフレームの水平方向と垂直方向に沿わせてもよい。この矩形に覆われた輪郭セグメントを、候補輪郭セグメントセットSet_t2として定義する。
【0066】
ブロック830において、関心のある輪郭セグメントからの距離が最も小さい輪郭セグメントを決定する。候補輪郭セグメントセットSet_t2における各候補輪郭セグメントFrag_t2に対して、投影の各画素と候補輪郭セグメントの画素との最小距離を決定することによって、投影Frag_t1’とこの候補輪郭セグメントFrag_t2との距離を決定する。その後、決定された距離が最も小さい候補輪郭セグメントを、第1のフレームの輪郭セグメントとマッチングする別の輪郭セグメントとして決定してもよい。投影Frag_t1’と候補輪郭セグメントFrag_t2との距離は、以下の等式によって算出してもよい。
そのうち、Frag_t1’の各画素p
iについて、それがFrag_t2で距離の最も近いマッチング画素p
jを算出し、距離が閾値Tを超えている場合、2つの画素の距離をTとして定義し、そうでない場合、真の距離|p
i-p
j|として定義する。閾値Tは、フレーム間の輪郭マッチングの算出の安定性を保証するために使用される。
【0067】
以上、
図1~
図8を参照して、本開示の実施例に係る動画処理方法について説明した。従来の案に比べ、本開示の実施例は、動画の時空間手がかりを利用してエッジ検出と強調の正確性および信頼性を向上させ、動画における低品質画像による悪影響を低減して、動画処理のロバスト性を向上させることができる。本開示のいくつかの実施例は、時空間的整合性に基づくエッジベクトル化および輪郭追跡をさらに実現しており、有益な視覚支援の実現を可能にし、医師が動画における関心のある対象を追跡するのを支援する。
【0068】
図9は本開示の実施例に係る動画処理装置900の模式的なブロック図を示している。装置900は、コンピューティングデバイス105によって実装されてもよく、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアとの組み合わせとして実装されてもよい。
【0069】
図示するように、装置900は、エッジ取得ユニット910と、空間オフセット決定ユニット920と、更新ユニット930とを備える。エッジ取得ユニット910は、動画の第1のフレームの第1のエッジと、第1のフレームの少なくとも1つの隣接領域フレームの第2のエッジとを取得するように構成される。空間オフセット決定ユニット920は、第1のフレームと少なくとも1つの隣接領域フレームとの間のレジストレーションに基づいて、第1のエッジの画素から第2のエッジの対応する画素への空間オフセットを決定するように構成される。更新ユニット930は、少なくとも第2のエッジの対応する画素の第2のエッジ属性と空間オフセットとに基づいて、第1のエッジの画素の第1のエッジ属性を更新するように構成される。
【0070】
いくつかの実施例において、エッジ取得ユニット910はさらに、第1のフレームと少なくとも1つの隣接領域フレームとの各画素のエッジ属性を決定することであって、エッジ属性は、画素がエッジに属する確率を示すことと、第1のフレームと少なくとも1つの隣接領域フレームにおいて、エッジ属性が閾値より大きい画素を決定することによって、第1のエッジと第2のエッジを決定することと、をするように構成されてもよい。
【0071】
いくつかの実施例において、更新ユニット930はさらに、少なくとも1つの隣接領域フレームが予め設定された条件を満たしているか否かを決定することと、少なくとも1つの隣接領域フレームが予め設定された条件を満たしていると決定したことに応答して、第2のエッジの対応する画素の第2のエッジ属性と空間オフセットとに基づいて、第1のエッジの画素の第1のエッジ属性を更新することと、をするように構成されてもよい。
【0072】
いくつかの実施例において、更新ユニット930はさらに、少なくとも1つの隣接領域フレームの画像品質レベルが品質閾値を超えているか否かを決定することと、第1のエッジの画素から第2のエッジの対応する画素への空間オフセットの平均値が予め設定された範囲内にあるか否かを決定することと、によって、少なくとも1つの隣接領域フレームが予め設定された条件を満たしているか否かを決定するように構成されてもよい。
【0073】
いくつかの実施例において、装置900は、追跡ユニットをさらに備えてもよい。追跡ユニットは、第1のエッジの画素の更新後の第1のエッジ属性に基づいて、第1のフレームにおける関心がある対象の輪郭セグメントを決定することと、第1のフレームと第1のフレームの後続フレームとの間のレジストレーションに基づいて、輪郭セグメントから後続フレームへの全体的な空間オフセットを決定することと、全体的な空間オフセットに基づいて、後続フレームにおいて輪郭セグメントとマッチングする別の輪郭セグメントを検索することと、をするように構成される。
【0074】
いくつかの実施例において、追跡ユニットは、更新後の第1のエッジ属性に基づいて、第1のフレームのスーパー画素輪郭を生成することと、スーパー画素輪郭に基づいて、関心がある対象の輪郭セグメントを生成することと、によって、第1のフレームにおける関心がある対象の輪郭セグメントを決定するように構成されてもよい。
【0075】
いくつかの実施例において、追跡ユニットはさらに、スーパー画素輪郭における交差点に基づいて、スーパー画素輪郭を1セットのセグメントに分割することと、1セットのセグメントをマージすることによって輪郭セグメントを生成することと、によって、関心がある対象の輪郭セグメントを生成するように構成されてもよい。
【0076】
いくつかの実施例において、追跡ユニットはさらに、1セットのセグメントのうちの2つの隣接するセグメント間の類似度を決定することと、類似度が閾値を超えていることに応答して、2つの隣接するセグメントをマージして輪郭セグメントを生成することと、によって、輪郭セグメントを生成するように構成されてもよい。
【0077】
いくつかの実施例において、追跡ユニットはさらに、2つの隣接するセグメントの画素の平均勾配の間の差と、2つの隣接するセグメントの画素の平均エッジ確率の間の差と、2つの隣接するセグメントの画素から隣接領域フレームへの平均空間オフセットの間の差と、のうちのいずれか一項によって、1セットのセグメントのうちの2つの隣接するセグメント間の類似度を決定するように構成されてもよい。
【0078】
いくつかの実施例において、追跡ユニットはさらに、全体的な空間オフセットに基づいて、後続フレームへの輪郭セグメントの投影を取得することと、後続フレームにおける複数の候補輪郭セグメントを決定することと、複数の候補輪郭セグメントにおいて投影に距離が最も近い別の輪郭セグメントを検索することと、によって、後続フレームにおいて輪郭セグメントとマッチングする別の輪郭セグメントを検索するように構成されてもよい。
【0079】
いくつかの実施例において、追跡ユニットはさらに、後続フレームにおける投影の位置に基づいて、後続フレームの領域を決定することと、後続フレームの、少なくとも部分的に領域内にある複数の候補輪郭セグメントを決定することと、によって、後続フレームにおける複数の候補輪郭セグメントを決定するように構成されてもよい。
【0080】
いくつかの実施例において、追跡ユニットはさらに、複数の候補輪郭セグメントのそれぞれに対して、投影の各画素と候補輪郭セグメントの画素との最小距離を決定することによって、投影と候補輪郭セグメントとの距離を決定することと、決定された距離が最も小さい候補輪郭セグメントを、別の輪郭セグメントとして決定することと、によって、投影に距離が最も近い別の輪郭セグメントを検索するように構成されてもよい。
【0081】
いくつかの実施例において、追跡ユニットはさらに、追跡のために、動画の再生中に、輪郭セグメントと別の輪郭セグメントをハイライト表示するように構成されてもよい。
【0082】
いくつかの実施例において、第1のエッジおよび第2のエッジはそれぞれ、微小構造のエッジと、病巣のエッジと、のうちの少なくとも一項を含んでもよい。
【0083】
いくつかの実施例において、動画は狭帯域結像(NBI)および拡大内視鏡(ME)動画を含んでもよい。
【0084】
図10は本開示の内容を実施するために使用され得る実施例の例示的なデバイス1000の模式的なブロック図を示している。例えば、本開示の実施例に係るコンピューティングデバイス105は、デバイス1000によって実施されてもよい。図示するように、デバイス1000は、読み取り専用メモリ(ROM)1002に記憶されたコンピュータプログラム命令、または記憶ユニット1008からランダムアクセスメモリ(RAM)1003にロードされたコンピュータプログラム命令に従って、様々な適切な動作および処理を実行することができる中央処理装置(CPU)1001を備える。RAM1003には、記憶デバイス1000の操作に必要な様々なプログラムおよびデータも記憶されていてもよい。CPU1001、ROM1002およびRAM1003は、バス1004を介して互いに接続されている。入出力(I/O)インターフェース1005もバス1004に接続されている。
【0085】
デバイス1000における、例えばキーボードやマウスなどの入力ユニット1006と、例えば各種のディスプレイやスピーカなどの出力ユニット1007と、例えば磁気ディスクや光ディスク等の記憶ユニット1008と、例えばネットワークインターフェースカード、モデム、無線通信トランシーバなどの通信ユニット1009と、を含む複数の部品は、I/Oインタフェース1005に接続されている。通信ユニット1009は、インターネットなどのコンピュータネットワークおよび/または様々な電気通信ネットワークを介して、デバイス1000が他のデバイスと情報・データを交換することを許可する。
【0086】
例えば方法200、500、600、700および/または800のような、上記に説明された各プロセスおよび処理は、処理ユニット1001によって実行されてもよい。例えば、いくつかの実施例において、方法200、500、600、700および/または800は、例えば記憶ユニット1008のような機械読み取り可能な媒体に実体的に含まれるコンピュータソフトウェアプログラムとして実装されてもよい。いくつかの実施例において、コンピュータプログラムの一部または全部は、ROM1002および/または通信ユニット1009を介してデバイス1000にロードおよび/またはインストールされてもよい。コンピュータプログラムがRAM1003にロードされてCPU1001によって実行されるとき、上記に説明された方法200、500、600、700および/または800の1つまたは複数の動作が実行されてもよい。
【0087】
本開示は、方法、装置、システム、および/またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、本開示の各形態を実行するためのコンピュータ読み取り可能なプログラム命令を搭載したコンピュータ読み取り可能な記憶媒体を含んでもよい。
【0088】
コンピュータ読み取り可能な記憶媒体は、命令実行デバイスによって使用される命令を保持し、記憶することができる有形デバイスであってもよい。コンピュータ読み取り可能な記憶媒体は、例えば、電気記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、または上記の任意の適切な組み合わせであってもよいが、これらに限定されるものではない。コンピュータ読み取り可能な記憶媒体のより具体的な例(網羅的なリストでない)は、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピーディスク、機械符号化デバイス、例えば命令が格納されているパンチカードまたはスロット内突起構造、および上記の任意の適切な組み合わせを含む。ここで使用されるコンピュータ読み取り可能な記憶媒体は、無線電波または他の自由に伝搬される電磁波、導波路または他の伝送媒体を介して伝搬される電磁波(例えば、光ファイバケーブルを介した光パルス)、または電気配線を介して伝送される電気信号などの瞬間的な信号そのものとしては解釈されない。
【0089】
ここで説明されたコンピュータ読み取り可能なプログラム命令は、コンピュータ読み取り可能な記憶媒体から各計算/処理デバイスに、または例えばインターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、および/または無線ネットワークというネットワークを介して外部コンピュータまたは外部記憶デバイスにダウンロードされてもよい。ネットワークは、銅伝送ケーブル、光ファイバ伝送、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ、および/またはエッジサーバを含んでもよい。各計算/処理デバイスにおけるネットワークアダプタカードまたはネットワークインタフェースは、ネットワークからコンピュータ読み取り可能なプログラム命令を受信し、そのコンピュータ読み取り可能なプログラム命令を移転して、各計算・処理デバイスにおけるコンピュータ読み取り可能な記憶媒体に格納する。
【0090】
本開示の操作を実行するためのコンピュータプログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械関連命令、マイクロコード、ファームウェア命令、状態設定データ、または、Smalltalk、C++などのオブジェクト指向プログラミング言語と、「C」言語または類似したプログラミング言語などの従来のプロセス型プログラミング言語とを含む1種または多種のプログラミング言語の任意の組み合わせで書かれたソースコードまたはオブジェクトコードであってもよい。コンピュータ読み取り可能なプログラム命令は、完全にユーザコンピュータ上で、部分的にユーザコンピュータ上で、独立したソフトウェアパッケージとして、部分的にユーザコンピュータ上で部分的にリモートコンピュータ上で、または完全にリモートコンピュータまたはサーバ上で実行されてもよい。リモートコンピュータが関与する場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザコンピュータに接続されてもよく、または外部コンピュータ(例えばインターネットを介してインターネットサービスプロバイダを利用して接続される)に接続されてもよい。いくつかの実施例において、コンピュータ読み取り可能なプログラム命令の状態情報を利用して、コンピュータ読み取り可能なプログラム命令を実行することができる、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)、またはプログラマブル論理アレイ(PLA)という電子回路をカスタマイズすることにより、本開示の各形態を実装する。
【0091】
本開示の各形態は、本開示の実施例に係る方法、装置(システム)、およびコンピュータプログラム製品のフローチャートおよび/またはブロック図を参照して、ここで説明される。フローチャートおよび/またはブロック図の各ブロック、ならびにフローチャートおよび/またはブロック図における各ブロックの組み合わせは、いずれもコンピュータ読み取り可能なプログラム命令によって実装されてもよいことを理解されたい。
【0092】
これらのコンピュータ読み取り可能なプログラム命令は、汎用コンピュータ、専用コンピュータ、または他のプログラマブルデータ処理装置の処理ユニットに提供されて、これらの命令がコンピュータまたは他のプログラマブルデータ処理装置の処理ユニットを介して実行されるときに、フローチャートおよび/またはブロック図における1つまたは複数のブロックに規定された機能/動作を実現する装置を生成するように、機械を製造することができる。これらのコンピュータ読み取り可能なプログラム命令を、コンピュータ読み取り可能な記憶媒体に記憶してもよく、これらの命令は、コンピュータ、プログラマブルデータ処理装置、および/または他のデバイスを特定の方法で動作させ、よって、命令が記憶されたコンピュータ読み取り可能な媒体は、フローチャートおよび/またはブロック図における1つまたは複数のブロックに規定された機能・動作の各形態を実装する命令を含む製造品を含む。
【0093】
コンピュータ読み取り可能なプログラム命令を、コンピュータ、他のプログラマブルデータ処理装置、または他のデバイスにロードしてもよく、コンピュータの実装するプロセスを生成するために、コンピュータ、他のプログラマブルデータ処理装置、または他のデバイス上で一連の操作ステップを実行させ、よって、コンピュータ、他のプログラマブルデータ処理装置、または他のデバイス上で実行される命令を、フローチャートおよび/またはブロック図における1つまたは複数のブロックに規定された機能・動作を実装する。
【0094】
図面のフローチャートおよびブロック図は、本開示の複数の実施例に係るシステム、方法、およびコンピュータプログラム製品が実装可能なのアーキテクチャ、機能、および操作を示している。この点で、フローチャートまたはブロック図における各ブロックは、規定された論理機能を実装するための1つまたは複数の実行可能命令を含むモジュール、プログラムセグメントまたは命令の一部を表すことができる。代替としてのいくつかの実装において、ブロックにおいて標記された機能は、図面において標記されたものとは異なる順序で発生してもよい。例えば、2つの連続したブロックは、実際には実質的に並行に実行されてもよく、係る機能に応じて逆の順序で実行されてもよい場合もある。ブロック図および/またはフローチャートにおける各ブロック、ならびにブロック図および/またはフローチャートにおけるブロックの組み合わせは、所定の機能または動作を実行するハードウェアベースの専用システムで実装されてもよく、または専用ハードウェアとコンピュータ命令との組み合わせで実装されてもよいことにも留意されたい。
【0095】
以上、本開示の各実施形態について説明したが、上記の説明は例示的なものであり、網羅的なものではなく、開示された各実施形態に限定されるものでもない。説明された各実施形態の範囲および精神から逸脱することない限り、多くの修正および変更は当業者にとって自明である。本文で使用される用語の選択は、各実施形態の原理、実際の応用、または市場における技術に対する改良を最もよく解釈すること、または本文で開示された各実施形態を当業者が理解できるようにすることを意図している。
【外国語明細書】