(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-03-10
(45)【発行日】2025-03-18
(54)【発明の名称】時空間データに基づき医用画像を解析するシステム及び方法
(51)【国際特許分類】
G06V 10/82 20220101AFI20250311BHJP
G06T 7/215 20170101ALI20250311BHJP
G06T 1/00 20060101ALI20250311BHJP
G06T 1/40 20060101ALI20250311BHJP
【FI】
G06V10/82
G06T7/215
G06T1/00 290
G06T1/40
(21)【出願番号】P 2022519001
(86)(22)【出願日】2020-09-24
(86)【国際出願番号】 US2020052442
(87)【国際公開番号】W WO2021061947
(87)【国際公開日】2021-04-01
【審査請求日】2023-09-15
(32)【優先日】2019-09-24
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】504337958
【氏名又は名称】カーネギー メロン ユニバーシティ
(74)【代理人】
【識別番号】100107342
【氏名又は名称】横田 修孝
(74)【代理人】
【識別番号】100155631
【氏名又は名称】榎 保孝
(74)【代理人】
【識別番号】100137497
【氏名又は名称】大森 未知子
(74)【代理人】
【識別番号】100207907
【氏名又は名称】赤羽 桃子
(74)【代理人】
【識別番号】100217294
【氏名又は名称】内山 尚和
(72)【発明者】
【氏名】ジョン、ガレオッティ
(72)【発明者】
【氏名】スダルシャン、テジャス、マタイ
【審査官】藤原 敬利
(56)【参考文献】
【文献】特開2019-037692(JP,A)
【文献】特開平11-003121(JP,A)
【文献】米国特許出願公開第2019/0130578(US,A1)
【文献】Fausto Milletari et al.,CFCM: Segmentation via Coarse to Fine Context Memory,arXiv,2018年06月04日,https://arxiv.org/pdf/1806.01413
【文献】Tejas Sudharshan Mathai et al.,Learning To Segment Corneal Tissue Interfaces In Oct Images,2019 IEEE 16th International Symposium on Biomedical Imaging (ISBI 2019),IEEE,2019年04月11日,https://ieeexplore.ieee.org/document/8759252
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00- 7/90
G06V 10/00-20/90
(57)【特許請求の範囲】
【請求項1】
人工ニューラルネットワークを使用して、時空間医用画像を解析する方法であって、
イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、
コンピューティングデバイスを用いて、
前記一連の医用画像の1つ以上の画像内の前記少なくとも1つの存在物の前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、
コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成することと、
コンピューティングデバイスを用いて、
前記時空間データを入力する人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することとを含み、
前記人工ニューラルネットワークは複数の層を含み、
前記複数の層の1つ又は複数の層のそれぞれは、少なくとも3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、方法。
【請求項2】
前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、異なるスケールの拡張畳み込みを含む、請求項1に記載の方法。
【請求項3】
前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、前記複数の層の少なくとも層のサブセット間の密結合及び/又は残差結合を含み、前記少なくとも層のサブセットが、少なくとも3つの異なるスケールからの特徴を含む、請求項1に記載の方法。
【請求項4】
前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、少なくとも2つの異なるスケールの畳み込み、及び少なくとも2つの異なるスケールからの特徴を含む前記複数の層の層のサブセットに対する結合を含み、少なくとも3つの異なるスケールの特徴をもたらす、請求項1に記載の方法。
【請求項5】
前記少なくとも1つの存在物が、以下の機器、前記イメージングデバイス、物理的アーチファクト、顕在アーチファクト、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項1に記載の方法。
【請求項6】
前記時変空間データを追跡することが、以下の前記少なくとも1つの存在物の平行移動/回転位置、前記少なくとも1つの存在物の速度、前記少なくとも1つの存在物の加速度、前記少なくとも1つの存在物の慣性測定値、又はそれらの任意の組み合わせの、少なくとも1つを追跡することを含む、請求項1に記載の方法。
【請求項7】
前記時変空間データを追跡することが、以下の慣性測定装置、追跡システム、位置センサ、ロボット運動学、逆運動学、又はそれらの任意の組み合わせの、少なくとも1つに基づく、請求項1に記載の方法。
【請求項8】
前記時空間データが、以下の前記患者の身体内の内的動きを表すデータ、前記患者の身体の外的動きを表すデータ、機器の動きを表すデータ、前記機器の角度を表すデータ、前記患者の体の変形を生じる動きを表すデータ、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項1に記載の方法。
【請求項9】
前記人工ニューラルネットワークが、エンコーダ及びデコーダを含み、前記デコーダ及び前記エンコーダの少なくとも一方が、入力として前記時空間データを利用するように構成される、請求項1に記載の方法。
【請求項10】
前記人工ニューラルネットワークが、以下の長・短期記憶(LSTM)ユニット、ゲート付き再帰型ユニット(GRU)、時間畳み込みネットワーク、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項1に記載の方法。
【請求項11】
前記
時空間データが、前記患者及び/又は機器の位置及び/又は向きを含む、請求項1に記載の方法。
【請求項12】
前記一連の医用画像を解析することが、前記一連の画像において少なくとも1つの解剖学的構造を識別することを含み、前記少なくとも1つの解剖学的構造が、以下の脈管、動脈、静脈、靭帯、神経、筋肉線維、筋膜線維又は筋膜網、脂肪の小塊、移植脂肪の小塊、リンパ組織、皮膚の斑、腱、骨、軟骨片、肺胸膜線、心臓弁、心房室、心臓表面、気管、脳領域、管、小柱網、角膜層、網膜層、眼球水晶体、眼表面、軟組織、角膜縁のフォークトパリセード、臓器、細胞外構造、細胞間構造、細胞、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項1に記載の方法。
【請求項13】
前記一連の医用画像が、以下の超音波画像、光干渉断層法(OCT)画像、CT画像、MRI画像、PET画像、SPECT画像、透視画像、X線画像、マンモグラフィ画像、断層合成画像、光音響画像、聴覚光学画像、内視鏡画像、顕微鏡画像、眼底画像、走査レーザ検眼鏡(SLO)画像、スマートフォン画像、3D(深度)画像、フォーカルスタック画像、明視野画像、可視光画像、赤外線画像、紫外線画像、熱画像、マルチスペクトル画像、断層画像、投影画像、統合画像、再構成画像、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項1に記載の方法。
【請求項14】
前記一連の医用画像を解析することが、前記一連の医用画像に示される1つ又は複数の脈管をセグメント化することを含む、請求項1に記載の方法。
【請求項15】
人工ニューラルネットワークを使用して、時空間医用画像を解析するシステムであって、 イメージングデバイスを用いて患者の一連の医用画像を取り込み、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、
コンピューティングデバイスを用いて、
前記一連の医用画像の1つ以上の画像内の前記少なくとも1つの存在物の前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡し、
コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成し、
コンピューティングデバイスを用いて、
前記時空間データを入力する人工ニューラルネットワークに基づいて、前記一連の医用画像を解析するよう、プログラムされ又は構成されたコンピューティングデバイスを有し、
前記人工ニューラルネットワークは複数の層を含み、
前記複数の層の1つ又は複数の層のそれぞれは、少なくとも3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、システム。
【請求項16】
前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、異なるスケールの拡張畳み込みを含む、請求項15に記載のシステム。
【請求項17】
前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、前記複数の層の少なくとも層のサブセット間の密結合及び/又は残差結合を含み、前記少なくとも層のサブセットが、少なくとも3つの異なるスケールからの特徴を含む、請求項15に記載のシステム。
【請求項18】
前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、少なくとも2つの異なるスケールの畳み込み、及び少なくとも2つの異なるスケールからの特徴を含む前記複数の層の層のサブセットに対する結合を含み、少なくとも3つの異なるスケールの特徴をもたらす、請求項15に記載のシステム。
【請求項19】
前記少なくとも1つの存在物が、以下の機器、前記イメージングデバイス、物理的アーチファクト、顕在アーチファクト、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項15に記載のシステム。
【請求項20】
前記時変空間データを追跡することが、以下の前記少なくとも1つの存在物の平行移動/回転位置、前記少なくとも1つの存在物の速度、前記少なくとも1つの存在物の加速度、前記少なくとも1つの存在物の慣性測定値、又はそれらの任意の組み合わせの、少なくとも1つを追跡することを含む、請求項15に記載のシステム。
【請求項21】
前記時変空間データを追跡することが、以下の慣性測定装置、追跡システム、位置センサ、ロボット運動学、逆運動学、又はそれらの任意の組み合わせの、少なくとも1つに基づく、請求項15に記載のシステム。
【請求項22】
前記時空間データが、以下の前記患者の身体内の内的動きを表すデータ、前記患者の身体の外的動きを表すデータ、機器の動きを表すデータ、前記機器の角度を表すデータ、前記患者の体の変形を生じる動きを表すデータ、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項15に記載のシステム。
【請求項23】
前記人工ニューラルネットワークが、エンコーダ及びデコーダを含み、前記デコーダ及び前記エンコーダの少なくとも一方が、入力として前記時空間データを利用するように構成される、請求項15に記載のシステム。
【請求項24】
前記人工ニューラルネットワークが、以下の長・短期記憶(LSTM)ユニット、ゲート付き再帰型ユニット(GRU)、時間畳み込みネットワーク、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項15に記載のシステム。
【請求項25】
前記
時空間データが、前記患者及び/又は機器の位置及び/又は向きを含む、請求項15に記載のシステム。
【請求項26】
前記一連の医用画像を解析することが、前記一連の画像において少なくとも1つの解剖学的構造を識別することを含み、前記少なくとも1つの解剖学的構造が、以下の脈管、動脈、静脈、靭帯、神経、筋肉線維、筋膜線維又は筋膜網、脂肪の小塊、移植脂肪の小塊、リンパ組織、皮膚の斑、腱、骨、軟骨片、肺胸膜線、心臓弁、心房室、心臓表面、気管、脳領域、管、小柱網、角膜層、網膜層、眼球水晶体、眼表面、軟組織、角膜縁のフォークトパリセード、臓器、細胞外構造、細胞間構造、細胞、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項15に記載のシステム。
【請求項27】
前記一連の医用画像が、以下の超音波画像、光干渉断層法(OCT)画像、CT画像、MRI画像、PET画像、SPECT画像、透視画像、X線画像、マンモグラフィ画像、断層合成画像、光音響画像、聴覚光学画像、内視鏡画像、顕微鏡画像、眼底画像、走査レーザ検眼鏡(SLO)画像、スマートフォン画像、3D(深度)画像、フォーカルスタック画像、明視野画像、可視光画像、赤外線画像、紫外線画像、熱画像、マルチスペクトル画像、断層画像、投影画像、統合画像、再構成画像、又はそれらの任意の組み合わせの、少なくとも1つを含む、請求項15に記載のシステム。
【請求項28】
前記一連の医用画像を解析することが、前記一連の医用画像に示される1つ又は複数の脈管をセグメント化することを含む、請求項15に記載のシステム。
【請求項29】
ニューラルネットワークを使用して医用画像を解析するコンピュータプログラム製品であって、コンピューティングデバイスによって実行されると、前記コンピューティングデバイスに、
イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、
コンピューティングデバイスを用いて、
前記一連の医用画像の1つ以上の画像内の前記少なくとも1つの存在物の前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、
コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成することと、
コンピューティングデバイスを用いて、
前記時空間データを入力する人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することと、を行わせる命令を含む少なくとも1つの非一時的コンピュータ可読媒体を含み、
前記人工ニューラルネットワークは複数の層を含み、
前記複数の層の1つ又は複数の層のそれぞれは、少なくとも3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、
コンピュータプログラム製品。
【請求項30】
前記人工ニューラルネットワークの少なくとも一部が拡張畳み込みを含む、請求項1に記載の方法。
【請求項31】
前記人工ニューラルネットワークの少なくとも一部が残差結合及び/又はスキップ結合を含む、請求項1に記載の方法。
【請求項32】
前記人工ニューラルネットワークの少なくとも一部が拡張畳み込みを含む、請求項15に記載のシステム。
【請求項33】
前記人工ニューラルネットワークの少なくとも一部が残差結合及び/又はスキップ結合を含む、請求項15に記載のシステム。
【請求項34】
人工ニューラルネットワークを使用して、時空間医用画像を解析する方法であって、
イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、
コンピューティングデバイスを用いて、
前記一連の医用画像の1つ以上の画像内の前記少なくとも1つの存在物の前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、
コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成することと、
コンピューティングデバイスを用いて、
前記時空間データを入力する人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することとを含み、
前記人工ニューラルネットワークは複数の層を含み、
前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、方法。
【請求項35】
人工ニューラルネットワークを使用して、時空間医用画像を解析するシステムであって、
イメージングデバイスを用いて患者の一連の医用画像を取り込み、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、
コンピューティングデバイスを用いて、
前記一連の医用画像の1つ以上の画像内の前記少なくとも1つの存在物の前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡し、
コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成し、
コンピューティングデバイスを用いて、
前記時空間データを入力する人工ニューラルネットワークに基づいて、前記一連の医用画像を解析するよう、プログラムされ又は構成されたコンピューティングデバイスを有し、
前記人工ニューラルネットワークは複数の層を含み、
前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、システム。
【請求項36】
ニューラルネットワークを使用して医用画像を解析するコンピュータプログラム製品であって、コンピューティングデバイスによって実行されると、前記コンピューティングデバイスに、
イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、
前記一連の医用画像の1つ以上の画像内の前記少なくとも1つの存在物の前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、
前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成することと、
前記時空間データを入力する人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することと、を行わせる命令を含む少なくとも1つの非一時的コンピュータ可読媒体を含み、
前記人工ニューラルネットワークは複数の層を含み、
前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、コンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、その開示内容が全体として参照により本明細書に援用される、2019年9月24日に出願された米国仮特許出願第62/904,728号明細書に対する優先権を主張するものである。
【0002】
1.分野
本開示は、一般に人工ニューラルネットワークに関し、非制限的な実施形態では、人工ニューラルネットワークを使用して、時空間データに基づき医用画像を解析するシステム、方法、及びコンピュータプログラム製品に関する。
【背景技術】
【0003】
2.技術的問題
光干渉断層法(OCT:optical coherence tomography)、超音波、MRI、又は他の逐次取得方法を使用して取得された医用画像は、患者の体の一部を通して得られた断層スライス(又はボリューム、例えば、フルフレームOCT)のシーケンスを含み得る。これらの画像は、(内的又は外的な)患者及び/又は使用される機器(例えば、超音波プローブ)などの様々な異なるタイプの動き及び/又は向きに基づいて、スライス(又はボリューム)ごとに変化を受ける。また、このような画像を解析するために使用される既存のニューラルネットワークは、シーケンス中の各画像を他の全ての画像とは関係なく考慮し、したがって、これらのニューラルネットワークは、動きをモデル化すること、シーケンス中の前の画像を考慮すること、或いは患者及び/又は機器の変化する動き及び/又は向きを考慮に入れることができない。
【0004】
内膜中膜厚(IMT:Intima-Media Thickness)は、臨床応用において、アテローム性動脈硬化プラークの形成などのリスクを定量化するパラメータである。しかしながら、具体的には、IMTは、変化をモニタリングするための最高水準は現在、組織病理学である、手の移植レシピエント(又は他の複合組織異物移植術のレシピエント)の機能的経過を追跡するために使用することができる。最近、極超短波超音波(UHFUS:Ultra-High Frequency Ultrasound)が、1cmの浅い組織深度の範囲内で0.03mmにある脈管構造の分解能によってIMTを定量的に測定することが示された。しかしながら、この改良された分解能は、従来の超音波及び高周波数超音波(HFUS:High Frequency Ultrasound)イメージングデバイスとは対照的に、脈管境界を損なうスペックルノイズの増加ももたらす。さらに、浅い深度にある脈管は、頸動脈などの体のより深い場所にある脈管とは対照的に、(トランスデューサの圧力及び動きにより)大きくゆがむ。したがって、経時的にIMTの変化を比較するために、UHFUS及びHFUSシーケンスにおいて、急速に移動及び拍動する脈管の輪郭、並びに他の存在物のサブミリメートルの位置特定に関与するシステムを有することが望ましい。
【0005】
超音波シーケンスに対する先行技術の脈管ベースのセグメント化手法は、2つのカテゴリに分類される。HFUS及びUHFUSに関する最新のレベルセット法などの第1のカテゴリは、すぐに実行できるが、パラメータの微調整に起因して、臨床用途で必要とされるロバスト性に欠ける。学習ベースの手法を含む第2のカテゴリは、スキャン設定の変更及び画像品質の変動に強いが、フレーム間脈管ダイナミクスを適切に利用することなく、タスクに固有のものであり、したがって、様々な異なる生物医学画像診断技術に適用できない。
【発明の概要】
【課題を解決するための手段】
【0006】
非制限的な実施形態又は態様によれば、提供されるのは、人工ニューラルネットワークを使用して、時空間医用画像を解析する方法であって、イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成することと、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することとを含み、前記複数の層の1つ又は複数の層のそれぞれは、少なくとも3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、方法。
【0007】
非制限的な実施形態又は態様によれば、前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、異なるスケールの拡張畳み込みを含む。非制限的な実施形態又は態様によれば、前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、前記複数の層の少なくとも層のサブセット間の密結合及び/又は残差結合を含み、前記少なくとも層のサブセットが、少なくとも3つの異なるスケールからの特徴を含む。非制限的な実施形態又は態様によれば、前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、少なくとも2つの異なるスケールの畳み込み、及び少なくとも2つの異なるスケールからの特徴を含む前記複数の層の層のサブセットに対する結合を含み、少なくとも3つの異なるスケールの特徴をもたらす。非制限的な実施形態又は態様によれば、前記少なくとも1つの存在物が、以下の機器、前記イメージングデバイス、物理的アーチファクト、顕在アーチファクト、又はそれらの任意の組み合わせの、少なくとも1つを含む。
【0008】
非制限的な実施形態又は態様によれば、前記時変空間データを追跡することが、以下の前記少なくとも1つの存在物の平行移動/回転位置、前記少なくとも1つの存在物の速度、前記少なくとも1つの存在物の加速度、前記少なくとも1つの存在物の慣性測定値、又はそれらの任意の組み合わせの、少なくとも1つを追跡することを含む。非制限的な実施形態又は態様によれば、前記時変空間データを追跡することが、以下の慣性測定装置、追跡システム、位置センサ、ロボット運動学、逆運動学、又はそれらの任意の組み合わせの、少なくとも1つに基づく。非制限的な実施形態又は態様によれば、前記時空間データが、以下の前記患者の身体内の内的動きを表すデータ、前記患者の身体の外的動きを表すデータ、機器の動きを表すデータ、前記機器の角度を表すデータ、前記患者の体の変形を生じる動きを表すデータ、又はそれらの任意の組み合わせの、少なくとも1つを含む。非制限的な実施形態又は態様によれば、前記人工ニューラルネットワークが、エンコーダ及びデコーダを含み、前記デコーダ及び前記エンコーダの少なくとも一方が、入力として前記時空間データを利用するように構成される。非制限的な実施形態又は態様によれば、前記人工ニューラルネットワークが、以下の長・短期記憶(LSTM)ユニット、ゲート付き再帰型ユニット(GRU)、時間畳み込みネットワーク、又はそれらの任意の組み合わせの、少なくとも1つを含む。
【0009】
非制限的な実施形態又は態様によれば、前記空間データが、前記患者及び/又は機器の位置及び/又は向きを含む。非制限的な実施形態又は態様によれば、前記一連の医用画像を解析することが、前記一連の画像において少なくとも1つの解剖学的構造を識別することを含み、前記少なくとも1つの解剖学的構造が、以下の脈管、動脈、静脈、靭帯、神経
、筋肉線維、筋膜線維又は筋膜網、脂肪の小塊、移植脂肪の小塊、リンパ組織、皮膚の斑、腱、骨、軟骨片、肺胸膜線、心臓弁、心房室、心臓表面、気管、脳領域、管、小柱網、角膜層、網膜層、眼球水晶体、眼表面、軟組織、角膜縁のフォークトパリセード、臓器、細胞外構造、細胞間構造、細胞、又はそれらの任意の組み合わせの、少なくとも1つを含む。非制限的な実施形態又は態様によれば、前記一連の医用画像が、以下の超音波画像、光干渉断層法(OCT)画像、CT画像、MRI画像、PET画像、SPECT画像、透視画像、X線画像、マンモグラフィ画像、断層合成画像、光音響画像、聴覚光学画像、内視鏡画像、顕微鏡画像、眼底画像、走査レーザ検眼鏡(SLO)画像、スマートフォン画像、3D(深度)画像、フォーカルスタック画像、明視野画像、可視光画像、赤外線画像、紫外線画像、熱画像、マルチスペクトル画像、断層画像、投影画像、統合画像、再構成画像、又はそれらの任意の組み合わせの、少なくとも1つを含む。非制限的な実施形態又は態様によれば、前記一連の医用画像を解析することが、前記一連の医用画像に示される1つ又は複数の脈管をセグメント化することを含む。
【0010】
非制限的な実施形態又は態様によれば、前記人工ニューラルネットワークの少なくとも一部が拡張畳み込みを含む。非制限的な実施形態又は態様によれば、前記人工ニューラルネットワークの少なくとも一部が残差結合及び/又はスキップ結合を含む。非制限的な実施形態又は態様によれば、前記人工ニューラルネットワークの少なくとも一部が拡張畳み込みを含む。非制限的な実施形態又は態様によれば、前記人工ニューラルネットワークの少なくとも一部が残差結合及び/又はスキップ結合を含む。
【0011】
非制限的な実施形態又は態様によれば、提供されるのは、人工ニューラルネットワークを使用して、時空間医用画像を解析するシステムであって、イメージングデバイスを用いて患者の一連の医用画像を取り込み、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡し、コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成し、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析するよう、プログラムされ又は構成されたコンピューティングデバイスを有し、前記複数の層の1つ又は複数の層のそれぞれは、少なくとも3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、システム。
【0012】
非制限的な実施形態又は態様によれば、前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、異なるスケールの拡張畳み込みを含む。非制限的な実施形態又は態様によれば、前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、前記複数の層の少なくとも層のサブセット間の密結合及び/又は残差結合を含み、前記少なくとも層のサブセットが、少なくとも3つの異なるスケールからの特徴を含む。非制限的な実施形態又は態様によれば、前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、少なくとも2つの異なるスケールの畳み込み、及び少なくとも2つの異なるスケールからの特徴を含む前記複数の層の層のサブセットに対する結合を含み、少なくとも3つの異なるスケールの特徴をもたらす。非制限的な実施形態又は態様によれば、前記少なくとも1つの存在物が、以下の機器、前記イメージングデバイス、物理的アーチファクト、顕在アーチファクト、又はそれらの任意の組み合わせの、少なくとも1つを含む。
【0013】
非制限的な実施形態又は態様によれば、前記時変空間データを追跡することが、以下の前記少なくとも1つの存在物の平行移動/回転位置、前記少なくとも1つの存在物の速度
、前記少なくとも1つの存在物の加速度、前記少なくとも1つの存在物の慣性測定値、又はそれらの任意の組み合わせの、少なくとも1つを追跡することを含む。非制限的な実施形態又は態様によれば、前記時変空間データを追跡することが、以下の慣性測定装置、追跡システム、位置センサ、ロボット運動学、逆運動学、又はそれらの任意の組み合わせの、少なくとも1つに基づく。非制限的な実施形態又は態様によれば、前記時空間データが、以下の前記患者の身体内の内的動きを表すデータ、前記患者の身体の外的動きを表すデータ、機器の動きを表すデータ、前記機器の角度を表すデータ、前記患者の体の変形を生じる動きを表すデータ、又はそれらの任意の組み合わせの、少なくとも1つを含む。非制限的な実施形態又は態様によれば、前記人工ニューラルネットワークが、エンコーダ及びデコーダを含み、前記デコーダ及び前記エンコーダの少なくとも一方が、入力として前記時空間データを利用するように構成される。非制限的な実施形態又は態様によれば、前記人工ニューラルネットワークが、以下の長・短期記憶(LSTM)ユニット、ゲート付き再帰型ユニット(GRU)、時間畳み込みネットワーク、又はそれらの任意の組み合わせの、少なくとも1つを含む。
【0014】
非制限的な実施形態又は態様によれば、前記空間データが、前記患者及び/又は機器の位置及び/又は向きを含む。非制限的な実施形態又は態様によれば、前記一連の医用画像を解析することが、前記一連の画像において少なくとも1つの解剖学的構造を識別することを含み、前記少なくとも1つの解剖学的構造が、以下の脈管、動脈、静脈、靭帯、神経、筋肉線維、筋膜線維又は筋膜網、脂肪の小塊、移植脂肪の小塊、リンパ組織、皮膚の斑、腱、骨、軟骨片、肺胸膜線、心臓弁、心房室、心臓表面、気管、脳領域、管、小柱網、角膜層、網膜層、眼球水晶体、眼表面、軟組織、角膜縁のフォークトパリセード、臓器、細胞外構造、細胞間構造、細胞、又はそれらの任意の組み合わせの、少なくとも1つを含む。非制限的な実施形態又は態様によれば、前記一連の医用画像が、以下の超音波画像、光干渉断層法(OCT)画像、CT画像、MRI画像、PET画像、SPECT画像、透視画像、X線画像、マンモグラフィ画像、断層合成画像、光音響画像、聴覚光学画像、内視鏡画像、顕微鏡画像、眼底画像、走査レーザ検眼鏡(SLO)画像、スマートフォン画像、3D(深度)画像、フォーカルスタック画像、明視野画像、可視光画像、赤外線画像、紫外線画像、熱画像、マルチスペクトル画像、断層画像、投影画像、統合画像、再構成画像、又はそれらの任意の組み合わせの、少なくとも1つを含む。非制限的な実施形態又は態様によれば、前記一連の医用画像を解析することが、前記一連の医用画像に示される1つ又は複数の脈管をセグメント化することを含む。
【0015】
非制限的な実施形態又は態様によれば、提供されるのは、ニューラルネットワークを使用して医用画像を解析するコンピュータプログラム製品であって、コンピューティングデバイスによって実行されると、前記コンピューティングデバイスに、イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成することと、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することと、を行わせる命令を含む少なくとも1つの非一時的コンピュータ可読媒体を含み、前記複数の層の1つ又は複数の層のそれぞれは、少なくとも3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、コンピュータプログラム製品。
【0016】
非制限的な実施形態又は態様によれば、提供されるのは、人工ニューラルネットワーク
を使用して、時空間医用画像を解析する方法であって、イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成することと、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することとを含み、前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、方法。非制限的な実施形態又は態様によれば、提供されるのは、人工ニューラルネットワークを使用して、時空間医用画像を解析するシステムであって、イメージングデバイスを用いて患者の一連の医用画像を取り込み、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡し、コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成し、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析するよう、プログラムされ又は構成されたコンピューティングデバイスを有し、前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、システム。非制限的な実施形態又は態様によれば、提供されるのは、ニューラルネットワークを使用して医用画像を解析するコンピュータプログラム製品であって、コンピューティングデバイスによって実行されると、前記コンピューティングデバイスに、イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成することと、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することと、を行わせる命令を含む少なくとも1つの非一時的コンピュータ可読媒体を含み、前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、コンピュータプログラム製品。
【0017】
他の非制限的実施形態又は態様は、以下の番号が付けられた条項に記載される。
【0018】
条項1:人工ニューラルネットワークを使用して、時空間医用画像を解析する方法であって、イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成することと、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することとを含み、前記複数の層の1つ又は複数の層のそれぞれは、少なくと
も3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、方法。
【0019】
条項2:前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、異なるスケールの拡張畳み込みを含む、条項1に記載の方法。
【0020】
条項3:前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、前記複数の層の少なくとも層のサブセット間の密結合及び/又は残差結合を含み、前記少なくとも層のサブセットが、少なくとも3つの異なるスケールからの特徴を含む、条項1または2に記載の方法。
【0021】
条項4:前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、少なくとも2つの異なるスケールの畳み込み、及び少なくとも2つの異なるスケールからの特徴を含む前記複数の層の層のサブセットに対する結合を含み、少なくとも3つの異なるスケールの特徴をもたらす、条項1~3のいずれかに記載の方法。
【0022】
条項5:前記少なくとも1つの存在物が、以下の機器、前記イメージングデバイス、物理的アーチファクト、顕在アーチファクト、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項1~4のいずれかに記載の方法。
【0023】
条項6:前記時変空間データを追跡することが、以下の前記少なくとも1つの存在物の平行移動/回転位置、前記少なくとも1つの存在物の速度、前記少なくとも1つの存在物の加速度、前記少なくとも1つの存在物の慣性測定値、又はそれらの任意の組み合わせの、少なくとも1つを追跡することを含む、条項1~5のいずれかに記載の方法。
【0024】
条項7:前記時変空間データを追跡することが、以下の慣性測定装置、追跡システム、位置センサ、ロボット運動学、逆運動学、又はそれらの任意の組み合わせの、少なくとも1つに基づく、条項1~6のいずれかに記載の方法。
【0025】
条項8:前記時空間データが、以下の前記患者の身体内の内的動きを表すデータ、前記患者の身体の外的動きを表すデータ、機器の動きを表すデータ、前記機器の角度を表すデータ、前記患者の体の変形を生じる動きを表すデータ、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項1~7のいずれかに記載の方法。
【0026】
条項9:前記人工ニューラルネットワークが、エンコーダ及びデコーダを含み、前記デコーダ及び前記エンコーダの少なくとも一方が、入力として前記時空間データを利用するように構成される、条項1~8のいずれかに記載の方法。
【0027】
条項10:前記人工ニューラルネットワークが、以下の長・短期記憶(LSTM)ユニット、ゲート付き再帰型ユニット(GRU)、時間畳み込みネットワーク、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項1~9のいずれかに記載の方法。
【0028】
条項11:前記空間データが、前記患者及び/又は機器の位置及び/又は向きを含む、条項1~10のいずれかに記載の方法。
【0029】
条項12:前記一連の医用画像を解析することが、前記一連の画像において少なくとも1つの解剖学的構造を識別することを含み、前記少なくとも1つの解剖学的構造が、以下の脈管、動脈、静脈、靭帯、神経、筋肉線維、筋膜線維又は筋膜網、脂肪の小塊、移植脂肪の小塊、リンパ組織、皮膚の斑、腱、骨、軟骨片、肺胸膜線、心臓弁、心房室、心臓表
面、気管、脳領域、管、小柱網、角膜層、網膜層、眼球水晶体、眼表面、軟組織、角膜縁のフォークトパリセード、臓器、細胞外構造、細胞間構造、細胞、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項1~11のいずれかに記載の方法。
【0030】
条項13:前記一連の医用画像が、以下の超音波画像、光干渉断層法(OCT)画像、CT画像、MRI画像、PET画像、SPECT画像、透視画像、X線画像、マンモグラフィ画像、断層合成画像、光音響画像、聴覚光学画像、内視鏡画像、顕微鏡画像、眼底画像、走査レーザ検眼鏡(SLO)画像、スマートフォン画像、3D(深度)画像、フォーカルスタック画像、明視野画像、可視光画像、赤外線画像、紫外線画像、熱画像、マルチスペクトル画像、断層画像、投影画像、統合画像、再構成画像、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項1~12のいずれかに記載の方法。
【0031】
条項14:前記一連の医用画像を解析することが、前記一連の医用画像に示される1つ又は複数の脈管をセグメント化することを含む、条項1~13のいずれかに記載の方法。
【0032】
条項15:人工ニューラルネットワークを使用して、時空間医用画像を解析するシステムであって、イメージングデバイスを用いて患者の一連の医用画像を取り込み、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡し、
コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成し、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析するよう、プログラムされ又は構成されたコンピューティングデバイスを有し、前記複数の層の1つ又は複数の層のそれぞれは、少なくとも3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、システム。
【0033】
条項16:前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、異なるスケールの拡張畳み込みを含む、条項15に記載のシステム。
【0034】
条項17:前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、前記複数の層の少なくとも層のサブセット間の密結合及び/又は残差結合を含み、前記少なくとも層のサブセットが、少なくとも3つの異なるスケールからの特徴を含む、条項15または16に記載のシステム。
【0035】
条項18:前記少なくとも3つの異なるスケールからの特徴を組み合わせる前記1つ又は複数の層が、少なくとも2つの異なるスケールの畳み込み、及び少なくとも2つの異なるスケールからの特徴を含む前記複数の層の層のサブセットに対する結合を含み、少なくとも3つの異なるスケールの特徴をもたらす、条項15~17のいずれかに記載のシステム。
【0036】
条項19:前記少なくとも1つの存在物が、以下の機器、前記イメージングデバイス、物理的アーチファクト、顕在アーチファクト、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項15~18のいずれかに記載のシステム。
【0037】
条項20:前記時変空間データを追跡することが、以下の前記少なくとも1つの存在物の平行移動/回転位置、前記少なくとも1つの存在物の速度、前記少なくとも1つの存在物の加速度、前記少なくとも1つの存在物の慣性測定値、又はそれらの任意の組み合わせの、少なくとも1つを追跡することを含む、条項15~19のいずれかに記載のシステム
。
【0038】
条項21:前記時変空間データを追跡することが、以下の慣性測定装置、追跡システム、位置センサ、ロボット運動学、逆運動学、又はそれらの任意の組み合わせの、少なくとも1つに基づく、条項15~20のいずれかに記載のシステム。
【0039】
条項22:前記時空間データが、以下の前記患者の身体内の内的動きを表すデータ、前記患者の身体の外的動きを表すデータ、機器の動きを表すデータ、前記機器の角度を表すデータ、前記患者の体の変形を生じる動きを表すデータ、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項15~21のいずれかに記載のシステム。
【0040】
条項23:前記人工ニューラルネットワークが、エンコーダ及びデコーダを含み、前記デコーダ及び前記エンコーダの少なくとも一方が、入力として前記時空間データを利用するように構成される、条項15~22のいずれかに記載のシステム。
【0041】
条項24:前記人工ニューラルネットワークが、以下の長・短期記憶(LSTM)ユニット、ゲート付き再帰型ユニット(GRU)、時間畳み込みネットワーク、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項15~23のいずれかに記載のシステム。
【0042】
条項25:前記空間データが、前記患者及び/又は機器の位置及び/又は向きを含む、条項15~24のいずれかにに記載のシステム。
【0043】
条項26:前記一連の医用画像を解析することが、前記一連の画像において少なくとも1つの解剖学的構造を識別することを含み、前記少なくとも1つの解剖学的構造が、以下の脈管、動脈、静脈、靭帯、神経、筋肉線維、筋膜線維又は筋膜網、脂肪の小塊、移植脂肪の小塊、リンパ組織、皮膚の斑、腱、骨、軟骨片、肺胸膜線、心臓弁、心房室、心臓表面、気管、脳領域、管、小柱網、角膜層、網膜層、眼球水晶体、眼表面、軟組織、角膜縁のフォークトパリセード、臓器、細胞外構造、細胞間構造、細胞、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項15~25のいずれかに記載のシステム。
【0044】
条項27:前記一連の医用画像が、以下の超音波画像、光干渉断層法(OCT)画像、CT画像、MRI画像、PET画像、SPECT画像、透視画像、X線画像、マンモグラフィ画像、断層合成画像、光音響画像、聴覚光学画像、内視鏡画像、顕微鏡画像、眼底画像、走査レーザ検眼鏡(SLO)画像、スマートフォン画像、3D(深度)画像、フォーカルスタック画像、明視野画像、可視光画像、赤外線画像、紫外線画像、熱画像、マルチスペクトル画像、断層画像、投影画像、統合画像、再構成画像、又はそれらの任意の組み合わせの、少なくとも1つを含む、条項15~26のいずれかに記載のシステム。
【0045】
条項28:前記一連の医用画像を解析することが、前記一連の医用画像に示される1つ又は複数の脈管をセグメント化することを含む、条項15~27に記載のシステム。
【0046】
条項29:ニューラルネットワークを使用して医用画像を解析するコンピュータプログラム製品であって、コンピューティングデバイスによって実行されると、前記コンピューティングデバイスに、イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相互に関連つけることによって時空間データを生成することと、コンピュ
ーティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することと、を行わせる命令を含む少なくとも1つの非一時的コンピュータ可読媒体を含み、前記複数の層の1つ又は複数の層のそれぞれは、少なくとも3つの異なるスケールからの特徴を組み合わせ、前記人工ニューラルネットワークの前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、コンピュータプログラム製品。
【0047】
条項30:前記人工ニューラルネットワークの少なくとも一部が拡張畳み込みを含む、条項1~14のいずれかに記載の方法。
【0048】
条項31:前記人工ニューラルネットワークの少なくとも一部が残差結合及び/又はスキップ結合を含む、条項1~14及び30のいずれかに記載の方法。
【0049】
条項32:前記人工ニューラルネットワークの少なくとも一部が拡張畳み込みを含む、条項15~28のいずれかに記載のシステム。
【0050】
条項33:前記人工ニューラルネットワークの少なくとも一部が残差結合及び/又はスキップ結合を含む、条項15~28及び32のいずれかに記載のシステム。
【0051】
条項34:人工ニューラルネットワークを使用して、時空間医用画像を解析する方法であって、イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成することと、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することとを含み、前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、方法。
【0052】
条項35:人工ニューラルネットワークを使用して、時空間医用画像を解析するシステムであって、イメージングデバイスを用いて患者の一連の医用画像を取り込み、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含む少なくとも1つの存在物の視覚的移動を含み、コンピューティングデバイスを用いて、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡し、
コンピューティングデバイスを用いて、前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成し、コンピューティングデバイスを用いて、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析するよう、プログラムされ又は構成されたコンピューティングデバイスを有し、前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、システム。
【0053】
条項36:ニューラルネットワークを使用して医用画像を解析するコンピュータプログラム製品であって、コンピューティングデバイスによって実行されると、前記コンピューティングデバイスに、イメージングデバイスを用いて患者の一連の医用画像を取り込むことと、前記一連の医用画像は、前記患者及び物体の少なくとも一方の少なくとも一部を含
む少なくとも1つの存在物の視覚的移動を含み、前記視覚的移動に基づいて、前記少なくとも1つの存在物に関連付けられた時変空間データを追跡することと、前記時変空間データを前記一連の医用画像と相関させることによって時空間データを生成することと、複数の層を含む人工ニューラルネットワークに基づいて、前記一連の医用画像を解析することと、を行わせる命令を含む少なくとも1つの非一時的コンピュータ可読媒体を含み、前記人工ニューラルネットワークが、拡張畳み込み、及び/又は少なくとも3つの異なるスケールからの特徴を組み合わせる、異なるスケール及び分解能の複数の層間の密結合を含み、前記複数の層の少なくとも1つの層が、前記時空間データに基づいて時空間関係を学習するように構成される、コンピュータプログラム製品。
【0054】
本開示の上記及び他の特徴及び特性、並びに構造の関連要素の動作方法及び機能、並びに部品の組み合わせ及び製造の経済性は、様々な図において同様の参照符号が対応する部分を表す添付の図面を参照して、以下の詳細な説明及び添付の特許請求の範囲を考慮すれば(これらは全て、本明細書の一部を形成する)、より明白になるだろう。しかしながら、図面は単に例示及び説明を目的としたものであり、本発明の制限の定義であることは意図されないことが明確に理解されるものとする。
【0055】
さらなる利点及び詳細は、添付の図面に示される非制限的な例示的実施形態を参照して、より詳細に以下に説明される。
【図面の簡単な説明】
【0056】
【
図1】非制限的実施形態による、人工ニューラルネットワークを使用して時空間医用画像を解析するシステムの模式図を示す。
【
図2】非制限的実施形態による、人工ニューラルネットワークを使用して時空間医用画像を解析するシステムで使用する人工ニューラルネットワークモデルを示す。
【
図3】非制限的実施形態による、人工ニューラルネットワークを使用して時空間医用画像を解析するシステムで使用する入力構造及び出力構造を示す。
【
図4】非制限的実施形態による、人工ニューラルネットワークを使用して時空間医用画像を解析するシステムで使用する符号化ブロック構造を示す。
【
図5】非制限的実施形態による、人工ニューラルネットワークを使用して時空間医用画像を解析するシステムで使用する復号ブロック構造を示す。
【
図6】非制限的実施形態による、人工ニューラルネットワークを使用して時空間医用画像を解析するためのフロー図を示す。
【
図7】非制限的実施形態に関連して使用されるコンピューティングデバイスのコンポーネント例を示す。
【発明を実施するための形態】
【0057】
そうでないと明確に指定される場合を除き、実施形態は、様々な代替のバリエーション及びステップシーケンスを取り得ることが理解されるものとする。また、以下の明細書に記載される具体的なデバイス及びプロセスは、単なる本開示の例示的実施形態又は態様であることが理解されるものとする。よって、本明細書に開示される実施形態又は態様に関連する具体的寸法及び他の物理的特性は、制限と見なされるものではない。本明細書で使用される態様、コンポーネント、要素、構造、行為、ステップ、機能、及び/又は命令などは、極めて重要又は必須であると明示的に記載されない限り、そのように見なされるものではない。また、本明細書において、冠詞「1つの(a)」及び「1つの(an)」は、1つ又は複数の項目を含むことが意図され、「1つ又は複数の」及び「少なくとも1つの」と交換可能に使用され得る。また、本明細書において、「有する(has)」、「有する(have)」、又は「有している(having)」などの用語は、オープンエンド形式の用語であることが意図される。さらに、「~に基づく(based on)」という表現は、明示的に別段の記載のない限り、「少なくとも部分的に~に基づく(bas
ed at least partially on)」を意味することが意図される。
【0058】
本明細書において、「コンピューティングデバイス」という用語は、データを処理するために構成された1つ又は複数の電子デバイスを指し得る。コンピューティングデバイスは、幾つかの例では、プロセッサ、ディスプレイ、メモリ、入力デバイス、及び/又はネットワークインタフェースなどの、データを受信し、処理し、及び出力するために必要なコンポーネントを含み得る。コンピューティングデバイスは、モバイルデバイスでもよい。また、コンピューティングデバイスは、デスクトップコンピュータ、又は他の形態の非モバイルコンピュータでもよい。非制限的実施形態では、コンピューティングデバイスは、GPUを含んでもよい。非制限的実施形態では、コンピューティングデバイスは、複数の回路から構成されてもよい。
【0059】
非制限的実施形態は、人工ニューラルネットワーク(例えば、畳み込みニューラルネットワーク(CNN)など)及び時空間データを使用して、一連の医用画像(解剖学的、生理学的、機能的、及び/又は他の生物医学的画像など)を解析するシステム、方法、及びコンピュータプログラム製品を提供する。幾つかの非制限的実施形態では、CNNベースのコンピュータビジョン手法は、限定されないが、超音波又は光干渉断層法(OCT)などの断面断層画像シーケンスにおいて目に見える解剖学的構造を自動的に識別及びラベル付けするために利用される。非制限的実施形態は、解剖学的構造などの存在物に対する変化の追跡と共に、動き及び向きデータなどの空間情報の同時追跡を可能にする。これは、形状などの解剖学的構造のパラメータが、空間及び時間にわたり追跡されることを可能にする。このような形状に対する変動は、例えば、例として、脈管の圧迫又は分岐点を含み得る。
【0060】
これより
図1を参照して、非制限的実施形態による、一連の医用画像104を解析するシステム1000が示される。システム1000は、ある期間にわたり、患者Pの一連の医用画像104を捕捉する、超音波スキャナ、及び/又はOCTスキャナなどを含み得るイメージングデバイス102を含む。医用画像には、超音波画像、OCT画像、CT画像、MRI画像、PET画像、SPECT画像、透視画像、X線画像、マンモグラフィ画像、断層合成画像、光音響画像、聴覚光学画像、内視鏡画像、顕微鏡画像、眼底画像、走査レーザ検眼鏡(SLO)画像、スマートフォン画像、3D(深度)画像、フォーカルスタック画像、明視野画像、可視光画像、赤外線画像、紫外線画像、熱画像、マルチスペクトル画像、断層画像、投影画像、統合画像、及び/又は再構成画像などが含まれ得る。イメージングデバイス102は、様々な機器が利用され得るが、超音波プローブなどのイメージングシステム102を動作させるための機器106と通信し得る。イメージングデバイス102は、データストレージデバイス108と通信するコンピューティングデバイス100とも通信する。
【0061】
引き続き
図1を参照して、一連の医用画像104は、患者及び/又は物体などの存在物の視覚的な動きに基づいて、あるスライス(又はボリューム)から次のスライスに変化し得る患者の体の画像を含み得る。例えば、このような動きには、内的動き(例えば、拍動する脈管、動いている胎児など)、外的動き(例えば、患者の体の動き、機器106又は他のツールの動き、OCT走査ビームの角度の変更など)、及び/又は相互作用的動き(例えば、超音波トランスデューサを患者の身体内に圧入し、それによって内部の解剖学的構造を変形させること)が含まれ得る。動く物体は、1つ又は複数の解剖学的構造(例えば、脈管、動脈、静脈、靭帯、神経、筋肉線維、筋膜線維又は筋膜網、脂肪の小塊、移植脂肪の小塊、リンパ組織、皮膚の斑、腱、骨、軟骨片、肺胸膜線、肺硬化、心臓弁、心房室、心臓表面、気管、脳領域、管、小柱網、角膜層、網膜層、眼球水晶体、眼表面、軟組織、角膜縁のフォークトパリセード、臓器、細胞外構造、細胞間構造、及び/又は細胞など)などの物理的アーチファクト、及び/又は物理的に存在しないが、1つ又は複数の生
理的性質を示す、イメージングプロセス及び/又はその際に使用されるツールによって生じる視覚効果などの顕在アーチファクトを含み得る。このような視覚効果は、例えば、針関連の超音波アーチファクト(例えば、残響、サイドローブ、及び/又はバヨネットアーチファクトなど)、並びに肺関連のアーチファクト及び構造(例えば、Aライン、Bライン、Zライン、及び/又はコミットテールなど)を含み得る。様々な他のアーチファクトも追跡され得る。
【0062】
さらに
図1を参照して、コンピューティングデバイス100は、一連の画像104の1つ又は複数の画像における存在物の視覚的移動に基づいて、その存在物の時変空間データを追跡するように構成される。連続して取得された画像間に生じ得る様々なあり得る変化が与えられたとき、非制限的実施形態は、これらの値が一連の画像104中の複数の画像(例えば、一連の画像104の少なくともサブセット)の画像ごとに異なるため、存在物の位置を追跡する。一連の画像104中の複数画像に広がる、追跡された時変空間データに基づいて、コンピューティングデバイス100は、時変空間データを一連の画像104中の複数画像と相互に関連つけることによって時空間データを生成し得る。例えば、空間データにおける値及び/又は値の変化は、1つ又は複数の特定の画像にリンクされることによって、それらの特定の画像に関連付けられてもよい。時空間データは、形状、位置、及び/又は向きの経時的な変化を示し得る。リンクされたデータは、データストレージデバイス108内のメモリにおいて示され得る。
【0063】
非制限的実施形態では、
図1をさらに参照して、生成された時空間データは、データストレージデバイス108に保存され、及び解析されてもよい。例えば、時空間データは、限定されないが、畳み込みニューラルネットワーク(CNN)などの、コンピューティングデバイス100によって実行される人工ニューラルネットワークに入力され得る。例えば、時空間データを用いて強化されたCNNは、例えば内膜中膜厚を測定するなどのために、(例えば、手における)脈管の超音波映像シーケンスにおける経時的な構造組織変化を解析するために使用され得る。別の例として、強化CNNは、例えば、毎日個々のボリュームを再構成し、その後、複数日にわたる角膜縁におけるフォークトパリセード幹細胞ニッシェの変化を定量化するなど、前眼部の構造的変化を解析するために使用され得る。様々な他の使用及び用途が可能であることが認識されるだろう。
【0064】
非制限的実施形態では、人工ニューラルネットワークは、逐次ダウンサンプリング層及びアップサンプリング層間の密結合及び/又は残差結合を含むU-Netアーキテクチャで構成されてもよく、したがって、このような層は、様々なスケールで生成された入力を処理する。このような実施形態では、又は(例えば、密結合又は残差結合を含まない可能性がある)他の非制限的U-Net実施形態では、U-Netは、様々なスケールにわたり特徴を算出する拡張(dilated)(及び通常の)畳み込みを用いるブロック又は層を含み得る。先行技術のU-Netアーキテクチャとは対照的に、このような個々の層又はブロックは、1つ又は複数のスケールの畳み込み、及び1つ又は複数のスケールを含む他の層への結合の組み合わせによって、少なくとも3つのスケールにわたり特徴を算出するように構成され得る。ダウンサンプリング層及び/又はアップサンプリング層の1つ又は複数の層は、時空間関係を学習するように構成されてもよい。時空間データは、様々なやり方で人工ニューラルネットワークに組み入れられてもよい。例えば、幾つかの非制限的実施形態では、長・短期記憶(LSTM:Long-Short Term Memory)が、CNNアーキテクチャのデコーダ部分に組み入れられる。LSTMベースのマルチスケールネットワークの使用により、複数の映像時間ステップにわたり関連する特徴を保持し、必要な場合にのみ特徴を更新するように、マルチスケール特徴がインテリジェントに組み合わせられる。幾つかの非制限的実施形態では、人工ニューラルネットワークアーキテクチャは、ネットワークのエンコーダ及び/又はデコーダ部分において、LSTM及び/又は他の形態のメモリ(ゲート付き再帰型ユニット(GRU:Gated R
ecurrent Unit)など)、又は「時間」畳み込みネットワークなどの他のアーキテクチャ要素をさらに組み入れるように修正されてもよい。
【0065】
他の非制限的実施形態では、残差ニューラルネットワーク(ResNet)又はCFCM(Coarse-to-Fine Context Memory)ネットワークなどの他のネットワークアーキテクチャが、マルチスケール特徴及び時空間特徴及び/又は関係を算出するために強化されてもよい。他の非制限的実施形態では、HRNet(High Resolution Network)などのマルチスケールネットワークが、時空間特徴及び/又は関係を学習するために構成されてもよい。
【0066】
非制限的実施形態では、時空間データを人工ニューラルネットワークに組み入れることにより、数多くの目的に使用することができる強化ニューラルネットワークがもたらされる。例えば、強化ニューラルネットワークは、例えば内膜中膜厚を測定するなどのために、(例えば、手における)脈管の超音波映像シーケンスにおける経時的な構造組織変化を解析するために使用され得る。別の例では、強化ニューラルネットワークは、例えば毎日個々のボリュームを再構成し、その後、複数日にわたる角膜縁におけるフォークトパリセード幹細胞ニッシェの変化を定量化するなど、前眼部の構造的変化を解析するために使用され得る。様々な他の使用及び用途が可能であることが認識されるだろう。
【0067】
非制限的実施形態では、一連の医用画像104は、機器106(例えば、超音波トランスデューサなど)が患者Pの体を横切って移動するにつれて、内部の解剖学的構造の表示が、超音波映像において移動及び変化するように、時空間シーケンスで取得される。ネットワークのLSTMは、機器106、患者P、又はプロセスで使用されるあらゆるツールがどのように移動していたかを推論するため、ユーザ(例えば、技師、医師、又は他のオペレータ若しくは解析者)は、機器106が実際にどのように移動されたかを分かっている必要はない。幾つかの例では、機器106、患者P、及び/又はツールがどのように移動しているかに関するさらなる情報(例えば、動き情報)が、平行移動/回転位置、速度、加速度、及び/又は例として、慣性測定装置、追跡システム(例えば、任意の数の次元に関する空間追跡システム)、位置センサ、ロボット運動学、及び/又は逆運動学からの他の出力を追跡することなどによって、利用可能であってもよい。例えば、(移動している機器106、患者P、及び/又はツールなどの)存在物が他の存在物に対してどのように移動していたかをコンピューティングデバイス100がより良く決定することができるように、機器106、患者P、及び/又はツール上に配置された1つ又は複数のセンサは、LSTMに組み入れられる動き情報を提供してもよい。
【0068】
これより
図2を参照して、非制限的実施形態による人工ニューラルネットワーク200が示される。ネットワーク200は、ダウンサンプリングエンコーダ(例えば、符号化ブロック206を含むネットワーク200の部分)及びLSTMベースのデコーダ(例えば、復号ブロック208を含むネットワーク200の部分)を含む。符号化ブロック206は、スケールのシーケンスで画像から特徴を算出し、特徴マップは、ブロック203からネットワーク200のエンコーダ部分を下方に、それらの個々のカーネルが、それらの入力特徴マップのより大きな割合から特徴を算出する(したがって、元の入力画像においてより大きな受容野を有する)につれて、分解能が低下する。同様に、復号ブロック208は、スケールのシーケンスで特徴を算出し、特徴マップは、ブロック212からブロック205へとネットワーク200のデコーダ部分を上方に、それらの個々のカーネルが、それらの入力特徴マップのより小さな割合から特徴を算出するにつれて、分解能が向上する。ブロックごとの反復214が、ネットワーク200に含まれ得る(例えば、例えば、一連のブロックを下方に2、3、4、6、3の反復)。例えば、デコーダは、畳み込みLSTMネットワーク(ConvLSTM)でもよく、又はそれを組み入れてもよい。ネットワーク200のモデルは、一連の各フレーム(例えば、画像)を独立して扱うU-Net
セグメント化モデルとは異なる。
図2に示されるLSTMベースのモデル及びアーキテクチャは、密なピクセルごとの予測のために、複数のスケールにわたって(例えば、脈管などの)存在物の外観を保持するために、画像(例えば、映像フレーム)間の相互関係を考慮する(例えば、復号ブロック208においてLSTMセルを使用する)メモリ機構を実装する。ネットワーク200のエンコーダ部分(例えば、符号化ブロック206)において収集された空間コンテキストを、通信経路210を用いたそのような情報の伝達を介して、ネットワーク200のデコーダ部分(例えば、復号ブロック208)からのLSTMセルと組み合わせることによって、セグメント化の向上のために時空間存在物関連特徴が推定される。
【0069】
図2~5を参照して、記号及び文字は以下を表す:C(畳み込み関数)、D(拡張畳み込み関数)、BN(バッチ正規化関数)、ReLU(整流線形活性化ユニット(rectified linear activation unit))、T(出力クラス:バイナリ(2)、マルチ(2,…))、N(特徴マップの数、例えば、{32,64,128,56,512})、Ht(時間iにおける隠れ状態)、Ct(時間tにおけるセル状態)、・(要素ごとの乗算関数)、a(シグモイド活性化)、×(畳み込み)、及び+(要素ごとの加算関数)。
【0070】
これより
図2及び
図3を参照して、人工ニューラルネットワーク200は、入力202として一連の画像を受信し、ブロック203を用いて画像の符号化を開始する。ネットワーク200は、ブロック212及び結果ブロック205から復号し、出力204として、1つ又は複数のセグメント化された存在物を有する一連の画像を出力する。ReLUは、BNに従い、整流器(例えば、活性化関数)を保持する。
【0071】
これより
図2及び
図4を参照して、ネットワーク200のエンコーダ部分は、拡張畳み込み及び残差結合を使用して、複数のスケールにわたり、存在物の外観の意味のある表現(representations)を抽出する符号化ブロック206を含む。ネットワーク200のエン
コーダ部分の最初の幾つかの層で特徴付けられた特徴マップは、それらのより小さな受容野により限定された低レベル属性と見なされる明瞭な性質(properties)(エッジ、角、及び/又は曲線など)を描写する。ネットワークのより深い層では、粗いが複雑な属性が、不明瞭な性質(例えば、存在物の輪郭)を有して見られる。このレベルでは、画像のより多くの部分が、特徴マップを算出する個々のカーネルのより大きな受容野により、グローバルスケールで見られる。残差結合及び拡張畳み込みは、特に、かすかに認識できる境界に関するさらなる空間情報を収集し、最後のセグメント化においてギャップを防止するために、あるブロックから次のブロックへとこの情報を教え込む(例えば、渡す)。拡張畳み込みは、存在物の境界(例えば、物体又は組織境界)を正確にセグメント化するために、より広い周囲画像内容に関するコンテキスト情報を収集する。一例として、拡張畳み込みは、境界のコントラストが不十分な領域において、先行技術の方法よりも良く機能するために、ギャップを「埋める」ことができる。このような階層的表現(representaton)は
、一連の画像において存在物の移動(例えば、脈管の移動)のダイナミクスを独立してモデル化しない可能性があるが、存在物のセグメント化を向上させるために使用され得る。例えば、エンコーダ部分から異なるスケールで抽出された特徴マップをデコーダ部分のLSTMセルに伝達することによって、LSTMセルは、関心のある関連特徴をメモリに保持し、したがって、より良い品質及び精度のセグメント化を生じさせるために、ネットワークモデルに組み込むことができる。
【0072】
これより
図2及び
図5を参照して、ネットワーク200のデコーダ部分は、復号ブロック208を含む。あらゆる符号化ブロック206は、それの出力特徴マップをネットワーク200のデコーダ部分のLSTMメモリユニットへと(例えば、通信経路210を介して対応する復号ブロック608へと)伝達する。例えば、各復号ブロック208のLST
Mセルは、ネットワーク200に組み入れられてもよく、並びに、単一の時間ステップとして各符号化ブロック206の出力を考慮し、及び粗密(coarse-to-fine)方法で複数のスケールで抽出された特徴マップを統合するためにメモリ機構を実装するように構成されてもよい。非制限的実施形態では、このような統合は、セル状態に対する新しい情報の除去又は付加を調整する復号ブロック208のゲート付き論理構造を用いて行われ得る。このようにして、最深エンコーダ層(例えば、最下の符号化ブロック206及びそれの全ての反復)からのグローバルコンテキスト情報が、まずLSTMユニットによって観察され、受容野が減少するにつれて、存在物に関するより細かい詳細(例えば、脈管境界に関するさらなる情報)が付加される。
【0073】
図2及び
図5を引き続き参照して、各復号ブロック208は、入力として、3つの特徴セット(入力状態、隠れ状態、及びセル状態)を利用するLSTMユニットを組み入れ、3つの論理ゲート(忘却ゲート、入力ゲート、及び出力ゲート)を使用して情報を出力する。忘却ゲートは、セル状態特徴セットから情報を除去するように構成される。入力ゲートは、セル状態特徴セットに組み入れられる新しい情報を決定するように構成される。出力ゲートは、それぞれのLSTMユニットの出力を調整するように構成される。各復号ブロック208のLSTMユニットは、LSTMユニットに関して様々な構造が可能であるが、セグメント化精度を向上させるために、畳み込み及びReLUを利用する。ネットワーク200の最深レベルの初期復号ブロック(例えば、ブロック212)の初期隠れ状態及び初期セル状態は、他のLSTMユニットのそれぞれ(例えば、212を除く復号ブロック208の部分)の隠れ状態及びセル状態が、それの下にあるLSTMユニットからアップサンプリングされるように、ゼロに初期化され得る。ConvLSTMブロックなどの構造化されたLSTMベースの復号ブロック208の使用は、ネットワーク200が存在物の形状属性を保持し、1つ又は複数の画像のそれぞれにおいて存在物をセグメント化することを容易にする。
【0074】
これより
図6を参照して、示されるのは、非制限的実施形態による一連の医用画像を解析する方法のフロー図である。
図6に示されるステップの順序は、単に例示を目的としたものであり、非制限的実施形態が、より多くのステップ、より少ないステップ、異なるステップ、及び/又は異なるステップ順序を伴い得ることが認識されるだろう。ステップ600では、人工ニューラルネットワークが作成される。非制限的実施形態では、人工ニューラルネットワークは、層間の密結合及び/又は残差結合を用いて作成される。このような実施形態及び他の非制限的実施形態において、人工ネットワークは、複数の層を含んでもよく、上記複数の層の1つ又は複数の層のそれぞれが、少なくとも3つの異なるスケール/分解能からの特徴を組み合わせる。幾つかの例では、少なくとも3つの異なるスケールからの特徴を組み合わせる層は、部分的に、異なるスケールの拡張畳み込み、3つの異なるスケールからの特徴を含む少なくとも層のサブセット間の密結合、及び/又は3つの異なるスケールからの特徴を含む少なくとも層のサブセット間の残差結合を含み得る。
【0075】
ネットワークは、例えば、教師付き及び/又は教師なしの方法論などによる様々なやり方で訓練され得る。非制限的例では、ネットワークの非時間的部分を訓練するために静止画像が使用されてもよい。一旦ネットワークの非時間的部分が訓練されれば、時空間データを用いてネットワーク全体を訓練するために映像が使用されてもよい。ステップ602では、超音波スキャナ及び/又はOCTスキャナなどのイメージングデバイスを用いて、一連の医用画像が捕捉される。一連の医用画像は、例えば患者、物体、及び/又はそれらの一部などの存在物の動きを示す映像からのフレームを含み得る。幾つかの例では、1つ又は複数の存在物が、捕捉された複数のフレーム(例えば、画像)内で移動する場合があり、幾つかの例では、フレームの外の1つ又は複数の存在物(例えば、画像を捕捉する超音波トランスデューサなど)が、フレーム内の存在物に対して移動する場合がある。
【0076】
図6をさらに参照して、ステップ604では、フレーム内又はフレームの外の少なくとも1つの存在物の移動に関連付けられた空間データが追跡される。空間データは、例えば、2次元又は3次元空間における絶対又は相対空間座標として追跡され得る。空間データは、平行移動/回転位置、速度、加速度、及び/又は例として、慣性測定装置、追跡システム(例えば、任意の数の次元に関する空間追跡システム)、位置センサ、ロボット運動学、及び/又は逆運動学からの他の出力を含み得る。ステップ606では、時空間データが、ステップ604で追跡された空間データをステップ602で捕捉された一連の医用画像と相関させることによって生成される。時空間データは、1つ又は複数のデータベースに関連付け(例えば、リンク)を含み得る。ステップ608では、ステップ600で作成された人工ニューラルネットワークを使用して、一連の医用画像が解析される。人工ニューラルネットワークは、本明細書に説明したようにLSTMセルを組み入れることに基づいて、存在物移動の時空間関係を識別するために訓練され得る。ステップ608の結果は、(例えば、例えば映像における)一連の画像全体を通した1つ又は複数の存在物の動きが観察及び記録され得るように、1つ又は複数の存在物がセグメント化される一連の医用画像でもよい。
【0077】
2つのスキャナ:Visualsonics Vevo 2100 UHFUSマシン(Fujifilm,Canada)及びDiasus HFUSスキャナ(Dynamic Imaging,UK)からの映像シーケンスを使用して、システムのテストを行った。UHFUSスキャナは、30μmの物理的分解能及び11.6μmのピクセル間隔を有する50MHzトランスデューサ(変換器)を提供した。それぞれが、832×512ピクセルの寸法を有する100個の2DのBスキャンを含む、58個のUHFUSシーケンスが使用された。HFUSスキャナは、92.5μmのピクセル間隔を有する10~22MHzトランスデューサを有していた。それぞれが、280×534ピクセルの寸法を有する可変個数の2DのBスキャン(50~250)を含む、26個のHFUSシーケンスが使用された。シーケンスの全てが、広範囲の調節可能な利得設定(40~70dB)で手の動脈(例えば、浅掌動脈弓)を含んでいた。縦走査、拍動する脈管、及び/又は面外脈管変形などの広範囲に及ぶプローブの動きも取得された。熟練した採点者が、全ての84個のUHFUS及びHFUSシーケンスに注釈を付けた。一般的な適用性を示すために、58個の異常なケース及び80個の正常なケースを有した138個の注釈付けされた画像を含むx線データセットに対しても、システムがテストされた。
【0078】
テストに使用された58個のUHFUSシーケンスのうち、20個は、訓練のために選ばれたものであり、残りの38個は、テストのために使用された。同様に、26個のHFUSシーケンスから、20個は、訓練のために選ばれたものであり、残りの6個は、テストのために使用された。脈管セグメント化タスクに関する三分割交差検証(tree-fold cross-validation)を行った。臨床応用をシミュレーションするために、(一重による)最も少ない検証損失を有する2つの最良モデルのアンサンブルをテストに使用した。肺のセグメント化タスクに関する三分割交差検証もx線データセットにおいて行った。脈管セグメント化タスクに関して、誤差をレベルセットベースの方法及び2つのLSTMベースのセグメント化手法による誤差と比較した。肺のセグメント化タスクに関して、結果を最新のモデルと比較した。シーケンスは、可変画像サイズを含み、フルサイズの画像を用いてConvLSTMを訓練することは、GPUのRAMによって制限された。したがって、人工ニューラルネットワークは、各Bスキャンを256×256ピクセルにスケーリングすることによって訓練された。訓練セットを120,000個の画像にまで増加させるために、データ拡大(弾性変形及び/又はぼけなど)を行った。他の方法と比較するために、各基準結果を専門家の注釈と比較した。誤差を定量化するために、以下のメトリクスを計算した:1)ダイス類似係数(DSC:Dice Similarity Coefficient)[6]、2)ミリメートル単位のハウスドルフ距離(HD)[6]、3)ミリメートル単位の平均絶対偏差(MAD)、4)明確な偽陽性及び偽陰性距離、5)精度
(Pree.)及び6)再現能力(Rec.)。
【0079】
表1は、他の方法と比較したUHFUS(上のUSVS-Net値)及びHFUS(下のUSVS-Net値)画像シーケンスに対するセグメント化誤差比較を示す。
【0080】
【0081】
これらのテストに基づいて、既存のレベルセット手法は、38個のシーケンスの内の33個においてのみ、脈管のセグメント化に成功したが、LSTMベースの方法は、全てのシーケンスにおいて脈管のセグメント化に成功した。本明細書に記載したシステム及びネットワークアーキテクチャは、最高の精度及び最小の誤差で、専門家の注釈に合致した出力を生成した。システムは、スペックルの増加及び大きな脈管の動きを有するUHFUSシーケンスにおけるサブミリメートルの脈管位置特定の処理及び出力を行った。
【0082】
これより
図7を参照して、示されるのは、非制限的実施形態による、本明細書に記載されるシステム及び方法を実装し、及び行うためのコンピューティングデバイス900のコンポーネント例の図である。幾つかの非制限的実施形態では、デバイス900は、さらなるコンポーネント、より少ないコンポーネント、異なるコンポーネント、又は
図7に示されるものとは異なるように配置されたコンポーネントを含んでもよい。デバイス900は、バス902、プロセッサ904、メモリ906、ストレージコンポーネント908、入力コンポーネント910、出力コンポーネント912、及び通信インタフェース914を含んでもよい。バス902は、デバイス900のコンポーネント間の通信を可能にするコンポーネントを含んでもよい。幾つかの非制限的実施形態では、プロセッサ904は、ハードウェア、ファームウェア、又はハードウェア及びソフトウェアの組み合わせで実装されてもよい。例えば、プロセッサ904は、プロセッサ(例えば、中央処理装置(CPU)、グラフィック処理ユニット(GPU)、加速処理ユニット(APU)など)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、及び/又はある機能を行うためにプログラムされ得る任意の処理コンポーネント(例えば、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)など)を含んでもよい。メモリ906は、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、及び/又はプロセッサ904によって使用される情報及び/又は命令を保存する別のタイプの動的又は静的ストレージデバイス(例えば、フラッシュメモリ、磁気メモリ、光メモリなど)を含み得る。
【0083】
図7を引き続き参照して、ストレージコンポーネント908は、デバイス900の動作及び使用に関連する情報及び/又はソフトウェアを保存してもよい。例えば、ストレージコンポーネント908は、ハードディスク(例えば、磁気ディスク、光ディスク、光磁気ディスク、固体ディスクなど)及び/又は別のタイプのコンピュータ可読媒体を含み得る。入力コンポーネント910は、ユーザ入力(例えば、タッチスクリーンディスプレイ、キーボード、キーパッド、マウス、ボタン、スイッチ、マイクロホンなど)を使用するな
どにより、デバイス900が情報を受信することを可能にするコンポーネントを含んでもよい。追加的又は代替的に、入力コンポーネント910は、情報を検知するためのセンサ(例えば、全地球測位システム(GPS)コンポーネント、加速度計、ジャイロスコープ、アクチュエータなど)を含んでもよい。出力コンポーネント912は、デバイス900からの出力情報を提供するコンポーネントを含んでもよい(例えば、ディスプレイ、スピーカ、1つ又は複数の発光ダイオード(LED)など)。通信インタフェース914は、有線接続、無線接続、又は有線及び無線接続の組み合わせなどにより、デバイス900が他のデバイスと通信することを可能にするトランシーバのようなコンポーネント(例えば、トランシーバ、別個の受信機及び送信機など)を含んでもよい。通信インタフェース914は、デバイス900が、別のデバイスから情報を受信し、及び/又は別のデバイスへと情報を提供することを可能にし得る。例えば、通信インタフェース914は、イーサネットインタフェース、光インタフェース、同軸インタフェース、赤外線インタフェース、無線周波数(RF)インタフェース、ユニバーサルシリアルバス(USB)インタフェース、Wi-Fi(登録商標)インタフェース、及び/又はセルラーネットワークインタフェースなどを含み得る。
【0084】
デバイス900は、本明細書に記載される1つ又は複数のプロセスを行うことができる。デバイス900は、メモリ906及び/又はストレージコンポーネント908などのコンピュータ可読媒体によって保存されるソフトウェア命令を実行するプロセッサ904に基づいて、これらのプロセスを行い得る。コンピュータ可読媒体は、任意の非一時的メモリデバイスを含み得る。メモリデバイスは、単一の物理的ストレージデバイス内にあるメモリ空間、又は複数の物理的ストレージデバイスに散在するメモリ空間を含む。ソフトウェア命令は、別のコンピュータ可読媒体から、又は通信インタフェース914を介して別のデバイスからメモリ906及び/又はストレージコンポーネント908内に読み込まれてもよい。実行されると、メモリ906及び/又はストレージコンポーネント908に保存されたソフトウェア命令は、本明細書に記載される1つ又は複数のプロセスをプロセッサ904に行わせることができる。追加的又は代替的に、本明細書に記載される1つ又は複数のプロセスを行うために、ソフトウェア命令の代わりに、又はソフトウェア命令と組み合わせて、ハードワイヤード回路網が使用されてもよい。したがって、本明細書に記載される実施形態は、ハードウェア回路網及びソフトウェアのどのような具体的な組み合わせにも限定されない。本明細書において、「プログラムされた、又は構成された」という用語は、ソフトウェア、ハードウェア回路網、又は1つ若しくは複数のデバイス上のそれらの任意の組み合わせの配置を指す。
【0085】
例示目的で実施形態を詳細に記載したが、上記詳細がそのような目的のためだけのものであること、及び開示内容が、開示された実施形態に限定されるものではなく、それどころか、添付の請求項の精神及び範囲内にある変更形態及び均等配置を対象に含めることが意図されることが理解されるものとする。例えば、本開示は、可能な範囲で、任意の実施形態の1つ又は複数の特徴が、任意の他の実施形態の1つ又は複数の特徴と組み合わせられ得ることを企図することが理解されるものとする。