IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ レチンエイアイ メディカル アーゲーの特許一覧

<>
  • 特許-画像中のノイズの低減 図1
  • 特許-画像中のノイズの低減 図2
  • 特許-画像中のノイズの低減 図3A
  • 特許-画像中のノイズの低減 図3B
  • 特許-画像中のノイズの低減 図3C
  • 特許-画像中のノイズの低減 図3D
  • 特許-画像中のノイズの低減 図3E
  • 特許-画像中のノイズの低減 図4
  • 特許-画像中のノイズの低減 図5
  • 特許-画像中のノイズの低減 図6A
  • 特許-画像中のノイズの低減 図6B
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-06
(45)【発行日】2022-12-14
(54)【発明の名称】画像中のノイズの低減
(51)【国際特許分類】
   G06T 5/00 20060101AFI20221207BHJP
   A61B 3/10 20060101ALI20221207BHJP
【FI】
G06T5/00 705
A61B3/10 100
【請求項の数】 12
(21)【出願番号】P 2020514334
(86)(22)【出願日】2018-05-16
(65)【公表番号】
(43)【公表日】2020-07-16
(86)【国際出願番号】 EP2018062824
(87)【国際公開番号】W WO2018210978
(87)【国際公開日】2018-11-22
【審査請求日】2021-05-12
(31)【優先権主張番号】17172039.4
(32)【優先日】2017-05-19
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】519411216
【氏名又は名称】レチンエイアイ メディカル アーゲー
(74)【代理人】
【識別番号】110001416
【氏名又は名称】弁理士法人信栄事務所
(72)【発明者】
【氏名】チラー ルイズ,カルロス
(72)【発明者】
【氏名】デ ザネット,サンドロ
(72)【発明者】
【氏名】アポストロポウロス,ステファノス
【審査官】松永 隆志
(56)【参考文献】
【文献】特開平11-196296(JP,A)
【文献】米国特許出願公開第2013/0051516(US,A1)
【文献】特開2002-373339(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00-19/20
A61B 3/10
(57)【特許請求の範囲】
【請求項1】
画像中のノイズを低減するためのニューラルネットワークをトレーニングする方法であって、
複数の入力画像を撮像装置から取得するステップ(101)と、
前記入力画像のサブセットを識別するステップ(101a)と、を含み、入力画像のサブセットの各入力画像が、当該サブセットのその他の入力画像と同一の対象物を表し、前記方法が、さらに、
複数のターゲット画像を生成するステップ(104)を含み、1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成され、前記方法が、さらに、
複数のトレーニングペアを生成するステップ(105)を含み、1つのトレーニングペアが、
前記ターゲット画像のうちの1つと、
トレーニング画像と、を含み、当該トレーニング画像が、前記ターゲット画像のうちの前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいており、前記トレーニング画像が1つ以上の入力画像に基づくとき、入力画像の前記サブセットの前記入力画像の全てではないが前記1つ以上を組み合わせることにより前記トレーニング画像のノイズを低減するように前記トレーニング画像を生成し、前記方法が、さらに、
前記複数のトレーニングペアを用いてニューラルネットワークをトレーニングするステップ(107)を含み、前記ニューラルネットワークへの入力が、前記複数のトレーニングペアのうちの幾つかのトレーニングペアの前記トレーニング画像を含み、且つ、前記ニューラルネットワークのターゲット出力が、前記幾つかのトレーニングペアの前記ターゲット画像を含み、
前記複数のトレーニングペアが、入力画像の、正の整数値である第1の番号Kに基づいた第1のトレーニング画像を含む第1のトレーニングペアと、入力画像の、正の整数値である第2の番号Kに基づいた第2のトレーニング画像を含む第2のトレーニングペアとを含み、正の整数値である前記第1の番号K正の整数値である前記第2の番号Kとは異なり、
前記複数のトレーニングペアが、異なる番号の入力画像に基づく異なるトレーニング画像ではなく、同一のターゲット画像を有するトレーニングペアを含む、方法。
【請求項2】
Nは正の整数値であって、N個の入力画像の各ターゲット画像、及び、当該ターゲット画像の対応するサブセットに対して、トレーニング画像が、N個の入力画像の前記サブセットの、Nよりも小さい全ての正の整数値であるKに基づいて生成される、請求項1に記載の方法。
【請求項3】
Nは正の整数値であって、任意の値Kに対して、N個の入力画像の前記サブセットからのK個の入力画像の1つ以上の可能な選択が存在するならば、トレーニング画像が、N個の入力画像の前記サブセットからの前記K個の入力画像の1つ以上の選択のために生成される、請求項1または2に記載の方法。
【請求項4】
前記入力画像を組み合わせる前記ステップが、
組み合わせた前記入力画像の対応する値を平均化するステップを含み、或いは、
さらに、サブセットの前記入力画像を、前記ターゲット画像及びトレーニング画像を生成する前に空間的に位置合わせするステップ、或いは
さらに、前記ニューラルネットワークをトレーニングする前に、ノイズを追加するか、又は、前記トレーニング画像の向きを変更することにより前記トレーニング画像を増強するステップを含む、請求項1~3のいずれかに記載の方法。
【請求項5】
前記入力画像が、光干渉断層撮影、OCTにより取得される、請求項1~4のいずれかに記載の方法。
【請求項6】
入力画像の特定のサブセットの前記入力画像が、単一のCスキャン画像から抽出された複数のBスキャン画像を含む、請求項5に記載の方法。
【請求項7】
前記入力画像が網膜の少なくとも一部を示す、請求項1~6のいずれかに記載の方法。
【請求項8】
異なるサブセットの前記入力画像が、異なる被検体における同一タイプの組織又は同一タイプの器官の画像を含み、或いは、異なるサブセットの前記入力画像が、同一タイプの異なる対象物の画像を含む、請求項1~7のいずれかに記載の方法。
【請求項9】
前記複数の入力画像を取得するステップが、複数の異なる撮像装置から入力画像を取得するステップを含む、請求項1~8のいずれかに記載の方法。
【請求項10】
さらに、トレーニング後に、撮像装置から、前記ニューラルネットワークへの入力画像としての新しい画像を受信して供給し(108)、前記ニューラルネットワークからの出力画像を得るステップを含む、請求項1~9のいずれかに記載の方法。
【請求項11】
撮像装置のノイズ低減装置であって、
撮像装置から画像を受信するための入力ユニット(411)と、
前記画像を、トレーニングされたニューラルネットワーク(401)に従って処理して出力画像を生成するための制御ユニット(410)と、を備え、
前記ニューラルネットワーク(401)が、複数の入力画像を撮像装置から取得するステップと当該入力画像のサブセットを識別するステップとにより作成され、入力画像のサブセットの各入力画像が、当該サブセットのその他の入力画像と同一の対象物を表し、前記ニューラルネットワーク(401)が、さらに、複数のターゲット画像を生成するステップにより作成され、1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成され、前記ニューラルネットワーク(401)が、さらに、複数のトレーニングペアを生成するステップにより作成され、1つのトレーニングペアが、前記ターゲット画像のうちの1つと、トレーニング画像と、を含み、当該トレーニング画像が、前記ターゲット画像のうちの前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいており、前記トレーニング画像が1つ以上の入力画像に基づくとき、入力画像の前記サブセットの前記入力画像の全てではないが前記1つ以上を組み合わせることにより、前記トレーニング画像のノイズを低減するように前記トレーニング画像を生成し、前記ニューラルネットワーク(401)が、さらに、前記複数のトレーニングペアを用いて前記ニューラルネットワークをトレーニングするステップにより作成され、前記ニューラルネットワークへの入力が、前記複数のトレーニングペアのうちの幾つかのトレーニングペアの前記トレーニング画像を含み、且つ、前記ニューラルネットワークのターゲット出力が、前記幾つかのトレーニングペアの前記ターゲット画像を含み、
前記複数のトレーニングペアが、入力画像の、正の整数値である第1の番号Kに基づいた第1のトレーニング画像を含む第1のトレーニングペアと、入力画像の、正の整数値である第2の番号Kに基づいた第2のトレーニング画像を含む第2のトレーニングペアとを含み、正の整数値である前記第1の番号K正の整数値である前記第2の番号Kとは異なり、前記複数のトレーニングペアが、異なる番号の入力画像に基づく異なるトレーニング画像ではなく、同一のターゲット画像を有するトレーニングペアを含む、ノイズ低減装置。
【請求項12】
画像中のノイズを低減するためのニューラルネットワークをトレーニングするシステムであって、
複数の入力画像を撮像装置から取得するための入力ユニット(411)と、
制御ユニット(410)と、を備え、当該制御ユニット(410)が、
前記入力画像のサブセットを識別する(101a)ように構成されており、入力画像のサブセットの各入力画像が、当該サブセットのその他の入力画像と同一の対象物を表しており、前記制御ユニット(410)が、さらに、
複数のターゲット画像を生成する(104)ように構成されており、1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成され、前記制御ユニット(410)が、さらに、
複数のトレーニングペアを生成する(105)ように構成されており、1つのトレーニングペアが、
前記ターゲット画像のうちの1つと、
トレーニング画像と、を含み、当該トレーニング画像が、前記ターゲット画像のうちの前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいており、前記トレーニング画像が1つ以上の入力画像に基づくとき、入力画像の前記サブセットの前記入力画像の全てではないが前記1つ以上を組み合わせることにより前記トレーニング画像のノイズを低減するように前記トレーニング画像を生成し、前記制御ユニット(410)が、さらに、
前記複数のトレーニングペアを用いてニューラルネットワーク(401)をトレーニングする(107)ように構成され、前記ニューラルネットワークへの入力が、前記複数のトレーニングペアのうちの幾つかのトレーニングペアの前記トレーニング画像を含み、且つ、前記ニューラルネットワークのターゲット出力が、前記幾つかのトレーニングペアの前記ターゲット画像を含み、
前記複数のトレーニングペアが、入力画像の、正の整数値である第1の番号Kに基づいた第1のトレーニング画像を含む第1のトレーニングペアと、入力画像の、正の整数値である第2の番号Kに基づいた第2のトレーニング画像を含む第2のトレーニングペアとを含み、正の整数値である前記第1の番号K正の整数値である前記第2の番号Kとは異なり、前記複数のトレーニングペアが、異なる番号の入力画像に基づく異なるトレーニング画像ではなく、同一のターゲット画像を有するトレーニングペアを含む、システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像中のノイズ、特にスペックルノイズを低減するための方法及び装置に関する。より詳細には、本発明は、OCT画像中のスペックルノイズを低減することに関する。
【背景技術】
【0002】
撮像装置(イメージングデバイス)は、通常、1以上のセンサから受信した信号に基づいてデジタル画像を生成できる。生成された画像はノイズを含む。生成された画像中のノイズを低減するために多くの研究が過去に行われてきた。
【0003】
光干渉断層撮影(OCT)は、マイクロメートルの解像度、生体組織及び他のサンプルの多次元画像を提供する非侵襲性の撮像モダリティである。OCT画像は、最も一般的な構成において、2つの広帯域レーザビームの干渉により形成される。これらのうちの一方は、静的ミラーからの反射(「参照ビーム」)(“reference beam”)であり、もう一方は、検査中のサンプルによる反射(「サンプルビーム」)(“sample beam”)である。OCTの用語において、「Aスキャン」が、静的なサンプルビームにより取得された単一の列を意味する。「Bスキャン」が、サンプルに対する所定のラインに沿って移動しているサンプルビームにより取得された2次元断面画像を意味する。「Cスキャン」が、サンプルに対してアプリケーション固有のラスタパターンで移動しているサンプルビームにより取得された3次元体積画像を意味する。
【0004】
技術は著しく進歩しているが、OCT画像は、いまだにスペックルノイズを含んでいる。スペックルノイズは、熱、電気、多重散乱効果の複雑な組合せ、及び、デジタル処理アルゴリズムにより生じ得る。実際、多くのアプリケーションにおいて、再構成されたOCT信号のスペクトルエネルギーの75%がノイズである。
【0005】
従って、スペックルの低減又はノイズ除去技術が、重要な研究課題である。最も簡単な第1の方法は、同一サンプル位置から取得した複数のBスキャンの平均化を含む。スペックルノイズはランダムプロセスの結果であり、従って無相関であるため、Bスキャンのn回の平均化により、信号対ノイズ比(SNR)が√n倍改善される。平均化は、通常、干渉信号においてではなく、最終的な再構成画像において実行される。
【0006】
デジタルノイズ除去アルゴリズムは、取得した画像を、その画像に含まれる構造情報を損なわずにスペックルノイズ量を低減するように後処理することを意図している。このような方法の例には、中央値フィルタリングと、その他の等方性及び異方性平滑化技術が含まれる。
【0007】
人工ニューラルネットワークアルゴリズムを用いたスペックルノイズ低減方法が、非特許文献1に開示されている。ANNをトレーニングするために、既知のシグマ値を有するノイジー(ノイズが多い)画像が必要である。既知のシグマ値を有するノイジー画像を生成するために、レイリーノイズジェネレーターが使用される。
【先行技術文献】
【非特許文献】
【0008】
【文献】M.R.N.アヴァナキ(Avanaki)らによる「人工ニューラルネットワークアルゴリズムを使用したスペックル低減」(“Speckle reduction using an artificial neural network algorithm”)(アプライド・オプティクス、2013年第21号52巻)
【発明の概要】
【発明が解決しようとする課題】
【0009】
測定技術を用いて得られた画像のノイズを低減するための改善された方法を提供することが有利であろう。
【課題を解決するための手段】
【0010】
この課題に対処するために、本発明の一態様は、画像中のノイズを低減するためのニューラルネットワークをトレーニングする方法を提供する。この方法は、
複数の入力画像を撮像装置から取得するステップと、
前記入力画像のサブセットを識別するステップと、を含み、入力画像のサブセットの各入力画像が、当該サブセットのその他の入力画像と同一の対象物を表す。前記方法は、さらに、
複数のターゲット画像を生成するステップを含み、1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成される。前記方法は、さらに、
複数のトレーニングペアを生成するステップを含み、1つのトレーニングペアが、
前記ターゲット画像のうちの1つと、
トレーニング画像と、を含み、当該トレーニング画像は、前記ターゲット画像のうちの前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいている。前記方法は、さらに、
前記複数のトレーニングペアを用いてニューラルネットワークをトレーニングするステップを含む。
【0011】
このようにしてトレーニングされた前記ニューラルネットワークは、ノイズが多い画像(ノイジー画像)を、対応する、ノイズが低減された画像(ノイズ低減画像)にマッピングできるため、ノイズを低減できる。前記ニューラルネットワークは、トレーニング画像(撮像装置により実際に作成された画像と、それらのノイズ低減バージョンであるターゲット画像と、に基づいている)を使用してトレーニングされるため、前記ニューラルネットワークは、撮像装置の特性と、撮像装置が発生するノイズを学習でき、それに応じて、検出されたノイズを除去できる。本明細書に開示する技術を使用する場合、発生するノイズの詳細(例えば、標準偏差など)を事前に確立しておく必要はない。なぜなら、トレーニング画像自体が、関連するノイズを表すからである。
【0012】
前記トレーニング画像が1つ以上の入力画像に基づくのであれば、入力画像の前記サブセットの前記入力画像の全てではないが前記1つ以上を組み合わせることにより前記トレーニング画像のノイズを低減するように前記トレーニング画像は生成され得る。これは、前記ネットワークが、部分的に低減されたノイズを含むトレーニング画像を有するペアから学習することを可能にする。この方法により、ニューラルネットワークトレーニングの結果が著しく改善される。
【0013】
前記複数のトレーニング画像を生成する前記ステップは、様々な番号の入力画像に基づいてトレーニング画像を生成するステップを含み得る。これは、様々な番号の入力画像を組み合わせて前記トレーニング画像を得ることにより行われる。
【0014】
前記複数のトレーニングペアは、入力画像の第1の番号Kに基づいた第1のトレーニング画像を含む第1のトレーニングペアと、入力画像の第2の番号Kに基づいた第2のトレーニング画像を含む第2のトレーニングペアとを含み、前記第1の番号Kは前記第2の番号Kとは異なる。これらの異なる番号の画像を組み合わせることで、前記トレーニング画像のノイズが可変レベルになる。前記第1のトレーニング画像は、前記第2のトレーニング画像とは異なる平滑化レベルを有するであろう。これにより、ニューラルネットワークのトレーニング結果が改善される。
【0015】
前記複数のトレーニングペアは、異なるトレーニング画像は異なる番号の入力画像に基づいているがターゲット画像は同一であるトレーニングペアを含み得る。こうして、異なるレベルのノイズをトレーニングするために、複数のトレーニングペアにおいて同一のターゲット画像が現れ得る。これにより、トレーニング結果が改善される。
【0016】
N個の入力画像の各ターゲット画像、及び、当該ターゲット画像の対応するサブセットに対して、トレーニング画像が、N個の入力画像の前記サブセットのKに基づいて生成される。Kは、Nよりも小さい全ての正の整数値である。本発明者は、これがニューラルネットワークのトレーニング結果を改善し得ることを確認した。
【0017】
任意の値Kに対して、N個の入力画像の前記サブセットからのK個の入力画像の1つ以上の可能な選択が存在するならば、トレーニング画像が、N個の入力画像の前記サブセットからの前記K個の入力画像の1つ以上の選択のために生成され得る。本発明者は、これがニューラルネットワークのトレーニング結果を改善し得ることを確認した。
【0018】
前記入力画像を組み合わせる前記ステップは、組み合わされた前記入力画像の対応する値を平均化するステップを含み得る。これは、前記ターゲット画像及び前記トレーニング画像中のノイズを低減するための有効な方法である。
【0019】
前記方法は、さらに、サブセットの前記入力画像を、前記ターゲット画像及びトレーニング画像を生成する前に空間的に位置合わせするステップを含み得る。これが、前記画像を組み合わせた結果を改善し得る。
【0020】
前記方法は、前記ニューラルネットワークをトレーニングする前に、ノイズを追加するか、又は、前記トレーニング画像の向きを変更することにより前記トレーニング画像を増強するステップを含み得る。これが、前記ネットワークトレーニングの結果を改善し得る。
【0021】
前記入力画像は、光干渉断層撮影、OCTにより取得され得る。本開示にて説明するこの方法は、OCT撮像におけるノイズ低減に特に適している。
【0022】
例えば、入力画像の特定のサブセットの前記入力画像は、単一のCスキャン画像から抽出された複数のBスキャン画像である。これらのCスキャンのBスキャン画像は、スキャン同士間の時間を最小限にして画像を取得するという利点を有する。従って、動き歪みの発生がより少なくなり得、これが、ノイズを低減するように画像を組み合わせることを容易にする。さらに、Bスキャンの取得に加えて、又は、Bスキャンの代わりに、Mスキャンを取得することも可能である。本明細書において、MスキャンはBスキャンと同一スポットで経時的に繰り返される。Mスキャンを組み合わせることにより、画像中のノイズを低減し得る。
【0023】
例えば、前記入力画像は、網膜の少なくとも一部を表し得る。本開示に記載するこの方法は、網膜撮像、詳細にはOCT網膜撮像におけるノイズ低減に特に適している。
【0024】
異なるサブセットの前記入力画像は、異なる被検体における同一タイプの組織又は同一タイプの器官の画像を含み得る。これが、ニューラルネットワークを特定の種類の組織又は器官の画像に特化することを可能にする。こうして、ノイズを対象物自体の実際の特徴と区別することが、より容易になる。同様に、異なるサブセットの前記入力画像が、同一タイプの異なる対象物の画像を含み得る。
【0025】
前記複数の入力画像を取得するステップは、複数の異なる撮像装置から入力画像を取得するステップを含み得る。これらの画像を用いることで、様々な撮像装置からの画像によるトレーニングペアを作成可能である。こうして、前記ニューラルネットワークにより装置が汎用化され得る。複数の装置からの画像を用いたトレーニングペアでのトレーニングが、基盤である画像構造に追加の情報を見出すことを補助し得る。これは、前記様々な撮像装置が異なる性能を有する場合にも当てはまる。例えば、組織透過性がより優れた装置からのサンプルを追加することで、前記ニューラルネットワークが、組織透過性が劣る装置の深部組織特性を改善することを可能にする。
【0026】
前記方法は、前記トレーニング後に、撮像装置から、前記ニューラルネットワークへの入力画像としての新しい画像を受信して供給し、前記ニューラルネットワークからの出力画像を得るステップを含み得る。これは、前記トレーニングされたニューラルネットワークが任意の画像中のノイズを低減するために適用され得るステップである。
【0027】
本発明の別の態様によれば、撮像装置のノイズ低減装置が提供される。この装置は、
撮像装置から画像を受信するための入力ユニットと、
前記画像を、トレーニングされたニューラルネットワークに従って処理して出力画像を生成するための制御ユニットと、を備え、
前記ニューラルネットワークは、複数の入力画像を撮像装置から取得するステップと当該入力画像のサブセットを識別するステップとにより作成され、入力画像のサブセットの各入力画像が、当該サブセットのその他の入力画像と同一の対象物を表す。前記ニューラルネットワークは、さらに、複数のターゲット画像を生成するステップにより作成され、1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成される。前記ニューラルネットワークは、さらに、複数のトレーニングペアを生成するステップにより作成され、1つのトレーニングペアが、前記ターゲット画像のうちの1つと、トレーニング画像と、を含み、当該トレーニング画像は、前記ターゲット画像のうちの前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいている。前記ニューラルネットワークは、さらに、前記複数のトレーニングペアを用いて前記ニューラルネットワークをトレーニングするステップにより作成される。
【0028】
本発明の別の態様によれば、画像中のノイズを低減するためのニューラルネットワークをトレーニングするシステムが提供される。このシステムは、
複数の入力画像を撮像装置から取得するための入力ユニットと、
制御ユニットと、を備え、当該制御ユニットは、以下のように構成されている。すなわち、
前記入力画像のサブセットを識別する。入力画像のサブセットの各入力画像は、当該サブセットのその他の入力画像と同一の対象物を表している。
複数のターゲット画像を生成する。1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成される。
複数のトレーニングペアを生成する。1つのトレーニングペアが、
前記ターゲット画像のうちの1つと、
トレーニング画像と、を含む。当該トレーニング画像は、前記ターゲット画像のうちの前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいている。前記制御ユニットは、さらに、
前記複数のトレーニングペアを用いてニューラルネットワークをトレーニングするように構成されている。
【0029】
当業者は、上記の特徴を、有用であると考えられる任意の方法で組み合わせ得ることを理解するであろう。さらに、方法に関して記載した改変及び変更を、装置及び/又はコンピュータプログラム製品を実現するために適用することが可能であり、また、装置に関して記載した改変及び変更も同様に、方法及びコンピュータプログラム製品に適用可能である。
【図面の簡単な説明】
【0030】
以下に、本発明の態様を、図面を参照しつつ、例を用いて説明する。図面は概略的であり、縮尺通りに描かれていない場合がある。図面全体を通じて、類似のアイテムは同一の参照番号で示され得る。
【0031】
図1】トレーニングデータセットを準備し、ニューラルネットワークをトレーニングしてニューラルネットワークを適用する方法のフローチャートである。
図2】ニューラルネットワークをトレーニングする方法のフローチャートである。
図3】幾つかのノイズ除去方法の比較を示している。
図4】ノイズ低減装置のブロック図である。
図5】様々なOCTスキャン及びそのタイリングの例を示している。
図6A】U字型構造のネットワーク(Uネット)の図である。
図6B図6Aに示した入力ブロック、出力ブロック、ブロックD及びブロックuの内容を示す図である。
【発明を実施するための形態】
【0032】
添付図面を参照して、幾つかの例示的な実施形態を、より詳細に説明する。
【0033】
詳細な構造及び要素などの説明において開示する事項は、例示的な実施形態の包括的な理解を補助するために提供される。従って、これらの具体的に定義された事項が存在せずとも例示的な実施形態を実行できることは明らかである。また、公知のオペレーション又は構造も、それらの不要な詳細により説明が曖昧になる場合があるため、詳細には説明しない。
【0034】
本開示の一態様によれば、画質を、OCTスキャンで符号化された構造情報を損なわずにスペックルノイズを除去することにより向上させ得る。本開示によれば、ニューラルネットワークが、各タイプの組織に対応する特定のスペックルパターンをバックグラウンドノイズから区別するように「学習」(“learn”)し、組織に関する情報を維持したままノイズを除去できる。また、本明細書に開示する解決方法は、取得した画像のノイズを低減するためにほぼリアルタイムで実行されてもよく、臨床設定に関連付けられる。
【0035】
本開示の一態様によれば、ノイズ低減の課題は、教師付き機械学習タスクとして扱われ、非線形変換関数f(I)→Iを学習しようとするものである。この変換関数は、ノイジーな/破損した画像Iを、ノイズ除去された/クリーン画像Iにマッピングする。
【0036】
本開示の一態様によれば、データセットが、教師付きトレーニングのための必要な情報を捕捉するために、例えばOCT画像に基づいて慎重に準備される。このデータセットは、特定のプロトコルを使用して取得されて特定の方法で後処理されるため、それぞれ、ノイジー画像とクリーン画像とのペア{I,I}を含む。
【0037】
一般的に発生する画像変化に対する不変性を得るために、各{I,I}ペアを、幅広い数学的変換のセットを使用して増強することが可能である。
【0038】
本開示の態様によれば、高次の非線形変換関数fが、畳み込みニューラルネットワークを{I,I}ペアで、収束するまでトレーニングすることにより決定される。
【0039】
図1は、画像中のノイズを低減するためにニューラルネットワークをトレーニングする方法のフロー図を示す。トレーニングデータセットは、ニューラルネットワークのトレーニングを成功させるための重要な要素である。ステップ101~106は、トレーニングデータセットの準備に関するものであり、ステップ107は、準備されたトレーニングデータセットを使用したニューラルネットワークの実際のトレーニングに関する。
【0040】
この方法は、ステップ101にて、複数の入力画像を取得することにより開始する。このステップは、センサを用いて画像データを測定するために画像検出デバイスを動作させることを含み得る。また、ステップ101は、画像再構成技術、例えば、コンピュータ断層撮影又は関連技術を実行して入力画像を取得することを含み得る。類似のタイプの対象物の様々な例の画像を取得し得る。例えば、異なる被検体の網膜が、類似のタイプの対象物と見なされ得る。同一の被写体の異なる網膜も、類似のタイプの対象物と見なされ得る。さらに、これらの異なる部分が類似の画像特性を有する場合、同一の対象物の異なる部分の画像が取得され得る。幾つかのアプリケーションにおいて、各対象物に対して同一の相対位置にある全ての画像を取得する必要がある。他のアプリケーションにおいては、対象物のどの部分を画像化するかは、それほど重要でない。これは、試行錯誤により判断され得る。
【0041】
画像は、光干渉断層撮影(OCT)画像であり得る。これらのOCT画像は、その空間領域における対象物を表すために再構築されている場合がある。対象物のタイプは、網膜、例えば、ヒトの網膜であり得る。複数の異なる被検体(例えば、人々)の網膜を撮像して、異なる被験者の画像を取得できる。
【0042】
また、例えば疾患の進行を検出するために、測定同士の間をかなり遅らせて同一被検体を複数回撮像してもよい。このような場合、これらの取得画像は、異なる対象物の画像であると見なされ得る(取得の間に対象物が変化した可能性があるため)。
【0043】
また、ステップ101aにおいて、画像はサブセットにグループ化され得る。これは、上記で定義したような同一の対象物の画像が共に同一のサブセットにグループ化されるように行われる。これが、次の処理ステップの実行を容易にする。
【0044】
その他の実施形態は、OCT画像の代わりに、例えば超音波画像又はCT画像を含み得る。
【0045】
ステップ102において、同一の対象物に対応する画像のサブセットの画像を互いに位置合わせし得る。このステップは、動き補償ステップであり得る。同一の対象物の連続画像が、わずかに異なる位置から取得される場合があり、或いは、対象物が、連続画像の間に移動した場合もある。位置合わせステップは、このような動きのいずれをも補償するために画像を互いにマッチングさせる。このステップは任意選択的である。なぜなら、幾つかの実施形態においては動きの量を無視できるからである。ステップ102の出力は画像のセットであり、同一の対象物の異なる画像が、互いに対して動き補償される。すなわち、各サブセット内の画像は、そのサブセット内のその他の画像に対して動き補償される。
【0046】
ステップ103において、外れ値を拒否するための任意選択的なステップが実行され得る。例えば、動き補償が失敗した場合、又は、動き補償後にサブセット内の画像が大きく異なり過ぎている場合、画像は破棄される。或いは、画像自体が異常特性を有する場合(暗すぎる、非現実的なスパイクなど)、そのような画像は破棄され得る。ステップ103の出力は、動き補償と、外れ値の破棄によるクリーニングとの両方が行われたデータセットである。ステップ101とステップ102との間に、代替的な又は追加の外れ値拒否ステップを実行してもよいことに留意されたい。
【0047】
ステップ104において、画質が改善された画像が、既存の画像から生成される。例えば、同一の対象物を表す画像の各サブセットの画像を平均化するか、或いはそれ以外の方法で組み合わせることにより、画質が改善された画像を取得できる。各サブセットにおける画像が動き補償されているため、画像の平均化によりノイズを低減でき、尚且つ、実際の組織情報が向上する。これらの改善された画質の画像を、本文以下「ターゲット画像」(“target images”)と称する。
【0048】
ステップ105において、ノイズのレベルが異なる様々な画像が生成される。これは、画像の各サブセットからの様々な個数の画像を平均化するか、或いはそれ以外の方法で組み合わせることにより実行される。すなわち、画像のサブセットがN個の画像を有する場合、N平均化画像(サブセット内の全ての画像の平均)がターゲット画像となる。しかし、トレーニング画像を構成するのは、N個未満の画像の平均画像である。任意の個数の画像Kを平均化でき、K=1からK=N-1である。また、Kの各値に対して、N個の画像のサブセットからの、K個の画像の複数の可能な選択がある。これら全ての選択により、異なるトレーニング画像が作成される。従って、これらの全ての選択を用いて、多くのトレーニング画像を生成できる。幾つかの実施形態において、Kの全ての値(1~N-1)が使用され、可能な限り多くのトレーニング画像を生成するために、K画像の全ての可能な選択が使用される。或いは、どの可能性が実際に使用されるべきかに関して、幾つかの選択が行われる。例えば、Kの任意の値に対する選択の個数が、ランダムな選択の所定の個数に限定されてよい。或いは、Kの全ての値を使用せずに、Kの特定の値のみを使用してもよい。例えば、奇数値K(K=1,3,5,…、K<N)、又はKの3番目ごとの値(K=1,4,7,…、K<N)を使用してもよい。組み合わされる画像の選択に関する他の選択は、当業者には明らかであろう。本発明の例を、画像の平均化に関して詳述したが、その他の種類の組合せ(中央値など)も、ステップ104及びステップ105の両方で可能であることに留意されたい。
【0049】
ステップ105の簡略版において、各トレーニング画像は、画像のサブセットの入力画像の全てにではなく、少なくとも1つに基づく。例えば、各ターゲット画像に対して作成され得るトレーニング画像は1つのみである。すなわち、単一の入力画像(K=1)のみをトレーニング画像として使用し得る。従って、Kの様々な値を省き得る。
【0050】
ステップ106において、ノイジー画像とノイズ除去画像とのペアが生成される。各ペアは、トレーニング画像とターゲット画像とを含む。1つのペアのトレーニング画像とターゲット画像とは、対象物を表す画像の同一のサブセットに基づいている。ステップ105において、各サブセットに対して複数のターゲットオブジェクトが作成されたため、同一のターゲット画像が複数の異なるペアに含まれることになる。本文以下、これらのペアを「トレーニングペア」(“training pair”)と称する。
【0051】
ステップ107において、ニューラルネットワークが、トレーニングペアを使用してトレーニングされる。このために、適切なニューラルネットワークトポロジ及びトレーニングプロセスが使用され得る。ニューラルネットワークへの入力はトレーニング画像であり、ターゲット出力は、トレーニング画像に対応するターゲット画像である。ステップ107の実行例が図2に示されている。
【0052】
トレーニングプロセスが完了したならば、画像中のノイズを低減するためにニューラルネットワークを適用してもよい。このために、ステップ108に示されているように、新しい画像が取得されたときに画像をニューラルネットワークに入力できる。ニューラルネットワークの出力が、ノイズ低減画像として使用され得る。
【0053】
図2は、本開示で説明したように準備されたトレーニングデータセットを使用してニューラルネットワークをトレーニングする方法を示している。この図が例示的な例として提供されているに過ぎないことを理解されたい。ニューラルネットワークをトレーニングするためのその他のスキームが当業者に公知であり、それらを用いることも可能である。
【0054】
ステップ201において、n個のトレーニングペアが、利用可能なトレーニングペアからランダムに選択される。各トレーニングペアは、ノイジー画像Snoisy(トレーニング画像とも称する)と、ノイズ除去画像Sdenoised(ターゲット画像とも称する)とから構成される。適切な個数n(nは、利用可能なトレーニングペアの個数よりも小さい)が試行錯誤により決定され得る。
【0055】
ステップ202において、ランダムに選択されたトレーニングペアのトレーニング画像がニューラルネットワークに入力される。これは、
[式1]

で表されることができ、FCNNはニューラルネットワークを示す。ニューラルネットワークFCNNは、畳み込みニューラルネットワーク、又は、別のタイプの教師付き学習ニューラルネットワークであり得る。
【0056】
ステップ203において、誤差関数が決定される。誤差を決定するために、ニューラルネットワークの各出力
【数1】

が、対応するターゲット画像Sdenoisedと比較される。誤差値は、例えば、二乗差の合計として決定され得る。例えば、画像の各ピクセル又はボクセル対して二乗差が決定され得る。これらの二乗差が加算され得る。このプロセスは、ランダムに選択されたn個の画像の全てに対して繰り返され得る。n個の画像に対して補正をするためには、全ての二乗差の合計を計算してnで割ればよい。これにより、以下の例示的な
[式2]

が得られ、式中、Eは、決定された誤差値である。
【0057】
ステップ204において、ニューラルネットワークのパラメータは、誤差値Eが低減されるように適合され得る。このステップは、逆伝搬プロセスにより実行され得る。このプロセス自体は当技術分野で公知である。
【0058】
ステップ205において、プロセスが収束したかどうかがテストされる。これは、誤差値Eを所定の閾値と比較することにより実行され得る。或いは、誤差値Eが減少する速度を追跡し、減少速度が遅くなっているならばプロセスが収束したと判断し得る。或いは、所定の繰り返し回数後にプロセスが収束したと判断され得る。プロセスが収束していない場合、プロセスはステップ201から繰り返される。プロセスが収束したならば、プロセスはステップ206で終了し、結果として得られるニューラルネットワークが、将来使用するために記憶され得る。
【0059】
本明細書で開示する技術は、高レベルで、変換関数fの有効な表現を学習するためにOCT画像のまばら性(スパーシティ)(すなわち、特定のサンプルの生じ得るOCTフットプリントの総数が、生じ得る画像の総数よりもはるかに少ないという事実)を利用することを可能にする。例えば、人間の網膜のOCTスキャンは、非常に特異的な層状構造を、病理学的に高度な眼の場合(すなわち、硝子体液が網膜の上にあり、脈絡膜がその下にある)でも明確にする。十分な個数の代表的な網膜スキャンでCNNをトレーニングすることにより、ノイジーIスキャンから、スペックルノイズを有さない、又はスペックルノイズが低減された、下層構造の下層のクリーン画像Iへの変換関数を学習できる。生じ得る有効なI画像の個数は、生じ得るノイジーIスキャンの個数よりも少ないため、この変換関数を、代替的に、圧縮係数をCNNの構造及び重みにエンコードした圧縮ストラテジとみなし得る。
【0060】
教師付き学習により、特定のサンプルのOCT構造に関する事前情報を抜き出してCNNに与え得る。{I,I}トレーニングデータセットは、CNNがノイジーサンプルのみ又はクリーンサンプルのみであれば可能ではないであろう変換関数f(I)→Iを発見することを可能にする。データセットの増強により、CNNは、{I,I}の個数又は必要な入力画像の個数を扱いやすいように保ったままで、変換関数に関する不変式を学習できる。最後に、CNNの使用により、(a)確率的勾配降下法を用いて、fの有効な高パラメータ近似値を見つけ、(b)トレーニングデータセットを、様々な装置から取得した様々な被検体の類似画像に一般的に使用し、(c)最新のGPUアクセラレーションを使用して、ほぼリアルタイムのパフォーマンスを達成する。
【0061】
本明細書に開示する技術は多くの利点を有する。以下の段落において、幾つかの特性及び考えられる利点について、より詳細に説明する。
【0062】
取得時間。網膜OCTの場合、この技術は、20回~50回(サンプル及び撮像装置に依る)の平均化に相当するSNRを達成する。これにより、本質的に、同一の画質に対して取得時間を20倍~50倍短縮でき、又は、同一の取得時間においては画質を向上させ得る。
【0063】
サンプルの一般化。本発明者には、トレーニングデータ(特定のサンプル位置の2次元Bスキャンを含む)でのトレーニングが、類似のサンプルの完全な3次元Cスキャンのノイズ除去も可能にすることが分かった。例えば、網膜のBスキャンでのトレーニングが、その他のいずれの網膜のCスキャンのノイズ除去も可能にする。
【0064】
装置の汎用化。本発明者らは、特定の装置のサンプルでのトレーニングにより、類似の特性(ボクセルのサイズや解像度など)を有するその他の装置により作成されたサンプルの画像のノイズ除去ができることを発見した。複数の装置の組み合わされたサンプルでのトレーニングが、基盤であるOCT構造に追加情報を見出すことを補助する(例えば、より良好な組織透過性を有する装置によるサンプルを追加すると、組織透過性がより低い装置の深部組織特性が向上し得る)。
【0065】
パフォーマンス。従来の反復アプローチとは異なり、本明細書で開示するニューラルネットワークのアプローチは、CNNを通過する単一の「前方」(“forward”)パスを使用して画像をノイズ除去できる。広範なGPUアクセラレーションと組み合わせることで、ほぼリアルタイムのパフォーマンスを現在のシステムにて達成できる。
【0066】
融通性。この方法は、適切なデータセットがあれば、あらゆる種類の生物学的組織(例えば、網膜、角膜、皮膚、脳組織、歯、動脈/血管若しくは結腸)又は非生物学的サンプル(例えば、塗料、金属構造物、半導体)をノイズ除去するために使用され得る。実際、この技術は、OCTにだけでなく、スペックルノイズを被るあらゆる撮像モダリティ(例えば、X線、コンピュータ断層撮影(CT)、磁気共鳴画像(MRI)、超音波、若しくは、蛍光/自家蛍光画像)に適用され得る。
【0067】
コスト節減。本明細書で開示する技術は、高性能の医療機器を凌ぐ性能を発揮できるOCT装置の構築を、わずかな費用で可能にし得る。
【0068】
データ圧縮。スペックルノイズを除去することにより、取得した1つのBスキャンあたりの記憶容量の実質的な低減を、可逆圧縮を使用した場合でも達成できる。例えば、本発明者は、ロスレスPNG圧縮を使用した場合、3倍の圧縮率を達成できた。
【0069】
以下に、トレーニングプロセスの例を詳細に開示する。しかし、本明細書で開示する詳細は、本発明の理解の補助のためものに過ぎない。これらの詳細は、本開示の範囲を限定することを意図されていない。また、以下に説明される技術は、OCT撮像の特定のアプリケーションに関するものである。しかし、OCTに関して、この技術の代替として別の種類のイメージング技術を用いてもよい。OCT用語において、「Aスキャン」(“A-scan”)とは、レーザビームの直線に沿った特徴を表す1次元画像を意味する。「Bスキャン」(“B-scan”)とは、特定のパス(直線であり得る)に沿ってレーザビームをスキャンすることにより得られる平面又は表面の特徴を表す2次元画像を意味する。「Cスキャン」(“C-scan”)とは、レーザビームを2次元パターンで走査することにより得られる3次元画像を意味する。図5(a)はBスキャンを示しており、Y軸が、光ビームに沿った方向を示し、X方向が、走査面に沿った走査方向を示している。図5(b)は、Y方向にて取得された複数のタイルを構成して単一のBスキャンを形成する方法を示している。図5(b)に示されているように、タイリングは幾つかの異なる方法で実行され得る。例えば、図5(b)の右側1’)に示されているように、タイルはX方向においては一部のみしかカバーできないが、Y方向においては元の画像の全体をカバーできる。図5(b)の左側に示されているように、例えばY方向に沿った4つのタイル1),2),3),4)を取得するために、タイリングをX方向及びY方向の両方に沿って実行してもよい。例えば、この方法で正方形のタイルを作成できる。図5(c)はCスキャンを示しており、検出器はZ方向もスキャンする。本開示の全体を通じて、入力画像、トレーニング画像、及びターゲット画像に関して説明するが、これらの画像が、より大きい画像のタイルであってもよい。
【0070】
ニューラルネットワークのトレーニングは、同一サンプル内のノイジー画像Iとクリーン画像Iとから成るペア{I,I}を含むデータセットの生成を含む。OCTの場合、これらの画像は、例えばBスキャン画像であり得る。概念的クリーンIBスキャンが、同一サンプル位置のノイジーIBスキャンのセットのほぼ平均であるとみなされる。
【0071】
高品質の平均化されたBスキャンを得るために平均化され得るノイジー画像の適切なセットを取得するために、幾つかの様々な技術を使用できる。標準的な市販のOCT装置では、I(平均化されていない単一のBスキャン)又はI(装置に固有の独自のアルゴリズムを使用して後処理された単一のn平均化Bスキャン)のいずれか一方しか提供できず、同時に両方では提供できない。そのため、本発明では、{I,I}ペアを生成するために必要なデータを取得するための2つの代替的な方法を開示する。
【0072】
第1の選択肢として、n平均化IBスキャン及び個々のIBスキャンの両方を同時に提供できるカスタムOCT装置を使用することが可能である。例えば、同一サンプル位置の10のBスキャンを高速度の繰り返しで取得することにより10個のIBスキャンが得られ、これらを平均化することで、対応する高品質のIBスキャンが得られる。
【0073】
或いは、平均化されていない高密度のCスキャンを取得することも可能である。この場合、Cスキャンの個々のBスキャンがノイジーI画像を形成し、Cスキャンのn平均化BスキャンのブロックがクリーンI画像を形成する。この場合、nは、異なるサンプル位置のBスキャンの平均化による動きぼやけ(モーションブラー)を回避するために十分に低値であることが好ましい(例えばn=3~5)。
【0074】
さらには、高度に平均化されたBスキャンをクリーンI画像として取得し、ノイジーI画像を、加法性又は乗法性ノイズを使用して合成することもできる。これは、基本的なスペックル除去を可能にするが、この方法では画質が低下する可能性もある。
【0075】
ネットワークを、ノイズを低減させるようにトレーニングするために、以下のステップを実行できる。
【0076】
1.Bスキャンを位置合わせする。Bスキャンを位置合わせする例示的な方法が、アポストロポロス(Apostolopoulos)らの特許出願に開示されている(すなわち、網膜の曲率及び全てのBスキャンを、強度ベースのレジストレーション(位置合わせ)を使用して平坦化する)。
2.位置合わせ後、n画像のセットを平均化して、クリーンIサンプルを構成する。
a.有用な例として、10回のBスキャンが同一の場所を示すデータセットが利用可能な場合、n=10が適切である。
b.BスキャンがCスキャンから抽出される場合、有用な例として、n=5が、平均画質と動きぼやけとの妥協点として良好である(個々のBスキャンが、より大きいCスキャンの異なる部分を表すため)。幾つかのアプリケーションにおいて、Cスキャンのデータセットの密度が非常に高いため、y軸上でのn=5が0.0586μmに等しくなり、これにより、動きぼやけ及びアーチファクトがかなり排除される。
3.n平均化された各グラウンドトゥルースに対し、その完全な集合である、m=1…n平均化ノイジーIサンプルを生成する。例えば、n=3であるクリーンIサンプルのために、ノイジーIサンプルの完全な集合は以下を含む。すなわち、
a.m=1のサンプルが3個
b.m=2のサンプルが3個
c.m=3のサンプル(「グラウンドトゥルース」画像)が1個
d.{I,I}ペアは合計で6個。
4.データセットを増強する。以下の増強機能の各々は例であり、全ての実施例に必要なものではないことに留意されたい。また、以下に列挙するものに加えて、その他の増強を使用してもよい。
a.ランダムな水平反転(トレーニング画像及びターゲット画像の両方に適用される)。
b.ランダムなガウスノイズ(トレーニング画像に適用され、ターゲット画像には適用されない)。
c.ランダムなレイリーノイズ(トレーニング画像に適用され、ターゲット画像には適用されない)。
d.x軸及びz軸におけるランダムなガウスぼかし(トレーニング画像に適用され、ターゲット画像には適用されない)。
e.ランダムなシフト及びせん断(トレーニング画像及びターゲット画像の両方に適用される)を、ロバスト性を向上させるために適用できる。
5.図5(b)に示されているように、画像を、任意選択的にタイルに分割し得る。x軸に沿ったタイリングにより、より良好なトレーニング結果が得られ、また、z軸に沿ったタイリングよりも、アーチファクトがより少なくなる(なぜなら、zタイルは、アーチファクトを生じさせる純粋なノイズを含む場合があるからである)。幾つかの実施形態において、タイリングは、画像が正方形であるように、すなわち、タイルの各方向のピクセルの数が等しいか又はほぼ同一であるように行われる。
【0077】
ニューラルネットワークとして、畳み込みニューラルネットワークを使用してもよい。例えば、U字状ネットワーク(「Uネット」)である。生物医学的画像のセグメンテーションのためのU字状のディープ畳み込みニューラルネットワークが、例えば、レンネバーガー・オー(Ronneberger, O)らによる「Uネット:生物医学的画像のセグメンテーションのための畳み込みネットワーク」(国際会議MICCAI(Medical Image Computing and Computer Assisted Intervention)(2015年、Springer、LNCS、Vol.9351:234~241))から公知である。この種のネットワークを、ノイズ低減ニューラルネットワークを作成するために、本明細書に開示したデータセットを用いて適応及びトレーニングさせ得る。ネットワークアーキテクチャの好適な例の図が図6Aに示されている。このアーキテクチャは、畳み込み、線形ユニット、プーリング層及びアップサンプリング層を含む。図6Bは、図6aの図で使用されているブロックD、ブロックU、入力ブロック、及び出力ブロックの内容の例を示している。その他の実施形態において、これらの代わりに、その他のタイプ及びアーキテクチャのニューラルネットワークを使用してもよい。
【0078】
例えば、画像がN×Mピクセルを有し、各ピクセルに1つの強度値が関連付けられている場合、ニューラルネットワークは、N×M入力ユニット及びN×M出力ユニットを有し得、1つの入力ユニットが(トレーニング画像の)各ピクセル値に対応し、1つの出力ユニットが(ターゲット画像の)各ピクセル値に対応している。より多数のピクセル値を各ピクセルが利用可能な場合(例えば、異なるカラーチャネル)、ニューラルネットワークに、より多数の入力ユニット及び出力ユニットを設けることができ、従って、ニューラルネットワークの画像の各ピクセル値に1つの入力ユニットを設け、出力画像の各ピクセルに1つの出力ユニットを設けることが可能になる。異なる解像度の画像をサポートするためには、ニューラルネットワークを適用する前又は後にリサンプリングステップを実行して、画像の望ましい解像度を、利用可能な入力/出力ユニットの数に適合させる。
【0079】
本明細書に開示する技術により、ニューラルネットワークは、手元の対象物の種類、例えば異なる層の網膜の構造を学習し、OCTスペックルパターンから最も可能性の高い構造を推測することで欠落情報を再構築できる。その結果、画質が劇的に向上し、スペックルノイズがほぼ完全に除去される。その結果、実際、モーションアーチファクト及び動きぼやけが全く無くなるため、同等のN平均化スキャンよりも優れている場合がある。
【0080】
単一のBスキャン位置でのトレーニングは、病変部が含まれている場合でも、完全なCスキャンをノイズ除去するのに十分な情報を提供すると思われる。しかし、トレーニングセットに、病変部に関するグラウンドトゥルースを追加すると、結果の質の向上が期待できる。
【0081】
トレーニング画像をランダムな量のガウスノイズ及びレイリーノイズにより破損すると、トレーニングプロセス及び得られる質の大幅な向上を補助するように見える(すなわち、ノイズが少ない、より滑らかな外観になる)。
【0082】
トレーニングサンプルをガウスブラーにより破損すると、より良好に画成された形状が得られるかも知れない。これにより、画像全体がわずかにぼやける場合もある。
【0083】
多くの異なる値m(m<n)に対してm平均化スキャンを使用すると、画質が大幅に向上し得る。
【0084】
解像度又はヒストグラムに関する撮像特性が大きく異なる装置にニューラルネットワークを適応させるためには、再トレーニングが有用であろう。
【0085】
ニューラルネットワークは、メモリ及び計算量の両方が多い。上記の構成を使用することで、トレーニングをミニバッチサイズ(例えば、4)で行うことができ、また、2~4Bスキャン/秒の推論速度を、Nvidia GeForce(エヌビディア・ジーフォース)GTX1080(アメリカ合衆国、カリフォルニア州、サンタクララのエヌビディア(Nvidia)社製)を用いて達成できる。
【0086】
より少ないレベル又はより少ないパラメータのネットワーク構成は、ミニバッチ(例えば、8又は10のBスキャン)で一度にトレーニングされることができ、対応する推論比は、約8Bスキャン/秒~16Bスキャン/秒である。
【0087】
タイルベースの方法で達成される画質は、画像全体の処理により得られる質よりも低いようである。その理由は、より大きいコンテキストの欠如であろう。画像全体を使用する場合、画像中に見える構造は、ニューラルネットワークにより互いに関連付けられ得る。例えば、脈絡膜構造は常に網膜の下に現れる。タイルベースの適切な妥協案は、スキャンのz軸全体をカバーする薄い鉛直タイルを含むことであろう。これは特に、OCT及び網膜撮像に当てはまるが、その他の幾つかのタイプの材料及び組織におけるその他のOCT結果にも当てはまる。
【0088】
再構成の画質を向上させるために、3Dベースの方法を使用してもよい。これは、3D畳み込み又はマルチチャネル2D畳み込みを含み得、複数の隣接する入力Bスキャンを組み合わせて単一の出力にする。実際、複数のチャネルを使用すると、少ないメモリコストで画質が向上する。このアーキテクチャの例は、上述の例で示した構造物と類似のベースライン構造で構成されるが、隣接するBスキャンを含む3次元への畳み込み(conv)を増大させる。
【0089】
インビボ撮像の場合、単純な平均化を行うと、モーションアーチファクトにより画像がぼやける場合がある。より良好な結果を得るためには、最初にn個のBスキャンの各々を、それら同士で(例えば、相互相関又はテンプレートマッチングを介して)、又は共通の参照画像にアライメント又は位置合わせする。共通の参照画像による位置合わせは、眼底をアイトラッカー(例えば走査型レーザー検眼鏡(SLO)又は通常の赤外線カメラ)を使用して撮像し、検出された目の動きを用いて各Bスキャンの位置を修正することにより実現できる。
【0090】
図3は、幾つかのノイズ除去方法の比較を示している。図3aは、ノイズ除去が行われていない元の画像を示している。図3bは、ウェーブレットを使用したノイズ低減後の画像を示している。図3cは、ブロックマッチング及び3Dフィルタリング(BM3D)法を使用したノイズ低減後の画像を示している。図3dは、20回の平均化によるノイズ低減後の画像を示している。図3eは、本開示による方法を使用したノイズ除去後の画像を示している。
【0091】
図4は、ニューラルネットワークを使用してノイズを低減できる撮像装置のブロック図である。この装置はメモリ400を備えている。メモリ400は、揮発性若しくは不揮発性メモリ、又は異なるタイプのメモリの組合せを含む、あらゆる種類のメモリデバイス又は記憶媒体を備え得る。メモリ400は、ネットワークの構造及びネットワークのパラメータを含む人工ニューラルネットワークの定義を含み得る。ニューラルネットワークのパラメータは、本開示のその他の場所でより詳細に説明したトレーニング手順により既に計算されている場合もある。トレーニング手順は、撮像装置から複数の入力画像を取得して入力画像のサブセットを識別するステップを含み得、入力画像のサブセットの各入力画像は、そのサブセットのその他の入力画像と同一の対象物を表す。前記トレーニング手順は、さらに、複数のターゲット画像を生成するステップを含み得、1つのターゲット画像が、前記サブセットうちの1つのサブセットの入力画像を、ノイズを低減するために組み合わせることにより生成される。前記トレーニング手順は、さらに、複数のトレーニングペアを生成するステップを含み得、1つのトレーニングペアが、前記ターゲット画像の1つと、トレーニング画像とを含む。このトレーニング画像は、前記ターゲット画像の前記1つに対応するサブセットの前記入力画像の全てにではないが少なくとも1つに基づいている。前記トレーニング手順は、さらに、ニューラルネットワークを、複数のトレーニングペアを使用してトレーニングするステップを含み得る。
【0092】
メモリ400は、さらに、画像データ402を記憶するために使用され得る。これらの画像データは入力ユニット411を介して受信され得、制御ユニット410の制御下でメモリ400に記憶され得る。また、ニューラルネットワーク401の出力、例えば、ノイズ低減された画像データも、メモリ400に記憶され得る。
【0093】
メモリ400は、さらに、プログラムコード403を記憶している。プログラムコード403は、制御ユニット410が幾つかのタスク(例えば、入力ユニット411を介して受信した入力画像の処理)を制御し、ニューラルネットワーク401に画像データを処理させ、ニューラルネットワークにより出力された画像を出力及び記憶するように構成されている。
【0094】
前記撮像装置は、さらに、撮像装置413から画像データを、外部データ記憶システム414を介して受信するための入力ユニット411を備え得る。入力ユニット411は、例えば、有線通信用の通信ポート又は無線通信用のトランシーバを含み得る。
【0095】
前記撮像装置は、さらに、画像を例えばディスプレイ415又は外部記憶システム414に出力する出力ユニット412を備え得る。入力ユニットと同様に、出力ユニットは、通信ポート及び/又は無線通信デバイスを備え得る。1つのハードウェアに入力ユニット及び出力ユニットの両方が実装され得る。
【0096】
外部記憶システム414は、例えば患者ファイルに編成されたデータの記憶及び検索のために構成されたコンピュータサーバを含み得る。
【0097】
ディスプレイ415は、任意のディスプレイ装置、例えばコンピュータモニタを含み得、或いは、コンピュータ及びモニタを含むワークステーションを備え得る。
【0098】
撮像装置413は、特定の測定を実行するように構成されたセンサを含む。適切な撮像装置の例は、光干渉断層撮影(OCT)スキャナ、コンピュータ断層撮影スキャナ、又は磁気共鳴撮像スキャナである。撮像装置413は、画像データを空間ドメイン又は時空間ドメインに再構成するための再構成ユニットを備え得る。撮像装置は、再構成された画像データを外部記憶システム414に出力するか、又は入力ユニット411に直接出力するように構成され得る。
【0099】
制御ユニット410は、システムのコンポーネントを制御し、メモリ400に記憶されているコンピュータコード403を実行して、本明細書で開示される機能を実施できる任意のプログラマブルプロセッサ又はコントローラであり得る。制御ユニット410は、ニューラルネットワーク401のトレーニングを行うように、又は、トレーニング後に、トレーニングされたニューラルネットワーク401を適用することにより新しい画像データを処理するように、プログラムコード403によりプログラムされ得る。
【0100】
その他の実施形態、例えばクラウドベースの実装なども可能である。
【0101】
本発明の幾つか又は全ての態様は、ソフトウェア、特にコンピュータプログラム製品の形態で実装されるのに適している。例えば、トレーニングデータセットを生成するために画像のサブセットを処理する手順に含まれるステップは、コンピュータプログラムで実装されるのに適している。また、ニューラルネットワークのトレーニングプロセスも、コンピュータプログラムで実行され得る。同様に、ニューラルネットワークの、新しい画像への適用も、コンピュータプログラムにより実行され得る。コンピュータプログラム製品は、非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラムを含み得る。また、コンピュータプログラムは、光ファイバケーブル又は空気などの伝送媒体により運ばれる光信号又は電磁信号などの信号により表現され得る。コンピュータプログラムは、コンピュータシステムにより実行されるのに適したソースコード、オブジェクトコード、又は擬似コードの形態を部分的に又は完全に有し得る。例えば、コードは、1以上のプロセッサ又はコントローラを備え得る制御ユニットにより実行可能であり得る。
【0102】
本明細書に記載した例及び実施形態は、本発明を例示するのに役立つのであり、本発明を限定するものではない。当業者は、代替実施形態を、添付の特許請求の範囲及びそれらの均等物により定義されているような本開示の精神及び範囲から逸脱せずに設計できよう。特許請求の範囲において括弧内に記載された参照符号は、特許請求の範囲を限定するものと解釈されるべきでない。特許請求の範囲又は詳細な説明において別個の存在として記載した要素は、記載されている要素の特徴を組み合わせる単一のハードウェア又はソフトウェアの要素として実現され得る。
【0103】
以下の節において実施例を開示する。
1. 画像中のノイズを低減するためのニューラルネットワークをトレーニングする方法であって、
複数の入力画像を撮像装置から取得するステップ(101)と、
前記入力画像のサブセットを識別するステップ(101a)と、を含み、入力画像のサブセットの各入力画像が、当該サブセットのその他の入力画像と同一の対象物を表し、前記方法が、さらに、
複数のターゲット画像を生成するステップ(104)を含み、1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成され、前記方法が、さらに、
複数のトレーニングペアを生成するステップ(105)を含み、1つのトレーニングペアが、
前記ターゲット画像のうちの1つと、
トレーニング画像と、を含み、当該トレーニング画像が、前記ターゲット画像のうちの前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいており、前記方法が、さらに、
前記複数のトレーニングペアを用いてニューラルネットワークをトレーニングするステップ(107)を含む、前記方法。
2.前記トレーニング画像が1つ以上の入力画像に基づくのであれば、入力画像の前記サブセットの前記入力画像の全てではないが前記1つ以上を組み合わせることにより前記トレーニング画像のノイズを低減するように前記トレーニング画像を生成するステップをさらに含む、条項1に記載の方法。
3. 前記複数のトレーニングペアが、入力画像の第1の番号Kに基づいた第1のトレーニング画像を含む第1のトレーニングペアと、入力画像の第2の番号Kに基づいた第2のトレーニング画像を含む第2のトレーニングペアとを含み、前記第1の番号Kが前記第2の番号Kとは異なる、条項2に記載の方法。
4. 前記複数のトレーニングペアが、異なるトレーニング画像は異なる番号の入力画像に基づいているがターゲット画像は同一であるトレーニングペアを含む、条項3に記載の方法。
5. N個の入力画像の各ターゲット画像、及び、当該ターゲット画像の対応するサブセットに対して、トレーニング画像が、N個の入力画像の前記サブセットの、Nよりも小さい全ての正の整数値であるKに基づいて生成される、条項1~4のいずれかに記載の方法。
6.任意の値Kに対して、N個の入力画像の前記サブセットからのK個の入力画像の1つ以上の可能な選択が存在するならば、トレーニング画像が、N個の入力画像の前記サブセットからの前記K個の入力画像の1つ以上の選択のために生成される、条項1~5のいずれかに記載の方法。
7.前記入力画像を組み合わせる前記ステップが、
組み合わせた前記入力画像の対応する値を平均化するステップを含み、或いは、
さらに、サブセットの前記入力画像を、前記ターゲット画像及びトレーニング画像を生成する前に空間的に位置合わせするステップ、或いは
さらに、前記ニューラルネットワークをトレーニングする前に、ノイズを追加するか、又は、前記トレーニング画像の向きを変更することにより前記トレーニング画像を増強するステップを含む、条項1~6のいずれかに記載の方法。
8.前記入力画像が、光コンピュータ断層撮影、OCTにより取得される、条項1~7のいずれかに記載の方法。
9.入力画像の特定のサブセットの前記入力画像が、単一のCスキャン画像から抽出された複数のBスキャン画像を含む、条項8に記載の方法。
10.前記入力画像が網膜の少なくとも一部を示す、条項1~9のいずれかに記載の方法。
11.異なるサブセットの前記入力画像が、異なる被検体における同一タイプの組織又は同一タイプの器官の画像を含み、或いは、異なるサブセットの前記入力画像が、同一タイプの異なる対象物の画像を含む、条項1~10のいずれかに記載の方法。
12.前記複数の入力画像を取得するステップが、複数の異なる撮像装置から入力画像を取得するステップを含む、条項1~11のいずれかに記載の方法。
13.さらに、トレーニング後に、撮像装置から、前記ニューラルネットワークへの入力画像としての新しい画像を受信して供給し(108)、前記ニューラルネットワークからの出力画像を得るステップを含む、条項1~12のいずれかに記載の方法。
14.撮像装置のノイズ低減装置であって、
撮像装置から画像を受信するための入力ユニット(411)と、
前記画像を、トレーニングされたニューラルネットワーク(401)に従って処理して出力画像を生成するための制御ユニット(410)と、を備え、
前記ニューラルネットワーク(401)が、複数の入力画像を撮像装置から取得するステップと当該入力画像のサブセットを識別するステップとにより作成され、入力画像のサブセットの各入力画像が、当該サブセットのその他の入力画像と同一の対象物を表し、前記ニューラルネットワーク(401)が、さらに、複数のターゲット画像を生成するステップにより作成され、1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成され、前記ニューラルネットワーク(401)が、さらに、複数のトレーニングペアを生成するステップにより作成され、1つのトレーニングペアが、前記ターゲット画像のうちの1つと、トレーニング画像と、を含み、当該トレーニング画像が、前記ターゲット画像のうちの前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいており、前記ニューラルネットワーク(401)が、さらに、前記複数のトレーニングペアを用いて前記ニューラルネットワークをトレーニングするステップにより作成される、ノイズ低減装置。
15.画像中のノイズを低減するためのニューラルネットワークをトレーニングするシステムであって、
複数の入力画像を撮像装置から取得するための入力ユニット(411)と、
制御ユニット(410)と、を備え、当該制御ユニット(410)が、
前記入力画像のサブセットを識別する(101a)ように構成されており、入力画像のサブセットの各入力画像が、当該サブセットのその他の入力画像と同一の対象物を表しており、前記制御ユニット(410)が、さらに、
複数のターゲット画像を生成する(104)ように構成されており、1つのターゲット画像が、前記サブセットのうちの1つのサブセットの前記入力画像を、ノイズを低減するように組み合わせることにより生成され、前記制御ユニット(410)が、さらに、
複数のトレーニングペアを生成する(105)ように構成されており、1つのトレーニングペアが、
前記ターゲット画像のうちの1つと、
トレーニング画像と、を含み、当該トレーニング画像が、前記ターゲット画像の前記1つに対応する前記サブセットの前記入力画像の全てにではないが少なくとも1つに基づいており、前記制御ユニット(410)が、さらに、
前記複数のトレーニングペアを用いてニューラルネットワーク(401)をトレーニングする(107)ように構成されている、システム。
図1
図2
図3A
図3B
図3C
図3D
図3E
図4
図5
図6A
図6B