IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 之江実験室の特許一覧

特表2023-550844深層形状学習に基づく肝臓CT自動分割方法
<>
  • 特表-深層形状学習に基づく肝臓CT自動分割方法 図1
  • 特表-深層形状学習に基づく肝臓CT自動分割方法 図2
  • 特表-深層形状学習に基づく肝臓CT自動分割方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-05
(54)【発明の名称】深層形状学習に基づく肝臓CT自動分割方法
(51)【国際特許分類】
   A61B 6/03 20060101AFI20231128BHJP
   G06T 7/00 20170101ALI20231128BHJP
【FI】
A61B6/03 360J
G06T7/00 350C
G06T7/00 612
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023535617
(86)(22)【出願日】2022-09-05
(85)【翻訳文提出日】2023-06-09
(86)【国際出願番号】 CN2022116983
(87)【国際公開番号】W WO2023071531
(87)【国際公開日】2023-05-04
(31)【優先権主張番号】202111240331.9
(32)【優先日】2021-10-25
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】521162399
【氏名又は名称】之江実験室
(74)【代理人】
【識別番号】100128347
【弁理士】
【氏名又は名称】西内 盛二
(72)【発明者】
【氏名】李 ▲勁▼松
(72)【発明者】
【氏名】胡 佩君
(72)【発明者】
【氏名】周 天舒
(72)【発明者】
【氏名】田 雨
【テーマコード(参考)】
4C093
5L096
【Fターム(参考)】
4C093AA22
4C093CA37
4C093DA01
4C093FA44
4C093FD01
4C093FF16
4C093FF42
5L096AA09
5L096BA06
5L096CA18
5L096DA01
5L096HA11
5L096KA04
(57)【要約】
【課題】本発明は深層形状学習に基づく肝臓CT自動分割方法を提供する。
【解決手段】
まず、肝臓分割データセットを確立して前処理し、肝臓分割を利用して肝臓CTを粗分割する。次に、肝臓形状セットを確立し、変分オートエンコーダを利用して肝臓形状を学習し、幾何形状正則化モジュールを構築し、そして幾何形状正則化モジュールを肝臓分割に加入し、幾何形状の一致性に制約された肝臓分割モデルを取得して肝臓CTの自動分割に使用する。本発明は、新規性と進歩性を有して、表現された形状特徴を正則化モジュールにより既存の深層分割ネットワークに加入し、畳み込みニューラルネットワークの訓練過程において形状事前検証情報を導入し、分割モデルの正則性及び汎化能力を向上することができ、分割の結果が標準肝臓の医学解剖的特徴により適合する。本発明は、自動化、高精度、転送拡張可能といった特徴を有し、肝臓を代表とする腹部の大器官の自動かつ正確な分割を実現できる。
【選択図】図1
【特許請求の範囲】
【請求項1】
深層形状学習に基づく肝臓CT自動分割方法であって、ステップ1~ステップ8を含み、
前記ステップ1では、原図像と肝臓分割ラベル図像とを含むCTボリュームデータを収集して前処理し、肝臓分割データの訓練セットを構築し、
前記ステップ2では、肝臓分割ネットワークを構築し、肝臓分割ネットワークがエンコードとデコードの2つの部分で構成され、エンコード部分が4つのエンコードブロックを含み、各エンコードブロックの後に何れも1つのダウンサンプリング層が接続され、デコード部分が4つのデコードブロックを含み、各デコードブロックの前に1つのアップサンプリング層が接続され、各デコードブロックが対応するエンコードブロックによって出力される特徴図に接続され、かつ各デコードブロックによって出力される特徴図に対して1つのマッピング層が作成され、出力の大きさが何れもネットワーク入力図像と同じ大きさの図像ブロックであり、
前記ステップ3では、前記ステップ1において肝臓分割データの訓練セットを利用して肝臓分割ネットワークを訓練し、訓練された肝臓分割ネットワークを利用して肝臓CTを粗分割し、
前記ステップ4では、医学解剖構造特徴に適合する肝臓標準形状セットを取得し、肝臓標準形状セットに対して欠陥操作を行い、肝臓形状欠陥セットを構成し、肝臓標準形状セット及び肝臓形状欠陥セットが共に肝臓形状訓練セットを構成し、
前記ステップ5では、三次元変分オートエンコーダを構築し、前記三次元変分オートエンコーダがエンコーダとデコーダとの2つの部分で構成され、エンコーダ部分が4つのエンコードブロックを含み、各エンコードブロックの後に1つのダウンサンプリング層が接続され、デコーダ部分が4つのデコードブロックを含み、各デコードブロックの前に1つのアップサンプリング層が接続され、デコーダの出力が1つのマッピング層によって特徴図を肝臓予測図としてマッピングし、
前記ステップ6では、肝臓形状訓練セットを利用して三次元変分オートエンコーダを訓練し、1つの欠陥の肝臓形状を訓練された三次元変分オートエンコーダに入力し、その流形空間の隠し空間表現を取得し、
前記ステップ7では、訓練された三次元変分オートエンコーダを幾何形状正則化モジュールとし、前記ステップ2で構築された肝臓分割ネットワークに加入し、肝臓分割ネットワークによって出力された粗分割結果及び肝臓標準分割ラベルをそれぞれ三次元変分オートエンコーダに入力し、肝臓予測形状及び標準肝臓形状の隠し空間表現を取得し、幾何形状正則化モジュールが予測形状と標準形状の隠し空間表現に対して一致性制約を行い、
前記ステップ8では、前処理された肝臓CT図像を幾何形状正則化モジュールが加入された肝臓分割ネットワークに入力し、ネットワークによって出力された分割図像を再サンプリングして原図像サイズにアップサンプリングし、最終的な肝臓分割結果を取得する
ことを特徴とする深層形状学習に基づく肝臓CT自動分割方法。
【請求項2】
前記ステップ1において、前処理過程には具体的に、訓練セットにおける各データをダウンサンプリング、再サンプリング及び取り込み動作し、肝臓ラベルに基づき、肝臓領域開始及び終了のsliceを見つけ、かつそれぞれ外に同じ層数を拡張し、訓練セットにおける各データに対してコントラストを調整し、図像のHU値を[-100、240]の間に切り取り、そして[0、1]の間に正規化し、前記HU値がCT値であり、人体のある局部組織または器官密度大きさを測定する計量単位であり、ハンター単位と呼ばれる
ことを特徴とする請求項1に記載の深層形状学習に基づく肝臓CT自動分割方法。
【請求項3】
前記ステップ2及び前記ステップ5において、各エンコードブロックは数が異なる畳み込み-活性化層で構成され、第1個のエンコードブロックが2つの畳み込み-活性化層を含み、残りの3つのエンコードブロックが何れも3つの畳み込み-活性化層を含み、各デコードブロックは数が異なる畳み込み-活性化層で構成され、最初の3つのデコードブロックが何れも3つの畳み込み-活性化層を含み、最後のデコードブロックが2つの畳み込み-活性化層を含む
ことを特徴とする請求項1に記載の深層形状学習に基づく肝臓CT自動分割方法。
【請求項4】
前記ステップ2において、ネットワークによって出力された各予測ラベルに対応し、対応する損失関数lossを交差エントロピ損失として設定し、
【数1】
ここで、outputがネットワークによって出力された予測図を代表し、Yが対応する標準肝臓形状であり、mが入力図像における画素点個数であり、yとzがそれぞれ画素点jの真ラベル及び予測ラベルであり、c=1または0がそれぞれ前景または背景を代表し、関数I(&middot;)が示性関数であり、関数logが対数関数であり、p(&middot;)がネットワーク予測の確率関数であり、記号
が加算記号であり、記号∈が「属する」を表現し、肝臓分割ネットワークに対して、深層教師あり方式を採用して最終的な損失関数Lsegを4つのマッピング層の出力損失の重み和として設定し、
【数2】
ここで、alphaが設定された深層教師あり係数であり、初期値を1に設定し、かつ40ステップあたりの往復を元の80%に減少し、Loss1~loss4が各マッピング層の出力損失である
ことを特徴とする請求項1に記載の深層形状学習に基づく肝臓CT自動分割方法。
【請求項5】
前記ステップ3において、前記訓練された肝臓分割ネットワークを利用して肝臓CTを粗分割する具体的な過程は、肝臓分割ネットワークによって出力された全ての図像ブロックの予測結果を融合し、原図像において各点に肝臓に属する確率値を与え、確率値を二値化操作して肝臓の粗分割結果を取得する
ことを特徴とする請求項1に記載の深層形状学習に基づく肝臓CT自動分割方法。
【請求項6】
前記ステップ4において、前記肝臓標準形状セットにおいて欠陥操作を行う具体的な過程は、肝臓標準形状セットにおける肝臓形状に対して開閉演算子操作を行い、損傷した肝臓領域を取得し、さらに肝臓形状欠陥セットを構築する
ことを特徴とする請求項1に記載の深層形状学習に基づく肝臓CT自動分割方法。
【請求項7】
前記ステップ5において、エンコーダ部分の出力にその対応する分布の平均値及び標準差を求め、平均値及び標準差の正規分布から1つの隠し空間変数を再サンプリングし、隠し空間変数がデコーダにおいて1つの肝臓形状を生成する
ことを特徴とする請求項1に記載の深層形状学習に基づく肝臓CT自動分割方法。
【請求項8】
前記ステップ5において、変分オートエンコーダの目標損失関数Lshapを再構成誤差Lrec及び正規分布と標準正規分布のKL発散LKLの和に定義し、
【数3】
ここで、
がネットワークに入力する肝臓形状図像を表現し、
が変分オートエンコーダによって再構成された図像を表現し、Yが対応する標準肝臓形状であり、

はエンコーダによって出力された長さがdの平均値ベクトルと標準差ベクトルを表現し、logが対数関数を表現し、記号

ノルムを表現し、
が加算記号である
ことを特徴とする請求項1に記載の深層形状学習に基づく肝臓CT自動分割方法。
【請求項9】
前記ステップ7において、前記幾何形状正則化モジュールが予測形状と標準形状の隠し空間表現に対して一致性制約を行い、具体的には肝臓分割ネットワークの損失関数に隠し空間表現一致性制約を加入し、
【数4】
ここで、E(Y)は、第k個の標準形状Yを三次元変分オートエンコーダに入力して標準肝臓形状の隠し空間表現を取得することを表現し、
は、第k個の予測形状
を三次元変分オートエンコーダに入力して肝臓予測形状の隠し空間表現を取得することを表現し、nが肝臓データ個数であり、最終的に幾何形状正則化に制約される肝臓分割ネットワーク目標損失関数Lは、以下の通り表現し、
【数5】
式において、λが調整パラメータである
ことを特徴とする請求項4に記載の深層形状学習に基づく肝臓CT自動分割方法。
【請求項10】
前記ステップ7において、肝臓分割データの訓練セットを利用して幾何形状正則化モジュールが加入された肝臓分割ネットワークにおけるパラメータを訓練し、逆方向伝播アルゴリズムを利用してネットワークパラメータを調整し、訓練完成後、幾何形状の一致性に制約された肝臓分割モデルを取得し、肝臓CTに対する自動分割に使用し、肝臓分割領域を取得する
ことを特徴とする請求項1に記載の深層形状学習に基づく肝臓CT自動分割方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、CT分割技術分野に関し、特に深層形状学習に基づく肝臓CT自動分割方法に関する。
【背景技術】
【0002】
肝臓がんは、世界で最も一般的な悪性腫瘍の1つであり、人間の生命健康を深刻に脅かす。中国は、肝臓がんの発生率が高い地域であり、肝臓がんは、中国の悪性腫瘍の死亡原因の3番目にランクされている。肝臓がんは、悪性度が高く、病気進行が早く、かつ早期肝臓がん患者が特異的な臨床表現を欠いており、患者が症状を発症するときに常に病気の中期・末期にあり、治療が困難で予後が悪い。コンピュータ断層走査図像(CT)は、肝臓がん診断の臨床映像分検査手段の1つであり、CT図像の肝臓の正確な分割に基づいて体積、大きさ、形状などの定量化情報を提供することができ、かつ後続の病変検出、映像分析の必要なステップ及び基礎であるため、コンピュータ支援診断、手術計画及びナビゲーションなどの臨床シナリオで重要な適用がある。CT図像のデータ量が膨大であり、人工で肝臓のエッジを描く手間がかかり、再現性が低くい。肝臓の全自動分割技術は大規模な臨床CT図像処理を実現することができ、患者の治療レベルを向上させ、関連する臨床研究を加速し、家族、社会及び国家経済に対して重要な意味を有する。
【0003】
肝臓CT自動分割は、固体の形状の差異が大きく、周囲の器官組織に接続し、境界がぼやけひいては部分的に欠失し、前景の見かけが異質であり、背景が複雑であるといった挑戦に直面し、多くの研究を吸引している。近年、全畳み込みニューラルネットワークを代表とする深層学習モデルは肝臓CT分割において良好な結果を取得する。このような方法は、図像情報に対して低層及び高層の特徴算出を行い、かつ分類関数を利用して各画素に対して種別判断を行い、エンドツーエンドの分割領域予測を取得できる。
【0004】
深層畳み込みニューラルネットワーク方法は、大規模なラベル付き医学映像データに依存し、小規模なデータで訓練を行う時に過度フィット現象が発生し易い。それと同時に、一般的な全畳み込みニューラルネットワークに基づく肝臓分割方法は、目標境界の光滑性を考慮せず、領域幾何性質の維持を欠いている。肝臓は特定の解剖構造特徴を有し、幾何形状事前検証知識を利用してモデルの正則性を向上し、モデル過度フィットを減少させ、最終的に目標分割の正確率とロバスト性を向上することができる。形状事前検証知識を利用する鍵は、如何に肝臓形状を表現し且つ深層学習モデルに形状情報を組み込むかのことである。現在、深層学習に基づく肝臓分割方法は幾何形状事前検証知識に対する表現に弱く、多くの方法は、能動形状モデル、マルチスペクトル図分割方法または水平セット表現により目標形状を表現する。しかし、異なる個体肝臓の変形は大きく、能動形状モデルとマルチスペクトル図分割方法は、一般に、小さい形状セットを選択して形状事前検証を構築し、肝臓形状の変形可能な範囲も小さな範囲内に制御されて、全ての個体をカバーすることはできない。形状情報融合段階では、一般的な方法は能動形状モデル、水平セット方法などを後処理として独立して深層畳み込みニューラルネットワークに加入した後、ネットワークの訓練に対して制約作用を果たすことができない。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の目的は、従来技術の不足に対して、深層形状学習に基づく肝臓CT自動分割方法を提出することにあり、本発明の技術課題は、従来の深層学習肝臓分割方法が幾何形状正則性を欠いており、幾何形状事前検証をうまく表現及び融合することができないことである。変分オートエンコーダは非教師あり特徴学習を利用して、多層ニューラルネットワーク構造により図像の非線形特徴を学習し、そのうち隠し層変数は、目標形状特徴をより良く表現することができる。本発明は、データ駆動の方式で、三次元変分オートエンコーダを利用して肝臓の幾何形状特徴を学習し、高次元図像を緊迫流形空間にマッピングし、肝臓形状の隠し空間特徴表現を取得することを提案する。そして、深層分割ネットワークにおいて、正則化モジュールを設計し、目標損失関数に隠し空間形状を加入して損失を表現し、訓練されたエンコーダを利用して分割ネットワークの訓練に対して正則作用を果たす。本発明は、肝臓形状を効果的に表現することができ、かつ分割ネットワークモデルの訓練段階でネットワーク訓練を制約し、分割の目標形状が肝臓変形可能な空間に近づくように制御し、ネットワークモデルの正則性を向上する。
【課題を解決するための手段】
【0006】
本発明の目的は、以下の技術手段により実現され、深層形状学習に基づく肝臓CT自動分割方法であって、以下のステップを含む。
(1)原図像と肝臓分割ラベル図像とを含むCTボリュームデータを収集して前処理し、肝臓分割データの訓練セットを構築するステップと、
(2)肝臓分割ネットワークを構築し、肝臓分割ネットワークがエンコードとデコードの2つの部分で構成され、エンコード部分が4つのエンコードブロックを含み、各エンコードブロックの後に何れも1つのダウンサンプリング層が接続され、デコード部分が4つのデコードブロックを含み、各デコードブロックの前に1つのアップサンプリング層が接続され、各デコードブロックが対応するエンコードブロックによって出力される特徴図に接続され、かつ各デコードブロックによって出力される特徴図に対して1つのマッピング層が作成され、出力の大きさが何れもネットワーク入力図像と同じ大きさの図像ブロックであるステップと、
(3)ステップ(1)において肝臓分割データの訓練セットを利用して肝臓分割ネットワークを訓練し、訓練された肝臓分割ネットワークを利用して肝臓CTを粗分割するステップと、
(4)医学解剖構造特徴に適合する肝臓標準形状セットを取得し、肝臓標準形状セットに対して欠陥操作を行い、肝臓形状欠陥セットを構成し、肝臓標準形状セット及び肝臓形状欠陥セットが共に肝臓形状訓練セットを構成するステップと、
(5)三次元変分オートエンコーダを構築し、前記三次元変分オートエンコーダがエンコーダとデコーダとの2つの部分で構成され、エンコーダ部分が4つのエンコードブロックを含み、各エンコードブロックの後に1つのダウンサンプリング層が接続され、デコーダ部分が4つのデコードブロックを含み、各デコードブロックの前に1つのアップサンプリング層が接続され、デコーダの出力が1つのマッピング層によって特徴図を肝臓予測図としてマッピングするステップと、
(6)肝臓形状訓練セットを利用して三次元変分オートエンコーダを訓練し、1つの欠陥の肝臓形状を訓練された三次元変分オートエンコーダに入力し、その流形空間の隠し空間表現を取得するステップと、
(7)訓練された三次元変分オートエンコーダを幾何形状正則化モジュールとし、ステップ(2)で構築された肝臓分割ネットワークに加入し、肝臓分割ネットワークによって出力された粗分割結果及び肝臓標準分割ラベルをそれぞれ三次元変分オートエンコーダに入力し、肝臓予測形状及び標準肝臓形状の隠し空間表現を取得し、幾何形状正則化モジュールが予測形状と標準形状の隠し空間表現に対して一致性制約を行うステップと、
(8)前処理された肝臓CT図像を幾何形状正則化モジュールが加入された肝臓分割ネットワークに入力し、ネットワークによって出力された分割図像を再サンプリングして原図像サイズにアップサンプリングし、最終的な肝臓分割結果を取得するステップと、を含む。
【0007】
さらに、ステップ(1)において、前処理過程は具体的に、訓練セットにおける各データをダウンサンプリング、再サンプリング及び取り込み動作し、肝臓ラベルに基づき、肝臓領域開始及び終了のsliceを見つけ、かつそれぞれ外に同じ層数を拡張し、訓練セットにおける各データに対してコントラストを調整し、図像のHU値を[-100、240]の間に切り取り、そして[0、1]の間に正規化する。
【0008】
さらに、ステップ(2)及びステップ(5)において、各エンコードブロックは数が異なる畳み込み-活性化層で構成され、第1個のエンコードブロックが2つの畳み込み-活性化層を含み、残りの3つのエンコードブロックが何れも3つの畳み込み-活性化層を含み、各デコードブロックは数が異なる畳み込み-活性化層で構成され、最初の3つのデコードブロックが何れも3つの畳み込み-活性化層を含み、最後のデコードブロックが2つの畳み込み-活性化層を含む。
【0009】
さらに、ステップ(2)において、ネットワークによって出力された各予測ラベルに対応し、対応する損失関数lossを交差エントロピ損失として設定し、
【数1】
ここで、outputがネットワークによって出力された予測図を代表し、Yが対応する標準肝臓形状であり、mが入力図像における画素点個数であり、yとzがそれぞれ画素点jの真ラベル及び予測ラベルであり、c=1または0がそれぞれ前景または背景を代表し、関数I(&middot;)が示性関数であり、関数logが対数関数であり、p(&middot;)がネットワーク予測の確率関数であり、記号
が加算記号であり、記号∈が「属する」を表現し、肝臓分割ネットワークに対して、深層教師あり方式を採用して最終的な損失関数Lsegを4つのマッピング層の出力損失の重み和として設定し、
【数2】
ここで、alphaが設定された深層教師あり係数であり、初期値を1に設定し、かつ40ステップあたりの往復を元の80%に減少し、Loss1~loss4が各マッピング層の出力損失である。
【0010】
さらに、ステップ(3)において、前記訓練された肝臓分割ネットワークを利用して肝臓CTを粗分割する具体的な過程は、肝臓分割ネットワークによって出力された全ての図像ブロックの予測結果を融合し、原図像において各点に肝臓に属する確率値を与え、確率値を二値化操作して肝臓の粗分割結果を取得する。
【0011】
さらに、ステップ(4)において、前記肝臓標準形状セットにおいて欠陥操作を行う具体的な過程は、肝臓標準形状セットにおける肝臓形状に対して開閉演算子操作を行い、損傷した肝臓領域を取得し、さらに肝臓形状欠陥セットを構築する。
【0012】
さらに、ステップ(5)において、エンコーダ部分の出力にその対応する分布の平均値及び標準差を求め、平均値及び標準差の正規分布から1つの隠し空間変数を再サンプリングし、隠し空間変数がデコーダにおいて1つの肝臓形状を生成する。
【0013】
さらに、ステップ(5)において、変分オートエンコーダの目標損失関数Lshapを再構成誤差Lrec及び正規分布と標準正規分布のKL発散LKLの和に定義し、
【数3】
ここで、
がネットワークに入力する肝臓形状図像を表現し、
が変分オートエンコーダによって再構成された図像を表現し、Yが対応する標準肝臓形状であり、

はエンコーダによって出力された長さがdの平均値ベクトルと標準差ベクトルを表現し、logが対数関数を表現し、記号

ノルムを表現し、
が加算記号である。
【0014】
さらに、ステップ(7)において、前記幾何形状正則化モジュールが予測形状と標準形状の隠し空間表現に対して一致性制約を行い、具体的には肝臓分割ネットワークの損失関数に隠し空間一致性制約表現を加入し、
【数4】
ここで、E(Y)は、第k個の標準形状Yを三次元変分オートエンコーダに入力して標準肝臓形状の隠し空間表現を取得することを表現し、
は、第k個の予測形状
を三次元変分オートエンコーダに入力して肝臓予測形状の隠し空間表現を取得することを表現し、nが肝臓データ個数であり、最終的に幾何形状正則化に制約される肝臓分割ネットワーク目標損失関数Lは、以下の通り表現し、
【数5】
式において、λが調整パラメータである。
【0015】
さらに、ステップ(7)において、肝臓分割データの訓練セットを利用して幾何形状正則化モジュールが加入された肝臓分割ネットワークにおけるパラメータを訓練し、逆方向伝播アルゴリズムを利用してネットワークパラメータを調整し、訓練完成後、幾何形状の一致性に制約された肝臓分割モデルを取得し、肝臓CTに対する自動分割に使用し、肝臓分割領域を取得する。
【発明の効果】
【0016】
本発明の有益な効果として、本発明は、データ駆動の方式で、三次元変分オートエンコーダに基づき、肝臓形状特徴を学習し、低次元流形空間での緊迫表現を取得し、肝臓幾何形状表現が困難であるという課題を解決することができる。同時に、新規性と進歩性を有して、表現された形状特徴を正則化モジュールにより既存の深層分割ネットワークに加入し、畳み込みニューラルネットワークの訓練過程において形状事前検証情報を導入し、分割モデルの正則性及び汎化能力を向上することができ、分割の結果が標準肝臓の医学解剖的特徴により適合する。提案された深層形状学習方法は、他の腹部器官及び映像モードに適用することができ、かつ正則化モジュールは、他の深層畳み込みニューラルネットワーク構造に移植することができ、良好な拡張可能性を有する。本発明は、自動化、高精度、転送拡張可能といった特徴を有し、肝臓を代表とする腹部の大器官の自動かつ正確な分割を実現できる。
【図面の簡単な説明】
【0017】
図1】深層形状学習に基づく肝臓CT自動分割図フローチャートである。
図2】ResUNetに基づく肝臓分割ネットワーク構成図概略図である。
図3】変分オートエンコーダに基づく形状学習ネットワーク構成図概略図である。
【発明を実施するための形態】
【0018】
以下、図面を参照して本発明の実施形態作をさらに詳細に説明する。
【0019】
図1に示すように、本発明による深層形状学習に基づく肝臓CT自動分割方法は、深層幾何形状学習過程と、肝臓分割ネットワーク訓練過程とを含む。
深層幾何形状学習過程は下記のことを含む。
肝臓形状セット確立であって、標準形状セットと肝臓欠陥セットとを含む。肝臓標準セットは、医学解剖構造特徴に適合する肝臓形状を収集し、肝臓欠陥セットは、ほとんどの肝臓領域が正しいが間違った情報が存在する肝臓形状を収集している。肝臓形状学習であって、変分オートエンコーダに基づいて特徴肝臓形状を学習し、欠陥肝臓形状を修正する。肝臓形状エンコードであって、訓練によって得られる変分オートエンコーダのエンコーダ部分で構成され、肝臓形状の流形空間緊迫表現に使用される。肝臓分割過程は下記のことを含む。肝臓分割訓練セット確立であって、原図像と肝臓分割標準データセットとで構成される。三次元肝臓分割ネットワーク訓練であって、肝臓分割データセットを利用して三次元深層畳み込みニューラルネットワークを訓練し、肝臓初期分割モデルを取得する。幾何形状正則化モジュールであって、肝臓分割ネットワークに正則化モジュールを加入し、肝臓形状隠し空間一致損失を導入する。肝臓形状予測モジュールであって、入力図像に対して肝臓領域を予測し、訓練済みの変分オートエンコーダが肝臓形状を補正する。具体的なステップは下記の通りである。
(1)肝臓分割データセットが前処理を確立する。
(1.1)CTボリュームデータを收集し、これらデータの肝臓標準分割結果を作成する。三次元CTボリュームデータをXとして記し、大きさが512×512×Lであり、ここで、Lがボリュームデータの層数である。対応する標準分割が
であり、ここで、|X|がXにおける全てのボクセル個数を代表し、y=1またはy=0はそれぞれボクセルjが肝臓または背景に属することを代表する。肝臓分割データセットを
として記し、ここで、nが肝臓データ個数である。分割データセットを訓練セットTrとテストセットTtに分ける。
(1.2)肝臓分割の訓練セットに対して、各ペアの原図像と肝臓分割ラベル図像に対してダウンサンプリング、再サンプリング及び取り込み動作を行う。CTデータに対して横断面で2倍のダウンサンプリングを行い、かつ再サンプリングを行い、全てのデータのz軸のspacingを1mmに調整する。肝臓ラベルに基づき、肝臓領域開始及び終了のsliceを見つけ、かつそれぞれ外に同じ層数を拡張する。
(1.3)各CTデータに対してコントラスト調整を行う。具体的に、図像のHU値を[-100、240]の間に切り取り、そして[0、1]の間に正規化する。データをniiフォーマットとして保存する。前記HU値がCT値であり、人体のある局部組織または器官密度の大きさを測定する計量単位であり、通常、ハンター単位(hounsfieldunit、HU)と呼ばれ、空気が-1000であり、緻密骨が+1000である。
(2)ResUNetネットワークを利用して肝臓CTを粗分割する。
(2.1)図2に示すように、ResUNetネットワークを構築し、当該ネットワークがエンコードとデコードの2つの部分で構成され、ネットワークの入力の大きさが1*48*256*256であり、出力の大きさが1*48*256*256である。エンコード部分が4つのエンコードブロックを含み、各エンコードブロックの後に何れも1つのダウンサンプリング層が接続される。各エンコードブロックは数が異なる畳み込み-活性化層で構成される。第1個のエンコードブロックが2つの畳み込み-活性化層を含み、残りの3つのエンコードブロックが何れも3つの畳み込み-活性化層を含む。各エンコードブロックの最後層の畳み込み-活性化層に入力に対する残差接続を加入する。エンコード部分によって出力される特徴図の大きさが256*3*16*16である。デコード部分が4つのデコードブロックを含み、各デコードブロックの前に1つのアップサンプリング層が接続される。各デコードブロックは数が異なる畳み込み-活性化層で構成される。最初の3つのデコードブロックが何れも3つの畳み込み-活性化層を含み、最後のデコードブロックが2つの畳み込み-活性化層を含む。各デコードブロックの第1層の畳み込み-活性化層において、対応するエンコードブロックによって出力される特徴図が接続される。かつ、各デコードブロックによって出力される特徴図に対して1つのマッピング層を作成し、当該マッピング層が畳み込み-アップサンプリング-活性化層で構成される。マッピング層の出力の大きさが何れもネットワーク入力図像と同じ大きさの図像ブロックであり、すなわち、サイズが1*48*256*256である。
ネットワークによって出力された各予測ラベルに対応し、対応する損失関数lossを交差エントロピ損失として設定し、
【数1】
ここで、outputがネットワークによって出力された予測図を代表し、mが入力図像における画素点個数であり、yとzがそれぞれ画素点jの真ラベル及び予測ラベルであり、c=1または0がそれぞれ前景または背景を代表する。関数I(&middot;)が示性関数であり、関数logが対数関数であり、p(&middot;)がネットワーク予測の確率関数である。記号
が加算記号であり、記号∈が「属する」を表現する。本発明のResUNetネットワークに対して、深層教師あり方式を採用して最終的な損失関数を設定し、すなわち、4つのマッピング層の出力損失の重み和として設定し、
【数2】
ここで、alphaが設定された深層教師あり係数であり、初期値を1に設定し、かつ40ステップあたりの往復を元の80%に減少する。Loss1~loss4が各マッピング層の出力損失である。
(2.2)肝臓分割の訓練セットを利用してResUNetネットワークにおける様々なパラメータを訓練する。用意された訓練セットをネットワークに入力し、逆方向伝播アルゴリズムを利用してネットワークパラメータを求める。訓練が完成し、肝臓初期分割モデルを取得する。
(2.3)ResUNetネットワークを取って1000ステップのモデルを訓練し、訓練セットとテストセットの図像をモデルに入力する。入力原図像の48層あまりの図像ブロックをネットワークの入力として、ニューラルネットワークを介して前方に伝播した後、最後の層の出力output4のみをネットワーク出力とする。最後に、全ての図像ブロックの予測結果を融合し、原図像において各点に肝臓に属する確率値を与える。確率値を二値化操作して、二値化しきい値を0.5にし、肝臓の粗分割結果を取得し、
と記し、|X|が図像画素個数である。
(3)肝臓形状セット確立
(3.1)肝臓分割ラベルを肝臓標準形状セット
として記し、ここで、nが形状訓練セットのデータ個数である。標準肝臓形状に対して欠陥操作を行い、肝臓形状欠陥セットを構成する。具体的に、標準セットにおける肝臓形状Yに対して開閉演算子操作を行い、損傷した肝臓領域
を取得する。肝臓欠陥形状セットを
と記する。肝臓標準形状セットSと肝臓欠陥形状セットCは、肝臓形状訓練セットを構成する。
(3.2)各ペアの標準肝臓形状と欠陥肝臓形状に対して再サンプリングと取り込み動作を行う。図像の分辨率を1mm*1mm*1mmに再サンプリングし、肝臓形状に基づいてその周辺矩形枠を算出し、そして矩形枠を中心とする大きさが320*320*256の図像領域を取り込む。ボリュームデータの層数が256層未満であれば、前後で値が0のピクチャに補完する。最後に、図像に対して2倍のダウンサンプリングを行い、最終的に大きさが160*160*128の大きさの図像ブロックを取得して変分オートエンコーダネットワークの入力とする。
(4)変分オートエンコーダを利用して肝臓形状を学習する
(4.1)図3に示すように、三次元変分オートエンコーダを構築し、エンコーダEとデコーダDとの2つの部分で構成される。ネットワークの入力の大きさが1*128*160*160であり、出力の大きさが1*128*160*160である。エンコーダ部分はResUNetのエンコーダ部分に類似し、4つのエンコードブロックを含み、各エンコードブロックの後に1つのダウンサンプリング層が接続される。各エンコードブロックは数が異なる畳み込み-活性化層で構成される。第1個のエンコードブロックが2つの畳み込み-活性化層を含み、残りの3つのエンコードブロックが何れも3つの畳み込み-活性化層を含む。最初の2つのエンコードブロックの最後層の畳み込み-活性化層に入力に対する残差接続を加入する。エンコーダ部分の出力の大きさが128*4*5*5の大きさの特徴図であり、それを1つの12800次元のベクトルに引き、かつ全接続層により800次元のベクトルに低減し、そしてその対応する分布の平均値μと標準差σを求める。平均値μと標準差σの正規分布から1つの隠し空間変数zを再サンプリングする。デコーダ部分では、デコーダを生成器とし、変数zを1つの肝臓形状として生成する。デコーダ部分は4つのデコードブロックを含み、各デコードブロックの前に1つのアップサンプリング層が接続される。各デコードブロックは数が異なる畳み込み-活性化層で構成される。最初の3つのデコードブロックが何れも3つの畳み込み-活性化層を含み、最後のデコードブロックが2つの畳み込み-活性化層を含む。デコーダの出力は大きさが32*64*80*80の特徴図であり、最後に1つのマッピング層により、特徴図を肝臓予測図としてマッピングする。マッピング層は畳み込み-アップサンプリング-活性化層で構成され、出力の大きさはネットワーク入力図像と同じ大きさの図像ブロックであり、すなわち、サイズが1*256*320*320である。
変分オートエンコーダの目標損失関数Lshapを再構成誤差Lrec及び正規分布と標準正規分布のKL発散LKL、すなわち、Lshap=Lrec+LKLに定義し、
【数3】
ここで、
がネットワークに入力する肝臓形状図像を表現し、
が変分オートエンコーダによって再構成された図像を表現し、Yが対応する標準肝臓形状である。

はエンコーダによって出力された長さがdの平均値ベクトルと標準差ベクトルを表現する。logが対数関数を表現する。記号

ノルムを表現する。
が加算記号である。
(4.2)形状訓練セットを利用して変分オートエンコーダにおける様々なパラメータを訓練する。ネットワークにおけるエンコーダとデコーダのパラメータは分割ネットワークResUNetのモデルパラメータによって初期化される。そして、用意された訓練セットをネットワークに入力し、逆方向伝播アルゴリズムを利用してネットワークパラメータを微調整する。訓練が完成し、形状学習モデルを取得する。
(4.3)変分オートエンコーダのエンコーダ部分を肝臓形状エンコーダEとする。1つの欠陥した肝臓形状を入力し、流形空間での隠し空間表現
、i=1、…、nを得ることができる。隠し空間表現は、肝臓形状特徴を抽象化したものである。隠し空間表現(Latent Space Representation)は、圧縮データの1つの表現であり、モードを見つけるために、データ特徴を学習しかつデータ表現を簡略化する。隠し空間において、類似するサンプルの間の特徴の差が余分の情報として除去され、そのコア特徴のみが保留される。
(5)幾何形状正則化モジュール構築
(5.1)ResUNet分割ネットワークに幾何形状正則化モジュールを加入する。具体的に、ResUNetによって出力された肝臓予測領域
をエンコーダEに入力し、肝臓予測形状の隠し空間表現
を取得する。同時に、肝臓標準分割ラベルをエンコーダに入力し、標準肝臓形状の隠し空間表現E(Y)を取得する。幾何形状正則化モジュールが予測形状と標準形状の隠し空間表現に対して一致性制約を行い、すなわち、分割ネットワークの損失関数に隠し空間一致性制約表現を加入し、
【数4】
ここで、E(Y)は第k個の標準形状Yを三次元変分オートエンコーダに入力して標準肝臓形状の隠し空間表現を取得することを表現し、
は、第k個の予測形状
を三次元変分オートエンコーダに入力して肝臓予測形状の隠し空間表現を取得することを表現し、nが肝臓データ個数である。
(5.2)最終的に幾何形状正則化に制約される肝臓分割ネットワーク目標損失関数は以下の通り表現されてもよく、
【数5】
式において、λが調整パラメータであり、ここで0.1に設定される。
(5.3)肝臓分割の訓練セットを利用して幾何形状正則化モジュールが加入されたResUNet分割ネットワークネットワークにおける様々なパラメータを訓練し、逆方向伝播アルゴリズムを利用してネットワークパラメータを微調整する。訓練が完成し、幾何形状の一致性に制約された肝臓分割モデルを取得する。
(6)肝臓自動分割
(6.1)所定のテスト図像Xtestに対してダウンサンプリングと再サンプリング過程を行う。そして、図像のグレー値を調整し、図像のHU値を[-100、240]の間に切り取り、そして[0、1]の間に正規化する。前処理されたテスト図像を幾何形状の一致性に制約された肝臓分割モデルに入力し、肝臓分割結果を取得する。
(6.2)分割図像を再サンプリングして原図像サイズにアップサンプリングし、最終的な肝臓分割結果を取得する。
【0020】
本発明においてResUNetは、UNet、DenseNet、ResNetなどの他の深層畳み込みニューラルネットワークモデルに置き換えることができ、ネットワークモデルの交換は、形状正則化モジュールの導入に影響を与えない。
【0021】
本発明は、CT肝臓データの自動分割に使用することに限定されず、映像モードも磁気共鳴画像(MRI)などの他の映像データに置き換えることができ、分割目標肝臓は、腎臓、脾臓などの解剖的構造特徴を有する器官に代替することができる。
【0022】
上記実施例は、本発明を説明するためのものであり、本発明を限定するものではなく、本発明の精神及び特許請求の範囲内で、本発明に対して行われた任意の補正及び変更は、いずれも本発明の保護範囲内に入る。
図1
図2
図3
【国際調査報告】