(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024083172
(43)【公開日】2024-06-20
(54)【発明の名称】画像解析装置及び画像解析方法
(51)【国際特許分類】
A61B 6/03 20060101AFI20240613BHJP
G06T 7/00 20170101ALI20240613BHJP
【FI】
A61B6/03 360J
G06T7/00 350B
A61B6/03 360G
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022197540
(22)【出願日】2022-12-09
(71)【出願人】
【識別番号】000006138
【氏名又は名称】株式会社明治
(71)【出願人】
【識別番号】512078812
【氏名又は名称】道脇 幸博
(71)【出願人】
【識別番号】504143441
【氏名又は名称】国立大学法人 奈良先端科学技術大学院大学
(74)【代理人】
【識別番号】110002675
【氏名又は名称】弁理士法人ドライト国際特許事務所
(72)【発明者】
【氏名】道脇 幸博
(72)【発明者】
【氏名】菊地 貴博
(72)【発明者】
【氏名】佐藤 嘉伸
(72)【発明者】
【氏名】大竹 義人
(72)【発明者】
【氏名】政木 勇人
【テーマコード(参考)】
4C093
5L096
【Fターム(参考)】
4C093AA22
4C093AA26
4C093CA15
4C093DA04
4C093FD03
4C093FF16
4C093FF24
4C093FF42
5L096AA09
5L096BA06
5L096BA13
5L096CA04
5L096FA02
5L096GA34
5L096HA11
5L096JA11
5L096KA04
5L096MA07
(57)【要約】
【課題】解析対象動画に基づいて頭頸部の各組織の運動を解析する際に人手による作業負担を軽減し得る画像解析装置及び画像解析方法を提供する。
【解決手段】画像解析装置1は、複数の4次元CT画像について、4次元CT画像ごとにそれぞれ4次元CT画像内における頭頸部の各組織をそれぞれ組織ごとに区画化した複数の区画化済4次元CT画像を、学習用4次元CT画像群として用いて、組織ごとの特徴を学習させた学習済みモデルを記憶する記憶部11と、頭頸部の各組織が運動しているときの2次元CT画像が時系列に連続して配置された構成でなる2次元CT動画、又は、新たな4次元CT画像を、解析対象動画として取得する画像取得部12と、学習済み畳み込みニューラルネットワークを用いて、解析対象動画内における頭頸部の各組織をそれぞれ組織ごとに区画化する動画解析を行う解析部15と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
頭頸部の各組織が運動しているときの前記頭頸部の内部を撮影した3次元画像が時系列に連続して配置された構成でなる複数の4次元画像について、前記4次元画像ごとにそれぞれ前記4次元画像内における前記頭頸部の各組織をそれぞれ前記組織ごとに区画化した複数の区画化済4次元画像を、学習用4次元画像群として用いて、前記組織ごとの特徴を学習させた学習済みモデルを記憶する記憶部と、
前記頭頸部の各組織が運動しているときの前記頭頸部の内部を撮影した2次元画像が時系列に連続して配置された構成でなる2次元動画、又は、新たな前記4次元画像を、解析対象動画として取得する画像取得部と、
前記記憶部に記憶されている前記学習済みモデルを用いて、前記解析対象動画内における前記頭頸部の各組織をそれぞれ前記組織ごとに区画化する動画解析を行う解析部と、
を備える、画像解析装置。
【請求項2】
前記記憶部に記憶されている前記学習済みモデルは、X線透過率に基づいて分類されたグループごとに、前記組織の特徴を学習している、請求項1に記載の画像解析装置。
【請求項3】
前記記憶部に記憶されている前記学習済みモデルは、前記X線透過率の低いグループから前記X線透過率の高い前記グループの順に、前記グループ内の前記組織の特徴を学習している、請求項2に記載の画像解析装置。
【請求項4】
前記記憶部に記憶されている前記学習済みモデルは、さらに前記組織の配置に基づいて分類されたグループごとの前記組織の配置を考慮して、前記組織の特徴を学習している、請求項2または3に記載の画像解析装置。
【請求項5】
前記記憶部に記憶されている前記学習済みモデルは、前記解析対象動画を構成する画像のうち、時系列に隣接する前記画像の変化量の低い前記画像から高い前記画像の順に、前記組織の特徴を学習している、請求項1に記載の画像解析装置。
【請求項6】
前記記憶部に記憶されている前記学習済みモデルは、ノード間の結合を脱落させ、脱落前後において、得られる前記組織の特徴の差が小さくなるように、前記組織の特徴を学習している、請求項1に記載の画像解析装置。
【請求項7】
前記記憶部に記憶されている前記学習済みモデルは、前記組織ごとの区画化の不確実性を算出し、前記区画化の結果とともに、算出した前記不確実性を出力する、請求項1に記載の画像解析装置。
【請求項8】
前記記憶部に記憶されている前記学習済みモデルは、さらに、前記4次元画像よりも時系列の解像度の高い学習用の2次元動画を同期させて、前記組織の特徴を学習している、請求項1に記載の画像解析装置。
【請求項9】
頭頸部の各組織が運動しているときの前記頭頸部の内部を撮影した3次元画像が時系列に連続して配置された構成でなる複数の4次元画像について、前記4次元画像ごとにそれぞれ前記4次元画像内における前記頭頸部の各組織をそれぞれ組織ごとに区画化した複数の区画化済4次元画像を、学習用4次元画像群として用いて、前記組織ごとの特徴を学習させて学習済みモデルを構築し、
前記頭頸部の各組織が運動しているときの前記頭頸部の内部を撮影した2次元画像が時系列に連続して配置された構成でなる2次元動画、又は、新たな前記4次元画像を、解析対象動画として取得し、
前記学習済みモデルを用いて、前記解析対象動画内における前記頭頸部の各組織をそれぞれ組織ごとに区画化する動画解析を行う、画像解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像解析装置及び画像解析方法に関する。
【背景技術】
【0002】
医療分野においては、診断対象となる部位をX線撮影により断層撮像して得られる3次元CT(Computed Tomography)画像を用いた診断が行われている。このような3次元CT画像は、診断に用いる際に各組織を区画に分けて、それぞれの区画を色分けして表示するのが好ましい。例えば、特許文献1には、心内腔領域を用いて心筋領域の面を特定し、その面を、当該位置の医用画像の信号値に応じた色として表示させる技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年、3次元CT画像を時系列に連続的に取得することが行われており、このようにして得られた4次元CT画像(4次元CTデータ、3次元CT動画と称されることもある)を解析対象動画として用い、例えば、咀嚼時や、嚥下時における頭頸部の各組織の運動(動的な変化)の解析が行われている。
【0005】
この際、頭頸部の4次元CT画像についても、特許文献1に示すように、各組織を特定識別し、各組織を区画化するために組織ごとに色分けして表示し、頭頸部の各組織の運動を解析することが考えられる。しかしながら、頭頸部は、心臓とは異なり周期的な運動を行っておらず、嚥下時又は咀嚼時には空気や経口摂取物等の組織以外の物質が口腔内に取り込まれることもあり、さらに、複数の組織が重なっている部位も存在する。このため、4次元CT画像の他、MRI(Magnetic Resonance Imaging)画像診断装置により得られる4次元MRI画像を解析対象画像とし、当該解析対象動画内の頭頸部の各組織の運動を解析するためには、人手によって解析対象動画内で頭頸部の各組織をそれぞれ組織ごとに区画化する作業が必要となり、その分、人手による作業負担が大きかった。
【0006】
本発明は、このような課題に鑑みてなされたものであり、解析対象動画に基づいて頭頸部の各組織の運動を解析する際に人手による作業負担を軽減し得る画像解析装置及び画像解析方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の画像解析装置によれば、頭頸部の各組織が運動しているときの頭頸部の内部を撮影した3次元画像が時系列に連続して配置された構成でなる複数の4次元画像について、4次元画像ごとにそれぞれ4次元画像内における頭頸部の各組織をそれぞれ組織ごとに区画化した複数の区画化済4次元画像を、学習用4次元画像群として用いて、組織ごとの特徴を学習させた学習済みモデルを記憶する記憶部と、頭頸部の各組織が運動しているときの頭頸部の内部を撮影した2次元画像が時系列に連続して配置された構成でなる2次元動画、又は、新たな4次元画像を、解析対象動画として取得する画像取得部と、記憶部に記憶されている学習済みモデルを用いて、解析対象動画内における頭頸部の各組織をそれぞれ組織ごとに区画化する動画解析を行う解析部と、を備える。
【0008】
本発明の画像解析方法によれば、頭頸部の各組織が運動しているときの頭頸部の内部を撮影した3次元画像が時系列に連続して配置された構成でなる複数の4次元画像について、4次元画像ごとにそれぞれ4次元画像内における頭頸部の各組織をそれぞれ組織ごとに区画化した複数の区画化済4次元画像を、学習用4次元画像群として用いて、組織ごとの特徴を学習させて学習済みモデルを構築し、頭頸部の各組織が運動しているときの頭頸部の内部を撮影した2次元画像が時系列に連続して配置された構成でなる2次元動画、又は、新たな4次元画像を、解析対象動画として取得し、学習済みモデルを用いて、解析対象動画内における頭頸部の各組織をそれぞれ組織ごとに区画化する動画解析を行う。
【発明の効果】
【0009】
本発明によれば、学習済みの畳み込みニューラルネットワークを用いて、解析対象動画内における頭頸部の各組織をそれぞれ組織ごとに区画化した動画解析を行えることから、その分、人手によって解析対象動画内の各組織をそれぞれ組織ごとに区画化する手間を軽減し得、解析対象動画に基づいて頭頸部の各組織の運動を解析する際に人手による作業負担を軽減し得る。
【図面の簡単な説明】
【0010】
【
図1】本実施形態に係る画像解析装置の機能構成を示したブロック図である。
【
図2】画像解析装置へ入力される4次元CT画像の撮影方法の説明図である。
【
図3】あるタイミングにおける、下方から100番目の断面における2次元CT画像の例である。
【
図4】あるタイミングにおける、下方から200番目の断面における2次元CT画像の例である。
【
図5】あるタイミングにおける、側方からの2次元CT画像の例である。
【
図6】2次元CT画像を立体再構築した3次元CT画像の例である。
【
図7】
図3の2次元CT画像の時系列の変化を示す図である。
【
図8】
図4の2次元CT画像の時系列の変化を示す図である。
【
図9】
図5の2次元CT画像の時系列の変化を示す図である。
【
図10】
図6の3次元CT画像の時系列の変化を示す図である。
【発明を実施するための形態】
【0011】
図1は、本願の画像解析方法を実行する画像解析装置1の機能構成を示したブロック図である。画像解析装置1は、撮影部2から入力される頭頸部の4次元CT画像(4次元CTデータ、3次元CT動画と称されることもある)について、各組織の領域を特定し、各組織のそれぞれの領域を区画化して組織ごとに異なる色を付して強調表示させた区画化済4次元CT画像を生成して出力する。4次元CT画像は、例えば、対象者が嚥下や咀嚼または発音を行い、頭頸部の各組織が運動している際の対象者の頭頸部を、公知のX線断層装置によって断層撮影することにより得られる複数の2次元のX線断層画像(2次元CT画像)から生成(画像再構成ともいう)した3次元CT画像を、時系列に沿って連続して配置することにより生成される、各組織の運動時における頭頸部内部を映した動画である。
【0012】
画像解析装置1は、このような4次元CT画像を構成する2次元のX線断層画像のそれぞれについて頭頸部の各組織を特定して組織ごとに区画化する画像解析及び動画解析を行う。なお、本実施形態に係る画像解析装置1では、上述したような4次元CT画像に対する動画解析を行う場合について主に説明するが、本発明はこれに限らず、例えば、対象者が嚥下や咀嚼又は発音を行っている際の対象者の頭頸部を公知のX線断層装置によって断層撮影することにより得られる時系列に連続した2次元CT動画についても、頭頸部の各組織をそれぞれ特定して組織ごとに区画化する画像解析及び動画解析を行うことができる。そのため、画像解析装置1で画像解析及び動画解析を行う解析対象画像及び動画には、4次元CT画像に限らず、2次元CT動画も含まれる。
【0013】
画像解析装置1は、記憶部11と、画像取得部12と、画像処理部13とを備えており、撮影部2からの画像入力を受け付ける。そして、画像処理部13による動画解析処理を行う際に、学習工程において予め学習しておいた学習済みモデルが利用される。なお、画像解析を行なって画像内から特定の物体が存在する領域を推測して検出し、検出した物体を画像内で区画化することは、領域分割(セグメンテーション)と称されている。画像解析装置1においては、このような領域分割の技術が用いられる。
【0014】
学習モデルは、一例としては、畳み込みニューラルネットワーク(CNN:Convolutional Neural Networkとも称する)があるが、畳み込みニューラルネットワークに限らず、ディープニューラルネットワーク(DNN:Deep Neural Network)や再帰型ニューラルネットワーク(RNN:Recurrent Neural Network)の他の種類のニューラルネットワークや、SVM(Support Vector Machine)、及び、ベイズ識別器等の任意の計算アルゴリズムや数理モデルを用いることができる。
【0015】
撮影部2は、例えば、X線断層装置等であり、咀嚼や嚥下又は発音が行われる領域である対象者の頭頸部、具体的には、鼻腔、口腔、咽頭、喉頭、食道等の各器官を含む領域を断層的にX線撮影してゆき、撮影された2次元のX線断層画像を再構成して3次元CT画像を生成する。撮影部2は、このような3次元CT画像の撮影を、対象者が咀嚼や嚥下を行っている時間(例えば、3秒間)連続して行っており、時系列に沿って順番に取得した複数の3次元CT画像を当該時系列に沿って順番に配置させた4次元CT画像(4次元CTデータ、4次元CT画像、3次元動画とも称する)を生成する。
【0016】
図2は、頭頸部の内部を撮影した4次元CT画像の取得例を示す。撮影部2は、例えば、頭頸部31の水平方向断面(xy面)の2次元CT画像32を、上下(z軸)方向に0.5mm間隔で320枚撮影する。なお、xy面における2次元CT画像32の解像度は、xy軸それぞれにおいて0.545mmである。その結果、xyz方向において、0.545mm、0.545mm、及び、0.500mmのボクセルが、それぞれ、512個、512個、及び、320個存在するような3次元CT画像が生成される。なお、3次元CT画像の撮影領域は、xyz方向おけるボクセルの大きさと数との積により定まるため、xyz方向において279mm、279mm、及び、160mmの領域を撮影できる。そして、このような3次元CT画像が、0.1秒間隔で30フレーム撮影されることで、3秒の4次元CT画像が生成される。このようにして、撮影部2によって咀嚼時又は嚥下時の頭頸部31の内部を撮影することにより生成された4次元CT画像は、記憶部11に記憶される。
【0017】
再び
図1を参照して画像解析装置1の構成を説明する。記憶部11には、このように撮影部2の撮影により生成された4次元CT画像に加えて、学習用4次元CT画像群が記憶されている。学習用4次元CT画像群は、複数の対象者について咀嚼時又は嚥下時の頭頸部31の内部をそれぞれ撮影した複数の4次元CT画像を基に、各4次元CT画像からそれぞれ生成した複数の区画化済4次元CT画像から構成されている。区画化済4次元CT画像は、4次元CT画像を構成する個々の2次元CT画像について組織ごとに区画化(領域分割)し、当該組織ごとに区画化した各領域にそれぞれ組織を示すラベル(インスタンス)が重畳された4次元CT画像である。例えば、区画化済4次元CT画像においては、気道、食塊、軟口蓋、舌、下顎骨、舌骨、甲状軟骨、喉頭蓋、輪状軟骨、咽頭壁、披裂部、声帯の各組織が区画化して示されている。
【0018】
画像取得部12は、学習工程と解析工程とで異なる動作を行う。学習工程においては、画像取得部12は、記憶部11から学習用の区画化済4次元CT画像を取得すると、学習部14に送信する。解析工程においては、画像取得部12は、記憶部11から解析対象動画を取得すると、解析部15に送信する。
【0019】
画像取得部12は、グループ設定部21を備えている。ここで、頭頸部31には、X線透過性がほぼ同等となる複数の組織が存在するため、これらの組織を器官ごとにグループ分けすることができる。以下においては、第1グループのX線の透過性が最も低く、第4グループのX線の透過性が最も高い。なお、以下の記載のうち括弧書きのものは、
図3~
図10の領域分割例においては領域特定がされていない器官である。
【0020】
第1グループ 骨:頭蓋骨(上顎骨)、頚椎、下顎骨、舌骨、食塊
第2グループ 軟骨:甲状軟骨、(輪状軟骨)、(披裂軟骨)、(喉頭蓋)、(気管軟骨)
第3グループ 軟部組織:(唇)、(頬)、舌、軟口蓋、(咽頭壁)
第4グループ その他:脂肪、空気層、気道
【0021】
2次元CT画像は、X線透過性に応じた濃淡で表示される。そこで、グループ設定部21は、断層撮影により取得した2次元CT画像の濃淡に対して、閾値に基づいて第1~第4グループのグルーピングを行い、設定したグループを識別する境界を2次元CT画像に重畳させる。なお、グルーピングに用いられる閾値は、後述の学習部14内の分割補助部23に含まれるグループ識別部24に相当する学習モデルにより得られる値を利用してもよい。このようにX線透過性に応じた前処理を行った4次元CT画像が、画像処理部13に入力される。
【0022】
学習部14は、学習用の4次元CT画像を用いて、頭頸部31の各組織のそれぞれの特徴を学習モデルに学習させることで、4次元CT画像を構成する各2次元CT画像について頭頸部31の各組織をそれぞれ区画化することが可能な学習済みモデルを構築する。学習部14によって得られる学習済みモデルによって、各2次元CT画像内における頭頸部31の組織が組織ごとに区画化され、対応するラベルが付与される。
【0023】
学習部14は、機能に着目すると、区画化部22と、区画化補助部23とを備える。区画化部22は、入力された学習用4次元CT画像群に対して領域分割の技術を用いて機械学習を行う。この区画化部22により行われる領域分割の機械学習により、4次元CT画像を構成する2次元CT画像に対して組織毎に区画化を行う学習済みモデルが得られる。区画化補助部23は、区画化部22による区画化の精度を向上させるために、機械学習において補助を行う。区画化補助部23は、グループ識別部24、優先学習部25、及び、不確実性計算部26を有しており、これらによって機械学習の補助が行われる。
【0024】
なお、学習部14におけるこのような構成は、学習部14における機能を説明するために便宜上設けたものであって、実際には、学習部14においては、画像認識により特徴量を求め、これらの特徴量に基づいて頭頸部31の各組織を特定する学習が行われており、学習方法を工夫することによって、学習部14内の各構成と対応する機能が得られる。
【0025】
区画化部22は、学習工程において、学習用である区画化済4次元CT画像を教師データとして用いた機械学習を行う。機械学習により得られる学習済みモデルは、入力される4次元CT画像等の解析対象動画に基づいて領域分割を行い、組織ごとに区画(領域)を特定して、当該区画に組織と対応するラベルを付して出力する。そして、出力される区画及びラベルと教師データの正解区画及びラベルとを損失関数を用いて評価し、評価結果に基づいて最適器が学習モデル内のパラメータを調整する。このような学習を繰り返すことで、最適なパラメータが設定されて、領域分割のための学習済みモデルが得られる。なお、上述の区画化部22による区画化の処理は、機械学習を用いた一例であって、種々の機械学習の方法を用いることができる。
【0026】
グループ識別部24は、グループ設定部21と同様に、2次元CT画像において各組織の階層性を利用して、第1~第4グループの順に区画化を行う。また、下位グループは上位グループの領域や、グループ間の位置関係を考慮して区画化が行われる。
【0027】
また、グループ識別部24は、X線透過性や組織の位置や配置に加えて、所属する器官や組織の硬さに応じて組織をグループ分けしてもよい。例えば、骨等の組織は硬く変形が少なく、軟部組織は柔らかく変形が大きいため、各組織の硬さを考慮してグループ分けをして、区画化をしてもよい。
【0028】
優先学習部25は、取得した一連の咀嚼嚥下動作を示す解析対象動画の中で、同じ位置で時系列に連続する2次元CT画像の変化量を抽出し、変化量が小さい時刻の2次元CT画像を選択して、優先的に機械学習(最適化)を行わせる。その後、変位が大きい時刻の2次元CT画像を選択して機械学習を行う。
【0029】
咀嚼嚥下動作中には、動作の開始前、終了後、または、動作中に、頭頸部31の一部または全部の組織の動きが遅くなり、一時的に動作が静止する期間が存在する。変化量が小さい時刻においては区画化の結果に対する信頼性が高いと考えられるので、変化量の小さい時刻の2次元CT画像を選択して優先的に機械学習を行い、その後、変化量の大きい時刻の2次元CT画像を選択して機械学習を行う。このように、変化量に応じて機械学習の優先度を変更することで、学習精度を高めることができる。
【0030】
変化量の一例としては、優先学習部25は、解析対象動画を構成する2次元CT画像のそれぞれについて、時系列に隣接する2次元CT画像同士を比較して全ボクセルの変化量の合計を算出する。他の変化量の一例としては、優先学習部25は、まず、各2次元CT画像について組織のおおよその識別と位置検知とを行い、時系列に隣接する2次元CT画像の検知した組織の位置の変化量を算出する。
【0031】
不確実性計算部26は、自身の機械学習の結果に対する信頼性の低い(不確実性の高い)箇所を求め、その箇所についての学習を強化する。例えば、不確実性計算部26は、信頼性の低い箇所を自動解析し、性能向上のための追加学習データを自動選択することで、学習を強化する。他の例としては、不確実性計算部26は、自身の機械学習の結果に対する信頼性の低い(不確実性の高い)箇所を求め、その箇所について自動または手動で学習を強化してもよい。
【0032】
また、学習モデルが畳み込みニューラルネットワークである場合には、畳み込みニューラルネットワークにおける神経回路網の特徴として、畳み込み層間の結合の一部が途切れて脱落しても、最終結果には大きな影響を与えないということが知られている。また、ベイジアンニューラルネットワークのように、出力結果に確率分布を含める技術が知られている。そこで、ニューラルネットワーク内のノードの結合をランダムに脱落させて、出力されるラベルの確率分布が大きく変わらないように学習モデルのパラメータを設定する。
【0033】
なお、不確実性計算部26は、信頼性の高い結果が得られる時間フレームと、信頼性の低い結果が得られる時間フレームとを区別し、信頼性の高い結果が得られる時間フレームにおける信頼性の高い部分の区画化の結果を考慮して、信頼性の低い時間フレームや信頼性の低い部分の区画化を実行する。このようにして、区画化の精度を向上させることができる。
【0034】
さらに、不確実性計算部26により算出される不確実性を示すパラメータは、学習済みモデルからの出力に含まれる。これにより、出力された画像を診断する診断者は、区画化の結果の信頼性を参考にして不確実性の低い箇所を優先的に確認することができるため、診断精度の向上を図ることができる。
【0035】
図3は、あるタイミングにおける、下方から100番目(下端から50mmの位置)の断面における下顎骨付近をZ軸側から被撮影者を見た2次元CT画像の一例である。
図4は、あるタイミングにおける、下方から200番目(下端から100mmの位置)の断面における上顎骨付近をZ軸側から被撮影者を見た2次元CT画像の一例である。
図5は、あるタイミングにおける、側方のx軸側から被撮影者を見た2次元CT画像の一例である。これらの2次元CT画像は、区画化済4次元CT画像を構成する画像の一部である。
【0036】
図3及び
図4では、被撮影者の顔の正面が上方に向かうように撮影(軸位断ともいう)され、
図5では、被撮影者の顔が左方に向かうように撮影(矢状断ともいう)される。以下では、各図に示された構成について図中の上下左右の方向を用いて説明するが、2次元CT画像の配置は図示された例に限らず、任意の方向で配置できる。
【0037】
図3には、図上部に逆V字型の下顎骨41が示されており、下顎骨41の下方に矩形状の舌42が示されている。舌42の下方の2か所の角の近傍には、外側下方に向かうような舌骨48が示されている。また、舌42の下側には、横方向に延在する気道43が示されている。そして、気道43の下方には、4つの部位に分かれて頚椎44が示されている。なお、この2次元CT画像において、下顎骨41~頚椎44以外の場所は、実際の撮影画像に対して濃淡を2値化して示されている。
【0038】
図4には、図上部に逆U字型の上顎骨45が示されており、上顎骨45の下部に隣接して、比較的大きな領域で同じく逆U字状の気道43が示されている。なお、上顎骨は、頭蓋骨の一部であるため、以下では、上顎骨(頭蓋骨)と記載する。この図において、気道43は、計3か所示されている。そして、上方の2つの気道43の間には舌42が示されており、下方の2つの気道43の間には軟口蓋46が示されている。また、
図3と同様に、下方には、4つの部位に分かれて頚椎44が示されている。
【0039】
図5においては、被撮影者の気管の上部から鼻の上部までの領域が撮影されており、被撮影者の口唇部が図左方に向き、後頭部が図右方に向かうように示されている。図中央の被撮影者の首の位置には上下方向に延在する頚椎44が示されている。図左方には、被撮影者の口唇部を構成する下顎骨41と上顎骨(頭蓋骨)45とが示されている。下顎骨41の図右方の内側には、舌42が示され、上顎骨(頭蓋骨)45の図右方の内側には、軟口蓋46が示されている。また、図下方の被撮影者の喉部には、甲状軟骨47が示されている。
【0040】
また、下顎骨41、舌42、及び、上顎骨(頭蓋骨)45と、頚椎44との間には、複数の気道43が示されている。なお、気道43は、学習済みモデルを利用した解析部15による画像解析によって、一部の領域のみが区画化して示されることがある。これは、原則として閉じられた領域に対して組織を特定して区画化するが、気道43の表面が閉じていないことに起因する。また、被撮影者の後頭部には、頭蓋骨45の一部が示されている。
【0041】
図6は、2次元CT画像を立体再構築した3次元CT画像の一例である。この図では
図5と同様に、被験者の首から鼻の上部までの領域が撮影されており、被撮影者の口唇部が図左方に向き、後頭部が図右方に向くように示されている。
【0042】
図右部の被撮影者の首の位置には上下方向に延在する頚椎44が示されており、図上部には、被撮影者の後頭部の頭蓋骨45が示されている。また、図左方には、頭蓋骨45の一部である上顎骨とともに被撮影者の口唇部を構成する下顎骨41が示されおり、下顎骨41に覆われるように舌42が示されている。また、被撮影者の首部には左方の正面側に甲状軟骨47が示されている。また、上述と同様の理由により、気道43には、一部の領域のみが区画化して示されている。
【0043】
区画化済4次元CT画像においては、これらの図に示すように、各組織の領域とともに、組織ごとのラベルが付される。また、解析部15から出力される4次元CT画像には、これらの図に示すように、分割して表示される領域のそれぞれに対して組織ごとのラベルが付され、さらに、領域認識結果の信頼度もボクセルごとに含まれる。
【0044】
次に、時系列に変化する頭頸部31の区画化済4次元CT画像の例について説明する。
図7は、
図3の2次元CT画像の学習用データの時系列の変化を示す図であり、
図8は、
図4の2次元CT画像の学習用データの時系列の変化を示す図であり、
図9は、
図5の2次元CT画像の学習用データの時系列の変化を示す図であり、
図10は、
図6の3次元CT画像の学習用データの時系列の変化を示す図である。これらの図においては、被撮影者が嚥下を行っている場合の時系列の変化が、(a)~(g)の順に示されている。
【0045】
図7には、下顎骨付近の2次元CT画像が示されている。この図に示すように、嚥下に伴って下顎骨41の撮影位置が変化し、その結果、図中の下顎骨41の形状が変化する。また、嚥下の動きに伴って、
図7(a)、(b)で存在する舌42は、
図7(c)においては甲状軟骨47の上方への移動に伴って消失する。さらに、
図7(d)においては気道43が出現し、
図7(g)においては再び舌42が出現する。また、舌骨48は、嚥下の動作に伴って上下に移動するため、嚥下開始の
図7(a)~(c)、及び、嚥下終了の
図7(g)には示されるが、嚥下の途中の
図7(d)~(f)には示されていない。
【0046】
図8には、上顎骨付近の2次元CT画像が示されている。この図に示すように、嚥下に伴う上顎骨(頭蓋骨)45の動きは小さいため、
図8(a)~(g)において、上顎骨(頭蓋骨)45の大きさは略同等である。
図8においては、主に、舌42の動きに起因した変化が示されており、
図8(a)~(c)で大きく示されていた気道43は、
図8(e)では、舌42に置き換わる。その後、
図8(f)、(g)では、舌42の撮影領域が小さくなり、再び気道43が出現する。
【0047】
図9には、左側方から見た頭頸部31の2次元CT画像が示されている。
図8と同様に、嚥下に伴う上顎骨(頭蓋骨)45の動きは小さく、
図7に示したように、下顎骨41の動きが大きい。下顎骨41は、
図9(b)で上方に移動すると、
図9(f)まで大きく位置を変えず、
図9(g)において、再び下方に移動する。
図9(b)~(f)においては、上顎骨(頭蓋骨)45及び下顎骨41の内部において、舌42の動きによって、気道43の大きさが変化する。また、軟口蓋46は、
図9(a)では舌42と接しているが、舌42の動きともに上方に移動して、
図9(c)では、舌42と離間して間に気道43が形成される。その後、
図9(f)では再び舌42と接触する。
【0048】
図10には、左側方から見た頭頸部31の2次元CT画像を再構築した3次元CT画像が示されている。
図10(a)~(g)は、
図9(a)~(g)と対応した嚥下の動作が示されている。これらの図に示すように、嚥下に伴う上顎骨(頭蓋骨)45の動きは小さく、下顎骨41の動きが大きい。また、頸部においては、
図10(b)~(e)に示すように、嚥下中は甲状軟骨47が上方に移動し、
図10(g)に示すように、嚥下を終えると甲状軟骨47は下方に移動する。
【0049】
このように、4次元CT画像においては、時系列に変化する頭頸部31の3次元CT画像が含まれることになる。そして、嚥下動作においては、上顎骨(頭蓋骨)45の動きは小さく、下顎骨41は嚥下開始と終了時の動きが大きいが、嚥下中の動きは小さい。また、舌42は、嚥下開始と終了時の動きが小さいが、嚥下中の動きは大きい。甲状軟骨47は、嚥下中において周期的に上下に移動する。そのため、全体的に変化量の小さい上顎骨(頭蓋骨)45の学習を優先した後、嚥下開始や終了時に変化量の小さい下顎骨41や舌42の学習を行い、その後、他の組織の学習を行うのが望ましいことが理解できる。
【0050】
また、学習部14によって行われる機械学習において、他の情報を参照してもよい。撮影対象が心臓や肺である場合には、心電図情報や呼吸周期に同期させて、画像の区画化を行うことがある。仮に4次元CT画像の時間分解能が低い場合であっても、比較的時間分解能の高いX線透視動画(2次元X線透視動画)を同期させて頭頸部31の4次元CT画像を画像解析することで、組織毎の区画化の精度向上を図ることができる。
【0051】
また、4次元CT画像の区画化を行った結果を、嚥下造影動画等のX線透視動画の区画化の学習データとして用いてもよい。他に、4次元CT画像から、筋骨格(および食塊)の4次元CT画像への変換を行ってもよい。
【0052】
以下、本実施形態により解決が期待される、頭頸部31の咀嚼、嚥下領域の動画解析における課題について説明する。
【0053】
1つ目の課題は、X線透過性に起因するものである。心臓(心筋)や肝臓(肝組織)などの器官は、X線透過性が略均一な組織で構成され、隣接器官との区別が容易である。また、下肢は、主に筋肉と骨により構成されるが、骨が棒状で、筋も大きいため、区別は比較的容易である。これに対して、頭頸部31は、第1~第4グループに示したように、グループ間ではX線透過性が異なるものの、グループ内ではX線透過性がほぼ同じである組織が、一つの器官に混在しているため、器官の区別ならびに器官内での組織の区別が容易ではない。
【0054】
2つ目の課題は、器官や組織の境界の不明瞭さに起因するものである。撮影対象が心臓である場合には、心臓は肺と重なる。撮影対象が肝臓である場合にも、肝臓は他の器官と重なる。しかしながら、両者ともに重なる器官との間には空気層や脂肪組織が存在するので境界を比較的識別しやすい。また、撮影対象が下肢である場合には、筋が大きく筋の境界に脂肪があるので境界は比較的識別しやすい。これに対して、頭頸部31は、狭い領域に口腔と咽頭、喉頭、食道の複数の器官が存在し、口腔と咽頭、喉頭、食道は切れ目なく連続し、境界部のX線透過性も略均一である。また、器官に存在する組織の中には、内部に複数の他の組織を内包するものもある。例えば、口腔では下顎骨や上顎骨と頬、歯、歯肉、舌が重なり、咽頭では舌根、軟口蓋、扁桃、咽頭壁、下顎骨、舌骨、頚椎が重なり、喉頭では喉頭蓋、甲状軟骨、輪状軟骨、声帯、披裂が重なる。そのため、静止時のCT画像でも口腔と咽頭、喉頭の境界、ならびに各器官を構成する組織の境界は不明瞭となってしまう。
【0055】
3つ目の課題は、アーティファクトに起因するものである。撮影対象が心臓である場合には、心臓の運動は周期性のある変形であり、位置は大きく変わらない。撮影対象が肝臓である場合にも、肝臓は呼吸に伴った周期性のある運動を行うが、変形の程度も緩やかである。また、撮影対象が下肢である場合には、下肢は位置を変えるが、筋肉の変形は小さい。これに対して、頭頸部31は、多数の組織が同時刻に運動し、変形しつつ位置を変え、また、それぞれの組織の運動が速いので、最新の4次元CT画像の技術を用いても正確な画像を撮影できないという、モーションアーティファクト(モーションブラーともいう)の影響が存在する。さらに口腔内の歯科補綴物に金属が含まれている場合は、メタルアーティファクトの影響も無視できない。
【0056】
これらの課題に対して、本実施形態の画像解析装置1によれば、頭頸部31の特徴を考慮して機械学習の補助を行う区画化補助部23内の構成によって、以下のように機械学習の精度向上を図る。
【0057】
グループ識別部24は、X線透過率に基づいて組織をグループに分類し、グループ内の組織の特徴を学習モデルに学習させる。例えば、グループ識別部24は、組織をX線透過率の低いグループから高いグループの順に、グループ内の組織の特徴を学習モデルに学習させる。また、グループ識別部24は、このようにX線透過率の異なる組織ごとにグルーピングし、グループごとに領域、位置関係を考慮して、信頼性の高い第1グループから順に各組織の特徴の学習を行うことができる。
【0058】
グループ識別部24は、さらに組織の配置に基づいてグループに分類し、グループ内の組織の特徴を学習モデルに学習させてもよい。組織の階層性を利用して、信頼性の高い組織から区画化に必要な各組織の特徴の学習を行うことができる。
【0059】
また、区画化補助部23の優先学習部25は、4次元CT画像を構成する2次元CT画像について時系列に隣接する変化量を求め、変化量の低い2次元CT画像から高い2次元CT画像の順に、グループ内の組織の特徴を学習モデルに学習させる。このようにしても、信頼性の高い2次元CT画像から順に、区画化に必要な各組織の特徴の学習を行うことができる。
【0060】
不確実性計算部26は、学習モデルがニューラルネットワークである場合には、ニューラルネットワークのノード間の結合を脱落させ、脱落前後において、学習される組織の特徴の差が小さくなるように、ニューラルネットワーク内のパラメータを調整する。不確実性計算部26は、ある2次元CT画像について時系列に隣接する2次元CT画像の変化量を求め、変化量の高い2次元CT画像から低い2次元CT画像の順に、グループ内の組織の特徴を学習モデルに学習させる。このようにしても、信頼性の高い2次元CT画像から順に、区画化に必要な各組織の特徴の学習を行うことができる。
【0061】
また、区画化補助部23の不確実性計算部26は、ボクセル毎に不確実性を計算し、計算により得られた不確実性を示すパラメータを出力に含める。このようにすることで、出力された画像を診断する診断者は、出力される信頼性を参考にして不確実性の低い箇所を優先的に確認することができる。
【0062】
このように、学習部14は、区画化を行う区画化部22に加えて、さらにその区画化を補助する区画化補助部23を備えていることにより、頭頸部31の4次元CT画像に対する組織ごとの区画化を行う。
【0063】
以上の構成において、画像解析装置1は、頭頸部31の各組織が運動しているときの頭頸部31の内部を撮影した3次元画像が時系列に連続して配置された構成でなる複数の4次元画像について、当該4次元画像ごとにそれぞれ4次元画像内における頭頸部31の各組織をそれぞれ組織ごとに区画化した複数の区画化済4次元画像を、学習用4次元画像群として取得する。そして、画像解析装置1は、学習用4次元画像群を用いて組織ごとの特徴を学習させた学習済みモデルを構築し、当該学習済みモデルを予め記憶部11に記憶する。
【0064】
画像解析装置1は、頭頸部31の各組織が運動しているときの頭頸部31の内部を撮影した2次元画像が時系列に連続して配置された構成でなる2次元動画、又は、新たな前記4次元画像を、解析対象動画として画像取得部12により取得すると、記憶部11に記憶されている学習済みモデルを用いて、解析部15によって、解析対象動画内における頭頸部31の各組織をそれぞれ組織ごとに区画化する動画解析を行う。
【0065】
これにより、画像解析装置1は、学習済みモデルを用いて、解析対象動画内における頭頸部31の各組織をそれぞれ組織ごとに区画化した動画解析が行えることから、その分、人手によって解析対象動画内の各組織をそれぞれ組織ごとに区画化する手間を軽減し得、解析対象動画に基づいて頭頸部31の各組織の運動を解析する際に人手による作業負担を軽減し得る。
【0066】
なお、上述した実施形態においては、2次元動画及び4次元画像として、対象者が嚥下や咀嚼を行っている際の対象者の頭頸部31を公知のX線断層装置によって断層撮影することにより得られる2次元CT動画や4次元CT画像を適用した場合について述べたが、本発明はこれに限らず、例えば、対象者が嚥下や咀嚼を行っている際の対象者の頭頸部31を公知のMRI画像診断装置によって断層撮影することにより得られる2次元MRI動画や4次元MRI画像を、2次元動画及び4次元画像として適用してもよい。
【0067】
なお、本発明は、本発明の広義の精神と範囲を逸脱することなく、様々な実施形態及び変形が可能とされるものである。また、上述した実施形態は、本発明を説明するためのものであり、本発明の範囲を限定するものではない。すなわち、本発明の範囲は、実施形態ではなく、特許請求の範囲によって示される。そして、特許請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形が、本発明の範囲内とみなされる。
【符号の説明】
【0068】
1 画像解析装置
11 記憶部
12 画像取得部
13 画像処理部
14 学習部
15 解析部
31 頭頸部
32 2次元CT画像