(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023184215
(43)【公開日】2023-12-28
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
A61B 6/03 20060101AFI20231221BHJP
G06T 7/00 20170101ALI20231221BHJP
G06V 10/774 20220101ALI20231221BHJP
A61B 6/00 20060101ALI20231221BHJP
G06T 7/30 20170101ALI20231221BHJP
【FI】
A61B6/03 360Q
G06T7/00 612
G06T7/00 350B
G06V10/774
A61B6/00 360B
G06T7/30
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022098247
(22)【出願日】2022-06-17
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和3年度 国立研究開発法人日本医療研究開発機構、医療機器等における先進的研究開発・開発体制強靭化事業 術中の迅速な判断・決定を支援するための診断支援機器・システム開発(研究開発課題名:「術前と術中をつなぐスマート手術ガイドソフトウェアの開発」)、産業技術力強化法第17条の適用を受けるもの
(71)【出願人】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】五十嵐 健夫
(72)【発明者】
【氏名】楊 溪
(72)【発明者】
【氏名】夏 鼎
(72)【発明者】
【氏名】金 太一
【テーマコード(参考)】
4C093
5L096
【Fターム(参考)】
4C093AA22
4C093AA24
4C093AA26
4C093CA21
4C093FD03
4C093FF11
4C093FF37
4C093FF42
5L096AA06
5L096AA09
5L096BA06
5L096BA13
5L096FA25
5L096FA66
5L096FA67
5L096FA69
5L096GA32
5L096GA34
5L096GA51
5L096HA11
5L096JA03
5L096JA09
5L096KA04
(57)【要約】
【課題】検査対象部位の部分画像と全体画像との良好な位置合わせを行うことが可能な情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】情報処理装置100は、患者の検査対象部位の撮影により取得された第1画像と、患者の検査対象部位の撮影により取得された第2画像とを取得する画像取得部124と、第1画像を、検査対象部位の標準的な形状情報を含むテンプレート空間に配置する第1処理部125と、第2画像をテンプレート空間に配置する第2処理部126と、テンプレート空間に配置された第1画像と第2画像との位置合わせを行う位置合わせ部127とを備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
患者の検査対象部位の撮影により取得された第1画像と、前記患者の前記検査対象部位の撮影により取得された第2画像とを取得する画像取得部と、
前記第1画像を、前記検査対象部位の標準的な形状情報を含むテンプレート空間に配置する第1処理部と、
前記第2画像を前記テンプレート空間に配置する第2処理部と、
前記テンプレート空間に配置された前記第1画像と前記第2画像との位置合わせを行う位置合わせ部と
を備える情報処理装置。
【請求項2】
前記第1処理部は、前記第1画像から固定サイズを有するボリュームをサンプリングしたパッチ画像と、前記パッチ画像の前記テンプレート空間中での予測位置とを所定数取得し、前記所定数のパッチ画像と予測位置とに基づいて、前記第1画像を前記テンプレート空間に配置する、請求項1に記載の情報処理装置。
【請求項3】
前記第1処理部は、前記パッチ画像を学習済モデルに入力することで前記予測位置を取得する、請求項2に記載の情報処理装置。
【請求項4】
前記位置合わせ部は、局所探索法を用いて前記第1画像と前記第2画像との位置合わせを行う、請求項1に記載の情報処理装置。
【請求項5】
前記第1画像は第1イメージング装置を用いて取得され、前記第2画像は、第2イメージング装置を用いて取得される、請求項1に記載の情報処理装置。
【請求項6】
前記第1画像は前記検査対象部位の一部のみを含む部分画像であり、前記第2画像は前記検査対象部位の全体を含む全体画像である、請求項1に記載の情報処理装置。
【請求項7】
患者の検査対象部位の撮影により取得された第1画像と、前記患者の前記検査対象部位の撮影により取得された第2画像とを取得することと、
前記第1画像を、前記検査対象部位の標準的な形状情報を含むテンプレート空間に配置することと、
前記第2画像を前記テンプレート空間に配置することと、
前記テンプレート空間に配置された前記第1画像と前記第2画像との位置合わせを行うことと
を含む方法。
【請求項8】
1又は複数のコンピュータに、
患者の検査対象部位の撮影により取得された第1画像と、前記患者の前記検査対象部位の撮影により取得された第2画像とを取得する処理と、
前記第1画像を、前記検査対象部位の標準的な形状情報を含むテンプレート空間に配置する処理と、
前記第2画像を前記テンプレート空間に配置する処理と、
前記テンプレート空間に配置された前記第1画像と前記第2画像との位置合わせを行う処理と
を実行させるプログラム。
【請求項9】
テンプレート空間中の位置情報が正解データとしてラベル付けされたパッチ画像を機械学習モデルに入力して前記機械学習モデルを学習させる学習部であって、前記パッチ画像は、患者の検査対象部位の撮影により取得された第1画像中の固定サイズを有するボリュームであり、前記テンプレート空間は、前記検査対象部位の標準的な形状情報を含む、学習部
を備える情報処理装置。
【請求項10】
テンプレート空間中の位置情報が正解データとしてラベル付けされたパッチ画像を取得することであって、前記パッチ画像は、患者の検査対象部位の撮影により取得された第1画像中の固定サイズを有するボリュームであり、前記テンプレート空間は、前記検査対象部位の標準的な形状情報を含む、ことと、
前記パッチ画像を用いて機械学習モデルを学習させることであって、前記機械学習モデルは、前記テンプレート空間中での前記パッチ画像の位置を推定する機械学習モデルである、ことと
を含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
医用画像処理の分野では異なるイメージング装置で得られた複数の画像の位置合わせを行い、それぞれの画像がもつ特徴を十分に利用することを可能とする処理手法の開発が行われてきた。このような処理は画像レジストレーション処理、すなわち画像位置合わせ処理とよばれ、医用画像処理分野における重要な処理手法の一つとなっている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Kin, T., Nakatomi, H., Shojima, M., Tanaka, M., Ino, K., Mori, H., Kunimatsu, A.,Oyama, H., Saito, N.: A new strategic neurosurgical planning tool for brainstem cavernous malformations using interactive computer graphics with multimodal fusion images. Journal of neurosurgery 117(1), 78-88 (2012)
【非特許文献2】Sandk"uhler, R., Jud, C., Andermatt, S., Cattin, P.C.: Airlab: Autograd image registration laboratory. arXiv preprint arXiv:1806.09907 (2018)
【発明の概要】
【発明が解決しようとする課題】
【0004】
異なるイメージング装置で得られた複数の画像の位置合わせ手法において、従来からMean Square Error(MSE)やNormalized Mutual Information(NMI)が画像間類似度の尺度として利用されている(非特許文献1)。従来の位置合わせ手法は、事前にラフな位置合わせとして初期設定を行った上で局所探索法を適用することで正確な位置合わせが可能である。しかしながら、臓器の一部のみを含む部分画像と臓器全体をカバーする全体画像との良好な初期設定を行う技術は存在しない。
【0005】
例えば、
図6に示されるようなCT画像(全体画像の一例)と3D Rotation Angiography(3DRA)画像(部分画像の一例)との位置合わせを行う例について検討する。従来技術では2つの画像の中心を揃えることで初期設定を行うため、部分画像の実際の中心位置が全体画像の中心位置から離れている場合には、局所探索法による位置合わせが局所解に陥ってうまく機能しないことがある。そのため、手作業で3DRA画像がCT画像のどのあたりに位置するかを設定し、その後、局所探索法を用いることで、3DRA画像とCT画像の位置合わせを実現している。
【0006】
そこで、本発明は、検査対象部位の部分画像と全体画像との良好な位置合わせを行うことが可能な情報処理装置、情報処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一態様に係る情報処理装置は、患者の検査対象部位の撮影により取得された第1画像と、患者の検査対象部位の撮影により取得された第2画像とを取得する画像取得部と、第1画像を、検査対象部位の標準的な形状情報を含むテンプレート空間に配置する第1処理部と、第2画像をテンプレート空間に配置する第2処理部と、テンプレート空間に配置された第1画像と第2画像との位置合わせを行う位置合わせ部とを備える。
【0008】
この態様によれば、情報処理装置は、第1画像と第2画像とをそれぞれテンプレート空間に配置することで、両画像の良好な初期設定を行うことができる。良好な初期設定を行った後に位置合わせ部が処理することで、正確な位置合わせを行うことができる。
【0009】
上記情報処理装置において、第1処理部は、第1画像から固定サイズを有するボリュームをサンプリングしたパッチ画像と、パッチ画像のテンプレート空間中での予測位置とを所定数取得し、所定数のパッチ画像と予測位置とに基づいて、第1画像をテンプレート空間に配置してもよい。この態様によれば、任意のサイズの第1画像について、同様にパッチ画像とパッチ画像のテンプレート空間中での予測位置とを取得し、取得した情報を用いて第1画像をテンプレート空間に配置することができる。
【0010】
上記情報処理装置において、第1処理部は、パッチ画像を学習済モデルに入力することで予測位置を取得してもよい。この態様によれば、所望の精度を有する予測位置を容易に取得することができる。さらに、学習済モデルへの入力データをパッチ画像としたことで、当該学習済モデルを得るために機械学習モデルを学習させる際の学習データとして、1の画像から多くの学習データを取得することができる。
【0011】
上記情報処理装置において、位置合わせ部は、局所探索法を用いて第1画像と第2画像との位置合わせを行ってもよい。この態様によれば、情報処理装置は、第1画像をテンプレート空間に配置した後、精緻な局所探索法を用いて第2画像との最終的な位置合わせを行うので、テンプレート空間への配置精度を必要以上に高めることなく、正確な位置合わせを行うことができる。
【0012】
上記情報処理装置において、第1画像は第1イメージング装置を用いて取得され、第2画像は、第2イメージング装置を用いて取得されてもよい。この態様によれば、異なるイメージング装置で取得された第1画像と第2画像との正確な位置合わせを行うことができる。
【0013】
上記情報処理装置において、第1画像は検査対象部位の一部のみを含む部分画像であり、第2画像は検査対象部位の全体を含む全体画像であってもよい。この態様によれば、検査対象部位の一部のみを含む部分画像と検査対象部位の全体を含む全体画像との正確な位置合わせを行うことができる。
【0014】
本発明の他の態様に係る方法は、患者の検査対象部位の撮影により取得された第1画像と、患者の検査対象部位の撮影により取得された第2画像とを取得することと、第1画像を、検査対象部位の標準的な形状情報を含むテンプレート空間に配置することと、第2画像をテンプレート空間に配置することと、テンプレート空間に配置された第1画像と第2画像との位置合わせを行うこととを含む。
【0015】
本発明の他の態様に係るプログラムは、1又は複数のコンピュータに、患者の検査対象部位の撮影により取得された第1画像と、患者の検査対象部位の撮影により取得された第2画像とを取得する処理と、第1画像を、検査対象部位の標準的な形状情報を含むテンプレート空間に配置する処理と、第2画像をテンプレート空間に配置する処理と、テンプレート空間に配置された第1画像と第2画像との位置合わせを行う処理とを実行させる。
【0016】
本発明の他の態様に係る情報処理装置は、テンプレート空間中の位置情報が正解データとしてラベル付けされたパッチ画像を機械学習モデルに入力して機械学習モデルを学習させる学習部であって、パッチ画像は、患者の検査対象部位の撮影により取得された第1画像中の固定サイズを有するボリュームであり、テンプレート空間は、検査対象部位の標準的な形状情報を含む、学習部を備える。この態様によれば、検査対象部位の画像の、テンプレート空間中での位置の推論に用いることが可能な学習済モデルを得ることができる。
【0017】
本発明の他の態様に係る方法は、テンプレート空間中の位置情報が正解データとしてラベル付けされたパッチ画像を取得することであって、パッチ画像は、患者の検査対象部位の撮影により取得された第1画像中の固定サイズを有するボリュームであり、テンプレート空間は、検査対象部位の標準的な形状情報を含む、ことと、パッチ画像を用いて機械学習モデルを学習させることであって、機械学習モデルは、テンプレート空間中でのパッチ画像の位置を推定する機械学習モデルである、こととを含む。
【発明の効果】
【0018】
本発明によれば、検査対象部位の部分画像と全体画像との良好な位置合わせを行うことが可能な情報処理装置、情報処理方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0019】
【
図1】本発明の一実施形態に係る情報処理装置の処理を説明する概略図である。
【
図2】本発明の一実施形態に係る情報処理装置のブロック図である。
【
図3】本発明の一実施形態に係るディープニューラルネットワーク(DNN)の概要を示す図である。
【
図4】本発明の一実施形態に係る情報処理装置の学習処理を示すフローチャートである。
【
図5】本発明の一実施形態に係る情報処理装置の位置合わせ処理を示すフローチャートである。
【
図6】従来技術を用いた部分画像と全体画像の位置合わせ処理と、本発明の一実施形態に係る部分画像と全体画像の位置合わせ処理とを概念的に示す図である。
【発明を実施するための形態】
【0020】
添付図面を参照して、本発明の実施形態について説明する。なお、以下の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施形態を採用することが可能であり、係る実施形態も本発明の範囲に含まれる。
【0021】
(概要)
図1を用いて、本発明の概要について説明する。
図1は、本発明の一実施形態に係る情報処理装置の処理を説明する概略図である。
【0022】
情報処理装置は、患者の検査対象部位の撮影により取得された第1医用画像と第2医用画像の位置合わせを行う装置である。
図1に示されるように、情報処理装置は、第1医用画像(3DRA volume)と第2医用画像(CT volume)をそれぞれテンプレート空間に配置することで、両画像の大域的な初期設定を行う。その後、情報処理装置は、初期設定がなされた医用画像に対して、従来の局所探索法を用いた位置合わせを行い、最終的な位置合わせ結果を得る。
【0023】
本実施形態では、医用画像の一例として、患者の脳の血管系の詳細な情報を立体的に提供可能な3DRA画像と、患者の脳周囲の骨と軟組織に関する情報を提供可能なCT画像とを用いる。CT画像が脳全体をカバーしているのに対して、3DRA画像は、脳の一部をカバーするものである。医療現場では、放射線被爆を考慮して病変領域を含む部分のみ撮影することが一般的であるため、検査対象部位の一部を含む医用画像の位置合わせを可能とすることは重要である。
【0024】
テンプレート空間とは、検査対象部位の標準的な形状情報を含むものであり、本実施形態では、標準的な頭蓋骨形状情報を含む立方空間である。ここで、「標準的な」とは、検査対象部位の形状情報として、一般的なもの、平均的なもの、典型的なもの等に限られず、検査対象部位の形状情報の一例や、一例に基づくもの等であってよい。一実施形態では、ランダムに選択したテンプレートCT画像のボリュームを、一辺が128ピクセルの立方空間に適合するようにスケーリングし、CT画像の中心を立方空間の中心に合わせる。そして、立方空間の空の空間をバックグラウンド領域としたものをテンプレート空間として用いる。
【0025】
情報処理装置は、まず、
図1の上段に示されるように、3DRA画像を、
図1中に破線で示されるテンプレート空間に配置する。情報処理装置はまた、
図1の下段左側に示されるように、CT画像をテンプレート空間に配置する。そして、情報処理装置は、テンプレート空間内に配置することで大域的な初期設定がなされた3DRA画像とCT画像とに対して、従来の局所探索法を用いた位置合わせを行い、最終的な位置合わせ結果を得る。
【0026】
(機能構成)
図2は、本発明の一実施形態に係る情報処理装置のブロック図である。なお、
図2では、単一の情報処理装置100を想定し、必要な機能構成だけを示しているが、情報処理装置100を、複数のコンピュータシステムによる多機能の分散システムの一部として構成することもできる。
【0027】
情報処理装置100は、入力部110と、制御部120と、記憶部130と、通信部140とを備えている。
【0028】
入力部110は、情報処理装置100の管理者からの操作を受け付けるように構成され、キーボードやマウス、タッチパネル等によって実現することができる。
【0029】
制御部120は、プロセッサに相当するCPUやMPU等の演算処理部121及びRAM等のメモリ122を備えている。演算処理部121(プロセッサ)は、各種入力に基づき、記憶部130に記録されたプログラムをメモリ122に展開して実行することで、演算処理部121における後述する機能及び処理を実現する。このプログラムは、CD-ROM等のコンピュータ読み取り可能な非一時的な記録媒体に記憶され、若しくはネットワークを介して配布され、コンピュータにインストールされるものであってもよい。メモリ122は、演算処理部121(プロセッサ)によるプログラム実行に必要なワークメモリとして機能する。
【0030】
記憶部130は、ハードディスク等の記憶装置によって構成され、制御部120における処理の実行に必要な各種プログラムや、各種プログラムの実行に必要なデータ等を記録しておくものである。本実施形態では、記憶部130は、テンプレート空間記憶部131、学習データ記憶部132、学習済モデル133及び画像記憶部134を有していることが望ましい。
【0031】
テンプレート空間記憶部131には、大域的な初期設定に用いる空間情報が保存される。本実施形態では、テンプレート空間記憶部131には、一辺が128ピクセルの立方空間に中心を位置合わせしたテンプレートCT画像のボリューム情報を含む。なお、立方空間の空の空間は、バックグラウンド領域とする。
【0032】
学習データ記憶部132には、後述の機械学習モデルMの学習に用いる学習データが保存される。本実施形態では、学習データ記憶部132には、テンプレート空間中の位置情報が正解データとしてラベル付けされた、3DRA画像のパッチ画像を学習データとして記憶している。ここで、パッチ画像とは、任意のサイズの3D画像から取得した固定の小さなサイズを有するボリュームである。本実施形態では、パッチ画像のサイズとして16×16×16ピクセルを用いるが、他の任意のサイズを用いてもよい。
【0033】
ここで、機械学習モデルとは、所定のモデル構造と、学習処理によって変動する処理パラメータとを有し、学習データから得られる経験に基づいてその処理パラメータが最適化されることで、識別精度が向上するモデルである。すなわち機械学習モデルは、学習処理によって最適な処理パラメータを学習するモデルである。機械学習モデルのアルゴリズムは、例えば、サポートベクターマシン、ロジスティック回帰、ニューラルネットワーク等を用いることができるが、その種類は特に限定されない。
【0034】
学習済モデル133には、部分画像のテンプレート空間への配置に用いる学習済モデルが保存される。本実施形態では、学習済モデル133には、パッチ画像を入力データとして受け取り、テンプレート空間中での予測位置を出力する学習済モデルが保存される。学習済モデルとは、任意の機械学習アルゴリズムによる機械学習モデルに対して、事前に適切な学習データを用いて学習を行ったモデルである。ただし、学習済モデルは、それ以上の学習を行わないものではなく、追加学習を行うこともできる。本実施形態では、学習済モデル133には、後述の機械学習モデルMの学習により得られた学習済モデルが保存される。
【0035】
本実施形態では、学習済モデル133の一例として、一辺が16ピクセルのパッチ画像を入力データとして受け取り、テンプレート空間中での予測位置を出力するディープニューラルネットワーク(DNN)を用いた実施例について説明する。しかしながら、DNNは学習済モデル133の一例にすぎず、情報処理装置100は、学習済モデル133として他の構成を用いてもよい。
【0036】
画像記憶部134には、位置合わせ対象の画像ペアが保存される。本実施形態では、画像記憶部134には、3DRA画像とCT画像とが対で保存されている。
【0037】
通信部140は、情報処理装置100をネットワークに接続するように構成される。例えば、通信部140は、LANカード、アナログモデム、ISDNモデム等、及びこれらをシステムバス等の伝送路を介して処理部と接続するためのインタフェースから実現することができる。
【0038】
さらに、
図2に示すように、演算処理部121は、機能部として、学習部123、画像取得部124、部分画像処理部125、全体画像処理部126、位置合わせ部127及び出力部128を備えている。
【0039】
学習部123は、学習データ記憶部132に記憶されている学習データを用いて、機械学習モデルMを学習させる。本実施形態では、学習部123は、テンプレート空間中の位置情報が正解データとしてラベル付けされた、3DRA画像のパッチ画像を機械学習モデルMに入力して、機械学習モデルMを学習させる。
【0040】
機械学習モデルMは、パッチ画像を入力データとして受け取り、テンプレート空間中での予測位置を出力する機械学習モデルである。本実施形態では、機械学習モデルMの一例として、パッチ画像を入力データとして受け取り、テンプレート空間中での予測位置を出力するDNNを用いた実施例について説明する。しかしながら、DNNは機械学習モデルMの一例にすぎず、情報処理装置100は、機械学習モデルMとして他の構成を用いてもよい。
図3に、本発明の一実施形態に係るDNNの概要を示す。
図3の例では、DNNは、5層の3次元畳み込み層と2層の全結合層により構成されている。
【0041】
学習部123は、機械学習モデルMが予測した位置と学習データにラベル付けされた正解データとのユークリッド距離を最小化するように、機械学習モデルMを学習させる。
【0042】
機械学習モデルMの学習が完了すると、情報処理装置100は、機械学習モデルMの学習により得られた学習済モデルを学習済モデル133に保存する。なお、学習部123は、例えば、所定数の学習データを用いて機械学習モデルMを学習させた後、学習を完了してもよいし、機械学習モデルMを用いて予測した位置の精度が所定の条件を満たした場合に学習を完了してもよい。
【0043】
画像取得部124は、位置合わせ対象の画像ペアを取得する。本実施形態では、画像取得部124は、3DRA画像とCT画像のペアを画像記憶部134から取得する。また、画像取得部124は、3DRA画像及びCT画像を、テンプレート空間として定義した一辺が128ピクセルの立方空間に適合するようにスケーリングする。一実施形態では、画像取得部124は、CT画像を一辺が128ピクセルの立方空間に適合するようにスケーリングし、CT画像のスケール比を用いて3DRA画像をスケーリングする。
【0044】
部分画像処理部125は、部分画像をテンプレート空間に配置する。本実施形態では、部分画像処理部125はまず、3DRA画像から16×16×16ピクセルのパッチ画像をサンプリングし、サンプリングしたパッチ画像を学習済モデル133に入力して、テンプレート空間中での予測位置(tx, ty, tz)を取得する。一実施形態では、部分画像処理部125は、16×16×16ピクセルのパッチ画像のうち、空の領域が40%以上のパッチ画像や中心がテンプレート空間外にあるパッチ画像は破棄するものとし、100個の利用可能なパッチ画像が得られるまで、3DRA画像からパッチ画像をサンプリングし、サンプリングしたパッチ画像のテンプレート空間中での予測位置を取得する。
【0045】
所定数のパッチ画像と予測位置のセットを取得すると、部分画像処理部125は、パッチ画像を対応する予測位置にできるだけ近く移動させる、3DRA画像の剛体変換行列Amovを決定する。本実施形態では、部分画像処理部125は、最小二乗フィッティングによって、3DRA画像から取得したパッチ画像のセットを予測位置のセットに変換するアフィン変換行列を計算し、アフィン変換行列の極分解によって剛体変換行列を得る。
【0046】
一実施形態では、部分画像処理部125は、所定数のパッチ画像と予測位置のセットから6つのセットをランダムに選択し、選択したセットを用いて剛体変換行列を計算するプロセスを2000回繰り返し、繰り返しのプロセスで得た剛体変換行列について、予測位置と剛体変換行列により得た位置との差が閾値以下となるパッチ画像をカウントする。そして、部分画像処理部125は、繰り返しのプロセスで得た剛体変換行列の中から、予測位置と剛体変換行列により得た位置との差が閾値以下となるパッチ画像が最も多い剛体変換行列を3DRA画像の剛体変換行列Amovとして決定してもよい。
【0047】
なお、部分画像処理部125は、3DRA画像の剛体変換行列の決定に先立ち、外れ値をフィルタリングするために、例えばRANSACを適用してもよい。なお、外れ値のフィルタリング手法はRANSACに限られることなく、他の任意の手法を用いることができる。
【0048】
全体画像処理部126は、全体画像をテンプレート空間に配置する。本実施形態では、全体画像処理部126は、CT画像の中心を、一辺が128ピクセルの立方空間の中心に合わせる。次に全体画像処理部126は、従来の局所探索法を用いてCT画像をテンプレート空間に位置合わせし、CT画像の剛体変換行列Afixを取得する。なお、本実施形態では、全体画像処理部126は、MSE又はNMIを画像間類似度の尺度とする局所探索法を用いるが、画像間類似度の尺度として他の任意の尺度を利用する局所探索法を用いてもよい。
【0049】
位置合わせ部127は、テンプレート空間内に配置することで大域的な初期設定がなされた部分画像と全体画像とに対して、最終的な位置合わせを行う。本実施形態では、位置合わせ部127はまず、3DRA画像をCT画像に位置合わせする相対的な剛体変換行列A
*を以下の式により求める。
【数1】
【0050】
次に、位置合わせ部127は、従来の局所探索法を用いて、相対的な剛体変換行列A*を用いて変換した部分画像と全体画像との位置合わせを行う。なお、本実施形態では、位置合わせ部127は、MSE又はNMIを画像間類似度の尺度とする局所探索法を用いるが、画像間類似度の尺度として他の任意の尺度を利用する局所探索法を用いてもよい。
【0051】
出力部128は、位置合わせ部127が位置合わせした結果を出力する。本実施形態では、出力部128は、CT画像に、位置合わせした3DRA画像を重畳して出力する。
【0052】
(学習処理)
図4を参照して、本発明の実施形態に係る情報処理装置の学習処理を詳細に説明する。本実施形態では、
図4で説明される学習処理を行う前に、情報処理装置100の管理者の管理の下、テンプレート空間記憶部131及び学習データ記憶部132に各種データが格納されているものとする。なお、
図4に示す処理は、例えば、管理者が入力部110を介して学習済モデルを生成する処理を実行するための指示を入力することで実行される。
【0053】
ステップS401において、情報処理装置100の学習部123は、機械学習モデルMの学習に用いる学習データを取得する。本実施形態では、学習部123は、学習データ記憶部132から、テンプレート空間中の位置情報が正解データとしてラベル付けされた、3DRA画像のパッチ画像を取得する。
【0054】
本実施形態では、学習データ記憶部132には、93個の3DRA画像の各3DRA画像から、150個のパッチ画像をランダムにサンプリングし、医療専門家によって正解データがラベル付けされた、13950の学習データが保存されている。なお、3DRA画像は、対となるCT画像を一辺が128ピクセルの立方空間に適合するようにスケーリングする際のスケール比を用いてスケーリングされたものである。
【0055】
次に、ステップS402において、情報処理装置100の学習部123は、取得した学習データを用いて、機械学習モデルMを学習させる。機械学習モデルMは、パッチ画像を入力データとして受け取り、テンプレート空間中での予測位置を出力するDNNである。
図3に、本発明の一実施形態に係るDNNの概要を示す。
図3の例では、DNNは、5層の3次元畳み込み層と2層の全結合層により構成されている。学習部123は、機械学習モデルMが予測した位置と学習データにラベル付けされた正解データとのユークリッド距離を最小化するように、機械学習モデルMを学習させる。
【0056】
本実施形態では、損失関数としてL1ノムル損失関数を用いる。外れ値に対する感度が高いL2ノムル損失関数ではなく、L1ノムル損失関数を用いることで、外れ値の影響を少なくすることができる。
【0057】
機械学習モデルMのモデル構造をより複雑にすることで、より正確な位置を予測することができる。一方で、より複雑なモデル構造の学習にはより多くの時間と学習データが必要となる。本実施形態では、学習済モデルを用いて3DRA画像をテンプレート空間に配置した後、精緻な局所探索法を用いてCT画像との最終的な位置合わせを行うので、機械学習モデルMの精度をより高める優先度は低い。
【0058】
機械学習モデルMの学習が完了すると、ステップS403において、情報処理装置100は、機械学習モデルMの学習により得られた学習済モデルを学習済モデル133に保存する。なお、学習部123は、例えば、所定数の学習データを用いて機械学習モデルMを学習させた後、学習を完了してもよいし、機械学習モデルMを用いて予測した位置の精度が所定の条件を満たした場合に学習を完了してもよい。
【0059】
(位置合わせ処理)
図5を参照して、本発明の実施形態に係る情報処理装置の位置合わせ処理を詳細に説明する。本実施形態では、
図5で説明される位置合わせ処理を行う前に、情報処理装置100の管理者の管理の下、学習済モデル133に学習済モデルが格納されているものとする。また、情報処理装置100の画像記憶部134には、位置合わせ対象の3DRA画像とCT画像とが対で格納されているものとする。なお、
図5に示す処理は、例えば、管理者が入力部110を介して位置合わせ処理を実行するための指示を入力することで実行される。
【0060】
ステップS501において、情報処理装置100の画像取得部124は、位置合わせ対象の画像ペアを取得する。本実施形態では、画像取得部124は、3DRA画像とCT画像のペアを画像記憶部134から取得する。
【0061】
ステップS502において、画像取得部124は、取得した画像ペアを、テンプレート空間に適合するようにスケーリングする。本実施形態では、画像取得部124は、テンプレート空間記憶部131に保存されたテンプレート空間の情報に基づいて、3DRA画像及びCT画像のスケーリングを行う。ここでは、画像取得部124は、CT画像を一辺が128ピクセルの立方空間に適合するようにスケーリングし、CT画像のスケール比を用いて3DRA画像をスケーリングする。
【0062】
ステップS503において、情報処理装置100の部分画像処理部125は、3DRA画像からパッチ画像をサンプリングし、サンプリングしたパッチ画像についてテンプレート空間中で予測される位置を求める。本実施形態では、部分画像処理部125は、サンプリングした16×16×16ピクセルのパッチ画像を学習済モデル133に入力して、出力として、テンプレート空間中での予測位置(tx, ty, tz)を取得する。
【0063】
本実施形態では、部分画像処理部125は、空の領域が40%以上のパッチ画像や中心がテンプレート空間外にあるパッチ画像は破棄するものとし、100個の利用可能なパッチ画像が得られるまで、3DRA画像からパッチ画像をサンプリングし、サンプリングしたパッチ画像のテンプレート空間中での予測位置を取得する。
【0064】
所定数のパッチ画像と予測位置のセットを取得すると、ステップS504において、部分画像処理部125は、外れ値をフィルタリングする。本実施形態では、部分画像処理部125は、RANSACを適用する。
【0065】
次に、ステップS505において、部分画像処理部125は、パッチ画像を対応する予測位置にできるだけ近く移動させる、3DRA画像の剛体変換行列Amovを決定する。本実施形態では、部分画像処理部125は、最小二乗フィッティングによって、3DRA画像から取得したパッチ画像のセットを予測位置のセットに変換するアフィン変換行列を計算し、アフィン変換行列の極分解によって剛体変換行列を得る。
【0066】
ここでは、部分画像処理部125は、所定数のパッチ画像と予測位置のセットから6つのセットをランダムに選択し、選択したセットを用いて剛体変換行列を計算するプロセスを2000回繰り返し、繰り返しのプロセスで得た剛体変換行列について、予測位置と剛体変換行列により得た位置との差が閾値以下となるパッチ画像をカウントする。そして、部分画像処理部125は、繰り返しのプロセスで得た剛体変換行列の中から、予測位置と剛体変換行列により得た位置との差が閾値として設定した10mm以下となるパッチ画像が最も多い剛体変換行列を3DRA画像の剛体変換行列Amovとして決定する。ステップS503~ステップS505の処理により、部分画像がテンプレート空間に配置される。
【0067】
続いて、ステップS506において、情報処理装置100の全体画像処理部126は、全体画像をテンプレート空間に配置する。本実施形態では、全体画像処理部126は、CT画像の中心を、一辺が128ピクセルの立方空間の中心に合わせる。次に全体画像処理部126は、従来の局所探索法を用いてCT画像をテンプレート空間に位置合わせし、CT画像の剛体変換行列Afixを取得する。なお、本実施形態では、全体画像処理部126は、MSE又はNMIを画像間類似度の尺度とする局所探索法を用いるが、画像間類似度の尺度として他の任意の尺度を利用する局所探索法を用いてもよい。
【0068】
ステップS507において、情報処理装置100の位置合わせ部127は、3DRA画像をCT画像に位置合わせする相対的な剛体変換行列A
*を求める。本実施形態では、位置合わせ部127は、以下の式を用いて剛体変換行列A
*を求める。
【数2】
【0069】
次に、ステップS508において、位置合わせ部127は、従来の局所探索法を用いて、相対的な剛体変換行列A*を用いて変換した部分画像と全体画像との位置合わせを行う。なお、本実施形態では、位置合わせ部127は、MSE又はNMIを画像間類似度の尺度とし、非特許文献2に記載の技術に基づく局所探索法を用いるが、画像間類似度の尺度として他の任意の尺度を利用する局所探索法を用いてもよい。
【0070】
ステップS509において、情報処理装置100の出力部128は、位置合わせ部127が位置合わせした結果を出力する。本実施形態では、出力部128は、CT画像に、位置合わせした3DRA画像を重畳して出力する。
【0071】
以上、本実施形態によれば、情報処理装置100は、3DRA画像とCT画像とをそれぞれテンプレート空間に配置することで、脳の一部を撮影した3DRA画像と脳全体を撮影したCT画像との良好な初期設定を行うことができる。良好な初期設定を行った後に従来の局所探索法を用いることで、脳の一部を撮影した3DRA画像と脳全体を撮影したCT画像とであっても、正確な位置合わせを行うことができる。
【0072】
また、本実施形態では、3DRA画像をテンプレート空間に配置した後、精緻な局所探索法を用いてCT画像との最終的な位置合わせを行うので、3DRA画像の配置に用いる学習済モデルの精度を必要以上に高めることなく、正確な位置合わせを行うことができる。
【0073】
さらに本実施形態では、3DRA画像からサンプリングしたパッチ画像を入力し、テンプレート空間中での予測位置を出力する学習済モデルを用いて、3DRA画像をテンプレート空間に配置した。このような構成とすることで、任意のサイズの3DRA画像について対処することができる。さらに、学習済モデルへの入力データをパッチ画像としたことで、機械学習モデルの学習データとして、1の3DRA画像から多くの学習データを取得することができる。
【0074】
なお、本実施形態では、検査対象部位の一例として脳を撮影した画像間の位置合わせについて説明してきたが、別の実施形態では、患者の他の検査対象部位の撮影により取得された、心臓の画像等の医用画像の位置合わせを行うことができる。
【符号の説明】
【0075】
100…情報処理装置、110…入力部、120…制御部、121…演算処理部、122…メモリ、123…学習部、124…画像取得部、125…部分画像処理部(第1処理部)、126…全体画像処理部(第2処理部)、127…位置合わせ部、128…出力部、130…記憶部、131…テンプレート空間記憶部、132…学習データ記憶部、133…学習済モデル、134…画像記憶部、140…通信部、M…機械学習モデル