(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024171696
(43)【公開日】2024-12-12
(54)【発明の名称】医用情報処理装置、医用情報処理方法及びプログラム
(51)【国際特許分類】
A61B 5/00 20060101AFI20241205BHJP
G16H 50/20 20180101ALI20241205BHJP
G16H 30/20 20180101ALI20241205BHJP
【FI】
A61B5/00 G
G16H50/20
G16H30/20
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023088849
(22)【出願日】2023-05-30
(71)【出願人】
【識別番号】594164542
【氏名又は名称】キヤノンメディカルシステムズ株式会社
(74)【代理人】
【識別番号】110001771
【氏名又は名称】弁理士法人虎ノ門知的財産事務所
(72)【発明者】
【氏名】山▲崎▼ 優大
【テーマコード(参考)】
4C117
5L099
【Fターム(参考)】
4C117XA01
4C117XB09
4C117XD22
4C117XD23
4C117XD24
4C117XE44
4C117XE45
4C117XE46
4C117XF22
4C117XJ01
4C117XJ12
4C117XJ34
4C117XJ35
4C117XK09
4C117XK20
4C117XL01
4C117XR07
4C117XR08
4C117XR09
4C117XR10
5L099AA04
5L099AA26
(57)【要約】
【課題】医用データを総合的に勘案した診断支援を簡便に提供可能とすること。
【解決手段】実施形態に係る医用情報処理装置は、第1の医用データ群と当該第1の医用データ群とは異なる第2の医用データ群とを取得する取得部と、前記第1の医用データ群を、統計モデルに対応付けられたモデル多様体に射影することで前記モデル多様体における第1の位置を特定し、前記第2の医用データ群を前記モデル多様体に射影することで前記モデル多様体における第2の位置を特定する特定部と、前記第1の位置と前記第2の位置とに基づいた測地線距離を算出する算出部とを備える。
【選択図】
図5
【特許請求の範囲】
【請求項1】
第1の医用データ群と当該第1の医用データ群とは異なる第2の医用データ群とを取得する取得部と、
前記第1の医用データ群を、統計モデルに対応付けられたモデル多様体に射影することで前記モデル多様体における第1の位置を特定し、前記第2の医用データ群を前記モデル多様体に射影することで前記モデル多様体における第2の位置を特定する特定部と、
前記第1の位置と前記第2の位置とに基づいた測地線距離を算出する算出部と
を備える、医用情報処理装置。
【請求項2】
前記取得部は、診断対象の被検体の医用データを前記第1の医用データ群として取得し、前記診断対象の被検体と異なる他の被検体の医用データを前記第2の医用データ群として取得する、請求項1に記載の医用情報処理装置。
【請求項3】
前記測地線距離に基づく診断支援情報の出力を行なう出力部を更に備え、
前記出力部は、複数の前記他の被検体それぞれに対応した複数の前記第2の位置のうち、前記第1の位置との間の前記測地線距離が閾値よりも短い位置を特定し、特定した位置に対応する前記他の被検体を、前記診断対象の被検体の類似被検体として特定し、当該類似被検体の医用データを診断支援情報として出力する、請求項2に記載の医用情報処理装置。
【請求項4】
前記測地線距離に基づく診断支援情報の出力を行なう出力部を更に備え、
前記出力部は、複数の前記他の被検体それぞれに対応した複数の前記第2の位置のうち、前記第1の位置との間の前記測地線距離が閾値よりも短い位置を特定し、特定した位置に対応する前記他の被検体を、前記診断対象の被検体の類似被検体として特定し、当該類似被検体が罹患していた疾患を前記診断対象の被検体の疾患候補として特定し、当該疾患候補を診断支援情報として出力する、請求項2に記載の医用情報処理装置。
【請求項5】
前記測地線距離に基づく診断支援情報の出力を行なう出力部を更に備え、
前記出力部は、複数の前記他の被検体それぞれに対応した複数の前記第2の位置のうち、前記第1の位置との間の前記測地線距離が閾値よりも短い位置を特定し、特定した位置に対応する前記他の被検体を、前記診断対象の被検体の類似被検体として特定し、当該類似被検体に基づいて前記診断対象の被検体の状態の時間的な推移を推定し、推定結果を診断支援情報として出力する、請求項2に記載の医用情報処理装置。
【請求項6】
第1の医用データ群と当該第1の医用データ群とは異なる第2の医用データ群とを取得し、
前記第1の医用データ群を、統計モデルに対応付けられたモデル多様体に射影することで前記モデル多様体における第1の位置を特定し、前記第2の医用データ群を前記モデル多様体に射影することで前記モデル多様体における第2の位置を特定し、
前記第1の位置と前記第2の位置とに基づいた測地線距離を算出する
ことを含む、医用情報処理方法。
【請求項7】
第1の医用データ群と当該第1の医用データ群とは異なる第2の医用データ群とを取得し、
前記第1の医用データ群を、統計モデルに対応付けられたモデル多様体に射影することで前記モデル多様体における第1の位置を特定し、前記第2の医用データ群を前記モデル多様体に射影することで前記モデル多様体における第2の位置を特定し、
前記第1の位置と前記第2の位置とに基づいた測地線距離を算出する
各処理をコンピュータに実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書及び図面に開示の実施形態は、医用情報処理装置、医用情報処理方法及びプログラムに関する。
【背景技術】
【0002】
臨床の場においては様々な医用データが収集され、データベースに記録されている。これらの医用データは、診断を行なう医師等のユーザに対して提示される他、近年では、これらの医用データを情報処理し、その結果から診断支援を行なう技術の開発が進められている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】米国特許出願公開第2017/0235871号明細書
【特許文献2】米国特許出願公開第2016/0370350号明細書
【特許文献3】米国特許出願公開第2020/0258223号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
本明細書及び図面に開示の実施形態が解決しようとする課題の一つは、医用データを総合的に勘案した診断支援を簡便に提供可能とすることである。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置付けることもできる。
【課題を解決するための手段】
【0005】
実施形態に係る医用情報処理装置は、第1の医用データ群と当該第1の医用データ群とは異なる第2の医用データ群とを取得する取得部と、前記第1の医用データ群を、統計モデルに対応付けられたモデル多様体に射影することで前記モデル多様体における第1の位置を特定し、前記第2の医用データ群を前記モデル多様体に射影することで前記モデル多様体における第2の位置を特定する特定部と、前記第1の位置と前記第2の位置とに基づいた測地線距離を算出する算出部とを備える。
【図面の簡単な説明】
【0006】
【
図1】
図1は、第1の実施形態に係る医用情報処理システムの構成の一例を示すブロック図である。
【
図2】
図2は、第1の実施形態に係る多様体の距離を算出する方法について説明するための図である。
【
図3】
図3は、第1の実施形態に係る医用情報処理装置の処理を示す概略図である。
【
図4】
図4は、第1の実施形態に係るモデル多様体に対する医用データ群の射影について説明するための図である。
【
図5】
図5は、第1の実施形態に係る測地線距離の算出について説明するための図である。
【
図6A】
図6Aは、第1の実施形態に係る距離の算出結果の一例を示す図である。
【
図6B】
図6Bは、第1の実施形態に係る距離の算出結果の一例を示す図である。
【
図6C】
図6Cは、第1の実施形態に係る距離の算出結果の一例を示す図である。
【
図7】
図7は、第1の実施形態に係る表示例を示す図である。
【
図8A】
図8Aは、第1の実施形態に係る表示例を示す図である。
【
図8B】
図8Bは、第1の実施形態に係る表示例を示す図である。
【
図9】
図9は、第1の実施形態に係る医用情報処理装置による処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0007】
以下、添付図面を参照して、医用情報処理装置、医用情報処理方法及びプログラムの実施形態について詳細に説明する。
【0008】
(第1の実施形態)
第1の実施形態では、医用情報処理装置30を含んだ医用情報処理システム1を例として説明する。例えば、医用情報処理システム1は、
図1に示すように、医用画像診断装置10、データベース20及び医用情報処理装置30を備える。なお、
図1は、第1の実施形態に係る医用情報処理システム1の構成の一例を示すブロック図である。
【0009】
図1に示すように、医用画像診断装置10、データベース20及び医用情報処理装置30は、ネットワークNWを介して接続される。ここで、ネットワークNWは、院内で閉じたローカルネットワークにより構成されてもよいし、インターネットを介したネットワークでもよい。例えば、データベース20は、医用画像診断装置10及び医用情報処理装置30と同一の施設内に設置されてもよいし、異なる施設に設置されてもよい。
【0010】
医用画像診断装置10は、被検体から医用画像を収集する装置である。医用画像診断装置10の種類(モダリティ)について特に限定されるものではないが、例としては、X線診断装置やX線CT(Computed Tomography)装置、MRI(Magnetic Resonance Imaging)装置、超音波診断装置、SPECT(Single Photon Emission Computed Tomography)装置、PET(Positron Emission computed Tomography)装置などを挙げることができる。なお、
図1には単一の医用画像診断装置10を示すが、医用情報処理システム1は、医用画像診断装置10を複数含んでいてもよい。医用画像診断装置10によって収集される医用画像は、医用データの一例である。
【0011】
データベース20は、種々の医用データを保管する保管装置であり、例えばサーバやワークステーション等のコンピュータ機器によって実現される。データベース20は、RIS(Radiology Information System)やHIS(Hospital Information System)、PACS(Picture Archiving and Communication System)といった情報管理システムのサーバであってもよい。なお、
図1には単一のデータベース20を示すが、データベース20は、複数の保管装置の組み合わせによって実現されてもよい。
【0012】
医用情報処理装置30は、処理回路34による処理により、医用データを総合的に勘案した診断支援を簡便に提供することを可能とする。例えば、医用情報処理装置30は、
図1に示すように、入力インタフェース31と、ディスプレイ32と、メモリ33と、処理回路34とを有する。
【0013】
入力インタフェース31は、ユーザからの各種の入力操作を受け付け、受け付けた入力操作を電気信号に変換して処理回路34に出力する。例えば、入力インタフェース31は、マウスやキーボード、トラックボール、スイッチ、ボタン、ジョイスティック、操作面へ触れることで入力操作を行うタッチパッド、表示画面とタッチパッドとが一体化されたタッチスクリーン、光学センサを用いた非接触入力回路、音声入力回路等により実現される。なお、入力インタフェース31は、医用情報処理装置30本体と無線通信可能なタブレット端末等で構成されることにしても構わない。また、入力インタフェース31は、モーションキャプチャによりユーザからの入力操作を受け付ける回路であっても構わない。一例を挙げると、入力インタフェース31は、トラッカーを介して取得した信号やユーザについて収集された画像を処理することにより、ユーザの体動や視線等を入力操作として受け付けることができる。また、入力インタフェース31は、マウスやキーボード等の物理的な操作部品を備えるものだけに限られない。例えば、医用情報処理装置30とは別体に設けられた外部の入力機器から入力操作に対応する電気信号を受け取り、この電気信号を処理回路34へ出力する電気信号の処理回路も入力インタフェース31の例に含まれる。
【0014】
ディスプレイ32は、各種の情報を表示する。例えば、ディスプレイ32は、処理回路34による制御の下、診断支援情報の表示を行なう。また、例えば、ディスプレイ32は、入力インタフェース31を介してユーザから各種の指示や設定等を受け付けるためのGUI(Graphical User Interface)を表示する。例えば、ディスプレイ32は、液晶ディスプレイやCRT(Cathode Ray Tube)ディスプレイである。ディスプレイ32は、デスクトップ型でもよいし、医用情報処理装置30本体と無線通信可能なタブレット端末等で構成されることにしても構わない。
【0015】
なお、
図1においては医用情報処理装置30がディスプレイ32を備えるものとして説明するが、医用情報処理装置30は、ディスプレイ32に代えて又は加えて、プロジェクタを備えてもよい。プロジェクタは、処理回路34による制御の下、スクリーンや壁、床等に対して投影を行なうことができる。一例を挙げると、プロジェクタは、プロジェクションマッピングによって、任意の平面や物体、空間等への投影を行なうこともできる。
【0016】
メモリ33は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子、ハードディスク、光ディスク等により実現される。例えば、メモリ33は、データベース20から取得された医用データや、医用情報処理装置30に含まれる回路がその機能を実現するためのプログラムを記憶する。メモリ33は、医用情報処理装置30とネットワークNWを介して接続されたサーバ群(クラウド)により実現されることとしてもよい。
【0017】
処理回路34は、取得機能34a、特定機能34b、算出機能34c及び出力機能34dを実行することで、医用情報処理装置30全体の動作を制御する。取得機能34aは、取得部の一例である。特定機能34bは、特定部の一例である。算出機能34cは、算出部の一例である。出力機能34dは、出力部の一例である。
【0018】
例えば、処理回路34は、取得機能34aに対応するプログラムをメモリ33から読み出して実行することにより、第1の医用データ群と、当該第1の医用データ群とは異なる第2の医用データ群とを取得する。また、処理回路34は、特定機能34bに対応するプログラムをメモリ33から読み出して実行することにより、第1の医用データ群をモデル多様体に射影することでモデル多様体における第1の位置を特定し、第2の医用データ群をモデル多様体に射影することでモデル多様体における第2の位置を特定する。また、処理回路34は、算出機能34cに対応するプログラムをメモリ33から読み出して実行することにより、第1の位置と第2の位置とに基づいた測地線距離を算出する。また、処理回路34は、出力機能34dに対応するプログラムをメモリ33から読み出して実行することにより、算出機能34cにより算出された測地線距離に基づく出力を行なう。
【0019】
算出機能34cにより算出された測地線距離は、診断支援情報の生成に用いられる。診断支援情報の生成及び表示は、医用情報処理装置30が行なってもよいし、他の装置において行われてもよい。例えば、出力機能34dは、測地線距離に基づいて診断支援情報を生成し、ディスプレイ32に表示させる。或いは、出力機能34dは、測地線距離に基づいて診断支援情報を生成し、生成した診断支援情報を、ネットワークNWを介して他の装置に送信する。この場合、当該他の装置において、診断支援情報の表示が行われる。或いは、出力機能34dは、算出機能34cにより算出された測地線距離を、ネットワークNWを介して他の装置に送信する。この場合、当該他の装置において、診断支援情報の生成及び表示が行われる。取得機能34a、特定機能34b、算出機能34c及び出力機能34による処理の詳細は後述する。
【0020】
図1に示す医用情報処理装置30においては、各処理機能がコンピュータによって実行可能なプログラムの形態でメモリ33へ記憶されている。処理回路34は、メモリ33からプログラムを読み出して実行することで各プログラムに対応する機能を実現するプロセッサである。換言すると、プログラムを読み出した状態の処理回路34は、読み出したプログラムに対応する機能を有することとなる。
【0021】
なお、
図1においては単一の処理回路34にて、取得機能34a、特定機能34b、算出機能34c及び出力機能34が実現するものとして説明したが、複数の独立したプロセッサを組み合わせて処理回路34を構成し、各プロセッサがプログラムを実行することにより機能を実現するものとしても構わない。また、処理回路34が有する各処理機能は、単一又は複数の処理回路に適宜に分散又は統合されて実現されてもよい。
【0022】
また、処理回路34は、ネットワークNWを介して接続された外部装置のプロセッサを利用して、機能を実現することとしてもよい。例えば、処理回路34は、メモリ33から各機能に対応するプログラムを読み出して実行するとともに、医用情報処理装置30とネットワークNWを介して接続されたサーバ群(クラウド)を計算資源として利用することにより、
図1に示す各機能を実現する。
【0023】
以上、医用画像診断装置10、データベース20及び医用情報処理装置30を含んだ医用情報処理システム1について説明した。かかる構成のもと、医用情報処理装置30は、医用データを総合的に勘案した診断支援を簡便に提供することを可能とする。
【0024】
ここで、診断支援の手法としては、機械学習モデルに診断支援情報を生成させる方法が考えられる。この場合、まずは学習データの収集が行われ、特定のタスクを解くように機械学習モデルが構築される。学習データは、一般的には、疾患や診療科、モダリティごとに収集される。
【0025】
例えば、疾患「肺がん」に関する診断支援を行なう機械学習モデルを、X線CT画像を学習データとして生成することができる。一例を挙げると、X線CT画像を入力側データとし、各X線CT画像の撮像対象となった被検体が肺がんを罹患していたか否かの確定診断を出力側データとしてニューラルネットワーク(Neural Network)を学習させることにより、肺がんの有無を判定するように機能付けられた機械学習モデルを生成することができる。そして、機械学習モデルは、X線CT画像の入力を受け、肺がんの有無の判定結果を診断支援情報として出力することができる。
【0026】
但し、このような機械学習による診断支援では、事前にタスクや学習データを用意する必要がある。十分な学習データを収集することは容易でないとともに、データ傾向やタスクが変わると対応できなくなってしまう場合がある。例えば、疾患分類が変わると再学習が必要となる。
【0027】
医用データに基づく診断支援の他の手法としては、医用データが類似する被検体を特定する方法が考えられる。例えば、診断対象の被検体の医用データを他の被検体と比較して医用データが類似する被検体を特定し、特定した被検体の医用データから、診断対象の被検体の状態や罹患する可能性のある病変を推定し、診断支援情報としてユーザに提供することができる。
【0028】
但し、臨床の場においては様々な医用データが収集される。例えば、被検体の身長や体重、既往歴といった被検体情報、医用画像診断装置10により撮像された医用画像、被検体の脈拍数や心電図、血液ガスの測定値といった検査結果などが医用データとして収集され、データベース20に登録される。特定の項目についてのみ類似する被検体、例えば身長が類似する被検体を特定することは容易であるが、様々な医用データについて総合的に類似する被検体を特定することは容易ではない。
【0029】
被検体間の医用データの距離(類似度)を算出する方法の1つとして、相互部分空間法が知られている。相互部分空間法では、各データを近似する部分空間を算出し、部分空間の間の角度の近さを、データの類似度として算出する。但し、相互部分空間法では線形を仮定しているため、医用データの分布が非線形の場合は精度が低下する。
【0030】
非線形の医用データを対象とする場合でも精度を保つための手法として、多様体の距離を算出する方法が提案されている。即ち、例えば
図2に示すように、被検体の様々な医用データを多様体として捉え、多様体の間の距離を類似度として算出する。
図2では、データD11、データD12、データD13及びデータD14を含んだ多様体A1と、データD21、データD22、データD23及びデータD24を含んだ多様体A2とを図示している。データD11~D14は、例えば特定の被検体について収集された種々の医用データであり、データD21~D24は、データD11~D14とは異なる被検体について収集された種々の医用データである。なお、医用データを含んだ多様体については、生体多様体とも記載する。
【0031】
但し、多様体は、
図2に示すような広がりを有する空間であり、データ空間上で距離を算出する際には、例えば各多様体について設けられた代表点を比較することとなり、多様体に含まれるデータ分布全体を評価することができない。即ち、利用可能な医用データを総合的に勘案した診断支援を提供することができない。例えば、被検体ごとの医用データを多様体として距離を算出する場合には、各被検体の瞬間的な状態(体調が良いとき、悪いとき等)しか捉えることができず、恒常的な状態を評価することはできない。
【0032】
そこで、医用情報処理装置30は、以下で説明する処理によって、医用データを総合的に勘案した診断支援を簡便に提供可能とすることを可能とする。以下、処理の詳細を
図3の概略図に沿って説明する。
【0033】
図3のデータベース20には、予め種々の医用データが登録される。医用データは、医用情報処理装置30による後述の処理が行われている間も含めて、データベース20に順次蓄積される。
【0034】
医用データの例には、被検体情報(患者情報)が含まれる。被検体情報は、例えば患者ID、氏名、生年月日、性別、血液型、身長、体重といった被検体に関する情報である。例えば、被検体情報は、被検体が来院した際の問診の結果として、HISやRIS等のシステムに登録される。
【0035】
また、医用データの例には、医用画像診断装置10により撮像された医用画像が含まれる。例えば、院内に設置された種々のモダリティによって各種の医用画像が収集され、PACS等のシステムに登録される。また、データベース20は、医用画像に基づく計測値を、医用データとして記録してもよい。例えば、データベース20は、血管造影X線画像に基づいて計測された血管径や、超音波画像に基づいて計測された血流の流速等を、医用データとして記録する。
【0036】
また、医用データの例には、血液検査や生化学検査、バイタルサインの計測といった検査の検査結果が含まれる。例えば、検査情報は、被検体に対する検査が行われるごとにHISやRIS等のシステムに登録される。なお、検査情報のデータベース20への登録は、検査を実行する装置(例えば心電図を計測する心電計、ポリグラフなど)によって自動で行われてもよいし、医師や医療従事者といったユーザが手動で行なってもよい。
【0037】
また、医用データの例には、既往歴が含まれる。既往歴には、被検体が罹患している疾患或いは過去に罹患したことのある疾患についての診断結果、受けたことのある治療の記録、アレルギーのような体質に関する情報等が含まれる。なお、診断結果は、病名の他、疾患の位置や範囲、分類、程度等の情報を含む。既往歴は、例えば電子カルテの一部としてHISやRIS等のシステムに登録される。
【0038】
データベース20に登録される医用データは、被検体の状態の評価に使用できるものであれば生理学的指標(バイオマーカー)に限定されるものではない。即ち、被検体の状態に関連し得るデータであれば、医用データの例に含まれる。
【0039】
取得機能34aは、
図3に示す通り、データベース20から医用データを取得する。例えば、取得機能34aは、ネットワークNWを介してデータベース20から医用データを取得する。或いは、取得機能34aは、入力インタフェース31を介して医用データの入力を受け付けたり、医用画像診断装置10や心電計といった装置により収集された医用データを当該装置から取得したりしてもよい。即ち、取得機能34aは、データベース20を介さず医用データを取得してもよい。
【0040】
取得機能34aは、被検体Pを含む複数の被検体に関する種々の医用データを取得する。ここで、被検体Pは、診断対象の被検体である。例えば、取得機能34aは、被検体Pの患者IDに紐付けられた被検体情報や医用画像、検査結果、既往歴等をデータベース20から取得する。同様に、取得機能34aは、被検体P以外の被検体それぞれの患者IDに紐付けられた被検体情報や医用画像、検査結果、既往歴等をデータベース20から取得する。以下、被検体Pに関する種々の医用データを医用データ群A3とし、被検体P以外の被検体に関する種々の医用データを医用データ群A4として説明する。医用データ群A3は、第1の医用データ群の一例である。医用データ群A4は、第2の医用データ群の一例である。
【0041】
なお、いずれの被検体を診断対象の被検体Pとするかについては、取得機能34aが医用データ群を取得する前に特定してもよいし、医用データ群の取得後に特定してもよい。例えば、ユーザ入力等に応じて被検体Pが事前に設定され、取得機能34aは、被検体Pを含む複数の被検体を対象として、医用データ群の取得を行なう。また、例えば、取得機能34aは、任意の被検体を対象として医用データ群の取得を行ない、その後、医用データ群の取得対象となった被検体の中から診断対象の被検体Pが選択されてもよい。
【0042】
次に、特定機能34bは、医用データ群をモデル多様体に射影することで、モデル多様体における位置を特定する。具体的には、特定機能34bは、まず、統計モデルを特定する。そして、特定機能34bが特定した統計モデルに応じて、
図4のモデル多様体B1が定義される。モデル多様体B1は、例えば、リーマン多様体である。
【0043】
例えば、特定機能34bは、統計モデルを選択する操作を入力インタフェース31を介してユーザから受け付けることにより、統計モデルを特定する。また、例えば、特定機能34bは、取得機能34aが取得した医用データ群に応じた統計モデルを自動で特定する。或いは、統計モデルはプリセットされていてもよい。
【0044】
以下、特定機能34bが特定した統計モデルに対応付けられたモデル多様体を、モデル多様体B1として説明する。特定機能34bは、医用データ群をモデル多様体B1に射影することで、モデル多様体B1における位置を特定する。例えば、特定機能34bは、
図4に示すように、統計モデルに従ってデータが分布するものと仮定し、あるパラメータθが構成するパラメータ空間(モデル多様体B1のパラメータ空間)において医用データ群に対応する位置p(x,θ)を特定する。
【0045】
例えば、特定機能34bは、
図5に示すように、被検体Pに関する医用データ群A3をモデル多様体B1に射影することで、モデル多様体B1における位置θ
Aを特定する。また、特定機能34bは、被検体P以外の被検体に関する医用データ群A4をモデル多様体B1に射影することで、モデル多様体B1における位置θ
Bを特定する。即ち、医用データ群A3や医用データ群A4については生体多様体として捉えることができるところ、特定機能34bは、各生体多様体をモデル多様体B1における位置(点)に変換する。位置θ
Aは、第1の位置の一例である。位置θ
Bは、第2の位置の一例である。
【0046】
次に、算出機能34cは、位置θ
Aと位置θ
Bとに基づいた測地線距離(
図5に示す測地線Dの長さ)を算出する。即ち、算出機能34cは、位置θ
Aと位置θ
Bとの間の距離を、モデル多様体B1に沿うように算出する。例えば、算出機能34cは、下記の式(1)により、測地線距離を算出することができる。なお、式(1)におけるGはFisher情報行列を表す。
【0047】
【0048】
図5ではモデル多様体B1において2つの位置を特定する様子を図示したが、特定機能34bは、データベース20に医用データが登録されている被検体の数だけ、モデル多様体B1における位置の特定を行なうことが可能である。また、算出機能34cは、モデル多様体B1において特定された位置の組み合わせの数だけ、測地線距離の算出を行なうことが可能である。但し、算出機能34cは、診断対象の被検体Pに対応する位置と、他の被検体に対応する位置との間でのみ、測地線距離の算出を行なってもよい。
【0049】
数十人程度の被検体について測地線距離の算出を行なった例を
図6Aに示す。
図6Aは、モデル多様体B1において算出された測地線距離の大小関係が保存されるように、特定機能34bがモデル多様体B1において特定した各位置を、2次元の平面上に投影したものである。また、
図6Aでは、心不全を罹患していた被検体に対応する点を「HF」で示し、肺がんを罹患していた被検体に対応する点を「Lung」で示し、心不全及び肺がんの両方を罹患していた被検体に対応する点を「HF&Lung」で示している。
【0050】
図6Aでは、「HF&Lung」に対応する点は上部に固まって分布しており、「Lung」に対応する点は中央部に固まって分布しており、「HF」に対応する点は下部に固まって分布している。即ち、同様の疾患を有する被検体の間の測地線距離は短く、疾患が一致しない被検体の間の測地線距離は長くなっている。このように、
図6Aは被検体の疾患ごとに分かれた分布となっており、各被検体の状態が表現されている。
【0051】
ここで、
図6Aの平面に対して診断対象の被検体Pに対応した点を射影することにより、被検体Pの状態を推定することもできる。例えば、被検体Pに対応した点が
図6Aの中央部に射影された場合、被検体Pが肺がんを有する可能性があると推定することができる。
【0052】
図6Aとの比較のため、
図6B及び
図6Cを示す。
図6Bは、例えば
図2に示したように、医用データ群の間のユークリッド距離をデータ空間において算出し、算出した距離の大小関係が保存されるように各医用データ群を2次元の平面上に射影したものである。
図6Bでは、「HF」、「Lung」及び「HF&Lung」の各分布が相互に重なってしまっている。ここで、
図6Bの平面に対して被検体Pに対応した点を射影しても、被検体Pの状態を推定することは難しい。
【0053】
図6Cは、各医用データ群をモデル多様体B1に射影し、モデル多様体B1のパラメータ空間上でユークリッド距離を算出し、算出した距離の大小関係が保存されるように、モデル多様体B1に射影された各位置を2次元の平面上に投影したものである。
図6Cでは、ある程度の傾向は見られるものの、「HF」、「Lung」及び「HF&Lung」の各分布がほとんど重なってしまっている。ここで、
図6Cの平面に対して被検体Pに対応した点を投影し、被検体Pの状態を推定したとしても、その信頼度は低いものとなる。
【0054】
上述したように
図6Aでは、
図6B及び
図6Cよりも各被検体の状態が明確に表現されている。即ち、特定機能34bの処理によって医用データ群をモデル多様体B1に射影してモデル多様体B1における位置を特定し、算出機能34cの処理によってモデル多様体B1における測地線距離を算出することにより、各被検体の状態を示す情報を精度良く抽出し、ひいては被検体Pの状態の推定を精度良く行うことが可能となる。
【0055】
出力機能34dは、算出機能34cにより算出された測地線距離に基づく出力を行なう。例えば、出力機能34dは、測地線距離に基づいて被検体Pの状態を推定し、推定結果を診断支援情報として表示させる。
【0056】
出力機能34dによる表示例を
図7に示す。
図7に示す例では、取得機能34aは、被検体Pの現在及び過去(1年前、2年前…)の健康診断の結果を、第1の医用データ群として取得している。当該第1の医用データ群には、現在及び過去における年齢や性別、血圧、赤血球数、血糖値といったデータが含まれる。また、取得機能34aは、被検体P以外の複数の被検体の現在及び過去の健康診断の結果を、第2の医用データ群として取得する。
【0057】
また、特定機能34bは、被検体Pに関する第1の医用データ群を、モデル多様体B1に射影することで、モデル多様体B1における第1の位置を特定する。また、特定機能34bは、被検体P以外の複数の被検体に関する複数の第2の医用データ群それぞれをモデル多様体B1に射影することで、モデル多様体B1における複数の第2の位置を特定する。また、算出機能34cは、第1の位置との間の測地線距離を、複数の第2の位置それぞれについて算出する。
【0058】
次に、出力機能34dは、算出された測地線距離に基づいて、被検体Pについて正常群よりも近い疾患を推定する。即ち、出力機能34dは、測地線距離に基づいて、被検体Pの疾患候補を推定する。例えば、出力機能34dは、被検体Pに関する第1の位置との間の測地線距離が閾値よりも短い第2の位置を特定し、特定した第2の位置に対応する被検体を、被検体Pの類似被検体として特定する。なお、類似被検体を特定する際の閾値については、例えばユーザが指定することができる。また、出力機能34dは、例えば正常患者の距離等に基づいて、閾値を自動設定してもよい(例えば平均値など)。
【0059】
そして、出力機能34dは、類似被検体が罹患していた疾患を、被検体Pの疾患候補として特定する。例えば、出力機能34dは、複数の類似被検体を特定し、閾値以上に高い割合で類似被検体が罹患していた疾患を、被検体Pの正常群よりも近い疾患候補として特定する。例えば、出力機能34dは、
図7に示すように、被検体Pについて正常群よりも近い疾患候補が「糖尿病」及び「高血圧症」であることを示す情報を、診断支援情報としてディスプレイ32に表示させる。
【0060】
出力機能34dによる別の表示例を
図8Aに示す。特定機能34bは、
図7の場合と同様に、モデル多様体B1における第1の位置及び複数の第2の位置を特定する。また、算出機能34cは、第1の位置との間の測地線距離を、複数の第2の位置それぞれについて算出する。
【0061】
また、出力機能34dは、被検体Pに関する第1の位置との間の測地線距離が閾値よりも短い第2の位置を特定し、特定した第2の位置に対応する被検体を、被検体Pの類似被検体として特定する。例えば、出力機能34dは、
図8Aに示す患者ID「0002」の被検体、患者ID「0005」の被検体、患者ID「0007」の被検体、及び、患者ID「0009」の被検体を、被検体Pの類似被検体として特定する。
【0062】
そして、出力機能34dは、特定した被検体Pの類似被検体を、診断支援情報としてディスプレイ32に表示させる。例えば、出力機能34dは、
図8Aに示すように、各類似被検体の患者IDと、被検体Pに関する第1の位置との間の測地線距離と、罹患していた疾患とを対応付けて表示させる。ここで、
図8Aの表示を参照した医師等のユーザは、被検体Pが、正常群よりも近い疾患として「心不全」及び「肺がん」を有していることを把握できる。
【0063】
また、「心不全」を有する類似被検体の測地線距離はそれぞれ「0.01」、「0.05」及び「0.08」であるのに対し、「肺がん」を有する類似被検体の測地線距離はそれぞれ「0.08」及び「0.10」である。このように、「心不全」を有する類似被検体の測地線距離は総じて短いことから、ユーザは、被検体Pについて「心不全」を有する可能性が特に大きいと判断することができる。
【0064】
また、出力機能34dは、診断支援情報として、
図6Aに示したような分布図を表示させてもよい。即ち、出力機能34dは、モデル多様体B1において算出された測地線距離の大小関係が保存されるように、モデル多様体B1において特定した各位置を2次元の平面上に投影し、散布図としてディスプレイ32に表示させてもよい。この時、出力機能34dは、散布図における点ごとの形状や色によって、各点に対応する被検体の状態を示してもよい。また、出力機能34dは、
図8Bに示すように、散布図上で被検体Pに対応する点を強調表示してもよい。
【0065】
また、出力機能34dは、
図8Bにおいて点の選択を受け付け、選択された点に対応する被検体の情報を表示せてもよい。例えば、
図8Aでは類似被検体の情報を表示させる場合について説明したが、出力機能34dは、類似被検体の情報に代えて又は加えて、
図8Bにおいて選択された点に対応する被検体の情報を表示せてもよい。
【0066】
次に、医用情報処理装置30による処理の一連の流れにつて、
図9を用いて説明する。
図9は、第1の実施形態に係る医用情報処理装置30による処理の一例を示すフローチャートである。なお、ステップS101及びステップS102は、取得機能34aにより実現されるステップである。ステップS103及びステップS104は、特定機能34bにより実現されるステップである。ステップS105は、算出機能34cにより実現されるステップである。ステップS106は、出力機能34dにより実現されるステップである。
【0067】
まず、処理回路34は、診断対象の被検体Pを特定し(ステップS101)、被検体Pを含む複数の被検体の医用データ群を取得する(ステップS102)。次に、処理回路34は、統計モデルを特定し(ステップS103)、各医用データ群について、統計モデルに対応付けられたモデル多様体上における位置を特定する(ステップS104)。即ち、処理回路34は、被検体Pに関する第1の医用データ群をモデル多様体に射影することで、モデル多様体における第1の位置を特定する。また、処理回路34は、被検体P以外の被検体に関する第2の医用データ群をモデル多様体に射影することで、モデル多様体における第2の位置を特定する。
【0068】
次に、処理回路34は、第1の位置と第2の位置とに基づいた測地線距離を算出する(ステップS105)。即ち、処理回路34は、被検体Pに対応するモデル多様体上の位置と、被検体P以外の被検体に対応するモデル多様体上の各位置との間の距離を、モデル多様体に沿うように算出する。そして、処理回路34は、測地線距離に基づく診断支援情報を出力する(ステップS106)。例えば、処理回路34は、
図7~
図8Bに示したような表示を行なう。
【0069】
なお、
図9のフローチャートはあくまで一例であり、種々の変形が可能である。
【0070】
例えば、ステップS101における被検体Pの特定は、ステップS102、ステップS103又はステップS104より後に行われてもよい。この場合、医用データ群の取得の対象となった被検体の中から、診断対象の被検体Pが選択されることとなる。また、ステップS101における被検体Pの特定は、ステップS105より後に行われてもよい。この場合、算出機能34cは、ステップS105において、任意の被検体の組み合わせの間で測地線距離を算出し、被検体Pが特定された後、被検体Pに関する測地線距離を特定する。
【0071】
また、上述した通り、統計モデルについてはプリセットされていてもよい。この場合、ステップS103については省略が可能である。また、診断支援情報の出力は、医用情報処理装置30と異なる他の装置において行われてもよい。例えば、出力機能34dは、測地線距離に基づいて診断支援情報を生成し、生成した診断支援情報を、ネットワークNWを介して他の装置に送信してもよい。或いは、出力機能34dは、算出機能34cにより算出された測地線距離を、ネットワークNWを介して他の装置に送信してもよい。
【0072】
上述したように、第1の実施形態に係る取得機能34aは、第1の医用データ群と、当該第1の医用データ群とは異なる第2の医用データ群とを取得する。また、特定機能34bは、第1の医用データ群を、統計モデルに対応付けられたモデル多様体に射影することで第1の位置を特定し、第2の医用データ群をモデル多様体に射影することで第2の位置を特定する。また、算出機能34cは、第1の位置と第2の位置とに基づいた測地線距離を算出する。これにより、第1の実施形態に係る医用情報処理装置30は、医用データを総合的に勘案した診断支援を簡便に提供することを可能とする。
【0073】
即ち、特定のタスクを解くように構築した機械学習モデルによって診断支援情報を生成する場合と異なり、医用情報処理装置30によれば、タスクや学習データを事前に準備したり、データ傾向やタスクが変わった際に再学習を行なったりする手間を要することなく、診断支援が簡便に実現される。
【0074】
また、医用情報処理装置30によれば、データ空間上で多様体間の距離を算出する場合とは異なり、代表点を定めて比較する必要はないため、医用データを総合的に勘案した診断支援を行なうことができる。例えば、被検体の瞬間的な状態ではなく、複数時点の状態や経時的な変化についても評価した診断支援を行なうことができる。
【0075】
(第2の実施形態)
例えば、特定機能34bは、正規分布や混合正規分布、二項分布、ベルヌーイといった確率分布を統計モデルとして特定し、統計モデルに対応付けられたモデル多様体に対して医用データ群を射影することで、モデル多様体における第1の位置を特定してもよい。即ち、特定機能34bは、確率分布に対応付けられたモデル多様体B1のパラメータ空間において医用データ群に対応する位置を特定してもよい。
【0076】
なお、確率分布を統計モデルとして使用する場合において、医用データ群に対応したパラメータを推定する手法としては、最尤推定やMAP(Maximum A Posteriori)推定、ベイズ推定などが挙げられる。例えば、医用データ郡XAが与えられた場合、最尤推定については、下記の式(2)によりパラメータθの推定を行なうことができる。
【0077】
【0078】
(第3の実施形態)
例えば、特定機能34bは、任意の構造を持つニューラルネットワークを統計モデルとして特定し、統計モデルに対応付けられたモデル多様体に対して医用データ群を射影することで、モデル多様体における第1の位置を特定してもよい。この場合、特定機能34bは、パラメータを推定するために最小二乗誤差や負の対数尤度といった損失関数を使用し、損失関数値を最小化又は最大化するようにパラメータを更新する。パラメータの更新は、確率的勾配降下法(Stochastic Gradient DescentSGD)やADAMといった任意の勾配降下法を使用することができる。例えば、パラメータの更新は、下記の式(3)により行なうことができる。式(3)において、「α」は学習率であり、「L」は損失関数を示す。
【0079】
【0080】
また、例えば、算出機能34cは、
図5に示した位置θ
Aを初期値として、異なる群のデータX
B(例えば医用データ群A4に含まれるデータ)の損失関数「L(θ;X
B)」を最小化又は最大化するように、ニューラルネットワークを学習させる。また、算出機能34cは、勾配降下法によってパラメータの微小変化量「dθ」を算出する。また、算出機能34cは、例えば下記の式(4)により、微小距離「ds」を算出する。そして、算出機能34cは、損失関数「L(θ;X
B)」の値が収束するか、或いは指定回数に達するまで上記の処理を繰り返し、微小距離「ds」の和を測地線距離として算出する。ここで、式(4)におけるGはFisher情報行列を表す。
【0081】
【0082】
(第4の実施形態)
上述した実施形態の他にも種々の変形を加えて実施されてよいものである。
【0083】
例えば、上述した実施形態では、ある被検体に関する医用データを医用データ群として説明した。即ち、被検体を単位とする医用データ群について説明した。しかしながら実施形態はこれに限定されるものではない。
【0084】
例えば、取得機能34aは、ある被検体に関する医用データの一部を、医用データ群として取得してもよい。一例を挙げると、取得機能34aは、被検体が特定の年齢だった期間に収集された医用データを医用データ群として取得したり、被検体が特定の生活習慣を行なっていた期間に収集された医用データを医用データ群として取得したり、被検体が特定の疾患を罹患していた期間に収集された医用データを医用データ群として取得したりしてもよい。
【0085】
また、例えば、取得機能34aは、複数の被検体に関する医用データを、1つの医用データ群として取得してもよい。一例を挙げると、取得機能34aは、血縁関係のある複数の被検体の医用データを1つの医用データ群として取得したり、特定の生活習慣を行なっている複数の被検体の医用データを1つの医用データ群として取得したり、特定の疾患を罹患している複数の被検体の医用データを1つの医用データ群として取得したりしてもよい。
【0086】
また、
図7~
図8Bの表示はあくまで一例であり、種々の変形が可能である。例えば、上述したように、出力機能34dは、測地線距離に基づいて、被検体Pの類似被検体を特定することができる。ここで、出力機能34dは、類似被検体の医用データに基づいて、被検体Pの状態の時間的な推移を推定することができる。
【0087】
以下、被検体Pが現在は「40歳」であり、類似被検体が現在は「50歳」である場合について説明する。ここで、被検体Pの「30歳~40歳」の医用データから成る医用データ群に基づく第1の位置と、類似被検体の「30歳~40歳」の医用データから成る医用データ群に基づく第2の位置とに基づいた測地線距離が最も短かった場合、出力機能34dは、類似被検体の「40歳~50歳」の医用データに基づいて、「50歳」までの被検体Pの状態の時間的な推移を推定し、推定結果を診断支援情報として出力することができる。
【0088】
例えば、「50歳」の類似被検体の状態が良好である場合、出力機能34dは、例えば、「40歳~50歳」の類似被検体が行なった生活習慣や服用した薬、類似被検体に対して行なわれた治療などを、被検体Pの状態を良好に保つために推薦される対応として提示することができる。また、例えば、「50歳」の類似被検体の状態が良好でない場合、出力機能34dは、例えば、定期的な検診や疾患に対する早期の治療開始を、推薦される対応として提示することができる。
【0089】
上記説明において用いた「プロセッサ」という文言は、例えば、CPU、GPU(Graphics PROCESSING Unit)、ASIC、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等の回路を意味する。プロセッサが例えばCPUである場合、プロセッサは記憶回路に保存されたプログラムを読み出し実行することで機能を実現する。一方、プロセッサが例えばASICである場合、記憶回路にプログラムを保存する代わりに、当該機能がプロセッサの回路内に論理回路として直接組み込まれる。なお、実施形態の各プロセッサは、プロセッサごとに単一の回路として構成される場合に限らず、複数の独立した回路を組み合わせて1つのプロセッサとして構成し、その機能を実現するようにしてもよい。さらに、各図における複数の構成要素を1つのプロセッサへ統合してその機能を実現するようにしてもよい。
【0090】
上述した実施形態に係る各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。即ち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。更に、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現されうる。
【0091】
また、上述した実施形態で説明した医用情報処理方法は、予め用意された医用情報処理プログラムをパーソナルコンピュータやワークステーション等のコンピュータで実行することによって実現することができる。この医用情報処理プログラムは、インターネット等のネットワークを介して配布することができる。また、この医用情報処理プログラムは、ハードディスク、フレキシブルディスク(FD)、CD-ROM、MO、DVD等のコンピュータで読み取り可能な非一過性の記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することもできる。
【0092】
以上説明した少なくとも1つの実施形態によれば、医用データを総合的に勘案した診断支援を簡便に提供可能とすることができる。
【0093】
いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、実施形態同士の組み合わせを行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0094】
1:医用情報処理システム
10:医用画像診断装置
20:データベース
30:医用情報処理装置
31:入力インタフェース
32:ディスプレイ
33:メモリ
34:処理回路
34a:取得機能
34b:特定機能
34c:算出機能
34d:出力機能