IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人理化学研究所の特許一覧 ▶ 国立大学法人 筑波大学の特許一覧

<>
  • 特開-予測装置、予測方法及びプログラム 図1
  • 特開-予測装置、予測方法及びプログラム 図2
  • 特開-予測装置、予測方法及びプログラム 図3
  • 特開-予測装置、予測方法及びプログラム 図4
  • 特開-予測装置、予測方法及びプログラム 図5
  • 特開-予測装置、予測方法及びプログラム 図6
  • 特開-予測装置、予測方法及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024060937
(43)【公開日】2024-05-07
(54)【発明の名称】予測装置、予測方法及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240425BHJP
   A61B 5/361 20210101ALI20240425BHJP
【FI】
G06N20/00 130
A61B5/361
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022168532
(22)【出願日】2022-10-20
(71)【出願人】
【識別番号】503359821
【氏名又は名称】国立研究開発法人理化学研究所
(71)【出願人】
【識別番号】504171134
【氏名又は名称】国立大学法人 筑波大学
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】清田 純
(72)【発明者】
【氏名】野中 尚輝
(72)【発明者】
【氏名】平松 祐司
(72)【発明者】
【氏名】坂本 裕昭
【テーマコード(参考)】
4C127
【Fターム(参考)】
4C127AA02
4C127GG05
4C127GG16
(57)【要約】      (修正有)
【課題】不整脈の発生を予測する予測装置、予測方法及びプログラムを提供する。
【解決手段】予測装置は、正常と不整脈とを表す第1のラベルが付与された第1の心電図データを用いて、予め決められた所定の時間区間ΔTの心電図データを表す単位心電図データを正常と不整脈に分類する分類モデルを学習する分類モデル学習部と、時間区間ΔT以上の時間区間の第2の心電図データと、学習済みの分類モデルとを用いて、予め決められたL個の単位心電図データの系列で表され、予め決められた所定の時間Δt後における正常又は不整脈を表す第2のラベルが付与された第3の心電図データを作成するデータ作成部と、第3の心電図データを用いて、L個の単位心電図データの系列が与えられたときに時間Δt後における正常又は不整脈を予測する予測モデルを学習する予測モデル学習部と、を有する。
【選択図】図3
【特許請求の範囲】
【請求項1】
正常と不整脈とを少なくとも表し得る第1のラベルが付与された第1の心電図データを用いて、予め決められた所定の時間区間ΔTの心電図データを表す単位心電図データを少なくとも正常と不整脈とを含むクラスに分類する分類モデルを学習するように構成されている分類モデル学習部と、
前記時間区間ΔT以上の時間区間の第2の心電図データと、学習済みの前記分類モデルとを用いて、L(ただし、Lは予め決められた1以上の整数)個の単位心電図データの系列で表される第3の心電図データであって、かつ、予め決められた所定の時間Δt後における正常又は不整脈を表す第2のラベルが付与された第3の心電図データを作成するように構成されているデータ作成部と、
前記第3の心電図データを用いて、L個の単位心電図データの系列が与えられたときに前記時間Δt後における正常又は不整脈を予測する予測モデルを学習するように構成されている予測モデル学習部と、
を有する予測装置。
【請求項2】
前記データ作成部は、
前記第2の心電図データを前記時間区間ΔT毎に区切って得られた単位心電図データの各々を学習済みの前記分類モデルにより正常と不整脈とを含むクラスに分類し、
L個の単位心電図データの系列に対して、前記L個の単位心電図データの系列の前記時間Δt後における単位心電図データが分類されたクラスを表すラベルを前記第2のラベルとして付与することで、前記第3の心電図データを作成するように構成されている請求項1に記載の予測装置。
【請求項3】
前記データ作成部は、
先頭からL-1個目までの単位心電図データが正常を表すクラスに分類され、かつ、L個目の単位心電図データが正常又は不整脈のいずれかを表すクラスに分類されたL個の単位心電図データの系列であって、前記時間Δt後における単位心電図データが分類されたクラスが正常又は不整脈であるL個の単位心電図データの系列に対して、前記時間Δt後における単位心電図データが分類されたクラスを表すラベルを前記第2のラベルとして付与することで、前記第3の心電図データを作成するように構成されている請求項2に記載の予測装置。
【請求項4】
前記時間Δtは、予め決められた0以上の整数をmとして、Δt=mΔTと表される、請求項3の何れか一項に記載の予測装置。
【請求項5】
L個の単位心電図データの系列が与えられたとき、学習済みの前記予測モデルにより、前記時間Δt後における正常又は不整脈を予測するように構成されている予測部を有する請求項1乃至4の何れか一項に記載の予測装置。
【請求項6】
前記不整脈は心房細動である、請求項5に記載の予測装置。
【請求項7】
前記分類モデル学習部は、
正常と心房細動と心房細動以外の不整脈とを少なくとも表し得る第1のラベルが付与された第1の心電図データを用いて、前記時間区間ΔTの心電図データを正常と心房細動と心房細動以外の不整脈とを含むクラスに分類する分類モデルを学習するように構成されている請求項6に記載の予測装置。
【請求項8】
正常と不整脈とを少なくとも表し得る第1のラベルが付与された第1の心電図データを用いて、予め決められた所定の時間区間ΔTの心電図データを表す単位心電図データを少なくとも正常と不整脈とを含むクラスに分類する分類モデルを学習する分類モデル学習手順と、
前記時間区間ΔT以上の時間区間の第2の心電図データと、学習済みの前記分類モデルとを用いて、L(ただし、Lは予め決められた1以上の整数)個の単位心電図データの系列で表される第3の心電図データであって、かつ、予め決められた所定の時間Δt後における正常又は不整脈を表す第2のラベルが付与された第3の心電図データを作成するデータ作成手順と、
前記第3の心電図データを用いて、L個の単位心電図データの系列が与えられたときに前記時間Δt後における正常又は不整脈を予測する予測モデルを学習する予測モデル学習手順と、
をコンピュータが実行する予測方法。
【請求項9】
正常と不整脈とを少なくとも表し得る第1のラベルが付与された第1の心電図データを用いて、予め決められた所定の時間区間ΔTの心電図データを表す単位心電図データを少なくとも正常と不整脈とを含むクラスに分類する分類モデルを学習する分類モデル学習手順と、
前記時間区間ΔT以上の時間区間の第2の心電図データと、学習済みの前記分類モデルとを用いて、L(ただし、Lは予め決められた1以上の整数)個の単位心電図データの系列で表される第3の心電図データであって、かつ、予め決められた所定の時間Δt後における正常又は不整脈を表す第2のラベルが付与された第3の心電図データを作成するデータ作成手順と、
前記第3の心電図データを用いて、L個の単位心電図データの系列が与えられたときに前記時間Δt後における正常又は不整脈を予測する予測モデルを学習する予測モデル学習手順と、
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、予測装置、予測方法及びプログラムに関する。
【背景技術】
【0002】
例えば、集中治療室で術後急性期治療が行われる心臓大血管手術後の患者は、手術中の心臓や刺激伝達系へのストレス及び周術期における様々な環境因子によって不整脈が誘発されやすい状態になっている。特に、不整脈の一種である心房細動は術後に発生しやすく、循環動態を不安定にする以外にも、例えば、心内血栓が形成され心原性脳梗塞を引き起こす原因ともなる。このように手術後の心房細動の発生は他の合併症の誘因となり、その結果、集中治療室の滞在期間や入院期間の延長、医療費の増大をもたらすと共に、長期予後にも悪影響を及ぼす。このため、心房細動の発生を検出する技術が従来から知られている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】米国特許第7,020,514号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、心房細動の発生を予測することはできなかった。例えば、数分後等の将来に心房細動が発生することを予測できれば、早期にその対処が可能となり、急性期治療においては非常に有用である。
【0005】
本開示は、上記の点に鑑みてなされたもので、不整脈の発生を予測できる技術を提供する。
【課題を解決するための手段】
【0006】
本開示の一態様による予測装置は、正常と不整脈とを少なくとも表し得る第1のラベルが付与された第1の心電図データを用いて、予め決められた所定の時間区間ΔTの心電図データを表す単位心電図データを少なくとも正常と不整脈とを含むクラスに分類する分類モデルを学習するように構成されている分類モデル学習部と、前記時間区間ΔT以上の時間区間の第2の心電図データと、学習済みの前記分類モデルとを用いて、L(ただし、Lは予め決められた1以上の整数)個の単位心電図データの系列で表される第3の心電図データであって、かつ、予め決められた所定の時間Δt後における正常又は不整脈を表す第2のラベルが付与された第3の心電図データを作成するように構成されているデータ作成部と、前記第3の心電図データを用いて、L個の単位心電図データの系列が与えられたときに前記時間Δt後における正常又は不整脈を予測する予測モデルを学習するように構成されている予測モデル学習部と、を有する。
【発明の効果】
【0007】
不整脈の発生を予測できる技術が提供される。
【図面の簡単な説明】
【0008】
図1】心房細動の発生予測を行うための手法の概略を示す図である。
図2】本実施形態に係る予測装置のハードウェア構成の一例を示す図である。
図3】本実施形態に係る予測装置の機能構成の一例を示す図である。
図4】モデル学習フェーズの処理と予測フェーズの処理の一例を示すフローチャートである。
図5】分類モデルの構成の一例を模式的に示す図である。
図6】長時間の心電図波形を表すラベルなし心電図データに対するラベル付けの一例を模式的に示す図である。
図7】予測モデルの構成の一例を模式的に示す図である。
【発明を実施するための形態】
【0009】
以下、本発明の一実施形態について説明する。
【0010】
<心房細動の発生予測の概略>
以下で説明する実施形態では、機械学習技術を利用して心電図データから心房細動の発生を予測する手法を提案する。一般に、心房細動の発生を精度良く予測することができる機械学習モデル(以下、予測モデルという。)を構築(学習)するためには、心電図データと、その心電図データが正常(SR:sinus rhythm)又は心房細動(AF:atrial fibrillation)のいずれを表すかを示すラベル(教師データ)とで構成された学習データが大量に必要になる。しかも、心電図データは、電位差の時系列データであり、その波形が意味を持つため、心房細動が発生するときの特徴を予測モデルが学習するためには少なくとも1分~数分程度といった或る程度の長さが必要であると考えられる。
【0011】
しかしながら、ラベルが付与されており、かつ、或る程度の長さの心電図データを大量に準備することは困難である。一方で、数十秒~百数十秒程度といった比較的短時間の長さの心電図データであれば、例えば、CPSC2018(China Physiological Signal Challenge 2018)等といったラベル付きの心電図データが公開されており、容易に入手可能である。また、ラベルは付与されていないが、2日~3日等といった比較的長時間の長さの心電図データであれば、例えば、MIMIC-III等といった心電図データが公開されており、容易に入手可能である。
【0012】
そこで、以下の(1)~(3)により、予測モデルを学習するための学習データを作成する。ここで、以下では、分類モデルの入力とする心電図データの長さ(時間区間)をΔTとする。以下では、ΔT=1〔分〕を想定するが、これは一例であって、これに限られるものではなく、数十秒~数分程度の任意の値を設定することが可能である。また、予測モデルの入力とする心電図データの長さ(心電図データをΔT毎の電位差の時系列データとみなしたときの系列長)をLとする。系列長Lは予め決められるパラメータであり、例えば、L∈{1,・・・,5}である。
【0013】
(1)CPSC2018等といったラベル付きの心電図データのデータセット(以下、第1のデータセットという。)を用いて、時間区間ΔTの心電図データのラベルを推論する機械学習モデル(以下、分類モデルという。)を構築(学習)する。
【0014】
(2)MIMIC-III等といった心電図データのデータセット(以下、第2のデータセットという。)を用いて、それらの心電図データを時間区間ΔT毎に区切った上で、各時間区間ΔTの心電図データに対して学習済みの分類モデルによりラベルを付与する。以下、時間区間ΔTの心電図データを「単位心電図データ」と呼ぶことにする。
【0015】
また、以下では、一例として、心電図データは50Hzでサンプリングされているものとし、単位心電図データには3000点のデータ点(電位差の値)が含まれるものとする。ただし、心電図データが50Hzでサンプリングされていることは一例であって、これに限られるものではない。また、或る心電図データを時間区間ΔT毎に区切って単位心電図データとしたときに、i番目の単位心電図データに含まれるデータ点を縦ベクトルで表現してx=[xi,1,・・・,xi,3000τとし、そのラベルをyとする。なお、τは転置を表す。
【0016】
(3)時間区間ΔT毎にラベルが付与された心電図データから系列長Lの単位心電図データ系列とそのラベルとを抽出し、予測モデル用の学習データとする。このとき、予め決められた0以上の整数をmとしてΔt=mΔT〔分〕後の心房細動の発生を予測したい場合、系列長Lの単位心電図データ系列{xi+1,・・・,xi+L}に対するラベルとして、xi+L+m+1のラベルyi+L+m+1を抽出する。ただし、より詳細には、系列長Lの単位心電図データ系列{xi+1,・・・,xi+L}として、ラベルyi+1,・・・,yi+L+mがすべて正常(SR)で、かつ、ラベルyi+L+m+1が正常(SR)又は心房細動(AF)のいずれかであるものを抽出する。なお、Δt後の心房細動の発生を予測するとは、Δt後のΔT間に心房細動が発生するか否かを予測することを意味するものとする。
【0017】
これにより、予測モデル用の学習データ({xi+1,・・・,xi+L},yi+L+m+1)で構成される予測モデル用学習データセットが得られる。
【0018】
以下、心電図データから心房細動の発生予測を行うための手法の概略について、図1を参照しながら説明する。
【0019】
手順1)まず、上記の(1)で説明した通り、比較的短時間のラベルあり心電図データで構成されるデータセットである第1のデータセットを用いて、分類モデルを学習する。
【0020】
手順2)次に、上記の(2)~(3)で説明した通り、比較的長時間のラベルなし心電図データで構成されるデータセットである第2のデータセットを用いて、学習済みの分類モデルにより、予測モデル用学習データセットを作成する。
【0021】
手順3)次に、上記の手順2で作成した予測モデル用学習データセットを用いて、予測モデルを学習する。
【0022】
手順4)そして、予測対象の心電図データを用いて、上記の手順3で学習済みの予測モデルにより、Δt後の心房細動の発生を予測する。
【0023】
以下では、上記の手順1~手順4に示す手法により、Δt後の心房細動の発生を予測する予測装置10について説明する。なお、上記の手順1~手順3はモデル学習フェーズ、上記の手順4は予測フェーズと呼ばれてもよい。モデル学習フェーズは予測フェーズよりも前に事前に実施される。一方で、予測フェーズは、予測対象の心電図データが与えられる都度実施される。
【0024】
<予測装置10のハードウェア構成例>
本実施形態に係る予測装置10のハードウェア構成例を図2に示す。図2に示すように、本実施形態に係る予測装置10は、入力装置101と、表示装置102と、外部I/F103と、通信I/F104と、RAM(Random Access Memory)105と、ROM(Read Only Memory)106と、補助記憶装置107と、プロセッサ108とを有する。これらの各ハードウェアは、それぞれがバス109を介して通信可能に接続されている。
【0025】
入力装置101は、例えば、キーボード、マウス、タッチパネル、物理ボタン等である。表示装置102は、例えば、ディスプレイ、表示パネル等である。なお、予測装置10は、例えば、入力装置101及び表示装置102の少なくとも一方を有していなくてもよい。
【0026】
外部I/F103は、記録媒体103a等の外部装置とのインタフェースである。予測装置10は、外部I/F103を介して、記録媒体103aの読み取りや書き込み等を行うことができる。なお、記録媒体103aとしては、例えば、フレキシブルディスク、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
【0027】
通信I/F104は、予測装置10を通信ネットワークに接続するためのインタフェースである。RAM105は、プログラムやデータを一時保持する揮発性の半導体メモリ(記憶装置)である。ROM106は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)である。補助記憶装置107は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等のストレージ装置(記憶装置)である。プロセッサ108は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の演算装置である。
【0028】
本実施形態に係る予測装置10は、図2に示すハードウェア構成を有することにより、後述する各種処理(モデル学習フェーズの処理と予測フェーズの処理)を実現することができる。なお、図2に示すハードウェア構成は一例であって、予測装置10のハードウェア構成はこれに限られるものではない。例えば、予測装置10は、複数の補助記憶装置107や複数のプロセッサ108を有していてもよいし、図示したハードウェアの一部を有していなくてもよいし、図示したハードウェア以外の様々なハードウェアを有していてもよい。
【0029】
<予測装置10の機能構成例>
本実施形態に係る予測装置10の機能構成例を図3に示す。図3に示すように、本実施形態に係る予測装置10は、分類モデル学習部201と、学習データ作成部202と、予測モデル学習部203と、予測部204とを有する。これら各機能部は、例えば、予測装置10にインストールされた1以上のプログラムが、プロセッサ108等に実行させる処理により実現される。また、本実施形態に係る予測装置10は、第1のデータセット記憶部205と、分類モデル記憶部206と、第2のデータセット記憶部207と、予測モデル用学習データセット記憶部208と、予測モデル記憶部209とを有する。これら各記憶部は、例えば、補助記憶装置107により実現される。ただし、上記の各記憶部のうちの少なくとも1つの記憶部が、予測装置10と通信ネットワークを介して接続されるデータベースサーバ等の記憶装置により実現されていてもよい。
【0030】
分類モデル学習部201は、第1のデータセット記憶部205に記憶されている第1のデータセットを用いて、分類モデルを学習する。そして、分類モデル学習部201は、学習済みの分類モデルのパラメータを分類モデル記憶部206に保存する。なお、分類モデルは、例えば、ニューラルネットワーク等を含むモデルであり、学習可能なパラメータを持つ。また、分類モデルの学習は、例えば、誤差逆伝播法等を利用した既知の教師あり学習の手法により行えばよい。
【0031】
学習データ作成部202は、第2のデータセット記憶部207に記憶されている第2のデータセットを用いて、学習済みの分類モデルにより、予測モデル用学習データセットを作成する。そして、学習データ作成部202は、作成した予測モデル用学習データセットを予測モデル用学習データセット記憶部208に保存する。
【0032】
予測モデル学習部203は、予測モデル用学習データセット記憶部208に記憶されている予測モデル用学習データセットを用いて、予測モデルを学習する。そして、予測モデル学習部203は、学習済みの予測モデルのパラメータを予測モデル記憶部209に保存する。なお、予測モデルは、例えば、ニューラルネットワーク等を含むモデルであり、学習可能なパラメータを持つ。また、予測モデルの学習は、例えば、誤差逆伝播法等を利用した既知の教師あり学習の手法により行えばよい。
【0033】
予測部204は、予測対象の心電図データを用いて、学習済みの予測モデルより、Δt後の心房細動の発生を予測する。なお、この予測結果(SR/AF)は予め決められた所定の出力先に出力される。このような出力先としては、例えば、ディスプレイ等の表示装置102、補助記憶装置107、通信ネットワークを介して接続される他の装置や他の端末等が挙げられる。
【0034】
第1のデータセット記憶部205は、第1のデータセットを記憶する。分類モデル記憶部206は、学習済みの分類モデルのパラメータを記憶する。第2のデータセット記憶部207は、第2のデータセットを記憶する。予測モデル用学習データセット記憶部208は、予測モデル用学習データセットを記憶する。予測モデル記憶部209は、学習済みの予測モデルのパラメータを記憶する。
【0035】
なお、図3に示す例では、予測装置10がすべての機能部とすべての記憶部とを有しているが、これらの機能部及び記憶部は複数の装置が分散して有していてもよい。例えば、モデル学習フェーズを実施する学習装置と、予測フェーズを実施する予測装置とが存在し、当該学習装置が分類モデル学習部201、学習データ作成部202、予測モデル学習部203、第1のデータセット記憶部205、分類モデル記憶部206、第2のデータセット記憶部207、及び予測モデル用学習データセット記憶部208を有しており、当該予測装置が予測部204、予測モデル用学習データセット記憶部208、及び予測モデル記憶部209を有していてもよい。
【0036】
<モデル学習フェーズの処理と予測フェーズの処理>
以下、モデル学習フェーズの処理と予測フェーズの処理について、図4を参照しながら説明する。なお、ステップS101~ステップS103がモデル学習フェーズの処理、ステップS104が予測フェーズの処理である。
【0037】
ステップS101:まず、分類モデル学習部201は、第1のデータセット記憶部205に記憶されている第1のデータセットを用いて、分類モデルを学習する。そして、分類モデル学習部201は、学習済みの分類モデルのパラメータを分類モデル記憶部206に保存する。
【0038】
以下では、一例として、CPSC2018を第1のデータセットとして用いることを想定する。CPSC2018では、10秒~140秒の12誘導心電図の心電図データに対して9種類のラベル(Normal、AF、I-AVB(I度の房室ブロック、First-degree atrioventricular block)、LBBB(左脚ブロック、Left bundle brunch block)、RBBB(右脚ブロック、Right bundle brunch block)、PAC(上室性期外収縮、Premature atrial contraction)、PVC(心室性期外収縮、Premature ventricular contraction)、STD(STセグメント低下、ST-segment depression)、STE(STセグメント上昇、ST-segment elevated))のいずれかを付与している。そこで、これら9種類のラベルを3種類に統合し、分類モデルでは3クラス分類を行うようにする。具体的には、Normal、I-AVB、LBBB、RBBB、STD、STEの6種類のラベルを「SR」、AFの1種類を「AF」、PAC及びPVCの2種類を「その他」として3クラス分類を行うようにする。
【0039】
また、CPSC2018は10秒~140秒の心電図データであるため、分類モデルに入力するために、その長さ(時間区間)がΔT=1〔分〕(=60〔秒〕)となるように心電図データを加工する(つまり、単位心電図データとなるように加工する。)。具体的には、長さが60秒未満の心電図データに関しては、データ点数が3000点となるまでゼロパディングを行ったものを学習データとする。一方で、長さが60秒を超える心電図データに関しては、データ点数が3000点を超える部分の切り捨てたものを学習データとする。
【0040】
なお、より精度の良い分類モデルを得るために、データ拡張の手法を利用して、学習データとする心電図データ数を増加させてもよい。具体的には、例えば、60秒を超える心電図データから60秒間の心電図データをランダムに複数サンプリングしたり、心電図データに対してホワイトノイズや矩形波、sin波等を付与して新たな心電図データを生成したりしてもよい。
【0041】
分類モデルとしては、3クラス分類の分類タスクに用いられる任意の機械学習モデルを採用することが可能であるが、以下では、一例として、図5に示す分類モデルを想定する。図5に示す分類モデルは、1次元畳み込み層(Conv1d)と、バッチ正規化層(Batch Norm)と、正規化線形ユニット層(ReLU)と、ドロップアウト層(Dropout)と、最大値プーリング層(Max Pooling)と、全結合層(Dense)と、ソフトマックス層(Softmax)とで構成されている。なお、最初の1次元畳み込み層の入力次元数は3000次元、最後のソフトマックス層の出力次元数は3次元である。ただし、図5に示す分類モデルの構成は一例であって、これに限られるものではない。また、3クラス分類も一例であって、4クラス以上の多クラス分類であってもよい。
【0042】
このとき、分類モデル学習部201は、学習データとした心電図データを分類モデルに入力したときの分類結果が、その心電図データに付与されたラベルを精度良く推定するように分類モデルを学習する。なお、分類モデルの学習は、例えば、誤差逆伝播法等を利用した既知の教師あり学習の手法により行えばよい。
【0043】
ステップS102:次に、学習データ作成部202は、第2のデータセット記憶部207に記憶されている第2のデータセットを用いて、学習済みの分類モデルにより、予測モデル用学習データセットを作成する。そして、学習データ作成部202は、作成した予測モデル用学習データセットを予測モデル用学習データセット記憶部208に保存する。
【0044】
以下では、一例として、MIMIC-IIIを第2のデータセットとして用いることを想定する。MIMIC-IIIは、2日~3日等といった長さのラベルなし心電図データの集合である。
【0045】
そこで、まず、学習データ作成部202は、上記の(2)で説明した通り、これらの心電図データを時間区間ΔT毎に区切った上で、各時間区間ΔTの心電図データに対して学習済みの分類モデルによりラベルを付与する。これにより、例えば、或る心電図データを時間区間ΔT毎に区切って各時間区間をベクトルで表現すれば、図6に示すように、単位心電図データ系列{x,・・・,x}とそれらのラベル系列{y,・・・,y}とが得られる。なお、nは当該心電図データを時間区間ΔT毎に区切って単位心電図データの系列として表現したときの系列長である。
【0046】
次に、学習データ作成部202は、上記の(3)で説明した通り、ラベルyi+1,・・・,yi+L+mがすべて正常(SR)で、かつ、ラベルyi+L+m+1が正常(SR)又は心房細動(AF)のいずれかである単位心電図データ系列{xi+1,・・・,xi+L}と、ラベルyi+L+m+1とを抽出し、予測モデル用の学習データ({xi+1,・・・,xi+L},yi+L+m+1)とする。なお、mは予め決められた0以上の整数であり、Δt=mΔT〔分〕を満たす。
【0047】
これにより、Δt後のラベル(正常(SR)又は心房細動(AF))を教師データとして持つ学習データ({xi+1,・・・,xi+L},yi+L+m+1)の集合が、予測モデル用学習データセットとして得られる。以下、簡単のため、予測モデル用の或る学習データを(X,Y)と表し、予測モデル用学習データセットをD={(X,Y)|i=1,・・・,|D|}とする。ここで、X={x (i),・・・,x (i)}、YはXのラベル(教師データ)である。また、予測モデル用学習データセットDに含まれる任意の学習データを単に(X,Y)と表すことにする。
【0048】
ステップS103:次に、予測モデル学習部203は、予測モデル用学習データセット記憶部208に記憶されている予測モデル用学習データセットを用いて、予測モデルを学習する。そして、予測モデル学習部203は、学習済みの予測モデルのパラメータを予測モデル記憶部209に保存する。
【0049】
予測モデルとしては、時系列データの予測タスクに用いられる任意の機械学習モデルを採用することが可能であるが、以下では、一例として、図7に示す予測モデルを想定する。図7に示す予測モデルは、1次元のResNet(1d-Resnet)と、GRU(gated recurrent unit)と、全結合層(Dense)と、シグモイド層(Sigmoid)とで構成されている。この構成の予測モデルでは、系列長Lの単位心電図データ系列{x,・・・,x}が入力されると、i=1,・・・,Lに対して順にi番目の単位心電図データxが1次元のResNetでzに変換されると共にh=GRU(z,hs-1)により隠れ状態hが再帰的に計算され、最終的な隠れ状態hが全結合層で1次元のスカラー値に変換されてシグモイド関数により予測結果^yが得られる。なお、隠れ状態hは、例えば、適当な初期ベクトルとすればよい。
【0050】
上記の予測結果^yは、系列長Lの単位心電図データ系列{x,・・・,x}が得られたときに、そのΔt後のΔT間に心房細動が発生する確率を表現しており、0以上1以下の値を取る。なお、本明細書のテキストでは、便宜上、予測値を表す記号「^」を変数の直前に表記している。
【0051】
このとき、予測モデル学習部203は、単位心電図データ系列X∈Dを予測モデルに入力したときの予測結果^yが、その単位心電図データ系列Xに付与されたラベルYを精度良く推定するように予測モデルを学習する。なお、予測モデルの学習は、例えば、誤差逆伝播法等を利用した既知の教師あり学習の手法により行えばよい。
【0052】
ステップS104:予測部204は、予測対象の心電図データが与えられたときに、この心電図データを用いて、学習済みの予測モデルより、Δt後の心房細動の発生を予測する。
【0053】
例えば、系列長Lの単位心電図データ系列{x,・・・,x}が与えられたものとする。ここで、xは最新のΔT=1〔分〕間の単位心電図データであり、xL-i(i=1,・・・,L-1)は(i+1)ΔT分前からiΔT分前までの単位心電図データである。すなわち、xL-i(i=0,・・・,L-1)は(i+1)ΔT分前からiΔT分前までの単位心電図データである。
【0054】
このとき、予測部204は、系列長Lの単位心電図データ系列{x,・・・,x}を用いて、学習済みの予測モデルにより、予測結果^yを計算する。これにより、Δt後のΔT間に心房細動が発生するか否かを表す予測結果^yが得られる。
【0055】
なお、^yは0以上1以下の値を取り、Δt後のΔT間に心房細動が発生する確率を表しているため、予測部204は、例えば、0.5を閾値として、^yが当該閾値よりも大きいか否かを判定してもよい。そして、このとき、予測部204は、^yが当該閾値よりも大きいと判定した場合は「Δt後に心房細動が発生する」又は「Δt後に心房細動が発生する可能性が高い」旨の情報、そうでない場合は「Δt後に心房細動は発生しない」又は「Δt後に心房細動は発生する可能性が低い」旨の情報を予測結果としてもよい。
【0056】
<評価>
CPSC2018を第1のデータセット、MIMIC-IIIを第2のデータセットとして、上記のステップS102で作成された予測モデル用学習データセットDに含まれるデータ(X,Y)について、8割を学習データ、1割を検証データ、1割をテストデータとした。そして、系列長Lを1~5、Δtを0〔分〕~5〔分〕の範囲でそれぞれ変化させた上で、学習データにより予測モデルを学習した後、テストデータを用いてその予測性能をF1スコアにより評価した。なお、同一のテストデータを用いて5回テストを実施し、F1スコアはその平均値とした。このときの評価結果を以下の表1に示す。
【0057】
【表1】
【0058】
上記の表1に示すように、系列長L=1~5、Δt=0~5の範囲内で最も予測が困難であると考えられるL=1、Δt=5〔分〕の場合であっても、0.7を超えるF1スコアが得られており、高い予測性能を達成できていることがわかる。
【0059】
<まとめ>
以上のように、本実施形態に係る予測装置10は、上記の(1)~(3)により予測モデル用学習データセットを作成する。これにより、精度の良い予測モデルを得るための学習データを大量に得られ、その結果、学習済みの予測モデルにより、将来の心房細動の発生有無を精度良く予測することが可能となる。
【0060】
このため、本実施形態に係る予測装置10を利用することで、例えば、医者等は患者の心房細動の発生予測を知ることが可能となり、早期にその対処が可能となる。これにより、例えば、心房細動そのものの発生を予防するのみならず、他の合併症の発生も予防することが可能となり、その結果、集中治療室の滞在期間や入院期間の延長、医療費の増大等の防止等が期待できる。
【0061】
なお、上記の実施形態では、心電図データから心房細動の発生を予測したが、心電図データに加えて、人体から取得可能な様々な情報を表す時系列データを用いて心房細動の発生を予測してもよい。例えば、心電図データに加えて、動脈圧、肺動脈圧、中心静脈圧、血液酸素飽和度等といった情報を表す時系列データを用いて心房細動の発生を予測してもよい。
【0062】
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
【符号の説明】
【0063】
10 予測装置
101 入力装置
102 表示装置
103 外部I/F
103a 記録媒体
104 通信I/F
105 RAM
106 ROM
107 補助記憶装置
108 プロセッサ
109 バス
201 分類モデル学習部
202 学習データ作成部
203 予測モデル学習部
204 予測部
205 第1のデータセット記憶部
206 分類モデル記憶部
207 第2のデータセット記憶部
208 予測モデル用学習データセット記憶部
209 予測モデル記憶部
図1
図2
図3
図4
図5
図6
図7