(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022184475
(43)【公開日】2022-12-13
(54)【発明の名称】予測装置、予測方法、予測プログラム、予測システム
(51)【国際特許分類】
A61B 10/00 20060101AFI20221206BHJP
A61B 5/022 20060101ALI20221206BHJP
A61B 5/0245 20060101ALI20221206BHJP
G01N 33/48 20060101ALI20221206BHJP
G01N 33/50 20060101ALI20221206BHJP
G01N 33/68 20060101ALI20221206BHJP
G01N 33/72 20060101ALI20221206BHJP
G01N 33/66 20060101ALI20221206BHJP
G01N 33/49 20060101ALI20221206BHJP
G06N 20/00 20190101ALI20221206BHJP
【FI】
A61B10/00 K
A61B5/022 400A
A61B5/0245 100A
G01N33/48 Z
G01N33/50 Z
G01N33/68
G01N33/72 A
G01N33/66
G01N33/49 A
G06N20/00
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021092351
(22)【出願日】2021-06-01
(71)【出願人】
【識別番号】509349141
【氏名又は名称】京都府公立大学法人
(71)【出願人】
【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】西 真宏
(72)【発明者】
【氏名】的場 聖明
(72)【発明者】
【氏名】奥野 恭史
(72)【発明者】
【氏名】内野 詠一郎
【テーマコード(参考)】
2G045
4C017
【Fターム(参考)】
2G045AA25
2G045CA25
2G045DA20
2G045DA31
2G045DA36
2G045DA42
2G045JA01
2G045JA07
4C017AA08
4C017AA10
4C017BC11
4C017BD04
4C017FF05
(57)【要約】
【課題】より高い精度で急性心筋梗塞の患者の予後を予測することができる技術を提供する。
【解決手段】予測装置1は、患者の少なくとも1つの特徴量を取得する取得部と、学習済みの予測モデルを用いて少なくとも1つの特徴量に基づき予後を予測する予測部と、予後の予測結果を出力する出力部とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
急性心筋梗塞の患者の予後を予測する予測装置であって、
前記患者の少なくとも1つの特徴量を取得する取得部と、
学習済みの予測モデルを用いて前記少なくとも1つの特徴量に基づき前記予後を予測する予測部と、
前記予後の予測結果を出力する出力部とを備える、予測装置。
【請求項2】
前記少なくとも1つの特徴量は、血液中のクレアチンフォスフォキナーゼの最大値を含む、請求項1に記載の予測装置。
【請求項3】
前記少なくとも1つの特徴量は、6種類以上の特徴量である、請求項2に記載の予測装置。
【請求項4】
前記少なくとも1つの特徴量は、血液中のクレアチンフォスフォキナーゼの最大値、血液中のヘモグロビンの量、心拍数、血液中のクレアチニンの濃度、収縮期血圧、血糖値、年齢、前記急性心筋梗塞における心機能障害の重症度に関する分類の結果、血液中の白血球の数、および血液中のC反応性タンパクの量の10種類の特徴量である、請求項1に記載の予測装置。
【請求項5】
前記予測モデルは、前記少なくとも1つの特徴量と前記患者の院内死亡の有無とに基づく機械学習によって生成されている、請求項1~請求項4のいずれか1項に記載の予測装置。
【請求項6】
前記機械学習のアルゴリズムは、ランダムフォレストを含む、請求項5に記載の予測装置。
【請求項7】
表示装置をさらに備え、
前記出力部は、前記予測結果を前記表示装置に出力し、
前記表示装置は、前記少なくとも1つの特徴量の値を入力するための画像と、前記予測結果を含む画像とを表示する、請求項1~請求項6のいずれか1項に記載の予測装置。
【請求項8】
コンピュータによる急性心筋梗塞の患者の予後を予測する予測方法であって、
前記患者の少なくとも1つの特徴量を取得するステップと、
学習済みの予測モデルを用いて前記少なくとも1つの特徴量に基づき前記予後を予測するステップと、
前記予後の予測結果を出力するステップとを含む、予測方法。
【請求項9】
急性心筋梗塞の患者の予後を予測する予測プログラムであって、
コンピュータに、
前記患者の少なくとも1つの特徴量を取得するステップと、
学習済みの予測モデルを用いて前記少なくとも1つの特徴量に基づき前記予後を予測するステップと、
前記予後の予測結果を出力するステップとを実行させる、予測プログラム。
【請求項10】
急性心筋梗塞の患者の予後を予測する予測システムであって、
ユーザ端末と、
前記ユーザ端末と通信するように構成されたサーバ装置とを備え、
前記サーバ装置は、
前記患者の少なくとも1つの特徴量を前記ユーザ端末から取得する取得部と、
学習済みの予測モデルを用いて前記少なくとも1つの特徴量に基づき前記予後を予測する予測部と、
前記予後の予測結果を前記ユーザ端末に出力する出力部とを備える、予測システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、予測装置、予測方法、予測プログラム、および予測システムに関する。
【背景技術】
【0002】
急性心筋梗塞(AMI:Acute Myocardial Infarction、以下、「AMI」とも称する。)は、世界の主な死亡原因である。現在まで、AMIの患者の短期および長期の予後を予測するために、いくつかの手法が提案されている。
【0003】
たとえば、特許文献1には、AMIの予後を予測する手法として、TIMI(Thrombolysis In Myocardial Ischemia)リスクインデックスおよびGRACE(Global Registries of Acute Coronary Events)スコアなどのリスクスコアリング方法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に開示された従来の予測手法は、カテーテルによる経皮的冠動脈形成術がAMIに対する主な治療法となる前から存在する。このため、従来の予測手法は、経皮的冠動脈形成術が主な治療法となった現在の標準的な診療に適合しているとは言い難く、より高い精度でAMIの患者の予後を予測することができる予測手法が求められている。
【0006】
本開示は、このような課題を解決するためになされたものであって、その目的は、より高い精度で急性心筋梗塞の患者の予後を予測することができる技術を提供することである。
【課題を解決するための手段】
【0007】
本開示のある局面に従う予測装置は、急性心筋梗塞の患者の予後を予測する。予測装置は、取得部と、予測部と、出力部とを備える。取得部は、患者の少なくとも1つの特徴量を取得する。予測部は、学習済みの予測モデルを用いて少なくとも1つの特徴量に基づき予後を予測する。出力部は、予後の予測結果を出力する。
【0008】
本開示の他の局面に従う予測方法は、コンピュータによる急性心筋梗塞の患者の予後を予測する方法である。予測方法は、(a)患者の少なくとも1つの特徴量を取得するステップと、(b)学習済みの予測モデルを用いて少なくとも1つの特徴量に基づき予後を予測するステップと、(c)予後の予測結果を出力するステップとを含む。
【0009】
本開示の他の局面に従う予測プログラムは、急性心筋梗塞の患者の予後を予測するプログラムである。予測プログラムは、コンピュータに、(a)患者の少なくとも1つの特徴量を取得するステップと、(b)学習済みの予測モデルを用いて少なくとも1つの特徴量に基づき予後を予測するステップと、(c)予後の予測結果を出力するステップとを実行させる。
【0010】
本開示の他の局面に従う予測システムは、急性心筋梗塞の患者の予後を予測する。予測システムは、ユーザ端末と、ユーザ端末と通信するように構成されたサーバ装置とを備える。サーバ装置は、取得部と、予測部と、出力部とを備える。取得部は、患者の少なくとも1つの特徴量をユーザ端末から取得する。予測部は、学習済みの予測モデルを用いて少なくとも1つの特徴量に基づき予後を予測する。出力部は、予後の予測結果をユーザ端末に出力する。
【発明の効果】
【0011】
本開示によれば、学習済みの予測モデルを用いて患者の特徴量に基づき予後を予測することができるため、より高い精度で急性心筋梗塞の患者の予後を予測することができる。
【図面の簡単な説明】
【0012】
【
図1】実施の形態1に係る予測装置の適用例を説明するための図である。
【
図2】実施の形態1に係る予測装置が備える制御装置の構成を示す図である。
【
図3】実施の形態1に係る予測モデルの生成を説明するための図である。
【
図4】サンプルデータの一例を説明するための図である。
【
図5】サンプルデータの一例を説明するための図である。
【
図6】特徴量の種類数ごとのAUC(Area Under the Curve)の評価結果を示す図である。
【
図7】特徴量ごとの重要度を説明するための図である。
【
図8】特徴量ごとの重要度を説明するための図である。
【
図9】本実施例と比較例とにおける予測モデルの比較結果を示す図である。
【
図10】本実施例と比較例とにおける予測モデルの比較結果を示す図である。
【
図11】本実施例と比較例とにおける予測モデルの比較結果を示す図である。
【
図12】本実施例と比較例とにおける予測モデルの比較結果を示す図である。
【
図13】本実施例と比較例とにおける予測モデルの比較結果を示す図である。
【
図14】実施の形態1に係る予測装置による予測結果の表示の一例を説明するための図である。
【
図15】実施の形態1に係る予測装置が実行する予測処理のフローチャートである。
【
図16】実施の形態2に係る予測システムを説明するための図である。
【発明を実施するための形態】
【0013】
本実施の形態について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一の符号を付して、その説明は原則的に繰り返さない。
【0014】
<実施の形態1に係る予測装置>
図1~
図15を参照しながら実施の形態1に係る予測装置1について説明する。
【0015】
[予測装置の構成]
図1は、実施の形態1に係る予測装置1の適用例を説明するための図である。予測装置1は、デスクトップ型のPC(personal computer)、ラップトップ型のPC、スマートフォン、スマートウォッチ、ウェアラブルデバイス、およびタブレットPCなど、所定の情報処理を実行する情報端末である。実施の形態1では、予測装置1は、医者などのユーザによって用いられ、AMIの患者の予後を予測するための処理(以下、「予測処理」とも称する。)を実行する。
【0016】
具体的には、予測装置1は、AMIの患者の予後を予測するための予測モデル121を備える。予測モデル121は、患者に属する少なくとも1つの特徴量と患者の院内死亡の有無とに基づく機械学習によって生成されている。予測装置1は、予測モデル121を用いることで、AMIの患者の特徴量に基づき患者の予後を予測する。ユーザは、予測装置1による予測結果を患者に提供することで、患者に対して従来よりも高い精度で診療を行うことができる。
【0017】
図1に示されるように、予測装置1は、制御装置10と、表示装置20と、キーボード31と、マウス32とを備える。表示装置20は、制御装置10の制御に従ってディスプレイ25に画像を表示する。キーボード31およびマウス32の各々は、ユーザの操作を受け付け、受け付けたユーザの操作に基づく情報を制御装置10に入力する。なお、表示装置20は、図示しないタッチパネルを備えていてもよい。ユーザは、タッチパネルを操作することで、制御装置10に情報を入力してもよい。
【0018】
図2は、実施の形態1に係る予測装置1が備える制御装置10の構成を示す図である。
図2に示されるように、制御装置10は、演算装置11と、記憶装置12と、入力インターフェース13と、出力インターフェース14とを備える。
【0019】
演算装置11は、「予測部」の一例であり、各種のプログラムに従って各種の処理を実行する演算主体(コンピュータ)である。演算装置11は、たとえば、CPU(Central Processing Unit)、FPGA(Field Programmable Gate Array)、GPU(Graphics Processing Unit)、およびMPU(Multi Processing Unit)のうちの少なくとも1つを含む。さらに、演算装置11は、DRAM(Dynamic Random Access Memory)およびSRAM(Static Random Access Memory)などの揮発性メモリ、ROM(Read Only Memory)およびフラッシュメモリなどの不揮発性メモリを含んでいてもよい。なお、演算装置11は、演算回路(Processing Circuitry)で構成されていてもよい。
【0020】
記憶装置12は、HDD(Hard Disk Drive)およびSSD(Solid State Drive)などの不揮発性メモリを含む。記憶装置12は、予測モデル121および予測プログラム122など、各種のプログラムおよびデータを記憶する。予測プログラム122は、演算装置11が予測モデル121を用いて予測処理を実行するためのプログラムである。
【0021】
入力インターフェース13は、「取得部」の一例であり、外部から入力された情報を取得する。たとえば、入力インターフェース13は、キーボード31およびマウス32の各々から入力された情報を取得する。
【0022】
出力インターフェース14は、「出力部」の一例であり、演算装置11の制御に従って外部に情報を出力する。たとえば、出力インターフェース14は、画像を表示するための情報を表示装置20に出力する。
【0023】
上述したように構成された制御装置10においては、入力インターフェース13は、AMIの患者の少なくとも1つの特徴量を外部から取得する。演算装置11は、予測プログラム122に従って予測処理を実行することで、AMIの患者の特徴量と予測モデル121とに基づき、患者の予後を予測する。出力インターフェース14は、演算装置11によって得られた予測結果を含む画像情報を表示装置20に出力する。表示装置20は、制御装置10から取得した画像情報に基づき、予測結果をディスプレイ25に表示する。
【0024】
これにより、ユーザは、AMIの患者の少なくとも1つの特徴量を予測装置1に入力することで、学習済みの予測モデル121を用いて患者の予後を予測することができる。
【0025】
[予測モデルの生成]
図3~
図8を参照しながら、予測モデル121の生成について説明する。
【0026】
図3は、実施の形態1に係る予測モデル121の生成を説明するための図である。実施の形態1に係る予測モデル121は、教師あり学習によって生成される。
図3に示されるように、予測モデル121の設計者は、まず、予測モデル121を生成するときに用いる複数のサンプルデータを用意する。たとえば、設計者は、経皮的冠動脈形成術がAMIに対する主な治療法となった以降のAMIの患者に関するデータを用意する。この例では、設計者は、サンプルデータとして、2009年から2015年までの期間において医療機関に登録されている2553人のST上昇型急性心筋梗塞の患者のデータを用意している。
【0027】
複数のサンプルデータの各々は、少なくとも1つの特徴量と、正解データとを含む。少なくとも1つの特徴量は、患者の臨床学的データおよび生物学的データなどを含む。正解データは、患者の院内死亡の有無の情報を含む。
【0028】
ここで、
図4および
図5を参照しながら、サンプルデータについて具体的に説明する。
図4および
図5は、サンプルデータの一例を説明するための図である。
図4および
図5には、特徴量ごとに、生存した患者に関するデータと院内で死亡した患者に関するデータとが示されている。
【0029】
図4および
図5に示されるように、2553人の患者のうち、生存した患者の数は2358人であり、院内で死亡した患者の数は195人である。すなわち、2553個のサンプルデータのうち、正解データとして生存が割り当てられたサンプルデータ(Survival)の数が2358個であり、正解データとして院内死亡が割り当てられたサンプルデータ(Dead)の数が195個である。サンプルデータは、生存した患者と院内で死亡した患者との各々で、各種の特徴量に対応するデータを含む。
【0030】
図4に示されるように、特徴量は、たとえば、年齢、性別、ボディマス指数(BMI:Body Mass Index)、高血圧の有無、糖尿病の有無、脂質異常症の有無、喫煙の有無、AMIを発症した家族の有無、過去のAMIの発症有無、過去の心血管病の発症有無、血液透析による治療有無、AMIにおける心機能障害の重症度に関するキリップ分類(Killip)の結果、収縮期血圧(BPs:Systolic Blood Pressure)、心拍数(HR:Heart Rate)、血液中の白血球(WBC:White Blood Cell)の数、血液中のヘモグロビン(Hb:Hemoglobin)の量、血糖値(BS:Blood Sugar)、血液中のクレアチンフォスフォキナーゼの最大値(max CPK:max Creatine Phosphorus Kinase、以下、「maxCPK」とも称する。)、血液中のクレアチニン(Cr:Creatinine)の濃度、血液中のC反応性タンパク(CRP:C-Reactive Protein)の量、治療前および治療後の各々のTIMIグレード、ステントを用いた治療の有無、および血栓吸引による治療の有無などを含む。
【0031】
ここで、クレアチンフォスフォキナーゼ(CPK:Creatine Phosphorus Kinase、以下、「CPK」とも称する。)は、骨格筋、心筋、および平滑筋などの筋肉に存在する酵素であり、筋肉細胞のエネルギー代謝に重要な役割を果たしている。これらの筋肉細胞に異常が生じると、CPKが血液中に流れ出すため、血液中のCPKの量が多くなる。AMIが発症した場合、血液検査によって示されるCPKの値が正常値よりも高くなり、AMIが発症してから24時間以内にはピークアウトする。maxCPKは、ピークアウト時のCPKの値である。なお、CPKの値を表す単位としては、「IU/L」または「U/L」が用いられる。これらの単位については、たとえば、試料1Lのうち、所定温度(たとえば30度、臨床検査の自動生化学分析機での測定では37度)で1分間に1μmolの基質を変化させることができる酵素量を1単位としている。
【0032】
さらに、
図5に示されるように、特徴量は、たとえば、AMIが発症した部位、AMIが発症した責任血管、病変数、AMIが発症した季節、AMIの発症時刻、患者が病院に到着してから血流再開までに要した時間、AMIが発症してから患者が病院に到着するまでに要した時間、および来院方法などを含む。なお、
図4および
図5の各々に括弧で示されるように、複数の特徴量のうちの一部の特徴量は、割合(%)またはデータのばらつきの範囲(IQR:Interquartile Range)の情報も含んでいる。
【0033】
図3に戻り、設計者は、ホールドアウト法を用いて予測モデル121の生成および評価を行う。具体的には、設計者は、複数のサンプルデータを、予測モデル121を生成するための訓練データと、予測モデル121を評価するためのテストデータとに分ける。たとえば、設計者は、複数のサンプルデータの80%を訓練データとして用い、複数のサンプルデータの20%をテストデータとして用いる。なお、訓練データおよびテストデータの各々の割合は、設計者が適宜設定すればよい。
【0034】
さらに、設計者は、複数の訓練データを用いて、K分割交差検証によって予測モデル121を生成する。具体的には、設計者は、複数の訓練データをK個(この例ではK=5)に分け、K個の訓練データのうち、1個の訓練データを検証データとして用い、残り(K-1個)の訓練データを学習データとして用いる。そして、設計者は、学習データを用いて予測モデルを学習させ、その後、検証データを用いて予測モデルを評価する。次に、設計者は、K個の訓練データのうち、既に検証データとして用いた訓練データとは異なる1個の訓練データを新たな検証データとして用い、残り(K-1個)の訓練データを新たな学習データとして用いる。そして、設計者は、学習データを用いて予測モデルを学習させ、その後、検証データを用いて予測モデルを評価する。
【0035】
設計者は、上述したような予測モデルに対する機械学習および評価のセットを、全ての訓練データが検証データとして用いられるまでK回繰り返す。このようにして、設計者は、複数の訓練データを用いて予測モデルを生成する。
【0036】
予測モデルの機械学習としては、アンサンブル学習が適用される。たとえば、実施の形態1では、機械学習のアルゴリズムとして、ランダムフォレストが用いられる。ランダムフォレストとは、訓練データに含まれる複数の特徴量の中からランダムに選択された少なくとも1つの特徴量に基づき複数の決定木を生成し、複数の決定木の各々の予測結果の平均または多数決をとることで予測精度を高める手法である。
【0037】
設計者は、学習アルゴリズムとしてランダムフォレストを採用した学習器(random forest classifier)を用いることで、生成した複数の予測モデルのうち、最も予測精度の高い予測モデルを選択するとともに、予測精度が最も高くなる少なくとも1つの特徴量を選択することができる。そして、設計者は、選択した予測モデルを、テストデータを用いて評価する。このとき、設計者は、テストデータの特徴量として予測精度が最も高くなるような特徴量を用いる。このようにして、設計者は、最終的な予測モデル121を生成することができる。
【0038】
なお、予測モデル121の機械学習のアルゴリズムには、ランダムフォレストに限らず、サポートベクターマシン、ニューラルネットワーク、ロジスティック回帰、およびxgboost(eXtreme Gradient Boosting)などの公知の学習アルゴリズムが適用されてもよい。さらに、設計者は、少なくとも1つの特徴量を抽出するために用いるアルゴリズムと同じアルゴリズムを用いて予測モデル121を生成してもよいし、少なくとも1つの特徴量を抽出するために用いるアルゴリズムと異なるアルゴリズムを用いて予測モデル121を生成してもよい。たとえば、設計者は、学習データの中から予測精度が最も高くなる少なくとも1つの特徴量を選択する際には、ランダムフォレストのアルゴリズムを用いる一方で、選択された少なくとも1つの特徴量を用いて最終的な予測モデル121を生成する際には、ランダムフォレストとは異なる上述した別のアルゴリズムを用いて予測モデル121を生成してもよい。
【0039】
図6は、特徴量の種類数ごとのAUC(Area Under the Curve)の評価結果を示す図である。
図6(A)には、ランダムフォレストによって生成された予測モデルにおけるAUCの評価結果が示されている。
図6(B)には、xgboostによって生成された予測モデルにおけるAUCの評価結果が示されている。
図6(C)には、ロジスティック回帰によって生成された予測モデルにおけるAUCの評価結果が示されている。
図6には、各学習アルゴリズムについて、横軸に特徴量の種類数、縦軸にAUCをとったグラフが示されている。
【0040】
AUCは、後述する
図9に示されるように、横軸に偽陽性率(1-特異度)、縦軸に感度をとったグラフにおいてプロットされるROC(Receiver Operating Characteristic)曲線について、ROC曲線下の面積によって示される評価指標である。AUCは、1に近いほど予測モデルの予測精度が高いと言える。偽陽性率は、正解データとして負ラベル(たとえば、生存)が紐付けられたサンプルデータのラベルを、予測モデルが間違えて正ラベル(たとえば、院内死亡)と予測した割合を示す。感度は、正解データとして正ラベル(たとえば、院内死亡)が紐付けられたサンプルデータのラベルを、予測モデルが正しく正ラベル(たとえば、院内死亡)と予測した割合を示す。
【0041】
図6に示されるように、ランダムフォレスト、xgboost、およびロジスティック回帰のいずれの学習アルゴリズムによって生成された予測モデルであっても、入力として6種類以上の特徴量を用いた場合に0.85以上の高い値のAUCを得ることができる。さらに、いずれの学習アルゴリズムによって生成された予測モデルであっても、入力として10種類の特徴量を用いた場合に最も高い値のAUCを得ることができる。
【0042】
図7および
図8は、特徴量ごとの重要度を説明するための図である。
図7および
図8には、横軸に特徴量の重要度、縦軸に特徴量の種類をとったグラフが示されている。特徴量の重要度は、学習アルゴリズムとしてランダムフォレストを用いた学習器によって算出される。予測モデルの入力データとして用いられた特徴量の重要度が高ければ高いほど、予測モデルの予測精度が高くなる。
【0043】
図7に示されるように、最も高い値のAUCを得ることができる10種類の特徴量は、maxCPK、ヘモグロビンの量、心拍数、クレアチニンの濃度、収縮期血圧、血糖値、年齢、キリップ分類の結果、白血球の数、およびC反応性タンパクの量である。
【0044】
図8に示されるように、予測モデルの入力データとして全ての特徴量を選択した場合、重要度の高い特徴量から順に、maxCPK、収縮期血圧、年齢、クレアチニンの濃度、キリップ分類の結果、ヘモグロビンの量、白血球の数、心拍数、血糖値、ボディマス指数、およびC反応性タンパクの量などが挙げられる。
【0045】
図7および
図8のいずれに示されるグラフにおいても、maxCPKの重要度が最も高く、全ての特徴量の中でmaxCPKが予測モデルの予測精度を最も高めることができる。
【0046】
このように、予測モデル121の設計者である本発明者は、AMIの患者の予後を予測するときに用いる患者の特徴量として、6種類以上の特徴量を用いることで予測精度を高く維持することができること、
図7に示されるような10種類の特徴量を用いることで予測精度を最も高めることができること、および、全ての特徴量の中でもmaxCPKを用いることで予測精度を最も高めることができることを見出した。なお、予測モデル121の生成にはパイソン(Python)のコードが用いられたが、予測モデル121は、その他のプログラミング言語を用いて生成されてもよい。
【0047】
[予測モデルの評価]
図9~
図13を参照しながら、予測モデル121の評価について説明する。
図9~
図13は、本実施例と比較例とにおける予測モデルの比較結果を示す図である。
図9~
図13に示される評価結果においては、本実施例としてランダムフォレストによって生成された予測モデル121に対して
図7に示されるような10種類の特徴量が入力された場合の予測結果が用いられている。比較例1として従来のTIMIリスクインデックスによる予測結果が用いられている。比較例2として従来のGRACEスコアによる予測結果が用いられている。
【0048】
図9には、本実施例、比較例1、および比較例2の各々について、横軸に偽陽性率、縦軸に感度をとったROC(Receiver Operating Characteristic)曲線のグラフが示されている。グラフにおいて、ROC曲線よりも下の部分の面積は、AUC(Area Under the Curve)と称され、0から1までの値をとる。予測精度が高いほどAUCの値が1に近くなる。
【0049】
図9に示されるように、本実施例の予測モデル121を用いた予測結果は、比較例1および比較例2の各々を用いた予測結果よりも、AUCが1に近い。
【0050】
このように、ROC曲線を用いた比較によれば、本実施例の予測モデル121は、比較例1および比較例2の各々よりも、予測精度が高くなっていることが分かる。
【0051】
図10には、本実施例、比較例1、および比較例2の各々について、511個のサンプルデータを用いて予後を予測した場合の混同行列が示されている。混同行列は、予測精度を評価する際に用いられ、真陰性(TN:True Negative)、偽陽性(FP:False Positive)、偽陰性(FN:False Negative)、および真陽性(TP:True Positive)を含む。
【0052】
真陰性は、正解データとして負ラベル(たとえば、生存)が紐付けられたサンプルデータのラベルを、正しく負ラベル(たとえば、生存)と予測した数を示し、予測精度が高いほど値が大きくなる。偽陽性は、正解データとして負ラベル(たとえば、生存)が紐付けられたサンプルデータのラベルを、間違えて正ラベル(たとえば、院内死亡)と予測した数を示し、予測精度が高いほど値が小さくなる。偽陰性は、正解データとして正ラベル(たとえば、院内死亡)が紐付けられたサンプルデータのラベルを、間違えて負ラベル(たとえば、生存)と予測した数を示し、予測精度が高いほど値が小さくなる。真陽性は、正解データとして正ラベル(たとえば、院内死亡)が紐付けられたサンプルデータのラベルを、正しく正ラベル(たとえば、院内死亡)と予測した数を示し、予測精度が高いほど値が大きくなる。
【0053】
図10に示されるように、本実施例の予測結果は、比較例1および比較例2の各々の予測結果よりも、真陰性(TN)の値が大きい。本実施例の予測結果は、比較例1および比較例2の各々の予測結果よりも、偽陽性(FP)の値が小さい。本実施例の予測結果は、比較例2の予測結果よりも、偽陰性(FN)の値が小さく、その値は比較例1の予測結果と同じである。本実施例の予測結果は、比較例2の予測結果よりも、真陽性(TP)の値が大きく、その値は比較例1の予測結果と同じである。
【0054】
このように、混同行列を用いた比較によれば、本実施例の予測モデル121は、比較例1および比較例2の各々よりも、予測精度が高くなっていることが分かる。
【0055】
図11(A)には、本実施例、比較例1、および比較例2の各々について、感度を比較した結果が示されている。
図11(B)には、本実施例、比較例1、および比較例2の各々について、特異度を比較した結果が示されている。
図11(C)には、本実施例、比較例1、および比較例2の各々について、適合率を比較した結果が示されている。
図11(D)には、本実施例、比較例1、および比較例2の各々について、F値を比較した結果が示されている。
図11(E)には、本実施例、比較例1、および比較例2の各々について、正確率を比較した結果が示されている。
【0056】
感度(再現率)は、TP/(TP+FN)で算出され、予測精度が高いほど値が大きくなる。特異度は、TN/(TN+FP)で算出され、予測精度が高いほど値が大きくなる。適合率は、TP/(TP+FP)で算出され、予測精度が高いほど値が大きくなる。F値は、(2*再現率*適合率)/(再現率+適合率)で算出され、予測精度が高いほど値が大きくなる。正確率は、(TP+TN)/(TN+FP+FN+FP)で算出され、予測精度が高いほど値が大きくなる。
【0057】
図11に示されるように、本実施例の予測結果は、比較例1および比較例2の各々の予測結果よりも、感度、特異度、適合率、F値、および正確率のいずれの値も大きい。
【0058】
このように、感度、特異度、適合率、F値、および正確率を用いた比較によれば、本実施例の予測モデル121は、比較例1および比較例2の各々よりも、予測精度が高くなっていることが分かる。
【0059】
図12には、本実施例、比較例1、および比較例2の各々について、横軸に再現率、縦軸に適合率をとったPR(Precision Recall)曲線のグラフが示されている。グラフにおいて、PR曲線よりも下の部分の面積は、AUPRC(Area Under the Precision Recall Curve)と称され、0から1までの値をとる。予測精度が高いほどAUPRCの値が1に近くなる。
【0060】
図12に示されるように、本実施例の予測結果は、比較例1および比較例2の各々の予測結果よりも、AUPRCが1に近い。
【0061】
このように、PR曲線を用いた比較によれば、本実施例の予測モデル121は、比較例1および比較例2の各々よりも、予測精度が高くなっていることが分かる。
【0062】
図13には、本実施例、比較例1、および比較例2の比較結果がまとめられている。
図13に示されるように、本実施例の予測モデル121は、比較例1および比較例2の各々よりも、予測精度が高くなっている。
【0063】
比較例1のTIMIリスクインデックスおよび比較例2のGRACEスコアは、経皮的冠動脈形成術がAMIに対する主な治療法となる前から存在するため、現在の標準的な診療に適合しているとは言い難い。これに対して、本実施例の予測モデル121は、経皮的冠動脈形成術がAMIに対する主な治療法となった以降のAMIの患者に関するサンプルデータを用いて生成されているため、現在の標準的な診療に適合している。
【0064】
本実施例の予測モデル121はAI(Artificial Intelligence)による機械学習を用いているのに対して、比較例1のTIMIリスクインデックスおよび比較例2のGRACEスコアはAIを用いていない。
【0065】
本実施例の予測モデル121は、ユーザがAMIの患者の特徴量を予測装置1に入力することで、比較例1のTIMIリスクインデックスおよび比較例2のGRACEスコアの各々よりも高い精度でAMIの患者の予後を予測することができるため、利便性および実用性に優れている。
【0066】
[予測結果の表示]
図14を参照しながら、予測装置1による予測結果の表示の一例を説明する。
図14は、実施の形態1に係る予測装置1による予測結果の表示の一例を説明するための図である。
【0067】
図14に示されるように、予測装置1の表示装置20は、ユーザが少なくとも1つの特徴量の値を入力するための画像21および画像22と、少なくとも1つの特徴量の値に基づき算出された予測結果を含む画像23とを、ディスプレイ25に表示する。
【0068】
画像21は、キリップ分類の結果をユーザが入力するためのアイコンを含む。画像22は、maxCPK、年齢、クレアチニンの濃度、C反応性タンパクの量、ヘモグロビンの量、白血球の数、血糖値、収縮期血圧、および心拍数の各々をユーザが入力するためのアイコンを含む。画像23は、予測結果として、たとえば院内死亡の確率を示す情報を含む。
【0069】
ユーザは、キーボード31およびマウス32などを用いて画像21および画像22を介して少なくとも1つの特徴量を予測装置1に入力することで、画像23によって表示された予測結果を得ることができる。
【0070】
なお、予測装置1は、予測結果として、生存の確率を示す情報を表示装置20のディスプレイ25に表示させてもよい。さらに、予測装置1は、確率ではなく、予め定められた基準に従って算出されるポイントによって予測結果を提示してもよい。
【0071】
[予測装置の処理]
図15を参照しながら、予測装置1の処理について説明する。
図15は、実施の形態1に係る予測装置1が実行する予測処理のフローチャートである。
図15に示される処理ステップ(以下、これを「S」と略す。)は、演算装置11が予測プログラム122を実行することによって実現される。
【0072】
図15に示されるように、予測装置1は、入力インターフェース13によって、少なくとも1つの特徴量を取得する(S1)。予測装置1は、取得した少なくとも1つの特徴量と学習済みの予測モデル121とに基づき、患者の予後を予測する(S2)。予測装置1は、出力インターフェース14によって、予後の予測結果を表示装置20に出力する。
【0073】
以上のように、実施の形態1に係る予測装置1によれば、患者の特徴量と学習済みの予測モデル121とに基づき予後を予測することができるため、より高い精度でAMIの患者の予後を予測することができる。したがって、予測装置1は、臨床現場におけるインフォームドコンセントなどにも役立てることができ、ユーザは、予測装置1を用いることで、AMIの患者に対する診療の質を向上させることができる。
【0074】
<実施の形態2に係る予測システム>
以下、実施の形態2に係る予測システム1000について、実施の形態1に係る予測装置1と異なる部分のみを説明する。
図16は、実施の形態2に係る予測システム1000を示す図である。
【0075】
図16に示されるように、予測システム1000は、ユーザ端末200と、サーバ装置300とを備える。サーバ装置300は、ネットワーク500を介してユーザ端末200と通信するように構成されている。
【0076】
ユーザ端末200は、デスクトップ型のPC(personal computer)、ラップトップ型のPC、スマートフォン、スマートウォッチ、ウェアラブルデバイス、およびタブレットPCなど、所定の情報処理を実行する情報端末である。
【0077】
サーバ装置300は、実施の形態1に係る制御装置10と同様に、取得部330と、予測部310と、出力部340とを備える。取得部330および出力部340は、たとえば、ネットワーク500を介してユーザ端末200と通信するための通信装置で構成され得る。予測部310は、たとえば、制御装置10と同様にCPUなどの演算装置によって構成され得る。
【0078】
このような構成を備える予測システム1000において、ユーザは、AMIの患者の少なくとも1つの特徴量をユーザ端末200に入力する。ユーザ端末200は、ネットワーク500を介して、サーバ装置300に少なくとも1つの特徴量を出力する。サーバ装置300は、ユーザ端末200から取得した少なくとも1つの特徴量を取得し、取得した少なくとも1つの特徴量と学習済みの予測モデルとに基づき、患者の予後を予測する。サーバ装置300は、ネットワーク500を介して、ユーザ端末200に予測結果を出力する。ユーザ端末200は、サーバ装置300から取得した予測結果をディスプレイ250に表示する。
【0079】
これにより、ユーザは、AMIの患者の特徴量をユーザ端末200に入力することで、サーバ装置300を用いて患者の予後を予測することができる。
【0080】
なお、サーバ装置300は、1つのユーザ端末200に限らず、複数のユーザ端末200と通信するように構成されてもよい。たとえば、予測システム1000においては、サーバ装置300がクラウドコンピューティングの態様で存在してもよい。この場合、サーバ装置300は、複数のユーザ端末200の各々から取得した少なくとも1つの特徴量に基づき、患者の予後を予測し、その予測結果を複数のユーザ端末200の各々に出力してもよい。このようにすれば、たとえば、地域内の複数の病院の各々に設置されたユーザ端末200からの入力に応答して、中核病院のサーバ装置300から予測結果を各ユーザ端末200に送信することも可能になる。
【0081】
今回開示された実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本開示の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0082】
1 予測装置、10 制御装置、11 演算装置、12 記憶装置、13 入力インターフェース、14 出力インターフェース、20 表示装置、21,22,23 画像、25,250 ディスプレイ、31 キーボード、32 マウス、121 予測モデル、122 予測プログラム、200 ユーザ端末、300 サーバ装置、310 予測部、330 取得部、340 出力部、500 ネットワーク、1000 予測システム。