(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-14
(45)【発行日】2022-09-26
(54)【発明の名称】予後予測システム、予後予測プログラム作成装置、予後予測装置、予後予測方法及び予後予測プログラム
(51)【国際特許分類】
G16H 50/70 20180101AFI20220915BHJP
G06Q 10/04 20120101ALI20220915BHJP
G06N 20/00 20190101ALI20220915BHJP
G01N 33/48 20060101ALI20220915BHJP
【FI】
G16H50/70
G06Q10/04
G06N20/00
G01N33/48 Z
(21)【出願番号】P 2019038948
(22)【出願日】2019-03-04
【審査請求日】2021-01-28
(73)【特許権者】
【識別番号】000125369
【氏名又は名称】学校法人東海大学
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】後藤 信哉
(72)【発明者】
【氏名】後藤 信一
【審査官】池田 聡史
(56)【参考文献】
【文献】特開2016-184221(JP,A)
【文献】特開2011-227838(JP,A)
【文献】特開2018-124639(JP,A)
【文献】特開2018-011497(JP,A)
【文献】衛藤亮太ほか5名,“深層学習を用いた電子カルテ医療情報の多角的解析”,電子情報通信学会技術研究報告,第117巻, 第212号,2017年09月11日,pp.43~49
【文献】衛藤亮太ほか5名,“電子診療報酬データの多角的解析”,第10回データ工学と情報マネジメントに関するフォーラム,日本,電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2018年03月06日,DEIM Forum 2018 K6-3
【文献】江頭庸輔ほか2名,“CNNを用いた心拍変動時系列の特徴抽出による嚥下検出”,電気学会研究会資料,PI-17-098,2017年10月13日,pp.59~62
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
G06Q 10/00-99/00
G06N 20/00
G01N 33/48
(57)【特許請求の範囲】
【請求項1】
過去に評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者について記憶する学習用データベースと、前記学習用データベースに記憶された対象者毎の前記検査の時系列データと、前記対象者に発生したイベントと、を含む学習データを
、時系列を考慮可能なモデルで機械学習し、検査の時系列データの入力に対してイベントの発生予測の結果を出力する学習済みプログラムを作成する機械学習部を含む予後予測プログラム作成装置と、
評価対象の投薬が行われた解析対象者の検査の時系列データを入力する入力部、前記機械学習部で作成した学習済みプログラムと、前記入力部に入力された前記解析対象者の検査の時系列データとに基づいて、前記解析対象者のイベントの発生予測を行う予測部と、を備える予後予測装置と、を含
み、
前記イベントは、出血の発生または血栓の発生に関するイベントであり、
前記検査は、血液の数値を検出する検査であり、
前記検査の時系列データは、所定時間間隔毎のデータであり、検査を行っていない時間間隔のタイミングでは、取得されない所定の値が登録される予後予測システム。
【請求項2】
前記検査の時系列データは、日単位で記録されたデータである請求項1に記載の予後予測システム。
【請求項3】
前記機械学習部は、投薬開始から第1期間の時系列のデータと投薬開始から前記第1期間よりも長い第2期間のイベント発生データを学習し、
前記予測部は、前記解析対象者の投薬開始から前記第1期間のデータに基づいて、投薬開始から前記第2期間の間の前記イベントの発生予測を行う請求項1に記載の予後予測システム。
【請求項4】
第1期間は、20日以上3月以内であり、
第2期間は、3月以上12月以内である請求項3に記載の予後予測システム。
【請求項5】
投薬する薬剤は、血液抗凝固剤である請求項1から
4のいずれか一項に記載の予後予測システム。
【請求項6】
前記イベントは、
死亡、脳卒中・全身塞栓症、重篤な出血のいずれかである請求項1から5のいずれか一項に記載の予後予測システム。
【請求項7】
前記学習データは、投薬の時系列データを含む請求項1から
6のいずれか一項に記載の予後予測システム。
【請求項8】
前記機械学習部は、LSTM処理をした後、畳み込み処理を少なくとも1回以上行う処理と、畳み込み処理を行った結果に対して全結合処理を行う請求項1から
7のいずれか一項に記載の予後予測システム。
【請求項9】
評価対象の投薬が行われた解析対象者の検査の時系列データを入力する入力部と、
評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者分含む学習データを
、時系列を考慮可能なモデルで機械学習し、検査の時系列データの入力に対してイベントの発生予測の結果を出力できる学習済みプログラムを記憶する記憶部と、
学習済みプログラムを用いて、前記入力部に入力された解析対象者のデータに基づいて、解析対象者のイベントの発生予測を行う予測部と、を含
み、
前記イベントは、出血の発生または血栓の発生に関するイベントであり、
前記検査は、血液の数値を検出する検査であり、
前記検査の時系列データは、所定時間間隔毎のデータであり、検査を行っていない時間間隔のタイミングでは、取得されない所定の値が登録される予後予測装置。
【請求項10】
評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者分含む学習データを用いて
、時系列を考慮可能なモデルで機械学習し、解析対象者の投薬開始から第1期間の検査の時系列データに基づいて、投薬開始からの前記第1期間よりも長い第2期間での前記イベントの発生予測を行う学習済みプログラムを作成
し、
前記イベントは、出血の発生または血栓の発生に関するイベントであり、
前記検査は、血液の数値を検出する検査であり、
前記検査の時系列データは、所定時間間隔毎のデータであり、検査を行っていない時間間隔のタイミングでは、取得されない所定の値が登録される予後予測プログラム作成装置。
【請求項11】
評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者分含む学習データを用いて
、時系列を考慮可能なモデルで機械学習し、解析対象者の投薬開始から検査の時系列データの入力に対してイベントの発生予測の結果を出力する学習済みプログラムを作成するステップと、
入力された評価対象の投薬が行われた解析対象者の検査の時系列データと、機械学習で作成した学習済みプログラムと、に基づいて、前記解析対象者のイベントの発生予測を行う予測ステップと、を備え
、
前記イベントは、出血の発生または血栓の発生に関するイベントであり、
前記検査は、血液の数値を検出する検査であり、
前記検査の時系列データは、所定時間間隔毎のデータであり、検査を行っていない時間間隔のタイミングでは、取得されない所定の値が登録される予後予測方法。
【請求項12】
評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者分含む学習データを用いて
、時系列を考慮可能なモデルで機械学習し、解析対象者の投薬開始から検査の時系列データの入力に対してイベントの発生予測の結果を出力する機械学習の結果を含み、
入力された解析対象者の検査の時系列データと、前記機械学習の結果とに基づいて、前記解析対象者のイベントの発生予測の結果を出力
し、
前記イベントは、出血の発生または血栓の発生に関するイベントであり、
前記検査は、血液の数値を検出する検査であり、
前記検査の時系列データは、所定時間間隔毎のデータであり、検査を行っていない時間間隔のタイミングでは、取得されない所定の値が登録される予後予測プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、投薬される対象者の予後を予測する予後予測システム、予後予測プログラム作成装置、予後予測装置、予後予測方法及び予後予測プログラムに関する。
【背景技術】
【0002】
医療従事者は、投薬治療において、治療対象の患者へ投薬した医薬品の効果を確認するため、種々の検査を行い、その結果に基づいて、投薬量の調整、医薬品の変更など、その後の対応を検討している。
【0003】
近年では、対象者(患者)の状態や、特定の症例の発生を予測するシステムとして、機械学習を用いたシステムが提案されている。特許文献1には、患者の健康データの心拍変動性データに関する第1のパラメータおよびバイタルサインデータに関する第2のパラメータのうち少なくとも1つと、患者の生存性に関する第3のパラメータをし、人工ニューラルネットワークを形成するように相互接続されたノードのネットワークを設け、ノードは複数の人工ニューロンを備え、各々の人工ニューロンは関連付けられた重みを有する少なくとも1つの入力を有し、各々の人工ニューロンの少なくとも1つの入力の関連付けられた重みが患者の健康データからの異なる組のデータのそれぞれの第1、第2、および第3のパラメータに応答して調節されるように患者の健康データを用いて人工ニューラルネットワークをトレーニングし、これにより患者の生存性に関する予測を行う、システムが記載されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1は、対象者である患者の生体データに基づいて、患者の生存性に関する予測を行うことができるとしている。ここで、上述したように、医療従事者は、投薬治療において、検査の結果に基づいて、治療対象の患者へ投薬した医薬品の効果を、これまでの経験により判断し、投薬量の調整、医薬品の変更など、その後の対応を行う。このため、投薬により生じる影響、特に投薬により引き起こされる予後イベントを高い精度で予測することが望まれている。特許文献1では、生体データで健康状態を判定することができるとしているが、予測対象が異なり、適用することが困難である。
【0006】
本発明の目的は、上述した課題を解決するものであり、高い精度で、投薬治療を行っている患者の、投薬により引き起こされる予後イベントを予測することができる予後予測システム、予後予測プログラム作成装置、予後予測装置、予後予測方法及び予後予測プログラムを提供することにある。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本発明は、予後予測システムであって、過去に評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者について記憶する学習用データベースと、前記学習用データベースに記憶された対象者毎の前記検査の時系列データと、前記対象者に発生したイベントと、を含む学習データを機械学習し、検査の時系列データの入力に対してイベントの発生予測の結果を出力する学習済みプログラムを作成する機械学習部を含む予後予測プログラム作成装置と、評価対象の投薬が行われた解析対象者の検査の時系列データを入力する入力部、前記機械学習部で作成した学習済みプログラムと、前記入力部に入力された前記解析対象者の検査の時系列データとに基づいて、前記解析対象者のイベントの発生予測を行う予測部と、を備える予後予測装置と、を含む。
【0008】
前記検査の時系列データは、日単位で記録されたデータであることが好ましい。
【0009】
前記機械学習部は、投薬開始から第1期間の時系列のデータと投薬開始から前記第1期間よりも長い第2期間のイベント発生データを学習し、前記予測部は、前記解析対象者の投薬開始から前記第1期間のデータに基づいて、投薬開始から前記第2期間の間の前記イベントの発生予測を行うことが好ましい。
【0010】
第1期間は、20日以上3月以内であり、第2期間は、3月以上12月以内であることが好ましい。
【0011】
前記検査は、血液の数値を検出する検査であることが好ましい。
【0012】
投薬する薬剤は、血液抗凝固剤であることが好ましい。
【0013】
前記イベントは、重篤な出血、脳卒中、死亡のいずれかであることが好ましい。
【0014】
前記学習データは、投薬の時系列データを含むことが好ましい。
【0015】
前記機械学習部は、LSTM処理をした後、畳み込み処理を少なくとも1回以上行う処理と、畳み込み処理を行った結果に対して全結合処理を行うことが好ましい。
【0016】
上述した課題を解決し、目的を達成するために、本発明は、予後予測装置であって、評価対象の投薬が行われた解析対象者の検査の時系列データを入力する入力部と、評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者分含む学習データを機械学習し、検査の時系列データの入力に対してイベントの発生予測の結果を出力できる学習済みプログラムを記憶する記憶部と、学習済みプログラムを用いて、前記入力部に入力された解析対象者のデータに基づいて、解析対象者のイベントの発生予測を行う予測部と、を含む。
【0017】
上述した課題を解決し、目的を達成するために、本発明は、予後予測プログラム作成装置であって、評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者分含む学習データを用いて機械学習し、解析対象者の投薬開始から第1期間の検査の時系列データに基づいて、投薬開始からの前記第1期間よりも長い第2期間での前記イベントの発生予測を行う学習済みプログラムを作成する。
【0018】
上述した課題を解決し、目的を達成するために、本発明は、予後予測方法であって、評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者分含む学習データを用いて機械学習し、解析対象者の投薬開始から検査の時系列データの入力に対してイベントの発生予測の結果を出力する学習済みプログラムを作成するステップと、入力された評価対象の投薬が行われた解析対象者の検査の時系列データを、機械学習で作成した学習済みプログラムと、に基づいて、前記解析対象者のイベントの発生予測を行う予測ステップと、を備える。
【0019】
上述した課題を解決し、目的を達成するために、本発明は、予後予測プログラムであって、評価対象の投薬が行われた対象者の検査の時系列データと、前記対象者に発生したイベントの情報と、を複数の対象者分含む学習データを用いて機械学習し、解析対象者の投薬開始から検査の時系列データの入力に対してイベントの発生予測の結果を出力する機械学習の結果を含み、入力された解析対象者の検査の時系列データと、前記機械学習の結果とに基づいて、前記解析対象者のイベントの発生予測の結果を出力する。
【発明の効果】
【0020】
本発明によれば、高い精度で、投薬治療を行っている患者の、投薬により引き起こされる予後イベントを予測することができる。
【図面の簡単な説明】
【0021】
【
図1】
図1は、本実施形態に係る予後予測システムの模式的なブロック図である。
【
図2】
図2は、データセット作成部に入力されるデータの一例を示す模式図である。
【
図3】
図3は、予後予測システムの処理の一例を示すフローチャートである。
【
図4】
図4は、予後予測システムの処理の一例を示すフローチャートである。
【
図5】
図5は、予後予測システムの処理の一例を示すフローチャートである。
【
図6】
図6は、予後予測システムの第1イベントの予測結果の一例を示すグラフである。
【
図7】
図7は、第1イベントの予測結果と比較例との信頼性を示すグラフである。
【
図8】
図8は、予後予測システムの第2イベントの予測結果の一例を示すグラフである。
【
図9】
図9は、第2イベントの予測結果と比較例との信頼性を示すグラフである。
【
図10】
図10は、予後予測システムの第3イベントの予測結果の一例を示すグラフである。
【
図11】
図11は、第3イベントの予測結果と比較例との信頼性を示すグラフである。
【
図12】
図12は、本実施例での第1イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
【
図13】
図13は、本実施例での第2イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
【
図14】
図14は、本実施例での第3イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
【
図15】
図15は、予後予測システムの第1イベントの予測結果の一例を示すグラフである。
【
図16】
図16は、第1イベントの予測結果と比較例との信頼性を示すグラフである。
【
図17】
図17は、予後予測システムの第2イベントの予測結果の一例を示すグラフである。
【
図18】
図18は、第2イベントの予測結果と比較例との信頼性を示すグラフである。
【
図19】
図19は、予後予測システムの第3イベントの予測結果の一例を示すグラフである。
【
図20】
図20は、第3イベントの予測結果と比較例との信頼性を示すグラフである。
【
図21】
図21は、本実施例での第1イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
【
図22】
図22は、本実施例での第2イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
【
図23】
図23は、本実施例での第3イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
【発明を実施するための形態】
【0022】
以下に添付図面を参照して、本発明の好適な実施形態を詳細に説明する。以下、解析対象者とは、評価対象の投薬治療中で、検査の時系列データに基づき予後イベントを予測する対象者をさす。なお、この実施形態により本発明が限定されるものではなく、また、実施形態が複数ある場合には、各実施形態を組み合わせて構成するものも含むものである。また、本実施形態は、投薬する薬剤として、血液の抗凝固剤を対象とし、対象者の検査結果として、血液検査の結果を用いる場合を例として説明するが、本実施形態はこれに限定されない。
【0023】
図1は、本実施形態に係る予後予測システムの模式的なブロック図である。なお、
図1では省略しているが、本実施形態に係る予後予測システム10は、学習用データベースに記憶されている過去に評価対象の投薬が行われた複数の対象者の検査の時系列データと、前記対象者に発生したイベントの情報とで、機械学習を行い、イベントの発生に関する予測を行う予後予測プログラムを作成し、作成した予後予測プログラムにより、解析対象者の検査の時系列データに基づいて、当該イベントの発生を予測する。
【0024】
予後予測システム10は、検査装置12と、予後予測プログラム作成装置14と、予後予測装置16と、を有する。予後予測プログラム作成装置14と予後予測装置16とは、本実施形態では別体としたが、1つの装置で実現してもよい。また、検査装置12と予後予測装置16とは、本実施形態では別体としたが、1つの装置で実現してもよい。また、検査装置12を備えず、予後予測装置16に入力する解析対象者の検査の時系列データを、予後予測システム10以外から取得してもよい。また、各部は、有線、無線で接続され、データの送受信を行うことができる。無線通信の場合、各部が例えばWi-Fi(登録商標)モジュールやアンテナなどを有し、無線での通信を行う。有線通信の場合、LANケーブル、光ファイバ等で接続されている。
【0025】
検査装置12は、解析対象者の血液データを取得する。検査装置12は、解析対象者から血液を採取する採血装置と、採血装置で採取した血液を分析する分析装置と、を含む。
【0026】
予後予測プログラム作成装置14は、機械学習部18と、入力部20と、表示部22と、学習用データベース24と、記憶部26と、を有する。予後予測プログラム作成装置14の機械学習部18と、学習用データベース24と、記憶部26と、は、クラウド上のサーバや、GPU等の演算能力が高い演算装置が例示される。
【0027】
機械学習部18は、機械学習を行い、学習済みプログラムを作成する。機械学習部18は、CPU(Central Processing Unit)、GPU等の演算装置を有する。機械学習部18は、データセット作成部122と、学習管理部124と、LSTM(Long Short-Term Memory)処理部126と、畳み込み処理部128と、を有する。データセット作成部122は、学習用データベースに記憶されたデータセットを用いて、学習用のデータセットを作成する。具体的には、入力されたデータセットから、トレーニングデータセットと、テストデータセットを作成する。
【0028】
学習管理部124は、データセット作成部122で作成されたデータセットを用い、LSTM処理部126と畳み込み処理部128とで行う処理を管理し、さらに、全結合の学習を行い、学習済みプログラムを作成する。LSTM処理部126は、入力データに対してLSTM(Long Short-Term Memory)で学習を行う。畳み込み処理部128は、一次畳み込み処理についての学習を行う。なお、機械学習部18は、時系列を考慮可能な機械学習と、畳み込み処理の機械学習と、を組み合わせることが好ましいが、時系列を考慮可能な機械学習を用いることができればよく、機械学習の方法はこれに限定されない。
【0029】
入力部20は、ユーザの入力を受け付ける装置や、記録媒体、記憶部からデータを受け取る装置である。入力部20は、ユーザの入力を受け付ける装置の場合、例えばマウス、キーボード、又はタッチパネル等である。入力部20は、記録媒体、記憶部からデータを受け取る装置の場合、USB端子及び読取装置、通信機器等である。入力部20は、対象者のIDと、前記対象者の投薬に関するデータ、検査に関するデータ、前記対象者に発生したイベントのデータを入力し、学習に必要なデータセットのデータを入力できる。
【0030】
表示部22と、機械学習部18の制御結果やユーザからの入力内容などを表示する装置であり、本実施形態では、ディスプレイやタッチパネルである。なお、本実施形態では、各種情報を出力する機器として、表示装置を用いたが、出力装置は、これに限定されず、紙に記録するプリンタや、データを記録媒体に書き込む書き込み装置としてもよい。
【0031】
学習用データベース24は、入力部20で入力された学習に必要なデータセットを有する。データセットは、対象者と検査の時系列データとイベントの発生とを対応つけたデータである。学習用データベース24は、入力部20から入力されたデータにより、更新することができる。また、機械学習部18は、学習用データベース24が更新された場合、再学習を行い、学習済プログラムを再度作成して、更新することが好ましい。入力部20からの入力は、他のデータベースの更新情報の取得、個別の対象者の情報の入力、入力済みの対象者の情報の更新等が例示される。入力部20からの入力のタイミングは、随時行っても、定期的に行ってもよい。
【0032】
記憶部26は、機械学習部18での演算内容やプログラムの情報などを記憶するメモリであり、例えば、RAM(Random Access Memory)と、ROM(Read Only Memory)と、HDD(Hard Disk Drive)などの外部記憶装置とのうち、少なくとも1つ含む。記憶部26は、データセット作成部122で作成された学習用のデータセットや、機械学習部18で作成された学習済みプログラムを記憶する。
【0033】
予後予測装置16は、予測部30と、入力部32と、表示部34と、を有する。予測部30は、予後予測プログラム作成装置14で作成した学習済みプログラム(予後予測プログラム)を用いて、解析対象者のイベント発生の予測を行う。予測部30は、演算部130と、記憶部132と、を有する。演算部130は、演算装置、すなわちCPU(Central Processing Unit)である。記憶部132は、演算部130の演算内容やプログラムの情報などを記憶するメモリであり、例えば、RAM(Random Access Memory)と、ROM(Read Only Memory)と、HDD(Hard Disk Drive)などの外部記憶装置とのうち、少なくとも1つ含む。記憶部132は、機械学習部18で作成された学習済みプログラム134を記憶する。学習済みプログラム134は、種々のタイミングで記憶部132に記憶される。予後予測装置16は、予後予測プログラム作成装置14から学習済みプログラム134が送信、更新された場合に記憶してもよく、予後予測の処理を実行する際に、学習済みプログラム134が格納されている装置から受信し、記憶してもよい。
【0034】
入力部32は、ユーザの入力を受け付ける装置や、記録媒体、記憶部からデータを受け取る装置である。入力部32は、ユーザの入力を受け付ける装置の場合、例えばマウス、キーボード、又はタッチパネル等である。入力部32は、記録媒体、記憶部からデータを受け取る装置の場合、USB端子及び読取装置、通信機器等である。入力部32は、予後イベントの予測を行う解析対象者の検査の時系列データを入力できる。
【0035】
表示部34と、予測部30の予測結果やユーザからの入力内容、入力した解析対象者の検査の時系列データから予測された予後イベントの予測値などを表示する装置であり、本実施形態では、ディスプレイやタッチパネルである。なお、本実施形態では、各種情報を出力する機器として、表示装置を用いたが、出力装置は、これに限定されず、紙に記録するプリンタや、データを記録媒体に書き込む書き込み装置としてもよい。
【0036】
次に、
図2から
図5を用いて、予後予測システム10の動作を説明する。
図2は、学習用データベースよりデータセット作成部に入力されるデータの一例を示す模式図である。
図3から
図5は、それぞれ予後予測システムの処理の一例を示すフローチャートである。
【0037】
本実施例の学習に用いるデータセットは、評価対象の投薬が行われた各対象者の、検査の時系列データと、イベント発生のデータと、を含む。検査の時系列データと、投薬を開始した日からの経過日数が、日単位でのデータである。検査の時系列データは、検査を行った日に取得した測定対象項目の数値が入力されている。検査の時系列データは、検査を行っていない日は、検査では、取得されない所定の値、
図2では0が入力される。
図2に示す表は、検査の時系列データを模式的に示している。検査の時系列データは、
図2に示すように、対象者が、対象者IDで対応つけられ、日数ごとに検査値が入力されている。データセットは、投薬する薬が複数ある場合は、投薬の時系列データを複数備える。また、データセットは、検査で取得する項目が複数ある場合、
図2に示すような日単位の検査データを検査項目ごとに備える。また、図示していないが、イベント発生のデータは、対象者のイベントの発生の有無、イベントが発生した日のデータである。
【0038】
図3を用いて、予後予測プログラムを作成する全体の処理の一例を説明する。予後予測プログラム作成装置14の機械学習部18は、1つのイベントごとに機械学習を行うことでより高い精度で対象のイベントの発生について予測ができるが、複数のイベントについて同時に学習してもよい。
【0039】
機械学習部18は、学習用データベース24から多数の対象者のデータを取得する(ステップS12)。機械学習部18は、データセット作成部122で、取得したデータを、トレーニングデータセットと、テストデータセットに分割する(ステップS14)。機械学習部18は、取得したデータの7割を、トレーニングデータセットとし、3割をテストデータセットとする。機械学習部18は、トレーニングデータセットから設定した個数のデータを抽出する(ステップS16)。機械学習部18は、ランダム抽出でデータを抽出する。次に、機械学習部18は、現時点の解析モデルを取得する(ステップS18)。
【0040】
次に、機械学習部18は、現時点の解析モデルを用いて機械学習処理を行い、新たな解析モデルを作成する(ステップS20)。
【0041】
以下、
図4を用いて、機械学習部18の機械学習処理を行い、新たな解析モデルを作成する処理の一例を説明する。機械学習部18は、学習管理部124で、LSTM処理部126と、畳み込み処理部128での演算を制御し、LSTM処置と、1次元畳み込み処理と、全結合処理を組み合わせて、機械学習を行い、学習済みモデル(学習済みプログラム)を作成する。機械学習部18は、現時点の解析モデルを各処理部に展開し、トレーニングデータを用いて、学習を行い、新たな解析モデルを作成する。
【0042】
機械学習部18は、LSTM処理を行い(ステップS42)、ステップS42でLSTM処理を行った処理結果に対して、1次元畳み込み処理を行う(ステップS44)。次に、機械学習部18は、ステップS44で1次元畳み込み処理を行った結果に対して、LSTM処理を行い(ステップS46)、ステップS46でLSTM処理を行った処理結果に対して、1次元畳み込み処理を行う(ステップS48)。次に、機械学習部18は、ステップS48で1次元畳み込み処理を行った結果に対して、LSTM処理を行い(ステップS50)、ステップS50でLSTM処理を行った処理結果に対して、1次元畳み込み処理を行う(ステップS52)。
【0043】
機械学習部18は、ステップS52で一次元畳み込み処理を行った後、全結合処理を行う(ステップS54)。機械学習部18は、ステップS54で全結合処理を行った結果に対して、再度全結合処理を行う(ステップS56)。
【0044】
機械学習部18は、トレーニングデータを用いて
図4に示す処理の機械学習を行い、
図4に示す処理の各種パラメータ等を設定し、新たな解析モデルを作成する。
【0045】
なお、本実施形態では、LSTM処理と1次元畳み込み処理とを組み合わせた処理を3回行ったが、繰り返しの回数は、限定されず、1回でも4回以上でもよい。機械学習部18は、LSTM処理、つまり時間経過を考慮した学習を行い、その結果を1次元畳み込み処理を行う順番とすることが好ましい。
【0046】
図3に戻り、予後予測プログラムを作成する全体の処理について説明する。機械学習部18は、新たな解析モデルを作成したら、テストデータを用いて、解析モデルを検証する(ステップS22)。機械学習部18は、テストデータの検査の時系列データを用いて処理を行い、テストデータのイベントの発生との一致度を検証する。
【0047】
機械学習部18は、以前の解析モデルよりも結果が向上したかを判定する(ステップS24)。機械学習部18は、ステップS22の処理の一致度がより高い場合、結果が向上したと判定する。機械学習部18は、結果が向上したと判定した場合(ステップS24でYes)、新たな解析モデルを現時点の解析モデルに選定する(ステップS26)。つまり、機械学習部18は、ステップS20で作成した新たな解析モデルを現時点の解析モデルとする。
【0048】
機械学習部18は、結果が向上していないと判定した場合(ステップS24でNo)、新たな解析モデル破棄する(ステップS28)。つまり、機械学習部18は、ステップS18で取得した現時点の解析モデルを維持する。機械学習部18は、ステップS26またはステップS28の処理を実行した場合、解析モデルの作成処理を所定回数以上実行したかを判定する(ステップS30)。機械学習部18は、所定回数以上実行していないと判定した場合(ステップS30でNo)、つまり、繰り返し回数が所定回数に到達していないと判定した場合、ステップS16に戻り、トレーニングデータセットからのデータの抽出を行う処理以降の処理を再度実行する。機械学習部18は、所定回数以上実行したと判定した場合(ステップS30でYes)、本処理を終了する。
【0049】
機械学習部18は、上述したように
図4の処理に対して機械学習を行い、学習済みプログラムを作成する。
【0050】
図5を用いて、予測部30の予測処理の一例を説明する。予後予測装置16の予測部30は、機械学習の結果を読み込む(ステップS62)。つまり予後予測プログラム作成装置14の機械学習部18の出力である学習済みプログラム134を読み込む。次に、予測部30は、解析対象者のデータを取得する(ステップS64)。解析対象者は、1名でも複数名でもよい。また、解析対象者の検査の時系列データの数値が範囲で示されたものでもよい。
【0051】
予測部30は、取得した解析対象者データを、機械学習済みプログラム134により計算し、予測結果を作成する(ステップS66)。予測部30は、予測結果として、解析対象者データに含まれる期間よりも先でのイベントの発生に関する予測を作成する。次に、予測部30は、予測結果を出力する(ステップS68)。予測部30は、予測結果をイベントの発生リスクを時系列で示したグラフを出力させてもよいし、数値としてイベントの発生確率(リスク)を出力してもよい。
【0052】
予後予測システム10は、以上のように、予後予測プログラム作成装置14で、複数の対象者の検査の時系列データと、前記対象者に発生したイベントの情報とを用いて、機械学習を行い、予後予測装置16で、解析対象者の検査の時系列データより、機械学習の結果の学習済みプログラムを用いて、予測を行うことで、高い精度で前記解析対象者の予後イベントを予測することができる。
【0053】
また、前記検査の時系列データは、日単位で記録されたデータであることが好ましい。これにより、効率よく解析を行うことができる。また、検査が行われていない日は、実行されている日では、生じない数値を与えることで、高い精度で学習を行うことができる。
【0054】
次に、本実施形態の予後予測システム10で予測を行った例について説明する。本実施例では、医療従事者用の抗血栓療法トライアルデータベース(GARFIELD-AF:Global Anticoagulant Registry in the Field-Atrial Fibrillation)の症例データを用いた。具体的には、抗凝固薬としてビタミンK阻害薬(VKA)を服用している症例且つVKA投薬開始から1ヵ月以内に3回以上の血液凝固機能検査であるPT―INR(prothrombin time-international normalized ratio、プロトロンビン時間 国際標準比)の検査行った対象者を選択し、そのPT―INRデータおよびGARFIELD―AFにおける観察期間が12ヵ月以内に発生した死亡、脳卒中・全身塞栓症、重篤な出血イベント発症の有無を抽出した。データベースから抽出したデータセットの1部を学習用データセットとして用い、データベースから抽出した別のデータセットを検証用データセットとして用いた。本実施例では、第1イベントとして重篤な出血の場合の予測モデルを作成し、第2イベントとして脳卒中の場合の予測モデルを作成し、第3イベントとして死亡の場合の予測モデルを作成した。重篤な出血とは、400cc以上の輸血が必要となった場合である。第1モデルの場合、教師データとして、4085例を用いて、3185例をトレーニングデータとし、1523例をテストデータとした。また、比較のために、抗凝固剤治療の効果の評価として標準的に用いられるTTR(Time in Therapeutic Range)での評価も行った。
【0055】
また、機械学習部18は、オープンソースの機械学習ライブラリKeras(Keras Documentation (https://keras.io/ja/))を用い、LSTM処理(
図4のステップS42,S46,S50)のLSTM関数(keras.layers.LSTM)のパラメータは、units=100, return_sequences=true、他をデフォルト値とし、1次元畳み込み処理(
図4のステップS44,S48,S52)の1次元畳み込み関数(keras.layers.Conv1D)のパラメータは、filter=64、kernel_size=3、他をデフォルト値とし、1回目の全結合処理(
図4のステップS54)の全結合関数(keras.layers.Dense)のパラメータは、units=30, activation=relu、他をデフォルト値、2回目の全結合処理(
図4のステップS56)の全結合関数のパラメータは、units=1 activation=sigmoid、他をデフォルト値とした。
【0056】
図6は、予後予測システムの第1イベントの予測結果の一例を示すグラフである。
図7は、第1イベントの予測結果と比較例との信頼性を示すグラフである。
図6は、本実施例(AI)と、TTRの場合のROC曲線(Receiver Operating Characteristic curve)を示している。縦軸が感度、横軸が偽陽性率(1-特異度)である。
図7は、本実施例と比較例のAUC(Area under an ROC curve)を示している。
図6に示すように、本実施例は、p値が0.01以下となる。また、本実施例は、AUCが、0.75(95%カットラインで、0.62以上0.87以下)であった。これに対して、TTRの場合は、AUCが、0.47(95%カットラインで、0.32以上0.61以下)であった。以上より、本実施形態の解析をもちいることで、より信頼性が高い予測ができることが分かる。
【0057】
図8は、予後予測システムの第2イベントの予測結果の一例を示すグラフである。
図9は、第2イベントの予測結果と比較例との信頼性を示すグラフである。
図8は、本実施例(Al)と、TTRの場合のROC曲線を示している。縦軸が感度、横軸が偽陽性率(1-特異度)である。
図9は、本実施例と比較例のAUC(Area under an ROC curve)を示している。
図9に示すように、本実施例は、p値が0.08以下であるが、TTRよりも信頼性が高いことが分かる。また、本実施例は、AUCが、0.70(95%カットラインで、0.56以上0.83以下)であった。これに対して、TTRの場合は、AUCが、0.47(95%カットラインで、0.31以上0.64以下)であった。以上より、本実施形態の解析をもちいることで、より信頼性が高い予測ができることが分かる。
【0058】
図10は、予後予測システムの第3イベントの予測結果の一例を示すグラフである。
図11は、第3イベントの予測結果と比較例との信頼性を示すグラフである。
図10は、本実施例(Al)と、TTRの場合のROC曲線を示している。縦軸が感度、横軸が偽陽性率(1-特異度)である。
図11は、本実施例と比較例のAUC(Area under an ROC curve)を示している。
図10に示すように、本実施例は、p値が0.01であり、TTRよりも信頼性が高いことが分かる。また、本実施例は、AUCが、0.61(95%カットラインで、0.54以上0.67以下)であった。これに対して、TTRの場合は、AUCが、0.48(95%カットラインで、0.42以上0.54以下)であった。以上より、本実施形態の解析を用いることで、より信頼性が高い予測ができることが分かる。
【0059】
次に、本実施例で作成した予測部を用いて、第1イベントから第3イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を算出した。
図12は、本実施例での第1イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
図13は、本実施例での第2イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
図14は、本実施例での第3イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
図12から
図14に示すように、いずれの場合でも、ハイリスクの対象者と、ローリスクの対象者とで、発生確率に差が生じることが分かる。また、ハイリスクの対象者がイベントの発生リスクが高い予測となることもわかる。以上より、予後予測システム10で有効な予測ができていることが分かる。
【0060】
次に、別のテストデータを用いて、同様の解析を行った場合を
図15から
図23に示す。
図15は、予後予測システムの第1イベントの予測結果の一例を示すグラフである。
図16は、第1イベントの予測結果と比較例との信頼性を示すグラフである。
図15は、本実施例(AI)と、TTRの場合のROC曲線を示している。縦軸が感度、横軸が偽陽性率(1-特異度)である。
図16は、本実施例と比較例のAUC(Area under an ROC curve)を示している。
図15に示すように、本実施例は、p値が0.01以下となる。また、本実施例は、AUCが、0.69(95%カットラインで、0.62以上0.76以下)であった。これに対して、TTRの場合は、AUCが、0.54(95%カットラインで、0.46以上0.62以下)であった。以上より、本実施形態の解析をもちいることで、より信頼性が高い予測ができることが分かる。
【0061】
図17は、予後予測システムの第2イベントの予測結果の一例を示すグラフである。
図18は、第2イベントの予測結果と比較例との信頼性を示すグラフである。
図17は、本実施例(Al)と、TTRの場合のROC曲線を示している。縦軸が感度、横軸が偽陽性率(1-特異度)である。
図18は、本実施例と比較例のAUC(Area under an ROC curve)を示している。
図18に示すように本実施例は、AUCが、0.65(95%カットラインで、0.56以上0.74以下)であった。これに対して、TTRの場合は、AUCが、0.62(95%カットラインで、0.52以上0.72以下)であった。以上より、本実施形態の解析をもちいることで、より信頼性が高い予測ができることが分かる。
【0062】
図19は、予後予測システムの第3イベントの予測結果の一例を示すグラフである。
図20は、第3イベントの予測結果と比較例との信頼性を示すグラフである。
図19は、本実施例(Al)と、TTRの場合のROC曲線を示している。縦軸が感度、横軸が偽陽性率(1-特異度)である。
図20は、本実施例と比較例のAUC(Area under an ROC curve)を示している。
図19に示すように、本実施例は、p値が0.09であり、TTRよりも信頼性が高いことが分かる。また、本実施例は、AUCが、0.57(95%カットラインで、0.52以上0.63以下)であった。これに対して、TTRの場合は、AUCが、0.51(95%カットラインで、0.45以上0.56以下)であった。以上より、本実施形態の解析を用いることで、より信頼性が高い予測ができることが分かる。
【0063】
次に、本実施例で作成した予測部を用いて、第1イベントから第3イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を算出した。
図21は、本実施例での第1イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
図22は、本実施例での第2イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
図23は、本実施例での第3イベントについて、ハイリスクとローリスクの対象者のイベント発生割合の時間推移を示すグラフである。
図21から
図23に示すように、いずれの場合でも、ハイリスクの対象者と、ローリスクの対象者とで、発生確率に差が生じることが分かる。また、ハイリスクの対象者がイベントの発生リスクが高い予測となることもわかる。以上より、予後予測システム10で有効な予測ができていることが分かる。
【0064】
また、予後予測システム10は、投薬開始から1か月の検査結果の時系列のデータと12か月のイベント発生データを学習し、予測部は、解析対象者の投薬開始から1か月のデータに基づいて、投薬開始から12か月の間のイベントの発生予測を行うことで、上記実施形態のように、イベントの発生を高い確率で予測することができる。なお、本実施形態では、投薬開始後の検査の時系列データを1ヶ月として、イベントの発生を12か月としたがこれに限定されず、投薬開始後の検査の時系列データを1ヶ月として、イベントの発生を3か月として学習を行い、予測するようにしてもよい。また、投薬後の服用、検査の時系列データを3ヶ月として、イベントの発生を12か月として学習を行い、3か月の時系列データに基づいて、12か月のイベントの発生(実際には3か月経過後から12か月目まで)の予測するようにしてもよい。具体的には、第1期間の検査の時系列データと、第1期間よりも長い第2期間のイベント発生のデータとを用いて学習を行い、学習済みプログラムを作成し、予測部で学習済みプログラムを用いて、解析対象者の第1期間の検査の時系列データで、イベントの発生を予測する。ここで、第1期間は、20日以上3月以内とし、第2期間は、3月以上12月以内とすることが好ましい。また、予測部は、解析対象者の投薬開始から3回の検査の結果で予測を実行することができることが好ましい。
【0065】
また、検査は、血液の数値を検出する検査であること、投薬する薬剤は、血液抗凝固剤である場合、の効果は上記より明らかである。また、イベントは、重篤な出血、脳卒中、死亡のいずれかであることで、上述したように、従来の予測よりも精度を高くできることが分かる。特にイベントとして重篤な出血は、高い精度で予測が行うことができることが分かる。特に、実施例のように抗凝固剤服用開始後1ヶ月以内に3回以上のPT-INR検査により1-12か月の重篤な出血を予測する場合、高い精度で予測を行うことができる。
【0066】
以上、本発明の実施形態を説明したが、この実施形態の内容により実施形態が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。
【0067】
予後予測システム10は、学習用データベースとして、対象者の投薬の時系列データを含めてもよい。つまり、予後予測システム10は、対象者の、投薬の時系列データと、検査の時系列データと、検査の結果と、対象者に発生したイベントの情報とで、機械学習を行い、イベントの発生に関する予測を行う予後予測プログラムを作成し、作成した予後予測プログラムを解析対象者の投薬の時系列データと、検査の時系列データと、検査の結果と、に基づいて、イベントの発生を予測することが好ましい。投薬の時系列データは、対象者が薬を服用する日と、その日に服用する薬の量のデータである。また、投薬の時系列データは、日単位で記録されたデータであることが好ましい。これにより、効率よく解析を行うことができる。また、検査が行われていない日、投薬(薬の服用)が行われていない日は、それぞれが実行されている日では、生じない数値を与えることで、高い精度で学習を行うことができる。
【0068】
また、本実施形態は、投薬する薬剤としては、血液の抗凝固剤を対象とし、対象者の検査結果として、血液検査の結果を用いる場合を例として説明するが、本実施形態はこれに限定されない。例えば、検査項目としては、血液から取得した結果ではなく、尿検査で取得した結果を用いるようにしてもよく、身体測定で取得した結果を用いるようにしてもよい。また、投薬する薬剤も血液の抗凝固剤に限定されず、種々の薬剤を対象とすることができる。さらにイベントも出血、脳梗塞、死亡に限定されない。なお、学習に用いるデータユニットは、多いことが好ましい。
【0069】
また、機械学習部は、予測に用いたデータのイベントデータの有無を蓄積し、再学習するようにしてもよい。
【符号の説明】
【0070】
10 予後予測システム
12 検査装置
14 予後予測プログラム作成装置
16 予後予測装置
18 機械学習部
20 入力部
22 表示部
24 学習用データベース
26 記憶部
30 予測部
32 入力部
34 表示部
122 データセット作成部
124 学習管理部
126 LSTM処理部
128 畳み込み処理部
130 演算部
132 記憶部
134 学習済みプログラム