IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テンパス・ラボズ・インコーポレイテッドの特許一覧 ▶ ゲイシンガー クリニックの特許一覧

特表2022-550705ECGベースの将来の心房細動予測システムおよび方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-05
(54)【発明の名称】ECGベースの将来の心房細動予測システムおよび方法
(51)【国際特許分類】
   G16H 50/30 20180101AFI20221128BHJP
   A61B 5/346 20210101ALI20221128BHJP
【FI】
G16H50/30
A61B5/346
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022518201
(86)(22)【出願日】2020-09-18
(85)【翻訳文提出日】2022-05-13
(86)【国際出願番号】 US2020051655
(87)【国際公開番号】W WO2021055870
(87)【国際公開日】2021-03-25
(31)【優先権主張番号】62/924,529
(32)【優先日】2019-10-22
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/013,897
(32)【優先日】2020-04-22
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/902,266
(32)【優先日】2019-09-18
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
2.TENSORFLOW
3.JAVASCRIPT
(71)【出願人】
【識別番号】521288448
【氏名又は名称】テンパス・ラボズ・インコーポレイテッド
(71)【出願人】
【識別番号】508246526
【氏名又は名称】ゲイシンガー クリニック
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ブランドン・ケー・フォーンウォルト
(72)【発明者】
【氏名】クリストファー・ハガティ
(72)【発明者】
【氏名】シュシュラヴヤ・ラチュナス
(72)【発明者】
【氏名】クリストファー・グッド
(72)【発明者】
【氏名】ジョン・フェイファー
(72)【発明者】
【氏名】アルヴァロ・ウジョア
(72)【発明者】
【氏名】アルン・ネマニ
(72)【発明者】
【氏名】タナー・カルボナティ
(72)【発明者】
【氏名】アシュラフ・ハーフェズ
【テーマコード(参考)】
4C127
5L099
【Fターム(参考)】
4C127AA02
4C127BB05
4C127GG10
5L099AA04
(57)【要約】
患者が心房細動を患う可能性を予測するための方法およびシステムが提供される。この方法は、患者に関連付けられている心電図データを受け取るステップと、心電図データの少なくとも一部を訓練済みモデルに提供するステップと、心電図データが生成されたときから所定の時間期間内に患者が心房細動を患う可能性を示すリスクスコアを受け取るステップと、開業医または医療管理者が閲覧するためにリスクスコアをメモリまたはディスプレイのうちの少なくとも一方に出力するステップとを含む。システムは、この方法のステップを実行するための命令を実行する少なくとも1つのプロセッサを備える。
【特許請求の範囲】
【請求項1】
患者、ならびに複数の誘導および時間間隔を含む心電図構成に関連付けられている心電図データを受け取るステップであって、前記心電図データは、前記複数の誘導に含まれる各誘導について、前記時間間隔の少なくとも一部に関連付けられている電圧データを含む、ステップと、
前記患者に関連付けられている年齢値を受け取るステップと、
前記患者に関連付けられている性別値を受け取るステップと、
前記年齢値、前記性別値、および前記心電図データの少なくとも一部を訓練済みモデルに提供するステップであって、前記訓練済みモデルは前記心電図構成に関連付けられている入力済み心電図データおよび前記患者に関連付けられている補足情報に基づきリスクスコアを生成するように訓練される、ステップと、
前記心電図データが生成されたときから所定の時間期間内に前記患者が病状を患う可能性を示すリスクスコアを受け取るステップと、
開業医または医療管理者が閲覧するために前記リスクスコアをメモリまたはディスプレイのうちの少なくとも一方に出力するステップと
を含む、方法。
【請求項2】
前記患者に関連付けられている電子健康記録データを受け取るステップと、
前記電子健康記録データの少なくとも一部を前記訓練済みモデルに提供するステップと
をさらに含む、請求項1に記載の方法。
【請求項3】
前記電子健康記録データは、血中コレステロール測定値、血球数、血液化学検査値、トロポニン値、ナトリウム利尿ペプチド濃度、血圧、心拍数、呼吸数、酸素飽和度、心駆出率、心室容積、心筋厚、心臓弁機能、糖尿病診断、慢性腎臓病診断、先天性心疾患診断、癌診断、手技、投薬、心臓病リハビリテーションの照会、または食事相談の照会のうちの少なくとも1つを含む、請求項2に記載の方法。
【請求項4】
前記リスクスコアが前記病状に関連付けられている所定の閾値より高いと決定するステップと、
前記リスクスコアが前記所定の閾値より高いとの決定に応答して、前記病状に対する治療または前記病状の原因のうちの少なくとも一方に関連付けられている情報および/または情報源へのリンクを含むレポートを生成するステップと、
開業医または医療管理者が閲覧するために前記レポートをメモリまたはディスプレイのうちの少なくとも一方に出力するステップと
をさらに含む、請求項1に記載の方法。
【請求項5】
前記時間期間は、1年である、請求項1に記載の方法。
【請求項6】
前記時間期間は、1日から30年までの範囲から選択される、請求項1に記載の方法。
【請求項7】
前記訓練済みモデルは、複数の分岐を含むディープニューラルネットワークを含む、請求項1に記載の方法。
【請求項8】
前記訓練済みモデルに提供される前記心電図データの前記一部は、前記複数の分岐に提供される、請求項7に記載の方法。
【請求項9】
前記訓練済みモデルは、畳み込みコンポーネントおよび緻密層コンポーネントを含むディープニューラルネットワークを含む、請求項1に記載の方法。
【請求項10】
前記畳み込みコンポーネントは、複数の畳み込み層を含むインセプションブロックを含む、請求項9に記載の方法。
【請求項11】
前記複数の誘導は、誘導I、誘導V2、誘導V4、誘導V3、誘導V6、誘導II、誘導VI、および誘導V5を含む、請求項1に記載の方法。
【請求項12】
前記心電図データは、前記誘導Iおよび前記時間間隔の第1の部分に関連付けられている第1の電圧データと、前記誘導V2および前記時間間隔の第2の部分に関連付けられている第2の電圧データと、前記誘導V4および前記時間間隔の第3の部分に関連付けられている第3の電圧データと、前記誘導V3および前記時間間隔の前記第2の部分に関連付けられている第4の電圧データと、前記誘導V6および前記時間間隔の前記第3の部分に関連付けられている第5の電圧データと、前記誘導IIおよび前記時間間隔の前記第1の部分に関連付けられている第6の電圧データと、前記誘導IIおよび前記時間間隔の前記第2の部分に関連付けられている第7の電圧データと、前記誘導IIおよび前記時間間隔の前記第3の部分に関連付けられている第8の電圧データと、前記誘導VIおよび前記時間間隔の前記第1の部分に関連付けられている第9の電圧データと、前記誘導VIおよび前記時間間隔の前記第2の部分に関連付けられている第10の電圧データと、前記誘導VIおよび前記時間間隔の前記第3の部分に関連付けられている第11の電圧データと、前記誘導V5および前記時間間隔の前記第1の部分に関連付けられている第12の電圧データと、前記誘導V5および前記時間間隔の前記第2の部分に関連付けられている第13の電圧データと、前記誘導V5および前記時間間隔の前記第3の部分に関連付けられている第14の電圧データとを含む、請求項11に記載の方法。
【請求項13】
前記時間間隔は、10秒の時間期間を含み、前記時間間隔の前記第1の部分は、前記時間間隔の第1の1/2を含み、前記時間間隔の前記第2の部分は、前記時間間隔の第3の1/4を含み、前記時間間隔の前記第3の部分は、前記時間間隔の第4の1/4を含む、請求項12に記載の方法。
【請求項14】
前記訓練済みモデルは、第1のチャネルと、第2のチャネルと、第3のチャネルとを備え、提供する前記ステップは、
前記第1の電圧データ、前記第6の電圧データ、前記第9の電圧データ、および前記第12の電圧データを前記第1のチャネルに提供するステップと、
前記第2の電圧データ、前記第4の電圧データ、前記第7の電圧データ、前記第10の電圧データ、および前記第13の電圧データを前記第2のチャネルに提供するステップと、
前記第3の電圧データ、前記第5の電圧データ、前記第8の電圧データ、前記第11の電圧データ、および前記第14の電圧データを前記第3のチャネルに提供するステップと
を含む、請求項12に記載の方法。
【請求項15】
前記複数の誘導の各々は、前記時間間隔に関連付けられている、請求項11に記載の方法。
【請求項16】
前記心電図データは、心臓学的基準に基づく心臓病状を示す、請求項1に記載の方法。
【請求項17】
前記心電図データは、心臓学的基準に基づく心臓病状を示さない、請求項1に記載の方法。
【請求項18】
前記病状は、死亡である、請求項1に記載の方法。
【請求項19】
前記病状は、心房細動である、請求項1に記載の方法。
【請求項20】
心電図デバイスから患者、ならびに複数の誘導および時間間隔を含む心電図構成に関連付けられている患者心電図データを受け取るステップであって、前記患者心電図データは、前記複数の誘導に含まれる各誘導について、前記時間間隔の少なくとも一部に関連付けられている電圧データを含む、ステップと、
前記患者心電図データの少なくとも一部を訓練済みモデルに提供するステップであって、前記訓練済みモデルは前記心電図構成に関連付けられている入力済み心電図データに基づきリスクスコアを出力するように訓練される、ステップと、
前記患者心電図データが生成されたときから所定の時間期間内に前記患者が病状を患う可能性を示すリスクスコアを受け取るステップと、
前記リスクスコアに基づきレポートを生成するステップと、
開業医または医療管理者が閲覧するために前記レポートをメモリまたはディスプレイのうちの少なくとも一方に出力するステップと
を含む、方法。
【請求項21】
命令を含む少なくとも1つのメモリに結合されている少なくとも1つのプロセッサを備え、前記少なくとも1つのプロセッサは、
患者、ならびに複数の誘導および時間間隔を含む心電図構成に関連付けられている心電図データを受け取ることであって、前記心電図データは、前記複数の誘導に含まれる各誘導について、前記時間間隔の少なくとも一部に関連付けられている電圧データを含む、受け取ることと、
前記心電図データの少なくとも一部を訓練済みモデルに提供することであって、前記訓練済みモデルは前記心電図構成に関連付けられている入力済み心電図データに基づきリスクスコアを出力するように訓練される、提供することと、
前記訓練済みモデルから前記心電図データが生成されたときから所定の時間期間内に前記患者が病状を患う可能性を示すリスクスコアを受け取ることと、
開業医または医療管理者が閲覧するために前記リスクスコアをメモリまたはディスプレイのうちの少なくとも一方に出力することと
を行う前記命令を実行する、システム。
【請求項22】
患者、ならびに複数の誘導および時間間隔を含む心電図構成に関連付けられている心電図データを受け取るステップであって、前記心電図データは、前記複数の誘導に含まれる各誘導について、前記時間間隔の少なくとも一部に関連付けられている電圧データを含む、ステップと、
前記患者に関連付けられている人口統計データを受け取るステップと、
前記心電図データおよび前記人口統計データを訓練済みモデルに提供するステップと、
前記心電図データに基づき情報を生成するステップと、
前記情報を前記人口統計データと連結するステップと、
前記情報および前記人口統計データに基づき前記心電図データが生成されたときから所定の時間期間内に前記患者が病状を患う可能性を示すリスクスコアを生成するステップと、
前記訓練済みモデルから前記リスクスコアを受け取るステップと、
開業医または医療管理者が閲覧するために前記リスクスコアをメモリまたはディスプレイのうちの少なくとも一方に出力するステップと
を含む、方法。
【請求項23】
前記人口統計データは、前記患者の性別を含む、請求項22に記載の方法。
【請求項24】
前記人口統計データは、前記患者の年齢を含む、請求項22に記載の方法。
【請求項25】
前記病状は、死亡である、請求項22に記載の方法。
【請求項26】
前記病状は、心房細動である、請求項22に記載の方法。
【請求項27】
前記時間期間は、少なくとも6カ月である、請求項22に記載の方法。
【請求項28】
前記時間期間は、少なくとも1年である、請求項27に記載の方法。
【請求項29】
前記複数の誘導は、誘導I、誘導V2、誘導V4、誘導V3、誘導V6、誘導II、誘導VI、および誘導V5を含む、請求項22に記載の方法。
【請求項30】
前記リスクスコアに基づきレポートを生成するステップと、
開業医または医療管理者が閲覧するために前記ディスプレイに前記レポートを出力するステップと
をさらに含む、請求項22に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、すべての目的に関して全体が参照により本明細書に組み込まれている、2019年9月18日に出願した米国仮特許出願第62/902,266号、2019年10月22日に出願した米国仮特許出願第62/924,529号、および2020年4月22日に出願した米国仮特許出願第63/013,897号に基づいており、その利益を主張し、その優先権を主張する。
【0002】
連邦政府による資金提供を受けた研究開発の記載
該当なし。
【0003】
本開示の分野は、予測的ECG検査(predictive ECG testing)であり、より詳細には、「現在」のECG結果を将来の医学的状態と関連付けるためにディープラーニングを使用して将来の医学的状態または健康状態を予測するためのシステムおよびプロセスである。
【背景技術】
【0004】
医師は、日常的に患者の状態を診断し、それらの状態の影響を排除するか、または最小にするための解決策を処方する。たとえば、患者が細菌に感染している場合、医師は、細菌を死滅させることが知られている抗生物質を処方し得る。それに加えて、特定の患者状態が通常その後の医療事象の前兆であることが知られている場合、医師は、その後の状態の影響を軽減する解決策を処方し得る。たとえば、心房細動(Atrial fibrillation (AF)、たとえば、血栓、脳卒中、心不全、および他の心臓血管関連合併症につながり得る、震えるまたは不規則な心拍(不整脈))を患っている患者の場合、医師は、その後の脳卒中の可能性を軽減する血液抗凝結薬を処方し得る。
【0005】
大部分の健康状態の場合、治療計画の有効性(たとえば、状態および/または状態への影響を排除するか、または軽減する最終的な能力)は、状態がどれだけ早く発見されたかに関係している。早期発見は、典型的には、結果として完全/迅速回復および/またはそれほどひどくない臨床転帰のいずれかをもたらすより多くの治療オプションを意味する。したがって、たとえば、医師がAFを、その数年後ではなく、開始直後(または理想的には開始直前)に検出した場合、治療成功の可能性は目立って高くなる可能性がある。このことは、AFのような疾病については特に重要であり、患者は、しばしば、この潜在的に危険な状態を有していることすら気づかず、脳への回復不能な損傷(脳卒中という形で)を負って、その損傷が起こる前に治療されることなく病院へ運ばれる。
【0006】
同様に、多くの場合において、現在健康な患者が特定の医学的状態を患う可能性が比較的高いことを、その状態の発生前に医師が見分けることができれば、その患者は、将来その状態を回避するのに役立つように設計された治療計画を処方され得る。たとえば、AFの場合、医師が、現在AFを患っていない患者が将来AFのかなりの危険性を有することを見分けることができれば、その患者は、脳卒中などのAFに関係する将来の悪い転帰の可能性を防ぐか、または低減するために、自分のライフスタイルを変更する仕方、またはたとえばAFを検出するためのウェアラブルデバイスによる監視を高める仕方について助言を受けることができる。たとえば、現在AFの既往歴を有していない患者のAFの可能性は、定期的身体活動をすること、心臓によい食事を摂ること、高血圧を管理すること、過度の量のアルコールおよびカフェインを回避すること、禁煙すること、ならびに健康体重を維持することを含むライフスタイルの選択肢によってかなり低減され得ると考えられており、理想的には、これらの選択肢は、将来のAFの実質的危険性を有する誰もが選択すべきである。
【0007】
心電図(ECG)は、おそらく世界で最も広く使用されている心臓血管診断検査であり、大多数の人々が人生のある時点においてこの検査を受けている。心電図を取得するには、2つの場所の間の電圧差を導出するために使用される身体の表面全体の様々な場所で電位を測定することを伴う。この電圧差は、たとえば、毎秒約250~500個の電圧サンプルを取得した後に、時間の関数としてプロットされる。時間の関数としての電圧のこのプロットは、ECGの基礎を形成し、ECGトレースと呼ばれる。すべての筋肉は、その機能が正常に働いている間に電圧差を発生し、心臓は、本質的に大きな筋肉であるので、これらの電圧差から心臓機能の様々な態様(たとえば、心臓の鼓動が速いか遅いか、または心臓のいくつかの部分が異常に肥大しているか)が導出され得る。したがって、ECGの分析は、異なる多くの心臓病を診断し、治療するために使用される。
【0008】
ECGは、最低2つの体表電位記録(2つの電位の減算から電圧差が計算できるような)を使用して取得することができる。典型的には少なくとも10秒の持続時間において、1つの電圧差しか得られないときに、これは「リズムストリップ」として知られている。1つの一般的なECGは、12誘導ECGであり、身体の表面を横切る12の異なる方向(または「誘導」)で電圧差が取得される。典型的には、これらは患者が身体活動を行っていない間(すなわち「安静時」)に取得されるが、激しい運動時(「ストレス時」)にも取得され得る。安静時12誘導ECGが最も一般的に取得されるタイプのECGであるが、ECGに対して取得できる、異なる「誘導」の数に制限はない。ECGを取得する機械は、現在の臨床診療ではどこにでもあり、その後多数の電線に接続される患者の身体の表面に取り付けられる電極と、各電線の電位を測定することができる機械とからなる。この機械は、次いで、異なる配置の間の電圧差を計算し、最終的にECGトレースを生成することができる。ECGトレースは、不整を識別するために医師によって目視で調べられる。AFは、多くの不整のうちの1つであり、次いで、ECFトレースから特定できる。
【0009】
訓練を受けた医師による従来の視覚的ECG分析は、患者が現在AFを有しているかどうかを評価するのには有効であるように見えるが、従来のECG分析は、将来のAFまたは将来のAFから結果として生じ得る他の医療事象(たとえば、心臓発作、脳卒中、死亡)の可能性を予測するのには有効でない。
【0010】
AFについての集団ベースのスクリーニングは困難である。一般人口におけるAFの年間発生率は低く、70歳未満では発生率は1000人年あたり10未満であると報告されている。AFは、しばしば発作性であり、多くの症状発現は24時間未満の間持続する。現在、最も一般的なスクリーニング戦略は、日和見的脈拍触診であり、これはときには定期的医療訪問時に12誘導心電図(ECG)と併せて用いられる。この戦略は、いくつか集団においては適切であり得る。しかしながら、この戦略は、AFの多くの症例を見逃してしまう可能性がある。
【発明の概要】
【発明が解決しようとする課題】
【0011】
このため、医師の訓練を受けた目で見てもAFに一致する特徴を現在含んでいないECGトレースを分析することから将来のAFの可能性を確認する手立てはない。したがって、医師がECGトレースにAFの証拠がないと決定した場合、患者は、将来のAFの可能性または将来のAF関連合併症の可能性を全く意識せずに現在AFを有していないことを単に指示されるだけである。
【課題を解決するための手段】
【0012】
一態様において、本開示は、患者、ならびに複数の誘導および時間間隔を含む心電図構成に関連付けられている心電図データを受け取るステップであって、心電図データは、複数の誘導に含まれる各誘導について、時間間隔の少なくとも一部に関連付けられている電圧データを含む、ステップと、患者に関連付けられている年齢値を受け取るステップと、患者に関連付けられている性別値を受け取るステップと、年齢値、性別値、および心電図データの少なくとも一部を訓練済みモデルに提供するステップであって、訓練済みモデルは心電図構成に関連付けられている入力済み心電図データおよび患者に関連付けられている補足情報に基づきリスクスコアを生成するように訓練される、ステップと、心電図データが生成されたときから所定の時間期間内に患者が病状を患う可能性を示すリスクスコアを受け取るステップと、開業医または医療管理者が閲覧するためにリスクスコアをメモリまたはディスプレイのうちの少なくとも一方に出力するステップとを含む方法を提供する。
【0013】
この方法は、患者に関連付けられている電子健康記録データを受け取るステップと、電子健康記録データの少なくとも一部を訓練済みモデルに提供するステップとをさらに含み得る。電子健康記録データは、血中コレステロール測定値、血球数、血液化学検査値、トロポニン値、ナトリウム利尿ペプチド濃度、血圧、心拍数、呼吸数、酸素飽和度、心駆出率、心室容積、心筋厚、心臓弁機能、糖尿病診断、慢性腎臓病診断、先天性心疾患診断、癌診断、手技、投薬、心臓病リハビリテーションの照会、または食事相談の照会のうちの少なくとも1つを含み得る。
【0014】
この方法は、リスクスコアが病状に関連付けられている所定の閾値より高いと決定するステップと、リスクスコアが所定の閾値より高いとの決定に応答して、病状に対する治療または病状の原因のうちの少なくとも一方に関連付けられている情報および/または情報源へのリンクを含むレポートを生成するステップと、開業医または医療管理者が閲覧するためにレポートをメモリまたはディスプレイのうちの少なくとも一方に出力するステップとをさらに含み得る。
【0015】
方法において、時間期間は、1年であってもよい。
【0016】
方法において、時間期間は、1日から30年までの範囲のうちから選択されてもよい。
【0017】
方法において、訓練済みモデルは、複数の分岐を含むディープニューラルネットワークを含んでもよい。訓練済みモデルに提供される心電図データの一部は、複数の分岐に提供され得る。
【0018】
方法において、訓練済みモデルは、畳み込みコンポーネントおよび緻密層コンポーネントを含むディープニューラルネットワークを含んでもよい。畳み込みコンポーネントは、複数の畳み込み層を含むインセプションブロックを含んでもよい。
【0019】
方法において、複数の誘導は、誘導I、誘導V2、誘導V4、誘導V3、誘導V6、誘導II、誘導VI、および誘導V5を含んでもよい。心電図データは、誘導Iおよび時間間隔の第1の部分に関連付けられている第1の電圧データと、誘導V2および時間間隔の第2の部分に関連付けられている第2の電圧データと、誘導V4および時間間隔の第3の部分に関連付けられている第3の電圧データと、誘導V3および時間間隔の第2の部分に関連付けられている第4の電圧データと、誘導V6および時間間隔の第3の部分に関連付けられている第5の電圧データと、誘導IIおよび時間間隔の第1の部分に関連付けられている第6の電圧データと、誘導IIおよび時間間隔の第2の部分に関連付けられている第7の電圧データと、誘導IIおよび時間間隔の第3の部分に関連付けられている第8の電圧データと、誘導VIおよび時間間隔の第1の部分に関連付けられている第9の電圧データと、誘導VIおよび時間間隔の第2の部分に関連付けられている第10の電圧データと、誘導VIおよび時間間隔の第3の部分に関連付けられている第11の電圧データと、誘導V5および時間間隔の第1の部分に関連付けられている第12の電圧データと、誘導V5および時間間隔の第2の部分に関連付けられている第13の電圧データと、誘導V5および時間間隔の第3の部分に関連付けられている第14の電圧データとを含み得る。時間間隔は、10秒の時間期間を含むものとしてよく、時間間隔の第1の部分は、時間間隔の第1の1/2を含むものとしてよく、時間間隔の第2の部分は、時間間隔の第3の1/4を含むものとしてよく、時間間隔の第3の部分は、時間間隔の第4の1/4を含むものとしてよい。訓練済みモデルは、第1のチャネル、第2のチャネル、および第3のチャネルを含むものとしてよく、提供ステップは、第1の電圧データ、第6の電圧データ、第9の電圧データ、および第12の電圧データを第1のチャネルに提供するステップと、第2の電圧データ、第4の電圧データ、第7の電圧データ、第10の電圧データ、および第13の電圧データを第2のチャネルに提供するステップと、第3の電圧データ、第5の電圧データ、第8の電圧データ、第11の電圧データ、および第14の電圧データを第3のチャネルに提供するステップとを含み得る。複数の誘導の各々は、時間間隔に関連付けられ
得る。
【0020】
方法において、心電図データは、心臓学的基準に基づく心臓病状を示してもよい。
【0021】
方法において、心電図データは、心臓学的基準に基づく心臓病状を示さなくてもよい。
【0022】
方法において、病状は、死亡であってもよい。
【0023】
方法において、病状は、心房細動であってもよい。
【0024】
別の態様において、本開示は、心電図デバイスから患者、ならびに複数の誘導および時間間隔を含む心電図構成に関連付けられている患者心電図データを受け取るステップであって、患者心電図データは、複数の誘導に含まれる各誘導について、時間間隔の少なくとも一部に関連付けられている電圧データを含む、ステップと、患者心電図データの少なくとも一部を訓練済みモデルに提供するステップであって、訓練済みモデルは心電図構成に関連付けられている入力済み心電図データに基づきリスクスコアを出力するように訓練される、ステップと、患者心電図データが生成されたときから所定の時間期間内に患者が病状を患う可能性を示すリスクスコアを受け取るステップと、リスクスコアに基づきレポートを生成するステップと、開業医または医療管理者が閲覧するためにレポートをメモリまたはディスプレイのうちの少なくとも一方に出力するステップとを含む方法を提供する。
【0025】
さらに別の態様において、本開示は、命令を含む少なくとも1つのメモリに結合されている少なくとも1つのプロセッサを備えるシステムを提供する。少なくとも1つのプロセッサは、患者、ならびに複数の誘導および時間間隔を含む心電図構成に関連付けられている心電図データを受け取ることであって、心電図データは、複数の誘導に含まれる各誘導について、時間間隔の少なくとも一部に関連付けられている電圧データを含む、受け取ることと、心電図データの少なくとも一部を訓練済みモデルに提供することであって、訓練済みモデルは心電図構成に関連付けられている入力済み心電図データに基づきリスクスコアを出力するように訓練される、提供することと、訓練済みモデルから心電図データが生成されたときから所定の時間期間内に患者が病状を患う可能性を示すリスクスコアを受け取ることと、開業医または医療管理者が閲覧するためにリスクスコアをメモリまたはディスプレイのうちの少なくとも一方に出力することとを行う命令を実行する。
【0026】
なおもさらなる別の態様において、本開示は、患者、ならびに複数の誘導および時間間隔を含む心電図構成に関連付けられている心電図データを受け取るステップであって、心電図データは、複数の誘導に含まれる各誘導について、時間間隔の少なくとも一部に関連付けられている電圧データを含む、ステップと、患者に関連付けられている人口統計データを受け取るステップと、心電図データおよび人口統計データを訓練済みモデルに提供するステップと、心電図データに基づき情報を生成するステップと、情報を人口統計データと連結するステップと、情報および人口統計データに基づき心電図データが生成されたときから所定の時間期間内に患者が病状を患う可能性を示すリスクスコアを生成するステップと、訓練済みモデルからリスクスコアを受け取るステップと、開業医または医療管理者が閲覧するためにリスクスコアをメモリまたはディスプレイのうちの少なくとも一方に出力するステップとを含む方法を提供する。
【0027】
方法において、人口統計データは、患者の性別を含むものとしてよい。
【0028】
方法において、人口統計データは、患者の年齢を含むものとしてよい。
【0029】
方法において、病状は、死亡であってもよい。
【0030】
方法において、病状は、心房細動であってもよい。
【0031】
方法において、時間期間は、少なくとも6カ月であってもよい。時間期間は、少なくとも1年であってもよい。
【0032】
方法において、複数の誘導は、誘導I、誘導V2、誘導V4、誘導V3、誘導V6、誘導II、誘導VI、および誘導V5を含んでもよい。
【0033】
方法は、リスクスコアに基づきレポートを生成するステップと、開業医または医療管理者が閲覧するためにディスプレイにレポートを出力するステップとをさらに含み得る。
【0034】
本特許のファイルは、カラーで作成された少なくとも1つの図面/写真を含む。カラー図面/写真を含む本特許の写しは、請求と必要な手数料の支払いによって当局から提供される。
【図面の簡単な説明】
【0035】
図1】心電図(ECG)データに基づき心房細動(AF)リスクスコアを自動的に予測するためのシステムの一例を示す図である。
図2図1のシステムのいくつかの実施形態において使用され得るハードウェアの一例を示す図である。
図3】生のECG電圧入力データの一例を示す図である。
図4A】モデルの例示的な一実施形態を示す図である。
図4B】モデルの例示的な別の実施形態を示す図である。
図5A図4Aのモデルを訓練しテストする例示的なフローを示す図である。
図5B図5AによるECG選択のためのタイムラインを示す図である。
図6A】脳卒中登録におけるすべての記録済み虚血性脳卒中のうち、潜在的に予防可能なAF関連脳卒中を識別する際に採用されるステップを含むフローを示す図である。
図6B図6AによるECG選択のためのタイムラインを示す図である。
図7A】受信者動作特性下の平均面積としてのモデル性能の棒グラフである。
図7B】適合率再現率曲線下の平均面積としてのモデル性能の棒グラフである。
図7C】受信者動作特性下の面積としてのモデル性能の棒グラフである。
図7D】CHARGE-AFスコアを計算するために十分なデータを有する母集団の適合率再現率曲線の棒グラフである。
図7E】3つのモデルについて動作点がマークされているROC曲線のグラフである。
図7F】30年のフォローアップに対するAで示されている動作点に対する高リスク群および低リスク群の無発生生存曲線のグラフである。
図7G】年齢層、性別、および正常ECGラベルまたは異常ECGラベルによって定義される亜母集団における3つのモデルに対する95%信頼区間(Cl)によるハザード比(HR)のプロットである。
図7H】<50歳、50~65歳、および>65歳の年齢層における男性に対するホールドアウトセット内のカプランマイヤー(KM)無発生生存曲線のプロットである。
図7I】<50歳、50~65歳、および>65歳の年齢層における女性に対するホールドアウトセット内のカプランマイヤー(KM)無発生生存曲線のプロットである。
図7J】<50歳、50~65歳、および>65歳の年齢層における男性に対する初発AFについてモデル(ECGトレース、年齢および性別で訓練されたモデルM0)予測された低リスク群および高リスク群に対するKM曲線のプロットである。
図7K】<50歳、50~65歳、および>65歳の年齢層における女性に対する初発AFのモデル予測された低リスク群および高リスク群に対するKM曲線のプロットである。
図7L】概念実証モデルのホールドアウトセット内のECG後のAF発生までの時間の累積分布を示すプロットである。
図8A】選択された動作点による受信者動作特性曲線のグラフである。
図8B図8Aの動作点における正常ECGサブセットおよび異常ECGサブセットにおける予測された低リスク群および高リスク群のカプランマイヤー曲線のグラフである。
図9】ECG後のインシデントAFまでの時間の定義の関数としてのモデル性能のグラフである。
図10】シミュレートされた展開モデルにおける内部検証セット上の動作点の選択のグラフである。
図11】ECG生成から1年、2年、および3年以内に発症したAF関連脳卒中を潜在的に防止するモデルの感度を、インシデントAFを発症する高いリスクがあるとしてターゲットにされた集団のパーセンテージの関数として示すグラフである。
図12】所与の年齢閾値未満の患者の関数としての集団におけるすべてのインシデントAF(ECG後1年以内)および脳卒中(ECG後3年以内)のパーセントのグラフである。
図13図4Aにおけるモデルなどのモデルを使用してリスクスコアを生成するための例示的なプロセスを示す図である。
図14】利用可能なフォローアップによる予測Afib群および予測無Afib群(尤度閾値=0.5)に対する無発生割合曲線を示すグラフである。
図15】将来のAfib予測システムのすべての動作点にわたって最高のリスクおよび陽性適中率を有する上位%患者を示すグラフである。
図16】追加特徴として年齢および性別を有する場合と有しない場合のECG測定およびECGトレースによる1年後死亡率を予測する死亡率予測モデルまたはシステム性能の棒グラフである。
図17】ECG後1年を過ぎた正常ECGサブセットおよび異常ECGサブセットにおける予測された生存群および死亡群に対する平均KM曲線を示すグラフである。
図18】複数のチャネルを各々処理する複数の分岐を有する畳み込みニューラルネットワークに対するモデルアーキテクチャを示す図である。
図19A】1年全原因死亡を予測するための受信者動作特性曲線下の面積(AUC)のグラフである。
図19B】2.5秒または10秒のトレーシングから導出された様々な誘導配置に対するAUCを示す棒グラフである。
図20A】ECG感度対特異度のプロットである。
図20B】選択された動作点(尤度閾値=0.5、感度:0.76、特異度:0.77)における生存割合対年数のカプランマイヤー生存分析プロットである。
図21】モデル結果を確認する前と確認した後の3人の異なる心臓内科医による予測された死亡転帰のグラフである。
図22A】無発生割合対年数のグラフである。
図22B】陽性適中率対母集団の上位パーセンテージのリスク群のグラフである。
【発明を実施するための形態】
【0036】
次に、本開示の様々な態様は、図面を参照しつつ説明され、いくつかの図面全体を通して同様の参照番号は、類似の要素に対応している。しかしながら、図面およびそれに関係する以下の詳細な説明は、特許請求された主題を開示された特定の形態に限定することを意図していないことは理解されるべきである。むしろ、目的は、特許請求された主題の趣旨および範囲内に収まるすべての修正物、均等物、および代替物を対象とする。
【0037】
以下の詳細な説明では、その一部をなし、本開示が実践され得る特定の実施形態が例証として示されている、添付図面が参照される。これらの実施形態は、当業者が本開示を実施することを可能にするために十分に詳しく説明されている。しかしながら、詳細な説明および特定の例は、本開示の実施形態の例を示しているが、例証としてのみ、また限定することなく与えられていることは理解されるであろう。本開示から、本開示の範囲内の様々な置換、修正、追加再配置構成、またはそれらの組合せがなされ得、これは当業者には明らかになるであろう。
【0038】
一般的な慣行に従って、図面に例示されている様々な特徴は、縮尺通りに描かれていない場合がある。本明細書に提示されている図解は、任意の特定の方法、デバイス、またはシステムの実際の図であることを意図しておらず、本開示の様々な実施形態を説明するために採用されている単なる理想化された表現である。したがって、明確にするために、様々な特徴の寸法は任意に拡大または縮小されていることがある。それに加えて、図面のいくつかは、明確にするために、簡略化され得る。したがって、図面は、所与の装置(たとえば、デバイス)または方法のすべての構成要素を描いていない場合がある。それに加えて、同様の参照番号は、本明細書および図面全体を通して同様の特徴を表すために使用され得る。
【0039】
本明細書において説明されている情報および信号は、様々な異なる技術と技法とを使用して表され得る。たとえば、上の説明全体を通して参照されている場合があるデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁場または磁気粒子、光場または光粒子、あるいはこれらの組合せにより表すことができる。いくつかの図面は、提示および説明を明確にするために、信号を単一の信号として例示することがある。信号は信号のバスを表し得、バスは様々なビット幅を有し得、本開示は単一のデータ信号を含む任意の数のデータ信号に関して実施され得ることは当業者によって理解されるであろう。
【0040】
本明細書で開示される実施形態に関して説明される、様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムの活動は、電子ハードウェア、コンピュータソフトウェア、または両方の組合せとして実装され得る。ハードウェアおよびソフトウェアのこの互換性を明確に説明するために、様々な例示的な構成要素、ブロック、モジュール、回路、および活動が、それらの機能の観点から一般的に説明される。そのような機能がハードウェアまたはソフトウェアのどちらとして実施されるのかは、システム全体に課される特定の用途および設計制約に依存する。当業者は、説明した機能を具体的な用途ごとに様々な方法で実装し得るが、そのような実装の決定は、本明細書において説明されている開示の実施形態の範囲からの逸脱を生じるものと解釈すべきではない。
【0041】
それに加えて、実施形態は、フローチャート、フローダイアグラム、構造図、またはブロック図として表されているプロセスに関して説明され得ることに留意されたい。フローチャートは、動作活動を逐次プロセスとして記述している場合があるけれども、これらの活動の多くは、別の順序で、並行して、または実質的に同時に実行され得る。それに加えて、活動の順番は並べ替えられ得る。プロセスは、メソッド、関数、プロシージャ、サブルーチン、サブプログラムなどに対応し得る。さらに、本明細書において開示されている方法は、ハードウェア、ソフトウェア、またはその両方で実装され得る。ソフトウェアで実装される場合、これらの関数は、コンピュータ可読媒体上に1つもしくは複数の命令またはコードとして記憶されるか、または伝送され得る。コンピュータ可読媒体は、一方の場所から別の場所へのコンピュータプログラムの転送を容易にする媒体を含むコンピュータ記憶媒体と通信媒体の両方を含む。
【0042】
本明細書において、「第1」、「第2」などの指定を用いて要素に言及することは、そのような制限が明示的に記載されていない限り、それらの要素の量または順序を制限しないことを理解されたい。むしろ、これらの指定は、2つ以上の要素または要素のインスタンスを区別する便宜上の方法として本明細書において使用され得る。そのため、第1および第2の要素への参照は、2つの要素のみがそこで使用され得ること、または第1の要素が何らかの形で第2の要素の前に来なければならないことを意味しない。また、断りのない限り、要素のセットは、1つまたは複数の要素を含み得る。
【0043】
本明細書において使用されているように、「コンポーネント」、「システム」、および同様の用語は、コンピュータ関係のエンティティ、すなわち、ハードウェア、ハードウェアとソフトウェアの組合せ、ソフトウェア、または実行中のソフトウェアのいずれかを指すことを意図されている。たとえば、コンポーネントは、限定はしないが、プロセッサ上で実行されているプロセス、プロセッサ、オブジェクト、実行可能ファイル、実行のスレッド、プログラム、および/またはコンピュータであるものとしてよい。例証として、コンピュータ上で実行しているアプリケーションおよびコンピュータは両方ともコンポーネントであってよい。1つまたは複数のコンポーネントは、1つのプロセスおよび/または実行スレッド内に常駐してよく、またコンポーネントは、1つのコンピュータにローカライズされ、および/または2つ以上のコンピュータもしくはプロセッサ間に分散されることも可能である。
【0044】
「例示的な」という言い回しは、本明細書では、一例、事例、または例証として使用することを意味するために使用される。「例示的」として本明細書に記載されたあらゆる態様または設計は必ずしも、他の態様または設計より好ましいまたはこれを凌ぐものであるとして解釈されるべきではない。
【0045】
さらに、開示されている主題は、標準的プログラミングおよび/またはエンジニアリング技術を使用してソフトウェア、ファームウェア、ハードウェア、またはこれらの任意の組合せを生産しコンピュータまたはプロセッサベースのデバイスを制御して本明細書において詳述されている態様を実装するシステム、方法、装置、または製造品として実装され得る。本明細書で使用されているような「製造品」(または代替的に、「コンピュータプログラム製品」)という用語は、任意のコンピュータ可読デバイス、キャリア、または媒体からアクセス可能なコンピュータプログラムを包含することを意図されている。たとえば、コンピュータ可読媒体は、限定はしないが、磁気記憶デバイス(たとえば、ハードディスク、フロッピィディスク、磁気ストリップ、...)、光ディスク(たとえば、コンパクトディスク(CD)、デジタル多目的ディスク(DVD)...)、スマートカード、およびフラッシュメモリデバイス(たとえば、カード、スティック)を含み得る。それに加えて、搬送波は、電子メールの送受信、またはインターネットもしくはローカルエリアネットワーク(LAN)などのネットワークへのアクセスに使用されるものなど、コンピュータ可読電子データを搬送するために採用され得ることは理解されるであろう。もちろん、当業者は、特許請求された主題の範囲または趣旨から逸脱することなくこの構成に多くの修正が加えられ得ることを理解するであろう。
【0046】
心房細動(AF)は、特に発見されないときには、実質的罹患率に関連している。初発AFが高い精度で予測できる場合、早期に見つけるためにスクリーニング方法が使用されることもあり得る。本開示は、安静時12誘導心電図(ECG)から初発AFを予測することができるディープニューラルネットワークを提供する。予測された初発AFは、開業医(たとえば、心臓内科医)が脳卒中などのAF関連有害転帰を予防するのを支援し得る。
【0047】
12誘導心電図は、I側方誘導(I誘導とも称される)と、II下方誘導(II誘導とも称される)と、III下方誘導(III誘導とも称される)と、aVR誘導、aVL側方誘導(aVL誘導とも称される)と、aVF下方誘導(aVF誘導とも称される)と、V1中隔誘導(V1誘導とも称される)と、V2中隔誘導(V2誘導とも称される)と、V3前方誘導(V3誘導とも称される)と、V4前方誘導(V4誘導とも称される)と、V5側方誘導(V5誘導とも称される)と、V6側方誘導(V6誘導とも称される)とを含み得る。
【0048】
心房細動(AF)は、脳卒中および心不全を含むいくつかの重要な有害健康転帰に関連付けられる心調律疾患である。AFおよび血栓塞栓症の危険因子を有する患者では、早期抗凝固療法が脳卒中を予防する上で効果的であることが示されている。残念なことに、AFはしばしば無症候性であるか、または最小症候性であるので、認識されず未治療に終わる。したがって、未発見AFをスクリーニングし、識別するためのシステムおよび方法は、脳卒中を予防するのに役立ち得る。
【0049】
AFについての集団ベースのスクリーニングは2つの主要な理由から困難である。1つは、一般人口におけるAFの年間発生率は低く、70歳未満では発生率は1000人年あたり10未満であると報告されていることである。もう1つは、AFは、しばしば「発作性」であり(すなわち、患者はいくつかの時間期間にAFを繰り返す)、多くの症状発現は24時間未満の間持続する。現在、最も一般的なスクリーニング戦略は、日和見的脈拍触診であり、これはときには定期的医療訪問時に12誘導心電図と併せて用いられる。これは、いくつかの集団においては費用効果が高いことが示されており、いくつかのガイドラインでは推奨されている。しかしながら、植え込み型心臓デバイスの研究では、この戦略はAFの多くの症例を見逃してしまうことを示唆している。
【0050】
現在、発作性および無症候性AFを検出するために多くの連続監視デバイスが利用可能である。パッチモニターは、最長で14~30日間装着でき、植え込み可能ループレコーダーは、3年程度連続監視を行い、ウェアラブルモニターは、ときにはモバイルデバイスと併用され、無期限に装着することができる。連続監視デバイスは、発作性AFの問題を克服しているが、依然として、初発AFの全体的に低い発生率に取り組まなければならず、コストと利便性が、広範囲の集団スクリーニングに対する使用を限定している。
【0051】
本開示では、広く利用され安価な検査である、ECGから将来のAFを正確に予測するシステムおよび方法が説明されている。
【0052】
図1は、ECGデータ(たとえば、安静時12誘導ECGからのデータ)に基づきAFリスクスコアを自動的に予測するためのシステム100の一例である。いくつかの実施形態において、システム100は、コンピューティングデバイス104、二次コンピューティングデバイス108、および/またはディスプレイ116を備えることができる。いくつかの実施形態において、システム100は、ECGデータベース120、訓練データデータベース124、および/または訓練済みモデルデータベース128を備えることができる。いくつかの実施形態において、コンピューティングデバイス104は、通信ネットワーク112上で、二次コンピューティングデバイス108、ディスプレイ116、ECGデータベース120、訓練データデータベース124、および/または訓練済みモデルデータベース128と通信することができる。図1に示されているように、コンピューティングデバイス104は、12誘導ECGデータなどのECGデータを受け取り、ECGデータに基づきAFリスクスコアを生成することができる。いくつかの実施形態において、AFリスクスコアは、ECGが取られたときから所定の時間期間内(たとえば、3カ月、6カ月、1年、5年、10年など)に患者がAFを発症する予測リスクを示すことができる。いくつかの実施形態において、コンピューティングデバイス104は、ECG分析アプリケーション132の少なくとも一部を実行し、AFリスクスコアを自動的に生成することができる。
【0053】
システム100は、リスクスコアを生成して、所定の期間内に心房細動、心房粗動、または別の関連する病状を経験する可能性が最も高い患者に対して追加の心臓監視を検討する推奨を医師に提供し得る。いくつかの例において、システム100は、現在のAFまたは以前のAFの既往歴のない40歳以上の患者への使用について指示され得る。いくつかの例において、システム100は、AFまたは他の関連する病状の以前から存在する、および/または同時に存在する文書を有しない患者における使用について指示され得る。いくつかの例において、システム100は、医療提供者によって、患者の病歴および臨床評価と組み合わせて、臨床的意思決定を伝えるために使用され得る。
【0054】
いくつかの実施形態において、ECGデータは、心臓学的基準に基づく心臓病状を示すか、または示さない場合がある。たとえば、ECGデータは、速い心拍を示すものであってもよい。システム100は、所与の心臓病状(たとえば、速い心拍)を示していないECGデータに基づき患者が病状(たとえば、AF)を患うことを示すリスクスコアを予測し得る。このようにして、システムは、ECGデータが心臓学的基準に基づき「健康」に見えるときであっても1つまたは複数の病状に対してリスクを有する患者を検出し得る。システム100は、心臓病状(たとえば、速い心拍)を示すECGデータに基づき患者が病状(たとえば、AF)を患うことを示すリスクスコアを予測し得る。このようにして、システム100は、ECGデータが異なる病状の存在を示すときに1つまたは複数の病状に対してリスクを有する患者を検出し得る。
【0055】
ECG分析アプリケーション132は、システム100に備えられ得る二次コンピューティングデバイス108、および/またはコンピューティングデバイス104に含まれ得る。コンピューティングデバイス104は、二次コンピューティングデバイス108と通信することができる。コンピューティングデバイス104および/または二次コンピューティングデバイス108は、また、通信ネットワーク112上で、システム100に備えられ得るディスプレイ116と通信し得る。いくつかの実施形態において、コンピューティングデバイス104および/または二次コンピューティングデバイス108は、ディスプレイ116に、ECG分析アプリケーション132によって生成される1つまたは複数のAFリスクスコアおよび/またはレポートを提示させることができる。
【0056】
通信ネットワーク112は、コンピューティングデバイス104と二次コンピューティングデバイス108との間の通信を円滑にすることができる。いくつかの実施形態において、通信ネットワーク112は、任意の好適な通信ネットワークまたは通信ネットワークの組合せとすることができる。たとえば、通信ネットワーク112は、Wi-Fiネットワーク(1つまたは複数のワイヤレスルーター、1つまたは複数のスイッチなどを含むことができる)、ピアツーピアネットワーク(たとえば、Bluetoothネットワーク)、セルラーネットワーク(たとえば、CDMA、GSM、LTE、LTE Advanced、WiMAXなどの、任意の好適な規格に準拠する、3Gネットワーク、4Gネットワーク、5Gネットワークなど)、有線ネットワークなど、を含むことができる。いくつかの実施形態では、通信ネットワーク112は、ローカルエリアネットワーク、ワイドエリアネットワーク、公衆通信回線(たとえば、インターネット)、プライベートもしくはセミプライベートネットワーク(たとえば、企業もしくは大学イントラネット)、任意の他の好適なタイプのネットワーク、またはネットワークの任意の好適な組合せとすることができる。図1に示されている通信リンクは、各々、有線リンク、光ファイバーリンク、Wi-Fiリンク、Bluetoothリンク、セルラーリンクなどの、任意の好適な通信リンクまたは通信リンクの組合せとすることができる。
【0057】
ECGデータベース120は、多数のECGを含むことができる。いくつかの実施形態において、ECGは、12誘導ECGを含むことができる。各ECGは、各誘導について所定の時間期間(たとえば、5秒、10秒、15秒、30秒、60秒など)にわたって一定の間隔(たとえば、250HZ、500Hz、1000Hzなどのレート)で取られた多数の電圧測定値を含むことができる。いくつかの事例において、誘導の数は異なっていてもよく(たとえば、1~12)、それぞれのサンプリングレートおよび時間期間は、各誘導について異なり得る。いくつかの実施形態において、ECGは、単一の誘導を含むことができる。いくつかの実施形態において、ECGデータベース120は、ECG分析アプリケーション132によって生成された1つまたは複数のAFリスクスコアを含むことができる。
【0058】
訓練データデータベース124は、多数のECGおよび臨床データを含むことができる。いくつかの実施形態において、臨床データは、ECGが取られた日の次の時間期間に患者がAFを発症したか否かなどの転帰データを含むことができる。例示的な時間期間は、1カ月、2カ月、3カ月、4カ月、5カ月、6カ月、7カ月、8カ月、9カ月、10カ月、11カ月、12カ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、または10年を含み得る。ECGおよび臨床データは、AFリスクスコアを生成するようにモデルを訓練するために使用され得る。いくつかの実施形態では、訓練データデータベース124は、ある時間期間(10秒など)にわたって取られた多誘導ECGおよび対応する臨床データを含むことができる。いくつかの実施形態において、訓練済みモデルデータベース128は、生ECGを受け取り、AFリスクスコアを出力することができる多数の訓練済みモデルを含むことができる。他の実施形態では、ECGに対する誘導のデジタル画像が使用され得る。いくつかの実施形態において、訓練済みモデル136は、コンピューティングデバイス104に記憶され得る。
【0059】
図2は、システム100のいくつかの実施形態において使用され得るハードウェアの一例である。コンピューティングデバイス104は、プロセッサ204、ディスプレイ208、1つまたは複数の入力212、1つまたは複数の通信システム216、およびメモリ220を備えることができる。プロセッサ204は、以下に説明されているプロセスを含むことができる、プログラムを実行することができる、中央演算処理装置(「CPU」)、グラフィックスプロセッシングユニット(「GPU」)などの、任意の好適なハードウェアプロセッサまたはプロセッサの組合せとすることができる。
【0060】
いくつかの実施形態において、ディスプレイ208は、グラフィカルユーザインターフェースを提示することができる。いくつかの実施形態において、ディスプレイ208は、コンピュータモニタ、タッチスクリーン、テレビなどの任意の好適なディスプレイデバイスを使用して実装することができる。いくつかの実施形態において、コンピューティングデバイス104の入力212は、インジケータ、センサー、作動可能ボタン、キーボード、マウス、グラフィカルユーザインターフェース、タッチスクリーンディスプレイなどを含むことができる。
【0061】
いくつかの実施形態において、通信システム216は、任意の好適な通信ネットワーク上で、他のシステムと通信するための任意の好適なハードウェア、ファームウェア、および/またはソフトウェアを備えることができる。たとえば、通信システム216は、1つまたは複数のトランシーバ、1つまたは複数の通信チップおよび/またはチップセットなどを含むことができる。より具体的な例では、通信システム216は、同軸接続、光ファイバー接続、イーサネット接続、USB接続、Wi-Fi接続、Bluetooth接続、セルラー接続などを確立するために使用できるハードウェア、ファームウェア、および/またはソフトウェアを含むことができる。いくつかの実施形態において、通信システム216は、コンピューティングデバイス104が二次コンピューティングデバイス108と通信することを可能にする。
【0062】
いくつかの実施形態において、メモリ220は、たとえば、ディスプレイ208を使用してコンテンツを提示する、通信システム216を介して二次コンピューティングデバイス108と通信する、などのためにプロセッサ204によって使用され得る命令、値などを記憶するために使用され得る任意の好適な記憶デバイスを含むことができる。メモリ220は、任意の好適な揮発性メモリ、不揮発性メモリ、ストレージ、またはそれらの任意の好適な組合せを含むことができる。たとえば、メモリ220は、RAM、ROM、EEPROM、1つまたは複数のフラッシュドライブ、1つまたは複数のハードディスク、1つまたは複数のソリッドステートドライブ、1つまたは複数の光学ドライブ、などを含むことができる。いくつかの実施形態において、メモリ220は、コンピューティングデバイス104(または二次コンピューティングデバイス108)の動作を制御するためのコンピュータプログラムをその上に符号化しているものとしてよい。そのような実施形態では、プロセッサ204は、コンピュータプログラムの少なくとも一部を実行して、コンテンツ(たとえば、ユーザインタフェース、画像、グラフィックス、テーブル、レポートなど)を提示し、二次コンピューティングデバイス108からコンテンツを受信し、二次コンピューティングデバイス108に情報を伝送する、などを行うことができる。
【0063】
二次コンピューティングデバイス108は、プロセッサ224、ディスプレイ228、1つまたは複数の入力232、1つまたは複数の通信システム236、およびメモリ240を備えることができる。プロセッサ224は、以下に説明されているプロセスを含むことができる、プログラムを実行することができる、中央演算処理装置(「CPU」)、グラフィックスプロセッシングユニット(「GPU」)などの、任意の好適なハードウェアプロセッサまたはプロセッサの組合せとすることができる。
【0064】
いくつかの実施形態において、ディスプレイ228は、グラフィカルユーザインターフェースを提示することができる。いくつかの実施形態において、ディスプレイ228は、コンピュータモニタ、タッチスクリーン、テレビなどの任意の好適なディスプレイデバイスを使用して実装することができる。いくつかの実施形態において、二次コンピューティングデバイス108の入力232は、インジケータ、センサー、作動可能ボタン、キーボード、マウス、グラフィカルユーザインターフェース、タッチスクリーンディスプレイなどを含むことができる。
【0065】
いくつかの実施形態において、通信システム236は、任意の好適な通信ネットワーク上で、他のシステムと通信するための任意の好適なハードウェア、ファームウェア、および/またはソフトウェアを備えることができる。たとえば、通信システム236は、1つまたは複数のトランシーバ、1つまたは複数の通信チップおよび/またはチップセットなどを含むことができる。より具体的な例では、通信システム236は、同軸接続、光ファイバー接続、イーサネット接続、USB接続、Wi-Fi接続、Bluetooth接続、セルラー接続などを確立するために使用できるハードウェア、ファームウェア、および/またはソフトウェアを含むことができる。いくつかの実施形態において、通信システム236は、二次コンピューティングデバイス108がコンピューティングデバイス104と通信することを可能にする。
【0066】
いくつかの実施形態において、メモリ240は、たとえば、ディスプレイ228を使用してコンテンツを提示する、通信システム236を介してコンピューティングデバイス104と通信する、などのためにプロセッサ224によって使用され得る命令、値などを記憶するために使用され得る任意の好適な記憶デバイスを含むことができる。メモリ240は、任意の好適な揮発性メモリ、不揮発性メモリ、ストレージ、またはそれらの任意の好適な組合せを含むことができる。たとえば、メモリ240は、RAM、ROM、EEPROM、1つまたは複数のフラッシュドライブ、1つまたは複数のハードディスク、1つまたは複数のソリッドステートドライブ、1つまたは複数の光学ドライブ、などを含むことができる。いくつかの実施形態において、メモリ240は、二次コンピューティングデバイス108(またはコンピューティングデバイス104)の動作を制御するためのコンピュータプログラムをその上に符号化しているものとしてよい。そのような実施形態では、プロセッサ224は、コンピュータプログラムの少なくとも一部を実行して、コンテンツ(たとえば、ユーザインタフェース、画像、グラフィックス、テーブル、レポートなど)を提示し、コンピューティングデバイス104からコンテンツを受信し、コンピューティングデバイス104に情報を伝送する、などを行うことができる。
【0067】
ディスプレイ116は、コンピュータディスプレイ、テレビモニタ、プロジェクタ、または他の好適なディスプレイとすることができる。
【0068】
データ選択および表現型定義
図3は、生ECG電圧入力データ300の一例である。ECG電圧入力データは、データ表現を12誘導から独立した8誘導に削減した後、3つの異なる、時間的にコヒーレントな分岐を含む。具体的には、図3に示されている例では、誘導aVL、aVF、およびIIIは、他の、保持されている誘導の一次結合であるので使用される必要がない場合がある。これらの誘導を追加することで、いくつかの誘導からのデータのオーバーローディング(すなわち、重複情報)に起因してモデルの性能に悪影響を与え、オーバーフィッティングにつながる可能性がある。いくつかの実施形態において、これらの誘導は、重複情報を表さないときにモデル性能をブーストし得る。さらに、誘導Iは、Goldbergerの式、-aVR=(I+II)/2を使用して2.5秒から5秒の時間間隔において計算された。いくつかの実施形態において、データは500Hzで取得され得る。500Hzで取得されないデータ(250Hzまたは1000Hzで取得される研究など)は、線形補間またはダウンサンプリングによって500Hzに再サンプリングされ得る。いくつかの実施形態において、1つまたは複数の誘導の完全な10秒、20秒、または60秒にわたる誘導を有する1つの分岐があり得る。他の実施形態において、各分岐について異なる時間期間があってもよい(たとえば、第1の分岐は0~2.5秒を含み得、第2の分岐は2.5~6秒を含み得、第3の分岐は6~10秒を含み得る)。いくつかの実施形態において、分岐の数は、異なる期間の数に一致し得る(たとえば、100Hzでサンプリングされた後続の1秒誘導を各々受け取る10個の分岐があり得る、500Hzでサンプリングされた後続の2.5秒誘導を各々受け取る4つの分岐があり得る、など)。いくつかの実施形態において、モデルは、複数の分岐、誘導、サンプリングレート、および/またはサンプリング周期構造について訓練され、保持され得る。
【0069】
図示されているように、生ECG電圧入力データ300は、データに含まれる誘導および各誘導がサンプリングされるか、または測定される時間間隔を定義する所定のECG構成を有し得る。いくつかの実施形態において、生ECG電圧入力データ300について、ECG構成は、0~5秒の時間間隔を有する誘導I、5~7.5秒の時間間隔を有する誘導V2、7.5~10秒の時間間隔を有する誘導V4、5~7.5秒の時間間隔を有する誘導V3、7.5~10秒の時間間隔を有する誘導V6、0~10秒の時間間隔を有する誘導II、0~10秒の時間間隔を有する誘導VI、および0~10秒の時間間隔を有する誘導V5を含むことができる。ECG電圧入力データ全体は、0~10秒の時間間隔を有することができる。したがって、いくつかの誘導は、ECG電圧入力データの時間間隔全体に対するデータを含むものとしてよく、他の誘導は、ECG電圧入力データの時間間隔のサブセットに対するデータのみを含み得る。
【0070】
いくつかの実施形態において、ECG電圧入力データ300は、時間間隔(たとえば、10秒)と関連付けることができる。ECG電圧入力データ300は、誘導(たとえば、誘導I、誘導V2、誘導V4、誘導V3、誘導V6、誘導II、誘導VI、および誘導V5)により生成される電圧データを含むことができる。いくつかの実施形態において、生ECG電圧入力データ300は、時間間隔全体にわたって誘導によって生成された電圧データを含むことができる。いくつかの実施形態において、いくつかの誘導からの電圧データは、患者に対してどのようなECGデータが利用可能であるかに応じて、時間間隔の一部(たとえば、時間間隔の第1の1/2、時間間隔の第3の1/4、時間間隔の第4の1/4)にわたって生成され得るのみである。いくつかの実施形態において、生ECG電圧入力データのデジタル画像が使用され得、デジタル画像から識別された各誘導および対応する電圧(たとえば、デジタル電圧データ)は、デジタル画像の分析から推定され得る。
【0071】
いくつかの実施形態において、ECG電圧入力データ300は、誘導Iおよび時間間隔の第1の部分に関連付けられている第1の電圧データ304と、誘導V2および時間間隔の第2の部分に関連付けられている第2の電圧データ308と、誘導V4および時間間隔の第3の部分に関連付けられている第3の電圧データ312と、誘導V3および時間間隔の第2の部分に関連付けられている第4の電圧データ316と、誘導V6および時間間隔の第3の部分に関連付けられている第5の電圧データ320と、誘導IIおよび時間間隔の第1の部分に関連付けられている第6の電圧データ324と、誘導IIおよび時間間隔の第2の部分に関連付けられている第7の電圧データ328と、誘導IIおよび時間間隔の第3の部分に関連付けられている第8の電圧データ332と、誘導VIおよび時間間隔の第1の部分に関連付けられている第9の電圧データ336と、誘導VIおよび時間間隔の第2の部分に関連付けられている第10の電圧データ340と、誘導VIおよび時間間隔の第3の部分に関連付けられている第11の電圧データ344と、誘導V5および時間間隔の第1の部分に関連付けられている第12の電圧データ348と、誘導V5および時間間隔の第2の部分に関連付けられている第13の電圧データ352と、誘導V5および時間間隔の第3の部分に関連付けられている第14の電圧データ356とを含み得る。このようにして、時間間隔の部分に関連付けられている電圧データは、患者に対するリスクスコアを推定するために訓練済みモデルの同じチャネルに提供され得る。
【0072】
図4Aは、モデル400の例示的な一実施形態である。具体的には、モデル400のアーキテクチャが図示されている。いくつかの実施形態において、モデル400は、ディープニューラルネットワークであり得る。いくつかの実施形態において、モデル400は、図3に示されている入力データを受け取ることができる。モデル400への入力データ構造は、時刻(t)=0(データ取得の開始)からt=5秒までに取得される誘導I、II、V1、およびV5(たとえば、第1の電圧データ、第6の電圧データ、第9の電圧データ、および第12の電圧データ)を含む第1の分岐404と、t=5からt=7.5秒までの間の誘導V1、V2、V3、II、およびV5(たとえば、第2の電圧データ、第4の電圧データ、第7の電圧データ、第10の電圧データ、および第13の電圧データ)を含む第2の分岐408と、t=7.5からt=10秒までの間の誘導V4、V5、V6、II、およびV1(たとえば、第3の電圧データ、第5の電圧データ、第8の電圧データ、第11の電圧データ、および第14の電圧データ)を含む第3の分岐412とを含むことができ、これは図3に示されているとおりである。分岐の配置構成は、不整脈および/または期外収縮に起因する標準的な臨床取得の全体にわたる同時の形態変化を考慮するように設計され得る。たとえば、モデル400は、データを理解するために、どの電圧情報またはデータが同じ時点で取得されるかについて同期させる必要があり得る。ECG誘導はすべて同時に取得されるわけではないので、誘導は、どのデータが同時に収集されたかをニューラルネットワークモデルに示すようにアライメントされ得る。すべての誘導が時間間隔全体にわたる電圧データを有する必要はないことに留意されたい。これは、いくつかのECGが時間間隔全体にわたるすべての誘導についてデータを含まないので、モデル400の利点である。たとえば、モデル400は、10個の分岐を含むことができ、10個の異なる誘導からの後続の1秒の期間にわたって電圧データを受信したことに応答したことに基づきリスクスコアを生成するように訓練され得る。別の例として、モデル400は、4個の分岐を含むことができ、4個の異なる誘導からの後続の2.5秒の期間にわたって電圧データを受信したことに応答したことに基づきリスクスコアを生成するように訓練され得る。病院などのいくつかの組織は、標準化されたECG構成(たとえば、10個の異なる誘導からの後続の1秒の期間にわたる電圧データ)を使用し得る。モデル400は、適切な数の分岐を含み、標準化されたECG構成に対するリスクスコアを生成するように訓練され得る。したがって、所与の組織によってどのようなECG構成が使用されようともモデル400はそれに合わせて手直しできる。
【0073】
いくつかの実施形態において、モデル400は、畳み込みコンポーネント400A、インセプションブロック400B、および全結合緻密層コンポーネント400Cを含むことができる。畳み込みコンポーネント400Aは、各分岐に対する入力から始まり、その後に畳み込みブロックが続くものとしてよい。畳み込みコンポーネント400Aに含まれる各畳み込みブロックは、1D畳み込み層、正規化線形活性化(RELU)活性化関数、およびバッチ正規化層を、順次含むことができる。次に、この畳み込みブロックの後に、4つのインセプションブロック400Bが順次続くことができ、各インセプションブロック400Bは、減少するフィルタウィンドウサイズでチャネル軸にわたって連結された3つの1D畳み込みブロックを含み得る。4つのインセプションブロック400Bの各々は、1D MaxPooling層に接続されてよく、これらは、別の単一の1D畳み込みブロックおよび最後のGlobal Average Pooling層に接続される。すべての3つの分岐に対する出力は連結され、緻密層コンポーネント400Cに完全結合され得る。緻密層コンポーネント400Cは、最後の層としてシグモイド関数を有する256個、64個、8個、および1個のユニットからなる4つの緻密層を含むことができる。このアーキテクチャにおけるすべての層は、カーネル制約を強制することができ、バイアス項を含まなくてもよい。いくつかの実施形態において、adagradオプティマイザは、1e-445の学習率、効率的なモデル収束のための早期停止前の1/10の線形学習率減衰、および2048のバッチサイズで使用され得る。いくつかの実施形態において、モデル400は、pythonのTensorFlowバックエンドとともにKerasを使用して実装することができ、指定された場合を除き既定の訓練パラメータが使用された。いくつかの実施形態において、AdaGradオプティマイザは、1e-4 45の学習率、3エポックのpatienceで効率的なモデル収束のための早期停止前の1/10の線形学習率減衰、および2048のバッチサイズで使用することができる。いくつかの実施形態において、異なるモデルフレームワーク、ハイパーチューニングパラメータ、および/またはプログラミング言語が実装され得る。早期停止に対するpatienceは、9エポックに設定された。いくつかの実施形態において、モデル400は、それぞれ、8個および16個のV100 GPUならびに1 GPUあたり32GBのRAMを有するNVIDIA DGX1およびDGX2マシンを使用して訓練することができる。
【0074】
いくつかの実施形態において、モデル400は、ネットワークへの入力特徴として年齢および性別/ジェンダーを含むことができる、人口統計データ416などの電子健康記録(EHR)データポイントを追加的に受け取ることができ、性別は男性および女性の両方について2進値に符号化することができ、年齢は各12誘導安静状態ECGについて取得の日付に対応する連続数値としてキャストすることができる。いくつかの実施形態において、年齢グループ化0~9歳、10~19歳、20~29歳、または他のグループ化サイズなどの、他の表現が使用され得る。いくつかの実施形態において、人種、喫煙状況、身長、および/または体重などの他の人口統計データが含まれてもよい。いくつかの実施形態において、EHRデータポイントは、実験値、エコー測定、ICDコード、および/またはケアギャップを含むことができる。EHRデータポイント(たとえば、人口統計データ、実験値など)は、共通の場所においてモデル400に提供され得る。
【0075】
EHRデータポイント(たとえば、年齢および性別)は、64ユニットの隠れ層に供給され、他の分岐と連結され得る。いくつかの事例において、これらのEHR特徴は、標準12誘導ECGレポートから直接抽出され得る。いくつかの実施形態において、モデル400は、第1の分岐404、第2の分岐408、および第3の分岐412からの電圧データに基づきECG情報を生成することができる。いくつかの実施形態において、モデル400は、人口統計データ416に基づき人口統計情報を生成することができる。いくつかの実施形態において、人口統計情報は、年齢および性別を入力することによって生成することができ、これらは64ユニット隠れ層に入力された。人口統計情報は、ECG情報と連結され得、モデル400は、人口統計情報およびECG情報に基づきリスクスコア420を生成することができる。ECG情報を別々に生成された人口統計情報と連結することで、モデル400が第1の分岐404、第2の分岐408、および第3の分岐412からの電圧データ、さらには人口統計データ416を個別に広めることを可能にすることができ、これは電圧データおよび人口統計データ416を同じチャネルでモデルに提供する他のモデルに勝る性能を改善し得る。
【0076】
いくつかの実施形態において、モデル400は、訓練済みモデル136に含まれ得る。いくつかの実施形態において、リスクスコア420は、心電図データ(たとえば、誘導からの電圧データ)が生成されたときから所定の期間内に患者が病状を患う可能性を示すことができる。いくつかの実施形態において、病状は、AF、死亡率、ST上昇型心筋梗塞(STEMI)、急性冠症候群(ACS)、脳卒中、または本明細書において示されている他の病状であり得る。いくつかの実施形態において、モデル400は、ECGに基づきECGの取得に続く所定の時間期間において患者がAFを発症するリスクを予測するように訓練することができる。いくつかの実施形態において、時間期間は1日から30年の範囲であり得る。たとえば、時間期間は、1日、3カ月、6カ月、1年、5年、10年、および/または30年であってもよい。
【0077】
図4Bは、モデル424の例示的な別の実施形態である。具体的には、図4Aのモデル400の別のアーキテクチャが図示されている。いくつかの実施形態において、図4Bのモデル424は、単一の時間間隔にわたって生成されたECG電圧データを受け取ることができる。
【0078】
いくつかの実施形態において、モデル424は、ディープニューラルネットワークであり得る。いくつかの実施形態において、図4Bに示されているような、モデル424は、単一の時間間隔(たとえば、10秒)にわたって生成されたECG電圧入力データ428を受け取ることができる単一の分岐を含むことができる。図示されているように、モデル424は、8個の誘導を使用して10秒の時間間隔にわたって生成されたECG電圧入力データ428を受け取ることができる。いくつかの実施形態において、ECG電圧入力データ428は、10秒の期間にわたって収集された5000個のデータポイント、ならびに誘導I、II、V1、V2、V3、V4、V5、およびV6を含む8個の誘導を含むことができる。データポイントの数は、誘導をサンプリングするために使用されるサンプリングレートに基づき変化し得る(たとえば、500Hzのサンプリングレートは、10秒の時間期間にわたって5000個のデータポイントを結果としてもたらす)。ECG電圧入力データ428は、ECG波形に変換され得る。
【0079】
上で説明されているように、いくつかの実施形態において、ECG電圧入力データ428は、「完全」であり、時間間隔全体にわたって生成された各誘導(たとえば、誘導I、誘導V2、誘導V4、誘導V3、誘導V6、誘導II、誘導VI、および誘導V5)からの電圧データを含むことができる。したがって、いくつかの実施形態において、所定のECG構成は、0~10秒の時間間隔を有する誘導I、誘導V2、誘導V4、誘導V3、誘導V6、誘導II、誘導VI、および誘導V5を含むことができる。モデル424は、0~10秒の時間間隔を有する誘導I、誘導V2、誘導V4、誘導V3、誘導V6、誘導II、誘導VI、および誘導V5を含む所定のECG構成を有する訓練データを使用して訓練され得る。すべての誘導が同じ時間間隔を共有するときに、モデルは、単一の入力分岐432でECG電圧入力データ428を受け取ることができる。そうでなければ、モデルは、各一意的な時間間隔に対する分岐を含むことができ、図4Aに関連して上で説明されているように使用され得る。
【0080】
各ECG誘導に対するECG波形データは、1D畳み込みブロック436に提供されてよく、層定義パラメータ(n、f、s)は、それぞれ、ブロックに提示されるデータポイント入力の数、使用されるフィルタの数、およびフィルタサイズ/ウィンドウを指す。いくつかの実施形態において、ブロックに提示されるデータポイント入力の数は5000であってよく、使用されるフィルタの数は32であってよく、フィルタサイズ/ウィンドウは80であってよい。1D畳み込みブロック436は、入力されたECG波形データのダウンサンプリングされたバージョンを生成し、インセプションブロックに出力することができる。いくつかの実施形態において、第1の1D畳み込みブロック436は、2のストライド値を有することができる。
【0081】
モデル424は、インセプションブロック440を含むことができる。いくつかの実施形態において、インセプションブロック440は、多数のサブブロックを含むことができる。各サブブロック444は、多数の畳み込みブロックを含むことができる。たとえば、各サブブロック444は、第1の畳み込みブロック448A、第2の畳み込みブロック448B、および第3の畳み込みブロック448Cを含むことができる。図4Bに示されている例では、インセプションブロック440は、4つのサブブロックを順に含むことができ、各サブブロックの出力は、次のサブブロックへの入力となる。各インセプションサブブロックは、時系列情報のダウンサンプリングされたセットを生成し、出力することができる。各サブブロックは、関連する層定義パラメータを有するインセプションブロック440に示されるようにフィルタおよびフィルタウィンドウとともに構成され得る。
【0082】
いくつかの実施形態において、第1の畳み込みブロック448A、第2の畳み込みブロック448B、および第3の畳み込みブロック448Cは、1D畳み込みブロックであってよい。畳み込みブロック444A~Cの各々からの結果は、結果(たとえば、配列)を結合し、連結された結果をサブブロック444に含まれるMaxPool層456に入力することによって連結452され得る。MaxPool層456は、各移動1D畳み込みフィルタウィンドウに対する正値を抽出することができ、別の形式の正則化、モデルの汎化を可能にし、オーバーフィッティングを防止する。4つすべてのインセプションブロックプロセスの完了後、出力は最後の畳み込みブロック460に渡され、次にグローバル平均プーリング(GAP)層464に渡される。GAP層464の目的は、8つすべての独立したECG誘導からの最後のダウンサンプリングされたECG特徴を単一のダウンサンプリングされた配列に平均化することである。GAP層464の出力は、図4Aに関連しているような一連の緻密層コンポーネント424Cに渡すことができる(たとえば、緻密層コンポーネント400Cで)。さらに、最適化パラメータは、すべての層に対しても設定され得る。たとえば、すべての層パラメータは、モデルのオーバーフィッティングを防止するために、カーネル制約パラメータ(max_norm=3)を強制することができる。最初の畳み込みブロック436および最後の畳み込みブロック460は、n=1のストライドパラメータを利用することができるが、各インセプションブロック440は、n=2のストライドパラメータを利用することができる。ストライドパラメータは、ECG時系列にわたるすべての畳み込み層の移動を決定し、モデル性能に影響を及ぼし得る。いくつかの実施形態において、モデル424は、図4Aに関連して上で説明されているように年齢および性別などの補足データを連結することもでき、モデル424は、モデル400と同じ緻密層コンポーネントアーキテクチャを利用することができる。モデル424は、人口統計情報およびECG情報に基づきリスクスコア468を出力することができる。具体的には、緻密層コンポーネント424Cは、リスクスコア468を出力することができる。いくつかの実施形態において、リスクスコア420は、心電図データ(たとえば、誘導からの電圧データ)が生成されたときから所定の期間内に患者が病状を患う可能性を示すことができる。いくつかの実施形態において、病状は、AF、死亡率、ST上昇型心筋梗塞(STEMI)、急性冠症候群(ACS)、脳卒中、または本明細書において示されている他の病状であり得る。いくつかの実施形態において、モデル400は、ECGに基づきECGの取得に続く所定の時間期間において患者がAFを発症するリスクを予測するように訓練することができる。いくつかの実施形態において、時間期間は1日から30年の範囲であり得る。たとえば、時間期間は、1日、3カ月、6カ月、1年、5年、10年、および/または30年であってもよい。
【0083】
図5Aは、図4Aのモデル400を訓練しテストする例示的なフロー500である。医療データベースから280万個の標準12誘導ECGトレースが抽出された。知られている時間事象または最低1年のフォローアップを有するすべてのECGが、モデル訓練時に使用され、単一のランダムECGが、モデル評価に対してホールドアウトセット内の各患者について選択され、結果は図5Bにおいて「M0」と表記される。図5Bは、図5AによるECG選択のためのタイムラインを示している。トレースは、1984年から2019年6月までの間に取得された。追加の再訓練は、安静時12誘導ECGのみで実行され、1)≧18歳の患者において取得され、2)12誘導に対して2.5秒、3誘導(V1、II、V5)に対して10秒の完全な電圧-時間トレースを有し、3)著しいアーチファクトはなかった。これは431k人の患者からの160万個のECGに相当した。各ECG後に利用可能な中央値(四分位範囲)フォローアップは4.1年(1.5~8.5年)であった。各ECGは、次のように正常または異常と定義された。すなわち、1)正常ECGは、「正常ECG」または「正常限界内」のパターンラベルを有し、他の異常は識別されていないものとして定義され、2)他のすべてのECGは異常とみなされた。正常ECGは、患者に心臓病または他の医療診断がないことを意味するものではないことに留意されたい。すべてのECG電圧-時間トレースは、波形がゼロベースラインにセンタリングされたことを確実にするように前処理されたが、分散および大きさの特徴を維持した。
【0084】
AFの以前から存在しているか、または同時である文書を有する患者からのすべての研究は除外された。AF表現型は、12誘導ECGからの心房細動または心房粗動の臨床的に報告された発見、あるいは24年の時間期間にわたる2回以上の入院患者もしくは外来患者診察または施設電子健康記録(EHR)からの患者問題リストに適用された心房細動または心房粗動の診断として定義された。心臓手術後30日以内、または甲状腺機能亢進症の診断後1年以内に発生した新たな診断は除外された。適用可能な診断コードおよびAF表現型の盲検化チャートレビュー検証の詳細は、以下のTable 1(表1)に提示されている。心房粗動は、塞栓および脳卒中のリスクを含む、2つのリズムの臨床的帰結が類似していること、および2つのリズムがしばしば共存することから、心房細動とともにグループ化された。いくつかの実施形態において、モデルの訓練セット、検証セット、および/またはテストセットに対して異なるデータが選択され得る。
【0085】
Table 1(表1)は、AF表現型定義の盲検化チャートレビューの性能指標を示す。診断コード(ICD 9、10、およびEDG)および対応する記述は、AF表現型を定義する際に使用され得る。
【0086】
【表1】
【0087】
AFは、ベースラインECGから少なくとも1日後に発症し、その時点で患者に現在または以前のAFの既往歴がなかった場合に「初発」と考えられた。EHRデータは、打ち切りのためについ最近の適格診察日を識別するために使用された。適格診察は、ECG、心エコー検査、内科の外来患者来診、一般診療の外来患者来診、心臓病の外来患者来診、入院患者診察、または外科的処置に限定された。
【0088】
すべての実験について、データは訓練セット、内部検証セット、およびテストセットに分けられた。訓練セットおよびテストセットの構成は、以下に説明されているように実験によって変わり、しかしながら、すべての場合における内部検証セットは、早期停止によるオーバーフィッティングを回避するために訓練中に受信者動作特性曲線下の検証面積(AUROC)を追跡する訓練データの20%のサブセットとして定義された。早期停止に対するpatienceは9に設定され、訓練中に内部検証セットのAUROCに改善がなかったときに、3エポック後に学習率が減衰するように設定された。
【0089】
モデルは、2つのクラスを区別する能力を表すモデル性能のロバストメトリックである、AUROCを使用して評価された。AUROCは高ければ高いほど、性能が高いことを示唆する(完全な区別は1のAUROCで表され、0.5のAUROCは当てずっぽうと同等である)。複数のAUROCが1000個のインスタンスをブートストラップすること(置換を伴うランダムサンプリングと可変サンプリングを使用する)によって比較された。モデル間の差は、95% Clの差の絶対値が0より大きい場合に統計的に有意であるとみなされた。モデルはまた、再現率の増加による各閾値で達成された適合率の加重平均を計算することによって適合率再現率曲線下の面積(AUPRC)を平均適合率スコアとして使用して評価された。
【0090】
研究デザイン
図5Aに例示されているように、2つの別々のモデリング実験が実行された。
【0091】
DNN予測概念実証(POC)
15年間からのすべてのECGを使用することで、患者は、訓練セット(DOデータセット:適格研究の80%)とホールドアウトテストセット(20%)にランダムに分割され、セット間に患者の重複はなかった。モデルアーキテクチャの2つのバージョンが比較された(上で説明されているように)。1つはECG電圧対時間のトレースだけを入力とするものであり、もう1つはECGトレースさらには年齢および性別を入力とするものである。ホールドアウトテストセットから導出された結果は、モデル「M0」と表記された。比較のために、年齢および性別のみを入力として使用するブースト決定木ベースのモデルならびに公開されているCHARGE-AF 5年リスク予測モデルは、利用可能な必要なすべてのデータ(年齢、人種、身長、体重、収縮期および拡張期血圧、喫煙状況、降圧薬の使用、ならびに糖尿病、心不全および心筋梗塞の既往歴の有無を必要とする)を有する患者において実装された。いくつかの実施形態において、人種および/または喫煙状況は、使用され得ない。モデル一般化可能性をさらに評価するために、DOデータセット内で5分割交差検証(CV)が実行され、モデルM1~M5を導出した。各分割において訓練セットとテストセットとの間に患者の重複はなかった。知られている時間事象またはフォローアップを有するすべてのECGがモデル訓練時に使用され、患者に対する単一のランダムECGは、複数のECGを有する患者を過大評価しないようにすべてのモデル(M0およびM1~M5)においてテストセットから選択された。
【0092】
POCモデルにおいて各患者から単一のランダムECGを選択することからのバイアスがなかったことを実証するために、M0モデルの性能は、ECGトレースのみの入力を有するモデルに対してそれぞれ0.834±0.002および0.209±0.004の、ならびに年齢および性別を含むECGトレースの入力を有するモデルに対して0.845±0.002および0.220±0.004の、AUROCおよびAUPRCの平均および標準偏差で100回ランダムに選択を繰り返してもバイアスなく安定していると決定された。
【0093】
カプランマイヤー無発生生存分析も、DNNモデル予測によって層化された利用可能なフォローアップデータを含むPOCモデルに基づき実行され、これは最適動作点を使用して母集団を低リスク群と高リスク群とに層化した。M0モデルに対する最適動作点は、内部検証セットにおける最高の等性能線上のROC曲線上の点(陽性と陰性の誤判別に対する等しいコスト)として定義され、その閾値はテストセットに適用された。データは、AFの最近の診察または発症に基づき打ち切られた。正常ECGのサブセットと異常ECGのサブセットにおける低リスクと高リスクのDNNモデル予測分類に関してAFの発生までの時間を回帰するCox比例ハザードモデルがフィッティングされた。モデルM0およびM1~M5に対するすべてのデータならびに正常サブセットおよび異常サブセットについて、95%信頼区間(Cl)によるハザード比が報告された(95% Clの下限値と上限値を伴う平均値)。生存時間解析には、Pythonのlifelinesパッケージ(バージョン:0.24.1)が使用された。
【0094】
シミュレートされた展開モデル
現実世界の展開シナリオをシミュレートする--モデルを使用してインシデントAFを予測し、AF関連脳卒中を潜在的に防止する--ために、第2のモデリングアプローチが使用された。15年の期間からのすべてのECGが訓練セットとして使用された。5年の期間からのすべてのECGがテストセットとして使用された。
【0095】
そのようなモデルの臨床的実装における潜在的なバラツキを考慮するために(すなわち、利用可能な資源の範囲および望ましいスクリーニング特性に性能をマッチさせる)、性能は一定範囲の動作点にわたって評価された。動作点は、インシデントAFを発症する高リスクまたは低リスクを分類するために使用されたモデルリスクの閾値であり得る。たとえば、0.7の操作点は、0.7以上のモデルリスクスコアは高リスクとみなされ、0.7未満のリスクスコアは低リスクとみなされることを示すであろう。したがって、全体的なモデル性能は、複数の動作点性能を単一のメトリックに集約するAUROCおよびAUPRCスコアを使用して測定され得る。これらの点は、内部検証セット内のFbスコアの最大値(b=0.15、0.5、1、および2に対する)に基づき定義された。Fbスコアは、適合率および再現率の関数である。1のb値は、適合率と再現率の調和平均(たとえば、感度)であり、2の値は、再現率を強調し、0.15および0.5の値は、それに対応して再現率の影響を弱める。年齢によるAFの発生率の実質的変動が与えられた場合、操作点は年齢の分だけ変化した。各患者に対する最高のリスクが上述の5年の期間の間に取得されたECGがテストセットとして選択された。
【0096】
展開モデル予測を潜在的に防止可能な脳卒中事象に関連付けるために、急性虚血性脳卒中と診断された患者の内部登録が使用された。この分析に含まれる時間間隔を表す、8年の期間を通して、この登録には虚血性脳卒中の治療を受けた6,569人の患者が含まれていた。この登録は、テストセットECGの後に虚血性脳卒中を発症した展開モデルテストセット内の患者を識別するために使用された。脳卒中が潜在的に予防可能であるとみなされるのは、1)患者が所与の動作点に対するAFの高リスクを予測した脳卒中の前の少なくとも1つのECGを有していたこと、2)初発AFが脳卒中を発症する前の3日間、または脳卒中を発症してから365日後までに識別されたこと、および3)患者が脳卒中を発症した時点において抗凝固療法中ではなかったこと、という基準が満たされることであった。十分なフォローアップを可能にするために、図6Aに示されているようにECGの3年以内に発生した脳卒中が含まれた。図6Aは、脳卒中登録におけるすべての記録済み虚血性脳卒中のうち、潜在的に予防可能なAF関連脳卒中を識別する際に採用されるステップを含むフロー600である。図6Bは、図6AによるECG選択のためのタイムラインを示している。
【0097】
結果
ホールドアウトセット(M0)における1年以内の初発AFの予測に対するPOC DNNモデルのAUROCおよびAUPRCは、DNN-ECGに対してそれぞれ0.83、95% Cl[0.83, 0.84]および0.21[0.20, 0.22]、ならびにDNN-ECG-ASに対してそれぞれ0.85[0.84, 0.85]および0.22[0.21, 0.24]であった。図7Aは、受信者動作特性下の平均面積としてのモデル性能の棒グラフである。図7Bは、適合率再現率曲線下の平均面積としてのモデル性能の棒グラフである。バーは、5分割交差検証にわたる平均性能を表し、エラーバーは、標準偏差を示す。円は、ホールドアウトセットにおけるM0モデル性能を表す。3本のバーは、(i)年齢と性別を入力とするExtreme Gradient Boosting(XGB)モデル、(ii)ECG電圧-時間トレースを入力とするDNNモデル、ならびに(iii)ECG電圧-時間トレース、年齢、および性別を入力とするDNNモデルについてのモデル性能を表す。ホールドアウトセット内には、患者の65%に対するCHARGE-AFスコアを計算するためのデータが十分にあった。このサブセット内では、DNN-ECG-ASは、CHARGE-AFスコア(AUROC=0.79[0.78, 0.80]、AUPRC=0.12[0.11, 0.13])と比較して優れた性能(AUROC=0.84,[0.83, 0.85]、AUPRC=0.20[0.19, 0.22])を示した。図7Cは、受信者動作特性下の面積としてのモデル性能(概念実証モデル)の棒グラフであり、図7Dは、CHARGE-AFスコアを計算するために十分なデータを有する母集団の適合率再現率曲線の棒グラフである。バーは、5分割交差検証にわたる平均性能を表し、エラーバーは、95%信頼区間を示す。円は、ホールドアウトセットにおけるM0モデル性能を表す。3本のバーは、(i)年齢と性別を入力とするExtreme Gradient Boosting(XGB)モデル、(ii)デジタルECGトレースを入力とするDNNモデル、ならびに(iii)デジタルECGトレース、年齢、および性別を入力とするDNNモデルについてのモデル性能を表す。
【0098】
この性能は、年齢および性別のみを使用するXGBoostモデルと比較して有意な改善を示す(AUROC=0.78、AUPRC=0.13、両方のDNNモデルに対するブートストラップすることによる95% Clの差に対してp<0.05)。同様に、CHARGE-AFスコアが計算できたホールドアウトテストセットの患者の65%の範囲内(AUROC=0.78、AUPRC=0.13)においても、DNNは優れた性能を示した(AUROC=0.79、AUPRC=0.12、図7B参照)。
【0099】
図7A図7Dにおける3つのAF予測モデルに対するKM曲線およびHRは、対応するROC曲線上に動作点がマークされている図7E図7Gに例示されている。一般に、図7E図7Gは、ホールドアウトセットで評価された3つのモデル、すなわち、(1)年齢および性別のみ(青色)、(2)ECGトレースのみ(赤色)によるDNNモデル、および(3)ホールドアウトセット内のすべてのECGに対するECGトレース、年齢および性別(黒色)によるDNNモデルに対する亜母集団における受信者動作特性(ROC)、無発生生存曲線、およびハザード比を例示している。図7Eは、3つのモデルについて動作点がマークされているROC曲線を例示している。図7Fは、30年のフォローアップに対するAで示されている動作点に対する高リスク群および低リスク群の無発生生存曲線を例示している。図7Gは、年齢層、性別、および正常ECGラベルまたは異常ECGラベルによって定義される亜母集団における3つのモデルに対する95%信頼区間(Cl)によるハザード比(HR)のプロットを示している。モデル(1)についてAge<50に対してHRはないが、それは、その亜母集団に対するモデルによる初発AFについて高リスクと分類された被験者がいなかったからであることに留意されたい。
【0100】
DNNモデルは、DNN-ECGおよびDNN-ECG-ASにおいて、それぞれ、6.7[6.4, 7.0]および7.2[6.9, 7.6]の有意なHRを示した。年齢(10歳刻み)および性別(性別およびモデルとの相互作用は有意であった)について調整する場合、HRは依然として有意であった。すなわち、DNN-ECGモデルに対して、女性および男性においてそれぞれ3.7[3.6, 4.1]および3.1[2.7, 3.4]であり、図7FのDNN-ECG-ASモデルに対して、女性および男性においてそれぞれ3.8[3.6, 4.1]および2.9[2.5, 3.4]であった。未調整の比較については、DNNモデルは、性別、年齢層、およびECGタイプ(正常または異常)により定義されたすべてのサブセット内でXGBoostモデル(年齢および性別)よりも高いHRを有していた。
【0101】
図7Hは、<50歳、50~65歳、および>65歳の年齢層における男性に対するホールドアウトセット内のカプランマイヤー(KM)無発生生存曲線を示している。図7Iは、<50歳、50~65歳、および>65歳の年齢層における女性に対するホールドアウトセット内のカプランマイヤー(KM)無発生生存曲線を示している。
【0102】
図7Jは、<50歳、50~65歳、および>65歳の年齢層における男性に対する初発AFについてモデル(ECGトレース、年齢および性別で訓練されたモデルM0)予測された低リスク群および高リスク群に対するKM曲線を示している。図7Kは、<50歳、50~65歳、および>65歳の年齢層における女性に対する初発AFのモデル予測された低リスク群および高リスク群に対するKM曲線を示している。
【0103】
図7Hおよび図7Iは、それぞれ男性と女性における<50歳、50~65歳、および>65歳の年齢層に対するKM曲線を示している。予想されるように、男女とも、生存曲線は各年齢層で実質的に異なっている。しかしながら、図7Jおよび図7Kは、各年齢層において、DNNモデルが、男性および女性に対してそれぞれ初発AFの発症に対する高リスク集団と低リスク集団とを区別する能力を保持していることを示している。具体的には、図7Jおよび図7Kは、患者のコホートにおいて生じるAFの経時的な発生率を示しており、時刻ゼロにおいて、誰もAFを有さず(100%無発生)、時刻Nにおいて、AFインシデントを有する患者が何人いたかを示している。モデルは、高齢の患者は、典型的には、コホート内の若い患者よりも経時的にAFの高い発生率を予測するので、推進特性として年齢に敏感であることを示している。年齢および性別だけに対するDNNモデルの優位性は、若い年齢層で最も明白であり、58歳未満の患者はXGBoostモデルによって高リスクと予測されなかったことに留意されたい。
【0104】
図8Aは、すべてのデータ(黒色円)、正常ECGサブセット(青色円)、および異常ECGサブセット(赤色円)について動作点がマークされているROC曲線のグラフである。図8Bは、図8Aの動作点における正常ECGサブセットおよび異常ECGサブセットにおける予測された低リスク群および高リスク群のKM曲線のグラフである。斜線部分は、95%信頼区間である。グラフの下の表は、ホールドアウトテストセットにおける所与の時間間隔に対する潜在的に危険な集団を示している。さらに、DNNは、臨床的に「正常」と報告されたECGのサブグループ内でも、異常ECGと同様に高い性能を維持した(図7図8A)。これらの結果は、MOへの交差検証モデル(M1~M5)の匹敵する性能およびホールドアウトセット内でのランダムサンプリングの繰り返し反復によるMOのメトリクスの安定性に基づき一般化可能およびロバストであることが観察された。最後に、モデルは、ECG後6カ月でAFを発症したデータサブセット(これらは真のインシデント症例、すなわちECG後1日から6カ月の間に急速に発現した潜在的に発作性の症例が除外されたことを表す)においても高い性能を維持し、AUROCは0.83であった(図9)。図9は、ECG後のインシデントAFまでの時間の定義の関数としてのモデル性能のグラフである。y軸は、受信者動作特性曲線下の面積(AUROC)、x軸は、インシデントAFを定義することに対する異なる閾値、すなわち、x軸上の「2」に対応する症例はベースラインECGから少なくとも2カ月後にAFを発症した人(ECG後最初の2カ月以内にAFを発症した者は除外された)であることを表している。洞律動ECG後1~31日の間に専ら現れるAFに対する0.87のAUROCが計算され、洞律動からの発作性AFの識別に対する他のものの知見と一致した。
【0105】
DNN 1年AFリスク予測は、長期的AFハザードと関連している
DNN予測(インシデントAFに対する低リスク対高リスク)の関数としてのAFの生存なしが図8Bに示されている。高リスクの1年間無発生AFとして予測された患者の割合は高かったが、高リスク予測は、次の30年間にわたるAFに対する長期的なハザードの有意な増大に関連していた。具体的には、ハザード比は、1年以内のAFの発症に対するそれらの予測された高リスク対低リスクを比較したときにすべてのECGにおいて7.2(95% Cl:6.9~7.56)、正常ECGにおいて8.2(7.2~9.3)、および異常ECGにおいて6.2(5.9~6.5)であった。さらに、低リスクおよび高リスクとして識別された2つのグループの中央値無発生生存期間は、正常ECGについてはそれぞれ13年および30年超、ならびに異常ECGについてはそれぞれ10年および28年であった。
【0106】
初発AFの予測で、将来の脳卒中の予防を可能にすることができる
展開実験において、2010年以前のデータで訓練され、2010年~2014年のデータでテストされたモデルは、1年間インシデントAF予測について全体的に高い性能を示し、AUROCとAUPRCはそれぞれ0.83および0.17であった。Table 2(表2)は、最大F0.15、F0.5、F1、およびF2スコアによって決まる特定の動作点における(すなわち、再現率、たとえば感度に重点を置くことを次第に高めながら)追加のモデル性能特性をまとめたものである(図10)。図10は、FbスコアまたはYouden indexを使用してシミュレートされた展開モデルにおける内部検証セット上の操作点の選択のグラフである。これらの異なる点の結果として、集団全体の1、4、12、および20%が高リスクのフラグが付けられ、これは28、21、15、および12%の陽性適中率に対応し、ECG後3年以内の4、17、45、および62%の脳卒中はそれぞれ潜在的に予防可能であった。これらの事例の各々において、1年で1つの新しいAF症例を見つけるためにスクリーニングするのに必要な数(NNS)は、低かった(4~9)。
【0107】
Table 2(表2)は、独立した内部検証セットで定義された4つの異なる動作点に対する展開シナリオにおいて1年間のインシデント心房細動(AF)を予測するためのECGならびに年齢および性別により訓練されたモデルの性能の要約である。
【0108】
【表2】
【0109】
モデルとは無関係に、181,969人中3,497人(1.9%)の患者が、展開テストセット内のECGの後に脳卒中を有することが観察された。このうち、96人、250人、および375人の患者は、それぞれ、ECG後1年、2年、および3年以内に脳卒中を有し、脳卒中後-3日から365日の間に新しいAFの診断を受けていた。それらの96人、250人、および375人の患者のうち、84人、229人、および342人は脳卒中発生時に抗凝固薬を服用しておらず、潜在的に予防可能なAF関連脳卒中を示している(図6A)。
【0110】
図11は、ECG後1年、2年、および3年以内に発症したAF関連脳卒中を潜在的に防止するモデルの感度を、インシデントAFを発症する高いリスクがあるとしてターゲットにされた集団のパーセンテージの関数として示すグラフである。灰色の点線は、Table 2(表2)からの対応する最適な動作閾値を表している。図11は、脳卒中予防を目標として初発AFについてその後スクリーニングされ得る高リスク集団を選択するためのモデルの潜在的可能性を示している。3つの結論が、図11から導き出され得る。1つ目は、潜在的に予防可能なAF関連脳卒中を識別する能力は、新しいAFを識別する能力に比例するということである。2つ目は、実質的な量のインシデントAFが、集団の比較的小さなパーセンテージのスクリーニングによって識別され得ることである。3つ目は、可変動作点が、様々な優先順位に合わせて手直しされ得る適合率と再現率との間のトレードオフの関係を許容することである。
【0111】
展開テストセット(2010~2014)内のECG後の虚血性脳卒中を有する181,969人のうち3,497人(1.9%)の患者が観察された。これらのうち、96人、250人、および375人の患者は、それぞれ、ECG後1年、2年、および3年以内に脳卒中を有し、脳卒中後365日以内にAFの新しい診断を受けていた。それら375人の患者のうち、342人は脳卒中発症時に抗凝固薬を服用しておらず、31人はAF以外の理由で抗凝固剤を服用しており、2人の患者は記録が不十分であり脳卒中発症時に抗凝固薬で治療されていたかどうかを決定することができなかった。したがって、これら375人は、ECGの時点でAF関連脳卒中のリスクを有するコホートを代表している。
【0112】
この展開テストセットにモデル(2010年以前のデータで訓練された)を適用したところ、1年で初発AFの予測に対する良好な性能(AUROC = 0.83、AUPRC = 0.17)が観察された。F2スコアで決定される動作点を使用することで、感度は69%、特異度は81%、1年後の初発AFを1例見つけるためにスクリーニングするのに必要な数(NNS)は9であった。ECG後3年以内にAF関連脳卒中を有した患者の62%(375人中231人)が初発AFに対する高リスクを予測された(図11)。高リスク予測から3年以内にAF関連脳卒中を発症した1人の患者のAFを識別するためのNNSは162であった。Table 3(表3)は、展開シナリオにおける1年初発AFを予測するためのDNNモデル(年齢および性別による)、およびECGから3年以内にAF関連脳卒中に対するリスクを有する患者を識別する潜在的可能性の性能概要である。結果は、完全なテストセット、さらには人口統計、臨床環境、または併存疾患特性が異なる指定された集団サブセットを使用したモデル予測に基づいて示されている。Table 3(表3)は、年齢、性別、人種、併存疾患、臨床環境、CHA2DS2VAScスコアによって定義されたサブグループにおける良好なテスト特性を示している。
【0113】
【表3】
【0114】
本開示は、12誘導安静時ECGデータで訓練され、AFの既往歴のない患者において、高い性能(AUROC=0.85)で1年以内のインシデントAFを予測できるディープニューラルネットワークについて説明している。さらに、このDNNは、同じデータセット内の臨床モデル(CHARGE-AF)ならびに年齢および性別を使用した機械学習モデルの両方を凌駕することが実証された。他のモデルの報告されている性能と比較してそのモデルの性能の優位性が指摘されている。CHARGE-AF(AUROC=0.77)、ARIC(AUROC=0.78)、およびFramingham(AUROC=0.78)である。また、モデル400の予測間隔が短ければ短いほど(5~10年と比較して1年)、より実施可能な予測が可能であり、この予測は今後30年間にわたり有意な予後の潜在的可能性を保持していることも指摘される。最後に、スクリーニングの対象となり得る高リスク集団を識別すること(たとえば、ウェアラブルデバイスまたは連続モニターを用いて)で、AF関連脳卒中の著しい割合が予防できる可能性があることをデータは示している。
【0115】
全脳卒中のうちの25%超がAFに起因するものと考えられており、AFに起因する脳卒中の~20%は、以前にAFと診断されていない個人に生じている。5年間にわたって取得されたECGにモデル400を適用し、予測された高リスクECGを潜在的に予防可能であるとみなされた将来の虚血性脳卒中発生率を相互参照することによって現実世界のシナリオがシミュレートされた(AFの同時/後続識別および抗凝固療法の現行使用なし)。そのようなスクリーニングイニシアチブの実装は異なる医療環境にわたる範囲の点で異なるという予想に基づき異なるモデル動作点の範囲が考慮された。これらの違いは、スクリーニングの総数対識別されたAFの割合および潜在的に予防される脳卒中の数について様々な選好に反映されることになる。
【0116】
この性能スペクトルの一端では、集団の上位1%のみが高リスクとして識別され、1年AFの検出に対して28%に近い陽性適中率が観察された(AFに対するNNS=4)。この適合率は、ベースラインからの0年から3年までの間に発生したインシデント脳卒中に対する120~361のスクリーニング量(NNS)に変換された。しかしながら、このより低いスクリーニング量は、予防可能な脳卒中のより低い全再現率(すなわち、感度)でオフセットされた(ECG後3年以内の脳卒中に対して4%)。集団の21%がAFを発症することに対して高リスクと識別されたスペクトルの他端では、予防可能な脳卒中再現率は、実質的に改善されたが(ECG後3年以内の脳卒中に対して62%)、AF(NNS=9)および脳卒中(それぞれ3年または1年の発生率に対してNNS=162~542)に対してスクリーニング量のかなりの増大を代償とした。スクリーニング量に対するこれらの数は、マンモグラフィ(60~69歳の1人の乳癌死亡を予防するNNS476)、前立腺特異抗原(前立腺癌からの1人の死亡を予防するNNS1410)、およびコレステロール(心臓血管疾患からの1人の死亡を予防するNNS418)を含む他の適切に受け入れられているスクリーニング検査と比べても勝るとも劣らない。
【0117】
モデル400は、すべてのECGが評価され、高リスクの研究がフォローアップおよび監視についてフラグが付けられるようにルーチンスクリーニングに組み入れることができる。そのような強化された監視は、組織的脈拍触診、組織的ECGスクリーニング、1回または複数回着用される連続パッチモニター、Kardia mobileなどのデバイスによる間欠的ホームスクリーニング、またはApple Watchなどのウェアラブルモニターを含む、多くの異なる形態を取り得る。これらの方法は分離してAFのスクリーニングに使用することも可能であるが、DNN予測モデルと併用することで、一般集団、特に若い年齢層におけるAFの全体的に低い発生率に関連付けられた課題を克服するのに役立ち得る。年齢は、一般的に、AFスクリーニング戦略をガイドする際の支配的危険因子と考えられているが、この研究では、すべての新しいAF(ECGから1年以内)の38%およびすべての潜在的に予防可能な脳卒中(ECGから3年以内)の36%が70歳未満で発生した。
【0118】
図12は、所与の年齢閾値未満の患者の関数としての集団におけるすべてのインシデントAF(ECG後1年以内)および脳卒中(ECG後3年以内)のパーセントのグラフである。モデル400は、18歳よりも上のすべての患者において使用することができ、これは年齢および性別だけを使用するモデルに勝っていた。
【0119】
モデル400は、発作性AFを検出し、初発AFを予測し得る。これは、インシデントAFを予測する能力なしの発作性AFの識別にのみ焦点を当てた他の技術とは異なるものである。上で指摘されているように、これらの結果は、モデル400が両方を行っていることを示す。DNNモデルが真に初発AFを予測できるというわれわれの主張を裏付ける証拠の1つは、図7H図7Kにおいて指摘されているようにインデックスECG後30年までのカプランマイヤー曲線の連続する分離である。
【0120】
全脳卒中のうちの25%超がAFに起因するものと考えられており、AFに起因する脳卒中の~20%は、以前にAFと診断されていない個人に生じている。AFが検出された後、抗凝固療法は脳卒中の予防に有効であるが、AFに対するスクリーニングは、AFの発作性の特質に起因し、またしばしば無症状であるという事実から、困難である。パッチモニター、ウェアラブル、および他のデバイスを伴うスクリーニング戦略は、AFの検出に使用され得るが、AFの高い有病率を有する集団において最も効果的である。この予測モデルを開発する際の基本的な目標は、脳卒中になる前にAFを見つけることを目標として追加の監視のために選択できる高リスク集団を識別することである。
【0121】
5年間にわたって大規模地域健康システム内で取得されたすべてのECGにわれわれのモデルを適用することにより、また予測された高リスクECGを潜在的に予防可能であるとみなされた将来の虚血性脳卒中発生率と相互参照することによって現実世界のシナリオがシミュレートされた(AFの同時/後続識別)。AF関連脳卒中を患っている患者のうちの高い割合(62%)の患者がAFに対する高リスクとして正しく予測されたことが判明した。AF関連脳卒中を後で患った1人の患者においてAFを識別するNNSは162であった。これは、マンモグラフィ(60~69歳の1人の乳癌死亡を予防するNNS476)、前立腺特異抗原(前立腺癌からの1人の死亡を予防するNNS1410)、およびコレステロール(心臓血管疾患からの1人の死亡を予防するNNS418)を含む他の適切に受け入れられているスクリーニング検査と比べても勝るとも劣らない。AFを患っているすべての患者が脳卒中のリスクが高いわけではなく、抗凝固療法の必要性を決定するためにCHA2DS2VAScなどのスコアリングシステムが一般的に使用される。2以上のCHA2DS2VAScスコアは、抗凝固薬を開始するために最も一般的に使用されるキューポイントであり、Table 3(表3)は、そのサブグループ内でモデルがうまく働き、AFの1つの新しい症例を見つけるためにNNSが8であることを示している。また、Table 3(表3)は、AF関連脳卒中を後で患うAFに対する高リスクが予測された患者のうち92%が、2以上のCHA2DS2VAScスコアを有しており、抗凝固療法に対して潜在的に適格であったことを示している。
【0122】
図13は、モデルを使用してリスクスコアを生成するための例示的なプロセス1300である。いくつかの実施形態において、モデルは、図4Aのモデル400であってよい。いくつかの実施形態において、モデルは、図4Bのモデル424であってよい。リスクスコアは、患者が所定の期間(たとえば、6カ月、1年、10年など)内に病状を患い、および/または発症するかどうかを示すことができる。いくつかの実施形態において、プロセス1300は、図1のECG分析アプリケーション132に含まれ得る。いくつかの実施形態において、プロセス1300は、1つまたは複数のメモリまたは他の非一時的コンピュータ可読媒体上のコンピュータ可読命令として実装されてよく、また1つまたは複数のメモリまたは媒体と通信する1つまたは複数のプロセッサによって実行され得る。いくつかの実施形態において、プロセス1300は、メモリ220および/またはメモリ240上のコンピュータ可読命令として実装され、プロセッサ204および/またはプロセッサ224によって実行され得る。
【0123】
1304で、プロセス1300は、ECGデータを含む患者データを受信することができる。ECGデータは、患者に関連付けることができる。いくつかの実施形態において、ECGデータは、ECG電圧入力データ300を含むことができる。いくつかの実施形態において、ECGデータは、複数の誘導および時間間隔を含む心電図構成に関連付けられ得る。ECGデータは、複数の誘導に含まれる各誘導について、時間間隔の少なくとも一部に関連付けられている電圧データを含むことができる。いくつかの実施形態において、ECGデータは、誘導Iおよび時間間隔の第1の部分に関連付けられている第1の電圧データと、誘導V2および時間間隔の第2の部分に関連付けられている第2の電圧データと、誘導V4および時間間隔の第3の部分に関連付けられている第3の電圧データと、誘導V3および時間間隔の第2の部分に関連付けられている第4の電圧データと、誘導V6および時間間隔の第3の部分に関連付けられている第5の電圧データと、誘導IIおよび時間間隔の第1の部分に関連付けられている第6の電圧データと、誘導IIおよび時間間隔の第2の部分に関連付けられている第7の電圧データと、誘導IIおよび時間間隔の第3の部分に関連付けられている第8の電圧データと、誘導VIおよび時間間隔の第1の部分に関連付けられている第9の電圧データと、誘導VIおよび時間間隔の第2の部分に関連付けられている第10の電圧データと、誘導VIおよび時間間隔の第3の部分に関連付けられている第11の電圧データと、誘導V5および時間間隔の第1の部分に関連付けられている第12の電圧データと、誘導V5および時間間隔の第2の部分に関連付けられている第13の電圧データと、誘導V5および時間間隔の第3の部分に関連付けられている第14の電圧データとを含み得る。
【0124】
ECGデータは、時刻(t)=0(データ取得の開始)からt=5秒までに取得される誘導I、II、V1、およびV5を含む第1の分岐(たとえば、「分岐1」)と、t=5からt=7.5秒までの誘導V1、V2、V3、II、およびV5を含む第2の分岐(たとえば、「分岐2」)と、t=7.5からt=10秒までの誘導V4、V5、V6、II、およびV1を含む第3の分岐(たとえば、「分岐3」)とを含むことができ、これは図3に示されているとおりである。いくつかの実施形態において、プロセス1300は、患者に関連付けられている人口統計データおよび/または他の患者情報を受け取るものとしてよい。人口統計データは、たとえば電子健康記録からの患者の年齢値および性別値または追加の変数(たとえば、人種、体重、身長、喫煙状況など)を含むことができる。いくつかの実施形態において、プロセス1300は、1つまたは複数のEHRデータポイントを受け取ることができる。いくつかの実施形態において、EHRデータポイントは、実験値(LDL/HDL/総コレステロールなどの血中コレステロール測定値、ヘモグロビン/ヘマトクリット/白血球数などの血球数、グルコース/ナトリウム/カリウム/肝臓および腎臓機能ラボなどの血液化学物質、ならびにトロポニンおよびナトリウム利尿ペプチドなどの追加の心臓血管マーカー)、バイタルサイン(血圧、心拍数、呼吸数、酸素飽和度)、イメージングメトリクス(心臓駆出分、心室容積、心筋厚、心臓弁機能など)、患者診断(糖尿病、慢性腎臓病、先天的心臓欠陥、癌など)、治療(手技、投薬、心臓リハビリテーションなどのサービスの照会、食事カウンセリング、など)、エコー測定、ICDコード、および/またはケアギャップを含むことができる。
【0125】
いくつかの実施形態において、ECGデータは、単一の時間間隔(たとえば、10秒)にわたって生成され得る。いくつかの実施形態において、ECGデータは、ECG電圧入力データ428を含むことができる。いくつかの実施形態において、ECG電圧入力データは、10秒の期間にわたって収集された5000個のデータポイント、ならびに誘導I、II、V1、V2、V3、V4、V5、およびV6を含む8個の誘導を含むことができる。
【0126】
いくつかの実施形態において、ECGデータは、500Hzで元々サンプリングされた誘導を含むことができる。いくつかの実施形態において、ECGデータは、250Hzで元々サンプリングされ、500Hzに線形補間された誘導を含むことができる。いくつかの実施形態において、ECGデータは、1000Hzで元々サンプリングされ、500Hzにダウンサンプリングされた誘導を含むことができる。したがって、様々なECGシステムおよび/またはサンプリング環境が、同じ訓練済みモデルとともに使用され得る。
【0127】
1308において、プロセスは、患者データの少なくとも一部を訓練済みモデルに提供することができる。いくつかの実施形態において、訓練済みモデルは、モデル400であってよい。いくつかの実施形態において、プロセス1308は、ECGデータをモデルに提供することができる。いくつかの実施形態において、プロセス1300は、第1の電圧データ、第6の電圧データ、第9の電圧データ、および第12の電圧データを第1のチャネルに提供することと、第2の電圧データ、第4の電圧データ、第7の電圧データ、第10の電圧データ、および第13の電圧データを第2のチャネルに提供することと、第3の電圧データ、第5の電圧データ、第8の電圧データ、第11の電圧データ、および第14の電圧データを第3のチャネルに提供することとを含み得る。いくつかの実施形態において、ECGデータは、時間間隔全体にわたるすべての誘導に対する電圧データを含むことができ、プロセス1300は、電圧データを訓練済みモデルに含まれる単一チャネルに提供することを含むことができる。いくつかの実施形態において、プロセス1308は、ECGデータおよび人口統計データおよび/またはEHRデータポイントをモデルに提供することができる。
【0128】
1312では、プロセス1300は、モデルからリスクスコアを受け取ることができる。いくつかの実施形態において、リスクスコアは、心電図データが生成されたときから所定の時間期間内に患者がAFを発症する予測リスクを示すAFリスクスコアであってよい。いくつかの実施形態において、所定の時間期間は、3カ月、6カ月、1年、5年、10年、30年、または6カ月から30年の範囲から選択される他の任意の時間期間であってよい。いくつかの実施形態において、所定の時間期間は、少なくとも3カ月(たとえば、3カ月、6カ月、など)であり得る。いくつかの実施形態において、所定の時間期間は、少なくとも6カ月(たとえば、6カ月、1年、など)であり得る。いくつかの実施形態において、所定の時間期間は、少なくとも1年(たとえば、1年、5年、など)であり得る。いくつかの実施形態において、所定の時間期間は、少なくとも5年(たとえば、5年、10年、など)であり得る。
【0129】
1316において、プロセスは、リスクスコアをメモリ(たとえば、メモリ220および/もしくはメモリ240)またはディスプレイ(たとえば、ディスプレイ116、ディスプレイ208、および/もしくはディスプレイ228)のうちの少なくとも1つに出力することができる。いくつかの実施形態において、ディスプレイは、開業医または医療管理者から見えるところにあるものとしてよい。いくつかの実施形態において、プロセス1300は、リスクスコアに基づきレポートを生成し、出力することができる。いくつかの実施形態において、レポートは、生のリスクスコアおよび/またはリスクスコアに関係する画像を含むことができる。いくつかの実施形態において、プロセス1300は、リスクスコアが病状に関連付けられた所定の閾値より高いと決定することができる(たとえば、閾値より高いリスクスコアは、患者が所定の時間期間内に病状を患うことを示すことができる)。次いで、プロセス1300は、リスクスコアが所定の閾値より高いという決定に基づきレポートを生成することができる。いくつかの実施形態において、リスクスコアが所定の閾値より高いとの決定に応答して、プロセス1300は、病状に対する治療、病状の原因、および/または病状に関する他の臨床情報についての情報(たとえば、テキスト)ならびにソースへのリンク(たとえば、1または複数のハイパーリンク)を含むようにレポートを生成することができる。いくつかの実施形態において、プロセス1300は、標準化されたJavaScript Object Notation(JSON)フォーマットなどの標準化フォーマットで記憶されている中間結果からレポートを生成することができる。標準化フォーマットは、また、医療提供者の電子健康記録システムへの変換などのために、フォーマット変換ソフトウェアを使用して医療提供者に提示できるように異なるフォーマットに変換され得る。いくつかの実施形態において、プロセス1300は、検査名、患者の性別、患者の生年月日、患者名、施設/医師名、および/または医療記録番号を含むようにレポートを生成することができる。いくつかの実施形態において、プロセス1300は、ECG波形を含むようにレポートを生成することができ、これは、たとえば、ECGによって生成された元の波形データの再表示、または元の波形との類似性
について検証された再描画波形であってよい。いくつかの実施形態において、プロセス1300は、治療推奨または監視推奨などの推奨を含むようにレポートを生成することができる。たとえば、レポートは、患者が未診断の疾患を検出する上で重要な一歩前進である追加の心臓モニタリングの対象とすべきであるという推奨を含むことができる。他の例として、レポートは、AFまたは他の病状を軽減することが示されているライフスタイル修正(たとえば、減量、禁酒など)、未診断のAFまたは睡眠時無呼吸症候群のような他の病状誘因のスクリーニング、より頻繁なフォローアップの実施、将来のECGの実施、脈触による心拍の評価、あるいは遠隔心臓モニターの処方に対する1つまたは複数の推奨を含んでもよい。医師は、他の症状および臨床学的因子と組み合わせたデバイスからの情報に基づき、これらの処置のいずれか、もしくはいずれも行わず、または他の適切な患者管理戦略を進めるものとしてよい。次いで、プロセス1300は終了することができる。
【0130】
12誘導心電図トレースから直接インシデント心房細動を予測するためのディープニューラルネットワーク
次に、臨床的に取得されたECG上で訓練されたニューラルネットワークの例が説明される。270万の臨床的に取得された12誘導ECGから、Afibのない110万個のECG(237,060人の患者からの)が抽出された。将来のインシデントAfibの有無が、その後のECG研究および主治医によって作製された問題リスト診断を介して抽出されたECGの各々について決定された。インシデントAfibの有病率は、集団全体で7%であり、臨床的に正常と解釈されたECGを有する61,142人の患者のサブセットでは3%であった。
【0131】
多クラス深層畳み込みニューラルネットワークは、5分割交差検証を使用して、ECG 1つあたり15トレースを入力として、1年インシデントAfib(たとえば、目標出力変数)を予測するように訓練された。モデル性能を受信者動作特性曲線下の面積(AUC)で評価し、予測群の無発生曲線にCox比例ハザード分析を実行した。それに加えて、日和見的集団スクリーニングの文脈においてモデル性能を評価するために、スクリーニングされるべき最高のモデル予測リスクを有する患者の数の関数としてモデルの陽性適中率(PPV)を推定した。
【0132】
図14は、利用可能なフォローアップによる予測Afib群および予測無Afib群(尤度閾値=0.5)に対する無発生割合曲線を示すグラフである。予測モデルの平均AUCは、0.75±0.02であった。単位リスクスコア増大は、1年以内にAFを発症するオッズの45%増加に相当した(オッズ比:1.45[95%信頼区間(Cl):1.15~1.66])。「正常」と解釈されたECGのサブセット(たとえば、医師が目視で不整脈を識別できなかった)においても、AUCは0.72±0.02であった。
【0133】
図15は、将来のAfib予測システムのすべての動作点にわたって最高のリスクおよび陽性適中率を有する上位%患者を示すグラフである。潜在的な集団スクリーニングの環境において、解釈性能は、リスクのある最も高い1%をスクリーニングするための0.3のPPVに対応する。
【0134】
ディープニューラルネットワークは臨床的に正常と解釈されるときでもECG信号から直接的に1年死亡率を予測することができる
34年間にわたって397,840人の患者から収集された1,775,926の12誘導安静時ECG、さらには年齢、性別、および生存状態が、単一の医療施設の電子健康記録から抽出された。15個の電圧-時間250~500Hzトレース(3つの標準的な「長い」10秒取得および12個の「短い」2.5秒取得)が、「ECG尺度」(30個の診断パターンと9個の標準的測定)とともに各ECGから抽出された。ディープニューラルネットワークは、ECGトレースから直接的に1年死亡率(たとえば、変数出力)を予測するために訓練された。異なる変数入力を使用する5分割交差検証されたモデルおよびCox比例ハザード生存分析が予測された群に対して実行され、それにより性能を比較した。良好な予測精度が、医師によって「正常」と呼ばれる297,548個のECGのサブセット内で識別された。3人の心臓内科医の盲検調査が実行され、それにより、ECGデータ内の死亡リスクを示す特徴を見ることができるかどうかを決定した。
【0135】
図16は、追加特徴として年齢および性別を有する場合と有しない場合のECG測定およびECGトレースによる1年後死亡率を予測する死亡率予測モデルまたはシステム性能の棒グラフである。
【0136】
図17は、ECG後1年を過ぎた正常ECGサブセットおよび異常ECGサブセットにおける予測された生存群および死亡群に対する平均KM曲線を示すグラフである。
【0137】
15個のトレースだけで訓練されたモデルは、0.83の平均AUCをもたらしたが、これは年齢と性別とを追加した後0.85に改善された。このモデルは、39個のECG測定値から作成された別の非線型モデルよりも優れていた(それぞれ年齢と性別を含まない場合および含む場合にAUC=0.77および0.81、p<0.001、図16を参照)。「正常」ECG内でも、モデル性能は高いままであり(AUC=0.84)、ECG後1年を過ぎたハザード比は6.6(p<0.005)であった(図17を参照)。盲検調査において、モデルによって捉えられたパターンは、ラベル付き真陽性(死亡)および真陰性(生存)が示された後でも、心臓内科医には視覚的に明白ではなかった。
【0138】
いくつかの実施形態において、訓練済みモデルは、ECG分析アプリケーション132に含めることができ、図13のプロセス1300に類似するプロセスを使用して1年死亡率を予測するために使用することができる。
【0139】
多くのECGマシンは、電圧-時間トレースから「ポータブルドキュメントフォーマット」(すなわち、PDF)を作成し、これは、次いで、医療記録内に保存され得る。基礎となる電圧データは、最初にPDFをXMLに変換し、次いで電圧-時間トレースの各々を構成する基礎となるデータポイントに対しXMLファイルを解析することによってこれらのPDFから抽出され得る。XMLは、また、患者の年齢、性別、ECGマシンによって出力される9つの連続的数値測定値(QRS持続時間、QT、QTC、PR間隔、心拍数、平均RR間隔、ならびにP、Q、およびT波軸)、および30個のカテゴリー別ECGパターンを決定するために解析されるものとしてよく、これは正常、左脚ブロック、不完全左脚ブロック、右脚ブロック、不完全右脚ブロック、心房細動、心房粗動、急性心筋梗塞、左室肥大、心室性期外収縮、心房性期外収縮、第1度ブロック、第2度ブロック、束ブロック、洞性徐脈、他の徐脈、洞性頻脈、心室性頻脈、上室性頻拍症、QT延長、ペースメーカー、虚血、低QRS電圧、房室内ブロック、前梗塞、非特異的t波異常、非特異的ST波異常、左軸偏位、右軸偏位、および早期再分極を含み、これらは医師によって診断され得る。PDFからSVGフォーマットへの変換、およびSVGから解析済みデータポイントへの変換のためのコード例は以下の付録Aに提示されている。
【0140】
ECGを読み取る方法からの包含/除外および出力
いくつかの実施形態において、予測モデルは、ECG PDF、PDFから抽出された変数、および1年死亡率などの目標とする出力変数などの一連の入力変数を使用して訓練され得る。モデル訓練段階では、ラベル付けされたデータ(入力および出力の両方が知られている)が提供され、これはモデルが出力変数を予測する最善の方法を学習することを可能にする。モデルが訓練された後、入力変数のみが知られており、出力が注目する予測ターゲットを含み得る状況において、展開され得る。注目する例示的なターゲットは、現在のECGを与えられた場合の1年死亡のリスクを含み得る。
【0141】
モデル訓練のために、一連の12誘導ECGトレースは、施設の臨床データベースから抽出され得る。そのようなデータベースは、数カ月、数年、または数十年の時間期間を含む、一定の時間期間の取得されたトレースなどの、260万を超えるトレースを含み得る。一例では、有意なアーチファクトを有さず、少なくとも1年のフォローアップまたは1年以内の死亡に関連付けられた、12誘導で2.5秒、3誘導(V1、II、V5)で10秒の電圧-時間トレースを有する安静時12誘導ECGが抽出され得る。アーチファクトは、ECGの時点においてECGソフトウェアによって識別されたものを含むものとしてよく、たとえば、「technically limited」、「motion/baseline artifact」、「Warning: interpretation of this ECG, although attempted, may be adversely affected by data quality」、「Acquisition hardware fault prevents reliable analysis」、「Suggest repeat tracing」、「chest leads probably not well placed」、「electrical/somatic/power line interference」、または「Defective ECG」を含むECG出力である。抽出は、15個の電圧-時間トレース(3個の10秒の誘導および12個の2.5秒の誘導)をさらに含み得る。そのようなものとして、最後のデータセットは、180万個のECGを含むものとしてよく、それらの51%は500Hz(Hz=毎秒サンプル数)で保存され、残りは250Hzで保存された。前処理段階は、線形補間によって250HzのECGを500Hzに再サンプリングすることを含み得る。
【0142】
追加のエンドポイントおよびEHRデータを含む、考察対象の他の入力
追加データがモデルに情報を与える可能性がある場合、抽出は、EHRからの各患者の最近の臨床診察と定期的更新死亡指数レジストリとを組み合わせることによって生成され得る患者の状態(生存/死亡)などの追加の患者データを有する電子健康記録からの記録を含むものとしてよい。患者の状態は、ECG後の1年死亡率に対する予測を決定するためのエンドポイントとして使用されるが、追加の臨床転帰も予測されるものとしてよく、これは、限定はしないが、任意の間隔(1、2、3年など)での死亡率、心臓病、心臓血管疾患、突然心臓死に関連する死亡率、心臓血管疾患のための入院、心臓血管疾患に対する集中治療室入院の必要性、心臓血管疾患に対する救急診療部外来、心房細動などの異常心調律の初発、心臓移植の必要性、ペースメーカーもしくは除細動器などの植え込み型心臓デバイスの必要性、左室/右室/両室補助デバイスもしくは完全人工心臓などの機械的循環支援の必要性、経皮的冠動脈インターベンションもしくは冠動脈バイパスグラフト/手術などの重要な心臓手技の必要性、新しい脳卒中もしくは一過性の虚血性発作、新しい急性冠症候群、または心不全などの任意の形態の心臓血管疾患の初発、またはECGから情報が得られ得る他の疾病からの診断の可能性を含む。
【0143】
さらに、エンドポイントの予測精度を改善すること、および予測される悪い転帰にプラスの影響を与えることができる治療を識別することの両方の目的のために予測モデルに追加の変数が追加され得る。たとえば、実験値(LDL/HDL/総コレステロールなどの血中コレステロール測定値、ヘモグロビン/ヘマトクリット/白血球数などの血球数、グルコース/ナトリウム/カリウム/肝臓および腎臓機能ラボなどの血液化学物質、ならびにトロポニンおよびナトリウム利尿ペプチドなどの追加の心臓血管マーカー)、バイタルサイン(血圧、心拍数、呼吸数、酸素飽和度)、イメージングメトリクス(心臓駆出分、心室容積、心筋厚、心臓弁機能など)、患者診断(糖尿病、慢性腎臓病、先天的心臓欠陥、癌など)、および治療(手技、投薬、心臓リハビリテーションなどのサービスの照会、食事カウンセリング、など)を抽出することによって、モデルの精度が改善され得る。これらの変数のいくつかは「修正可能な」危険因子であり、特定の治療法を使用することの有益性を示すためのモデルへの入力として使用され得る。たとえば、予測は、次の年に心房細動を発症する可能性が40%であるとして患者を識別し得るが、モデルが患者がベータブロッカーを服用していることを識別できた場合、予測モデルに利用可能なデータの増加に基づき予測リスクは20%に低下するであろう。一例では、人口統計データ416および患者データ1304は、抽出された実験値または修正可能な危険因子など、これらの追加変数で補完されてもよい。
【0144】
予測モデルを実装するための機械学習モデルは、複数のチャネルを各々処理する複数の分岐を有する畳み込みニューラルネットワーク(以下の図18に例示されるモデルアーキテクチャ)を含んでもよい。図18は、複数のチャネルを各々処理する複数の分岐を有する畳み込みニューラルネットワークに対するモデルアーキテクチャである。図示されているように、いくつかの実施形態において、モデルは、時間的に同時のチャネルとして3つの誘導の入力(分岐1:[I、II、III]、分岐2:[aVR、aVL、aVF]、分岐3:[V1、V2、V3]、分岐4:[V4、V5、V6]および分岐5[V1-long、ll-long、V5-long])が予測を生成するために利用され得る5つの分岐を含むことができる。いくつかの多分岐CNNでは、各分岐は、同時に、または同じ心拍の間に取得されたときに3つの誘導を表すことができる。「長い誘導」を含むことができる、分岐5については、分岐は10秒の持続時間においてサンプリングされ得る。他の4つの分岐については、誘導は、2.5秒の持続時間においてサンプリングされ得る。
【0145】
典型的な12誘導ECGでは、3つの誘導のこれらの分岐のうちの4つが10秒の持続時間にわたって取得される。同時に、「長い誘導」は、10秒の持続時間全体にわたって記録される。CNNのロバスト性を改善するために、特に異常な心調律は標準的な10秒間の臨床的取得全体を通してトレースが形態を変化することを引き起こすので、これらの詳細を考慮するようにアーキテクチャが設計され得る。従来のモデルは、より長い10秒間の読み取り中に形態偏位を示す異常な心調律を見逃す可能性がある。
【0146】
畳み込みブロックは、1次元畳み込み層と、それに続くバッチ正規化および正規化線形ユニット(ReLU)活性化を含み得る。一例では、最初の4つの分岐および最後の分岐は、それぞれ4および6の畳み込みブロックを含み、その後にグローバル平均プーリング(GAP)層が続くものとしてよい。すべての分岐の出力は、次いで、連結され、最終層としてシグモイド関数を有する256(ドロップアウト付き)、128(ドロップアウト付き)、64、32、8および1ユニットを有する層を含む、一連の6つの層など、一連の緻密層に接続され得る。学習率1e-5およびバッチサイズ2048のAdamオプティマイザは、より高速な計算のために別のGPU上で並行して各モデル分岐に対して計算され得る。追加のアーキテクチャは、(1)GAP層を、長短期記憶およびゲート付き回帰型ユニットなどの回帰型ニューラルネットワークに置き換えること、(2)現在のアーキテクチャにおけるすべての分岐または多数の分岐においてフィルタサイズを変化させることで畳み込み層の数を変えること、またはそれに加えて、アーキテクチャにおける分岐の数を変えること、(3)モデル訓練へのパワースペクトル密度などの時間-電圧トレースからの導出信号の追加、および(4)年齢および性別に加えて、実験値、エコー測定、ICDコード、および/またはケアギャップなどの、EHRからの表形式または導出特徴の追加を含み得る。一例では、人口統計データ416および患者データ1304は、被験者のEHRからのこれらの追加の表形式または導出特徴で補完され得る。
【0147】
訓練方法
訓練データは、複数の分割に分けられてよく、最後の分割は検証セットとして確保される。例示的な分布は、検証セットとして確保された訓練データの5パーセントを有する5つの分割を含んでもよい。データは、交差検証のために、同じ患者が訓練セットとテストセットの両方に存在しないように分割されてもよい。転帰は、検証セットでほぼバランスが取られ得る。訓練タイミングは、各訓練間隔で評価され得る検証損失に基づくものとしてよい。各エポックに対する検証セット上で評価された損失(バイナリクロスエントロピー)は、基準として十分であり得る。たとえば、訓練は、検証損失が10エポックについて減少し得ない場合(早期停止基準として)打ち切られ得、エポックの最大数は500に設定され得る。例示的なモデルは、pythonのTensorFlowバックエンドを有するKerasを使用して実装されてもよく、既定の訓練パラメータが使用され得る。他の実施形態では、他のモデル、プログラミング言語、およびパラメータが使用され得る。すべての誘導が単一の共通時間期間においてサンプリングされる場合(たとえば、0~10秒からサンプリングされる12の誘導)、上述のモデルの単一分岐が使用され得る。人口統計学的変数が、ロバスト性を高め、予測値を向上させるためにモデルに追加され得る。一例として、年齢および性別の人口統計学的変数は、以下の64の隠れユニット層を他の分岐と連結することによってモデルに追加され得る。一例では、訓練は、8つのV100 GPUおよび1 GPUあたり32GBのRAMを有するNVIDIA DGX1プラットフォーム上で実行され得る。しかしながら、訓練は、任意のコンピューティングデバイス、CPU、GPU、FPGA、ASIC、および同様のものを介して実行され、持続時間の変動は各訓練デバイスにおいて利用可能な、有効コンピュータパワーに基づくものとしてよい。一例において、5個のGPUおよび各エポックで分割をフィッティングしたところ、約10分かかった。
【0148】
追加の外部検証について、特定の病院(Geisinger Medical Center、Rush、Northwesternなど)で取得されたデータを訓練に利用し、他の病院で取得されたすべてのデータでモデルをテストすることが有利な場合がある。訓練セットおよび検証セットを施設別にセグメント分割することで、モデル精度の追加の独立した検証の形成が可能になる。
【0149】
モデル運用
モデルが十分に訓練された後、モデルは、患者のECGに基づき患者に関連付けられている1つまたは複数の状態を予測するために使用され得る。そのようなものとして、訓練済みモデルへの入力は、最低限、ECGを含む。モデルの精度は、上で詳細に説明されているように、追加の臨床的変数入力を有することによって、高められ、そのようなものとして、追加の有用性(すなわち、治療変更を推奨する能力を有する)を追加するものとしてよい。
【0150】
訓練済みモデルの出力は、将来の有害転帰の可能性(潜在的転帰は上で詳細に説明されている)、および有害転帰の可能性を低減するために実施され得る潜在的介入を含むものとしてよい。示唆され得る例示的な介入は、患者がβブロッカーの投薬を受けた場合に、入院のリスクが10%から5%に減少し得ることを主治医に通知することを含む。
【0151】
これらのモデルから予測を生成することは、有害臨床転帰の将来のリスクを決定する目的を満たすことを含んでもよく、これは最終的により早い治療およびさらにより早い介入の結果としての潜在的な予防により臨床医および患者を支援するためのものである。ECGと最終的な予測との間の持続時間(たとえば、1年死亡率を予測する場合に1年)は、注目する臨床転帰ならびに最終的に提案されおよび/または実施され得る介入に応じて変化し得る。上記で言及しているように、モデルは、1、2、3、4、もしくは5年(またはそれ以上)を含む時間期間などの、ECG取得後の任意の関連する持続時間、および任意の関連する臨床的予測について訓練され得る。それに加えて、各関連する臨床的予測について、モデル学習相関関係、または介入の刊行物のいずれかに基づき介入が同様に提案され得る。例は、患者が次の年に40%の確率でa-fibを発症すると予測することを含み得るが、その患者がβブロッカーを処方(服用)されると、その同じ患者は、その代わりに次の年にa-fibを発症する確率が20%に減少し得る。精密医療を、患者が最初のECGを受けたときなど、治療の最も早い段階に組み込むことで、患者の健康状態が悪化して高度医療を求める事態になる前に患者の全体的な生活の質を改善し、好ましくない転帰を防ぎ得る推奨を治療医が行うことを可能にする。さらに、ECGより高くそれを超える追加の変数を開発の訓練段階に組み込むことによって、モデルは、いくつかの治療/介入が患者転帰にどのようなプラスの影響を与えるか、すなわち、注目している有害臨床転帰の可能性を減らすことができるかを学習する。運用段階では、モデルは、ECGおよび関連する臨床的変数入力を取り込み、次いで、いくつかの治療/介入を行わない場合または行った場合の有害臨床転帰の予測される尤度を出力することができる。患者の現在の治療が不明な場合であっても、モデルは、「この患者が糖尿病になる場合、臨床ガイドラインに従って血糖が適切にコントロールされていれば1年死亡の可能性は10%だけ低減される」などの提案を行うことができる。
【0152】
追加の例示的なモデル運用
一実施形態において、十分に訓練されたモデルは、a-fibの可能性を予測し、治療に対する患者の全体的反応を改善するのに減量が必要であるという、患者の身長、体重、またはBMIに基づく、さらなる示唆を含み得る。十分に訓練されたモデルは、臨床的に取得された12誘導安静時ECGのPDFを取り込み、1年の死亡の正確なリスクを0から1の範囲の尤度として出力するモデルを含むものとしてよく、モデルはまた患者の身長、体重、またはBMIおよび少なくとも1年にわたって患者の臨床更新を受け取った。
【0153】
図19Aは、1年全原因死亡を予測するための受信者動作特性曲線下の面積(AUC)のグラフである。図19Bは、2.5秒または10秒のトレーシングから導出された様々な誘導配置に対するAUCを示す棒グラフである。
【0154】
上述した包含/除外基準および5分割交差検証方式を使用することで、1年全原因死亡を予測するための受信者動作特性曲線下の面積(AUC)は、ECG電圧-時間トレースのみを使用して(PDFから直接取得)0.830であり、年齢および性別が追加入力変数として加えられたときに0.847まで改善することが示されるものとしてよい(図19Aの透明[青色]バーを参照されたい)。AUCは、0.5(偶然に相当する最悪の予測精度)から1(完全予測)までの範囲のモデル精度の尺度であることに留意されたい。12誘導ECG取得時に、すべての誘導が2.5秒の持続時間において取得され、それらの12誘導のうちの3つ(V1、IIおよびV5)が10秒の持続時間において追加的に取得される。12の標準誘導からの15個のECG電圧-時間トレースすべてを一緒にしたモデル(2.5秒間に取得される3つの誘導と10秒間に取得される12個の誘導)は、入力として各単一誘導から導出されたモデルと比較して最良のAUCを提供した。10秒間のトレーシングから導出されたモデルは、2.5秒間のトレーシングから導出されたモデルに比べて高いAUCを有し、より長い持続時間のデータはモデルに情報量の多い特徴を提供することを実証した。
【0155】
図20Aは、ECG感度対特異度のプロットである。図20Bは、選択された動作点(尤度閾値=0.5、感度:0.76、特異度:0.77)における生存割合対年数のカプランマイヤー生存分析プロットである。
【0156】
データセット全体および医師によって「正常」または「異常」のいずれかと解釈されたECGのサブセット内での予測性能をさらに調査するために、カプランマイヤー生存分析が、選択された動作点におけるモデルによって予測された2つの群(1年後の生存/死亡)についてのEHRで利用可能なフォローアップデータを使用して実行された(尤度の閾値=0.5、感度:0.76、特異度:0.77)。正常なECGについては、1年の生存および死亡を予測した2つの群の生存期間中央値(5分割の平均生存曲線に対する)は、それぞれ26年および8年であり、異常ECGについては、それぞれ、16年および6年であった(図20B参照)。Cox比例ハザード回帰モデルは、5つの分割の各々についてフィッティングされ、平均ハザード比(95%信頼区間の下限と上限を含む)は、モデルによってECG後1年の生存と死亡が予測されたものと比較して、すべてのECGで4.4[4.0~4.5]、異常ECGで3.9[3.6~4.0]、および正常ECGで6.6[5.8~7.6](すべてのp<0.005)であった。したがって、ハザード比は、正常ECGのサブセットにおいて最大であり、モデルからの1年死亡の予測は、ECGの臨床的取得後30年の間の長期生存の有意な識別子であった。
【0157】
図21は、モデル結果を確認する前と確認した後の3人の異なる心臓内科医による予測された死亡転帰のグラフである。十分に訓練されたモデルのもう1つの考察は、モデルによって学習された特徴が心臓内科医には視覚的に明白である場合を含み得る。たとえば、401セットのペアにされた正常ECGが選択され、3人の心臓内科医による盲検調査に提供される場合、心臓内科医の目視検査に対するモデル性能の尺度が生成され得る。各ペアは、年齢および性別について一致した真陽性(1年後に死亡とモデルによって正しく予測された正常ECG)および真陰性(1年後に生存とモデルによって正しく予測された正常ECG)からなるものとしてよい。図22Aは、無発生割合対年数のグラフである。図22Bは、陽性適中率対母集団の上位パーセンテージのリスク群のグラフである。ある研究では、心臓内科医は、一般的に、1年死亡率にリンクする正常ECGを正しく識別するために55~68%(偶然より10~36%高い)と低い精度を有していた。各心臓内科医が転帰を示すようにラベル付けされた240のペアにされたECGの別個のデータセットを調査することを可能にした後、401のペアにされたECGの元の盲検調査を繰り返す際の予測精度は、低いままであった(50~75%の精度、すなわち、偶然よりも0~50%高い)(図21参照)。これは、上記のモデルが、重要なことに心臓内科医が長年の臨床訓練にもかかわらず視覚的に識別することができない重要な臨床転帰を予測する特徴を識別できることを示唆している。
【0158】
転帰を予測するための報告された精度は、各患者からの単一のECGのみに対してテストすることによってわずかに改善される可能性があることに留意されたい。上記の数値は、患者からのすべてのECGからのテストデータ精度(AUC)を報告しており、これは結局より多くのECGを受ける患者を過大評価することになる(すなわち、生涯で20回のECGを受ける患者は、生涯で1回しかECGを受けなかった患者に比べて精度評価により多く寄与する)。より多くのECGを有する患者ほど、典型的には、病気であるので、彼らの臨床転帰を予測することはより困難であり、したがって、これらの患者を過剰評価すると、認知された精度(AUC)がわずかに低下する可能性がある。
【0159】
心房細動の予測
心房細動(AF)は、脳卒中のリスクを高める心臓の異常なリズムである。したがって、脳卒中が発生する前に、AFの発症を検出するための予測戦略は、臨床的に非常に重要である。一実施形態において、ディープラーニングモデルは、臨床的に取得されたPDFから抽出されるような12誘導安静時心電図(ECG)電圧-時間トレースから直接的に将来のAFを予測し得る。
【0160】
たとえば、270万の臨床的に取得された12誘導ECGを含むデータセットは、AFのない110万個のECG(237,060人の患者からの)を含み得る。将来のインシデントAFの有無は、その後のECG研究および電子健康記録内の問題リスト診断を介して決定され得る。インシデントAFの有病率は、集団全体で7%であり、臨床的に正常と解釈されたECGを有する61,142人の患者のサブセットでは3%であった。多クラス深層畳み込みニューラルネットワークなどのモデルは、5分割交差検証を使用して、15個のECGトレースを入力として1年インシデントAFを予測するように訓練され得る。一事例において、モデル性能は、受信者動作特性曲線下の面積(AUC)および予測群の無発生曲線に関するCox比例ハザード分析から測定され得る。モデル性能の追加の評価は、日和見的な集団スクリーニングの文脈において実行されてもよい。たとえば、スクリーニングされるべき最も高いモデル予測リスクを有する患者の数の関数としてのモデルの陽性適中率(PPV)が計算され得る。入力インスタンスとしての15個のECGトレースによる多クラス深層CNNでは、予測モデルの平均AUCは、0.75であり、次の年の年内にAFを発症すると予測された患者は、ECG取得後25年以上に及ぶAFを発症することに対する有意な長期の増大したリスクを有していた(図22Aを参照)。医師によって「正常」と解釈されたECGのサブセットであっても、AUCは0.720であった。潜在的な集団スクリーニングの環境において、この性能は、リスクのある最も高い1%をスクリーニングするための0.3の陽性適中率に対応していた(図22Bを参照)。これは、リスクのある上位1%のうち、約30%が結局最初の年の年内にAFを発症し、さらに多くの人が次の25年にわたってAFを発症することを意味する。
【0161】
要約すると、これは、将来の臨床的に関連する事象(次の年の年内の心房細動)の発症を予測するためにモデルを使用したもう1つの例である。この予測は、ECGが医師によって臨床的に「正常」と解釈されるときであっても適度な精度を維持する。特にECGの医師の臨床的解釈が「正常」である事例おいて、医師に予測を提供することは、患者ケアを大きく改善することになる。モデルの予測および治療に関する意味は、モデル開発の訓練段階への追加の特徴の包含によってなおいっそう改善されるものとしてよく、治療/介入がAFの発症リスクを低減する仕方に関するなおもさらに関連する予測を可能にすること(たとえば、患者がβブロッカー薬を服用している場合または血圧が正常範囲内にある場合に、AFの発症リスクを低減する可能性が高く、またモデルはこれらの予測を行うことができる)は、患者の治療に含められ得る。
【0162】
いくつかの実施形態において、モデル400によって報告された結果は、発作性AFの検出およびインシデントAFの予測を反映している。直感的に、DNNによる高リスク予測につながるECGの特性は、すでにAFを有するが現在は洞律動である患者においてより優勢である。このことを念頭に置いて、インシデントAFの予測と比較して発作性AFの識別に対するより高いモデル性能を期待し、これは、まさにわれわれが見ているものである。1年にわたって初発AFの率が減少していることも予想している。これは、図7Lに示されており、発作性AFの素早い識別とそれに続くインシデントAFを表す症例のより遅い識別に一致する。DNNモデルがインシデントAFを予測できるというわれわれの主張を裏付ける証拠のうちの最大のものは、図7E図7Kにおいて指摘されているようにインデックスECG後30年までのKM無発生生存曲線の連続する分離である。他の実施形態では、モデル400からの結果はAFを有する患者の心房内で発生する構造的変化を反映するものとしてよく、モデル400では、提供する予測結果をガイドするためにこの心房ミオパシーのECG発現を使用する。
【0163】
システム100が利用され得、本明細書において開示されている方法が実行され得る異なる環境が多数ある。環境に関して、1つの有望な機会--特に統合医療介護提供システムに対する--は、医療システムにおけるすべてのECGの組織的スクリーニングである。たとえば、モデル400は、すべてのECGが評価されるように、(EHRシステムなどを通して)既存の臨床的ワークフローに組み込まれることもあり得、高リスク研究は、フォローアップおよび監視についてフラグが付けられることもあり得る。そのような強化された監視は、組織的脈拍触診、組織的ECGスクリーニング、1回または複数回着用される連続パッチモニター、Kardia mobileなどのデバイスによる間欠的ホームスクリーニング、またはApple Watchなどのウェアラブルモニターを含む、多くの異なる形態を取り得る。
【0164】
付録A
CODE:(ECGを読み取る方法)
def convert_pdf_to_svg(fname, outname, verbose=0):
""
Input:
fname :PDFファイル名
outname :SVGファイル名
Output:
outname :outnameを返す(ファイルはディスクに保存される)

これはPDFをSVGフォーマットに変換し、所与のoutpathに保存する。
""
(status, out) = subprocess.getstatusoutput(".join(['pdftocairo -svg', fname,' ', outname]))
if (status != 0):
logging.error('Error in converting PDF to SVG: {}'.format(out))
return outname

def process_svg_to_pd_perdata(svgfile, pdffile=None):
""
Input:
svgfile - svgファイルに対するdatapath
Output (returns):
data :12誘導に対するデータ(利用可能な15または12のトレース)、scale_valesおよびpandas dataframe内の分解ユニット

ハードコードされた値:
1) 信号の長さ=6は、トレースの始まりのキャリブレーショントレーシングであると仮定される(実験により)
""

columnnames = np.array(['I', 'II', 'III', 'aVR', 'aVL', 'aVF', 'V1', 'V2', 'V3', 'V4', \ 'V5', 'V6', 'V1L', 'IIL', 'V5L'])

doc = parse(svgfile)
if pdffile is None:
strn = os.path.splitext(os.path.basename(svgfile))[0]
else:
strn = os.path.splitext(os.path.basename(pdffile))[0]
arrayindex = [np.array([strn, strn]), np.array(['x','y'])]

data = pd.DataFrame(columns = ['PT_MRN','TEST_ID','filename','lead','x','y']) #,'scale_x','scale_y'])
a = 0
spacingvals = []
scale_vals = []
try:
siglen = []
for path in doc.getElementsByTagName('path'):
tmp = path.getAttribute('d')
tmp_split = tmp.split(' ')
signal_np = np.asarray([float(x) for x in tmp_split if (x != 'M' and x != 'L' and x != 'C' and x != 'Z' and x != ")])
signalx = signal_np[0::2]
signaly = signal_np[1::2]

siglen.append(len(signalx))

siglen = np.array(siglen)

# これらはキャリブレーション信号である
cali6sigs = np.where(siglen == 6)[0]
minposcali = np.min(cali6sigs)

tmpstart = list(range(minposcali, len(siglen)))
last15sigs = np.array(list(set(tmpstart)- set(cali6sigs)))

# 誘導に対するインデックス
a = 0
for ind, path in enumerate(doc.getElementsByTagName('path')):
if ind in last15sigs:
if a > 14:
continue
tmp = path.getAttribute('d')
tmp_split = tmp.split(' ')
signal_np = np.asarray([float(x) for x in tmp_split if (x != 'M' and x != 'L' and x != 'C' and x != 'Z' and x != ")])
signalx = signal_np[0::2]
signaly = signal_np[1::2]

# ファイルの名前がptmrn_testidフォーマットであると期待する
tmp = strn.split('_')
try:
pid, testid = tmp[0], tmp[1]
except:
pid = tmp[0]
testid = tmp[0]
data.loc[data.shape[0]] = [pid, testid, strn, columnnames[a], signalx, signaly]
spacingx = [t -s for s,t in zip(signalx, signalx[1:])]
spacingvals.append(np.min(spacingx))
a += 1

elif ind in cali6sigs:
tmp = path.getAttribute('d')
tmp_split = tmp.split(' ')
signal_np = np.asarray([float(x) for x in tmp_split if (x != 'M' and x != 'L' and x != 'C' and x != 'Z' and x != ")])
signalx = signal_np[0::2]
signaly = signal_np[1::2]
scale_vals.append([np.min(signaly), np.max(signaly)])

if len(scale_vals) == 0:
data = None
return data

sx = [x[0] for x in scale_vals]
sy = [x[1] for x in scale_vals]

startloc = [d[0] for d in data.x.values]
leads_ip = len(startloc)

a = np.sum(startloc[0:3] == startloc[0])
b = np.sum(startloc[3:6] == startloc[3])
c = np.sum(startloc[6:9] == startloc[6])
d = np.sum(startloc[9:12] == startloc[9])

if data.shape[0] == 15:
e = np.sum(startloc[12:15] == startloc[12])
checkrhs = [3, 3, 3, 3, 3]
checklhs = [a,b,c,d,e]
assert checklhs == checkrhs

scale_x = [sx[0:3],sx[0:3],sx[0:3],sx[0:3], sx[3:6]]
scale_y = [sy[0:3],sy[0:3],sy[0:3],sy[0:3], sy[3:6]]

elif data.shape[0] == 12:
checkrhs = [3, 3, 3, 3]
checklhs = [a,b,c,d]

assert checklhs == checkrhs

scale_x = [sx[0:3],sx[0:3],sx[0:3],sx[0:3]]
scale_y = [sy[0:3],sy[0:3],sy[0:3],sy[0:3]]
else:
data=None
return data

scale_x = [y for x in scale_x for y in x]
data['scale_x'] = scale_x[0:data.shape[0]]

scale_y = [y for x in scale_y for y in x]
data['scale_y'] = scale_y[0:data.shape[0]]
data['minspacing'] = spacingvals[0:data.shape[0]]
except:
data = None

return data
【0165】
したがって、適切に訓練されたディープニューラルネットワークは、ECGが臨床的に「正常」と解釈されるときでも、12誘導ECGトレースから直接的にインシデントAFを予測することができる。このアプローチは、脳卒中のリスクを潜在的に最小化するために、初発AFのターゲットスクリーニングおよびモニタリングに対して著しい潜在的可能性を有する。
【0166】
さらに、ディープラーニングは、医師によって「正常」と解釈される場合であっても、早期介入から利益を得る可能性のある潜在的な有害転帰(たとえば、死亡)を有する患者を識別するための強力なツールとなり得る。
【0167】
本発明は、様々な修正形態および代替的形態の影響を受け得るが、特定の実施形態は、図面内に例として示されており、本明細書において詳細に説明されている。しかしながら、本発明は、開示されている特定の形態に限定されることを意図していないことは理解されるべきである。
【0168】
したがって、本発明は、次の添付の特許請求の範囲によって定義されているような本発明の趣旨および範囲内に収まるすべての修正物、均等物、および代替物を対象とする。
【0169】
本発明の範囲を公衆に知らせるために、次の特許請求の範囲が用意された。
【符号の説明】
【0170】
100 システム
104 コンピューティングデバイス
108 二次コンピューティングデバイス
112 通信ネットワーク
116 ディスプレイ
120 ECGデータベース
124 訓練データデータベース
128 訓練済みモデルデータベース
132 ECG分析アプリケーション
136 訓練済みモデル
204 プロセッサ
208 ディスプレイ
212 入力
216 通信システム
220 メモリ
224 プロセッサ
228 ディスプレイ
232 入力
236 通信システム
240 メモリ
300 生ECG電圧入力データ
304 第1の電圧データ
308 第2の電圧データ
312 第3の電圧データ
316 第4の電圧データ
320 第5の電圧データ
324 第6の電圧データ
328 第7の電圧データ
332 第8の電圧データ
336 第9の電圧データ
340 第10の電圧データ
344 第11の電圧データ
348 第12の電圧データ
352 第13の電圧データ
356 第14の電圧デー
400 モデル
400A 畳み込みコンポーネント
400B インセプションブロック
400C 全結合緻密層コンポーネント
404 第1の分岐
408 第2の分岐
412 第3の分岐
416 人口統計データ
420 リスクスコア
424 モデル
424C 緻密層コンポーネント
428 ECG電圧入力データ
432 単一の入力分岐
436 1D畳み込みブロック
440 インセプションブロック
444 サブブロック
448A 第1の畳み込みブロック
448B 第2の畳み込みブロック
448C 第3の畳み込みブロック
456 MaxPool層
460 最後の畳み込みブロック
464 グローバル平均プーリング(GAP)層
468 リスクスコア
図1
図2
図3
図4A
図4B
図5A
図5B
図6A
図6B
図7A
図7B
図7C
図7D
図7E
図7F
図7G
図7H
図7I
図7J
図7K
図7L
図8A
図8B
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19A
図19B
図20A
図20B
図21
図22A
図22B
【国際調査報告】