IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グーグル インコーポレイテッドの特許一覧

特許7030853電子健康記録から医療イベントを予測して要約するためのシステムおよび方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-02-25
(45)【発行日】2022-03-07
(54)【発明の名称】電子健康記録から医療イベントを予測して要約するためのシステムおよび方法
(51)【国際特許分類】
   G16H 50/20 20180101AFI20220228BHJP
   G16H 50/30 20180101ALI20220228BHJP
   A61B 5/00 20060101ALI20220228BHJP
   G06N 20/00 20190101ALI20220228BHJP
   G06N 5/04 20060101ALI20220228BHJP
【FI】
G16H50/20
G16H50/30
A61B5/00 D
G06N20/00
G06N5/04
【請求項の数】 31
(21)【出願番号】P 2019566256
(86)(22)【出願日】2017-08-30
(65)【公表番号】
(43)【公表日】2020-10-01
(86)【国際出願番号】 US2017049300
(87)【国際公開番号】W WO2019022779
(87)【国際公開日】2019-01-31
【審査請求日】2020-01-28
(31)【優先権主張番号】62/538,112
(32)【優先日】2017-07-28
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502208397
【氏名又は名称】グーグル エルエルシー
【氏名又は名称原語表記】Google LLC
【住所又は居所原語表記】1600 Amphitheatre Parkway 94043 Mountain View, CA U.S.A.
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】カイ・チェン
(72)【発明者】
【氏名】パトリック・サンドバーグ
(72)【発明者】
【氏名】アレクサンダー・モシン
(72)【発明者】
【氏名】ニッサン・ハジャジ
(72)【発明者】
【氏名】カート・リッシュ
(72)【発明者】
【氏名】ジェームズ・ウェクスラー
(72)【発明者】
【氏名】イ・ジャン
(72)【発明者】
【氏名】クン・ジャン
(72)【発明者】
【氏名】ジェイコブ・マーカス
(72)【発明者】
【氏名】エイアル・オレン
(72)【発明者】
【氏名】ヘクター・イー
(72)【発明者】
【氏名】ジェフリー・ディーン
(72)【発明者】
【氏名】ミカエラ・ハルト
(72)【発明者】
【氏名】ベンジャミン・アーヴィン
(72)【発明者】
【氏名】ジェームズ・ウィルソン
(72)【発明者】
【氏名】アンドリュー・ダイ
(72)【発明者】
【氏名】ピーター・リュウ
(72)【発明者】
【氏名】シャオミ・スン
(72)【発明者】
【氏名】クォック・レ
(72)【発明者】
【氏名】シャオビン・リュウ
(72)【発明者】
【氏名】アルヴィン・ラージコマール
(72)【発明者】
【氏名】グレゴリー・コラッド
(72)【発明者】
【氏名】ジェラルド・フロレス
(72)【発明者】
【氏名】インウェイ・ツイ
(72)【発明者】
【氏名】ギャヴィン・ダガン
【審査官】関 博文
(56)【参考文献】
【文献】特表2017-502439(JP,A)
【文献】米国特許出願公開第2017/0161439(US,A1)
【文献】米国特許出願公開第2015/0025329(US,A1)
【文献】国際公開第2006/013320(WO,A1)
【文献】MA, Fenglong.,Dipole: Diagnosis Prediction in Healthcare via Attention-based Bidirectional Recurrent Neaural Networks,ARXIV.org,米国,CORNELL UNIVERSITY LIBRALRY,2017年06月19日,DOI:10.1145/3097983.3098088,XP080770722
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
A61B 5/00
G06N 20/00
G06N 5/04
(57)【特許請求の範囲】
【請求項1】
電子健康記録から医療イベントを予測して要約するためのシステムであって、
a)薬剤、検査値、診断、バイタルサイン、および医療ノートのいくつかまたは全てを含む、多様な年齢、健康状態、および人口統計の多数の患者からの集約された電子健康記録を格納するコンピュータメモリであって、前記集約された電子健康記録が、単一の標準データ構造フォーマットに変換され、患者ごとの規則正しい配列である、コンピュータメモリと、
b)前記標準データ構造フォーマットを有する患者の入力電子健康記録に基づいて1つまたは複数の将来の臨床イベントを予測し、かつ前記予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、前記単一の標準データ構造フォーマットに変換された前記規則正しい配列の前記集約された電子健康記録でトレーニングされた1つまたは複数の深層学習モデルを実行するコンピュータと、
c)前記患者についての前記予測した1つまたは複数の将来の臨床イベントおよび前記関連のある過去の医療イベントを表示する医療提供者対向インターフェースで構成される、前記患者を治療する医療提供者による使用のための電子デバイスと
を備
前記1つまたは複数の深層学習モデルのうちの少なくとも1つが、前記1つまたは複数の将来の臨床イベントを予測し、かつ前記予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、どれだけ多くの注目を前記1つまたは複数のモデルが前記電子健康記録内の要素に示したかを示す注目機構を含む、
システム。
【請求項2】
前記集約された電子健康記録が、少なくとも2つの異なるデータフォーマットで配列された健康記録を含む、請求項1に記載のシステム。
【請求項3】
前記標準データ構造フォーマットが、Fast Healthcare Interoperability Resources(FHIR)を含む、請求項1または2に記載のシステム。
【請求項4】
1つまたは複数の深層学習モデルが、長期短期メモリ(LSTM)モデル、時間認識フィードフォワードモデル(FFM)、および埋込みブースト型時系列モデルを含む、請求項1に記載のシステム。
【請求項5】
前記深層学習モデルのそれぞれが、前記集約された電子健康記録を作るデータセットで別々にトレーニングされる、請求項4に記載のシステム。
【請求項6】
1つまたは複数の将来の臨床イベントの予測、および前記予測した1つまたは複数の将来の臨床イベントに関する要約された関連のある過去の医療イベントが、前記深層学習モデルのアンサンブル平均から取得される、請求項4に記載のシステム。
【請求項7】
前記予測した1つまたは複数の将来の臨床イベントが、集中治療室への計画外搬送、7日より長い入院期間、前記患者の退院後30日以内の計画外再入院、入院患者の死、1次診断、1次および2次の請求診断の全セット、または急性腎傷害、低カリウム血症、低血糖症、もしくは低ナトリウム血症などの異常な検査値のうちの少なくとも1つを含む、請求項1から6のいずれか一項に記載のシステム。
【請求項8】
前記電子デバイスの前記インターフェースが、
(1)前記予測した1つまたは複数の将来の臨床イベントへの注意喚起と、
(2)前記注意喚起に関する主要な医療問題または状態と、
(3)前記注意喚起に関するノートまたは前記ノートの抜粋と
の表示を含む、請求項1に記載のシステム。
【請求項9】
前記1つまたは複数の深層学習モデルそれぞれ、前記注目機構を含み、前記ノートまたは前記ノートの抜粋の前記表示が、前記注目機構の適用による結果を示す手法で表示される、請求項8に記載のシステム。
【請求項10】
1つまたは複数のコンピュータによって実施される、電子健康記録から医療イベントを予測して要約するための方法であって、
a)多様な年齢、健康状態、および人口統計の多数の患者から電子健康記録を集約するステップであって、前記電子健康記録が、薬剤、検査値、診断、バイタルサイン、および医療ノートのいくつかまたは全てを含む、ステップと、
b)規則正しい配列に患者ごとに並べられた、単一の標準データ構造フォーマットに前記集約された電子健康記録を変換するステップと、
c)前記単一の標準データ構造フォーマットに変換された前記規則正しい配列の前記集約された電子健康記録で1つまたは複数の深層学習モデルをトレーニングするステップと、
d)前記標準データ構造フォーマットを有し、かつ発生順に並べられた患者の入力電子健康記録から、1つまたは複数の将来の臨床イベントを予測し、かつ前記予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、前記トレーニングされた1つまたは複数の深層学習モデルを使用するステップと、
e)前記患者についての前記予測した1つまたは複数の将来の臨床イベントおよび前記関連のある過去の医療イベントを表示するために、医療提供者対向インターフェースを有する、前記患者を治療する医療提供者による使用のための電子デバイスのためのデータを生成するステップと
を含
前記1つまたは複数の深層学習モデルのうちの少なくとも1つが、前記1つまたは複数の将来の臨床イベントを予測し、前記予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、どれだけ多くの注目を前記1つまたは複数のモデルが前記電子健康記録内の要素に示したかを示す注目機構を含む、
方法。
【請求項11】
前記集約された電子健康記録が、種々のデータフォーマットで配列された多数の患者からの健康記録を含む、請求項10に記載の方法。
【請求項12】
前記標準データ構造フォーマットが、Fast Healthcare Interoperability Resources(FHIR)を含む、請求項10または11に記載の方法。
【請求項13】
1つまたは複数の深層学習モデルが、長期短期メモリ(LSTM)モデル、時間認識フィードフォワードモデル(FFM)、および埋込みブースト型時系列モデルを含む、請求項10に記載の方法。
【請求項14】
前記深層学習モデルのそれぞれが、前記集約された電子健康記録を作るデータセットで別々にトレーニングされる、請求項13に記載の方法。
【請求項15】
1つまたは複数の将来の臨床イベントの予測、および前記予測した1つまたは複数の将来の臨床イベントに関する要約された関連のある過去の医療イベントが、前記深層学習モデルのアンサンブル平均から取得される、請求項13に記載の方法。
【請求項16】
前記1つまたは複数の深層学習モデルが、集中治療室への計画外搬送、7日より長い入院期間、前記患者の退院後30日以内の計画外再入院、入院患者の死、1次診断、1次および2次の請求診断の全セット、または急性腎傷害、低カリウム血症、低血糖症、もしくは低ナトリウム血症などの異常な検査値、のうちの少なくとも1つを含む1つまたは複数の将来の臨床イベントを予測する、請求項10から15のいずれか一項に記載の方法。
【請求項17】
前記方法が、
(1)前記1つまたは複数の将来の臨床イベントへの注意喚起と、
(2)前記注意喚起に関する主要な医療問題または状態と、
(3)前記注意喚起に関するノートまたは前記ノートの抜粋と
といった、前記電子デバイスの前記インターフェースに表示するためのデータを生成するステップをさらに含む、請求項10に記載の方法。
【請求項18】
前記1つまたは複数の深層学習モデルがそれぞれ、前記注目機構を含み、前記ノートまたは前記ノートの抜粋の前記表示が、前記注目機構の適用による結果を示す手法で表示される、請求項17に記載の方法。
【請求項19】
前記注目機構の前記適用による結果を示す前記ノートまたは前記ノートの抜粋の前記表示が、前記ノート内の特定の単語、句、または他のテキストに対するハイライトまたは強調のグラデーションを提供するために、フォントサイズ、フォント色、陰影、太字、イタリック体、下線、取り消し線、点滅、色付きのハイライト、およびフォント選択のうちの少なくとも1つを使用する前記ノートまたは前記ノートの抜粋の表示を含む、請求項18に記載の方法。
【請求項20】
標準データ構造フォーマットを有し、発生順に並べられた患者の入力電子健康記録に基づいて、1つまたは複数の将来の臨床イベントを予測し、かつ前記予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、単一の標準データ構造フォーマットに変換された規則正しい配列の集約された電子健康記録でトレーニングされた1つまたは複数の深層学習モデルを実行するプロセッサ
を備
前記1つまたは複数の深層学習モデルのうちの少なくとも1つが、前記1つまたは複数の将来の臨床イベントを予測し、かつ前記予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、どれだけ多くの注目を前記1つまたは複数のモデルのうちの前記少なくとも1つが前記電子健康記録内の要素に示したかを示す注目機構を含む、
改良型コンピュータ。
【請求項21】
前記1つまたは複数の深層学習モデルが、長期短期メモリ(LSTM)モデル、時間認識フィードフォワードモデル(FFM)、および埋込みブースト型時系列モデルを含む、請求項20に記載の改良型コンピュータ。
【請求項22】
前記深層学習モデルのそれぞれが、前記集約された電子健康記録を作るデータセットで別々にトレーニングされる、請求項21に記載の改良型コンピュータ。
【請求項23】
1つまたは複数の将来の臨床イベントの予測、および前記予測した1つまたは複数の将来の臨床イベントに関する要約された関連のある過去の医療イベントが、前記深層学習モデルのアンサンブル平均から取得される、請求項21に記載の改良型コンピュータ。
【請求項24】
前記予測した1つまたは複数の将来の臨床イベントが、集中治療室への計画外搬送、7日より長い入院期間、前記患者の退院後30日以内の計画外再入院、入院患者の死、1次診断、1次および2次の請求診断の全セット、または急性腎傷害、低カリウム血症、低血糖症、および低ナトリウム血症などの異常な検査値のうちの少なくとも1つを含む、請求項21に記載の改良型コンピュータ。
【請求項25】
前記プロセッサが、異なる患者の複数の入力電子健康記録に対する予測を実質的にリアルタイムに生成するように動作する、請求項20から24のいずれか一項に記載の改良型コンピュータ。
【請求項26】
a)薬剤、検査値、診断、バイタルサイン、および医療ノートのいくつかまたは全てを含み、種々のフォーマットで取得された、多様な年齢、健康状態、および人口統計の多数の患者からの集約された電子健康記録を格納するコンピュータメモリであって、前記集約された電子健康記録が、単一の標準データ構造フォーマットに変換され、規則正しい配列に患者ごとに並べられる、コンピュータメモリと、
b)患者の入力電子健康記録に基づいて将来の臨床イベントを予測するために、前記単一の標準データ構造フォーマットに変換された前記規則正しい配列の前記集約された電子健康記録でトレーニングされた1つまたは複数の深層学習モデルを実行するコンピュータと
を組み合わせて備
前記1つまたは複数の深層学習モデルのうちの少なくとも1つが、前記1つまたは複数の将来の臨床イベントを予測し、かつ前記予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、どれだけ多くの注目を前記1つまたは複数のモデルのうちの前記少なくとも1つが前記電子健康記録内の要素に示したかを示す注目機構を含む、
システム。
【請求項27】
前記集約された電子健康記録が、種々のデータフォーマットで配列された健康記録を含む、請求項26に記載のシステム。
【請求項28】
前記標準データ構造フォーマットが、Fast Healthcare Interoperability Resources(FHIR)を含む、請求項26または27に記載のシステム。
【請求項29】
前記集約された電子健康記録が、主要な結果および除外基準を定義するのに必要な変数を除く、標準用語に調和されていない変数名を含む、請求項26に記載のシステム。
【請求項30】
前記集約された電子健康記録が入院診断を含み、前記診断が、単一レベルの臨床分類ソフトウェア(CCS)コードにマッピングされる、請求項26に記載のシステム。
【請求項31】
前記電子健康記録が、患者ごとに発生順に並べられる、請求項26から30のいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
優先権
本出願は、2017年7月28日に出願の米国仮出願第62/538,112号に対する米国特許法第119条に基づく優先権の利益を主張する。付録Aおよび付録Bを含むこの仮出願第62/538,112号の全内容は、本明細書に参照により組み込まれる。
【0002】
本開示は、深層学習モデルを使用して、電子健康記録から医療イベントを予測して要約するためのシステムおよび方法を対象とする。本開示は、モデル生成およびトレーニングのための単一フォーマットへの電子健康記録の統合、医療記録から健康イベントを予測するための深層学習モデル、ならびに深層学習を通じて取得された臨床予測、および予測に関する根本的な関係医療イベントの表示のための電子デバイス上の提供者対向インターフェースを含む、いくつかの構成要素の態様およびこれらの組合せも対象とする。
【背景技術】
【0003】
ノーベル賞受賞者Herbert Simonは、「情報が消費するものは、むしろ明らかであり、それは、情報の受領者の注目を消費する。したがって、大量の情報が注目の欠如をもたらし、これを消費する可能性のある情報源過多の中で効率的にこの注目を割り振る必要性を作り出す。」とかつて言った。臨床の場において、患者に関する情報の管理および提示は、たとえば患者をどのように治療するか、または病院から患者をいつ退院させるべきかといった、患者ケアおよび医療上の意思決定の重要な態様である。情報の管理は、看護師または医師などの医療提供者が、多くの患者を同時に診療している多忙な病院または診療所の状況において特に深刻な問題である。たとえば患者の電子健康記録に含まれている情報は、受領者(たとえば、看護師または医師)の注目を消費する。たとえば長年にわたる特定の患者の大規模な医療履歴、またはより普通には多数の患者の医療履歴に含まれている大量の情報は注目の欠如をもたらす。
【0004】
多様な発生源からの情報過多の中で効率的に医療提供者の注目を割り振ること、ならびに将来の臨床イベントを予測すること、およびこれらの予測にタイムリに寄与する、関連のある根本的な医療イベントをハイライトすることを行うことを医療提供者が行うのを支援するためのシステムおよび方法が必要である。本開示は、病院の医師に迫る緊急の問題、すなわち自分の注目に対する最大の必要性をどの患者が今有しているのか、および個々のレベルにおいて、患者のチャートにおけるどの情報を自分は診療するべきなのかということに対処する。
【0005】
関連技術
電子健康記録(EHR:electronic health record)の迅速な採用が、日常の臨床データをデジタル的に豊富にしてきた。Adler-Milstein J, DesRoches CM, Kralovec P, et al. Electronic Health Record Adoption In US Hospitals: Progress Continues, But Challenges Persist. Health Aff. 2015; 34(12):2174-2180. Henry J, et al., Adoption of Electronic Health Record Systems among U.S. Non-Federal Acute Care Hospitals: 2008-2015, Office of the National Coordinator for Health Information Technology, ONC data brief no. 35, May 2016。この現象は、再入院のリスクが高いと予測される患者への介入を対象とすること(Parikh RB, Kakad M, Bates DW. Integrating Predictive Analytics Into High-Value Care: The Dawn of Precision Delivery. JAMA. 2016;315(7):651-652を参照されたい)、有害事象または代償不全のリスクのある患者をトリアージすること(Bates DW, Saria S, Ohno-Machado L, Shah A, Escobar G. Big data in healthcare: using analytics to identify and manage high-risk and high-cost patients. Health Aff . 2014;33(7):1123-1131; Obermeyer Z, Emanuel EJ. Predicting the Future - Big Data, Machine Learning, and Clinical Medicine. N Engl J Med. 2016;375(13
):1216-1219を参照されたい)、および特定の癌治療を推奨することまでも(Kantarjian H, Yu PP. Artificial Intelligence, Big Data, and Cancer. JAMA Oncol. 2015;1(5):573-574を参照されたい)を行うアルゴリズムによって電子健康記録を利用するという努力に拍車をかけてきた。
【0006】
従来、これらの予測モデルは、しばしば高品質のデータコレクションを保証するために、臨床登録所または臨床試験における、予め特定されたコホートに対して一貫して測定される変数を収集することによって、各タスクに対して別々に作り出される。対照的に、日常ケアの中で生成されたデータは、不完全、不正確、かつ一貫性のないデータセットを生み出す場合がある。Hersh WR, Weiner MG, Embi PJ, et al. Caveats for the use of operational electronic health record data in comparative effectiveness research. Med Care. 2013;51(8 Suppl 3):S30-S37; Newton KM, Peissig PL, Kho AN, et al. Validation of electronic medical record-based phenotyping algorithms: results and lessons learned from the eMERGE network. J Am Med Inform Assoc. 2013;20(e1):e147-e154; Opmeer BC. Electronic Health Records as Sources of Research Data. JAMA. 2016;315(2):201-202。したがって、予測モデルを作り出すために、研究者は、変数を定義すること、データを正規化すること、および導入を複雑にし、したがって生データに基づいてリアルタイムにステップが再作成されなければならない、欠落した測定値にうまく対応すること(たとえば、the Newton and Opmeerのリファレンスを参照されたい)を行うためにかなりの努力を費やす。Goldstein BA, Navar AM, Pencina MJ, Ioannidis JPA. Opportunities and challenges in developing risk prediction models with electronic health records data: a systematic review. J Am Med Inform Assoc. 2017;24(1):198-208。上記を考慮すると、予測モデルにおける変数の中央の数は27であり(上記のGoldstein et al.,を参照されたい)、したがって特にノートのような構造化されていないデータ、ならびにバイタルサインおよび検査結果のような繰り返し行われる測定値といった、ほとんどのデータを無視する。
【先行技術文献】
【非特許文献】
【0007】
【文献】Adler-Milstein J, DesRoches CM, Kralovec P, et al. Electronic Health Record Adoption In US Hospitals: Progress Continues, But Challenges Persist. Health Aff. 2015; 34(12):2174-2180
【文献】Henry J, et al., Adoption of Electronic Health Record Systems among U.S. Non-Federal Acute Care Hospitals: 2008-2015, Office of the National Coordinator for Health Information Technology, ONC data brief no. 35, May 2016
【文献】Parikh RB, Kakad M, Bates DW. Integrating Predictive Analytics Into High-Value Care: The Dawn of Precision Delivery. JAMA. 2016;315(7):651-652
【文献】Bates DW, Saria S, Ohno-Machado L, Shah A, Escobar G. Big data in healthcare: using analytics to identify and manage high-risk and high-cost patients. Health Aff . 2014;33(7):1123-1131
【文献】Obermeyer Z, Emanuel EJ. Predicting the Future - Big Data, Machine Learning, and Clinical Medicine. N Engl J Med. 2016;375(13):1216-1219
【文献】Kantarjian H, Yu PP. Artificial Intelligence, Big Data, and Cancer. JAMA Oncol. 2015;1(5):573-574
【文献】Hersh WR, Weiner MG, Embi PJ, et al. Caveats for the use of operational electronic health record data in comparative effectiveness research. Med Care. 2013;51(8 Suppl 3):S30-S37
【文献】Newton KM, Peissig PL, Kho AN, et al. Validation of electronic medical record-based phenotyping algorithms: results and lessons learned from the eMERGE network. J Am Med Inform Assoc. 2013;20(e1):e147-e154
【文献】Opmeer BC. Electronic Health Records as Sources of Research Data. JAMA. 2016;315(2):201-202
【文献】Goldstein BA, Navar AM, Pencina MJ, Ioannidis JPA. Opportunities and challenges in developing risk prediction models with electronic health records data: a systematic review. J Am Med Inform Assoc. 2017;24(1):198-208
【文献】Mandel JC, et al., SMART on FHIR: a standards-based, interoperable apps platform for electronic health records. J Am Med Inform Assoc. 2016;23(5):899-908
【文献】A. Vaswani et al., Attention is all you need, arXiv:1706.03762 [cs.CL] (June 2017)
【文献】D. Bahdanau et al., Neural Machine Translation by Jointly Learning to Align and Translate, Jan. 2014 (arXiv:1409.0473[cs.CL]
【文献】Choi et al., GRAM: Graph-based attention model for Healthcare Representation Learning, arXiv:1611.07012v3 [cs.LG] April 2017
【文献】Choi et al., RETAIN: an Interpretable Predictive Model for Healthcare using Reverse Time Attention Mechanism, arXiv:1608.05745v3[cs.GL] February 2017
【文献】Zimmerman et al. Acute Physiology and Chronic Health Evaluation (APACHE) IV: hospital mortality assessment for today's critically ill patients, Crit. Care Med., 2006
【文献】Hochreiter S, Schmidhuber J., Long Short-Term Memory. Neural Comput. 9 pp. 1735-1780 (1997)
【文献】A. Vaswani et al., Attention is all you need, arXiv:1706.03762 [cs.CL] (June 2017)
【発明の概要】
【課題を解決するための手段】
【0008】
全体像および概要として、本開示の1つの態様は、電子健康記録から医療イベントを予測して要約するためのシステムを対象とする。本システムは、以下の3つの構成要素を含む。
【0009】
第1に、システムは、多様な年齢、健康状態、および人口統計の多くの(たとえば何百万もの)患者からの集約電子健康記録を格納する、たとえば1つまたは複数のマスデータストレージデバイスといったコンピュータメモリを含み、記録は、とりわけ薬剤、検査値、診断、バイタルサイン、医療ノート(すなわち、提供者によって入力されるフリーテキスト)を含む。集約健康記録は、1つまたは複数のソースから非特定化されて取得された患者であり、旧式のシステムにおける相違が原因で、種々のデータ構造タイプに編成されている可能性がある。集約電子健康記録は、単一の標準データ構造フォーマットに変換され、好ましくは、たとえば発生順などの規則正しいフォーマットで配置される。
【0010】
第2に、システムは、標準データ構造フォーマットに、規則正しいフォーマットで変換された集約健康記録でトレーニングされた1つまたは複数の機械学習モデルを実行するコンピュータ(この用語は、補助メモリを含む、単一のコンピュータ、またはコンピュータのシステム、または処理タスクを共有する処理ユニットを指すことを意図するものである)を含む。深層学習モデルは、所与の患者の入力電子健康記録に基づいて、1つまたは複数の将来の臨床イベントを予測し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベント(たとえば、診断、薬剤、ノート、またはノートの抜粋)を要約またはハイライトするようにトレーニングされる。入力電子健康記録は、標準データ構造フォーマットであり、モデルトレーニングのために使用される集約健康記録と同様に発生順に並べられる。
【0011】
第3に、システムは、たとえばコンピュータ端末もしくはワークステーション、タブレット、スマートフォン、または、1つもしくは複数の予測モデルによって生成された、患者についての予測した1つもしくは複数の将来の臨床イベント、および関連のある過去の医療イベントを表示するクライアント対向インターフェースで構成される画面ディスプレイを有するコンピューティングデバイスの他のタイプといった、患者を治療する医療提供者による使用のための電子デバイスを含む。
【0012】
詳細な説明において、我々は、たとえば病院または医療システムといった複数の種々の機関から非特定化された形式で取得された多数の患者(何十万もの患者、または何百万もの患者までも)からの健康記録の形を集約健康記録がとる場合があるということを説明する。種々の機関からのデータは、業界における標準化不足のため、種々のデータフォーマットである場合がある。記録は、標準データ構造フォーマットに変換される。1つの実施形態において、これらの記録は、患者ごとに時系列に配列される。集約健康記録の中では患者が非特定化される。1つの特定の実施形態において、標準データ構造フォーマットは、既知のフォーマットである、Fast Healthcare Interoperability Resources(FHIR:Fast Health Interoperability Resources)フォーマット(Mandel JC, et al., SMART on FHIR: a standards-based, interoperable apps platform for electronic health records. J Am Med Inform Assoc. 2016;23(5):899-908を参照されたい)であり、この中でEHRは、時系列のFHIR「リソース」の束でフォーマットされている。
【0013】
1つの実施形態において、集約健康記録は、主要な結果、および除外基準、すなわちモデルトレーニングのために所与のEHRが含まれるのを除外するための基準を定義するのに必要な変数を除く、標準用語に調和されていない変数名を含む。1つの実施形態において、集約健康記録は、入院診断を含み、この診断は、単一レベルの臨床分類ソフトウェア(CCS:Clinical Classification Software)コードにマッピングされる。
【0014】
1つの態様において、深層学習モデルの1つまたは複数は、「注目機構(attention mechanisms)」(深層学習の分野において知られ、下記で詳細に説明され、「属性機構(attribution mechanisms)」と呼ばれることもある技法)を含み、起動されると、1つまたは複数の将来の臨床イベントの予測、および関連のある過去の医療イベントに到達するために、どれだけ多くの注目すなわち「重み」を1つまたは複数のモデルが電子健康記録内の微細要素(ノート内の個々の単語、検査測定値、薬剤など)に対応する特定の「トークン」に示したかを示す。提供者対向インターフェースは、特に注目機構から高く点数を付けられた要素といった、特定の予測と関連付けられた健康記録内の要素(すなわち、過去の医療イベント)に対するハイライトまたは強調の度合いを提供することなどによる、注目機構の結果の表示を含むことが好ましい。予測および関連医療イベントに加えて、電子デバイス上の注目機構の結果の表示は、予測およびその基礎に対する信頼を医療提供者に提供し、医療提供者の患者ケアを知らせて誘導するために、予測に関する健康記録の関係要素または特徴に医療提供者の注目を向けさせる。
【0015】
本開示の態様は、予測を行うために使用される深層学習モデルを対象とする。1つの実施形態において、我々は、深層学習ニューラルネットワークモデルのアンサンブルを使用しようと考え、これらのモデルのそれぞれは、集約EHRで個別にトレーニングされる。1つの実施形態において、我々は、(1)長短期メモリ(LSTM:Long-Short-Term Memory)モデル、(2)本明細書において、時間認識注目(Time-Aware Attention)を伴うフィードフォワードモデルとも呼ばれる、時間認識フィードフォワードモデル(FFM:time aware Feed-Forward Model)、および(3)本明細書において、埋込み型時間認識ブーストモデル(Embedded Time-Aware Boosting model)とも呼ばれる、埋込みブースト型時系列モデル(embedded boosted time-series model)を使用する。たとえば、注目を伴う自己回帰型畳み込みニューラルネットワークモデル(autoregressive convolutional neural network model)などのこれらのモデルに対する代替が、本システムにおける使用に適している場合がある(A. Vaswani et al., Attention is all you need, arXiv:1706.03762 [cs.CL] (June 2017)を参照されたい)。1つまたは複数の将来の臨床イベントの予測、および予測した1つまたは複数の将来の臨床イベントに関する要約された関連のある過去の医療イベントは、3つの深層学習モデルのアンサンブル平均から取得されることが可能である。いくつかの事例において、アンサンブルのメンバからの予測は、様々な理由で除外されてよい。
【0016】
我々は、将来の臨床イベントの様々な可能な予測を開示し、1つの実施形態において、深層学習モデルは、集中治療室への計画外搬送、7日より長い入院期間、計画外入院、患者退院後30日以内のER受診もしくは再入院、入院患者の死、1次診断、または患者退院時の1次および2次の請求診断(billing diagnoses)の全セットのうちの少なくとも1つを予測する。我々は、急性腎傷害、低カリウム血症、低血糖症、または低ナトリウム血症などの潜在的なものを含む、異常な検査値を予測する能力も開示する。我々は、モデルが使用されることが可能なさらなる追加の予測タスクを下記で説明する。
【0017】
本開示のさらなる態様は、電子デバイスとその提供者対向インターフェースを対象とする。1つの実施形態において、インターフェースは、(1)予測した1つまたは複数の将来の臨床イベントへの注意喚起、(2)注意喚起に関する主要な医療問題または状態(すなわち、過去の医療イベント)、および(3)注意喚起に関する、たとえば単語または句といったノートまたはノートの抜粋の表示を含む。1つの構成の中で、深層学習モデルは、1つまたは複数の将来の臨床イベントを予測するために、どれだけ多くの注目を1つまたは複数のモデルが電子健康記録内の要素に対応するトークンに示したかを示す注目機構を含む。ノートまたはノートの抜粋の表示は、たとえばフォントサイズ、色、陰影、太字、イタリック体、下線、取り消し線、点滅、ハイライト、フォント選択などを変化させることによる、たとえばノート内の特定の単語、句、または他のテキストに対するハイライトまたは強調の度合いの使用によって、注目機構の適用による結果を示す手法で表示され、それにより予測した将来の臨床イベントに関係するEHR内の最も重要な過去の医療イベントに提供者の注目を引き寄せる。さらに1つのさらなる構成において、表示は、患者の電子健康記録からの推定情報(たとえば、過去の医療イベントから推定される暫定診断)、および死亡またはICUへの搬送などの一定の臨床イベントが将来発生するリスクまたは確率のタイムラインまたはプロットをさらに含むことができる。
【0018】
1つの可能な構成において、表示は、主要な問題または状態のうちの1つを電子デバイスのユーザが選択することを可能にし、選択は、たとえば患者に処方された薬剤、および選択した主要な問題または状態に関するノートまたはノートの抜粋の表示といった、選択した主要な問題または状態に関係する情報のさらなる表示をトリガする。
【0019】
本開示の別の態様において、電子健康記録から医療イベントを予測して要約するための方法が説明される。方法は、
a)多様な年齢、健康状態、および人口統計の多数の患者から電子健康記録を集約することであって、電子健康記録が、薬剤、検査値、診断、バイタルサイン、および医療ノートのいくつかまたは全てを含む、集約することと、
b)単一の標準データ構造フォーマットに、また患者ごとの規則正しい配列に、集約電子健康記録を変換することと、
c)単一の標準データ構造フォーマットに変換された規則正しい配列の集約健康記録で1つまたは複数の深層学習モデルをトレーニングすることと、
d)標準データ構造フォーマットを有し、時系列順に並べられた、患者の入力電子健康記録から、1つまたは複数の将来の臨床イベントを予測し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、トレーニングされた1つまたは複数の深層学習モデルを使用することと、
e)患者についての予測した1つまたは複数の将来の臨床イベント、および関連のある過去の医療イベントを表示する、医療提供者による使用のための電子デバイスの医療提供者対向インターフェースのためのデータを生成することと、
というステップを含む。
【0020】
さらに別の態様において、
a)薬剤、検査値、診断、バイタルサイン、および医療ノートのいくつかまたは全てを含み、種々のフォーマットで取得された、多様な年齢、健康状態、および人口統計の多数の患者からの集約電子健康記録を格納するコンピュータメモリであって、集約電子健康記録が、単一の標準データ構造フォーマットに変換され、発生順などの規則正しい配列で配置される、コンピュータメモリと、
b)患者の入力電子健康記録に基づいて将来の臨床イベントを予測するために、単一の標準データ構造フォーマットに変換された規則正しい配列の集約健康記録でトレーニングされた1つまたは複数の深層学習モデルを実行する(上記で定義されたような)コンピュータと
を組み合わせて備えるシステムが説明される。1つの態様において、1つまたは複数の深層学習モデルはそれぞれ、1つまたは複数の将来の臨床イベントの予測に到達し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、どれだけ多くの注目を1つまたは複数のモデルが電子健康記録内の微細要素(ノート内の個々の単語、検査測定値、薬剤など)に対応する特定の「トークン」に示すかを示す「注目機構」を含む。1つの実施形態において、我々は、深層学習ニューラルネットワークモデルのアンサンブルを使用しようと考え、これらのモデルのそれぞれは、集約EHRで個別にトレーニングされる。1つの実施形態において、我々は、(1)長短期メモリ(LSTM)モデル、(2)時間認識フィードフォワードモデル(FFM)、および(3)埋込みブースト型時系列モデルを使用する。
【0021】
本開示のさらに別の態様において、電子健康記録から医療イベントを予測するための方法が説明される。方法は、
a)多様な年齢、健康状態、および人口統計の多数の患者から電子健康記録を集約することであって、電子健康記録が、薬剤、検査値、診断、バイタルサイン、および医療ノートのいくつかまたは全てを含み、種々のフォーマットで取得される、集約することと、
b)たとえば発生順などの規則正しい配列に患者ごとに並べられた、単一の標準データ構造フォーマットに集約電子健康記録を変換することと、
c)単一の標準データ構造フォーマットに変換された規則正しい配列の集約健康記録で1つまたは複数の深層学習モデルをトレーニングすることであって、トレーニングされた1つまたは複数の深層学習モデルが、標準データ構造フォーマットであり、発生順に並べられた患者の入力電子健康記録に基づいて、将来の臨床イベントを予測する、トレーニングすることと、
というステップを含む。
【0022】
さらに別の態様において、我々は、標準データ構造フォーマットを有し、発生順に並べられた患者の入力電子健康記録に基づいて、1つまたは複数の将来の臨床イベントを予測し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、単一の標準データ構造フォーマットに、発生順で変換された集約電子健康記録でトレーニングされた1つまたは複数の深層学習モデルを実行する(以前に定義されたような)改良型コンピュータを説明した。
【0023】
好ましい実施形態において、深層学習モデルはそれぞれ、1つまたは複数の将来の臨床イベントを予測し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、どれだけ多くの注目を1つまたは複数のモデルが電子健康記録内の電子健康記録要素内の微細要素(ノート内の個々の単語、検査測定値、薬剤など)に対応する特定の「トークン」に示すかを示す注目機構を含む。
【0024】
さらに別の態様において、a)標準データ構造フォーマットを有し、発生順に並べられた患者の入力電子健康記録に基づいて、1つまたは複数の将来の臨床イベントを予測し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、単一の標準データ構造フォーマットに、発生順に変換された集約健康記録でトレーニングされた1つまたは複数の深層学習モデルを実行するコンピュータと、b)患者についての予測した1つまたは複数の将来の臨床イベント、および関連のある過去の医療イベントを表示するように構成される、患者を治療する医療提供者による使用のための電子デバイスのクライアント対向インターフェースとを組み合わせて備えるシステムが開示される。
【0025】
さらに別の態様において、少なくとも1名の患者についての1つまたは複数の将来の臨床イベントの予測の表示を、実質的にリアルタイムに表示する医療提供者対向インターフェースを有する電子デバイス(たとえば、ワークステーション、タブレット型コンピュータ、またはスマートフォン)が開示される。表示はさらに、予測に関する電子健康記録に基づいて動作する予測モデル上の注目機構の適用に対応する、電子健康記録からの要素(過去の医療イベント)を表示するように構成される。1つの実施形態において、電子健康記録の要素は、ノート内の特定の単語、句、または他のテキストに対するハイライトまたは強調のグラデーションがついたノートまたはノートの引用である。電子健康記録の要素は、検査値、前の薬剤、バイタルサインなどなどのものであることも可能である。ハイライトまたは強調のグラデーションは、フォントサイズ、フォント色、陰影、太字、イタリック体、下線、取り消し線、点滅、色付きのハイライト、およびフォント選択、または場合によっては、赤色と太字フォントなどのこれらのいくつかの組合せのうちの少なくとも1つの形をとることができる。予測した1つまたは複数の将来の臨床イベントは、集中治療室への計画外搬送、7日より長い入院期間、患者の退院後30日以内の計画外再入院、入院患者の死、1次診断、1次および2次の請求診断の全セット、または急性腎傷害、低カリウム血症、低血糖症、および低ナトリウム血症などの異常な検査値を含むことができる。
【0026】
1つの実施形態において、インターフェースは、たとえばICUへの搬送のリスク、または7日より長い入院のリスク、または死亡のリスクのプロットといった、少なくとも1名の患者のリスクまたは確率を経時的にプロットするタイムラインを表示するようにさらに構成される。電子デバイスは、複数の患者についての将来の臨床イベントを同時に予測するためにシステムが機能している病院または診療所の環境において使用されることが可能であり、このケースにおいて、インターフェースは、少なくとも1名の患者のリスクまたは確率を経時的にプロットするタイムラインを、複数の患者に対して同時に表示するようにさらに構成される。
【0027】
さらに別の態様において、ヘルスケア提供者が患者にケアを行うのを支援する方法が開示される。方法は、
a)(1)患者についての将来の臨床イベントの予測を生成するため、および(2)患者についての入力電子健康記録から関連のある過去の医療イベントを識別するために、集約電子健康記録からトレーニングされた予測モデルを使用することと、
b)予測と、識別した関連のある過去の医療イベントととの両方に関するデータを生成することと、
c)電子デバイスに表示するために、ヘルスケア提供者によって使用される電子デバイスに、生成したデータを送信することと、
というステップを含み、
予測モデルは、将来の臨床イベントを予測し、関連のある過去の医療イベントを識別するために、どれだけ多くの注目を予測モデルが入力電子健康記録内の要素に示したかを示すために注目機構を使用し、生成したデータは、注目機構の結果を含む。
【0028】
1つの実施形態において、関連のある過去の医療イベントは、ノート(たとえば、医師もしくは看護師から入力されたテキスト)またはノートの抜粋を含む。1つの実施形態において、予測は、集中治療室への計画外搬送、7日より長い入院期間、患者の退院後30日以内の計画外再入院、入院患者の死、1次診断、1次および2次の請求診断の全セット、および異常な検査値からなるグループから選択される。
【0029】
生成したデータは、イベントが経時的に発生する確率またはリスクのタイムラインをさらに含んでよい。
【0030】
1つの実施形態において、ステップa)、b)、c)、およびd)は、多数の入力電子健康記録からの多数の患者に対して同時にリアルタイムに行われる。多数の患者のうちの少なくとも2名をケアするヘルスケア提供者は、少なくとも2名の患者に対して生成したデータをリアルタイムに受信し、それによりヘルスケア提供者が少なくとも2名の患者を同時にケアするのを支援し、個々の予測に基づいて、少なくとも2名の患者に対する患者ケアの優先順位付けを可能にする。
【0031】
別の態様において、本開示は、
a)薬剤、検査値、診断、バイタルサイン、および医療ノートのいくつかまたは全てを含み、種々のフォーマットで取得された、多様な年齢、健康状態、および人口統計の多数の患者からの集約電子健康記録を格納するコンピュータメモリであって、集約電子健康記録が、単一の標準データ構造フォーマットに変換され、規則正しい配列に患者ごとに並べられる、コンピュータメモリと、
b)患者の入力電子健康記録に基づいて将来の臨床イベントを予測するために、単一の標準データ構造フォーマットに変換された規則正しい配列の集約健康記録でトレーニングされた1つまたは複数の深層学習モデルを実行するコンピュータと
を含むシステムを対象とする。
【0032】
1つの実施形態において、集約健康記録は、種々のデータフォーマットで配列された健康記録の形式である。標準データ構造フォーマットは、Fast Healthcare Interoperability Resources(FHIR)の形をとってよい。集約健康記録は、主要な結果および除外基準を定義するのに必要な変数を除く、標準用語に調和されていない変数名を含む。集約健康記録は、入院診断を含んでよく、診断は、単一レベルの臨床分類ソフトウェア(CCS)コードにマッピングされる。1つの実施形態において、電子健康記録は、患者ごとに発生順に並べられる。
【0033】
別の態様において、多様なデータフォーマットの多様な発生源からの多数の患者の未加工電子健康記録のセットから、機械学習のためのトレーニングデータを生成するための方法が開示される。方法は、
a)未加工電子健康記録のセットを取得することと、
b)未加工電子健康記録のセットを単一の標準データ構造フォーマットに変換することと、
c)単一の標準データ構造フォーマットに変換された電子健康記録を、患者ごとの時系列順に並べることと、
d)標準データ構造フォーマットの時系列に並べられた電子健康記録をデータストレージデバイスに格納することと
というステップを含む。
【0034】
電子健康記録のセットは、構造化データと、フリーテキストノートを含む構造化されていないデータとの両方を含むことができる。1つの実施形態において、変換するステップb)は、未加工電子健康記録内の用語を標準用語に調和させずに行われる。
【図面の簡単な説明】
【0035】
図1】集約電子健康記録、トレーニングされた深層学習モデルを実行するコンピュータ、ならびに深層学習モデルからの予測、および予測に関する関連のある対応する過去の医療イベントを受信し、ディスプレイにこのような情報を提示するためのインターフェースを有する、医療提供者によって使用される電子デバイスを含む全体システムの概略図である。
図2】時系列順に未加工電子健康記録をFHIRリソースに変換するための図1のシステムにおいて使用される手順の例証を示す図である。
図3A図1の時間認識フィードフォワードモデルのデザインおよび動作を示す流れ図である。
図3A1図1の時間認識フィードフォワードモデルのデザインおよび動作を示す流れ図である。
図3A2図1の時間認識フィードフォワードモデルのデザインおよび動作を示す流れ図である。
図3B図1の埋込みブースト型時系列モデルのデザインおよび動作を示す流れ図である。
図3B1図1の埋込みブースト型時系列モデルのデザインおよび動作を示す流れ図である。
図3B2図1の埋込みブースト型時系列モデルのデザインおよび動作を示す流れ図である。
図3C図1のLSTMモデルのデザインおよび動作を示す流れ図である。
図3C1図1のLSTMモデルのデザインおよび動作を示す流れ図である。
図3C2図1のLSTMモデルのデザインおよび動作を示す流れ図である。
図4】薬剤、遭遇、処置、ノート、指示などを含む患者のタイムラインまたは一連のイベントにおける、深層学習モデルにおける注目機構の結果を示す提供者対向インターフェース上のデータの表示の1つの形式の例証を示す図である。
図5】単語が深層学習モデルによって生成された臨床予測のためのものであったという注目(重要性または重み)、および医療履歴内の特定の薬剤が予測のためのものであったという注目に対応する、ノート内の個々の単語または句に与えられる強調の度合い(大きさ、太さ、色など)の付いたノートの抜粋の形で深層学習モデルにおける注目機構の結果を示すEHR内のデータの表示の別の形式の例証を示す図である。
図6】予測に関連する種々の強調の度合い(太字)をもたらされる、EHRのノートの中で見つかった種々の単語または句を示す、深層学習モデルにおける注目機構の結果の別の例を示す図である。ハイライトが濃ければ濃いほど、注目点数がますます高くなることに対応する。
図7】モデルトレーニングのために使用される患者記録の元のセットのテストセット部分に遡及的にモデルを適用することから取得された精度の統計情報と共に、異常な検査結果を含む、本開示のモデルが行うために使用されることが可能な様々なタイプの予測の例証を示す図である。
図8A】たとえば、コンピュータ端末、タブレット、スマートフォン、または画面ディスプレイを有するコンピューティングデバイスの他のタイプといった、患者を治療する医療提供者による使用のための電子デバイスの医療提供者対向インターフェースの例証を示す図である。本構成におけるインターフェースは、病院における使用のためにデザインされ、2名の患者についてのリスクのプロットを同時に示す。インターフェースは、特定の患者についての2つの予測した将来の臨床イベント、この場合、集中治療室(ICU)への計画外搬送、および病院からの遅延退院を表示する。図8Aの表示は、リスクのある患者に対して医療提供者の注目を早期に注意喚起するようにデザインされる。
図8B】注意喚起のある患者を提供者が選択した後の、図8Aのインターフェースの例証を示す図である。表示は、主要な医療問題(予測に関する医療イベント)を提供者に注意喚起することによって、提供者が患者を今理解すること、モデルの注目機構の結果を伴うノートを含む患者ケアに関する決定を行うために、提供者が目を向ける必要がある可能性のある状態または他のデータを掘り下げること、および提供者が重要情報を見逃さないようにすることに役立つ。
図9】外来患者の予測時のインターフェースの使用に関係するインターフェース上のツールの表示を示す図である。
図10】EHRから医療提供者が利用できる大量の情報、および本開示の特徴が必要である理由の仮定の実施例を示す図である。図10は、400以上のリスト化された診断を伴う、患者の医療履歴のうちの4年間からの抜粋を示す。
図11】EHRから医療提供者が利用できる大量の情報、および本開示の特徴が必要である理由の仮定の実施例を示す図である。図11は、患者が、外来患者として、入院患者として、またはICUもしくは他の状況において治療されたかどうかなどの重要な付随情報の不足を除く、患者に対する診断の抜粋を示す。
図12】EHRから医療提供者が利用できる大量の情報、および本開示の特徴が必要である理由の仮定の実施例を示す図である。図12は、所与のタイムスパンにわたる特定の患者についての150以上の種々の遭遇を示すが、各遭遇において起こったことについての詳細がない。
図13】EHRから医療提供者が利用できる大量の情報、および本開示の特徴が必要である理由の仮定の実施例を示す図である。図13は、1つの仮定の4日間の入院時に提供者によってとられた、たった1つのほんのわずかのノートを示し、ノートの全ての表示が、標準的なモバイルデバイスの60個の異なる画面を必要とする。
図14】4名の患者についてのデータおよびリスクをリアルタイムで追跡する、図3のデバイスのインターフェースの例を示す図である。
図15】予測(ICU搬送、遅延退院)に関連し、患者のタイムラインに提示される、EHR内の150件の過去の遭遇における主要イベントだけの選択を示す図8Bのインターフェースを示す図である。
図16】予測(ICU搬送、遅延退院)に関連する、EHR内の400件の過去の診断のリストからの主要な問題だけの選択を示す図8Bのインターフェースを示す図である。主要な問題(すなわち、関連のある過去の医療イベント)は、問題一覧エリアにおける表示の左側に概要として提示される。
図17】予測(ICU搬送、遅延退院)に関連する、EHR内のノートにおける10,000個の単語からの主要で重要な抜粋または単語だけの選択を示す図8Bのインターフェースを示す図である。主要な抜粋(単語および句)は、予測を生成するときの深層学習モデルにおける注目機構の使用の結果として、特定の単語または句へのハイライトの度合いで、インターフェースの右下のエリアに提示される。
図18】リスト化された各医療問題を要約するためのインターフェースの能力を示す図8Bのインターフェースを示す図である。この実例において、図8Bの表示における「アルコール離脱症状」という主要な問題をクリックすると、表示は、主要な問題に関するイベントの薬剤、ノート、およびタイムラインを示す。
図19】タイムライン、薬剤、および関連付けられたノートの形で、「心筋症」という主要な問題の概要を示す図である。
【発明を実施するための形態】
【0036】
図および付随の説明において、全ての患者および提供者の名前ならびに医療データは架空のものであり、いずれの秘密の患者情報も明らかにするものではない。
【0037】
A.全体像
本開示は、予測モデルのトレーニング時の使用のためにEHRデータを構成する新しい方法を説明する。モデルは、臨床ノート、未加工の調和されていないフォーマットまたは用語における変数を含む、患者について記録された全てのデータを使用し、データコレクションの時間的順序を保つ。我々は、EHRデータから臨床予測を行うために、モデルを生成してトレーニングするための深層学習の態様をさらに適用した。我々は、深層学習が何百万もの変数を取り扱い、種々のソースからのデータを自動的に調和させることができ、可変長の一連のデータを収容するので、深層学習を選んだ。深層学習技法は、(たとえば、糖尿病性網膜症および癌性皮膚病変の検出のための)医療画像認識、および言語翻訳のような他の複合ドメインにおいて、最先端の性能を実現してきた。本問題ドメインに対するこれらの深層学習モデルの応用および実行の多くは、新しいものであると思われている。
【0038】
本文書は、我々のアプローチの技術的実現性および臨床的有用性をさらに実証する。我々は、スループットを改善し、コストを低減させるために入院期間を予測すること、高リスクの患者への介入を対象とするために計画外再入院を予測すること、早期介入の展開を支援するために入院患者の死を予測すること、臨床決定サポートを可能にするために、日常の臨床データから診断を予測すること、およびフェノタイピングを行うこと(phenotyping)を含む、複数の臨床タスクのための予測モデルを説明する。さらに、我々は、集中治療室への病院内の患者の計画外搬送、および1次診断を予測するためのモデルの応用を説明してきた。さらに、我々は、これらの予測、および提供者がタイムリに患者を治療するのを支援する基礎となる関連医療イベントを提示する、電子デバイス(たとえば、コンピュータ端末、タブレット、またはスマートフォン)の提供者対向ユーザインターフェースを説明する。
【0039】
図1は、電子健康記録から医療イベントを予測して要約するためのシステム10を示す。システムは、以下の3つの構成要素を含む。
【0040】
第1に、薬剤、検査値、診断、バイタルサイン、および医療ノート(たとえば、診療医師および看護師によって書かれたフリーテキストノート)を含む、多様な年齢、健康状態、および人口統計の多数の患者からの集約電子健康記録22を格納する、たとえばマスデータストレージデバイスといったコンピュータメモリ24が説明される。集約電子健康記録は、単一の標準データ構造フォーマットに変換され、たとえば発生順に患者ごとに並べられる。種々の機関14(たとえば、大学医療センタ、病院システムなど)からの大量の患者の未加工電子健康記録12は、現在使用中の多種多様の旧式の電子健康記録システムが原因で、様々な異なる電子フォーマットでフォーマットされている場合がある。未加工健康記録は、患者が非特定化され、コンピュータネットワーク16で送信され、リレーショナルデータベース(RDB:relational database)20に格納され、コンバータとして機能するコンピュータシステム18によって標準フォーマットに変換され、メモリ24に格納される。これらの記録は、標準データ構造フォーマットに変換され、規則正しい配列で配列され、好ましい実施形態においては時系列で配列される。1つの特定の実施形態において、標準データ構造フォーマットは、既知のフォーマットである、Fast Healthcare Interoperability Resources(FHIR)フォーマットであり、このフォーマットで、EHRは、図1において22と示された時系列のFHIR「リソース」の束にフォーマットされる。これは、図2と共に後で説明されることになる。
【0041】
第2に、システムは、単一の標準データ構造フォーマットに変換された時系列順の集約健康記録22でトレーニングされた1つまたは複数の深層学習モデル(下記で説明される28、30、32)を実行するコンピュータ26(この用語は、単一のコンピュータ、またはコンピュータのシステム、または補助メモリと共に処理タスクを共有する処理ユニットを指すことを意図するものである)を含む。深層学習モデルは、所与の患者36の入力電子健康記録38に基づいて、1つまたは複数の将来の臨床イベントを予測し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベント(たとえば、問題、状態、テスト結果、薬剤など)を要約するためにトレーニングされる。入力健康記録38は、モデルトレーニングのために使用される集約健康記録と同様に標準データ構造フォーマットであり、発生順に並べられる。入力健康記録38は、必要であれば、破線39によって示されるように、コンバータ18によってFHIRフォーマットに変換されることが可能である。
【0042】
図1は、単一の患者からの入力電子健康記録38の受信を示すが、実際には、これは、システムの広がりの範囲に応じて、医療システムまたは病院の全体にわたって、他の多くの他の患者に対して本質的に同時に発生していてよいということが正しく認識されよう。図1のシステムは、入力健康記録に基づいてモデルを動作させ、予測、および全てのこれらの患者のEHRを同時にリアルタイムに予測するための対応する過去の医療イベントについてのデータを生成することと、デバイスのクライアント対向インターフェースに表示するために電子デバイス40にデータを送信することとをコンピュータ26(または、コンピュータのシステム)が行うのに十分な計算リソースを用いるのが好ましい。
【0043】
第3に、システムは、たとえばコンピュータ端末もしくはワークステーション、タブレット、スマートフォン、または画面ディスプレイを有するコンピューティングデバイスの他のタイプといった、患者を治療する医療提供者による使用のための電子デバイス40を含み、患者についての予測した1つまたは複数の将来の臨床イベント、および関連のある過去の医療イベントを表示するクライアント(医療提供者)対向インターフェース(図8A図8B図9図14など)で構成される。将来予測される臨床イベントおよび対応する過去の医療イベントの表示は、ICU搬送、遅い退院、死などの予測などの予測に関係する患者の電子健康記録内の非常に関係のある情報に、医療提供者42(たとえば、看護師または医者)が自分の注目をフォーカスするのを支援する。デバイス40の使用、およびこの支援を提供するためのインターフェースの例は、図8A図19と共に、および例において、後で説明される。
【0044】
本開示の別の態様において、電子健康記録から医療イベントを予測して要約するための方法が説明される。方法は、
a)多様な年齢、健康状態、および人口統計の多数の患者から電子健康記録12を集約することであって、電子健康記録が、薬剤、検査値、診断、バイタルサイン、および医療ノートを含む、集約することと、
b)規則正しい配列に患者ごとに並べられた、単一の標準データ構造フォーマットに集約電子健康記録を変換すること(コンバータ18によって生成された時系列のFHIRリソースの束22を参照されたい)と、
c)単一の標準データ構造フォーマットに変換された規則正しい配列の集約健康記録22で1つまたは複数の深層学習モデル28、30、および32をトレーニングすることと、
d)標準データ構造フォーマットを有し、発生順に並べられた患者36の入力電子健康記録38から、1つまたは複数の将来の臨床イベントを予測し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約するために、トレーニングされた1つまたは複数の深層学習モデル28、30、および32を使用することと、
e)患者を治療する医療提供者42による使用のための電子デバイス40の医療提供者対向インターフェース(図8A図8B図14図19など)のためのデータを生成することであって、データが、患者についての予測した1つまたは複数の将来の臨床イベント、および関連のある過去の医療イベントを表示する、生成することと
というステップを含む。
【0045】
システムおよび方法の構成要素の態様は、よりいっそう詳細にこれから説明される。
【0046】
B.モデル生成のための単一フォーマットへの電子健康記録の統合
上述のように、未加工電子健康記録12は、多数の患者(何十万もの患者、または何百万もの患者までも)からの健康記録の形をとってよい。集約健康記録は、1つまたは複数の異なる機関から取得されることが可能である。EHRデータは、業界における標準化不足が原因で、異なるデータフォーマットである場合がある。これらの記録は、標準フォーマットに変換され、規則正しい配列で配列される。これは図2に示され、この中で患者の未加工電子健康記録12は、遭遇テーブル50(医師の診察室、検査室、病院などへの患者の全ての受診)、全ての検査室テストおよび結果を含む検査テーブル52、ならびにバイタルサインデータ、医療ノート(フリーテキスト)、人口統計学データ、診断、フローシートなどなどのデータを含む他のテーブル(図示せず)を含む。患者データは匿名化され、個人識別データは含まれない。データを受信し、モデルをトレーニングするためにデータを使用する許可は、機関から取得される。未加工データを表すこれらのテーブル50、52は、図1のRDB20に格納される。次に、コンバータ18は、未加工データを標準フォーマット、この例においては、図2に示されるようなFHIRリソース22A、22B、22C、22D等のコレクションに変換し、各患者について、このようなFHIRリソースの「束」またはセット22が存在する。図2の54において示されるように、これらのリソースは、その後、タイムライン作り出すために時系列順に、またはEHR内の全てのデータの発生順に配置される。
【0047】
我々の予測モデルを生成するために我々が使用したデータセットの詳細は、2017年7月28日に出願の我々の先の米国仮出願第62/538,112号の付録Aに示されている。手短に言えば、我々のモデル開発において、我々は、カリフォルニア州サンフランシスコのUniversity of California, San Francisco(UCSF)、イリノイ州シカゴのUniversity of Chicago Medicine(UCM)、およびマサチューセッツ州ボストン(MIMIC-III)のBeth Israel Deaconess Medical Centerから、電子健康記録データを取得した。これらの電子健康記録は、全ての州および連邦のプライバシー法(HIPAAを含む)を遵守して共有された、非特定のまたは限定的なデータセット形式のものであった。我々は、2013年から2015年までの間の7千万人の患者を横断する20億件の遭遇の記録を保持する、"Uranus"として内部で知られる、メディケアおよび商業権利についての非特定化された全国データベースも使用した。UCSFのデータは、様々な大きさのいくつかの病院を伴う、アカデミック医療システムからの2011年から2016年までの間に遭遇のある全ての患者を含む。UCMの非特定化されたデータは、いくつかの病院からの2009年から2016年までの間の全ての大人の患者の遭遇を含む。MIMICの非特定化されたデータセットは、2001年から2012年までの、マサチューセッツ州ボストンの救命医療ユニットにおける患者の遭遇と関連付けられたデータを含む。当然、電子健康記録は、他の機関から集約され、取得されることが可能であるので、開発セットの細目は、特に重要なものであると思われているわけではなく、モデルの精度を改善するために十分に大きいセットが使用されるべきである。
【0048】
各EHRデータセットは、患者の人口統計、全ての入院患者および外来患者の遭遇、EHRに入力された順序、診断、処置、薬剤、検査値、バイタルサイン、および他の全ての構造化データ要素(たとえば看護フローシート)を表すフローシートデータを含んでいた。さらに、UCMおよびMIMIC-IIIからのデータセットは、非特定化された医療ノートを含んでおり、UCMからのデータセットは、手術中のバイタルサイン、および外来患者の外科フローシートデータも含んでいた。
【0049】
Uranusの権利データセットは、患者の人口統計、全ての入院患者および外来患者の遭遇、診断コード、処置コード、および外来患者の処方箋を含んでいた。
【0050】
データは、UCMデータセット内の日付を除いて非特定化されており、HIPAAの下での限定的なデータセットの開示および使用のための全ての要件を遵守していた。倫理審査および施設内審査委員会の適用免除は、各機関から取得された。患者データは、いずれのGoogleユーザデータにもリンクされていなかった。さらに、モデルを作り出すために使用される集約電子健康記録について、我々のシステムは、規制、データライセンス、および/またはデータ使用同意に従って、各EHRデータセットを互いに分離されたままにするサンドボックスインフラストラクチャを含む。各サンドボックス内のデータは暗号化され、全てのデータアクセスは個人レベルで制御され、ログに記録され、検査される。
【0051】
我々は、全ての健康システムおよび予測のために使用された各システムからのデータを格納するために、Fast Healthcare Interoperability Resources(FHIR)に基づいて集約EHRのための単一データ構造を開発した。FHIRは、リソースのセットとしての臨床データの標準的な表現(単一の遭遇または検査室テストのような特定のデータタイプを含むモジュールのエントリ)を可能にするオープンソースフレームワークである。健康システムによって収集された様々なタイプのデータは、これらの対応するFHIRリソースに変換された。
【0052】
FHIRフォーマット(「リソース」、図2を参照されたい)にデータを変換するとき、我々は、標準用語に変数名を調和させず、代わりに健康システムによって提供された未加工の用語を使用し、従来の時間のかかるデータ調和を控えた。退院措置、病院サービス、診断コード、および処置コードという、主要な結果および除外基準を定義するのに必要な変数に対して唯一の例外が行われた。入院診断はICD-9/10コードとして提供され、我々は、単一レベルの臨床分類ソフトウェアカテゴリ(CCS; Agency for Healthcare Research and Quality)にこれらをマッピングし、入院処置は、ICD-9/10、および医師診療行為用語(CPT: Current Procedural Terminology)の処置コードとして提供され、CCSコードにもマッピングされた。
【0053】
次に、所与の患者のためのリソースのセットが発生順に組み立てられた。この一連のイベントは、EHR内の各患者のタイムラインの忠実な表現を提供した。請求コードは、遭遇の終わりの直後のタイムスタンプを割り当られる。
【0054】
バイタルサインのような一定の要素は、これらが収集された後、EHRに入力されることが可能である。我々は、リアルタイムにEHR内でデータが利用できるようになるときに、データをモデル化するために収集されたものとしてデータが記録されたときではなく、EHRへのデータの入力に対応する看護書類の作成およびバイタルサインのタイムスタンプを使用した。
【0055】
C.医療記録から健康イベントを予測するための深層学習モデル
図1に示されるように、我々のシステムは、単一の標準データ構造フォーマットに変換された時系列順の集約健康記録22でトレーニングされた深層学習モデル28、30、および32を実行するコンピュータ26(すなわち、コンピュータまたはプロセッサと補助メモリのセット)を含む。モデルは、患者36の入力電子健康記録38に基づいて1つまたは複数の将来の臨床イベントを予測し、予測した1つまたは複数の将来の臨床イベントに関する関連のある過去の医療イベントを要約する。入力したEHRは、元々のまま、または必要であればコンバータ18による変換後に、同じ標準データ構造フォーマットでフォーマットされ、発生順に並べられる。
【0056】
理論上は、単一のトレーニングされたモデルを使用することしかできないが、オーバーフィットを避け、将来の臨床イベントを予測する際に高い精度をもたらすために、我々は、集約電子健康記録を別々に作るデータセットでそれぞれがトレーニングされる、3つの異なるモデルを使用することが有利であるということがわかった。深層学習モデルのうちの少なくとも1つは、1つまたは複数の将来の臨床イベント、および予測した1つまたは複数の将来の臨床イベントに関する関連した関連のある過去の医療イベントを予測するために、どれだけ多くの注目(すなわち、どれだけ重大であるか)をモデルが「トークン」(すなわち、ノート内の個々の単語、薬剤、検査結果などの電子健康記録内の微細要素)に示したかを示す注目機構を含む。深層学習ニューラルネットワークにおける注目機構の使用は、D. Bahdanau et al., Neural Machine Translation by Jointly Learning to Align and Translate, Jan. 2014 (arXiv:1409.0473[cs.CL]の学会発表において説明されている。医療の背景における注目機構のさらなる説明は、Choi et al., GRAM: Graph-based attention model for Healthcare Representation Learning, arXiv:1611.07012v3 [cs.LG] April 2017、およびChoi et al., RETAIN: an Interpretable Predictive Model for Healthcare using Reverse Time Attention Mechanism, arXiv:1608.05745v3[cs.GL] February 2017を含む。Choi et al.とBahdanauの参照の内容は、本明細書において参照により組み込まれる。
【0057】
我々の好ましい実施形態において、我々は、重み付けされた回帰型ニューラルネットワークモデルである長短期メモリ(LSTM)モデル28、(本明細書において、時間認識注目を伴うフィードフォワードモデルとも呼ばれる)時間認識フィードフォワードモデル(FFM)30、および本明細書において、ブースト型時間認識スタンプを伴うフィードフォワードモデルとも呼ばれる、埋込みブースト型時系列モデル32、という3つの異なるモデルを使用する。先の我々の米国'112仮出願の付録B、および図3A図3Cの説明は、3つのモデルのアーキテクチャ、デザイン、および実装形態に関するさらなる詳細を示す。
【0058】
これらのモデルによって行われることが可能な様々な予測タスクが存在し、これらのいくつかが、ここで少し詳しく、また、先の我々の米国'112仮出願の付録Aの中で説明される。これらは、長引く入院期間、計画外再入院、ICUへの計画外搬送、入院患者の死、1次診断コード、および退院時の請求診断コードの全セットを含む。これらの予測は、タスクごとの予測変数の選択またはエンジニアリングなく行われる。
【0059】
5つの予測タスクの結論が下記で定義される。全ての予測に対して、我々は、入院時、24時間後または退院後という、予測が行われるときまでに(権利データベースを除く)EHR内で利用可能な全ての情報を使用する。我々は、APACHEなどの臨床予測モデルにおいて24時間が一般に使用されるので、24時間を選択した。たとえば、Zimmerman et al. Acute Physiology and Chronic Health Evaluation (APACHE) IV: hospital mortality assessment for today's critically ill patients, Crit. Care Med., 2006。
【0060】
入院時刻は、入院患者ステータスのスタートとして定義され、救急部門および外来手術からのデータが入院より前に利用可能であることを意味する。
【0061】
MIMICデータセットについて、この時点はICU入院に関するものであった。権利データは日レベルの属性しか有していないので、入院日に行われた予測は、入院と同じカレンダ日付に出された権利を含む。
【0062】
入院患者の死
我々は、入院患者の死亡を予測し、「期限切れ」の退院措置として定義した。
【0063】
長い入院期間
我々は、7日より長い入院期間を予測し、これは、データセット全体にわたるほとんどのサービスに対するおよそ75番目のパーセンタイルの入院として選び出された。入院期間は、入院と退院の間の時間として定義された。
【0064】
30日の計画外再入院
我々は、入院中および入院前の上記のデータ要素の全てを考慮して、入院からの退院後に続く30日以内の将来の計画外再入院を予測した。「計画外」についての受け入れられた定義は存在しないので、我々は、再入院が、先の我々の米国'112仮出願の付録Bに詳細がある、急性合併症、化学療法、移植、またはリハビリテーションのための入院ではない、計画された処置のためのものである場合の再入院が除外されるという、Centers for Medicare and Medicaid Services(CMS)の定義の修正形を使用した。再入院は、いずれの介在する入院もなく、適格な指標となる入院の、前の退院時刻の30日以内に入院時刻があった場合に含められた(すなわち再入院は1度しか数えられることがない)。
【0065】
診断 - 1次および全セット
各入院について、我々は、(どのクラスタが、敗血症または結核などのおよそ250のグループに診断および処置を関連させるかというCCSカテゴリを使用して)1次診断を予測することによって、何に対して患者が治療されている可能性が最もあるかを分類した。我々は、1次および2次のICD-9請求診断のセット全体(すなわち14,025個のコードの母集団から)も予測した。我々は、正確なICD-9コードを必要としない判定サポートのために使用されることが可能な割当てを模倣するために、1次診断に対してCCSカテゴリを使用した。
【0066】
研究コホートにおける包含および除外基準
我々は、文献と比較できるように、年齢制限を我々が使用しなかった1つのデータセットを除いて、18歳以上の患者に対する全ての連続的な入院を含めた。我々は、様々な時点での予測が同一のコホートを有することを保証するために、24時間以上の入院しか含めなかった。
【0067】
リアルタイム予測システムの実用的な精度に似せるために、我々は、入院の初期に予測するときにこれらの除外基準が知られていないので、医療助言に反して退院させられたような、再入院の研究によって典型的に除去される患者を除外しなかった。
【0068】
ICD-9診断の完全なセットを予測するために、我々は、データセットあたりおよそ2パーセントから12パーセント存在する、いずれのICD-9診断も伴わない遭遇を除外した。これらは一般に、病院がICD-10に切り替えた2015年10月以降の遭遇である。しかし我々は、他の全ての予測のためにこのような入院を含めた。
【0069】
既存の文献と比較するために、我々は、医療または外科サービスに対する(すなわち、産科を除く)指標入院の制約されたセットも作り出した。
【0070】
モデルデザインおよびトレーニング
我々は、EHR内の一連の患者イベントをモデル化することを考慮するモデル28、30、および32(図1)に対して3つのタイプの深層学習アーキテクチャを使用した。我々は、モデル28を作り出すために長短期メモリ(LSTM)(Hochreiter S, Schmidhuber J., Long Short-Term Memory. Neural Comput. 9 pp. 1735-1780 (1997)を参照されたく、本内容は本明細書において参照により組み込まれる)と呼ばれる回帰型ニューラルネットワークのよく知られたバージョンを使用した。我々は、モデル30を作り出すための時間認識フィードフォワードモデル(FFM)、およびモデル32を作り出すための埋込みブースト型時系列と呼ぶ2つの新しい方法を作り出し、これらについて、我々の先の米国'112仮出願の付録Bにおいて説明している。第1の2つのモデル28および30に対して、我々は、予測に最も影響を及ぼすデータ要素をハイライトするために、注目機構(以前に引用したBahdanau et al.の書類を参照されたい)を実行した。各モデルは、長い一連の患者イベント、変数の動的変化、および遠く離れた履歴患者データの影響という、EHRデータによる特定の難題に対処することに向けて合わされた。
【0071】
各モデル28、30、および32は、コホート内の各データセットで別々にトレーニングされた。予測について、ほとんどいくつかの実例において、我々は、最終的な予測点数を見つけるために各モデルから予測の平均をとった。他の実例において、我々は、たとえば特定のタスクまたは予測に対して調整されていないモデルのうちの1つからの結果を除外し、残りのモデルの予測点数を平均する。
【0072】
患者のEHRは、開発セット(80%)、有効化セット(10%)、およびテストセット(10%)にランダムに分割された。任意の暗黙的なオーバーフィットを防ぐために、テストセットは、最終的な評価まで未使用の(および隠れた)ままにした。モデルの精度はテストセットについてレポートされ、テストセットのブートストラップは、999回、95%の信頼区間を計算するために使用された。ゴールは、個別化された予測を作り出すことであり、個人の予測者の寄与を評価することではないので、我々は、患者内クラスタリングを無視した。
【0073】
各予測タスクに対して、我々は、遡及的なモデル性能を判断するために、既存の文献に基づいて手作りされた変数でベースラインモデルを作り出した。ベースラインモデルについての詳細は、我々の先の米国'112仮出願の付録Bにおいて説明されている。LSTMおよびフィードフォワードモデル28および30は、Tensorflow(バージョン1.0)でトレーニングされ、ブーストモデル32は、カスタムC++コードで実行された。統計分析およびベースラインモデルは、SciKit learn Python(0.18.1)において行われた。
【0074】
全てのモデルは、各トークン(たとえば、EHRの微細要素)を表すために埋込みベクトルを学習する。トークンは、たとえばノート内の単語、薬剤の名前、または特定の検査室テストの離散化値であることが可能である。埋込みは、ランダムに初期化され、モデルトレーニングは、予測性能を改善するために埋込みを更新した。
【0075】
図3Aは、図1のFFM30のデザインおよび実行を示す流れ図である。ステップは、本質的に以下のようなものである。
【0076】
ステップ(1)は、たとえば予測の瞬間に対する相対的なタイムスタンプ(デルタ時間)を有する元のEHR内のデータを示す。
【0077】
ステップ(2)は、各データ要素が埋め込まれていることを示し、d次元ベクトルに変換されたことを意味する(この変換はモデルによって学習される)。
【0078】
ステップ(3)は、各デルタ時間が埋め込まれていることを示し、区分線形分割を相互にエンコードするk関数を使用して、k次元ベクトルに変換されたことを意味する(この変換はモデルによって学習され、所定のまたは学習された関数A1...Akのバンクを生じる)。
【0079】
ステップ(4)は、注目データ射影行列を生じるように、学習された射影行列にデータ埋込みを乗じることを示し、これは、列ドット積演算子を使用して時間埋込み行列を乗じて、アルファ(α)ベクトルを生じる。
【0080】
ステップ(5)は、αベクトルがsoftmax関数に位置付けられ、ベータ(β)ベクトルを生じることを示す。
【0081】
ステップ(6)において、ベータベクトルにデータ埋込み行列を乗じ、最後にシグモイドまたはsoftmax関数によって、フィードフォワードネットワークに入力される次元Dの低減されたレコードベクトル(すなわち、内部ReLu(矯正線形ユニット)のいくつかのレイヤ)を生じ、予測出力を生じる。
【0082】
モデルの出力は、シグモイドの出力であり、ステップ(4)から学習された注目ベクトルである。
【0083】
図3Bは、図1の埋込みブースト型時系列モデル32のデザインおよび動作を示す流れ図である。ステップは、本質的に以下のようなものであり、ステップ(1)は、たとえば予測の瞬間に対する相対的なタイムスタンプ(デルタ時間)を有する元のEHR内のデータを示す。ステップ2)において、各データ要素は、特定の(相対的な)時点における特定の値/トークンの存在を示すバイナリ特徴f0...fNに調整される。いくつかのt>Tにおける形式の各述語はv>Vである。相互にこれらは、NビットのベクトルVを形成する。
【0084】
ステップ(3)において、ベクトルVに、次元Dの(学習された)埋込みベクトルEを乗じて、集約され(たとえば、合計され)、D次元ベクトルを生じる。
【0085】
ステップ(4)において、このD次元ベクトルは、たとえばシグモイドで終わるいくつかのELU(指数関数的線形ユニット)レイヤのネットワークに入力される。ネットワークの出力は、シグモイド関数の出力である。
【0086】
図3Cは、図1のLSTMモデル28のデザインおよび動作を示す流れ図である。ステップは、本質的に以下のようなものである。
(1)各特徴カテゴリ(たとえば、薬剤、ノート、バイタルサイン)に対して、各データポイントが、Dcategoryの大きさのベクトルに埋め込まれる。
(2)全てのデータは、たとえば1日のバッグの中で考えられる。特徴タイプごとに、バッグ内の全てのベクトルに対して重み付き平均が計算され、たとえばこのバッグに対する平均薬剤ベクトルを生じる。
(3)たとえば1日といったバッグごとに、全ての平均特徴ベクトルが結合され、全ての特徴タイプに対して、大きさD=Dmedication+Dnote+Dvitalのベクトル等を生じる。
(4)これらの平均ベクトルは、LSTMモデルに入力され、各ベクトルは、シーケンス内の1つのステップを表す。
(5)LSTMの出力は、softmax関数(たとえば1次診断を識別する複数クラス分類のため)、またはロジスティック関数(たとえば死といった確率タスクのため)に入力される。
【0087】
これらのモデルに対する代替は、たとえば注目を伴う自己回帰型畳み込みニューラルネットワークモデルなどの本システムにおいて使用するのに適したものであってよい(A. Vaswani et al., Attention is all you need, arXiv:1706.03762 [cs.CL] (June 2017)を参照されたい)。
【0088】
上述のように、モデルは、患者に対する特定の予測を行うためにモデルによって使用される特定のトークンに対する、重みまたは「注目」の粒度の細かい可視化を可能にする注目機構を使用する。いくつかの例が、図4図5、および図6と共にこれから説明される。
【0089】
図4は、薬剤、遭遇、処置、ノート、指示などを含む患者のタイムラインまたは一連のイベントにおける、深層学習モデルにおける注目機構の結果を示すEHR内のデータの表示64の1つの形式の例証である。この特定の例において、それぞれの丸は、薬の投与、検査室テスト、処置、ノート、または指示などの予測に関する特定のイベントの発生(この場合、入院患者の死という予測リスク)を示す。タイムラインは、患者が入院した日付、およびこの例において、2日にわたる特定の時点におけるこれらの記録の抜粋(たとえば、薬剤、ノート、レポートなど)を示す。図5は、注目(重要性、または重み)に対応するノート内の個々の単語に与えられた強調の度合い(大きさ、太さなど)を伴うノートの抜粋の形で、深層学習モデルにおける注目機構の結果を示すEHR内のデータの表示の別の形式の例証であり、単語は、深層学習モデルによって生成された臨床予測に対するものであり、医療履歴における特定の薬剤は、予測(肺炎および貧血を伴う転移性黒色腫という診断)に対するものである。EHR内のフリーテキストノートからの用語「黒色腫」、「転移性」、「エンケースメント」、「喀血」等は、EHRのこれらの要素がモデルによって生成された予測に関係するか、関連する提供者の注目を向けるために、より大きいフォント、およびより濃い色で示される。図6は、深層学習モデルにおける注目機構の結果の別の例であり、アルコール関連疾患の診断の予測に関連する、異なる強調の度合い(太さ、フォントサイズ)を与えられた、EHRのノートの中で見つけた種々の単語を示す。より濃いハイライトは、誤用、離脱症状、飲酒家などといったより高い注目点数の医療ノート内の単語に対応する。予測に関係するEHR内の医療イベントの表示を推進するためのモデルにおける注目機構のさらなる例は、提供者対向インターフェースについて、後のセクションにおいて論じられることになる。
【0090】
図4図5、および図6の注目結果がどのように生成されるかについての例は、以下のようなものである。第1に、予測に関する患者の過去の医療問題を識別するために、我々は、患者の全ての履歴上の時間に対して(つまり、履歴上の遭遇ごとに1度、または履歴における各週に対して一度)、診断コード(以前に説明されたように、ICD9コード予測、および1次診断CCSコード予測)を識別するモデルを実行する。このことから、我々は、予測/識別した過去の医療問題のリストを得て、そうすることで、我々は、薬剤、検査、バイタル、ノート等を推定した。
【0091】
これらの問題はランク付けされ、医師に提示される。ランク付けは、(1)どれだけ多くの証拠がこの医療問題をサポートするか(たとえば、これは、ノートの中で言及されるだけか、または検査/バイタルにおいても診察され、薬剤で治療も行われるか)、(2)この問題は明示的に請求され、主なEHRの中でコード化されたことがあるか、または、これは、我々が推定したが、明示的にコード化されることも、請求されることもなかった「埋め込まれた」診断であるか、および(3)この医療問題がどれだけ珍しく、深刻であるか(たとえば動脈瘤対高血圧)、および潜在的な他のファクタ、などのいくつかのファクタに依存する。
【0092】
次に、各問題に対して、我々は、主要な薬剤および主要なノートの抜粋および単語などの主要な事実を要約する必要がある。我々は、たとえばノート内の各薬剤または各単語に対して、どれだけ多くの注目(または、直感的に、重みもしくは重要性)をモデルがこの単語に示したかという0~1の間の数を示すために、注目機構を使用して、(この患者をたとえば高血圧を有するものとして分類した)上記のモデルを照会する。最も高い点数を付けられた単語は、図5および図6のこれらの例証の中で示される。
【0093】
別の例として、後の図において説明されるように、電子デバイス(図1の40)の提供者対向インターフェースは、(履歴上の医療問題の代わりに)ICU搬送の予測に関するEHRからのノートの抜粋を示す。ここで我々は、(たとえば、ノート内の各単語に対して、規定された各薬剤に対してなど)モデルによって参照される各入力トークンに対する0~1の間の数を得るために同じ注目機構を再び正確に使用し、ICU搬送の予測を行う間にどれだけ多くの重みをモデルがこの個々の単語/薬剤/等につけるかを示す。
【0094】
モデル性能、研究コホート、データセットの特性、およびベースラインモデルと比較した結果についてのさらなる詳細は、我々の先の米国'112仮出願の付録Aの中で示され、特に関係しない。コホート内のテストセットの遡及的研究における我々のモデルの性能の結果の概要が図7に示される。図7は、再入院、死、計画外のER/病院受診などを含む、モデルによって行われた様々なタイプの予測を示す。"AUC"性能測定基準は、機械学習における標準性能測定基準である、受診者動作特性濃度曲線下面積を表す。
【0095】
モデルの開発およびテストからの我々の発見の概要は、以下のようなものである。電子健康記録データに基づく深層学習を使用して、我々は、院内死、長い入院期間、計画外の30日の再入院を予測すること、1次診断を識別すること、および退院時に請求コードを割当てることを行う際の高い予測性能を実証した。我々は、結果が、医療システムおよび臨床タスク全体にわたって一致し、初診患者データの可用性で改善し、注目機構の使用で解釈できることを示した。我々には、下記で説明される4つの主要な発見がある。さらなる詳細は、我々の先の米国'112仮出願の付録Aの中で見つかる。
【0096】
結果は、完全に異なるデータセット全体にわたって拡張可能である
第1に、我々の方法は、複数の臨床サイト全体にわたるフリーテキストノートなどの構造化されていないデータを受け入れ、モデルトレーニングのためにEHR内の全てのデータを使用して、正確な予測を作り出すことができる。我々のアプローチは、特定のサイトの未加工データから、変数を厳選すること、ならびにこれらをクリーンにすること、抽出すること、および調和させることを行う方法を判断することを必要としない。文献における予測モデルは、27個の変数の中央値を使用するが、その一方で我々は、臨床ノートおよびフローシートのような、典型的には含めるのが難しい変数を含む、100,000個以上のデータ-ポイントの中央値を使用した。
【0097】
予測性能は、完全に異なるタスク全体にわたって優秀である
第2に、我々の結果は、EHRデータを表し、モデル化する我々の方法が、臨床タスク全体にわたって拡張可能であるということを示し、我々は、死(0.94~0.98対0.91)、再入院(0.74~0.75対0.69)、および入院期間(0.86~0.92対0.77)に関する同種の研究より、我々の結果が優れていると信じている。ICUでの死および再入院についての我々の性能は、医師による識別能力もしのいでいる。
【0098】
しかし、我々の結果を他の研究と比較することは、コホート選択および研究デザインに基づいて性能が相違することを考慮すると困難であり、多くの結果は、コホートおよび結論についての不完全な記述を有するか、小さい疾患固有のコホートを予測するか、または日常的に利用可能ではないデータをリアルタイムに使用している。
【0099】
この限界に対処するために、我々は、ベースラインとしてHOSPITALのバージョン、NEWS点数、およびLiuのモデルを実装し(我々の先の米国'112仮出願の付録Bを参照されたい)、優れた性能を実証する。我々は、医療または外科サービスについての患者の関連研究におけるものにより似ているようにデザインされたコホートも評価し、我々のアプローチに対する類似の利益を発見した。
【0100】
さらに、我々は、MIMICというオープンデータセットを使用し、ここで我々は、0.91対0.80という死についてのAUC、および0.4対0.28というICD分類についてのmicro-F1で、既存の文献をしのいだ。
【0101】
モデル化は、完全な一連のデータのからの値を利用する
第3に、我々のモデル化技法は、固定時点を使用することとは対照的に、新しいデータが利用可能になるときに予測を成功裏に更新する。全てのタスクに対して、モデルは、全てのタスクに対する性能における実質的な利点を得るために何十万もの患者属性を使用する。興味深いことに、我々のモデルは、EHRデータについての性能とほぼ同種の、権利データから特色のある性能を引き出すが、実際は、計画外再入院を予測することについては、権利についての性能はEHRデータについての性能を超過し、他の病院における再入院についての全体像による可能性が高い。
【0102】
複雑なモデルの出力が解釈可能である
第4に、我々は、モデルによって使用されるデータの粒度の細かい可視化が、患者に対する特定の予測を行うことを可能にする注目機構を実証する(図4図6、ならびに図8図9および図14図19におけるインターフェースについての以下の議論を参照されたい)。我々は、患者イベントのシーケンスおよびタイミングを明示的にモデル化するので、我々の方法は、実際は、予測に関連する患者の履歴における、何、いつ、どこでを示す。各変数が結論にどのように寄与するかを説明するためのアナログ対オッズ比を有していないにもかかわらず、我々は、深層学習が「ブラックボックス」であるという懸念を注目技法が緩和する場合があり、将来において、臨床医にとって重要な情報を引き出すために使用される可能性があるということを信じている。インターフェースにおける、予測した将来の臨床イベントに関連する基礎となる過去の医療イベントの提示は、タイムリかつ有用な情報を深層学習モデルが実際に提供しているという信頼を医療提供者に与える。
【0103】
限界
モデル開発およびトレーニングのために使用されるデータセットにおけるラベルは、臨床的に正しくないか、欠落している場合がある。請求診断は、臨床診断を反映していない場合があり、たとえば肺炎は、管理上の理由のために、敗血症としてますますコード化されている。同様に、再入院は、別々の健康システムにおいて一般に発生し、これらの記録は、典型的には、退院システムと共有されない。健康機関の間で共有する完全なデータ、またはリサーチグレードのフェノタイプを有するデータセットがない場合、この限界は、活動中の臨床ケアの中で収集される全てのデータに影響を及ぼす。
【0104】
第2の限界は、大きいデータセット、強力なコンピューティングインフラストラクチャ、および複雑なアルゴリズムに我々のアプローチが依存するというものであり、これらは、複製するために洗練されたエンジニアリングを必要とする。しかし、このアプローチは、単一のモデリングアーキテクチャが、予測タスクの範囲の全てにわたる優秀な予測性能を実現することを可能にすることであり、本開示および付随の付録を考慮すると、当業者の能力の範囲内にある。
【0105】
最後に、多くの変数を相変わらず使用することがオーバーフィットを導くという懸念があった。我々は、現実世界の性能を推定する、トレーニング中に使用されない患者の提供されたテストセットについての結果をレポートすることによって、また、3つの別々のデータセットのために結果が保持することを示すことによって、この懸念を和らげる。さらに、モデルのデザインは、オーバーフィットを回避するための技法を含める場合がある。
【0106】
予測のいくつかのタイプが上述されたが、モデルは、以下を含む他の予測タスクのために使用されることが可能である。
【0107】
普通ではない投薬量、または予期しない処方(医療エラーの発生源)に対する自動補完および注意喚起との両方のための薬剤および投薬量。
【0108】
医師が見直すため、編集するため、および提出するためのテンプレートまたは書類の一部を自動補完または提案するための、たとえば退院概要といった、医師のノート内の次の単語、文、または段落(書類を書くことは主要な時間の負担である)。
【0109】
挿管、通気、ケアの激しさ(たとえばICU搬送)の変化、臓器サポート、移植等などの多種多様な生命を脅かすイベントを、このようなイベントの監視および注意喚起のために、予測すること。
【0110】
たとえば日々、または検査室テストの指示を出す前に、またはたとえば(たとえば高血糖/低血糖を防ぐのために)ブドウ糖を投与する前に、生理的劣化を予測すること。高コスト患者をリスク階層化するために、ケアのトータルコストを予測すること。
【0111】
収容能力の計画立案のための入院の予測および人数調査(どれだけ多くの患者が、各病棟に入院させられることになるか)。
【0112】
D.深層学習を通じた臨床予測および理解のための提供者のインターフェース
上述のように予測モデル28、30、および32が開発され、テストされ、有効であると認められると、これらは次に、患者ケアを改善するために、図1に示されるような患者からの入力EHRに基づく予測を行うために使用されることが可能である。本文書の本セクションの中で、我々は、EHR内の関連のある過去の医療イベント(テスト結果、診断、ノート、薬剤など)の識別と共にこれらの予測が医療提供者に、どのように提示されることが可能であるかを説明することになる。本質的に、図1のコンピュータ26は、モデル28、30、およびまたは32を使用して、予測および対応する過去の医療イベントについての入力健康記録からのデータを生成し、インターフェース上に描写するために、このデータを電子デバイス40に提供する。
【0113】
図8Aは、たとえばコンピュータ端末、タブレット、スマートフォン、または画面ディスプレイを有するコンピューティングデバイスの他のタイプといった、患者を治療する医療提供者による使用のための電子デバイス40の医療提供者対向インターフェース100の例証である。本構成におけるインターフェース100は、病院における使用のためにデザインされている。インターフェースは、2名の患者についての表示エリア102および103を含む。"Mark Smith"という患者について、表示は、この場合、集中治療室への計画外搬送(ICU)、および病院からの遅延退院という、この特定の患者に関する2つの将来の臨床イベントを予測モデルが予測していることを示す注意喚起104を含む。図8Aのインターフェースは、危険な状態にある患者に対して医療提供者の注目を早期に注意喚起するようにデザインされる。図1のシステムは、何かが、「オフ」、「普通ではない」、または「注目を要する」である、特定のイベントを正確に予測している。医師の観点から、インターフェースは、医師にまだ行動する時間があるときに、早期に注意喚起される必要性を満たす。さらに、図8Bと共に説明されることになるように、インターフェースは、注意喚起条件が起こると予測モデルが思う/予測する理由を説明する。
【0114】
図8Aは、表示102のタイムラインエリア105における、Y軸目盛0~100上の種々の確率(またはリスク)のグラフ表示を医師が選択することを可能にするツールバー108を含む、関心のある他の態様も示す。この実例において、医師は、死亡、退院、およびICU搬送というリスク/確率を「オン」の位置に切り替えた。線110は、病院からの退院の確率をプロットする。線112は、ICU搬送の確率をプロットする。線114は、死亡のリスクをプロットする。16:00頃にICU搬送のリスクの急上昇があり、この直後に、死亡のリスクのわずかな増加があるということに留意されたい。医師は、リスクのこれらのプロット/確率を調査し、注意喚起アイコン104をクリックまたは選択することによって、ICU搬送および遅延退院のリスクに関する過去の医療イベントについてのより多くの情報を知ることができる。
【0115】
注意喚起アイコン104が選択されると、インターフェース100は、図8Bに示された表示に変わる。基本的に、行われる予測、および関連する前の医療イベントを含むこのバージョンのインターフェースは、医師が患者を今理解するのに役立つ。医師は、「私が知っている必要がある主要な医療問題は何か。決定を行うために、私が見る必要がある可能性のある状態または他のデータを掘り下げるのを手伝ってください。私が、重要情報を見逃さないようにしてください。」と思う。これらの必要性は、図8Bの表示によって満たされる。特に、領域130に、現在の入院に関する主訴(腹痛)、主要な前の入院(アルコール離脱症状、心房細動)、EHRにリアルタイムに基づく主要な推測される診断(すなわち、モデル28、30、32によって推定される診断)、および患者の他の主要な医療状態(前糖尿病、高血圧、および頑癬)といった、注意喚起と関連付けられた問題一覧について表示される。領域140に、現在の検査結果の表示がある。領域150に、ICU搬送および遅延退院の予測に関係のあった医療ノートの抜粋の表示があり、モデルにおける注目機構の結果が、注目機構によって高く点数を付けられたノート内の特定の要素または単語を赤いフォントでハイライトしている(この場合、「EtOH離脱症状」、「ETOH離脱症状に対する懸念」)。領域160に、現在のバイタルサインの表示がある。領域120に、前の入院、ER受診、および外来活動を示すタイムラインの表示がある。線122は、たとえばどのくらいの頻度で患者が医療設備を受診したか、どれだけ多く検査値やバイタルがとられたか、どれだけ多くの薬剤が処方されたかなどといった、患者の医療利用の量、およびこの患者についての利用可能なデータの大きさの可視化である。
【0116】
図8Aおよび図8Bのインターフェースについてのさらなる議論は、実施例の説明の中で、下記で行われる。
【0117】
上述のように、予測モデルは、患者についての予測を行うために外来の状況において使用されることも可能である。たとえば、図9は、医師の診察室における、インターフェース100、およびインターフェースの使用に関係のあるインターフェース上のツール200の表示を示す。ツール200は、図8Bの表示線202に類似の、救急部門受診、入院、死亡、および医療リソースの一般的なコスト/利用についての(図8Aの領域105に示されるものに類似の)リスク/確率のタイムラインを、医師および医師のケアチームがプロットすることを可能にする。
【実施例1】
【0118】
本開示の利益がない状態でこの日に起こること
本仮定の実施例は、本開示の利益がない状態での患者ケアにおける難しさを示すことになる。
【0119】
患者"Mark Smith"が、ひどい腹痛のために午前7時に緊急治療室に来る。
彼は、明らかな根拠のない状態で検査および腹部超音波検査を含む完全な精密検査を行う。
彼の腹部検査は比較的良性であるが、彼はまだIV鎮痛剤を必要としている。
【0120】
午前10時に、彼は、診察および疼痛制御のために内科チームに入院する。入院チームは非特定の胃炎を疑い、彼らは翌日の退院を予想する。
【0121】
1次チームは午後4に退出して、担当医師(130名の患者に責任がある)に引き渡し、「Smithさんは、アルコール離脱症状を発症している可能性があるが、徴候はまだ何もない」と警告する。午後8時に、担当医師は、130名の患者全員を夜勤医師であるKingsley医師に引き渡して退出する。午後8時に、Kingsley医師は、自分の深夜のシフトに入る。彼女は130名の患者を担当しているが、彼女は、これらの患者の誰も以前にケアしたことがない。彼女は、130名の患者全員のためのファーストコールのポケットベルを自分自身に転送することによって自分のシフトを始める。午後10時に、Kingsley医師はポケットベルを受信する。
【0122】
14L-21号室の患者Smithの心拍数は99であり、ベッドで快適にTVを視聴している。BP115/79、RR20、98%RA。コールパラメータとしてのFYIは90である。
【0123】
午前1:00に、Kingsley医師は、別のポケットベルを受ける。
【0124】
14L-21号室の患者Smithに敗血症の注意喚起があり、3-9124に折り返し電話してください。
【0125】
Kingsley医師はEHRにログインし、注意喚起を見る。
【0126】
敗血症の注意喚起。患者は、SIRS基準を満たす。全国的なガイドラインにより、1時間以内に30cc/kgのIV輸液および抗生物質を投与してください。
【0127】
詳しく調べると、Kingsley医師は、患者の心拍数が日中に70から99に経時的に上昇していたこと、および今は110であり、患者の呼吸数は20と記録されていることを知る(呼吸数が正常のときに記録される普通の数である)。(看護師によって処方された)乳酸塩は2.5であった(少し高い)。Kingsley医師のポケットベルは、今45秒ごとになっているので、彼女は、自分の時間をトリアージしなければならない。午前1:05に、彼女は、「彼は元気そうではなく、彼は少し震えており、大汗をかいている」とレポートした看護師に折り返し電話する。彼女が話している間、彼女は、その日のノートを引き寄せ、ここで1次の問題は「未特定の腹痛」である。ノートは、「患者には不特定の腹痛があり、肝臓酵素が少し高く、超音波診断では不特定の胆嚢肥厚がある。胃炎の疑いは、アルコールの常用からのものである可能性があるが、患者は否定している。腹腔内の病変を監視してください」と続く。
【0128】
敗血症の注意喚起は、敗血症に対して抗生物質が遅れる1時間ごとに、死亡率が7.5%ずつ上昇するという臨床ルールを彼女に思い出させた。彼女は、患者に会いたいが、あと30分の間、彼を検査できない可能性があり、1時間以上、抗生物質が遅れる可能性がある。彼女は、腹腔内感染を心配している。彼女は、彼がかつて心エコー図をとったことがあるかどうかを確かめるが、彼はとったことがなかった。
【0129】
午前1:10に、彼女は、2LのIVF、バンコマイシン、およびゾシン(抗生物質)を処方し、腹部骨盤造影CT(CT abdomen-pelvis with contrast)を指示した。
【0130】
午前2:10、オーバヘッドアラームが鳴る。
【0131】
緊急事態:14L 21号室
【0132】
Kingsley医師は14-L 21号室に走り、Smithさんが呼吸困難になっているのを発見する。2袋目のIV輸液がほぼ完了している。彼女は彼の肺の音を聴き、日勤チームによって記録されていなかった顕著な捻髪音に気づく。彼のJVDは明らかに高い。彼女は、彼の顕著な震えと、舌の揺れ(tongue-wag)にも気づく。患者は再び尋ねられると今度は、この1週間大いに飲酒したが、2日前に腹痛が原因でやめたことを認める。彼女はIV輸液を停止し、医原性急性肺水腫およびアルコール離脱症状のために、患者をICUに搬送するように集中治療室(ICU)チームに指令する。
【0133】
この例の解明事項は、以下のようなものである。患者には、実際に、アルコールおよびイブプロフェンの常用による胃の不快感があり、彼の腹痛の原因となった。病院にいる間、彼は、アルコール離脱症状の状態になり始め、これが、彼の高い心拍数、震え、および発汗の原因であった。臨床医は、彼の外来医が、悪化する運動耐性のためにアルコール心筋症について心配していたこと、およびまだ行われていない心エコー図を指示していたことも見逃した。
【0134】
緊急事態により実際に患者の検査に入った後、医師は、彼女が指示した輸液による急性肺水腫と診断し、アルコール離脱症状を認識した。患者は、ICUに搬送されて治療され、4日後に退院した。患者は、クロストリジウムディフィシル腸炎により3週間後に再入院したが、不正確に与えられた抗生物質によるものである可能性がある。
【0135】
根本原因分析は、何をKingsley医師が見逃したかを問う。患者は、彼が悪化した後に軽率に評価された。患者には、アルコール性胃炎および離脱症状があり、これが敗血症と間違えられ、間違って治療された。患者は心筋症を疑っていたが、理学的検査およびECGをせずに輸液を受けるべきではなかった。何が起こるはずだったか。
1.アルコール離脱症状によるICU搬送の延期を予測し、防いだはずであった。
2.IV輸液を与えず、したがって輸液の過負荷に対するICU搬送を防いだはずであった。
3.抗生物質を与えず、したがって院内感染を防いだはずであった。
4.その後の再入院を防いだはずであった。
フレーミングバイアスおよび確認バイアスとの両方が、これが発生した理由を説明するのに役立つ。フレーミングバイアスは、私は、敗血症の可能性のある患者に対する救命治療を保留するか、というものである。確認バイアスは、情報の密度を考慮して、腹部敗血症の可能性の発生源のみを医師が探すというものである。
【0136】
図10図13は、EHRから医療提供者が利用できる大量の情報、および本開示の特徴が必要な理由の例を示す。図10は、433個のリスト化された診断を伴う、この患者の4年の医療履歴からの抜粋を示す。図11は、この患者に対する診断の抜粋を示すが、外来患者として、入院患者として、またはICUもしくは他の状況において患者が治療されたかどうかなどの重要な付随情報の不足が、情報の有用性を限定している。図12は、所与のタイムスパンにわたるこの特定の患者に対する種々の遭遇の莫大なリストを示すが、各遭遇の中で起こったことについての詳細を欠いている。図13は、4日間にわたる1回の入院において提供者によってとられるノート(標準的なモバイルデバイスの60個の異なる画面を満たす全部で~10,000単語の33件のノート)のうちの1つの小さな断片しか示していない。
【0137】
端的に言えば、患者の現在の状態に実際に関連するEHR内のこれらの要素だけに、Kingsley医師が自分の注目を向けるのを支援する必要性がある。例1における患者ケアは改善されること、したがって本開示のシステムを開発することが可能である。
【実施例2】
【0138】
ICU搬送および遅延退院についての予測した臨床イベント
この例は、例1における患者"Mark Smith"の治療における図1のシステムの利益を示すことになる。要約すれば、システムは、特定のイベントを正確に予測することによって、危険な状態にある患者に対する医師の注目を早期に注意喚起し、医師にまだ行動する時間があり、システムが予測を行っている理由を説明する時間があるうちに医師に早期に注意喚起する。(たとえば、図8Aの注意喚起の使用によって)医師が注目すると、これは、主要な問題は何か、決定を行うために医師が見る必要がある可能性のある状態および他のデータは何か、という患者の今を医師が理解すること、および医師が重要情報を見逃さないようにすることに役立つ。
【0139】
図14において、図3のデバイスのインターフェース100の例は、4名の患者のデータおよびリスクをリアルタイムに追跡する。医師は、リアルタイムのリスクまたは確率の追跡をカスタマイズするためにツール108を切り替えた。図14において、インターフェースは、4人の異なる患者についての4つの表示エリア300、302、304、および306を含み、表示エリア300は、患者Mark Smithについての表示エリアであり、プロットおよび注意喚起104は図8Aにおいて説明されたようなものである。
【0140】
我々の仮定の実施例において、午後8:02に、Kingsley医師は自分の午後8時のシフトを開始し、本書類において"Guardian"と称される本開示のインターフェース100を提供するシステムにログインする。彼女はまず、線303によって示される死亡の増加リスクをプロットが示すので、Guardianによって確認される「ウォッチャ」であると彼女が告げられたJerry Mashokitarを見る。午後8:03に、注意喚起104が作動され、彼女は、Mark Smithが患者リストの最上位にあることに気づく。注意喚起は、ICU搬送および遅延退院という危険な状態にこの患者があるというものである。
【0141】
患者の進行中の医療問題は何か、過去のこれらのアルコール離脱症状はどれほど深刻だったのか、これらはICU在室を必要としたのか、という疑問がKingsley医師の心にすぐに生じる。
どのような治療を心不全に対して彼らは行ったのか。これらには駆出率の低下があったのか。
彼らには前の感染症があるのか、または抗生物質を最近受けたのか。何らかの陽性培養があったのか。
心房細動は制御し難かったのか。患者は、突然ベータ遮断薬を摂取するのをやめたのか。つまり、患者に伴う主要な問題は何か、いつか、また証拠は何か。
【0142】
Kingsley医師はアイコン104を活性化させ、図8Bの表示が現れる。インターフェースはICU搬送のリスクを示し、「Et-OH-離脱症状発作のHxの可能性」、「EtOHの乱用」、および「ETOH離脱症状に対する懸念」というノートの抜粋を示すノート領域150によって、このリスクを悪化させるアルコール離脱症状に対する懸念に彼女の注目を引き付ける。「EtOH-離脱症状」および「ETOH離脱症状に対する懸念」という句は、赤いフォントで示され、太字にされている。これは、以前に説明されたような予測モデルにおける注目機構の使用の結果である。このように、図8Bの表示は、予測した現在のリスク(ICU搬送)に関する過去の医療イベントを要約している。
【0143】
図15は、予測(ICU搬送、遅延退院)に関連し、患者のタイムラインエリアに提示されるEHR内の152件の過去の遭遇の中の主要イベントだけの選択を示す図8Bのインターフェースを示す。
【0144】
図16は、予測(ICU搬送、遅延退院)に関連するEHR内の433件の過去の診断または問題のリストからの主要な問題だけの選択を示す図8Bのインターフェースを示す。主要な問題(すなわち、関連のある過去の医療イベント)は、問題一覧エリアにおける表示の左側に概要として提示される。
【0145】
図17は、予測(ICU搬送、遅延退院)に関連するEHR内のノートにおける12,000個の単語からの主要で重要な抜粋または単語だけの選択を示す図8Bのインターフェースを示す。主要な抜粋(単語および句)が、予測を生成するときの深層学習モデルにおける注目機構の使用の結果として特定の単語または句に対するハイライトの度合いでインターフェースの右下のエリアに提示される。
【0146】
図18は、リスト化された各医療問題をインターフェースが要約する能力を示す図8Bのインターフェースを示す。この実例において、提供者は、図8Bの表示エリア130における「アルコール離脱症状」という主要な問題400をクリックし、表示は、アルコール離脱症状という主要な問題に関連したフィールド402における薬剤、フィールド404におけるノートまたはノートの抜粋、およびフィールド406におけるイベントのタイムラインを示す。
【0147】
図19は、心筋症という「主要な推測される」問題をユーザが選択するときに起こることを示し、表示は、タイムライン506、薬剤502、およびフィールド504における関連付けられたノートまたはノートの抜粋の形で、主要な問題「心筋症」の概要を示す。フィールド504および404におけるノートまたは抜粋は、予測を生成する際に最も重要であったEHRの要素を医師に再び示すために、モデルにおける注目機構の結果を示すためのハイライト(太字、フォントサイズ等)を再び使用する。
【0148】
本開示の特徴を使用して患者Mark Smithの治療の説明に再び戻ると、実施例1において、Kingsley医師が午前1時に敗血症のページを得る一方で、本開示の特徴によって、Kingsley医師は、望まれる介入を早期に指示する。彼女は、注意喚起が提示された直後に患者に会いに行き、非常に高いリスクを考慮して、アルコール離脱症状に対するCIWAプロトコルを指示する。彼女は、心筋症の外来の疑いを見て、患者が実際に心不全を有している場合に備えて、2LのIVを与えないことを決定する。診断の不確実性を考慮して、彼女は、心房細動の病歴を考慮したECGを指示することも決定し、患者を検査する。
【0149】
要約すると、本開示のシステムは、患者をICUに搬送する必要性、また、後で病院に入院する必要性も回避した。この例において、医師は、予測した臨床イベントについての注意喚起をタイムリに与えられ、予測に対する主要医療イベントを提示され、患者に対する医師のケアを改善すること、ICU搬送を回避すること、病院への計画外再入院を回避すること、および抗生物質の投与による合併症を回避することを医師が行うのを可能にする。
【実施例3】
【0150】
ERまたは入院のリスクについての外来の注意喚起
この例は、外来の状況における図1のシステムの使用を説明することになる。
【0151】
Jennifer Choiは、心不全(EF30%)、ワルファリンによる心房細動、高血圧、および前糖尿病の病歴のある83歳の女性であり、Keyes医師の外来心臓病診療所に初診患者として来院する。Keyes医師は、彼女の心不全を管理することを求められた。Choiさんは、治療がどれもが互いに干渉しないことを確実にするために、彼女の他の状態を確実にKeyes医師が理解することを望む。
【0152】
以前、Choiさんは、かかりつけ医(PCP: primary care physician)を受診する前に検査を受けており、そこで、彼女は、軽度の急性腎障害があることに気づいた。彼女のPCPは、彼女のボリュームステータスが安定していると感じたので、彼は、利尿薬の用量を減らし、1週間、繰り返し検査することを勧めた。
【0153】
Keyes医師との面会から出て行く途中、Choiさんの娘は、自分の母はますます混乱しており、母は自分の薬剤を正しく服用していないかもしれないということを心配しているとの懸念を密かに表明した。Keyes医師は既に30分、自分の予定より遅れており、3週間後の面会においてこれをさらに調査すると述べ、次回受診時に混乱に対処するために、「娘は患者がますます混乱していることを懸念している。次回受診時に、認知機能障害に対するMOCAおよび評価を予定」という注意書きを自分のノートに書き付けた。
【0154】
PCPとKeyes医師の両者は、図1のシステムに参加し、予測モデルを利用するために、ChoiさんのEHRを図1のコンピュータ26に転送する。PCPとKeyes医師の両者は、外来のために使用される図9のインターフェースを含む電子デバイス(ワークステーション)を有している。
【0155】
モデルは、Choiさんが今後14日のうちのED受診/入院に対する危険があるということを予測する。図9の表示上に注意喚起が提示される。このチームは、これらの高リスク状況を管理するための専門知識を有している。表示は、図18のフィールド406に示されるものなどの(最近の入院を含む)タイムラインを示し、これは、図8Bのフィールド130におけるCHF、AKI、AFib、前糖尿病、高血圧という、推定される問題を示し、以下のノートの抜粋をフィールド150(図8B)に含む。
ノート1(pcp):「娘は患者がますます混乱していると懸念している。次回受診時に、認知機能障害に対するMOCAおよび評価を予定[..]。患者は、悪化した腎機能を有し、過剰な利尿(over-diuresis)による可能性がある。ラシックスの用量を減らし、1週間、検査を繰り返すことになる。体重と呼吸を監視するように娘に言った」。
ノート2(看護師):「患者は、ラシックスの用量について混乱している」
ノート3(看護師):「私は、私の母が、どれだけの用量を服用するべきかわからない」
注目モデルの使用の結果として、これらのノートの主要な部分(「懸念している」、「混乱している」、"MOCA"、「悪化した腎機能」、「ラシックスの用量を減らす」、「ラシックスの用量について混乱している」など)が太字フォントで描写される。
【実施例4】
【0156】
多忙な救急部門
この例は、実施例1および実施例2における仮定の患者"Mark Smith"による本開示の特徴の使用を示すことになる。
【0157】
Mark Smithは、胃を抱えて痛みを訴えながら、歩いて緊急治療室に入る。彼の心拍数は110であり、彼は震えており、汗をかき、利尿状態である。看護師は、何が起きているのかを理解するのに役立てるために、EDレジデントであるPeters医師を連れてくる。
【0158】
Peters医師には、非常に多くの疑問がある。彼は以前、いたことがあるのか。どのような疾患を彼は有しているのか。これらはどれほど深刻なのか。これらはどのように治療されたのか。EDは、SmithさんのEHRを取り出し、図1の予測モデルが、SmithさんのEHRに利用される。インターフェースを提示する端末または他の電子デバイスのインターフェースは、これらの疑問および彼の現在の主訴に関係する情報を取り出して表示し、図8Bに示されるような、予測した診断、および主要な基礎となる医療イベントを含める。バイタルサインが取得されると、これらは、関係するチャート情報の表示に追加される。
【0159】
さらなる検討
予測モデルおよび関連したコンピュータまたはコンピュータシステム26の精密な物理的位置および実装形態は変化してよい。いくつかの事例において、これは、医療システムまたは病院が提供する関連設備、かかりつけ医の診察室、および関連した診療所などに物理的に位置していてよい。他の状況において、これは、中心に位置してもよく、広域コンピュータネットワークでEHRを受信し、予測した将来の臨床イベントおよび関連した前の医療イベントを送信してもよく、サービスに対する支払い、購読、スタンドアロン製品、または他のビジネスモデルにおいて、多くの関係のない医療機関にサービスしてもよい。全ての状況において、妥当なデータセキュリティおよびHIPPAコンプライアンス手続きが実施される。
【符号の説明】
【0160】
10 システム
12 未加工電子健康記録、電子健康記録
14 機関
16 コンピュータネットワーク
18 コンバータ、コンピュータシステム
20 RDB、リレーショナルデータベース
22 時系列のFHIRリソースの束、集約電子健康記録、集約健康記録
22A FHIRリソース
22B FHIRリソース
22C FHIRリソース
22D FHIRリソース
24 メモリ、コンピュータメモリ
26 コンピュータ
28 LSTMモデル、深層学習モデル、長短期メモリ(LSTM)モデル、LSTM、モデル
30 FFMモデル、深層学習モデル、時間認識フィードフォワードモデル(FFM)、モデル、FFM
32 埋込みブースト型T-Sモデル、深層学習モデル、埋込みブースト型時系列モデル、モデル、ブーストモデル
36 患者
38 EHR、入力電子健康記録、入力健康記録
39 破線
40 電子デバイス、デバイス
42 提供者、医療提供者
50 遭遇テーブル、テーブル
52 検査テーブル、テーブル
100 医療提供者対向インターフェース、インターフェース
102 表示エリア
103 表示エリア
104 注意喚起アイコン、注意喚起
105 タイムラインエリア、領域
108 ツールバー、ツール
110 線
112 線
114 線
120 領域
122 線
130 領域、表示エリア、フィールド
140 領域
150 領域、ノート領域、フィールド
160 領域
200 ツール
202 表示線
300 表示エリア
302 表示エリア
303 線
304 表示エリア
306 表示エリア
400 主要な問題
402 フィールド
404 フィールド
406 フィールド
502 薬剤
504 フィールド
506 タイムライン
図1
図2
図3A
図3A1
図3A2
図3B
図3B1
図3B2
図3C
図3C1
図3C2
図4
図5
図6
図7
図8A
図8B
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19