(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-14
(45)【発行日】2024-02-22
(54)【発明の名称】医療記録を分類する方法
(51)【国際特許分類】
G16H 10/60 20180101AFI20240215BHJP
G06F 40/279 20200101ALI20240215BHJP
【FI】
G16H10/60
G06F40/279
(21)【出願番号】P 2021512559
(86)(22)【出願日】2019-09-03
(86)【国際出願番号】 EP2019073415
(87)【国際公開番号】W WO2020048952
(87)【国際公開日】2020-03-12
【審査請求日】2022-08-31
(32)【優先日】2018-11-16
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】PCT/CN2018/104157
(32)【優先日】2018-09-05
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】590000248
【氏名又は名称】コーニンクレッカ フィリップス エヌ ヴェ
【氏名又は名称原語表記】Koninklijke Philips N.V.
【住所又は居所原語表記】High Tech Campus 52, 5656 AG Eindhoven,Netherlands
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】リー,ズオフェン
(72)【発明者】
【氏名】ウェン,ドン
【審査官】鹿谷 真紀
(56)【参考文献】
【文献】特開2018-014058(JP,A)
【文献】特開2016-157320(JP,A)
【文献】米国特許出願公開第2018/0011922(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
G06F 40/279
(57)【特許請求の範囲】
【請求項1】
医療記録を分類する
、コンピュータが行う方法であって、
複数の医療記録を得るステップと、
データ抽出モデルに従って前記医療記録を処理して、各記録から1つ以上の介入事象を抽出するステップであり、各々の介入事象が医療介入を表している、ステップと、
アルゴリズムに従って、抽出された前記介入事象の各々を処理して、特徴付け属性のセットに関して前記事象の表現を導き出すステップであり、前記属性は、定められた属性ドメインのセットの各々における少なくとも1つの属性を含む、ステップと、
指標付け介入事象のデータセットにアクセスするステップであり、指標付け介入事象の各々が前記データセットにおいて、対応する属性のセットに関する表現に関連しており、前記定められた属性ドメインのセットの各々に属する少なくとも1つを含み、さらに、前記抽出された介入事象及び格納された前記指標付け介入事象の属性の比較に基づき、各抽出された介入事象に最も近い一致する指標付け介入事象を特定する、ステップと、
前記医療記録の各々を、その記録に対して特定された1つ又は複数の前記指標付け介入事象に従って分類するステップと、
前記複数の医療記録を集約するための基準として使用するために複数の指標付け介入事象のうち1つを選択するステップであり、前記選択は、ユーザに関係する情報に基づく、ステップと、
選択された前記指標付け介入事象に基づき、分類された前記複数の医療記録を集約するステップと、
を含む方法。
【請求項2】
前記定められた属性ドメインのセットは、少なくとも、前記介入事象が関係する解剖学的領域、前記介入事象が関係する介入処置、及び前記介入事象が関係する介入処置のサブタイプ又はカテゴリーを含む、請求項1に記載の方法。
【請求項3】
前記指標付け介入事象のデータセットは、前記指標付け介入事象のオントロジーを含み、前記オントロジーは、前記指標付け介入事象の各々と関連する前記属性のセットとの紐づけを定めている、請求項1に記載の方法。
【請求項4】
前記医療記録を集約するステップは、階層的データ構造に前記医療記録を構造化することを含み、前記階層的データ構造は、前記記録の各々に適用される指標付け事象分類に従ってグループ化又はソートされた前記得られた複数の医療記録を含む、請求項1に記載の方法。
【請求項5】
前記階層的データ構造は、前記得られた医療記録を、前記医療記録のさらなる属性に従って、前記指標付け事象分類に補助的なレベルでさらにソートさせる、請求項4に記載の方法。
【請求項6】
前記さらなる属性は、各医療記録のタイムスタンプ及び前記指標付け事象分類のサブカテゴリーのうち少なくとも1つを含む、請求項5に記載の方法。
【請求項7】
前記さらなる属性は、自然言語処理ツールを使用して各医療記録から抽出される、請求項5に記載の方法。
【請求項8】
当該方法は、前記データ抽出モデルを訓練するための訓練手順をさらに含み、前記訓練手順は、前記得られた複数の医療記録から前記医療記録のサブセットを選択し、選択された前記記録のサブセットを前記モデルに入力し、前記記録のサブセットに含まれるデータから異なる指標付け介入事象のセットを特定するために前記モデルを訓練することを含む、請求項1に記載の方法。
【請求項9】
前記訓練手順は、条件付き確率場又は畳み込みニューラルネットワークの使用を含む、請求項8に記載の方法。
【請求項10】
前記医療記録は、1つ以上の介入事象を言語学的に表すテキストベースの内容を含み、前記データ抽出モデルは、前記1つ以上の介入事象を抽出するために言語分析方法を適用するように構成される、請求項1に記載の方法。
【請求項11】
前記ユーザに関係する情報は、前記ユーザに関係する識別情報、又は前記ユーザの関心臨床領域を示す情報のいずれかを含む、請求項1に記載の方法。
【請求項12】
前記集約を行うための前記指標付け介入事象の選択は、複数のユーザと、各ユーザに対する1つ以上の好ましい指標付け介入事象との紐づけを有するユーザデータベースを検索することを含む、請求項1又は11に記載の方法。
【請求項13】
当該方法は、前記1つ以上の介入事象を抽出するステップを行うために複数の格納されたデータ抽出モデルのうち1つを選択するステップを含み、前記データ抽出モデルは、ユーザに関係する情報に基づき選択される、請求項1に記載の方法。
【請求項14】
コンピュータプログラムであって、当該プログラムがコンピュータ上で実行されると請求項1に記載の方法を実施するコード手段を含むコンピュータプログラム。
【請求項15】
処理ユニットであって、
複数の医療記録を得て、
データ抽出モデルに従って前記医療記録を処理して、それぞれが医療介入を表す1つ以上の介入事象を各記録から抽出し、
アルゴリズムに従って、抽出された前記介入事象の各々を処理して、特徴付け属性のセットに関して前記事象の表現を導き出し、前記属性は、定められた属性ドメインのセットの各々における少なくとも1つの属性を含み、
指標付け介入事象のデータセットにアクセスし、指標付け介入事象の各々が前記データセットにおいて、対応する属性のセットに関する表現に関連しており、前記定められた属性ドメインのセットの各々に属する少なくとも1つを含み、さらに、前記抽出された介入事象及び格納された前記指標付け介入事象の属性の比較に基づき、各抽出された介入事象に最も近い一致する指標付け事象を特定し、
前記医療記録の各々を、その記録に対して特定された1つ又は複数の前記指標付け介入事象に従って分類し、
前記複数の医療記録を集約するための基準として使用するために前記データセット内の指標付け介入事象のうち1つを選択し、前記選択は、ユーザに関係する情報に基づき、
選択された前記指標付け介入事象に基づき、分類された前記複数の医療記録を集約する、
ように構成された処理ユニット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、医療記録を分類する方法に関する。
【背景技術】
【0002】
データ量の増加が、現在、医療情報システムにおいて生じている。システムは不十分に統合されることが多く、患者情報を調査することを困難且つ非効率的にしている。
【0003】
典型的には、例えば病院における患者データは、主に、画像保存通信システム(PACS)、病院情報システム(HIS)、放射線科情報システム(RIS)、及び臨床検査情報システム(LIS)等、データソースに従って組織化されている。従来の紙ベースの医療記録と比較して、情報システムは、データの組織化及び利便性を著しく改善している。
【0004】
しかし、システム内の情報の組織化は不十分に構成されることが多く、臨床医が必要な情報を見つけることを困難にしている。
【0005】
例えば、患者の現状を評価しようとする医師は、複数の異なる情報システムにアクセスし、データを手動で照合しなければならず、これは非効率的である。さらに、患者の記録のうち他の記録への紐づけ等の状況情報がないと、医師が直観的に患者の状態を理解するのは困難である。
【0006】
さらに、非常に大量の患者データの利用可能性を高めることは、臨床医が大量の利用可能なデータの中から必要とされる特定の情報を明らかにすることができない情報オーバーロードの問題をもたらす。これは、エラー又は省略、遅延、患者の安全に対する全体的なリスク等、患者の転帰にマイナスの結果を及ぼす可能性がある。
【0007】
現在知られている患者情報及び表示システムは、ユーザとしての臨床医のニーズを満たしていない。使用される1つの例となるシステムは、例えば、Patient Holographic Viewである。これは広く採用されており、様々な情報源からのデータの統合を可能にし、1人の患者に関係する全ての情報を1ページに表示する。
【0008】
これは、異なる病院情報システムからの情報源を接続することによって、複数の完全に分離された情報源の問題に取り組んでいる。
【0009】
しかし、そのようなシステムには依然として欠陥が残っている。特に、複数の情報源が紐づけられているため、現在、医師にはあまりにも多くの情報が提示されており、効率的な様式で検索及び評価することができない。従って、情報オーバーロードの問題は残っている。
【0010】
さらに、典型的には、医師によって、必要とする特定の情報のクラスに関する特定の要件は異なる。また、状況によって、異なる種類の情報が必要とされ得る。
【0011】
例えば、治療のための患者の最初の入院時に、医師は、検査及び薬歴の情報を必要とすることがある。人口統計学情報等の他の情報は、この時点では役に立たず、関連性もない。
【0012】
従って、医療記録データを組織化する改善された方法が一般的に必要とされている。
【発明の概要】
【0013】
本発明は、特許請求の範囲によって定められる。
【0014】
本発明の一態様に従った例によると、医療記録を分類する方法が提供され、当該方法は:
複数の医療記録を得るステップ;
データ抽出モデルに従って医療記録を処理して、各記録から1つ以上の介入事象を抽出するステップであり、各々の介入事象が医療介入を表している、ステップ;
アルゴリズムに従って、導き出された介入事象の各々を処理して、特徴付け属性のセットに関して事象の表現を導き出すステップであり、属性は、定められた属性ドメインのセットの各々における少なくとも1つの属性を含む、ステップ;
指標付け介入事象のデータセットにアクセスするステップであり、指標付け介入事象の各々がデータセットにおいて、対応する属性のセットに関する表現に関連しており、上記の定められた属性ドメインのセットの各々に属する少なくとも1つを含み、さらに、抽出された介入事象及び格納された指標付け介入事象の属性の比較に基づき、各導き出された介入事象に最も近い一致する指標付け事象を特定する、ステップ;
医療記録の各々を、その記録に対して特定された1つ又は複数の指標付け事象に従って分類するステップ;
複数の医療記録を集約するための基準として使用するために複数の指標付け介入事象のうち1つを選択するステップであり、選択は、ユーザに関係する情報に基づく、ステップ;及び、
選択された指標付け介入事象に基づき、得られた複数の医療記録を集約するステップ;
を含む。
【0015】
本発明の実施形態は、異なる記録が関係する異なる駆動医療事象(介入事象)に基づき医療記録を集約又は組織化することに基づいている。
【0016】
介入事象は、例えば、主要な医療介入若しくは治療、及び/又は、介入若しくは治療後の経過観察事象を指してもよい。一般に、介入事象は、多くの記録が関係する主な医療事象を指すことがある。様々な医療記録が、同じ医療介入事象に関連している可能性がある。
【0017】
例えば、これらには、例えば、症状が診断された最初の診察、及び症状を治癒するための特定の治癒的介入への照会が含まれてもよい。この場合、治癒的介入が介入事象であり得る。これに続いて、状態をモニターするための経過観察の診察を、異なる介入事象(例えば、外来での経過観察)に関して分類することができる。症状の再発がある場合、これに関係する記録は、異なる介入事象に関して再分類されてもよい。従って、介入事象は、医療ケアの目的全体又は記録が向けられるか又は関連する目的を特徴付ける事象であり得る。
【0018】
特定の例として、患者は、最初に肝がんと診断され得る。これに続いて、患者は、肝切除術の形の根治的治療に対して照会される。肝切除術は介入事象である。照会に続いて、患者は外来患者として登録され、治療が行われる。これらの事象のうち全てが、同じ介入事象(肝切除術)に関して分類されてもよい。これに続いて、患者の状態をモニターするためにいくつかの経過観察の外来診察があってもよい。これらは、例えば経過観察の外来として等、異なって分類されてもよい。
【0019】
本発明の実施形態は、各医療記録から、例えば言語分析技術に基づき、1つ以上の候補介入事象を抽出し、次に、これを、定められた指標付け事象(指標付け介入事象)のセットの1つにマップすることに基づいている。これは、抽出された事象を、定められた介入事象オントロジーにマップするとして理解されてもよい。
【0020】
マッピングを行うために、各抽出された(導き出された)介入事象は、第一に、特徴付け属性のセットに分類又は分解され、これらの特徴付け属性は、定められた属性ドメインのセットの各々に属する。マッピングは、次に、各抽出された介入事象に対して最も近い一致する指標付け事象を見つけるために、各抽出された介入事象の属性を、指標付け介入事象に対して格納された属性と比較することに基づいている。従って、これは、各抽出された事象を、定められた指標付け事象のセットの1つに効果的にマップする。
【0021】
次に、各導き出された介入事象は、特定された最も近い一致する指標付け介入事象に従って分類される。
【0022】
次に、分類された記録は、指標付け介入事象のうち選択された1つに基づき集約される(例えば、ソートされるか又は組織化される)。集約を行うための基準となる指標付け事象の選択は、ユーザに関係する情報に基づいている。従って、これは、所与のユーザの特定のニーズに集約を合わせる。例えば、ユーザ情報は、ユーザの専門臨床領域又は職歴であってもよく、これは、ユーザの診療領域に最も関連する介入事象のうち特定の1つを示し得る。
【0023】
データ抽出モデルは、複数の例において、指標付け事象を抽出するために言語分析技術を使用することができる。データ抽出モデルは、訓練手順を使用して本発明の方法の前に訓練されてもよく、訓練手順は、各医療記録から関連する医療データのサブセットを選択し、データをモデルに入力し、データから異なる指標付け事象のセットを特定することにおいてモデルを訓練することを含む。
【0024】
条件付き確率場(CRF)又は畳み込みニューラルネットワーク(CNN)が、例えば、データ抽出モデルを構築するために使用されてもよい。
【0025】
複数の例において、分類は、該当する介入事象をラベルすることを含み得る。
【0026】
集約とは、例えば、グループ化を意味し得る。例えば、選択された指標付け介入事象を用いて分類される全ての抽出された介入事象は、組織化された様式でユーザによって見るために共にグループ化(集約)されてもよい。従って、集約とは、分類に基づき組織化又はソートすることを意味し得る。
【0027】
集約は、選択された指標付け介入事象に従って、抽出された介入事象をフィルタリングすること、すなわち、抽出された介入事象から、選択された指標付け介入事象に従って分類されていない任意の事象をフィルターで除去することをさらに含んでもよい。
【0028】
定められた属性ドメインのセットは、特定の例において、介入事象が関係する解剖学的領域、介入事象が関係する介入処置、及び、上記の介入事象が関係する介入処置のサブタイプ又はカテゴリーを少なくとも含んでもよい。
【0029】
この属性ドメインの選択は、強力な方法でデータを組織化する際に特に効率的であることが分かっている。
【0030】
指標付け介入事象のデータセットは、指標付け介入事象のオントロジーを含んでもよく、このオントロジーは、指標付け介入事象の各々と関連する属性のセットとの紐づけを定める。オントロジーは、コンピュータ情報技術の分野における技術用語であり、例えば、特定のカテゴリー、プロパティ、及び特定のドメインの一部を形成する概念間の関係の表現及び正式名を包含する。例えば、本事例では、オントロジーは、(すでに論じたように)オントロジーに格納された標準的な事象の属性に基づき、医療記録から抽出された候補事象をマップすることができる標準的な介入事象(指標付け介入事象)のセットを定めるためのものであってもよい。定められた紐づけは、単に、データセット内の様々な指標付け介入事象名の各々に関連付けられた又は紐づけられた、オントロジーデータセットに格納された属性のそれぞれのセットが存在することを意味し得る。
【0031】
医療記録の集約は、階層的データ構造に医療記録を構造化することを含んでもよく、階層的データ構造は、記録の各々に適用される指標付け事象分類に従ってグループ化又はソートされた、得られた複数の医療記録を含む。
【0032】
1つ以上の例によると、当該方法は、各医療記録の指標付け事象分類ごとに下位分類を決定するさらなるステップを含んでもよく、下位分類は、該当する医療記録のさらなる属性に基づく。
【0033】
例として、適切な例において、上述の階層的データ構造は、得られた医療記録を、医療記録のさらなる属性に従って、指標付け事象分類に補助的なレベルでさらにソートさせてもよい。補助的なソートレベルは、上記のものに従って決定された下位分類に基づいてもよい。
【0034】
特定の例において、例えば、さらなる属性は:各医療記録のタイムスタンプ及び指標付け事象分類のサブカテゴリーのうち少なくとも1つを含んでもよい。
【0035】
この場合、又は任意の他の例によると、さらなる属性は、自然言語処理ツールを使用して各医療記録から抽出されてもよい。
【0036】
当該方法は、1つ以上の例によると、データ抽出モデルを訓練するための訓練手順をさらに含んでもよく、訓練手順は、得られた複数の医療記録から医療記録のサブセットを選択し、選択された記録のサブセットをモデルに入力し、上記の記録のサブセットに含まれるデータから異なる指標付け事象のセットを特定するためにモデルを訓練することを含む。
【0037】
訓練手順は、例えば、医療記録を処理するステップの前に行われてもよい。
【0038】
特定の例によると、訓練手順は、条件付き確率場(CRF)又は畳み込みニューラルネットワーク(CNN)の使用を含んでもよい。そのようなツールは、例えば、データ抽出モデルを構築するために使用することができる。条件付き確率場及び畳み込みニューラルネットワークは、データ処理の分野ではよく知られたツールであり、当業者は、これらの用語が指す方法を認識することになる。
【0039】
医療記録は、1つ以上の介入事象を言語学的に表すテキストベースの内容を含んでもよく、データ抽出モデルは、1つ以上の介入事象を抽出するために言語分析方法を適用するように構成される。
【0040】
言語分析技術は、自然言語処理技術を含んでもよい。
【0041】
(上述の)ユーザに関係する情報は、特定の例において、ユーザに関係する識別情報、又はユーザの関心臨床領域を示す情報を含んでもよい。
【0042】
関心臨床領域を示す情報に基づき、最も適切な又は関連している指標付け介入事象を、データを集約(すなわち、グループ化又はソート)するための基準として選択することができる。例えば、指標付け介入事象は、その関心臨床領域に最も臨床的に関連するものとして選択されてもよい。
【0043】
情報が識別情報である場合、ここでは、識別情報を使用して、(それぞれの識別情報に紐づけられた)各ユーザについての特定の好ましい指標付け介入事象を格納しているか又は単に各患者の関心臨床領域を格納しているかもしれないデータベースをサーチ又は検索することができる。このアプローチは、入力された識別情報のみを必要とし、その関心臨床領域の説明を必要としないため、ユーザの観点からより効率的であり得る。
【0044】
従って、述べられているように、集約を行うための指標付け介入事象の選択は、特定の例において、複数のユーザと、各ユーザに対する好ましい指標付け介入事象との紐づけを有するユーザデータベースを検索することを含んでもよい。
【0045】
1つ以上の例によると、当該方法は、1つ以上の介入事象を抽出するステップを行うために複数の格納されたデータ抽出モデルのうち1つを選択するステップを含んでもよく、データ抽出モデルは、ユーザに関係する情報に基づき選択される。
【0046】
ユーザに関係する情報は、例えば、関心臨床領域及び/又は1つ以上の好ましい指標付け介入事象を示す情報であってもよい。これに基づき、当該方法は、好ましい指標付け事象のその臨床領域に最も関連する(候補)介入事象を医療記録から抽出するように構成されたデータ抽出モデルを選択することができる。特定の例では、各利用可能なデータ抽出モデルに対して、抽出のために構成された介入事象のリスト、及び/又は、抽出のために構成された指標付け事象のリストを格納するデータ構造が存在し得る。
【0047】
本発明のさらなる態様による例は、コンピュータプログラムであって、当該プログラムがコンピュータ上で実行されると、すでに概説したか又は以下に記載される例又は実施形態のいずれかによる方法を実施するためのコード手段を含むコンピュータプログラムを提供する。
【0048】
本発明のさらなる態様による例は、処理ユニットを提供し、当該処理ユニットは:
複数の医療記録を得て;
データ抽出モデルに従って医療記録を処理して、それぞれが医療介入を表す1つ以上の介入事象を各記録から抽出し;
アルゴリズムに従って、抽出された介入事象の各々を処理して、特徴付け属性のセットに関して事象の表現を導き出し、属性は、定められた属性ドメインのセットの各々における少なくとも1つの属性を含み;
指標付け介入事象のデータセットにアクセスし、指標付け介入事象の各々がデータセットにおいて、対応する属性のセットに関する表現に関連しており、上記の定められた属性ドメインのセットの各々に属する少なくとも1つを含み、さらに、抽出された介入事象及び格納された指標付け介入事象の属性の比較に基づき、各抽出された介入事象に最も近い一致する指標付け事象を特定し;
医療記録の各々を、その記録に対して特定された1つ又は複数の指標付け介入事象に従って分類し;
複数の医療記録を集約するための基準として使用するためにデータセット内の指標付け介入事象のうち1つを選択し、選択は、ユーザに関係する情報に基づき;
選択された指標付け介入事象に基づき、得られた複数の医療記録を集約する;
ように構成される。
【0049】
本発明の方法の態様に関連した上記の例、オプション、又は実施形態のうちいずれの特徴も、本発明の上記の装置の態様に等しく有利に適用することができる。
【0050】
本発明のこれら及び他の態様が、以下において記載される1つ又は複数の実施形態から明らかになり、以下において記載される1つ又は複数の実施形態を参照して解明される。
【図面の簡単な説明】
【0051】
発明をより良く理解するため、及び、それをどのように実行することができるかをより明確に示すために、次に、単なる例として、添付の図面が参照される。
【
図1】本発明の1つ以上の実施形態に従った例となる方法のブロック図である。
【
図2】1つ以上の実施形態に従った1つの例となる方法の例となるワークフローの概略図である。
【
図3】1つ以上の実施形態に従った例となる処理ユニットを実施する際に使用する例となるコンピュータのブロック図である。
【発明を実施するための形態】
【0052】
本発明は、図を参照して記載されることになる。
【0053】
詳細な記載及び具体的な例が、装置、システム、及び方法の例証的な実施形態を示しているけれども、これらは単に例示目的を意図しており、本発明の範囲を限定することを意図していないということが理解されるべきである。本発明の装置、システム、及び方法のこれら及び他の特徴、態様、及び利点が、以下の説明、付随の特許請求の範囲、及び添付の図面からより良く理解されることになる。図は単なる概略図であり、縮尺通りに描かれていないということが理解されるべきである。また、同じ又は類似の部分を示すために、図を通して同じ参照番号が使用されているということも理解されるべきである。
【0054】
本発明は、医療介入に関連する各記録について特定された指標付け介入事象に従った医療記録のセットの分類に基づき、医療記録データを組織化する方法を提供する。本発明は、複数の医療記録の各々について、1つ以上の候補介入事象を抽出し、次に、これらを標準的な介入事象名(指標付け介入事象)のデータセット(又はオントロジー)にマップして、各抽出された介入事象について最も近い一致する指標付け事象を特定することに基づいている。マッピングは、各抽出された介入事象を、特定のドメイン又はタイプの特徴付け属性のセットに分類し、次に、これらを、データセット内の指標付け事象の各々についての対応する属性セットと比較することに基づいている。最も近い一致が見つかり、各医療記録は最も近い一致する指標付け事象に従って分類される。次に、データは、分類に基づき、及び、ユーザに関する情報、例えば、特定の専門臨床領域等にも基づき集約される。
【0055】
本発明の実施形態は、異なる特定の医師の要件を理知的に考慮に入れた方法で、複数の異なるデータソースからのデータを集約し組み合わせるより効率的な手段を提供することを目的としている。
【0056】
特に、本発明の実施形態は、現在の医療データシステムに関する少なくとも2つの重要な問題に取り組むものとして理解することができる。
【0057】
第一に、臨床医にとって、複数のデータソースにわたって分散した複数のばらばらの医療記録を手動で検索することに基づき、臨床医の診療に関連する特定の臨床情報を探索することは非常に非効率的である。
【0058】
医療記録は、典型的には、異なる情報システムに散在している。病院情報管理データの取得可能性の分野における最近の改善にもかかわらず、記録はばらばらになったままであり、組織化も不十分である。従って、特に、関連する記録間の紐づけが不十分なため、医師にとって関連情報を特定することは不便で非効率なままである。
【0059】
さらに、異なる病院情報システムは、典型的には、異なる特定の目的を有して異なるプロトコルで動作するため、システム間の直接的な通信又は統合は困難である。例えば、特定の患者に対する記録を共にグループ化するためには、非効率的な手作業による介入が必要である。
【0060】
医師は、例えば、システムの長期的な使用及び経験を通して特定のシステムに対してこれらの問題を経時的に軽減する(データ検索をより速くする)かもしれないけれども、他の病院の症例を調査することになる際には、新しいシステムの使用方法を学ぶ必要がある。
【0061】
第2の主な問題は、異なる役割を担う臨床スタッフ又は異なる臨床専門家がそれぞれ、異なる特定のデータ組織化のニーズを持っている可能性があるということである。
【0062】
例えば、医師は、ケースレビューを行うために関連した臨床記録を分類する必要があることが多い。既知の電子医療記録(EMR)システムにおいて、臨床文書は、典型的には単に時系列によってソートされる。医師は、次に、選択された患者の記録を取得するために、マニュアル検索及びフィルター機能を使用しなければならず、これは非効率的である。
【0063】
異なる臨床シナリオでは、医師は、特定の情報を必要とすることがある。従って、臨床文書に対する柔軟な分類は価値がある。一般に、医師は、患者の状態を分析するために、異なる記録を比較し関連付ける必要がある。
【0064】
上記の問題に取り組むために、本発明は、各記録が関連付けられ得る特定の「ドライバー事象」に基づき、医療記録(臨床文書等)を分類及び集約する方法を提案する。これらのドライバー事象は、紐づけ又は集約のために異なる記録の指標をつける又はそれらをカテゴリー化するように使用されるため、指標付け事象の機能を果たす。
【0065】
ドライバー事象又は指標付け事象は全て、なんらかの臨床的な介入、行為、又は出来事に関し、このために、指標付け介入事象と呼ばれることになる。
【0066】
指標付け介入事象又はドライバー事象は、一般に、各医療記録の背後にある何らかの行為若しくは狙い、又は根底にある「駆動」目的を表している。例えば、指標付け介入事象は、主要な介入(例えば、手術等)を表してもよく、診断、入院、及び手術自体の報告に関する記録は、この介入事象の指標をつけられることがある。手術に続いて、定期的な患者モニタリング及び臨床医の診察等の経過観察の事象は、駆動目的がもはや手術ではなく、正しくは安定性及び改善のモニタリングであるため、異なる指標付け介入事象に関してもよい。
【0067】
具体的な例として、患者は、最初に肝がんと診断され得る。根治的治療(例えば、肝切除術等)に適している場合、そのような治療は、治療につながる記録に対する指標付け事象を表すことになる。例えば、診断に続いて、患者を入院患者として登録して入院させ、次に、治療を行うことができる。治療につながる活動のうち全て及び治療自体が、切除術の指標付け介入事象に関する。
【0068】
退院後、その後の医療記録に対する関連する指標付け(駆動)事象は、外来での経過観察に変更することができる。
【0069】
将来、患者が何らかの症状の再発を経験した場合、関連する指標付け事象は、TACE(肝動脈化学塞栓術)又は別の介入に変更することができる。
【0070】
以下に説明するように、これらの異なる指標付け事象の各々に関する全ての医療記録を、指標付け事象の周囲に集約又はクラスター化することができる。
【0071】
指標付け介入事象を構成するものの特定の一般的な定義は、技術的な意味では重要ではないということに留意されたい。なぜなら、どの事象が指標付け介入事象として分類されるかは、本質的に、(以下に説明するように)使用される特定のオントロジー又は指標付け介入事象のデータセットによって定められる可能性があるからである。実施形態による方法は、全ての抽出された候補事象を、このデータセット又はオントロジーにおいて定められた指標付け介入事象の1つに一致させること又はマップすることを含み、従って、このデータセットは、指標付け介入事象のセットを効果的に定めている。
【0072】
これらの鍵となる介入事象に基づき記録を分類する利点は、異なる専門分野からの異なる臨床的関心を持つ臨床医が、彼らに関連する特定の種類の介入事象に従ってデータを容易にソート又は集約することができるということである。
【0073】
例えば、多くの専門分野にわたるチーム(MDT(Multiple Disciplinary Team))の場合、様々な部門からの専門家が、1人の患者について異なる観点から記録を見ることを望む可能性がある。例えば、高血圧を有する肝がん患者に対して、心臓病学の専門家は心血管の介入事象に関する記録を調査する必要があり得る。この患者に対する慢性疾患の病歴及び異常なバイタルサインが、例えば、このユーザにとって重要な因子であり得る。
【0074】
しかし、肝臓の専門医は、代わりに、肝切除手技の手術の詳細、及び、例えば、臨床検査結果の進行に関する情報を必要とすることがある。
【0075】
本発明の実施形態において適用されるドライバー事象に基づく分類で、各ユーザは、ユーザに関連する特定の介入事象分類に従って、記録を容易にソート又は集約することができる。
【0076】
図1は、本発明の1つ以上の実施形態による例となる方法を例示している。当該方法は、第一に、ステップの進行を示すために概要で述べられることになり、次に、各特定のステップがさらに説明され、次に明確にされることになる。
【0077】
例となる方法は、第一に複数の医療記録を得るステップ12を含む。医療記録は、例えば、遠隔コンピュータからデータメッセージとして受信されてもよく、又は、当該方法は、例えば、1つ以上のデータソースに能動的にアクセスし、医療記録を検索又は抽出するステップを含んでもよい。当業者には明らかなように、記録を得る他の手段も使用することができる。
【0078】
当該方法は、データ抽出モデルに従って医療記録を処理して、各記録から1つ以上の介入事象を抽出するステップ14をさらに含み、各介入事象は医療介入を表している。これらの介入事象は、例えば、候補介入事象として理解され得る。抽出は、自然言語処理(NLP)技術に基づいてもよい。例えば、医療記録はそれぞれ、1つ以上の介入事象を言語学的に表すテキストベースの内容(例えば、フリーテキスト等)を含んでもよく、データ抽出モデルは、1つ以上の介入事象を抽出するために言語分析方法を適用するように構成される。
【0079】
当該方法は、アルゴリズムに従って、抽出された介入事象の各々を処理して、特徴付け属性のセットに関して事象の表現を導き出すステップ16をさらに含み、属性は、定められた属性ドメインのセットの各々における少なくとも1つの属性を含む。アルゴリズムは、予め決定され、予め格納され、抽出を行うように構成されてもよい。このステップは、各抽出された介入事象を、特定のドメインに属する属性のセットに分類又は分解することを含む。必要なドメインを定めることによって、これは、事象を、標準的な指標付け事象のデータセット内の事象と比較することをより容易且つより効率的にする。なぜなら、共通のドメインにおけるそれらのそれぞれの属性に基づき行うことができるからである。
【0080】
当該方法は、指標付け介入事象のデータセットにアクセスするステップをさらに含み、指標付け介入事象の各々が、データセットにおいて、対応する属性のセットに関する表現に関連付けられ、上記の定められた属性ドメインのセットの各々に属する少なくとも1つを含み、さらに、抽出された介入事象及び格納された指標付け介入事象の属性の比較18に基づき、各抽出された介入事象に最も近い一致する指標付け事象を特定するステップ20をさらに含む。従って、このステップは、各抽出された事象の、データセット内の標準的な指標付け事象のセットへのマッピングを表し、マッピングは、それぞれの事象の属性表現に基づいている。指標付け介入事象のデータセットは、指標付け介入事象のオントロジーを表してもよい。
【0081】
最も近い一致する指標付け介入事象を特定するステップに続いて、当該方法は、その記録に対して特定された1つ又は複数の最も近い一致する指標付け介入事象に従って、医療記録の各々を分類するステップ22を含む。各記録は、2つ以上の指標付け介入事象を用いて分類されてもよく、例えば、所与の記録に対して複数の介入事象が抽出された場合、これらの介入事象の各々に対して、最も近い一致する指標付け事象が特定されてもよい。従って、記録は、最も近い一致する指標付け介入事象の全てに従って分類されてもよい。
【0082】
当該方法は、複数の医療記録を集約するための基準として使用するために複数の指標付け介入事象のうち1つを選択するステップ24をさらに含み、選択するステップは、ユーザに関係する情報に基づいている。ここで、医療記録が組織化されるか又はグループ化される(すなわち、集約される)ことになる特定の基準が選択される。これは、例えば、臨床医の臨床専門分野に関し得るユーザ固有の情報に基づいている。このようにして、データは、該当するユーザに最も関連する指標付け介入事象に従って上記の記録がグループ化又はソートされるように、組織化又は集約される。
【0083】
従って、当該方法は、選択された指標付け介入事象に基づき分類された複数の医療記録を集約するステップ26をさらに含む。集約するステップは、例えば、選択された指標付け介入事象によって記録をグループ化及び/又はソートすることを含んでもよい。集約するステップは、選択された指標付け介入事象を用いて分類された記録のみを選択するために、記録をフィルタリングすることを含んでもよい。
【0084】
次に、当該方法のこれらのステップが、以下においてより詳細に説明される。
【0085】
論じられているように、本発明の実施形態は、各記録が関係する鍵となる駆動事象(指標付け介入事象)に従って医療記録を分類することに基づいており、ここで、分類が行われる指標付け事象は、標準的な格納されたデータセット又はオントロジーにおいて定められている。
【0086】
論じられているように、指標付け介入事象は、各記録が関係する異なる根底にある又は中心的な医療目的に従って定められてもよい。例えば、外来段階での最初の診察の場合、一部の例では、中心的な(指標付け)介入事象が診断として考慮されてもよい。手術の入院事象の場合、中心的な介入事象は、行われている手術であると考慮されてもよい。
【0087】
異なる入院事象、例えば、内科の入院事象等については、中心的な介入事象は、投与された薬物療法であると考慮されてもよい。
【0088】
さらに、一般に、全体的な介入事象が、複数のより具体的な治療又は診断の目的又は事象に関し得るため、当該方法の1つ以上の実施形態に従って、各指標付け介入事象は、異なる事象のサブタイプにさらに分割されてもよい。
【0089】
これによって、各医療記録に適用される指標付け事象分類ごとに、下位分類を決定するさらなるステップが当該方法において可能になり、下位分類は、例えば、該当する医療記録のさらなる属性に基づいている。
【0090】
一例として、下位分類は、単に特定の記録のタイムスタンプ又はタグに基づいてもよい。
【0091】
しかし、さらなる例において、下位分類は、該当する介入事象のより詳細な又は特定のカテゴリー化に関してもよい。
【0092】
具体的な例として、肺切除術の介入事象が:完全な切除、不完全な切除、不確実な切除、及び開放及び閉鎖手術(open and close operation)の1つとして下位分類されてもよい。サブカテゴリー化が、該当する医療記録の意味解析又は言語分析に基づき行われてもよい。
【0093】
集約ステップにおいて、記録は、指定されたサブカテゴリー化に従って、指標付け介入事象に補助的なレベルでさらにソートされてもよい。
【0094】
サブカテゴリー化を標準化するために、指標付け介入事象のデータセット(さもなければ、指標付け介入事象のオントロジーとして知られている)は、データセットに含まれる指標付け介入事象の一部又は全てに対して、複数のサブカテゴリー化を含むか若しくは包含する、又は定めてもよい。
【0095】
論じられているように、本発明は、指標付け介入事象のデータセットの使用に基づいており、各医療記録からの各抽出された介入事象が、事象の属性のセットの比較に基づき、データセット内の指標付け介入事象にマップされるか又は関連づけられる。
【0096】
指標付け介入事象のデータセットは、介入事象のオントロジーを表す、包含する、又は含んでもよい。このデータセット又はオントロジーは、各医療記録から抽出された各介入事象がマップされ得る標準的な介入事象(指標付け介入事象)のセットを効果的に定める。これによって、標準的な事象名のセットによって記録をソートすることができるということが確実にされる。
【0097】
当該方法は、特定の例において、指標付け介入事象のデータセットを構築するステップを含んでもよい。このデータセットは、指標付け介入事象のオントロジーを構成してもよい。これは、シードライブラリとして効果的に使用され得る。オントロジーは、コンピュータ情報科学の分野でよく知られている概念であり、一般に、ツリー構造に組織化された概念のセットを表す。
【0098】
指標付け介入事象のデータセット又はオントロジーは、例えば、シードワードのセットを含んでもよく、ここで、これらは、臨床専門用語の標準的な使用に従ったものであるように、臨床レキシコンに基づき予め定められる。これらのシードワードは、指標付け介入事象の各々の名前を表してもよい。
【0099】
データセット内の指標付け介入事象ごとに、指標付け介入事象に対する特徴付け属性のセットが格納される。
【0100】
一組の有利な例では、この属性のセットは、定められた属性ドメインのセットの各々からの少なくとも1つの属性を含む。
【0101】
有利に、属性のセットは、3つの特定の属性ドメインの各々における1つの属性を含んでもよく、これらのドメインは:介入事象が関係する解剖学的領域;介入事象が関係する介入処置;及び上記の介入事象が関係する介入処置のサブタイプ又はカテゴリーを含む。これらの3つのドメインは、さもなければ:フィーチャドメイン(Feature domain)、エンティティドメイン(Entity domain)、及びバリュードメイン(Value domain)として知られている可能性がある。エンティティとは、介入事象が関係する解剖学的領域を指し;フィーチャとは、切除又は他の医療行為若しくは介入等の鍵となる処置を指してもよく;バリューとは、事象の詳細な特性又は説明、すなわち、サブカテゴリー又はタイプを指してもよい。
【0102】
具体的な例として、肝動脈化学塞栓術と呼ばれる疾患が存在し、以下の:
エンティティドメイン:動脈;
フィーチャドメイン:化学塞栓;
バリュードメイン:手術;
のように上記の属性ドメインに関して表されてもよい。
【0103】
データセット又はオントロジーに格納するための、そのような属性のセットに関する指標付け介入事象の各々の表現は、例えば、臨床専門家によって手動で決定されてもよい。或いは、例えば、教科書又は他の資料からの鍵となる属性の抽出に基づき、自動的に決定されてもよい。次に、これは、任意的に、臨床専門家によってその後調査される。
【0104】
オントロジーにおける各指標付け事象のエンティティ-フィーチャ-バリューの属性の分類で、1つの概念を3つの部分に分けることができ、3つの属性が異なる方法で組み合わされるのを可能にしている。これによって、異なる介入事象の広範なカテゴリー化が、非常に具体的且つ柔軟な方法で可能になる。このようにして、臨床概念知識の表現は、以下において説明するように、3つの属性ドメインの組み合わせを通して未知の医療記録を分類及びソートするために大きく拡張することができる。
【0105】
実施形態による方法は、各医療記録から1つ以上の介入事象を抽出するステップを含む。これは、さもなければ、医療記録の構文解析として知られている。これは、データ抽出モデルの使用に基づき行われる。
【0106】
特定の例では、データ抽出モデルを構築又は訓練するプロセスが行われてもよい。これは、本発明の方法を行う前に実行されてもよく、又は、本発明の1つ以上の実施形態に従って、本発明の方法におけるさらなる予備ステップとして行われてもよい。
【0107】
いずれの場合も、従って、1つ以上のデータ抽出モデルを訓練するための訓練手順が行われてもよい。これは、例えば、得られた複数の医療記録から医療記録のサブセットを選択し、選択された記録のサブセットをモデルに入力し、上記の記録のサブセットに含まれるデータから異なる介入事象のセットを特定するためにモデルを訓練することに基づいてもよい。
【0108】
一例によると、いくつかのデータ抽出モデルを、候補介入事象の抽出のために、すなわち、記録が少なくとも部分的に関係する介入事象の名前を特定するために訓練することができる。これは、例えば、手術名又は療法を含んでもよい。
【0109】
構築されるモデルごとに、最初に、複数の医療記録の鍵となるサブセット又は医療記録のデータが選択される。これは、該当するモデルが特定及び抽出のために構成されることになる特定の1つ又は複数の介入事象に最も関連するか又はそれを最も示す鍵となるデータを選択することに基づいてもよい。
【0110】
鍵となるデータは、例えば、診察又は臨床医への所与の訪問の目的等、各出来事の目的を表すデータを含んでもよい。鍵となるデータは、例えば、臨床医又は病院への所与の訪問の間に生成された医療記録の完全なセットから選択されてもよい。このように医療記録をフィルタダウンすることによって、訓練を最も関連しているデータのみを使用して行うことができ、それによって訓練の効率が改善され、精度も改善される。
【0111】
例えば、外科的介入事象を抽出又は特定する場合、手術ノート及び症状ノートは重要である。進行ノート及び医療指示が、入院治療事象の検出に重要な場合がある。次に、選択されたデータのサブセットが、1つ以上の介入事象を抽出するようにデータ抽出モデルを訓練するために使用される。
【0112】
この訓練手順では、入力データは、選択された医療記録である。出力は、介入事象名である。
【0113】
一例として、条件付き確率場(CRF)又は畳み込みニューラルネットワーク(CNN)を使用して、データ抽出モデルを構築することができる。いくつかの介入事象が、単一の医療記録又は記録の群から抽出されてもよい。例えば、全てが臨床医又は医療センターへの特定の訪問に関係する記録の群に対して、複数の介入事象が記録から抽出されてもよい。
【0114】
例えば、冠動脈心疾患を有する患者が、肝切除手術のために病院に通院している可能性がある。この処置によって心臓にかけられる圧力を考慮して、医師は主な手術に先立って冠動脈拡張療法を実施してもよい。従って、冠動脈拡張療法に関係する及び主な腫瘍切除療法に対する記録が存在することになる。関心臨床領域又は専門分野が肝臓である医師にとって、関連する介入事象は肝腫瘍の切除である。しかし、関心臨床領域又は専門知識が心臓病学である医師にとっては、最も関連する介入事象は、代わりに、冠動脈拡張である。
【0115】
1つ以上のデータ抽出モデルが(本発明の方法の前であろうと、その一部としてであろうと)構築及び/又は訓練されると、1つ又は複数のモデルを適用して、複数の医療記録から介入事象を抽出するステップを行うことができる。
【0116】
論じられているように、1つ以上の介入事象名(例えば、手術名又は薬物療法名等)が、得られた複数の医療記録から抽出されると、抽出された介入事象の各々を、共通のデータセット又はオントロジーにおいて列挙された標準的な指標付け介入事象にマップする必要がある。
【0117】
これは、手術名又は薬物療法名を、特徴付け特性のセットに関する表現に変換することに基づいており、各々が特定の特徴ドメインのセットの1つに属する。ドメインは、すでに論じたエンティティ、フィーチャ、バリューのドメインであってもよい。従って、この場合、抽出された介入事象の各々は、対応する「エンティティ-フィーチャ-バリュー」の属性パターン又は表現に分解又は分類される。従って、例えば、介入事象ごとに、介入事象の3つの属性を含むタプル又はトリプルを含む表現を導き出すことができる。
【0118】
述べたように、エンティティ属性は、例えば、事象が関係する解剖学的部位を指し、フィーチャ属性は、特定の療法又は処置のタイプに対応してもよい。バリュー属性は、異なる事柄に関してもよく、一般に、介入事象のいくつかのより詳細な特性に対応する。例えば、場合によっては、使用される特定の材料を指してもよい。
【0119】
例えば、経皮的エタノール注入と呼ばれる手術が存在する。経皮的は、エンティティ属性として解剖学的部位を示しており;注入は、フィーチャ属性として処置タイプを示しており;エタノールは、バリュー属性として療法材料を示している。従って、介入事象は、3つの属性の一般的なパターンにマップすることができる。
【0120】
データセット又はオントロジーにおける各指標付け介入事象はまた、特徴付け属性に関する、例えば属性のエンティティ-フィーチャ-バリューのパターンに関する関連する表現と共に格納されるということは、既に論じられている。これによって、抽出された事象の属性セットの、指標付け事象の属性セットへの比較又はマッピングに基づき、各抽出された介入事象が、データセットの最も近い一致する標準的な指標付け介入事象にマップされるのが可能になる。これは、記録の分類及び集約が、共通の概念のセットに基づき行われるように、共通のレキシコンが特定の介入事象タイプを指すために使用されるということを確実にする。
【0121】
例えば、同じ解剖学的部位に対して異なる名前がこのプロセスによって混合されてもよい。
【0122】
特定の例によると、各介入事象のサブカテゴリーは、1つ以上の例に従って、決定又は抽出されてもよい。これは、例えば、各医療記録へのNLPツールの適用に基づき決定することができる。このようにして、記録の言語分析又は意味解析が行われ、これに基づき、サブカテゴリー化が決定される。具体的な例として、例えば、右葉肝切除術及び胆管切除術の場合、肝胆道切除手術の特定の指標付け介入事象の下位分類を導き出すことができる。
【0123】
抽出された介入事象の属性セットと、データセットに格納された指標付け介入事象の属性セットとの比較を行うために、特定の例では、レーベンシュタイン距離アルゴリズムが使用されてもよい。これによって、任意の属性の2セット間の類似性が計算されるのが可能になり、各属性のセットは、例えば、共通の属性ドメインのセットに関係している。
【0124】
レーベンシュタイン距離は、最小編集距離としても知られている。これは、一般に、2つの文字列間の類似性の測定を可能にする。この距離は、1つの文字列を別の文字列に変換するのに必要な欠失、挿入、又は置換の数に対応している。
【0125】
最も近い一致する指標付け介入事象は、例えば、関連する属性セットが、抽出された介入事象の属性セットとの最も高い類似性レベルを示すものとして決定される。レーベンシュタイン距離アルゴリズムの場合、最も高い類似性レベルは、最も短いレーベンシュタイン距離に対応する。
【0126】
次に、関連する介入事象が抽出された医療記録は、1つ又は複数の最も近い一致する指標付け介入事象に従って分類されてもよい。
【0127】
論じられているように、これに続いて、分類された医療記録は、指標付け事象分類に基づき集約される。より詳細には、事象が集約される特定の指標付け介入事象は、ユーザに関係する情報に基づき決定されてもよい。
【0128】
従って、指標付け介入事象分類は、高レベルで患者の病歴を組織化する非常に効率的な方法を提供する。
【0129】
例えば、医療記録の集約は、階層的データ構造に医療記録を構造化することを含んでもよく、階層的データ構造は、記録の各々に適用される指標付け事象分類に従ってグループ化又はソートされた得られた複数の医療記録を含む。
【0130】
階層的データ構造は、得られた医療記録を、医療記録のさらなる属性に従って、指標付け事象分類に補助的なレベルでさらにソートさせてもよい。例えば、医療記録は、患者の治療のタイムライン(すなわち、時系列)に従うようにさらにソートされてもよい。
【0131】
記録が集約又はソートされる基準は、ユーザに関係する情報に従って選択することができる。
【0132】
一部の例において、ユーザに関係する情報は、ユーザに関係する識別情報、又はユーザの関心臨床領域を示す情報を含んでもよい。これは、例えば、ユーザの臨床専門分野に関係する情報であってもよい。これは、ユーザの専門的な(例えば、臨床的な)背景に関係する情報であってもよい。このようにして、記録がソート又は集約される基準となる特定の指標付け介入事象を、ユーザに関する状況情報に基づき選択することができる。
【0133】
一例として、集約を行うための指標付け介入事象の選択は、複数のユーザと各ユーザに対する好ましい指標付け介入事象との紐づけを有するユーザデータベースを検索することを含んでもよい。
【0134】
例えば、所与の医療センターでは、異なる専門的背景及び異なる関心臨床領域を有するユーザ(例えば、医師等)は、異なる方法で患者の医療記録を集約及び分類する必要があるかもしれない。
【0135】
例えば、臨床医によっては、異なる特定の指標付け介入事象、すなわち、彼らの診療に最も関連する事象に基づき、データがグループ化、ソート、又は集約されるのを好む可能性がある。
【0136】
一部の例において、プロフィールが、多くのユーザ(例えば、臨床医等)の各々について維持されてもよく、これは、例えば、ユーザの特定の関心臨床領域又は専門領域、及び/又は、ユーザが最も関心を有する1つ以上の特定の指標付け介入事象を示している。これらの因子のいずれかに基づき、当該方法は、特定の指標付け介入事象を選択することができ、これに基づき、医療記録の集約を行うべきである。
【0137】
一部の例において、医師の名称、役割、医学部、及び/又は患者に関する詳細を考慮に入れたプロフィールが維持されてもよい。集約の基準とすべき指標付け介入事象は、これに基づき選択することができる。
【0138】
例えば、患者病棟で診療している循環器内科からの医師に対しては、心血管療法に関する指標付け介入事象が選択されてもよい。
【0139】
ユーザプロフィールは、任意の例において、一定間隔で更新されてもよい。これは、例えば、ユーザと所与のシステム上で実行されている他のアプリケーションとの相互作用によってトリガされ得る。
【0140】
すでに述べられているように、複数のデータ抽出モデルは、当該方法を実行する前に構築されてもよい。1つ以上の実施形態によると、当該方法は、(医療記録からの)1つ以上の介入事象を抽出するステップを行うために、複数の格納されたデータ抽出モデルのうち1つを選択することを含んでもよく、データ抽出モデルは、ユーザに関係する情報に基づき選択される。ユーザに関係する情報は、例えば、ユーザの関心臨床領域及び/又はデータを集約するための1つ以上の好ましい指標付け介入事象に関してもよい。
【0141】
さらに当該方法を例示するために、
図2は、次に簡単に述べられる方法の例となるワークフローを概略的に描いている。
【0142】
複数のデータソース32a、32bから生じる複数の医療記録が第一に得られる。これらは、次に、データ抽出ステップ14において、データ抽出モデルによって処理されて、各医療記録が関係する1つ以上の介入事象が抽出される。
【0143】
これに続いて、抽出された介入事象ごとに、これは、特徴付け属性36のセットに関する表現に分類され、これらの属性は、定められた属性ドメインのセット40a、40b、40cの各々における少なくとも1つを含む。この場合、3つの属性ドメインがある。例えば、これらは、上記のエンティティ-フィーチャ-バリューのドメインに対応してもよい。
【0144】
3つのドメインの各々からの1つである、3つの属性のうち単一のタプル42又はセットが、各抽出された介入事象の表現として導き出される。これは、次に、導き出された属性のセット42と、異なる指標付け介入事象に対するデータセットに格納された属性のセットとの比較に基づき、データセット又はオントロジー48に格納された最も近い一致する指標付け介入事象にマップされる。
【0145】
好ましくは、最も近い一致する指標付け介入事象を特定し、これに基づき、抽出された事象を分類することに加えて、介入事象の下位分類も導き出され、これは、特定された最も近い一致する指標付け介入事象のより詳細な又は狭いサブカテゴリーを表している。
【0146】
次に、抽出された介入事象の集約(図示せず)が、適用されたカテゴリー化及びサブカテゴリー化に基づき行われる。
【0147】
本発明のさらなる態様による例は、処理ユニットを提供し、当該処理ユニットは:
複数の医療記録を得て;
データ抽出モデルに従って医療記録を処理して、それぞれが医療介入を表す1つ以上の介入事象を各記録から抽出し;
アルゴリズムに従って、抽出された介入事象の各々を処理して、特徴付け属性のセットに関して事象の表現を導き出し、属性は、定められた属性ドメインのセットの各々における少なくとも1つの属性を含み;
指標付け介入事象のデータセットにアクセスし、指標付け介入事象の各々がデータセットにおいて、対応する属性のセットに関する表現に関連しており、定められた属性ドメインのセットの各々に属する少なくとも1つを含み、さらに、抽出された介入事象及び格納された指標付け介入事象の属性の比較に基づき、各抽出された介入事象に最も近い一致する指標付け事象を特定し;
医療記録の各々を、その記録に対して特定された1つ又は複数の指標付け介入事象に従って分類し;
複数の医療記録を集約するための基準として使用するためにデータセット内の指標付け介入事象のうち1つを選択し、選択は、ユーザに関係する情報に基づき;
選択された指標付け介入事象に基づき、分類された複数の医療記録を集約する;
ように構成されている。
【0148】
一例として、
図3は、上記の処理ユニットを実施するためのコンピュータ52の一例を例示している。
【0149】
コンピュータ52は、PC、ワークステーション、ラップトップ、PDA、パーム装置、サーバ、及びストレージ等を含むが、これらに限定されない。一般的に、ハードウェアアーキテクチャに関して、コンピュータ52は、ローカルインタフェース(図示せず)を介して通信可能に結合された1つ以上のプロセッサ54、メモリ56、及び1つ以上のI/Oデバイス58を含んでもよい。当技術分野において知られているように、ローカルインタフェースは、例えば、1つ以上のバス、又は他の有線若しくは無線接続であってもよいが、これらに限定されない。ローカルインタフェースは、通信を可能にするために、コントローラ、バッファ(キャッシュ)、ドライバ、リピータ、及びレシーバ等、さらなる要素を有してもよい。さらに、ローカルインタフェースは、上述の構成要素間の適切な通信を可能にするために、アドレス、制御、及び/又はデータ接続を含んでもよい。
【0150】
プロセッサ54は、メモリ56に格納することができるソフトウェアを実行するためのハードウェア装置である。プロセッサ54は、実質的には、コンピュータ52に関連するいくつかのプロセッサの中でも、任意のカスタムメイド又は市販のプロセッサ、中央処理装置(CPU)、デジタルシグナルプロセッサ(DSP)、又は補助プロセッサであってもよく、プロセッサ54は、(マイクロチップの形態の)半導体ベースのマイクロプロセッサ又はマイクロプロセッサであってもよい。
【0151】
メモリ56は、揮発性メモリ素子(例えば、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)等のランダムアクセスメモリ(RAM)等)、及び、不揮発性メモリ素子(例えば、ROM、消去可能プログラマブルリードオンリーメモリ(EPROM)、電子的消去可能プログラマブルリードオンリーメモリ(EEPROM)、プログラマブルリードオンリーメモリ(PROM)、テープ、コンパクトディスクリードオンリーメモリ(CD-ROM)、ディスク、ディスケット、カートリッジ、又はカセット等)のうちいずれか1つ又は組み合わせを含み得る。さらに、メモリ56は、電子、磁気、光、及び/又は他のタイプの記憶媒体を組み込むことができる。メモリ56は、分散アーキテクチャを有してもよく、ここで、様々なコンポーネントが互いに離れて位置しているが、プロセッサ54によってアクセスすることができるということに留意されたい。
【0152】
メモリ56内のソフトウェアは、1つ以上の別々のプログラムを含んでもよく、その各々が、論理機能を実施するための実行可能な命令の順序付けられたリストを含む。メモリ56内のソフトウェアは、例証的な実施形態に従って、適したオペレーティングシステム(O/S)60、コンパイラ62、ソースコード64、及び1つ以上のアプリケーション66を含む。
【0153】
アプリケーション66は、計算ユニット、論理、機能ユニット、プロセス、オペレーション、仮想エンティティ、及び/又はモジュール等、多数の機能コンポーネントを含む。
【0154】
オペレーティングシステム60は、コンピュータプログラムの実行を制御し、スケジューリング、入出力制御、ファイル及びデータ管理、メモリ管理、並びに通信制御及び関連サービスを提供する。
【0155】
アプリケーション66は、行われることになる命令のセットを含むソースプログラム、実行可能プログラム(オブジェクトコード)、スクリプト、又は任意の他のエンティティであってもよい。ソースプログラムの場合、プログラムは通常、コンパイラ(コンパイラ62等)、アセンブラ、又はインタプリタ等を介して翻訳され、これらは、オペレーティングシステム60に関連して適切に動作するように、メモリ52内に含まれていても含まれていなくてもよい。さらに、アプリケーション66は、データ及びメソッドのクラスを有するオブジェクト指向プログラミング言語、又は、ルーチン、サブルーチン、及び/又は機能を有する手続き型プログラミング言語として書くことができ、これらのプログラミング言語は、例えば、C、C++、C#、Pascal、BASIC、APIコール、HTML、XHTML、XML、ASPスクリプト、JavaScript、FORTRAN、COBOL、Perl、Java、ADA、及び.NET等であるが、これらに限定されない。
【0156】
I/Oデバイス58は、例えば、マウス、キーボード、スキャナ、マイクロホン、カメラ等の入力装置を含んでもよいが、これらに限定されない。さらに、I/Oデバイス58は、例えば、プリンタ、ディスプレイ等の出力装置も含んでもよいが、これらに限定されない。最後に、I/Oデバイス58は、例えば、限定されるわけではないが、(遠隔装置、他のファイル、装置、システム、又はネットワークにアクセスするための)ネットワークインターフェースコントローラ(NIC)若しくは変調/復調器、無線周波(RF)又は他のトランシーバ、電話インターフェース、ブリッジ、ルータ等の入力及び出力の両方を通信する装置をさらに含んでもよい。I/Oデバイス58は、インターネット又はイントラネット等の様々なネットワークを介して通信するための構成要素も含む。
【0157】
コンピュータ52が動作中であるとき、プロセッサ54は、メモリ56内に格納されたソフトウェアを実行して、メモリ56に且つそこからデータを通信し、ソフトウェアに従ってコンピュータ52の動作を一般的に制御するように構成される。アプリケーション66及びオペレーティングシステム60は、プロセッサ54によって全体的に又は部分的に読み込まれ、おそらくプロセッサ54内でバッファリングされ、次に実行される。
【0158】
アプリケーション66がソフトウェアで実装される場合、アプリケーション66は、任意のコンピュータ関連システム又は方法によって、又はそれらに関連して使用するために、実質的には任意のコンピュータ読取可能媒体上に格納することができるということに留意するべきである。本文書に関して、コンピュータ読取可能媒体は、コンピュータ関連システム又は方法によって又はそれらに関連して使用するためのコンピュータプログラムを有する又は格納することができる電子、磁気、光、又は他の物理的装置又は手段であってもよい。
【0159】
開示された実施形態に対する変更は、請求された発明を実行する際に、図面、明細書、及び付随の特許請求の範囲の調査から当業者により理解する及びもたらすことができる。特許請求の範囲において、「含む」という用語は、他の要素又はステップを除外せず、不定冠詞はその複数形を除外しない。1つのプロセッサ又は他のユニットは、特許請求の範囲において列挙されたいくつかの項目の機能を満たすことができる。特定の手段が互いに異なる従属項において記載されているという単なる事実は、これらの手段の組合せを役立つよう使用することができないと示しているわけではない。コンピュータプログラムは、他のハードウェアと共に若しくはその一部として供給される、光記憶媒体又は固体記憶媒体等、適したメディア上に記憶/分散させてもよいが、インターネット又は他の有線若しくは無線の通信システムを介して等、他の形状で分散させてもよい。特許請求の範囲におけるいかなる参照番号も、その範囲を限定するとして解釈されるべきではない。