IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アビオメド インコーポレイテッドの特許一覧

特許7475353有害事象を発見するための自然言語処理の使用
<>
  • 特許-有害事象を発見するための自然言語処理の使用 図1
  • 特許-有害事象を発見するための自然言語処理の使用 図2
  • 特許-有害事象を発見するための自然言語処理の使用 図3
  • 特許-有害事象を発見するための自然言語処理の使用 図4
  • 特許-有害事象を発見するための自然言語処理の使用 図5
  • 特許-有害事象を発見するための自然言語処理の使用 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-18
(45)【発行日】2024-04-26
(54)【発明の名称】有害事象を発見するための自然言語処理の使用
(51)【国際特許分類】
   G16H 15/00 20180101AFI20240419BHJP
【FI】
G16H15/00
【請求項の数】 12
(21)【出願番号】P 2021535564
(86)(22)【出願日】2019-12-20
(65)【公表番号】
(43)【公表日】2022-02-09
(86)【国際出願番号】 US2019067741
(87)【国際公開番号】W WO2020132390
(87)【国際公開日】2020-06-25
【審査請求日】2022-12-15
(31)【優先権主張番号】62/784,192
(32)【優先日】2018-12-21
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】510121444
【氏名又は名称】アビオメド インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】リュウ チェン
(72)【発明者】
【氏名】カテルジ アーマッド エル
【審査官】今井 悠太
(56)【参考文献】
【文献】特開2016-131017(JP,A)
【文献】特開2012-200546(JP,A)
【文献】特表2016-508041(JP,A)
【文献】米国特許出願公開第2015/0302161(US,A1)
【文献】米国特許出願公開第2015/0223731(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
(57)【特許請求の範囲】
【請求項1】
以下の工程を含む、自然言語処理を使用してコンピュータプロセッサにより複数の患者の臨床記述を自動的に分類するための方法であって、該臨床記述が、該複数の患者のうちの1人を治療するための心室補助装置(VAD)の使用に関連する、方法:
テキストを含む少なくとも1つの臨床記述を受け取る工程;
前記テキスト内の対象語の位置を決定する工程;
アクティブ領域内の少なくとも1つの否定語の存在を判定する工程であって、該アクティブ領域が、前記対象語を含む、前記対象語の直前および直後に存在する前記テキスト内の所定数の単語を含む、工程;
前記アクティブ領域内の少なくとも1つの身体部位語の存在を判定する工程;ならびに
前記アクティブ領域が否定語または身体部位語のどちらかを含む場合、前記少なくとも1つの臨床記述が無視されるべきであると判定する工程。
【請求項2】
単語トークンを生成するために前記テキストを処理する工程;
ある単語の活用形を含む単語トークンを判定およびグループ化する工程;ならびに
前記グループ化された単語トークンを使用して前記テキストに対してキーワード検索を行う工程
をさらに含む、請求項1記載の方法。
【請求項3】
前記アクティブ領域が否定語および身体部位語を含まない場合、前記少なくとも1つの臨床記述にフラグを立てる工程
をさらに含む請求項1または2記載の方法。
【請求項4】
前記少なくとも1つの臨床記述のヘッダにフラグを書き込む工程
をさらに含む請求項1~3のいずれか一項記載の方法。
【請求項5】
前記アクティブ領域の前記所定数の単語が少なくとも3語である請求項1~4のいずれか一項記載の方法。
【請求項6】
前記アクティブ領域の単語の前記所定数が3である、請求項5記載の方法。
【請求項7】
前記少なくとも1つの否定語が、「no(ない)」、「not(~ない)」、「nor(~もまた~ない)」、「non(非)」、「without(~なしの)」、「never(決して~ない)」、および「false(偽)」のうちのいずれか1つを含む請求項1~6のいずれか一項記載の方法。
【請求項8】
前記臨床記述が、急性心筋梗塞心原性ショック(Acute Myocardial Infarction Cardiogenic Shock(AMICS))リポジトリから取得される請求項1~7のいずれか一項記載の方法。
【請求項9】
患者を治療するための少なくとも1つの心室補助装置(VAD)と、
前記VADと通信し、かつ、前記VADによる前記患者の前記治療の少なくとも1つの臨床記述を生成するように構成された、コントローラと、
前記治療の前記少なくとも1つの臨床記述を格納するためのデータリポジトリと、
前記データリポジトリと通信し、かつ、請求項1~のいずれか一項記載の方法を行うように構成された、プロセッサと
を含む、患者の臨床記述を自動的に分類するためのシステム。
【請求項10】
有害事象を含む臨床記述の数が所定の閾値を超える場合、VADの使用を不可にする、請求項9記載のシステム。
【請求項11】
複数の患者の臨床記述を自動的に分類するためのシステムであって、各臨床記述が、該複数の患者のうちの1人に対する心室補助装置の使用に関連しており、該システムが、請求項1~8のいずれか一項記載の方法を行うように構成されたプロセッサを含む、システム。
【請求項12】
プロセッサを含むコンピューティング装置によって実行されると、請求項1~8のいずれか一項記載の方法を前記コンピューティング装置に行わせる、コンピュータ実行可能命令を含むコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、その内容全体が参照により本明細書に組み入れられる、2018年12月21日に出願された、米国仮出願第62/784,192号からの米国特許法第119条(e)の優先権の恩典を主張するものである。
【背景技術】
【0002】
背景
心血管疾患は、患者の生活の質を低下させる可能性がある。そのような疾患の心臓を治療するために、医薬品から機械的装置および移植に至るまで、様々な治療選択肢が開発されてきた。心臓ポンプシステムやカテーテルシステムなどの心室補助装置(VAD)が、心臓の治療において血行力学的補助を提供し、回復を促進するためによく使用される。心臓ポンプシステムの中には、心臓に経皮的に挿入され、心拍出量を補うために自己心と並行して動作することができるものもある。そのような心臓ポンプシステムには、マサチューセッツ州ダンバーズのAbiomed,Inc.によるImpella(登録商標)ファミリーの機器が含まれる。これらの医療手技の中には、治療中に患者に発生する有害事象につながり得るものがある。これは、機器の誤った使用、または準最適な機器構成に起因する可能性がある。
【0003】
VADなどの医療機器を使用して患者に治療を施した後、患者に提供された治療の詳細な説明、およびそのような治療中の任意の臨床的適応が記録される。そのような記録は、従来、医療用の略語で手書きで書き込むか、またはコンピュータにタイプ入力されている。あるいは、治療の詳細が、音声をテキストに変換する機器(ディクタフォンや、音声認識ソフトウェアが動作しているラップトップマイクロホンなど)に提供され、テキストファイルとして格納される。そのようなファイルは、多くの場合、患者データリポジトリに格納され、患者の医療ファイルへのアクセスを必要とする他の臨床医に提供される。
【0004】
通常、臨床医は、さらなる治療を決定する前に、患者が治療中に有害事象を経験したかどうかを判定しなければならない。例えば、有害事象には、(例えば、Impella(登録商標)ポンプを備えた新しいガイドワイヤーの使用による)患者を治療するためのVADの使用中に発生した可能性がある、出血、溶血および虚血が含まれる。そのような判定は、臨床記録を読み取り、検査して、治療中に何らかのそのような有害事象が発生したかどうかを手動で確認することを伴う。手動検査は、ある程度の自由度を伴う。例えば、臨床記述のテキストの特定の部分が見落とされたり、判読が困難であったりする場合もあり、または臨床記述の解釈が人によって異なる場合もある。さらに、治療計画(成功率など)の臨床兆候を取得するために、典型となる指標を取得するように臨床記述のリポジトリが解析される必要がある。多数の臨床記述の手動検査には時間がかかり、前述の自由度に起因するいくつかの誤りを伴う可能性がある。
【0005】
臨床記述の解析を自動化する試みは、例えば、バギングおよびランダムフォレスト、ロジスティック回帰、ならびに回帰木などの自然言語前処理および機械学習の使用を伴う。そのようなアルゴリズムは複雑で再帰的であり、特にアルゴリズムが容易に収束しない場合、コンピューティングシステム上のプロセッサリソースを占有する。そのようなアルゴリズムを使用する機械学習はまた、多くの場合、機械モデルを信頼できるようになるまでに、訓練データのかなりの大きさのプールを必要とする。したがって、小さなデータリポジトリの場合、不十分な訓練データにより不安定な機械学習モデルが得られ、臨床記述の解析におけるその出力は信頼できないものとなる。
【発明の概要】
【0006】
概要
本明細書に記載される方法およびシステムは、コンピューティング装置のプロセッサによる自然言語処理およびキーワード検索を使用して、臨床記述が有害事象を含む治療に関連するかどうかを判定する。方法は、テキストを含む少なくとも1つの臨床記述を受け取ることから開始する。プロセッサは、次いで、テキスト内の対象語の位置を決定する。プロセッサは、次いで、処理を進めて、(対象語を含む、対象語の直前および直後に存在するテキスト内の所定数の単語を含む)アクティブ領域内の少なくとも1つの否定語の存在を判定する。次に、プロセッサは、アクティブ領域内の少なくとも1つの身体部位語の存在を判定する。方法は、次いで、アクティブ領域が否定語または身体部位語のどちらかを含む場合、臨床記述が無視されるべきであると判定する。
【0007】
臨床記述のテキスト内のキーワードを検索することによって、(訓練データを必要とする)機械学習アルゴリズムの訓練が必要とされず、それにより、コンピューティング装置のシステムリソースが解放される。本開示の方法およびシステムのキーワード検索の性質は、臨床記述の解析を行うコンピューティング装置のプロセッサを独占するものではない。
【0008】
いくつかの実施態様では、方法は、単語トークンを生成するためにテキストを処理する工程、ある単語の活用形を含む単語トークンを判定およびグループ化する工程、ならびにグループ化された単語トークンを使用してテキストに対してキーワード検索を行う工程をさらに含む。他の実施態様では、方法は、アクティブ領域が否定語および身体部位語を含まない場合、臨床記述にフラグを立てる工程を含む。特定の実施態様では、方法は、臨床記述のヘッダにフラグを書き込む工程を含む。いくつかの実施態様では、アクティブ領域の所定数の単語は少なくとも3語である。他の実施態様では、アクティブ領域の単語の所定数は3である。特定の実施態様では、少なくとも1つの否定語は、「no(ない)」、「not(~ない)」、「nor(~もまた~ない)」、「non(非)」、「without(~なしの)」、「never(決して~ない)」、および「false(偽)」のうちのいずれか1つを含む。いくつかの実施態様では、臨床記述は、急性心筋梗塞心原性ショック(Acute Myocardial Infarction Cardiogenic Shock(AMICS))リポジトリから取得される。
【0009】
別の態様では、患者の臨床記述を自動的に分類するためのシステムが提供される。システムは、患者を治療するための少なくとも1つの心室補助装置(VAD)を含む。システムはまた、VADと通信し、かつ、VADによる患者の治療の少なくとも1つの臨床記述を生成するように構成された、コントローラも含む。さらに、システムは、治療の臨床記述を格納するためのデータリポジトリを含む。システムはまた、前述の態様のいずれかによる方法を実行するように構成された、データリポジトリと通信するプロセッサも含む。いくつかの実施態様では、システムは、有害事象を含む臨床記述の数が所定の閾値を超える場合、VADの使用を不可にする。
【0010】
さらに別の態様では、患者の臨床記述を自動的に分類するためのシステムが提供され、各臨床記述は、患者に対する心室補助装置の使用に関連している。システムは、前述の態様のいずれかによる方法を行うように構成されたプロセッサを含む。
【0011】
さらなる態様では、プロセッサを含むコンピューティング装置によって実行されると、前述の態様のいずれかによる方法をコンピューティング装置に行わせる、コンピュータ実行可能命令を含むコンピュータプログラムが提供される。
【図面の簡単な説明】
【0012】
上記その他の目的および利点は、以下の詳細な説明を添付の図面と併せて考察すれば明らかになるであろう。図面において、同様の参照符号は全体を通して同様の部分を指す。
【0013】
図1】本開示の一態様による、臨床記述において有害事象を発見するための例示的なシステムを示す図である。
図2】キーワード検索を使用した自然言語処理の方法を示す例示的なフローチャートである。
図3】本開示の一態様による臨床記述内の有害事象を発見する方法を示す例示的なフローチャートである。
図4図1の方法を使用して生じる偽陽性の数に関連する、対象語を囲むアクション領域の長さの最適化を示す図である。
図5図5Aおよび5Bは、否定語を含む臨床記述に対する図1の方法の使用を示す図である。
図6図6Aおよび6Bは、身体部位語を含む臨床記述に対する図1の方法の使用を示す図である。
【発明を実施するための形態】
【0014】
詳細な説明
本明細書に記載される方法およびシステムの全体的な理解を提供するために、特定の例示的な態様について説明する。本明細書に記載される態様および特徴は、心室補助装置(VAD)の使用を伴う臨床記述内の有害事象を自動的に検出するための自然言語処理の使用に関連した使用について特に説明されているが、以下で概説されるすべての構成要素および他の特徴は、任意の適切な方法で互いに組み合わされ得、関連付けられた臨床記述を有する他のタイプの医学療法に適応および適用され得ることが理解されよう。
【0015】
本明細書に記載されるシステムおよび方法は、自然言語処理(NLP)を使用して、臨床記述内の有害事象の発生を自動的に検出する。NLPは、臨床記述に含まれる対象語のアクティブ領域内のキーワードの検索を行うために使用される。キーワードが発見されると、プロセッサは、その臨床記述が、有害事象が発生した治療に関連している(場合によっては、関連していない)とみなす。本開示のいくつかの態様では、臨床記述テキストファイルのヘッダにフラグが書き込まれる。臨床記述のテキスト内のキーワードを検索することによって、(訓練データを必要とする)機械学習アルゴリズムの訓練が必要とされず、それにより、コンピューティング装置のシステムリソースが解放される。本開示の方法およびシステムのキーワード検索の性質は、臨床記述の解析を行うコンピューティング装置のプロセッサを独占するものではない。
【0016】
図1に、臨床記述110内の有害事象の発生を自動的に検出するためのシステム100のブロック図を示す。システム100は、例えば、患者データリポジトリ130と通信する、ラップトップなどのコンピューティング装置120を含む。簡潔にするために、図1にはコンピューティング装置120のプロセッサ125のみが示されている。しかしながら、コンピューティング装置120は、例えば、揮発性メモリ(ランダム・アクセス・メモリRAMなど)、不揮発性メモリ(読取り専用メモリROMなど)、ディスプレイ、および、これらの構成要素間の通信を可能にする接続バスなどの、コンピューティング装置と通常関連付けられる他の構成要素も含み、これらすべてが本開示に含まれることが理解されよう。
【0017】
コンピューティング装置120は、機械可読命令を実行して、自然言語処理を使用してテキストデータに対して演算を行うことができるプロセッサ125を含む。コンピューティング装置120は、様々な医療機関から取得された患者データを含む患者データリポジトリ130と通信する。本開示の特定の態様によれば、患者データリポジトリ130は、Salesforce.com,Inc.などのCRMによって集計および維持される急性心筋梗塞心原性ショック(AMICS)データベースを含み得る。AMICSデータベース130は、高リスク経皮的冠動脈インターベンション(percutaneous coronary intervention(PCI))患者および心原性ショックの患者の治療からのデータを格納する。AMICSデータベース130はまた、治療に利用可能なVAD140に固有のデータをVADデータベース135に格納し得る。VADデータベース135は、機器ごとの動作パラメータを含み得る。
【0018】
患者データは、心原性ショックの患者の治療後にAMICSデータベース130に格納された臨床記述110を含む。そのような治療は、例えばVAD140などの、患者の状態を緩和するための医療機器の使用を含む。VADは、心原性ショックの患者に心室補助を提供し、Impella(登録商標)ポンプ、体外式膜型人工肺(ECMO)ポンプ、バルーンポンプ、およびスワン・ガンツカテーテルを含み得るが、これに限定されない。Impella(登録商標)ポンプは、すべてマサチューセッツ州ダンバーズのAbiomed,Inc.によるものである、Impella 2.5(登録商標)ポンプ、Impella 5.0(登録商標)ポンプ、Impella CP(登録商標)ポンプ、およびImpella LD(登録商標)ポンプを含み得る。
【0019】
VAD140は、患者170を治療するときに医師160がVAD140を操作することを可能にするコントローラ150に接続される。そのような操作は、患者170内でのVADの誘導、および患者170の状態に適合するようなVAD140の動作パラメータの調整を含み得る。動作パラメータは、例えば、パージ量、流量、およびポンプ速度を含むが、これらに限定されない。本開示の特定の態様によれば、コントローラ150は、マサチューセッツ州ダンバーズのAbiomed,Inc.によるAutomated Impella(登録商標)Controller(AIC)を含み得る。
【0020】
各VAD140は、VADが患者の治療に使用されている間に患者170からデータを収集する少なくとも1つのセンサを含み得る。患者データは、信号としてコントローラ150に送信される。そのようなデータは、平均動脈圧(MAP)、左心室圧(LVP)、左心室拡張末期圧(LVEDP)、肺動脈楔入圧(PAWP)、肺毛細血管楔入圧(PCWP)、肺動脈閉塞圧(PAOP)を含み得るが、これに限定されない。コントローラ150は、治療後の解析のためのデータを格納するAMICSデータベース130に患者データを伝達する。AMICSデータベース130には、患者データと一緒に格納され得る医師160からの追加データ(患者の治療からのメモなど)も提供され得る。
【0021】
患者および医師からのデータは、臨床記述110としてリポジトリ130に格納され得る。本開示の特定の態様では、臨床記述110は、*.txt拡張子を有する少なくとも1つのテキストファイルとしてAMICSデータベース130に格納され得る。臨床記述110は、任意の言語(英語など)のテキストおよび/または略語(医療用の略語など)を含み得る。例示的な臨床記述を表1に示す。テキストファイルはまた、例えば、患者および医療機関の名前、患者人口統計、日付、時刻(表1には示されていない)などの識別データを含むヘッダ情報も含み得る。上記は臨床記述の例示的な態様であり、「臨床記述」という用語は、VADを使用する心血管治療など、患者に対して行われる医療手技に関連する情報を含む機械可読文字の任意のグループを包含することが理解されよう。
【0022】
(表1)*.txt形式の例示的な臨床記述
【0023】
臨床記述110は、それぞれの治療中に発生する様々な事象の分類のためにコンピューティング装置120によって評価される。事象は、例えば、有害事象の発生、治療装置の誤動作、および治療の成功を含み得る。臨床記述110は、例えば、地理的地域、期間、診断タイプ、患者年齢、および使用された治療装置のタイプ(Impella(登録商標)CPポンプからなるVADなど)といった、指定された基準のセットに基づいて選択され得る。そのような基準は、事前に決定され得るか、または、例えば、グラフィカルユーザインターフェース(GUI)を介してラップトップ120を操作する臨床医によって入力され得る。選択された各臨床記述110は、次いで、ソフトウェアによって実装された自然言語処理(NLP)アルゴリズムを使用して、コンピューティング装置120のプロセッサ125によって解析される。NLPソフトウェアの例には、Apache OpenNPL、Mallet、ELIZAおよびcTAKESが含まれるが、これらに限定されない。
【0024】
自然言語処理アルゴリズムは、選択された各臨床記述110内のキーワードが存在するかどうかを判定する。キーワードは、臨床記述110内の対象語に対して、または対象語に関連して作用する少なくとも1つの単語を含み得る。キーワードは、臨床記述110の選択を分類するために使用され得る。本開示の一態様によれば、対象語は、患者の心臓の治療中に発生した有害事象(出血、溶血または虚血など)を記述するために使用され得る。対象語の例には、「bleed(出血)」、「clot(血餅)」、および「heart(心臓)」が含まれ得、キーワードの例には、「not」、「non」、および「no」が含まれ得る。そのようなキーワードおよび対象語は、事前に決定され、特定のタイプの解析のためにコンピューティング装置120のメモリに格納され得る。あるいは、キーワードおよび対象語は、NLPソフトウェアのGUIを介してコンピューティング装置120を操作する臨床医によって入力されてもよい。対象語を囲むアクティブ領域におけるキーワードの存在は、次いで、それぞれの治療中に特定の事象が発生したかどうかを判定するためにNLPによって解析される。例えば、NPLは、有害事象の発生を識別し、臨床記述110に、有害事象122を含むまたは有害事象124を含まないとしてフラグを立ててもよい。
【0025】
図2に、本開示の一態様による自然言語処理の方法200を表すフローチャートを示す。図2の方法200は、図1のプロセッサ125によって実行される。方法は、工程210から開始し、そこでコンピューティング装置120のプロセッサ125がAMICSデータベース130から臨床記述110の選択を取得する。前述のように、臨床記述110の選択は、例えば、地理的地域、期間、診断タイプ、患者年齢、および使用された治療装置のタイプ(VADなど)といった、指定された基準のセットに基づくものであり得る。工程220で、NPLアルゴリズムは、各臨床記述110のテキストを断片またはトークンに分割する(これはテキストのトークン化と呼ばれる)。使用されるNPLアルゴリズムに応じて、句読文字などのテキスト内の特定の文字は無視され得る。各トークンは、選択された臨床記述と関連付けられたテキストの処理のための意味単位として使用される。
【0026】
テキストのトークン化の後、方法200は、次いで、レンマ化としても知られる工程230に進み、ここで、類似のトークンが、トークンの活用形に基づいて一緒にグループ化され、よって単一項目として解析されることができる。本質的に、レンマ化(またはステミング)は、同じ基本形(語根)を有するトークンをリンクし、それらをグループ化して、それらのトークンを同様の方法で処理できるようにする。例えば、英語では、「walk(歩く)」という動詞は、「walk」、「walked」、「walks」、「walking」として現れ得る。ここでの基本形は「walk」であり、辞書で調べることができる。レンマ化工程230の出力は、トークンのグループを含むbag-of-words(バッグ・オブ・ワーズ)(BOW)であり、各グループは関連付けられた基本形を有する。
【0027】
選択された臨床記述110についてのBOWが形成されると、キーワード検索を行うことができる(工程240)。NPLは、対象語をレンマ化し、対象語の語根を識別する。次に、NPLは、BOWをスキャンして、BOWにおいて対象語の語根が存在するかどうかを判定する。そのような判定が肯定的である場合、すなわち、BOWが対象語の語根と一致する語根を含む場合、選択された臨床記述110は、対象語を含むとみなされる。逆に、判定が否定的である場合、すなわち、BOWが対象語の語根を含まない場合、選択された臨床記述110は対象語を含まないとみなされる。
【0028】
図3に、本開示の一態様による臨床記述110を自動的に分類するための方法300のフロー図を示す。図3の方法300は、図1のプロセッサ125によって実行される。方法200と同様に、方法300は工程310から開始し、そこでコンピューティング装置120のプロセッサ125がAMICSデータベース130から臨床記述110の選択を取得する。前述のように、臨床記述110の選択は、例えば、地理的地域、期間、診断タイプ、患者年齢、および使用された治療装置のタイプ(VADなど)といった、指定された基準のセットに基づくものであり得る。基準は、コンピューティング装置120のGUIを介して臨床医によって指定され得る。
【0029】
工程320で、プロセッサ125は、プロセッサ125上で動作しているNPLアルゴリズムを使用して、選択された各臨床記述110内の対象語の位置を決定する。対象語の位置が識別されると、方法300は、NPLプロセス200をさらに使用して、対象語に関連するアクティブ領域をさらに識別する。アクティブ領域は、対象語の直前および直後に存在する選択された臨床記述110のテキスト内の所定数の単語を含む。アクティブ領域はまた、対象語も含む。所定数の単語は、コンピューティング装置120内に格納され得るか、またはGUIを介して臨床医からの入力として提供され得る。所定数の単語は、アクティブ領域のサイズ(すなわち、方法300の粒度)を定義し、以下ではこれを粒度サイズと呼ぶ。
【0030】
方法300は、次いで、選択された各臨床記述110内のアクティブ領域を続いて解析する。ここで、プロセッサ125は、NPL法200を使用して、選択された臨床記述110の各々のアクティブ領域をキーワードについて検索する。上記で説明されているように、キーワードは、各臨床記述110内の対象語に対して、または対象語に関連して作用する。本開示の態様によれば、キーワードは否定語または身体部位語を含み得る。否定語は、「no」、「not」、「nor」、「non」、「without」、「never」、および「false」を含み得るが、これらに限定されない。対象語のアクティブ領域内に否定語が存在すると、対象語の通常の意味が逆転するか、または無効になる。例えば、臨床記述が「… groin site is dry with no evidence of bleeding at all(鼠径部は乾いており出血の証拠は全くない)… 」と読める場合、否定語「no」の存在は、その鼠径部で発生する対象語「bleeding(出血)」の意味を無効にする。よって、そのアクティブ領域内で否定語「no」を検出すると、プロセッサ125は、この臨床記述に、(鼠径部での出血である)有害事象に関連しないとしてフラグを立てる。
【0031】
同様に、身体部位語は、例えば「leg(脚)」、「arm(腕)」、「abdomen(腹部)」および「groin(鼠径部)」などの任意の身体部位を含み得る。対象語のアクティブ領域に身体部位語が存在すると、対象語の通常の意味が無効になる。否定語とは異なり、本開示の一態様によれば、身体部位語の存在は、有害事象(例えば、出血)が心臓内で発生しないことを表す。例えば、臨床記述が「…patient is very sick and they feel she is bleeding into her abdomen(患者は重症であり、彼らは患者がその腹部に出血していると感じている)…」と読める場合、身体部位語「abdomen」の存在は、心臓に関連しないため、対象語「bleeding」の意味を無効にする。本開示の一態様によれば、対象語に対して作用する身体部位語を有しない臨床記述内のあらゆる有害事象は、患者の心臓で発生すると想定される。よって、アクティブ領域内で身体部位語「abdomen」を検出すると、プロセッサ125は、この臨床記述に、心臓での出血の有害事象に関連しないとしてフラグを立てる。NPLのキーワード検索を、アクティブ領域内の単語を特定の身体部位語、例えば「heart」と一致させ、一致に基づいて臨床記述にフラグを立てるように、さらにカスタマイズできることが理解されよう。
【0032】
図3に戻って、臨床記述110のテキスト内の対象語の位置が決定されると、方法300は工程330に進み、そこでアクティブ領域に否定語が存在するかどうかがさらに判定される。アクティブ領域に否定語が存在する場合(工程330で「はい」)、臨床記述は有害事象を含まないとしてフラグを立てられる。本開示の特定の態様では、フラグは、(例えば、ASCII文字で)臨床記述ごとのテキストファイルのヘッダに書き込まれ得、フラグ付き臨床記述110は、コンピューティング装置120によってAMICSデータベースに書き戻され得る。
【0033】
否定語がアクティブ領域に存在しない場合(工程330で「いいえ」)、方法300は工程340に進み、そこでアクティブ領域に身体部位語が存在するかどうかがさらに判定される。身体部位語が存在する場合(工程340で「はい」)、工程350のように、臨床記述は有害事象を含まないとしてフラグを立てられる。身体部位語が存在しない場合(工程340で「いいえ」)、工程360のように、臨床記述は有害事象を含むとしてフラグを立てられる。本開示の特定の態様では、工程340に対する「はい」と「いいえ」の両方の場合のフラグが、臨床記述ごとのテキストファイルのヘッダに格納され得、フラグ付き臨床記述110は、コンピューティング装置120によってAMICSデータベースに書き戻され得る。
【0034】
本開示の戦略的キーワード検索は、各臨床記述110内のテキストをスキャンして、対象語および対象語のアクティブ領域内の任意の指定されたキーワードを見つける。キーワードが識別されると、臨床記述はフラグを立てられ、解析は次のテキストファイルに進む。これは、機械学習を使用するNPLと比較してプロセッサに負担をかけず、したがってコンピューティング装置の処理能力を解放する。
【0035】
図4に、本開示の一態様による、対象語に関する否定語を検出するためのアクティブ領域のサイズに基づくNPLアルゴリズムの最適化チャート400を示す。実際には、これは方法300の粒度を最適化する。前述のように、偽陽性(FP)の数は、プロセッサ125が、アクティブ領域内の否定語または身体部位語が実際には存在する場合に該否定語および身体部位語の存在を検出しない回数を指し、真陽性TPは、否定語または身体部位語が存在しかつ検出されることを意味する。実際には、FPは警報の見落としであり、例えば、プロセッサ125は、臨床記述のアクティブ領域内の否定語または身体部位語を誤って識別することによって、臨床記述110による患者の心臓内の出血事象の検出を見落とす。同様に、偽陰性(FN)の数は、プロセッサ125が、否定語および身体部位語が実際には存在しない場合にアクティブ領域内の否定語または身体部位語の存在を誤って検出する回数を指し、真陰性TNは、否定語および身体部位語が存在せず検出されもしないことを意味する。
【0036】
図4では、アクティブ領域のサイズは、対象語の直前および直後の単語の数に関して参照される。最適化は、偽陽性の数に関して行われる。最適化チャート400の折れ線グラフ410は、偽陽性の発生が、3語以上の粒度を有するアクティブ領域で最小の変動を示すことを示している。さらに、表2に、アクティブ領域の粒度が変化するときのTP、FP、FNおよびTNの例示的な値を示す。表2の値は、アクティブ領域のサイズが増加するにつれて警報の見落とし、すなわちFPの数が減少する、図4に示される傾向を補強する。FPの減少率は、アクティブ領域の臨界粒度後に横ばい状態になる。本明細書の態様によれば、アクティブ領域の臨界サイズは3語とみなされる。
【0037】
(表2)アクティブ領域のサイズによるFPの最適化
【0038】
図5Aおよび図5Bに、上記で説明されているシステムおよび方法による、NPLアルゴリズムを使用して臨床記述500、550内の否定語の存在を自動的に検出する例を示す。図5Aでは、対象語510は「bleeding」であり、アクティブ領域520は3の粒度を有する。キーワード530は否定語「no」である。否定語530が対象語510のアクティブ領域520内に存在するとき、臨床記述500は、有害事象を含まないとしてフラグを立てられる。同様に、図5Bでは、対象語560は「bleeding」であり、アクティブ領域570は3の粒度を有する。キーワード580は否定語「no」である。否定語580が対象語560のアクティブ領域570内に存在するとき、臨床記述550は、有害事象を含まないとしてフラグを立てられる。上記のどちらの例でも、対象語、否定語、およびアクティブ領域内の単語を識別するために図2に示される方法200によるNPL処理が使用される。
【0039】
図6Aおよび図6Bに、上記で説明されているシステムおよび方法による、NPLアルゴリズムを使用して臨床記述600、650内の身体部位語の存在を自動的に検出する例を示す。図6Aでは、対象語610は「bleeding」であり、アクティブ領域620は3の粒度を有する。キーワード630は、身体部位語「abdomen」である。身体部位語630が対象語610のアクティブ領域620内に存在するとき、臨床記述600は、有害事象を含まないとしてフラグを立てられる。前述のように、対象語に対して作用する身体部位語を有しない臨床記述内の有害事象は、患者の心臓で発生すると想定される。よって、アクティブ領域620内で身体部位語「abdomen」を検出するとき、プロセッサ125は、この臨床記述600に、心臓での出血の有害事象に関連しないとしてフラグを立てる。同様に、図6Bでは、対象語660は「bleeding」であり、アクティブ領域670は3の粒度を有する。キーワード680は、身体部位語「groin」である。身体部位語680が対象語660のアクティブ領域670内に存在するとき、臨床記述650は、有害事象を含まないとしてフラグを立てられる。上記のどちらの例でも、対象語、身体部位語、およびアクティブ領域内の単語を識別するために図2に示される方法200によるNPL処理が使用される。
【0040】
表3に、本開示の方法およびシステムの有効性を例示するための例示的な図を提供する混同行列を示す。表3は、NPLを使用して、臨床記述内のすべての単語に対してNPLを使用して完全なキーワード検索を行った結果を、本開示の態様による、NPLを使用して、対象語のアクティブ領域内の否定語および/または身体部位語だけを検索する戦略的な否定および/または身体部位キーワード検索に対して比較している。混同行列に関連する指標には、適合率、再現率、および正解率が含まれる。適合率は、式:TP/(TP+FP)を使用して求められ、再現率は、式:TP/(TP+FN)を使用して求められ、正解率は、式:(TP+TN)/(TP+FP+FN+TN)を使用して求められる。表3の例示的な混同行列では、完全なキーワード検索の適合率、再現率、および正解率の指標は、それぞれ、53.4%、97.5%、および91.7%であるのに対して、戦略的否定および/または身体部位キーワード検索の同じ指標は、それぞれ、74.0%、92.5%、および96.2%である。これらの指標比較は、戦略的否定および/または身体部位キーワード検索がより高い適合率および正解率でキーワードを識別することを示している。そのような数字は、本開示の戦略的否定および/または身体部位キーワード検索が、従来のNPL技術よりも優れており、同時に、そのような自然言語処理を行うためのシステムリソースの使用も最小限に抑えることを示している。
【0041】
前述のように、選択された各臨床記述110がフラグを立てられた後、フラグは各臨床記述テキストファイルのヘッダに記憶され得、テキストファイルはコンピューティング装置120によってAMICSデータベース130に書き戻され得る。そのために、臨床医は、特定の基準(VADタイプ、患者年齢、医療機関の名称など)に基づいてAMICSデータベースからフラグ付き臨床記述をフィルタリングして、対象語を含む臨床記述の割合を取得することもできる。例えば、コンピューティング装置120を操作する臨床医は、心臓手技中に心臓内で出血したマサチューセッツ州ボストンの50~55歳の男性患者に使用されたImpella(登録商標)2.5心臓ポンプに関連するAMICSデータベースからのデータを取得することもできる。そのようなデータが、基準に一致している患者について統計的に示されたデータを下回る場合、それは様々な問題を示している可能性がある。そのような問題には、例えば、心臓手技が該患者に誤って施されていること、または、使用されたVADに調整を要する欠陥があることが、含まれ得る。心臓手技を誤って施した場合、そのようなデータにより医療機関でのさらなる訓練が開始される可能性がある。VADの欠陥が疑われる場合、そのようなデータを、そのような機器の製造中の品質管理として使用することができる。さらに、有害事象を含むフラグ付き臨床記述から得られたデータは、フラグ付き臨床記述の数が所定の閾値を超えた場合にVADの使用に対して医師に警告するためのロックアウト機構をトリガするために使用され得る。上記で説明されているように臨床記述にそのように自動的にフラグを立てることにより、臨床医に、患者に提供される治療を改善することができるフィードバックを提供することができるようになる。
【0042】
(表3)混同行列の比較
【0043】
以上は本開示の原理の単なる例示であり、装置は、限定ではなく例示を目的として提示されている記載の実施態様以外によっても実施することができる。本明細書に開示されている方法は、自動化された心室補助システムで使用するために示されているが、他の自動化された医療システムで使用されるべきシステムにも適用され得ることを理解されたい。
【0044】
本開示を検討した後、当業者には変更および修正が想起されるであろう。開示の特徴は、本明細書に記載されている1つまたは複数の他の特徴との、任意の組み合わせおよび部分的組み合わせ(複数の従属的組み合わせおよび部分的組み合わせを含む)として実装され得る。以上で説明または例示された様々な特徴は、それらの任意の構成要素を含めて、他のシステムにおいて結合または統合される場合もある。さらに、特定の特徴が省略され、または実装されない場合もある。
【0045】
変更、置換、および改変の例は、当業者であれば確かめることができ、本明細書に開示されている情報の範囲から逸脱することなくなされ得る。本明細書中に引用されたすべての参考文献は、参照によりその全体が組み入れられ、本出願の一部をなす。
図1
図2
図3
図4
図5
図6