特許第6652986号(P6652986)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社FRONTEOの特許一覧 ▶ エーザイ・アール・アンド・ディー・マネジメント株式会社の特許一覧

特許6652986危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム
<>
  • 特許6652986-危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム 図000005
  • 特許6652986-危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム 図000006
  • 特許6652986-危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6652986
(24)【登録日】2020年1月28日
(45)【発行日】2020年2月26日
(54)【発明の名称】危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム
(51)【国際特許分類】
   G06F 16/35 20190101AFI20200217BHJP
   G06F 16/332 20190101ALI20200217BHJP
【FI】
   G06F16/35
   G06F16/332
【請求項の数】10
【全頁数】15
(21)【出願番号】特願2018-88828(P2018-88828)
(22)【出願日】2018年5月2日
(65)【公開番号】特開2019-194807(P2019-194807A)
(43)【公開日】2019年11月7日
【審査請求日】2019年10月28日
【早期審査対象出願】
(73)【特許権者】
【識別番号】316014906
【氏名又は名称】株式会社FRONTEO
(73)【特許権者】
【識別番号】506137147
【氏名又は名称】エーザイ・アール・アンド・ディー・マネジメント株式会社
(74)【代理人】
【識別番号】100105784
【弁理士】
【氏名又は名称】橘 和之
(72)【発明者】
【氏名】豊柴 博義
(72)【発明者】
【氏名】内山 秀文
【審査官】 鹿野 博嗣
(56)【参考文献】
【文献】 特開2005−208782(JP,A)
【文献】 国際公開第2017/199445(WO,A1)
【文献】 特開2018−032213(JP,A)
【文献】 横田 慎一郎、遠藤 美代子、平松 達雄、野口 貴史、美代 賢吾、大江 和彦,電子カルテデータを利用した後ろ向きコホートによる患者転倒リスク予測式の構築・評価・実装手法,医療情報学 第34巻 3号,日本,一般社団法人日本医療情報学会,2014年 9月29日,p.119〜128
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/35
G06F 16/332
(57)【特許請求の範囲】
【請求項1】
危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるm個(mは2以上の任意の整数)の文章を学習用データとして入力する学習用データ入力部と、
上記学習用データ入力部により上記学習用データとして入力された上記m個の文章を解析し、当該m個の文章からn個(nは2以上の任意の整数)の単語を抽出する単語抽出部と、
上記m個の文章をそれぞれ所定のルールに従ってq次元(qは2以上の任意の整数)にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルを算出する文章ベクトル算出部と、
上記n個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルを算出する単語ベクトル算出部と、
上記m個の文章ベクトルと上記n個の単語ベクトルとの内積をそれぞれとることにより、上記m個の文章および上記n個の単語間の関係性を反映したm×n個の類似性指標値を算出する指標値算出部と、
上記指標値算出部により算出された上記m×n個の類似性指標値を用いて、1つの文章についてn個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記m個の文章を分類するための分類モデルを生成する分類モデル生成部と、
予測対象とする患者に関する医療情報に含まれるm’個(m’は1以上の任意の整数)の文章を予測用データとして入力する予測用データ入力部と、
上記予測用データ入力部により入力された上記予測用データに対して上記単語抽出部、上記文章ベクトル算出部、上記単語ベクトル算出部および上記指標値算出部の処理を実行することによって得られる類似性指標値を、上記分類モデル生成部により生成された上記分類モデルに適用することにより、上記予測対象とする患者が上記危険行動を起こす可能性を予測する危険行動予測部とを備えたことを特徴とする危険行動予測装置。
【請求項2】
上記文章ベクトル算出部および上記単語ベクトル算出部は、上記n個の単語のうち一の単語から上記m個の文章のうち一の文章が予想される確率、または、上記m個の文章のうち一の文章から上記n個の単語のうち一の単語が予想される確率を、上記m個の文章と上記n個の単語との全ての組み合わせについて算出して合計した値を目標変数とし、当該目標変数を最大化する文章ベクトルおよび単語ベクトルを算出することを特徴とする請求項1に記載の危険行動予測装置。
【請求項3】
上記指標値算出部は、上記m個の文章ベクトルの各q個の軸成分を各要素とする文章行列と、上記n個の単語ベクトルの各q個の軸成分を各要素とする単語行列との積をとることにより、m×n個の上記類似性指標値を各要素とする指標値行列を算出することを特徴とする請求項1または2に記載の危険行動予測装置。
【請求項4】
上記学習用データ入力部は、上記危険行動を起こしたか否かについて既知である患者の電子カルテを上記医療情報として入力し、当該電子カルテに含まれている診療記録テキストから成る文章を上記学習用データとして入力し、
上記予測用データ入力部は、現在の入院患者の電子カルテを上記医療情報として入力し、当該電子カルテに含まれている診療記録テキストから成る文章を上記予測用データとして入力することを特徴とする請求項1〜3の何れか1項に記載の危険行動予測装置。
【請求項5】
退院患者の電子カルテに含まれている危険行動記録レポートを実績データとして入力する実績データ入力部と、
上記退院患者の入院時に上記危険行動予測部により予測された上記危険行動の発生可能性に対し、上記実績データ入力部により入力された上記実績データにより示される上記危険行動の発生実績に応じて、上記分類モデル生成部に与える報酬を決定する報酬決定部とを更に備え、
上記分類モデル生成部は、上記報酬決定部により決定された報酬に応じて、上記分類モデルを改変することを特徴とする請求項4に記載の危険行動予測装置。
【請求項6】
危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるm個(mは2以上の任意の整数)の文章を学習用データとして入力する学習用データ入力部と、
上記学習用データ入力部により上記学習用データとして入力された上記m個の文章を解析し、当該m個の文章からn個(nは2以上の任意の整数)の単語を抽出する単語抽出部と、
上記m個の文章をそれぞれ所定のルールに従ってq次元(qは2以上の任意の整数)にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルを算出する文章ベクトル算出部と、
上記n個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルを算出する単語ベクトル算出部と、
上記m個の文章ベクトルと上記n個の単語ベクトルとの内積をそれぞれとることにより、上記m個の文章および上記n個の単語間の関係性を反映したm×n個の類似性指標値を算出する指標値算出部と、
上記指標値算出部により算出された上記m×n個の類似性指標値を用いて、1つの文章についてn個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記m個の文章を分類するための分類モデルを、上記文章から上記危険行動が発生する可能性を予測するための予測モデルとして生成する分類モデル生成部とを備えたことを特徴とする予測モデル生成装置。
【請求項7】
上記文章ベクトル算出部および上記単語ベクトル算出部は、上記n個の単語のうち一の単語から上記m個の文章のうち一の文章が予想される確率、または、上記m個の文章のうち一の文章から上記n個の単語のうち一の単語が予想される確率を、上記m個の文章と上記n個の単語との全ての組み合わせについて算出して合計した値を目標変数とし、当該目標変数を最大化する文章ベクトルおよび単語ベクトルを算出することを特徴とする請求項6に記載の予測モデル生成装置。
【請求項8】
上記指標値算出部は、上記m個の文章ベクトルの各q個の軸成分を各要素とする文章行列と、上記n個の単語ベクトルの各q個の軸成分を各要素とする単語行列との積をとることにより、m×n個の上記類似性指標値を各要素とする指標値行列を算出することを特徴とする請求項6または7に記載の予測モデル生成装置。
【請求項9】
危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるm個(mは2以上の任意の整数)の文章を学習用データとして入力する学習用データ入力手段、
上記学習用データ入力手段により上記学習用データとして入力された上記m個の文章を解析し、当該m個の文章からn個(nは2以上の任意の整数)の単語を抽出する単語抽出手段
上記m個の文章をそれぞれ所定のルールに従ってq次元(qは2以上の任意の整数)にベクトル化するとともに、上記n個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルおよびq個の軸成分から成るn個の単語ベクトルを算出するベクトル算出手段、および
上記m個の文章ベクトルと上記n個の単語ベクトルとの内積をそれぞれとることにより、上記m個の文章および上記n個の単語間の関係性を反映したm×n個の類似性指標値を算出する指標値算出手段、および
上記指標値算出手段により算出された上記m×n個の類似性指標値を用いて、1つの文章についてn個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記m個の文章を分類するための分類モデルを、上記文章から上記危険行動が発生する可能性を予測するための予測モデルとして生成する分類モデル生成手段、
としてコンピュータを機能させるための危険行動予測用プログラム。
【請求項10】
予測対象とする患者に関する医療情報に含まれるm’個(m’は1以上の任意の整数)の文章を予測用データとして入力する予測用データ入力手段、および
上記予測用データ入力手段により入力された上記予測用データに対して上記単語抽出手段、上記ベクトル算出手段および上記指標値算出手段の処理を実行することによって得られる類似性指標値を、上記分類モデル生成手段により生成された上記分類モデルに適用することにより、上記予測対象とする患者が上記危険行動を起こす可能性を予測する危険行動予測手段
としてコンピュータを更に機能させるための請求項9に記載の危険行動予測用プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、危険行動予測装置、予測モデル生成装置および危険行動予測用プログラムに関し、特に、患者が転倒または転落などの危険行動を起こす可能性を予測する技術および、この予測に用いる予測モデルを生成する技術に関するものである。
【背景技術】
【0002】
近年、インシデントを予防することが様々な産業分野において重要視されている。医療分野でも、医療事故を防ぐために様々な方策が検討されている。例えば、インシデントレポートを記録し、医療事故に繋がり得る危険な行為をインシデントレポートに基づいて管理することにより、医療事故を未然に防止するためのシステムが提供されている。
【0003】
ところで、医療事故には、医師や看護師等の医療行為に起因する事故の他に、患者側の事情に起因する事故、例えば、患者の転倒が存在する。医師や看護師等による医療行為の質を向上させることによって、前者の事故を極力防ぐようにすることはできるが、患者側の要因が大きい後者の事故を防ぐことはそもそも難しい。したがって、従来の対策では、患者の行動を一律に規制するなど、大まかな対応しか講じ得なかったのが実情であった。
【0004】
なお、特許文献1には、患者の危険行動(転倒または落下など)を予測する装置が開示されている。特許文献1に記載の行動予測装置では、患者の危険行動に関するインシデントレポートと紐付けられることによって危険行動が特定されたカルテ情報である既判断カルテ情報からあらかじめ抽出された、当該危険行動に関連する医療情報を記憶部に格納する。関係性評価部は、インシデントレポートが紐付けられていない未判断カルテ情報を取得して、記憶部に格納された危険行動に関連する医療情報をもとに、未判断カルテ情報と当該未判断カルテ情報に対応する患者が取り得る危険行動との関係性を評価する。予測部は、関係性評価部の評価結果に応じて、未判断カルテ情報に対応する患者の危険行動を予測する。
【0005】
具体的には、特許文献1に記載の行動予測装置は、カルテ情報に含まれるデータ要素(患者の感情表現を含むデータ要素、例えば、「楽になった」、「痛い」、「苦しい」などの形態素)に対する感情評価を対応付けて記憶部に記憶する。また、行動予測装置は、カルテ情報に含まれるテキストについて、あらかじめ定められたキーワード(感情に関する文言)が当該テキストに含まれるか否かを探索する。そして、含まれていた場合に、所定の基準に従って算出した感情スコアを当該キーワードに対応付けて記憶部に記憶しておく。
【0006】
一方、行動予測装置は、未判断カルテ情報から、あらかじめ定められた感情に係るキーワードを抽出し、抽出したキーワードに対応付けられている感情スコアを記憶部から取得して、キーワード各々の感情スコアを統合することにより、当該未判断カルテ情報の感情スコアとする。例えば、未判断カルテ情報のテキスト中に「最近、足が痛い。立ち上がるときにフラフラする。」という文章が含まれていたとする。そして、キーワードとして「痛い」、「フラフラ」が記憶部にあらかじめ格納され、それぞれ「+1.4」、「+0.9」という感情スコアが対応付けられているとする。この場合、行動予測装置は、両者を加算して「+2.3」という感情スコアを算出する。そして、行動予測装置は、当該感情スコアに基づいて患者の危険行動(転倒)を予測する。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特許第5977898号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
上記特許文献1のような機械学習によって転倒の予測を行う場合に、予測の精度を上げるためには、学習によって生成する予測モデルの精度を上げることが欠かせない。しかしながら、上記特許文献1に記載の行動予測装置では、予測に使用するスコアを、ただ単に、あらかじめ定められた感情に係るキーワードがカルテ情報の中にどの程度含まれているかによって計算しているだけであり、これによって生成される予測モデルは、算出されたスコアをキーワードに対応付けて記憶しただけの極めて単純なものである。このため、予測の精度を十分に上げることが難しいという問題があった。
【0009】
本発明は、このような問題を解決するために成されたものであり、電子カルテなどの医療情報に含まれる文章を対象とした解析により、転倒や転落など人に起因する危険行動の発生を精度よく予測することができるようにすることを目的とする。
【課題を解決するための手段】
【0010】
上記した課題を解決するために、本発明の危険行動予測装置では、危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるm個の文章を学習用データとして入力し、当該入力されたm個の文章を解析して当該m個の文章からn個の単語を抽出し、m個の文章をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルを算出するとともに、n個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルを算出し、さらに、m個の文章ベクトルとn個の単語ベクトルとの内積をそれぞれとることにより、m個の文章およびn個の単語間の関係性を反映したm×n個の類似性指標値を算出する。そして、1つの文章についてn個の類似性指標値から成る文章指標値群をもとに、危険行動が発生する可能性の高さについてm個の文章を分類するための分類モデルを生成するようにしている。予測対象とする患者について危険行動を起こす可能性を予測する際には、予測対象とする患者に関する医療情報に含まれるm’個の文章を予測用データとして入力し、当該入力した予測用データに対して単語抽出、文章ベクトル算出、単語ベクトル算出および指標値算出の各処理を実行することによって得られる類似性指標値を分類モデルに適用することにより、予測対象とする患者が危険行動を起こす可能性を予測するようにしている。
【発明の効果】
【0011】
上記のように構成した本発明によれば、患者の医療情報に含まれる文章から算出された文章ベクトルと、文章内に含まれる単語から算出された単語ベクトルとの内積を計算することによって、文章および単語間の関係性を反映した類似性指標値が算出されるので、どの単語がどの文章に対してどの程度寄与しているのか、あるいは、どの文章がどの単語に対してどの程度寄与しているのかを内積の値として得ることができる。そして、このような性質を有する類似性指標値を用いて分類モデルが生成されるので、m個の文章とn個の単語との寄与度を加味した上で、危険行動が発生する可能性の高さについて、各患者に対応する文章を適切に分類することができるようになる。よって、本発明によれば、患者が危険行動を起こす可能性の予測を行う装置において、学習によって生成する分類モデルの精度を上げて、危険行動の発生を精度よく予測することができるようになる。
【図面の簡単な説明】
【0012】
図1】本実施形態による危険行動予測装置の機能構成例を示すブロック図である。
図2】本実施形態による危険行動予測装置の動作例を示すフローチャートである。
図3】本実施形態による危険行動予測装置の他の機能構成例を示すブロック図である。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態を図面に基づいて説明する。図1は、本実施形態による危険行動予測装置の機能構成例を示すブロック図である。本実施形態の危険行動予測装置は、その機能構成として、学習用データ入力部10、単語抽出部11、ベクトル算出部12、指標値算出部13、分類モデル生成部14、予測用データ入力部20および危険行動予測部21を備えて構成されている。ベクトル算出部12は、より具体的な機能構成として、文章ベクトル算出部12Aおよび単語ベクトル算出部12Bを備えている。また、本実施形態の危険行動予測装置は、記憶媒体として、分類モデル記憶部30を備えている。
【0014】
なお、以下の説明の便宜上、単語抽出部11、ベクトル算出部12および指標値算出部13で構成される部分を類似性指標値算出部100と称する。類似性指標値算出部100は、文章に関する文章データを入力し、文章とその中に含まれる単語との関係性を反映した類似性指標値を算出して出力するものである。また、本実施形態の危険行動予測装置は、患者の電子カルテ(特許請求の範囲の医療情報に相当)に含まれる文章を類似性指標値算出部100が解析することによって算出される類似性指標値を利用して、電子カルテに含まれる文章の内容から、患者が危険行動(例えば、歩行中や入浴中の転倒、またはベッドや便座等からの転落など。以下、単に転倒転落という)を起こす可能性を予測するものである。なお、学習用データ入力部10、類似性指標値算出部100および分類モデル生成部14により、本発明の予測モデル生成装置が構成される。
【0015】
上記各機能ブロック10〜14,20〜21は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック10〜14,20〜21は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。
【0016】
学習用データ入力部10は、転倒転落の危険行動を起こしたか否かについて既知である患者に関する電子カルテに含まれるm個(mは2以上の任意の整数)の文章を学習用データとして入力する。例えば、学習用データ入力部10は、入院中における転倒転落の発生の有無が電子カルテあるいは他の報告書の記述により報告されている過去の入院患者の電子カルテを入力し、当該電子カルテに含まれている診療記録テキストから成る文章を学習用データとして入力する。
【0017】
電子カルテには、患者の氏名、生年月日、血液型、性別などの個人情報のほかに、診療科、診察日、診療記録テキストなどが含まれている。学習用データ入力部10は、電子カルテの中の診療記録テキストの部分を学習用データとして使用することを設定した状態で、電子カルテを入力する(厳密に言うと、電子カルテを入力して、その電子カルテの中の診療記録テキストの文章を学習用データとして使用する)。なお、学習用データ入力部10により入力する診療記録テキストの文章、つまり、後述の解析対象とする文章は、1つのセンテンス(句点によって区切られる単位)から成るものであってもよいし、複数のセンテンスから成るものであってもよい。
【0018】
単語抽出部11は、学習用データ入力部10により入力されたm個の文章を解析し、当該m個の文章からn個(nは2以上の任意の整数)の単語を抽出する。文章の解析方法としては、例えば、公知の形態素解析を用いることが可能である。ここで、単語抽出部11は、形態素解析によって分割される全ての品詞の形態素を単語として抽出するようにしてもよいし、特定の品詞の形態素のみを単語として抽出するようにしてもよい。
【0019】
なお、m個の文章の中には、同じ単語が複数含まれていることがある。この場合、単語抽出部11は、同じ単語を複数個抽出することはせず、1つのみ抽出する。すなわち、単語抽出部11が抽出するn個の単語とは、n種類の単語という意味である。ここで、単語抽出部11は、m個の電子カルテ中の文章から同じ単語が抽出される頻度を計測し、出現頻度が大きい方からn個(n種類)の単語、あるいは出現頻度が閾値以上であるn個(n種類)の単語を抽出するようにしてもよい。
【0020】
ベクトル算出部12は、m個の文章およびn個の単語から、m個の文章ベクトルおよびn個の単語ベクトルを算出する。ここで、文章ベクトル算出部12Aは、単語抽出部11による解析対象とされたm個の文章をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個(qは2以上の任意の整数)の軸成分から成るm個の文章ベクトルを算出する。また、単語ベクトル算出部12Bは、単語抽出部11により抽出されたn個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルを算出する。
【0021】
本実施形態では、一例として、以下のようにして文章ベクトルおよび単語ベクトルを算出する。今、m個の文章とn個の単語とから成る集合S=<d∈D,w∈W>を考える。ここで、各文章d(i=1,2,・・・,m)および各単語w(j=1,2,・・・,n)に対してそれぞれ文章ベクトルd→および単語ベクトルw→(以下では、記号“→”はベクトルであることを指すものとする)を関連付ける。そして、任意の単語wと任意の文章dに対して、次の式(1)に示す確率P(w|d)を計算する。
【0022】
【数1】
【0023】
なお、この確率P(w|d)は、例えば、文章や文書をパラグラフ・ベクトルにより評価することについて記述した論文「“Distributed Representations of Sentences and Documents”by Quoc Le and Tomas Mikolov, Google Inc, Proceedings of the 31st International Conference on Machine Learning Held in Bejing, China on 22-24 June 2014」に開示されている確率pに倣って算出することが可能な値である。この論文には、例えば、“the”、“cat”、“sat”という3つの単語があるときに、4つ目の単語として“on”を予測するとあり、その予測確率pの算出式が掲載されている。当該論文に記載されている確率p(wt|wt-k,・・・,wt+k)は、複数の単語wt-k,・・・,wt+kから別の1つの単語wtを予測したときの正解確率である。
【0024】
これに対し、本実施形態で用いる式(1)に示される確率P(w|d)は、m個の文章のうち一の文章dから、n個の単語のうち一の単語wが予想される正解確率を表している。1つの文章dから1つの単語wを予測するというのは、具体的には、ある文章dが出現したときに、その中に単語wが含まれる可能性を予測するということである。
【0025】
式(1)では、eを底とし、単語ベクトルw→と文章ベクトルd→との内積値を指数とする指数関数値を用いる。そして、予測対象とする文章dと単語wとの組み合わせから計算される指数関数値と、文章dとn個の単語w(k=1,2,・・・,n)との各組み合わせから計算されるn個の指数関数値の合計値との比率を、一の文章dから一の単語wが予想される正解確率として計算している。
【0026】
ここで、単語ベクトルw→と文章ベクトルd→との内積値は、単語ベクトルw→を文章ベクトルd→の方向に投影した場合のスカラ値、つまり、単語ベクトルw→が有している文章ベクトルd→の方向の成分値とも言える。これは、単語wが文章dに寄与している程度を表していると考えることができる。したがって、このような内積を利用して計算される指数関数値を用いて、n個の単語w(k=1,2,・・・,n)について計算される指数関数値の合計に対する、1つの単語wについて計算される指数関数値の比率を求めることは、1つの文章dからn個の単語のうち1つの単語wが予想される正解確率を求めることに相当する。
【0027】
なお、式(1)は、dとwについて対称なので、n個の単語のうち一の単語wから、m個の文章のうち一の文章dが予想される確率P(d|w)を計算してもよい。1つの単語wから1つの文章dを予測するというのは、ある単語wが出現したときに、それが文章dの中に含まれる可能性を予測するということである。この場合、文章ベクトルd→と単語ベクトルw→との内積値は、文章ベクトルd→を単語ベクトルw→の方向に投影した場合のスカラ値、つまり、文章ベクトルd→が有している単語ベクトルw→の方向の成分値とも言える。これは、文章dが単語wに寄与している程度を表していると考えることができる。
【0028】
なお、ここでは、単語ベクトルw→と文章ベクトルd→との内積値を指数とする指数関数値を用いる計算例を示したが、指数関数値を用いることを必須とするものではない。単語ベクトルw→と文章ベクトルd→との内積値を利用した計算式であればよく、例えば、内積値そのものの比率により確率を求めるようにしてもよい。
【0029】
次に、ベクトル算出部12は、次の式(2)に示すように、上記式(1)により算出される確率P(w|d)を全ての集合Sについて合計した値Lを最大化するような文章ベクトルd→および単語ベクトルw→を算出する。すなわち、文章ベクトル算出部12Aおよび単語ベクトル算出部12Bは、上記式(1)により算出される確率P(w|d)を、m個の文章とn個の単語との全ての組み合わせについて算出し、それらを合計した値を目標変数Lとして、当該目標変数Lを最大化する文章ベクトルd→および単語ベクトルw→を算出する。
【0030】
【数2】
【0031】
m個の文章とn個の単語との全ての組み合わせについて算出した確率P(w|d)の合計値Lを最大化するというのは、ある文章d(i=1,2,・・・,m)からある単語w(j=1,2,・・・,n)が予想される正解確率を最大化するということである。つまり、ベクトル算出部12は、この正解確率が最大化するような文章ベクトルd→および単語ベクトルw→を算出するものと言える。
【0032】
ここで、本実施形態では、上述したように、ベクトル算出部12は、m個の文章dをそれぞれq次元にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルd→を算出するとともに、n個の単語をそれぞれq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルw→を算出する。これは、q個の軸方向を可変として、上述の目標変数Lが最大化するような文章ベクトルd→および単語ベクトルw→を算出することに相当する。
【0033】
指標値算出部13は、ベクトル算出部12により算出されたm個の文章ベクトルd→とn個の単語ベクトルw→との内積をそれぞれとることにより、m個の文章dおよびn個の単語w間の関係性を反映したm×n個の類似性指標値を算出する。本実施形態では、指標値算出部13は、次の式(3)に示すように、m個の文章ベクトルd→の各q個の軸成分(d11〜dmq)を各要素とする文章行列Dと、n個の単語ベクトルw→の各q個の軸成分(w11〜wnq)を各要素とする単語行列Wとの積をとることにより、m×n個の類似性指標値を各要素とする指標値行列DWを算出する。ここで、Wは単語行列の転置行列である。
【0034】
【数3】
【0035】
このようにして算出された指標値行列DWの各要素は、どの単語がどの文章に対してどの程度寄与しているのかを表したものと言える。例えば、1行2列の要素dw12は、単語w2が文章d1に対してどの程度寄与しているのかを表した値である。これにより、指標値行列DWの各行は文章の類似性を評価するものとして用いることが可能であり、各列は単語の類似性を評価するものとして用いることが可能である。
【0036】
分類モデル生成部14は、指標値算出部13により算出されたm×n個の類似性指標値を用いて、1つの文章d(i=1,2,・・・,m)についてn個の類似性指標値dw(j=1,2,・・・,n)から成る文章指標値群をもとに、転倒転落が発生する可能性の高さについてm個の文章dをそれぞれ2つに分類するための分類モデルを生成する。すなわち、分類モデル生成部14は、転倒転落を起こしたことが既知である患者の電子カルテをもとに算出される文章指標値群については「転倒転落あり」に分類され、転倒転落を起こしていないことが既知である患者の電子カルテをもとに算出される文章指標値群については「転倒転落なし」に分類されるような分類モデルを生成する。そして、分類モデル生成部14は、生成した分類モデルを分類モデル記憶部30に記憶させる。
【0037】
ここで、文章指標値群とは、例えば1つ目の文章dの場合、指標値行列DWの1行目に含まれるn個の類似性指標値dw11〜dw1nがこれに該当する。同様に、2つ目の文章d2の場合、指標値行列DWの2行目に含まれるn個の類似性指標値dw21〜dw2nがこれに該当する。以下、m個目の文章dmに関する文章指標値群(n個の類似性指標値dwm1〜dwmn)まで同様である。
【0038】
分類モデル生成部14は、例えば、各文章dの文章指標値群についてそれぞれ特徴量を算出し、当該算出した特徴量の値に応じて、マルコフ連鎖モンテカルロ法による2群分離の最適化を行うことにより、各文章dを2つの事象に分類するための分類モデルを生成する。ここで、分類モデル生成部14が生成する分類モデルは、文章指標値群を入力として、予測したい2つの事象(転倒転落の発生の可能性の有無)のうち何れかを解として出力する学習モデルである。あるいは、転倒転落の「可能性あり」に分類される確率を数値として出力する学習モデルとしてもよい。学習モデルの形態は任意である。
【0039】
例えば、分類モデル生成部14が生成する分類モデルの形態は、回帰モデル(線形回帰、ロジスティック回帰、サポートベクターマシーンなどをベースとする学習モデル)、木モデル(決定木、回帰木、ランダムフォレスト、勾配ブースティング木などをベースとする学習モデル)、ニューラルネットワークモデル(パーセプトロン、畳み込みニューラルネットワーク、再起型ニューラルネットワーク、残差ネットワーク、RBFネットワーク、確率的ニューラルネットワーク、スパイキングニューラルネットワーク、複素ニューラルネットワークなどをベースとする学習モデル)、ベイズモデル(ベイズ推論などをベースとする学習モデル)、クラスタリングモデル(k近傍法、階層型クラスタリング、非階層型クラスタリング、トピックモデルなどをベースとする学習モデル)などのうち何れかとすることが可能である。なお、ここに挙げた分類モデルは一例に過ぎず、これに限定されるものではない。
【0040】
予測用データ入力部20は、予測対象とする患者に関する電子カルテに含まれるm’個(m’は1以上の任意の整数)の文章を予測用データとして入力する。例えば、予測用データ入力部20は、本実施形態の危険行動予測装置を導入している病院における現在の入院患者の人数分の電子カルテを入力し、当該電子カルテに含まれている診療記録テキストから成る文章を予測用データとして入力する。
【0041】
実際の病院の運用としては、予測用データ入力部20によって各入院患者の電子カルテの入力を定期的に(例えば、毎日)行い、危険行動予測部21によって各入院患者の転倒転落の予測を定期的に行うのが好ましい。例えば、予測用データ入力部20は、電子カルテのデータを保存した電子カルテシステム(図示せず)から各入院患者の電子カルテを定期的に入力するようにしてよい。電子カルテ内の診療記録テキストの記述は、医師による日次の診療を通じて更新されている可能性がある。よって、更新され得る診療記録テキストの文章の内容に基づいて、各入院患者の転倒転落の予測を日次で行うことになる。
【0042】
ここで、予測用データ入力部20が入力する電子カルテは、転倒転落の発生の可能性が未知の患者、および、転倒転落の発生の可能性が現時点ではないと予測されている患者の電子カルテとする。転倒転落の発生の可能性があると既に予測されている患者の電子カルテは必ずしも入力対象としなくてもよい。ただし、患者の症状や体調の改善によって転倒転落の発生の可能性がなくなる可能性もあるので、転倒転落の発生の可能性があると既に予測されている患者の電子カルテを入力対象に含めてもよい。
【0043】
なお、電子カルテの更新履歴と、転倒転落の予測実施履歴とを患者ごとに記録したデータベースを作成し、予測用データ入力部20がこのデータベースの履歴情報に基づいて、予測対象とする患者の電子カルテを電子カルテシステムから選択的に入力するようにしてもよい。例えば、予測用データ入力部20は、電子カルテの更新が行われていて、その更新よりも後に転倒転落の予測処理が実行されていないことが履歴情報により示されている患者の電子カルテを電子カルテシステムから検索して入力するようにしてもよい。
【0044】
危険行動予測部21は、予測用データ入力部20により入力された予測用データに対して、類似性指標値算出部100の単語抽出部11、ベクトル算出部12および指標値算出部13の処理を実行することによって得られる類似性指標値を、分類モデル生成部14により生成された分類モデル(分類モデル記憶部30に記憶された分類モデル)に適用することにより、予測対象とする患者が転倒転落の危険行動を起こす可能性を予測する。
【0045】
例えば、予測用データ入力部20により電子カルテ内に含まれるm’個の診療記録テキストの文章が予測用データとして入力された場合、危険行動予測部21の指示によりこのm’個の診療記録テキストの文章について類似性指標値算出部100の処理を実行することにより、m’個の文章指標値群を得る。危険行動予測部21は、類似性指標値算出部100により算出されたm’個の文章指標値群を1つずつ分類モデルに入力データとして与えることにより、m’個の文章のそれぞれについて、患者の転倒転落の発生の可能性を予測する。
【0046】
ここで、単語抽出部11は、m個の学習用データから抽出したn個の単語と同じ単語をm’個の予測用データから抽出するのが好ましい。予測用データから抽出されるn個の単語から成る文章指標値群が、学習用データから抽出されたn個の単語から成る文章指標値群と同じ単語を要素とするものとなるので、分類モデル記憶部30に記憶された分類モデルに対する適合度が高くなるからである。ただし、学習時と同じn個の単語を予測時にも抽出することを必須とするものではない。学習時とは異なる単語の組み合わせによって予測用の文章指標値群が生成される場合、分類モデルに対する適合度が低くなるものの、適合度が低いということ自体も評価の一要素として、事象に該当する可能性を予測すること自体は可能だからである。
【0047】
図2は、上記のように構成した本実施形態による危険行動予測装置の動作例を示すフローチャートである。図2(a)は、分類モデルを生成する学習時の動作例を示し、図2(b)は、生成された分類モデルを用いて転倒転落の発生の可能性の予測を行う予測時の動作例を示している。
【0048】
図2(a)に示す学習時において、まず、学習用データ入力部10は、転倒転落の危険行動を起こしたか否かについて既知である患者に関する電子カルテに含まれるm個の文章(診療記録テキスト)を学習用データとして入力する(ステップS1)。単語抽出部11は、学習用データ入力部10により入力されたm個の文章を解析し、当該m個の文章からn個の単語を抽出する(ステップS2)。
【0049】
次いで、ベクトル算出部12は、学習用データ入力部10により入力されたm個の文章および単語抽出部11により抽出されたn個の単語から、m個の文章ベクトルd→およびn個の単語ベクトルw→を算出する(ステップS3)。そして、指標値算出部13は、m個の文章ベクトルd→とn個の単語ベクトルw→との内積をそれぞれとることにより、m個の文章dおよびn個の単語w間の関係性を反映したm×n個の類似性指標値(m×n個の類似性指標値を各要素とする指標値行列DW)を算出する(ステップS4)。
【0050】
さらに、分類モデル生成部14は、指標値算出部13により算出されたm×n個の類似性指標値を用いて、1つの文章dについてn個の類似性指標値dwから成る文章指標値群をもとに、転倒転落が発生する可能性の高さについてm個の文章dを2つに分類するための分類モデルを生成し、生成した分類モデルを分類モデル記憶部30に記憶させる(ステップS5)。以上により、学習時の動作が終了する。
【0051】
図2(b)に示す予測時において、まず、予測用データ入力部20は、予測対象とする患者に関する電子カルテに含まれるm’個の文章(診療記録テキスト)を予測用データとして入力する(ステップS11)。危険行動予測部21は、予測用データ入力部20により入力された予測用データを類似性指標値算出部100に供給し、類似性指標値の算出を指示する。
【0052】
この指示に応じて、単語抽出部11は、予測用データ入力部20により入力されたm’個の文章を解析し、当該m’個の文章からn個の単語(学習用データから抽出されたものと同じ単語)を抽出する(ステップS12)。なお、m’個の文章の中にn個の単語が全て含まれているとは限らない。m’個の文章の中に存在しない単語についてはNull値となる。
【0053】
次いで、ベクトル算出部12は、予測用データ入力部20により入力されたm’個の文章および単語抽出部11により抽出されたn個の単語から、m’個の文章ベクトルd→およびn個の単語ベクトルw→を算出する(ステップS13)。
【0054】
そして、指標値算出部13は、m’個の文章ベクトルd→とn個の単語ベクトルw→との内積をそれぞれとることにより、m’個の文章dおよびn個の単語w間の関係性を反映したm’×n個の類似性指標値(m’×n個の類似性指標値を各要素とする指標値行列DW)を算出する(ステップS14)。指標値算出部13は、算出したm’×n個の類似性指標値を危険行動予測部21に供給する。
【0055】
危険行動予測部21は、類似性指標値算出部100から供給されたm’×n個の類似性指標値をもとに、m’個の文章指標値群をそれぞれ分類モデル記憶部30に記憶された分類モデルに適用することにより、m’個の文章のそれぞれについて、予測対象とする患者が転倒転落の危険行動を起こす可能性を予測する(ステップS15)。これにより、予測時の動作が終了する。
【0056】
以上詳しく説明したように、本実施形態では、患者の電子カルテに含まれるm個の文章を学習用データとして入力し、当該入力された文章から算出した文章ベクトルと、文章内に含まれる単語から算出した単語ベクトルとの内積を計算することによって、文章および単語間の関係性を反映した類似性指標値を算出し、この類似性指標値を用いて分類モデルを生成している。これにより、どの単語がどの文章に対してどの程度寄与しているのか、あるいは、どの文章がどの単語に対してどの程度寄与しているのかを表した類似性指標値を用いて分類モデルが生成される。このため、m個の文章とn個の単語との寄与度を加味した上で、電子カルテ内の文章を、転倒転落の発生の可能性の有無という2つの事象のうち何れかに適切に分類することができるようになる。よって、本実施形態によれば、患者が危険行動を起こす可能性の予測を行う装置において、学習によって生成する分類モデルの精度を上げて、危険行動の発生を精度よく予測することができるようになる。
【0057】
なお、上記実施形態では、「転倒転落あり」および「転倒転落なし」の2つの事象のうちどちらに該当するかが既知である文章に関する文章データを学習用データとして用いる教師あり学習を適用した例について説明したが、これに強化学習を組み合わせるようにしてもよい。図3は、強化学習の仕組みを追加した他の実施形態に係る危険行動予測装置の機能構成例を示すブロック図である。
【0058】
図3に示すように、他の実施形態に係る危険行動予測装置は、図1に示した構成に加えて実績データ入力部22および報酬決定部23を更に備えている。また、他の実施形態に係る危険行動予測装置は、図1に示した分類モデル生成部14に代えて分類モデル生成部14’を備えている。
【0059】
実績データ入力部22は、退院患者の電子カルテに含まれている危険行動記録レポートを実績データとして入力する。すなわち、電子カルテには、上述した患者の氏名、生年月日、血液型、性別、診療科、診察日、診療記録テキストのほかに、退院後サマリーの項目が含まれていることがある。この退院後サマリーは、患者の退院後に、入院中における患者の状態を要約として記述するための項目である。この退院後サマリーに、患者が入院中に危険行動を起こしたか否かの記録レポートが記述される。実績データ入力部22は、この退院後サマリーに記述されている危険行動記録レポートの内容、つまり患者が入院中に危険行動を起こしたか否かの情報を実績データとして入力する。
【0060】
なお、実績データ入力部22による実績データの入力方法はこれに限定されない。例えば、患者が入院中に危険行動を起こしたか否かの情報が電子カルテの診療記録テキストに記述される場合もある。よって、実績データ入力部22は、診療記録テキストに記述されている危険行動記録レポートの内容を実績データとして入力するようにしてもよい。
【0061】
具体的には、実績データ入力部22は、退院後サマリーまたは診療記録テキストに記述されている文章を解析することによって、患者が入院中に危険行動を起こしたか否かを判定し、その判定結果を実績データとして入力する。あるいは、退院後サマリーまたは診療記録テキストに記述されている文章を医師や看護師等の医療従事者が目視により確認し、医師や看護師等の医療従事者がキーボードやタッチパネル等の入力デバイスを操作することによって入力した情報を実績データ入力部22が入力することにより、退院患者の入院中における危険行動の発生の有無を実績データとして入力するようにしてもよい。
【0062】
報酬決定部23は、危険行動予測部21により予測された転倒転落の発生の可能性に対し、実績データ入力部22より入力された転倒転落の発生の実績に応じて、分類モデル生成部14’に与える報酬を決定する。例えば、報酬決定部23は、危険行動予測部21により予測された転倒転落の発生の可能性を示す予測データと、実績データ入力部22により入力された実績データとが一致している場合にはプラスの報酬を与えるように決定し、一致していない場合は無報酬またはマイナスの報酬を与えるように決定する。
【0063】
分類モデル生成部14’は、図1に示した分類モデル生成部14と同様に、学習用データ入力部10により入力された学習用データをもとに、分類モデルを生成し、分類モデル記憶部30に記憶させる。これに加え、分類モデル生成部14’は、報酬決定部23により決定された報酬に応じて、分類モデル記憶部30に記憶された分類モデルを改変する。このように、教師あり学習の仕組みに対して強化学習の仕組みを加えて分類モデルを生成することにより、分類モデルの精度を更に向上させることができる。
【0064】
なお、上記実施形態では、学習および予測に使用する医療情報として電子カルテを用いる例について説明したが、例えば看護記録レポートなど、患者の危険行動の発生の可能性を予測し得る文章が含まれているものであれば、電子カルテ以外の医療情報を用いてもよい。
【0065】
また、上記実施形態では、患者の危険行動として転倒転落の発生の可能性を予測する例について説明したが、本発明はこれに限定されない。すなわち、医師や看護師側ではなく患者側の事情に起因する危険行動の発生を予測することに広く利用することが可能である。
【0066】
また、上記実施形態では、転倒転落が発生する可能性の高さについて文章を2つに分類する例について説明したが、3つ以上のランクに分類するようにしてもよい。
【0067】
また、上記実施形態では、入院中の患者に関する転倒転落の発生を予測することについて説明したが、本発明はこれに限定されない。例えば、外来患者、在宅訪問治療の対象患者、遠隔医療システムを利用している遠隔治療患者など、電子カルテまたはそれに類する医療情報が存在する患者についても、在宅での転倒転落の発生の可能性を予測することが可能である。
【0068】
また、上記実施形態では、病院において患者が危険行動を起こす可能性を予測することについて説明したが、介護施設などにおいて被介護者が危険行動を起こす可能性を予測することも可能である。本明細書および特許請求の範囲では、被介護者も「患者」に含まれる概念であるものとする。
【0069】
その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0070】
10 学習用データ入力部
11 単語抽出部
12 ベクトル算出部
12A 文章ベクトル算出部
12B 単語ベクトル算出部
13 指標値算出部
14,14’ 分類モデル生成部
20 予測用データ入力部
21 危険行動予測部
22 実績データ入力部
23 報酬決定部
30 分類モデル記憶部
100 類似性指標値算出部
図1
図2
図3