【文献】
横田 慎一郎、遠藤 美代子、平松 達雄、野口 貴史、美代 賢吾、大江 和彦,電子カルテデータを利用した後ろ向きコホートによる患者転倒リスク予測式の構築・評価・実装手法,医療情報学 第34巻 3号,日本,一般社団法人日本医療情報学会,2014年 9月29日,p.119〜128
(58)【調査した分野】(Int.Cl.,DB名)
危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるm個(mは2以上の任意の整数)の文章を学習用データとして入力する学習用データ入力部と、
上記学習用データ入力部により上記学習用データとして入力された上記m個の文章を解析し、当該m個の文章からn個(nは2以上の任意の整数)の単語を抽出する単語抽出部と、
上記m個の文章をそれぞれ所定のルールに従ってq次元(qは2以上の任意の整数)にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルを算出する文章ベクトル算出部と、
上記n個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルを算出する単語ベクトル算出部と、
上記m個の文章ベクトルと上記n個の単語ベクトルとの内積をそれぞれとることにより、上記m個の文章および上記n個の単語間の関係性を反映したm×n個の類似性指標値を算出する指標値算出部と、
上記指標値算出部により算出された上記m×n個の類似性指標値を用いて、1つの文章についてn個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記m個の文章を分類するための分類モデルを生成する分類モデル生成部と、
予測対象とする患者に関する医療情報に含まれるm’個(m’は1以上の任意の整数)の文章を予測用データとして入力する予測用データ入力部と、
上記予測用データ入力部により入力された上記予測用データに対して上記単語抽出部、上記文章ベクトル算出部、上記単語ベクトル算出部および上記指標値算出部の処理を実行することによって得られる類似性指標値を、上記分類モデル生成部により生成された上記分類モデルに適用することにより、上記予測対象とする患者が上記危険行動を起こす可能性を予測する危険行動予測部とを備えたことを特徴とする危険行動予測装置。
上記文章ベクトル算出部および上記単語ベクトル算出部は、上記n個の単語のうち一の単語から上記m個の文章のうち一の文章が予想される確率、または、上記m個の文章のうち一の文章から上記n個の単語のうち一の単語が予想される確率を、上記m個の文章と上記n個の単語との全ての組み合わせについて算出して合計した値を目標変数とし、当該目標変数を最大化する文章ベクトルおよび単語ベクトルを算出することを特徴とする請求項1に記載の危険行動予測装置。
上記指標値算出部は、上記m個の文章ベクトルの各q個の軸成分を各要素とする文章行列と、上記n個の単語ベクトルの各q個の軸成分を各要素とする単語行列との積をとることにより、m×n個の上記類似性指標値を各要素とする指標値行列を算出することを特徴とする請求項1または2に記載の危険行動予測装置。
上記学習用データ入力部は、上記危険行動を起こしたか否かについて既知である患者の電子カルテを上記医療情報として入力し、当該電子カルテに含まれている診療記録テキストから成る文章を上記学習用データとして入力し、
上記予測用データ入力部は、現在の入院患者の電子カルテを上記医療情報として入力し、当該電子カルテに含まれている診療記録テキストから成る文章を上記予測用データとして入力することを特徴とする請求項1〜3の何れか1項に記載の危険行動予測装置。
危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるm個(mは2以上の任意の整数)の文章を学習用データとして入力する学習用データ入力部と、
上記学習用データ入力部により上記学習用データとして入力された上記m個の文章を解析し、当該m個の文章からn個(nは2以上の任意の整数)の単語を抽出する単語抽出部と、
上記m個の文章をそれぞれ所定のルールに従ってq次元(qは2以上の任意の整数)にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルを算出する文章ベクトル算出部と、
上記n個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルを算出する単語ベクトル算出部と、
上記m個の文章ベクトルと上記n個の単語ベクトルとの内積をそれぞれとることにより、上記m個の文章および上記n個の単語間の関係性を反映したm×n個の類似性指標値を算出する指標値算出部と、
上記指標値算出部により算出された上記m×n個の類似性指標値を用いて、1つの文章についてn個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記m個の文章を分類するための分類モデルを、上記文章から上記危険行動が発生する可能性を予測するための予測モデルとして生成する分類モデル生成部とを備えたことを特徴とする予測モデル生成装置。
上記文章ベクトル算出部および上記単語ベクトル算出部は、上記n個の単語のうち一の単語から上記m個の文章のうち一の文章が予想される確率、または、上記m個の文章のうち一の文章から上記n個の単語のうち一の単語が予想される確率を、上記m個の文章と上記n個の単語との全ての組み合わせについて算出して合計した値を目標変数とし、当該目標変数を最大化する文章ベクトルおよび単語ベクトルを算出することを特徴とする請求項6に記載の予測モデル生成装置。
上記指標値算出部は、上記m個の文章ベクトルの各q個の軸成分を各要素とする文章行列と、上記n個の単語ベクトルの各q個の軸成分を各要素とする単語行列との積をとることにより、m×n個の上記類似性指標値を各要素とする指標値行列を算出することを特徴とする請求項6または7に記載の予測モデル生成装置。
危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるm個(mは2以上の任意の整数)の文章を学習用データとして入力する学習用データ入力手段、
上記学習用データ入力手段により上記学習用データとして入力された上記m個の文章を解析し、当該m個の文章からn個(nは2以上の任意の整数)の単語を抽出する単語抽出手段、
上記m個の文章をそれぞれ所定のルールに従ってq次元(qは2以上の任意の整数)にベクトル化するとともに、上記n個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルおよびq個の軸成分から成るn個の単語ベクトルを算出するベクトル算出手段、および
上記m個の文章ベクトルと上記n個の単語ベクトルとの内積をそれぞれとることにより、上記m個の文章および上記n個の単語間の関係性を反映したm×n個の類似性指標値を算出する指標値算出手段、および
上記指標値算出手段により算出された上記m×n個の類似性指標値を用いて、1つの文章についてn個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記m個の文章を分類するための分類モデルを、上記文章から上記危険行動が発生する可能性を予測するための予測モデルとして生成する分類モデル生成手段、
としてコンピュータを機能させるための危険行動予測用プログラム。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、本実施形態による危険行動予測装置の機能構成例を示すブロック図である。本実施形態の危険行動予測装置は、その機能構成として、学習用データ入力部10、単語抽出部11、ベクトル算出部12、指標値算出部13、分類モデル生成部14、予測用データ入力部20および危険行動予測部21を備えて構成されている。ベクトル算出部12は、より具体的な機能構成として、文章ベクトル算出部12Aおよび単語ベクトル算出部12Bを備えている。また、本実施形態の危険行動予測装置は、記憶媒体として、分類モデル記憶部30を備えている。
【0014】
なお、以下の説明の便宜上、単語抽出部11、ベクトル算出部12および指標値算出部13で構成される部分を類似性指標値算出部100と称する。類似性指標値算出部100は、文章に関する文章データを入力し、文章とその中に含まれる単語との関係性を反映した類似性指標値を算出して出力するものである。また、本実施形態の危険行動予測装置は、患者の電子カルテ(特許請求の範囲の医療情報に相当)に含まれる文章を類似性指標値算出部100が解析することによって算出される類似性指標値を利用して、電子カルテに含まれる文章の内容から、患者が危険行動(例えば、歩行中や入浴中の転倒、またはベッドや便座等からの転落など。以下、単に転倒転落という)を起こす可能性を予測するものである。なお、学習用データ入力部10、類似性指標値算出部100および分類モデル生成部14により、本発明の予測モデル生成装置が構成される。
【0015】
上記各機能ブロック10〜14,20〜21は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック10〜14,20〜21は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。
【0016】
学習用データ入力部10は、転倒転落の危険行動を起こしたか否かについて既知である患者に関する電子カルテに含まれるm個(mは2以上の任意の整数)の文章を学習用データとして入力する。例えば、学習用データ入力部10は、入院中における転倒転落の発生の有無が電子カルテあるいは他の報告書の記述により報告されている過去の入院患者の電子カルテを入力し、当該電子カルテに含まれている診療記録テキストから成る文章を学習用データとして入力する。
【0017】
電子カルテには、患者の氏名、生年月日、血液型、性別などの個人情報のほかに、診療科、診察日、診療記録テキストなどが含まれている。学習用データ入力部10は、電子カルテの中の診療記録テキストの部分を学習用データとして使用することを設定した状態で、電子カルテを入力する(厳密に言うと、電子カルテを入力して、その電子カルテの中の診療記録テキストの文章を学習用データとして使用する)。なお、学習用データ入力部10により入力する診療記録テキストの文章、つまり、後述の解析対象とする文章は、1つのセンテンス(句点によって区切られる単位)から成るものであってもよいし、複数のセンテンスから成るものであってもよい。
【0018】
単語抽出部11は、学習用データ入力部10により入力されたm個の文章を解析し、当該m個の文章からn個(nは2以上の任意の整数)の単語を抽出する。文章の解析方法としては、例えば、公知の形態素解析を用いることが可能である。ここで、単語抽出部11は、形態素解析によって分割される全ての品詞の形態素を単語として抽出するようにしてもよいし、特定の品詞の形態素のみを単語として抽出するようにしてもよい。
【0019】
なお、m個の文章の中には、同じ単語が複数含まれていることがある。この場合、単語抽出部11は、同じ単語を複数個抽出することはせず、1つのみ抽出する。すなわち、単語抽出部11が抽出するn個の単語とは、n種類の単語という意味である。ここで、単語抽出部11は、m個の電子カルテ中の文章から同じ単語が抽出される頻度を計測し、出現頻度が大きい方からn個(n種類)の単語、あるいは出現頻度が閾値以上であるn個(n種類)の単語を抽出するようにしてもよい。
【0020】
ベクトル算出部12は、m個の文章およびn個の単語から、m個の文章ベクトルおよびn個の単語ベクトルを算出する。ここで、文章ベクトル算出部12Aは、単語抽出部11による解析対象とされたm個の文章をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個(qは2以上の任意の整数)の軸成分から成るm個の文章ベクトルを算出する。また、単語ベクトル算出部12Bは、単語抽出部11により抽出されたn個の単語をそれぞれ所定のルールに従ってq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルを算出する。
【0021】
本実施形態では、一例として、以下のようにして文章ベクトルおよび単語ベクトルを算出する。今、m個の文章とn個の単語とから成る集合S=<d∈D,w∈W>を考える。ここで、各文章d
i(i=1,2,・・・,m)および各単語w
j(j=1,2,・・・,n)に対してそれぞれ文章ベクトルd
i→および単語ベクトルw
j→(以下では、記号“→”はベクトルであることを指すものとする)を関連付ける。そして、任意の単語w
jと任意の文章d
iに対して、次の式(1)に示す確率P(w
j|d
i)を計算する。
【0023】
なお、この確率P(w
j|d
i)は、例えば、文章や文書をパラグラフ・ベクトルにより評価することについて記述した論文「“Distributed Representations of Sentences and Documents”by Quoc Le and Tomas Mikolov, Google Inc, Proceedings of the 31st International Conference on Machine Learning Held in Bejing, China on 22-24 June 2014」に開示されている確率pに倣って算出することが可能な値である。この論文には、例えば、“the”、“cat”、“sat”という3つの単語があるときに、4つ目の単語として“on”を予測するとあり、その予測確率pの算出式が掲載されている。当該論文に記載されている確率p(wt|wt-k,・・・,wt+k)は、複数の単語wt-k,・・・,wt+kから別の1つの単語wtを予測したときの正解確率である。
【0024】
これに対し、本実施形態で用いる式(1)に示される確率P(w
j|d
i)は、m個の文章のうち一の文章d
iから、n個の単語のうち一の単語w
jが予想される正解確率を表している。1つの文章d
iから1つの単語w
jを予測するというのは、具体的には、ある文章d
iが出現したときに、その中に単語w
jが含まれる可能性を予測するということである。
【0025】
式(1)では、eを底とし、単語ベクトルw→と文章ベクトルd→との内積値を指数とする指数関数値を用いる。そして、予測対象とする文章d
iと単語w
jとの組み合わせから計算される指数関数値と、文章d
iとn個の単語w
k(k=1,2,・・・,n)との各組み合わせから計算されるn個の指数関数値の合計値との比率を、一の文章d
iから一の単語w
jが予想される正解確率として計算している。
【0026】
ここで、単語ベクトルw
j→と文章ベクトルd
i→との内積値は、単語ベクトルw
j→を文章ベクトルd
i→の方向に投影した場合のスカラ値、つまり、単語ベクトルw
j→が有している文章ベクトルd
i→の方向の成分値とも言える。これは、単語w
jが文章d
iに寄与している程度を表していると考えることができる。したがって、このような内積を利用して計算される指数関数値を用いて、n個の単語w
k(k=1,2,・・・,n)について計算される指数関数値の合計に対する、1つの単語w
jについて計算される指数関数値の比率を求めることは、1つの文章d
iからn個の単語のうち1つの単語w
jが予想される正解確率を求めることに相当する。
【0027】
なお、式(1)は、d
iとw
jについて対称なので、n個の単語のうち一の単語w
jから、m個の文章のうち一の文章d
iが予想される確率P(d
i|w
j)を計算してもよい。1つの単語w
jから1つの文章d
iを予測するというのは、ある単語w
jが出現したときに、それが文章d
iの中に含まれる可能性を予測するということである。この場合、文章ベクトルd
i→と単語ベクトルw
j→との内積値は、文章ベクトルd
i→を単語ベクトルw
j→の方向に投影した場合のスカラ値、つまり、文章ベクトルd
i→が有している単語ベクトルw
j→の方向の成分値とも言える。これは、文章d
iが単語w
jに寄与している程度を表していると考えることができる。
【0028】
なお、ここでは、単語ベクトルw→と文章ベクトルd→との内積値を指数とする指数関数値を用いる計算例を示したが、指数関数値を用いることを必須とするものではない。単語ベクトルw→と文章ベクトルd→との内積値を利用した計算式であればよく、例えば、内積値そのものの比率により確率を求めるようにしてもよい。
【0029】
次に、ベクトル算出部12は、次の式(2)に示すように、上記式(1)により算出される確率P(w
j|d
i)を全ての集合Sについて合計した値Lを最大化するような文章ベクトルd
i→および単語ベクトルw
j→を算出する。すなわち、文章ベクトル算出部12Aおよび単語ベクトル算出部12Bは、上記式(1)により算出される確率P(w
j|d
i)を、m個の文章とn個の単語との全ての組み合わせについて算出し、それらを合計した値を目標変数Lとして、当該目標変数Lを最大化する文章ベクトルd
i→および単語ベクトルw
j→を算出する。
【0031】
m個の文章とn個の単語との全ての組み合わせについて算出した確率P(w
j|d
i)の合計値Lを最大化するというのは、ある文章d
i(i=1,2,・・・,m)からある単語w
j(j=1,2,・・・,n)が予想される正解確率を最大化するということである。つまり、ベクトル算出部12は、この正解確率が最大化するような文章ベクトルd
i→および単語ベクトルw
j→を算出するものと言える。
【0032】
ここで、本実施形態では、上述したように、ベクトル算出部12は、m個の文章d
iをそれぞれq次元にベクトル化することにより、q個の軸成分から成るm個の文章ベクトルd
i→を算出するとともに、n個の単語をそれぞれq次元にベクトル化することにより、q個の軸成分から成るn個の単語ベクトルw
j→を算出する。これは、q個の軸方向を可変として、上述の目標変数Lが最大化するような文章ベクトルd
i→および単語ベクトルw
j→を算出することに相当する。
【0033】
指標値算出部13は、ベクトル算出部12により算出されたm個の文章ベクトルd
i→とn個の単語ベクトルw
j→との内積をそれぞれとることにより、m個の文章d
iおよびn個の単語w
j間の関係性を反映したm×n個の類似性指標値を算出する。本実施形態では、指標値算出部13は、次の式(3)に示すように、m個の文章ベクトルd
i→の各q個の軸成分(d
11〜d
mq)を各要素とする文章行列Dと、n個の単語ベクトルw
j→の各q個の軸成分(w
11〜w
nq)を各要素とする単語行列Wとの積をとることにより、m×n個の類似性指標値を各要素とする指標値行列DWを算出する。ここで、W
tは単語行列の転置行列である。
【0035】
このようにして算出された指標値行列DWの各要素は、どの単語がどの文章に対してどの程度寄与しているのかを表したものと言える。例えば、1行2列の要素dw
12は、単語w
2が文章d
1に対してどの程度寄与しているのかを表した値である。これにより、指標値行列DWの各行は文章の類似性を評価するものとして用いることが可能であり、各列は単語の類似性を評価するものとして用いることが可能である。
【0036】
分類モデル生成部14は、指標値算出部13により算出されたm×n個の類似性指標値を用いて、1つの文章d
i(i=1,2,・・・,m)についてn個の類似性指標値dw
j(j=1,2,・・・,n)から成る文章指標値群をもとに、転倒転落が発生する可能性の高さについてm個の文章d
iをそれぞれ2つに分類するための分類モデルを生成する。すなわち、分類モデル生成部14は、転倒転落を起こしたことが既知である患者の電子カルテをもとに算出される文章指標値群については「転倒転落あり」に分類され、転倒転落を起こしていないことが既知である患者の電子カルテをもとに算出される文章指標値群については「転倒転落なし」に分類されるような分類モデルを生成する。そして、分類モデル生成部14は、生成した分類モデルを分類モデル記憶部30に記憶させる。
【0037】
ここで、文章指標値群とは、例えば1つ目の文章d
1の場合、指標値行列DWの1行目に含まれるn個の類似性指標値dw
11〜dw
1nがこれに該当する。同様に、2つ目の文章d
2の場合、指標値行列DWの2行目に含まれるn個の類似性指標値dw
21〜dw
2nがこれに該当する。以下、m個目の文章d
mに関する文章指標値群(n個の類似性指標値dw
m1〜dw
mn)まで同様である。
【0038】
分類モデル生成部14は、例えば、各文章d
iの文章指標値群についてそれぞれ特徴量を算出し、当該算出した特徴量の値に応じて、マルコフ連鎖モンテカルロ法による2群分離の最適化を行うことにより、各文章d
iを2つの事象に分類するための分類モデルを生成する。ここで、分類モデル生成部14が生成する分類モデルは、文章指標値群を入力として、予測したい2つの事象(転倒転落の発生の可能性の有無)のうち何れかを解として出力する学習モデルである。あるいは、転倒転落の「可能性あり」に分類される確率を数値として出力する学習モデルとしてもよい。学習モデルの形態は任意である。
【0039】
例えば、分類モデル生成部14が生成する分類モデルの形態は、回帰モデル(線形回帰、ロジスティック回帰、サポートベクターマシーンなどをベースとする学習モデル)、木モデル(決定木、回帰木、ランダムフォレスト、勾配ブースティング木などをベースとする学習モデル)、ニューラルネットワークモデル(パーセプトロン、畳み込みニューラルネットワーク、再起型ニューラルネットワーク、残差ネットワーク、RBFネットワーク、確率的ニューラルネットワーク、スパイキングニューラルネットワーク、複素ニューラルネットワークなどをベースとする学習モデル)、ベイズモデル(ベイズ推論などをベースとする学習モデル)、クラスタリングモデル(k近傍法、階層型クラスタリング、非階層型クラスタリング、トピックモデルなどをベースとする学習モデル)などのうち何れかとすることが可能である。なお、ここに挙げた分類モデルは一例に過ぎず、これに限定されるものではない。
【0040】
予測用データ入力部20は、予測対象とする患者に関する電子カルテに含まれるm’個(m’は1以上の任意の整数)の文章を予測用データとして入力する。例えば、予測用データ入力部20は、本実施形態の危険行動予測装置を導入している病院における現在の入院患者の人数分の電子カルテを入力し、当該電子カルテに含まれている診療記録テキストから成る文章を予測用データとして入力する。
【0041】
実際の病院の運用としては、予測用データ入力部20によって各入院患者の電子カルテの入力を定期的に(例えば、毎日)行い、危険行動予測部21によって各入院患者の転倒転落の予測を定期的に行うのが好ましい。例えば、予測用データ入力部20は、電子カルテのデータを保存した電子カルテシステム(図示せず)から各入院患者の電子カルテを定期的に入力するようにしてよい。電子カルテ内の診療記録テキストの記述は、医師による日次の診療を通じて更新されている可能性がある。よって、更新され得る診療記録テキストの文章の内容に基づいて、各入院患者の転倒転落の予測を日次で行うことになる。
【0042】
ここで、予測用データ入力部20が入力する電子カルテは、転倒転落の発生の可能性が未知の患者、および、転倒転落の発生の可能性が現時点ではないと予測されている患者の電子カルテとする。転倒転落の発生の可能性があると既に予測されている患者の電子カルテは必ずしも入力対象としなくてもよい。ただし、患者の症状や体調の改善によって転倒転落の発生の可能性がなくなる可能性もあるので、転倒転落の発生の可能性があると既に予測されている患者の電子カルテを入力対象に含めてもよい。
【0043】
なお、電子カルテの更新履歴と、転倒転落の予測実施履歴とを患者ごとに記録したデータベースを作成し、予測用データ入力部20がこのデータベースの履歴情報に基づいて、予測対象とする患者の電子カルテを電子カルテシステムから選択的に入力するようにしてもよい。例えば、予測用データ入力部20は、電子カルテの更新が行われていて、その更新よりも後に転倒転落の予測処理が実行されていないことが履歴情報により示されている患者の電子カルテを電子カルテシステムから検索して入力するようにしてもよい。
【0044】
危険行動予測部21は、予測用データ入力部20により入力された予測用データに対して、類似性指標値算出部100の単語抽出部11、ベクトル算出部12および指標値算出部13の処理を実行することによって得られる類似性指標値を、分類モデル生成部14により生成された分類モデル(分類モデル記憶部30に記憶された分類モデル)に適用することにより、予測対象とする患者が転倒転落の危険行動を起こす可能性を予測する。
【0045】
例えば、予測用データ入力部20により電子カルテ内に含まれるm’個の診療記録テキストの文章が予測用データとして入力された場合、危険行動予測部21の指示によりこのm’個の診療記録テキストの文章について類似性指標値算出部100の処理を実行することにより、m’個の文章指標値群を得る。危険行動予測部21は、類似性指標値算出部100により算出されたm’個の文章指標値群を1つずつ分類モデルに入力データとして与えることにより、m’個の文章のそれぞれについて、患者の転倒転落の発生の可能性を予測する。
【0046】
ここで、単語抽出部11は、m個の学習用データから抽出したn個の単語と同じ単語をm’個の予測用データから抽出するのが好ましい。予測用データから抽出されるn個の単語から成る文章指標値群が、学習用データから抽出されたn個の単語から成る文章指標値群と同じ単語を要素とするものとなるので、分類モデル記憶部30に記憶された分類モデルに対する適合度が高くなるからである。ただし、学習時と同じn個の単語を予測時にも抽出することを必須とするものではない。学習時とは異なる単語の組み合わせによって予測用の文章指標値群が生成される場合、分類モデルに対する適合度が低くなるものの、適合度が低いということ自体も評価の一要素として、事象に該当する可能性を予測すること自体は可能だからである。
【0047】
図2は、上記のように構成した本実施形態による危険行動予測装置の動作例を示すフローチャートである。
図2(a)は、分類モデルを生成する学習時の動作例を示し、
図2(b)は、生成された分類モデルを用いて転倒転落の発生の可能性の予測を行う予測時の動作例を示している。
【0048】
図2(a)に示す学習時において、まず、学習用データ入力部10は、転倒転落の危険行動を起こしたか否かについて既知である患者に関する電子カルテに含まれるm個の文章(診療記録テキスト)を学習用データとして入力する(ステップS1)。単語抽出部11は、学習用データ入力部10により入力されたm個の文章を解析し、当該m個の文章からn個の単語を抽出する(ステップS2)。
【0049】
次いで、ベクトル算出部12は、学習用データ入力部10により入力されたm個の文章および単語抽出部11により抽出されたn個の単語から、m個の文章ベクトルd
i→およびn個の単語ベクトルw
j→を算出する(ステップS3)。そして、指標値算出部13は、m個の文章ベクトルd
i→とn個の単語ベクトルw
j→との内積をそれぞれとることにより、m個の文章d
iおよびn個の単語w
j間の関係性を反映したm×n個の類似性指標値(m×n個の類似性指標値を各要素とする指標値行列DW)を算出する(ステップS4)。
【0050】
さらに、分類モデル生成部14は、指標値算出部13により算出されたm×n個の類似性指標値を用いて、1つの文章d
iについてn個の類似性指標値dw
jから成る文章指標値群をもとに、転倒転落が発生する可能性の高さについてm個の文章d
iを2つに分類するための分類モデルを生成し、生成した分類モデルを分類モデル記憶部30に記憶させる(ステップS5)。以上により、学習時の動作が終了する。
【0051】
図2(b)に示す予測時において、まず、予測用データ入力部20は、予測対象とする患者に関する電子カルテに含まれるm’個の文章(診療記録テキスト)を予測用データとして入力する(ステップS11)。危険行動予測部21は、予測用データ入力部20により入力された予測用データを類似性指標値算出部100に供給し、類似性指標値の算出を指示する。
【0052】
この指示に応じて、単語抽出部11は、予測用データ入力部20により入力されたm’個の文章を解析し、当該m’個の文章からn個の単語(学習用データから抽出されたものと同じ単語)を抽出する(ステップS12)。なお、m’個の文章の中にn個の単語が全て含まれているとは限らない。m’個の文章の中に存在しない単語についてはNull値となる。
【0053】
次いで、ベクトル算出部12は、予測用データ入力部20により入力されたm’個の文章および単語抽出部11により抽出されたn個の単語から、m’個の文章ベクトルd
i→およびn個の単語ベクトルw
j→を算出する(ステップS13)。
【0054】
そして、指標値算出部13は、m’個の文章ベクトルd
i→とn個の単語ベクトルw
j→との内積をそれぞれとることにより、m’個の文章d
iおよびn個の単語w
j間の関係性を反映したm’×n個の類似性指標値(m’×n個の類似性指標値を各要素とする指標値行列DW)を算出する(ステップS14)。指標値算出部13は、算出したm’×n個の類似性指標値を危険行動予測部21に供給する。
【0055】
危険行動予測部21は、類似性指標値算出部100から供給されたm’×n個の類似性指標値をもとに、m’個の文章指標値群をそれぞれ分類モデル記憶部30に記憶された分類モデルに適用することにより、m’個の文章のそれぞれについて、予測対象とする患者が転倒転落の危険行動を起こす可能性を予測する(ステップS15)。これにより、予測時の動作が終了する。
【0056】
以上詳しく説明したように、本実施形態では、患者の電子カルテに含まれるm個の文章を学習用データとして入力し、当該入力された文章から算出した文章ベクトルと、文章内に含まれる単語から算出した単語ベクトルとの内積を計算することによって、文章および単語間の関係性を反映した類似性指標値を算出し、この類似性指標値を用いて分類モデルを生成している。これにより、どの単語がどの文章に対してどの程度寄与しているのか、あるいは、どの文章がどの単語に対してどの程度寄与しているのかを表した類似性指標値を用いて分類モデルが生成される。このため、m個の文章とn個の単語との寄与度を加味した上で、電子カルテ内の文章を、転倒転落の発生の可能性の有無という2つの事象のうち何れかに適切に分類することができるようになる。よって、本実施形態によれば、患者が危険行動を起こす可能性の予測を行う装置において、学習によって生成する分類モデルの精度を上げて、危険行動の発生を精度よく予測することができるようになる。
【0057】
なお、上記実施形態では、「転倒転落あり」および「転倒転落なし」の2つの事象のうちどちらに該当するかが既知である文章に関する文章データを学習用データとして用いる教師あり学習を適用した例について説明したが、これに強化学習を組み合わせるようにしてもよい。
図3は、強化学習の仕組みを追加した他の実施形態に係る危険行動予測装置の機能構成例を示すブロック図である。
【0058】
図3に示すように、他の実施形態に係る危険行動予測装置は、
図1に示した構成に加えて実績データ入力部22および報酬決定部23を更に備えている。また、他の実施形態に係る危険行動予測装置は、
図1に示した分類モデル生成部14に代えて分類モデル生成部14’を備えている。
【0059】
実績データ入力部22は、退院患者の電子カルテに含まれている危険行動記録レポートを実績データとして入力する。すなわち、電子カルテには、上述した患者の氏名、生年月日、血液型、性別、診療科、診察日、診療記録テキストのほかに、退院後サマリーの項目が含まれていることがある。この退院後サマリーは、患者の退院後に、入院中における患者の状態を要約として記述するための項目である。この退院後サマリーに、患者が入院中に危険行動を起こしたか否かの記録レポートが記述される。実績データ入力部22は、この退院後サマリーに記述されている危険行動記録レポートの内容、つまり患者が入院中に危険行動を起こしたか否かの情報を実績データとして入力する。
【0060】
なお、実績データ入力部22による実績データの入力方法はこれに限定されない。例えば、患者が入院中に危険行動を起こしたか否かの情報が電子カルテの診療記録テキストに記述される場合もある。よって、実績データ入力部22は、診療記録テキストに記述されている危険行動記録レポートの内容を実績データとして入力するようにしてもよい。
【0061】
具体的には、実績データ入力部22は、退院後サマリーまたは診療記録テキストに記述されている文章を解析することによって、患者が入院中に危険行動を起こしたか否かを判定し、その判定結果を実績データとして入力する。あるいは、退院後サマリーまたは診療記録テキストに記述されている文章を医師や看護師等の医療従事者が目視により確認し、医師や看護師等の医療従事者がキーボードやタッチパネル等の入力デバイスを操作することによって入力した情報を実績データ入力部22が入力することにより、退院患者の入院中における危険行動の発生の有無を実績データとして入力するようにしてもよい。
【0062】
報酬決定部23は、危険行動予測部21により予測された転倒転落の発生の可能性に対し、実績データ入力部22より入力された転倒転落の発生の実績に応じて、分類モデル生成部14’に与える報酬を決定する。例えば、報酬決定部23は、危険行動予測部21により予測された転倒転落の発生の可能性を示す予測データと、実績データ入力部22により入力された実績データとが一致している場合にはプラスの報酬を与えるように決定し、一致していない場合は無報酬またはマイナスの報酬を与えるように決定する。
【0063】
分類モデル生成部14’は、
図1に示した分類モデル生成部14と同様に、学習用データ入力部10により入力された学習用データをもとに、分類モデルを生成し、分類モデル記憶部30に記憶させる。これに加え、分類モデル生成部14’は、報酬決定部23により決定された報酬に応じて、分類モデル記憶部30に記憶された分類モデルを改変する。このように、教師あり学習の仕組みに対して強化学習の仕組みを加えて分類モデルを生成することにより、分類モデルの精度を更に向上させることができる。
【0064】
なお、上記実施形態では、学習および予測に使用する医療情報として電子カルテを用いる例について説明したが、例えば看護記録レポートなど、患者の危険行動の発生の可能性を予測し得る文章が含まれているものであれば、電子カルテ以外の医療情報を用いてもよい。
【0065】
また、上記実施形態では、患者の危険行動として転倒転落の発生の可能性を予測する例について説明したが、本発明はこれに限定されない。すなわち、医師や看護師側ではなく患者側の事情に起因する危険行動の発生を予測することに広く利用することが可能である。
【0066】
また、上記実施形態では、転倒転落が発生する可能性の高さについて文章を2つに分類する例について説明したが、3つ以上のランクに分類するようにしてもよい。
【0067】
また、上記実施形態では、入院中の患者に関する転倒転落の発生を予測することについて説明したが、本発明はこれに限定されない。例えば、外来患者、在宅訪問治療の対象患者、遠隔医療システムを利用している遠隔治療患者など、電子カルテまたはそれに類する医療情報が存在する患者についても、在宅での転倒転落の発生の可能性を予測することが可能である。
【0068】
また、上記実施形態では、病院において患者が危険行動を起こす可能性を予測することについて説明したが、介護施設などにおいて被介護者が危険行動を起こす可能性を予測することも可能である。本明細書および特許請求の範囲では、被介護者も「患者」に含まれる概念であるものとする。
【0069】
その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。