(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-08
(45)【発行日】2023-03-16
(54)【発明の名称】情報処理システム
(51)【国際特許分類】
G06F 40/279 20200101AFI20230309BHJP
【FI】
G06F40/279
(21)【出願番号】P 2018215016
(22)【出願日】2018-11-15
【審査請求日】2020-04-17
【審判番号】
【審判請求日】2022-08-22
(73)【特許権者】
【識別番号】517384914
【氏名又は名称】TXP Medical株式会社
(74)【代理人】
【識別番号】100205084
【氏名又は名称】吉浦 洋一
(72)【発明者】
【氏名】園生 智弘
【合議体】
【審判長】稲葉 和生
【審判官】中野 裕二
【審判官】石井 則之
(56)【参考文献】
【文献】特開2017-142653(JP,A)
【文献】特開2018-41155(JP,A)
【文献】特開2004-86307(JP,A)
【文献】特開2006-59063(JP,A)
【文献】特開2009-93568(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F40/00-40/58
(57)【特許請求の範囲】
【請求項1】
演算装置と表示装置とを備えたコンピュータで機能する情報処理システムであって,
前記演算装置は,
電子カルテの自由入力欄にテキスト情報の自由入力を受け付けるテキスト情報入力受付処理部と,
前記自由入力を受け付けたテキスト情報
から自然言語解析処理を用いて抽出したテキスト情報に基づいて,あらかじめ定められた情報種別ごとに
テーブル形式
の構造化情報とする構造化処理部と,
前記テキスト情報と前記構造化情報とを前記表示装置に表示させる表示処理部と,を有しており,
前記構造化処理部は,
前記自由入力を受け付けたテキスト情報からあらかじめ定めた情報種別を検出することで切り出したテキスト情報について,その情報種別に対応する対象情報を,係り受け解析,文脈解析,またはニューラルネットワークを用いた学習モデルによる機械学習のいずれか一以上の前記自然言語解析処理を用いて抽出し,前記抽出した対象情報をテーブル形式で格納して構造化情報とし,
前記表示処理部は,
前記テキスト情報を前記表示装置における第1の表示領域に表示させ,
前記構造化情報を前記表示装置における第2の表示領域に表示させ,
前記第1の表示領域へのテキスト情報の入力に応じて,前記第2の表示領域に前記構造化情報を表示させる,
ことを特徴とする情報処理システム。
【請求項2】
前記表示処理部は,
前記第2の表示領域の表示の有無が切り替え可能である,
ことを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記表示処理部は,
前記第2の表示領域を表示していない場合であって,前記構造化情報が所定の条件を充足したことが判定された場合に,前記第2の表示領域を表示する,
を有することを特徴とする請求項1または請求項2に記載の情報処理システム。
【請求項4】
前記表示処理部は,
前記自由入力されたテキスト情報のうち構造化情報に反映したテキスト情報について,表示形態を変更して,またはマークを付して前記第1の表示領域に表示する,
ことを特徴とする請求項1から請求項3のいずれかに記載の情報処理システム。
【請求項5】
前記表示処理部は,
前記自由入力されたテキスト情報のうち構造化情報に反映したテキスト情報について表示形態を変更して第1の表示領域に表示し,
前記表示形態を変更したテキスト情報に基づく構造化情報の表示形態を対応させて前記第2の表示領域に表示する,
ことを特徴とする請求項1から請求項4のいずれかに記載の情報処理システム。
【請求項6】
コンピュータを,
電子カルテの自由入力欄にテキスト情報の自由入力を受け付けるテキスト情報入力受付処理部,
前記自由入力を受け付けたテキスト情報
から自然言語解析処理を用いて抽出したテキスト情報に基づいて,あらかじめ定められた情報種別ごとに
テーブル形式
の構造化情報とする構造化処理部,
前記テキスト情報と前記構造化情報とを前記コンピュータの表示装置に表示させる表示処理部,として機能させる情報処理プログラムであって,
前記構造化処理部は,
前記自由入力を受け付けたテキスト情報からあらかじめ定めた情報種別を検出することで切り出したテキスト情報について,その情報種別に対応する対象情報を,係り受け解析,文脈解析,またはニューラルネットワークを用いた学習モデルによる機械学習のいずれか一以上の前記自然言語解析処理を用いて抽出し,前記抽出した対象情報をテーブル形式で格納して構造化情報とし,
前記表示処理部は,
前記テキスト情報を前記表示装置における第1の表示領域に表示させ,
前記構造化情報を前記表示装置における第2の表示領域に表示させ,
前記第1の表示領域へのテキスト情報の入力に応じて,前記第2の表示領域に前記構造化情報を表示させる,
ことを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は,自由入力されるテキスト情報を構造化する情報処理システムに関する。
【背景技術】
【0002】
自由入力されるテキスト情報に対して解析を行う場合,自然言語解析処理を実行するなどによりテキスト情報を構造化することが考えられる。
【0003】
たとえばテキスト情報を入力するシステムとして,医師が患者を診察した場合に入力する電子カルテや,看護師による看護記録などがある。これらのシステム(医療情報システム)では,主に,保険請求に関する情報(保険病名,保険請求のための処方・処置や検査所見,入退院履歴や受診歴など)と,患者に対する診療や看護の記録である医療情報記録とから構成されている。前者の保険請求に関する情報は画一的であるので,主にプルダウンメニューなどによる選択や,マスタからの選択などによって行われることが多く,情報は十分に構造化されている。
【0004】
一方,患者を診療,看護した際の記録である医療情報記録の多くは,テキスト情報として,たとえば電子カルテの自由記載部分に入力される。医療情報記録として自由入力されるテキスト情報は,たとえば症状や主訴,現病歴(なぜ受診に至ったか),既往歴・家族歴・内服歴・アレルギー歴,身体所見・バイタルサイン,検査所見の解釈,来院後の経過などがある。これらはいずれも,臨床上および医学研究上,非常に重要な情報である。
【0005】
すなわち,現在の医療情報システムにおいては,保険請求に関する情報は十分に構造化されているものの,臨床上および医学研究上,重要な情報については,テキスト情報として自由入力されているだけであって,構造化がされていない。
【0006】
非特許文献1および非特許文献2に従来の電子カルテシステムの一例を示す。
【先行技術文献】
【非特許文献】
【0007】
【文献】株式会社島津製作所,”統合型電子カルテシステム「SimCLINIC T3」のご紹介”,[online],インターネット<URL:http://www.med.shimadzu.co.jp/application/info/09.html>
【文献】富士通株式会社,”中堅病院様向け電子カルテシステム FUJITSU ヘルスケアソリューション HOPE EGMAIN-LX",[online],インターネット<URL:http://www.fujitsu.com/jp/solutions/industry/healthcare/products/egmainlx/>
【発明の概要】
【発明が解決しようとする課題】
【0008】
日本においては保険診療をすることが一般的となっている。保険診療では,実施処置や実施処方に対応する保険病名を記録しておき,実施処置や実施処方,保険病名とに基づいて診療報酬請求が行われる。この診療報酬請求は,電子カルテにおける「オーダリング」の情報(保険請求に関する情報)をもとに行われる。そのため,電子カルテの「オーダリング」の情報において,保険病名を記録することを目的とした入力欄が存在しており,医師は,そこに保険病名を必ず記録することとなる。その結果として,電子カルテ上に,確実に記録が残る患者の病名はこの保険病名となる。
【0009】
ところが,この保険病名は,「患者の病状を正確に反映した病名(臨床病名)」(医師が患者の病状に対して最適と想起して診療録記載において含めた病名)とはかけ離れていることも多い。
【0010】
たとえば,医師が外来患者に鎮痛薬を処方した場合,実際の患者の病名(臨床病名)にかかわらず,保険診療の対象とするため,保険病名としてすべて「腰痛症」が記録されていたり,心電図検査を行った患者のすべてに,臨床病名にかかわらず,保険病名として「不整脈」が記録されていたりする現象が生じている。
【0011】
また,経過が長い患者の場合,その都度の処置や検査に対応した保険病名が電子カルテに記載されるため,保険病名が100病名を超えることもある。そのため,電子カルテに記載された保険病名のリストを見ただけでは,どれが患者の実際の病名である臨床病名であるのか,すぐに判別することは容易ではない。
【0012】
このような実態があることから,医療情報システムにおいては,上述のように保険請求に関する情報として,保険病名,保険請求のための処方・処置や検査所見などが構造化して記録されているものの,保険請求に関する構造化された情報を参照したとしても,医学研究や,医療従事者の実際の臨床業務の観点からは,ほとんど役に立たない。
【0013】
医学研究や実際の臨床業務の観点から重要な情報は,医療情報システムでは,自由入力されるテキスト情報である医療情報記録に記載されている。そこで,医学研究や実際の臨床業務の観点から,情報の検索や,統計的な情報処理などのため,自由入力されたテキスト情報がデータベースとして使用可能なように構造化して管理されていることが好ましい。
【0014】
しかし,従来の医療情報システムでは,電子カルテや看護記録の自由入力欄に,テキストが自由入力されているだけなので,入力されたテキスト情報の検索や情報処理には不向きである。
【0015】
そこで,自由入力されたテキスト情報を医学研究や臨床業務の対象として用いる場合には,従来は,研究ごとにフォーマットを用意して,たとえば「ある薬を内服している人,いない人」,「特定の疾患既往のある人」という個別の情報を,カルテ(電子カルテを含む)や看護記録などを読み返して内容を確認し,オンラインのフォーマットに転記する方法が用いられている。
【0016】
このような作業は,従来は,医学研究実施あるいは全国レジストリの構築という目的のためにリサーチアシスタントを雇用したり,若手医師が臨床業務外で作業を行うという方法で対応していた。しかしながら,リサーチアシスタントの雇用や若手医師を臨床業務外に活用することができる医療機関は限られており,また特定の研究テーマに限定した診療に関するテキスト情報の構造化しか行うことができない。さらに若手医師がこのような作業を行うのは大きな負担にもなる。
【0017】
このような課題については,電子カルテや看護記録のような医療情報システムに限定されたものではなく,テキスト入力された情報を構造化する要望があるすべてのコンピュータシステムで求められているものである。
【0018】
そこで,入力方法はそのままに,人工知能(AI)などを用いることで自然言語解析処理の技術を向上させることが一つの方法としてある。
【0019】
しかし,人間が入力するテキスト情報を自動的に構造化するには,言語の複雑さなどからまだまだ精度が高いとまでは言い切れない。とくに,入力されたテキスト情報で正確に文法が使用されていない場合には,その解析精度は著しく低下する。きわめて多忙かつ迅速な対応が求められる場合もある臨床現場では,電子カルテの自由入力欄には,正確な文法を用いて入力をするのではなく,とりあえず入力をしておく,といったことも多い。また,時間的余裕がある場合であっても,電子カルテにおける自由入力欄は,医師がメモ書き程度に記載していることもあるので,自らが理解可能な程度にしか記載しておらず,第三者が理解可能な程度の記載をしていない場合も多い。
【0020】
たとえば電子カルテの自由入力欄において,
図13に示すようなテキスト情報の入力が行われ,既往歴名とそれに関連する情報とを対応づけて構造化することを試みる場合,自然言語解析処理の技術を向上させても,構造化することは容易ではない。
【0021】
このように自由入力されたテキスト情報に対する解析を行う場合,自然言語解析処理の技術がいかに向上したとしても,入力されたテキスト情報を精度よく構造化することは容易ではない。
【課題を解決するための手段】
【0022】
本発明者は上記課題に鑑み,自由入力可能なテキスト入力を行う者に,テキスト情報の構造化を意識させながらその入力を行わせる情報処理システムを発明した。
【0023】
第1の発明は、演算装置と表示装置とを備えたコンピュータで機能する情報処理システムであって,前記演算装置は,電子カルテの自由入力欄にテキスト情報の自由入力を受け付けるテキスト情報入力受付処理部と,前記自由入力を受け付けたテキスト情報から自然言語解析処理を用いて抽出したテキスト情報に基づいて,あらかじめ定められた情報種別ごとにテーブル形式の構造化情報とする構造化処理部と,前記テキスト情報と前記構造化情報とを前記表示装置に表示させる表示処理部と,を有しており,前記構造化処理部は,前記自由入力を受け付けたテキスト情報からあらかじめ定めた情報種別を検出することで切り出したテキスト情報について,その情報種別に対応する対象情報を,係り受け解析,文脈解析,またはニューラルネットワークを用いた学習モデルによる機械学習のいずれか一以上の前記自然言語解析処理を用いて抽出し,前記抽出した対象情報をテーブル形式で格納して構造化情報とし,前記表示処理部は,前記テキスト情報を前記表示装置における第1の表示領域に表示させ,前記構造化情報を前記表示装置における第2の表示領域に表示させ,前記第1の表示領域へのテキスト情報の入力に応じて,前記第2の表示領域に前記構造化情報を表示させる,情報処理システムである。
【0024】
本発明を用いることによって,テキスト情報の入力をする者は,それがどのように構造化情報として表示されているのかを視認しながらテキスト情報を入力することとなる。そのため,不自然な構造化情報が表示された場合には,それを認識でき,修正することができる。そして入力を行う際に,どのようにテキスト情報の入力を行えば構造化情報が適切に表示されるのかを,マニュアルなどを読まずとも,経験値として習得できるので,最初から,構造化しやすいテキスト情報の入力を心がけるようになる。その結果,入力者の入力が,自然と,それに構造化しやすい入力となるので,自然言語解析処理の技術が高くなくても,適切に構造化情報を得ることができる。
自由入力されたテキスト情報と,それに基づく構造化情報とは,異なる表示領域に表示することで,その視認性を向上させることができる。
【0025】
たとえば本発明者が所属する医療機関において,電子カルテの自由入力欄におけるテキスト情報の構造化を試みたところ,従来は,入力者によってさまざまな方法でテキスト情報が入力されていたので,その構造化の精度は高くなかった。しかし,本発明を用いたところ,医師による電子カルテの自由入力欄へのテキスト情報の入力自体が改善され,100%に近い精度の構造化情報を得られることとなった。
【0028】
上述の発明において,前記表示処理部は,前記第2の表示領域の表示の有無が切り替え可能である,情報処理システムのように構成することができる。
【0029】
第2の表示領域は,テキスト情報を自由入力する入力者に対して,入力したテキスト情報の構造化を意識しやすくするために表示するものである。そのため,入力者が習熟して,自然と構造化しやすいテキスト情報の入力を行った場合にまでも,表示させることは,煩わしい場合もあるし,第1の表示領域などの表示の範囲が狭められてしまう。そこで,第2の表示領域は表示の有無が切り替え可能であることが好ましい。
【0030】
上述の発明において,前記表示処理部は,前記第2の表示領域を表示していない場合であって,前記構造化情報が所定の条件を充足したことが判定された場合に,前記第2の表示領域を表示する,を有する情報処理システムのように構成することができる。
【0031】
テキスト情報の入力をする者が習熟してくれば,構造化しやすいテキスト情報の入力を行うようになるので,第2の表示領域を表示しなくてもその目的は達成する。しかし,何らかの事情,たとえば期間が空いたあとにテキスト情報の入力をする,習熟していない人が新たに入力をするような場合には,必ずしも構造化しやすいテキスト情報の入力が行えるとは限らない。その場合,構造化が適切に行えない可能性がある。そこで,構造化情報に誤判定の可能性があるなど所定の条件を充足した場合には,第2の表示領域を自動的に再度表示させることで,構造化しやすいテキスト情報の入力への意識づけを再度,行わせることができる。
【0032】
上述の発明において,前記表示処理部は,前記自由入力されたテキスト情報のうち構造化情報に反映したテキスト情報について,表示形態を変更して,またはマークを付して前記第1の表示領域に表示する,情報処理システムのように構成することができる。
【0034】
上述の発明において,前記表示処理部は,前記自由入力されたテキスト情報のうち構造化情報に反映したテキスト情報について表示形態を変更して第1の表示領域に表示し,前記表示形態を変更したテキスト情報に基づく構造化情報の表示形態を対応させて前記第2の表示領域に表示する,情報処理システムのように構成することができる。
【0035】
自由入力したテキスト情報のうち,どこが構造化情報として反映されたかを入力者が視認できるようになる。そのため,入力者が構造化を意識してテキスト情報を入力する際に,どこに注意をすればよいのかを意識しやすくなり,入力者の意識づけをさらに促すことができる。とくに,第1の表示領域のテキスト情報と,第2の表示領域の構造化情報との表示形態を対応づけることで,対応づけの視認性が向上する。
【0036】
第1の発明は,本発明のプログラムをコンピュータに読み込ませて実行することで実現することができる。すなわち,コンピュータを,電子カルテの自由入力欄にテキスト情報の自由入力を受け付けるテキスト情報入力受付処理部,前記自由入力を受け付けたテキスト情報から自然言語解析処理を用いて抽出したテキスト情報に基づいて,あらかじめ定められた情報種別ごとにテーブル形式の構造化情報とする構造化処理部,前記テキスト情報と前記構造化情報とを前記コンピュータの表示装置に表示させる表示処理部,として機能させる情報処理プログラムであって,前記構造化処理部は,前記自由入力を受け付けたテキスト情報からあらかじめ定めた情報種別を検出することで切り出したテキスト情報について,その情報種別に対応する対象情報を,係り受け解析,文脈解析,またはニューラルネットワークを用いた学習モデルによる機械学習のいずれか一以上の前記自然言語解析処理を用いて抽出し,前記抽出した対象情報をテーブル形式で格納して構造化情報とし,前記表示処理部は,前記テキスト情報を前記表示装置における第1の表示領域に表示させ,前記構造化情報を前記表示装置における第2の表示領域に表示させ,前記第1の表示領域へのテキスト情報の入力に応じて,前記第2の表示領域に前記構造化情報を表示させる,情報処理プログラムである。
【発明の効果】
【0037】
本発明の情報処理システムを用いることで,自由入力可能なテキスト入力を行う者は,テキスト情報を入力する際に,その構造化がどのように行われているのかを認識しながら行うこととなる。そのため,テキスト情報の構造化の意識づけが行われるので,自動的にテキスト情報の入力をする場合に,構造化を意識した入力を心がけるようになる。その結果,自由入力されたテキスト情報自体が,構造化に適した入力となり,構造化の精度を向上させることができる。
【図面の簡単な説明】
【0038】
【
図1】本発明の情報処理システムの全体の処理機能の一例を模式的に示すブロック図である。
【
図2】本発明の情報処理システムが機能するコンピュータのハードウェア構成の一例を模式的に示す概念図である。
【
図3】電子カルテの自由入力欄に入力されたテキスト情報と,それに対する構造化処理の結果,得られた構造化情報の一例を示す図である。
【
図4】病名についての表記揺らぎ辞書の一例を示す図である。
【
図5】薬剤名についての表記揺らぎ辞書の一例を示す図である。
【
図6】第1の表示領域と,第2の表示領域との表示の関係の一例を示す図である。
【
図8】本発明の情報処理システムの処理プロセスの一例を示すフローチャートである。
【
図9】本発明を用いて入力者が構造化しやすいテキスト情報の入力がされた場合のテキスト情報の一例と,本発明によって構造化処理がされた構造化情報の一例を示す図である。
【
図10】実施例2における情報処理システムの全体の処理機能の一例を示すブロック図である。
【
図11】第1の表示領域に表示するテキスト情報のうち構造化情報に反映したテキスト情報について,文字色,太さ,フォントなどの表示形態を変更する場合の一例を示す図である。
【
図12】第1の表示領域に表示するテキスト情報のうち構造化情報に反映したテキスト情報と,それに対応する構造化情報との表示形態を対応させて変更する場合の一例を示す図である。
【
図13】電子カルテの自由入力欄に従来通りにテキスト情報が入力された場合の一例を示す図である。
【発明を実施するための形態】
【0039】
本発明の情報処理システム1の全体の処理機能の一例を
図1のブロック図に示す。また本発明の情報処理システム1を実現するコンピュータのハードウェア構成の一例を
図2に示す。
【0040】
情報処理システム1は,本発明の処理を実行するコンピュータである。情報処理システム1で用いるコンピュータは,プログラムの演算処理を実行するCPUなどの演算装置70と,情報を記憶するRAMやハードディスクなどの記憶装置71と,ディスプレイ(画面)などの表示装置72と,キーボードやポインティングデバイス(マウスやテンキーなど)などの入力装置73と,演算装置70の処理結果や記憶装置71に記憶する情報をインターネットやLANなどのネットワークを介して送受信する通信装置74とを有している。コンピュータ上で実現する各機能(各手段)は,その処理を実行する手段(プログラムやモジュールなど)が演算装置70に読み込まれることでその処理が実行される。各機能は,記憶装置71に記憶した情報をその処理において使用する場合には,該当する情報を当該記憶装置71から読み出し,読み出した情報を適宜,演算装置70における処理に用いる。また,
図1の情報処理システム1は一台のコンピュータで実現される場合を示したが,複数のコンピュータに,その機能が分散配置されていてもよい。コンピュータには,サーバやパーソナルコンピュータ,ワークステーションなど各種の情報処理装置が含まれる。また,いわゆるクラウド形式であってもよい。たとえば入力者がテキスト情報の入力に用いるコンピュータと,入力されたテキスト情報を受け付けて本発明における各処理を実行するコンピュータとが分かれていてもよい。
【0041】
コンピュータがタッチパネルディスプレイを備えている場合には,表示装置72と入力装置73とが一体的に構成されていてもよい。タッチパネルディスプレイは,たとえばタブレット型コンピュータやスマートフォンなどの可搬型通信端末などで利用されることが多いが,それに限定するものではない。タッチパネルディスプレイは,そのディスプレイ上で,直接,所定の入力デバイス(タッチパネル用のペンなど)や指などによって入力を行える点で,表示装置72と入力装置73の機能が一体化した装置である。
【0042】
またコンピュータは音声入力が可能であってもよい。この場合,入力者が発話した音声を所定のマイク(集音装置)で集音し,テキスト情報に変換して対応箇所にテキスト入力を行う。
【0043】
本発明における各手段は,その機能が論理的に区別されているのみであって,物理上あるいは事実上は同一の領域を為していてもよい。また,本発明で説明する処理は一例に過ぎず,その処理プロセスを適宜,変更することが可能である。
【0044】
情報処理システム1は,テキスト情報入力受付処理部11とテキスト情報記憶部12と構造化処理部13と照合辞書記憶部14と表示処理部15と構造化情報記憶部16とを有する。
【0045】
テキスト情報入力受付処理部11は,テキスト情報の入力を行う者が自由入力をしたテキスト情報を受け付け,テキスト情報記憶部12に記憶させる。たとえば情報処理システム1が医療情報システムである場合,電子カルテの自由入力欄に記載したテキスト情報の入力を受け付ける。自由入力とは,プルダウンによる情報の選択や,あらかじめ入力する情報の種別が定められた入力フィールドに対するテキスト入力ではなく,入力者が自由にテキスト情報の入力をすることを意味する。
【0046】
テキスト情報記憶部12は,テキスト情報入力受付処理部11で入力を受け付けたテキスト情報を記憶する。たとえば情報処理システム1が医療情報システムである場合,電子カルテの自由入力欄に記載したテキスト情報などの医療情報記録を記憶する。なお,医療情報記録にかかわらず,保険請求に関する情報を記憶していてもよい。
【0047】
構造化処理部13は,テキスト情報入力受付処理部11で受け付けたテキスト情報の入力を監視し,係り受け解析,文脈解析などの自然言語解析処理や,後述する照合辞書記憶部14を参照して,自由入力されたテキスト情報を構造化し,構造化情報として構造化情報記憶部16に記憶させる。構造化処理部13におけるテキスト情報の構造化処理にはさまざまな技術を用いることができる。この際に,後述する照合辞書記憶部14を参照して,表記揺らぎ処理を実行してもよい。表記揺らぎ処理とは,同一の事象に対して複数の表記がある場合,それを標準的な表記に統一する処理である。また,自然言語解析処理にもちいるコンピュータシステムとしては,たとえばマイクロソフト社が提供するMircosoft AzureのLUIS(Language Understanding)を用いることができる。
【0048】
テキスト情報の構造化とは,自由入力されたテキスト情報に基づいて,あらかじめ定められた情報種別ごとにその内容を標準化された形にすることである。たとえばテーブル形式で保持される。テキスト情報を構造化する一つの処理としては,次のような処理がある。自由入力されたテキスト情報に基づいて,文,文節,段落などの所定のテキスト情報の単位に付与されたタグを照合辞書記憶部14を参照したり,文脈解析などの自然言語解析処理を用いて,標準化タグ付きのテキスト情報(情報種別ごとのテキスト情報の分類)に分割をする。そして,それぞれの情報種別では抽出すべき対象情報は定められているので,それぞれの情報種別のテキスト情報において,自然言語解析処理を用いて,あらかじめ定められた抽出すべき対象情報を抽出し,構造化情報として標準化したテーブルに格納する。
【0049】
本発明の情報処理システム1を医療情報システムに用いる場合には,情報種別として「現病歴」,「既往歴」,「内服薬」,「身体所見」,「来院後経過」などがあり,それらに対応する対象情報としては,情報種別「現病歴」には「症状」,情報種別「既往歴」には既往歴としての「病名」,情報種別「内服薬」には「薬剤名」,情報種別「来院後経過」には診断名としての「病名」などがある。また対象情報としては症状や病名に対する陽性陰性表現や付加情報(備考欄)なども含まれる。情報種別ごとにテーブルが生成され,このテーブルには,対象情報が格納される。たとえば情報種別「現病歴」のテーブルには,「症状」とそれに対する陽性陰性表現が対応づけて格納される。どのような情報種別を設けるか,その情報種別に対して対象情報をどのように設定するかは,本発明の情報処理システムをどのような分野で用いるかで任意に設定することができるが,一般的な医師,看護師の記録ではある程度統一された情報種別セットが存在する。
【0050】
構造化処理部13は,入力を受け付けたテキスト情報において,照合辞書記憶部14のタグパターンの辞書に記憶する情報種別を示すタグを参照したり,入力されたテキスト情報に対する文脈解析などの自然言語解析処理によって情報種別があることを検出すると,その情報種別に対応するテーブル,たとえば情報種別「現病歴」のテーブル,情報種別「既往歴」のテーブル,情報種別「内服薬」のテーブル,情報種別「身体所見」のテーブル,情報種別「来院後経過」のテーブルがすでに生成されているか否かを判定する。そして,検出した情報種別に対応するテーブルが生成されていない場合には,そのテーブルを生成する。また情報種別のテキスト情報ごとに自然言語解析処理を用いて対象情報を抽出し,生成した情報種別のテーブルに対象情報を振り分けて格納する。一方,検出した情報種別に対応するテーブルがすでにある場合には,情報種別のテキスト情報ごとに自然言語解析処理を用いて対象情報を抽出し,検出した情報種別に対応するテーブルに,抽出した対象情報を振り分けて格納する。情報種別に対応するテーブルの有無は,情報種別とテーブルとの対応関係をあらかじめ設定しておき,その対応関係に基づいて,テーブルが生成されているか否かを判定することができる。
【0051】
検出した対象情報について,後述する照合辞書記憶部14を参照し,その対象情報が症状名,病名,薬剤名を示す表現の有無を判定し,これらのいずれかである場合には,照合辞書記憶部14で一致する文字列を特定し,検出した対象情報を,照合辞書記憶部14であらかじめ定めた標準的な表記や標準的なコードを追加または変更し,その表記を統一する処理を実行してもよい。
【0052】
たとえば情報種別「現病歴」のテキスト情報に対して自然言語解析処理技術を用いて対象情報として「頭が痛い」を検出した場合,照合辞書記憶部14を参照し,標準的な症状名として「頭痛」に変更するとともに,その陽性陰性表現として「+」であることを判定し,情報種別「現病歴」のテーブルに「頭痛」,「+」を対応づけて格納する。同様に,情報種別「内服薬」のテキスト情報に対して自然言語解析処理技術を用いて対象情報として「アスピリン」,「スタチン」を検出した場合,照合辞書記憶部14を参照し,標準的な薬剤名として「バイアスピリン」,「スタチン」とし,またそれらのコード(薬効分類コード)を追加して,情報種別「内服薬」のテーブルに対応づけて格納する。
【0053】
構造化処理部13は,上述のように入力されたテキスト情報から抽出した各情報種別における対象情報を標準的な表記に変更し,またコードを追加して,それぞれの情報種別のテーブルに振り分けて格納する。
【0054】
たとえば電子カルテの自由入力欄に,
図3(a)のようにテキスト情報が入力された場合には,構造化処理部13は,情報種別を示すタグとして「S:」で情報種別「現病歴」を,「内服:」で情報種別「内服薬」を,「O:」で情報種別「身体所見」を,「A/P:」で情報種別「来院後経過」を検出する。また,「心筋梗塞でカテーテル治療後。」のテキスト情報に対する文脈解析により,情報種別「既往歴」を検出する。そして検出した情報種別から次の情報種別までの間のテキスト情報を,最初に検出した情報種別のテキスト情報として切り出す(物理的に切り出すほか,処理対象として特定する場合も含む)。すなわち,「S:」の検出によって情報種別「現病歴」を検出し,「心筋梗塞でカテーテル治療後。」のテキスト情報に対する文脈解析により,情報種別「既往歴」を検出する。そして,情報種別「現病歴」と情報種別「既往歴」との間にあるテキスト情報を,情報種別「現病歴」に対応するテキスト情報として分割をする。情報種別ごとにテキスト情報を切り出した状態を模式的に示すのが
図3(b)である。
【0055】
分割した情報種別「現病歴」に対応するテキスト情報から自然言語解析処理を用いて,対象情報を抽出する。対象情報は情報種別ごとに対応づけられているので,たとえば情報種別「現病歴」における対象情報「症状」とその陽性陰性表現を抽出する。そして,抽出した「症状」に陽性陰性表現を対応づけてテーブルに格納する。
【0056】
このように分割した情報種別ごとに対象情報を振り分けて,構造化情報としてテーブルに格納することで,
図3(c)のように情報種別ごとのテーブルができる。
【0057】
構造化処理部13における処理は,上述の処理に限定されるのではなく,さまざまな自然言語解析処理によって実現できる。たとえば,中間層が多数の層からなるニューラルネットワークの各層のニューロン間の重み付け係数が最適化された学習モデルを参照して機械学習を実行する深層学習(ディープラーニング)による自然言語解析処理を用いてもよい。また深層学習や機械学習を用いたAI(人工知能)あるいはそれらを用いないAIにより自然言語解析処理を実行してもよい。
【0058】
照合辞書記憶部14は,症状名,病名,薬剤名などの表記の揺らぎを判定するための表記揺らぎ辞書,否定表現や曖昧表現などのパターンテーブルの辞書,入力されるテキスト情報の種別(たとえば医療情報記録)に応じた,頻出する略語や特異的なタグパターンの辞書(たとえば「主訴:」,「A/P」など)などを記憶する。
【0059】
症状名,病名,薬剤名についての表記揺らぎ辞書としては,たとえば症状名,病名,薬剤名に対する標準表記,コード,表記パターンを記憶する。
図4では,病名についての表記揺らぎ辞書の一例を示しており,標準病名,ICDコード(国際標準コード),病名変換コード(国内汎用カルテコード),表記パターンを対応づけて記憶している場合を示している。また,
図5では,薬剤名についての表記揺らぎ辞書の一例を示しており,標準薬剤名,一般名,薬効分類コード,表記パターンを対応づけて記憶している場合を示している。
【0060】
照合辞書記憶部14は,上記に限定するものではなく,テキスト情報に基づいて構造化処理を実行するために必要な辞書を適宜備えればよい。
【0061】
表示処理部15は,テキスト情報入力受付処理部11で入力を受け付けたテキスト情報と,そのテキスト情報に対応する構造化情報を表示する。具体的には自由入力を受け付ける領域(第1の表示領域101)と,第1の表示領域101に入力されたテキスト情報に対する構造化処理の結果,生成された構造化情報を表示する表示領域(第2の表示領域102)とを表示する。そして第1の表示領域101には自由入力されたテキスト情報を,第2の表示領域102にはテキスト情報に基づく構造化情報を表示する。
【0062】
たとえば,情報処理システム1が医療情報システムである場合,電子カルテの自由入力欄が第1の表示領域101であり,その領域に入力されたテキスト情報に基づく構造化情報の表示領域が第2の表示領域102となる。第1の表示領域101にテキスト情報が入力されると,それを構造化処理部13が監視し,自然言語解析処理を実行することで構造化処理を実行して,第2の表示領域102に逐次,構造化情報を表示する。すなわち,第1の表示領域101に入力されたテキスト情報をテキスト情報入力受付処理部11で受け付け,その入力に対する監視を構造化処理部13が行い,入力されたテキスト情報に基づいて所定の条件を充足していることを判定した場合には,その条件に応じてテーブルを生成する。そして生成したテーブルおよびそこに格納された情報を第2の表示領域102に表示させる。
【0063】
第1の表示領域101と第2の表示領域102とは,異なる表示領域であることが好ましいが,同一の表示領域上に,それぞれを表示してもよい。自由入力されたテキスト情報と,それに対応した構造化情報とを同時に表示していることが好ましい。第2の表示領域102には,標準症状名とその有無を示す構造化情報103aと,標準化既往歴名とそれに対応する情報(備考)を示す構造化情報103bと,標準化情報役名とそれに対応する薬効分類コードを示す構造化情報103cと,標準化診断名とそれに対応する情報(備考)を示す構造化情報103dとが表示されている。
【0064】
表示処理部15は,第1の表示領域101に対するテキスト情報の入力に応じて,逐次,構造化処理部13における構造化処理の結果の構造化情報を第2の表示領域102に表示させることが好ましいが,テキスト情報記憶部12に記憶されたテキスト情報を抽出して第1の表示領域101に表示させ,抽出したテキスト情報に対して,所定のタイミングで構造化処理部13における構造化処理を実行し,構造化情報を第2の表示領域102に表示させるようにしてもよい。
【0065】
なお,表示処理部15は,第1の表示領域101に表示されるテキスト情報に基づく構造化情報を第2の表示領域102に表示するが,構造化処理の際に切り出される情報種別ごとのテキスト情報の一部または全部を,さらに第1の表示領域101,第2の表示領域102,またはほかの表示領域(図示せず)に表示させるようにしてもよい。すなわち,
図3(b)におけるテキスト情報を表示させるようにしてもよい。
【0066】
構造化情報記憶部16は,構造化処理部13で構造化されたテキスト情報のテーブル(構造化情報)を記憶する。たとえばデータベースであってもよいし,それ以外の記憶形式であってもよい。
図7に構造化情報記憶部16の一例を示す。
図7(a)は標準症状名とその有無を示す構造化情報であり,
図7(b)は標準化既往歴名とそれに対応する情報(備考)を示す構造化情報であり,
図7(c)は標準化情報役名とそれに対応する薬効分類コードを示す構造化情報であり,
図7(d)は標準化診断名とそれに対応する情報(備考)を示す構造化情報である。
【実施例1】
【0067】
つぎに本発明の情報処理システム1の処理プロセスの一例を
図8のフローチャートを用いて説明する。なお,以下の説明では情報処理システム1が医療情報システムであって,その電子カルテに診療内容の情報(医療情報記録)が入力される場合を示す。情報処理システム1は,テキスト情報を自由入力可能なコンピュータシステムであれば,医療情報システム以外のコンピュータシステムであってもよい。
【0068】
救急車などで病院などの医療機関に搬送されてきた患者は,医師が診療をする。診療をする際に,医師は患者またはその付添人などから,患者の氏名などの属性情報のほか,現在の症状,既往歴,日常から服用している内服薬などの情報を聴取し,電子カルテの自由入力欄にテキスト入力をする(S100)。また,医師が患者に対して施した処置や投薬の情報,診断した病名などの診療内容の情報も医師は電子カルテに入力をする。電子カルテの自由入力欄にテキスト入力された情報は,テキスト情報入力受付処理部11で受け付け,テキスト情報記憶部12に記憶される。そして,表示処理部15が,医療情報システムの第1の表示領域101に逐次,表示させる。
【0069】
また,それと並行して,構造化処理部13は入力されたテキスト情報を監視しており(S110),構造化処理を実行する(S120)。
【0070】
具体的には,構造化処理部13は,入力を受け付けたテキスト情報において,照合辞書記憶部14のタグパターンの辞書に記憶する情報種別を示すタグを参照したり,入力されたテキスト情報に対する文脈解析などの自然言語解析処理技術によって情報種別があることを検出すると,その情報種別に対応するテーブルがすでに生成されているか否かを判定する。そして,検出した情報種別に対応するテーブルが生成されていない場合には,そのテーブルを生成する。
【0071】
そして情報種別ごとにテキスト情報を切り出し,それぞれの情報種別のテキスト情報において,自然言語解析処理を用いて対象情報を抽出し,生成した情報種別のテーブルに対象情報を振り分けて格納する。
【0072】
一方,検出した情報種別に対応するテーブルがすでにある場合には,情報種別ごとに切り出したテキスト情報において,自然言語解析処理を用いて対象情報を抽出し,検出した情報種別に対応するテーブルに,抽出した対象情報を振り分けて格納する。
【0073】
なお,対象情報をテーブルに格納する前に,照合辞書記憶部14を参照し,症状名,病名,薬剤名などで一致する文字列があるかを判定し,もし一致する文字列がある場合には,検出した対象情報を標準的な表記やコードに変更し,または検出した対象情報に追加する。
【0074】
以上のような処理を実行することで,自由入力欄に入力されたテキスト情報を,逐次,構造化情報にすることができる。
【0075】
そして,表示処理部15は,テキスト情報入力受付処理部11で入力を受け付けたテキスト情報を第1の表示領域101に表示し,また,上述の構造化処理部13で構造化処理を実行した構造化情報を第2の表示領域102に表示させる(S130)。この一例が
図6である。
【0076】
以上のような処理を実行することで,テキスト情報の入力をする者は,それがどのように構造化情報として表示されているのかを視認しながらテキスト情報を入力することができ,それを繰り返すことで,自然と構造化がしやすいテキスト情報の入力を心がけるようになる。そのため,従来は,
図13のようにテキスト情報の入力をしていたが,同じ内容であっても,
図9のように構造化しやすいテキスト情報の入力を自然と心がけるようになる。
【実施例2】
【0077】
上述の実施例では,表示処理部15は第1の表示領域101と第2の表示領域102を表示していたが,テキスト情報の入力を行う者の操作によって,第2の表示領域102を表示するか否かを切り替え可能としていてもよい。
【0078】
また,情報処理システム1において,構造化処理した構造化情報の監視を行う構造化情報判定処理部17を備えていてもよい。この場合の情報処理システム1の全体の処理機能の一例を
図10のブロック図に示す。
【0079】
構造化情報判定処理部17は,構造化情報記憶部16に記憶した構造化情報に誤判定があるかを判定する。たとえば,構造化情報における対象情報が,所定の文字数以上または所定の文字数より少ない文字列である,情報種別に関連していない情報であるなどを判定し,構造化情報の誤判定の可能性があると判定した場合には,所定の制御処理を実行する。
【0080】
情報種別に関連している情報であるか否かは,たとえば第1の表示領域101に入力されたテキスト情報(テキスト情報記憶部12に記憶したテキスト情報)を参照し,当該情報種別のテキスト情報として切り出した情報に含まれているかで判定する方法がある。また,情報種別とそれに対応する重要情報とを検索エンジンで検索して検索結果が存在するか,情報種別とその関連語をあらかじめ所定の辞書情報に対応づけて記憶しておき,重要情報の一部または全部にその関連語が含まれているか,などの方法により判定することができる。情報種別に関連している情報であるかを判定するには,ほかの方法を用いることもできる。
【0081】
構造化情報判定処理部17は,とくに,第2の表示領域102が表示されていない場合に実行することが好ましい。この場合,所定の制御処理として,表示処理部15に第2の表示領域102を表示させたり,所定の警告メッセージを表示する,などがある。
【実施例3】
【0082】
上述の実施例において,さらに,表示処理部15は,自由入力されたテキスト情報と,それに基づいて構造化した構造化情報との対応関係を表示可能としてもよい。すなわち,第1の表示領域101に表示するテキスト情報のうち構造化情報に反映したテキスト情報について,文字色,太さ,フォント,装飾などの表示形態を変更する,マークを付するなどしてもよい。この場合の表示の一例を
図11に示す。
図11では,「頭が痛い」,「鼻水」,「喉も痛い」,「熱MAX38度」,「下痢嘔吐はなく」に基づいて標準症状名とその有無を示す構造化情報(テーブル)が生成されており,「心筋梗塞でカテーテル治療後」に基づいて標準化既往歴名とそれに対応する情報(備考)を示す構造化情報(テーブル)が生成されており,「内服:アスピリン、コレステロールの薬(スタチン)」に基づいて標準化常用薬名と薬効分類コードを示す構造化情報(テーブル)が生成されており,「風邪?」に基づいて標準化診断名とそれに対応する情報(テーブル)が生成されている。そのため,これらの各テキスト情報について,表示形態を変更している。なお,
図11ではテキスト情報の太字と下線を付している。
【0083】
また,テキスト情報の表示形態を変更した場合には,第2の表示領域102に表示する構造化情報の各テーブルに格納された情報も,対応する色,太さ,フォント,装飾などの表示形態で表示することで,自由入力されたテキスト情報と,それに基づいて構造化した構造化情報との対応関係の把握を容易としてもよい。この場合の表示の一例を
図12に示す。なお,
図12では,説明の便宜上,各テキスト情報とテーブルとが同一の表示形態となっているが,テーブルと,それに対応するテキスト情報との表示形態は,テーブルごとに異なっているとよい。
【実施例4】
【0084】
上述の各実施例において,第2の表示領域102に表示した構造化情報について,直接,入力者が修正や削除,変更,追加等の入力を行えてもよい。この入力は,構造化情報記憶部16に記憶される。
【産業上の利用可能性】
【0085】
本発明の情報処理システム1を用いることで,自由入力可能なテキスト入力を行う者は,テキスト情報を入力する際に,その構造化がどのように行われているのかを認識しながら行うこととなる。そのため,テキスト情報の構造化の意識づけが行われるので,自動的にテキスト情報の入力をする場合に,構造化を意識した入力を心がけるようになる。その結果,自由入力されたテキスト情報自体が,構造化に適した入力となり,構造化の精度を向上させることができる。
【符号の説明】
【0086】
1:情報処理システム
11:テキスト情報入力受付処理部
12:テキスト情報記憶部
13:構造化処理部
14:照合辞書記憶部
15:表示処理部
16:構造化情報記憶部
17:構造化情報判定処理部
70:演算装置
71:記憶装置
72:表示装置
73:入力装置
74:通信装置
100:画面
101:第1の表示領域
102:第2の表示領域
103:第2の表示領域に表示する構造化情報