IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7234622文書検索プログラム、文書検索方法および文書検索システム
<>
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図1
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図2
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図3
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図4
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図5
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図6
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図7
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図8
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図9
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図10
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図11
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図12
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図13
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図14
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図15
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図16
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図17
  • 特許-文書検索プログラム、文書検索方法および文書検索システム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-28
(45)【発行日】2023-03-08
(54)【発明の名称】文書検索プログラム、文書検索方法および文書検索システム
(51)【国際特許分類】
   G06F 16/2455 20190101AFI20230301BHJP
   G16H 10/60 20180101ALI20230301BHJP
   G06F 16/24 20190101ALI20230301BHJP
   G06F 16/28 20190101ALI20230301BHJP
   G06F 16/33 20190101ALI20230301BHJP
   G06F 16/903 20190101ALI20230301BHJP
【FI】
G06F16/2455
G16H10/60
G06F16/24
G06F16/28
G06F16/33
G06F16/903
【請求項の数】 9
(21)【出願番号】P 2018240065
(22)【出願日】2018-12-21
(65)【公開番号】P2020102021
(43)【公開日】2020-07-02
【審査請求日】2021-09-09
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100104190
【弁理士】
【氏名又は名称】酒井 昭徳
(72)【発明者】
【氏名】柏木 潮
(72)【発明者】
【氏名】山下 亜紀
【審査官】和田 財太
(56)【参考文献】
【文献】特開2011-198203(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G16H 10/60
G06Q 50/00
(57)【特許請求の範囲】
【請求項1】
ポジティブに分類された文書とネガティブに分類された文書を登録した第1の記憶部を参照して、前記ポジティブに分類された文書と前記ネガティブに分類された文書の少なくともいずれかに含まれる単語について、前記ポジティブに分類された文書と前記ネガティブに分類された文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
算出した前記指標値を前記単語と対応付けて第2の記憶部に登録し、
検索文字列を受け付け、
文書群から前記検索文字列に対応する文書を検索し、
前記検索文字列に対応する1または複数の文書が検索された場合、前記第2の記憶部を参照して、前記1または複数の文書の各文書に含まれる単語に対応する指標値に基づき、前記各文書の指標値を算出し、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語に対応する指標値に基づき、前記検索文字列の指標値を算出し、
算出した前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記検索文字列に対応する検索結果を出力する、
処理をコンピュータに実行させることを特徴とする文書検索プログラム。
【請求項2】
前記出力する処理は、
前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記1または複数の文書のうち、前記検索文字列と指標値が近い文書を優先して検索結果として出力する、ことを特徴とする請求項1に記載の文書検索プログラム。
【請求項3】
前記検索文字列の指標値に基づいて、前記検索文字列をポジティブまたはネガティブに分類する、処理を前記コンピュータに実行させ、
前記出力する処理は、
前記検索文字列をポジティブに分類した場合、前記各文書の指標値に基づいて、前記1または複数の文書のうち、ポジティブな意味合いの傾向が強い文書を優先して出力し、
前記検索文字列をネガティブに分類した場合、前記各文書の指標値に基づいて、前記1または複数の文書のうち、ネガティブな意味合いの傾向が強い文書を優先して出力する、
ことを特徴とする請求項1に記載の文書検索プログラム。
【請求項4】
前記各文書の指標値に基づいて、前記各文書の表示態様を決定する、処理を前記コンピュータに実行させ、
前記出力する処理は、
前記各文書を検索結果として出力する際に、決定した前記表示態様で前記各文書を出力する、ことを特徴とする請求項1~3のいずれか一つに記載の文書検索プログラム。
【請求項5】
前記第1の記憶部に記憶された文書は、患者のカルテ情報であり、前記患者の転帰に応じてポジティブまたはネガティブに分類される、ことを特徴とする請求項1~4のいずれか一つに記載の文書検索プログラム。
【請求項6】
前記第1の記憶部に記憶された文書は、前記患者の病名に対応付けられており、
前記単語の指標値を算出する処理は、
前記第1の記憶部に記憶された文書のうち、各病名に対応する文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
前記登録する処理は、
算出した前記指標値を、前記単語と前記各病名とに対応付けて前記第2の記憶部に登録する、ことを特徴とする請求項5に記載の文書検索プログラム。
【請求項7】
前記各文書の指標値を算出する処理は、
前記第2の記憶部を参照して、検索された前記各文書に含まれる単語について、診療対象の患者の病名に対応する指標値を特定し、
特定した前記各文書に含まれる単語の指標値に基づき、前記各文書の指標値を算出し、
前記検索文字列の指標値を算出する処理は、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語について、前記診療対象の患者の病名に対応する指標値を特定し、
特定した前記検索文字列に含まれる単語の指標値に基づき、前記検索文字列の指標値を算出する、ことを特徴とする請求項6に記載の文書検索プログラム。
【請求項8】
ポジティブに分類された文書とネガティブに分類された文書を登録した第1の記憶部を参照して、前記ポジティブに分類された文書と前記ネガティブに分類された文書の少なくともいずれかに含まれる単語について、前記ポジティブに分類された文書と前記ネガティブに分類された文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
算出した前記指標値を前記単語と対応付けて第2の記憶部に登録し、
検索文字列を受け付け、
文書群から前記検索文字列に対応する文書を検索し、
前記検索文字列に対応する1または複数の文書が検索された場合、前記第2の記憶部を参照して、前記1または複数の文書の各文書に含まれる単語に対応する指標値に基づき、前記各文書の指標値を算出し、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語に対応する指標値に基づき、前記検索文字列の指標値を算出し、
算出した前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記検索文字列に対応する検索結果を出力する、
処理をコンピュータが実行することを特徴とする文書検索方法。
【請求項9】
ポジティブに分類された文書とネガティブに分類された文書を登録した第1の記憶部を参照して、前記ポジティブに分類された文書と前記ネガティブに分類された文書の少なくともいずれかに含まれる単語について、前記ポジティブに分類された文書と前記ネガティブに分類された文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する算出部と、
前記算出部によって算出された前記指標値を前記単語と対応付けて第2の記憶部に登録する登録部と、
検索文字列を受け付ける受付部と、
文書群から前記受付部が受け付けた前記検索文字列に対応する文書を検索する検索部と、
前記検索部によって前記検索文字列に対応する1または複数の文書が検索された場合、前記第2の記憶部を参照して、前記1または複数の文書の各文書に含まれる単語に対応する指標値に基づき、前記各文書の指標値を算出し、前記第2の記憶部を参照して、前記検索文字列に含まれる単語に対応する指標値に基づき、前記検索文字列の指標値を算出する算出部と、
前記算出部によって算出された前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記検索文字列に対応する検索結果を出力する出力部と、
を含むことを特徴とする文書検索システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書検索プログラム、文書検索方法および文書検索システムに関する。
【背景技術】
【0002】
従来、患者の診療を行うにあたり、医師が、過去のカルテの記載を参考にして、今後の治療方針を検討することがある。例えば、医師は、通院歴の長い患者について、その患者の過去のカルテの記載を参考にして、選択すべき治療法や薬剤などを判断することがある。カルテの検索には、例えば、キーワード検索が用いられる。
【0003】
先行技術としては、例えば、ポジティブワードの一覧とネガティブワードの一覧とを記憶する記憶部に記憶されたポジティブワードおよびネガティブワードに基づいて、連絡情報に対するネガティブ・ポジティブ判定を実行するものがある。また、分類わけされた要素がポジティブなものかネガティブなものかを解析して、要素をポジティブ辞書、ネガティブ辞書に蓄積し、ポジティブ辞書の要素とネガティブ辞書の要素とを比較して、同一の場合、該同一の要素をポジティブ辞書およびネガティブ辞書から削除する技術がある。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2016-212925号公報
【文献】特開2008-204355号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術では、文書検索を行うにあたり、単語が持つポジティブまたはネガティブの意味合いを判断することができない場合がある。単語が持つポジティブまたはネガティブの意味合いを判断できなければ、ポジティブまたはネガティブの条件を加味した文書検索を行うことは難しい。
【0006】
一つの側面では、本発明は、単語が持つポジティブまたはネガティブの意味合いの傾向を特定可能にし、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現することを目的とする。
【課題を解決するための手段】
【0007】
1つの実施態様では、ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部を参照して、処理対象となる単語について、前記ポジティブまたはネガティブに分類可能な文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、算出した前記指標値を前記単語と対応付けて第2の記憶部に登録する、文書検索プログラムが提供される。
【発明の効果】
【0008】
本発明の一側面によれば、単語が持つポジティブまたはネガティブの意味合いの傾向を特定可能にし、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現することができる。
【図面の簡単な説明】
【0009】
図1図1は、実施の形態にかかる文書検索方法の一実施例を示す説明図である。
図2図2は、文書検索システム200のシステム構成例を示す説明図である。
図3図3は、情報処理装置101のハードウェア構成例を示すブロック図である。
図4図4は、病名DB220の記憶内容の一例を示す説明図である。
図5図5は、カルテDB230の記憶内容の一例を示す説明図である。
図6図6は、ネガポジDB240の記憶内容の一例を示す説明図である。
図7図7は、情報処理装置101の機能的構成例を示すブロック図である。
図8図8は、ネガポジ件数テーブル800の記憶内容の一例を示す説明図である。
図9図9は、クライアント装置201の画面遷移例を示す説明図である。
図10図10は、検索結果画面の他の画面例を示す説明図である。
図11図11は、キーワード検索画面の他の画面例を示す説明図である。
図12図12は、情報処理装置101のネガポジ登録処理手順の一例を示すフローチャート(その1)である。
図13図13は、情報処理装置101のネガポジ登録処理手順の一例を示すフローチャート(その2)である。
図14図14は、情報処理装置101のネガポジ登録処理手順の一例を示すフローチャート(その3)である。
図15図15は、ネガティブ件数算出処理の具体的処理手順の一例を示すフローチャートである。
図16図16は、ポジティブ件数算出処理の具体的処理手順の一例を示すフローチャートである。
図17図17は、情報処理装置101の文書検索処理手順の一例を示すフローチャート(その1)である。
図18図18は、情報処理装置101の文書検索処理手順の一例を示すフローチャート(その2)である。
【発明を実施するための形態】
【0010】
以下に図面を参照して、本発明にかかる文書検索プログラム、文書検索方法および文書検索システムの実施の形態を詳細に説明する。
【0011】
(実施の形態)
図1は、実施の形態にかかる文書検索方法の一実施例を示す説明図である。図1において、情報処理装置101は、文書の検索を支援するコンピュータである。文書は、キーワード検索が可能な電子情報である。キーワード検索は、キーワードに対応する文書を検索する機能であり、キーワードとして入力された文字や文字列を含む文書を検索する。
【0012】
検索対象の文書は、例えば、医療機関において作成されるカルテ(診療記録)の記事や、研究開発において作成される報告書などである。カルテには、患者の主訴、医師の所見(評価)、診断結果、治療計画(治療方針)などが記載される。研究開発における報告書には、研究者の所見や研究結果などが記載される。
【0013】
これらの文書には、ポジティブな内容の文書もあれば、ネガティブな内容の文書もある。ポジティブとは、例えば、肯定的、積極的、前向き、好転などの意味である。ネガティブとは、否定的、消極的、後ろ向き、悪化などの意味である。例えば、カルテの記事には、症状が改善されたときの記事(ポジティブ)もあれば、症状が悪化したときの記事(ネガティブ)もある。
【0014】
ここで、文書を検索するにあたり、ネガティブまたはポジティブの条件を加味した文書検索を行いたい場合がある。例えば、「発熱」の症状がある患者の診療を行う際に、医師が、患者にとって不向きな治療法や薬剤を判断するために、その患者の症状が悪化したときの過去のカルテの記事が欲しい場合がある。
【0015】
しかし、キーワード検索を用いた文書検索では、キーワードとして入力された文字列が単純に一致するかどうかで検索を行うため、本来欲しい情報がヒットしない、あるいは、欲しい情報を見つけ出すのに時間がかかる場合がある。例えば、「発熱」というキーワードで文書検索を行うと、「発熱が治まった」という本来必要でない情報もヒットして、欲しい情報が埋もれてしまうことがある。
【0016】
このため、単語が持つポジティブまたはネガティブな意味合いの傾向から、その単語を含む文書のポジティブまたはネガティブな意味合いを判断し、ネガティブまたはポジティブの条件を加味した文書検索を行うことが考えられる。この場合、様々な単語について、ポジティブまたはネガティブな意味合いの傾向を特定する情報を予め保持しておくことになる。
【0017】
ところが、様々な単語について、人手により単語の意味合いを一つ一つ確認し、ポジティブまたはネガティブの意味合いの傾向を示す情報をデータベース等に予め登録することは、時間や手間がかかり現実的ではない。また、単語によっては、ポジティブまたはネガティブの意味合いの傾向を人手で判断しにくいものもある。
【0018】
そこで、本実施の形態では、単語が持つポジティブまたはネガティブの意味合いの傾向を特定可能にし、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現する文書検索方法について説明する。以下、情報処理装置101の処理例について説明する。
【0019】
(1)情報処理装置101は、処理対象となる単語を受け付ける。ここで、処理対象となる単語は、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する対象の単語である。ポジティブな意味合いの傾向とは、どの程度ポジティブな意味を有しているかをあらわす。ネガティブな意味合いの傾向とは、どの程度ネガティブな意味を有しているかをあらわす。
【0020】
具体的には、例えば、情報処理装置101は、ユーザの操作入力により、または、外部のコンピュータから受信することにより、処理対象となる単語を受け付けることにしてもよい。また、情報処理装置101は、文書から単語を抽出することにより、抽出した単語を処理対象となる単語として受け付けることにしてもよい。
【0021】
図1の例では、処理対象となる単語として、単語「xxx」を受け付けた場合を想定する。
【0022】
(2)情報処理装置101は、第1の記憶部110を参照して、処理対象となる単語について、ポジティブまたはネガティブに分類可能な文書それぞれにおける単語の出現頻度に基づき、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する。
【0023】
第1の記憶部110は、ポジティブまたはネガティブに分類可能な文書を登録した記憶部である。ポジティブまたはネガティブに分類可能な文書とは、ポジティブな内容、結果の文書であるか、または、ネガティブな内容、結果の文書であるかを分類可能な文書である。第1の記憶部110には、例えば、文書に対応付けて、当該文書がポジティブまたはネガティブのいずれの文書であるかを分類するための情報が記憶されている。
【0024】
ここで、ポジティブに分類された文書における出現頻度が高い単語ほど、ポジティブな意味合いが強い単語であるといえる。一方、ネガティブに分類された文書における出現頻度が高い単語ほど、ネガティブな意味合いが強い単語であるといえる。ただし、ポジティブに分類された文書に出現した単語が、ネガティブに分類された文書に出現することもある。また、ネガティブに分類された文書に出現した単語が、ポジティブに分類された文書に出現することもある。
【0025】
このため、情報処理装置101は、処理対象となる単語について、ポジティブに分類された文書における出現頻度と、ネガティブに分類された文書における出現頻度とに基づいて、その単語の指標値を算出する。文書における単語の出現頻度は、例えば、その単語が文書中に出現した回数を、文書に含まれる単語の総数(全単語数)で除算することにより求めることができる。
【0026】
図1の例では、第1の記憶部110には、ポジティブに分類された文書111と、ネガティブに分類された文書112とが記憶されているとする。また、ポジティブに分類された文書111における単語「xxx」の出現頻度を「出現頻度f1」とし、ネガティブに分類された文書112における単語「xxx」の出現頻度を「出現頻度f2」とする。
【0027】
この場合、情報処理装置101は、単語「xxx」について、ポジティブに分類された文書111における出現頻度f1と、ネガティブに分類された文書112における出現頻度f2とに基づいて、単語「xxx」の指標値v1を算出する。より具体的には、例えば、指標値v1は、出現頻度f1と出現頻度f2との差分(例えば、f1-f2)によって表されることにしてもよい。
【0028】
ここでは、指標値v1を、出現頻度f1から出現頻度f2を引いた値とする。この場合、指標値v1が大きいほど、単語「xxx」が持つポジティブな意味合いの傾向が強いといえる。また、指標値v1が小さいほど、単語「xxx」が持つネガティブな意味合いの傾向が強いといえる。
【0029】
なお、ここではポジティブ(または、ネガティブ)に分類された文書が1つの場合を例に挙げて説明したが、複数の文書が存在する場合は、情報処理装置101は、複数の文書全体における単語の出現頻度を算出することにしてもよい。
【0030】
(3)情報処理装置101は、算出した指標値を、単語と対応付けて第2の記憶部120に登録する。ここで、第2の記憶部120は、単語と対応付けて、その単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を記憶する記憶部である。
【0031】
図1の例では、情報処理装置101は、算出した指標値v1を、単語「xxx」と対応付けて第2の記憶部120に登録する。
【0032】
このように、情報処理装置101によれば、処理対象となる単語が持つポジティブまたはネガティブの意味合いの傾向を特定可能な指標値を求めて登録しておくことができる。これにより、単語が持つポジティブまたはネガティブの意味合いの傾向から、その単語を含む文書が持つポジティブまたはネガティブの意味合いの傾向を推定可能となり、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現することができる。
【0033】
図1の例では、単語「xxx」が持つポジティブまたはネガティブの意味合いの傾向を特定可能な指標値v1を登録しておくことができる。これにより、文書検索を行うにあたり、単語「xxx」の指標値v1を用いて、単語「xxx」を含む文書が持つポジティブまたはネガティブの意味合いの傾向を推定することが可能となる。
【0034】
(文書検索システム200のシステム構成例)
つぎに、図1に示した情報処理装置101を含む文書検索システム200のシステム構成例について説明する。文書検索システム200は、例えば、医療機関の電子カルテシステムに適用される。医療機関は、病院、診療所などである。
【0035】
図2は、文書検索システム200のシステム構成例を示す説明図である。図2において、文書検索システム200は、情報処理装置101と、クライアント装置201と、を含む。文書検索システム200において、情報処理装置101およびクライアント装置201は、有線または無線のネットワーク210を介して接続される。ネットワーク210は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどである。
【0036】
ここで、情報処理装置101は、病名DB(Database)220、カルテDB230およびネガポジDB240を有する。情報処理装置101は、例えば、電子カルテシステムのサーバである。なお、各種DB220,230,240の記憶内容については、図4図6を用いて後述する。
【0037】
クライアント装置201は、文書検索システム200のユーザが使用するコンピュータである。文書検索システム200のユーザは、例えば、医療機関の医師、看護師などの医療従事者である。クライアント装置201は、例えば、PC(Personal Computer)、タブレット型PCなどである。
【0038】
なお、上述した説明では、情報処理装置101とクライアント装置201とが別体に設けられることにしたが、これに限らない。例えば、情報処理装置101は、クライアント装置201により実現されることにしてもよい。
【0039】
(情報処理装置101のハードウェア構成例)
図3は、情報処理装置101のハードウェア構成例を示すブロック図である。図3において、情報処理装置101は、CPU(Central Processing Unit)301と、メモリ302と、ディスクドライブ303と、ディスク304と、通信I/F(Interface)305と、可搬型記録媒体I/F306と、可搬型記録媒体307と、を有する。また、各構成部は、バス300によってそれぞれ接続される。
【0040】
ここで、CPU301は、情報処理装置101の全体の制御を司る。CPU301は、複数のコアを有していてもよい。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMがOS(Operating System)のプログラムを記憶し、ROMがアプリケーションプログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
【0041】
ディスクドライブ303は、CPU301の制御に従ってディスク304に対するデータのリード/ライトを制御する。ディスク304は、ディスクドライブ303の制御で書き込まれたデータを記憶する。ディスク304としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
【0042】
通信I/F305は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部のコンピュータ(例えば、図2に示したクライアント装置201)に接続される。そして、通信I/F305は、ネットワーク210と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。通信I/F305には、例えば、モデムやLANアダプタなどを採用することができる。
【0043】
可搬型記録媒体I/F306は、CPU301の制御に従って可搬型記録媒体307に対するデータのリード/ライトを制御する。可搬型記録媒体307は、可搬型記録媒体I/F306の制御で書き込まれたデータを記憶する。可搬型記録媒体307としては、例えば、CD(Compact Disc)-ROM、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリなどが挙げられる。
【0044】
なお、情報処理装置101は、上述した構成部のほかに、例えば、SSD(Solid State Drive)、入力装置、ディスプレイ等を有することにしてもよい。また、情報処理装置101は、上述した構成部のうち、例えば、ディスクドライブ303、ディスク304、可搬型記録媒体I/F306、可搬型記録媒体307を有していなくてもよい。また、図2に示したクライアント装置201についても、情報処理装置101と同様のハードウェア構成により実現することができる。ただし、クライアント装置201は、上述した構成部のほかに、入力装置、ディスプレイなどを有する。
【0045】
(各種DB220,230,240の記憶内容)
つぎに、図4図6を用いて、情報処理装置101が有する各種DB220,230,240の記憶内容について説明する。各種DB220,230,240は、例えば、図3に示したメモリ302、ディスク304などの記憶装置により実現される。
【0046】
図4は、病名DB220の記憶内容の一例を示す説明図である。図4において、病名DB220は、患者ID、病名コード、病名、主病名区分、病名開始日、転帰および転帰日のフィールドを有し、各フィールドに情報を設定することで、病名情報(例えば、病名情報400-1~400-8)をレコードとして記憶する。
【0047】
ここで、患者IDは、患者を一意に識別する識別子である。患者は、例えば、文書検索システム200が導入される医療機関における患者である。病名コードは、患者につけられた病名を一意に識別する識別子である。病名は、病気の名称である。病名には、主病名や疑い病名などがある。主病名は、主たる病名である。疑い病名は、疑いのある病名である。
【0048】
主病名区分は、主病名であるか否かを示すフラグである。主病名区分「1」は、主病名であることを示す。主病名区分「0」は、主病名ではないことを示す。病名開始日は、病名がつけられた日付である。転帰は、病気が進行または改善した結果、どのような状態にいたったのかを示す。転帰日は、転帰が記載された日付である。
【0049】
例えば、病名情報400-1は、患者ID「P1」の患者の病名コード「12345」、病名「胃腫瘍」、主病名区分「1」、病名開始日「2018/10/1」、転帰「死亡」および転帰日「2018/11/1」を示す。
【0050】
図5は、カルテDB230の記憶内容の一例を示す説明図である。図5において、カルテDB230は、患者ID、記載日、SOAP区分および記事のフィールドを有し、各フィールドに情報を設定することで、カルテ情報(例えば、カルテ情報500-1~500-8)をレコードとして記憶する。
【0051】
ここで、患者IDは、患者を一意に識別する識別子である。記載日は、カルテの記事を記載した日付である。SOAP区分は、SOAP形式で記載されたカルテのいずれの情報についての記事であるかを示す。SOAP区分「S」は、患者の主訴を示す。「S」は、Subjectiveの頭文字である。
【0052】
SOAP区分「O」は、患者の検査結果等を示す。「O」は、Objectiveの頭文字である。SOAP区分「A」は、医師の所見(評価)を示す。「A」は、Assessmentの頭文字である。SOAP区分「P」は、治療計画を示す。「P」は、Planの頭文字である。記事は、カルテの記載内容である。
【0053】
例えば、カルテ情報500-1は、患者ID「P1」、記載日「2018/10/1」、SOAP区分「S」および記事「1週間前から下腹部に痛みがある」を示す。
【0054】
図6は、ネガポジDB240の記憶内容の一例を示す説明図である。図6において、ネガポジDB240は、要素、病名コード、病名、ポジティブ件数、ポジティブ出現頻度、ネガティブ件数、ネガティブ出現頻度およびネガポジ度数のフィールドを有する。各フィールドに情報を設定することで、ネガポジ情報(例えば、ネガポジ情報600-1~600-10)がレコードとして記憶される。
【0055】
ここで、要素は、文書で使用された単語である。文書は、例えば、カルテ情報の記事である。病名コードは、病名を一意に識別する識別子である。病名は、病気の名称である。ポジティブ件数は、ポジティブに分類された文書に単語が出現した回数である。ポジティブ出現頻度は、ポジティブに分類された文書における単語の出現頻度を示す。
【0056】
ネガティブ件数は、ネガティブに分類された文書に単語が出現した回数である。ネガティブ出現頻度は、ネガティブに分類された文書における単語の出現頻度を示す。ネガポジ度数は、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値である。ここでは、ネガポジ度数は、ポジティブ出現頻度からネガティブ出現頻度を引いた値を示す。
【0057】
例えば、ネガポジ情報600-1は、要素「痛み」、病名コード「12345」、病名「胃腫瘍」、ポジティブ件数「5」、ポジティブ出現頻度「0.113636364」、ネガティブ件数「10」、ネガティブ出現頻度「0.263157895」およびネガポジ度数「-0.149521531」を示す。
【0058】
(情報処理装置101の機能的構成例)
図7は、情報処理装置101の機能的構成例を示すブロック図である。図7において、情報処理装置101は、第1の受付部701と、算出部702と、登録部703と、第2の受付部704と、検索部705と、決定部706と、出力部707と、第1の記憶部710と、第2の記憶部720と、を含む。具体的には、例えば、第1の受付部701~出力部707は、図3に示したメモリ302、ディスク304などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、通信I/F305により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク304などの記憶装置に記憶される。第1の記憶部710および第2の記憶部720は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0059】
第1の記憶部710は、ポジティブまたはネガティブに分類可能な文書を記憶する。具体的には、例えば、第1の記憶部710は、図4に示した病名DB220および図5に示したカルテDB230を記憶する。図1に示した第1の記憶部110は、例えば、第1の記憶部710に相当する。
【0060】
第2の記憶部720は、単語と対応付けて、当該単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を記憶する。具体的には、例えば、第2の記憶部720は、図6に示したネガポジDB240を記憶する。図1に示した第2の記憶部120は、例えば、第2の記憶部720に相当する。
【0061】
第1の受付部701は、処理対象となる単語を受け付ける。ここで、処理対象となる単語は、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する対象の単語である。処理対象となる単語は、特定の品詞の単語であってもよい。特定の品詞は、任意に設定可能であり、例えば、名詞、動詞、形容詞、形容動詞、副詞などである。
【0062】
具体的には、例えば、第1の受付部701は、文書から抽出された単語を、処理対象となる単語として受け付ける。文書は、例えば、第1の記憶部710に記憶されたポジティブまたはネガティブに分類可能な文書であってもよい。より詳細に説明すると、例えば、第1の受付部701は、図5に示したカルテDB230内のカルテ情報の記事から抽出された特定の品詞の単語を、処理対象となる単語として受け付けることにしてもよい。
【0063】
算出部702は、第1の記憶部710を参照して、処理対象となる単語について、ポジティブまたはネガティブに分類可能な文書それぞれにおける単語の出現頻度に基づき、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する。
【0064】
以下の説明では、ポジティブまたはネガティブな意味合いの傾向を示す指標値を「ネガポジ度数」と表記する場合がある。
【0065】
具体的には、例えば、算出部702は、第1の記憶部710に記憶された各文書を、ポジティブまたはネガティブのいずれかに分類する。つぎに、算出部702は、ポジティブに分類された文書における単語の出現頻度を算出する。また、算出部702は、ネガティブに分類された文書における単語の出現頻度を算出する。そして、算出部702は、算出したポジティブに分類された文書における単語の出現頻度と、ネガティブに分類された文書における単語の出現頻度とに基づいて、単語のネガポジ度数を算出する。
【0066】
より詳細に説明すると、例えば、算出部702は、図4に示した病名DB220から、病名情報を選択する。つぎに、算出部702は、選択した病名情報の病名開始日から転帰日までの期間Tを特定する。そして、算出部702は、図5に示したカルテDB230から、選択した病名情報の患者IDに対応し、かつ、特定した期間Tに記載日が含まれるカルテ情報を選択する。
【0067】
ここで、選択した病名情報の転帰が「死亡」の場合、算出部702は、選択したカルテ情報の記事をネガティブに分類する。一方、選択した病名情報の転帰が「寛解または治癒」の場合、算出部702は、選択したカルテ情報の記事をポジティブに分類する。
【0068】
これにより、患者の転帰が「寛解または治癒」であるか、または、「死亡」であるかに応じて、病気の治療中に記載されたカルテ情報の記事を、ポジティブまたはネガティブに分類することができる。
【0069】
なお、病名DB220内の病名情報のうち、病名開始日が所定期間内の病名情報だけを処理対象とすることにしてもよい。所定期間は、任意に設定可能であり、例えば、直近5年などの期間に設定される。これにより、古いカルテ情報の記事を処理対象から除外することができる。
【0070】
また、病名DB220内の病名情報のうち、病名が主病名である病名情報、すなわち、主病名区分「1」の病名情報だけを処理対象とすることにしてもよい。これにより、例えば、病名が確定していないときに記載されたカルテ情報の記事を処理対象から除外することができる。
【0071】
つぎに、算出部702は、ポジティブに分類されたカルテ情報の記事を形態素解析することにより、当該記事を単語(形態素)単位に分解する。つぎに、算出部702は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する。そして、算出部702は、抽出した各単語について、ポジティブに分類されたカルテ情報の記事における出現回数を算出する。
【0072】
なお、ポジティブに分類されたカルテ情報の記事における出現回数は、例えば、ポジティブに分類されたカルテ情報の記事のうち、全てのカルテ情報の記事を対象として算出されてもよく、また、一部のカルテ情報の記事を対象として算出されてもよい。
【0073】
また、算出部702は、ネガティブに分類されたカルテ情報の記事を形態素解析することにより、当該記事を単語(形態素)単位に分解する。つぎに、算出部702は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する。そして、算出部702は、抽出した各単語について、ネガティブに分類されたカルテ情報の記事における出現回数を算出する。
【0074】
なお、ネガティブに分類されたカルテ情報の記事における出現回数は、例えば、ネガティブに分類されたカルテ情報の記事のうち、全てのカルテ情報の記事を対象として算出されてもよく、また、一部のカルテ情報の記事を対象として算出されてもよい。
【0075】
以下の説明では、ポジティブに分類された文書(例えば、カルテ情報の記事)における単語の出現回数を「ポジティブ件数」と表記する場合がある。また、ネガティブに分類された文書(例えば、カルテ情報の記事)における単語の出現回数を「ネガティブ件数」と表記する場合がある。
【0076】
算出された単語のポジティブ件数およびネガティブ件数は、例えば、図8に示すようなネガポジ件数テーブル800に記憶される。ネガポジ件数テーブル800は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0077】
図8は、ネガポジ件数テーブル800の記憶内容の一例を示す説明図である。図8において、ネガポジ件数テーブル800は、要素、病名コード、病名、ネガティブ件数およびポジティブ件数のフィールドを有し、各フィールドに情報を設定することで、件数情報(例えば、件数情報800-1~800-6)をレコードとして記憶する。
【0078】
ここで、要素は、カルテ情報の記事で使用された単語である。病名コードは、病名を一意に識別する識別子である。病名は、カルテ情報に対応する病名情報、すなわち、カルテ情報を選択するにあたり参照された病名情報から特定される。病名は、病気の名称である。ネガティブ件数は、ネガティブに分類されたカルテ情報の記事における単語の出現回数である。ポジティブ件数は、ポジティブに分類されたカルテ情報の記事における単語の出現回数である。
【0079】
例えば、件数情報800-1は、要素「痛み」、病名コード「12345」、病名「胃腫瘍」、ネガティブ件数「5」およびポジティブ件数「10」を示す。
【0080】
例えば、算出部702は、ネガポジ件数テーブル800を参照して、各単語のポジティブ件数を積算することにより、合計ポジティブ件数を算出する。合計ポジティブ件数は、ポジティブに分類されたカルテ情報の記事に含まれる単語(例えば、特定の品詞の単語)の総数に相当する。つぎに、算出部702は、各単語のポジティブ件数を合計ポジティブ件数で除算することにより、各単語のポジティブ出現頻度を算出する。ポジティブ出現頻度は、ポジティブに分類されたカルテ情報の記事における単語の出現頻度である。
【0081】
また、算出部702は、ネガポジ件数テーブル800を参照して、各単語のネガティブ件数を積算することにより、合計ネガティブ件数を算出する。合計ネガティブ件数は、ネガティブに分類されたカルテ情報の記事に含まれる単語(例えば、特定の品詞の単語)の総数に相当する。つぎに、算出部702は、各単語のネガティブ件数を合計ネガティブ件数で除算することにより、各単語のネガティブ出現頻度を算出する。ネガティブ出現頻度は、ネガティブに分類されたカルテ情報の記事における単語の出現頻度である。
【0082】
そして、算出部702は、算出した各単語のポジティブ出現頻度とネガティブ出現頻度とに基づいて、各単語のネガポジ度数を算出する。例えば、算出部702は、各単語のポジティブ出現頻度とネガティブ出現頻度との差分を、各単語のネガポジ度数として算出することにしてもよい。
【0083】
ネガポジ度数を、ポジティブ出現頻度からネガティブ出現頻度を引いた値とすると、ネガポジ度数が大きいほど、単語が持つポジティブな意味合いの傾向が強いといえる。一方、ネガポジ度数を、ネガティブ出現頻度からポジティブ出現頻度を引いた値とすると、ネガポジ度数が大きいほど、単語が持つネガティブな意味合いの傾向が強いといえる。ここでは、ネガポジ度数を、ポジティブ出現頻度からネガティブ出現頻度を引いた値とする。
【0084】
登録部703は、算出された単語のネガポジ度数を、単語と対応付けて第2の記憶部720に登録する。具体的には、例えば、登録部703は、算出された単語のネガポジ度数を、単語(要素)と対応付けて、図6に示したネガポジDB240に登録する。この際、登録部703は、病名コード、病名、ポジティブ件数、ポジティブ出現頻度、ネガティブ件数およびネガティブ出現頻度をさらに対応付けて、ネガポジDB240に登録する。
【0085】
病名は、単語のネガポジ度数を算出する際に参照されたカルテ情報に対応する病名情報から特定される。ただし、ポジティブ件数、ポジティブ出現頻度、ネガティブ件数およびネガティブ出現頻度については、ネガポジDB240に登録しないようにしてもよい。
【0086】
第2の受付部704は、検索文字列を受け付ける。ここで、検索文字列は、文書を検索する際の検索条件となるキーワード(文字または文字列)を指定するものである。検索文字列には、複数のキーワードが含まれていてもよい。具体的には、例えば、第2の受付部704は、図2に示したクライアント装置201から検索文字列を受信することにより、受信した検索文字列を受け付ける。
【0087】
より詳細に説明すると、例えば、医師が、ある患者の診療を行うにあたり、後述の図9に示すようなキーワード検索画面910において、過去のカルテ記事を検索するために検索文字列を入力する。この場合、クライアント装置201は、入力された検索文字列を、情報処理装置101に送信する。検索文字列には、診療対象の患者の病名を特定する情報が対応付けられていてもよい。
【0088】
検索部705は、文書群から、受け付けた検索文字列に対応する文書を検索する。ここで、文書群は、例えば、第1の記憶部710に記憶された文書群である。また、文書群は、インターネット上のウェブサイトから取得可能な文書群であってもよい。
【0089】
具体的には、例えば、検索部705は、カルテDB230から、検索文字列に対応するカルテ情報の記事を検索する。より詳細に説明すると、例えば、検索部705は、検索文字列に含まれる文字や文字列を含むカルテ情報の記事を検索する。この際、検索部705は、SOAP区分が「S」または「A」のカルテ情報の記事を検索対象としてもよい。
【0090】
また、検索部705は、現在の病名(診断対象の患者の病名)と同じ病名の病気を治療中に記載されたカルテ情報の記事を検索対象としてもよい。カルテ情報に対応する病名は、例えば、カルテ情報の患者IDと記載日をもとに病名DB220から特定可能である。ただし、検索アルゴリズムは、既存のいかなるものを用いることにしてもよい。
【0091】
以下の説明では、カルテDB230内のカルテ情報の記事を、単に「カルテ記事」と表記する場合がある。
【0092】
決定部706は、検索文字列に対応する1または複数の文書が検索された場合、検索された1または複数の文書の各文書の優先度を決定する。ここで、文書の優先度とは、検索文字列に対する検索結果として文書を出力する際の優先度である。例えば、優先度が高い文書ほど、検索結果として他の文書よりも上位に表示される。
【0093】
具体的には、例えば、決定部706は、第2の記憶部720を参照して、検索された1または複数の文書の各文書に含まれる単語に対応するネガポジ度数に基づき、各文書のネガポジ度数を算出する。また、決定部706は、第2の記憶部720を参照して、検索文字列に含まれる単語に対応するネガポジ度数に基づき、検索文字列のネガポジ度数を算出する。そして、決定部706は、算出した各文書のネガポジ度数と検索文字列のネガポジ度数とに基づいて、各文書の優先度を決定する。
【0094】
より詳細に説明すると、例えば、決定部706は、検索されたカルテ記事を形態素解析することにより、当該カルテ記事を単語(形態素)単位に分解する。つぎに、決定部706は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する。
【0095】
また、決定部706は、診療対象の患者の病名を特定する。診療対象の患者の病名は、例えば、検索文字列に対応付けられた情報から特定されてもよく、また、クライアント装置201や電子カルテシステムに問い合わせることにより特定されることにしてもよい。
【0096】
つぎに、決定部706は、抽出した各単語について、ネガポジDB240を参照して、特定した病名に対応するネガポジ度数を特定する。すなわち、決定部706は、単語と病名との組み合わせに対応するネガポジ度数を特定する。例えば、単語「痛み」と病名「胃腫瘍」との組み合わせに対応するネガポジ度数は「-0.149521531」である。
【0097】
そして、決定部706は、特定した各単語のネガポジ度数を積算することにより、カルテ記事のネガポジ度数を算出する。この際、決定部706は、例えば、各単語のネガポジ度数を積算した値を、カルテ記事から抽出した単語数(あるいは、分解した単語数)で割ることにより正規化することにしてもよい。
【0098】
これにより、検索文字列に対応するカルテ記事が持つポジティブまたはネガティブな意味合いの傾向を示す指標値(ネガポジ度数)を得ることができる。
【0099】
また、決定部706は、検索文字列を形態素解析することにより、当該検索文字列を単語(形態素)単位に分解する。つぎに、決定部706は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する。そして、決定部706は、抽出した各単語について、ネガポジDB240を参照して、特定した診療対象の患者の病名に対応するネガポジ度数を特定する。
【0100】
つぎに、決定部706は、特定した各単語のネガポジ度数を積算することにより、検索文字列のネガポジ度数を算出する。この際、決定部706は、例えば、各単語のネガポジ度数を積算した値を、検索文字列から抽出した単語数(あるいは、分解した単語数)で割ることにより正規化することにしてもよい。
【0101】
これにより、検索文字列が持つポジティブまたはネガティブな意味合いの傾向を示す指標値(ネガポジ度数)を得ることができる。
【0102】
そして、決定部706は、算出した各カルテ記事のネガポジ度数と検索文字列のネガポジ度数とに基づいて、各カルテ記事の優先度を決定する。ここで、各カルテ記事のネガポジ度数と検索文字列のネガポジ度数とに基づいて、カルテ記事の優先度を決定する第1および第2の決定例について説明する。
【0103】
・第1の決定例
決定部706は、各カルテ記事のネガポジ度数と検索文字列のネガポジ度数とに基づいて、検索された1または複数のカルテ記事のうち、ネガポジ度数が、検索文字列に近いカルテ記事ほど優先度が高くなるように、各カルテ記事の優先度を決定する。これにより、ポジティブまたはネガティブな意味合いの傾向の強さが検索文字列と同程度であるカルテ記事ほど高い優先度とすることができる。
【0104】
この際、決定部706は、算出した検索文字列のネガポジ度数に基づいて、検索文字列をポジティブまたはネガティブに分類することにしてもよい。例えば、検索文字列のネガポジ度数が0以上の場合、決定部706は、検索文字列をポジティブに分類する。一方、検索文字列のネガポジ度数が0未満の場合、決定部706は、検索文字列をネガティブに分類する。ただし、ネガポジ度数は、値が大きいほど、ポジティブな意味合いの傾向が強いものとする。
【0105】
ここで、検索文字列がポジティブに分類された場合、検索者は、ネガティブな意味合いの検索結果よりも、ポジティブな意味合いの検索結果を必要としているといえる。一方、検索文字列がネガティブに分類された場合、検索者は、ポジティブな意味合いの検索結果よりも、ネガティブな意味合いの検索結果を必要としているといえる。
【0106】
このため、検索文字列がポジティブに分類された場合、決定部706は、ネガポジ度数が0未満のカルテ記事よりも、ネガポジ度数が0以上のカルテ記事の優先度が高くなるように、各カルテ記事の優先度を決定することにしてもよい。これにより、検索文字列がポジティブに分類された場合には、ネガポジ度数が、0以上であって、検索文字列に近いカルテ記事ほど高い優先度とすることができる。
【0107】
一方、検索文字列がネガティブに分類された場合、決定部706は、ネガポジ度数が0以上のカルテ記事よりも、ネガポジ度数が0未満のカルテ記事の優先度が高くなるように、各カルテ記事の優先度を決定することにしてもよい。これにより、検索文字列がネガティブに分類された場合には、ネガポジ度数が、0未満であって、検索文字列に近いカルテ記事ほど高い優先度とすることができる。
【0108】
・第2の決定例
決定部706は、算出した検索文字列のネガポジ度数に基づいて、検索文字列をポジティブまたはネガティブに分類する。ここで、検索文字列がポジティブに分類された場合、決定部706は、ネガポジ度数が大きいカルテ記事ほど優先度が高くなるように、各カルテ記事の優先度を決定することにしてもよい。これにより、検索文字列がポジティブに分類された場合には、ポジティブな意味合いの傾向が強いカルテ記事ほど高い優先度とすることができる。
【0109】
一方、ここで、検索文字列がネガティブに分類された場合、決定部706は、ネガポジ度数が小さいカルテ記事ほど優先度が高くなるように、各カルテ記事の優先度を決定することにしてもよい。これにより、検索文字列がネガティブに分類された場合には、ネガティブな意味合いの傾向が強いカルテ記事ほど高い優先度とすることができる。
【0110】
なお、各カルテ記事の優先度をどのように決定するかは、任意に設定可能である。例えば、情報処理装置101は、クライアント装置201からの指示に応じて、上述した第1または第2の決定例のいずれかの方法により、各カルテ記事の優先度を決定することにしてもよい。
【0111】
また、決定部706は、算出した各カルテ記事のネガポジ度数に基づいて、各カルテ記事の表示態様を決定することにしてもよい。ここで、カルテ記事の表示態様とは、検索結果としてカルテ記事を表示する際の態様であり、カルテ記事の背景色、文字の色、大きさなどによって表される。
【0112】
具体的には、例えば、決定部706は、ネガポジ度数が0以上のカルテ記事の表示態様が、ネガポジ度数が0未満のカルテ記事の表示態様と異なるように、各カルテ記事の表示態様を決定する。これにより、ポジティブな意味合いの検索結果と、ネガティブな意味合いの検索結果とを判別可能にすることができる。
【0113】
なお、決定部706によって決定された表示態様によるカルテ記事の表示例については、図9を用いて後述する。
【0114】
出力部707は、決定された各文書の優先度に基づいて、検索文字列に対応する検索結果を出力する。具体的には、例えば、出力部707は、検索された1または複数の文書を、決定された優先度が高い順に並べた文書リスト(あるいは、文書の名称等のリスト)を検索結果として出力することにしてもよい。
【0115】
この際、出力部707は、検索された1または複数の文書のうち、決定された優先度が高い順に上位N個の文書を検索結果として出力することにしてもよい。Nは、任意に設定可能である。また、出力部707は、各文書(あるいは、文書の名称等)を検索結果として出力する際に、決定された表示態様で各文書を出力することにしてもよい。
【0116】
また、出力部707は、各文書(あるいは、文書の名称等)を出力する際に、各文書と対応付けて、算出された各文書の指標値を出力することにしてもよい。出力部707の出力形式としては、例えば、通信I/F305による他のコンピュータへの送信、メモリ302、ディスク304などの記憶装置への記憶、不図示のディスプレイへの表示、不図示のプリンタへの印刷出力などがある。
【0117】
より詳細に説明すると、例えば、出力部707は、検索文字列に対応するカルテ記事をリスト化して示す検索結果画面を、クライアント装置201に表示することにしてもよい。検索結果画面の画面例については、図9および図10を用いて後述する。
【0118】
なお、上述した説明では、検索文字列のネガポジ度数に基づいて、検索文字列をポジティブまたはネガティブに分類することにしたが、これに限らない。例えば、第2の受付部704は、検索文字列とともに、ポジティブまたはネガティブのいずれかの選択を受け付けることにしてもよい。
【0119】
ポジティブまたはネガティブの選択は、例えば、クライアント装置201に表示される、後述の図11に示すようなキーワード検索画面1100において行われる。この場合、クライアント装置201は、入力された検索文字列とともに、ポジティブまたはネガティブの選択結果を、情報処理装置101に送信する。
【0120】
そして、第2の受付部704は、クライアント装置201から検索文字列および選択結果を受信することにより、検索文字列およびポジティブまたはネガティブの選択を受け付ける。決定部706は、ポジティブの選択を受け付けた場合、検索文字列をポジティブに分類する。一方、ネガティブの選択を受け付けた場合、決定部706は、検索文字列をネガティブに分類する。
【0121】
また、上述した説明では、文書検索時に、検索された各文書について、当該各文書のネガポジ度数を算出することにしたが、これに限らない。例えば、情報処理装置101は、第1の記憶部710に記憶された文書について、当該文書のネガポジ度数を予め算出しておくことにしてもよい。
【0122】
具体的には、例えば、情報処理装置101は、第2の記憶部720を参照して、第1の記憶部710に記憶された各文書に含まれる単語に対応するネガポジ度数に基づき、各文書のネガポジ度数を算出する。そして、情報処理装置101は、算出した各文書のネガポジ度数を、各文書と対応付けて第1の記憶部710に登録しておくことにしてもよい。
【0123】
より詳細に説明すると、例えば、情報処理装置101は、カルテDB230に記憶された各カルテ記事に含まれる単語について、ネガポジDB240を参照して、各カルテ記事に対応する病名に対応するネガポジ度数を特定する。つぎに、情報処理装置101は、特定した各カルテ記事に含まれる単語のネガポジ度数に基づき、各カルテ記事のネガポジ度数を算出する。そして、情報処理装置101は、算出した各カルテ記事のネガポジ度数を、各カルテ記事と対応付けて、メモリ302、ディスク304などの記憶装置に登録しておくことにしてもよい。
【0124】
これにより、文書検索時に、予め登録した文書(例えば、カルテ記事)のネガポジ度数を読み出すだけでよい、すなわち、各文書のネガポジ度数を算出しなくてもよくなるため、文書検索時の処理負荷を削減して応答性能を高めることができる。
【0125】
また、情報処理装置101は、例えば、研修医などが記載したカルテ記事などを対象として、カルテ記事のネガポジ度数を求めることにしてもよい。これにより、カルテ記事のネガポジ度数から、カルテ記事の内容がポジティブすぎる、あるいは、ネガティブすぎるといった評価を行うことができ、新人教育に役立てることができる。
【0126】
また、情報処理装置101の各機能部は、文書検索システム200内の情報処理装置101とは異なる他のコンピュータ、例えば、クライアント装置201で実現することにしてもよい。また、情報処理装置101の各機能部は、文書検索システム200内の複数のコンピュータ(例えば、情報処理装置101とクライアント装置201)により実現されることにしてもよい。
【0127】
(クライアント装置201に表示される各種画面の画面例)
つぎに、クライアント装置201のディスプレイ(不図示)に表示される各種画面の画面例について説明する。ここでは、医師が、患者の診療を行うにあたり、その患者の過去のカルテ記事を参考にして、今後の治療方針を検討する場合を想定する。
【0128】
以下の説明では、操作画面に表示されているボタン等をユーザが選択する操作として、クリック操作を行う場合を例に挙げて説明する。
【0129】
図9は、クライアント装置201の画面遷移例を示す説明図である。図9において、キーワード検索画面910は、検索文字列の入力を受け付ける操作画面である。キーワード検索画面910において、不図示の入力装置を用いたユーザ(医師)の操作入力により、ボックス911をクリックすると、検索文字列を入力することができる。図9の例では、ボックス911に検索文字列「下腹部の痛み」が入力されている。
【0130】
また、キーワード検索画面910において、ユーザ(医師)の操作入力により、ボタン912をクリックすると、ボックス911に入力された検索文字列が情報処理装置101に送信される。図9の例では、ボックス911に入力された検索文字列「下腹部の痛み」が情報処理装置101に送信される。
【0131】
情報処理装置101は、クライアント装置201から検索文字列「下腹部の痛み」を受け付けると、カルテDB230から検索文字列「下腹部の痛み」に対応するカルテ記事を検索する。つぎに、情報処理装置101は、検索した各カルテ記事の優先度を決定する。ここでは、上述した第1の決定例により、各カルテ記事の優先度を決定する場合を想定する。
【0132】
具体的には、例えば、情報処理装置101は、検索文字列「下腹部の痛み」のネガポジ度数を算出する。また、情報処理装置101は、検索した各カルテ記事のネガポジ度数を算出する。ここで、検索文字列「下腹部の痛み」のネガポジ度数を算出する場合を例に挙げて、具体的な処理内容について説明する。
【0133】
より詳細に説明すると、例えば、情報処理装置101は、検索文字列「下腹部の痛み」を形態素解析して、単語(形態素)単位に分解する。ここでは、「下腹部」と「の」と「痛み」の3単語に分解される。つぎに、情報処理装置101は、ネガポジDB240を参照して、分解した各単語に対応するネガポジ度数を特定する。
【0134】
ただし、患者の病名を「胃腫瘍」とする。また、単語「の」は、助詞のため除外する。すなわち、情報処理装置101は、ネガポジDB240を参照して、分解した3単語のうち、単語「下腹部」と単語「痛み」について、病名「胃腫瘍」に対応するネガポジ度数を特定する。
【0135】
ここでは、単語「下腹部」のネガポジ度数として、病名「胃腫瘍」に対応する「-0.017942584」が特定された場合を想定する。また、単語「痛み」のネガポジ度数として、病名「胃腫瘍」に対応する「-0.149521531」が特定された場合を想定する。
【0136】
つぎに、情報処理装置101は、特定した各単語のネガポジ度数を積算することにより、検索文字列「下腹部の痛み」のネガポジ度数を算出する。ここでは、検索文字列「下腹部の痛み」のネガポジ度数は「-0.167464115」となる。このため、検索文字列「下腹部の痛み」は、ネガティブに分類される。
【0137】
この場合、情報処理装置101は、検索したカルテ記事のうち、ネガポジ度数が0未満であって、ネガポジ度数が検索文字列に近いカルテ記事ほど高い優先度とする。そして、情報処理装置101は、決定した各カルテ記事の優先度に従って、検索したカルテ記事を並べた検索結果画面920をクライアント装置201に表示する。
【0138】
検索結果画面920は、検索文字列「下腹部の痛み」に対応するカルテ記事921~924をリスト化して示す操作画面である。検索結果画面920では、ネガポジ度数が0未満であって、ネガポジ度数が検索文字列「下腹部の痛み」に近いカルテ記事が優先して表示(上位に表示)されている。
【0139】
ここで、カルテ記事921のネガポジ度数は、「-0.16755522」である。また、カルテ記事922のネガポジ度数は、「-0.16899999」である。カルテ記事923のネガポジ度数は、「-0.147856321」である。カルテ記事924のネガポジ度数は、「+0.157856561」である。
【0140】
例えば、カルテ記事921は、ネガポジ度数が0未満であって、ネガポジ度数が検索文字列「下腹部の痛み」に最も近いため、最上位に表示されている。また、カルテ記事924は、ネガポジ度数が0以上のため、ネガポジ度数が0未満である他のカルテ記事921~923よりも下位に表示されている。
【0141】
検索結果画面920によれば、検索文字列「下腹部の痛み」に応じて、ネガティブの条件を加味した検索結果を提示することができる。これにより、医師は、病名「胃腫瘍」の患者の診療を行うにあたり、その患者の過去のカルテ記事から必要な情報を容易に見つけ出すことができる。
【0142】
また、検索結果画面920では、ネガポジ度数が0未満のカルテ記事921~923と、ネガポジ度数が0以上のカルテ記事924とが異なる態様(背景の模様が異なる)で表示されている。これにより、医師は、ポジティブな意味合いのカルテ記事と、ネガティブな意味合いのカルテ記事とを容易に判別することができる。
【0143】
また、検索結果画面920では、カルテ記事921~924と対応付けて、ネガポジ度数情報931~934がそれぞれ表示されている。各ネガポジ度数情報931~934は、各カルテ記事921~924のネガポジ度数を示す情報である。これにより、医師は、各カルテ記事921~924のネガポジ度数から、各カルテ記事921~924のポジティブまたはネガティブの傾向の強さを判断することができる。
【0144】
ただし、検索結果画面920において、ネガポジ度数情報931~934は表示されていなくてもよい。
【0145】
つぎに、図10を用いて、検索結果画面の他の画面例について説明する。ここでは、上述した第2の決定例により、各カルテ記事の優先度が決定された場合を想定する。この場合、検索文字列「下腹部の痛み」がネガティブに分類されると、ネガティブな意味合いの傾向が強いカルテ記事ほど高い優先度となる。
【0146】
図10は、検索結果画面の他の画面例を示す説明図である。図10において、検索結果画面1000は、検索文字列「下腹部の痛み」に対応するカルテ記事921~924をリスト化して示す操作画面である。検索結果画面1000では、ネガティブな意味合いの傾向が強いカルテ記事が優先して表示(上位に表示)されている。
【0147】
これにより、医師は、上位に表示されたものほど、ネガティブな意味合いの傾向が強いことがわかり、過去のカルテ記事から必要な情報を容易に見つけ出すことができる。
【0148】
つぎに、図11を用いて、キーワード検索画面の他の画面例について説明する。
【0149】
図11は、キーワード検索画面の他の画面例を示す説明図である。図11において、キーワード検索画面1100は、検索文字列の入力を受け付ける操作画面である。キーワード検索画面1100において、ユーザ(医師)の操作入力により、ボックス1101をクリックすると、検索文字列を入力することができる。図11の例では、ボックス1101に検索文字列「下腹部の痛み」が入力されている。
【0150】
また、キーワード検索画面1100において、ユーザの操作入力により、ボタン1102,1103のいずれかをクリックすると、ポジティブまたはネガティブのいずれかを選択することができる。図11の例では、ボタン1103がクリックされ、ネガティブが選択されている。
【0151】
また、キーワード検索画面1100において、ユーザの操作入力により、ボタン1104をクリックすると、ボックス1101に入力された検索文字列、および、ポジティブまたはネガティブの選択結果が情報処理装置101に送信される。図11の例では、ボックス1101に入力された検索文字列「下腹部の痛み」および選択結果「ネガティブ」が情報処理装置101に送信される。
【0152】
これにより、情報処理装置101において、検索文字列「下腹部の痛み」をポジティブまたはネガティブに分類するにあたり、検索文字列「下腹部の痛み」のネガポジ度数を算出することなく、選択結果「ネガティブ」から精度よく分類することができる。
【0153】
(情報処理装置101のネガポジ登録処理手順)
つぎに、図12図14を用いて、情報処理装置101のネガポジ登録処理手順について説明する。
【0154】
図12図14は、情報処理装置101のネガポジ登録処理手順の一例を示すフローチャートである。図12のフローチャートにおいて、まず、情報処理装置101は、病名DB220から選択されていない未選択の病名情報を選択する(ステップS1201)。つぎに、情報処理装置101は、選択した病名情報の主病名区分を参照して、主病名であるか否かを判断する(ステップS1202)。
【0155】
ここで、主病名ではない場合(ステップS1202:No)、情報処理装置101は、ステップS1208に移行する。一方、主病名の場合には(ステップS1202:Yes)、情報処理装置101は、選択した病名情報の病名開始日が5年以内であるか否かを判断する(ステップS1203)。
【0156】
ここで、病名開始日が5年以内ではない場合(ステップS1203:No)、情報処理装置101は、ステップS1208に移行する。一方、病名開始日が5年以内の場合(ステップS1203:Yes)、情報処理装置101は、選択した病名情報の転帰が「死亡」であるか否かを判断する(ステップS1204)。
【0157】
ここで、転帰が「死亡」の場合(ステップS1204:Yes)、情報処理装置101は、ネガティブ件数算出処理を実行して(ステップS1205)、ステップS1208に移行する。ネガティブ件数算出処理の具体的な処理手順については、図15を用いて後述する。
【0158】
一方、転帰が「死亡」ではない場合(ステップS1204:No)、情報処理装置101は、選択した病名情報の転帰が「寛解または治癒」であるか否かを判断する(ステップS1206)。ここで、転帰が「寛解または治癒」ではない場合(ステップS1206:No)、情報処理装置101は、ステップS1208に移行する。
【0159】
一方、転帰が「寛解または治癒」の場合(ステップS1206:Yes)、情報処理装置101は、ポジティブ件数算出処理を実行する(ステップS1207)。ポジティブ件数算出処理の具体的な処理手順については、図16を用いて後述する。そして、情報処理装置101は、病名DB220から選択されていない未選択の病名情報があるか否かを判断する(ステップS1208)。
【0160】
ここで、未選択の病名情報がある場合(ステップS1208:Yes)、情報処理装置101は、ステップS1201に戻る。一方、未選択の病名情報がない場合には(ステップS1208:No)、情報処理装置101は、図13に示すステップS1301に移行する。
【0161】
図13のフローチャートにおいて、まず、情報処理装置101は、ネガポジ件数テーブル800を参照して、各単語のネガティブ件数を積算することにより、合計ネガティブ件数を算出する(ステップS1301)。つぎに、情報処理装置101は、ネガポジ件数テーブル800を参照して、各単語のポジティブ件数を積算することにより、合計ポジティブ件数を算出する(ステップS1302)。
【0162】
そして、情報処理装置101は、ネガポジ件数テーブル800から選択されていない未選択の件数情報を選択する(ステップS1303)。つぎに、情報処理装置101は、選択した件数情報のネガティブ件数が未設定であるか否かを判断する(ステップS1304)。
【0163】
ここで、ネガティブ件数が設定済みの場合(ステップS1304:No)、情報処理装置101は、選択した件数情報のネガティブ件数を、算出した合計ネガティブ件数で除算して、ネガティブ出現頻度を算出し(ステップS1305)、ステップS1307に移行する。
【0164】
一方、ネガティブ件数が未設定の場合(ステップS1304:Yes)、情報処理装置101は、ネガティブ出現頻度を「0」とする(ステップS1306)。そして、情報処理装置101は、選択した件数情報の要素と病名に対応付けて、ネガティブ出現頻度をネガポジDB240に記憶して(ステップS1307)、図14に示すステップS1401に移行する。
【0165】
図14のフローチャートにおいて、まず、情報処理装置101は、選択した件数情報のポジティブ件数が未設定であるか否かを判断する(ステップS1401)。ここで、ポジティブ件数が設定済みの場合(ステップS1401:No)、情報処理装置101は、選択した件数情報のポジティブ件数を、算出した合計ポジティブ件数で除算して、ポジティブ出現頻度を算出し(ステップS1402)、ステップS1404に移行する。
【0166】
一方、ポジティブ件数が未設定の場合(ステップS1401:Yes)、情報処理装置101は、ポジティブ出現頻度を「0」とする(ステップS1403)。そして、情報処理装置101は、選択した件数情報の要素と病名に対応付けて、ポジティブ出現頻度をネガポジDB240に記憶する(ステップS1404)。
【0167】
つぎに、情報処理装置101は、ポジティブ出現頻度からネガティブ出現頻度を引くことにより、ネガポジ度数を算出する(ステップS1405)。そして、情報処理装置101は、選択した件数情報の要素と病名に対応付けて、算出したネガポジ度数をネガポジDB240に記憶する(ステップS1406)。
【0168】
つぎに、情報処理装置101は、ネガポジ件数テーブル800から選択されていない未選択の件数情報があるか否かを判断する(ステップS1407)。ここで、未選択の件数情報がある場合(ステップS1407:Yes)、情報処理装置101は、ステップS1303に戻る。
【0169】
一方、未選択の件数情報がない場合(ステップS1407:No)、情報処理装置101は、本フローチャートによる一連の処理を終了する。なお、情報処理装置101は、選択した件数情報の要素と病名に対応付けて、選択した件数情報のネガティブ件数およびポジティブ件数をネガポジDB240に記憶することにしてもよい。
【0170】
これにより、カルテで使用される単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値(ネガポジ度数)を登録することができる。
【0171】
つぎに、図15を用いて、図12に示したステップS1205のネガティブ件数算出処理の具体的な処理手順について説明する。
【0172】
図15は、ネガティブ件数算出処理の具体的処理手順の一例を示すフローチャートである。図15のフローチャートにおいて、まず、ステップS1201において選択した病名情報の病名開始日から転帰日までの期間Tを特定する(ステップS1501)。つぎに、情報処理装置101は、カルテDB230から、選択した病名情報の患者IDに対応するカルテ情報を抽出する(ステップS1502)。
【0173】
そして、情報処理装置101は、抽出したカルテ情報のうち、特定した期間Tに記載日が含まれるカルテ情報の中から選択されていない未選択のカルテ情報を選択する(ステップS1503)。つぎに、情報処理装置101は、選択したカルテ情報の記事を形態素解析して、当該記事を単語(形態素)単位に分解する(ステップS1504)。
【0174】
そして、情報処理装置101は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する(ステップS1505)。つぎに、情報処理装置101は、抽出した各単語について、選択したカルテ情報の記事における出現回数を算出する(ステップS1506)。
【0175】
そして、情報処理装置101は、算出した各単語の出現回数を、選択した病名情報の病名に対応するネガポジ件数テーブル800内の各単語のネガティブ件数に加算する(ステップS1507)。なお、ネガポジ件数テーブル800内に、病名情報の病名に対応する単語のレコードが存在しない場合は、情報処理装置101は、病名情報の病名に対応する単語のレコードを新規作成する。
【0176】
つぎに、情報処理装置101は、期間Tに記載日が含まれるカルテ情報の中から選択されていない未選択のカルテ情報があるか否かを判断する(ステップS1508)。ここで、未選択のカルテ情報がある場合(ステップS1508:Yes)、情報処理装置101は、ステップS1503に戻る。
【0177】
一方、未選択のカルテ情報がない場合(ステップS1508:No)、情報処理装置101は、ネガティブ件数算出処理を呼び出したステップに戻る。これにより、ネガティブに分類されたカルテ情報(転帰が「死亡」のカルテ情報)の記事における単語の出現回数をカウントすることができる。
【0178】
つぎに、図16を用いて、図12に示したステップS1207のポジティブ件数算出処理の具体的な処理手順について説明する。
【0179】
図16は、ポジティブ件数算出処理の具体的処理手順の一例を示すフローチャートである。図16のフローチャートにおいて、まず、ステップS1201において選択した病名情報の病名開始日から転帰日までの期間Tを特定する(ステップS1601)。つぎに、情報処理装置101は、カルテDB230から、選択した病名情報の患者IDに対応するカルテ情報を抽出する(ステップS1602)。
【0180】
そして、情報処理装置101は、抽出したカルテ情報のうち、特定した期間Tに記載日が含まれるカルテ情報の中から選択されていない未選択のカルテ情報を選択する(ステップS1603)。つぎに、情報処理装置101は、選択したカルテ情報の記事を形態素解析して、当該記事を単語(形態素)単位に分解する(ステップS1604)。
【0181】
そして、情報処理装置101は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する(ステップS1605)。つぎに、情報処理装置101は、抽出した各単語について、選択したカルテ情報の記事における出現回数を算出する(ステップS1606)。
【0182】
そして、情報処理装置101は、算出した各単語の出現回数を、選択した病名情報の病名に対応するネガポジ件数テーブル800内の各単語のポジティブ件数に加算する(ステップS1607)。
【0183】
つぎに、情報処理装置101は、期間Tに記載日が含まれるカルテ情報の中から選択されていない未選択のカルテ情報があるか否かを判断する(ステップS1608)。ここで、未選択のカルテ情報がある場合(ステップS1608:Yes)、情報処理装置101は、ステップS1603に戻る。
【0184】
一方、未選択のカルテ情報がない場合(ステップS1608:No)、情報処理装置101は、ポジティブ件数算出処理を呼び出したステップに戻る。これにより、ポジティブに分類されたカルテ情報(転帰が「寛解または治癒」のカルテ情報)の記事における単語の出現回数をカウントすることができる。
【0185】
(情報処理装置101の文書検索処理手順)
つぎに、図17および図18を用いて、情報処理装置101の文書検索処理手順について説明する。
【0186】
図17および図18は、情報処理装置101の文書検索処理手順の一例を示すフローチャートである。図17のフローチャートにおいて、まず、情報処理装置101は、クライアント装置201からの検索文字列を受け付けたか否かを判断する(ステップS1701)。
【0187】
ここで、情報処理装置101は、検索文字列を受け付けるのを待つ(ステップS1701:No)。そして、情報処理装置101は、検索文字列を受け付けた場合(ステップS1701:Yes)、診療対象の患者の病名を特定する(ステップS1702)。なお、診療対象の患者の病名を特定する情報は、検索文字列に対応付けられていてもよく、また、クライアント装置201や電子カルテシステムに問い合わせることにしてもよい。
【0188】
つぎに、情報処理装置101は、検索文字列を形態素解析して、当該検索文字列を単語(形態素)単位に分解する(ステップS1703)。そして、情報処理装置101は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する(ステップS1704)。つぎに、情報処理装置101は、抽出した各単語について、ネガポジDB240を参照して、特定した診療対象の患者の病名に対応するネガポジ度数を特定する(ステップS1705)。
【0189】
そして、情報処理装置101は、特定した各単語のネガポジ度数を積算することにより、検索文字列のネガポジ度数を算出する(ステップS1706)。つぎに、情報処理装置101は、カルテDB230から、検索文字列に対応するカルテ情報の記事を検索して(ステップS1707)、図18に示すステップS1801に移行する。
【0190】
なお、ステップS1707において、カルテ情報の記事が検索されなかった場合には、情報処理装置101は、例えば、検索文字列に対応する記事が検索されなかったことを示す検索結果を出力して、本フローチャートによる一連の処理を終了する。
【0191】
図18のフローチャートにおいて、まず、情報処理装置101は、検索された1または複数のカルテ情報の記事のうち選択されていない未選択の記事を選択する(ステップS1801)。つぎに、情報処理装置101は、選択した記事を形態素解析して、当該記事を単語(形態素)単位に分解する(ステップS1802)。
【0192】
そして、情報処理装置101は、分解した単語(形態素)のうち、特定の品詞の単語を抽出する(ステップS1803)。つぎに、情報処理装置101は、抽出した各単語について、ネガポジDB240を参照して、特定した診療対象の患者の病名に対応するネガポジ度数を特定する(ステップS1804)。
【0193】
そして、情報処理装置101は、特定した各単語のネガポジ度数を積算した値を、抽出した単語数で割ることにより、選択した記事のネガポジ度数を算出する(ステップS1805)。つぎに、情報処理装置101は、検索された1または複数のカルテ情報の記事のうち選択されていない未選択の記事があるか否かを判断する(ステップS1806)。
【0194】
ここで、未選択の記事がある場合(ステップS1806:Yes)、情報処理装置101は、ステップS1801に戻る。一方、未選択の記事がない場合(ステップS1806:No)、情報処理装置101は、算出した各記事のネガポジ度数と検索文字列のネガポジ度数とに基づいて、各記事の優先度を決定する(ステップS1807)。
【0195】
そして、情報処理装置101は、検索した1または複数のカルテ情報の記事を、決定した優先度が高い順に並べた検索結果をクライアント装置201に出力して(ステップS1808)、本フローチャートによる一連の処理を終了する。これにより、検索文字列に応じて、ポジティブまたはネガティブの条件を加味した検索結果を出力することができる。
【0196】
なお、情報処理装置101は、ステップS1807において、さらに、各記事のネガポジ度数に基づいて、各記事の表示態様を決定することにしてもよい。この場合、情報処理装置101は、ステップS1808において、決定した表示態様で各記事を出力する。
【0197】
以上説明したように、実施の形態にかかる情報処理装置101によれば、ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部710を参照して、処理対象となる単語について、ポジティブまたはネガティブに分類可能な文書それぞれにおける単語の出現頻度に基づき、単語のネガポジ度数を算出し、算出したネガポジ度数を単語と対応付けて第2の記憶部720に登録することができる。単語のネガポジ度数は、単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値である。
【0198】
これにより、単語が持つポジティブまたはネガティブの意味合いの傾向を特定することが可能となり、ひいては、ポジティブまたはネガティブの条件を加味した文書検索を実現することができる。
【0199】
また、情報処理装置101によれば、検索文字列を受け付け、文書群から検索文字列に対応する文書を検索し、検索文字列に対応する1または複数の文書が検索された場合、第2の記憶部720を参照して、検索された各文書に含まれる単語に対応するネガポジ度数に基づき、各文書のネガポジ度数を算出することができる。また、情報処理装置101によれば、第2の記憶部720を参照して、検索文字列に含まれる単語に対応するネガポジ度数に基づき、検索文字列のネガポジ度数を算出することができる。そして、情報処理装置101によれば、算出した各文書のネガポジ度数と検索文字列のネガポジ度数とに基づいて、検索文字列に対応する検索結果を出力することができる。文書群は、例えば、第1の記憶部710に記憶された文書群である。
【0200】
これにより、単語が持つポジティブまたはネガティブの意味合いの傾向から、その単語を含む文書が持つポジティブまたはネガティブの意味合いの傾向を推定して、ポジティブまたはネガティブの条件を加味した文書検索を行うことができる。
【0201】
また、情報処理装置101によれば、各文書のネガポジ度数と検索文字列のネガポジ度数とに基づいて、検索した1または複数の文書のうち、検索文字列とネガポジ度数が近い文書を優先して検索結果として出力することができる。
【0202】
これにより、ポジティブまたはネガティブな意味合いの傾向の強さが検索文字列と同程度である文書(例えば、カルテ記事)を優先して検索結果として出力することができる。
【0203】
また、情報処理装置101によれば、検索文字列のネガポジ度数に基づいて、検索文字列をポジティブまたはネガティブに分類し、検索文字列をポジティブに分類した場合、各文書のネガポジ度数に基づいて、検索した1または複数の文書のうち、ポジティブな意味合いの傾向が強い文書を優先して出力することができる。また、情報処理装置101によれば、検索文字列をネガティブに分類した場合、各文書のネガポジ度数に基づいて、検索した1または複数の文書のうち、ネガティブな意味合いの傾向が強い文書を優先して出力することができる。
【0204】
これにより、検索文字列がポジティブまたはネガティブのいずれに分類されたかに応じて、ポジティブまたはネガティブのいずれの傾向が強い文書を優先して出力するのかを決めることができる。
【0205】
また、情報処理装置101によれば、各文書のネガポジ度数に基づいて、各文書の表示態様を決定し、各文書を検索結果として出力する際に、決定した表示態様で各文書を出力することができる。
【0206】
これにより、検索文字列に対応する検索結果を表示する際に、ポジティブな意味合いの文書と、ネガティブな意味合いの文書とを判別可能に表示することができる。
【0207】
また、情報処理装置101によれば、第1の記憶部710(カルテDB230)に記憶された文書である患者のカルテ情報の記事を、その患者の転帰に応じてポジティブまたはネガティブに分類することができる。
【0208】
これにより、例えば、患者の転帰が「寛解または治癒」であるか、または、「死亡」であるかに応じて、病気の治療中に記載されたカルテ記事を、ポジティブまたはネガティブに分類することができる。
【0209】
また、情報処理装置101によれば、第1の記憶部710(カルテDB230)に記憶された文書(カルテ情報の記事)のうち、各病名に対応する文書それぞれにおける単語の出現頻度に基づき、単語のネガポジ度数を算出することができる。そして、情報処理装置101によれば、算出したネガポジ度数を、単語と各病名とに対応付けて第2の記憶部720(ネガポジDB240)に登録することができる。
【0210】
これにより、カルテ記事で使用された単語のネガポジ度数を、病名ごとの単語の使われ方を考慮して求めることができる。例えば、ある病気ではネガティブな意味合いで使う単語であっても、他の病気ではポジティブな意味合いで使うことがある。このような病名ごとの使われ方の特性を考慮することで、単語が持つポジティブまたはネガティブの意味合いの傾向を精度よく特定することが可能となる。
【0211】
また、情報処理装置101によれば、第2の記憶部720(ネガポジDB240)を参照して、検索された各文書(カルテ情報の記事)に含まれる単語について、診療対象の患者の病名に対応するネガポジ度数を特定し、特定した各文書に含まれる単語のネガポジ度数に基づき、各文書のネガポジ度数を算出することができる。また、情報処理装置101によれば、第2の記憶部720を参照して、検索文字列に含まれる単語について、診療対象の患者の病名に対応するネガポジ度数を特定し、特定した検索文字列に含まれる単語のネガポジ度数に基づき、検索文字列のネガポジ度数を算出することができる。
【0212】
これにより、検索文字列やカルテ記事のネガポジ度数を、病名ごとの単語の使われ方を考慮して求めることができ、検索文字列やカルテ記事が持つポジティブまたはネガティブの意味合いの傾向を精度よく特定することが可能となる。
【0213】
これらのことから、実施の形態にかかる情報処理装置101および文書検索システム200によれば、ポジティブまたはネガティブの条件を加味した文書検索を実現することで、ユーザにとって必要な情報をより早く簡単に見つけ出せるようにして、文書検索を行う際の作業効率を向上させることができる。
【0214】
なお、本実施の形態で説明した文書検索方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本文書検索プログラムは、ハードディスク、フレキシブルディスク、CD-ROM、DVD、USBメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本文書検索プログラムは、インターネット等のネットワークを介して配布してもよい。
【0215】
また、本実施の形態で説明した情報処理装置101は、スタンダードセルやストラクチャードASIC(Application Specific Integrated Circuit)などの特定用途向けICやFPGAなどのPLD(Programmable Logic Device)によっても実現することができる。
【0216】
上述した実施の形態に関し、さらに以下の付記を開示する。
【0217】
(付記1)ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部を参照して、処理対象となる単語について、前記ポジティブまたはネガティブに分類可能な文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
算出した前記指標値を前記単語と対応付けて第2の記憶部に登録する、
処理をコンピュータに実行させることを特徴とする文書検索プログラム。
【0218】
(付記2)検索文字列を受け付け、
文書群から前記検索文字列に対応する文書を検索し、
前記検索文字列に対応する1または複数の文書が検索された場合、前記第2の記憶部を参照して、前記1または複数の文書の各文書に含まれる単語に対応する指標値に基づき、前記各文書の指標値を算出し、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語に対応する指標値に基づき、前記検索文字列の指標値を算出し、
算出した前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記検索文字列に対応する検索結果を出力する、
処理を前記コンピュータに実行させることを特徴とする付記1に記載の文書検索プログラム。
【0219】
(付記3)前記出力する処理は、
前記各文書の指標値と前記検索文字列の指標値とに基づいて、前記1または複数の文書のうち、前記検索文字列と指標値が近い文書を優先して検索結果として出力する、ことを特徴とする付記2に記載の文書検索プログラム。
【0220】
(付記4)前記検索文字列の指標値に基づいて、前記検索文字列をポジティブまたはネガティブに分類する、処理を前記コンピュータに実行させ、
前記出力する処理は、
前記検索文字列をポジティブに分類した場合、前記各文書の指標値に基づいて、前記1または複数の文書のうち、ポジティブな意味合いの傾向が強い文書を優先して出力し、
前記検索文字列をネガティブに分類した場合、前記各文書の指標値に基づいて、前記1または複数の文書のうち、ネガティブな意味合いの傾向が強い文書を優先して出力する、
ことを特徴とする付記2に記載の文書検索プログラム。
【0221】
(付記5)前記各文書の指標値に基づいて、前記各文書の表示態様を決定する、処理を前記コンピュータに実行させ、
前記出力する処理は、
前記各文書を検索結果として出力する際に、決定した前記表示態様で前記各文書を出力する、ことを特徴とする付記2~4のいずれか一つに記載の文書検索プログラム。
【0222】
(付記6)前記第1の記憶部に記憶された文書は、患者のカルテ情報であり、前記患者の転帰に応じてポジティブまたはネガティブに分類可能である、ことを特徴とする付記2~5のいずれか一つに記載の文書検索プログラム。
【0223】
(付記7)前記第1の記憶部に記憶された文書は、前記患者の病名に対応付けられており、
前記単語の指標値を算出する処理は、
前記第1の記憶部に記憶された文書のうち、各病名に対応する文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
前記登録する処理は、
算出した前記指標値を、前記単語と前記各病名とに対応付けて前記第2の記憶部に登録する、ことを特徴とする付記6に記載の文書検索プログラム。
【0224】
(付記8)前記各文書の指標値を算出する処理は、
前記第2の記憶部を参照して、検索された前記各文書に含まれる単語について、診療対象の患者の病名に対応する指標値を特定し、
特定した前記各文書に含まれる単語の指標値に基づき、前記各文書の指標値を算出し、
前記検索文字列の指標値を算出する処理は、
前記第2の記憶部を参照して、前記検索文字列に含まれる単語について、前記診療対象の患者の病名に対応する指標値を特定し、
特定した前記検索文字列に含まれる単語の指標値に基づき、前記検索文字列の指標値を算出する、ことを特徴とする付記7に記載の文書検索プログラム。
【0225】
(付記9)前記文書群は、前記第1の記憶部に記憶された文書群である、ことを特徴とする付記2~8のいずれか一つに記載の文書検索プログラム。
【0226】
(付記10)前記処理対象となる単語は、前記第1の記憶部に記憶された文書に含まれる単語である、ことを特徴とする付記1~9のいずれか一つに記載の文書検索プログラム。
【0227】
(付記11)ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部を参照して、処理対象となる単語について、前記ポジティブまたはネガティブに分類可能な文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出し、
算出した前記指標値を前記単語と対応付けて第2の記憶部に登録する、
処理をコンピュータが実行することを特徴とする文書検索方法。
【0228】
(付記12)ポジティブまたはネガティブに分類可能な文書を登録した第1の記憶部を参照して、処理対象となる単語について、前記ポジティブまたはネガティブに分類可能な文書それぞれにおける前記単語の出現頻度に基づき、前記単語が持つポジティブまたはネガティブな意味合いの傾向を示す指標値を算出する算出部と、
前記算出部によって算出された前記指標値を前記単語と対応付けて第2の記憶部に登録する登録部と、
を含むことを特徴とする文書検索システム。
【符号の説明】
【0229】
101 情報処理装置
110,710 第1の記憶部
120,720 第2の記憶部
111,112 文書
200 文書検索システム
201 クライアント装置
210 ネットワーク
220 病名DB
230 カルテDB
240 ネガポジDB
300 バス
301 CPU
302 メモリ
303 ディスクドライブ
304 ディスク
305 通信I/F
306 可搬型記録媒体I/F
307 可搬型記録媒体
701 第1の受付部
702 算出部
703 登録部
704 第2の受付部
705 検索部
706 決定部
707 出力部
800 ネガポジ件数テーブル
910,1100 キーワード検索画面
920,1000 検索結果画面
921,922,923,924 カルテ記事
931,932,933,934 ネガポジ度数情報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18