(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-28
(45)【発行日】2023-03-08
(54)【発明の名称】同一事象判定プログラム、同一事象判定方法および同一事象判定システム
(51)【国際特許分類】
G06F 16/36 20190101AFI20230301BHJP
【FI】
G06F16/36
(21)【出願番号】P 2019075954
(22)【出願日】2019-04-11
【審査請求日】2022-01-11
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100104190
【氏名又は名称】酒井 昭徳
(72)【発明者】
【氏名】森 達也
(72)【発明者】
【氏名】前田 一穂
【審査官】酒井 恭信
(56)【参考文献】
【文献】特開2003-316795(JP,A)
【文献】特開2010-211361(JP,A)
【文献】特開2012-256197(JP,A)
【文献】特開2003-263458(JP,A)
【文献】米国特許出願公開第2008/0059187(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00 - 16/958
(57)【特許請求の範囲】
【請求項1】
複数の組織がそれぞれ保有するマスター
のデータベースにそれぞれアクセスし、
任意の二つの単語が一つの前記マスター
のデータベース内に存在するか否かを、それぞれの前記マスター
のデータベースについて照合し、
それぞれの
前記マスターのデータベースについての前記照合の結果に基づき
、前記二つの単語が同一事象であるか否かを示す同一事象指標値を算出し、
算出した前記同一事象指標値を同一の記憶部に記録する、
処理をコンピュータに実行させることを特徴とする同一事象判定プログラム。
【請求項2】
それぞれの前記マスターのデータベースについての前記照合の結果に基づき、前記二つの単語がともに存在する前記マスター
のデータベースの数を算出
し、前記同一事象指標値として、前記二つの単語がともに存在する前記マスターのデータベースの数に応じた値を算出する、
ことを特徴とする請求項1に記載の同一事象判定プログラム。
【請求項3】
それぞれの前記マスターのデータベースについての前記照合の結果に基づき、前記同一事象指標値として、
前記照合の対象とする
前記マスター
のデータベースの総数に対する二つの単語が両方とも存在したマスター
のデータベースの数
の比率に応じた値を算出する、
ことを特徴とする請求項1に記載の同一事象判定プログラム。
【請求項4】
前記二つの単語として、任意の多数の単語集合のなかから類似する二つの単語を抽出する、
ことを特徴とする請求項1~3のいずれか一つに記載の同一事象判定プログラム。
【請求項5】
複数の組織がそれぞれ保有するマスター
のデータベースにアクセスし、
任意の二つの単語が一つの前記マスター
のデータベース内に存在するか否かを、それぞれの前記マスター
のデータベースについて照合し、
それぞれの
前記マスターのデータベースについての前記照合の結果に基づき
、前記二つの単語が同一事象であるか否かを示す同一事象指標値を算出し、
算出した前記同一事象指標値を同一の記憶部に記録する、
処理をコンピュータが実行することを特徴とする同一事象判定方法。
【請求項6】
複数の組織がそれぞれ保有するマスター
のデータベースにアクセスし、
任意の二つの単語が一つの前記マスター
のデータベース内に存在するか否かを、それぞれの前記マスター
のデータベースについて照合するマスター照合部と、
それぞれの
前記マスターのデータベースについての前記照合の結果に基づき
、前記二つの単語が同一事象であるか否かを示す同一事象指標値を算出する同一事象指標算出部と、
算出した前記同一事象指標値を記録する記憶部と、
を備えたことを特徴とする同一事象判定システム。
【請求項7】
多数の単語集合のなかから類似する二つの単語の組を複数抽出し、各組の前記二つの単語を前記マスター照合部に出力する類似単語抽出部、
を備えたことを特徴とする請求項6に記載の同一事象判定システム。
【請求項8】
二つの単語を取得し、
複数の組織がそれぞれ保有するマスター
のデータベースにアクセスし、
複数の前記マスター
のデータベースの内の少なくとも1以上のマスター
のデータベースに前記二つの単語の
両方が存在する場合は、前記二つの単語は
同一事象でないと判定する、
処理をコンピュータに実行させることを特徴とする同一事象判定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、異なる単語が同一事象であるか否かを判定する同一事象判定プログラム、同一事象判定方法および同一事象判定システムに関する。
【背景技術】
【0002】
複数の組織では、それぞれ同じような種類の情報が蓄積されたデータベースが存在している。例えば、複数の組織それぞれのデータベースを統合する場合、ある組織のデータベースのマスターに記載されている単語が、他の組織のマスターの単語と同じ事象(ものや行為等)を示すかどうかを精度よく判定する必要がある。例えば、病院で用いられる電子カルテは、複数の病院にそれぞれ同じ医療情報が蓄積されているデータベースである。ここで、病院1の電子カルテに記載された薬品(薬名)が、他の病院2の薬品と違っていた場合、データベース統合時には、同一の薬品か否かを判定する必要が生じる。
【0003】
従来技術として、類義語を推定する技術がある。類義語の推定では、例えば、共通の文字が多く使われている単語同士を、類義語と推定する。他にも、word2vecという技術がある。この技術は、類義語なら文章中で同じような使われ方をすることに着目する。具体的には、文章中にでてくる前後の語句が共通なら同義語とみなす。
【0004】
類義語抽出に関連する技術として、文書群から共起関係等の類似性により同義語候補を抽出し、抽出した定型文中の非定型部分を同義語候補から除外する技術が開示されている(例えば、下記特許文献1参照。)。また、閲覧商品のセッション情報から、ある単語の短期的セッションを抽出し、抽出した中で、共起頻度が所定値以上で単語IDF(単語の重要度)が閾値以下となる単語を同義語候補から除外する技術が開示されている(例えば、下記特許文献2参照。)。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2014-132406号公報
【文献】特開2013-164751号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来技術では、単語の使われ方が同じである単語は、同じ意味であるとして判断されている。しかし、同じ使われ方でも、実際の事象は異なる場合がある。例えば、ある病院1では、花粉症として診断された患者に薬品Aを処方するが、他の病院2では、薬品Bを処方することを想定する。この例において、AとBとの薬品の用途は「花粉症の患者に処方される」という点では共通しているが、別の薬品である。ここで、従来技術では、薬品Aと薬品Bとの製品名に例えば共通する文字が複数含まれているなど類似している場合に、同じ薬品である確率が高いと判断されてしまう。このような抽出結果をそのまま用いてデータベース統合した場合、統合したデータベースには、実際には異なる薬品である薬品Aと薬品Bとが「花粉症の患者に処方される」同一の薬品として登録されてしまう問題が生じる。
【0007】
一つの側面では、本発明は、二つの異なる単語が同一の事象であるか否かを精度良く判定できることを目的とする。
【課題を解決するための手段】
【0008】
本発明の一側面によれば、複数の組織がそれぞれ保有するマスターのデータベースにそれぞれアクセスし、任意の二つの単語が一つの前記マスターのデータベース内に存在するか否かを、それぞれの前記マスターのデータベースについて照合し、それぞれの前記マスターのデータベースについての前記照合の結果に基づき、前記二つの単語が同一事象であるか否かを示す同一事象指標値を算出し、算出した前記同一事象指標値を同一の記憶部に記録する、ことを要件とする。
【発明の効果】
【0009】
本発明の一態様によれば、二つの異なる単語が同一の事象であるか否かを精度良く判定できるという効果を奏する。
【図面の簡単な説明】
【0010】
【
図1】
図1は、本発明による同一事象判定処理の概要を説明する図である。
【
図2】
図2は、実施の形態にかかる同一事象判定装置のハードウェア構成例を示す図である。
【
図3】
図3は、実施の形態にかかる同一事象判定装置の構成例1を示すブロック図である。
【
図4】
図4は、実施の形態にかかる同一事象判定装置の構成例2を示すブロック図である。
【
図5】
図5は、実施の形態にかかる同一事象判定装置による同一事象判定例1を示すフローチャートである。
【
図6】
図6は、実施の形態にかかる同一事象判定装置によるデータ処理の具体例1を説明する図である。
【
図7】
図7は、実施の形態にかかる同一事象判定装置による同一事象判定例2を示すフローチャートである。
【
図8】
図8は、実施の形態にかかる同一事象判定装置によるデータ処理の具体例2を説明する図である。
【
図9】
図9は、実施の形態にかかる同一事象判定装置による同一事象判定例3を示すフローチャートである。
【
図10】
図10は、実施の形態にかかる同一事象判定装置によるデータ処理の具体例3を説明する図である。
【
図11】
図11は、実施の形態にかかる同一事象判定装置によるデータ処理の具体例4を説明する図である。
【発明を実施するための形態】
【0011】
以下に図面を参照して、開示の同一事象判定プログラム、同一事象判定方法および同一事象判定システムの実施の形態を詳細に説明する。
【0012】
図1は、本発明による同一事象判定処理の概要を説明する図である。
図1に示すように、異なる複数の組織1~nでは、同じような種類の情報が蓄積されたデータベースが存在する。例えば、各組織1~nは、それぞれ同様の種類の情報のマスター1を有する。マスターは、データベースに記録する静的な情報である。同様に、各組織1~nは、それぞれ同様の種類の情報のマスター2がデータベース化されている。このように、組織は同様の種類の情報のマスターのデータベースを有しており、組織は、例えば、企業、団体等、所定の集合体である。
【0013】
同一事象判定システムは、同一事象判定装置100が各組織1~nのマスターのデータベースにアクセスする構成である。例えば、同一事象判定装置100は、各組織1~nのサーバに通信接続し、マスターのデータベースにアクセスする。
【0014】
同一事象判定装置100は、例えば、ある組織のマスターに記載されている単語が、他組織のマスターの単語と同じ事象(ものや行為等)を示すかどうかを精度よく判定する。例えば、同一事象判定装置100は、異なる二つの単語X,Yについて、ある組織1のマスター1に記載されている単語Xが組織2~nのマスターの単語Yと同じ事象であるかどうかを判定する。
【0015】
例えば、組織が病院である場合、マスター1は、各病院で使用する電子カルテで用いる「薬品」の情報であり、マスター2は、各病院で使用する電子カルテで用いる「病名」の情報である。電子カルテは、複数の病院(組織1~n)にそれぞれ同じ医療情報が蓄積されているデータベースである。
【0016】
実施の形態の同一事象判定装置100は、例えば、「薬品」に関する同一事象判定を行う場合、各組織1~nの「薬品」のマスター1にアクセスする。そして、同一事象判定装置100は、組織1「病院1」のマスター1に記載された「薬品X」と、組織2「病院2」のマスター1に記載された「薬品Y」とが同一の薬品であるか否かを判定し、判定結果として同一事象指標を出力する。
【0017】
実施の形態では、データベースのマスターが、所定の特性を持っていることを利用して、精度よく類義語を判定する。すなわち、どの組織1~nでも、組織内のマスターには、同じ事象(例えば、薬品)が別々の単語として同時に記載されることはない(確率は低い)。この特性は、一般にデータベースは正規化(データの重複をなくし、整合的にデータを取り扱うこと)されているためである。この場合、マスターは同一の事象を別々の単語として保持しない。同一事象判定装置100は、このような特性に着目することで、以下のように二つの異なる単語が同一の事象か判断する。
【0018】
1.二つの異なる単語が同じ事象であった場合、どの組織のマスターにもその二つの単語は同時に出現しない(確率が低い)。
2.二つの異なる単語が同じ事象でなかった場合、その二つの単語が同時に記載されたマスターが、いずれかの組織には存在する可能性が高い。
【0019】
例えば、ある組織1「病院1」では、花粉症として診断された患者に「薬品A」を処方するが、ある組織2「病院2」では、「薬品B」を処方する。このようなケースでは、薬品の使い方が「花粉症の患者に処方される」という点では病院1,2で共通しているが、「薬品A」と「薬品B」は別の薬である。ここで、従来技術では、「薬品A」と「薬品B」は同じ薬品である確率が高いと判断してしまう。
【0020】
これに対し、実施の形態の同一事象判定装置100は、二つの単語X「薬品A」,単語Y「薬品B」について、同じ事象であるか否かを判定する。例えば、「薬品A」と「薬品B」という二つの単語X,Yが同じ事象か否かを示す「同一事象指標」を算出する。「同一事象指標」は、二つの異なる単語が、同一の事象(ものや行為等)を示すのか、否かを示す指標である。実施の形態によれば、ある組織「病院」のマスター1には「薬品A」と「薬品B」という異なる表記があることを「同一事象指標」で提示する。
図1には、二つの単語X,Yが外部入力される形で記載したが、同一事象判定装置100がマスター1にアクセスした際に、これら二つの単語X,Yを取得してもよい。
【0021】
このように、実施の形態の同一事象判定装置100を用いることでデータの利活用を拡大でき、例えば、異なる組織1~組織nのデータの統合を効率的に行えるようになる。例えば、全国に多数ある病院1~病院nのマスター(データベース)を統合して、保険商品の開発や、製薬プロセスの効率化、診断支援AI等の開発を行うことができるようになる。
【0022】
ここで、ある組織1「病院1」内の電子カルテのシステムでは、「病院1」で使いやすい単語が用いられる傾向がある。このため、同一事象でも、「病院1」と異なる「病院2」~「病院n」では、それぞれ異なる表記の単語が用いられることが多い。例えば、「病院1」では、事象を正式名称で管理するが、他の「病院2」では略称で管理している。このため、異なる「病院1」~「病院n」のデータを統合して利活用するには、「同一事象=同一表記」となるよう、表記を揃える必要がある。このデータの統合時には、異なる表記の単語が同一事象であるか否かを判断するための辞書(類義語の対応表に相当)を用意する必要がある。この辞書を作るのに工数がかかるため、できるだけ自動化したい要望がある。そのため、ある単語同士が同一事象であるかを、高精度に自動判定したいという要望がある。
【0023】
実施の形態では、例えば、マスターのデータの統合等のために、ある単語同士が同一事象であるかを高精度で自動判定する。この同一事象指標を用いることで、異なる組織1「病院1」~組織n「病院n」のデータの統合を効率的に行えるようになる。
【0024】
同一事象判定装置100は、上記判断を行うために、二つの単語が各組織のマスターに同時に記載されているか判断するマスター照合部101と、マスター照合部101の照合結果(記載されているか否か)を統合的に見て、二つの単語が同じ事象か否かを示す「同一事象指標」を算出する同一事象指標算出部102と、を含む。
【0025】
マスター照合部101は、組織1「病院1」のマスター1に、単語X「薬品A」と、単語Y「薬品B」が同時に記載されているか判断する(照合1)。同様に、組織2「病院2」のマスター1に、単語X「薬品A」と、単語Y「薬品B」が同時に記載されているか判断する(照合2)。マスター照合部101は、同様の処理により、組織n「病院n」のマスター1に、単語X「薬品A」と、単語Y「薬品B」が同時に記載されているか否かを判断する(照合n)。
【0026】
同一事象指標算出部102は、マスター照合部101が照合したN個の照合結果「照合1」~「照合n」に基づき、二つの単語が同じ事象か否かを示す「同一事象指標」を算出する。この際、同一事象指標算出部102は、単語X,Yが同時に存在するマスター数(both_use)、および、単語X,Yのどちらかが存在している組織数(Share)を算出する。
【0027】
また、同一事象指標算出部102では、同一事象指標値を、下記処理Aのみ、あるいは処理Bまたは処理Cに基づき算出する。処理Aは、同一事象指標値の算出の基本処理である。処理Bと処理Cは、処理Aの処理内容の発展形であり、同一事象指標算出部102は、処理Aに代えて、処理Bまたは処理Cを実施する。
【0028】
処理Aでは、マスター照合部101のN個の照合結果「照合1」~「照合n」が、全ての組織において、二つの単語が同時に含まれなかった場合に、同一事象指標として値「1」を出力し、それ以外の場合に値「0」を出力する。
【0029】
処理Bでは、マスター照合部101のN個の照合結果「照合1」~「照合n」に基づき、二つの単語が両方とも同一マスターに存在した組織の数が大きくなるに従い、小さな同一事象指標を算出する。例えば、同一事象指標=1-(二つの単語が両方とも同一マスターに存在した組織の数)/(全組織の数)を算出する。ここで、上記処理Aでは、同じ事象のものを別の単語としてマスターに記載している組織が一つでもある場合に判定を誤ってしまう場合があるが、処理Bによれば、この誤判定を防ぐことができる。例えば、一部の組織が歴史的経緯(システム移行)等により同じ意味の単語を二重管理したケースに対応できる。
【0030】
処理Cでは、二つの単語のマスター登録数を考慮し、二つの単語が両方とも同一マスターに存在した組織の数が大きくなるに従い、また、二つの単語のいずれかがマスターに存在する組織の数が小さくなるに従い、小さな同一事象指標を算出する。例えば、同一事象指標=1-(二つの単語が両方とも同一マスターに存在した組織の数)/(二つの単語のいずれかがマスターに存在する組織の数)を算出する。この場合、二つの単語X,Yを使っている組織が少ない場合に、同一事象指標が高くなることを防止できる。
【0031】
なお、同一事象判定装置100のマスター照合部101は、二つの単語X,Yについて、例えば、既存の技術(類義語検索等)の手法を用い、互いに似た使われ方をしていると判定された単語X,Yとしてもよい。
【0032】
ここで、同一事象指標算出部102に、二つの単語X,Yの単語類似度を入力する場合には下記の処理A~処理Cとなる。
【0033】
処理Aでは、マスター照合部101のN個の照合結果「照合1」~「照合n」が、全ての組織において、二つの単語が同時に含まれていない場合に、同一事象指標として、例えば、単語類似度の値を出力し、それ以外の場合に値「0」を出力する。値「0」の場合、いずれかの組織に二つの単語X,Yが同時に含まれていることを示す。
【0034】
処理Bでは、マスター照合部101のN個の照合結果「照合1」~「照合n」に基づき、例えば、同一事象指標=単語類似度×(1-(二つの単語が両方とも同一マスターに存在した組織の数)/(全組織の数))を算出する。
【0035】
処理Cでは、二つの単語のマスター登録数を考慮し、例えば、同一事象指標=単語類似度×(1-(二つの単語が両方とも同一マスターに存在した組織の数)/(二つの単語のいずれかがマスターに存在する組織の数)を算出する。
【0036】
図2は、本発明の同一事象判定装置のハードウェア構成例を示す図である。同一事象判定装置100は、例えば、
図2に示すハードウェアからなる汎用のサーバで構成することができる。
【0037】
同一事象判定装置100は、CPU(Central Processing Unit)201、メモリ202、ネットワークインタフェース(IF)203、記録媒体IF204、記録媒体205、を含む。200は各部を接続するバスである。
【0038】
CPU201は、同一事象判定装置100の全体の制御を司る制御部として機能する演算処理装置である。メモリ202は、不揮発性メモリおよび揮発性メモリを含む。不揮発性メモリは、例えば、CPU201のプログラムを格納するROM(Read Only Memory)である。揮発性メモリは、例えば、CPU201のワークエリアとして使用されるDRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory)等である。
【0039】
ネットワークIF203は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワーク210に対する通信インタフェースである。同一事象判定装置100は、ネットワークIF203を介してネットワーク210に通信接続する。例えば、同一事象判定装置100は、ネットワーク210を介して、対象のマスターのデータベースを保持する組織(病院)のサーバにアクセスする。
【0040】
記録媒体IF204は、CPU201が処理した情報を記録媒体205との間で読み書きするためのインタフェースである。記録媒体205は、メモリ202を補助する記録装置であり、HDD(Hard Disk Drive)や、SSD(Solid State Drive)、USB(Universal Serial Bus)フラッシュドライブ等を用いることができる。
【0041】
メモリ202または記録媒体205に記録されたプログラムをCPU201が実行することにより、
図1に示した同一事象判定装置100の各機能(マスター照合部101、同一事象指標算出部102)を実現する。また、メモリ202や記録媒体205は、同一事象判定装置100が扱う情報を記録保持する。
【0042】
図3は、実施の形態にかかる同一事象判定装置の構成例1を示すブロック図である。
図3に示す同一事象判定装置100は、
図1に示したマスター照合部101と、同一事象指標算出部102、の各機能を含む。
【0043】
マスター照合部101は、入力された二つの単語X,Yが各組織1~nのマスター(例えばマスター1)に同時に記載されているか判断する。そして、同一事象指標算出部102は、単語X,Yが同時に存在するマスター数(both_use)を計算する。そして、上記処理Aの実行により、各マスター照合部のN個の照合結果(記載されているか否か)から、二つの単語が同じ事象か否かを示す同一事象指標「0/1」を求め、出力する。
【0044】
図4は、実施の形態にかかる同一事象判定装置の構成例2を示すブロック図である。
図4に示す同一事象判定装置100は、
図3同様の構成のマスター照合部101、同一事象指標算出部102のほかに、類似単語抽出部401の機能を有する。
【0045】
類似単語抽出部401は、少なくとも単語集合から、同一事象を表す単語X,Yの組の候補を抽出し、マスター照合部101に単語X,Yを出力する機能を有する。この際、外部入力される単語集合から、単語X,Yの組み合わせを計算する。
【0046】
また、類似単語抽出部401は、異なる単語X,Y同士の類似度を算出し、類似度が大きい単語X,Yのみを抽出してもよい。これにより、同一事象を表す可能性が低い単語X,Yの組み合わせに対しては、マスター照合部101および同一事象指標算出部102での処理を不要にでき、装置全体の処理を効率化できるようになる。この単語X,Y同士の類似度の計算は、例えば、レーベンシュタイン距離を用い、レーベンシュタイン距離の逆数を類似度とすればよい。
【0047】
また、類似単語抽出部401は、単語そのもの以外に、単語に関わる特徴量(例えば、単語X,Yが含まれる文章)等を取得し、この特徴量を類似度の算出に利用してもよい。
【0048】
また、上記の説明では、二つの異なる単語X,Yを抽出する例について説明したが、二つ以上の単語の組を用いて同一事象指標の算出処理を行ってもよい。この場合、類似単語抽出部401は、複数の単語の組を抽出する。この場合、マスター照合部101は、各組毎に照合結果×Nを算出し、同一事象指標算出部102は各組毎に同一事象指標を算出すればよい。この場合、同一事象指標算出部102は、単語類似度も鑑みて同一事象指標を算出する。
【0049】
また、外部入力される単語集合、および単語に関わる特徴量は、マスターを保持しているN個の「組織1~n」からそれぞれ取得して統合したものでもよい。また、マスターを保持しているN個の「組織1~n」とは関係なく、取得してもよい。例えば、インターネット上に公開されている論文等から取得した文章を用いてもよい。さらには、文章に限らず、時系列データでもよい。これら文章や時系列データを用いることで、同時に使われている単語や、単語と同時、あるいは、前後の状況を特徴量(例えば、時間帯)として取得することができる。これによって、類似単語抽出部401では、「似た使われ方」の単語を精度よく求めることができる。
【0050】
(同一事象の各判定例)
次に、同一事象判定装置100が行う二つの単語X,Yに対する同一事象の各判定例について説明する。同一事象判定装置100の制御部(CPU201)は、プログラム実行することで、同一事象判定の処理を行う。この際、制御部は、二つの単語X,Yについて、構成例1または構成例2に基づき、同一事象指標の算出対象の二つの単語X,Yがマスター照合部101に入力される。例えば、構成例1の場合には、同一事象指標を算出する二つの単語X,Yは、例えばユーザ操作によりマスター照合部101に手動入力され、構成例2の場合には、類似単語抽出部401が抽出してマスター照合部101に入力する。そして、制御部は、抽出した二つの単語X,Yに対し、上記処理A~処理Cで説明した同一事象指標の算出処理を行う。
【0051】
図5は、実施の形態にかかる同一事象判定装置による同一事象判定例1を示すフローチャートである。はじめに、制御部(マスター照合部101)は、単語の組(二つの単語X,Y)の入力を待機する(ステップS501:Noのループ)。単語の組が入力されると(ステップS501:Yes)、制御部は、必要な全マスターの照合を終了したか判定する(ステップS502)。この照合は、
図1で示した各組織1~nのマスター1~nに対する照合1~nに相当する。
【0052】
必要な全マスターの照合が終了していなければ(ステップS502:No)、制御部は、未照合のマスターを取得し(ステップS503)、取得したマスターに単語Xと単語Yが同時に存在するか照合を行い(ステップS504)、ステップS502の処理に戻る。
【0053】
そして、全マスターの照合が終了すれば(ステップS502:Yes)、制御部(同一事象指標算出部102)は、単語X,Yが同時に存在するマスター数(both_use)を計算する(ステップS505)。
【0054】
また、制御部(同一事象指標算出部102)は、処理Aの実施による同一事象指標を算出し、単語X,Yが同時に存在するマスター数(both_use)がなければ(0の場合)には同一事象指標として「1」を出力し、それ以外(正の値)の場合「0」を出力し(ステップS506)、以上の処理を終了する。
【0055】
図6は、実施の形態にかかる同一事象判定装置によるデータ処理の具体例1を説明する図である。
図5に示した同一事象判定例1に対応する具体的なデータ処理例を示す。
図6には、構成例1または2により、同一事象指標を算出する対象の単語X,Yが薬品であり、単語Xは「ピペラジンアジピン酸塩」、単語Yは「アジピン酸ピペラジン」である。これら単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」は、互いに類似する(似た使われ方をする)薬品である。
【0056】
同一事象判定装置100のマスター照合部101は、入力された単語X,Yに基づき、各組織1~nに相当する「病院1~n」の薬品のマスター600にアクセスする。例えば、「病院1」の薬品のマスター600aには、「ピペラジンアジピン酸塩」、「アトロピン硫酸塩水和物」、…、の各単語が記憶保持されているとする。
【0057】
そして、マスター照合部101は、単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の両方が「病院1~n」のそれぞれのマスター600に存在するか否かを照合処理し、照合結果601を求める。この照合結果601では、「病院1」のマスター600aには、単語X,Yの両方が存在せず(記号:×)、「病院2」のマスター600bにも、単語X,Yの両方が存在しない(記号:×)ことが示されている。
【0058】
そして、同一事象指標算出部102は、マスター照合部101の照合結果601に基づき、単語X,Yについての同一事象指標算出結果602を算出する。
図6の例の場合、同一事象指標算出部102は、単語X,Yの同時利用組織数(both_use)が「0」であると算出する。
【0059】
また、同一事象指標算出部102は、処理Aの実施により、同一事象指標値「1」を算出する。同一事象判定装置100(制御部)は、同一事象指標算出部102が算出した同一事象指標算出結果602を外部出力する。
【0060】
上記処理によれば、同一事象指標算出結果602として、単語X,Yが同時に存在するマスター数(both_use)と、同一事象指標値を得ることができる。上記例では、全ての「病院1~n」のマスター600のうち、全ての病院のマスター600に単語X,Yが同時に存在しないことを示す。
【0061】
また、同一事象指標算出結果602として、「全ての病院1~nに二つの単語X,Yが同時に含まれていない」という条件を満たしている旨を、同一事象指標値「1」で示している。すなわち、同一事象指標値「1」の場合、全ての病院1~nに二つの単語が同時に含まれないことを明確に示すことができる。例えば、照合結果601が全ての病院A=×、病院B=×、病院C=×のとき、同一事象指標値は初めて「1」となる。病院A~Cのいずれか一つでも、照合結果に〇があれば、同一事象指標値は「0」となる。この同一事象指標算出結果602により、例えば、これら全ての「病院1~n」のマスターを統合した共通マスターの作成時、あるいはマスター間の共通辞書の作成時における単語に関する注意事項を明確に提示できるようになる。
【0062】
図7は、実施の形態にかかる同一事象判定装置による同一事象判定例2を示すフローチャートである。はじめに、制御部(マスター照合部101)は、単語の組(二つの単語X,Y)の入力を待機する(ステップS701:Noのループ)。単語の組が入力されると(ステップS701:Yes)、制御部は、必要な全マスターの照合を終了したか判定する(ステップS702)。
【0063】
必要な全マスターの照合が終了していなければ(ステップS702:No)、制御部は、未照合のマスターを取得し(ステップS703)、取得したマスターに単語Xと単語Yが同時に存在するか照合を行い(ステップS704)、ステップS702の処理に戻る。
【0064】
そして、全マスターの照合が終了すれば(ステップS702:Yes)、制御部(同一事象指標算出部102)は、単語X,Yが同時に存在するマスター数(both_use)を計算する(ステップS705)。
【0065】
また、制御部(同一事象指標算出部102)は、処理Bの実施により、同一事象指標を、1-(二つの単語が両方とも同一マスターに存在した組織の数)/(全組織の数)に基づき算出し(ステップS706)、以上の処理を終了する。
【0066】
図8は、実施の形態にかかる同一事象判定装置によるデータ処理の具体例2を説明する図である。
図7に示した同一事象判定例2に対応する具体的なデータ処理例を示す。
図8においても、構成例1または2により、同一事象指標を算出する対象の単語Xが「ピペラジンアジピン酸塩」、単語Yが「アジピン酸ピペラジン」である例を示す。
【0067】
同一事象判定装置100のマスター照合部101は、入力された単語X,Yに基づき、各組織1~nに相当する「病院1~n」の薬品のマスター600にアクセスする。そして、マスター照合部101は、単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の両方が「病院1~n」のそれぞれのマスター600に存在するか否かを照合処理し、照合結果601を求める。照合結果601には、「病院1」のマスター600aには、単語X,Yの両方が存在せず(記号:×)、「病院2」のマスター600bには、単語X,Yの両方が存在している(記号:〇)ことが示されている。
【0068】
そして、同一事象指標算出部102は、マスター照合部101の照合結果に基づき、単語X,Yについての同一事象指標算出結果602を算出する。
図8の例の場合、同一事象指標算出部102は、単語X,Yの同時利用組織数(both_use)が「1」であると算出する。
【0069】
また、同一事象指標算出部102は、処理Bの実施により、同一事象指標値を、1-(二つの単語が両方とも同一マスターに存在した組織の数)/(全組織の数)に基づき「0.95」と算出する。同一事象指標値は、N(全マスター数)=20の場合で算出した。同一事象判定装置100(制御部)は、同一事象指標算出部102が算出した同一事象指標算出結果602を外部出力する。
【0070】
上記処理によれば、同一事象指標算出結果602として、単語X,Yが同時に存在するマスター数(both_use)と、同一事象指標を得ることができる。上記例では、全ての「病院1~n」のマスター600のうち、一部の病院(病院2)のマスター600bに単語X,Yが同時に存在することを示すことができる。
【0071】
また、同一事象指標算出結果602として、「全ての病院1~nに二つの単語X,Yが同時に含まれていない」という条件を満たしていない割合を、同一事象指標値「0.95」で明確に示している。値は「1」に近いほど「全ての病院1~nに二つの単語X,Yが同時に含まれていない」という条件を満たしていない(「全ての病院1~nに二つの単語X,Yが同時に含まれている」)旨を示す。このように同一事象指標値を処理Bにより細かく算出することで、全てのマスター600の同一事象指標(「全ての病院1~nに二つの単語X,Yが同時に含まれていない」)をより細かく提示できるようになる。
【0072】
図9は、実施の形態にかかる同一事象判定装置による同一事象判定例3を示すフローチャートである。はじめに、制御部(マスター照合部101)は、単語の組(二つの単語X,Y)の入力を待機する(ステップS901:Noのループ)。単語の組が入力されると(ステップS901:Yes)、制御部は、必要な全マスターの照合を終了したか判定する(ステップS902)。
【0073】
必要な全マスターの照合が終了していなければ(ステップS902:No)、制御部は、未照合のマスターを取得する(ステップS903)。そして、制御部は、今回取得した一つのマスターに単語Xと単語Yどちらか一方が存在するか照合を行い(ステップS904)、また、今回取得したマスターに単語Xと単語Yが同時に存在するか照合を行い(ステップS905)、ステップS902の処理に戻る。
【0074】
そして、全マスターの照合が終了すれば(ステップS902:Yes)、制御部(同一事象指標算出部102)は、単語X,Yのどちらかが存在している組織数(Share)を計算する(ステップS906)。また、単語X,Yが同時に存在するマスター数(both_use)を計算する(ステップS907)。
【0075】
そして、制御部(同一事象指標算出部102)は、処理Bの実施により、同一事象指標として、1-(二つの単語が両方とも同一マスターに存在した組織の数)/(全組織の数)に基づき算出する。また、制御部(同一事象指標算出部102)は、処理Cの実施により、同一事象指標=1-(二つの単語が両方とも同一マスターに存在した組織の数)/(二つの単語のいずれかがマスターに存在する組織の数)を算出する(ステップS908)。以上により、制御部は、一連の処理を終了する。
【0076】
図10は、実施の形態にかかる同一事象判定装置によるデータ処理の具体例3を説明する図である。
図9に示した同一事象判定例3に対応する具体的なデータ処理例1を示す。
図10においても、構成例1または2により、同一事象指標を算出する対象の単語Xが「ピペラジンアジピン酸塩」、単語Yが「アジピン酸ピペラジン」である例を示す。
【0077】
同一事象判定装置100のマスター照合部101は、入力された単語X,Yに基づき、各組織1~nに相当する「病院1~n」の薬品のマスター600にアクセスする。そして、マスター照合部101は、単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の両方が取得した一つのマスターに同時に存在するか照合した照合結果601aを求める。照合結果601aには、「病院1」のマスター600aには、単語X,Yの両方が同時に存在せず(記号:×)、「病院2」のマスター600bには、単語X,Yの両方が同時に存在している(記号:〇)ことが示されている。
【0078】
また、マスター照合部101は、単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の少なくともどちらか一方が取得した一つのマスターに同時に存在するか照合した照合結果601bを求める。照合結果601bには、「病院1」のマスター600aには、単語X,Yの少なくとも一方が存在し(記号:〇)、また、「病院2」のマスター600bにも単語X,Yの少なくとも一方が存在している(記号:〇)ことが示されている。
【0079】
そして、同一事象指標算出部102は、マスター照合部101の照合結果601a,601bに基づき、単語X,Yについての同一事象指標算出結果602を算出する。
図10の例の場合、同一事象指標算出部102は、照合結果601bに基づく処理Cの実施により、単語X,Yのいずれか一方を利用する利用組織数(Share)が「13」と算出する。また、照合結果601aに基づく処理Bの実施により、単語X,Yを同時に利用する同時利用組織数(both_use)が「1」であると算出する。また、同一事象指標算出部102は、同一事象指標算出結果602として、「全ての病院1~nに二つの単語X,Yが同時に含まれていない」という条件を満たしていない割合を、同一事象指標値「0.92」を算出する。そして、同一事象判定装置100(制御部)は、同一事象指標算出部102が算出した同一事象指標算出結果602を外部出力する。
【0080】
上記処理によれば、同一事象指標算出結果602として、単語X,Yのいずれか一方を利用する利用組織数(Share)と、単語X,Yが同時に存在するマスター数(both_use)と、同一事象指標を得ることができる。上記例では、全ての「病院1~n」のマスター600のうち、一部の病院(病院2)のマスター600bに単語X,Yが同時に存在することを示している。また、一部の病院(病院1,2)のマスター600a,600bには、単語X,Yの少なくともどちらか一方が存在することを示している。
【0081】
また、同一事象指標算出部102は、同一事象指標算出結果602として、「全ての病院1~nに二つの単語X,Yが同時に含まれていない」という条件を満たしていない割合を、同一事象指標値「0.92」で明確に示している。このように同一事象指標値を処理B,処理Cにより細かく算出することで、全てのマスター600の同一事象指標(「全ての病院1~nに二つの単語X,Yが同時に含まれていない」)をより細かく提示できるようになる。
【0082】
図11は、実施の形態にかかる同一事象判定装置によるデータ処理の具体例4を説明する図である。
図9に示した同一事象判定例3に対応する具体的なデータ処理例2を示す。上述した
図10に示したデータ処理例1は、一組(二つの単語X,Y)の入力であった。これに対し、この
図11に示すデータ処理例2では、構成例2で説明した類似単語抽出部401を設け、類似単語抽出部401が多数の単語集合の中から単語X,Yの組を複数求め、マスター照合部101に出力する構成である。
【0083】
図11において、同一事象判定装置100に入力される単語集合は、同一の薬品で異なる表記の薬品、または異なる薬品の集合体である。類似単語抽出部401は、この集合単語の中から任意(例えば総あたりで得た)の単語X,Yについてそれぞれの類似度を求める。
図11の例では、一組の単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の類似度は0.1と算出する。他の一組の単語X「ピペラジンアジピン酸塩」、単語Y「アトロピン硫酸塩水和物」の類似度は0.1と算出する。一組の単語X「アトロピン硫酸塩水和物」、単語Y「アトロピン硫酸塩」の類似度は0.333と算出する。
【0084】
同一事象判定装置100のマスター照合部101は、類似単語抽出部401が抽出した一組の単語X,Y毎に、各組織1~nに相当する「病院1~n」の薬品のマスター600にアクセスする。
【0085】
そして、マスター照合部101は、一組の単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の両方が取得した一つのマスターに同時に存在するか照合した照合結果601aを求める。照合結果601aには、「病院1」のマスター600aには、単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の両方が同時に存在していない(記号:×)ことが示されている。また、「病院2」のマスター600bには、単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の両方が同時に存在している(記号:〇)ことが示されている。
【0086】
また、マスター照合部101は、他の一組の単語X「ピペラジンアジピン酸塩」、単語Y「アトロピン硫酸塩水和物」の両方が取得した一つのマスターに同時に存在するか照合した照合結果601aを求める。照合結果601aには、「病院1」のマスター600aと、「病院2」のマスター600bには、単語X「ピペラジンアジピン酸塩」、単語Y「アトロピン硫酸塩水和物」の両方が同時に存在する(記号:〇)ことが示されている。以降も同様に、マスター照合部101は、他の一組の単語X,Yの両方が取得した一つのマスターに同時に存在するか照合した照合結果601aを求める。
【0087】
また、マスター照合部101は、一組の単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の少なくともどちらか一方が取得した一つのマスターに存在するか照合した照合結果601bを求める。照合結果601bには、「病院1」のマスター600aと、「病院2」のマスター600bには、単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」の少なくとも一方が存在している(記号:〇)ことが示されている。
【0088】
また、マスター照合部101は、他の一組の単語X「ピペラジンアジピン酸塩」、単語Y「アトロピン硫酸塩水和物」の少なくとも一方が取得した一つのマスターに存在するか照合した照合結果601bを求める。照合結果601bには、「病院1」のマスター600aと、「病院2」のマスター600bには、単語X「ピペラジンアジピン酸塩」、単語Y「アトロピン硫酸塩水和物」の少なくとも一方が存在している(記号:〇)ことが示されている。以降も同様に、マスター照合部101は、他の一組の単語X,Yの少なくとも一方が取得した一つのマスターに存在するか照合した照合結果601bを求める。
【0089】
そして、同一事象指標算出部102は、マスター照合部101の照合結果601a,601bに基づき、一組の単語X,Y毎に同一事象指標算出結果602を算出する。
図11の例の場合、同一事象指標算出部102は、照合結果601bに基づく処理Cの実施により、一組の単語X,Y毎に、単語X,Yのいずれか一方を利用する利用組織数(Share)を算出する。例えば、一組の単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」については、単語X,Yのいずれか一方を利用する利用組織数(Share)が「13」と算出する。
【0090】
また、照合結果601aに基づく処理Bの実施により、単語X,Yを同時に利用する同時利用組織数(both_use)を算出する。例えば、一組の単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」については、単語X,Yを同時に利用する同時利用組織数(both_use)が「1」と算出する。また、同一事象指標算出部102は、単語X「ピペラジンアジピン酸塩」、単語Y「アジピン酸ピペラジン」が、「全ての病院1~nに二つの単語X,Yが同時に含まれていない」という条件を満たしていない割合を、同一事象指標値「0.092」と算出する。この値は、類似度「0.1」の乗算により算出している。
【0091】
また、同一事象指標算出部102は、マスター照合部101の照合結果601a,601bに基づき、他の各組の単語X,Y毎に同一事象指標算出結果602を算出する。そして、同一事象判定装置100(制御部)は、同一事象指標算出部102が算出した同一事象指標算出結果602を外部出力する。
【0092】
上記処理によれば、同一事象指標算出結果602として、一組の単語X,Y毎に、単語X,Yのいずれか一方を利用する利用組織数(Share)と、単語X,Yが同時に存在するマスター数(both_use)と、同一事象指標を得ることができる。また、同一事象指標算出結果602として、「全ての病院1~nに二つの単語X,Yが同時に含まれていない」という条件を満たしていない割合を、一組の単語毎に同一事象指標値として明確に示すことができる。
【0093】
以上説明した実施の形態によれば、複数の組織1~nがそれぞれ保有するマスター1にアクセスし、任意の二つの単語X,Yが一つの組織1の一つのマスター1に存在するか否かを照合する。そして、照合の結果に基づき、全ての組織1~nのマスター1のそれぞれに、二つの単語X,Yが含まれているか否かを示す同一事象指標値を算出する。例えば、どの組織1~nでも、一つの組織内の一つのマスター1には、同じ事象(例えば、薬品)が別々の単語として同時に記載されることがないとする。この場合、どの組織のマスターにも二つの単語が同時に出現しない場合、二つの異なる単語が同じ事象と判断する。また、二つの単語が同時に記載されたマスターが、いずれかの組織のマスター1に存在する場合、二つの異なる単語が同じ事象ではないと判断する。
【0094】
また、二つの単語を取得し、複数の組織1~nがそれぞれ保有するマスター1にアクセスし、複数のマスター1の内の少なくとも1以上のマスター1に二つの単語X,Yのいずれもが存在する場合は、二つの単語X,Yの意味はそれぞれ異なると判定する。
【0095】
これにより、実施の形態によれば、二つの異なる単語が同一の事象であるか否かを精度良く判定できるようになる。そして、多数の組織のマスター(データベース)のデータを統合して利活用する際、「同一事象=同一表記」となるよう、表記を揃えるための事前作業を効率的に行うことができる。例えば、異なる表記の単語が同一事象であるか否かを判断するための辞書(類義語の対応表に相当)を容易に作成できるようになる。
【0096】
また、二つの単語X,Yがともに存在するマスターの数を算出してもよい。これにより、複数の組織それぞれのマスターのうち、二つの単語X,Yが存在するマスターの数を具体的に示すことができるようになる。
【0097】
また、照合の結果に基づき、全ての組織において、二つの単語X,Yが同時に含まれなかった場合に同一事象指標値を「1」、それ以外の場合に値を「0」と算出してもよい。これにより、対象とした一部の組織1~nのマスター1について、二つの単語X,Yが同時に含まれているか否かを最も簡単で明確な数値で示すことができる。
【0098】
また、照合の結果に基づき、同一事象指標値として、1-(二つの単語が両方とも同一マスターに存在した組織の数)/(全組織の数)を算出してもよい。これにより、対象とした全ての組織1~nのマスター1について、二つの単語X,Yが存在する全体の組織数に対する割合を具体的な数値で示すことができる。また、同じ事象のものを別の単語としてマスターに記載している組織が一つでもある場合の誤判定を防ぐことができる。
【0099】
また、二つの単語X,Yのいずれかが存在する組織1~nの数を算出してもよい。これにより、複数の組織のうち、二つの単語X,Yのいずれかが存在する組織の数を具体的に示すことができるようになる。
【0100】
また、照合の結果に基づき、同一事象指標値として、1-(二つの単語が両方とも同一マスターに存在した組織の数)/(二つの単語のいずれかがマスターに存在する組織の数)を算出してもよい。これにより、対象とした全ての組織1~nのマスター1について、二つの単語X,Yいずれかが存在する組織数に対し、二つの単語X,Yが両方とも存在する割合を具体的な数値で示すことができる。また、二つの単語X,Yを使っている組織が少ない場合に、同一事象指標が高くなることを防止できる。
【0101】
また、対象とする二つの単語を、任意の多数の単語集合のなかから類似する二つの単語の組を抽出してもよい。二つの単語の類似度は汎用の技術を用いることができ、類似度を用いて得た組毎の二つの単語を対象とすることで、同一事象指標にかかる全体処理を効率的に行えるようになる。例えば、複数のマスター1にアクセスして多数の単語集合が得られ、類似する二つの単語の組を多数の単語集合の中から抽出することができ、この後の同一事象指標算出にかかる処理を効率的に行えるようになる。
【0102】
また、同一事象指標を算出するシステム(同一事象判定装置100)は、対象となる組織のマスター1に通信接続するネットワークインタフェース203を備えてもよい。これにより、多数の組織のマスター1に対する通信接続で、これら多数の組織のマスター1に、二つの単語が含まれているか否かを示す同一事象指標値を算出する処理を効率的に行えるようになる。
【0103】
これらのことから、実施の形態によれば、異なる組織の同じ種類(例えば薬品)のマスター全てにおいて、二つの異なる単語が同一の事象(ものや行為等)として記載されているか否かを精度良く判定できるようになる。この点、従来の類義語判定の処理だけでは、例えば、二つの単語「薬品A」と「薬品B」が同じ薬品である確率が高いと誤判断されていた。これに対し、実施の形態では、これら異なる二つの薬品の単語が一つのマスターに同一の事象として記載されていることを明確に提示できるようになる。
【0104】
なお、本発明の実施の形態で説明した同一事象判定にかかる方法は、あらかじめ用意されたプログラムをサーバ等のプロセッサに実行させることにより実現することができる。本方法は、ハードディスク、フレキシブルディスク、CD-ROM(Compact Disc-Read Only Memory)、フラッシュメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また本方法は、インターネット等のネットワークを介して配布してもよい。
【0105】
上述した実施の形態に関し、さらに以下の付記を開示する。
【0106】
(付記1)複数の組織がそれぞれ保有するマスターにそれぞれアクセスし、
任意の二つの単語が一つの前記マスター内に存在するか否かを、それぞれの前記マスターについて照合し、
それぞれの前記マスターについて、前記照合の結果に基づき、一つの前記マスターに、前記二つの単語が含まれているか否かを示す同一事象指標値を算出し、
算出した前記同一事象指標値を同一の記憶部に記録する、
処理をコンピュータに実行させることを特徴とする同一事象判定プログラム。
【0107】
(付記2)さらに、前記二つの単語がともに存在する前記マスターの数を算出する、
ことを特徴とする付記1に記載の同一事象判定プログラム。
【0108】
(付記3)前記照合の結果に基づき、前記同一事象指標値として、
処理対象とするマスターの総数に対する二つの単語が両方とも存在したマスターの数に応じた値を算出する、
ことを特徴とする付記1に記載の同一事象判定プログラム。
【0109】
(付記4)前記二つの単語として、任意の多数の単語集合のなかから類似する二つの単語を抽出する、
ことを特徴とする付記1~3のいずれか一つに記載の同一事象判定プログラム。
【0110】
(付記5)複数の組織がそれぞれ保有するマスターにアクセスし、
任意の二つの単語が一つの前記マスター内に存在するか否かを、それぞれの前記マスターについて照合し、
それぞれの前記マスターについて、前記照合の結果に基づき、一つの前記マスターに、前記二つの単語が含まれているか否かを示す同一事象指標値を算出し、
算出した前記同一事象指標値を同一の記憶部に記録する、
処理をコンピュータが実行することを特徴とする同一事象判定方法。
【0111】
(付記6)複数の組織がそれぞれ保有するマスターにアクセスし、
任意の二つの単語が一つの前記マスター内に存在するか否かを、それぞれの前記マスターについて照合するマスター照合部と、
それぞれの前記マスターについて、前記照合の結果に基づき、一つの前記マスターに、前記二つの単語が含まれているか否かを示す同一事象指標値を算出する同一事象指標算出部と、
算出した前記同一事象指標値を記録する記憶部と、
を備えたことを特徴とする同一事象判定システム。
【0112】
(付記7)多数の単語集合のなかから類似する二つの単語の組を複数抽出し、各組の前記二つの単語を前記マスター照合部に出力する類似単語抽出部、
を備えたことを特徴とする付記6に記載の同一事象判定システム。
【0113】
(付記8)前記組織の前記マスターに通信接続するネットワークインタフェースを備えたことを特徴とする付記6または7に記載の同一事象判定システム。
【0114】
(付記9)二つの単語を取得し、
複数の組織がそれぞれ保有するマスターにアクセスし、
複数の前記マスターの内の少なくとも1以上のマスターに前記二つの単語のいずれもが存在する場合は、前記二つの単語の意味はそれぞれ異なると判定する、
処理をコンピュータに実行させることを特徴とする同一事象判定プログラム。
【符号の説明】
【0115】
100 同一事象判定装置
101 マスター照合部
102 同一事象指標算出部
201 CPU(制御部)
202 メモリ
203 ネットワークインタフェース(IF)
205 記録媒体
210 ネットワーク
401 類似単語抽出部
600 マスター
601(601a,601b) 照合結果
602 同一事象指標算出結果
X,Y (一組の)単語