(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024072348
(43)【公開日】2024-05-28
(54)【発明の名称】情報処理プログラム、情報処理方法および情報処理装置
(51)【国際特許分類】
G06F 16/27 20190101AFI20240521BHJP
G06F 16/215 20190101ALI20240521BHJP
【FI】
G06F16/27
G06F16/215
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022183076
(22)【出願日】2022-11-16
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002918
【氏名又は名称】弁理士法人扶桑国際特許事務所
(72)【発明者】
【氏名】池ヶ谷 剛
(72)【発明者】
【氏名】山本 嗣雅
(72)【発明者】
【氏名】青山 満雄
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175EA03
(57)【要約】
【課題】データの関連性判断の作業を効率化する情報を作成する。
【解決手段】情報処理装置1の処理部2は、共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、複数の項目のうち1以上の第1の項目のデータが一致し、複数の項目のうち1以上の第2の項目のデータが一致しないデータレコード11,12を抽出する。処理部2は、データレコード11,12のそれぞれに含まれる複数の項目のデータを表示した表示情報20を作成して出力する。処理部2は、この表示情報20において、1以上の第2の項目のデータを、1以上の第1の項目のデータとは異なる形態で表示する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
コンピュータに、
共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、前記複数の項目のうち1以上の第1の項目のデータが一致し、前記複数の項目のうち1以上の第2の項目のデータが一致しない第1のデータレコードおよび第2のデータレコードを抽出し、
前記第1のデータレコードと前記第2のデータレコードのそれぞれに含まれる前記複数の項目のデータを表示した表示情報であって、前記1以上の第2の項目のデータを、前記1以上の第1の項目のデータとは異なる形態で表示した前記表示情報を作成して出力する、
処理を実行させる情報処理プログラム。
【請求項2】
前記表示情報の作成では、前記1以上の第2の項目のデータのうち前記第1のデータレコードと前記第2のデータレコードとの間で一致しない第1の部分データ領域を、前記1以上の第2の項目のデータのうち前記第1のデータレコードと前記第2のデータレコードとの間で一致する第2の部分データ領域、および前記第1のデータレコードと前記第2のデータレコードの前記1以上の第1の項目のデータとは異なる形態で、前記表示情報に表示する、
請求項1記載の情報処理プログラム。
【請求項3】
前記表示情報の作成では、
あらかじめ記憶部に記憶された、データ不一致の発生原因を示す複数の原因情報の中から、前記第1の部分データ領域の位置、または前記第1の部分データ領域の内容の少なくとも一方に基づいて一の原因情報を選択し、
前記一の原因情報を前記表示情報に表示する、
請求項2記載の情報処理プログラム。
【請求項4】
前記複数の項目のそれぞれにはテキストが設定され、
前記表示情報の作成では、前記1以上の第2の項目のテキストのうち前記第1のデータレコードと前記第2のデータレコードとの間で一致しない第1の部分テキスト領域を、前記1以上の第2の項目のテキストのうち前記第1のデータレコードと前記第2のデータレコードとの間で一致する第2の部分テキスト領域、および前記第1のデータレコードと前記第2のデータレコードの前記1以上の第1の項目のテキストとは異なる形態で、前記表示情報に表示する、
請求項1記載の情報処理プログラム。
【請求項5】
前記コンピュータに、
前記複数の項目のうち、前記1以上の第1の項目と前記1以上の第2の項目との組合せがそれぞれ異なる複数の判定条件を用いて、前記複数のデータレコードの中から、前記1以上の第1の項目のデータが一致し、前記1以上の第2の項目のデータが一致しないデータレコードペアを、前記複数の判定条件ごとに1以上抽出する、
処理をさらに実行させ、
前記表示情報の作成では、前記複数の判定条件のうち一の判定条件の選択操作を受け付けると、前記一の判定条件を用いて抽出された前記データレコードペアのそれぞれについて、前記1以上の第2の項目のデータを、前記1以上の第1の項目のデータとは異なる形態で表示した前記表示情報を作成する、
請求項1記載の情報処理プログラム。
【請求項6】
前記表示情報の作成では、
前記一の条件を用いて抽出された前記データレコードペアのそれぞれについて、前記1以上の第2の項目のデータのうち、前記データレコードペアに含まれる前記第1のデータレコードと前記第2のデータレコードとの間で一致しない第1の部分データ領域を、前記1以上の第2の項目のデータのうち前記第1のデータレコードと前記第2のデータレコードとの間で一致する第2の部分データ領域、および前記第1のデータレコードと前記第2のデータレコードの前記1以上の第1の項目のデータとは異なる形態で、前記表示情報に表示し、
前記一の条件を用いて抽出された前記データレコードペアのそれぞれについて、データ不一致の発生原因を示す複数の原因情報の中から、前記一の条件と、前記第1の部分データ領域の位置、または前記第1の部分データ領域の内容の少なくとも一方とに基づいて一の原因情報を選択し、前記一の原因情報を前記表示情報に表示する、
請求項5記載の情報処理プログラム。
【請求項7】
前記コンピュータに、
前記複数の条件のそれぞれの内容を表示した第1の表示部と、前記複数の条件ごとに抽出された前記データレコードペアの数を表示した第2の表示部と、前記複数の条件のいずれかの選択操作を受け付ける入力部とを含む他の表示情報を作成して表示装置に表示させる、
処理をさらに実行させ、
前記表示情報の作成および出力では、前記入力部に対する入力操作によって前記一の条件が選択されると、前記一の条件に対応する前記表示情報を作成して前記表示装置に表示させる、
請求項5記載の情報処理プログラム。
【請求項8】
コンピュータが、
共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、前記複数の項目のうち1以上の第1の項目のデータが一致し、前記複数の項目のうち1以上の第2の項目のデータが一致しない第1のデータレコードおよび第2のデータレコードを抽出し、
前記第1のデータレコードと前記第2のデータレコードのそれぞれに含まれる前記複数の項目のデータを表示した表示情報であって、前記1以上の第2の項目のデータを、前記1以上の第1の項目のデータとは異なる形態で表示した前記表示情報を作成して出力する、
情報処理方法。
【請求項9】
共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、前記複数の項目のうち1以上の第1の項目のデータが一致し、前記複数の項目のうち1以上の第2の項目のデータが一致しない第1のデータレコードおよび第2のデータレコードを抽出し、
前記第1のデータレコードと前記第2のデータレコードのそれぞれに含まれる前記複数の項目のデータを表示した表示情報であって、前記1以上の第2の項目のデータを、前記1以上の第1の項目のデータとは異なる形態で表示した前記表示情報を作成して出力する、処理部、
を有する情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理プログラム、情報処理方法および情報処理装置に関する。
【背景技術】
【0002】
それぞれ個人データが蓄積された異なる種類のデータベース間の個人データ同士や、同じ種類のデータベース内の個人データ同士を突合することで同一人物の個人データを抽出する作業は、一般的に「名寄せ」と呼ばれる。名寄せ作業では、例えば、個人データに含まれる項目の中から突合対象とする複数の項目が「名寄せキー」として決定される。そして、個人データ間ですべての名寄せキーの登録データが一致した場合に、それらの個人データが同一人物のデータであると判定される。
【0003】
また、名寄せに関しては次のような技術が提案されている。例えば、計算機による名寄せに失敗したデータを顧客名の読みにしたがってソートするために、顧客名を単語単位に分割し、単語辞書を使用して顧客名を構成する単語とこの単語の他単語との接続条件の組合せから各単語の読みを求める顧客名集約方法が提案されている。また、名寄せ判定対象の項目に関する医療情報を記述している文字または数値の一致割合を患者間で算定し、算定された一致割合を、当該項目に関して必要な情報一致度と比較して、前者が後者を上回る場合に患者ペアが同一人物であると判定する医療情報管理システムが提案されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平7-192053号公報
【特許文献2】特開2011-257854号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、名寄せ対象の個人データの中には、同一人物のデータであっても一部の名寄せキーの登録データが一致しないものがある。例えば、事業所変更などによる保険証番号の変更や、結婚などによる名字の変更によってこのような個人データが発生し得る。上記のように「個人データ間ですべての名寄せキーの登録データが一致する」という判定条件を用いた場合には、このような個人データを正しく名寄せすることができず、名寄せの精度が高いとはいえないという問題がある。
【0006】
また、名寄せをコンピュータを用いて行うことで、個人データを目視して確認する場合よりも作業効率を高めることができる。しかし、コンピュータによって上記の判定条件を用いた名寄せを行っても、名寄せの精度が低いことに変わりはない。高精度な名寄せを行おうとすると、上記の判定条件に合致しなかった個人データを目視して確認しなければならず、名寄せの作業効率は低い。
【0007】
なお、上記の課題は、個人データの名寄せに限らず、データレコード間の関連性を判断する場合に発生し得る。
1つの側面では、本発明は、データの関連性判断の作業を効率化する情報を作成可能な情報処理プログラム、情報処理方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
1つの案では、コンピュータに、共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、複数の項目のうち1以上の第1の項目のデータが一致し、複数の項目のうち1以上の第2の項目のデータが一致しない第1のデータレコードおよび第2のデータレコードを抽出し、第1のデータレコードと第2のデータレコードのそれぞれに含まれる複数の項目のデータを表示した表示情報であって、1以上の第2の項目のデータを、1以上の第1の項目のデータとは異なる形態で表示した表示情報を作成して出力する、処理を実行させる情報処理プログラムが提供される。
【0009】
また、1つの案では、上記の情報処理プログラムに基づく処理と同様の処理をコンピュータが実行する情報処理方法が提供される。
さらに、1つの案では、上記の情報処理プログラムに基づく処理と同様の処理を実行する情報処理装置が提供される。
【発明の効果】
【0010】
1つの側面では、データの関連性判断の作業を効率化する情報を作成できる。
【図面の簡単な説明】
【0011】
【
図1】第1の実施の形態に係る情報処理装置の構成例および処理例を示す図である。
【
図2】第2の実施の形態に係る情報処理システムの構成例を示す。
【
図3】名寄せ支援装置のハードウェア構成例を示す図である。
【
図4】一般的な名寄せ作業の手順を示す比較例である。
【
図5】第2の実施の形態における名寄せ作業の流れを示す図である。
【
図6】名寄せ確認シートの第1の例を示す図である。
【
図7】名寄せ確認シートの第2の例を示す図である。
【
図8】名寄せ支援装置が備える処理機能の構成例を示す図である。
【
図9】名寄せ候補データベースのデータ構成例を示す図である。
【
図10】加入者情報データベースと他のデータベースとの名寄せ処理手順を示すフローチャートの例である。
【
図11】シート作成処理手順を示すフローチャートの例である。
【
図12】加入者情報の名寄せ処理手順を示すフローチャートの例である。
【
図13】失敗理由選択テーブルの構成例を示す図である。
【発明を実施するための形態】
【0012】
以下、本発明の実施の形態について図面を参照して説明する。
〔第1の実施の形態〕
図1は、第1の実施の形態に係る情報処理装置の構成例および処理例を示す図である。
図1に示す情報処理装置1は、処理部2を有する。処理部2は、例えばプロセッサである。
【0013】
この情報処理装置1は、複数のデータレコードの中から関連性の高いデータレコードのペアを抽出する作業を支援する。
図1では例として、複数のデータレコード(データレコード11,12,13,・・・)はデータベース10に登録されているものとする。また、データベース10に登録された各データレコードは、共通する複数の項目についてのデータを含む。
図1の例では、各データレコードは項目(A)~(C)のデータを含んでいる。
【0014】
これらの項目(A)~(C)は、例えば、関連性の高いデータレコードのペアを抽出するために使用される。この場合、データレコードの間で項目(A)~(C)のすべてのデータが一致したときに、それらのデータレコードの関連性が高いと判定される。一例として、データレコード11,12,13,・・・が医療データなどの個人データであるとする。この場合、データレコードの間で項目(A)~(C)のすべてのデータが一致したときに、それらのデータレコードは同一人物に関するデータレコードであると判定される。
【0015】
しかし、実際のデータレコードでは、項目(A)~(C)の一部のデータだけが一致した場合でもデータレコードの関連性が高い場合がある。上記の判定処理では、このようなデータレコードのペアを抽出できないという問題がある。
【0016】
これに対して、処理部2は、項目(A)~(C)の一部のデータのみが一致したデータレコードのペアを、データベース10から抽出する。具体的には、処理部2は、項目(A)~(C)のうち1以上の第1の項目のデータが一致し、それ以外の1以上の第2の項目のデータが一致しないデータレコードのペアを、データベース10から抽出する(ステップS1)。
【0017】
図1では例として、第1の項目として項目(A),(C)が適用され、第2の項目として項目(B)が適用される。そして、処理部2は、項目(A),(C)のデータが一致し、項目(B)のデータが一致しないデータレコードのペアとして、データレコード11,12を抽出したとする。
【0018】
次に、処理部2は、抽出されたデータレコード11,12のそれぞれに含まれる項目(A)~(C)のデータを表示した表示情報20を作成して出力する(ステップS2)。このとき、処理部2は、登録内容が異なっている項目(B)のデータを、登録内容が同じである項目(A),(C)のデータとは異なる形態で、表示情報20に表示する。
【0019】
図1の例では、表示情報20には、データレコード11に含まれる項目(A)~(C)のデータを表示した表示部21と、データレコード12に含まれる項目(A)~(C)のデータを表示した表示部22とが含まれる。データレコード11に含まれる項目(B)のデータ「efgh」と、データレコード12に含まれる項目(B)のデータ「efxy」とは異なっている。このため、表示部21,22では、項目(B)のデータの一部が下線付きで強調表示されており、項目(B)のデータは項目(A),(C)のデータとは異なる形態で表示されている。
【0020】
以上の処理により、情報処理装置1は、データの関連性判断の作業を効率化する情報を作成できる。すなわち、上記の表示情報20により、抽出されたデータレコード11,12の間でデータが異なっている箇所がわかりやすく表示される。表示情報20を視認したユーザは、表示情報20を視認することで、データレコード11,12との間でデータが異なっている箇所を直感的に認識できる。このため、表示情報20は、データレコード11,12の間の関連性を判断する作業を支援し、その作業効率を高めるために有用な情報となる。
【0021】
なお、
図1の例では、データレコード11に含まれる項目(B)のデータ「efgh」と、データレコード12に含まれる項目(B)のデータ「efxy」との間では、前者の「gh」の領域と後者の「xy」の領域のみが異なっている。そこで、表示部21,22では、項目(B)のデータのうち、データレコード11,12との間で異なっているデータ領域のみ、下線付きで強調表示されている。このような表示により、データレコード11,12の間でデータが異なっている箇所をより細かく提示できようになり、データの不一致箇所の表示がさらにわかりやすくなる。
【0022】
〔第2の実施の形態〕
次に、関連性の判断対象のデータレコードとして医療データが適用された情報処理システムについて説明する。
【0023】
図2は、第2の実施の形態に係る情報処理システムの構成例を示す。
図2に示す情報処理システムは、サーバ装置50と名寄せ支援装置100を含む。
サーバ装置50は、医療データを用いて各種の処理を実行するサーバコンピュータである。サーバ装置50には、それぞれ医療データが蓄積された1種類以上の医療情報データベースが接続されており、サーバ装置50は、それらの医療情報データベースにアクセス可能になっている。なお、例えば、サーバ装置50が複数設けられ、異なる種類の医療情報データベースがそれぞれ異なるサーバ装置50に接続されていてもよい。
【0024】
名寄せ支援装置100は、
図1に示した情報処理装置1の一例である。名寄せ支援装置100は、サーバ装置50に接続された医療情報データベースに蓄積された医療データの名寄せ作業を支援するコンピュータである。名寄せ支援装置100は、医療データに含まれる項目のうち、特定の項目を名寄せキーとして用いて名寄せ処理を実行する。
【0025】
名寄せでは一般的に、医療情報データベースに含まれる2つの医療データ間で、すべての名寄せキーのデータが一致した場合に、それらの医療データが同一人物のデータであると判定される。これに対して、名寄せ支援装置100は、このような「完全一致」という判定条件に該当しなかった医療データ(失敗データ)の中から、同一人物のデータである可能性がある医療データのペアを「名寄せ候補」として抽出する。名寄せ支援装置100は、抽出された名寄せ候補に関する情報をユーザに提示することで、失敗データに対するユーザの名寄せ作業を支援する。
【0026】
図3は、名寄せ支援装置のハードウェア構成例を示す図である。名寄せ支援装置100は、例えば、
図3に示すようなコンピュータとして実現される。
図3に示す名寄せ支援装置100は、プロセッサ101、RAM(Random Access Memory)102、HDD(Hard Disk Drive)103、GPU(Graphics Processing Unit)104、入力インタフェース(I/F)105、読み取り装置106および通信インタフェース(I/F)107を有する。
【0027】
プロセッサ101は、名寄せ支援装置100全体を統括的に制御する。プロセッサ101は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)またはPLD(Programmable Logic Device)である。また、プロセッサ101は、CPU、MPU、DSP、ASIC、PLDのうちの2以上の要素の組み合わせであってもよい。
【0028】
RAM102は、名寄せ支援装置100の主記憶装置として使用される。RAM102には、プロセッサ101に実行させるOS(Operating System)プログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、プロセッサ101による処理に必要な各種データが格納される。
【0029】
HDD103は、名寄せ支援装置100の補助記憶装置として使用される。HDD103には、OSプログラム、アプリケーションプログラム、および各種データが格納される。なお、補助記憶装置としては、SSD(Solid State Drive)などの他の種類の不揮発性記憶装置を使用することもできる。
【0030】
GPU104には、表示装置104aが接続されている。GPU104は、プロセッサ101からの命令にしたがって、画像を表示装置104aに表示させる。表示装置104aとしては、液晶ディスプレイや有機EL(ElectroLuminescence)ディスプレイなどを用いることができる。
【0031】
入力インタフェース105には、入力装置105aが接続されている。入力インタフェース105は、入力装置105aから出力される信号をプロセッサ101に送信する。入力装置105aとしては、キーボードやポインティングデバイスなどを用いることができる。ポインティングデバイスとしては、マウス、タッチパネル、タブレット、タッチパッド、トラックボールなどを用いることができる。
【0032】
読み取り装置106には、可搬型記録媒体106aが脱着される。読み取り装置106は、可搬型記録媒体106aに記録されたデータを読み取ってプロセッサ101に送信する。可搬型記録媒体106aとしては、光ディスク、半導体メモリなどがある。
【0033】
通信インタフェース107は、ネットワーク107aを介してサーバ装置50などの他の装置との間でデータの送受信を行う。
以上のようなハードウェア構成によって、名寄せ支援装置100の処理機能を実現することができる。なお、サーバ装置50も、
図3に示すようなコンピュータとして実現可能である。
【0034】
図4は、一般的な名寄せ作業の手順を示す比較例である。
図4では、コンピュータである名寄せ装置70を用いて自動的に名寄せ作業が行われる場合について例示する。
また、名寄せ対象データとしては、例として、加入者情報データベース(DB)61、健診情報データベース(DB)62、保険指導情報データベース(DB)63およびレセプトデータベース(DB)64が用いられるものとする。加入者情報データベース61には、健康保険組合の各加入者に関する基本的な情報が登録される。健診情報データベース62は、各加入者に対して行われた健康診断の診断結果を示す情報が登録される。保険指導情報データベース63には、各加入者に対して行われた保険指導の内容を示す情報が登録される。レセプトデータベース64には、各加入者が受けた保険診療に対する診療報酬の明細書を示す。なお、以下の説明では、これらの各データベース上の1つのレコードを「医療データ」と記載する場合がある。
【0035】
名寄せ装置70は、各データベースの医療データに含まれる項目のうち、各データベースに共通して含まれる特定の複数の項目を名寄せキーとして用いる、名寄せキーとしては、保険証の記号および番号、氏名、生年月日など、加入者に関する基本的な情報の項目が用いられる。
【0036】
名寄せ装置70は、上記の各データベースから2つの医療データを抽出して突合する。突合される2つの医療データは、異なるデータベースから抽出される場合もあるし、同一のデータベースから抽出される場合もある。
【0037】
名寄せ装置70は、突合される2つの医療データが同一人物のデータかを判定するための名寄せルール(判定条件)として、すべての名寄せキーのデータが一致するという一般的な方法を用いて名寄せ処理を実行する。このような名寄せ処理の結果、名寄せに成功したデータは名寄せ済みデータ80として出力される。名寄せ済みデータ80では、例えば、同一人物のデータと判定された2つの医療データに対して、同一の識別番号が付与されて管理される。
【0038】
ところが、実際には、同一人物の医療データの間で名寄せキーの一部のデータが一致しない場合がある。上記の名寄せルールでは、このような医療データのペアは同一人物のデータと判定されない。このため、上記の名寄せルールは名寄せ精度が低いという問題がある。
【0039】
例えば、健康保険組合が保有する医療データでは、事業所変更などによる保険証番号の変更や、結婚などによる名字の変更など、年度間で個人属性の変更が多く発生する。このため、本来は同一人物の医療データであっても名寄せキーの一部が一致しないケースが発生しやすい。このような医療データのペアを同一人物のデータと正確に判定するためには、ユーザ(作業者)が医療データのペアのデータ内容を1つずつ確認する必要があり、作業者の作業負荷が高い。名寄せの精度を上げようとするほど、膨大な確認作業が必要になってしまう。
【0040】
図5は、第2の実施の形態における名寄せ作業の流れを示す図である。本実施の形態において、名寄せ支援装置100は、上記のような名寄せキーの完全一致ではなく、特定の一部の名寄せキーのデータのみが一致するという名寄せルールを用いて、同一人物のデータである可能性がある医療データのペアを「名寄せ候補」として抽出する。名寄せ支援装置100は、このような名寄せルールを複数用いて名寄せ候補を抽出する。
【0041】
名寄せ支援装置100は、抽出された名寄せ候補に関する情報や、適用された名寄せルールなどの情報を示す名寄せ確認シート110を作成して出力する。ユーザは、名寄せ確認シート110も目視でチェックし、名寄せ確認シート110の内容を参考にしながら名寄せ候補についての名寄せ作業を行い、同一人物のデータか否かを判断することができる。
【0042】
このように、名寄せ支援装置100は、抽出された名寄せ候補に関する情報や適用された名寄せルールなどの情報をユーザにわかりやすく提示することで、完全一致による名寄せに失敗した医療データに対するユーザの名寄せ作業を支援する。名寄せ支援装置100による完全一致以外の名寄せルールに基づく自動的な名寄せ処理と、ユーザによる目視によるデータの確認というハイブリッドな名寄せ方法が実現されることで、ユーザは高精度な名寄せ作業を短時間で行うことが可能となり、ユーザの名寄せ作業効率を高めることができる。
【0043】
図6は、名寄せ確認シートの第1の例を示す図である。名寄せ支援装置100は、いずれかの名寄せルールに合致した医療データのペア(名寄せ候補)を、合致した名寄せルールごとにグルーピングする。
図6に示すグルーピングシート111は、グルーピングされた名寄せ候補の集計結果や名寄せルールの内容などを表示するための名寄せ確認シートである。このグルーピングシート111は、名寄せルール表示部111a、名寄せキー表示部111b、人数表示部111c、リンク表示部111d、判定可否表示部111eおよび確度表示部111fを含む。
【0044】
名寄せルール表示部111aには、名寄せルールを識別する情報が表示される。
図6の例では、名寄せルール表示部111aには、名寄せルールの識別番号と、名寄せルールの説明文とが表示されている。
【0045】
名寄せキー表示部111bには、名寄せキーの一覧と、各名寄せルールで一致・不一致が判定される判定対象キーを示す表示部とが表示される。名寄せキーの一覧としては、健康保険証の記号、健康保険証の番号、性別、漢字氏名情報、カナ氏名情報および生年月日情報が表示される。漢字氏名情報は、漢字の氏名(名字と下の名前)と、その氏名に含まれる名(下の名前)とに分類される。カナ氏名情報も、カナの氏名と、その氏名に含まれる名とに分類される。生年月日情報は、生年月日と生年月と生月日とに分類される。
【0046】
判定対象キーの表示部では、名寄せキーの一覧のうち、判定対象キーに対して丸印が表示される。名寄せ対象の医療データ間で、丸印が付いた判定対象キーのすべてについて登録データが一致した場合に、それらの医療データは対応する名寄せルールに合致した名寄せ候補と判定される。名寄せキー表示部111bは、各名寄せルールの内容をわかりやすく表示したものである。ユーザは、名寄せキー表示部111bを視認することで、名寄せルールごとにどの名寄せキーが一致しているかを直感的に理解できる。
【0047】
ここで、
図6に示す名寄せルールでは、漢字氏名情報とカナ氏名情報の一方のみが判定対象キーとして使用される。これにより、いずれの名寄せルールも、名寄せキーのうち一部のみが同一である医療データのペアを抽出可能な判定条件となっている。また、漢字氏名情報に含まれる名寄せキー(氏名、名)の一方のみが判定対象キーとして使用され、カナ氏名情報に含まれる名寄せキー(カナ氏名、カナ名)の一方のみが判定対象キーとして使用される。さらに、生年月日情報に含まれる名寄せキー(生年月日、生年月、生月日)のうちの1つのみが判定対象キーとして使用される。
【0048】
例えば、名寄せルール「1」では、医療データのペア間で、記号、番号、性別、氏名、生年月日の登録データが一致する場合に、そのペアが名寄せ候補として抽出される。氏名については、名字と下の名前の両方が一致している必要がある。一方、名寄せルール「3」では、医療データのペア間で、記号、番号、性別、名、生年月日の登録データが一致する場合に、そのペアが名寄せ候補として抽出される。氏名については、下の名前は一致しているが名字は一致していないことが条件となる。
【0049】
また、名寄せルール「2」では、医療データのペア間で、記号、番号、性別、カナ氏名、生年月日の登録データが一致する場合に、そのペアが名寄せ候補として抽出される。カナ氏名については、名字と下の名前の両方が一致している必要がある。一方、名寄せルール「4」では、医療データのペア間で、記号、番号、性別、カナ名、生年月日の登録データが一致する場合に、そのペアが名寄せ候補として抽出される。カナ氏名については、下の名前は一致しているが名字は一致していないことが条件となる。
【0050】
名寄せルール「3」、「4」は、医療データの特性に合った判定条件となっている。例えば、上記のように医療データでは、結婚などによって名字が変わってしまうケースがある。名寄せルール「3」、「4」は、このようなケースが発生した場合でも同一人物の医療データのペアを正確に抽出できるようにしたものである。
【0051】
人数表示部111cには、対応する名寄せルールに合致した医療データのペア数が「人数」として表示される。
リンク表示部111dには、後述する詳細シートを表示するためのリンクが表示される。詳細シートは名寄せルールごとに作成されるため、ユーザは、リンク表示部111dにおける所望の名寄せルールに対応するリンクを選択操作することで、その名寄せルールに対応する詳細シートを表示させることができる。
【0052】
判定可否表示部111eには、対応する名寄せルールが、医療データのペアが同一人物のデータかを判定可能なものか否かを示す情報が表示される。
確度表示部111fには、対応する名寄せルールに合致した医療データのペアが同一人物のデータである確度が表示される。
図6の例では、確度が「高」「中」「低」の3段階で示されている。ユーザは例えば、高い確度が示された名寄せルールに対応するリンクを選択操作することで、同一人物のデータである可能性が高い医療データのペアのみを確認することが可能となるので、確認作業の効率を高めることができる。
【0053】
なお、本実施の形態では例として、突合される医療データの1つの組み合わせ(ペア)に対しては、そのペアが複数の名寄せルールに合致する場合でも、いずれか1つの名寄せルールのみが対応付けられるものとする。例えば、1つの医療データのペアの名寄せ処理には、グルーピングシート111上の上位から順に名寄せルールが適用され、最初に合致した名寄せルールに対してその医療データのペアが対応付けられる。
【0054】
図7は、名寄せ確認シートの第2の例を示す図である。
図7に示す詳細シート112は、名寄せルールごとに作成される。
図6に示したリンク表示部111dのいずれかのリンクが選択操作された場合に、そのリンクに対応する詳細シート112が表示されることになる。
【0055】
詳細シート112は、対応する名寄せルールに合致した医療データのペアの内容を対比させて表示するための情報である。詳細シート112は、結束キー表示部112a、第1医療データ表示部112b、第2医療データ表示部112c、同一人物フラグ入力部112dおよび失敗理由表示部112eを含む。
【0056】
結束キー表示部112aには、名寄せ候補として抽出された医療データのペアを関連付けるためのユニークな結束キーが表示される。
第1医療データ表示部112bには、医療データのペアのうち一方の医療データの内容が表示される。第2医療データ表示部112cには、医療データのペアのうち他方の医療データの内容が表示される。これらのいずれの表示部にも、医療データを識別する識別番号と、名寄せキーの登録データとが表示される。名寄せキーとしては、記号、番号、氏名(漢字の氏名)、カナ氏名、性別および生年月日の登録データが表示される。
【0057】
例えば、加入者情報データベース61の各医療データ(加入者情報)と、他のデータベースの医療データとの間で名寄せが行われる場合、第1医療データ表示部112bには加入者情報データベース61の医療データが表示され、第2医療データ表示部112cには他のデータベースの医療データが表示される。また、
図7では、名寄せ済みの加入者情報データベース61の各医療データと、その後に更新された各医療データ(加入者情報)との間で名寄せが行われた場合を例示している。この場合、第1医療データ表示部112bには前者の医療データが「過去の登録データ」として表示され、第2医療データ表示部112cには後者の医療データが「今回の登録データ」として表示される。
【0058】
さらに、第1医療データ表示部112bおよび第2医療データ表示部112cでは、医療データ間で同一名寄せキーの登録データが異なる箇所が明示される。
図7の例では、登録データが異なる箇所が、下線付きで強調表示されている。ただし、他の方法の例としては、該当箇所を他の箇所とは異なる色で表示する方法などが採用されてもよい。
【0059】
図7の詳細シート112は、例として、
図6に示した名寄せルール「3」に合致した名寄せ候補を一覧表示している。結束キー「0000000324」のレコードでは、医療データ間で漢字の名字とカナの名字とが異なっている。このため、漢字の名字とカナの名字の部分が下線付きで強調表示されている。また、結束キー「0000020761」のレコードでは、医療データ間で漢字の名字の一部が異なっている。このため、漢字の名字のうち医療データ間で異なる部分が下線付きで強調表示されている。
【0060】
このような第1医療データ表示部112bおよび第2医療データ表示部112cは、名寄せ候補として抽出された医療データのペアが同一人物のものかをユーザが判断するために有用な情報を提供する。ユーザは、第1医療データ表示部112bと第2医療データ表示部112cとを視認することで、抽出された名寄せ候補のデータ登録内容を対比させて視認できるだけでなく、医療データ間でデータ登録内容が異なる箇所を容易に視認できる。すなわち、ユーザは、完全一致を判定条件とした名寄せにおいて、データのどの部分の不一致によって名寄せ失敗と判定されたかを容易に把握できるようになる。
【0061】
同一人物フラグ入力部112dでは、ユーザの操作によって同一人物フラグを入力可能になっている。第1医療データ表示部112bおよび第2医療データ表示部112cや、失敗理由表示部112eを確認したユーザが、医療データのペアが同一人物のものであると判断した場合に、同一人物フラグ入力部112dの対応箇所に同一人物フラグを入力可能である。
【0062】
同一人物フラグの有無は、詳細シート112のデータファイルに記録される。このため、ユーザは、詳細シート112を後から再度開いたときに、名寄せ成功と判断した医療データのペアを容易に確認でき、このペアの情報を名寄せ済みデータ80に登録できる。また、詳細シート112のデータファイルをコンピュータに取り込むことで、そのコンピュータが、名寄せ成功と判断された医療データのペアを自動的に抽出し、そのペアの情報を名寄せ済みデータに登録できるようになる。
【0063】
失敗理由表示部112eには、完全一致の判定条件を用いた名寄せで失敗したことに対する、考え得る失敗理由が表示される。表示される失敗理由は、名寄せルールごとにあらかじめ1つ以上用意されている。そして、第1医療データ表示部112bおよび第2医療データ表示部112cにおいて特定されたデータ登録内容の相違位置や相違内容に基づいて、用意された失敗理由の中から1つ以上が選択されて失敗理由表示部112eに表示される。
【0064】
このような失敗理由表示部112eも、第1医療データ表示部112bおよび第2医療データ表示部112cと同様に、名寄せ候補として抽出された医療データのペアが同一人物のものかをユーザが判断するために有用な情報を提供する。ユーザは、失敗理由表示部112eを視認することで、医療データのペアが、完全一致を判定条件とした名寄せにおいて名寄せ失敗と判定された理由を容易に確認できる。
【0065】
図8は、名寄せ支援装置が備える処理機能の構成例を示す図である。名寄せ支援装置100は、記憶部120、名寄せ処理部131およびシート作成処理部132を備える。
記憶部120は、例えばHDD103など、名寄せ支援装置100が備える記憶装置に確保された記憶領域である。記憶部120には、名寄せルールデータベース(DB)121、失敗理由データベース(DB)122、名寄せ辞書123および名寄せ候補データベース(DB)124が記憶される。
【0066】
名寄せルールデータベース121には、名寄せルールを示す情報が登録される。失敗理由データベース122には、名寄せルールごとに、詳細シート112の失敗理由表示部112eに表示するための失敗理由が1つ以上登録される。失敗理由データベース122には、医療データ間の登録データの一致・相違位置などに基づく失敗理由の選択条件がさらに登録されてもよい。
【0067】
名寄せ辞書123には、基本的に加入者情報が、レコードを識別するユニークな識別情報に対応付けて登録される。名寄せ辞書123には、登録されたレコードと同一人物のものと判定された他のレコードとを関連付ける情報が登録されてもよい。名寄せ候補データベース124には、名寄せルールごとに抽出された名寄せ候補の情報が登録される。
【0068】
名寄せ処理部131およびシート作成処理部132の処理は、例えば、プロセッサ101が所定のアプリケーションプログラムを実行することで実現される。
名寄せ処理部131は、加入者情報データベース61、健診情報データベース62、保険指導情報データベース63およびレセプトデータベース64のレコードを名寄せ対象データとして、名寄せルールにしたがって名寄せ処理を実行する。名寄せ処理部131は、名寄せ処理によって抽出された名寄せ候補の情報を名寄せ候補データベース124に登録する。
【0069】
シート作成処理部132は、名寄せ候補データベース124に基づいて、グルーピングシートファイル111_1や詳細シートファイル112_1a,112_1b,・・・を作成して出力する。グルーピングシートファイル111_1は、前述のグルーピングシート111のデータファイルである。詳細シートファイル112_1a,112_1b,・・・は、それぞれ個別の名寄せルールに対応する詳細シート112のデータファイルである。
【0070】
図9は、名寄せ候補データベースのデータ構成例を示す図である。名寄せ候補データベース124は、名寄せルールごとのテーブル124a,124b,124c,・・・を含む。
【0071】
テーブル124a,124b,124c,・・・のそれぞれには、対応する名寄せルールによって抽出された名寄せ候補を示すレコードが登録される。各レコードは、結束キー、名寄せ辞書のレコードを示す識別番号、名寄せ対象の他のデータベース(対象データベース)におけるレコードを示す識別番号を含む。各識別番号が、名寄せ候補として抽出された2つの医療データのそれぞれを識別する。結束キーは、2つの医療データを関連付けるためのユニークな識別番号である。
【0072】
次に、名寄せ支援装置100の処理について、フローチャートを用いて説明する。
図10は、加入者情報データベースと他のデータベースとの名寄せ処理手順を示すフローチャートの例である。名寄せ支援装置100は、まず、加入者情報データベース61と、その他のデータベースとの間で名寄せ処理を実行する。
【0073】
[ステップS11]名寄せ処理部131は、加入者情報データベース61の各加入者情報に対してユニークな識別情報を付与し、識別情報が付与された各加入者情報を登録した名寄せ辞書123を作成する。
【0074】
[ステップS12]名寄せ処理部131は、ステップS21までの処理ループを、名寄せ対象のデータベース(対象データベース)ごとに実行する。すなわち、ステップS21までの処理ループは、健診情報データベース62、保険指導情報データベース63、レセプトデータベース64をそれぞれ対象データベースとして実行される。
【0075】
[ステップS13]名寄せ処理部131は、対象データベースの医療データの中から1つ選択する。
[ステップS14]名寄せ処理部131は、名寄せ辞書123の加入者情報の中から、すべての名寄せキーのデータがステップS13で選択された医療データと一致する加入者情報を検索する。
【0076】
[ステップS15]名寄せ処理部131は、ステップS14の検索により名寄せ辞書123から該当する加入者情報が検索されたかを判定する。該当する加入者情報が検索された場合、処理がステップS16に進められ、該当する加入者情報が検索されなかった場合、処理がステップS17に進められる。
【0077】
[ステップS16]このケースでは、完全一致の判定条件による名寄せに成功したことになる。この場合、名寄せ処理部131は、例えば、名寄せ辞書123において、ステップS13で選択された医療データを、ステップS14で検索された加入者情報に関連付ける。
【0078】
[ステップS17]名寄せ処理部131は、ステップS13で選択された医療データと、名寄せ辞書123の各加入者情報との間で、完全一致でない名寄せルールをそれぞれ用いた名寄せを実行する。すなわち、名寄せ処理部131は、名寄せルールを1つずつ選択しながら、名寄せ辞書123の加入者情報の中から、選択した名寄せルールに合致する加入者情報を検索する。
【0079】
[ステップS18]名寄せ処理部131は、ステップS17の処理により、名寄せ辞書123から名寄せルールの1つに合致する加入者情報が検索されたかを判定する。いずれかの名寄せルールに合致する加入者情報が検索された場合、処理がステップS19に進められ、いずれかの名寄せルールに合致する加入者情報が検索されなかった場合、処理がステップS20に進められる。
【0080】
[ステップS19]名寄せ処理部131は、ステップS17で名寄せルールに合致した加入者情報と、ステップS13で選択された医療データとを、名寄せ候補データベース124のテーブルのうち合致した名寄せルールに対応するテーブルに名寄せ候補として登録する。また、名寄せ処理部131は、登録された名寄せ候補にユニークな結束キーを付与する。
【0081】
[ステップS20]名寄せ処理部131は、名寄せエラーと判定する。この場合、名寄せ処理部131は例えば、名寄せ辞書123に新たなレコードを追加し、ステップS13で選択された医療データを追加したレコードに登録する。また、名寄せ処理部131は、登録された医療データにユニークな識別情報を付与される。以後、名寄せ辞書123に追加されたレコードの情報は、加入者情報の1つとして取り扱われる。
【0082】
[ステップS21]名寄せ処理部131は、対象データベースの医療データのすべてについて処理済みかを判定する。処理済みでない医療データが存在する場合、処理がステップS13に進められ、処理済みでない医療データの1つが選択される。一方、すべての医療データが処理済みの場合、処理がステップS22に進められる。
【0083】
[ステップS22]ステップS12~S22の処理ループがすべての対象データベースを処理対象として実行されると、名寄せ処理が終了する。
図11は、シート作成処理手順を示すフローチャートの例である。
図10の名寄せ処理によって名寄せ候補データベース124が作成されると、この名寄せ候補データベース124を用いて
図11の処理が実行される。
【0084】
[ステップS31]シート作成処理部132は、ステップS37までの処理ループを名寄せルールごとに実行する。
[ステップS32]シート作成処理部132は、名寄せ候補データベース124のテーブルのうち処理対象の名寄せループに対応するテーブルから名寄せ候補のレコードを1つ選択し、名寄せ候補とされた2つの医療データのそれぞれから名寄せキーのデータを抽出する。
【0085】
[ステップS33]シート作成処理部132は、2つの医療データの間で同一名寄せキーのデータを比較し、データが不一致のデータ領域を抽出する。
[ステップS34]シート作成処理部132は、処理対象の名寄せルールと、ステップS33で抽出されたデータ領域の位置や内容とに基づいて、失敗理由データベース122から失敗理由を取得する。
【0086】
[ステップS35]シート作成処理部132は、名寄せ候補データベース124の全レコードについて処理済みかを判定する。処理済みでないレコードがある場合、処理がステップS32に進められ、処理済みでないレコードの中から1つが選択される。一方、すべてのレコードについて処理済みの場合、処理がステップS36に進められる。
【0087】
[ステップS36]シート作成処理部132は、詳細シート112を作成する。この詳細シート112では、ステップS33で取得された各名寄せ候補のデータが表示される。すなわち、名寄せ候補ごとに、名寄せ候補に含まれる一方の医療データと他方の医療データとが、詳細シート112に表示される。また、一方の医療データの表示部と他方の医療データの表示部では、ステップS33で抽出された、データが不一致のデータ領域が、例えばハイライト表示される。さらに、詳細シート112においては、名寄せ候補に対応付けて、ステップS34で取得された、名寄せ候補に対応する失敗理由が表示される。
【0088】
[ステップS37]ステップS31~S37の処理ループがすべての名寄せルールを処理対象として実行されると、処理がステップS38に進められる。
[ステップS38]シート作成処理部132は、名寄せ候補データベース124を参照して、名寄せルールごとに人数(名寄せルールに対応するテーブルに登録された名寄せ候補の数)をカウントする。
【0089】
[ステップS39]シート作成処理部132は、グルーピングシート111を作成する。グルーピングシート111においては、名寄せルール表示部111a、名寄せキー表示部111b、判定可否表示部111eおよび確度表示部111fには、あらかじめ決められた情報が表示される。また、名寄せルールごとの人数表示部111cには、ステップS38でカウントされた人数が名寄せルールに対応付けて表示される。リンク表示部111dには、ステップS36で名寄せルールごとに作成された詳細シート112を示すリンク情報が、名寄せルールに対応付けて表示される。
【0090】
図示しないが、シート作成処理部132は、例えば、ユーザの操作によってグルーピングシート111の表示が要求されると、ステップS39で作成されたグルーピングシート111をディスプレイに表示させる。また、リンク表示部111dに表示されたいずれかのリンク情報が選択操作されると、シート作成処理部132は、ステップS36で作成された詳細シート112のうち、選択操作されたリンク情報が示す詳細シート112をディスプレイに表示させる。
【0091】
図12は、加入者情報の名寄せ処理手順を示すフローチャートの例である。
図10の処理により名寄せ辞書123が作成されてから所定の時間が経過すると、
図12の処理が実行される。
図12の処理では、作成された名寄せ辞書123と、加入者情報データベース61の加入者情報のうち、名寄せ辞書123の作成後に更新された加入者情報との間で名寄せ処理が実行される。以下の説明では、後者の加入者情報を「更新された加入者情報」と記載する。更新された加入者情報には、加入者情報データベース61に新たに登録された加入者情報も含まれる。
【0092】
[ステップS41]名寄せ処理部131は、更新された加入者情報の中から加入者情報を1つ選択する。
[ステップS42]名寄せ処理部131は、名寄せ辞書123の加入者情報の中から、すべての名寄せキーのデータがステップS41で選択された加入者情報と一致する加入者情報を検索する。
【0093】
[ステップS43]名寄せ処理部131は、ステップS42の検索により該当する加入者情報が検索されたかを判定する。該当する加入者情報が検索された場合、処理がステップS44に進められ、該当する加入者情報が検索されなかった場合、処理がステップS45に進められる。
【0094】
[ステップS44]このケースでは、完全一致の判定条件による名寄せに成功したことになる。この場合、名寄せ処理部131は、例えば、名寄せ辞書123において、ステップS41で選択された加入者情報を、ステップS42で検索された加入者情報に関連付ける。
【0095】
[ステップS45]名寄せ処理部131は、ステップS41で選択された加入者情報と、名寄せ辞書123の加入者情報のそれぞれとの間で、完全一致でない名寄せルールをそれぞれ用いた名寄せを実行する。すなわち、名寄せ処理部131は、名寄せルールを1つずつ選択しながら、名寄せ辞書123の加入者情報の中から、選択した名寄せルールに合致する加入者情報データを検索する。
【0096】
[ステップS46]名寄せ処理部131は、ステップS45の処理により、名寄せ辞書123の中から名寄せルールの1つに合致する加入者情報が検索されたかを判定する。いずれかの名寄せルールに合致する加入者情報が検索された場合、処理がステップS47に進められ、いずれかの名寄せルールに合致する加入者情報が検索されなかった場合、処理がステップS48に進められる。
【0097】
[ステップS47]名寄せ処理部131は、ステップS45で名寄せルールに合致した加入者情報と、ステップS41で選択された加入者情報とを、名寄せ候補データベース124のテーブルのうち合致した名寄せルールに対応するテーブルに名寄せ候補として登録する。また、名寄せ処理部131は、登録された名寄せ候補にユニークな結束キーを付与する。なお、ステップS47での登録先の名寄せ候補データベース124は、
図13で使用される名寄せ候補データベース124とは別のデータベースである。
【0098】
[ステップS48]名寄せ処理部131は、名寄せエラーと判定する。この場合、名寄せ処理部131は例えば、名寄せ辞書123に新たなレコードを追加し、ステップS41で選択された加入者情報を追加したレコードに登録する。また、名寄せ処理部131は、登録された医療データにユニークな識別情報を付与される。
【0099】
[ステップS49]名寄せ処理部131は、更新された加入者情報のすべてについて処理済みかを判定する。処理済みでない加入者情報が存在する場合、処理がステップS41に進められ、更新された加入者情報のうち処理済みでない加入者情報の1つが選択される。一方、すべての加入者情報が処理済みの場合、名寄せ処理が終了する。
【0100】
以上の
図12の名寄せ処理によって名寄せ候補データベース124が新たに作成されると、この名寄せ候補データベース124を用いて
図11の処理が実行され、グルーピングシート111と名寄せルールごとの詳細シート112とが作成される。作成処理手順は
図11と同様であるので、図示を省略する。
図12で作成された名寄せ候補データベース124を用いて
図11の処理が実行されることで、更新された加入者情報と既存の名寄せ辞書123との間の名寄せ結果に基づくグルーピングシート111および詳細シート112が作成されることになる。
【0101】
ここで、詳細シート112の失敗理由表示部112eに表示する失敗理由の選択処理(
図11のステップS34に対応)について説明する。失敗理由は、例えば、
図13に示すような失敗理由選択テーブルに基づいて選択される。
【0102】
図13は、失敗理由選択テーブルの構成例を示す図である。
図13に示す失敗理由選択テーブル122aは、名寄せルールごとに作成されて失敗理由データベース122に登録される。
図13では、名寄せルール「3」に対応する失敗理由選択テーブル122aを例示している。
【0103】
失敗理由選択テーブル122aには、1以上の失敗理由に対して、失敗理由を選択するための選択条件が対応付けて登録される。ステップS34では、例えば、名寄せルールに対応する失敗理由選択テーブル122aが選択される。そして、選択された失敗理由選択テーブル122aの先頭側から選択条件が順に選択されて、データが相違する領域の位置や内容に基づき、選択された選択条件を満たすかが判定される。
【0104】
図13に示す1つ目の選択条件は、名寄せ候補内の各医療データの間で「漢字の名字、カナの名字のいずれも異なる」というものである。この選択条件を満たす場合、各医療データは同一人物に対応するものの、その人物の名字が結婚などによって変更となったことが失敗理由になった可能性がある。このような選択条件が満たされるケースは、更新前後の加入者情報が突合される
図12の処理において発生しやすい。換言すると、
図12の処理により、結婚などによって名字が変更されたことで同一人物の加入者情報が複数登録されてしまった場合でも、これらの加入者情報を同一人物か否かの判断の対象として抽出し、ユーザに同一人物であると判定してもらう機会を確実に与えることができるようになる。
【0105】
図13に示す2つ目の選択条件は、名寄せ候補内の各医療データの間で「カナの名字が一致し、漢字の名字の相違箇所に特定の字が含まれる」というものである。この選択条件を満たす場合、各医療データは同一人物に対応するものの、一方の医療データに対してシステムによる字つぶれや文字化けが発生したことが失敗理由になった可能性がある。
【0106】
図13に示す3つ目の選択条件は、名寄せ候補内の各医療データの間で「カナの名字が一致し、漢字の名字の相違箇所が新旧の字体になっている」というものである。この選択条件を満たす場合、各医療データは同一人物に対応するものの、名字の漢字として一方の医療データには旧字体が使用され、他方の医療データには新字体が使用されたことが失敗理由になった可能性がある。
【0107】
2つ目または3つ目の選択条件が満たされるケースは、
図10および
図12のいずれの処理でも発生し得る。本実施の形態では、字つぶれや文字化けの発生、あるいは新旧字体の使用によって同一人物の加入者情報が複数登録されてしまった場合でも、これらの加入者情報を同一人物か否かの判断の対象として抽出し、ユーザに同一人物であると判定してもらう機会を確実に与えることができるようになる。
【0108】
なお、上記の各実施の形態に示した装置(例えば、情報処理装置1、名寄せ支援装置100)の処理機能は、コンピュータによって実現することができる。その場合、各装置が有すべき機能の処理内容を記述したプログラムが提供され、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、磁気テープなどがある。光ディスクには、CD(Compact Disc)、DVD(Digital Versatile Disc)、ブルーレイディスク(Blu-ray Disc:BD、登録商標)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
【0109】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CDなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0110】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムにしたがった処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムにしたがった処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムにしたがった処理を実行することもできる。
【符号の説明】
【0111】
1 情報処理装置
2 処理部
10 データベース
11~13 データレコード
20 表示情報
21,22 表示部
S1,S2 ステップ