特開2024-72348 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-72348情報処理プログラム、情報処理方法および情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024072348

(43)【公開日】2024-05-28

(54)【発明の名称】情報処理プログラム、情報処理方法および情報処理装置

(51)【国際特許分類】

G06F 16/27 20190101AFI20240521BHJP

G06F 16/215 20190101ALI20240521BHJP

【ＦＩ】

G06F16/27

G06F16/215

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2022183076

(22)【出願日】2022-11-16

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002918

【氏名又は名称】弁理士法人扶桑国際特許事務所

(72)【発明者】

【氏名】池ヶ谷剛

(72)【発明者】

【氏名】山本嗣雅

(72)【発明者】

【氏名】青山満雄

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175EA03

(57)【要約】

【課題】データの関連性判断の作業を効率化する情報を作成する。
【解決手段】情報処理装置１の処理部２は、共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、複数の項目のうち１以上の第１の項目のデータが一致し、複数の項目のうち１以上の第２の項目のデータが一致しないデータレコード１１，１２を抽出する。処理部２は、データレコード１１，１２のそれぞれに含まれる複数の項目のデータを表示した表示情報２０を作成して出力する。処理部２は、この表示情報２０において、１以上の第２の項目のデータを、１以上の第１の項目のデータとは異なる形態で表示する。
【選択図】図１

【特許請求の範囲】

【請求項1】

コンピュータに、
共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、前記複数の項目のうち１以上の第１の項目のデータが一致し、前記複数の項目のうち１以上の第２の項目のデータが一致しない第１のデータレコードおよび第２のデータレコードを抽出し、
前記第１のデータレコードと前記第２のデータレコードのそれぞれに含まれる前記複数の項目のデータを表示した表示情報であって、前記１以上の第２の項目のデータを、前記１以上の第１の項目のデータとは異なる形態で表示した前記表示情報を作成して出力する、
処理を実行させる情報処理プログラム。

【請求項2】

前記表示情報の作成では、前記１以上の第２の項目のデータのうち前記第１のデータレコードと前記第２のデータレコードとの間で一致しない第１の部分データ領域を、前記１以上の第２の項目のデータのうち前記第１のデータレコードと前記第２のデータレコードとの間で一致する第２の部分データ領域、および前記第１のデータレコードと前記第２のデータレコードの前記１以上の第１の項目のデータとは異なる形態で、前記表示情報に表示する、
請求項１記載の情報処理プログラム。

【請求項3】

前記表示情報の作成では、
あらかじめ記憶部に記憶された、データ不一致の発生原因を示す複数の原因情報の中から、前記第１の部分データ領域の位置、または前記第１の部分データ領域の内容の少なくとも一方に基づいて一の原因情報を選択し、
前記一の原因情報を前記表示情報に表示する、
請求項２記載の情報処理プログラム。

【請求項4】

前記複数の項目のそれぞれにはテキストが設定され、
前記表示情報の作成では、前記１以上の第２の項目のテキストのうち前記第１のデータレコードと前記第２のデータレコードとの間で一致しない第１の部分テキスト領域を、前記１以上の第２の項目のテキストのうち前記第１のデータレコードと前記第２のデータレコードとの間で一致する第２の部分テキスト領域、および前記第１のデータレコードと前記第２のデータレコードの前記１以上の第１の項目のテキストとは異なる形態で、前記表示情報に表示する、
請求項１記載の情報処理プログラム。

【請求項5】

前記コンピュータに、
前記複数の項目のうち、前記１以上の第１の項目と前記１以上の第２の項目との組合せがそれぞれ異なる複数の判定条件を用いて、前記複数のデータレコードの中から、前記１以上の第１の項目のデータが一致し、前記１以上の第２の項目のデータが一致しないデータレコードペアを、前記複数の判定条件ごとに１以上抽出する、
処理をさらに実行させ、
前記表示情報の作成では、前記複数の判定条件のうち一の判定条件の選択操作を受け付けると、前記一の判定条件を用いて抽出された前記データレコードペアのそれぞれについて、前記１以上の第２の項目のデータを、前記１以上の第１の項目のデータとは異なる形態で表示した前記表示情報を作成する、
請求項１記載の情報処理プログラム。

【請求項6】

前記表示情報の作成では、
前記一の条件を用いて抽出された前記データレコードペアのそれぞれについて、前記１以上の第２の項目のデータのうち、前記データレコードペアに含まれる前記第１のデータレコードと前記第２のデータレコードとの間で一致しない第１の部分データ領域を、前記１以上の第２の項目のデータのうち前記第１のデータレコードと前記第２のデータレコードとの間で一致する第２の部分データ領域、および前記第１のデータレコードと前記第２のデータレコードの前記１以上の第１の項目のデータとは異なる形態で、前記表示情報に表示し、
前記一の条件を用いて抽出された前記データレコードペアのそれぞれについて、データ不一致の発生原因を示す複数の原因情報の中から、前記一の条件と、前記第１の部分データ領域の位置、または前記第１の部分データ領域の内容の少なくとも一方とに基づいて一の原因情報を選択し、前記一の原因情報を前記表示情報に表示する、
請求項５記載の情報処理プログラム。

【請求項7】

前記コンピュータに、
前記複数の条件のそれぞれの内容を表示した第１の表示部と、前記複数の条件ごとに抽出された前記データレコードペアの数を表示した第２の表示部と、前記複数の条件のいずれかの選択操作を受け付ける入力部とを含む他の表示情報を作成して表示装置に表示させる、
処理をさらに実行させ、
前記表示情報の作成および出力では、前記入力部に対する入力操作によって前記一の条件が選択されると、前記一の条件に対応する前記表示情報を作成して前記表示装置に表示させる、
請求項５記載の情報処理プログラム。

【請求項8】

コンピュータが、
共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、前記複数の項目のうち１以上の第１の項目のデータが一致し、前記複数の項目のうち１以上の第２の項目のデータが一致しない第１のデータレコードおよび第２のデータレコードを抽出し、
前記第１のデータレコードと前記第２のデータレコードのそれぞれに含まれる前記複数の項目のデータを表示した表示情報であって、前記１以上の第２の項目のデータを、前記１以上の第１の項目のデータとは異なる形態で表示した前記表示情報を作成して出力する、
情報処理方法。

【請求項9】

共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、前記複数の項目のうち１以上の第１の項目のデータが一致し、前記複数の項目のうち１以上の第２の項目のデータが一致しない第１のデータレコードおよび第２のデータレコードを抽出し、
前記第１のデータレコードと前記第２のデータレコードのそれぞれに含まれる前記複数の項目のデータを表示した表示情報であって、前記１以上の第２の項目のデータを、前記１以上の第１の項目のデータとは異なる形態で表示した前記表示情報を作成して出力する、処理部、
を有する情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理プログラム、情報処理方法および情報処理装置に関する。

【背景技術】

【0002】

それぞれ個人データが蓄積された異なる種類のデータベース間の個人データ同士や、同じ種類のデータベース内の個人データ同士を突合することで同一人物の個人データを抽出する作業は、一般的に「名寄せ」と呼ばれる。名寄せ作業では、例えば、個人データに含まれる項目の中から突合対象とする複数の項目が「名寄せキー」として決定される。そして、個人データ間ですべての名寄せキーの登録データが一致した場合に、それらの個人データが同一人物のデータであると判定される。

【0003】

また、名寄せに関しては次のような技術が提案されている。例えば、計算機による名寄せに失敗したデータを顧客名の読みにしたがってソートするために、顧客名を単語単位に分割し、単語辞書を使用して顧客名を構成する単語とこの単語の他単語との接続条件の組合せから各単語の読みを求める顧客名集約方法が提案されている。また、名寄せ判定対象の項目に関する医療情報を記述している文字または数値の一致割合を患者間で算定し、算定された一致割合を、当該項目に関して必要な情報一致度と比較して、前者が後者を上回る場合に患者ペアが同一人物であると判定する医療情報管理システムが提案されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開平７－１９２０５３号公報

【特許文献2】特開２０１１－２５７８５４号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

ところで、名寄せ対象の個人データの中には、同一人物のデータであっても一部の名寄せキーの登録データが一致しないものがある。例えば、事業所変更などによる保険証番号の変更や、結婚などによる名字の変更によってこのような個人データが発生し得る。上記のように「個人データ間ですべての名寄せキーの登録データが一致する」という判定条件を用いた場合には、このような個人データを正しく名寄せすることができず、名寄せの精度が高いとはいえないという問題がある。

【0006】

また、名寄せをコンピュータを用いて行うことで、個人データを目視して確認する場合よりも作業効率を高めることができる。しかし、コンピュータによって上記の判定条件を用いた名寄せを行っても、名寄せの精度が低いことに変わりはない。高精度な名寄せを行おうとすると、上記の判定条件に合致しなかった個人データを目視して確認しなければならず、名寄せの作業効率は低い。

【0007】

なお、上記の課題は、個人データの名寄せに限らず、データレコード間の関連性を判断する場合に発生し得る。
１つの側面では、本発明は、データの関連性判断の作業を効率化する情報を作成可能な情報処理プログラム、情報処理方法および情報処理装置を提供することを目的とする。

【課題を解決するための手段】

【0008】

１つの案では、コンピュータに、共通する複数の項目についてのデータをそれぞれ含む複数のデータレコードの中から、複数の項目のうち１以上の第１の項目のデータが一致し、複数の項目のうち１以上の第２の項目のデータが一致しない第１のデータレコードおよび第２のデータレコードを抽出し、第１のデータレコードと第２のデータレコードのそれぞれに含まれる複数の項目のデータを表示した表示情報であって、１以上の第２の項目のデータを、１以上の第１の項目のデータとは異なる形態で表示した表示情報を作成して出力する、処理を実行させる情報処理プログラムが提供される。

【0009】

また、１つの案では、上記の情報処理プログラムに基づく処理と同様の処理をコンピュータが実行する情報処理方法が提供される。
さらに、１つの案では、上記の情報処理プログラムに基づく処理と同様の処理を実行する情報処理装置が提供される。

【発明の効果】

【0010】

１つの側面では、データの関連性判断の作業を効率化する情報を作成できる。

【図面の簡単な説明】

【0011】

【図1】第１の実施の形態に係る情報処理装置の構成例および処理例を示す図である。

【図2】第２の実施の形態に係る情報処理システムの構成例を示す。

【図3】名寄せ支援装置のハードウェア構成例を示す図である。

【図4】一般的な名寄せ作業の手順を示す比較例である。

【図5】第２の実施の形態における名寄せ作業の流れを示す図である。

【図6】名寄せ確認シートの第１の例を示す図である。

【図7】名寄せ確認シートの第２の例を示す図である。

【図8】名寄せ支援装置が備える処理機能の構成例を示す図である。

【図9】名寄せ候補データベースのデータ構成例を示す図である。

【図10】加入者情報データベースと他のデータベースとの名寄せ処理手順を示すフローチャートの例である。

【図11】シート作成処理手順を示すフローチャートの例である。

【図12】加入者情報の名寄せ処理手順を示すフローチャートの例である。

【図13】失敗理由選択テーブルの構成例を示す図である。

【発明を実施するための形態】

【0012】

以下、本発明の実施の形態について図面を参照して説明する。
〔第１の実施の形態〕
図１は、第１の実施の形態に係る情報処理装置の構成例および処理例を示す図である。図１に示す情報処理装置１は、処理部２を有する。処理部２は、例えばプロセッサである。

【0013】

この情報処理装置１は、複数のデータレコードの中から関連性の高いデータレコードのペアを抽出する作業を支援する。図１では例として、複数のデータレコード（データレコード１１，１２，１３，・・・）はデータベース１０に登録されているものとする。また、データベース１０に登録された各データレコードは、共通する複数の項目についてのデータを含む。図１の例では、各データレコードは項目（Ａ）～（Ｃ）のデータを含んでいる。

【0014】

これらの項目（Ａ）～（Ｃ）は、例えば、関連性の高いデータレコードのペアを抽出するために使用される。この場合、データレコードの間で項目（Ａ）～（Ｃ）のすべてのデータが一致したときに、それらのデータレコードの関連性が高いと判定される。一例として、データレコード１１，１２，１３，・・・が医療データなどの個人データであるとする。この場合、データレコードの間で項目（Ａ）～（Ｃ）のすべてのデータが一致したときに、それらのデータレコードは同一人物に関するデータレコードであると判定される。

【0015】

しかし、実際のデータレコードでは、項目（Ａ）～（Ｃ）の一部のデータだけが一致した場合でもデータレコードの関連性が高い場合がある。上記の判定処理では、このようなデータレコードのペアを抽出できないという問題がある。

【0016】

これに対して、処理部２は、項目（Ａ）～（Ｃ）の一部のデータのみが一致したデータレコードのペアを、データベース１０から抽出する。具体的には、処理部２は、項目（Ａ）～（Ｃ）のうち１以上の第１の項目のデータが一致し、それ以外の１以上の第２の項目のデータが一致しないデータレコードのペアを、データベース１０から抽出する（ステップＳ１）。

【0017】

図１では例として、第１の項目として項目（Ａ），（Ｃ）が適用され、第２の項目として項目（Ｂ）が適用される。そして、処理部２は、項目（Ａ），（Ｃ）のデータが一致し、項目（Ｂ）のデータが一致しないデータレコードのペアとして、データレコード１１，１２を抽出したとする。

【0018】

次に、処理部２は、抽出されたデータレコード１１，１２のそれぞれに含まれる項目（Ａ）～（Ｃ）のデータを表示した表示情報２０を作成して出力する（ステップＳ２）。このとき、処理部２は、登録内容が異なっている項目（Ｂ）のデータを、登録内容が同じである項目（Ａ），（Ｃ）のデータとは異なる形態で、表示情報２０に表示する。

【0019】

図１の例では、表示情報２０には、データレコード１１に含まれる項目（Ａ）～（Ｃ）のデータを表示した表示部２１と、データレコード１２に含まれる項目（Ａ）～（Ｃ）のデータを表示した表示部２２とが含まれる。データレコード１１に含まれる項目（Ｂ）のデータ「ｅｆｇｈ」と、データレコード１２に含まれる項目（Ｂ）のデータ「ｅｆｘｙ」とは異なっている。このため、表示部２１，２２では、項目（Ｂ）のデータの一部が下線付きで強調表示されており、項目（Ｂ）のデータは項目（Ａ），（Ｃ）のデータとは異なる形態で表示されている。

【0020】

以上の処理により、情報処理装置１は、データの関連性判断の作業を効率化する情報を作成できる。すなわち、上記の表示情報２０により、抽出されたデータレコード１１，１２の間でデータが異なっている箇所がわかりやすく表示される。表示情報２０を視認したユーザは、表示情報２０を視認することで、データレコード１１，１２との間でデータが異なっている箇所を直感的に認識できる。このため、表示情報２０は、データレコード１１，１２の間の関連性を判断する作業を支援し、その作業効率を高めるために有用な情報となる。

【0021】

なお、図１の例では、データレコード１１に含まれる項目（Ｂ）のデータ「ｅｆｇｈ」と、データレコード１２に含まれる項目（Ｂ）のデータ「ｅｆｘｙ」との間では、前者の「ｇｈ」の領域と後者の「ｘｙ」の領域のみが異なっている。そこで、表示部２１，２２では、項目（Ｂ）のデータのうち、データレコード１１，１２との間で異なっているデータ領域のみ、下線付きで強調表示されている。このような表示により、データレコード１１，１２の間でデータが異なっている箇所をより細かく提示できようになり、データの不一致箇所の表示がさらにわかりやすくなる。

【0022】

〔第２の実施の形態〕
次に、関連性の判断対象のデータレコードとして医療データが適用された情報処理システムについて説明する。

【0023】

図２は、第２の実施の形態に係る情報処理システムの構成例を示す。図２に示す情報処理システムは、サーバ装置５０と名寄せ支援装置１００を含む。
サーバ装置５０は、医療データを用いて各種の処理を実行するサーバコンピュータである。サーバ装置５０には、それぞれ医療データが蓄積された１種類以上の医療情報データベースが接続されており、サーバ装置５０は、それらの医療情報データベースにアクセス可能になっている。なお、例えば、サーバ装置５０が複数設けられ、異なる種類の医療情報データベースがそれぞれ異なるサーバ装置５０に接続されていてもよい。

【0024】

名寄せ支援装置１００は、図１に示した情報処理装置１の一例である。名寄せ支援装置１００は、サーバ装置５０に接続された医療情報データベースに蓄積された医療データの名寄せ作業を支援するコンピュータである。名寄せ支援装置１００は、医療データに含まれる項目のうち、特定の項目を名寄せキーとして用いて名寄せ処理を実行する。

【0025】

名寄せでは一般的に、医療情報データベースに含まれる２つの医療データ間で、すべての名寄せキーのデータが一致した場合に、それらの医療データが同一人物のデータであると判定される。これに対して、名寄せ支援装置１００は、このような「完全一致」という判定条件に該当しなかった医療データ（失敗データ）の中から、同一人物のデータである可能性がある医療データのペアを「名寄せ候補」として抽出する。名寄せ支援装置１００は、抽出された名寄せ候補に関する情報をユーザに提示することで、失敗データに対するユーザの名寄せ作業を支援する。

【0026】

図３は、名寄せ支援装置のハードウェア構成例を示す図である。名寄せ支援装置１００は、例えば、図３に示すようなコンピュータとして実現される。図３に示す名寄せ支援装置１００は、プロセッサ１０１、ＲＡＭ（Random Access Memory）１０２、ＨＤＤ（Hard Disk Drive）１０３、ＧＰＵ（Graphics Processing Unit）１０４、入力インタフェース（Ｉ／Ｆ）１０５、読み取り装置１０６および通信インタフェース（Ｉ／Ｆ）１０７を有する。

【0027】

プロセッサ１０１は、名寄せ支援装置１００全体を統括的に制御する。プロセッサ１０１は、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）またはＰＬＤ（Programmable Logic Device）である。また、プロセッサ１０１は、ＣＰＵ、ＭＰＵ、ＤＳＰ、ＡＳＩＣ、ＰＬＤのうちの２以上の要素の組み合わせであってもよい。

【0028】

ＲＡＭ１０２は、名寄せ支援装置１００の主記憶装置として使用される。ＲＡＭ１０２には、プロセッサ１０１に実行させるＯＳ（Operating System）プログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、ＲＡＭ１０２には、プロセッサ１０１による処理に必要な各種データが格納される。

【0029】

ＨＤＤ１０３は、名寄せ支援装置１００の補助記憶装置として使用される。ＨＤＤ１０３には、ＯＳプログラム、アプリケーションプログラム、および各種データが格納される。なお、補助記憶装置としては、ＳＳＤ（Solid State Drive）などの他の種類の不揮発性記憶装置を使用することもできる。

【0030】

ＧＰＵ１０４には、表示装置１０４ａが接続されている。ＧＰＵ１０４は、プロセッサ１０１からの命令にしたがって、画像を表示装置１０４ａに表示させる。表示装置１０４ａとしては、液晶ディスプレイや有機ＥＬ（ElectroLuminescence）ディスプレイなどを用いることができる。

【0031】

入力インタフェース１０５には、入力装置１０５ａが接続されている。入力インタフェース１０５は、入力装置１０５ａから出力される信号をプロセッサ１０１に送信する。入力装置１０５ａとしては、キーボードやポインティングデバイスなどを用いることができる。ポインティングデバイスとしては、マウス、タッチパネル、タブレット、タッチパッド、トラックボールなどを用いることができる。

【0032】

読み取り装置１０６には、可搬型記録媒体１０６ａが脱着される。読み取り装置１０６は、可搬型記録媒体１０６ａに記録されたデータを読み取ってプロセッサ１０１に送信する。可搬型記録媒体１０６ａとしては、光ディスク、半導体メモリなどがある。

【0033】

通信インタフェース１０７は、ネットワーク１０７ａを介してサーバ装置５０などの他の装置との間でデータの送受信を行う。
以上のようなハードウェア構成によって、名寄せ支援装置１００の処理機能を実現することができる。なお、サーバ装置５０も、図３に示すようなコンピュータとして実現可能である。

【0034】

図４は、一般的な名寄せ作業の手順を示す比較例である。図４では、コンピュータである名寄せ装置７０を用いて自動的に名寄せ作業が行われる場合について例示する。
また、名寄せ対象データとしては、例として、加入者情報データベース（ＤＢ）６１、健診情報データベース（ＤＢ）６２、保険指導情報データベース（ＤＢ）６３およびレセプトデータベース（ＤＢ）６４が用いられるものとする。加入者情報データベース６１には、健康保険組合の各加入者に関する基本的な情報が登録される。健診情報データベース６２は、各加入者に対して行われた健康診断の診断結果を示す情報が登録される。保険指導情報データベース６３には、各加入者に対して行われた保険指導の内容を示す情報が登録される。レセプトデータベース６４には、各加入者が受けた保険診療に対する診療報酬の明細書を示す。なお、以下の説明では、これらの各データベース上の１つのレコードを「医療データ」と記載する場合がある。

【0035】

名寄せ装置７０は、各データベースの医療データに含まれる項目のうち、各データベースに共通して含まれる特定の複数の項目を名寄せキーとして用いる、名寄せキーとしては、保険証の記号および番号、氏名、生年月日など、加入者に関する基本的な情報の項目が用いられる。

【0036】

名寄せ装置７０は、上記の各データベースから２つの医療データを抽出して突合する。突合される２つの医療データは、異なるデータベースから抽出される場合もあるし、同一のデータベースから抽出される場合もある。

【0037】

名寄せ装置７０は、突合される２つの医療データが同一人物のデータかを判定するための名寄せルール（判定条件）として、すべての名寄せキーのデータが一致するという一般的な方法を用いて名寄せ処理を実行する。このような名寄せ処理の結果、名寄せに成功したデータは名寄せ済みデータ８０として出力される。名寄せ済みデータ８０では、例えば、同一人物のデータと判定された２つの医療データに対して、同一の識別番号が付与されて管理される。

【0038】

ところが、実際には、同一人物の医療データの間で名寄せキーの一部のデータが一致しない場合がある。上記の名寄せルールでは、このような医療データのペアは同一人物のデータと判定されない。このため、上記の名寄せルールは名寄せ精度が低いという問題がある。

【0039】

例えば、健康保険組合が保有する医療データでは、事業所変更などによる保険証番号の変更や、結婚などによる名字の変更など、年度間で個人属性の変更が多く発生する。このため、本来は同一人物の医療データであっても名寄せキーの一部が一致しないケースが発生しやすい。このような医療データのペアを同一人物のデータと正確に判定するためには、ユーザ（作業者）が医療データのペアのデータ内容を１つずつ確認する必要があり、作業者の作業負荷が高い。名寄せの精度を上げようとするほど、膨大な確認作業が必要になってしまう。

【0040】

図５は、第２の実施の形態における名寄せ作業の流れを示す図である。本実施の形態において、名寄せ支援装置１００は、上記のような名寄せキーの完全一致ではなく、特定の一部の名寄せキーのデータのみが一致するという名寄せルールを用いて、同一人物のデータである可能性がある医療データのペアを「名寄せ候補」として抽出する。名寄せ支援装置１００は、このような名寄せルールを複数用いて名寄せ候補を抽出する。

【0041】

名寄せ支援装置１００は、抽出された名寄せ候補に関する情報や、適用された名寄せルールなどの情報を示す名寄せ確認シート１１０を作成して出力する。ユーザは、名寄せ確認シート１１０も目視でチェックし、名寄せ確認シート１１０の内容を参考にしながら名寄せ候補についての名寄せ作業を行い、同一人物のデータか否かを判断することができる。

【0042】

このように、名寄せ支援装置１００は、抽出された名寄せ候補に関する情報や適用された名寄せルールなどの情報をユーザにわかりやすく提示することで、完全一致による名寄せに失敗した医療データに対するユーザの名寄せ作業を支援する。名寄せ支援装置１００による完全一致以外の名寄せルールに基づく自動的な名寄せ処理と、ユーザによる目視によるデータの確認というハイブリッドな名寄せ方法が実現されることで、ユーザは高精度な名寄せ作業を短時間で行うことが可能となり、ユーザの名寄せ作業効率を高めることができる。

【0043】

図６は、名寄せ確認シートの第１の例を示す図である。名寄せ支援装置１００は、いずれかの名寄せルールに合致した医療データのペア（名寄せ候補）を、合致した名寄せルールごとにグルーピングする。図６に示すグルーピングシート１１１は、グルーピングされた名寄せ候補の集計結果や名寄せルールの内容などを表示するための名寄せ確認シートである。このグルーピングシート１１１は、名寄せルール表示部１１１ａ、名寄せキー表示部１１１ｂ、人数表示部１１１ｃ、リンク表示部１１１ｄ、判定可否表示部１１１ｅおよび確度表示部１１１ｆを含む。

【0044】

名寄せルール表示部１１１ａには、名寄せルールを識別する情報が表示される。図６の例では、名寄せルール表示部１１１ａには、名寄せルールの識別番号と、名寄せルールの説明文とが表示されている。

【0045】

名寄せキー表示部１１１ｂには、名寄せキーの一覧と、各名寄せルールで一致・不一致が判定される判定対象キーを示す表示部とが表示される。名寄せキーの一覧としては、健康保険証の記号、健康保険証の番号、性別、漢字氏名情報、カナ氏名情報および生年月日情報が表示される。漢字氏名情報は、漢字の氏名（名字と下の名前）と、その氏名に含まれる名（下の名前）とに分類される。カナ氏名情報も、カナの氏名と、その氏名に含まれる名とに分類される。生年月日情報は、生年月日と生年月と生月日とに分類される。

【0046】

判定対象キーの表示部では、名寄せキーの一覧のうち、判定対象キーに対して丸印が表示される。名寄せ対象の医療データ間で、丸印が付いた判定対象キーのすべてについて登録データが一致した場合に、それらの医療データは対応する名寄せルールに合致した名寄せ候補と判定される。名寄せキー表示部１１１ｂは、各名寄せルールの内容をわかりやすく表示したものである。ユーザは、名寄せキー表示部１１１ｂを視認することで、名寄せルールごとにどの名寄せキーが一致しているかを直感的に理解できる。

【0047】

ここで、図６に示す名寄せルールでは、漢字氏名情報とカナ氏名情報の一方のみが判定対象キーとして使用される。これにより、いずれの名寄せルールも、名寄せキーのうち一部のみが同一である医療データのペアを抽出可能な判定条件となっている。また、漢字氏名情報に含まれる名寄せキー（氏名、名）の一方のみが判定対象キーとして使用され、カナ氏名情報に含まれる名寄せキー（カナ氏名、カナ名）の一方のみが判定対象キーとして使用される。さらに、生年月日情報に含まれる名寄せキー（生年月日、生年月、生月日）のうちの１つのみが判定対象キーとして使用される。

【0048】

例えば、名寄せルール「１」では、医療データのペア間で、記号、番号、性別、氏名、生年月日の登録データが一致する場合に、そのペアが名寄せ候補として抽出される。氏名については、名字と下の名前の両方が一致している必要がある。一方、名寄せルール「３」では、医療データのペア間で、記号、番号、性別、名、生年月日の登録データが一致する場合に、そのペアが名寄せ候補として抽出される。氏名については、下の名前は一致しているが名字は一致していないことが条件となる。

【0049】

また、名寄せルール「２」では、医療データのペア間で、記号、番号、性別、カナ氏名、生年月日の登録データが一致する場合に、そのペアが名寄せ候補として抽出される。カナ氏名については、名字と下の名前の両方が一致している必要がある。一方、名寄せルール「４」では、医療データのペア間で、記号、番号、性別、カナ名、生年月日の登録データが一致する場合に、そのペアが名寄せ候補として抽出される。カナ氏名については、下の名前は一致しているが名字は一致していないことが条件となる。

【0050】

名寄せルール「３」、「４」は、医療データの特性に合った判定条件となっている。例えば、上記のように医療データでは、結婚などによって名字が変わってしまうケースがある。名寄せルール「３」、「４」は、このようなケースが発生した場合でも同一人物の医療データのペアを正確に抽出できるようにしたものである。

【0051】

人数表示部１１１ｃには、対応する名寄せルールに合致した医療データのペア数が「人数」として表示される。
リンク表示部１１１ｄには、後述する詳細シートを表示するためのリンクが表示される。詳細シートは名寄せルールごとに作成されるため、ユーザは、リンク表示部１１１ｄにおける所望の名寄せルールに対応するリンクを選択操作することで、その名寄せルールに対応する詳細シートを表示させることができる。

【0052】

判定可否表示部１１１ｅには、対応する名寄せルールが、医療データのペアが同一人物のデータかを判定可能なものか否かを示す情報が表示される。
確度表示部１１１ｆには、対応する名寄せルールに合致した医療データのペアが同一人物のデータである確度が表示される。図６の例では、確度が「高」「中」「低」の３段階で示されている。ユーザは例えば、高い確度が示された名寄せルールに対応するリンクを選択操作することで、同一人物のデータである可能性が高い医療データのペアのみを確認することが可能となるので、確認作業の効率を高めることができる。

【0053】

なお、本実施の形態では例として、突合される医療データの１つの組み合わせ（ペア）に対しては、そのペアが複数の名寄せルールに合致する場合でも、いずれか１つの名寄せルールのみが対応付けられるものとする。例えば、１つの医療データのペアの名寄せ処理には、グルーピングシート１１１上の上位から順に名寄せルールが適用され、最初に合致した名寄せルールに対してその医療データのペアが対応付けられる。

【0054】

図７は、名寄せ確認シートの第２の例を示す図である。図７に示す詳細シート１１２は、名寄せルールごとに作成される。図６に示したリンク表示部１１１ｄのいずれかのリンクが選択操作された場合に、そのリンクに対応する詳細シート１１２が表示されることになる。

【0055】

詳細シート１１２は、対応する名寄せルールに合致した医療データのペアの内容を対比させて表示するための情報である。詳細シート１１２は、結束キー表示部１１２ａ、第１医療データ表示部１１２ｂ、第２医療データ表示部１１２ｃ、同一人物フラグ入力部１１２ｄおよび失敗理由表示部１１２ｅを含む。

【0056】

結束キー表示部１１２ａには、名寄せ候補として抽出された医療データのペアを関連付けるためのユニークな結束キーが表示される。
第１医療データ表示部１１２ｂには、医療データのペアのうち一方の医療データの内容が表示される。第２医療データ表示部１１２ｃには、医療データのペアのうち他方の医療データの内容が表示される。これらのいずれの表示部にも、医療データを識別する識別番号と、名寄せキーの登録データとが表示される。名寄せキーとしては、記号、番号、氏名（漢字の氏名）、カナ氏名、性別および生年月日の登録データが表示される。

【0057】

例えば、加入者情報データベース６１の各医療データ（加入者情報）と、他のデータベースの医療データとの間で名寄せが行われる場合、第１医療データ表示部１１２ｂには加入者情報データベース６１の医療データが表示され、第２医療データ表示部１１２ｃには他のデータベースの医療データが表示される。また、図７では、名寄せ済みの加入者情報データベース６１の各医療データと、その後に更新された各医療データ（加入者情報）との間で名寄せが行われた場合を例示している。この場合、第１医療データ表示部１１２ｂには前者の医療データが「過去の登録データ」として表示され、第２医療データ表示部１１２ｃには後者の医療データが「今回の登録データ」として表示される。

【0058】

さらに、第１医療データ表示部１１２ｂおよび第２医療データ表示部１１２ｃでは、医療データ間で同一名寄せキーの登録データが異なる箇所が明示される。図７の例では、登録データが異なる箇所が、下線付きで強調表示されている。ただし、他の方法の例としては、該当箇所を他の箇所とは異なる色で表示する方法などが採用されてもよい。

【0059】

図７の詳細シート１１２は、例として、図６に示した名寄せルール「３」に合致した名寄せ候補を一覧表示している。結束キー「０００００００３２４」のレコードでは、医療データ間で漢字の名字とカナの名字とが異なっている。このため、漢字の名字とカナの名字の部分が下線付きで強調表示されている。また、結束キー「０００００２０７６１」のレコードでは、医療データ間で漢字の名字の一部が異なっている。このため、漢字の名字のうち医療データ間で異なる部分が下線付きで強調表示されている。

【0060】

このような第１医療データ表示部１１２ｂおよび第２医療データ表示部１１２ｃは、名寄せ候補として抽出された医療データのペアが同一人物のものかをユーザが判断するために有用な情報を提供する。ユーザは、第１医療データ表示部１１２ｂと第２医療データ表示部１１２ｃとを視認することで、抽出された名寄せ候補のデータ登録内容を対比させて視認できるだけでなく、医療データ間でデータ登録内容が異なる箇所を容易に視認できる。すなわち、ユーザは、完全一致を判定条件とした名寄せにおいて、データのどの部分の不一致によって名寄せ失敗と判定されたかを容易に把握できるようになる。

【0061】

同一人物フラグ入力部１１２ｄでは、ユーザの操作によって同一人物フラグを入力可能になっている。第１医療データ表示部１１２ｂおよび第２医療データ表示部１１２ｃや、失敗理由表示部１１２ｅを確認したユーザが、医療データのペアが同一人物のものであると判断した場合に、同一人物フラグ入力部１１２ｄの対応箇所に同一人物フラグを入力可能である。

【0062】

同一人物フラグの有無は、詳細シート１１２のデータファイルに記録される。このため、ユーザは、詳細シート１１２を後から再度開いたときに、名寄せ成功と判断した医療データのペアを容易に確認でき、このペアの情報を名寄せ済みデータ８０に登録できる。また、詳細シート１１２のデータファイルをコンピュータに取り込むことで、そのコンピュータが、名寄せ成功と判断された医療データのペアを自動的に抽出し、そのペアの情報を名寄せ済みデータに登録できるようになる。

【0063】

失敗理由表示部１１２ｅには、完全一致の判定条件を用いた名寄せで失敗したことに対する、考え得る失敗理由が表示される。表示される失敗理由は、名寄せルールごとにあらかじめ１つ以上用意されている。そして、第１医療データ表示部１１２ｂおよび第２医療データ表示部１１２ｃにおいて特定されたデータ登録内容の相違位置や相違内容に基づいて、用意された失敗理由の中から１つ以上が選択されて失敗理由表示部１１２ｅに表示される。

【0064】

このような失敗理由表示部１１２ｅも、第１医療データ表示部１１２ｂおよび第２医療データ表示部１１２ｃと同様に、名寄せ候補として抽出された医療データのペアが同一人物のものかをユーザが判断するために有用な情報を提供する。ユーザは、失敗理由表示部１１２ｅを視認することで、医療データのペアが、完全一致を判定条件とした名寄せにおいて名寄せ失敗と判定された理由を容易に確認できる。

【0065】

図８は、名寄せ支援装置が備える処理機能の構成例を示す図である。名寄せ支援装置１００は、記憶部１２０、名寄せ処理部１３１およびシート作成処理部１３２を備える。
記憶部１２０は、例えばＨＤＤ１０３など、名寄せ支援装置１００が備える記憶装置に確保された記憶領域である。記憶部１２０には、名寄せルールデータベース（ＤＢ）１２１、失敗理由データベース（ＤＢ）１２２、名寄せ辞書１２３および名寄せ候補データベース（ＤＢ）１２４が記憶される。

【0066】

名寄せルールデータベース１２１には、名寄せルールを示す情報が登録される。失敗理由データベース１２２には、名寄せルールごとに、詳細シート１１２の失敗理由表示部１１２ｅに表示するための失敗理由が１つ以上登録される。失敗理由データベース１２２には、医療データ間の登録データの一致・相違位置などに基づく失敗理由の選択条件がさらに登録されてもよい。

【0067】

名寄せ辞書１２３には、基本的に加入者情報が、レコードを識別するユニークな識別情報に対応付けて登録される。名寄せ辞書１２３には、登録されたレコードと同一人物のものと判定された他のレコードとを関連付ける情報が登録されてもよい。名寄せ候補データベース１２４には、名寄せルールごとに抽出された名寄せ候補の情報が登録される。

【0068】

名寄せ処理部１３１およびシート作成処理部１３２の処理は、例えば、プロセッサ１０１が所定のアプリケーションプログラムを実行することで実現される。
名寄せ処理部１３１は、加入者情報データベース６１、健診情報データベース６２、保険指導情報データベース６３およびレセプトデータベース６４のレコードを名寄せ対象データとして、名寄せルールにしたがって名寄せ処理を実行する。名寄せ処理部１３１は、名寄せ処理によって抽出された名寄せ候補の情報を名寄せ候補データベース１２４に登録する。

【0069】

シート作成処理部１３２は、名寄せ候補データベース１２４に基づいて、グルーピングシートファイル１１１＿１や詳細シートファイル１１２＿１ａ，１１２＿１ｂ，・・・を作成して出力する。グルーピングシートファイル１１１＿１は、前述のグルーピングシート１１１のデータファイルである。詳細シートファイル１１２＿１ａ，１１２＿１ｂ，・・・は、それぞれ個別の名寄せルールに対応する詳細シート１１２のデータファイルである。

【0070】

図９は、名寄せ候補データベースのデータ構成例を示す図である。名寄せ候補データベース１２４は、名寄せルールごとのテーブル１２４ａ，１２４ｂ，１２４ｃ，・・・を含む。

【0071】

テーブル１２４ａ，１２４ｂ，１２４ｃ，・・・のそれぞれには、対応する名寄せルールによって抽出された名寄せ候補を示すレコードが登録される。各レコードは、結束キー、名寄せ辞書のレコードを示す識別番号、名寄せ対象の他のデータベース（対象データベース）におけるレコードを示す識別番号を含む。各識別番号が、名寄せ候補として抽出された２つの医療データのそれぞれを識別する。結束キーは、２つの医療データを関連付けるためのユニークな識別番号である。

【0072】

次に、名寄せ支援装置１００の処理について、フローチャートを用いて説明する。
図１０は、加入者情報データベースと他のデータベースとの名寄せ処理手順を示すフローチャートの例である。名寄せ支援装置１００は、まず、加入者情報データベース６１と、その他のデータベースとの間で名寄せ処理を実行する。

【0073】

［ステップＳ１１］名寄せ処理部１３１は、加入者情報データベース６１の各加入者情報に対してユニークな識別情報を付与し、識別情報が付与された各加入者情報を登録した名寄せ辞書１２３を作成する。

【0074】

［ステップＳ１２］名寄せ処理部１３１は、ステップＳ２１までの処理ループを、名寄せ対象のデータベース（対象データベース）ごとに実行する。すなわち、ステップＳ２１までの処理ループは、健診情報データベース６２、保険指導情報データベース６３、レセプトデータベース６４をそれぞれ対象データベースとして実行される。

【0075】

［ステップＳ１３］名寄せ処理部１３１は、対象データベースの医療データの中から１つ選択する。
［ステップＳ１４］名寄せ処理部１３１は、名寄せ辞書１２３の加入者情報の中から、すべての名寄せキーのデータがステップＳ１３で選択された医療データと一致する加入者情報を検索する。

【0076】

［ステップＳ１５］名寄せ処理部１３１は、ステップＳ１４の検索により名寄せ辞書１２３から該当する加入者情報が検索されたかを判定する。該当する加入者情報が検索された場合、処理がステップＳ１６に進められ、該当する加入者情報が検索されなかった場合、処理がステップＳ１７に進められる。

【0077】

［ステップＳ１６］このケースでは、完全一致の判定条件による名寄せに成功したことになる。この場合、名寄せ処理部１３１は、例えば、名寄せ辞書１２３において、ステップＳ１３で選択された医療データを、ステップＳ１４で検索された加入者情報に関連付ける。

【0078】

［ステップＳ１７］名寄せ処理部１３１は、ステップＳ１３で選択された医療データと、名寄せ辞書１２３の各加入者情報との間で、完全一致でない名寄せルールをそれぞれ用いた名寄せを実行する。すなわち、名寄せ処理部１３１は、名寄せルールを１つずつ選択しながら、名寄せ辞書１２３の加入者情報の中から、選択した名寄せルールに合致する加入者情報を検索する。

【0079】

［ステップＳ１８］名寄せ処理部１３１は、ステップＳ１７の処理により、名寄せ辞書１２３から名寄せルールの１つに合致する加入者情報が検索されたかを判定する。いずれかの名寄せルールに合致する加入者情報が検索された場合、処理がステップＳ１９に進められ、いずれかの名寄せルールに合致する加入者情報が検索されなかった場合、処理がステップＳ２０に進められる。

【0080】

［ステップＳ１９］名寄せ処理部１３１は、ステップＳ１７で名寄せルールに合致した加入者情報と、ステップＳ１３で選択された医療データとを、名寄せ候補データベース１２４のテーブルのうち合致した名寄せルールに対応するテーブルに名寄せ候補として登録する。また、名寄せ処理部１３１は、登録された名寄せ候補にユニークな結束キーを付与する。

【0081】

［ステップＳ２０］名寄せ処理部１３１は、名寄せエラーと判定する。この場合、名寄せ処理部１３１は例えば、名寄せ辞書１２３に新たなレコードを追加し、ステップＳ１３で選択された医療データを追加したレコードに登録する。また、名寄せ処理部１３１は、登録された医療データにユニークな識別情報を付与される。以後、名寄せ辞書１２３に追加されたレコードの情報は、加入者情報の１つとして取り扱われる。

【0082】

［ステップＳ２１］名寄せ処理部１３１は、対象データベースの医療データのすべてについて処理済みかを判定する。処理済みでない医療データが存在する場合、処理がステップＳ１３に進められ、処理済みでない医療データの１つが選択される。一方、すべての医療データが処理済みの場合、処理がステップＳ２２に進められる。

【0083】

［ステップＳ２２］ステップＳ１２～Ｓ２２の処理ループがすべての対象データベースを処理対象として実行されると、名寄せ処理が終了する。
図１１は、シート作成処理手順を示すフローチャートの例である。図１０の名寄せ処理によって名寄せ候補データベース１２４が作成されると、この名寄せ候補データベース１２４を用いて図１１の処理が実行される。

【0084】

［ステップＳ３１］シート作成処理部１３２は、ステップＳ３７までの処理ループを名寄せルールごとに実行する。
［ステップＳ３２］シート作成処理部１３２は、名寄せ候補データベース１２４のテーブルのうち処理対象の名寄せループに対応するテーブルから名寄せ候補のレコードを１つ選択し、名寄せ候補とされた２つの医療データのそれぞれから名寄せキーのデータを抽出する。

【0085】

［ステップＳ３３］シート作成処理部１３２は、２つの医療データの間で同一名寄せキーのデータを比較し、データが不一致のデータ領域を抽出する。
［ステップＳ３４］シート作成処理部１３２は、処理対象の名寄せルールと、ステップＳ３３で抽出されたデータ領域の位置や内容とに基づいて、失敗理由データベース１２２から失敗理由を取得する。

【0086】

［ステップＳ３５］シート作成処理部１３２は、名寄せ候補データベース１２４の全レコードについて処理済みかを判定する。処理済みでないレコードがある場合、処理がステップＳ３２に進められ、処理済みでないレコードの中から１つが選択される。一方、すべてのレコードについて処理済みの場合、処理がステップＳ３６に進められる。

【0087】

［ステップＳ３６］シート作成処理部１３２は、詳細シート１１２を作成する。この詳細シート１１２では、ステップＳ３３で取得された各名寄せ候補のデータが表示される。すなわち、名寄せ候補ごとに、名寄せ候補に含まれる一方の医療データと他方の医療データとが、詳細シート１１２に表示される。また、一方の医療データの表示部と他方の医療データの表示部では、ステップＳ３３で抽出された、データが不一致のデータ領域が、例えばハイライト表示される。さらに、詳細シート１１２においては、名寄せ候補に対応付けて、ステップＳ３４で取得された、名寄せ候補に対応する失敗理由が表示される。

【0088】

［ステップＳ３７］ステップＳ３１～Ｓ３７の処理ループがすべての名寄せルールを処理対象として実行されると、処理がステップＳ３８に進められる。
［ステップＳ３８］シート作成処理部１３２は、名寄せ候補データベース１２４を参照して、名寄せルールごとに人数（名寄せルールに対応するテーブルに登録された名寄せ候補の数）をカウントする。

【0089】

［ステップＳ３９］シート作成処理部１３２は、グルーピングシート１１１を作成する。グルーピングシート１１１においては、名寄せルール表示部１１１ａ、名寄せキー表示部１１１ｂ、判定可否表示部１１１ｅおよび確度表示部１１１ｆには、あらかじめ決められた情報が表示される。また、名寄せルールごとの人数表示部１１１ｃには、ステップＳ３８でカウントされた人数が名寄せルールに対応付けて表示される。リンク表示部１１１ｄには、ステップＳ３６で名寄せルールごとに作成された詳細シート１１２を示すリンク情報が、名寄せルールに対応付けて表示される。

【0090】

図示しないが、シート作成処理部１３２は、例えば、ユーザの操作によってグルーピングシート１１１の表示が要求されると、ステップＳ３９で作成されたグルーピングシート１１１をディスプレイに表示させる。また、リンク表示部１１１ｄに表示されたいずれかのリンク情報が選択操作されると、シート作成処理部１３２は、ステップＳ３６で作成された詳細シート１１２のうち、選択操作されたリンク情報が示す詳細シート１１２をディスプレイに表示させる。

【0091】

図１２は、加入者情報の名寄せ処理手順を示すフローチャートの例である。図１０の処理により名寄せ辞書１２３が作成されてから所定の時間が経過すると、図１２の処理が実行される。図１２の処理では、作成された名寄せ辞書１２３と、加入者情報データベース６１の加入者情報のうち、名寄せ辞書１２３の作成後に更新された加入者情報との間で名寄せ処理が実行される。以下の説明では、後者の加入者情報を「更新された加入者情報」と記載する。更新された加入者情報には、加入者情報データベース６１に新たに登録された加入者情報も含まれる。

【0092】

［ステップＳ４１］名寄せ処理部１３１は、更新された加入者情報の中から加入者情報を１つ選択する。
［ステップＳ４２］名寄せ処理部１３１は、名寄せ辞書１２３の加入者情報の中から、すべての名寄せキーのデータがステップＳ４１で選択された加入者情報と一致する加入者情報を検索する。

【0093】

［ステップＳ４３］名寄せ処理部１３１は、ステップＳ４２の検索により該当する加入者情報が検索されたかを判定する。該当する加入者情報が検索された場合、処理がステップＳ４４に進められ、該当する加入者情報が検索されなかった場合、処理がステップＳ４５に進められる。

【0094】

［ステップＳ４４］このケースでは、完全一致の判定条件による名寄せに成功したことになる。この場合、名寄せ処理部１３１は、例えば、名寄せ辞書１２３において、ステップＳ４１で選択された加入者情報を、ステップＳ４２で検索された加入者情報に関連付ける。

【0095】

［ステップＳ４５］名寄せ処理部１３１は、ステップＳ４１で選択された加入者情報と、名寄せ辞書１２３の加入者情報のそれぞれとの間で、完全一致でない名寄せルールをそれぞれ用いた名寄せを実行する。すなわち、名寄せ処理部１３１は、名寄せルールを１つずつ選択しながら、名寄せ辞書１２３の加入者情報の中から、選択した名寄せルールに合致する加入者情報データを検索する。

【0096】

［ステップＳ４６］名寄せ処理部１３１は、ステップＳ４５の処理により、名寄せ辞書１２３の中から名寄せルールの１つに合致する加入者情報が検索されたかを判定する。いずれかの名寄せルールに合致する加入者情報が検索された場合、処理がステップＳ４７に進められ、いずれかの名寄せルールに合致する加入者情報が検索されなかった場合、処理がステップＳ４８に進められる。

【0097】

［ステップＳ４７］名寄せ処理部１３１は、ステップＳ４５で名寄せルールに合致した加入者情報と、ステップＳ４１で選択された加入者情報とを、名寄せ候補データベース１２４のテーブルのうち合致した名寄せルールに対応するテーブルに名寄せ候補として登録する。また、名寄せ処理部１３１は、登録された名寄せ候補にユニークな結束キーを付与する。なお、ステップＳ４７での登録先の名寄せ候補データベース１２４は、図１３で使用される名寄せ候補データベース１２４とは別のデータベースである。

【0098】

［ステップＳ４８］名寄せ処理部１３１は、名寄せエラーと判定する。この場合、名寄せ処理部１３１は例えば、名寄せ辞書１２３に新たなレコードを追加し、ステップＳ４１で選択された加入者情報を追加したレコードに登録する。また、名寄せ処理部１３１は、登録された医療データにユニークな識別情報を付与される。

【0099】

［ステップＳ４９］名寄せ処理部１３１は、更新された加入者情報のすべてについて処理済みかを判定する。処理済みでない加入者情報が存在する場合、処理がステップＳ４１に進められ、更新された加入者情報のうち処理済みでない加入者情報の１つが選択される。一方、すべての加入者情報が処理済みの場合、名寄せ処理が終了する。

【0100】

以上の図１２の名寄せ処理によって名寄せ候補データベース１２４が新たに作成されると、この名寄せ候補データベース１２４を用いて図１１の処理が実行され、グルーピングシート１１１と名寄せルールごとの詳細シート１１２とが作成される。作成処理手順は図１１と同様であるので、図示を省略する。図１２で作成された名寄せ候補データベース１２４を用いて図１１の処理が実行されることで、更新された加入者情報と既存の名寄せ辞書１２３との間の名寄せ結果に基づくグルーピングシート１１１および詳細シート１１２が作成されることになる。

【0101】

ここで、詳細シート１１２の失敗理由表示部１１２ｅに表示する失敗理由の選択処理（図１１のステップＳ３４に対応）について説明する。失敗理由は、例えば、図１３に示すような失敗理由選択テーブルに基づいて選択される。

【0102】

図１３は、失敗理由選択テーブルの構成例を示す図である。図１３に示す失敗理由選択テーブル１２２ａは、名寄せルールごとに作成されて失敗理由データベース１２２に登録される。図１３では、名寄せルール「３」に対応する失敗理由選択テーブル１２２ａを例示している。

【0103】

失敗理由選択テーブル１２２ａには、１以上の失敗理由に対して、失敗理由を選択するための選択条件が対応付けて登録される。ステップＳ３４では、例えば、名寄せルールに対応する失敗理由選択テーブル１２２ａが選択される。そして、選択された失敗理由選択テーブル１２２ａの先頭側から選択条件が順に選択されて、データが相違する領域の位置や内容に基づき、選択された選択条件を満たすかが判定される。

【0104】

図１３に示す１つ目の選択条件は、名寄せ候補内の各医療データの間で「漢字の名字、カナの名字のいずれも異なる」というものである。この選択条件を満たす場合、各医療データは同一人物に対応するものの、その人物の名字が結婚などによって変更となったことが失敗理由になった可能性がある。このような選択条件が満たされるケースは、更新前後の加入者情報が突合される図１２の処理において発生しやすい。換言すると、図１２の処理により、結婚などによって名字が変更されたことで同一人物の加入者情報が複数登録されてしまった場合でも、これらの加入者情報を同一人物か否かの判断の対象として抽出し、ユーザに同一人物であると判定してもらう機会を確実に与えることができるようになる。

【0105】

図１３に示す２つ目の選択条件は、名寄せ候補内の各医療データの間で「カナの名字が一致し、漢字の名字の相違箇所に特定の字が含まれる」というものである。この選択条件を満たす場合、各医療データは同一人物に対応するものの、一方の医療データに対してシステムによる字つぶれや文字化けが発生したことが失敗理由になった可能性がある。

【0106】

図１３に示す３つ目の選択条件は、名寄せ候補内の各医療データの間で「カナの名字が一致し、漢字の名字の相違箇所が新旧の字体になっている」というものである。この選択条件を満たす場合、各医療データは同一人物に対応するものの、名字の漢字として一方の医療データには旧字体が使用され、他方の医療データには新字体が使用されたことが失敗理由になった可能性がある。

【0107】

２つ目または３つ目の選択条件が満たされるケースは、図１０および図１２のいずれの処理でも発生し得る。本実施の形態では、字つぶれや文字化けの発生、あるいは新旧字体の使用によって同一人物の加入者情報が複数登録されてしまった場合でも、これらの加入者情報を同一人物か否かの判断の対象として抽出し、ユーザに同一人物であると判定してもらう機会を確実に与えることができるようになる。

【0108】

なお、上記の各実施の形態に示した装置（例えば、情報処理装置１、名寄せ支援装置１００）の処理機能は、コンピュータによって実現することができる。その場合、各装置が有すべき機能の処理内容を記述したプログラムが提供され、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置（ＨＤＤ）、磁気テープなどがある。光ディスクには、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、ブルーレイディスク（Blu-ray Disc：ＢＤ、登録商標）などがある。光磁気記録媒体には、ＭＯ（Magneto-Optical disk）などがある。

【0109】

プログラムを流通させる場合には、例えば、そのプログラムが記録されたＤＶＤ、ＣＤなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。

【0110】

プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムにしたがった処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムにしたがった処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムにしたがった処理を実行することもできる。

【符号の説明】

【0111】

１情報処理装置
２処理部
１０データベース
１１～１３データレコード
２０表示情報
２１，２２表示部
Ｓ１，Ｓ２ステップ

【図1】