(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024088830
(43)【公開日】2024-07-03
(54)【発明の名称】情報処理プログラム、情報処理方法および情報処理装置
(51)【国際特許分類】
G06F 16/215 20190101AFI20240626BHJP
【FI】
G06F16/215
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022203818
(22)【出願日】2022-12-21
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和元年度、国立研究開発法人海上・港湾・航空技術研究所、戦略的イノベ-ション創造プログラム「スマート物流サービス」「物流・商流データ基盤に関する技術(要素基礎技術)」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002918
【氏名又は名称】弁理士法人扶桑国際特許事務所
(72)【発明者】
【氏名】田中 杏奈
(72)【発明者】
【氏名】菅原 久嗣
(72)【発明者】
【氏名】河合 豊
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175CA07
5B175HB03
(57)【要約】
【課題】対応するレコードを効率良く特定可能にする。
【解決手段】記憶部は、複数の第1レコードを含む第1データおよび複数の第2レコードを含む第2データを記憶する。処理部は、第1データのうちの第1レコードが選択されると、選択された第1レコードと複数の第2レコードそれぞれとの第1類似度を、第2レコードごとに表示装置に表示させる。処理部は、第1類似度の表示後に、第2データのうちの第2レコードが選択されると、選択された第2レコードと複数の第1レコードそれぞれとの第2類似度を、第2レコードごとの第1類似度とともに、第1レコードごとに表示装置に表示させる。
【選択図】
図17
【特許請求の範囲】
【請求項1】
コンピュータに、
複数の第1レコードを含む第1データのうちの第1レコードが選択されると、選択された前記第1レコードと複数の第2レコードを含む第2データに含まれる前記複数の第2レコードそれぞれとの第1類似度を、第2レコードごとに表示装置に表示させ、
前記第1類似度の表示後に、前記第2データのうちの前記第2レコードが選択されると、選択された前記第2レコードと前記複数の第1レコードそれぞれとの第2類似度を、前記第2レコードごとの前記第1類似度とともに、前記第1レコードごとに前記表示装置に表示させる、
処理を実行させる情報処理プログラム。
【請求項2】
前記第2類似度の表示では、前記第1類似度の表示の際に選択された前記第1レコードを強調表示させる、
請求項1記載の情報処理プログラム。
【請求項3】
前記第2類似度の表示後に、前記第1類似度および前記第2類似度の計算に用いられた計算手法とは異なる他の計算手法が選択されると、前記第1類似度の表示の際に選択された前記第1レコードと前記複数の第2レコードそれぞれとの第3類似度であって、前記他の計算手法を用いて計算された前記第3類似度を、前記第2レコードごとに前記表示装置に表示させる、
処理を更に前記コンピュータに実行させる請求項1記載の情報処理プログラム。
【請求項4】
前記第3類似度の表示では、前記第1類似度に代えて、前記第2レコードごとに前記第3類似度を表示させ、前記第2類似度の表示の際に選択された前記第2レコードを強調表示させる、
請求項3記載の情報処理プログラム。
【請求項5】
前記第1類似度の表示後に、前記第1レコードと前記第2レコードとのペアが選択されると、前記ペアを示す情報を記憶部に格納する、
処理を更に前記コンピュータに実行させる請求項1記載の情報処理プログラム。
【請求項6】
前記複数の第1レコードおよび前記複数の第2レコードに対する前記ペアの選択を完了する入力を受け付けると、前記記憶部に格納された前記ペアに含まれる前記第1レコードと前記第2レコードとを特定し、特定した前記第1レコードに含まれる第1データ項目の情報と、特定した前記第2レコードに含まれる第2データ項目の情報との対応関係を示す情報を出力する、
処理を更に前記コンピュータに実行させる請求項5記載の情報処理プログラム。
【請求項7】
コンピュータが、
複数の第1レコードを含む第1データのうちの第1レコードが選択されると、選択された前記第1レコードと複数の第2レコードを含む第2データに含まれる前記複数の第2レコードそれぞれとの第1類似度を、第2レコードごとに表示装置に表示させ、
前記第1類似度の表示後に、前記第2データのうちの前記第2レコードが選択されると、選択された前記第2レコードと前記複数の第1レコードそれぞれとの第2類似度を、前記第2レコードごとの前記第1類似度とともに、前記第1レコードごとに前記表示装置に表示させる、
情報処理方法。
【請求項8】
複数の第1レコードを含む第1データおよび複数の第2レコードを含む第2データを記憶する記憶部と、
前記第1データのうちの第1レコードが選択されると、選択された前記第1レコードと前記複数の第2レコードそれぞれとの第1類似度を、第2レコードごとに表示装置に表示させ、前記第1類似度の表示後に、前記第2データのうちの前記第2レコードが選択されると、選択された前記第2レコードと前記複数の第1レコードそれぞれとの第2類似度を、前記第2レコードごとの前記第1類似度とともに、前記第1レコードごとに前記表示装置に表示させる処理部と、
を有する情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理プログラム、情報処理方法および情報処理装置に関する。
【背景技術】
【0002】
データベースによって登録されているデータの形式が異なることがある。そのため、データベースの統合を行う場合などに、それぞれのデータベースの対応するレコード同士を特定する名寄せが行われることがある。
【0003】
例えば、第1文書に含まれる記載事項と関連付けるべき第2文書の記載事項の候補を、記載事項に含まれるキーワード同士の類似度に応じた優先度で表示してユーザに選択させる記載事項関連付けシステムの提案がある。また、例えば、患者間のデータの一致割合が、必要な情報一致度を上回る場合に、該当患者ペアは同一人物であるとして該当患者の医療情報を対応付けて出力する医療情報管理システムの提案もある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2015-028739号公報
【特許文献2】特開2011-257854号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
名寄せ作業者は、レコードの各項目を確認して、各データベースから対応するレコード同士を選択する。そこで、一方のデータベースから選択されたレコードに類似する他方のデータベースのレコードをコンピュータが提示することが考えられる。しかし、類似するレコード同士をコンピュータが提示した場合でも、両者が対応関係にあるか否かを作業者が目視確認することが多く、作業者の負担が大きい。
【0006】
1つの側面では、本発明は、対応するレコードを効率良く特定可能にする情報処理プログラム、情報処理方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
1つの態様では、情報処理プログラムが提供される。情報処理プログラムは、コンピュータに、複数の第1レコードを含む第1データのうちの第1レコードが選択されると、選択された第1レコードと複数の第2レコードを含む第2データに含まれる複数の第2レコードそれぞれとの第1類似度を、第2レコードごとに表示装置に表示させ、第1類似度の表示後に、第2データのうちの第2レコードが選択されると、選択された第2レコードと複数の第1レコードそれぞれとの第2類似度を、第2レコードごとの第1類似度とともに、第1レコードごとに表示装置に表示させる、処理を実行させる。
【0008】
また、1つの態様では、情報処理方法が提供される。
また、1つの態様では、情報処理装置が提供される。
【発明の効果】
【0009】
1つの側面では、対応するレコードを効率良く特定可能にすることができる。
【図面の簡単な説明】
【0010】
【
図1】第1の実施の形態の情報処理装置を説明する図である。
【
図2】第2の実施の形態の情報処理システムの例を示す図である。
【
図8】類似レコード探索画面の例を示す図(その1)である。
【
図9】類似レコード探索画面の例を示す図(その2)である。
【
図10】類似レコード探索画面の例を示す図(その3)である。
【
図11】類似レコード探索画面の例を示す図(その4)である。
【
図12】レコードペア一覧表示画面の例を示す図である。
【
図13】レコード詳細表示画面の例を示す図である。
【
図15】サーバの処理例を示すフローチャート(その1)である。
【
図16】サーバの処理例を示すフローチャート(その2)である。
【
図17】サーバの処理による名寄せ作業支援を説明する図である。
【発明を実施するための形態】
【0011】
以下、本実施の形態について図面を参照して説明する。
[第1の実施の形態]
第1の実施の形態を説明する。
【0012】
図1は、第1の実施の形態の情報処理装置を説明する図である。
情報処理装置10は、表示装置20に接続される。情報処理装置10は、表示装置20の画面表示によってユーザの名寄せ作業を支援する。なお、表示装置20は、情報処理装置10に接続されるディスプレイなどであってもよいし、情報処理装置10とネットワークを介して通信する装置に接続されるディスプレイなどであってもよい。情報処理装置10は、記憶部11および処理部12を有する。
【0013】
記憶部11は、RAM(Random Access Memory)などの揮発性記憶装置でもよいし、HDD(Hard Disk Drive)やフラッシュメモリなどの不揮発性記憶装置でもよい。処理部12は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)などを含み得る。処理部12はプログラムを実行するプロセッサでもよい。「プロセッサ」は、複数のプロセッサの集合(マルチプロセッサ)を含み得る。
【0014】
記憶部11は、第1データ11aおよび第2データ11bを記憶する。第1データ11aおよび第2データ11bは、例えば会社や個人に関する項目ごとの情報が登録されるデータベースである。なお、第1データ11aの項目と第2データ11bの項目とは、同じであってもよいし、異なっていてもよい。第1データ11aは、複数の第1レコードを含む。複数の第1レコードそれぞれは、第1データ11aの各項目の情報が記録されたものである。一例として、第1データ11aは、レコード名「X1」、「X2」、「X3」の第1レコードを含む。第2データ11bは、複数の第2レコードを含む。複数の第2レコードそれぞれは、第2データ11bの各項目に対応する情報が記録されたものである。一例として、第2データ11bは、レコード名「Y1」、「Y2」、「Y3」の第2レコードを含む。
【0015】
処理部12は、第1データ11aのうちの第1レコードの選択を受け付ける。例えば、処理部12は、表示装置20に画面21を表示させる。画面21は、レコード名「X1」、「X2」、「X3」および各レコード名に対応するチェックボックスを含む。処理部12は、何れかのチェックボックスの選択操作を受け付けると、選択されたチェックボックスに対応する第1レコードの選択を受け付ける。ここでは、レコード名「X1」の第1レコードが選択されたものとする。
【0016】
処理部12は、第1データ11aのうちの第1レコードが選択されると、選択された第1レコードと第2データ11bに含まれる複数の第2レコードそれぞれとの第1類似度22a,22b,22cを算出する。類似度の算出では一例として、まず、処理部12は、第1データ11aおよび第2データ11bの項目の選択をユーザから受け付ける。処理部12は、レコード名「X1」の第1レコードと複数の第2レコードそれぞれとの選択された項目同士を比較して類似度を算出する。例えば、処理部12は、選択された各項目に、会社名や住所などのテキストが記録されている場合、テキストの一致度合いを示す指標を類似度として算出する。
【0017】
ここでは、レコード名「X1」の第1レコードとレコード名「Y1」の第2レコードとの第1類似度22aが「90」と算出されたとする。また、レコード名「X1」の第1レコードとレコード名「Y2」の第2レコードとの第1類似度22bが「20」と算出されたとする。また、レコード名「X1」の第1レコードとレコード名「Y3」の第2レコードとの第1類似度22cが「50」と算出されたとする。処理部12は、第1類似度22a,22b,22cを、第2レコードごとに表示装置20に表示させる。例えば、処理部12は、第1類似度22a,22b,22cを画面21に追加した画面22を表示装置20に表示させる。
【0018】
画面22は、レコード名「Y1」、「Y2」、「Y3」および各レコード名に対応する第1類似度22a,22b,22cを含む。なお、画面22では、レコード名およびレコード名に対応する第1類似度が第1類似度の値が大きいほど上に配置される。また、画面22は、レコード名「Y1」、「Y2」、「Y3」それぞれに対応するチェックボックスを含む。
【0019】
処理部12は、第1類似度22a,22b,22cの表示後に、第2データ11bのうちの第2レコードの選択を受け付ける。例えば、処理部12は、画面22のレコード名「Y1」、「Y2」、「Y3」に対応する何れかのチェックボックスの選択操作を受け付けると、選択されたチェックボックスに対応する第2レコードの選択を受け付ける。ここでは、レコード名「Y1」の第2レコードが選択されたものとする。
【0020】
処理部12は、第2データ11bのうちの第2レコードが選択されると、選択された第2レコードと複数の第1レコードそれぞれとの第2類似度23a,23b,23cを算出する。例えば、処理部12は、第1類似度22a,22b,22cの計算に用いられた計算手法と同じ計算手法で、レコード名「Y1」の第2レコードと複数の第1レコードそれぞれとの第2類似度23a,23b,23cを算出する。
【0021】
ここでは、レコード名「Y1」の第2レコードとレコード名「X1」の第1レコードとの第2類似度23aが「90」と算出されたとする。また、レコード名「Y1」の第2レコードとレコード名「X2」の第1レコードとの第2類似度23bが「30」と算出されたとする。また、レコード名「Y1」の第2レコードとレコード名「X3」の第1レコードとの第2類似度23cが「60」と算出されたとする。
【0022】
処理部12は、第2類似度23a,23b,23cを第2レコードごとの第1類似度22a,22b,22cとともに、第1レコードごとに表示装置20に表示させる。ここで、処理部12は、第1類似度22a,22b,22cの表示の際に選択された第1レコードを強調表示させる。例えば、処理部12は、第2類似度23a,23b,23cを画面22に追加した画面23を表示装置20に表示させる。
【0023】
画面23は、レコード名「X1」、「X2」、「X3」および各レコード名に対応する第2類似度23a,23b,23cを含む。なお、画面23では、レコード名およびレコード名に対応する第2類似度が第2類似度の値が大きいほど上に配置される。また、画面23では、レコード名「X1」およびレコード名「X1」に対応する第2類似度23aが枠で囲まれ、強調されている。
【0024】
処理部12は、第1類似度22a,22b,22cの表示後に、第1レコードと第2レコードとのペアが選択されると、ペアを示す情報を記憶部11に格納する。例えば、処理部12は、画面21において選択された第1レコードと、画面22において選択された第2レコードとがペアであることを示す情報を記憶部11に格納する。つまり、処理部12は、レコード名「X1」の第1レコードとレコード名「Y1」の第2レコードとがペアであることを示す情報を記憶部11に格納する。
【0025】
処理部12は、上記の処理を複数の第1レコードおよび複数の第2レコードに対するペアの選択を完了する入力を受け付けるまで繰り返す。処理部12は、ペアの選択を完了する入力を受け付けると、記憶部11に格納されたペアに含まれる第1レコードと第2レコードとを特定する。そして、処理部12は、特定した第1レコードに含まれる第1データ項目の情報と、特定した第2レコードに含まれる第2データ項目の情報との対応関係を示す情報を出力する。例えば、処理部12は、第1データ項目の情報と第2データ項目の情報との対応関係を示すテーブルを、記憶部11に格納する。
【0026】
なお、第1データ項目は、例えば、第1データ11aの項目のうち、第1データ11aから第1レコードを検索するためのキーとなる項目である。また、第2データ項目は、例えば、第2データ11bの項目のうち、第2データ11bから第1レコードを検索するためのキーとなる項目である。
【0027】
情報処理装置10によれば、記憶部11は、複数の第1レコードを含む第1データ11aおよび複数の第2レコードを含む第2データ11bを記憶する。処理部12は、第1データ11aのうちの第1レコードが選択されると、選択された第1レコードと複数の第2レコードそれぞれとの第1類似度22a,22b,22cを、第2レコードごとに表示装置20に表示させる。ここで、第1類似度22a,22b,22cの表示後に、第2データ11bのうちの第2レコードが選択される。すると、処理部12は選択された第2レコードと複数の第1レコードそれぞれとの第2類似度23a,23b,23cを、第2レコードごとの第1類似度22a,22b,22cとともに、第1レコードごとに表示装置20に表示させる。
【0028】
これにより、情報処理装置10は、第1データ11aと第2データ11bとの名寄せ作業をするユーザに第1類似度22a,22b,22cおよび第2類似度23a,23b,23cを確認させることができる。ユーザは、第1類似度22a,22b,22cを確認することで、複数の第2レコードのうち第1レコードと対応関係にある可能性が高い第2レコードを選択できる。こうして、情報処理装置10は、ユーザにより、対応するレコードを効率良く特定可能にすることができる。
【0029】
その後、情報処理装置10は、第2類似度23a,23b,23cを、第1類似度22a,22b,22cとともに、表示装置20に表示させる。これにより、ユーザは、選択された第1レコードが複数の第1レコードのうち第2レコードと対応関係にある可能性が高いか否かを確認できる。すると、ユーザは、選択された第1レコードおよび選択された第2レコードの詳細を確認することなく、選択された第1レコードおよび選択された第2レコードが対応関係にあるか否かを判断できる。よって、情報処理装置10は、名寄せにおける作業負担を軽減することができる。
【0030】
また、処理部12は、第2類似度23a,23b,23cの表示では、第1類似度22a,22b,22cの表示の際に選択された第1レコードを強調表示させる。これにより、情報処理装置10は、選択された第2レコードと選択された第1レコードとの第2類似度をユーザに確認させやすくすることができる。
【0031】
また、処理部12は、第1類似度22a,22b,22cの表示後に、第1レコードと第2レコードとのペアが選択されると、ペアを示す情報を記憶部11に格納する。これにより、情報処理装置10は、ユーザによる名寄せ結果を保存できる。
【0032】
また、処理部12は、複数の第1レコードおよび複数の第2レコードに対するペアの選択を完了する入力を受け付けると、記憶部11に格納されたペアに含まれる第1レコードと第2レコードとを特定する。そして、処理部12は、特定した第1レコードに含まれる第1データ項目の情報と、特定した第2レコードに含まれる第2データ項目の情報との対応関係を示す情報を出力する。これにより、情報処理装置10は、第1データ11aおよび第2データ11bの一方の項目を用いて、他方から対応するデータを検索できるようにすることができる。よって、情報処理装置10は、データの利便性を向上させることができる。
【0033】
以下では、情報処理装置10の機能を更に具体的に説明する。
[第2の実施の形態]
次に、第2の実施の形態を説明する。
【0034】
図2は、第2の実施の形態の情報処理システムの例を示す図である。
第2の実施の形態の情報処理システムは、ユーザ端末41およびサーバ100を含む。サーバ100は、複数の会社それぞれに関する情報が登録された標準マスタを管理するサーバコンピュータである。標準マスタは、複数の会社に対して標準化されたデータ項目を管理するテーブルである。標準マスタは、サーバ100が管理するデータベースに含まれる。サーバ100は、ユーザ端末41から個社マスタのアップロードを受け付ける。個社マスタは、個々の会社で定められたデータ項目を管理するテーブルである。個社マスタは、個々の会社が運用するサーバコンピュータが管理するデータベースに含まれる。なお、個々の会社が運用するサーバコンピュータは、
図2では省略されている。そして、サーバ100は、ユーザ端末41を操作するユーザによる、個社マスタのレコードと標準マスタのレコードとの対応付けを行う名寄せ作業を支援するための画面情報をユーザ端末41に送信する。
【0035】
サーバ100は、第1の実施の形態の情報処理装置10の一例である。サーバ100およびユーザ端末41は、ネットワーク30に接続される。ネットワーク30は、例えばWAN(Wide Area Network)やインターネットである。サーバ100は、標準マスタを保持することで、会社間の円滑なデータ交換を支援する。
【0036】
ユーザ端末41は、ユーザにより操作されるクライアントコンピュータである。なお、ユーザ端末41は、ユーザが操作する他のコンピュータからリモート制御されていてもよい。ユーザ端末41は、例えば、ブラウザによって、サーバ100から取得した画面情報に基づく画面表示をする。
【0037】
図3は、サーバのハードウェア例を示す図である。
サーバ100は、CPU101、RAM102、HDD103、GPU(Graphics Processing Unit)104、入力インタフェース105、媒体リーダ106およびNIC(Network Interface Card)107を有する。なお、CPU101は、第1の実施の形態の処理部12の一例である。RAM102またはHDD103は、第1の実施の形態の記憶部11の一例である。
【0038】
CPU101は、プログラムの命令を実行するプロセッサである。CPU101は、HDD103に記憶されたプログラムやデータの少なくとも一部をRAM102にロードし、プログラムを実行する。なお、CPU101は複数のプロセッサコアを含んでもよい。また、サーバ100は複数のプロセッサを有してもよい。以下で説明する処理は複数のプロセッサまたはプロセッサコアを用いて並列に実行されてもよい。また、複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うことがある。
【0039】
RAM102は、CPU101が実行するプログラムやCPU101が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、サーバ100は、RAM以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。
【0040】
HDD103は、OS(Operating System)やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性の記憶装置である。なお、サーバ100は、フラッシュメモリやSSD(Solid State Drive)などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。
【0041】
GPU104は、CPU101からの命令に従って、サーバ100に接続されたディスプレイ31に画像を出力する。ディスプレイ31としては、CRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ(LCD:Liquid Crystal Display)、プラズマディスプレイ、有機EL(OEL:Organic Electro-Luminescence)ディスプレイなど、任意の種類のディスプレイを用いることができる。
【0042】
入力インタフェース105は、サーバ100に接続された入力デバイス32から入力信号を取得し、CPU101に出力する。入力デバイス32としては、マウス・タッチパネル・タッチパッド・トラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、サーバ100に、複数の種類の入力デバイスが接続されていてもよい。
【0043】
媒体リーダ106は、記録媒体33に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体33として、例えば、磁気ディスク、光ディスク、光磁気ディスク(MO:Magneto-Optical disk)、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク(FD:Flexible Disk)やHDDが含まれる。光ディスクには、CD(Compact Disc)やDVD(Digital Versatile Disc)が含まれる。
【0044】
媒体リーダ106は、例えば、記録媒体33から読み取ったプログラムやデータを、RAM102やHDD103などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、CPU101によって実行される。なお、記録媒体33は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体33やHDD103を、コンピュータ読み取り可能な記録媒体と言うことがある。
【0045】
NIC107は、ネットワーク30に接続され、ネットワーク30を介してユーザ端末41を含む他のコンピュータと通信を行うインタフェースである。NIC107は、例えば、スイッチやルータなどの通信装置とケーブルで接続される。NIC107は、通信装置と無線で接続されてもよい。
【0046】
なお、ユーザ端末41も、サーバ100と同様のハードウェアにより実現される。ユーザ端末41が有するディスプレイは、第1の実施の形態の表示装置20の一例である。
図4は、サーバの機能例を示す図である。
【0047】
サーバ100は、記憶部110、画面表示制御部120、類似度算出部130および変換テーブル出力部140を有する。記憶部110には、RAM102やHDD103の記憶領域が用いられる。画面表示制御部120、類似度算出部130および変換テーブル出力部140は、RAM102に記憶されたプログラムがCPU101により実行されることで実現される。
【0048】
記憶部110は、サーバ100が管理する標準マスタおよびユーザ端末41によってアップロードされた個社マスタを記憶する。
画面表示制御部120は、ユーザ端末41によるGUI(Graphical User Interface)の表示と、GUIを介したユーザ端末41からの入力を制御する。画面表示制御部120は、名寄せ作業を支援するための画面情報をユーザ端末41に送信し、ユーザ端末41のディスプレイに、当該画面を表示させる。なお以下では、ある画面を表示するための画面情報をユーザ端末41に送信し、ユーザ端末41のディスプレイに、当該画面を表示させることを、単に、ユーザ端末41に画面を表示させる、ということがある。
【0049】
画面表示制御部120は、名寄せ作業における条件の選択を受け付ける。例えば、画面表示制御部120は、名寄せによって対応付ける個社マスタの項目および標準マスタの項目(個社マスタの変換項目および標準マスタの変換項目)の選択を受け付ける。また、例えば、画面表示制御部120は、類似度計算に用いる類似度計算手法および類似度計算において比較される個社マスタの項目(個社マスタの突合せ項目)と標準マスタの項目(標準マスタの突合せ項目)との組み合わせの選択を受け付ける。
【0050】
画面表示制御部120は、個社マスタのレコードをユーザ端末41に表示させる。画面表示制御部120は、表示した個社マスタのレコードのうち、名寄せによる対応付けをする個社マスタのレコード(名寄せ元レコード)の選択を受け付ける。
【0051】
画面表示制御部120は、名寄せ元レコードの選択を受け付けると、標準マスタのレコードごとの名寄せ元レコードとの類似度をユーザ端末41に表示させる。画面表示制御部120は、表示した標準マスタのレコードのうち、名寄せ元レコードと対応付ける名寄せ先レコードの選択を受け付ける。
【0052】
画面表示制御部120は、名寄せ先レコードの選択を受け付けると、名寄せ元レコードを強調させて、個社マスタのレコードごとの名寄せ先レコードとの類似度をユーザ端末41に表示させる。
【0053】
類似度算出部130は、標準マスタのレコードごとの名寄せ元レコードとの類似度および個社マスタのレコードごとの名寄せ先レコードとの類似度を算出する。例えば、標準マスタのレコードごとの名寄せ元レコードとの類似度では、類似度算出部130は、名寄せ元レコードの突合せ項目に登録されたテキストと標準マスタのレコードの突合せ項目に登録されたテキストの一致度合いを示す指標を類似度として算出する。ここで、類似度算出部130は、テキストに含まれる所定の単語を他の単語に変換してから、突合せ項目に登録されたテキストを比較して類似度を算出してもよい。単語の変換に用いられる辞書は、画面表示制御部120が受け付けた類似度計算手法に応じて異なってもよい。また、類似度算出部130は、名寄せ元レコードと標準マスタに含まれる各レコードとの類似度を、名寄せ元レコードと標準マスタ上の各レコードとの相対評価により計算してもよい。例えば、類似度算出部130は、標準マスタに含まれるレコードの総数と、標準マスタのレコードのうち何番目に名寄せ元レコードに類似しているかとに基づいて、類似度を算出してもよい。
【0054】
変換テーブル出力部140は、名寄せ元レコードと名寄せ先レコードとがペアであることを示す情報を記憶部110に格納する。そして、変換テーブル出力部140は、ペアであるレコードの突合せ項目同士の対応関係を示すコード変換テーブルを出力する。
【0055】
図5は、標準マスタの例を示す図である。
標準マスタ111は、予め記憶部110に記憶される。標準マスタ111は、企業名、標準法人コードおよび所在地の項目を含む。企業名の項目には、企業の名称が登録される。標準法人コードの項目には、標準マスタ111における企業のIDが登録される。所在地の項目には、企業の所在地が登録される。
【0056】
例えば、標準マスタ111には、企業名の項目が「A株式会社」、標準法人コードの項目が「99999」、所在地の項目が「東京都・・・」であるレコードが登録されている。当該レコードは、企業名が「A株式会社」である企業の標準マスタ111における企業のIDが「99999」であり、所在地が「東京都・・・」であることを示す。
【0057】
図6は、個社マスタの例を示す図である。
個社マスタ112は、名寄せ作業の際に、ユーザ端末41から記憶部110にアップロードされる。個社マスタ112は、ID、会社名、法人番号および住所の項目を含む。IDの項目には、個社マスタ112におけるレコードのIDが登録される。会社名の項目には、会社の名称が登録される。法人番号の項目には、会社の法人番号が登録される。住所の項目には、会社の住所が登録される。
【0058】
例えば、個社マスタ112には、IDの項目が「1」、会社名の項目が「A(株)」、法人番号の項目が「12345」、住所の項目が「東京都・・・」である、ID「1」のレコードが登録されている。ID「1」のレコードは、会社名が「A(株)」である会社の法人番号が「12345」であり、住所が「東京都・・・」であることを示す。
【0059】
次に、画面表示制御部120がユーザ端末41に表示させる画面について説明する。
図7は、名寄せ項目選択画面の例を示す図である。
名寄せ項目選択画面200は、サーバ100による名寄せ作業支援の設定をユーザに選択させる画面である。画面表示制御部120は、ユーザ端末41からの接続に応じて、名寄せ項目選択画面200をユーザ端末41に表示させる。名寄せ項目選択画面200は、計算手法プルダウン201、個社マスタ表示領域202、標準マスタ表示領域203、突合せ項目表示領域204および変換項目表示領域205,206を含む。
【0060】
計算手法プルダウン201は、標準マスタ111のレコードと、個社マスタ112のレコードとの類似度の計算手法の選択を受け付けるプルダウンである。画面表示制御部120は、計算手法プルダウン201で選択された計算手法の通知をユーザ端末41から取得する。
【0061】
個社マスタ表示領域202は、個社マスタ112のレコードのサンプルが表示される領域である。ユーザ端末41は、名寄せ項目選択画面200の「個社マスタアップロード」ボタンの押下を受け付けると、個社マスタ112をサーバ100にアップロードする。すると、画面表示制御部120は、個社マスタ112のレコードのサンプルを個社マスタ表示領域202に表示させる。例えば、個社マスタ表示領域202には、個社マスタ112の各項目および個社マスタ112のID「1」のレコードに登録された各項目の情報が表示されている。
【0062】
標準マスタ表示領域203は、標準マスタ111のレコードのサンプルが表示される領域である。ユーザ端末41は、標準マスタを選択するプルダウンから標準マスタ111の選択を受け付けると、標準マスタ111のレコードのサンプルの表示をサーバ100に要求する。すると、画面表示制御部120は、標準マスタ111のレコードのサンプルを標準マスタ表示領域203に表示させる。例えば、標準マスタ表示領域203には、標準マスタ111の各項目および標準マスタ111の企業名の項目が「A株式会社」であるレコードに登録された各項目の情報が表示されている。
【0063】
突合せ項目表示領域204は、標準マスタ111のレコードと、個社マスタ112のレコードとの類似度の計算において比較される突合せ項目の組み合わせが表示される領域である。ユーザ端末41は、突合せ項目表示領域204に含まれる追加ボタンの押下を受け付けると、個社マスタ112の項目および標準マスタ111の項目を1つずつユーザに選択させる。ユーザ端末41は、選択された項目を突合せ項目の組み合わせとしてサーバ100に通知する。画面表示制御部120は、通知された突合せ項目の組み合わせを突合せ項目表示領域204に並べて表示させる。例えば、突合せ項目表示領域204には、個社マスタ112の会社名の項目と標準マスタ111の企業名の項目とが並べて表示されている。また、個社マスタ112の住所の項目と標準マスタ111の所在地の項目とが突合せ項目表示領域204に並べて表示されている。
【0064】
変換項目表示領域205は、個社マスタ112の変換項目が表示される領域である。ユーザ端末41は、個社マスタ表示領域202に表示された個社マスタ112の項目から1つの項目の選択を受け付ける。ユーザ端末41は、選択された項目を個社マスタ112の変換項目としてサーバ100に通知する。画面表示制御部120は、通知された個社マスタの変換項目を変換項目表示領域205に表示させる。例えば、変換項目表示領域205には、個社マスタ112の法人番号の項目が表示されている。
【0065】
変換項目表示領域206は、標準マスタ111の変換項目が表示される領域である。ユーザ端末41は、標準マスタ表示領域203に表示された標準マスタ111の項目から1つの項目の選択を受け付ける。ユーザ端末41は、選択された項目を標準マスタ111の変換項目としてサーバ100に通知する。画面表示制御部120は、通知された標準マスタ111の変換項目を変換項目表示領域206に表示させる。例えば、変換項目表示領域206には、標準マスタ111の標準法人コードの項目が表示されている。
【0066】
また、名寄せ項目選択画面200は、「名寄せ実行」ボタンを含む。画面表示制御部120は、「名寄せ実行」ボタンが押下されたことがユーザ端末41から通知されると、ユーザ端末41に次の画面を表示させる。なお、画面表示制御部120は、類似計算手法、突合せ項目および変換項目の選択を、類似度計算手法、突合せ項目および変換項目それぞれが選択されたときにユーザ端末41から受け付けてもよいし、「名寄せ実行」ボタンが押下されたときに受け付けてもよい。
【0067】
図8は、類似レコード探索画面の例を示す図(その1)である。
類似レコード探索画面300は、名寄せ作業支援をする画面である。画面表示制御部120は、名寄せ項目選択画面200の「名寄せ実行」ボタンが押下されたことがユーザ端末41から通知されると、類似レコード探索画面300をユーザ端末41に表示させる。
図8に示す類似レコード探索画面300は、レコードごとの情報の表示件数を設定するプルダウンおよび個社マスタレコード表示領域301を含む。例えば、類似レコード探索画面300では、表示件数が10件と設定されている。
【0068】
個社マスタレコード表示領域301は、名寄せ元レコードの選択を受け付ける領域である。個社マスタレコード表示領域301には、個社マスタ112のレコードごとに、突合せ項目の情報、変換項目の情報およびチェックボックスが表示される。例えば、個社マスタレコード表示領域301には、会社名、法人番号および住所の項目の情報が個社マスタ112のレコードごとに表示されている。
【0069】
ユーザ端末41は、個社マスタレコード表示領域301のチェックボックスの選択を受け付けると、選択されたチェックボックスに対応するレコードをサーバ100に通知する。画面表示制御部120は、通知されたレコードを名寄せ元レコードとして受け付ける。
【0070】
また、個社マスタレコード表示領域301は、「名寄せ先標準マスタレコード表示」ボタンを含む。画面表示制御部120は、「名寄せ先標準マスタレコード表示」ボタンが押下されたことがユーザ端末41から通知されると、類似度算出部130に、名寄せ元レコードと標準マスタ111のレコードそれぞれとの類似度を算出させる。類似度算出部130は、名寄せ項目選択画面200において選択された類似度計算手法および突合せ項目の組み合わせに基づいて、名寄せ元レコードと標準マスタ111のレコードそれぞれとの類似度を算出する。そして、画面表示制御部120は、類似レコード探索画面300に、名寄せ元レコードと標準マスタ111のレコードそれぞれとの類似度を追加表示させる。
【0071】
図9は、類似レコード探索画面の例を示す図(その2)である。
画面表示制御部120は、「名寄せ先標準マスタレコード表示」ボタンが押下されたことがユーザ端末41から通知されると、標準マスタレコード表示領域302を類似レコード探索画面300に追加表示させる。また、画面表示制御部120は、「選択レコードペア詳細確認」ボタンおよび「レコードペア一覧表示」ボタンを類似レコード探索画面300に追加表示させる。
【0072】
標準マスタレコード表示領域302は、標準マスタ111のレコードごとの、名寄せ元レコードに対する類似度を表示し、名寄せ先レコードの選択を受け付ける領域である。標準マスタレコード表示領域302には、標準マスタ111のレコードごとに、突合せ項目の情報、変換項目の情報、名寄せ元レコードとの類似度(スコア)、編集ボタンおよびチェックボックスが表示される。なお、標準マスタレコード表示領域302に表示される標準マスタ111のレコードごとの情報は、名寄せ元レコードとの類似度が大きいレコードの情報ほど上に配置される。
【0073】
例えば、標準マスタレコード表示領域302には、企業名、標準法人コードおよび所在地の項目の情報が標準マスタ111のレコードごとに表示されている。また、例えば、標準マスタレコード表示領域302には、名寄せ元レコードとの類似度が0~100の数値で標準マスタ111のレコードごとに表示されている。
【0074】
ユーザ端末41は、標準マスタレコード表示領域302のチェックボックスの選択を受け付けると、選択されたチェックボックスに対応するレコードをサーバ100に通知する。画面表示制御部120は、通知されたレコードを名寄せ先レコードとして受け付ける。なお、ユーザ端末41は、編集ボタンの押下を受け付けると、名寄せ先レコードの選択し直しを受け付ける。
【0075】
また、標準マスタレコード表示領域302は、「名寄せ元個社マスタレコード表示」ボタンを含む。画面表示制御部120は、「名寄せ元個社マスタレコード表示」ボタンが押下されたことがユーザ端末41から通知されると、類似度算出部130に、名寄せ先レコードと個社マスタ112のレコードそれぞれとの類似度を算出させる。類似度算出部130は、名寄せ項目選択画面200において選択された類似度計算手法および突合せ項目の組み合わせに基づいて、名寄せ先レコードと個社マスタ112のレコードそれぞれとの類似度を算出する。そして、画面表示制御部120は、類似レコード探索画面300に、名寄せ先レコードと個社マスタ112のレコードそれぞれとの類似度を追加表示させる。なお、画面表示制御部120は、名寄せ先レコードの選択を「名寄せ元個社マスタレコード表示」ボタンが押下されたときに受け付けてもよい。
【0076】
画面表示制御部120は、「選択レコードペア詳細確認」ボタンが押下されたことがユーザ端末41から通知されると、名寄せ元レコードおよび名寄せ先レコードの詳細を確認するための画面をユーザ端末41に表示させる。また、画面表示制御部120は、「レコードペア一覧表示」ボタンが押下されたことがユーザ端末41から通知されると、名寄せ元レコードおよび名寄せ先レコードとして選択されたペアの一覧をユーザ端末41に表示させる。また、変換テーブル出力部140は、「選択レコードペア詳細確認」ボタンまたは「レコードペア一覧表示」ボタンが押下されたことがユーザ端末41から通知されると、名寄せ元レコードと名寄せ先レコードとがペアであることを示す情報を記憶部110に格納する。
【0077】
図10は、類似レコード探索画面の例を示す図(その3)である。
画面表示制御部120は、「名寄せ元個社マスタレコード表示」ボタンが押下されたことがユーザ端末41から通知されると、個社マスタレコード表示領域303を類似レコード探索画面300に追加表示させる。
【0078】
個社マスタレコード表示領域303は、個社マスタ112のレコードごとの、名寄せ先レコードに対する類似度を表示する領域である。個社マスタレコード表示領域303には、個社マスタ112のレコードごとに、突合せ項目の情報、変換項目の情報、名寄せ先レコードとの類似度(スコア)が表示される。なお、個社マスタレコード表示領域303に表示される個社マスタ112のレコードごとの情報は、名寄せ先レコードとの類似度が大きいレコードの情報ほど上に配置される。また、個社マスタレコード表示領域303に表示される個社マスタ112のレコードごとの情報のうち、名寄せ元レコードの情報は、強調して表示される。
【0079】
例えば、個社マスタレコード表示領域303には、会社名、法人番号および住所の項目の情報が個社マスタ112のレコードごとに表示されている。また、例えば、個社マスタレコード表示領域303には、名寄せ先レコードとの類似度が0~100の数値で個社マスタ112のレコードごとに表示されている。また、例えば、個社マスタレコード表示領域303に表示されている名寄せ元レコードの情報は、目立つ色彩で表示されている。
【0080】
なお、個社マスタ112のレコードごとの類似度は、個社マスタ112のレコードの総数と、個社マスタ112のレコードのうち何番目に名寄せ先レコードに類似しているかとに基づいて、算出されることがある。また、標準マスタレコード表示領域302に表示される標準マスタ111のレコードごとの類似度は、標準マスタ111のレコードの総数と、標準マスタ111のレコードのうち何番目に名寄せ元レコードに類似しているかとに基づいて、算出されることがある。よって、標準マスタレコード表示領域302に表示される名寄せ元レコードと名寄せ先レコードとの類似度と、個社マスタレコード表示領域303に表示される名寄せ元レコードと名寄せ先レコードとの類似度とが異なる値になることがある。
【0081】
次に、類似レコード探索画面300において名寄せ元レコードおよび名寄せ先レコードが選択された後、類似レコード探索画面300を表示する際に用いた類似度計算手法と異なる類似度計算手法(他の計算手法)が選択された場合について説明する。
【0082】
図11は、類似レコード探索画面の例を示す図(その4)である。
図11に示す類似レコード探索画面300には、他の計算手法で算出された類似度および
図8~10で示した類似レコード探索画面300において選択された名寄せ先レコードに基づいて、標準マスタ111および個社マスタ112のレコードが表示される。例えば、画面表示制御部120は、
図8~10で示したように名寄せ元レコードおよび名寄せ先レコードが選択された後、名寄せ項目選択画面200で他の類似度計算手法が選択されると、
図11に示す類似レコード探索画面300をユーザ端末41に表示させる。なお、計算手法プルダウン201は、類似レコード探索画面300に含まれてもよい。
図11に示す類似レコード探索画面300の個社マスタレコード表示領域301では、類似レコード探索画面300と同じ名寄せ元レコードが選択されているものとする。
【0083】
図11に示す標準マスタレコード表示領域302では、標準マスタ111のレコードごとの類似度として、名寄せ元レコードとの他の計算手法で算出した類似度が表示される。また、
図11に示す標準マスタレコード表示領域302に表示される標準マスタ111のレコードごとの情報は、他の計算手法で算出した類似度が大きいレコードの情報ほど上に配置される。また、
図11に示す標準マスタレコード表示領域302に表示される標準マスタ111のレコードごとの情報のうち、
図8~10で示した類似レコード探索画面300において選択された名寄せ先レコードの情報は、強調して表示される。
【0084】
図11に示す個社マスタレコード表示領域303には、個社マスタ112のレコードごとの類似度として、
図11に示す標準マスタレコード表示領域302で選択された名寄せ先レコードとの他の計算手法で算出した類似度が表示される。また、
図11に示す個社マスタレコード表示領域303に表示される個社マスタ112のレコードごとの情報は、名寄せ先レコードとの他の計算手法で算出した類似度が大きいレコードの情報ほど上に配置される。また、
図11に示す個社マスタレコード表示領域303に表示される個社マスタ112のレコードごとの情報のうち、
図11に示す個社マスタレコード表示領域301において選択された名寄せ元レコードの情報は、強調して表示される。
【0085】
図12は、レコードペア一覧表示画面の例を示す図である。
レコードペア一覧表示画面400は、名寄せ元レコードおよび名寄せ先レコードのペアとして選択されたレコードを一覧表示する画面である。画面表示制御部120は、類似レコード探索画面300の「レコードペア一覧表示」ボタンが押下されたことがユーザ端末41から通知されると、レコードペア一覧表示画面400をユーザ端末41に表示させる。レコードペア一覧表示画面400は、個社マスタレコード表示領域401および標準マスタレコード表示領域402を含む。
【0086】
個社マスタレコード表示領域401には、個社マスタ112のレコードごとに、突合せ項目の情報および変換項目の情報が表示される。例えば、個社マスタレコード表示領域401には、会社名、法人番号および住所の項目の情報が個社マスタ112のレコードごとに表示されている。また、ユーザ端末41は、個社マスタレコード表示領域401に表示されたレコードの選択を受け付ける。画面表示制御部120は、個社マスタレコード表示領域401に表示されたレコードの選択を受け付けたことがユーザ端末41から通知されると、当該レコードおよび当該レコードの名寄せ先レコードの詳細を確認するための画面をユーザ端末41に表示させる。
【0087】
標準マスタレコード表示領域402には、個社マスタレコード表示領域401に表示された個社マスタ112のレコードそれぞれの名寄せ先レコードである標準マスタ111のレコードの情報が表示される。標準マスタレコード表示領域402には、標準マスタ111のレコードごとに、突合せ項目の情報および変換項目の情報が表示される。例えば、標準マスタレコード表示領域402には、企業名、標準法人コードおよび所在地の項目の情報が標準マスタ111のレコードごとに表示されている。
【0088】
標準マスタレコード表示領域402では、個社マスタレコード表示領域401に表示された個社マスタ112のレコードの情報それぞれの隣に、各レコードの名寄せ先レコードの情報が配置される。なお、名寄せ先レコードがない個社マスタ112のレコードの情報の隣には、例えば、「一致レコードなし」などの名寄せ先レコードがないことを示すメッセージが表示されてもよい。
【0089】
また、レコードペア一覧表示画面400は、「変換テーブル出力」ボタンを含む。画面表示制御部120は、「変換テーブル出力」ボタンが押下されたことがユーザ端末41から通知されると、変換テーブル出力部140に、名寄せ元レコードの変換項目と名寄せ先レコードの変換項目との対応関係を示すコード変換テーブルを生成させる。変換テーブル出力部140は、コード変換テーブルを生成し、記憶部110に格納する。
【0090】
図13は、レコード詳細表示画面の例を示す図である。
レコード詳細表示画面500は、名寄せ元レコードおよび名寄せ先レコードのペアの詳細を表示する画面である。画面表示制御部120は、類似レコード探索画面300の「選択レコードペア詳細確認」ボタンが押下されたことがユーザ端末41から通知されると、レコード詳細表示画面500をユーザ端末41に表示させる。また、画面表示制御部120は、レコードペア一覧表示画面400の個社マスタレコード表示領域401に表示されたレコードの選択を受け付けたことがユーザ端末41から通知されると、レコード詳細表示画面500をユーザ端末41に表示させる。レコード詳細表示画面500は、変換項目表示領域501、名寄せ元レコード表示領域502および名寄せ先レコード表示領域503を含む。
【0091】
変換項目表示領域501には、名寄せ元レコードおよび名寄せ先レコードそれぞれの変換項目の情報が表示される。名寄せ元レコード表示領域502には、個社マスタ112の各項目および名寄せ元レコードに登録された各項目の情報が表示されている。名寄せ先レコード表示領域503には、標準マスタ111の各項目および名寄せ先レコードに登録された各項目の情報が表示されている。
【0092】
また、レコード詳細表示画面500は、「変換テーブル出力」ボタンを含む。画面表示制御部120は、「変換テーブル出力」ボタンが押下されたことがユーザ端末41から通知されると、変換テーブル出力部140に、名寄せ元レコードの変換項目と名寄せ先レコードの変換項目との対応関係を示すコード変換テーブルを生成させる。変換テーブル出力部140は、コード変換テーブルを生成し、記憶部110に格納する。
【0093】
図14は、画面遷移の例を示す図である。
画面表示制御部120は、名寄せ項目選択画面200、類似レコード探索画面300、レコードペア一覧表示画面400およびレコード詳細表示画面500をユーザ端末41に表示させる。
【0094】
まず、画面表示制御部120は、ユーザ端末41からの接続に応じて、名寄せ項目選択画面200をユーザ端末41に表示させる。画面表示制御部120は、名寄せ項目選択画面200を表示しているユーザ端末41から「名寄せ実行」ボタンが押下されたことが通知されると(つまり、ペアの探索が要求されると)、類似レコード探索画面300をユーザ端末41に表示させる。
【0095】
画面表示制御部120は、類似レコード探索画面300を表示しているユーザ端末41から名寄せ項目選択画面200に戻る要求をされると(つまり、類似度計算手法の変更が要求されると)、名寄せ項目選択画面200をユーザ端末41に表示させる。また、画面表示制御部120は、類似レコード探索画面300を表示しているユーザ端末41から「レコードペア一覧表示」ボタンが押下されたことを通知されると、レコードペア一覧表示画面400をユーザ端末41に表示させる。また、画面表示制御部120は、類似レコード探索画面300を表示しているユーザ端末41から「選択レコードペア詳細確認」ボタンが押下されたことを通知されると、レコード詳細表示画面500をユーザ端末41に表示させる。
【0096】
画面表示制御部120は、レコードペア一覧表示画面400を表示しているユーザ端末41から個社マスタレコード表示領域401に表示されたレコードの選択を受け付けたことを通知されると、レコード詳細表示画面500をユーザ端末41に表示させる。
【0097】
次に、サーバ100の処理手順を説明する。
図15は、サーバの処理例を示すフローチャート(その1)である。
(S11)画面表示制御部120は、名寄せ項目選択画面200をユーザ端末41に表示させる。
【0098】
(S12)画面表示制御部120は、個社マスタ112を取得する。具体的には、画面表示制御部120は、ユーザ端末41がサーバ100にアップロードした個社マスタ112を取得し、記憶部110に格納する。そして、画面表示制御部120は、個社マスタ112のレコードのサンプルを名寄せ項目選択画面200の個社マスタ表示領域202に表示させる。
【0099】
(S13)画面表示制御部120は、標準マスタの選択を受け付ける。画面表示制御部120は、標準マスタ111を選択したことがユーザ端末41から通知されると、標準マスタ111のレコードのサンプルを名寄せ項目選択画面200の標準マスタ表示領域203に表示させる。
【0100】
(S14)画面表示制御部120は、標準マスタ111の変換項目および個社マスタ112の変換項目の選択を受け付ける。具体的には、画面表示制御部120は、ユーザ端末41から、名寄せ項目選択画面200において選択された標準マスタ111の変換項目および個社マスタ112の変換項目の通知を受け付ける。そして、画面表示制御部120は、個社マスタ112の変換項目を名寄せ項目選択画面200の変換項目表示領域205に表示させる。また、画面表示制御部120は、標準マスタ111の変換項目を名寄せ項目選択画面200の変換項目表示領域206に表示させる。
【0101】
(S15)画面表示制御部120は、標準マスタ111の突合せ項目および個社マスタ112の突合せ項目の選択を受け付ける。具体的には、画面表示制御部120は、ユーザ端末41から、名寄せ項目選択画面200において選択された突合せ項目の組み合わせの通知を受け付ける。画面表示制御部120は、通知された突合せ項目の組み合わせを突合せ項目表示領域204に並べて表示させる。
【0102】
(S16)画面表示制御部120は、類似度計算手法の選択を受け付ける。具体的には、画面表示制御部120は、ユーザ端末41から、名寄せ項目選択画面200において選択された類似度計算手法の通知を受け付ける。
【0103】
なお、上記のステップS14~ステップS16は、何れの順番で実行されてもよい。つまり、画面表示制御部120は、変換項目、突合せ項目および類似度計算手法の選択を何れの順番で受け付けてもよい。また、画面表示制御部120は、変換項目、突合せ項目および類似度計算手法の選択をまとめて受け付けてもよい。
【0104】
(S17)画面表示制御部120は、個社マスタ112のレコードをユーザ端末41に表示させる。具体的には、画面表示制御部120は、名寄せ項目選択画面200の「名寄せ実行」ボタンが押下されたことがユーザ端末41から通知されると、類似レコード探索画面300をユーザ端末41に表示させる。そして、画面表示制御部120は、類似レコード探索画面300の個社マスタレコード表示領域301に、個社マスタ112のレコードごとに、突合せ項目の情報、変換項目の情報を表示させる。
【0105】
(S18)画面表示制御部120は、名寄せ元レコードの選択を受け付ける。具体的には、画面表示制御部120は、ユーザ端末41から、類似レコード探索画面300において選択された名寄せ元レコードの通知を受け付ける。
【0106】
(S19)類似度算出部130は、ステップS18で選択を受け付けた名寄せ元レコードと標準マスタ111のレコードそれぞれとの類似度を算出する。ここで、類似度算出部130は、ステップS15で選択を受け付けた突合せ項目およびステップS16で選択を受け付けた類似度計算手法に基づいて、名寄せ元レコードと標準マスタ111のレコードそれぞれとの類似度を算出する。
【0107】
例えば、類似度算出部130は、名寄せ元レコードの突合せ項目に登録されたテキストと標準マスタ111のレコードの突合せ項目に登録されたテキストの一致度合いを示す指標を類似度として算出する。ここで、類似度算出部130は、テキストに含まれる所定の単語を他の単語に変換してから(例えば、「(株)」を「株式会社」に変換してから)、突合せ項目に登録されたテキストを比較して類似度を算出してもよい。単語の変換に用いられる辞書は、類似度計算手法ごとに異なってもよい。また、類似度算出部130は、標準マスタ111に含まれるレコードの総数と、標準マスタ111のレコードのうち何番目に名寄せ元レコードに類似しているかとに基づいて、類似度を算出してもよい。そして、類似度算出部130は、ステップS20に処理を進める。
【0108】
図16は、サーバの処理例を示すフローチャート(その2)である。
(S20)類似度算出部130は、ステップS16で選択を受け付けた類似度計算手法とは異なる類似度算出手法に基づいて実行された、名寄せ元レコードと標準マスタ111のレコードそれぞれとの類似度計算(実行済みの類似度計算)があるか否かを判定する。類似度算出部130は、実行済みの類似度計算がある場合、処理をステップS22に進める。また、類似度算出部130は、実行済みの類似度計算がない場合、処理をステップS21に進める。
【0109】
(S21)画面表示制御部120は、標準マスタ111のレコードそれぞれの名寄せ元レコードとの類似度をユーザ端末41に表示させる。具体的には、画面表示制御部120は、類似レコード探索画面300の標準マスタレコード表示領域302に、標準マスタ111のレコードごとに、突合せ項目の情報、変換項目の情報および名寄せ元レコードとの類似度を表示させる。そして、処理がステップS23に進む。
【0110】
(S22)画面表示制御部120は、実行済みの類似度計算において名寄せ先レコードとして選択されたレコードを強調して、標準マスタ111のレコードそれぞれの名寄せ元レコードとの類似度をユーザ端末41に表示させる。具体的には、画面表示制御部120は、類似レコード探索画面300の標準マスタレコード表示領域302に、標準マスタ111のレコードごとに、突合せ項目の情報、変換項目の情報および名寄せ元レコードとの類似度を表示させる。画面表示制御部120は、ユーザ端末41に、標準マスタレコード表示領域302に情報が表示されるレコードのうち、実行済みの類似度計算において名寄せ先レコードとして選択されたレコードの情報を強調して表示させる。
【0111】
(S23)画面表示制御部120は、名寄せ先レコードの選択を受け付ける。具体的には、画面表示制御部120は、ユーザ端末41から、類似レコード探索画面300において選択された名寄せ先レコードの通知を受け付ける。
【0112】
(S24)類似度算出部130は、ステップS23で選択を受け付けた名寄せ先レコードと個社マスタ112のレコードそれぞれとの類似度を算出する。ここで、類似度算出部130は、ステップS15で選択を受け付けた突合せ項目およびステップS16で選択を受け付けた類似度計算手法に基づいて、名寄せ先レコードと個社マスタ112のレコードそれぞれとの類似度を算出する。
【0113】
なお、類似度算出部130は、個社マスタ112のレコードの総数と、個社マスタ112のレコードのうち何番目に名寄せ先レコードに類似しているかとに基づいて、類似度を算出することがある。ここで、標準マスタ111のレコードの総数と個社マスタ112のレコードの総数とが異なる場合がある。よって、ステップS20で算出される名寄せ元レコードと名寄せ先レコードとの類似度と、ステップS24で算出される名寄せ元レコードと名寄せ先レコードとの類似度とが異なる値になることがある。
【0114】
(S25)画面表示制御部120は、ステップS18で選択を受け付けた名寄せ元レコードを強調して、個社マスタ112のレコードそれぞれの名寄せ先レコードとの類似度をユーザ端末41に表示させる。具体的には、画面表示制御部120は、類似レコード探索画面300の個社マスタレコード表示領域303に、個社マスタ112のレコードごとに、突合せ項目の情報、変換項目の情報および名寄せ先レコードとの類似度を表示させる。画面表示制御部120は、ユーザ端末41に、個社マスタレコード表示領域303に情報が表示されるレコードのうち、名寄せ元レコードの情報を強調して表示させる。
【0115】
(S26)変換テーブル出力部140は、名寄せ元レコードと名寄せ先レコードとがペアであることを示す情報を記憶部110に格納する。なお、変換テーブル出力部140は、名寄せ元レコードまたは名寄せ先レコードにペアがあることを示す情報がすでに記憶部110に格納されていた場合、名寄せ元レコードまたは名寄せ先レコードにペアがあることを示す情報を削除する。
【0116】
(S27)画面表示制御部120は、条件の変更の要求を受け付けたか否かを判定する。具体的には、画面表示制御部120は、ユーザ端末41から名寄せ項目選択画面200に戻る要求を受け付けた場合、条件の変更の要求を受け付けたと判定する。また、画面表示制御部120は、名寄せ項目選択画面200に戻る要求を受け付けていない場合、条件の変更の要求を受け付けていないと判定する。画面表示制御部120は、条件の変更の要求を受け付けたと判定した場合、処理をステップS15に進める。また、画面表示制御部120は、条件の変更の要求を受け付けていないと判定した場合、処理をステップS28に進める。
【0117】
(S28)画面表示制御部120は、ペアの選択が完了したことを示す入力があったか否かを判定する。具体的には、画面表示制御部120は、レコードペア一覧表示画面400またはレコード詳細表示画面500において「変換テーブル出力」ボタンが押下されたことがユーザ端末41から通知されると、ペアの選択が完了したことを示す入力があったと判定する。また、画面表示制御部120は、「変換テーブル出力」ボタンが押下されたことがユーザ端末41から通知されていない場合、ペアの選択が完了したことを示す入力がなかったと判定する。画面表示制御部120は、ペアの選択が完了したことを示す入力があったと判定した場合、処理をステップS29に進める。また、画面表示制御部120は、ペアの選択が完了したことを示す入力がなかったと判定した場合、処理をステップS27に進める。
【0118】
(S29)変換テーブル出力部140は、コード変換テーブルを出力する。具体的には、変換テーブル出力部140は、記憶部110に格納されたペアを示す情報から、ペアとなる標準マスタ111のレコードと個社マスタ112のレコードとを特定する。そして、変換テーブル出力部140は、特定したレコードそれぞれの、ステップS14で選択を受け付けた変換項目に登録された情報を対応付けた、コード変換テーブルを生成する。そして、変換テーブル出力部140は、生成したコード変換テーブルを記憶部110に格納する。
【0119】
このように、画面表示制御部120は、類似レコード探索画面300をユーザ端末41に表示させて、ユーザの名寄せ作業を支援する。これにより、画面表示制御部120は、名寄せにおけるユーザの作業負担を軽減することができる。
【0120】
また、画面表示制御部120は、類似度計算手法などの条件の変更を受け付け、他の類似度計算手法によって算出される、標準マスタ111のレコードそれぞれの名寄せ元レコードとの類似度をユーザ端末41に表示させることもできる。これにより、画面表示制御部120は、名寄せにおける複数の判断基準をユーザに提示できる。よって、画面表示制御部120は、名寄せの精度を向上させることができる。
【0121】
ここで、画面表示制御部120は、以前の類似度表示において、名寄せ先レコードとして選択されたレコードを強調表示させる。これにより、画面表示制御部120は、以前に名寄せ元レコードと対応関係にあると判断したレコードをユーザに確認させやすくすることができる。
【0122】
次に、類似レコード探索画面300によるユーザの名寄せ作業の支援について説明する。
図17は、サーバの処理による名寄せ作業支援を説明する図である。
【0123】
画面表示制御部120は、名寄せ元レコードが選択されると、類似レコード探索画面300の標準マスタレコード表示領域302に、標準マスタ111のレコードごとに、名寄せ元レコードとの類似度を表示させる。これにより、画面表示制御部120は、ユーザ端末41を操作するユーザに、標準マスタ111のレコードごとの、名寄せ元レコードとの類似度を確認させることで、名寄せ元レコードに対応する可能性が高い名寄せ先レコードを選択させることができる。
【0124】
画面表示制御部120は、名寄せ先レコードが選択されると、類似レコード探索画面300の個社マスタレコード表示領域303に、個社マスタ112のレコードごとに、名寄せ先レコードとの類似度を表示させる。これにより、画面表示制御部120は、名寄せ元レコードが個社マスタ112のレコードの中でどれだけ名寄せ先レコードと対応関係にある可能性が高いかをユーザに確認させることができる。
【0125】
画面表示制御部120が、このような双方向の類似度を表示させることで、ユーザは、名寄せ元レコードおよび名寄せ先レコードの詳細を確認することなく、名寄せ元レコードおよび名寄せ先レコードが対応関係にあるか否かを判断できる。よって、画面表示制御部120は、名寄せにおいて対応するレコードをユーザが効率良く特定可能にすることができる。
【0126】
また、画面表示制御部120は、名寄せ元レコードを強調して、個社マスタ112のレコードごとに、名寄せ先レコードとの類似度を表示させる。これにより、画面表示制御部120は、個社マスタ112のレコードごとの名寄せ先レコードとの類似度のうち、名寄せ元レコードと名寄せ先レコードとの類似度をユーザに確認させやすくすることができる。こうして、サーバ100は、ユーザによる円滑な名寄せ作業を支援できる。
【0127】
次に、コード変換テーブルについて説明する。
図18は、コード変換テーブルの例を示す図である。
コード変換テーブル113は、変換テーブル出力部140によって生成され、記憶部110に格納される。なお、
図18に示すコード変換テーブル113は、標準マスタ111の変換項目として、標準法人コードの項目が選択され、個社マスタ112のレコードの変換項目として法人番号が選択された場合に生成されるものである。コード変換テーブル113は、法人番号および標準法人コードの項目を有する。
【0128】
法人番号の項目には、ペアに含まれる個社マスタ112のレコードの法人番号の項目に登録されている情報が登録される。標準法人コードの項目には、ペアに含まれる標準マスタ111のレコードの法人情報の項目に登録されている情報が登録される。
【0129】
例えば、コード変換テーブル113には、法人番号の項目が「12345」、標準法人コードの項目が「99999」であるレコードが登録されている。当該レコードは、法人番号の項目に「12345」が登録されている個社マスタ112のレコードと、標準法人コードの項目に「99999」が登録されている標準マスタ111のレコードとがペアであることを示す。
【0130】
なお、サーバ100は、コード変換テーブル113をユーザ端末41に送信することもできる。すると、ユーザ端末41は、コード変換テーブル113を用いることで、個社マスタ112のレコードに対応する標準マスタ111のレコードを検索できるようになる。また、例えば、個社側から標準マスタ111に登録するレコードにおける法人番号を、標準法人コードに適切に変換できる。よって、変換テーブル出力部140は、このようなコード変換テーブル113を生成することで、標準マスタ111に登録するレコードの変換を容易化でき、サーバ100を介した会社間のデータ交換を円滑化できる。
【0131】
第2の実施の形態によれば、サーバ100は、以下の処理を実行する。記憶部110は、複数の第1レコードを含む第1データおよび複数の第2レコードを含む第2データを記憶する。
【0132】
画面表示制御部120は、第1データのうちの第1レコードが選択されると、選択された第1レコードと複数の第2レコードそれぞれとの第1類似度を、第2レコードごとに表示装置に表示させる。画面表示制御部120は、第1類似度の表示後に、第2データのうちの第2レコードが選択されると、選択された第2レコードと複数の第1レコードそれぞれとの第2類似度を、第2レコードごとの第1類似度とともに、第1レコードごとに表示装置に表示させる。
【0133】
ここで、個社マスタ112は、第1データの一例である。また、標準マスタ111は、第2データの一例である。また、ユーザ端末41は、表示装置の一例である。また、名寄せ元レコードは、選択された第1レコードの一例である。また、名寄せ先レコードは、選択された第2レコードの一例である。
【0134】
これにより、サーバ100は、名寄せ作業をするユーザに第1類似度を確認させ、複数の第2レコードのうち第1レコードと対応関係にある可能性が高い第2レコードを選択させることができる。さらに、ユーザは、第2レコード選択後に、第1類似度とともに表示された第2類似度を確認することで、選択された第1レコードが複数の第1レコードのうち第2レコードと対応関係にある可能性が高いか否かを確認できる。すると、ユーザは、選択された第1レコードおよび選択された第2レコードの詳細を確認することなく、選択された第1レコードおよび選択された第2レコードが対応関係にあるか否かを判断できる。よって、サーバ100は、ユーザにより、対応するレコードを効率良く特定可能にすることができる。また、サーバ100は、名寄せにおけるユーザの作業負担を軽減することができる。
【0135】
また、画面表示制御部120は、第1類似度の表示の際に選択された第1レコードを強調表示させる。これにより、サーバ100は、選択された第2レコードと選択された第1レコードとの第2類似度をユーザに確認させやすくすることができる。
【0136】
また、第2類似度の表示後に、第1類似度および第2類似度の計算に用いられた計算手法とは異なる他の計算手法が選択されることがある。すると、画面表示制御部120は、第1類似度の表示の際に選択された第1レコードと複数の第2レコードそれぞれとの第3類似度であって、他の計算手法を用いて計算された第3類似度を、第2レコードごとに表示装置に表示させる。これにより、サーバ100は、名寄せにおける複数の判断基準をユーザに提示できる。よって、サーバ100は、名寄せの精度を向上させることができる。
【0137】
また、画面表示制御部120は、第1類似度に代えて、第2レコードごとに第3類似度を表示させ、第2類似度の表示の際に選択された第2レコードを強調表示させる。これにより、サーバ100は、以前に第1レコードと対応関係にあると判断した第2レコードをユーザに確認させやすくすることができる。
【0138】
また、変換テーブル出力部140は、第1類似度の表示後に、第1レコードと第2レコードとのペアが選択されると、ペアを示す情報を記憶部に格納する。これにより、サーバ100は、ユーザによる名寄せ結果を保存できる。
【0139】
また、変換テーブル出力部140は、複数の第1レコードおよび前記複数の第2レコードに対するペアの選択を完了する入力を受け付けると、記憶部110に格納されたペアに含まれる第1レコードと第2レコードとを特定する。そして、変換テーブル出力部140は、特定した第1レコードに含まれる第1データ項目の情報と、特定した第2レコードに含まれる第2データ項目の情報との対応関係を示す情報を出力する。これにより、サーバ100は、例えば、第1データ項目の情報を含むレコードにおける当該第1データ項目の情報を、第2データ項目の情報に容易に変換可能になる。例えば、サーバ100は、あるユーザが管理するレコードにおける第1データ項目の情報を別のユーザが管理するレコード、あるいは、標準的なレコードにおける第2データ項目の情報に容易に変換可能にすることで、ユーザ間のデータ交換を円滑化できる。なお、個社マスタ112の変換項目は、第1データ項目の一例である。また、標準マスタ111の変換項目は、第2データ項目の一例である。
【0140】
なお、第1の実施の形態の情報処理は、処理部12にプログラムを実行させることで実現できる。また、第2の実施の形態の情報処理は、CPU101にプログラムを実行させることで実現できる。プログラムは、コンピュータ読み取り可能な記録媒体33に記録できる。
【0141】
例えば、プログラムを記録した記録媒体33を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体33に記録されたプログラムまたは他のコンピュータから受信したプログラムを、RAM102やHDD103などの記憶装置に格納し(インストールし)、当該記憶装置からプログラムを読み込んで実行してもよい。
【符号の説明】
【0142】
10 情報処理装置
11 記憶部
11a 第1データ
11b 第2データ
12 処理部
20 表示装置
21,22,23 画面
22a,22b,22c 第1類似度
23a,23b,23c 第2類似度