(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023101973
(43)【公開日】2023-07-24
(54)【発明の名称】名寄せ装置
(51)【国際特許分類】
G06Q 50/10 20120101AFI20230714BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022002238
(22)【出願日】2022-01-11
(71)【出願人】
【識別番号】520368828
【氏名又は名称】株式会社ランドデータバンク
(74)【代理人】
【識別番号】100110858
【弁理士】
【氏名又は名称】柳瀬 睦肇
(72)【発明者】
【氏名】矢川 昇
(72)【発明者】
【氏名】川口 英利
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC12
(57)【要約】
【課題】法人の記載形式が異なる2つのデータテーブルを容易に名寄せできる名寄せ装置を提供する。
【解決手段】本発明は、名寄せ対象データテーブル11から、第1,第2の名寄せ対象データそれぞれの複数の法人の各々の第1,第2の照合要素をデータテーブルに導入する機能(b)12と、第1,第2の名寄せ対象データの各々の第1,第2の照合要素を、照合可能となるように互換性を有する情報に置換する機能(c)と、機能(c)で置換された第1の名寄せ対象データの第1,第2の照合要素と第2の名寄せ対象データの第1,第2の照合要素を照合することで、第1,第2の照合要素の両方が1組一致する法人の複数の組み合わせを良好一致集合に登録し、且つ第1,第2の照合要素の少なくとも一方が一致しない法人を再検討処理集合に登録する機能(d)を実現するプログラムを有する名寄せ装置である。
【選択図】
図1
【特許請求の範囲】
【請求項1】
第1及び第2の照合要素を有する複数の法人を含む第1の名寄せ対象データと、前記第1及び第2の照合要素を有する複数の法人を含む第2の名寄せ対象データを含む名寄せ対象データテーブルを有する名寄せ装置において、
前記名寄せ対象データテーブルから、前記第1の名寄せ対象データの前記複数の法人の各々の前記第1及び第2の照合要素、及び、前記第2の名寄せ対象データの前記複数の法人の各々の前記第1及び第2の照合要素をデータテーブルにインポートする機能(b)と、
前記データテーブルにインポートされた前記第1及び第2の名寄せ対象データの各々の前記第1及び第2の照合要素を、照合可能となるように互換性を有する情報に置換する機能(c)と、
前記機能(c)で置換された前記第1の名寄せ対象データの前記第1の照合要素と前記第2の名寄せ対象データの前記第1の照合要素を照合し、且つ、前記機能(c)で置換された前記第1の名寄せ対象データの前記第2の照合要素と前記第2の名寄せ対象データの前記第2の照合要素を照合することで、第1及び第2の照合要素の両方が1組一致する法人の複数の組み合わせを良好一致集合に登録し、且つ前記第1及び第2の照合要素の少なくとも一方が一致しない法人を第1の再検討処理集合に登録し、且つ前記第1及び第2の照合要素の両方が複数組一致する法人の組み合わせを第2の再検討処理集合に登録する機能(d)と、
を実現するプログラムを有することを特徴とする名寄せ装置。
【請求項2】
請求項1において、
前記機能(d)で前記第1の再検討処理集合に登録された法人の第1及び第2の照合要素又は前記機能(c)で置換される前の前記第1及び第2の照合要素をキーワードにして検索エンジンにより検索し、その検索結果から第1の検索照合要素を取得する機能(e)と、
前記機能(e)で取得した前記第1の名寄せ対象データ側の前記第1の検索照合要素と前記第2の名寄せ対象データ側の前記第1の検索照合要素を照合することで、両者が一致する法人の組み合わせを前記良好一致集合に登録する機能(f)と、
を実現するプログラムを有することを特徴とする名寄せ装置。
【請求項3】
請求項1又は2において、
前記機能(d)で前記第2の再検討処理集合に登録された法人の第1及び第2の照合要素又は前記機能(c)で置換される前の前記第1及び第2の照合要素をキーワードにして検索エンジンにより検索し、その検索結果から第2の検索照合要素を取得する機能(g)と、
前記機能(g)で取得した前記第1の名寄せ対象データ側の前記第2の検索照合要素と前記第2の名寄せ対象データ側の前記第2の検索照合要素を照合することで、両者が一致する法人の組み合わせを前記良好一致集合に登録する機能(h)と、
を実現するプログラムを有することを特徴とする名寄せ装置。
【請求項4】
請求項1から3のいずれか一項において、
前記機能(d)で前記第1及び第2の照合要素の両方が1組一致する法人の複数の組み合わせを良好一致集合に登録する際に、その登録前に前記法人の複数の組み合わせについて各種ロジックで一致を検証し、誤一致が疑われる法人は前記良好一致集合に登録せず、誤一致の疑いのない法人だけを良好一致集合に登録する機能(d1)を実現するプログラムを有することを特徴とする名寄せ装置。
【請求項5】
請求項1から4のいずれか一項において、
前記第1の照合要素は、法人名であり、
前記第2の照合要素は、住所、電話番号、郵便番号、代表者名、及び、前記法人が所属する業界で付与された番号のいずれかであることを特徴とする名寄せ装置。
【請求項6】
請求項5において、
前記機能(c)は、前記法人名の中にスペースが存在する場合は前記スペースを削除し、前記法人名の中に企業種別の省略形が存在する場合は前記省略形を正式な記載に置換し、様々な長音記号を統一した長音記号に置換し、旧字を新字に置換する機能を有することを特徴とする名寄せ装置。
【請求項7】
請求項5又は6において、
前記機能(c)は、前記住所において、都道府県を第1コードに置換し、市区町村、東京都の23区、又は政令指定都市の場合は市と区の組み合わせを第2コードに置換する機能を有することを特徴とする名寄せ装置。
【請求項8】
請求項1から7のいずれか一項において、
前記機能(e)の前記第1の検索照合要素は、URLのドメイン部分であることを特徴とする名寄せ装置。
【請求項9】
請求項1から8のいずれか一項において、
前記良好一致集合に登録された複数の法人の各々に識別番号を付与し、テーブルに出力する機能(m)を実現するプログラムを有することを特徴とする名寄せ装置。
【請求項10】
請求項1から9のいずれか一項において、
前記第1の名寄せ対象データは、前記第1及び第2の照合要素を有する複数の個人事業主を含み、前記第2の名寄せ対象データは、前記第1及び第2の照合要素を有する複数の個人事業主を含むことを特徴とする名寄せ装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、名寄せ装置に関する。
【背景技術】
【0002】
企業情報の分析を行うためには、例えば建設業界等の法人及び個人事業主等の法人名や屋号及び住所や電話番号等を含むデータテーブルが複数あるとき、法人及び個人事業主等を特定するためにテーブル間の名寄せ作業を行うことがある。
【0003】
しかし、上記の複数のデータテーブルは、同一の法人や個人事業主であっても法人名や屋号等の記載形式が異なることが多いため、単純に法人名や屋号によって名寄せ作業を行っても、法人や個人事業主の同一性が確認できないことが多い。そのため、法人名や屋号等の記載形式が異なる複数のデータテーブルの中からでも容易に名寄せ作業ができる名寄せ装置が求められている。なお、名寄せ作業に関連する技術が特許文献1に記載されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の種々の態様は、法人の記載形式が異なる2つのデータテーブルを容易に名寄せできる名寄せ装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
以下に本発明の種々の態様について説明する。
【0007】
[1]第1及び第2の照合要素を有する複数の法人を含む第1の名寄せ対象データと、前記第1及び第2の照合要素を有する複数の法人を含む第2の名寄せ対象データを含む名寄せ対象データテーブルを有する名寄せ装置において、
前記名寄せ対象データテーブルから、前記第1の名寄せ対象データの前記複数の法人の各々の前記第1及び第2の照合要素、及び、前記第2の名寄せ対象データの前記複数の法人の各々の前記第1及び第2の照合要素をデータテーブルにインポートする機能(b)と、
前記データテーブルにインポートされた前記第1及び第2の名寄せ対象データの各々の前記第1及び第2の照合要素を、照合可能となるように互換性を有する情報に置換する機能(c)と、
前記機能(c)で置換された前記第1の名寄せ対象データの前記第1の照合要素と前記第2の名寄せ対象データの前記第1の照合要素を照合し、且つ、前記機能(c)で置換された前記第1の名寄せ対象データの前記第2の照合要素と前記第2の名寄せ対象データの前記第2の照合要素を照合することで、第1及び第2の照合要素の両方が1組一致する法人の複数の組み合わせを良好一致集合に登録し、且つ前記第1及び第2の照合要素の少なくとも一方が一致しない法人を第1の再検討処理集合に登録し、且つ前記第1及び第2の照合要素の両方が複数組一致する法人の組み合わせを第2の再検討処理集合に登録する機能(d)と、
を実現するプログラムを有することを特徴とする名寄せ装置。
【0008】
上記[1]の名寄せ装置によれば、第1及び第2の照合要素の両方が1組一致する場合は、その一致した法人の複数の組み合わせを良好一致集合に登録する。これにより、第1及び第2の名寄せ対象データの各々に膨大な件数の記載形式の異なる法人が含まれていても、第1の名寄せ対象データと第2の名寄せ対象データを容易に名寄せすることができる。
【0009】
[2]上記[1]において、
前記機能(d)で前記第1の再検討処理集合に登録された法人の第1及び第2の照合要素又は前記機能(c)で置換される前の前記第1及び第2の照合要素をキーワードにして検索エンジンにより検索し、その検索結果から第1の検索照合要素を取得する機能(e)と、
前記機能(e)で取得した前記第1の名寄せ対象データ側の前記第1の検索照合要素と前記第2の名寄せ対象データ側の前記第1の検索照合要素を照合することで、両者が一致する法人の組み合わせを前記良好一致集合に登録する機能(f)と、
を実現するプログラムを有することを特徴とする名寄せ装置。
【0010】
上記[2]の名寄せ装置によれば、第1の検索照合要素の両者が一致する場合は、その一致した法人の組み合わせを良好一致集合に登録する。これにより、第1の名寄せ対象データと第2の名寄せ対象データの名寄せができる割合を高めることができる。
【0011】
[3]上記[1]又は[2]において、
前記機能(d)で前記第2の再検討処理集合に登録された法人の第1及び第2の照合要素又は前記機能(c)で置換される前の前記第1及び第2の照合要素をキーワードにして検索エンジンにより検索し、その検索結果から第2の検索照合要素を取得する機能(g)と、
前記機能(g)で取得した前記第1の名寄せ対象データ側の前記第2の検索照合要素と前記第2の名寄せ対象データ側の前記第2の検索照合要素を照合することで、両者が一致する法人の組み合わせを前記良好一致集合に登録する機能(h)と、
を実現するプログラムを有することを特徴とする名寄せ装置。
【0012】
上記[3]の名寄せ装置によれば、第2の検索照合要素の両者が一致する場合は、その一致した法人の組み合わせを良好一致集合に登録する。これにより、第1の名寄せ対象データと第2の名寄せ対象データの名寄せができる割合を高めることができる。
【0013】
[4]上記[1]から[3]のいずれか一項において、
前記機能(d)で前記第1及び第2の照合要素の両方が1組一致する法人の複数の組み合わせを良好一致集合に登録する際に、その登録前に前記法人の複数の組み合わせについて各種ロジックで一致を検証し、誤一致が疑われる法人は前記良好一致集合に登録せず、誤一致の疑いのない法人だけを良好一致集合に登録する機能(d1)を実現するプログラムを有することを特徴とする名寄せ装置。
【0014】
上記[4]の名寄せ装置によれば、誤一致が疑われる法人を良好一致集合への登録から除くことで、良好一致集合に登録される法人の組み合わせの信頼性を高めることができる。
【0015】
[5]上記[1]から[4]のいずれか一項において、
前記第1の照合要素は、法人名であり、
前記第2の照合要素は、住所、電話番号、郵便番号、代表者名、及び、前記法人が所属する業界で付与された番号のいずれかであることを特徴とする名寄せ装置。
【0016】
上記[5]の名寄せ装置によれば、法人名及び住所等の照合要素を有することにより、第1の名寄せ対象データと第2の名寄せ対象データの名寄せ処理を容易に行うことができる。
【0017】
[6]上記[5]において、
前記機能(c)は、前記法人名の中にスペースが存在する場合は前記スペースを削除し、前記法人名の中に企業種別の省略形が存在する場合は前記省略形を正式な記載に置換し、様々な長音記号を統一した長音記号に置換し、旧字を新字に置換する機能を有することを特徴とする名寄せ装置。
【0018】
上記[6]の名寄せ装置によれば、第1及び第2の名寄せ対象データの各々の第1の照合要素の法人名を互換性を有する法人名に置換することで、第1の名寄せ対象データと第2の名寄せ対象データの名寄せ処理を容易に行うことができる。
【0019】
[7]上記[5]又は[6]において、
前記機能(c)は、前記住所において、都道府県を第1コードに置換し、市区町村、東京都の23区、又は政令指定都市の場合は市と区の組み合わせを第2コードに置換する機能を有することを特徴とする名寄せ装置。
【0020】
上記[7]の名寄せ装置によれば、第1及び第2の名寄せ対象データの各々の第2の照合要素の住所を互換性を有するコードに置換することで、第1の名寄せ対象データと第2の名寄せ対象データの名寄せ処理を容易に行うことができる。
【0021】
[8]上記[1]から[7]のいずれか一項において、
前記機能(e)の前記第1の検索照合要素は、URLのドメイン部分であることを特徴とする名寄せ装置。
【0022】
[9]上記[1]から[8]のいずれか一項において、
前記良好一致集合に登録された複数の法人の各々に識別番号を付与し、テーブルに出力する機能(m)を実現するプログラムを有することを特徴とする名寄せ装置。
【0023】
[10]上記[1]から[9]のいずれか一項において、
前記第1の名寄せ対象データは、前記第1及び第2の照合要素を有する複数の個人事業主を含み、前記第2の名寄せ対象データは、前記第1及び第2の照合要素を有する複数の個人事業主を含むことを特徴とする名寄せ装置。
【発明の効果】
【0024】
本発明の種々の態様によれば、法人の記載形式が異なる2つのデータテーブルを容易に名寄せできる名寄せ装置を提供することができる。
【図面の簡単な説明】
【0025】
【
図1】本発明の一態様に係る名寄せ装置を説明するための図である。
【発明を実施するための形態】
【0026】
以下では、本発明の実施形態について図面を用いて詳細に説明する。ただし、本発明は以下の説明に限定されず、本発明の趣旨及びその範囲から逸脱することなくその形態及び詳細を様々に変更し得ることは、当業者であれば容易に理解される。従って、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。
【0027】
(第1の実施形態)
図1は、本発明の種々の態様に係る名寄せ装置を説明するための図である。
この名寄せ装置は、第1及び第2の名寄せ対象データを含む名寄せ対象データテーブル11を有している。第1及び第2の名寄せ対象データは、有償又は無償で取得したものを用いることができ、例えば建設業許可番号マスタ、法人番号マスタ等である。
【0028】
第1の名寄せ対象データは、複数の法人を含み、複数の法人の各々は少なくとも第1及び第2の照合要素を有する。なお、第1の名寄せ対象データは、複数の個人事業主を含んでいてもよく、複数の個人事業主の各々は少なくとも第1及び第2の照合要素を有する。
【0029】
第2の名寄せ対象データは、複数の法人を含み、複数の法人の各々は少なくとも第1及び第2の照合要素を有する。なお、第2の名寄せ対象データは、複数の個人事業主を含んでいてもよく、複数の個人事業主の各々は少なくとも第1及び第2の照合要素を有する。
【0030】
上記の複数の法人の各々が有する照合要素としては、例えば法人名、法人の住所、法人の代表者名、電話番号、法人が属している業界の特定の番号等が挙げられるが、法人と関連付けられるものであれば、その他のものでも良い。これらの照合要素の中から第1及び第2の照合要素を選定するとよい。なお、第1及び第2の名寄せ対象データの各々に複数の個人事業主が含まれる場合、複数の個人事業主の各々が有する照合要素としては、個人事業主の屋号又は氏名、個人事業主の住所、個人事業主が属している業界の特定の番号等が挙げられるが、個人事業主と関連付けられるものであれば、その他のものでも良い。
【0031】
図1の名寄せ装置は以下の(b)~(d)の機能12~14を実現するプログラムを有している。
【0032】
(b)名寄せ対象データテーブル11から、第1の名寄せ対象データの複数の法人の各々の第1及び第2の照合要素、及び、第2の名寄せ対象データの複数の法人の各々の第1及び第2の照合要素をデータテーブルにインポートする機能(
図1の参照符号12)。第1の照合要素は、例えば法人名であるとよい。また、第2の照合要素は、例えば法人の住所であるとよい。
【0033】
(c)上記(b)のデータテーブルにインポートされた第1及び第2の名寄せ対象データの各々の前記第1及び第2の照合要素(例えば法人名及び住所)を、照合可能となるように互換性を有する情報に置換する機能(
図1の参照符号13)。第1及び第2の名寄せ対象データは、法人の記載形式が互いに異なるため、例えば第1の照合要素が法人名である場合、同一の会社であっても、第1の名寄せ対象データでは「(株)名寄せ」と記載されているのに対し、第2の名寄せ対象データでは「株式会社名寄せ」と記載されていることがある。このような場合、互換性を有しないので、例えば「(株)」を「株式会社」に置換することで照合可能となる。
【0034】
また、上記(c)の機能13は、第1の照合要素の法人名の中にスペースが存在する場合はスペースを削除し、第1の照合要素の法人名の中に企業種別の省略形が存在する場合は省略形を正式な記載に置換し、様々な長音記号を統一した長音記号に置換し、旧字を新字に置換する機能を有していてもよい。
【0035】
上述したように、第1及び第2の名寄せ対象データの各々の第1の照合要素の法人名を互換性を有する法人名に置換することで、第1の名寄せ対象データと第2の名寄せ対象データの名寄せ処理を容易に行うことができる。
【0036】
また、上記(c)の機能13は、第2の照合要素として法人の住所を用いた場合、都道府県を第1コードに置換し、市区町村、東京都の23区、又は政令指定都市の場合は市と区の組み合わせを第2コードに置換する機能を有するとよい。
【0037】
上述したように、第1及び第2の名寄せ対象データの各々の第2の照合要素の住所を互換性を有するコードに置換することで、第1の名寄せ対象データと第2の名寄せ対象データの名寄せ処理を容易に行うことができる。
【0038】
(d)上記(c)の機能13で置換された第1の名寄せ対象データの第1の照合要素(例えば法人名)と第2の名寄せ対象データの第1の照合要素(例えば法人名)を照合し、且つ、上記(c)の機能13で置換された第1の名寄せ対象データの第2の照合要素(例えば住所)と第2の名寄せ対象データの第2の照合要素(例えば住所)を照合することで、第1及び第2の照合要素(例えば法人名及び住所)の両方が1組一致する法人の複数の組み合わせを良好一致集合に登録し、且つ第1及び第2の照合要素の少なくとも一方が一致しない法人を第1の再検討処理集合に登録し、且つ第1及び第2の照合要素の両方が複数組一致する法人の組み合わせを第2の再検討処理集合に登録する機能(
図1の参照符号14)。
【0039】
つまり、結果は以下の3パターンとなる。
(1)第1及び第2の照合要素の両方が1組一致する場合(具体的には、第1及び第2の照合要素の両方が完全一致する法人が1組である場合)は、その一致した法人の複数の組み合わせを良好一致集合に登録する。
【0040】
(2)第1及び第2の照合要素の少なくとも一方が一致しない場合(具体的には、第1の照合要素は第1の名寄せ対象データ側と第2の名寄せ対象データ側の両方が一致するが第2の照合要素は一致しない場合、第1の照合要素は一致しないが第2の照合要素は第1の名寄せ対象データ側と第2の名寄せ対象データ側の両方が一致する場合、又は第1及び第2の照合要素の両方が第1の名寄せ対象データ側と第2の名寄せ対象データ側とで一致しない場合)は、その法人を第1の再検討処理集合に登録する。
【0041】
(3)第1及び第2の照合要素の両方が複数組一致する場合(具体的には、第1及び第2の照合要素の両方が完全一致する法人が、例えば第1の名寄せ対象データにm件あり、第2の名寄せ対象データにn件ある場合であって、m及びnの少なくとも一方が複数である場合)は、それらの法人の組み合わせを第2の再検討処理集合に登録する。例えばmが2で、nが1である場合やmが2でnが2である場合等が該当する。
【0042】
本実施形態によれば、第1及び第2の照合要素の両方が1組一致する場合は、その一致した法人の複数の組み合わせを良好一致集合に登録する。これにより、第1及び第2の名寄せ対象データの各々に膨大な件数の記載形式の異なる法人が含まれていても、第1の名寄せ対象データと第2の名寄せ対象データを容易に名寄せすることができる。別言すれば、名寄せできた複数の法人を良好一致集合に登録し、名寄せできていない法人を第1及び第2の再検討処理集合に登録することにより、名寄せできた複数の法人と名寄せできていない複数の法人を分類することができる。
【0043】
なお、本実施形態では、第2の照合要素の具体例として法人の住所を挙げたが、これ以外の照合要素であってもよく、例えば、法人の電話番号、郵便番号、代表者名、及び、法人が所属する業界で付与された番号のいずれかであってもよい。
【0044】
ただし、本実施形態のように法人名及び法人の住所を第1及び第2の照合要素とすることにより、第1の名寄せ対象データと第2の名寄せ対象データの名寄せ処理を容易に行うことができる。
【0045】
(第2の実施形態)
本実施形態は、第1の実施形態の名寄せ対象テーブル11及び(b)~(d)の機能12~14に加え、以下の(e)、(f)及び(m)の機能15、16、19を実現するプログラムを有するとよい。
【0046】
(e)第1の実施形態の(d)の機能14で第1の再検討処理集合に登録された法人の第1及び第2の照合要素(例えば法人名及び住所)又は上記(c)の機能13で置換される前の第1及び第2の照合要素(例えば法人名及び住所)をキーワードにして検索エンジンにより検索し、その検索結果から第1の検索照合要素を取得する機能(
図1の参照符号15)。第1の検索照合要素は、例えば検索結果の第一候補(一番上に表示)のサイトへ遷移し、取得できたURLのドメイン部分であってもよい。なお、検索エンジンは、インターネット上の情報を検索するシステムであれば、種々のものを用いることが可能である。
【0047】
(f)上記(e)の機能15で取得した第1の名寄せ対象データ側の第1の検索照合要素(例えばURLのドメイン部分)と第2の名寄せ対象データ側の第1の検索照合要素(例えばURLのドメイン部分)を照合することで、両者が一致する法人の組み合わせを良好一致集合に登録する機能(
図1の参照符号16)。
【0048】
なお、第1の検索照合要素は、検索エンジンで検索した結果、両者の同一性を判断するのに十分な情報であれば良い。例えばURLのドメイン部分が一致する法人であれば、両者は同一の法人と判断することが可能であるが、URLのドメイン部分以外の情報であっても同一性を判断するのに十分な情報であれば種々の情報を利用することも可能である。
【0049】
(m)上記の良好一致集合に登録された複数の法人の各々に識別番号を付与し、その識別番号と対応する法人をテーブルに出力する機能(
図1の参照符号19)。
【0050】
本実施形態においても第1の実施形態と同様の効果を得ることができる。
【0051】
また、本実施形態では、第1の検索照合要素の両者が一致する場合は、その一致した法人の組み合わせを良好一致集合に登録する。これにより、第1の名寄せ対象データと第2の名寄せ対象データの名寄せができる割合を高めることができる。
【0052】
(第3の実施形態)
本実施形態は、第1の実施形態の名寄せ対象テーブル11及び(b)~(d)の機能12~14に加え、もしくは、第1の実施形態の名寄せ対象テーブル11及び(b)~(d)の機能12~14、第2の実施形態の(e)及び(f)の機能15、16に加え、以下の(g)、(h)及び(m)の機能17、18、19を実現するプログラムを有するとよい。
【0053】
(g)上記(d)の機能14で第2の再検討処理集合に登録された法人の第1及び第2の照合要素(例えば法人名及び住所)又は上記(c)の機能13で置換される前の前記第1及び第2の照合要素(例えば法人名及び住所)をキーワードにして検索エンジンにより検索し、その検索結果から第2の検索照合要素を取得する機能(
図1の参照符号17)。第2の検索照合要素は、例えば検索結果の第一候補(一番上に表示)のサイトへ遷移し、取得できたURLのドメイン部分であってもよい。なお、検索エンジンは、インターネット上の情報を検索するシステムであれば、種々のものを用いることが可能である。
【0054】
(h)上記(g)の機能17で取得した第1の名寄せ対象データ側の第2の検索照合要素と第2の名寄せ対象データ側の第2の検索照合要素を照合することで、両者が一致する法人の組み合わせを良好一致集合に登録する機能(
図1の参照符号18)。
【0055】
第2の検索照合要素は、検索エンジンで検索した結果、両者の同一性を判断するのに十分な情報であれば良い。例えばURLのドメイン部分が一致する法人であれば、両者は同一の法人と判断することが可能であるが、URLのドメイン部分以外の情報であっても同一性を判断するのに十分な情報であれば種々の情報を利用することも可能である。
【0056】
(m)上記の良好一致集合に登録された複数の法人の各々に識別番号を付与し、その識別番号と対応する法人をテーブルに出力する機能(
図1の参照符号19)。
【0057】
本実施形態においても第1の実施形態と同様の効果を得ることができる。
【0058】
また、本実施形態では、第2の検索照合要素の両者が一致する場合は、その一致した法人の組み合わせを良好一致集合に登録する。これにより、第1の名寄せ対象データと第2の名寄せ対象データの名寄せができる割合を高めることができる。
【0059】
(第4の実施形態)
本実施形態において第1の実施形態と同一部分の説明は省略し、異なる部分についてのみ説明する。
【0060】
第1の実施形態では、(d)の機能14において、第1及び第2の照合要素(例えば法人名及び住所)の両方が1組一致する法人の複数の組み合わせを良好一致集合に登録している。
これに対し、以下の(d1)の機能14aを実現するプログラムを有するとよい。
【0061】
(d1)上記(d)の機能14で第1及び第2の照合要素の両方が1組一致する法人の複数の組み合わせを良好一致集合に登録する前に前記法人の複数の組み合わせについて各種ロジックで一致を検証し、誤一致が疑われる法人は良好一致集合に登録せず、誤一致の疑いのない法人だけを良好一致集合に登録する機能(
図1の参照符号14a)。
【0062】
上記の「各種ロジックで一致を検証し」とは、例えば、上記(d)の機能14で第1及び第2の照合要素の両方が1組一致する法人であっても、その法人の第1及び第2の照合要素(例えば法人名及び住所)又は上記(c)の機能13で置換される前の第1及び第2の照合要素(例えば法人名及び住所)をキーワードにして検索エンジンにより検索し、その検索結果から第3の検索照合要素を取得し、その取得した第1の名寄せ対象データ側の第3の検索照合要素と第2の名寄せ対象データ側の第3の検索照合要素を照合することで、両者が一致する法人の組み合わせであるかを検証することである。この検証により両者が一致しない法人の組み合わせは誤一致が疑われる法人であると判断し、良好一致集合に登録せず、この検証により両者が一致する法人の組み合わせは誤一致のない法人であると判断し、良好一致集合に登録するとよい。
【0063】
本実施形態によれば、誤一致が疑われる法人を良好一致集合への登録から除くことで、良好一致集合に登録される法人の組み合わせの信頼性を高めることができる。
【0064】
なお、上記の第3の検索照合要素は、検索エンジンで検索した結果、両者の同一性を判断するのに十分な情報であれば良い。例えばURLのドメイン部分が一致する法人であれば、両者は同一の法人と判断することが可能であるが、URLのドメイン部分以外の情報であっても同一性を判断するのに十分な情報であれば種々の情報を利用することも可能である。
【0065】
また、第4の実施形態は、第2又は第3の実施形態と組み合わせて実施することも可能である。
【符号の説明】
【0066】
11 名寄せ対象データテーブル
12~19,14a 機能