特許7580080 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 学校法人慶應義塾の特許一覧

特許7580080判定装置、判定方法、および、判定プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-10-31

(45)【発行日】2024-11-11

(54)【発明の名称】判定装置、判定方法、および、判定プログラム

(51)【国際特許分類】

G06Q 10/10 20230101AFI20241101BHJP

【ＦＩ】

G06Q10/10

【請求項の数】 7

(21)【出願番号】P 2021123734

(22)【出願日】2021-07-28

(65)【公開番号】P2023019204

(43)【公開日】2023-02-09

【審査請求日】2023-09-29

(73)【特許権者】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(73)【特許権者】

【識別番号】598121341

【氏名又は名称】慶應義塾

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】石井方邦

(72)【発明者】

【氏名】槇俊孝

(72)【発明者】

【氏名】大槻知明

【審査官】渡邉加寿磨

(56)【参考文献】

【文献】特開２０１３－２９８９１（ＪＰ，Ａ）

【文献】特開２０１９－１５９８３７（ＪＰ，Ａ）

【文献】特開２０１０－１２２８８０（ＪＰ，Ａ）

【文献】特開２０２０－１７３６７５（ＪＰ，Ａ）

【文献】特開２００６－４４１１（ＪＰ，Ａ）

【文献】米国特許第５７２４５９７（ＵＳ，Ａ）

【文献】中国特許第１１２５９７２８４（ＣＮ，Ｂ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

Ｇ０６Ｆ１６／００－１６／９５８

(57)【特許請求の範囲】

【請求項1】

第１の組織が保有する第１のＤＢに格納される第１レコードと、第２の組織が保有する第２のＤＢに格納される第２レコードとが同じ事項に関するレコードであるか否かを判定する判定装置であって、
前記第１レコードおよび前記第２レコードを取得する取得部と、
前記第１レコードを構成する特徴量の前記第１のＤＢにおける重要度と、前記第２レコードを構成する特徴量の前記第２のＤＢにおける重要度とを用いて、前記第１レコードを構成する特徴量と前記第２レコードを構成する特徴量とのペアごとに、前記ペアにおける特徴量の値が同じだった場合に加算する値の重み付けを行うことにより、前記第１レコードと前記第２レコードとが同じ事項に関するレコードである度合いを示すスコアを算出するスコア算出部と、
前記スコアの大きさに基づき、前記第１レコードと前記第２レコードが同じ事項に関するレコードであるか否かを判定する判定部と、
判定した結果を前記第１の組織または前記第２の組織に送信する送信部と、
を備えることを特徴とする判定装置。

【請求項2】

前記第１レコードまたは前記第２レコードは、行動ベースの特徴量を含む
ことを特徴とする請求項１に記載の判定装置。

【請求項3】

前記第１レコードを構成する特徴量は、
前記第１のＤＢに含まれる各特徴量のうち、前記第１のＤＢに含まれる他の特徴量との相互情報量が高いものから優先的に選択された特徴量であり、
前記第２レコードを構成する特徴量は、
前記第２のＤＢに含まれる各特徴量のうち、前記第２のＤＢに含まれる他の特徴量との相互情報量が高いものから優先的に選択された特徴量である
ことを特徴とする請求項１に記載の判定装置。

【請求項4】

前記第１レコードを構成する特徴量の前記第１のＤＢにおける重要度は、
当該特徴量と前記第１のＤＢに含まれる他の特徴量との相互情報量に基づき算出された値であり、
前記第２レコードを構成する特徴量の前記第２のＤＢにおける重要度は、
当該特徴量と前記第２のＤＢに含まれる他の特徴量との相互情報量に基づき算出された値である、
ことを特徴とする請求項３に記載の判定装置。

【請求項5】

前記第１レコードを構成する特徴量と前記第２レコードを構成する特徴量とのペアは、
互いのデータ型が同じ特徴量のペア
であることを特徴とする請求項１に記載の判定装置。

【請求項6】

第１の組織が保有する第１のＤＢに格納される第１レコードと、第２の組織が保有する第２のＤＢに格納される第２レコードとが同じ事項に関するレコードであるか否かを判定する判定装置により実行される判定方法であって、
前記第１レコードおよび前記第２レコードを取得する工程と、
前記第１レコードを構成する特徴量の前記第１のＤＢにおける重要度と、前記第２レコードを構成する特徴量の前記第２のＤＢにおける重要度とを用いて、前記第１レコードを構成する特徴量と前記第２レコードを構成する特徴量とのペアごとに、前記ペアにおける特徴量の値が同じだった場合に加算する値の重み付けを行うことにより、前記第１レコードと前記第２レコードとが同じ事項に関するレコードである度合いを示すスコアを算出する工程と、
前記スコアの大きさに基づき、前記第１レコードと前記第２レコードが同じ事項に関するレコードであるか否かを判定する工程と、
判定した結果を前記第１の組織または前記第２の組織に送信する工程と、
を含むことを特徴とする判定方法。

【請求項7】

第１の組織が保有する第１のＤＢに格納される第１レコードと、第２の組織が保有する第２のＤＢに格納される第２レコードとが同じ事項に関するレコードであるか否かを判定するための判定プログラムであって、
前記第１レコードおよび前記第２レコードを取得する工程と、
前記第１レコードを構成する特徴量の前記第１のＤＢにおける重要度と、前記第２レコードを構成する特徴量の前記第２のＤＢにおける重要度とを用いて、前記第１レコードを構成する特徴量と前記第２レコードを構成する特徴量とのペアごとに、前記ペアにおける特徴量の値が同じだった場合に加算する値の重み付けを行うことにより、前記第１レコードと前記第２レコードとが同じ事項に関するレコードである度合いを示すスコアを算出する工程と、
前記スコアの大きさに基づき、前記第１レコードと前記第２レコードが同じ事項に関するレコードであるか否かを判定する工程と、
判定した結果を前記第１の組織または前記第２の組織に送信する工程と、
をコンピュータに実行させるための判定プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、複数のデータベース（ＤＢ）のレコードが同じ事項に関するレコードであるか否かを判定するための、判定装置、判定方法、および、判定プログラムに関する。

【背景技術】

【0002】

従来、複数のＤＢのレコードをマッチングする技術がある。各ＤＢのレコードの特徴量の数が数百ある場合、どの特徴量にどれくらいの重み付けをしてマッチングさせればマッチングの精度が高くなるかわからないため、機械学習を用いて、レコードのマッチングを行う技術がある。

【先行技術文献】

【非特許文献】

【0003】

【文献】V.Meduri, L.Popa, P.Sen, and M.Sarwat, “A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching,” Mar. 2020.

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかし、上記の技術では、機械学習を行うため、マッチング対象のＤＢそれぞれのレコードを取得し、集約する必要がある。したがって、例えば、マッチング対象のＤＢがそれぞれ別の組織により管理される場合、プライバシーの問題が発生する。また、機械学習には時間もかかり、ハードウェア資源も多く必要である。

【0005】

そこで、本発明は、前記した問題を解決し、複数の組織のＤＢのレコードを学習データとして取得せずに、各ＤＢのレコードを一か所に集約することなくマッチングのパラメータをセットアップし、各ＤＢのレコードを精度よくマッチングすることを課題とする。

【課題を解決するための手段】

【0006】

前記した課題を解決するため、本発明は、第１の組織が保有する第１のＤＢに格納される第１レコードと、第２の組織が保有する第２のＤＢに格納される第２レコードとが同じ事項に関するレコードであるか否かを判定する判定装置であって、前記第１レコードおよび前記第２レコードを取得する取得部と、前記第１レコードを構成する特徴量の前記第１のＤＢにおける重要度と、前記第２レコードを構成する特徴量の前記第２のＤＢにおける重要度とを用いて、前記第１レコードを構成する特徴量と前記第２レコードを構成する特徴量とのペアごとに、前記ペアにおける特徴量の値が同じだった場合に加算する値の重み付けを行うことにより、前記第１レコードと前記第２レコードとが同じ事項に関するレコードである度合いを示すスコアを算出するスコア算出部と、前記スコアの大きさに基づき、前記第１レコードと前記第２レコードが同じ事項に関するレコードであるか否かを判定する判定部と、判定した結果を前記第１の組織または前記第２の組織に送信する送信部と、を備えることを特徴とする。

【発明の効果】

【0007】

本発明によれば、複数の組織のＤＢのレコードを学習データとして取得せずに、各ＤＢのレコードを一か所に集約することなくマッチングのパラメータをセットアップし、各ＤＢのレコードを精度よくマッチングすることができる。

【図面の簡単な説明】

【0008】

【図1】図１は、マッチング装置の動作概要を説明する図である。

【図2】図２は、マッチングシステムの処理手順の概要を示す図である。

【図3】図３は、マッチングシステムの処理手順の概要を示す図である。

【図4】図４は、マッチングシステムの構成例を示す図である。

【図5】図５は、マッチングシステムの事前準備フェーズの処理手順の例を示すシーケンス図である。

【図6】図６は、マッチングシステムの事前準備フェーズの処理手順の例を示すシーケンス図である。

【図7】図７は、マッチングプログラムを実行するコンピュータの構成例を示す図である。

【発明を実施するための形態】

【0009】

以下、図面を参照しながら、本発明を実施するための形態（実施形態）について説明する。本発明は、以下に説明する実施形態に限定されない。

【0010】

［概要］
まず、図１を用いて、本実施形態のマッチング装置（判定装置）１０の動作概要を説明する。ここではマッチング装置１０が、社内の営業ＤＢ（データベース）と外部企業のＤＢとのデータマッチングを行う場合を例に説明する。以下、社内の営業ＤＢを、ＤＢ＿Ａとし、外部企業のＤＢを、ＤＢ＿Ｂとして説明する。

【0011】

まず、ＤＢ＿Ａを保有するＤＢ装置は、事前準備として、ＤＢ＿Ａに含まれる特徴量ごとに、ＤＢ＿Ａにおける重要度を求める。重要度は、例えば、ＤＢ＿Ａ内における他の各特徴量との相互情報量を用いる（詳細は後記）。そして、当該ＤＢ装置は、重要度が高い特徴量の特徴量名、当該特徴量の重要度（重み）、当該特徴量のデータ型（型）を示した重み付き特徴量リスト１０１を作成する。また、ＤＢ＿Ｂを保有するＤＢ装置も、同様にＤＢ＿Ｂに含まれる特徴量ごとに、ＤＢ＿Ｂにおける重要度を求め、重み付き特徴量リスト１０２を作成する。この際に、重み付き特徴量リスト１０１および重み付き特徴量リスト１０２については、ある特徴量に対し、各型である可能性を確率的に定義することも可能である。

【0012】

その後、マッチング装置１０は、ＤＢ＿Ａを保有するＤＢ装置から、重み付き特徴量リスト１０１を取得し、ＤＢ＿Ｂを保有するＤＢ装置から重み付き特徴量リスト１０２を取得する。そして、マッチング装置１０は、各リストに示される特徴量のうち、同じ型の特徴量のペアごとに、そのペアの特徴量の重みの和を示した情報（符号１０３）を作成する。

【0013】

例えば、符号１０３に示す情報において、ＤＢ＿Ａの特徴量「会社名」とＤＢ＿Ｂの特徴量「企業名」はそれぞれ、型が「企業型」のペアであり、そのペアの特徴量の重みの和は「５．５＋５．４＝１０．９」であることを示す。また、ＤＢ＿Ａの特徴量「住所」とＤＢ＿Ｂの特徴量「所在地」はそれぞれ、型が「住所型」のペアであり、そのペアの特徴量の重みの和は「３．５＋４．０＝７．５」であることを示す。さらに、ＤＢ＿Ａの特徴量「販売数」とＤＢ＿Ｂの特徴量「資本金」はそれぞれ、型が「数型」のペアであり、そのペアの特徴量の重みの和は「４．０＋２．０＝６．０」であることを示す。

【0014】

その後、マッチング装置１０は、上記の符号１０３に示す情報に基づき、ＤＢ＿ＡのレコードとＤＢ＿Ｂのレコードとのマッチングを行う。

【0015】

例えば、マッチング装置１０は、ＤＢ＿Ａのレコード１０４およびＤＢ＿Ｂのレコード１０５それぞれについて、符号１０３に示すペアの特徴量の値が同じ場合、重み付けの値を加算することにより、マッチングのスコアを算出する。

【0016】

例えば、マッチング装置１０は、レコード１０４，１０５について、レコード１０４における「会社名」の値と、レコード１０５における「企業名」の値とは同じではないので、重みは加算しない。一方、レコード１０４における「住所」の値と、レコード１０５における「所在地」の値とが同じである場合、重み「７．５」を加算する。また、マッチング装置１０は、レコード１０４における「販売数」の値と、レコード１０５における「資本金」の値とが同じである場合、重み「６．０」を加算する。マッチング装置１０は、このような処理をレコード１０４，１０５の各特徴量について実施する。

【0017】

これにより、マッチング装置１０は、レコード１０４とレコード１０５とが同じ事項に関するレコードである度合いを示すスコアを算出することができる。そして、マッチング装置１０は、算出したスコアの値に基づき、両レコードが同じ事項に関するレコードか否かを判定する。

【0018】

例えば、レコード１０４とレコード１０５のスコアが所定値を超える場合、マッチング装置１０は、レコード１０４とレコード１０５とが同じ事項に関するレコード（例えば、同じ企業に関するレコード）と判定する。

【0019】

なお、重み付き特徴量リスト１０１，１０２が、ある特徴量に対し、各型である可能性が確率的に定義される場合、例えば、マッチング装置１０は、同じ型の特徴量のペアごとの特徴量の重みの和を以下のようにして算出してもよい。

【0020】

例えば、マッチング装置１０は、「会社名」という型の90％が「企業名型」、10%が「住所型」である場合、それを「企業名型の会社名」と「住所型の会社名」とに分ける。そして、マッチング装置１０は、重み付き特徴量リスト１０１の「会社名」に対する重み5.5を、前者に5.5x90%＝4.95、後者に5.5x10%＝0.55と分割して、同じ型の特徴量のペアごとの特徴量の重みの和を算出してもよい。

【0021】

このようなマッチング装置１０によれば、複数の組織のＤＢのレコードを学習データとして取得せずに、各ＤＢのレコードを精度よくマッチングすることができる。

【0022】

［処理手順の概要］
次に、図２および図３を用いて、マッチング装置１０を含むマッチングシステムの処理手順の概要を説明する。図２に示すように、マッチングシステム１は、マッチング装置１０と、ＤＢ装置２０Ａと、ＤＢ装置２０Ｂとを備える。ＤＢ装置２０Ａと、ＤＢ装置２０Ｂとはそれぞれ異なる組織により保有されるものとする。

【0023】

［事前準備フェーズ］
図２を用いて、事前準備フェーズにおける処理手順の例を説明する。事前準備フェーズは、マッチングシステム１がレコードのマッチングの事前準備を行うフェーズである。

【0024】

まず、マッチング装置１０は、公開されている、社名リストや所在地リスト等のデータを取得し、取得したデータに基づき、電話番号や郵便番号等の特徴量の型の推定用ルール（Ａ）を作成する（（１））。

【0025】

また、マッチング装置１０は、上記の（１）と同様に、取得したデータを学習データとし、機械学習を用いて、入力された特徴量がどの型（例えば、社名、住所等）か推定するためのモデル（型の推定モデル）（Ｂ）を構築する（（２））。そして、マッチング装置１０は、上記のＡ，ＢをＤＢ装置２０Ａに提供する（（３））。

【0026】

その後、ＤＢ装置２０Ａは、自身のＤＢのレコード群を用いて、マッチングに用いる特徴量の選択用の情報の作り込みを行う（（４））。例えば、ＤＢ装置２０Ａは、以下の処理を行う。この情報の作りこみを行うプログラムについては、事前にマッチング装置１０からＤＢ装置２０Ａ及びＤＢ装置２０Ｂに提供することもできる。

【0027】

まず、ＤＢ装置２０Ａは、ＤＢ内の全ての特徴量のペアの相互情報量を用いて、マッチングに用いる特徴量の選択と、マッチングにおいて当該特徴量を用いるときの重みとを算出する（（４－１））。また、ＤＢ装置２０Ａは、（４－１）で選択された特徴量の型を、上記のＡ，Ｂを用いて推定する（（４－２））。

【0028】

その後、ＤＢ装置２０Ａは、（４－１）の情報に、（４－２）の情報を付加してマッチング装置１０へ送信する（（５））。

【0029】

また、マッチング装置１０は、上記のＡ，ＢをＤＢ装置２０Ｂに対しても提供する（（６））。その後、ＤＢ装置２０Ｂは、自身のＤＢのレコード群を用いて、上記の（４）、（５）と同様の処理を実行する。

【0030】

これにより、マッチング装置１０は、ＤＢ装置２０Ａ，２０Ｂそれぞれから、レコードのマッチングに用いる特徴量と、当該特徴量の型の推定結果と、マッチングにおいて当該特徴量を用いるときの重みとを示した情報（重み付き特徴量リスト）を受け取ることができる。そして、マッチング装置１０は、ＤＢ装置２０Ａ，２０Ｂから受信した重み付き特徴量リストに示される特徴量のうち、同じ型の特徴量のペアごとに、そのペアの特徴量の重みの和を示した情報（図１の符号１０３）を作成する。また、マッチング装置１０は、上記の情報に基づき、ＤＢ装置２０Ａ，２０Ｂから受信したレコードのマッチングのスコアの算出に用いる式（後記する式（３）参照）を作成する。

【0031】

［マッチングフェーズ］
次に、図３を用いて、マッチングフェーズにおける処理手順の例を説明する。マッチング装置１０は、事前準備フェーズでＤＢ装置２０Ａ，２０Ｂから受信した重み付き特徴量リスト用いて、以下のようにしてレコードのマッチングを行う。

【0032】

まず、ＤＢ装置２０Ａは、マッチング対象のレコードＲをマッチング装置１０へ送信する（（１））。その後、マッチング装置１０は、ＤＢ装置２０Ｂに、レコードＲとのマッチング対象となるレコードの検索クエリを送信する（（２））。次に、ＤＢ装置２０Ｂは、当該検索クエリを用いてＤＢを検索し、マッチング対象となるレコード群をマッチング装置１０へ送信する（（３））。

【0033】

その後、マッチング装置１０は、レコードＲと、（３）で受信したレコード群の各レコードとのマッチングを行う（（４）マッチングの実施）。

【0034】

例えば、マッチング装置１０は、レコードＲと、（３）で受信したレコード群の各レコードとでレコードのペアを作成する。そして、マッチング装置１０は、ＤＢ装置２０Ａ，２０Ｂから受信した重み付き特徴量リストを用いて、各レコードのペアがどの程度マッチしているかのスコアリングを行う。

【0035】

その後、マッチング装置１０は、（４）のマッチングの結果をＤＢ装置２０Ａへ送信する（（５））。例えば、マッチング装置１０は、レコードＲと、レコードＲとのマッチングのスコアが最も高いレコードとのペアをＤＢ装置２０Ａへ送信する。

【0036】

このようにすることで、マッチング装置１０は、学習データとして複数の組織のＤＢのレコードを取得せずに、各ＤＢのレコードをマッチングすることができる。

【0037】

なお、マッチング装置１０は、スコアが所定値以下のレコードしかなかった場合は、マッチするレコードがなかった旨をＤＢ装置２０Ａへ送信してもよい。また、マッチング装置１０は、同じスコアのレコードが複数あった場合、それらのレコードを全てＤＢ装置２０Ａに送信してもよいし、最初またはランダムにスコアが所定値を超えたレコードをＤＢ装置２０Ａへ送信してもよい。

【0038】

また、マッチング装置１０は、信頼できる第三者により管理されることを想定するが、これに限定されない。例えば、マッチング装置１０は、ＤＢ装置２０Ａを管理する組織に管理されてもよいし、ＤＢ装置２０Ｂを管理する組織により管理されてもよい。

【0039】

［構成例］
次に、図４を用いて、マッチングシステム１の構成例を説明する。マッチングシステム１は、マッチング装置１０とＤＢ装置２０とを備える。まず、ＤＢ装置２０を説明する。

【0040】

［ＤＢ装置］
ＤＢ装置２０は、通信部２１、入出力部２２、記憶部２３、および、制御部２４を備える。通信部２１は、外部装置とデータ通信を行うためのインタフェースである。入出力部２２は、ＤＢ装置２０への各種入力や、出力を行うためのインタフェースである。

【0041】

記憶部２３は、制御部２４が各種処理を実行するためのデータを記憶する。この記憶部２３は、所定領域にＤＢを備える。ＤＢは複数のレコードを格納する。各レコードは、複数の特徴量から構成される。また、記憶部２３は、マッチング装置１０から送信された、型の推定ルール（Ａ）または型の推定モデル（Ｂ）を記憶する。

【0042】

制御部２４は、ＤＢ装置２０全体の制御を行う。制御部２４は、特徴量作成部２４１と、正規化部２４２と、特徴量削減部２４３と、重み算出部２４４と、特徴量選択部２４５と、型推定部２４６と、重み付き特徴量リスト送信部２４７と、レコード送信部２４８と、マッチング結果出力部２４９とを備える。

【0043】

特徴量作成部２４１は、ＤＢの全レコードを用いて、マッチング用の特徴量の候補を作成する。ここで、特徴量作成部２４１は、例えば、マッチング用の特徴量の候補として、行動ベースの特徴量を組み込んでもよい。行動ベースの特徴量とは、例えば、ＤＢのレコードが他のデータ（例えば、ログ群）とリンクされている場合、そのリンク先のデータから抽出される特徴量である。なお、この処理は任意である。

【0044】

正規化部２４２は、ＤＢのレコードの表記揺れの正規化を行う。例えば、正規化部２４２は、ＤＢのレコードが日本語で記述されている場合、レコードに含まれる企業名や住所等の表記の正規化を行う。また、正規化部２４２は、レコードに含まれる平仮名／カタカナの表記をカタカナに統一したり、株式会社／（株）等の表記を「株式会社」に統一したりする。なお、この処理は任意である。

【0045】

特徴量削減部２４３は、特徴量作成部２４１により作成されたマッチング用の特徴量の候補から、マッチングに用いるのに適さない特徴量を削除する。例えば、特徴量削減部２４３は、例えば、ＤＢのレコードにおける、値の欠損率が所定値以上の特徴量、ユニーク要素数が所定値以下の特徴量等を、マッチング用の特徴量の候補から削除する。そして、特徴量削減部２４３は、上記の削除後のマッチング用の特徴量の候補を、重み算出部２４４に出力する。なお、この処理は任意である。

【0046】

重み算出部２４４は、マッチング用の各特徴量の候補の重みを算出する。このマッチング用の特徴量の候補の重みは、例えば、ＤＢにおける当該特徴量の候補の重要度に基づき算出される。ここで重要度としては、例えば、ＤＢにおける特徴量間の相互情報量を用いる。

【0047】

ここで重要度として、ＤＢにおける特徴量間の相互情報量を用いるのは以下の理由による。マッチングにおいて、他のＤＢの特徴量との比較ができない中で、各ＤＢで終端する処理が必要となる。その中で複数の情報量の表し方（例えば、エントロピー、自己エントロピー等）を利用することが考えられるが、他の特徴量との相対的な強さを比較するという観点で、特徴量のペアの相互情報量を用いれば、特徴量のペアの情報量を定義できる。そこで、重み算出部２４４が、重要度として、特徴量のペアの相互情報量を用いて、特徴量のペアの相互依存の尺度を表す。これにより、重み算出部２４４は、他の特徴量に対して、ある特徴量が重要であるか否かを比較し、相互依存の度合いが大きい特徴量ほど全体として各ＤＢの中で重要な特徴量であると考えられるからである。

【0048】

重み算出部２４４は、例えば、以下のようにして、特徴量間の相互情報量を算出する。

【0049】

（１）まず、重み算出部２４４は、すべての特徴量のペア(X,Y)をとる。（２）次に、重み算出部２４４は、ＤＢ内のレコードに基づき、各ペア(X,Y)の相互情報量I(X;Y)を算出する。例えば、重み算出部２４４は、式（１）により相互情報量I(X;Y)を算出する。

【0050】

【数1】

【0051】

なお、p(x,y)：X,Yの同時分布関数である。p(x,y)は、X、Yからそれぞれランダムサンプリングしたレコードセット（全てのレコードを利用してもよい）よりペアを作った際のx,yが同時に出現する確率等により算出される。

【0052】

また、p(x),p(y):周辺確率分布関数である。p(x)は、Xからランダムサンプリングされたレコードセット（全てのレコードを利用してもよい）内のxの出現確率である。また、p(y)は、Yからランダムサンプリングされたレコードセット（全てのレコードを利用してもよい）内のyの出現確率により算出される。

【0053】

なお、ＤＢ内にレコードが多い場合、重み算出部２４４は、ＤＢ内から所定数のレコードをサンプリングし、そのサンプリングしたレコードにより相互情報量を算出してもよい。また、重み算出部２４４は、算出した相互情報量をレコード数の総和で割る等の正規化処理を行ってもよい。

【0054】

（３）次に、重み算出部２４４は、特徴量の候補ごとに、当該特徴量の候補が含まれる全ペアの相互情報量の和を算出する。そして、重み算出部２４４は、算出した特徴量の候補ごとの相互情報量の和を特徴量選択部２４５に出力する。

【0055】

特徴量選択部２４５は、重み算出部２４４により算出された、各特徴量の候補の重み（例えば、前記した相互情報量の和）を用いて、マッチングに利用する特徴量を選択する。例えば、特徴量選択部２４５は、重み算出部２４４から出力された、各特徴量の候補のうち、相互情報量の和が大きいものから優先的に選択する。

【0056】

一例を挙げると、特徴量選択部２４５は、特徴量選択部２４５は、各特徴量の候補を相互情報量の和の値が降順になるように並べ、予め設定した所定順位以上の特徴量の候補を選択する。また、特徴量選択部２４５は、重み算出部２４４から出力された相互情報量の和が所定の閾値を超える特徴量の候補を選択してもよい。

【0057】

特徴量選択部２４５が、マッチングに利用する特徴量の選択を行うのは以下の理由による。例えば、特徴量の候補がとても多い場合、マッチング装置１０がそのすべての特徴量を利用してマッチングを行うと、マッチングに要する計算量が多くなる。ここで、相互情報量の和（重み）が小さい特徴量については、マッチングに利用したとしても、マッチングの結果にあまり大きな影響を与えないと考えられる。そこで、特徴量選択部２４５は、相互特徴量の和の大きさが、所定順位以上の特徴量の候補、あるいは、閾値以上の特徴量の候補を、マッチングに利用する特徴量として選択する。これにより、マッチング装置１０がマッチングに要する計算量を低減することができる。

【0058】

なお、特徴量選択部２４５は、重み算出部２４４から出力された全ての特徴量を利用してもよい。

【0059】

型推定部２４６は、特徴量選択部２４５により選択された特徴量の型の推定を行う。例えば、型推定部２４６は、特徴量選択部２４５により選択された各特徴量の候補のレコードに、型の推定ルール（Ａ）を適用することにより、各特徴量の候補の型の推定を行う。あるいは、型推定部２４６は、上記の各特徴量の候補のレコードを入力とし、型の推定モデル（Ｂ）を用いて、各特徴量の候補の型の推定を行ってもよい。ここで、１つの特徴量については、複数の型を確率的に定義することも可能とする。

【0060】

また、型推定部２４６は、上記の各特徴量の候補のレコードをＤＢからサンプリングし、上記の型の推定ルール（Ａ）により特徴量の候補の型が推定できなかった場合、上記の型の推定モデル（Ｂ）を適用して、型を推定してもよい。

【0061】

特徴量リスト送信部２４７は、特徴量選択部２４５により選択された特徴量（特徴量の候補）と、型推定部２４６により推定された当該特徴量の型の推定結果と、重み算出部２４４により算出された当該特徴量の重みとを示す重み付き特徴量リストを作成し、マッチング装置１０へ送信する。

【0062】

レコード送信部２４８は、マッチング対象のレコードをマッチング装置１０へ送信する。例えば、レコード送信部２４８は、入出力部２２経由でマッチング対象のレコードの送信指示を受け付けると、ＤＢからマッチング対象のレコードを読み出し、マッチング装置１０へ送信する。また、レコード送信部２４８は、マッチング装置１０から、レコードの検索クエリを受け付けた場合、当該検索クエリに基づきＤＢのレコードを検索し、マッチング装置１０へ送信する。

【0063】

マッチング結果出力部２４９は、マッチング装置１０から、マッチング対象のレコードに対するマッチングの結果を受信する。そして、マッチング結果出力部２４９は、受信したマッチングの結果を入出力部２２経由で出力する。例えば、マッチング結果出力部２４９は、受信したマッチングの結果を、入出力部２２経由で表示装置（図示省略）に表示する。これにより、ＤＢ装置２０の利用者は、マッチング対象のレコードに対するマッチングの結果を確認することができる。

【0064】

［マッチング装置］
次に、マッチング装置１０を説明する。マッチング装置１０は、通信部１１、入出力部１２、記憶部１３、および、制御部１４を備える。通信部１１は、外部装置とデータ通信を行うためのインタフェースである。入出力部１２は、マッチング装置１０への各種入力や、出力を行うためのインタフェースである。

【0065】

記憶部１３は、制御部１４が各種処理を実行するためのデータを記憶する。例えば、記憶部１３は、各ＤＢ装置２０から受信した重み付き特徴量リストを記憶する。また、記憶部１３は、制御部１４が作成したスコア算出式（詳細は後記）を記憶する。

【0066】

制御部１４は、マッチング装置１０全体の制御を司る。制御部１４は、型推定ルール送信部１４１と、重み付き特徴量リスト取得部１４２と、特徴量情報取得部１４３と、フィルタリング部１４４と、スコア算出式作成部１４５と、レコード取得部１４６と、スコア算出部１４７と、判定部１４８と、送信部１４９とを備える。

【0067】

型推定ルール送信部１４１は、型の推定ルールを作成し、ＤＢ装置２０へ送信する。例えば、型推定ルール送信部１４１は、公開されている社名リストや所在地リスト等のデータに基づき、電話番号や郵便番号等の型の推定ルールを作成し、各ＤＢ装置２０へ送信する。

【0068】

また、型推定ルール送信部１４１は、公開されている社名リストや所在地リスト等のデータを学習データとし、機械学習を用いて、型の推定モデルを作成し、各ＤＢ装置２０へ送信してもよい。例えば、型推定ルール送信部１４１は、機械学習アルゴリズム（RandomForestやLinearRegression等）により、入力レコードがどの型（社名、住所等）かを推定するモデルを作成し、各ＤＢ装置２０へ送信する。ここでの、モデルの精度チューニング（パラメータ設定等）については、例えば、RakuDA等のデータ分析自動化技術を利用してもよい。

【0069】

なお、型推定ルール送信部１４１は、上記の型の推定ルールおよび型の推定モデルのいずれかを送信してもよいし、その両方を送信してもよい。

【0070】

重み付き特徴量リスト取得部１４２は、マッチング対象のレコードを保持する各ＤＢ装置２０から重み付き特徴量リストを取得（受信）する。各ＤＢ装置２０から取得した重み付き特徴量リストは、記憶部１３に格納される。

【0071】

特徴量情報取得部１４３は、各ＤＢ装置２０から取得した重み付き特徴量リストに含まれる特徴量の情報を取得する。例えば、特徴量情報取得部１４３は、ＤＢ装置２０Ａの重み付き特徴量リストから、当該重み付き特徴量リストに含まれる特徴量群A(特徴量A1,特徴量A2,…,特徴量An）を取得する。また、特徴量情報取得部１４３は、ＤＢ装置２０Ｂの重み付き特徴量リストから、当該重み付き特徴量リストに含まれる特徴量群B（特徴量B1,特徴量B2,…,特徴量Bm）を取得する。

【0072】

フィルタリング部１４４は、特徴量情報取得部１４３により取得された、各ＤＢ装置２０の特徴量群のすべてのペアから、型が異なる特徴量のペアを除外する。なお、ペアを構成する特徴量の型が異なるか否かは、各ＤＢ装置２０の重み付き特徴量リストに示される各特徴量の型の推定結果を用いて判断される。なお、ここで各特徴量について型が確率的に定義された場合は、その型の確率の大きさに応じて重みを分配することもできる。

【0073】

例えば、フィルタリング部１４４は、まず、上記の特徴量群A(特徴量A1,特徴量A2,…,特徴量An）と特徴量群B(特徴量B1,特徴量B2,…,特徴量Bm）とのペアとして、［特徴量A1,特徴量B1］、［特徴量A1,特徴量B2］、…を作成する。次に、フィルタリング部１４４は、上記の［特徴量A1,特徴量B1］、［特徴量A1,特徴量B2］、…のペアのうち、特徴量の型の推定結果が異なるペアを除外する。これにより、特徴量の型の推定結果が同じ特徴量のペアが残る。なお、この処理は任意である。

【0074】

スコア算出式作成部１４５は、フィルタリング部１４４によりフィルタリングされた特徴量のペアと、重み付き特徴量リストに示される各特徴量の重みとを用いて、レコード同士が同じ事項に関するレコードである度合いを示すスコアの算出式（スコア算出式）を作成する。

【0075】

例えば、上記の算出式は、マッチングの対象となるレコードのペアについて、ペアにおける特徴量の値が同じだった場合、スコアを加算する式とする。ここで、スコア算出式作成部１４５は、上記のレコードのペアにおける特徴量の値が同じだった場合に加算するスコアに重み付けを行う。ここでの重み付けの値は、重み付き特徴量リストに示される各特徴量の重みの和とする。例えば、スコア算出式作成部１４５は、レコードのペアのスコア算出式として、以下の式（２）に示す式を作成する。

【0076】

【数2】

【0077】

式（２）における、W[特徴量A1,特徴量B1]は、重み付き特徴量リストにおける特徴量A1の重みと特徴量B1の重みとの和である。例えば、ＤＢ装置２０Ａから送信された重み付き特徴量リストにおける特徴量A1「会社名」の重みが「５．５」であり、ＤＢ装置２０Ｂから送信された重み付き特徴量リストにおける特徴量B1「企業名」の重みが「５．４」の場合、W[特徴量A1,特徴量B1]は「５．５＋５．４＝１０．９」である。

【0078】

換言すると、スコア算出式作成部１４５は、以下の式（３）に示す、レコードのペアのスコア算出式S（x,y）を作成する。

【0079】

【数3】

【0080】

スコア算出式作成部１４５は、作成したスコア算出式を記憶部１３に格納する。

【0081】

レコード取得部１４６は、各ＤＢ装置２０からマッチング対象のレコードを取得する。例えば、レコード取得部１４６は、ＤＢ装置２０Ａからマッチング対象のレコードを取得する。その後、レコード取得部１４６は、取得したレコードに対するマッチング対象のレコードの検索クエリを、ＤＢ装置２０Ｂへ送信し、ＤＢ装置２０Ｂからその検索クエリに対する検索結果（検索されたレコード）を取得する。

【0082】

例えば、レコード取得部１４６が、ＤＢ装置２０Ａから取得したマッチング対象のレコードが、ある地域の企業に関するレコードであった場合、その地域に関するレコードの検索クエリをＤＢ装置２０Ｂへ送信する。これにより、マッチング装置１０は、マッチング対象のレコードの絞り込みをすることができる。

【0083】

スコア算出部１４７は、レコード取得部１４６により取得されたマッチング対象のレコードについて、レコードのペアごとのスコアを算出する。

【0084】

例えば、スコア算出部１４７は、ＤＢ装置２０Ａから取得したマッチング対象のレコードＲと、ＤＢ装置２０Ｂから取得したマッチング対象のレコード群（レコードＲ１～Ｒｎ）について、レコードＲとレコードＲ１のペア、レコードＲとレコードＲ２のペア…というように、レコードのペアを作成する。そして、スコア算出部１４７は、そのレコードのペアそれぞれについて、スコア算出式作成部１４５により作成されたスコア算出式を用いてスコアを算出する。

【0085】

判定部１４８は、スコア算出部１４７により算出されたレコードのペアそれぞれのスコアの大きさに基づき、レコードのペアが同じ事項に関するレコードのペアであるか否かを判定する。例えば、判定部１４８は、スコア算出部１４７により算出されたレコードのペアそれぞれのスコアを確認し、スコアが所定の閾値以上のレコードのペアがあれば、当該レコードのペアは同じ事項に関するレコードのペアと判定する。

【0086】

また、判定部１４８は、スコア算出部１４７により算出されたレコードのペアそれぞれのスコアの大きさに基づき、スコアが最も大きいレコードのペアを、同じ事項に関するレコードのペアと判定してもよい。また、判定部１４８は、スコアが所定の閾値以上のレコードのペアがなかった場合、同じ事項に関するレコードのペアがなかったと判定してもよい。

【0087】

送信部１４９は、判定部１４８による判定の結果（マッチングの結果）を、ＤＢ装置２０へ送信する。例えば、送信部１４９は、マッチングの結果を、マッチング対象のレコードを保持するＤＢ装置２０ＡまたはＤＢ装置２０Ｂへ送信する。なお、送信部１４９は、マッチングの結果を、ＤＢ装置２０Ａを管理する組織またはＤＢ装置２０Ｂを管理する組織へ送信してもよい。

【0088】

［処理手順の例］
次に、マッチングシステム１の処理手順の例を説明する。まず、図５を用いて、マッチングシステム１の事前準備フェーズの処理手順の例を説明する。

【0089】

まず、マッチング装置１０の型推定ルール送信部１４１は、型の推定ルール（Ａ）を作成し（Ｓ１）、また、型の推定モデル（Ｂ）を作成する（Ｓ２）。そして、型推定ルール送信部１４１は、上記の型の推定ルール（Ａ）と、型の推定モデル（Ｂ）とをＤＢ装置２０Ａ，２０Ｂへ送信する（Ｓ３）。

【0090】

Ｓ３の後、ＤＢ装置２０Ａは、型の推定ルール（Ａ）と型の推定モデル（Ｂ）に記憶部２３に格納する（Ｓ１０）。そして、特徴量作成部２４１は、ＤＢの全レコードを用いて、マッチング用の特徴量の候補を作成する（Ｓ１１：特徴量作成）。また、正規化部２４２は、ＤＢのレコードの表記揺れの正規化を行う（Ｓ１２：正規化）。

【0091】

Ｓ１２の後、特徴量削減部２４３は、Ｓ１１で作成されたマッチング用の特徴量の候補から、ＤＢにおける、値の欠損率が所定値以上の特徴量、ユニーク要素数が所定値以下の特徴量等を、マッチング用の特徴量の候補から削除する（Ｓ１３：特徴量削減）。

【0092】

Ｓ１３の後、重み算出部２４４は、マッチング用の各特徴量の候補の重み（例えば、各特徴量の候補の相互情報量の和）を算出する（Ｓ１４：重みの算出）。その後、特徴量選択部２４５は、Ｓ１４で算出された、各特徴量の候補の重みを用いて、マッチングに利用する特徴量を選択する（Ｓ１５：特徴量の選択）。例えば、特徴量選択部２４５は、Ｓ１４で算出された、各特徴量の候補の相互情報量の和を降順に並べ、予め設定した所定順位以上の特徴量の候補を選択する。

【0093】

Ｓ１５の後、型推定部２４６は、Ｓ１５で選択された特徴量の型の推定を行う（Ｓ１６）。ここでの型の推定には、Ｓ１０で受信した型の推定ルール（Ａ）と型の推定モデル（Ｂ）とを用いる。そして、重み付き特徴量リスト送信部２４７は、Ｓ１５で選択された特徴量と、Ｓ１６で推定された当該特徴量の型の推定結果と、Ｓ１４で算出された当該特徴量の重みとを示した重み付き特徴量リストを作成し、マッチング装置１０へ送信する（Ｓ１７）。

【0094】

また、Ｓ３の後、ＤＢ装置２０Ｂは、Ｓ２０～Ｓ２７の処理を実行する。このＳ２０～Ｓ２７の処理は、前記したＳ１０～Ｓ１７の処理と同様なので説明を省略する。

【0095】

その後、マッチング装置１０の重み付き特徴量リスト取得部１４２は、ＤＢ装置２０Ａ，２０Ｂそれぞれから重み付き特徴量リストを受信すると、各重み付き特徴量リストを記憶部１３に格納する（Ｓ３１）。そして、特徴量情報取得部１４３は、ＤＢ装置２０Ａ，２０Ｂの重み付き特徴量リストそれぞれから、特徴量の情報を取得する（Ｓ３２）。例えば、特徴量情報取得部１４３は、ＤＢ装置２０Ａの重み付き特徴量リストから、特徴量群A(特徴量A1,特徴量A2,…,特徴量An）を取得し、ＤＢ装置２０Ｂの重み付き特徴量リストから、特徴量群B（特徴量B1,特徴量B2,…,特徴量Bm）を取得する。

【0096】

Ｓ３２の後、フィルタリング部１４４は、Ｓ３２で取得された特徴量の情報から、推定された型が異なる特徴量のペアを除外する（Ｓ３３：特徴量のペアのフィルタリング）。その後、スコア算出式作成部１４５は、Ｓ３３でフィルタリングされた特徴量のペアと、ＤＢ装置２０Ａ，２０Ｂの重み付き特徴量リストに示される各特徴量の重みとを用いて、スコア算出式を作成する（Ｓ３４）。そして、スコア算出式作成部１４５は、作成したスコア算出式を記憶部１３に格納する。

【0097】

次に、図６を用いて、マッチングシステム１のマッチングフェーズの処理手順の例を説明する。

【0098】

まず、ＤＢ装置２０Ａのレコード送信部２４８は、マッチング対象のレコードをＤＢから読み出し、マッチング装置１０へ送信する（Ｓ４１）。マッチング装置１０のレコード取得部１４６は、Ｓ４１で送信されたマッチング対象のレコードを記憶部１３に格納する。

【0099】

Ｓ４１の後、マッチング装置１０のレコード取得部１４６は、ＤＢ装置２０Ｂに対し、マッチング対象のレコードの検索クエリを送信する（Ｓ４２）。その後、ＤＢ装置２０Ｂのレコード送信部２４８は、当該検索クエリに基づき、ＤＢから、マッチング対象のレコードを検索し、マッチング装置１０へ送信する（Ｓ４３）。その後、マッチング装置１０のレコード取得部１４６は、Ｓ４３で送信されたマッチング対象のレコードを記憶部１３に格納する。

【0100】

Ｓ４３の後、マッチング装置１０のスコア算出部１４７は、ＤＢ装置２０Ａ，２０Ｂから送信されたマッチング対象のレコードについて、レコードのペアごとのスコアを算出する（Ｓ４４）。なお、スコアの算出には、図５のＳ３４で作成されたスコア算出式を用いる。

【0101】

Ｓ４４の後、マッチング装置１０の判定部１４８は、Ｓ４４で算出された、マッチング対象のレコードのペアごとのスコアの大きさに基づく判定を行う（Ｓ４５）。例えば、判定部１４８は、Ｓ４４で算出されたレコードのペアそれぞれのスコアを確認し、最もスコアが大きいレコードのペアを、同じ事項に関するレコードのペアと判定する。その後、送信部１４９は、Ｓ４５における判定の結果（マッチングの結果）をＤＢ装置２０Ａへ送信する（Ｓ４６）。

【0102】

その後、ＤＢ装置２０Ａのマッチング結果出力部２４９は、マッチングの結果を表示装置等に出力する（Ｓ４７）。

【0103】

このようにすることで、マッチングシステム１は、複数の組織のＤＢのレコードを学習データとして取得せずに、各ＤＢのレコードを精度よくマッチングすることができる。これにより、マッチングシステム１は、例えば、複数の組織のＤＢのレコードの名寄せ等を精度よく行うことができる。

【0104】

また、マッチングシステム１によれば、複数の組織のＤＢのレコードを学習データとして用いた機械学習が不要なので、マッチングに要する処理負荷が少なくて済む。また、マッチングシステム１は、マッチング対象のレコードを保持する各ＤＢ装置２０から、マッチングの対象以外のレコードを取得する必要がないので、各ＤＢ装置２０がそれぞれ別の組織により管理される場合でも、プライバシーの問題が発生しない。

【0105】

さらに、マッチングシステム１は、レコードのマッチングに適切な特徴量を絞り込んでマッチングを行うので、多数の特徴量から構成されるレコードのマッチングも行うことができる。さらに、マッチングシステム１は、レコードのマッチングに用いる特徴量を選択する際、値の欠損率が所定値以上の特徴量、ユニーク要素数が所定値以下の特徴量等を、マッチング用の特徴量の候補から削除する。また、マッチングシステム１は、レコードのマッチングに用いる特徴量のペアについて、特徴量の型の推定結果を用いたフィルタリングを行う。これにより、マッチングシステム１は、例えば、各ＤＢに１つの特徴量に対し様々な型が混在するレコードが含まれていても、マッチングすることができる。

【0106】

例えば、レコードを構成する１つの特徴量の中に、例えば、人為ミスや組織の運用の違いにより、複数の型のデータが入っている場合もある。例えば、電話番号型等の同じ型を持つレコードが複数あるため、その中でもどの特徴量とどの特徴量とをマッチングに利用するのがよいか、人では判断しづらい場合もある。このような場合でも、マッチングシステム１は、マッチングに適切な特徴量を判断し、マッチングすることができる。また、ＤＢ間でレコードのカラム数の偏り等がある場合でも、マッチングシステム１はレコードのマッチングをすることができる。

【0107】

［その他の実施形態］
なお、前記した実施形態においてマッチング装置１０は、２つのＤＢ装置２０のＤＢのレコードのマッチングを行う場合を例に説明したが、これに限定されない。例えば、マッチング装置１０は、３つ以上のＤＢ装置２０のＤＢのレコードのマッチングを行ってもよい。

【0108】

さらに、マッチング装置１０は、各ＤＢ装置２０から送信された各特徴量の型の推定結果を用いて、レコードのマッチングを行うこととしたが、各特徴量の型の推定結果を用いずにマッチングを行ってもよい。

【0109】

また、ＤＢ装置２０は、マッチング用の特徴量の候補を作成する際に行動ベースの特徴量を組み込んだり、ＤＢのレコードの表記揺れの正規化処理を行ったり、これらの処理を実行しないこととしてもよい。

【0110】

［適用例］
次に、前記したマッチングシステム１の適用例を説明する。マッチングシステム１により、社内データと、外部データとのマッチングを行ったところ、マッチング率は95.3％であった。

【0111】

上記の結果から、マッチングシステム１によれば、各ＤＢのレコードを用いた機械学習を行わなくても、ＤＢのレコードを精度よくマッチングできることが確認できた。

【0112】

［システム構成等］
また、図示した各部の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、ＣＰＵ及び当該ＣＰＵにて実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

【0113】

また、前記した実施形態において説明した処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

【0114】

［プログラム］
前記したマッチング装置１０は、パッケージソフトウェアやオンラインソフトウェアとしてプログラム（マッチングプログラム）を所望のコンピュータにインストールさせることによって実装できる。例えば、上記のプログラムを情報処理装置に実行させることにより、情報処理装置を、マッチング装置１０として機能させることができる。ここで言う情報処理装置にはスマートフォン、携帯電話機やPHS（Personal Handyphone System）等の移動体通信端末、さらには、PDA（Personal Digital Assistant）等の端末等がその範疇に含まれる。

【0115】

図７は、マッチングプログラムを実行するコンピュータの一例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、ＣＰＵ１０２０を有する。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

【0116】

メモリ１０１０は、ROM（Read Only Memory）１０１１及びRAM（Random Access Memory）１０１２を含む。ROM１０１１は、例えば、BIOS（Basic Input Output System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

【0117】

ハードディスクドライブ１０９０は、例えば、OS１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、上記のマッチング装置１０が実行する各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、マッチング装置１０における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、SSD（Solid State Drive）により代替されてもよい。

【0118】

また、上述した実施形態の処理で用いられるデータは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてRAM１０１２に読み出して実行する。

【0119】

なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（LAN（Local Area Network）、WAN（Wide Area Network）等）を介して接続される他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

【符号の説明】

【0120】

１０マッチング装置（判定装置）
２０ＤＢ装置
１１，２１通信部
１２，２２入出力部
１３，２３記憶部
１４，２４制御部
１４１型推定ルール送信部
１４２重み付き特徴量リスト取得部
１４３特徴量情報取得部
１４４フィルタリング部
１４５スコア算出式作成部
１４６レコード取得部
１４７スコア算出部
１４８判定部
１４９送信部
２４１特徴量作成部
２４２正規化部
２４３特徴量削減部
２４４重み算出部
２４５特徴量選択部
２４６型推定部
２４７重み付き特徴量リスト送信部
２４８レコード送信部
２４９マッチング結果出力部

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版