特許7123326 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 金子稔功の特許一覧 ▶ プレソフト・システム・コンサルティング株式会社の特許一覧

特許7123326情報処理方法、情報処理プログラム、情報処理装置及び学習モデルの生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2022-08-15

(45)【発行日】2022-08-23

(54)【発明の名称】情報処理方法、情報処理プログラム、情報処理装置及び学習モデルの生成方法

(51)【国際特許分類】

G06Q 50/10 20120101AFI20220816BHJP

G06Q 40/08 20120101ALI20220816BHJP

【ＦＩ】

G06Q50/10

G06Q40/08

【請求項の数】 12

(21)【出願番号】P 2021173453

(22)【出願日】2021-10-22

【審査請求日】2021-10-22

【早期審査対象出願】

(73)【特許権者】

【識別番号】521465614

【氏名又は名称】金子稔功

(73)【特許権者】

【識別番号】521465625

【氏名又は名称】プレソフト・システム・コンサルティング株式会社

(74)【代理人】

【識別番号】100114557

【弁理士】

【氏名又は名称】河野英仁

(74)【代理人】

【識別番号】100078868

【弁理士】

【氏名又は名称】河野登夫

(72)【発明者】

【氏名】金子稔功

【審査官】庄司琴美

(56)【参考文献】

【文献】特開２０１２－１５９８８４（ＪＰ，Ａ）

【文献】特開２００８－２７６４６５（ＪＰ，Ａ）

【文献】特開２００９－１５１５６３（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

コンピュータが、
基準契約の情報を取得し、
前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得し、
前記基準者と一部の属性項目が一致する前記基準者に類似する参照者を、当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得し、
前記基準者の属性項目と前記参照者の属性項目との類似度を算出し、
基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、
前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得し、
前記基準契約に含まれる前記基準者以外の当事者又は関係者と、前記参照契約の前記参照者以外の当事者又は関係者との一致度に基づいて、前記同人確率を調整し、
調整後の前記同人確率と、前記参照契約の当事者及び関係者とを出力する
処理を実行することを特徴とする情報処理方法。

【請求項2】

一の前記基準者に対して、複数の前記参照者それぞれの同人確率を算出し、
複数の前記参照者それぞれの前記同人確率と、前記参照契約の前記当事者及び関係者とを出力する
ことを特徴とする請求項１に記載の情報処理方法。

【請求項3】

前記参照者それぞれの前記同人確率に基づいて、前記基準者との位置関係が異なる表示態様となるように、前記基準者、並びに、複数の前記参照者及びそれぞれの前記同人確率を出力する
ことを特徴とする請求項２に記載の情報処理方法。

【請求項4】

前記基準契約の当事者及び関係者を出力する
ことを特徴とする請求項１から請求項３のいずれか一項に記載の情報処理方法。

【請求項5】

前記基準契約の当事者及び関係者、並びに、前記参照契約の前記当事者及び関係者の中に、同一人物又は同一人物と推定される候補人物が複数含まれている場合、前記同一人物又は前記候補人物であることが視認可能に、出力する
ことを特徴とする請求項４に記載の情報処理方法。

【請求項6】

前記基準者の前記属性項目と前記参照者の前記属性項目との相違を視認可能に、出力する
ことを特徴とする請求項１から請求項５のいずれか一項に記載の情報処理方法。

【請求項7】

前記基準者及び前記参照者が表示された画面において、前記参照者を示すアイコンが、前記基準者の表示領域に移動された場合、前記基準者及び前記参照者の対応付け情報を生成する
ことを特徴とする請求項１から請求項６のいずれか一項に記載の情報処理方法。

【請求項8】

前記対応付け情報を取得し、
前記基準者の属性項目と前記参照者の属性項目とに基づき、前記学習モデルを再学習する
ことを特徴とする請求項７に記載の情報処理方法。

【請求項9】

前記対応付け情報は、前記属性項目それぞれについて、前記基準者の値と前記参照者の値のいずれの値で統一するかの情報を含む
ことを特徴とする請求項７又は請求項８に記載の情報処理方法。

【請求項10】

基準契約の情報を取得し、
前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得し、
前記基準者と一部の属性項目が一致する前記基準者に類似する参照者を、当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得し、
前記基準者の属性項目と前記参照者の属性項目との類似度を算出し、
基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、
前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得し、
前記基準契約に含まれる前記基準者以外の当事者又は関係者と、前記参照契約の前記参照者以外の当事者又は関係者との一致度に基づいて、前記同人確率を調整し、
調整後の前記同人確率と、前記参照契約の当事者及び関係者とを出力する
処理をコンピュータに行わせることを特徴とする情報処理プログラム。

【請求項11】

基準契約の情報を取得する契約取得部と、
前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得する属性取得部と、
前記基準者と一部の属性項目が一致する前記基準者に類似する参照者を、当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得する参照属性取得部と、
前記基準者の属性項目と前記参照者の属性項目との類似度を算出する算出部と、
基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得する確率取得部と、
前記基準契約に含まれる前記基準者以外の当事者又は関係者と、前記参照契約の前記参照者以外の当事者又は関係者との一致度に基づいて、前記同人確率を調整する調整部と、
調整後の前記同人確率と、前記参照契約の当事者及び関係者とを出力する出力部と
を備えることを特徴とする情報処理装置。

【請求項12】

基準契約に係る基準者及び該基準者以外の前記基準契約に係る関係者の属性項目を取得し、
前記基準者と同一人物であると判断された参照契約に係る参照者及び該参照者以外の前記参照契約に係る関係者の属性項目を取得し、
前記基準者及び該基準者以外の関係者の属性項目と前記参照者及び該参照者以外の関係者の属性項目との類似度を算出し、
算出した前記類似度を含む訓練データに基づき、基準契約に係る基準者及び該基準者以外の前記基準契約に係る関係者の属性項目と参照契約に係る参照者及び該参照者以外の前記参照契約に係る関係者の属性項目との類似度を入力した場合に前記基準者と前記参照者とが同一人物である確率を出力する学習モデルを生成する
学習モデルの生成方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、名寄せ候補となる一組の顧客情報を出力する情報処理方法等に関する。

【背景技術】

【0002】

顧客情報が重複して管理されている場合、購入履歴等が適切に把握できない。そのため、顧客が既に購入している商品・サービスに関するダイレクトメールを送付してしまう不都合が生じることがある。それを防止するために、重複する顧客情報を取りまとめる名寄せが行われている。複数の顧客情報間で含まれる項目が異なる場合に名寄せを行うことは困難である。

【0003】

このような状況に対して、多様なサービスに基づいた情報の名寄せを支援するための情報管理システムが提案されている（特許文献１）。特許文献１に開示の情報管理システムでは、第１、第２サービスサーバから第１、第２ユーザ関連情報を新たに取得した場合、新たに算出した第１スコア及び第２スコアの組み合わせに対して、予測モデルを適用し、同一人物の確からしさを予測する。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０２１－０３３４６５号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、特許文献１に開示の情報管理システムは、顧客に新たな取引を提案することを主目的としており、同一人物の確からしさは提示されない。本発明はこのような状況に鑑みてなされたものである。その目的は、同一人物の可能性がある基準者及び参照者の同人確率を出力する情報処理方法等の提供である。

【課題を解決するための手段】

【0006】

本願に開示する情報処理方法は、コンピュータが、基準契約の情報を取得し、前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得し、前記基準者と一部の属性項目が一致する前記基準者に類似する参照者を、当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得し、前記基準者の属性項目と前記参照者の属性項目との類似度を算出し、基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得し、前記基準契約に含まれる前記基準者以外の当事者又は関係者と、前記参照契約の前記参照者以外の当事者又は関係者との一致度に基づいて、前記同人確率を調整し、調整後の前記同人確率と、前記参照契約の当事者及び関係者とを出力する処理を実行することを特徴とする。

【発明の効果】

【0007】

本願の一態様にあっては、同一人物の可能性がある基準者及び参照者の同人確率を確認することが可能となる。

【図面の簡単な説明】

【0008】

【図1】名寄せシステムの構成例を示す説明図である。

【図2】ＡＰサーバのハードウェア構成例を示すブロック図である。

【図3】ユーザ端末のハードウェア構成例を示すブロック図である。

【図4】顧客ＤＢの例を示す説明図である。

【図5】契約ＤＢの例を示す説明図である。

【図6】候補組ＤＢの例を示す説明図である。

【図7】類似度ＤＢの例を示す説明図である。

【図8】判定結果ＤＢの例を示す説明図である。

【図9】結果ＤＢの例を示す説明図である。

【図10】項目結果ＤＢの例を示す説明図である。

【図11】訓練ＤＢの例を示す説明図である。

【図12】モデル生成処理の手順例を示すフローチャートである。

【図13】前処理の手順例を示すフローチャートである。

【図14】判定処理の手順例を示すフローチャートである。

【図15】名寄せ処理の手順例を示すフローチャートである。

【図16】再学習処理の手順例を示すフローチャートである。

【図17】表示画面例を示す説明図である。

【図18】名寄せ操作画面の例を示す説明図である。

【図19】項目設定画面の例を示す説明図である。

【図20】調整の例を示す説明図である。

【図21】調整処理の手順例を示すフローチャートである。

【発明を実施するための形態】

【0009】

（実施の形態１）
以下実施の形態を、図面を参照して説明する。図１は名寄せシステムの構成例を示す説明図である。名寄せシステム１００はＡＰサーバ１及びユーザ端末２を含む。ＡＰサーバ１及びユーザ端末２はネットワークＮにより、互いに通信可能に接続されている。また、ＡＰサーバ１及びユーザ端末２は、ネットワークＮを介して、基幹システムＤＢ２００にアクセス可能となっている。

【0010】

ＡＰサーバ１はサーバコンピュータ、ワークステーション、ＰＣ（Personal Computer）等で構成する。また、ＡＰサーバ１を複数のコンピュータからなるマルチコンピュータ、ソフトウェアによって仮想的に構築された仮想マシン又は量子コンピュータで構成してもよい。さらに、ＡＰサーバ１の機能をクラウドサービスで実現してもよい。

【0011】

ユーザ端末２はノートパソコン、パネルコンピュータ、タブレットコンピュータ、スマートフォン等で構成する。図２にはユーザ端末２を２台記載しているが、１台であっても３台以上であってもよい。なお、ユーザは名寄せ作業を行う従業員等である。

【0012】

基幹システムＤＢ２００は基幹システムのデータベースである。基幹システムＤＢ２００は名寄せ処理の対象となる顧客データを記憶している。以下の説明においては、生命保険会社の顧客データを想定する。生命保険契約においては、当事者である契約者以外に、被保険者、保険料の負担者（以下、単に「負担者」という。）、給付金、保険金の受取人（以下、単に「受取人」という。）等の関係者が含まれる。ここで、顧客データは、契約者のデータのみならず、関係者のデータも含むものとする。

【0013】

図２はＡＰサーバのハードウェア構成例を示すブロック図である。ＡＰサーバ１は制御部１１、主記憶部１２、補助記憶部１３、通信部１５及び読み取り部１６を含む。制御部１１、主記憶部１２、補助記憶部１３、通信部１５及び読み取り部１６はバスＢにより接続されている。

【0014】

制御部１１は、一又は複数のＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro-Processing Unit）、ＧＰＵ（Graphics Processing Unit）等の演算処理装置を有する。制御部１１は、補助記憶部１３に記憶された制御プログラム１Ｐ（プログラム、プログラム製品）を読み出して実行することにより、ＡＰサーバ１に係る種々の情報処理、制御処理等を行い、契約取得部、属性取得部、参照属性取得部、算出部、確率取得部、及び、出力部等の機能部を実現する。

【0015】

主記憶部１２は、ＳＲＡＭ（Static Random Access Memory）、ＤＲＡＭ（Dynamic Random Access Memory）、フラッシュメモリ等である。主記憶部１２は主として制御部１１が演算処理を実行するために必要なデータを一時的に記憶する。

【0016】

補助記憶部１３はハードディスク又はＳＳＤ（Solid State Drive）等であり、制御部１１が処理を実行するために必要な制御プログラム１Ｐや各種ＤＢ（Database）を記憶する。補助記憶部１３は、顧客ＤＢ１３１、契約ＤＢ１３２、候補組ＤＢ１３３、類似度ＤＢ１３４、判定結果ＤＢ１３５、結果ＤＢ１３６、項目結果ＤＢ１３７、及び、訓練ＤＢ１３８を記憶する。また、補助記憶部１３は学習モデル１４１を記憶する。補助記憶部１３はＡＰサーバ１と別体で外部接続された外部記憶装置であってもよい。補助記憶部１３に記憶する各種ＤＢ等を、ＡＰサーバ１とは異なるデータベースサーバやクラウドストレージに記憶してもよい。

【0017】

通信部１５はネットワークＮを介して、ユーザ端末２と通信を行う。また、制御部１１が通信部１５を用い、ネットワークＮ等を介して他のコンピュータから制御プログラム１Ｐをダウンロードし、補助記憶部１３に記憶してもよい。

【0018】

読み取り部１６はＣＤ（Compact Disc）－ＲＯＭ及びＤＶＤ（Digital Versatile Disc）－ＲＯＭを含む可搬型記憶媒体１ａを読み取る。制御部１１が読み取り部１６を介して、制御プログラム１Ｐを可搬型記憶媒体１ａより読み取り、補助記憶部１３に記憶してもよい。また、半導体メモリ１ｂから、制御部１１が制御プログラム１Ｐを読み込んでもよい。

【0019】

図３はユーザ端末のハードウェア構成例を示すブロック図である。ユーザ端末２は制御部２１、主記憶部２２、補助記憶部２３、通信部２４、入力部２５及び表示部２６を含む。各構成はバスＢで接続されている。

【0020】

制御部２１は、一又は複数のＣＰＵ、ＭＰＵ、ＧＰＵ等の演算処理装置を有する。制御部２１は、補助記憶部２３に記憶された制御プログラム２Ｐ（プログラム、プログラム製品）を読み出して実行することにより、種々の機能を提供する。

【0021】

主記憶部２２は、ＳＲＡＭ、ＤＲＡＭ、フラッシュメモリ等である。主記憶部２２は主として制御部２１が演算処理を実行するために必要なデータを一時的に記憶する。

【0022】

補助記憶部２３はハードディスク又はＳＳＤ等であり、制御部２１が処理を実行するために必要な各種データを記憶する。補助記憶部２３はユーザ端末２と別体で外部接続された外部記憶装置であってもよい。補助記憶部２３に記憶する各種ＤＢ等を、データベースサーバやクラウドストレージに記憶してもよい。

【0023】

通信部２４はネットワークＮを介して、ＡＰサーバ１と通信を行う。また、制御部２１が通信部２４を用い、ネットワークＮ等を介して他のコンピュータから制御プログラム２Ｐをダウンロードし、補助記憶部２３に記憶してもよい。

【0024】

入力部２５はキーボードやマウスである。表示部２６は液晶表示パネル等を含む。表示部２６はＡＰサーバ１が出力した顧客情報などを表示する。また、入力部２５と表示部２６とを一体化し、タッチパネルディスプレイを構成してもよい。なお、ユーザ端末２は外部の表示装置に表示を行ってもよい。

【0025】

次に、名寄せシステム１００が用いるデータベースについて説明する。図４は顧客ＤＢの例を示す説明図である。顧客ＤＢ１３１は顧客（契約者、関係者を含む）のデータを記憶する。顧客ＤＢ１３１は、顧客番号列、氏名列、フリガナ列、性別列、生年月日列、住所列、及び電話番号列を含む。顧客番号列は顧客を特定可能な顧客番号を記憶する。氏名列は顧客の氏名を記憶する。フリガナ列は顧客氏名のフリガナを記憶する。性別列は顧客の性別を示すアルファベットを記憶する。顧客が男性の場合、性別列はＭを記憶する。顧客が女性の場合、性別列はＦを記憶する。生年月日列は顧客の生年月日を記憶する。住所列は顧客の住所を記憶する。電話番号列は顧客の電話番号を記憶する。

【0026】

図５は契約ＤＢの例を示す説明図である。契約ＤＢ１３２は保険契約の内容を記憶する。契約ＤＢ１３２は証券番号列、契約者列、被保険者列、負担者列及び受取人列を含む。証券番号列は保険証券に付された証券番号を記憶する。契約者列は保険契約者の顧客番号を記憶する。被保険者列は被保険者の顧客番号を記憶する。負担者列は保険料負担者の顧客番号を記憶する。受取人列は保険金の受取人の情報を記憶する。受取人列は番号列及び顧客列を含む。番号列は受取人の順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。顧客列は受取人の顧客番号を記憶する。

【0027】

顧客ＤＢ１３１及び契約ＤＢ１３２は、マスタデータを基幹システムＤＢ２００が保持しておくべきである。したがって、ＡＰサーバ１が記憶している顧客ＤＢ１３１及び契約ＤＢ１３２は、基幹システムＤＢ２００からコピーしたものであるか、名寄せ用に必要な項目のみを基幹システムＤＢ２００からコピーしたものであってもよい。

【0028】

図６は候補組ＤＢの例を示す説明図である。候補組ＤＢ１３３は名寄せの対象となる複数顧客の組み合わせ情報を記憶する。候補組ＤＢ１３３はＰＩＤ列、基準者列、基準契約列、対象者列、対象契約列を含む。ＰＩＤ列は候補組を特定するＰＩＤを記憶する。基準者列は名寄せの基準とする顧客の情報を記憶する。基準者列は顧客番号列及び立場列を含む。顧客番号列は基準者の顧客番号を記憶する。立場列は基準者の契約における立場を記憶する。立場とは、契約者、被保険者、負担者又は受取人である。基準契約列は基準者に紐付いている保険契約の証券番号を記憶する。対象者列は名寄せの対象となる顧客の情報を記憶する。対象者列は番号列、顧客番号列及び立場列を含む。番号列は対象者の順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。顧客番号列は対象者の顧客番号を記憶する。立場列は対象者の契約における立場を記憶する。対象契約列は対象者に紐付いている保険契約の証券番号を記憶する。

【0029】

図７は類似度ＤＢの例を示す説明図である。類似度ＤＢ１３４は属性項目毎の基準者と対象者との類似度を記憶する。類似度ＤＢ１３４はＰＩＤ列、番号列、氏名列、フリガナ列、性別列、生年月日列、住所列及び電話番号列を記憶する。ＰＩＤ列は候補組を特定するＰＩＤを記憶する。番号列は対象者の順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。氏名列は、基準者の氏名と対象者の氏名との類似度を記憶する。フリガナ列は、基準者の氏名フリガナと対象者の氏名フリガナとの類似度を記憶する。性別列は、基準者の性別と対象者の性別との類似度を記憶する。性別が一致する場合は１を、一致しない場合は０を、いずれか一方の性別が不明の場合は０．５を、性別列は記憶する。生年月日列は、基準者の生年月日と対象者の生年月日との類似度を記憶する。住所列は、基準者の住所と対象者の住所との類似度を記憶する。電話番号列は、基準者の電話番号と対象者の電話番号との類似度を記憶する。例えば、類似度は、基準者の値と対象者の値とを、Ｗｏｒｄ２Ｖｅｃ又はＤｏｃ２Ｖｅｃによりベクトルで表現し、２つのベクトルのコサイン類似度としてもよい。また、基準者の値と対象者の値とを前方一致の文字列比較を行い、一致する文字列の長さと、全体の文字列の長さとから、類似度を算出してもよい。

【0030】

図８は判定結果ＤＢの例を示す説明図である。判定結果ＤＢ１３５は基準者と対象者とが同一人物であるか否かを、学習モデル１４１が判定した結果を記憶する。ＰＩＤ列は候補組を特定するＰＩＤを記憶する。基準者列は基準者の情報を記憶する。基準者列は顧客番号列及び立場列を含む。顧客番号列は基準者の顧客番号を記憶する。立場列は基準者が含まれる契約における立場を記憶する。基準契約列は基準者を含む契約の証券番号を記憶する。対象者列は対象者の情報を記憶する。対象者列は番号列、顧客番号列及び立場列を含む。番号列は順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。顧客番号列は対象者の顧客番号を記憶する。立場列は対象者の立場を記憶する。対象契約列は対象者を含む契約の証券番号を記憶する。評価列は評価値を記憶する。評価値は例えば０から１００までの値である。０は基準者と対象者とが同一人物である確率は０％であることを示す。１００は基準者と対象者とが同一人物である確率は１００％であることを示す。

【0031】

図９は結果ＤＢの例を示す説明図である。結果ＤＢ１３６は学習モデル１４１の判定結果を参考に、ユーザが、基準者と対象者とを同一人物と判断したか否かの判断結果を記憶する。結果ＤＢ１３６はＰＩＤ列、基準者列、対象者列、評価列及び結果列を含む。ＰＩＤ列は候補組を特定するＰＩＤを記憶する。基準者列は基準者の顧客番号を記憶する。対象者列は対象者の情報を記憶する。対象者列は番号列、顧客番号列及び立場列を含む。番号列は順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。顧客番号列は対象者の顧客番号を記憶する。立場列は対象者の立場を記憶する。評価列は評価値を記憶する。評価値は、判定結果ＤＢ１３５において、ＰＩＤ列の値、及び対象者列の番号列の値が一致するレコードにおける評価列の値と、同一の値を記憶する。結果列は判断結果を記憶する。例えば、ユーザが、基準者と対象者とを同一人物と判断した場合、結果列は○を記憶する。ユーザが、基準者と対象者とを同一人物でないと判断した場合、結果列は×を記憶する。

【0032】

図１０は項目結果ＤＢの例を示す説明図である。項目結果ＤＢ１３７は、ユーザが、基準者と対象者とを同一人物と判断した場合において、基準者、対象者の属性項目を、基準者又は対象者の何れの値に統一すると判断したかを記憶する。項目結果ＤＢ１３７はＰＩＤ列、基準者列、対象者列、氏名列、フリガナ列、性別列、生年月日列、住所列及び電話番号列を含む。ＰＩＤ列は候補組を特定するＰＩＤを記憶する。基準者列は基準者の顧客番号を記憶する。対象者列は対象者の顧客番号を記憶する。氏名列、フリガナ列、性別列、生年月日列、住所列、及び電話番号列は、それぞれ値を、基準者又は対象者の何れの値に統一すると判断したかを記憶する。例えば、ユーザが対象者の値を基準者の値に書き換えると判断した場合、それぞれの列は基準者を記憶する。ユーザが基準者の値を対象者の値に書き換えると判断した場合、それぞれの列は対象者を記憶する。

【0033】

図１１は訓練ＤＢの例を示す説明図である。訓練ＤＢ１３８は学習モデル１４１を生成又は再学習する際に用いる訓練データを記憶する。訓練ＤＢ１３８は番号列、ラベル列、氏名列、フリガナ列、性別列、生年月日列、住所列及び電話番号列を含む。番号列は順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。ラベル列は判定の正解値を記憶する。０は同一人物ではないと判定すべきことを示し、１は同一人物であると判定すべきことを示す。氏名列、フリガナ列、性別列、生年月日列、住所列及び電話番号列は、基準者と対象者との項目毎の類似度である。なお、訓練データに含まれる項目は、類似度ＤＢ１３４又は結果ＤＢ１３６より生成可能である。したがって、学習モデル１４１の利用開始後は、類似度ＤＢ１３４又は結果ＤＢ１３６から、訓練データを作成し、学習モデル１４１の再学習が可能である。

【0034】

続いて、学習モデル１４１について説明する。学習モデル１４１は、例えばＣＮＮ（Convolution Neural Network）などのニューラルネットワークである。学習モデル１４１は項目毎の類似度を受け付ける入力層と、基準者と対象者とが同一人物である確率を出力する出力層と、基準者と対象者との類似度を出力する中間層を有する。

【0035】

入力層は、項目毎の類似度の入力を受け付ける複数のニューロンを有し、入力された類似度を中間層に受け渡す。中間層は複数のニューロンを有し、入力層から入力された項目毎の類似度を畳み込むコンボリューション層と、コンボリューション層で畳み込んだ類似度をマッピングするプーリング層とが交互に連結された構成を有し、基準者と対象者との類似度を出力する。出力層はソフトマックス関数等により、中間層からの類似度を、基準者と対象者とが同一人物である確率に変換して、出力する。学習モデル１４１は、ＣＮＮに限定されず、ＣＮＮ以外のニューラルネットワーク、ベイジアンネットワーク、決定木など、他の学習アルゴリズムで構築する学習モデルであってもよい。

【0036】

次に、名寄せシステム１００が行う情報処理について説明する。図１２はモデル生成処理の手順例を示すフローチャートである。モデル生成処理は学習モデル１４１を生成する処理である。ＡＰサーバ１の制御部１１は、訓練ＤＢ１３８から訓練データを１レコード取得する（ステップＳ１）。制御部１１は学習を行う（ステップＳ２）。制御部１１は訓練データに含む項目毎の類似度を入力層に入力し、中間層での演算処理を経て、出力層から基準者と対象者とが同一人物である確率を取得する。確率は、０から１までの範囲の値である。なお、確率は離散値（０又は１）であってもよい。制御部１１は、出力層から出力された確率を、訓練データに含むラベルの値、すなわち正解値と比較し、出力層からの出力値が正解値に近づくように、中間層での演算処理に用いるパラメータを最適化する。当該パラメータは、例えばニューロン間の重み（結合係数）、各ニューロンで用いられる活性化関数の係数などである。パラメータの最適化の方法は特に限定されないが、例えば制御部１１は誤差逆伝播法を用いて各種パラメータの最適化を行う。制御部１１は未処理の訓練データがあるか否かを判定する（ステップＳ３）。制御部１１は未処理の訓練データがあると判定した場合（ステップＳ３でＹＥＳ）、処理をステップＳ１へ戻し、未処理の訓練データを用いて、学習を行う。制御部１１は未処理の訓練データがないと判定した場合（ステップＳ３でＮＯ）、学習により最適化されたパラメータ等を含む学習モデル１４１を、補助記憶部１３に記憶し（ステップＳ４）、処理を終了する。

【0037】

図１３は前処理の手順例を示すフローチャートである。前処理は基準者と対象者との組み合わせを作成する等の準備を行う処理である。まず前提として、基幹システムＤＢ２００から、追加又は変更された顧客情報、契約情報を差分データとして、制御部１１は取得しているとする。制御部１１は差分データの正規化を行う（ステップＳ１１）。例えば、住所に含まれる「永田町１丁目３番５号」との記載形式を、「永田町１－３－５」との記載形式に変更する。電話番号では、「（０３）１２３－４５６７」との記載形式を、「03-123-4567」との記載形式に変更する。生年月日では、「平成１３年９月２日」との記載形式を「2001/09/02」との記載形式に変更する。変更の例はあくまでも一例であり、形式が統一されるのであれば、他の形式でもよい。制御部１１は候補組の作成を行う（ステップＳ１２）。候補組は名寄せ対象となる１名の基準者と１又は複数名の対象者との組み合わせである。例えば、制御部１１は、顧客情報が追加又は変更された顧客を基準者とする。または、制御部１１は追加又は変更された契約情報に含まれる契約当事者や関係者を基準者とする。対象者は顧客ＤＢ１３１を検索して、基準者と所定の項目、例えば名前のフリガナが一致し、生年月日又は性別が一致する顧客とする。制御部１１は候補組ＤＢ１３３に候補組を記憶し（ステップＳ１３）、処理を終了する。ステップＳ１２、ステップＳ１３は基準者の数に合わせて繰り返し実行する。

【0038】

図１４は判定処理の手順例を示すフローチャートである。判定処理は基準者と対象者とが同一人物であるか否かの判定を行う処理である。制御部１１は候補組ＤＢ１３３から一組のデータを取得する（ステップＳ２１）。制御部１１は候補組に含まれる基準者の属性と対象者の属性とを、顧客ＤＢ１３１から取得し、項目毎の類似度を算出する（ステップＳ２２）。制御部１１は判定を行う（ステップＳ２３）。制御部１１は項目毎の類似度を学習モデル１４１に入力し、学習モデル１４１が出力した確率を取得する。当該処理を対象者の数に合わせて行う。制御部１１は判定結果を判定結果ＤＢ１３５に記憶する（ステップＳ２４）。制御部１１は未処理の候補組データがあるか否かを判定する（ステップＳ２５）。制御部１１は未処理の候補組データがあると判定した場合（ステップＳ２５でＹＥＳ）、処理をステップＳ２１へ戻し、未処理の候補組データについての処理を行う。制御部１１は未処理の候補組データがないと判定した場合（ステップＳ２５でＮＯ）、処理を終了する。なお、類似度の算出（ステップＳ２２）は、前処理で行ってもよい。

【0039】

なお、前処理及び判定処理は、日次バッチとして行うことを想定している。基幹システムＤＢ２００が、日次バッチにより、顧客情報、契約情報の差分データを作成する。差分データの作成された後に、ＡＰサーバ１が前処理、判定処理を順に実行すればよい。

【0040】

図１５は名寄せ処理の手順例を示すフローチャートである。名寄せ処理は判定結果ＤＢ１３５に基づいて、基準者と参照者との名寄せを行うか、ユーザが判断するための処理である。ユーザはユーザ端末２にて、名寄せ処理の開始操作をする。ユーザ端末２の制御部２１は、名寄せの候補組データの要求をＡＰサーバ１へ送信する（ステップＳ３１）。ＡＰサーバ１の制御部１１は要求を受信する（ステップＳ３２）。制御部１１は未処理の候補組データを選択する（ステップＳ３３）。制御部１１は操作画面を生成し、ユーザ端末２へ送信する（ステップＳ３４）。ユーザ端末２の制御部２１は画面を受信する（ステップＳ３５）。制御部２１は受信した画面を表示する（ステップＳ３６）。ユーザは操作画面を見て、基準者と参照者とを名寄せすべきかを判断し、判断に従った操作を行う。制御部２１は操作を受け付ける（ステップＳ３７）。制御部２１は受け付けた操作が完了か否かを判定する（ステップＳ３８）。制御部２１は受け付けた操作が完了でないと判定した場合（ステップＳ３８でＮＯ）、操作内容を補助記憶部２３等に記憶し（ステップＳ３９）、処理をステップＳ３６へ戻す。操作内容は、基準者と参照者のいずれとを名寄せするという指示操作や、名寄せする際、属性値を基準者にあわせるのか、参照者にあわせるのかを属性項目毎に指示する操作である。制御部２１は受け付けた操作が完了であると判定した場合（ステップＳ３８でＹＥＳ）、ユーザの判断結果をＡＰサーバ１へ送信する（ステップＳ４０）。なお、制御部１１は、判断結果を補助記憶部２３等に記憶された操作内容に基づいて作成する。ＡＰサーバ１の制御部１１は判断結果を受信する（ステップＳ４１）。制御部１１は判断結果に基づき、再学習用の訓練データを生成する（ステップＳ４２）。制御部１１は判断結果を結果ＤＢ１３６と項目結果ＤＢ１３７とに記憶し、訓練データを訓練ＤＢ１３８に記憶し（ステップＳ４３）、処理を終了する。なお、名寄せすべき参照者がなかった場合、項目結果ＤＢ１３７への記憶を、制御部１１は行わない。なお、引き続き、ユーザが名寄せ処理を行う場合、ユーザ操作により、再度、名寄せ処理が実行される。項目結果ＤＢ１３７の内容は、基幹システムへ送信され、基幹システムＤＢ２００において、データの名寄せが行われる。結果ＤＢ１３６と項目結果ＤＢ１３７とに記憶される判断結果は、対応付け情報の一例である。

【0041】

図１６は再学習処理の手順例を示すフローチャートである。ＡＰサーバ１の制御部１１は再学習用の訓練データを訓練ＤＢ１３８から取得する（ステップＳ６１）。制御部１１は訓練データを用いて、学習モデル１４１の学習を行う（ステップＳ６２）。制御部１１は未処理の訓練データがある否かを判定する（ステップＳ６３）。制御部１１は未処理の訓練データがあると判定した場合（ステップＳ６３でＹＥＳ）、処理をステップＳ６１へ戻し、未処理の訓練データによる学習を行う。制御部１１は未処理の訓練データがないと判定した場合（ステップＳ６３でＮＯ）、再学習前後の学習モデル１４１の性能比較を行う（ステップＳ６４）。例えば、再学習前後の学習モデル１４１へ再学習用の訓練データを入力し、正解率が向上しているかを判定する。制御部１１は学習モデル１４１の性能が改善されているか否かを判定する（ステップＳ６５）。制御部１１は学習モデル１４１の性能が改善されていると判定した場合（ステップＳ６５でＹＥＳ）、学習モデル１４１を再学習後のものに更新し（ステップＳ６６）、処理を終了する。制御部１１は学習モデル１４１の性能が改善されていないと判定した場合（ステップＳ６５でＮＯ）、処理を終了する。

【0042】

図１７は表示画面例を示す説明図である。表示画面は基準契約情報１７１、参照契約情報１７２、１７３、属性表１７４を含む。基準契約情報１７１は基準者が含まれる基準契約の情報である。基準契約情報１７１には、証券番号並びに、契約者、被保険者、負担者及び受取人の氏名が含まれている。参照契約情報１７２、１７３は、参照者が含まれる参照契約の情報である。参照契約情報１７２、１７３には、証券番号並びに、契約者、被保険者、負担者及び受取人の氏名が含まれている。属性表１７４は、基準者及び参照者それぞれの属性項目の相違を視認可能とする表である。

【0043】

図１７では、基準者は田中一郎である。参照者のうち、参照契約情報１７３に含まれる負担者としての田中一郎１７３１は基準者との同一人物である確率（同人確率）１７３２が９８％と、受取人としての田中一郎１７３１は同人確率１７３２が８５％と判定されている。

【0044】

図１８は名寄せ操作画面の例を示す説明図である。名寄せ操作画面は名寄せ操作を行う画面である。例えば、図１７に示した表示画面を参照して、ユーザが基準者と名寄せする参照者を決めた後、所定の操作を行うと、制御部２１は名寄せ操作画面を表示する。名寄せ操作画面では、参照者の同人確率によって、基準者との位置関係が異なるような表示態様としている。図１８では、同人確率が高い参照者ほど、基準者に近い位置に表示している。名寄せ操作画面において、ユーザは、名寄せする参照者アイコン１８２を基準者アイコン１８１へドラッグ・アンド・ドロップする。当該操作が、両者を名寄せする指示操作となる。名寄せ操作画面では、参照者の同人確率によって、基準者との位置関係が異なるように表示しているので、参照者間で同人確率の大小が分かりやすくなっている。基準者アイコン１８１は、基準者の表示領域の一例である。

【0045】

図１９は項目設定画面の例を示す説明図である。項目設定画面は基準者と参照者とを名寄せする際に、各属性項目をいずれの者の項目値に統一するかを指定する画面である。方向アイコン１９１、１９２を操作して、ユーザは項目毎に値を採用する者を指定する。方向アイコン１９１は基準者の属性項目を参照者の属性項目に統一することを示す。方向アイコン１９２は参照者の属性項目を基準者の属性項目に統一することを示す。例えば、次の操作により、ユーザは指示を行う。方向アイコン１９１をマウスクリックすると、方向アイコン１９２に切り替わり、方向アイコン１９２をマウスクリックすると、方向アイコン１９１に切り替わる。すべての項目について方向が定まったら、ユーザは確定ボタン１９３を選択する。ユーザが確定ボタン１９３を選択すると、ユーザ端末２は設定を記憶する。ユーザがキャンセルボタン１９４を選択すると、項目設定は破棄される。

【0046】

ユーザの操作により、基準者と名寄せする参照者の情報、各属性項目をいずれの者に統一するかの情報が生成される。生成された情報は、判断結果として、ユーザ端末２からＡＰサーバ１へ送信される。

【0047】

本実施の形態は、次の効果を奏する。基準者と参照者とが同一人物である確率が表示されるので、ユーザは名寄せすべき基準者と参照者との組み合わせを、的確に指定することが可能となる。また、図１７に示した表示画面では、当事者（契約者）に加えて、被保険者、負担者、受取人等の関係者も表示するので、基準者及び参照者の情報だけ以外の当事者又は関係者を見て、ユーザは基準者と参照者とが同一人物であるかを判断可能である。さらに、図１７の属性表１７４を参照することにより、ユーザは基準者と参照者とが同一人物であるかを判断可能である。図１８に示した名寄せ操作画面、図１９に示した項目設定画面により、ユーザは名寄せの指示を直感的な操作により行えるので、操作ミスの発生を抑制することが可能となる。

【0048】

（実施の形態２）
本実施の形態は、基準者と対象者とが同一人物であるか否かの判定において、基準契約と対象契約との比較を行う形態である。以下の説明においては、実施の形態１と同様な内容は可能な限り省略し、実施の形態１と異なる内容を主として説明する。

【0049】

本実施の形態では、基準者が含まれる基準契約と、対象者が含まれる対象契約との比較において、基準者又は対象者以外の当事者又は関係者同士の一致度をみる。そして、基準者又は対象者以外に、基準契約と対象契約とで同一人物が含まれている場合、基準者と対象者との同人確率を調整する。図２０は調整の例を示す説明図である。図２０Ａは従来の基準者と対象者との比較のみの場合を示す。図２０Ｂは基準者又は対象者以外の当事者又は関係者同士を比較する場合を示す。図２０において住所として記憶されているものは３つであり、数字で示している。電話番号は０３が固定電話の番号が記憶されていることを示し、０９０は携帯電話の番号が記憶されていることを示す。

【0050】

図２０Ａにおいて、基準者と対象者とでは、住所が異なり電話番号も異なっている。基準者の電話番号は固定電話のものであり、対象者の電話番号は携帯電話のものである。そのため電話番号が大きく異なることから、基準者及び対象者の同人確率は５５％と判定されている。図２０Ｂにおいて、基準契約の被保険者と対象契約の被保険者とは、同じ田中花子である。顧客ＩＤが一致することから、両契約の田中花子は同一人物である。そこで、同人確率は５５％から９２％となるように、調整されている。

【0051】

図２１は調整処理の手順例を示すフローチャートである。調整処理は、図１４に示した判定処理において、ステップＳ２３とＳ２４との間に実行する。ＡＰサーバ１の制御部１１は候補組に含まれる基準契約及び対象契約の情報を取得する（ステップＳ８１）。制御部１１は候補組に含まれる基準契約及び対象契約のそれぞれの証券番号をキーにして契約ＤＢ１３２を検索し、基準契約に含まれる当事者及び関係者の情報と、対象契約に含まれる当事者及び関係者の情報とを取得する。制御部１１は基準者と対象者とを除いた両契約の当事者及び関係者を対比する（ステップＳ８２）。制御部１１は、両契約間で同一人物が含まれているか否かを判定する（ステップＳ８３）。例えば、両契約間で顧客ＩＤが同一の人物が含まれている場合、ステップＳ８３でＹＥＳとなる。制御部１１は、両契約間で同一人物が含まれていると判定した場合（ステップＳ８３でＹＥＳ）、同人確率を調整し（ステップＳ８４）、処理を終了する。例えば、同人確率に所定の係数を掛ける、同人確率に所定の値を加える、予め用意したテーブルを用いて同人確率を更新する、等の処理を調整として行う。なお、調整により、同人確率は調整前よりも大きな値となる。両契約間で含まれる同一人物の数により、調整幅を変えてもよい。制御部１１は、両契約間で同一人物が含まれていないと判定した場合（ステップＳ８３でＮＯ）、処理を終了する。

【0052】

上述においては、学習モデル１４１の判定結果を、基準契約と対象契約との比較結果により調整したが、それに限らない。学習モデル１４１への入力として、基準契約に含まれる基準者以外の関係者の情報、及び、対象契約に含まれる対象者以外の関係者の情報を含めてよい。この場合、訓練データにも、基準者以外の関係者の情報、及び、対象者以外の関係者の情報を含め、学習モデル１４１を生成又は再学習する。基準者と対象者とが同一人物であるか否かを学習モデル１４１に判定させる際にも、基準者以外の関係者の情報、及び、対象者以外の関係者の情報を入力として含める。

【0053】

本実施の形態は、実施の形態１が奏する効果に加えて、以下の効果を奏する。基準者が含まれる基準契約と、対象者が含まれる対象契約とを比較し、基準者と対象者とを除いた両契約の当事者及び関係者の間に、同一人物が含まれる場合、基準者及び対象者の同人確率を増加させる。それによって、ユーザは基準者及び対象者が同一人物であることを、確信を持って判断することが可能となる。

【0054】

各実施の形態で記載されている技術的特徴（構成要件）はお互いに組み合わせ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

【符号の説明】

【0055】

１００システム
２００基幹システムＤＢ
１ＡＰサーバ
１１制御部
１２主記憶部
１３補助記憶部
１３１顧客ＤＢ
１３２契約ＤＢ
１３３候補組ＤＢ
１３４類似度ＤＢ
１３５判定結果ＤＢ
１３６結果ＤＢ
１３７項目結果ＤＢ
１３８訓練ＤＢ
１４１学習モデル
１５通信部
１６読み取り部
１Ｐ制御プログラム
１ａ可搬型記憶媒体
１ｂ半導体メモリ
２ユーザ端末
Ｂバス
Ｎネットワーク

【要約】

【課題】同一人物であると思われる基準者及び参照者の同人確率を出力する情報処理方法等を提供すること。
【解決手段】情報処理方法は、コンピュータが、基準契約の情報を取得し、前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得し、前記基準者に類似する参照者を当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得し、前記基準者の属性項目と前記参照者の属性項目との類似度を算出し、基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得し、前記同人確率と、前記参照契約の当事者及び関係者とを出力する処理を実行する。
【選択図】図１４