(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-08-15
(45)【発行日】2022-08-23
(54)【発明の名称】情報処理方法、情報処理プログラム、情報処理装置及び学習モデルの生成方法
(51)【国際特許分類】
G06Q 50/10 20120101AFI20220816BHJP
G06Q 40/08 20120101ALI20220816BHJP
【FI】
G06Q50/10
G06Q40/08
(21)【出願番号】P 2021173453
(22)【出願日】2021-10-22
【審査請求日】2021-10-22
【早期審査対象出願】
(73)【特許権者】
【識別番号】521465614
【氏名又は名称】金子 稔功
(73)【特許権者】
【識別番号】521465625
【氏名又は名称】プレソフト・システム・コンサルティング株式会社
(74)【代理人】
【識別番号】100114557
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】金子 稔功
【審査官】庄司 琴美
(56)【参考文献】
【文献】特開2012-159884(JP,A)
【文献】特開2008-276465(JP,A)
【文献】特開2009-151563(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータが、
基準契約の情報を取得し、
前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得し、
前記基準者と一部の属性項目が一致する前記基準者に類似する参照者を
、当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得し、
前記基準者の属性項目と前記参照者の属性項目との類似度を算出し、
基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、
前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得し、
前記基準契約に含まれる前記基準者以外の当事者又は関係者と、前記参照契約の前記参照者以外の当事者又は関係者との一致度に基づいて、前記同人確率を調整し、
調整後の前記同人確率と、前記参照契約の当事者及び関係者とを出力する
処理を実行することを特徴とする情報処理方法。
【請求項2】
一の前記基準者に対して、複数の前記参照者それぞれの同人確率を算出し、
複数の前記参照者それぞれの前記同人確率と、
前記参照契約の前記当事者及び関係者とを出力する
ことを特徴とする請求項
1に記載の情報処理方法。
【請求項3】
前記参照者それぞれの前記同人確率に基づいて、前記基準者との位置関係が異なる表示態様となるように、前記基準者、並びに、複数の前記参照者及びそれぞれの前記同人確率を出力する
ことを特徴とする請求項
2に記載の情報処理方法。
【請求項4】
前記基準契約の当事者及び関係者を出力する
ことを特徴とする請求項1から請求項
3のいずれか一項に記載の情報処理方法。
【請求項5】
前記基準契約の当事者及び関係者、並びに、前記参照契約の前記当事者及び関係者の中に、同一人物又は同一人物と推定される候補人物が複数含まれている場合、前記同一人物又は前記候補人物であることが視認可能に、出力する
ことを特徴とする請求項4に記載の情報処理方法。
【請求項6】
前記基準者の前記属性項目と前記参照者の前記属性項目との相違を視認可能に、出力する
ことを特徴とする請求項1から請求項5のいずれか一項に記載の情報処理方法。
【請求項7】
前記基準者及び前記参照者が表示された画面において、前記参照者を示すアイコンが、前記基準者の表示領域に移動された場合、前記基準者及び前記参照者の対応付け情報を生成する
ことを特徴とする請求項1から請求項6のいずれか一項に記載の情報処理方法。
【請求項8】
前記対応付け情報を取得し、
前記基準者の属性項目と前記参照者の属性項目とに基づき、前記学習モデルを再学習する
ことを特徴とする請求項7に記載の情報処理方法。
【請求項9】
前記対応付け情報は、前記属性項目それぞれについて、前記基準者の値と前記参照者の値のいずれの値で統一するかの情報を含む
ことを特徴とする請求項7又は請求項8に記載の情報処理方法。
【請求項10】
基準契約の情報を取得し、
前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得し、
前記基準者と一部の属性項目が一致する前記基準者に類似する参照者を
、当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得し、
前記基準者の属性項目と前記参照者の属性項目との類似度を算出し、
基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、
前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得し、
前記基準契約に含まれる前記基準者以外の当事者又は関係者と、前記参照契約の前記参照者以外の当事者又は関係者との一致度に基づいて、前記同人確率を調整し、
調整後の前記同人確率と、前記参照契約の当事者及び関係者とを出力する
処理をコンピュータに行わせることを特徴とする情報処理プログラム。
【請求項11】
基準契約の情報を取得する契約取得部と、
前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得する属性取得部と、
前記基準者と一部の属性項目が一致する前記基準者に類似する参照者を
、当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得する参照属性取得部と、
前記基準者の属性項目と前記参照者の属性項目との類似度を算出する算出部と、
基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得する確率取得部と、
前記基準契約に含まれる前記基準者以外の当事者又は関係者と、前記参照契約の前記参照者以外の当事者又は関係者との一致度に基づいて、前記同人確率を調整する調整部と、
調整後の前記同人確率と、前記参照契約の当事者及び関係者とを出力する出力部と
を備えることを特徴とする情報処理装置。
【請求項12】
基準契約に係る基準者及び該基準者以外の前記基準契約に係る関係者の属性項目を取得し、
前記基準者と同一人物であると判断された参照契約に係る参照者及び該参照者以外の前記参照契約に係る関係者の属性項目を取得し、
前記基準者及び該基準者以外の関係者の属性項目と前記参照者及び該参照者以外の関係者の属性項目との類似度を算出し、
算出した前記類似度を含む訓練データに基づき、基準契約に係る基準者及び該基準
者以外の前記基準契約に係る関係者の属性項目と参照契約に係る参照者及び該参照者以外の前記参照契約に係る関係者の属性項目との類似度を入力した場合に前記基準者と前記参照者とが同一人物である確率を出力する学習モデルを生成する
学習モデルの生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、名寄せ候補となる一組の顧客情報を出力する情報処理方法等に関する。
【背景技術】
【0002】
顧客情報が重複して管理されている場合、購入履歴等が適切に把握できない。そのため、顧客が既に購入している商品・サービスに関するダイレクトメールを送付してしまう不都合が生じることがある。それを防止するために、重複する顧客情報を取りまとめる名寄せが行われている。複数の顧客情報間で含まれる項目が異なる場合に名寄せを行うことは困難である。
【0003】
このような状況に対して、多様なサービスに基づいた情報の名寄せを支援するための情報管理システムが提案されている(特許文献1)。特許文献1に開示の情報管理システムでは、第1、第2サービスサーバから第1、第2ユーザ関連情報を新たに取得した場合、新たに算出した第1スコア及び第2スコアの組み合わせに対して、予測モデルを適用し、同一人物の確からしさを予測する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に開示の情報管理システムは、顧客に新たな取引を提案することを主目的としており、同一人物の確からしさは提示されない。本発明はこのような状況に鑑みてなされたものである。その目的は、同一人物の可能性がある基準者及び参照者の同人確率を出力する情報処理方法等の提供である。
【課題を解決するための手段】
【0006】
本願に開示する情報処理方法は、コンピュータが、基準契約の情報を取得し、前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得し、前記基準者と一部の属性項目が一致する前記基準者に類似する参照者を、当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得し、前記基準者の属性項目と前記参照者の属性項目との類似度を算出し、基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得し、前記基準契約に含まれる前記基準者以外の当事者又は関係者と、前記参照契約の前記参照者以外の当事者又は関係者との一致度に基づいて、前記同人確率を調整し、調整後の前記同人確率と、前記参照契約の当事者及び関係者とを出力する処理を実行することを特徴とする。
【発明の効果】
【0007】
本願の一態様にあっては、同一人物の可能性がある基準者及び参照者の同人確率を確認することが可能となる。
【図面の簡単な説明】
【0008】
【
図1】名寄せシステムの構成例を示す説明図である。
【
図2】APサーバのハードウェア構成例を示すブロック図である。
【
図3】ユーザ端末のハードウェア構成例を示すブロック図である。
【
図12】モデル生成処理の手順例を示すフローチャートである。
【
図13】前処理の手順例を示すフローチャートである。
【
図14】判定処理の手順例を示すフローチャートである。
【
図15】名寄せ処理の手順例を示すフローチャートである。
【
図16】再学習処理の手順例を示すフローチャートである。
【
図21】調整処理の手順例を示すフローチャートである。
【発明を実施するための形態】
【0009】
(実施の形態1)
以下実施の形態を、図面を参照して説明する。
図1は名寄せシステムの構成例を示す説明図である。名寄せシステム100はAPサーバ1及びユーザ端末2を含む。APサーバ1及びユーザ端末2はネットワークNにより、互いに通信可能に接続されている。また、APサーバ1及びユーザ端末2は、ネットワークNを介して、基幹システムDB200にアクセス可能となっている。
【0010】
APサーバ1はサーバコンピュータ、ワークステーション、PC(Personal Computer)等で構成する。また、APサーバ1を複数のコンピュータからなるマルチコンピュータ、ソフトウェアによって仮想的に構築された仮想マシン又は量子コンピュータで構成してもよい。さらに、APサーバ1の機能をクラウドサービスで実現してもよい。
【0011】
ユーザ端末2はノートパソコン、パネルコンピュータ、タブレットコンピュータ、スマートフォン等で構成する。
図2にはユーザ端末2を2台記載しているが、1台であっても3台以上であってもよい。なお、ユーザは名寄せ作業を行う従業員等である。
【0012】
基幹システムDB200は基幹システムのデータベースである。基幹システムDB200は名寄せ処理の対象となる顧客データを記憶している。以下の説明においては、生命保険会社の顧客データを想定する。生命保険契約においては、当事者である契約者以外に、被保険者、保険料の負担者(以下、単に「負担者」という。)、給付金、保険金の受取人(以下、単に「受取人」という。)等の関係者が含まれる。ここで、顧客データは、契約者のデータのみならず、関係者のデータも含むものとする。
【0013】
図2はAPサーバのハードウェア構成例を示すブロック図である。APサーバ1は制御部11、主記憶部12、補助記憶部13、通信部15及び読み取り部16を含む。制御部11、主記憶部12、補助記憶部13、通信部15及び読み取り部16はバスBにより接続されている。
【0014】
制御部11は、一又は複数のCPU(Central Processing Unit)、MPU(Micro-Processing Unit)、GPU(Graphics Processing Unit)等の演算処理装置を有する。制御部11は、補助記憶部13に記憶された制御プログラム1P(プログラム、プログラム製品)を読み出して実行することにより、APサーバ1に係る種々の情報処理、制御処理等を行い、契約取得部、属性取得部、参照属性取得部、算出部、確率取得部、及び、出力部等の機能部を実現する。
【0015】
主記憶部12は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリ等である。主記憶部12は主として制御部11が演算処理を実行するために必要なデータを一時的に記憶する。
【0016】
補助記憶部13はハードディスク又はSSD(Solid State Drive)等であり、制御部11が処理を実行するために必要な制御プログラム1Pや各種DB(Database)を記憶する。補助記憶部13は、顧客DB131、契約DB132、候補組DB133、類似度DB134、判定結果DB135、結果DB136、項目結果DB137、及び、訓練DB138を記憶する。また、補助記憶部13は学習モデル141を記憶する。補助記憶部13はAPサーバ1と別体で外部接続された外部記憶装置であってもよい。補助記憶部13に記憶する各種DB等を、APサーバ1とは異なるデータベースサーバやクラウドストレージに記憶してもよい。
【0017】
通信部15はネットワークNを介して、ユーザ端末2と通信を行う。また、制御部11が通信部15を用い、ネットワークN等を介して他のコンピュータから制御プログラム1Pをダウンロードし、補助記憶部13に記憶してもよい。
【0018】
読み取り部16はCD(Compact Disc)-ROM及びDVD(Digital Versatile Disc)-ROMを含む可搬型記憶媒体1aを読み取る。制御部11が読み取り部16を介して、制御プログラム1Pを可搬型記憶媒体1aより読み取り、補助記憶部13に記憶してもよい。また、半導体メモリ1bから、制御部11が制御プログラム1Pを読み込んでもよい。
【0019】
図3はユーザ端末のハードウェア構成例を示すブロック図である。ユーザ端末2は制御部21、主記憶部22、補助記憶部23、通信部24、入力部25及び表示部26を含む。各構成はバスBで接続されている。
【0020】
制御部21は、一又は複数のCPU、MPU、GPU等の演算処理装置を有する。制御部21は、補助記憶部23に記憶された制御プログラム2P(プログラム、プログラム製品)を読み出して実行することにより、種々の機能を提供する。
【0021】
主記憶部22は、SRAM、DRAM、フラッシュメモリ等である。主記憶部22は主として制御部21が演算処理を実行するために必要なデータを一時的に記憶する。
【0022】
補助記憶部23はハードディスク又はSSD等であり、制御部21が処理を実行するために必要な各種データを記憶する。補助記憶部23はユーザ端末2と別体で外部接続された外部記憶装置であってもよい。補助記憶部23に記憶する各種DB等を、データベースサーバやクラウドストレージに記憶してもよい。
【0023】
通信部24はネットワークNを介して、APサーバ1と通信を行う。また、制御部21が通信部24を用い、ネットワークN等を介して他のコンピュータから制御プログラム2Pをダウンロードし、補助記憶部23に記憶してもよい。
【0024】
入力部25はキーボードやマウスである。表示部26は液晶表示パネル等を含む。表示部26はAPサーバ1が出力した顧客情報などを表示する。また、入力部25と表示部26とを一体化し、タッチパネルディスプレイを構成してもよい。なお、ユーザ端末2は外部の表示装置に表示を行ってもよい。
【0025】
次に、名寄せシステム100が用いるデータベースについて説明する。
図4は顧客DBの例を示す説明図である。顧客DB131は顧客(契約者、関係者を含む)のデータを記憶する。顧客DB131は、顧客番号列、氏名列、フリガナ列、性別列、生年月日列、住所列、及び電話番号列を含む。顧客番号列は顧客を特定可能な顧客番号を記憶する。氏名列は顧客の氏名を記憶する。フリガナ列は顧客氏名のフリガナを記憶する。性別列は顧客の性別を示すアルファベットを記憶する。顧客が男性の場合、性別列はMを記憶する。顧客が女性の場合、性別列はFを記憶する。生年月日列は顧客の生年月日を記憶する。住所列は顧客の住所を記憶する。電話番号列は顧客の電話番号を記憶する。
【0026】
図5は契約DBの例を示す説明図である。契約DB132は保険契約の内容を記憶する。契約DB132は証券番号列、契約者列、被保険者列、負担者列及び受取人列を含む。証券番号列は保険証券に付された証券番号を記憶する。契約者列は保険契約者の顧客番号を記憶する。被保険者列は被保険者の顧客番号を記憶する。負担者列は保険料負担者の顧客番号を記憶する。受取人列は保険金の受取人の情報を記憶する。受取人列は番号列及び顧客列を含む。番号列は受取人の順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。顧客列は受取人の顧客番号を記憶する。
【0027】
顧客DB131及び契約DB132は、マスタデータを基幹システムDB200が保持しておくべきである。したがって、APサーバ1が記憶している顧客DB131及び契約DB132は、基幹システムDB200からコピーしたものであるか、名寄せ用に必要な項目のみを基幹システムDB200からコピーしたものであってもよい。
【0028】
図6は候補組DBの例を示す説明図である。候補組DB133は名寄せの対象となる複数顧客の組み合わせ情報を記憶する。候補組DB133はPID列、基準者列、基準契約列、対象者列、対象契約列を含む。PID列は候補組を特定するPIDを記憶する。基準者列は名寄せの基準とする顧客の情報を記憶する。基準者列は顧客番号列及び立場列を含む。顧客番号列は基準者の顧客番号を記憶する。立場列は基準者の契約における立場を記憶する。立場とは、契約者、被保険者、負担者又は受取人である。基準契約列は基準者に紐付いている保険契約の証券番号を記憶する。対象者列は名寄せの対象となる顧客の情報を記憶する。対象者列は番号列、顧客番号列及び立場列を含む。番号列は対象者の順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。顧客番号列は対象者の顧客番号を記憶する。立場列は対象者の契約における立場を記憶する。対象契約列は対象者に紐付いている保険契約の証券番号を記憶する。
【0029】
図7は類似度DBの例を示す説明図である。類似度DB134は属性項目毎の基準者と対象者との類似度を記憶する。類似度DB134はPID列、番号列、氏名列、フリガナ列、性別列、生年月日列、住所列及び電話番号列を記憶する。PID列は候補組を特定するPIDを記憶する。番号列は対象者の順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。氏名列は、基準者の氏名と対象者の氏名との類似度を記憶する。フリガナ列は、基準者の氏名フリガナと対象者の氏名フリガナとの類似度を記憶する。性別列は、基準者の性別と対象者の性別との類似度を記憶する。性別が一致する場合は1を、一致しない場合は0を、いずれか一方の性別が不明の場合は0.5を、性別列は記憶する。生年月日列は、基準者の生年月日と対象者の生年月日との類似度を記憶する。住所列は、基準者の住所と対象者の住所との類似度を記憶する。電話番号列は、基準者の電話番号と対象者の電話番号との類似度を記憶する。例えば、類似度は、基準者の値と対象者の値とを、Word2Vec又はDoc2Vecによりベクトルで表現し、2つのベクトルのコサイン類似度としてもよい。また、基準者の値と対象者の値とを前方一致の文字列比較を行い、一致する文字列の長さと、全体の文字列の長さとから、類似度を算出してもよい。
【0030】
図8は判定結果DBの例を示す説明図である。判定結果DB135は基準者と対象者とが同一人物であるか否かを、学習モデル141が判定した結果を記憶する。PID列は候補組を特定するPIDを記憶する。基準者列は基準者の情報を記憶する。基準者列は顧客番号列及び立場列を含む。顧客番号列は基準者の顧客番号を記憶する。立場列は基準者が含まれる契約における立場を記憶する。基準契約列は基準者を含む契約の証券番号を記憶する。対象者列は対象者の情報を記憶する。対象者列は番号列、顧客番号列及び立場列を含む。番号列は順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。顧客番号列は対象者の顧客番号を記憶する。立場列は対象者の立場を記憶する。対象契約列は対象者を含む契約の証券番号を記憶する。評価列は評価値を記憶する。評価値は例えば0から100までの値である。0は基準者と対象者とが同一人物である確率は0%であることを示す。100は基準者と対象者とが同一人物である確率は100%であることを示す。
【0031】
図9は結果DBの例を示す説明図である。結果DB136は学習モデル141の判定結果を参考に、ユーザが、基準者と対象者とを同一人物と判断したか否かの判断結果を記憶する。結果DB136はPID列、基準者列、対象者列、評価列及び結果列を含む。PID列は候補組を特定するPIDを記憶する。基準者列は基準者の顧客番号を記憶する。対象者列は対象者の情報を記憶する。対象者列は番号列、顧客番号列及び立場列を含む。番号列は順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。顧客番号列は対象者の顧客番号を記憶する。立場列は対象者の立場を記憶する。評価列は評価値を記憶する。評価値は、判定結果DB135において、PID列の値、及び対象者列の番号列の値が一致するレコードにおける評価列の値と、同一の値を記憶する。結果列は判断結果を記憶する。例えば、ユーザが、基準者と対象者とを同一人物と判断した場合、結果列は○を記憶する。ユーザが、基準者と対象者とを同一人物でないと判断した場合、結果列は×を記憶する。
【0032】
図10は項目結果DBの例を示す説明図である。項目結果DB137は、ユーザが、基準者と対象者とを同一人物と判断した場合において、基準者、対象者の属性項目を、基準者又は対象者の何れの値に統一すると判断したかを記憶する。項目結果DB137はPID列、基準者列、対象者列、氏名列、フリガナ列、性別列、生年月日列、住所列及び電話番号列を含む。PID列は候補組を特定するPIDを記憶する。基準者列は基準者の顧客番号を記憶する。対象者列は対象者の顧客番号を記憶する。氏名列、フリガナ列、性別列、生年月日列、住所列、及び電話番号列は、それぞれ値を、基準者又は対象者の何れの値に統一すると判断したかを記憶する。例えば、ユーザが対象者の値を基準者の値に書き換えると判断した場合、それぞれの列は基準者を記憶する。ユーザが基準者の値を対象者の値に書き換えると判断した場合、それぞれの列は対象者を記憶する。
【0033】
図11は訓練DBの例を示す説明図である。訓練DB138は学習モデル141を生成又は再学習する際に用いる訓練データを記憶する。訓練DB138は番号列、ラベル列、氏名列、フリガナ列、性別列、生年月日列、住所列及び電話番号列を含む。番号列は順番号を記憶する。順番号はレコードを特定のために付しており、番号の順番に特に意味はない。ラベル列は判定の正解値を記憶する。0は同一人物ではないと判定すべきことを示し、1は同一人物であると判定すべきことを示す。氏名列、フリガナ列、性別列、生年月日列、住所列及び電話番号列は、基準者と対象者との項目毎の類似度である。なお、訓練データに含まれる項目は、類似度DB134又は結果DB136より生成可能である。したがって、学習モデル141の利用開始後は、類似度DB134又は結果DB136から、訓練データを作成し、学習モデル141の再学習が可能である。
【0034】
続いて、学習モデル141について説明する。学習モデル141は、例えばCNN(Convolution Neural Network)などのニューラルネットワークである。学習モデル141は項目毎の類似度を受け付ける入力層と、基準者と対象者とが同一人物である確率を出力する出力層と、基準者と対象者との類似度を出力する中間層を有する。
【0035】
入力層は、項目毎の類似度の入力を受け付ける複数のニューロンを有し、入力された類似度を中間層に受け渡す。中間層は複数のニューロンを有し、入力層から入力された項目毎の類似度を畳み込むコンボリューション層と、コンボリューション層で畳み込んだ類似度をマッピングするプーリング層とが交互に連結された構成を有し、基準者と対象者との類似度を出力する。出力層はソフトマックス関数等により、中間層からの類似度を、基準者と対象者とが同一人物である確率に変換して、出力する。学習モデル141は、CNNに限定されず、CNN以外のニューラルネットワーク、ベイジアンネットワーク、決定木など、他の学習アルゴリズムで構築する学習モデルであってもよい。
【0036】
次に、名寄せシステム100が行う情報処理について説明する。
図12はモデル生成処理の手順例を示すフローチャートである。モデル生成処理は学習モデル141を生成する処理である。APサーバ1の制御部11は、訓練DB138から訓練データを1レコード取得する(ステップS1)。制御部11は学習を行う(ステップS2)。制御部11は訓練データに含む項目毎の類似度を入力層に入力し、中間層での演算処理を経て、出力層から基準者と対象者とが同一人物である確率を取得する。確率は、0から1までの範囲の値である。なお、確率は離散値(0又は1)であってもよい。制御部11は、出力層から出力された確率を、訓練データに含むラベルの値、すなわち正解値と比較し、出力層からの出力値が正解値に近づくように、中間層での演算処理に用いるパラメータを最適化する。当該パラメータは、例えばニューロン間の重み(結合係数)、各ニューロンで用いられる活性化関数の係数などである。パラメータの最適化の方法は特に限定されないが、例えば制御部11は誤差逆伝播法を用いて各種パラメータの最適化を行う。制御部11は未処理の訓練データがあるか否かを判定する(ステップS3)。制御部11は未処理の訓練データがあると判定した場合(ステップS3でYES)、処理をステップS1へ戻し、未処理の訓練データを用いて、学習を行う。制御部11は未処理の訓練データがないと判定した場合(ステップS3でNO)、学習により最適化されたパラメータ等を含む学習モデル141を、補助記憶部13に記憶し(ステップS4)、処理を終了する。
【0037】
図13は前処理の手順例を示すフローチャートである。前処理は基準者と対象者との組み合わせを作成する等の準備を行う処理である。まず前提として、基幹システムDB200から、追加又は変更された顧客情報、契約情報を差分データとして、制御部11は取得しているとする。制御部11は差分データの正規化を行う(ステップS11)。例えば、住所に含まれる「永田町1丁目3番5号」との記載形式を、「永田町1-3-5」との記載形式に変更する。電話番号では、「(03)123-4567」との記載形式を、「03-123-4567」との記載形式に変更する。生年月日では、「平成13年9月2日」との記載形式を「2001/09/02」との記載形式に変更する。変更の例はあくまでも一例であり、形式が統一されるのであれば、他の形式でもよい。制御部11は候補組の作成を行う(ステップS12)。候補組は名寄せ対象となる1名の基準者と1又は複数名の対象者との組み合わせである。例えば、制御部11は、顧客情報が追加又は変更された顧客を基準者とする。または、制御部11は追加又は変更された契約情報に含まれる契約当事者や関係者を基準者とする。対象者は顧客DB131を検索して、基準者と所定の項目、例えば名前のフリガナが一致し、生年月日又は性別が一致する顧客とする。制御部11は候補組DB133に候補組を記憶し(ステップS13)、処理を終了する。ステップS12、ステップS13は基準者の数に合わせて繰り返し実行する。
【0038】
図14は判定処理の手順例を示すフローチャートである。判定処理は基準者と対象者とが同一人物であるか否かの判定を行う処理である。制御部11は候補組DB133から一組のデータを取得する(ステップS21)。制御部11は候補組に含まれる基準者の属性と対象者の属性とを、顧客DB131から取得し、項目毎の類似度を算出する(ステップS22)。制御部11は判定を行う(ステップS23)。制御部11は項目毎の類似度を学習モデル141に入力し、学習モデル141が出力した確率を取得する。当該処理を対象者の数に合わせて行う。制御部11は判定結果を判定結果DB135に記憶する(ステップS24)。制御部11は未処理の候補組データがあるか否かを判定する(ステップS25)。制御部11は未処理の候補組データがあると判定した場合(ステップS25でYES)、処理をステップS21へ戻し、未処理の候補組データについての処理を行う。制御部11は未処理の候補組データがないと判定した場合(ステップS25でNO)、処理を終了する。なお、類似度の算出(ステップS22)は、前処理で行ってもよい。
【0039】
なお、前処理及び判定処理は、日次バッチとして行うことを想定している。基幹システムDB200が、日次バッチにより、顧客情報、契約情報の差分データを作成する。差分データの作成された後に、APサーバ1が前処理、判定処理を順に実行すればよい。
【0040】
図15は名寄せ処理の手順例を示すフローチャートである。名寄せ処理は判定結果DB135に基づいて、基準者と参照者との名寄せを行うか、ユーザが判断するための処理である。ユーザはユーザ端末2にて、名寄せ処理の開始操作をする。ユーザ端末2の制御部21は、名寄せの候補組データの要求をAPサーバ1へ送信する(ステップS31)。APサーバ1の制御部11は要求を受信する(ステップS32)。制御部11は未処理の候補組データを選択する(ステップS33)。制御部11は操作画面を生成し、ユーザ端末2へ送信する(ステップS34)。ユーザ端末2の制御部21は画面を受信する(ステップS35)。制御部21は受信した画面を表示する(ステップS36)。ユーザは操作画面を見て、基準者と参照者とを名寄せすべきかを判断し、判断に従った操作を行う。制御部21は操作を受け付ける(ステップS37)。制御部21は受け付けた操作が完了か否かを判定する(ステップS38)。制御部21は受け付けた操作が完了でないと判定した場合(ステップS38でNO)、操作内容を補助記憶部23等に記憶し(ステップS39)、処理をステップS36へ戻す。操作内容は、基準者と参照者のいずれとを名寄せするという指示操作や、名寄せする際、属性値を基準者にあわせるのか、参照者にあわせるのかを属性項目毎に指示する操作である。制御部21は受け付けた操作が完了であると判定した場合(ステップS38でYES)、ユーザの判断結果をAPサーバ1へ送信する(ステップS40)。なお、制御部11は、判断結果を補助記憶部23等に記憶された操作内容に基づいて作成する。APサーバ1の制御部11は判断結果を受信する(ステップS41)。制御部11は判断結果に基づき、再学習用の訓練データを生成する(ステップS42)。制御部11は判断結果を結果DB136と項目結果DB137とに記憶し、訓練データを訓練DB138に記憶し(ステップS43)、処理を終了する。なお、名寄せすべき参照者がなかった場合、項目結果DB137への記憶を、制御部11は行わない。なお、引き続き、ユーザが名寄せ処理を行う場合、ユーザ操作により、再度、名寄せ処理が実行される。項目結果DB137の内容は、基幹システムへ送信され、基幹システムDB200において、データの名寄せが行われる。結果DB136と項目結果DB137とに記憶される判断結果は、対応付け情報の一例である。
【0041】
図16は再学習処理の手順例を示すフローチャートである。APサーバ1の制御部11は再学習用の訓練データを訓練DB138から取得する(ステップS61)。制御部11は訓練データを用いて、学習モデル141の学習を行う(ステップS62)。制御部11は未処理の訓練データがある否かを判定する(ステップS63)。制御部11は未処理の訓練データがあると判定した場合(ステップS63でYES)、処理をステップS61へ戻し、未処理の訓練データによる学習を行う。制御部11は未処理の訓練データがないと判定した場合(ステップS63でNO)、再学習前後の学習モデル141の性能比較を行う(ステップS64)。例えば、再学習前後の学習モデル141へ再学習用の訓練データを入力し、正解率が向上しているかを判定する。制御部11は学習モデル141の性能が改善されているか否かを判定する(ステップS65)。制御部11は学習モデル141の性能が改善されていると判定した場合(ステップS65でYES)、学習モデル141を再学習後のものに更新し(ステップS66)、処理を終了する。制御部11は学習モデル141の性能が改善されていないと判定した場合(ステップS65でNO)、処理を終了する。
【0042】
図17は表示画面例を示す説明図である。表示画面は基準契約情報171、参照契約情報172、173、属性表174を含む。基準契約情報171は基準者が含まれる基準契約の情報である。基準契約情報171には、証券番号並びに、契約者、被保険者、負担者及び受取人の氏名が含まれている。参照契約情報172、173は、参照者が含まれる参照契約の情報である。参照契約情報172、173には、証券番号並びに、契約者、被保険者、負担者及び受取人の氏名が含まれている。属性表174は、基準者及び参照者それぞれの属性項目の相違を視認可能とする表である。
【0043】
図17では、基準者は田中一郎である。参照者のうち、参照契約情報173に含まれる負担者としての田中一郎1731は基準者との同一人物である確率(同人確率)1732が98%と、受取人としての田中一郎1731は同人確率1732が85%と判定されている。
【0044】
図18は名寄せ操作画面の例を示す説明図である。名寄せ操作画面は名寄せ操作を行う画面である。例えば、
図17に示した表示画面を参照して、ユーザが基準者と名寄せする参照者を決めた後、所定の操作を行うと、制御部21は名寄せ操作画面を表示する。名寄せ操作画面では、参照者の同人確率によって、基準者との位置関係が異なるような表示態様としている。
図18では、同人確率が高い参照者ほど、基準者に近い位置に表示している。名寄せ操作画面において、ユーザは、名寄せする参照者アイコン182を基準者アイコン181へドラッグ・アンド・ドロップする。当該操作が、両者を名寄せする指示操作となる。名寄せ操作画面では、参照者の同人確率によって、基準者との位置関係が異なるように表示しているので、参照者間で同人確率の大小が分かりやすくなっている。基準者アイコン181は、基準者の表示領域の一例である。
【0045】
図19は項目設定画面の例を示す説明図である。項目設定画面は基準者と参照者とを名寄せする際に、各属性項目をいずれの者の項目値に統一するかを指定する画面である。方向アイコン191、192を操作して、ユーザは項目毎に値を採用する者を指定する。方向アイコン191は基準者の属性項目を参照者の属性項目に統一することを示す。方向アイコン192は参照者の属性項目を基準者の属性項目に統一することを示す。例えば、次の操作により、ユーザは指示を行う。方向アイコン191をマウスクリックすると、方向アイコン192に切り替わり、方向アイコン192をマウスクリックすると、方向アイコン191に切り替わる。すべての項目について方向が定まったら、ユーザは確定ボタン193を選択する。ユーザが確定ボタン193を選択すると、ユーザ端末2は設定を記憶する。ユーザがキャンセルボタン194を選択すると、項目設定は破棄される。
【0046】
ユーザの操作により、基準者と名寄せする参照者の情報、各属性項目をいずれの者に統一するかの情報が生成される。生成された情報は、判断結果として、ユーザ端末2からAPサーバ1へ送信される。
【0047】
本実施の形態は、次の効果を奏する。基準者と参照者とが同一人物である確率が表示されるので、ユーザは名寄せすべき基準者と参照者との組み合わせを、的確に指定することが可能となる。また、
図17に示した表示画面では、当事者(契約者)に加えて、被保険者、負担者、受取人等の関係者も表示するので、基準者及び参照者の情報だけ以外の当事者又は関係者を見て、ユーザは基準者と参照者とが同一人物であるかを判断可能である。さらに、
図17の属性表174を参照することにより、ユーザは基準者と参照者とが同一人物であるかを判断可能である。
図18に示した名寄せ操作画面、
図19に示した項目設定画面により、ユーザは名寄せの指示を直感的な操作により行えるので、操作ミスの発生を抑制することが可能となる。
【0048】
(実施の形態2)
本実施の形態は、基準者と対象者とが同一人物であるか否かの判定において、基準契約と対象契約との比較を行う形態である。以下の説明においては、実施の形態1と同様な内容は可能な限り省略し、実施の形態1と異なる内容を主として説明する。
【0049】
本実施の形態では、基準者が含まれる基準契約と、対象者が含まれる対象契約との比較において、基準者又は対象者以外の当事者又は関係者同士の一致度をみる。そして、基準者又は対象者以外に、基準契約と対象契約とで同一人物が含まれている場合、基準者と対象者との同人確率を調整する。
図20は調整の例を示す説明図である。
図20Aは従来の基準者と対象者との比較のみの場合を示す。
図20Bは基準者又は対象者以外の当事者又は関係者同士を比較する場合を示す。
図20において住所として記憶されているものは3つであり、数字で示している。電話番号は03が固定電話の番号が記憶されていることを示し、090は携帯電話の番号が記憶されていることを示す。
【0050】
図20Aにおいて、基準者と対象者とでは、住所が異なり電話番号も異なっている。基準者の電話番号は固定電話のものであり、対象者の電話番号は携帯電話のものである。そのため電話番号が大きく異なることから、基準者及び対象者の同人確率は55%と判定されている。
図20Bにおいて、基準契約の被保険者と対象契約の被保険者とは、同じ田中花子である。顧客IDが一致することから、両契約の田中花子は同一人物である。そこで、同人確率は55%から92%となるように、調整されている。
【0051】
図21は調整処理の手順例を示すフローチャートである。調整処理は、
図14に示した判定処理において、ステップS23とS24との間に実行する。APサーバ1の制御部11は候補組に含まれる基準契約及び対象契約の情報を取得する(ステップS81)。制御部11は候補組に含まれる基準契約及び対象契約のそれぞれの証券番号をキーにして契約DB132を検索し、基準契約に含まれる当事者及び関係者の情報と、対象契約に含まれる当事者及び関係者の情報とを取得する。制御部11は基準者と対象者とを除いた両契約の当事者及び関係者を対比する(ステップS82)。制御部11は、両契約間で同一人物が含まれているか否かを判定する(ステップS83)。例えば、両契約間で顧客IDが同一の人物が含まれている場合、ステップS83でYESとなる。制御部11は、両契約間で同一人物が含まれていると判定した場合(ステップS83でYES)、同人確率を調整し(ステップS84)、処理を終了する。例えば、同人確率に所定の係数を掛ける、同人確率に所定の値を加える、予め用意したテーブルを用いて同人確率を更新する、等の処理を調整として行う。なお、調整により、同人確率は調整前よりも大きな値となる。両契約間で含まれる同一人物の数により、調整幅を変えてもよい。制御部11は、両契約間で同一人物が含まれていないと判定した場合(ステップS83でNO)、処理を終了する。
【0052】
上述においては、学習モデル141の判定結果を、基準契約と対象契約との比較結果により調整したが、それに限らない。学習モデル141への入力として、基準契約に含まれる基準者以外の関係者の情報、及び、対象契約に含まれる対象者以外の関係者の情報を含めてよい。この場合、訓練データにも、基準者以外の関係者の情報、及び、対象者以外の関係者の情報を含め、学習モデル141を生成又は再学習する。基準者と対象者とが同一人物であるか否かを学習モデル141に判定させる際にも、基準者以外の関係者の情報、及び、対象者以外の関係者の情報を入力として含める。
【0053】
本実施の形態は、実施の形態1が奏する効果に加えて、以下の効果を奏する。基準者が含まれる基準契約と、対象者が含まれる対象契約とを比較し、基準者と対象者とを除いた両契約の当事者及び関係者の間に、同一人物が含まれる場合、基準者及び対象者の同人確率を増加させる。それによって、ユーザは基準者及び対象者が同一人物であることを、確信を持って判断することが可能となる。
【0054】
各実施の形態で記載されている技術的特徴(構成要件)はお互いに組み合わせ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0055】
100 システム
200 基幹システムDB
1 APサーバ
11 制御部
12 主記憶部
13 補助記憶部
131 顧客DB
132 契約DB
133 候補組DB
134 類似度DB
135 判定結果DB
136 結果DB
137 項目結果DB
138 訓練DB
141 学習モデル
15 通信部
16 読み取り部
1P 制御プログラム
1a 可搬型記憶媒体
1b 半導体メモリ
2 ユーザ端末
B バス
N ネットワーク
【要約】
【課題】同一人物であると思われる基準者及び参照者の同人確率を出力する情報処理方法等を提供すること。
【解決手段】情報処理方法は、コンピュータが、基準契約の情報を取得し、前記基準契約の情報から、前記基準契約の当事者及び関係者から選択された基準者の属性項目を取得し、前記基準者に類似する参照者を当事者又は関係者として含む参照契約の情報から前記参照者の属性項目を取得し、前記基準者の属性項目と前記参照者の属性項目との類似度を算出し、基準者の属性項目と参照者の属性項目との類似度を入力した場合、前記基準者と前記参照者とが同一人物である確率を示す同人確率を出力する学習モデルへ、算出した類似度を入力し、前記学習モデルが出力した前記基準者及び前記参照者の同人確率を取得し、前記同人確率と、前記参照契約の当事者及び関係者とを出力する処理を実行する。
【選択図】
図14