(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】特表2021-504782(P2021-504782A)
(43)【公表日】2021年2月15日
(54)【発明の名称】人工知能基盤の保険金不当請求の探知装置及び方法
(51)【国際特許分類】
G06Q 40/08 20120101AFI20210118BHJP
【FI】
G06Q40/08
【審査請求】有
【予備審査請求】未請求
【全頁数】26
(21)【出願番号】特願2020-526088(P2020-526088)
(86)(22)【出願日】2018年11月23日
(11)【特許番号】特許第6821885号(P6821885)
(45)【特許公報発行日】2021年1月27日
(85)【翻訳文提出日】2020年5月22日
(86)【国際出願番号】KR2018014539
(87)【国際公開番号】WO2019107840
(87)【国際公開日】20190606
(31)【優先権主張番号】10-2017-0162069
(32)【優先日】2017年11月29日
(33)【優先権主張国】KR
(81)【指定国】
AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DJ,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JO,JP,KE,KG,KH,KN,KP,KW,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT,TZ
(71)【出願人】
【識別番号】520146732
【氏名又は名称】ワイセイテック カンパニー リミテッド
(74)【代理人】
【識別番号】110000877
【氏名又は名称】龍華国際特許業務法人
(72)【発明者】
【氏名】キム、ジ ヒョク
(72)【発明者】
【氏名】リー、ジ ヒョン
【テーマコード(参考)】
5L055
【Fターム(参考)】
5L055BB61
(57)【要約】
保険金不当請求の探知装置及び方法が開示される。本願の一実施例による保険金不当請求の探知装置は、保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部とを含むことができる。
【特許請求の範囲】
【請求項1】
保険金不当請求の探知装置において、
保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、
前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、
前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部とを含む保険金不当請求の探知装置。
【請求項2】
前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録するデータベースをさらに含み、
前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである請求項1に記載の保険金不当請求の探知装置。
【請求項3】
前記不当請求探知部は、
前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築するものである請求項1に記載の保険金不当請求の探知装置。
【請求項4】
新規パターン分析部をさらに含み、
前記新規パターン分析部は、
前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する不当請求パターン分類部と、
指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する判別模型構築部と、
前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する新規パターン判別部とを含むものである請求項1に記載の保険金不当請求の探知装置。
【請求項5】
前記不当請求パターン分類部は、
前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、
前記請求パターンの群集間分離度に基づいて前記新規パターンを検出するものである請求項4に記載の保険金不当請求の探知装置。
【請求項6】
前記不当請求パターン分類部は、
前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類するものである請求項5に記載の保険金不当請求の探知装置。
【請求項7】
前記不当請求パターン分類部は、
前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定するものである請求項6に記載の保険金不当請求の探知装置。
【請求項8】
前記判別模型構築部は、
前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築するものである請求項7に記載の保険金不当請求の探知装置。
【請求項9】
前記新規パターン判別部は、
前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである請求項8に記載の保険金不当請求の探知装置。
【請求項10】
保険金不当請求の探知方法において、
保険請求内訳データを定型化して特質変数を導出する段階と、
前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する段階と、
前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する段階とを含む保険金不当請求の探知方法。
【請求項11】
前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録する段階をさらに含み、
前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである請求項10に記載の保険金不当請求の探知方法。
【請求項12】
前記不当請求探知模型を構築する段階は、
前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築するものである請求項10に記載の保険金不当請求の探知方法。
【請求項13】
新規パターンを分析する段階をさらに含み、
前記新規パターンを分析する段階は、
前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する段階と、
指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する段階と、
前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する段階とを含むものである請求項12に記載の保険金不当請求の探知方法。
【請求項14】
前記不当請求の新規パターンを分類する段階は、
前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、
前記請求パターンの群集間分離度に基づいて前記新規パターンを検出するものである請求項13に記載の保険金不当請求の探知方法。
【請求項15】
前記不当請求の新規パターンを分類する段階は、
前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類するものである請求項14に記載の保険金不当請求の探知方法。
【請求項16】
前記不当請求の新規パターンを分類する段階は、
前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定するものである請求項15に記載の保険金不当請求の探知方法。
【請求項17】
前記新規パターン判別模型を構築する段階は、
前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築するものである請求項16に記載の保険金不当請求の探知方法。
【請求項18】
前記パターン類型を判別する段階は、
前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである請求項17に記載の保険金不当請求の探知方法。
【請求項19】
請求項10から18のいずれか一項の方法をコンピュータで実行するためのプログラムを記録したコンピュータで読取可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、人工知能基盤の保険金不当請求の探知装置及び方法に関する。
【背景技術】
【0002】
既存の保険詐欺防止システムは、ビジネスルールを基盤として請求された保険事件に対して、審査者の経験と知識を土台としてルールを導出する方法で、調査対象ルールと調査対象除外ルールとに区分して算出している。しかし、保険詐欺は益々知能化及び高度化されるにつれて新しい不当請求パターンまたは詐欺パターンに対する持続的な更新が必要である。
【0003】
また、保険会社は、保険詐欺に対して何らの措置も取らないまま保険金詐取を放置することもできず、保険詐欺を完全に明かすという目的の下で無限大の調査費用を出費することもできない。そこで、保険会社は、保険詐欺により詐取される保険金を減らす一方、過度に多い調査費用を出費しない適正な程度で調査努力の水準を決める必要がある。
【0004】
本願の背景となる技術は、特許文献1に開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】韓国登録特許公報第10−0862181号
【発明の概要】
【発明が解決しようとする課題】
【0006】
本願は、前述した従来技術の問題点を解決するためのもので、保険金請求の不当請求を判別することができる探知模型を提供する人工知能基盤の保険金不当請求の探知装置及び方法を提供することを目的とする。
【0007】
本願は、前述した従来技術の問題点を解決するためのもので、保険金請求関連データを学習して新規の請求件に対する不当を判別する人工知能基盤の保険金不当請求の探知装置及び方法を提供することを目的とする。
【0008】
但し、本願の実施例が達成しようとする技術的課題は、上記のような技術的課題に限定されず、また他の技術的課題が存在し得る。
【0009】
但し、本願の実施例が達成しようとする技術的課題は、上記のような技術的課題に限定されず、さらに他の技術的課題が存在し得る。
【課題を解決するための手段】
【0010】
上記の技術的課題を達成するための技術的手段として、本願の一実施例による保険金不当請求の探知装置は、保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部とを含むことができる。
【0011】
本願の一実施例によると、前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録するデータベースをさらに含み、前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むことができる。
【0012】
本願の一実施例によると、前記不当請求探知部は、前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築することができる。
【0013】
本願の一実施例によると、新規パターン分析部をさらに含み、前記新規パターン分析部は、前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する不当請求パターン分類部と、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する判別模型構築部と、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する新規パターン判別部とを含むことができる。
【0014】
本願の一実施例によると、前記不当請求パターン分類部は、前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、前記請求パターンの群集間分離度に基づいて前記新規パターンを検出することができる。
【0015】
本願の一実施例によると、前記不当請求パターン分類部は、前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類することができる。
【0016】
本願の一実施例によると、前記不当請求パターン分類部は、前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定することができる。
【0017】
本願の一実施例によると、前記判別模型構築部は、前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築することができる。
【0018】
本願の一実施例によると、前記新規パターン判別部は、前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別することができる。
【0019】
本願の一実施例による保険金不当請求の探知方法は、保険請求内訳データを定型化して特質変数を導出する段階、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する段階及び前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する段階を含むことができる。
【0020】
本願の一実施例によると、前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録する段階をさらに含み、前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むことができる。
【0021】
本願の一実施例によると、前記不当請求探知模型を構築する段階は、前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築することができる。
【0022】
本願の一実施例によると、新規パターンを分析する段階をさらに含み、前記新規パターンを分析する段階は、前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する段階と、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する段階と、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する段階とを含むことができる。
【0023】
本願の一実施例によると、前記不当請求の新規パターンを分類する段階は、前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、前記請求パターンの群集間分離度に基づいて前記新規パターンを検出することができる。
【0024】
本願の一実施例によると、前記不当請求の新規パターンを分類する段階は、前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類することができる。
【0025】
本願の一実施例によると、前記不当請求の新規パターンを分類する段階は、前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定することができる。
【0026】
本願の一実施例によると、前記新規パターン判別模型を構築する段階は、前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築することができる。
【0027】
本願の一実施例によると、前記パターン類型を判別する段階は、前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別することができる。
【0028】
上述した課題解決手段は、単に例示的なもので、本願を制限しようとする意図で解釈されてはならない。上述した例示的な実施例の他にも、図面及び発明の詳細な説明に追加の実施例が存在し得る。
【発明の効果】
【0029】
前述した本願の課題解決手段によると、保険金請求の不当請求を判別することができる探知模型を提供する人工知能基盤の保険金不当請求の探知装置及び方法を提供することができる。
【0030】
本願は、前述した従来技術の問題点を解決するためのもので、保険金請求関連データを学習して新規請求件に対する不当を判別する人工知能基盤の保険金不当請求の探知装置及び方法を提供することができる。
【図面の簡単な説明】
【0031】
【
図1】本願の一実施例による保険金不当請求の探知装置の構成を図示した図面である。
【
図2】本願の一実施例による保険金不当請求の探知装置の新規パターン分析部の構成を図示した図面である。
【
図3】本願の一実施例による保険金不当請求の探知装置の新規パターン検出の例を図示した図面である。
【
図4】本願の一実施例による保険金不当請求の探知装置の類似パターングループ分類の例を図示した図面である。
【
図5】本願の一実施例による保険金不当請求の探知装置の不当請求探知模型の評価指標を図示した図面である。
【
図6】本願の一実施例による保険金不当請求の探知装置のアルゴリズム間性能比較を図示した図面である。
【
図7】本願の一実施例による保険金不当請求の探知装置のアルゴリズム間安定性及び柔軟性を比較した図面である。
【
図8】本願の一実施例による保険金不当請求の探知装置のDeep Learningアルゴリズムで構築された不当請求探知模型を図示した図面である。
【
図9】本願の一実施例による保険金不当請求の探知方法の流れを図示した図面である。
【
図10】本願の一実施例による保険金不当請求の探知方法の新規不当請求パターン分析の流れを図示した図面である。
【発明を実施するための形態】
【0032】
以下では、添付の図面を参照して本願が属する技術分野で通常の知識を有する者が容易に実施することができるように、本願の実施例を詳しく説明する。しかし、本願は、様々な異なる形態で具現されることができ、ここで説明する実施例に限定されない。そして、図面で本願を明確に説明するために、説明と関係ない部分は省略し、明細書全体を通じて類似した部分については類似した図面符号をつけた。
【0033】
本願明細書全体において、ある部分が他の部分と「連結」されているとすると、これは「直接的に連結」されている場合だけでなく、その中間に他の素子を挟んで「電気的に連結」されている場合も含む。
【0034】
本願明細書全体において、ある部材が他の部材「上に」、「上部に」、「上端に」、「下に」、「下部に」、「下端に」位置しているとすると、これは、ある部材が他の部材に接している場合だけでなく、二つの部材間にまた他の部材が存在する場合も含む。
【0035】
本願明細書全体において、ある部分がある構成要素を「含む」とすると、これは、特に反対の記載がない限り、他の構成要素を除外するのではなく、他の構成要素をさらに含むことができることを意味する。
【0036】
図1は、本願の一実施例による保険金不当請求の探知装置の構成を図示した図面である。
【0037】
図1を参照すると、保険金不当請求の探知装置100は、データ前処理部110、不当請求探知部120、不当請求判断部130、新規パターン分析部140及びデータベース150を含むことができる。データ前処理部110は、保険請求内訳データを定型化して特質変数を導出することができる。
【0038】
後述する説明は、保険金の不当請求だけでなく、補助金、支援金、保証金などの不当請求を含むことは自明であるが、説明の便宜のために、保険金不当請求を中心として説明する。前記保険請求内訳データは、例示として、保険金を請求した請求データ、保険または補助金関連の契約データ、保険金の支給データ、保険設計士データ、顧客データ及び保険詐欺摘発結果データの少なくともいずれか一つを含むことができる。データ前処理部110は、前記保険請求内訳データを定型化して特質変数を導出することができる。保険請求内訳データの定型化は例えば、顧客データの場合、顧客の所得水準、顧客が訪問した病院の数、顧客が申請した疾病事由の個数などを数値化することを意味する。また、データ前処理部110によって導出される特質変数は、保険金請求と関連して数値化された値を有することができる変数であり、例えば、顧客ID番号、保険詐欺者であるか否か、同一病名で重複申請した個数、契約締結年月個数、一日最大契約個数、支払い承認された証券個数、支払い申請した証券個数、顧客が締結した証券個数、保障性保険の請求回数、信用等級の変化量、加入した契約の種類、類義病院訪問の総回数、顧客が申請した疾病事由の個数、顧客が会った医者の人数、顧客が訪問した病院の個数、有効入/通院の総日数、診療科目個数、顧客所得水準、FP(Financial Planner)の変更回数、実損処理個数、詐欺FP契約個数の少なくともいずれか一つを含むことができる。データベース150は、保険請求内訳データ、前記特質変数及び正常請求データの少なくともいずれか一つを記録することができる。
【0039】
不当請求探知部120は、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築することができる。指導学習とは、予め構築された学習用データ(training data)を活用してモデルを学習することを意味する。前記不当請求探知部120は、前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築することができる。例示として、前記分類/予測アルゴリズムは、Random Forestアルゴリズム、SVM(support vector machine)アルゴリズム、Extra Treeアルゴリズム、XG Boostアルゴリズム、及びDeep Learningアルゴリズムの少なくともいずれか一つを含むことができる。Random Forestアルゴリズムは、数多くのDecision TreeがForestを構成してそれぞれの予測結果を一つの結果変数として平均化するアルゴリズムであり、SVMアルゴリズムは、データの分布空間で最も大幅の境界を区分してデータが属する分類を判断する非確率的アルゴリズムである。Extra Treeアルゴリズムは、Random forestと類似しているが、速度がRandom forestに比べて速いアルゴリズムであり、XGBoostアルゴリズムは、Random ForestのTreeは独立であることに対し、XGBoostのTreeの結果を次のツリーに適用するboost方式のアルゴリズムである。Deep Learningアルゴリズムは、多層構造のNeural Networkを基盤として変数のパターンが結果に及ぶ影響を加重値で調節しながら学習するアルゴリズムである。
【0040】
前記不当請求探知模型は、前記特質変数及び正常請求データを入力として不当請求探知結果を出力することができる。例示として、不当請求探知模型は、特質変数と正常請求データ間の類似度に基づいて不当請求探知結果を出力することができる。前記類似度が予め設定された閾値未満であれば、特質変数と連携された保険請求を正常として判断し、前記類似度が予め設定された閾値以上であれば、特質変数と連携された保険請求を不当請求として判断することができる。前記類似度は、K−meansクラスターリングアルゴリズム、SOM(Self−Organizing−Maps)アルゴリズム、EM&Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムによって演算されることができる。K−meansクラスターリングアルゴリズムは、伝統的な分類技法として、対象集団を距離の平均値(類似度)を基準としてK個の群集に繰り返し細分化する技法であり、SOMアルゴリズムは、人工神経網を基盤として訓練集合の入力パターンを加重値で学習して群集化する技法である。また、EM&Canopyアルゴリズムは、与えられた初期値で可能性が最大のものから繰り返し過程を通じてパラメーター値を更新して群集化する技法を意味する。不当請求探知部120は、入力による出力の導出を繰り返して行うことで不当請求探知模型の正確度を向上させることができる。
【0041】
不当請求判断部130は、不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断することができる。不当請求探知部120によって構築された不当請求探知模型に新しい新規保険請求内訳が入力されれば、前述したように類似度に基づいて新規保険請求内訳が不当であるか否かが判断されることができる。
【0042】
図2は、本願の一実施例による保険金不当請求の探知装置の新規パターン分析部の構成を図示した図面である。
【0043】
本願の一実施例による保険金不当請求の探知装置は、不当請求の新しいパターン、即ち、新規パターンを分析して新しい保険請求(新規請求)のパターン類型を決定することができる。
図2を参照すると、新規パターン分析部140は、不当請求パターン分類部141、判別模型構築部142及び新規パターン判別部143を含むことができる。不当請求パターン分類部141は、特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類することができる。非指導学習とは、学習用データを構築するものではなく、データ自体を分析するか群集しながら学習するアルゴリズムを意味する。これは公知された事項であるため、具体的な説明は省略する。不当請求パターン分類部141は、保険請求内訳データの頻度に基づいて特質変数を複数個の請求パターンに群集することができる。例示として、不当請求パターン分類部141は、K−meansクラスターリングアルゴリズム、SOM(Self−Organizing−Maps)アルゴリズム、EM&Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムに基づいて不当請求の新規パターンを分類することができる。
【0044】
図3は、本願の一実施例による保険金不当請求の探知装置の新規パターン検出の例を図示した図面である。
【0045】
図3は、特質変数の頻度によって群集された請求パターンを示し、互いに異なる請求パターンに属した特質変数の頻度が類似した場合、
図3に示すように、同一または類似した色(青色)で区分されることができる。即ち、請求パターン相互間の色が同一または類似した場合、群集間の分離度が低いと言える。また、特質変数間で類似した頻度で群集された請求パターンは、正常な保険請求により発生する特質変数の頻度に基づいて群集された請求パターン、即ち、不当請求ではなく正常な請求パターンであると判断することができる。
【0046】
一方、類似した頻度を有する特質変数と異なる頻度を有する特質変数で群集された請求パターンの場合、
図3に示すように、前述した請求パターンとは異なる色(赤色)で区分されることができる。このような請求パターンは、正常な請求パターンの特質変数の頻度とは異なるため(例えば、FP変更回数が正常な請求パターンの特質変数に比べて相対的に多い場合)、不当請求の新規パターンであることができ、不当請求パターン分類部141によって検出されることができる。
【0047】
図4は、本願の一実施例による保険金不当請求の探知装置の類似パターングループ分類の例を図示した図面である。
【0048】
不当請求パターン分類部141は、新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類することができる。新規パターン相互間の類似度は、前述した群集アルゴリズムに基づいて演算されることができるため、重複する説明は省略する。
図4は、新規パターン相互間の類似度に基づいて7個の類似パターングループに分類された例を図示する。前記類似パターングループの数は、新規パターン相互間の類似度によって変化することができることは自明である。また、不当請求パターン分類部141は、前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定することができる。例示として、前記危険水準は、
図4に示すように、注意群、低危険群、中危険群及び高危険群に区分されることができるが、これに限定されるものではない。即ち、高危険群として分類されたパターングループの場合、閾値以上の特質変数が多い新規パターンを含むパターングループである可能性が高いと言える。
【0049】
判別模型構築部142は、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築することができる。指導学習とは、予め構築された学習用データ(training data)を活用してモデルを学習することを意味する。また、意思決定アルゴリズムとは、例えば、Decision Treeアルゴリズムであることができるが、これに限定されるものではない。
【0050】
判別模型構築部142は、危険水準が設定されたパターングループに分類された前記請求パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習することができる。また、判別模型構築部130は、新規パターン判別規則を含む新規不当請求パターン判別模型を構築することができる。前述した非指導学習基盤の新規パターン分類は、単純に頻度に基づいて新規パターンを分類することはできるが、いずれの変数によって分類されたかは分からない。従って、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別規則を学習することができる。
【0051】
前記新規パターン判別規則とは、閾値以上の特質変数に基づいて請求パターンを新規パターンとして判別することができる規則を意味する。また、このような新規パターン判別規則を総合して判別模型構築部142によって新規パターン判別模型として構築されることができる。前記高危険群として設定されたパターングループの新規パターンは、予め設定された閾値以上の特質変数を有する確率が他の危険群に比べて相対的に高いことは自明である。しかし、低危険群のパターングループであるとしても、不当請求の余地がある特質変数(即ち、予め設定された閾値以上の特質変数)を有する確率がなくはないため、全ての危険水準別のパターングループに含まれた新規パターンを入力として新規パターン判別規則が学習されることができる。また、新規パターン判別規則の学習は、特質変数の重要度が考慮されることができる。すなわち、多様な特質変数の中でも不当請求の危険性が高い特質変数の場合、相対的に高い重要度を有することができ、新規パターン判別規則の学習時にこのような特質変数の重要度が考慮されることができる。例えば、特質変数の中で類義病院訪問の総回数は、顧客が会った医者の人数より高い重要度が付与されることができる。判別模型構築部142は、特質変数の重要度を考慮することで、より正確な新規パターン判別模型を構築することができる。
【0052】
新規パターン判別部143は、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別することができる。新規パターン判別部143は、新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別することができる。換言すると、構築された新規パターン判別模型に新規請求の特質変数を入力して、正常で判断された請求パターンであるか、不当請求で判断されたパターンであるか、新しい不当請求の新規パターンであるか、パターンの類型を判別することができる。また、前記新規請求が不当請求として判断されたパターン及び不当請求の新規パターンとして判断された場合、不当請求判断の要因(すなわち、特質変数)として作用した特質変数を検出することができる。例示として、新規請求の中で健康保険の分布が多数であり、受診者の年齢が20代中盤であり、女性が多数という特質変数である時に、初診診察及び再診診察が高い分布を示す場合、留意すべき不当請求のパターンとして判断されることができる。また、初診に比べて再診の割合が相対的に高い場合、治療、施術、手術前の不当請求のパターンとして判断することができる。
【0053】
図5は、本願の一実施例による保険金不当請求の探知装置の不当請求探知模型の評価指標を図示した図面である。
【0054】
不当請求探知模型は、模型構築に基盤となる分類/予測アルゴリズムによってその性能が左右される。
図5を参照すると、不当請求探知模型の評価指標は、Accuracy(正確度)、Precison(精密度)、Recall(再現率)を使用するが、実際の不当請求探知ではY Recallの向上に重点を置く。Accuracy(正確度)は、不当請求探知模型が探知した結果と実際の結果が一致する正探知の割合で(TP(True Positive)+TN(True Negative))/Totalで表すことができ、100に近いほど良い指標であると解釈されることができる。Precison(精密度)は、不当請求探知模型が不当であると探知した結果の中で、実際の結果も不当である正探割合で(TP)/(TP+FP(False Positive))で表すことができ、1−Precisonで誤探率を表すことができる。
【0055】
Recall(再現率)は、全体の不当請求の中で不当請求探知模型が不当請求であると正確に探知した正探割合で(TP)/(TP+FN(False Negative))で表すことができ、1−Recallで未探率を表すことができる。
【0056】
図6は、本願の一実施例による保険金不当請求の探知装置のアルゴリズム間性能比較を図示した図面である。
【0057】
図6は、Random Forestアルゴリズム、SVMアルゴリズム、Extra Treeアルゴリズム及びXFBoostアルゴリズムでそれぞれ構築された不当請求探知模型に高危険群のパターングループと連携された特質変数を入力として出力される結果を比較した図面である。各アルゴリズムで構築された不当請求探知模型の高い正確度も重要であるが、実際の不当請求を探知することができるY Recallをより重要に考慮すれば、Random Forestアルゴリズム及びExtra Treeアルゴリズムで構築された不当請求探知模型が他のアルゴリズムに比べて相対的に優れた性能を表すことを確認することができる。
【0058】
図7は、本願の一実施例による保険金不当請求の探知装置のアルゴリズム間安定性及び柔軟性を比べた図面である。
【0059】
図7のaは、Random Forestアルゴリズムで構築された不当請求探知模型を図式化した図面であり、
図7のbは、Deep Learningアルゴリズムで構築された不当請求探知模型を図式化した図面である。Random Forestアルゴリズムで構築された不当請求探知模型は、条件を基準として分類する方式、例えば、「a*請求金額+b*医者数+c*受診数」を基準として判定するか、請求金額>a、医者数>b、受診数>cであれば「異常」(すなわち、不当請求)と分類する方式である。Deep Learningアルゴリズムで構築された不当請求探知模型は、異常(不当請求)状態に該当する(請求金額、医者数、受診数)の組み合わせを探し出す方式であり、Deep LearningアルゴリズムのConvolutional Neural Network(CNN)はイメージ処理に適合し、Recurrent Neural Network(RNN)は時系列処理に適合した特性がある。Random Forestアルゴリズムで構築された不当請求探知模型は、線形関係を有する変数を知られた規則に適用するのに適合するが、連関変数が多くなればむしろ正確性が落ちるという短所がある一方、Deep Learningアルゴリズムで構築された不当請求探知模型は、変数の組み合わせをパターンとして学習して新しいパターンを自ら発見し、如何なるパターンに対しても異常可能性を算出可能であり、多くの変数を対象として正確度の高い予測を行うことができるという特徴がある。従って、Deep Learningアルゴリズムで構築された不当請求探知模型がRandom Forestアルゴリズムで構築された不当請求探知模型より安定性と柔軟性が高いと言える。
【0060】
一方、Deep Learningアルゴリズムは、学習の個数、即ち、入力によって出力を算出する繰り返しの数が少ない場合、その性能が低下し得る。例示として、高危険群のパターングループと連携された特質変数の数は、他の危険群のパターングループと連携された特質変数の数より相対的に少ないことがある。このような場合、Deep Learningアルゴリズムで構築された不当請求探知模型は不当を判別する性能が低下し得る。従って、不当請求探知部120は、特質変数の数が予め設定された数未満の場合、Under Samplingを通じて不当の割合を高めることで、Deep Learningアルゴリズムで構築された不当請求探知模型のY Recallを向上させることができる。
【0061】
図8は、本願の一実施例による保険金不当請求の探知装置のDeep Learningアルゴリズムで構築された不当請求探知模型を図示した図面である。
【0062】
図8を参照すると、Deep Learningアルゴリズムで構築された不当請求探知模型は、前述したように学習が十分に行われていない場合、その性能が明確に発揮されない一方、学習が繰り返されるほど性能が向上されるという特徴がある。また、Deep LearningアルゴリズムのHidden Layerの構造によって性能の差異が大きく変わるため、多様なLayer構造を有する不当請求探知模型を構築することで、Deep Learningアルゴリズムで構築された不当請求探知模型の性能を最適化することができる。
【0063】
図9は、本願の一実施例による保険金不当請求の探知方法の流れを図示した図面であり、
図10は、本願の一実施例による保険金不当請求の探知方法の新規不当請求パターン分析の流れを図示した図面である。
【0064】
図9及び
図10に示した新規不当請求パターン分析方法は、上述した
図1〜
図8を通じて説明された保険金不当請求の探知装置によって行われることができる。従って、以下で省略された内容であるとしても、
図1〜
図8を通じて保険金不当請求の探知装置について説明された内容は、
図9及び
図10にも同様に適用されることができる。
【0065】
図9を参照すると、段階S910においてデータ前処理部110は前記保険請求内訳データを定型化して特質変数を導出することができる。前記保険請求内訳データは、例示として、保険金を請求した請求データ、保険または補助金関連契約データ、保険金の支給データ、保険設計士データ、顧客データ及び保険詐欺摘発結果データの少なくともいずれか一つを含むことができる。保険請求内訳データの定型化は、例えば、顧客データの場合、顧客の所得水準、顧客が訪問した病院の数、顧客が申請した疾病事由の個数などを数値化することを意味する。データベース150は、保険請求内訳データ、前記特質変数及び正常請求データの少なくともいずれか一つを記録することができる。
【0066】
段階S920において、不当請求探知部120は、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築することができる。前記不当請求探知部120は、前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築することができる。例示として、前記分類/予測アルゴリズムは、Random Forestアルゴリズム、SVM(support vector machine)アルゴリズム、Extra Treeアルゴリズム、XG Boostアルゴリズム及びDeep Learningアルゴリズムの少なくともいずれか一つを含むことができる。
【0067】
前記不当請求探知模型は、前記特質変数及び正常請求データを入力として不当請求探知結果を出力することができる。例示として、不当請求探知模型は、特質変数と正常請求データ間の類似度に基づいて不当請求探知結果を出力することができる。前記類似度が予め設定された閾値未満であれば特質変数と連携された保険請求を正常として判断し、前記類似度が予め設定された閾値以上であれば特質変数と連携された保険請求を不当請求として判断することができる。前記類似度は、K−meansクラスターリングアルゴリズム、SOM(Self−Organizing−Maps)アルゴリズム、EM&Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムによって演算されることができる。
【0068】
段階S930において、不当請求判断部130は、不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断することができる。不当請求探知部120によって構築された不当請求探知模型に新しい新規保険請求内訳が入力されれば、前述したように、類似度に基づいて新規保険請求内訳が不当であるか否かが判断されることができる。
【0069】
図10を参照して新規不当請求パターン分析の流れを説明すると、段階S1010において、データ前処理部110は、保険請求内訳データを定型化して特質変数を導出することができる。これは、前述した段階S910で説明したデータ前処理部110と同様に理解されることができるため、重複する説明は省略する。
【0070】
段階S1020において、不当請求パターン分類部141は、特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類することができる。不当請求パターン分類部141は、保険請求内訳データの頻度に基づいて特質変数を複数個の請求パターンに群集することができる。例示として、不当請求パターン分類部141は、K−meansクラスターリングアルゴリズム、SOM(Self−Organizing−Maps)アルゴリズム、EM&Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムに基づいて不当請求の新規パターンを分類することができる。不当請求パターン分類部141は、前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集することができる。即ち、請求パターンは、同質性のある特質変数の群集であることができる。また、請求パターンの群集間の分離度、即ち、群集間距離に基づいて前記新規パターンを検出することができる。
【0071】
また、不当請求パターン分類部141は、新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類することができる。新規パターン相互間の類似度は、前述した群集アルゴリズムに基づいて演算されることができるため、重複する説明は省略する。
【0072】
段階S1030において、判別模型構築部142は、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築することができる。指導学習とは、予め構築された学習用データ(training data)を活用してモデルを学習することを意味する。また、意思決定アルゴリズムとは、例えば、Decision Treeアルゴリズムであることができるが、これに限定されるものではない。判別模型構築部130は、危険水準が設定されたパターングループに分類された前記請求パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習することができる。また、判別模型構築部142は、新規パターン判別規則を含む新規不当請求パターン判別模型を構築することができる。新規パターン判別規則の学習は、特質変数の重要度が考慮されることができる。すなわち、多様な特質変数の中でも不当請求の危険性が高い特質変数の場合、相対的に高い重要度を有することができ、新規パターン判別規則の学習時にこのような特質変数の重要度が考慮されることができる。例えば、特質変数の中で類義病院訪問の総回数は顧客が会った医者の人数より高い重要度が付与されることができる。判別模型構築部142は、特質変数の重要度を考慮することで、より正確な新規パターン判別模型を構築することができる。
【0073】
段階S1040において、新規パターン判別部143は、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別することができる。新規パターン判別部143は、新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別することができる。換言すると、構築された新規パターン判別模型に新規請求の特質変数を入力して、正常として判断された請求パターンであるか、不当請求として判断されたパターンであるか、新しい不当請求の新規パターンであるか、パターンの類型を判別することができる。また、前記新規請求が不当請求として判断されたパターン及び不当請求の新規パターンとして判断された場合、不当請求判断の要因(すなわち、特質変数)として作用した特質変数を検出することができる。
【0074】
本願の一実施例によると、保険金不当請求の探知方法は、多様なコンピュータ手段を通じて行われることができるプログラム命令形態で具現されて、コンピュータ読取可能な媒体に記録されることができる。前記コンピュータ読取可能媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。前記媒体に記録されるプログラム命令は、本発明のために特別に設計されて構成されたものであってもよく、コンピュータソフトウェア当業者に公知されて使用可能なものであってもよい。コンピュータ読取可能記録媒体の例としては、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体(magnetic media)、CD−ROM、DVDのような光記録媒体(optical media)、フロプティカルディスク(floptical disk)のような磁気−光媒体(magneto−optical media)、及びロム(ROM)、ラム(RAM)、フラッシュメモリーなどのようなプログラム命令を格納し行うように特別に構成されたハードウェア装置が含まれる。プログラム命令の例としては、コンパイラによって作られるような機械語コードだけでなく、インタプリターなどを使用してコンピュータによって実行されることができる高級言語コードを含む。上記のハードウェア装置は、本発明の動作を行うために一つ以上のソフトウェアモジュールとして作動するように構成されることができ、その反対の場合も同様である。
【0075】
前述した本願の説明は、例示のためのものであり、本願が属する技術分野の通常の知識を有する者は、本願の技術的思想や必須的な特徴を変更せずに他の具体的な形態に容易に変形可能なことが理解できるであろう。従って、以上で記述した実施例は、全ての面で例示的なものであり、限定的なものではないと理解すべきである。例えば、単一型で説明されている各構成要素は、分散して実施してもよく、同様に、分散して説明されている構成要素も、結合した形態で実施してもよい。
【0076】
本願の範囲は、上記詳細な説明よりも後述する特許請求の範囲によって表され、特許請求の範囲の意味及び範囲、並びにその均等概念から導出される全ての変更又は変形された形態が本願の範囲に含まれると解釈されるべきである。
【手続補正書】
【提出日】2020年5月22日
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
保険金不当請求の探知装置において、
保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、
前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、
前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部と、
前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する不当請求パターン分類部、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する判別模型構築部及び前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する新規パターン判別部を含む新規パターン分析部とを含み、
前記不当請求探知部は、
前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築し、
前記不当請求パターン分類部は、
前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、
前記請求パターンの群集間分離度に基づいて前記新規パターンを検出し、
前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類し、
前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定し、
前記特質変数は、保険金請求と関連して数値化された値を有することができる変数であり、前記特質変数は、同一病名で重複申請した個数及び顧客が申請した疾病事由の個数を含むものである、保険金不当請求の探知装置。
【請求項2】
前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録するデータベースをさらに含み、
前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである請求項1に記載の保険金不当請求の探知装置。
【請求項3】
前記判別模型構築部は、
前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築するものである請求項1または2に記載の保険金不当請求の探知装置。
【請求項4】
前記新規パターン判別部は、
前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである請求項3に記載の保険金不当請求の探知装置。
【請求項5】
保険金不当請求の探知方法において、
データ前処理部が保険請求内訳データを定型化して特質変数を導出する段階と、
不当請求探知部が前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する段階と、
不当請求判断部が前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する段階と、
新規パターン分析部が前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類し、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築し、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する段階とを含み、
前記不当請求探知模型を構築する段階は、
前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築し、
前記新規請求のパターン類型を判別する段階は、
前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、
前記請求パターンの群集間分離度に基づいて前記新規パターンを検出し、
前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類し、
前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定し、
前記特質変数は、保険金請求と関連して数値化された値を有することができる変数であり、前記特質変数は、同一病名で重複申請した個数及び顧客が申請した疾病事由の個数を含むものである、保険金不当請求の探知方法。
【請求項6】
前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録する段階をさらに含み、
前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである請求項5に記載の保険金不当請求の探知方法。
【請求項7】
前記新規パターン判別模型を構築する段階は、
前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築するものである請求項5または6に記載の保険金不当請求の探知方法。
【請求項8】
前記パターン類型を判別する段階は、
前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである請求項7に記載の保険金不当請求の探知方法。
【請求項9】
請求項5から8のいずれか一項の方法をコンピュータに実行させるためのプログラム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0076
【補正方法】変更
【補正の内容】
【0076】
本願の範囲は、上記詳細な説明よりも後述する特許請求の範囲によって表され、特許請求の範囲の意味及び範囲、並びにその均等概念から導出される全ての変更又は変形された形態が本願の範囲に含まれると解釈されるべきである。
[項目1]
保険金不当請求の探知装置において、
保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、
上記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、
上記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部とを含む保険金不当請求の探知装置。
[項目2]
上記保険請求内訳データ、上記特質変数及び上記正常請求データの少なくともいずれか一つを記録するデータベースをさらに含み、
上記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである項目1に記載の保険金不当請求の探知装置。
[項目3]
上記不当請求探知部は、
上記指導学習基盤の分類/予測アルゴリズムに基づいて上記不当請求探知模型を構築するものである項目1に記載の保険金不当請求の探知装置。
[項目4]
新規パターン分析部をさらに含み、
上記新規パターン分析部は、
上記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する不当請求パターン分類部と、
指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する判別模型構築部と、
上記新規パターン判別模型に基づいて新規請求のパターン類型を判別する新規パターン判別部とを含むものである項目1に記載の保険金不当請求の探知装置。
[項目5]
上記不当請求パターン分類部は、
上記特質変数の頻度に基づいて上記群集アルゴリズムを通じて上記特質変数を複数個の請求パターンに群集し、
上記請求パターンの群集間分離度に基づいて上記新規パターンを検出するものである項目4に記載の保険金不当請求の探知装置。
[項目6]
上記不当請求パターン分類部は、
上記新規パターン相互間の類似度に基づいて上記新規パターンを複数個の類似パターングループに分類するものである項目5に記載の保険金不当請求の探知装置。
[項目7]
上記不当請求パターン分類部は、
上記新規パターンのそれぞれと連携された特質変数の中で上記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて上記パターングループの危険水準を設定するものである項目6に記載の保険金不当請求の探知装置。
[項目8]
上記判別模型構築部は、
上記危険水準別に上記パターングループに含まれた上記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、上記新規パターン判別規則を含む上記新規パターン判別模型を構築するものである項目7に記載の保険金不当請求の探知装置。
[項目9]
上記新規パターン判別部は、
上記新規パターン判別規則に基づいて上記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである項目8に記載の保険金不当請求の探知装置。
[項目10]
保険金不当請求の探知方法において、
保険請求内訳データを定型化して特質変数を導出する段階と、
上記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する段階と、
上記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する段階とを含む保険金不当請求の探知方法。
[項目11]
上記保険請求内訳データ、上記特質変数及び上記正常請求データの少なくともいずれか一つを記録する段階をさらに含み、
上記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである項目10に記載の保険金不当請求の探知方法。
[項目12]
上記不当請求探知模型を構築する段階は、
上記指導学習基盤の分類/予測アルゴリズムに基づいて上記不当請求探知模型を構築するものである項目10に記載の保険金不当請求の探知方法。
[項目13]
新規パターンを分析する段階をさらに含み、
上記新規パターンを分析する段階は、
上記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する段階と、
指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する段階と、
上記新規パターン判別模型に基づいて新規請求のパターン類型を判別する段階とを含むものである項目12に記載の保険金不当請求の探知方法。
[項目14]
上記不当請求の新規パターンを分類する段階は、
上記特質変数の頻度に基づいて上記群集アルゴリズムを通じて上記特質変数を複数個の請求パターンに群集し、
上記請求パターンの群集間分離度に基づいて上記新規パターンを検出するものである項目13に記載の保険金不当請求の探知方法。
[項目15]
上記不当請求の新規パターンを分類する段階は、
上記新規パターン相互間の類似度に基づいて上記新規パターンを複数個の類似パターングループに分類するものである項目14に記載の保険金不当請求の探知方法。
[項目16]
上記不当請求の新規パターンを分類する段階は、
上記新規パターンのそれぞれと連携された特質変数の中で上記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて上記パターングループの危険水準を設定するものである項目15に記載の保険金不当請求の探知方法。
[項目17]
上記新規パターン判別模型を構築する段階は、
上記危険水準別に上記パターングループに含まれた上記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、上記新規パターン判別規則を含む上記新規パターン判別模型を構築するものである項目16に記載の保険金不当請求の探知方法。
[項目18]
上記パターン類型を判別する段階は、
上記新規パターン判別規則に基づいて上記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである項目17に記載の保険金不当請求の探知方法。
[項目19]
項目10から18のいずれか一項の方法をコンピュータで実行するためのプログラムを記録したコンピュータで読取可能な記録媒体。
【国際調査報告】