IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ワイセイテック カンパニー リミテッドの特許一覧

特許7009658人工知能基盤の悪質延滞探知装置及び方法
<>
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図1
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図2
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図3
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図4
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図5
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図6a
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図6b
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図6c
  • 特許-人工知能基盤の悪質延滞探知装置及び方法 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-14
(45)【発行日】2022-01-25
(54)【発明の名称】人工知能基盤の悪質延滞探知装置及び方法
(51)【国際特許分類】
   G06Q 40/02 20120101AFI20220118BHJP
【FI】
G06Q40/02
【請求項の数】 9
(21)【出願番号】P 2020567125
(86)(22)【出願日】2019-11-11
(65)【公表番号】
(43)【公表日】2022-01-11
(86)【国際出願番号】 KR2019015258
(87)【国際公開番号】W WO2020111571
(87)【国際公開日】2020-06-04
【審査請求日】2021-06-21
(31)【優先権主張番号】10-2018-0147550
(32)【優先日】2018-11-26
(33)【優先権主張国・地域又は機関】KR
【早期審査対象出願】
(73)【特許権者】
【識別番号】520146732
【氏名又は名称】ワイセイテック カンパニー リミテッド
(74)【代理人】
【識別番号】110000877
【氏名又は名称】龍華国際特許業務法人
(72)【発明者】
【氏名】キム、ジ ヒョク
(72)【発明者】
【氏名】リー、ジ ヒョン
(72)【発明者】
【氏名】チョ、アラ
【審査官】塩田 徳彦
(56)【参考文献】
【文献】米国特許出願公開第2017/0200164(US,A1)
【文献】韓国公開特許第10-2017-0079161(KR,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
人工知能基盤の悪質延滞探知装置において、
レンタル費納付内訳データから特質変数を算出するデータ前処理部と、
前記特質変数を入力とする異常探知アルゴリズムに基づいて正常パターン及び延滞パターンを検出するパターン検出部と、
前記正常パターン及び延滞パターンを入力とする非指導学習基盤の群集アルゴリズムに基づいてレンタル費納付の新規パターンを分類する新規パターン分類部と、
前記正常パターン、前記延滞パターン及び前記新規パターンを入力とするパターン判別モデルを構築して、新規悪質延滞者の悪質パターンを検出する新規納付パターン検出部と、
を含み、
前記パターン検出部は、
前記異常探知アルゴリズムに基づいて、レンタル費納付の正常納付及び延滞に対応する特質変数から正常納付及び悪性延滞のそれぞれの正常値及び異常値を検出し、
前記異常値に対応する特質変数の頻度に基づいて異常群集を検出し、前記異常群集に基づいて前記正常パターン及び延滞パターンを検出し、
前記新規パターン分類部は、
前記群集アルゴリズムに基づいて前記正常パターン及び延滞パターンを群集し、前記正常パターン及び延滞パターンの群集間分離度に基づいて前記レンタル費納付の新規パターンを分類し、
前記正常パターン、前記延滞パターン及び前記新規パターンを入力とする指導学習基盤の分類アルゴリズムに基づいてパターン判別モデルを構築して、前記悪質パターンを検出し、
前記パターン判別モデルは、レンタル費納付の新規パターン及び既分類されたレンタル費納付パターンを入力とする意思決定アルコリズムに基づいて学習されたパターン探知規則を含むものである、人工知能基盤の悪質延滞探知装置。
【請求項2】
前記レンタル費納付内訳データ、前記特質変数及び前記新規パターンの少なくともいずれか一つを記録するデータベースをさらに含み、
前記レンタル費納付内訳データは、取引先コード、延滞有無、法人区分、債券移管有無、休廃業区分、運営年数、総契約件数、延滞履歴件数、最長延滞月数などのデータの少なくともいずれか一つを含むものである、請求項1に記載の人工知能基盤の悪質延滞探知装置。
【請求項3】
前記特質変数及び前記レンタル費納付内訳データを入力とする指導学習基盤の悪質延滞者探知モデルを構築して、顧客が悪質延滞者に該当するか否かを予測する悪質延滞者予測部をさらに含むものである、請求項1または2に記載の人工知能基盤の悪質延滞探知装置。
【請求項4】
前記悪質延滞者予測部は、
前記特質変数と正常納付データとの間の類似度に基づいて悪質延滞者に該当するか否かの探知結果を算出するものである、請求項に記載の人工知能基盤の悪質延滞探知装置。
【請求項5】
人工知能基盤の悪質延滞探知方法において、
(a)レンタル費納付内訳データから特質変数を算出する段階と、
(b)前記特質変数を入力とする異常探知アルゴリズムに基づいて正常パターン及び延滞パターンを検出する段階と、
(c)前記正常パターン及び延滞パターンを入力とする非指導学習基盤の群集アルゴリズムに基づいてレンタル費納付の新規パターンを分類する段階と、
(d)前記正常パターン、前記延滞パターン及び前記新規パターンを入力とするパターン判別モデルを構築して、新規悪質延滞者の悪質パターンを検出する段階と、
を含み、
前記(b)段階は、
前記異常探知アルゴリズムに基づいて、レンタル費納付の正常納付及び延滞に対応する特質変数から正常納付及び悪性延滞のそれぞれの正常値及び異常値を検出し、
前記異常値に対応する特質変数の頻度に基づいて異常群集を検出し、前記異常群集に基づいて前記正常パターン及び延滞パターンを検出し、
前記(c)段階は、
前記群集アルゴリズムに基づいて前記正常パターン及び延滞パターンを群集し、前記正常パターン及び延滞パターンの群集間分離度に基づいて前記レンタル費納付の新規パターンを分類し、
前記正常パターン、前記延滞パターン及び前記新規パターンを入力とする指導学習基盤の分類アルゴリズムに基づいてパターン判別モデルを構築して、前記悪質パターンを検出し、
前記パターン判別モデルは、レンタル費納付の新規パターン及び既分類されたレンタル費納付パターンを入力とする意思決定アルコリズムに基づいて学習されたパターン探知規則を含むものである、人工知能基盤の悪質延滞探知方法。
【請求項6】
前記レンタル費納付内訳データ、前記特質変数及び前記新規パターンの少なくともいずれか一つを記録する段階をさらに含み、
前記レンタル費納付内訳データは、取引先コード、延滞有無、法人区分、債券移管有無、休廃業区分、運営年数、総契約件数、延滞履歴件数、最長延滞月数などのデータの少なくともいずれか一つを含むものである、請求項に記載の人工知能基盤の悪質延滞探知方法。
【請求項7】
(e)前記特質変数及び前記レンタル費納付内訳データを入力とする指導学習基盤の悪質延滞者探知モデルを構築して、顧客が悪質延滞者に該当するか否かを予測する段階をさらに含むものである、請求項5または6に記載の人工知能基盤の悪質延滞探知方法。
【請求項8】
前記(e)段階は、
前記特質変数と正常納付データとの間の類似度に基づいて悪質延滞者に該当するか否かの探知結果を算出するものである、請求項に記載の人工知能基盤の悪質延滞探知方法。
【請求項9】
請求項からのいずれか一項の方法をコンピュータで実行するためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、人工知能基盤の悪質延滞探知装置及び方法に関する。
【背景技術】
【0002】
既存の保険詐欺防止システムは、ビジネスルール基盤として請求された保険事件に対して、審査者の経験と知識を土台としてルールを導出する方法で、調査対象ルールと調査対象外ルールとに区分して算出している。しかし、保険詐欺は益々知能化及び高度化されるにつれて新しい不当請求パターンまたは詐欺パターンに対する持続的な更新が必要であり、そこで、不当請求及び不当パターンの探知システムが開発された。
【0003】
また、保険会社だけでなく、多様な業種で各種の詐欺問題または悪質顧客問題が発生しており、各会社は、このような問題に対して何らの措置も取らないまま費用漏れを放置することもできず、問題点を完全に明かすという目的下で無限大の調査費用を出費することもできない。そこで、各会社は、当該分野で発生し得る上記のような問題から無駄な出費を減らす一方、過度に多い調査費用を出費しない適正な程度で調査努力の水準を決める必要がある。
【0004】
本願の背景になる技術は、特許文献1として開示されている。
【先行技術文献】
【特許文献】
【0005】
【文献】韓国登録特許公報第10-0862181号
【発明の概要】
【発明が解決しようとする課題】
【0006】
本願は、前述した従来技術の問題点を解決するためのもので、悪質延滞のデータを学習して新しい悪質延滞のパターンを分析し、新規件に対する悪質延滞パターンの類型を判別することができる人工知能基盤の悪質延滞探知装置及び方法を提供することを目的とする。
【0007】
但し、本願の実施例が達成しようとする技術的課題は、上記のような技術的課題に限定されず、また他の技術的課題が存在し得る。
【課題を解決するための手段】
【0008】
上記の技術的課題を達成するための技術的手段として、本願の一実施例による人工知能基盤の悪質延滞探知装置は、レンタル費納付内訳データから特質変数を算出するデータ前処理部と、前記特質変数を入力とする異常探知アルゴリズムに基づいて正常パターン及び延滞パターンを検出するパターン検出部と、前記正常パターン及び延滞パターンを入力とする非指導学習基盤の群集アルゴリズムに基づいてレンタル費納付の新規パターンを分類する新規パターン分類部と、前記正常パターン、前記延滞パターン及び前記新規パターンを入力とするパターン判別モデルを構築して、新規悪質延滞者の悪質パターンを検出する新規納付パターン検出部とを含むことができる。
【0009】
本願の一実施例によると、前記レンタル費納付内訳データ、前記特質変数及び前記新規パターンの少なくともいずれか一つを記録するデータベースをさらに含み、前記レンタル費納付内訳データは、取引先コード、延滞有無、法人区分、債券移管有無、休廃業区分、運営年数、総契約件数、延滞履歴件数、最長延滞月数などのデータの少なくともいずれか一つを含むことができる。
【0010】
本願の一実施例によると、前記パターン検出部は、前記異常探知アルゴリズムに基づいて、レンタル費納付の正常納付及び延滞に対応する特質変数から正常値及び異常値を検出し、前記異常値に対応する特質変数の頻度に基づいて異常群集を検出することができる。
【0011】
本願の一実施例によると、前記パターン検出部は、前記異常群集に基づいて前記正常パターン及び延滞パターンを検出することができる。
【0012】
本願の一実施例によると、前記新規パターン分類部は、前記群集アルゴリズムに基づいて前記正常パターン及び延滞パターンを群集し、前記正常パターン及び延滞パターンの群集間分離度に基づいて前記レンタル費納付の新規パターンを分類することができる。
【0013】
本願の一実施例によると、前記新規納付パターン検出部は、前記正常パターン、前記延滞パターン及び前記新規パターンを入力とする指導学習基盤の分類アルゴリズムに基づいてパターン判別モデルを構築して、前記悪質パターンを検出することができる。
【0014】
本願の一実施例によると、前記特質変数及び前記レンタル費納付データを入力とする指導学習基盤の悪質延滞者探知モデルを構築して、顧客が悪質延滞者に該当するか否かを予測する悪質延滞者予測部をさらに含むことができる。
【0015】
本願の一実施例によると、前記悪質延滞者予測部は、前記特質変数と正常納付データとの間の類似度に基づいて悪質延滞者に該当するか否かの探知結果を算出することができる。
【0016】
本願の一実施例による人工知能基盤の悪質延滞探知方法は、(a)レンタル費納付内訳データから特質変数を算出する段階と、(b)前記特質変数を入力とする異常探知アルゴリズムに基づいて正常パターン及び延滞パターンを検出する段階と、(c)前記正常パターン及び延滞パターンを入力とする非指導学習基盤の群集アルゴリズムに基づいてレンタル費納付の新規パターンを分類する段階と、(d)前記正常パターン、前記延滞パターン及び前記新規パターンを入力とするパターン判別モデルを構築して、新規悪質延滞者の悪質パターンを検出する段階とを含むことができる。
【0017】
本願の一実施例によると、人工知能基盤の悪質延滞探知方法は、前記レンタル費納付内訳データ、前記特質変数及び前記新規パターンの少なくともいずれか一つを記録する段階をさらに含み、前記レンタル費納付内訳データは、取引先コード、延滞有無、法人区分、債券移管有無、休廃業区分、運営年数、総契約件数、延滞履歴件数、最長延滞月数などのデータの少なくともいずれか一つを含むことができる。
【0018】
本願の一実施例によると、前記(b)段階は、前記異常探知アルゴリズムに基づいて、レンタル費納付の正常納付及び延滞に対応する特質変数から正常値及び異常値を検出し、前記異常値に対応する特質変数の頻度に基づいて異常群集を検出することができる。
【0019】
本願の一実施例によると、前記(b)段階は、前記異常群集に基づいて前記正常パターン及び延滞パターンを検出することができる。
【0020】
本願の一実施例によると、前記(c)段階は、前記群集アルゴリズムに基づいて前記正常パターン及び延滞パターンを群集し、前記正常パターン及び延滞パターンの群集間分離度に基づいて前記レンタル費納付の新規パターンを分類することができる。
【0021】
本願の一実施例によると、前記(d)段階は、前記正常パターン、前記延滞パターン及び前記新規パターンを入力とする指導学習基盤の分類アルゴリズムに基づいてパターン判別モデルを構築して、前記悪質パターンを検出することができる。
【0022】
本願の一実施例によると、人工知能基盤の悪質延滞探知方法は、(e)前記特質変数及び前記レンタル費納付データを入力とする指導学習基盤の悪質延滞者探知モデルを構築して、顧客が悪質延滞者に該当するか否かを予測する段階をさらに含むことができる。
【0023】
本願の一実施例によると、前記(e)段階は、前記特質変数と正常納付データとの間の類似度に基づいて悪質延滞者に該当するか否かの探知結果を算出することができる。
【0024】
上述した課題解決手段は、単に例示的なもので、本願を制限しようとする意図で解釈されてはならない。上述した例示的な実施例の他にも、図面及び発明の詳細な説明に追加の実施例が存在し得る。
【発明の効果】
【0025】
前述した本願の課題解決手段によると、悪質延滞のデータを学習して新しい悪質延滞のパターンを分析し、新規件に対する悪質延滞パターン類型を判別することができる人工知能基盤の悪質延滞探知装置及び方法を提供することができる。
【図面の簡単な説明】
【0026】
図1】本願の一実施例による人工機能基盤の悪質延滞探知装置の構成を図示した図面である。
【0027】
図2】本願の一実施例による人工知能基盤の悪質延滞探知装置の特質変数間の相関関係例を図示した図面である。
【0028】
図3】本願の一実施例による人工知能基盤の悪質延滞探知装置の異常探知アルゴリズムの探知結果を図示した図面である。
【0029】
図4】本願の一実施例による人工知能基盤の悪質延滞探知装置の群集アルゴリズムによって分類されたパターンを図示した図面である。
【0030】
図5】本願の一実施例による人工知能基盤の悪質延滞探知装置の悪質延滞者探知モデルのアルゴリズム別性能を図示した図面である。
【0031】
図6a】本願の一実施例による人工知能基盤の悪質延滞探知装置のパターン探知規則例を図示した図面である。
【0032】
図6b】本願の一実施例による人工知能基盤の悪質延滞探知装置のパターン探知規則例を図示した図面である。
【0033】
図6c】本願の一実施例による人工知能基盤の悪質延滞探知装置のパターン探知規則例を図示した図面である。
【0034】
図7】本願の一実施例による人工知能基盤の悪質延滞探知方法の流れを図示した図面である。
【発明を実施するための形態】
【0035】
以下では、添付の図面を参照して本願が属する技術分野で通常の知識を有する者が容易に実施することができるように、本願の実施例を詳しく説明する。しかし、本願は、様々な異なる形態で具現されることができ、ここで説明する実施例に限定されない。そして、図面で本願を明確に説明するために、説明と関係ない部分は省略し、明細書全体を通じて類似した部分については類似した図面符号をつけた。
【0036】
本願明細書全体において、ある部分が他の部分と「連結」されているとすると、これは「直接的に連結」されている場合だけでなく、その中間に他の素子を挟んで「電気的に連結」されている場合も含む。
【0037】
本願明細書全体において、ある部材が他の部材「上に」、「上部に」、「上端に」、「下に」、「下部に」、「下端に」位置しているとすると、これは、ある部材が他の部材に接している場合だけでなく、二つの部材間にまた他の部材が存在する場合も含む。
【0038】
本願明細書全体において、ある部分がある構成要素を「含む」とすると、これは、特に反対の記載がない限り、他の構成要素を除外するのではなく、他の構成要素をさらに含むことができることを意味する。
【0039】
図1は、本願の一実施例による人工機能基盤の悪質延滞探知装置の構成を図示した図面である。
【0040】
図1を参照すると、人工知能基盤の悪質延滞探知装置100は、データ前処理部110、パターン検出部120、新規パターン分類部130、新規納付パターン検出部140、悪質延滞者予測部150、及びデータベース160を含むことができる。
【0041】
後述する説明は、レンタル費の悪質延滞だけでなく、リース費、貸出金、償還金などの悪質延滞を含むことは自明であるが、説明の便宜のために、レンタル費の悪質延滞を中心として説明する。前記レンタル費納付内訳データは、例示として、取引先コード、延滞有無、法人区分、債券移管有無、休廃業区分、運営年数、総契約件数、延滞履歴件数、最長延滞月数などのデータの少なくともいずれか一つを含むことができる。
【0042】
図2は、本願の一実施例による人工知能基盤の悪質延滞探知装置の特質変数間の相関関係例を図示した図面である。
【0043】
データ前処理部110は、レンタル費納付内訳データから特質変数を算出することができる。具体的に、データ前処理部110は、レンタル費納付内訳データを定型化して特質変数を導出することができる。レンタル費納付内訳データの定形化は、例えば、休廃業区分、運営年数、総契約件数、正常契約履歴、進行契約件数などを数値化、範疇化することを意味する。また、データ前処理部110によって導出される特質変数は、レンタル費納付と関連して数値化された値を有することができる変数であり、例えば、延滞有無、法人区分、債券移管有無、休廃業区分、運営年数、総契約件数、正常契約履歴件数、進行契約件数、最長延滞月数、最大延長回数、総請求金額、総収納金額、総延滞金額、一般管理の否定的応答有無、一般管理の通話履歴数、該当月データの少なくともいずれか一つを含むことができる。図2を参照すると、前記特質変数間の相関関係が高いほどパターン検出部120によって延滞パターンとして検出される確率が高いといえる。データベース160は、前記レンタル費納付内訳データ、前記特質変数及び前記新規パターンの少なくともいずれか一つを記録することができる。
【0044】
図3は、本願の一実施例による人工知能基盤の悪質延滞探知装置の異常探知アルゴリズムの探知結果を図示した図面である。
【0045】
パターン検出部120は、特質変数を入力とする異常探知アルゴリズムに基づいて正常パターン及び延滞パターンを検出することができる。前記異常探知アルゴリズムは、全体データ、即ち、レンタル費納付内訳データの平均的な特性に合わない少数の異常データを探知するアルゴリズムを意味する。
【0046】
パターン検出部120は、異常探知アルゴリズムに基づいてレンタル費納付パターンの正常納付及び悪質延滞に対応する特質変数から正常値及び異常値を検出することができる。また、パターン検出部120は、異常値に対応する特質変数の頻度に基づいて異常群集を検出することができる。例示として、異常探知アルゴリズムは、アイソレーションフォレスト(Isolation Forest)アルゴリズムを含むことができ、アイソレーションフォレストアルゴリズムは、ツリー基盤で異常データを孤立させることで、異常群集を探知することができる。例示として、アイソレーションフォレストアルゴリズムを利用した正常値及び異常値探知の正確度は、89%の性能を表す。
【0047】
具体的に、パターン検出部120は、異常探知アルゴリズムによって探知された少数の群集を異常群集として検出することができる。また、パターン検出部120は、異常群集に基づいて正常パターン及び延滞パターンを検出することができる。レンタル費納付の場合、延滞の割合が正常納付の割合より小さいため、異常探知アルゴリズムを通じて異常データを孤立させることができる。即ち、パターン検出部120は、異常群集を延滞パターンとして検出し、異常群集に属しない群集を正常パターンとして検出することができる。図3を参照すると、パターン検出部120は、異常探知アルゴリズムを通じてレンタル費納付パターンの正常納付及び悪質延滞のそれぞれの正常値と異常値を検出することができる。具体的に、レンタル費納付の悪質延滞は、既存の延滞パターンの場合は正常値として探知されることができる一方、悪質延滞の異常値は、悪質延滞の新しいパターンである可能性が高い。
【0048】
図4は、本願の一実施例による人工知能基盤の悪質延滞探知装置の群集アルゴリズムによって分類されたパターンを図示した図面である。
【0049】
図4の(a)は、正常パターンの群集を図示し、図4の(b)は、異常パターンの群集を図示する。図4を参照すると、新規パターン分類部130は、前記正常パターン及び延滞パターンを入力とする非指導学習基盤の群集アルゴリズムに基づいてレンタル費納付の新規パターンを分類することができる。非指導学習とは、学習用データを構築するものではなく、データ自体を分析するか群集しながら学習するアルゴリズムを意味する。これは公知された事項であるため、具体的な説明は省略する。新規パターン分類部130は、群集アルゴリズムに基づいて前記正常パターン及び延滞パターンを群集することができる。また、新規パターン分類部130は、前記正常パターン及び延滞パターンの群集間分離度に基づいて前記レンタル費納付の新規パターンを分類することができる。
【0050】
例示として、前記非指導学習のための群集アルゴリズムには、K-Neighborsアルゴリズム、ランダムフォレストアルゴリズム、GradientBosstingアルゴリズム、SVM(Support Vector Machine)アルゴリズム、意思決定アルゴリズム及び群集アルゴリズムが利用されることができる。また、新規パターン分類部130は、上述したアルゴリズムの他にもExtra Treeアルゴリズム、XG Boostアルゴリズム及びDeep Learningアルゴリズム、K-means クラスタリングアルゴリズム、SOM(Self-Organizing-Maps)アルゴリズム、EM & Canopyアルゴリズムのような群集アルゴリズムを通じて非指導学習を行うことができる。Random Forestアルゴリズムは、数多くのDecision TreeがForestを構成してそれぞれの予測結果を一つの結果変数で平均するアルゴリズムであり、SVMアルゴリズムは、データの分布空間で最も大きい幅の境界を区分してデータが属する分類を判断する非確率的アルゴリズムである。Extra Treeアルゴリズムは、Random forestと類似しているが、速度がRandom forestに比べて速いアルゴリズムであり、XGBoostアルゴリズムは、Random ForestのTreeは独立し、XGBoostのTreeの結果を次のツリーに適用するboost方式のアルゴリズムである。Deep Learningアルゴリズムは、多層構造のNeural Networkを基盤として変数のパターンが結果に及ぼす影響を加重値で調節しながら学習するアルゴリズムである。また、K-meansクラスタリングアルゴリズムは、伝統的な分類技法で対象集団を距離の平均値(類似度)を基準としてK個の群集に繰り返し細分化する技法であり、SOMアルゴリズムは、人工神経網を基盤として訓練集合の入力パターンを加重値で学習して群集化する技法である。また、EM & Canopyアルゴリズムは、与えられた初期値で可能性が最大なものから繰り返し過程を通じてパラメータ値を更新して群集化する技法を意味する。
【0051】
新規パターン分類部130は、前記群集アルゴリズムを通じて前記正常パターン及び延滞パターンを複数個のパターン群集に細分化することができる。パターン群集は、同質性のある特質変数の群集であり、群集間分離度、即ち、群集間距離に基づいて分離する。これを通じて前記正常パターン及び延滞パターン、そして新規パターンを検出することができる。具体的に、正常パターンまたは延滞パターンに属した特質変数の頻度が類似した場合、類似した特質変数同士で同一または類似したパターニング(または識別字)が付与されることができる。このように、パターン相互間のパターニングが同一または類似した場合、群集間の分離度が低いといえる。新規パターン分類部130は、類似した正常パターンと延滞パターンを群集することができ、類似していないパターンを新規パターンとして分類する。特質変数を基盤として類似した正常納付のパターンであると判断されれば正常パターン、前記新規パターンが類似した延滞パターンであると判断されれば悪質延滞パターンとして検出することができる。
【0052】
一方、類似していない頻度を有する特質変数で群集されたパターンの場合、前記ラベリングと異なるラベリングで区分されることができる。このようなパターンは、正常な類似した納付パターンの特質変数の頻度とは異なるため、レンタル費納付の新規パターンであることができ、新規パターン分類部130によって検出されることができる。
【0053】
例示として、上記図4の(a)を参照すると、正常納付の場合でも異常値が探知されることができる。これは、レンタル費納付の新規パターンとして延滞パターンに分類される可能性があることを意味する。レンタル費納付の新規パターンを検出することは、人的資源が限られた状況でも、新しく登場する悪質延滞者を検出するための重要な要素である。このような新規パターンを累積することで、悪質延滞者検出の信頼度が向上されることができ、今後登場する知られていない新しい悪質延滞件に対しても累積したパターンデータに基づいて検出することができる基盤が設けられることができる。
【0054】
新規納付パターン検出部140は、前記正常パターン、前記延滞パターン及び前記新規パターンを入力とするパターン判別モデルを構築して、新規悪質延滞者の悪質パターンを検出することができる。具体的に、新規納付パターン検出部140は、前記正常パターン、前記延滞パターン及び前記新規パターンを入力とする指導学習基盤の分類アルゴリズムに基づいてパターン判別モデルを構築して、前記悪質パターンを検出することができる。指導学習とは、予め構築された学習用データ(training data)を活用してモデルを学習することを意味する。即ち、新規納付パターン検出部140は、分類アルゴリズムに基づいて前記悪質延滞者のパターン、即ち、悪質パターンを探知することができる。前記分類アルゴリズムは、意思決定アルゴリズムを含み、意思決定アルゴリズムは、例えばDecision Treeアルゴリズムであることができるが、これに限定されるものではない。
【0055】
また、新規納付パターン検出部140は、レンタル費納付の新規パターン及び既分類されたレンタル費納付パターンを入力とする意思決定アルゴリズムに基づいてパターン探知規則を学習することができる。また、新規納付パターン検出部140は、パターン探知規則を含む悪質延滞者のパターン判別モデルを構築することができる。前述した非指導学習基盤の新規パターン分類は、単純に頻度に基づいて新規パターンを分類することはできるが、如何なる変数によって分類されたかは分からない。しかし、指導学習基盤の意思決定アルゴリズムは、パターン探知規則を通じてこれを確認することができる。
【0056】
前記パターン探知規則とは、閾値以上の特質変数に基づいてレンタル費納付パターンを判別することができる規則を意味する。このようなパターン探知規則は、レンタル費納付の新規パターン及び既分類されたレンタル費納付パターンを含む全てのパターンを入力として学習されることができる。さらに、パターン探知規則を総合して悪質延滞者のパターン判別モデルとして構築することができる。一方、パターン探知規則の学習は、特質変数の重要度が考慮されることができる。即ち、多様な特質変数の中でも悪質延滞の危険性の高い特質変数の場合、相対的に高い重要度を有することができ、パターン探知規則の学習時にこのような特質変数の重要度が考慮されることができる。即ち、新規納付パターン検出部140は、特質変数の重要度を考慮することで、より正確な悪質延滞者のパターン判別モデルを構築することができる。
【0057】
図5は、本願の一実施例による人工知能基盤の悪質延滞探知装置の悪質延滞者探知モデルのアルゴリズム別性能を図示した図面であり、図6a~図6cは、本願の一実施例による人工知能基盤の悪質延滞探知装置のパターン探知規則例を図示した図面である。
【0058】
悪質延滞者予測部150は、前記特質変数及び前記レンタル費納付データを入力とする指導学習基盤の悪質延滞者探知モデルを構築して、顧客が悪質延滞者に該当するか否かを予測することができる。前記悪質延滞者探知モデルは、前記特質変数及びレンタル費納付データを入力として悪質延滞者探知結果を出力することができる。悪質延滞者予測部150は、指導学習基盤の分類/予測アルゴリズムに基づいて前記悪質延滞者探知モデルを構築することができる。前記分類/予測アルゴリズムには、前述した群集アルゴリズムで説明したアルゴリズムであることができるため、重複する説明は省略する。
【0059】
また、悪質延滞者予測部150は、前記特質変数と正常納付データとの間の類似度に基づいて悪質延滞者に該当するか否かの探知結果を算出することができる。前記悪質延滞者探知モデルは、前記特質変数及びレンタル費納付データを入力として顧客が悪質延滞者に該当するか否かの探知結果を出力することができる。例示として、悪質延滞者探知モデルは、特質変数と正常納付データとの間の類似度に基づいて悪質延滞者に該当するか否かの探知結果を出力することができる。前記類似度が予め設定された閾値未満であれば、特質変数と連携されたレンタル費納付パターンを正常と判断し、前記類似度が予め設定された閾値以上であれば、特質変数と連携されたレンタル費納付パターンを悪質延滞者として判断することができる。前記類似度は、K-meansクラスタリングアルゴリズム、SOM(Self-Organizing-Maps)アルゴリズム、EM & Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムによって演算することができる。悪質延滞者予測部150は、入力による出力の導出を繰り返して行うことで悪質延滞者探知モデルの正確度を向上させることができる。
【0060】
悪質延滞者予測部150は、悪質延滞者探知モデルに基づいて顧客が悪質延滞者に該当するか否かを予測することができる。悪質延滞者予測部150は、前記構築された悪質延滞者探知モデルに新しいレンタル費納付内訳が入力されれば、前述したように、類似度に基づいて顧客が悪質延滞者に該当するか否かを予測することができる。この時、新規納付パターン検出部140によって構築されたパターン判別モデルにも新規レンタル費納付内訳が入力されることで、新規レンタル費納付内訳が悪質延滞であるか否かと、該当新規レンタル費納付内訳のパターンを把握するだけでなく、新規レンタル費納付内訳が悪質延滞の場合、悪質延滞の新規パターンがあるか否かまで判別することができる。
【0061】
図7は、本願の一実施例による人工知能基盤の悪質延滞探知方法の流れを図示した図面である。
【0062】
図7に示した人工知能基盤の悪質延滞探知方法は、上述した図1図6cを通じて説明された人工知能基盤の悪質延滞探知装置100によって行われることができる。従って、以下では省略された内容であるとしても、図1図6cを通じて人工知能基盤の悪質延滞探知装置100について説明された内容は図7にも同様に適用されることができる。
【0063】
図7を参照すると、段階S710において、データ前処理部110は、レンタル費納付内訳データから特質変数を算出することができる。具体的に、データ前処理部110は、レンタル費納付内訳データを定型化して特質変数を導出することができる。レンタル費納付内訳データの定形化は、例えば、休廃業区分、運営年数、総契約件数、正常契約履歴、進行契約件数などを数値化、範疇化することを意味する。また、データ前処理部110によって導出される特質変数は、レンタル費納付と関連して数値化された値を有することができる変数であり、例えば、延滞有無、法人区分、債券移管有無、休廃業区分、運営年数、総契約件数、正常契約履歴件数、進行契約件数、最長延滞月数、最大延長回数、総請求金額、総収納金額、総延滞金額、一般管理の否定的応答有無、一般管理の通話履歴数、該当月データの少なくともいずれか一つを含むことができる。前記特質変数間の相関関係が高いほど、パターン検出部120によって延滞パターンとして検出される確率が高いといえる。データベース160は、前記レンタル費納付内訳データ、前記特質変数及び前記新規パターンの少なくともいずれか一つを記録することができる。
【0064】
段階S720において、パターン検出部120は、特質変数を入力とする異常探知アルゴリズムに基づいて正常パターン及び延滞パターンを検出することができる。前記異常探知アルゴリズムは、全体データ、即ち、レンタル費納付内訳データの平均的な特性に不適合な少数の異常データを探知するアルゴリズムを意味する。
【0065】
パターン検出部120は、異常探知アルゴリズムに基づいてレンタル費納付パターンの正常納付及び悪質延滞に対応する特質変数から正常値及び異常値を検出することができる。また、パターン検出部120は、異常値に対応する特質変数の頻度に基づいて異常群集を検出することができる。例示として、異常探知アルゴリズムは、アイソレーションフォレスト(Isolation Forest)アルゴリズムを含むことができ、アイソレーションフォレストアルゴリズムは、ツリー基盤で異常データを孤立させることで異常群集を探知することができる。例示として、アイソレーションフォレストアルゴリズムを利用した正常値及び異常値探知の正確度は89%の性能を表す。
【0066】
具体的に、パターン検出部120は、異常探知アルゴリズムによって探知された少数の群集を異常群集として検出することができる。また、パターン検出部120は、異常群集に基づいて正常パターン及び延滞パターンを検出することができる。レンタル費納付の場合、延滞の割合が正常納付の割合より小さいため、異常探知アルゴリズムを通じて異常データを孤立させることができる。即ち、パターン検出部120は、異常群集を延滞パターンとして検出し、異常群集に属しない群集を正常パターンとして検出することができる。パターン検出部120は、異常探知アルゴリズムを通じてレンタル費納付パターンの正常納付及び悪質延滞のそれぞれの正常値と異常値を検出することができる。具体的に、レンタル費納付の悪質延滞は、既存の延滞パターンの場合に正常値として探知されることができる一方、悪質延滞の異常値は、悪質延滞の新しいパターンである可能性が高い。
【0067】
段階S730において、新規パターン分類部130は、前記正常パターン及び延滞パターンを入力とする非指導学習基盤の群集アルゴリズムに基づいてレンタル費納付の新規パターンを分類することができる。非指導学習とは、学習用データを構築するものではなく、データ自体を分析するか群集しながら学習するアルゴリズムを意味する。これは公知された事項であるため、具体的な説明は省略する。新規パターン分類部130は、群集アルゴリズムに基づいて前記正常パターン及び延滞パターンを群集することができる。また、新規パターン分類部130は、前記正常パターン及び延滞パターンの群集間分離度に基づいて前記レンタル費納付の新規パターンを分類することができる。
【0068】
新規パターン分類部130は、前記群集アルゴリズムを通じて前記正常パターン及び延滞パターンを複数個のパターン群集に細分化することができる。パターン群集は、同質性のある特質変数の群集であり、群集間分離度、即ち、群集間距離に基づいて分離する。これを通じて前記正常パターン及び延滞パターン、そして新規パターンを検出することができる。具体的に、正常パターンまたは延滞パターンに属した特質変数の頻度が類似した場合、類似した特質変数同士で同一または類似したパターニング(または識別字)が付与されることができる。このように、パターン相互間のパターニングが同一または類似した場合、群集間分離度が低いといえる。新規パターン分類部130は、類似した正常パターンと延滞パターンを群集することができ、類似していないパターンを新規パターンとして分類する。特質変数を基盤として類似した正常納付のパターンであると判断されれば正常パターン、前記新規パターンが類似した延滞パターンであると判断されれば悪質延滞パターンとして検出することができる。
【0069】
一方、類似していない頻度を有する特質変数で群集されたパターンの場合、前記ラベリングと異なるラベリングに区分されることができる。このようなパターンは、正常な類似した納付パターンの特質変数の頻度とは異なるため、レンタル費納付の新規パターンであることができ、新規パターン分類部130によって検出されることができる。例示として、正常納付の場合も異常値が探知されることができる。これは、レンタル費納付の新規パターンとして延滞パターンに分類される可能性があることを意味する。レンタル費納付の新規パターンを検出することは、人的資源が限定された状況でも、新しく登場する悪質延滞者を検出するための重要な要素である。このような新規パターンを累積することで、悪質延滞者検出の信頼度が向上されることができ、今後登場する知られていない新しい悪質延滞件に対しても、累積したパターンデータに基づいて検出することができる基盤が設けられることができる。
【0070】
新規納付パターン検出部140は、前記正常パターン、前記延滞パターン及び前記新規パターンを入力とするパターン判別モデルを構築して、新規悪質延滞者の悪質パターンを検出することができる。具体的に、新規納付パターン検出部140は、前記正常パターン、前記延滞パターン及び前記新規パターンを入力とする指導学習基盤の分類アルゴリズムに基づいてパターン判別モデルを構築して、前記悪質パターンを検出することができる。指導学習とは、予め構築された学習用データ(training data)を活用してモデルを学習することを意味する。即ち、新規納付パターン検出部140は、分類アルゴリズムに基づいて前記悪質延滞者のパターン、即ち、悪質パターンを探知することができる。前記分類アルゴリズムは、意思決定アルゴリズムを含み、意思決定アルゴリズムは、例えばDecision Treeアルゴリズムであることができるが、これに限定されるものではない。
【0071】
また、新規納付パターン検出部140は、レンタル費納付の新規パターン及び既分類されたレンタル費納付パターンを入力とする意思決定アルゴリズムに基づいてパターン探知規則を学習することができる。また、新規納付パターン検出部140は、パターン探知規則を含む悪質延滞者のパターン判別モデルを構築することができる。前述した非指導学習基盤の新規パターン分類は、単純に頻度に基づいて新規パターンを分類することはできるが、如何なる変数によって分類されたかは分からない。しかし、指導学習基盤の意思決定アルゴリズムは、パターン探知規則を通じてこれを確認することができる。
【0072】
前記パターン探知規則とは、閾値以上の特質変数に基づいてレンタル費納付パターンを判別することができる規則を意味する。このようなパターン探知規則は、レンタル費納付の新規パターン及び既分類されたレンタル費納付パターンを含む全てのパターンを入力として学習されることができる。さらに、パターン探知規則を総合して悪質延滞者のパターン判別モデルとして構築することができる。一方、パターン探知規則の学習は、特質変数の重要度が考慮されることができる。即ち、多様な特質変数の中でも悪質延滞の危険性が高い特質変数の場合、相対的に高い重要度を有することができ、パターン探知規則の学習時にこのような特質変数の重要度が考慮されることができる。即ち、新規納付パターン検出部140は、特質変数の重要度を考慮することで、より正確な悪質延滞者のパターン判別モデルを構築することができる。
【0073】
段階S740において、悪質延滞者予測部150は、前記特質変数及び前記レンタル費納付データを入力とする指導学習基盤の悪質延滞者探知モデルを構築して、顧客が悪質延滞者に該当するか否かを予測することができる。前記悪質延滞者探知モデルは、前記特質変数及びレンタル費納付データを入力として悪質延滞者探知結果を出力することができる。悪質延滞者予測部150は、指導学習基盤の分類/予測アルゴリズムに基づいて前記悪質延滞者探知モデルを構築することができる。前記分類/予測アルゴリズムには、前述した群集アルゴリズムで説明したアルゴリズムであることができるため、重複した説明は省略する。
【0074】
また、悪質延滞者予測部150は、前記特質変数と正常納付データとの間の類似度に基づいて悪質延滞者に該当するか否かの探知結果を算出することができる。前記悪質延滞者探知モデルは、前記特質変数及びレンタル費納付データを入力として顧客が悪質延滞者に該当するか否かの探知結果を出力することができる。例示として、悪質延滞者探知モデルは、特質変数と正常納付データとの間の類似度に基づいて悪質延滞者に該当するか否かの探知結果を出力することができる。前記類似度が予め設定された閾値未満であれば、特質変数と連携されたレンタル費納付パターンを正常であると判断し、前記類似度が予め設定された閾値以上であれば、特質変数と連携されたレンタル費納付パターンを悪質延滞者として判断することができる。前記類似度は、K-meansクラスタリングアルゴリズム、SOM(Self-Organizing-Maps)アルゴリズム、EM & Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムによって演算されることができる。悪質延滞者予測部150は、入力による出力の導出を繰り返して行うことで、悪質延滞者探知モデルの正確度を向上させることができる。
【0075】
悪質延滞者予測部150は、悪質延滞者探知モデルに基づいて顧客が悪質延滞者に該当するか否かを予測することができる。悪質延滞者予測部150は、前記構築された悪質延滞者探知モデルに新しいレンタル費納付内訳が入力されれば、前述したように、類似度に基づいて顧客が悪質延滞者に該当するか否かを予測することができる。この時、新規納付パターン検出部140によって構築されたパターン判別モデルにも新規レンタル費納付内訳が入力されることで、新規レンタル費納付内訳が悪質延滞であるか否かと、該当新規レンタル費納付内訳のパターンを把握するだけでなく、新規レンタル費納付内訳が悪質延滞である場合、悪質延滞の新規パターンであるか否かまで判別することができる。
【0076】
本願の一実施例による人工知能基盤の悪質延滞探知方法は、多様なコンピュータ手段を通じて行われることができるプログラム命令形態で具現され、コンピュータ読取可能媒体に記録されることができる。前記コンピュータ読取可能媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。前記媒体に記録されるプログラム命令は、本発明のために特別に設計されて構成されたものであるか、コンピュータソフトウェア当業者に公知されて使用可能なものであってもよい。コンピュータ読取可能記録媒体の例としては、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体(magnetic media)、CD-ROM、DVDのような光記録媒体(optical media)、フロプティカルディスク(floptical disk)のような磁気-光媒体(magneto-optical media)、及びロム(ROM)、ラム(RAM)、フラッシュメモリーなどのようなプログラム命令を格納して行うように特別に構成されたハードウェア装置が含まれる。プログラム命令の例としては、コンパイラーによって作られるような機械語コードだけでなく、インタプリターなどを使用してコンピュータによって実行可能な高級言語コードを含む。上記のハードウェア装置は、本発明の動作を行うために一つ以上のソフトウェアモジュールとして作動するように構成されることができ、その反対も同様である。
【0077】
前述した本願の説明は例示のためのものであり、本願が属する技術分野の通常の知識を有する者は、本願の技術的思想や必須的な特徴を変更せずに他の具体的な形態に容易に変形可能なことが理解できるであろう。従って、以上で記述した実施例は、全ての面で例示的なものであり、限定的ではないと理解すべきである。例えば、単一型で説明されている各構成要素は分散して実施されてもよく、同様に分散したもので説明されている構成要素も結合された形態で実施されてもよい。
【0078】
本願の範囲は、上記詳細な説明よりは後述する特許請求の範囲によって表され、特許請求の範囲の意味及び範囲、そしてその均等概念から導出される全ての変更または変形された形態が本願の範囲に含まれると解釈されるべきである。
図1
図2
図3
図4
図5
図6a
図6b
図6c
図7