IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アジャイルソーダ インコーポレイテッドの特許一覧

特許7111934強化学習基盤の詐欺貸出分類システム及び方法
<>
  • 特許-強化学習基盤の詐欺貸出分類システム及び方法 図1
  • 特許-強化学習基盤の詐欺貸出分類システム及び方法 図2
  • 特許-強化学習基盤の詐欺貸出分類システム及び方法 図3
  • 特許-強化学習基盤の詐欺貸出分類システム及び方法 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-26
(45)【発行日】2022-08-03
(54)【発明の名称】強化学習基盤の詐欺貸出分類システム及び方法
(51)【国際特許分類】
   G06Q 40/02 20120101AFI20220727BHJP
   G06N 20/00 20190101ALI20220727BHJP
【FI】
G06Q40/02
G06N20/00
【請求項の数】 8
(21)【出願番号】P 2020558929
(86)(22)【出願日】2020-08-21
(65)【公表番号】
(43)【公表日】2022-02-22
(86)【国際出願番号】 KR2020011165
(87)【国際公開番号】W WO2021107337
(87)【国際公開日】2021-06-03
【審査請求日】2020-10-19
(31)【優先権主張番号】10-2019-0157606
(32)【優先日】2019-11-29
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】520408272
【氏名又は名称】アジャイルソーダ インコーポレイテッド
(74)【代理人】
【識別番号】100079049
【弁理士】
【氏名又は名称】中島 淳
(74)【代理人】
【識別番号】100084995
【弁理士】
【氏名又は名称】加藤 和詳
(72)【発明者】
【氏名】ロ、チョル-キョン
(72)【発明者】
【氏名】ミン、イェ-リン
(72)【発明者】
【氏名】ル、ファム-トゥエン
【審査官】竹下 翔平
(56)【参考文献】
【文献】米国特許出願公開第2019/0266609(US,A1)
【文献】米国特許出願公開第2011/0173116(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
情報入力部110から任意の貸出情報が入力されれば、エンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果、この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である、を出力する詐欺貸出分類エージェント120;及び
前記分類された予測結果を前記貸出情報の実際結果、この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出であるかを示す結果情報である、と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェント120に提供するリワード分類部130を含み、かつ
前記リワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供し、
実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供し、
前記詐欺貸出分類エージェント120は提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行することを特徴とする、強化学習基盤の詐欺貸出分類システム。
【請求項2】
情報入力部110から任意の貸出情報が入力されれば、エンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果、この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である、を出力する詐欺貸出分類エージェント120;及び
前記分類された予測結果を前記貸出情報の実際結果、この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出であるかを示す結果情報である、と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェント120に提供するリワード分類部130を含み、かつ
前記リワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-2*貸出金額’をリワード情報として提供し、
実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘3*貸出金額’、合わないと、‘-8*貸出金額’をリワード情報として提供し、
前記詐欺貸出分類エージェント120は提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行することを特徴とする、強化学習基盤の詐欺貸出分類システム。
【請求項3】
情報入力部110から任意の貸出情報が入力されれば、エンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果、この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である、を出力する詐欺貸出分類エージェント120;及び
前記分類された予測結果を前記貸出情報の実際結果、この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出であるかを示す結果情報である、と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェント120に提供するリワード分類部130を含み、かつ
前記リワード情報は実際結果が正常貸出である場合、予想結果が合うと、‘貸出金額*予め設定された指標値’、合わないと、‘-貸出金額*予め設定された指標値’をリワード情報として提供し、
実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供し、
前記詐欺貸出分類エージェント120は提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行することを特徴とする、
強化学習基盤の詐欺貸出分類システム。
【請求項4】
前記貸出金額は‘0’~‘1’範囲のスケールに変換して反映されることを特徴とする、請求項1~請求項3のうち、いずれか一項に記載の強化学習基盤の詐欺貸出分類システム。
【請求項5】
a)情報入力部110から任意の貸出情報が入力されれば、詐欺貸出分類エージェント120がエンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果、この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である、を出力するステップ;
b)前記詐欺貸出分類エージェント120から分類された予測結果をリワード分類部130が前記貸出情報の実際結果、この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出を示す結果情報である、と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェント120に提供するステップ;及び
c)前記詐欺貸出分類エージェント120が前記リワード分類部130から提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行するステップ;を含み、かつ
前記リワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供し、実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供することを特徴とする、強化学習基盤の詐欺貸出分類方法。
【請求項6】
a)情報入力部110から任意の貸出情報が入力されれば、詐欺貸出分類エージェント120がエンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果、この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である、を出力するステップ;
b)前記詐欺貸出分類エージェント120から分類された予測結果をリワード分類部130が前記貸出情報の実際結果、この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出を示した結果情報である、と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェント120に提供するステップ;及び
c)前記詐欺貸出分類エージェント120が前記リワード分類部130から提供されたリワード情報を貸出情報の確率値の算出に反映して強化学習を遂行するステップ;を含み、かつ
前記リワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-2*貸出金額’をリワード情報として提供し、
実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘3*貸出金額’、合わないと、‘-8*貸出金額’をリワード情報として提供することを特徴とする、強化学習基盤の詐欺貸出分類方法。
【請求項7】
a)情報入力部110から任意の貸出情報が入力されれば、詐欺貸出分類エージェント120がエンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果、この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である、を出力するステップ;
b)前記詐欺貸出分類エージェント120から分類された予測結果をリワード分類部130が前記貸出情報の実際結果、この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出を示す結果情報である、と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェント120に提供するステップ;及び
c)前記詐欺貸出分類エージェント120が前記リワード分類部130から提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行するステップ;を含み、かつ
前記リワード情報は実際結果が正常貸出である場合、予想結果が合うと、‘貸出金額*予め設定された指標値’、合わないと、‘-貸出金額*予め設定された指標値’をリワード情報として提供することを特徴とする、
強化学習基盤の詐欺貸出分類方法。
【請求項8】
前記貸出金額は‘0’~‘1’範囲のスケールに変換して反映されることを特徴とする、請求項5~請求項7のうち、いずれか一項に記載の強化学習基盤の詐欺貸出分類方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は強化学習基盤の詐欺貸出分類システム及び方法に関する発明であって、より詳しくは、強化学習を用いて詐欺貸出を選別する強化学習基盤の詐欺貸出分類システム及び方法に関する。
【背景技術】
【0002】
一般的な自動車金融市場構造によれば、自動車購買者が負担するようになる費用を算定する費用構造が過度に複雑で、自動車購買者が理解し難いので、自動車金融商品加入に従う業務を自動車ディーラーに委任している実状である。
【0003】
自動車金融市場で自動車購買者の費用構造及び自動車ディーラーの収益構造では、取扱手数料または貸出商品紹介手数料によって付加的な費用が発生せざるを得ない。
【0004】
したがって、キャピタル社のような金融会社のオートローン(Auto-Loan)は相対的に高金利政策を取っている。
【0005】
これによって、第2キャピタル社の自動車貸出サービスを用いる債務者は高金利によって経済的負担が増加することがある。
【0006】
また、債務者がキャピタル社のような第2金融圏の貸出サービスを用いる場合に、債務者の信用等級が下落し、他金融商品の貸出不適合要件として作用することがあるので、今後、経済活動に悪影響を及ぼす。
【0007】
中古車売買市場では、中古車を購買しようとする債務者、中古車の以前主人である売渡者、中古車売買を斡旋する売買商の間に取引がなされるので、取引主体が多様で、取引対象である中古車の性能、維持状態、及び取引時勢が一定でないので、中古車の取引時、格別の注意が必要である。
【0008】
最近、消費者の自動車交替周期が短くなり、高価の自動車取引が増加するにつれて、高価の中古車売買も増加して、自動車貸出サービスに対する関心が高まる趨勢である。
【0009】
このような貸出サービスを提供する過程で、金融社またはキャピタル社は自動車貸出詐欺を防止するために債務者の貸出適格を直接審査し、債務者の取引車両、自動車売渡者、及び売買商に対する検証が完了した債務者に貸出サービスを提供することがある。
【0010】
しかしながら、従来の貸出サービスは金融社またはキャピタル社で予め設定した貸出規定に従うルールベースを基盤に貸出適格審査を進行して正常貸出と詐欺貸出を区分し難いという問題点がある。
【0011】
一方、強化学習は環境(environment)と相互作用して目標を達成するエージェントを扱う学習方法であって、ロボットや人工知能分野でたくさん使われている。
【0012】
このような強化学習は学習の行動主体である強化学習エージェント(Agent)がどんな行動をすればより多い補償(Reward)を受けるのか突き止めることを目的とする。
【0013】
即ち、定まった答がない状態でも補償を最大化させるために何をするかを学ぶものであって、入力と出力が明確な関係を有している状況で事前にどんな行為をするかを聞いて行うことでなく、試行錯誤を経ながら補償を最大化させることを学ぶ過程を経る。
【0014】
また、エージェントは時間ステップが流れるにつれて順次にアクションを選択するようになり、前記アクションが環境に及ぼした影響に基盤して補償(reward)を受けるようになる。
【0015】
図1は従来技術に従う強化学習装置の構成を示すブロック図であって、図1に示すように、エージェント10が強化学習モデルの学習を通じてアクション(Action、または行動)aを決定する方法を学習させ、各アクションであるaはその次のステート(state)Sに影響を及ぼし、成功した程度は補償(Reward)rとして測定することができる。
【0016】
即ち、補償は強化学習モデルを通じて学習を進行する場合、どんなステート(State)によってエージェント10が決定するアクション(行動)に対する補償点数であって、学習に従うエージェント10の意思決定に対する一種のフィードバックである。
【0017】
また、補償をどのように策定するかによって学習結果に多い影響が発生するので、強化学習を通じてエージェント10は未来の補償が最大になるようにアクションを取るようになる。
【0018】
しかしながら、従来技術に従う強化学習装置は与えられた環境で目標達成と関連して画一的に決定される補償に基づいて学習を進行することによって、目標をなすために1つの行動パターンを持たざるを得ないという問題点がある。
【発明の概要】
【発明が解決しようとする課題】
【0019】
このような問題点を解決するために、本発明は強化学習を用いて車両詐欺貸出を選別する強化学習基盤の詐欺貸出分類システム及び方法を提供することを目的とする。
【課題を解決するための手段】
【0020】
前記の目的を達成するために、本発明の一実施形態は強化学習基盤の詐欺貸出分類システムであって、情報入力部から任意の貸出情報が入力されれば、エンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定形化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果-この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である-を出力する詐欺貸出分類エージェント;及び前記分類された予測結果を前記貸出情報の実際結果-この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出であるかを示した結果情報である-と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェントに提供するリワード分類部を含む。
【0021】
また、前記実施形態に従うリワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供し、実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供し、前記詐欺貸出分類エージェントは提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行することを特徴とする。
【0022】
また、本発明の一実施形態は強化学習基盤の詐欺貸出分類システムであって、情報入力部から任意の貸出情報が入力されれば、エンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果-この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である-を出力する詐欺貸出分類エージェント;及び前記分類された予測結果を前記貸出情報の実際結果-この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出であるかを示した結果情報である-と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェントに提供するリワード分類部を含む。
【0023】
また、前記実施形態に従うリワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-2*貸出金額’をリワード情報として提供し、実際の結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘3*貸出金額’、合わないと、‘-8*貸出金額’をリワード情報として提供し、前記詐欺貸出分類エージェントは提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行することを特徴とする。
【0024】
また、前記実施形態に従うリワード情報は実際結果が正常貸出である場合、予想結果が合うと、‘貸出金額*予め設定された指標値’、合わないと、‘-貸出金額*予め設定された指標値’をリワード情報として提供することを特徴とする。
【0025】
また、前記実施形態に従う貸出金額は‘0’~‘1’範囲のスケールに変換して反映されることを特徴とする。
【0026】
また、本発明の一実施形態は強化学習基盤の詐欺貸出分類方法であって、a)情報入力部から任意の貸出情報が入力されれば、詐欺貸出分類エージェントがエンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類された予測結果-この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である-を出力するステップ;b)前記詐欺貸出分類エージェントから分類された予測結果をリワード分類部が前記貸出情報の実際結果-この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出を示した結果情報である-と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェントに提供するステップ;及びc)前記詐欺貸出分類エージェントが前記リワード分類部から提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行するステップ;を含む。
【0027】
また、前記実施形態に従うリワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供し、実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供することを特徴とする。
【0028】
また、本発明の一実施形態は強化学習基盤の詐欺貸出分類方法であって、a)情報入力部から任意の貸出情報が入力されれば、詐欺貸出分類エージェントがエンベッディング(Embedding)技法により貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、範疇型データ、または非定型データの情報を縮約及び定型化し、前記縮約及び定型化した入力変数を用いて予め格納された分析プログラムを通じて前記貸出情報に対する正常貸出である確率値と詐欺貸出である確率値を各々算出し、前記算出された確率値のうち、高い側の確率値に分類した予測結果-この際、予測結果は正常貸出である確率値が高ければ正常貸出であり、詐欺貸出である確率値が高ければ詐欺貸出である-を出力するステップ;b)前記詐欺貸出分類エージェントから分類された予測結果をリワード分類部が前記貸出情報の実際結果-この際、実際結果は入力された貸出情報が正常貸出または詐欺貸出を示した結果情報である-と比較して前記予測結果の合う/合わないによって分類されたリワード情報を前記詐欺貸出分類エージェントに提供するステップ;及びc)前記詐欺貸出分類エージェントが前記リワード分類部から提供されたリワード情報を貸出情報の確率値算出に反映して強化学習を遂行するステップ;を含む。
【0029】
また、前記実施形態に従うリワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-2*貸出金額’をリワード情報として提供し、実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘3*貸出金額’、合わないと、‘-8*貸出金額’をリワード情報として提供することを特徴とする。
【0030】
また、前記実施形態に従うリワード情報は実際結果が正常貸出である場合、予想結果が合うと、‘貸出金額*予め設定された指標値’、合わないと、‘-貸出金額*予め設定された指標値’をリワード情報として提供することを特徴とする。
【0031】
また、前記貸出金額は‘0’~‘1’範囲のスケールに変換して反映されることを特徴とする。
【発明の効果】
【0032】
本発明は強化学習を用いて車両詐欺貸出の分類を改善することによって、詐欺貸出による予想損失金額の発生を最小化することができる長所がある。
【図面の簡単な説明】
【0033】
図1】従来技術に従う強化学習装置の構成を示すブロック図。
図2】本発明の一実施形態に従う強化学習基盤の詐欺貸出分類システムの構成を示すブロック図。
図3図2の実施形態に従う強化学習基盤の詐欺貸出分類システムの分類過程を説明するための例示図。
図4】本発明の一実施形態に従う強化学習基盤の詐欺貸出分類方法を示すフローチャート。
【発明を実施するための形態】
【0034】
以下、添付した図面を参照して本発明の一実施形態に従う強化学習基盤の詐欺貸出分類システム及び方法の好ましい実施形態を詳細に説明する。
【0035】
本明細書で、ある部分がある構成要素を“含む”という表現は他の構成要素を排除することでなく、他の構成要素をさらに含むことができるということを意味する。
【0036】
また、“‥部”、“‥機”、“‥モジュール”などの用語は、少なくとも1つの機能や動作を処理する単位を意味し、これはハードウェアやソフトウェア、またはその2つの結合に区分できる。
【0037】
図2は本発明の一実施形態に従う強化学習基盤の詐欺貸出分類システムの構成を示すブロック図であり、図3図2の実施形態に従う強化学習基盤の詐欺貸出分類システムの分類過程を説明するための例示図である。
【0038】
図2及び図3を参照して説明すると、強化学習基盤の詐欺貸出分類システム100は、情報入力部110と、詐欺貸出分類エージェント120と、リワード分類部130を含んで構成される。
【0039】
情報入力部110は詐欺貸出分類エージェント120の強化学習のための貸出情報を提供する構成であって、キーボードなどの入力手段、メモリなどの格納手段、ネットワークを介して連結された外部端末などで構成できる。
【0040】
また、貸出情報は詐欺貸出分類エージェント120が分類する貸出情報であって、貸出者の貸出申請情報、車両の売買証明情報、車両の売渡者情報、車両の仲介取引者情報、またはその他の付加情報などを含むことができる。
【0041】
また、情報入力部110は強化学習のために入力された個別貸出情報に対し、正常貸出であるかまたは詐欺貸出であるかに対する実際結果情報を提供することができる。
【0042】
詐欺貸出分類エージェント120は、情報入力部110から任意の貸出情報が入力されれば、予め格納された分析プログラムを用いて貸出情報が正常貸出である確率値と詐欺貸出である確率値を各々算出し、算出された確率値のうち、高い側に分類した予測結果、即ち正常貸出である確率値が高ければ正常貸出に分類した予測結果を出力し、詐欺貸出である確率値が高ければ詐欺貸出に分類した予測結果を出力する。
【0043】
即ち、詐欺貸出分類エージェント120は分析プログラムを用いて貸出情報に含まれた個人信用情報及び他金融期間貸出内訳を含んだ貸出者情報、貸出金額、貸出期間、利率などを含んだ貸出条件、車両情報、車両の売買証明情報、車両の売渡者情報、車両の仲介取引者情報などを分析し、分析結果に基づいて正常貸出である確率値と詐欺貸出である確率値を算出する。
【0044】
また、詐欺貸出分類エージェント120は貸出者情報、貸出条件、車両情報、車両の仲介取引者情報、数字型でない範疇型または非定型データの情報縮約を通じて定型化することによって、高次元のデータを低次元のデータに縮めたエンベッディング(Embedding)技法を用いた情報などを用いて分析することもできる。
【0045】
また、詐欺貸出分類エージェント120は算出された確率値に基づいて貸出情報が正常貸出であるかまたは詐欺貸出であるかを予測(または、意思決定)することができる。
【0046】
即ち、詐欺貸出分類エージェント120は、図3に示すように、個別貸出情報、例えば、貸出情報1 210a、貸出情報2 210b、貸出情報3 210c、‥貸出情報n 210nに対し、貸出者情報220a、貸出金(額)220b、貸出期間220cなどに基づいた正常貸出であるかまたは詐欺貸出であるかの確率値を算出し、算出された確率値に基づいて意思決定した結果にて正常貸出であるかまたは詐欺貸出であるかを決定した予測値300または予測結果を出力する。
【0047】
また、詐欺貸出分類エージェント120は算出された正常貸出に対する確率値と詐欺貸出に対する確率値の比較を通じて確率値が大きい値を有する側に貸出情報が決定されるようにする。
【0048】
例えば、算出された正常貸出に対する確率値が“40”であり、詐欺貸出に対する確率値が“60”であれば、入力された貸出情報は“詐欺貸出”と予測した予測値を出力する。
【0049】
また、詐欺貸出分類エージェント120はリワード分類部130から提供されたリワード情報を貸出情報の確率値算出時に反映して強化学習を遂行することができる。
【0050】
リワード分類部130は、詐欺貸出分類エージェント120が強化学習を通じて予測した確率値に基づいて正常貸出または重複貸出に分類した予測値300を実際結果310、即ち強化学習のために入力された貸出情報の正常貸出または詐欺貸出を示した結果情報と比較することによって、例えば、正常貸出が‘合う’または‘合わない’、詐欺貸出が‘合う’または‘合わない’に分類した予測結果(または、意思決定結果)を提供することができる。
【0051】
また、リワード分類部130は詐欺貸出分類エージェント120の予測結果と実際結果の合う/合わないによって詐欺貸出分類エージェント120の予測値分類のための学習方向を決定するリワード情報400を詐欺貸出分類エージェント120に提供する。
【0052】
ここで、リワード情報は貸出金額をリワード情報として提供することができるが、実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供することができる。
【0053】
また、リワード情報は実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供することができる。
【0054】
また、リワード情報は実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-2*貸出金額’をリワード情報として提供することができる。
【0055】
また、リワード情報は実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘3*貸出金額’、合わないと、‘-8*貸出金額’をリワード情報として提供することができる。
【0056】
また、リワード情報は貸出金額がリワードに反映されれば、演算値が増加できるので、反映される貸出金額を‘0’~‘1’範囲のスケールに変換して提供することもできる。
【0057】
次に、本発明の一実施形態に従う強化学習基盤の詐欺貸出分類方法を図2乃至図4を参照して説明する。
【0058】
詐欺貸出対象選別部120が情報入力部110から貸出情報を受信(S100)する。
【0059】
詐欺貸出分類エージェント120は、予め格納された分析プログラムを用いて貸出情報が正常貸出である確率値と詐欺貸出である確率値を各々算出し、算出された確率値のうち、高い側に分類した予測結果、即ち正常貸出である確率値が高ければ正常貸出に分類し、詐欺貸出である確率値が高ければ詐欺貸出に分類した予測値300を出力(S200)する。
【0060】
ステップS200で、詐欺貸出分類エージェント120は情報入力部110から入力される貸出情報に対して分析プログラムが貸出情報に含まれた貸出者情報220a、貸出金(額)220b、貸出期間220cをエンベッディング(Embedding)技法により分析した情報、機械学習を通じて分析した情報などに基づいて確率値を算出することができる。
【0061】
ステップS200を遂行した後、詐欺貸出分類エージェント120から分類された予測値300は、リワード分類部130で実際結果310と比較し、予測値300と実際結果310の合う/合わないによって詐欺貸出分類エージェント120の予測値算出のための学習方向を決定するリワード情報を分類(S300)する。
【0062】
ステップS300で、リワード分類部130は予測結果と実際結果とが合うと、一定貸出金額が加算されるようにし、予測結果と実際結果とが合わないと、正常貸出及び詐欺貸出の確率値を計算するための任意の情報に対して一定貸出金額が減算または加算されるようにリワード情報を設定することができる。
【0063】
また、ステップS300で設定及び提供されるリワード情報は、実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供することができる。
【0064】
また、実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘+貸出金額’、合わないと、‘-貸出金額’をリワード情報として提供することができる。
【0065】
ここで、リワード情報は予め設定された指標値を付加して設定されることもできる。
【0066】
即ち、実際結果が正常貸出である場合、予想結果が合うと、‘貸出金額*予め設定された指標値’、合わないと、‘-貸出金額*予め設定された指標値’をリワード情報として提供して詐欺貸出分類エージェント120の予測値分類のための学習方向が最適の方向に学習できるようにする。
【0067】
また、ステップS300で提供されるリワード情報は詐欺貸出の摘発対象または他社を通じての詐欺貸出に対する摘発など、難易度によって調整できるが、このような貸出情報の分類で実際結果が正常貸出である貸出情報に対し、予測結果が正常貸出に合うと、‘+貸出金額’、合わないと、‘-2*貸出金額’をリワード情報として提供することができる。
【0068】
また、実際結果が詐欺貸出である貸出情報に対し、予測結果が詐欺貸出に合うと、‘3*貸出金額’、合わないと、‘-8*貸出金額’をリワード情報として提供することによって、詐欺貸出分類エージェント120の予測値分類のための学習方向が最適の方向に学習できるようにする。
【0069】
一方、リワード情報は貸出金額がリワードに反映されれば、演算値が増加できるので、反映される貸出金額を‘0’~‘1’範囲のスケールに変換して提供できる。
【0070】
ステップS300で設定されたリワード情報は、リワード分類部130から詐欺貸出分類エージェント120に提供され、詐欺貸出分類エージェント120はリワード分類部130から提供されたリワード情報を決済情報の予測結果決定のための任意の情報、例えば、貸出情報に含まれた貸出者情報220a、貸出金(額)220b、貸出期間220cをエンベッディング(Embedding)技法により分析した情報、機械学習を通じて分析した情報などに基づいた確率値の算出時に反映して強化学習を遂行(S400)する。
【0071】
したがって、強化学習を用いて車両詐欺貸出の分類を改善することによって、詐欺貸出による予想損失金額の発生を最小化することができる。
【0072】
前記のように、本発明の好ましい実施形態を参照して説明したが、該当技術分野の熟練した当業者であれば、下記の特許請求範囲に記載された本発明の思想及び領域から逸脱しない範囲内で本発明を多様に修正及び変更させることができることを理解することができる。
【0073】
また、本発明の特許請求範囲に記載された図面番号は説明の明瞭性と便宜のために記載したものであり、これに限定されるのではなく、実施形態を説明する過程で図面に図示された線の厚さや構成要素のサイズなどは説明の明瞭性と便宜上、誇張して図示されることもあり、前述した用語は本発明での機能を考慮して定義された用語であって、これはユーザ、運用者の意図または慣例によって変わることがあるので、このような用語に対する解釈は本明細書の全般に亘る内容に基づいて下されるべきである。
図1
図2
図3
図4