特許第6783002号(P6783002)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アイエスディー インコーポレーテッドの特許一覧

特許6783002企業の債務不履行予測システム及びその動作方法
<>
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000002
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000003
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000004
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000005
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000006
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000007
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000008
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000009
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000010
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000011
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000012
  • 特許6783002-企業の債務不履行予測システム及びその動作方法 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6783002
(24)【登録日】2020年10月23日
(45)【発行日】2020年11月11日
(54)【発明の名称】企業の債務不履行予測システム及びその動作方法
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20201102BHJP
【FI】
   G06Q50/10
【請求項の数】10
【全頁数】19
(21)【出願番号】特願2019-197263(P2019-197263)
(22)【出願日】2019年10月30日
(65)【公開番号】特開2020-95693(P2020-95693A)
(43)【公開日】2020年6月18日
【審査請求日】2019年10月30日
(31)【優先権主張番号】10-2018-0159763
(32)【優先日】2018年12月12日
(33)【優先権主張国】KR
(73)【特許権者】
【識別番号】519388686
【氏名又は名称】アイエスディー インコーポレーテッド
(74)【代理人】
【識別番号】100130111
【弁理士】
【氏名又は名称】新保 斉
(72)【発明者】
【氏名】ユン、ドク チャン
(72)【発明者】
【氏名】チョン、スク ヨン
(72)【発明者】
【氏名】ワスンダラ デヒヤ
(72)【発明者】
【氏名】ソ、ウォン ヨン
【審査官】 久慈 渉
(56)【参考文献】
【文献】 特開2009−245369(JP,A)
【文献】 特開2003−216804(JP,A)
【文献】 米国特許出願公開第2012/0023006(US,A1)
【文献】 韓国公開特許第10−2009−0001940(KR,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 − 99/00
(57)【特許請求の範囲】
【請求項1】
コンピューティングシステムによって行われる、ニュース記事を基に企業の債務不履行の危険性を予測する方法において、
インターネット上で複数のニュース記事を収集するステップと、
分析対象となる企業を選択するステップと、
収集した複数のニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類するステップと、
前記分析対象記事それぞれに対する危険レベルを算出するステップと、
算出された危険レベルを基準に前記分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成するステップと、
生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算するステップと、を含む、企業の債務不履行危険性の予測方法。
【請求項2】
前記分析対象記事それぞれに対する危険レベルを算出するステップは、
特定マシンラーニングアルゴリズムを採択し、採択したマシンラーニングアルゴリズムを利用して収集したニュース記事に対して回帰または項目化分析を行った後、前記回帰または項目化分析を介して導出された危険算出アルゴリズムを利用し、前記分析対象記事それぞれに対する危険レベルを算出することである、請求項1に記載の企業の債務不履行危険性の予測方法。
【請求項3】
収集したニュース記事に対して回帰または項目化分析を行うにあたって、債務不履行が発生した企業に関するニュース記事のうち、該当企業の債務不履行から一定時間以内に発行されたニュース記事のみを分析対象として選択するステップを更に含む、請求項2に記載の企業の債務不履行危険性の予測方法。
【請求項4】
収集した複数のニュース記事のうち、分析対象企業に関連するニュース記事を分析対象記事として分類するステップは、
前記分析対象企業の名称が含まれたニュース記事を選別するステップと、
選別されたニュース記事それぞれに対して前記分析対象企業に関連する記事であるのかを判断するステップと、更にを含む、請求項1に記載の企業の債務不履行危険性の予測方法。
【請求項5】
選別されたニュース記事それぞれに対して前記分析対象企業に関連する記事であるのかを判断するステップは、
選別されたニュース記事それぞれに関する文脈またはテーマを識別し、識別した文脈またはテーマが前記分析対象企業の情報に関連するのか否かを判断するステップを更に含む、請求項4に記載の企業の債務不履行危険性の予測方法。
【請求項6】
算出された危険レベルを基準に前記分析対象記事のグループ化を行って各グループを示す特性ベクトルを生成するステップは、
前記分析対象記事に対して算出された危険レベルを基に危険レベルを複数の区間に分類し、それを介して前記分析対象記事のグループ化を行うステップを更に含む、請求項1に記載の企業の債務不履行危険性の予測方法。
【請求項7】
前記危険レベルを複数の区間に分類するステップは、
前記分析対象企業が属する産業の種類によって異なる方式で分類を行うことを特徴とする、請求項6に記載の企業の債務不履行危険性の予測方法。
【請求項8】
生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算するステップは、
グループ化が行われた分析対象記事の特性ベクトルを意思決定木アルゴリズムを介して分類した後、結果を基に前記分析対象企業の債務不履行危険性の予測値を算出するステップを更に含む、請求項1に記載の企業の債務不履行危険性の予測方法。
【請求項9】
グループ化が行われた分析対象記事の特性ベクトルを意思決定木アルゴリズムを介して分類するステップは、
前記分析対象記事のグループに対して生成した特性ベクトルを含むデータをn個に分類した後、n個のデータ集合に対して交差検証(n−Cross Validation)方式で意思決定木(Decision Tree)アルゴリズムを適用して特性ベクトルを分類するステップを更に含む、請求項8に記載の企業の債務不履行危険性の予測方法。
【請求項10】
ニュース記事を基に企業の債務不履行危険性を予測するコンピューティングシステムにおいて、
インターネット上で複数のニュース記事を収集するニュース記事収集部と、
分析対象となる企業を選択する分析企業選定部と、
収集した複数のニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類する分析対象記事分類部と、
前記分析対象記事それぞれに対する危険レベルを算出する危険レベル算出部と、
算出された危険レベルを基準に前記分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成する特性ベクトル生成部と、
生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算する債務不履行危険性予測部と、を含む、コンピューティングシステム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の多様な実施例は、企業の債務不履行予測システム及びその動作方法に関し、ニュースデータの分析に基づいて企業の債務不履行の危険を評価するシステムに関する。
【背景技術】
【0002】
現代社会で最も規模が大きく重要度が高い経済主体は企業である。一年にも数多くの企業が生成し消滅されており、関連する個人、企業、更には国家にも経済的に多くの影響を及ぼすことなる。よって、企業の興亡盛衰を分析することは、該当企業の属する産業群だけでなく、全体産業群の分析においても基礎となる。企業が消滅する原因は多いが、そのうち債務不履行(Default)を介して企業が消滅する場合、該当企業の役職員はもちろん、該当企業の投資者や取引企業も莫大な影響を受けるようになる。
【0003】
そのため、各企業に対する債務不履行可能性の予測に対する研究が地道に行われている。一般に、企業の債務不履行可能性は企業の営業利益によって利子コストにどれだけ耐えられるのかを示す指標であるインタレスト・カバレッジ・レシオ、負債比率などを介して予測されていた。このように、企業の債務不履行可能性の分析予測において、定量的に獲得し得る財務的なデータが主に利用されてきたが、最近は非財務的なデータを基に企業のリスクを分析する方法論が浮き彫りになっている。
【0004】
企業が公開する財務的データには該当企業に不利な内容が反映されていない可能性があり、企業が公開する財務関連報告書に対する信頼性も疑われる場合があった。よって、非財務的なデータを分析する方法論が様々に台頭している実情であり、非財務的なデータのうち、分析できる程の十分な量を有するニュース記事のデータが主に利用され始めている。
【0005】
ニュース記事のデータはその量が分析の対象になる程多いが、ニュース記事がいかなる企業に関する記事であるのかを分析し、該当ニュース記事を債務不履行の危険といかなる方式で関連付けて分析するのかを決定するのに難しさがあった。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の多様な実施例は、複数のニュース記事を基に特定企業の債務不履行危険性を予測する方法を提供することをその目的とする。
本発明の多様な実施例は、多様なマシンラーニングアルゴリズム及び分析方法を介して、債務不履行危険性の正確度を向上させることをその目的とする。
本発明が解決しようとする課題は上述した課題に限らず、上述されていない他の課題は以下の記載から通常の技術者に明確に理解されるはずである。
【課題を解決するための手段】
【0007】
上述した課題を解決するために、本発明の多様な実施例による企業の債務不履行危険性の予測方法は、インターネット上で複数のニュース記事を収集するステップと、分析対象となる企業を選択するステップと、収集した複数のニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類するステップと、前記分析対象記事それぞれに対する危険レベルを算出するステップと、算出された危険レベルを基準に前記分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成するステップと、生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算するステップと、を含む。
【0008】
前記分析対象記事それぞれに対する危険レベルを算出するステップは、特定マシンラーニングアルゴリズムを採択し、採択したマシンラーニングアルゴリズムを利用して収集したニュース記事に対して回帰または項目化分析を行った後、前記回帰または項目化分析を介して導出された危険算出アルゴリズムを利用し、前記分析対象記事それぞれに対する危険レベルを算出する。
【0009】
企業の債務不履行危険性の予測方法は、収集したニュース記事に対して回帰または項目化分析を行うにあたって、債務不履行が発生した企業に関するニュース記事のうち、該当企業の債務不履行から一定時間以内に発行されたニュース記事のみを分析対象として選択するステップを更に含む。
【0010】
収集した複数のニュース記事のうち、分析対象企業に関連するニュース記事を分析対象記事として分類するステップは、前記分析対象企業の名称が含まれたニュース記事を選別するステップと、選別されたニュース記事それぞれに対して前記分析対象企業に関連する記事であるのかを判断するステップと、更にを含む。
【0011】
選別されたニュース記事それぞれに対して前記分析対象企業に関連する記事であるのかを判断するステップは、選別されたニュース記事それぞれに関する文脈またはテーマを識別し、識別した文脈またはテーマが前記分析対象企業の情報に関連するのか否かを判断するステップを更に含む。
【0012】
算出された危険レベルを基準に前記分析対象記事のグループ化を行って各グループを示す特性ベクトルを生成するステップは、前記分析対象記事に対して算出された危険レベルを基に危険レベルを複数の区間に分類し、それを介して前記分析対象記事のグループ化を行うステップを更に含む。
前記危険レベルを複数の区間に分類するステップは、前記分析対象企業が属する産業の種類によって異なる方式で分類を行うことを特徴とする。
【0013】
生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算するステップは、グループ化が行われた分析対象記事の特性ベクトルを意思決定木アルゴリズムを介して分類した後、結果を基に前記分析対象企業の債務不履行危険性の予測値を算出するステップを更に含む。
【0014】
グループ化が行われた分析対象記事の特性ベクトルを意思決定木アルゴリズムを介して分類するステップは、前記分析対象記事のグループに対して生成した特性ベクトルを含むデータをn個に分類した後、n個のデータ集合に対して交差検証(n−Cross Validation)方式で意思決定木(Decision Tree)アルゴリズムを適用して特性ベクトルを分類するステップを更に含む。
【0015】
本発明他の他の実施例によると、ニュース記事を基に企業の債務不履行危険性を予測するコンピューティングシステムは、インターネット上で複数のニュース記事を収集するニュース記事収集部と、分析対象となる企業を選択する分析企業選定部と、収集した複数のニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類する分析対象記事分類部と、前記分析対象記事それぞれに対する危険レベルを算出する危険レベル算出部と、算出された危険レベルを基準に前記分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成する特性ベクトル生成部と、生成された特性ベクトルを基に前記分析対象企業の債務不履行危険性を計算する債務不履行危険性予測部と、を含む。
【発明の効果】
【0016】
本発明の実施例によると、特定企業に対して該当企業と直接関連するニュース記事を選別し、該当記事のみに基づいて企業の債務不履行危険性を予測することができる。
【0017】
本発明の実施例によると、債務不履行危険性の予測に効果的なマシンラーニングアルゴリズムが採択されて使用され、各記事に対する危険レベルが独立に計算されるだけでなく、ニュース記事のグループ化を介した分析で債務不履行危険性予測の正確度を向上させることができる。
本発明の効果は上述した効果に限らず、上述されていない他の効果は以下の記載から通常の技術者に明確に理解されるはずである。
【図面の簡単な説明】
【0018】
図1】本発明の一実施例による企業の債務不履行予測システムが動作する環境を概略的に示す画像である。
図2】本発明の一実施例による企業の債務不履行予測システムが動作する方式を概略的に示すフローチャートである。
図3】本発明の一実施例による債務不履行予測装置がニュース記事を収集する動作を示す図である。
図4】本発明の一実施例による債務不履行予測装置がNERアルゴリズムを利用して分析対象企業に関連するニュース記事を分析対象記事として分類する方式を示す図である。
図5】本発明の一実施例による債務不履行予測装置が分析対象記事に対する危険レベルを算出するにあたって使用する独立変数を選択する過程を示す図である。
図6】本発明の一実施例による債務不履行予測装置が分析対象記事に対する危険レベルの算出に利用するマシンラーニングアルゴリズムを選択する過程を示す図である。
図7】本発明の一実施例による債務不履行予測装置が分析対象記事の危険レベルに基づいて企業の債務不履行を予測する過程を示す図である。
図8】本発明の一実施例による債務不履行予測装置が特定企業に関する分析対象記事をグループ化する方式を示す図である。
図9】本発明の一実施例による債務不履行予測装置が分類された特性ベクトルを介して分析対象企業の債務不履行の危険性を計算する方式を説明する図である。
図10】本発明の一実施例による債務不履行予測装置が意思決定木アルゴリズムを介して特性ベクトルを分類するのに利用する交差検証方式を説明する図である。
図11】本発明の一実施例による債務不履行予測装置の構成を示すブロック図である。
図12】本発明の一実施例による債務不履行予測装置が分析対象企業の債務不履行危険性予測値を導出するための過程を示すフローチャートである。
【発明を実施するための形態】
【0019】
本明細書で使用された用語は実施例を説明するためのものであって、本発明を制限するものではない。本明細書において、単数形は文の中で特に言及されない限り複数形も含む。明細書で使用される「含む(comprises)」及び/または「含む(comprising)」は、言及された構成要素以外にも一つ以上の他の構成要素の存在または追加を排除しない。明細書全体にわたって、同じ図面符号は同じ構成要素を指し、「及び/または」は言及された構成要素のそれぞれ及び一つ以上の全ての組み合わせを含む。たとえ「第1」、「第2」などが多様な構成要素を述べるために使用されても、これらの構成要素はこれらの用語によって制限されないことはもちろんである。これらの用語は単に一つの構成要素を他の構成要素と区別するために使用するものである。よって、以下で言及する第1構成要素は、本発明の技術的思想内で第2構成要素であってもよいことはもちろんである。
【0020】
明細書全体にわたって、ある部分がある構成要素を「含む」という際、これは特に反対する記載がない限り、他の構成要素を除くのではなく、他の構成要素を更に含むことを意味する。また、明細書に記載された「…部」、「モジュール」などの用途は少なくとも一つの機能や動作を処理する単位を意味し、これはハードウェアまたはソフトウェアで具現されるかハードウェアとソフトウェアの結合で具現される。
図1は、本発明の一実施例による企業の債務不履行予測システムが動作する環境を概略的に示す画像である。
図1を参照すると、企業の債務不履行予測システムは、債務不履行予測装置100、ユーザ端末機200、及び外部サーバ300からなる。
債務不履行予測装置100は、ニュース記事を収集し、収集したニュース記事の分析を介して特定企業に対する債務不履行危険性を予測する。
【0021】
債務不履行予測装置100は、メモリ手段及び演算装置を備えているコンピューティングシステムからなる。つまり、債務不履行予測装置100は集約的な処理機能を有するサーバからなり、これとは異なって、パーソナルコンピュータ(例えば、デスクトップパソコン、ノートパソコンなど)、ワークステーション、PDA、ウェブパッドなどのようにメモリ手段を備え、マイクロプロセッサを搭載して演算能力を備えたデジタル機器のうち一つからなってもよい。債務不履行予測装置100が含むメモリ手段には、債務不履行の予測に関する機能を具現するソフトウェアが貯蔵または設置された状態で記録される。
【0022】
ユーザ端末機200は、債務不履行予測装置100との通信を介して特定企業の債務不履行の危険性に関する情報を獲得しようとするユーザによって使用される端末機である。
【0023】
本発明の一実施例によるユーザ端末機200は、携帯、スマートフォン、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレットPCなどのようにネットワークを介してウェブサーバと連結されるあらゆる種類のハンドヘルド(Handheld)基盤の無線通信装置を含み、パーソナルコンピュータ(例えば、デスクトップパソコン、ノートパソコンなど)、ワークステーション、PDA、ウェブパッドなどのようにメモリ手段を備え、マイクロプロセッサを搭載して演算能力を備えたデジタル機器のうち一つであってもよい。
【0024】
一実施例によると、ユーザはユーザ端末機200を使用して債務不履行の危険性を知りたい企業に関する識別情報を債務不履行予測装置100に伝送し、債務不履行予測装置100が分析した該当企業に対する債務不履行危険性の予測に関する情報をユーザ端末機200を介して受信し確認する。
【0025】
外部サーバ300は、債務不履行予測装置100の管理主体によって管理されないサーバであって、一実施例によると、ニュースデータを含んでいるサーバである。債務不履行予測装置100は、外部サーバ300に接続してニュースデータの収集を行う。債務不履行予測装置100によって行われるニュースデータの収集は、ウェブ上で発行される多様な種類のニュースデータをクローリング(Crawling)する方式で行われる。この場合、債務不履行予測装置100は、複数の外部サーバ300からニュースデータを収集する。このように、外部サーバ300の数は特定個数に限らないことはもちろんである。
債務不履行予測装置100は、多様な方式で具現される通信網を介してユーザ端末機200及びサーバ300との通信を行う。
【0026】
通信網は、有線通信網、無線通信網、及び複合通信網のうち一つに具現される。例えば、通信網は、3G、LTE(Long Term Evolution)、及びLTE−Aのような移動通信網を含んでもよい。通信網は、Wi−Fi、UMTS(Universal Mobile Telecommunications System)/GPRS(General Packet Radio Service)、またはイーサネット(登録商標)(Ethernet)などのような有線または無線通信網を含む。通信網は、磁気セキュア伝送(MST、Magnetic Secure Transmission)、RFID(Radio Frequency IDentifiction)、NFC(Near Field Communication)、ジグビー(ZigBee)、Z−Wave、ブルートゥース(登録商標)(Bluetooth(登録商標))、低電力ブルートゥース(登録商標)(BLE、Bluetooth(登録商標) Low Energy)、または赤外線通信(IR、InfraRed communication)などのような近距離通信網を含む。通信網は、近距離ネットワーク(LAN、Local Area Network)、都市圏ネットワーク(MAN、Metropolitan Area Network)、または広域ネットワーク(WAN、Wide Area Network)などを含む。 図2は、本発明の一実施例による企業の債務不履行予測システムが動作する方式を概略的に示すフローチャートである。
図2を参照すると、債務不履行予測装置100は、概略的に3つのステップを経て最終的に企業の債務不履行の危険性を予測する。
【0027】
図2のステップ(a)はニュースデータを収集して全処理を行うステップであり、ステップ(b)はニュース記事別の危険レベルを算出するステップであり、ステップ(c)は最終的に企業の債務不履行の危険性を予測するステップである。
【0028】
図2のステップ(a)から説明すると、ステップ(a)において、債務不履行予測装置100はインターネットに接続してクローリングを介してニュース記事を収集する。この過程で、債務不履行予測装置100は、分析対象として選択された対象企業の名称を含むニュース記事のみを収集してもよい。
【0029】
次に、債務不履行予測装置100は、収集したニュース記事が分析対象企業に関するのか否かを判断し、それを介して複数のニュース記事の一部を部戦記対象記事として分類する。例えば、分析対象企業の名称をテキストの形式で含むニュース記事が存在しても、該当名称がニュース記事のテキスト上で分析対象企業の名称を称するのではなく他の用途に使用されることがあり得る。また、記事の文脈またはテーマが分析対象となる企業と関連しないこともあり得る。前記のような場合においては、ニュース記事に分析対象企業の名称が含まれていても、該当記事が分析対象記事として分類されない。
【0030】
図2のステップ(b)について説明すると、ステップ(b)において、債務不履行予測装置100は、分析対象となる企業に関連すると分類された分析対象記事それぞれに対する危険レベルを算出する。
【0031】
ステップ(b)において、分析対象記事それぞれに対する危険レベルの算出はマシンラーニング(Machine Learing)を介して行われる。つまり、債務不履行予測装置100は、収集したニュース記事の少なくとも一部をマシンラーニングのための学習用データ(Traning Set)及び試験用データ(Test set)と設定し、特定マシンラーニングアルゴリズムを採択した後、該当マシンラーニングアルゴリズムを介して学習用データに対する分析を行い、それを試験用データに適用して分析結果を評価する方式で、危険レベルの算出に使用される危険算出アルゴリズムを導出する。次に、債務不履行予測装置100は、導出された危険算出アルゴリズムを介して分析対象記事に対する危険レベルを算出する。
【0032】
債務不履行予測装置100は、多様な種類のマシンラーニングアルゴリズムに対して学習及び試験を前記のような方式で行い、その結果を評価して、評価結果が最も良いマシンラーニングアルゴリズムを採択する。評価結果によるマシンラーニングアルゴリズムの採択は債務不履行予測装置100によって自動的に行われてもよく、債務不履行予測装置100の管理者が評価結果を確認し選択してもよい。
【0033】
一実施例によると、学習用データ内にはどの企業に対して債務不履行が発生したのかに関する情報が含まれており、債務不履行予測装置100はこのような情報を活用してマシンラーニングアルゴリズムの評価を行う。例えば、債務不履行が発生した企業に関するニュース記事の危険レベルを高く算出し、債務不履行が発生していない企業に関するニュース記事の危険レベルを低く算出した程度に応じて、マシンラーニングアルゴリズムの評価か行われてもよい。
【0034】
ステップ(b)では最終的に採択されたマシンラーニングアルゴリズムによって導出された危険算出アルゴリズムが活用されて、分析対象記事それぞれに対する危険レベルが算出される。
【0035】
図2のステップ(c)について説明すると、債務不履行予測装置100は、ステップ(b)で算出されたニュース記事の危険レベルを基に、最終的に企業の債務不履行危険性を予測する。
【0036】
債務不履行予測装置100は、分析対象企業に対して分類された分析対象記事の危険レベルを基に、分析対象企業の債務不履行の危険性を数値化された形態で計算する。また、債務不履行予測装置100は計算された債務不履行の危険性を基に該当企業に対する債務不履行の予想を可否形式(yes or no)で判断してもよく、計算された債務不履行危険性の信頼度を付加的に算出してもよい。
【0037】
債務不履行予測装置100は、分析対象記事の危険レベルを基に分析対象企業の債務不履行の危険性を計算するにあたって、算出された危険レベルを基準に分析対象記事のグループ化を行い、各グループ別の特性ベクトルを生成して、それに基づいて債務不履行の危険性を計算してもよい。
図3は、本発明の一実施例による債務不履行予測装置100がニュース記事を収集する動作を示す図である。
【0038】
図3を参照すると、債務不履行予測装置100はインターネット上でクローリングを介してニュース記事を収集する。図3には、債務不履行予測装置100が収集したニュース記事のうち特定企業に関するニュース記事のみが示されている。
【0039】
一実施例によると、債務不履行予測装置100は、Luceneのような形態素分析ライブラリを利用し、全体のニュース記事のうちから特定企業の名称を含むニュース記事のみを選別する。
【0040】
図4は、本発明の一実施例による債務不履行予測装置100がNERアルゴリズムを利用して分析対象企業に関連するニュース記事を分析対象記事として分類する方式を示す図である。
【0041】
図4を参照すると、債務不履行予測装置100は、分析対象企業に関する記事を分類するのに特性化しているNER(Named Entity Recognition)アルゴリズムを活用する。図3で説明したように、形態素分析ライブラリなどを活用して全体のニュース記事のうちから特定企業の名称を含むニュース記事のみが選別されるが、この場合、選別された記事をそのまま分析対象記事として分類し使用するにはいくつかの問題点があった。問題点について説明すると、特定ニュースは該当企業と全く関係のない場合があり、形態素分析ライブラリが誤字と判断される記事を許容して関係のない記事が選別される場合もあった。また、特定企業の名称は該当企業の名称として使用されるだけでなく、該当企業が販売する商品の名称としても使用されるなど、企業の名称が異なる意味で使用されている記事が選別される場合もあった。
【0042】
前記のような問題点を解決するために、債務不履行予測装置100は、NERアルゴリズムを活用して、形態素分析ライブラリを介して選別されたニュース記事が分析対象企業に関連するニュースであるのかを判断し、該当する記事を分析対象記事として分類する。つまり、債務不履行予測装置100は、分析対象企業の名称が含まれたニュース記事を形態素分析ライブラリを活用して選別し、NERアルゴリズムを介して選別されたニュース記事それぞれに対して該当記事が分析対象企業に関連する記事であるのかを判断する。
【0043】
一実施例によると、NERアルゴリズムはプログラミング言語であるRを介して具現され、POS taggingとn−gram方式を活用して具現される。POS(Part−Of−Speech) taggingとはテキストを文法的機能や形態によって区分する方式を意味し、このような区分は多様な基準を介して行われる。n−gramとは単語をグループ化する方式であって、文をn個の音節または単語を有するグループに分類し、それに対する分析を行う方式を意味する。
【0044】
図4を参照すると、NERアルゴリズムを介して分析対象企業に対して選別されたニュース記事が分析対象企業に関連するのか否かが判断される。企業の名称が含まれたテキストが抽出されたのか否かに基づき、NERアルゴリズムが適用されて該当記事が分析対象企業に関連するのか否かが判断されるが、図4のように「ACCEPT」または「REJECT」のような可否形式で結果が導出される。
【0045】
前記のように、NERアルゴリズムによると、選別されたニュース記事それぞれに対する文脈またはテーマが識別されて、識別された文脈またはテーマが分析対象企業に関連するのか否かが判断され、特定企業の名称が該当企業を称せず他の意味として使用されているのか否かが判断される。
【0046】
図5は、本発明の一実施例による債務不履行予測装置100が分析対象記事に対する危険レベルを算出するにあたって使用する独立変数を選択する過程を示す図である。
【0047】
債務不履行予測装置100は、図3及び図4を介し、上述した方式を介して分類された分析記事に対する分析を行うにあたって、マシンラーニングアルゴリズムを活用する。債務不履行予測装置100は、特定のマシンラーニングアルゴリズムを採択し分析対象記事の一部を学習用データとして設定した後、それに対する分析を行って危険算出アルゴリズムを導出する。この過程で使用されるマシンラーニングアルゴリズムは、回帰分析または項目化分析方式を活用する。
【0048】
図5を参照すると、債務不履行予測装置100は、多様な方式を介して危険レベルの算出に使用する独立変数を選択する。危険レベルの算出に使用される独立変数は、ニュース記事に含まれる文または単語の少なくとも一部を含む。
【0049】
一実施例によると、債務不履行予測装置100は、ニュース記事に含まれる単語をn−gram形式に分類して選択するが、多様な特徴選択(Feature Selection)方式を介して単語を選択してもよい。また、単語がニュース記事で登場する頻度によって計算される希少性に基づいて、危険レベルを算出するにあたって独立変数として使用される単語が選択されてもよい。
【0050】
図5は、多様な方式で独立変数が選択された際の結果値を示す。図5の右側のグラフにおいて、横軸は独立変数の選択が異なるように行われている方式を示し、棒グラフは各方式で使用されている独立変数の個数、線グラフは各方式別評価点数を示す。
【0051】
図5を参照すると、1−3及び1−4方式から分かるように、独立変数の個数が大きくなると評価点数もそれに応じて上昇するが、このような方式では過剰適合(Overfitting)の問題が発生する恐れがあり、非常に過大な独立変数の数を処理する方式はコンピューティングシステムのリソースを過度に要求する恐れがある。よって、3−1方式と3−2方式に示したように、適切な数の独立変数が選定されれば、それによって適切な評価点数が過剰適合の問題を起こせず算出される。
【0052】
図6は、本発明の一実施例による債務不履行予測装置100が分析対象記事に対する危険レベルの算出に利用するマシンラーニングアルゴリズムを選択する過程を示す図である。
【0053】
図6を参照すると、債務不履行予測装置100は、多様な種類のマシンラーニングアルゴリズムを採択して分析対象記事を分析し、分析結果に基づいて危険算出アルゴリズムを導出する。一実施例によると、マシンラーニングアルゴリズムは回帰分析または項目化分析を利用する。マシンラーニングアルゴリズムの種類は、図6に示したように、MLP Regression、Logistic Regression、Decision Tree、Random Forest、Adaboost Classifier、SVM(Support Vector Machine)などを含む。但し、債務不履行予測装置100が採択して使用し得るマシンラーニングアルゴリズムの種類が前記例に限らないことはもちろんである。
【0054】
図6には、多様な種類のマシンラーニングアルゴリズムを介して分析対象記事を分析した結果をAUC及びジニ係数(Gini Value)を介して評価した数値を示されている。AUC(Area Under Curve)は統計学で判別モデルの性能を評価するために使用する計算方式であって、x軸をFalse Positive Rateと設定し、y軸をTrue Positive Rateと設定したグラフで表されるROC(Receiver Operating Characteristics)曲線の下の面積を意味する。AUCが最大値は1であり、高い値が出る程分類の性能が優れると解釈される。ジニ係数も統計学で判別モデルの性能を評価するために使用する計算方式のうち一つであり、グラフにおいてROC曲線と原点から始まってグラフを半分に分類する対角線の間の面積をAとし、ROC曲線の下の面積をBとすると、Aを(A+B)で割ることで求められる。AUCとジニ係数の関係は、AUCに2をかけた値から1を引くとジニ係数が算出される関係である。
【0055】
債務不履行予測装置100は上述した評価結果に基づいて特定のマシンラーニングアルゴリズムを採択し、採択したアルゴリズムを介して導出された危険算出アルゴリズム利用して分析対象記事それぞれに対する危険レベルを算出する。
図7は、本発明の一実施例による債務不履行予測装置100が分析対象記事の危険レベルに基づいて企業の債務不履行を予測する過程を示す図である。
【0056】
図7を参照すると、債務不履行予測装置100は、分析対象企業に関連する分析対象記事の危険レベルに基づいて債務不履行記事の割合を判断し、それによって債務不履行の危険性を計算する。図7を参照すると、大略の誤差は存在するが、時間が経つ程債務不履行記事の割合が次第に増加すると表示されており、債務不履行発生4ヶ月前のM−4時点からは債務不履行記事の割合とともに債務不履行危険性数値(D.D:Distance to Default)も増加すると示されている。図7において、円で示した部分701では一時的に債務不履行記事の割合が増加したが、債務不履行危険性の数値は大きな変動を示さないことが分かる。このように債務不履行予測装置100は、債務不履行記事の割合が一時的に増加するか減少しても、債務不履行危険性の数値がこれに過度に連携して変化しないように制御することができる。
図8は、本発明の一実施例による債務不履行予測装置100が特定企業に関する分析対象記事をグループ化する方式を示す図である。
【0057】
図8を参照すると、複数の分析対象記事に対する危険レベルが数値された形態に示されており、分析対象記事のグループ化が危険レベルを基準に行われた形態が示されている。
【0058】
本発明の一実施例によると、複数の分析対象記事は図8のように多様な数値の危険レベルで表されるが、これは危険レベルに基づいた任意の基準によって複数個のグループにグループ化される。図8では0.7、0.8、及び0.9の危険レベルが算出された分析対象記事が第1グループ801にグループ化されており、1.2及び1.3の危険レベルが算出された分析対象記事が第2グループ803にグループ化されており、0.3、0.4、及び0.5の危険レベルが算出された分析対象記事が第3グループ805にグループ化されている状態が示されている。このように、本発明の一実施例によると、危険レベルによる複数の区間が設定され、各区間に分析対象記事に属する記事が属するようになって、分析対象記事のグループ化が行われる。
【0059】
図9は、本発明の一実施例による債務不履行予測装置100が分類された特性ベクトルを介して分析対象企業の債務不履行の危険性を計算する方式を説明する図である。
【0060】
図9を参照すると、債務不履行予測装置100は、前記のように分析対象記事が危険レベルを基準にグループ化された後、各グループを示す特性ベクトル(Feature Vector)を生成する。特性ベクトルは、各グループに属する分析対象記事の危険レベルに基づいて計算される統計値をベクトルの元素として含む。分析対象記事の危険レベルに基づいて計算される統計値は、最小値(Minimum)、最大値(Maximum)、平均(Mean)、中央値(Median)、最頻値(mode)などを含む。
【0061】
各グループに対する特性ベクトルを生成した後、債務不履行予測装置100は、生成された特性ベクトルを基に分析対象企業の債務不履行の危険性を計算する。一実施例によると、債務不履行予測装置100は、債務不履行の危険性を計算し、最終的に該当企業の債務不履行の危険性を可否形式で判断してもよい。
【0062】
この過程で、債務不履行予測装置100は、特性ベクトルを意思決定木アルゴリズムを介して分類する。つまり、特性ベクトルが有する多様な種類の特性に基づいて特性ベクトルが分類されるが、その分類結果に基づいて、分析対象企業の債務不履行危険性の予測値が計算され、債務不履行危険性予測の信頼性も計算される。
【0063】
一実施例によると、債務不履行予測装置100は、意思決定木アルゴリズムを介して債務不履行危険性の予測値を計算するにあたって、各クラスの確率分布値に基づく。例えば、意思決定木アルゴリズムの同じ枝(branch)内で同じクラスが出る確率、つまり、データの分類に利用される特性ベクトルが特定クラスに分類される確率を基に債務不履行危険性の予測値を計算する。
【0064】
債務不履行予測装置100は、債務不履行危険性の予測と共に危険性予測の信頼度も計算するが、これは意思決定木アルゴリズムによって特性ベクトルの全ての特性が検討されていない状態で債務不履行危険性の予測値が計算されたら、信頼度を減少させる形態に計算される可能性がある。例えば、特性ベクトルが意思決定木アルゴリズム上で分類される基準が10個であれが、その基準のうち一部のみが使用された状態で最終クラスの分類が完了されて債務不履行危険性の予測値が計算されたら、使用された基準の個数が少なく算定されることで信頼度が落ちる方式で信頼度の計算が行われる可能性がある。
【0065】
図10は、本発明の一実施例による債務不履行予測装置100が意思決定木アルゴリズムを介して特性ベクトルを分類するのに利用する交差検証方式を説明する図である。
【0066】
図10を参照すると、債務不履行予測装置100は、意思決定木アルゴリズムを介して特性ベクトルを分類するにあたって、交差検証方式を介して分類を行う。詳しくは、債務不履行予測装置100は、分析対象記事について算出された危険レベル情報を含むデータに基づいて、データをn個に分類した後、n個のデータ集合のうち一つの集合を試験用データに、残りの集合を学習用データ(Training setまたはLearning set)に使用することをn回繰り返す。このように、交差検証方式によると、繰り返す過程で試験用データとして使用するデータの集合が変更され続け、異なる試験用データ及び学習用データで分析をn回まで繰り返すようにことがきるようになる。
図11は、本発明の一実施例による債務不履行予測装置100の構成を示すブロック図である。
【0067】
図11を参照すると、債務不履行予測装置100は、ニュース記事収集部110、分析企業選定部120、分析対象記事分類部130、危険レベル算出部140、特性ベクトル生成部150、債務不履行危険性予測部160、通信部170、貯蔵部180、及び制御部190を含んで構成される。
【0068】
説明の便宜上、債務不履行予測装置100内でそれぞれの役割をする主体を…部の形態で表したが、それぞれの部分は債務不履行予測装置100内で動作するサブプログラムモジュールまたは制御部190を機能的に分類した構成である。このようなプログラムモジュールは、各動作を行うか、特定の抽象データ類型を行うルーティン、サブルーティン、プログラム、オブジェクト、コンポネント、データ構造などを包括する概念であるが、これに限らない。
【0069】
ニュース記事収集部110は、インターネット上でニュース記事の収集を行う。このために、ニュース記事収集部110は、多様な種類の外部サーバ300に接続する。ニュース記事収集部110は、ウェブ上で発行されるニュース関連データに対してクローリングを行う方式でニュース記事を収集する。
【0070】
一実施例によると、ニュース記事収集部110は、分析対象企業が選択されると、該当企業に関する記事のみを分類して収集する。ニュース記事収集部110は、このような企業を行うにあたって、後述する分析企業選定部120及び分析対象記事分類部130の機能を利用する。
【0071】
分析企業選定部120は、分析対象となる企業を選択する。上述したように、ニュース記事収集部110は、分析企業選定部120が選択する企業に関する記事のみを収集し、後述する分析対象記事分類部130も分析企業選定部120が選択する企業に関する記事を分類する。一実施例によると、分析企業選定部120は複数の分析対象企業を選択してもよく、ユーザ端末機200から受信した企業情報に当たる企業を分析対象企業として選択してもよい。
【0072】
分析対象記事分類部130は、収集したニュース記事のうち分析対象企業に関連するニュース記事を分析対象記事として分類する。このために、分析対象記事分類部130は一次的に分析対象企業の名称が含まれたニュース記事を選別し、選別されたニュース記事それぞれに対して分析対象企業に関連する記事であるのか否かを判断する。
【0073】
分析対象記事分類部130は、分析対象企業の名称が含まれたニュース記事を選別するにあたって、形態素分析ライブラリを活用する。また、分析対象記事分類部130は、分析対象企業の名称が含まれたニュース記事が選別されると、選別されたニュース記事それぞれに関する文脈またはテーマを識別し、識別した文脈またはテーマが前記分析対象企業の情報に関連するのか否かを判断する。例えば、分析対象企業がおもちゃを製造する企業であり、該当企業の名称が含まれていて選別された記事のうち一つがこれには全く関係のない半導体に関する内容を含んでいれば、分析対象記事分類部130は該当記事を分析対象企業の情報とは関連しないと判断し、分析対象記事から除外する。
【0074】
危険レベル算出部140は、分析対象記事分類部130が分類した分析対象記事それぞれに対する危険レベルを算出する。この過程で、危険レベル算出部140は特定マシンラーニングアルゴリズムを採択し、該当マシンラーニングアルゴリズムを利用して収集したニュース記事に関する回帰または項目化分析を行う。危険レベル算出部140は、回帰または項目化分析の結果から導出された危険算出アルゴリズムを利用して分析対象記事それぞれに対する危険レベルを算出する。
【0075】
危険レベル算出部140は、分析対象企業に関するニュースだけでなく、ニュース記事収集部110が収集した全てのニュース記事に対して分析を行う。つまり、危険レベル算出部140は、マシンラーニングアルゴリズムを利用するにあたって、該当マシンラーニングアルゴリズムを学習させるべきであるため、学習用データとしてこのようなニュース記事を活用する。一実施例によると、危険レベル算出部140は、ニュース記事だけでなく、企業の債務不履行情報も管理する。企業の債務不履行情報は、債務不履行が発生した企業の情報と債務不履行の発生時点に関する情報を含む。
【0076】
危険レベル算出部140は、マシンラーニングアルゴリズムを介して収集したニュース記事に対する分析を行うにあたって、債務不履行が発生した企業に関するニュース記事のみをその対象としてもよく、債務不履行が発生した企業に関するニュース記事に対して該当企業の債務不履行から一定時間以内に発行されたニュース記事のみを分析対象として選択してもよい。例えば、危険レベル算出部140は、特定企業に債務不履行が発生したら、債務不履行発生日以前の2年間に発行されたニュース記事のみを分析対象としてもよい。
【0077】
このように、危険レベル算出部140が債務不履行が発生した企業に対して、企業の債務不履行発生前の一定時間以内に発行されたニュース記事のみをマシンラーニングアルゴリズムを介して分析し、分析結果によって導出された危険算出アルゴリズムを利用して分析対象記事それぞれに対する危険レベルを算出することで、危険レベル算出の正確度が向上される。つまり、危険レベル算出部140は、マシンラーニングアルゴリズムの学習を行うステップでは債務不履行が発生した事実が認知されている企業の記事を介して学習を行い、マシンラーニングアルゴリズムを介して導出された危険算出アルゴリズムを利用して債務不履行が現在まで発生していない分析対象企業のニュース記事それぞれに対する危険レベルを算出する。
【0078】
特性ベクトル生成部150は、分析対象記事それぞれに対して算出された危険レベルを基準に分析対象記事のグループ化を行い、各グループを示す特性ベクトルを生成する。
【0079】
特性ベクトルを生成150は、分析対象記事に対して算出された危険レベルの区間に応じて分析対象記事を複数のグループに分類し、各グループに含まれる分析対象記事の危険レベルの統計値に基づいてグループを示す特性ベクトルを生成する。
【0080】
一実施例によると、特性ベクトル生成部150が特性ベクトルを生成するにあたって使用する分析対象記事の危険レベルの統計値は、危険レベル数値の平均、中央値、最頻値、最小値、最大値などを含む。特性ベクトルを生成部150は、このような統計値またはこれを活用して算出された他の数値を特性ベクトルの元素にして特性ベクトルを生成する。
【0081】
一実施例によると、特性ベクトルを生成部150は、危険レベルを複数の区間に分類するにあたって、分析対象企業が属する産業の種類に応じて異なる方式で分類を行う。例えば、特性ベクトルを生成部150は、製造業、医療業、金融業、通信業などに産業を分類し、分析対象企業がどこに属するのかを捉えた後、各産業の種類に合わせて危険レベルの区間分類を行う。他の例として、特性ベクトルを生成部150は、分析対象企業が属する産業を製造業または非製造業に分類し、それによって危険レベルの各区間分類を行ってもよい。
【0082】
債務不履行危険性予測部160は、分析対象企業に対して生成された複数の特性ベクトルに基づいて該当企業の債務不履行危険性の予測値を算出し、予測値の算出に関する信頼度を計算する。
【0083】
一実施例によると、債務不履行危険性予測部160は、意思決定木アルゴリズムを介して特性ベクトルを分類することで債務不履行危険性の予測値を計算する。債務不履行危険性予測部160は、分析対象記事のグループに対して生成された特性ベクトルを含むデータをn個に分類した後、n個のデータ集合に対してn−Cross Validation方式で意思決定木を適用し、特性ベクトルの分類を行う。
【0084】
債務不履行危険性予測部160は、意思決定木の上で各クラスの確率分布値を基に債務不履行危険性の予測値を計算する。また、債務不履行危険性予測部160は、債務不履行危険性予測の信頼度を計算するにあたって、債務不履行危険性の予測値が計算される過程で意思決定木アルゴリズムによって検討された特性の個数を基に、債務不履行危険性予測の信頼度を計算する。
【0085】
通信部170は、債務不履行予測装置100がユーザ端末機200及び外部サーバ300との通信を行うようにする。通信部170が通信を行うために使用する通信網は、優先及び無線などのようなその通信様態を構わずに構成されてもよく、多様な種類の通信網で具現される。
【0086】
貯蔵部180は、債務不履行予測装置100が動作する過程で活用するデータを保管する役割をする。例えば、貯蔵部180は、収集されるニュース記事のデータ及びそれに対する分析データを貯蔵し管理してもよい。
【0087】
貯蔵部180は、例えば、メモリ(memory)、キャッシュ(cash)、バッファ(buffer)などを含み、ソフトウェア、ファームウェア、ハードウェア、またはこれらのうち少なくとも2つ以上の組み合わせからなる。一実施例によると、貯蔵部180はROM(Read Only Memory)の形態に具現される。
【0088】
制御部190は、ニュース記事収集部110、分析企業選定部120、分析対象記事分類部130、危険レベル算出部140、特性ベクトル生成部150、債務不履行危険性予測部160、通信部170、及び貯蔵部180の間のデータの流れを制御する機能を行う。つまり、本発明による制御部190は、ニュース記事収集部110、分析企業選定部120、分析対象記事分類部130、危険レベル算出部140、特性ベクトル生成部150、債務不履行危険性予測部160、通信部170、及び貯蔵部180でそれぞれ固有の機能を行うように制御する。
【0089】
図11において、ニュース記事収集部110、分析企業選定部120、分析対象記事分類部130、危険レベル算出部140、特性ベクトル生成部150、及び債務不履行危険性予測部160は、制御部190を機能的に分類した構成であるため、一つの制御部190に統合されて構成される。
図12は、本発明の一実施例による債務不履行予測装置100が分析対象記事の債務不履行危険性予測値を導出するための過程を示すフローチャートである。
【0090】
図12を参照すると、債務不履行予測装置100はインターネット上でニュース記事に対する収集を行う(S1201)。このような収集ステップで蓄積されたニュース記事のデータは、後にマシンラーニングアルゴリズムの学習用データまたは試験用データとして使用されてもよく、分析対象企業として選択される企業に関するニュース記事のみが別途に分類されて債務不履行危険性の予測に使用されてもよい。
【0091】
債務不履行予測装置100は、マシンラーニングアルゴリズムを介してニュース記事の分析を行い、危険算出アルゴリズムを導出する(S1203)。この過程で、債務不履行予測装置100は、多様な種類のマシンラーニングアルゴリズムを介してニュース記事の分析を行い、その結果を比較して特定のマシンラーニングアルゴリズムを採択する。債務不履行予測装置100は、ニュース記事のデータとは別に企業の債務不履行情報を収集して管理し、それに基づいてニュース記事の分析結果を評価する。
【0092】
債務不履行予測装置100は、分析対象となる企業を選択し、該当企業に関するニュース記事を分析対象記事として分類する(S1205)。分析対象企業の選択はユーザによって行われ、選択情報がユーザ端末機200から債務不履行予測装置100に伝達される方式で行われてもよく、債務不履行予測装置100の管理者によって行われてもよい。債務不履行予測装置100は予め収集されたニュース記事のうち該当企業に関するニュース記事を分類してもよいが、インターネット上で該当企業に関するニュース記事を新たに検索して収集してもよい。債務不履行予測装置100は、形態素ライブラリを活用して分析対象企業の名称を含む記事のみを収集する。
【0093】
債務不履行予測装置100は、分析対象となる企業を選択し該当企業に関するニュース記事を分析対象記事として分類するにあたって、形態素ライブラリを利用して収集された全体のニュース記事のうちから分析対象企業の名称を含むニュース記事のみを選別し、NERアルゴリズムを利用して選別された記事のうちから分析対象企業に関するニュース記事のみを分析対象記事として分類する。これとは異なって、債務不履行予測装置100は、収集ステップで分析対象企業の名称を含むニュース記事のみが収集されれば、それについてNERアルゴリズムを利用して分析対象企業に関するニュース記事のみを分析対象記事として分類してもよい。
【0094】
債務不履行予測装置100は、分析対象記事を分類した後、S1203で導出された危険算出アルゴリズムを利用して分析対象記事それぞれに対する危険レベルを算出するS1207。
【0095】
分析対象記事それぞれに対する危険レベルが算出されたら、債務不履行予測装置100は、算出された危険レベルを基準に分析対象記事をグループ化を行う(S1209)。一実施例によると、分析対象記事のグループ化は、各記事に対して算出された危険レベルが複数個の区間のうちどの区間に属するのかに基づいて行われる。
【0096】
債務不履行予測装置100は、分析対象記事がグループ化された結果を活用して、分析対象記事のグループ別に特性ベクトルを生成するS1211。特性ベクトルが含む元素は、各グループに含まれる分析対象記事の危険レベルに基づいて計算される各種の統計値、またはこのような統計値を活用して算出された数値である。
【0097】
債務不履行予測装置100は、最終的に、生成された特性ベクトルを基に分析対象企業の債務不履行情報の危険性を計算するS1213。分析対象企業の債務不履行危険性の計算は、意思決定木アルゴリズムを介して特性ベクトルを分類する過程を介して行われる。また、債務不履行予測装置100は、債務不履行危険性の予測値を計算する過程で債務不履行危険性予測の信頼度を別途に計算する。
【0098】
このように、本発明の多様な実施例によると、特定企業に関するニュース記事の分析を介して該当企業の債務不履行の危険性を計算することができ、銀行はそれに基づいて企業に対する信用評価を行うことができるため、企業に対する貸出リスクの管理をより強化して行うことができる。また、多様なマシンラーニングアルゴリズムのうち債務不履行危険性の計算に適合したアルゴリズムが選択され、それぞれのニュース記事を介した危険レベルが独立して計算されるだけでなく、ニュース記事のグループ化を介して総体的な債務不履行の危険性が予測される。
【0099】
本発明の実施例について説明した方法またはアルゴリズムのステップは、ハードウェアで直接具現されるか、ハードウェアによって実行されるソフトウェアモジュールで具現されるか、またはこれらの結合によって具現される。ソフトウェアモジュールは、RAM(Random Access Memory)、ROM、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、フラッシュメモリ(Flash Memory)、ハードディスク、着脱型ディスク、CD−ROM、または本発明が属する技術分野でよく知られている任意の形態のコンピュータで読み取り可能な記録媒体に常住してもよい。
【0100】
これまで添付した図面を参照して本発明の実施例を説明したが、本発明が属する技術分野の通常の技術者は、本発明がその技術的思想や必須的特徴を変更せずも他の具体的な形態に実施され得ることを理解できるはずである。よって、上述した実施例は全ての面で例示的で、制限的ではないと理解すべきである。
【符号の説明】
【0101】
100:債務不履行予測装置
200:ユーザ端末機
300:外部サーバ

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12