IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社NTTデータの特許一覧

特許7525315寄与度集約システム、寄与度集約方法およびプログラム
<>
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図1
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図2
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図3
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図4
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図5
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図6
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図7
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図8
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図9
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図10
  • 特許-寄与度集約システム、寄与度集約方法およびプログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-22
(45)【発行日】2024-07-30
(54)【発明の名称】寄与度集約システム、寄与度集約方法およびプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240723BHJP
   G06Q 40/12 20230101ALI20240723BHJP
【FI】
G06N20/00
G06Q40/12 420
【請求項の数】 6
(21)【出願番号】P 2020111459
(22)【出願日】2020-06-29
(65)【公開番号】P2022010749
(43)【公開日】2022-01-17
【審査請求日】2023-05-29
(73)【特許権者】
【識別番号】523286071
【氏名又は名称】株式会社NTTデータ
(74)【代理人】
【識別番号】110000752
【氏名又は名称】弁理士法人朝日特許事務所
(72)【発明者】
【氏名】佐藤 隆
【審査官】佐藤 直樹
(56)【参考文献】
【文献】国際公開第2017/163277(WO,A1)
【文献】特開2020-024541(JP,A)
【文献】特開2020-095398(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06Q 40/12
(57)【特許請求の範囲】
【請求項1】
学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する寄与度取得部と、
前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約部と、
前記所定の種類ごとに合計された寄与度を示す画面を生成する画面生成部と
を備え
前記寄与度取得部は、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、
前記集約部はさらに、前記取得された寄与度の複数のセットの各々について、前記所定の種類ごとに合計値を算出し、
前記寄与度の複数のセットの各々について前記所定の種類ごとに算出された合計値に基づいて、前記所定の種類ごとに統計量を算出する統計量算出部をさらに備え、
前記画面生成部は、前記所定の種類ごとに合計された寄与度と、前記算出された統計量とを示す画面を生成することを特徴とする寄与度集約システム。
【請求項2】
学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する寄与度取得部と、
前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約部と、
前記所定の種類ごとに合計された寄与度を示す画面を生成する画面生成部と、
前記画面において前記所定の種類のうちのいずれかが選択されると、選択された種類に分類される特徴量の項目について推定された寄与度を抽出する寄与度抽出部とを備え、
前記画面生成部は、前記抽出された寄与度を示す画面をさらに生成し、
前記寄与度取得部は、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、
前記特徴量の項目ごとに推定された寄与度の複数のセットに基づいて、前記特徴量の項目ごとに統計量を算出する統計量算出部をさらに備え、
前記寄与度抽出部は、前記選択された種類に分類される特徴量の項目について算出された統計量をさらに抽出し、
前記画面生成部は、前記抽出された寄与度と、前記抽出された統計量とを示す画面をさらに生成することを特徴とする寄与度集約システム。
【請求項3】
寄与度集約システムにより実行される寄与度集約方法であって、
学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する取得ステップと、
前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約ステップと、
前記所定の種類ごとに合計された寄与度を示す画面を生成する生成ステップとを含み、
前記取得ステップにおいて、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、
前記集約ステップにおいてさらに、前記取得された寄与度の複数のセットの各々について、前記所定の種類ごとに合計値を算出し、
前記寄与度の複数のセットの各々について前記所定の種類ごとに算出された合計値に基づいて、前記所定の種類ごとに統計量を算出する算出ステップをさらに含み、
前記生成ステップにおいて、前記所定の種類ごとに合計された寄与度と、前記算出された統計量とを示す画面を生成する寄与度集約方法
【請求項4】
寄与度集約システムにより実行される寄与度集約方法であって、
学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する取得ステップと、
前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約ステップと、
前記所定の種類ごとに合計された寄与度を示す画面を生成する生成ステップと、
前記画面において前記所定の種類のうちのいずれかが選択されると、選択された種類に分類される特徴量の項目について推定された寄与度を抽出する抽出ステップとを含み、
前記生成ステップにおいて、前記抽出された寄与度を示す画面をさらに生成し、
前記取得ステップにおいて、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、
前記特徴量の項目ごとに推定された寄与度の複数のセットに基づいて、前記特徴量の項目ごとに統計量を算出する算出ステップをさらに含み、
前記抽出ステップにおいて、前記選択された種類に分類される特徴量の項目について算出された統計量をさらに抽出し、前記生成ステップにおいて、前記抽出された寄与度と、前記抽出された統計量とを示す画面をさらに生成する寄与度集約方法。
【請求項5】
コンピュータに、
学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する取得ステップと、
前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約ステップと、
前記所定の種類ごとに合計された寄与度を示す画面を生成する生成ステップとを実行させ、
前記取得ステップにおいて、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、
前記集約ステップにおいてさらに、前記取得された寄与度の複数のセットの各々について、前記所定の種類ごとに合計値を算出し、
前記寄与度の複数のセットの各々について前記所定の種類ごとに算出された合計値に基づいて、前記所定の種類ごとに統計量を算出する算出ステップをさらに実行させ、
前記生成ステップにおいて、前記所定の種類ごとに合計された寄与度と、前記算出された統計量とを示す画面を生成するプログラム
【請求項6】
コンピュータに、
学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する取得ステップと、
前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約ステップと、
前記所定の種類ごとに合計された寄与度を示す画面を生成する生成ステップと、
前記画面において前記所定の種類のうちのいずれかが選択されると、選択された種類に分類される特徴量の項目について推定された寄与度を抽出する抽出ステップとを実行させ、
前記生成ステップにおいて、前記抽出された寄与度を示す画面をさらに生成し、
前記取得ステップにおいて、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、
前記特徴量の項目ごとに推定された寄与度の複数のセットに基づいて、前記特徴量の項目ごとに統計量を算出する算出ステップをさらに実行させ、
前記抽出ステップにおいて、前記選択された種類に分類される特徴量の項目について算出された統計量をさらに抽出し、
前記生成ステップにおいて、前記抽出された寄与度と、前記抽出された統計量とを示す画面をさらに生成するプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習済みモデルの推定結果の解釈を支援する方法に関する。
【背景技術】
【0002】
従来、機械学習モデルの推定結果を解釈するための手法として、SHAP(SHapley Additive exPlanations)やLIME(Local Interpretable Model-agnostic Explanations)等が知られている(非特許文献1および2参照)。これらの解釈手法では、機械学習モデルの推定に寄与した各特徴量の度合いを定量化することで、推定結果の局所的な説明が試みられている。
【先行技術文献】
【非特許文献】
【0003】
【文献】“A unified approach to interpreting model predictions”、Scott M Lundberg and Su-In Lee、Advances in Neural Information Processing Systems, 4768-4777、2016年
【文献】“Why Should I Trust You?” Explaining the Predictions of Any Classifier、Marco Tulio Ribeiro et. al.、Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining、2016年8月
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記の解釈手法によれば、特徴量単位で寄与度を定量化することで推定結果の局所的な解釈が可能になるが、特徴量の数が多くなると、推定結果を端的に解釈することが難しくなるという問題がある。
【0005】
本発明は、このような事情に鑑みてなされたものであり、学習済みモデルの推定結果の解釈を支援することを目的とする。
【課題を解決するための手段】
【0006】
上記の課題を解決するため、本発明の一実施形態に係る寄与度集約システムは、学習済モデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する寄与度取得部と、前記特徴量項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約部と、前記所定の種類ごとに合計された寄与度を示す画面を生成する画面生成部とを備え、前記寄与度取得部は、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、前記集約部はさらに、前記取得された寄与度の複数のセットの各々について、前記所定の種類ごとに合計値を算出し、前記寄与度の複数のセットの各々について前記所定の種類ごとに算出された合計値に基づいて、前記所定の種類ごとに統計量を算出する統計量算出部をさらに備え、前記画面生成部は、前記所定の種類ごとに合計された寄与度と、前記算出された統計量とを示す画面を生成することを特徴とする。
本発明の一実施形態に係る寄与度集約システムは、学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する寄与度取得部と、前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約部と、前記所定の種類ごとに合計された寄与度を示す画面を生成する画面生成部と、前記画面において前記所定の種類のうちのいずれかが選択されると、選択された種類に分類される特徴量の項目について推定された寄与度を抽出する寄与度抽出部とを備え、前記画面生成部は、前記抽出された寄与度を示す画面をさらに生成し、前記寄与度取得部は、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、前記特徴量の項目ごとに推定された寄与度の複数のセットに基づいて、前記特徴量の項目ごとに統計量を算出する統計量算出部をさらに備え、前記寄与度抽出部は、前記選択された種類に分類される特徴量の項目について算出された統計量をさらに抽出し、前記画面生成部は、前記抽出された寄与度と、前記抽出された統計量とを示す画面をさらに生成することを特徴とする。
【0012】
本発明の一実施形態に係る寄与度集約方法は、寄与度集約システムにより実行される寄与度集約方法であって、学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する取得ステップと、前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約ステップと、前記所定の種類ごとに合計された寄与度を示す画面を生成する生成ステップとを含み、前記取得ステップにおいて、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、前記集約ステップにおいてさらに、前記取得された寄与度の複数のセットの各々について、前記所定の種類ごとに合計値を算出し、前記寄与度の複数のセットの各々について前記所定の種類ごとに算出された合計値に基づいて、前記所定の種類ごとに統計量を算出する算出ステップをさらに含み、前記生成ステップにおいて、前記所定の種類ごとに合計された寄与度と、前記算出された統計量とを示す画面を生成する
本発明の一実施形態に係る寄与度集約方法は、寄与度集約システムにより実行される寄与度集約方法であって、学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する取得ステップと、前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約ステップと、前記所定の種類ごとに合計された寄与度を示す画面を生成する生成ステップと、前記画面において前記所定の種類のうちのいずれかが選択されると、選択された種類に分類される特徴量の項目について推定された寄与度を抽出する抽出ステップとを含み、前記生成ステップにおいて、前記抽出された寄与度を示す画面をさらに生成し、前記取得ステップにおいて、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、前記特徴量の項目ごとに推定された寄与度の複数のセットに基づいて、前記特徴量の項目ごとに統計量を算出する算出ステップをさらに含み、前記抽出ステップにおいて、前記選択された種類に分類される特徴量の項目について算出された統計量をさらに抽出し、前記生成ステップにおいて、前記抽出された寄与度と、前記抽出された統計量とを示す画面をさらに生成する。
【0013】
本発明の一実施形態に係るプログラムは、コンピュータに、学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する取得ステップと、前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約ステップと、前記所定の種類ごとに合計された寄与度を示す画面を生成する生成ステップとを実行させ、前記取得ステップにおいて、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、前記集約ステップにおいてさらに、前記取得された寄与度の複数のセットの各々について、前記所定の種類ごとに合計値を算出し、前記寄与度の複数のセットの各々について前記所定の種類ごとに算出された合計値に基づいて、前記所定の種類ごとに統計量を算出する算出ステップをさらに実行させ、前記生成ステップにおいて、前記所定の種類ごとに合計された寄与度と、前記算出された統計量とを示す画面を生成する
本発明の一実施形態に係るプログラムは、コンピュータに、学習済みモデルと、目的変数を出力するために当該学習済みモデルに入力された特徴量データとに基づいて特徴量の項目ごとに推定された寄与度を取得する取得ステップと、前記特徴量の項目ごとに推定された寄与度を、前記特徴量の項目を分類するための所定の種類ごとに合計する集約ステップと、前記所定の種類ごとに合計された寄与度を示す画面を生成する生成ステップと、前記画面において前記所定の種類のうちのいずれかが選択されると、選択された種類に分類される特徴量の項目について推定された寄与度を抽出する抽出ステップとを実行させ、前記生成ステップにおいて、前記抽出された寄与度を示す画面をさらに生成し、前記取得ステップにおいて、前記学習済みモデルと、目的変数を出力するために前記学習済みモデルに入力された特徴量データの複数のセットとに基づいて前記特徴量の項目ごとに推定された寄与度の複数のセットをさらに取得し、前記特徴量の項目ごとに推定された寄与度の複数のセットに基づいて、前記特徴量の項目ごとに統計量を算出する算出ステップをさらに実行させ、前記抽出ステップにおいて、前記選択された種類に分類される特徴量の項目について算出された統計量をさらに抽出し、前記生成ステップにおいて、前記抽出された寄与度と、前記抽出された統計量とを示す画面をさらに生成する。
【発明の効果】
【0014】
本発明によれば、学習済みモデルの推定結果の解釈を支援することができる。
【図面の簡単な説明】
【0015】
図1】デフォルト率予測システムの構成を示す図
図2】デフォルト率推定処理を示すフロー図
図3】推定対象データの一例を示す図
図4】寄与度データの一例を示す図
図5】分類データの一例を示す図
図6】寄与度集計データの一例を示す図
図7】デフォルト率表示画面の一例を示す図
図8】ドリルダウン画面の一例を示す図
図9】デフォルト率表示画面の一例を示す図
図10】ドリルダウン画面の一例を示す図
図11】デフォルト率表示画面の一例を示す図
【発明を実施するための形態】
【0016】
1.実施形態
本発明の一実施形態に係るデフォルト率推定システムについて図面を参照して説明する。本実施形態に係るデフォルト率推定システムは、機械学習モデルを用いて企業のデフォルト率を推定するためのシステムである。このデフォルト率推定システムはさらに、デフォルト率の推定に用いた多数の特徴量の各々について、その推定に寄与した寄与度を推定する。そして、推定した寄与度を特徴量の種類ごとに集約して、レーダーチャートの形で可視化する。このレーダーチャートを見た利用者は、デフォルト率の推定にどのような種類の特徴量が影響したかを理解することができる。
【0017】
図1は、このデフォルト率予測システムの構成を示す図である。同図に示すように、デフォルト率予測システムは、推定対象データ記憶部1、学習済みモデル記憶部2、デフォルト率推定部3、デフォルト率データ記憶部4、寄与度推定部5、寄与度データ記憶部6、分類データ記憶部7、集約部8、寄与度集計データ記憶部9および画面生成部10を備える。これらの構成要素のうち、推定対象データ記憶部1、学習済みモデル記憶部2、デフォルト率データ記憶部4、寄与度データ記憶部6、分類データ記憶部7および寄与度集計データ記憶部9は、記憶装置により実現される。残りのデフォルト率推定部3、寄与度推定部5、集約部8および画面生成部10は、記憶装置に記憶されたプログラムがプロセッサに実行されることにより実現される。
【0018】
図2は、このデフォルト率推定システムにより実行されるデフォルト率推定処理を示すフロー図を示す図である。以下では、図1および図2を参照して、このデフォルト率推定処理について説明する。
【0019】
推定対象データ記憶部1は、デフォルト率の推定対象となる企業に関するデータ(以下、「推定対象データ」という。)を記憶する。図3は、この推定対象データの一例を示す図である。同図に示すように、推定対象データは、その企業の財務状況や属性などを示す多数(例えば、1,000個)の特徴量(説明変数)データにより構成される。各特徴量データは、特徴量項目とその値により構成される。
【0020】
学習済みモデル記憶部2は、企業のデフォルト率を推定するために使用されるデフォルト率推定モデルを記憶する。このデフォルト率推定モデルは、多数の企業の企業データを、ニューラルネットワーク等の機械学習モデルに学習させることで生成される。なお、ここで言う企業データとは、企業の多数の特徴量データ(その特徴量項目の種類は、上記の推定対象データと同じ。)と、その企業のデフォルトの発生の有無を示すデータからなる。生成されたデフォルト率推定モデルは、上記の推定対象データを入力とし、デフォルト率を示すデータを出力する。
【0021】
デフォルト率推定部3は、推定対象データ記憶部1から推定対象データを読み出し、学習済みモデル記憶部2からデフォルト率推定モデルを読み出す。そして、読み出した推定対象データを入力とし、読み出したデフォルト率推定モデルを用いることで、推定対象となる企業のデフォルト率を推定する(ステップS1)。推定されたデフォルト率を示すデータは、デフォルト率データ記憶部4に記憶される。
【0022】
寄与度推定部5は、推定対象データ記憶部1から推定対象データを読み出し、学習済みモデル記憶部2からデフォルト率推定モデルを読み出す。そして、読み出した推定対象データの近傍において、読み出したデフォルト率推定モデルと出力が近似する説明関数を求め、その説明関数の係数を寄与度として抽出する(ステップS2)。具体的には、SHAPやLIME等の手法を用いて寄与度を算出する。なお、ここで言う寄与度とは、デフォルト率の推定に寄与する度合いのことである。デフォルト率の増加に寄与する寄与度は正の値で表され、デフォルト率の減少に寄与する寄与度は負の値で表される。算出された寄与度を表すデータは、寄与度データ記憶部6に記憶される。図4は、この寄与度データ記憶部6に記憶される寄与度データの一例を示す図である。同図に示すように、寄与度データは、多数の特徴量項目(その種類は、上記の推定対象データと同じ。)の各々に寄与度を対応付けたデータである。
【0023】
分類データ記憶部7は、上記の推定対象データの多数の特徴量項目が6つの種類に分類されている分類データを記憶する。ここで言う6つの種類とは、安全性、効率性、生産性、健全性、収益性および売上持続性である。多数の特徴量項目の各々は、これらの6つの種類のうち、その特徴量項目が関連する種類に手動で分類される。図5は、この分類データの一例を示す図である。同図に例示する分類データでは、例えば、「預金合計残高」が「安全性」に分類され、「融資合計金額」が「健全性」に分類され、「経常利益率」が「収益性」に分類されている。
【0024】
集約部8は、寄与度データ記憶部6から寄与度データを読み出し、分類データ記憶部7から分類データを読み出す。そして、各特徴量項目の寄与度を種類ごとに合計する(ステップS3)。その際、集約部8は、正の寄与度と負の寄与度を別々に合計する。種類ごとに合計された寄与度を示すデータは、寄与度集計データ記憶部9に記憶される。図6は、この寄与度集計データ記憶部9に記憶される寄与度集計データの一例を示す図である。同図に示すように、寄与度集計データは、6つの種類の各々に、正の寄与度の合計値と負の寄与度の合計値を対応付けたデータである。
【0025】
画面生成部10は、デフォルト率データ記憶部4からデフォルト率データを読み出し、寄与度集計データ記憶部9から寄与度集計データを読み出す。そして、読み出したデータに基づいてデフォルト率表示画面を生成する(ステップS4)。図7は、このデフォルト率表示画面の一例を示す図である。同図に示すように、デフォルト率表示画面には、デフォルト率の推定値と、寄与度集計データのレーダーチャートが含まれる。この画面に含まれる表示要素のうち、レーダーチャートを見た利用者は、そのデフォルト率の推定にどのような種類の特徴量が影響したかを理解することができる。特にこのレーダーチャートでは、多数の特徴量の寄与度が6つの種類に集約されているため、多数の特徴量の各々について寄与度が提示される場合と比較して、利用者は、そのデフォルト率が推定された根拠を端的に理解することができる。
【0026】
画面生成部10により生成されたデフォルト率表示画面は、デフォルト率推定システムと通信回線で接続される表示装置(図示略)に表示される。
【0027】
2.変形例
上記の実施形態は以下に記載するように変形してもよい。以下に記載する1以上の変形例は互いに組み合わせてもよい。
【0028】
2-1.変形例1
画面生成部10は、上記のデフォルト率表示画面に示されるデフォルト率の推定根拠の理解を助けるために、上記の6つの種類について説明する画面をさらに生成してもよい。この種類説明画面は、例えば、6つの種類の各々について、概要と、正の寄与度の解釈の仕方と、負の寄与度の解釈の仕方を示す画面である。この種類説明画面を見た利用者は、各種類の寄与度が示す意味を理解することができる。
【0029】
画面生成部10により生成された種類説明画面は、利用者の要求に応じて上記の表示装置に表示される。
【0030】
2-2.変形例2
上記のデフォルト率推定システムは、上記のデフォルト率表示画面に示される種類別の寄与度の詳細を表示させるための機能(ドリルダウン機能)を備えてもよい。この機能を備えるデフォルト率推定システムは、寄与度抽出部をさらに備える。この寄与度抽出部は、上記のデフォルト率表示画面においていずれかの種類が利用者により選択されると、寄与度データ記憶部6から寄与度データを読み出し、分類データ記憶部7から分類データを読み出す。そして、各特徴量項目の寄与度のうち、選択された種類に属する特徴量項目の寄与度を、絶対値の大きい方から順に所定数(例えば、5個)抽出する。その際、寄与度抽出部は、正の寄与度と負の寄与度をそれぞれ所定数ずつ抽出する。抽出された寄与度を表すデータは、抽出寄与度データ記憶部に記憶される。
【0031】
画面生成部10は、抽出寄与度データ記憶部から抽出寄与度データを読み出し、読み出した抽出寄与度データに基づいてドリルダウン画面を生成する。図8は、このドリルダウン画面の一例を示す図である。同図に例示するドリルダウン画面には、「健全性」という種類に属する特徴量項目の寄与度のうち、上位5項目の寄与度が、正の寄与度と負の寄与度のそれぞれについて示されている。このドリルダウン画面を見た利用者は、「健全性」という種類に属する特徴量項目のうち、デフォルト率の推定に特に影響を与えた特徴量項目を知ることができる。
【0032】
なお、上記の寄与度抽出部は、寄与度を抽出する際に、絶対値の大きい方から順に所定数抽出しているが、これに代えて、利用者により選択された種類に属する特徴量項目の寄与度であって、予め定められた特徴量項目の寄与度を抽出するようにしてもよい。このように抽出対象の特徴量項目を固定することで、他の企業との間で寄与度を比較することが容易になる。
【0033】
2-3.変形例3
上記のレーダーチャートにおいて、デフォルト率の推定対象となった企業の寄与度集計データに重ねて、企業の平均の寄与度集計データを描画するようにしてもよい。このように企業の平均の寄与度集計データを重ねて描画することで、利用者は、デフォルト率の推定対象となった企業の寄与度と企業平均の寄与度とを端的に比較することができる。
【0034】
この比較表示を可能にするために、寄与度推定部5は、複数の企業の各々について寄与度データを生成する。
【0035】
集約部8は、寄与度推定部5により生成された寄与度データの各々について寄与度集計データを生成する。
【0036】
統計量算出部は、集約部8により生成された各寄与度集計データに基づいて、種類ごとに寄与度の平均値を算出する。その際、統計量算出部は、正の寄与度の平均値と負の寄与度の平均値を別々に算出する。
【0037】
画面生成部10は、デフォルト率データ記憶部4からデフォルト率データを読み出し、寄与度集計データ記憶部9から寄与度集計データを読み出す。加えて、統計量算出部により生成された平均寄与度データを取得する。そして、取得した各データに基づいてデフォルト率表示画面を生成する。図9は、このデフォルト率表示画面の一例を示す図である。同図に示すように、デフォルト率表示画面には、デフォルト率の推定値と、寄与度集計データのレーダーチャートが含まれる。この画面に含まれる表示要素のうち、レーダーチャートには、デフォルト率の推定対象となった企業の寄与度集計データに重ねて、企業の平均の寄与度集計データが描画されている。このレーダーチャートを見た利用者は、デフォルト率の推定対象となった企業の寄与度と企業平均の寄与度とを端的に比較することができる。
【0038】
なお、上記の統計量算出部により算出される平均値は、あくまで寄与度に基づいて算出される統計量の一例である。この平均値に代えて、分散、中央値、最大値、最小値などのその他の統計量が算出されてもよい。
【0039】
2-4.変形例4
上記のドリルダウン画面において、デフォルト率の推定対象となった企業の寄与度データと並べて、企業の平均の寄与度データを配置するようにしてもよい。このように企業の平均の寄与度データを並べて配置することで、利用者は、デフォルト率の推定対象となった企業の寄与度と企業平均の寄与度とを端的に比較することができる。
【0040】
この比較表示を可能にするために、寄与度推定部5は、複数の企業の各々について寄与度データを生成する。
【0041】
統計量算出部は、寄与度推定部5により生成された各寄与度データに基づいて、特徴量項目ごとに寄与度の平均値を算出する。
【0042】
上記の寄与度抽出部は、上記の通り、抽出寄与度データを生成して、抽出寄与度データ記憶部に格納する。加えて、統計量算出部により算出された各特徴量項目の寄与度平均値のうち、上記の抽出寄与度データと共通する特徴量項目の寄与度平均値を抽出する。
【0043】
画面生成部10は、抽出寄与度データ記憶部から抽出寄与度データを読み出す。加えて、寄与度抽出部により生成された平均寄与度データを取得する。そして、取得した各データに基づいてドリルダウン画面を生成する。図10は、このドリルダウン画面の一例を示す図である。同図に例示するドリルダウン画面には、「健全性」という種類に属する特徴量項目の寄与度のうち、上位5項目の寄与度が、正の寄与度と負の寄与度のそれぞれについて示されている。加えて、その上位5項目の寄与度の平均値が、正の寄与度と負の寄与度のそれぞれについて示されている。このドリルダウン画面を見た利用者は、デフォルト率の推定対象となった企業の寄与度と企業平均の寄与度とを端的に比較することができる。
【0044】
なお、上記の統計量算出部により算出される平均値は、あくまで寄与度に基づいて算出される統計量の一例である。この平均値に代えて、分散、中央値、最大値、最小値などのその他の統計量が算出されてもよい。
【0045】
2-5.変形例5
上記の実施形態では、推定対象データの特徴量項目が6つの種類に分類されているが、この分類方法はあくまで一例である。特徴量項目の分類方法は、利用者のニーズに応じて適宜変更されてよい。
【0046】
2-6.変形例6
図7に示すデフォルト率表示画面では、寄与度集計データがレーダーチャートとして図示されているが、この図示方法はあくまで一例である。レーダーチャートに代えて、棒チャートや表形式で図示されてもよい。
【0047】
2-7.変形例7
上記の実施形態は、企業のデフォルト率を推定するためのシステムであるが、この実施形態はあくまで一例である。本発明は、学習済みモデルを用いて、デフォルト率以外の目的変数を推定するためのシステムとして実施されてもよい。
【0048】
2-8.変形例8
上記の実施形態では、集約部8は、正の寄与度と負の寄与度を別々に合計している。しかし、これに代えて、正と負を区別せずに寄与度を合計するようにしてもよい。その場合、集約部8により生成される寄与度集計データは、6つの種類の各々に1つの寄与度合計値を対応付けたデータとなる。
【0049】
集約部8は、上記の変形例3においても、正と負を区別せずに寄与度を合計するようにしてもよい。その場合、変形例3に係る統計量算出部は、種類ごとに正の寄与度平均値と負の寄与度平均値を算出することに代えて、種類ごとに1つの寄与度平均値を算出することになる。そのため、この統計量算出部により生成される平均寄与度データは、6つの種類の各々に1つの寄与度平均値を対応付けたデータとなる。
【0050】
正と負を区別せずに寄与度を合計した場合、変形例3に係る画面生成部10は、図11に示すようなデフォルト率表示画面を生成することになる。このデフォルト率表示画面に含まれるレーダーチャートでは、図9に示すレーダーチャートと異なり、デフォルト率の推定対象となった企業と企業群の各々について、種類ごとに1つの寄与度のみが示される。
【符号の説明】
【0051】
1…推定対象データ記憶部、2…学習済みモデル記憶部、3…デフォルト率推定部、4…デフォルト率データ記憶部、5…寄与度推定部、6…寄与度データ記憶部、7…分類データ記憶部、8…集約部、9…寄与度集計データ記憶部、10…画面生成部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11