(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-03-03
(45)【発行日】2025-03-11
(54)【発明の名称】指標選択装置、指標選択方法、及びプログラム
(51)【国際特許分類】
G06F 16/906 20190101AFI20250304BHJP
G06Q 40/12 20230101ALI20250304BHJP
【FI】
G06F16/906
G06Q40/12 420
(21)【出願番号】P 2022578116
(86)(22)【出願日】2021-12-10
(86)【国際出願番号】 JP2021045470
(87)【国際公開番号】W WO2022163163
(87)【国際公開日】2022-08-04
【審査請求日】2023-07-05
(31)【優先権主張番号】P 2021010113
(32)【優先日】2021-01-26
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100110928
【氏名又は名称】速水 進治
(72)【発明者】
【氏名】西山 智之
【審査官】原 秀人
(56)【参考文献】
【文献】国際公開第2017/203601(WO,A1)
【文献】特開2018-045516(JP,A)
【文献】特開2007-280018(JP,A)
【文献】有賀 友紀 外,RとPythonで学ぶ[実践的]データサイエンス&機械学習,初版,日本,株式会社技術評論社,2019年12月21日,p. 147
【文献】呂 建軍 外,遺伝的プログラミングによる階層的ルール生成を用いたクラスタ検索システムの構成,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2005年09月09日,Vol. 105 No. 277,pp. 85-90
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 40/12
(57)【特許請求の範囲】
【請求項1】
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得手段と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択手段と、
を備え、
前記選択手段は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択装置。
【請求項2】
請求項1に記載の指標選択装置において、
前記取得手段は、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第2モデルを生成し、
前記複数の指標毎に当該指標が前記第2モデルの精度に与える影響の大きさを示す第2影響度を取得し、当該第2影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、指標選択装置。
【請求項3】
請求項1又は2に記載の指標選択装置において、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択手段は、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第1影響度の取得を行い、
前記第1影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、指標選択装置。
【請求項4】
請求項1~3のいずれか一項に記載の指標選択装置において、
前記評価対象は企業であり、
前記複数の指標のそれぞれは財務指標である、指標選択装置。
【請求項5】
請求項1~3のいずれか一項に記載の指標選択装置において、
前記評価対象は個人であり、
前記複数の指標の少なくとも一つは、前記個人の信用情報、収入額、又は預金額である、指標選択装置。
【請求項6】
コンピュータが、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得処理と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択処理と、
を行い、
前記選択処理において、前記コンピュータは、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択方法。
【請求項7】
請求項6に記載の指標選択方法において、
前記取得処理において、前記コンピュータは、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第2モデルを生成し、
前記複数の指標毎に当該指標が前記第2モデルの精度に与える影響の大きさを示す第2影響度を取得し、当該第2影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、指標選択方法。
【請求項8】
請求項6又は7に記載の指標選択方法において、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択処理において、前記コンピュータは、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第1影響度の取得を行い、
前記第1影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、指標選択方法。
【請求項9】
コンピュータに、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得機能と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択機能と、
を持たせ、
前記選択機能は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、プログラム。
【請求項10】
請求項9に記載のプログラムにおいて、
前記取得機能は、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第2モデルを生成し、
前記複数の指標毎に当該指標が前記第2モデルの精度に与える影響の大きさを示す第2影響度を取得し、当該第2影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、プログラム。
【請求項11】
請求項1~5のいずれか一項に記載の指標選択装置において、
前記選択手段は、前記複数の組み合わせ変数の中で前記第1影響度の大きさが大きい組み合わせ変数ほど優先して選択し、選択した組み合わせ変数に含まれる前記異なる指標を前記サポート変数として選択する、指標選択装置。
【請求項12】
請求項11に記載の指標選択装置において、
前記選択手段は、前記複数の組み合わせ変数の中で前記第1影響度が基準値より大きい組み合わせ変数を優先して選択する、指標選択装置。
【請求項13】
請求項11に記載の指標選択装置において、
前記選択手段は、前記第1影響度の大きさに基づいて決まる前記複数の組み合わせ変数の順序において、上から数えて所定の順位以内にある組み合わせ変数を優先して選択する、指標選択装置。
【請求項14】
請求項6~8のいずれか一項に記載の指標選択方法において、
前記コンピュータが、前記選択処理において、前記複数の組み合わせ変数の中で前記第1影響度の大きさが大きい組み合わせ変数ほど優先して選択し、選択した組み合わせ変数に含まれる前記異なる指標を前記サポート変数として選択する、指標選択方法。
【請求項15】
請求項14に記載の指標選択方法において、
前記コンピュータが、前記選択処理において、前記複数の組み合わせ変数の中で前記第1影響度が基準値より大きい組み合わせ変数を優先して選択する、指標選択方法。
【請求項16】
請求項14に記載の指標選択方法において、
前記コンピュータが、前記選択処理において、前記第1影響度の大きさに基づいて決まる前記複数の組み合わせ変数の順序において、上から数えて所定の順位以内にある組み合わせ変数を優先して選択する、指標選択方法。
【請求項17】
請求項9又は10に記載のプログラムにおいて、
前記選択機能は、前記複数の組み合わせ変数の中で前記第1影響度の大きさが大きい組み合わせ変数ほど優先して選択し、選択した組み合わせ変数に含まれる前記異なる指標を前記サポート変数として選択する、プログラム。
【請求項18】
請求項17に記載のプログラムにおいて、
前記選択機能は、前記複数の組み合わせ変数の中で前記第1影響度が基準値より大きい組み合わせ変数を優先して選択する、プログラム。
【請求項19】
請求項17に記載のプログラムにおいて、
前記選択機能は、前記第1影響度の大きさに基づいて決まる前記複数の組み合わせ変数の順序において、上から数えて所定の順位以内にある組み合わせ変数を優先して選択する、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、指標選択装置、指標選択方法、及びプログラムに関する。
【背景技術】
【0002】
近年は大量のデータを分析することにより、目的変数と説明変数の関係を見つけ出すことが行われている。一方、特許文献1に記載されているように、複数の説明変数の組み合わせを取ってデータ分析に用いる特徴量を生成する場合、特徴量の数が多くなりすぎることがある。これに対して特許文献1には、目的変数との相関係数がしきい値以上になる特徴量を生成することが記載されている。
【0003】
また特許文献2には、データを学習したモデルを用いて、データに含まれる複数の項目値に関する条件の組み合わせごとの、当該データにおける共起性の度合いである指標値を計算し、当該条件又は指標値に基づいて特定の組み合わせを抽出することが記載されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2020-13511号公報
【文献】特開2020-140581号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
評価対象の評価方法の一つに、複数の指標で評価する方法がある。本発明者は、これら複数の指標のうち特定の2つ以上の指標を組み合わせると、評価対象を精度よく評価できると考えた。本発明の目的は、評価対象を評価する場合において、組み合わせるべき2つ以上の指標を選択しやすくすることにある。
【課題を解決するための手段】
【0006】
本発明によれば、評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得手段と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択手段と、
を備え、
前記選択手段は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択装置が提供される。
【0007】
本発明によれば、コンピュータが、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得処理と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択処理と、
を行い、
前記選択処理において、前記コンピュータは、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択方法が提供される。
【0008】
本発明によれば、コンピュータに、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得機能と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択機能と、
を持たせ、
前記選択機能は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、プログラムが提供される。
【発明の効果】
【0009】
本発明によれば、評価対象を評価する場合において、組み合わせるべき2つ以上の指標を選択しやすくなる。
【図面の簡単な説明】
【0010】
【
図1】指標選択装置及び評価装置の利用環境を説明するための図である。
【
図2】指標選択装置の機能構成の一例を示す図である。
【
図3】訓練データ記憶部が記憶しているデータの一例を示す図である。
【
図4】組み合わせ特定情報記憶部が記憶している組み合わせ特定情報の一例を示す図である。
【
図5】組み合わせ特定情報記憶部が記憶しているグループ特定情報の一例を示す図である。
【
図7】対象データ記憶部が記憶しているデータの第1例を示す図である。
【
図8】対象データ記憶部が記憶しているデータの第2例を示す図である。
【
図9】出力部が出力するデータの一例を示す図である。
【
図10】指標選択装置のハードウェア構成例を示す図である。
【
図11】指標選択装置が行う処理の一例を示すフローチャートである。
【
図12】
図11に示したステップS110の変形例を示す図である。
【
図13】評価装置が行う処理の第1例を示すフローチャートである。
【
図14】
図13のステップS262の詳細を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0012】
図1は、実施形態に係る指標選択装置10及び評価装置20の利用環境を説明するための図である。評価装置20は、評価対象の評価結果を示す情報(以下、評価情報と記載)を生成する。評価装置20は、評価情報を生成する際に、指標選択装置10が生成した評価モデルを使用する。
【0013】
詳細には、評価対象の状態は、複数の指標によって示されている。例えば評価対象が企業であり、評価結果がその企業の健全性(例えば倒産確率)を示している場合、複数の指標のそれぞれは財務指標である。また、評価対象が個人であり、評価結果がその個人の信用力である場合、複数の指標の少なくとも一つは、その個人の信用情報、収入額、又は預金額である。
【0014】
そして指標選択装置10が生成する評価モデルは、カテゴリ変数と、サポート変数を組み合わせた指標を用いて評価情報を生成する。以下、カテゴリ変数とサポート変数の組み合わせを組み合わせ変数と記載する。カテゴリ変数及びサポート変数は、いずれも上記した複数の指標の一つである。詳細には、カテゴリ変数は、メインとなる指標であり、サポート変数は、カテゴリ変数の値の良否を解釈する際に参照される指標(ただし当該カテゴリ変数とは異なる指標)である。例えば評価対象が企業であり、カテゴリ変数が安全性指標(例えば借入金依存率)である場合、サポート変数の一例は、収益性指標(例えば総資本利益率:ROA)である。
【0015】
評価モデルが用いるカテゴリ変数の数は、一つでもよいが、複数であるのが好ましい。ただしカテゴリ変数の数は、上記した指標の数よりも少ない。そして一つのカテゴリ変数に対して、一つ以上のサポート変数(好ましくは複数のサポート変数)が設定されている。
【0016】
図2は、指標選択装置10の機能構成の一例を示す図である。指標選択装置10は、取得部110及び選択部120を有しており、上記した組み合わせ変数を少なくとも一つ(好ましくは複数)生成する。
【0017】
取得部110は、カテゴリ変数を指定する情報(以下、カテゴリ変数指定情報と記載)を取得する。取得部110は、指標選択装置10の外部からカテゴリ変数指定情報を取得してもよいし、データを処理することによってカテゴリ変数指定情報を生成してもよい。前者の場合、取得部110は、ユーザ入力によってカテゴリ変数指定情報を取得してもよいし、通信によってカテゴリ変数指定情報を取得してもよい。後者の場合、取得部110は、例えば後述する訓練データ記憶部130が記憶しているデータを用いて、カテゴリ変数指定情報を生成する。
【0018】
選択部120は、カテゴリ変数毎に、上記した複数の指標からサポート変数を選択する。言い換えると、選択部120は、少なくとも一つ(好ましくは複数)の組み合わせ変数を選択し、選択した組み合わせ変数を特定する情報(以下、組み合わせ特定情報と記載)を設定する。具体的には、選択部120は、上記した組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成する。ここで用いられる手法の一例は、XGboost又はdotDATAである。そして複数の組み合わせ変数毎に第1影響度を生成する。第1影響度は、当該組み合わせ変数が第1モデルの精度に与える影響の大きさを示している。そして選択部120は、この第1影響度を用いてサポート変数を選択する。例えば選択部120は、第1影響度が大きい順に、必要な数のサポート変数を選択する。第1影響度の一例は、Feature Importanceである。
【0019】
なお、選択部120は、カテゴリ変数毎にサポート変数を選択せずに、複数の組み合わせ変数のうち第1影響度が基準を満たす組み合わせ変数を選択することにより、組み合わせ特定情報を生成してもよい。ここで用いられる基準の一例は、「第1影響度が基準値より大きい」であるが、「第1影響度が上から数えて所定の順位以内にあること」であってもよい。
【0020】
図2に示す例において、指標選択装置10は、さらに訓練データ記憶部130、組み合わせ特定情報記憶部140、及び送信部150を備えている。
【0021】
訓練データ記憶部130は、第1モデルを生成するための訓練データを記憶している。選択部120は、訓練データ記憶部130が記憶している訓練データを用いて第1モデルを生成するとともに、複数の前記組み合わせ変数毎に第1影響度を生成する。
【0022】
なお、上記したように、訓練データは、組み合わせ変数を説明変数として、評価対象の評価結果を目的変数としている。訓練データ記憶部130は、訓練データそのものを記憶していなくても、組み合わせ変数の生成に必要なデータ(例えば複数の指標それぞれの値)及び評価結果を記憶していればよい。この場合、選択部120は、訓練データ記憶部130が記憶しているデータを用いて訓練データを生成する。
【0023】
組み合わせ特定情報記憶部140は、上記した組み合わせ特定情報を記憶する。この組み合わせ特定情報は、評価装置20が用いる評価モデルを示す情報となる。
【0024】
なお、詳細を後述するように、カテゴリ変数の値に応じて複数のグループが定められている。そして評価装置20は、評価対象が属しているグループに応じて、その評価対象の評価方法を変更する。組み合わせ特定情報記憶部140は、これらのグループを特定する情報(以下、グループ特定情報と記載)も記憶している。
【0025】
送信部150は、組み合わせ特定情報記憶部140が記憶している組み合わせ特定情報及びグループ特定情報を評価装置20に送信する。
【0026】
図3は、訓練データ記憶部130が記憶しているデータの一例を示す図である。上記したように、訓練データ記憶部130は訓練データ又は訓練データの元になる情報を記憶している。本図に示す例において、訓練データ記憶部130は、訓練データの元になる複数のデータセットを記憶している。
図3は、一つのデータセットを示している。複数のデータセットの各々は、
図3に示すように、複数の指標それぞれの値及び評価結果の値を含んでいる。一つのデータセットは、評価対象と同一種類の対象における実際のデータである。例えば評価対象が企業である場合、一つのデータセットは、ある企業における、複数の財務指標それぞれの値(複数の指標それぞれの値に該当)及び所定期間後に倒産したか否かを2値で示したデータ(評価結果の値に該当)を含んでいる。また、評価対象が個人である場合、一つのデータセットは、ある個人における、信用情報に含まれる複数の指標それぞれの値及び信用力を示す値(評価結果の値に該当)を含んでいる。
【0027】
図4は、組み合わせ特定情報記憶部140が記憶している組み合わせ特定情報の一例を示す図である。組み合わせ特定情報は、カテゴリ変数となる指標を示す情報と、そのカテゴリ変数のサポート変数となる指標を示す情報と、を含んでいる。ここで一つのカテゴリ変数に対して複数のサポート変数が指定されていてもよい。また、カテゴリ変数が複数ある場合、組み合わせ特定情報は、カテゴリ変数別にそのカテゴリ変数のサポート変数となる指標を示す情報を含んでいる。
【0028】
また、評価対象の種類が複数ある場合、組み合わせ特定情報記憶部140は、これら種類毎に組み合わせ特定情報を記憶している。例えば組み合わせ特定情報記憶部140は、企業を評価するための組み合わせ特定情報と、個人を評価するための組み合わせ特定情報と、を記憶している。
【0029】
図5は、組み合わせ特定情報記憶部140が記憶しているグループ特定情報の一例を示す図である。上記したように、カテゴリ変数の値に応じて複数のグループが定められている。グループ特定情報は、グループ毎に、そのグループの定義である、値の範囲を示す情報を記憶している。複数のカテゴリ変数が設定されている場合、組み合わせ特定情報記憶部140は、複数のカテゴリ変数毎にグループ特定情報を記憶している。
【0030】
図6は、評価装置20の機能構成の一例を示す図である。評価装置20は、組み合わせ取得部210及び評価部230を備えている。
【0031】
組み合わせ取得部210は、指標選択装置10から組み合わせ特定情報及びグループ特定情報を取得し、組み合わせ記憶部220に記憶させる。組み合わせ記憶部220は、評価装置20の一部であってもよいし、評価装置20の外部に設けられていてもよい。
【0032】
評価部230は、組み合わせ記憶部220が記憶している組み合わせ特定情報及びグループ特定情報を用いた処理を行うことにより、複数のサポート変数それぞれの評価結果を示す情報、すなわち上記した評価情報を生成する。
【0033】
詳細には、上記したように、カテゴリ変数の値に基づいて複数のグループが定められている。そして、複数のグループ毎に、サポート変数の統計値が生成されている。この統計値は、カテゴリ変数の値がそのグループに属する評価対象を母集団として生成されている。この統計値は、例えば当該サポート変数の平均値であるが、他の統計手法に基づいた値であってもよい。そして評価部230は、サポート変数毎に、評価対象の当該サポート変数の値と、当該評価対象のカテゴリ変数の値が属しているグループの当該サポート変数の統計値を用いて、評価情報、例えば評価値を生成する。評価値の一例は、標準化した値である。
【0034】
以下、評価対象が企業であり、評価結果が倒産確率であり、カテゴリ変数及びサポート変数が財務指標である場合を例に挙げる。
【0035】
複数のグループのそれぞれは、カテゴリ変数に指定された財務指標の値の範囲として定義されている。例えば
図5に示す例では、借入金依存度の値によって複数のグループが定義されている。また、カテゴリ変数の各々には、サポート変数として複数の財務指標が指定されている。評価部230は、評価対象の複数の財務指標それぞれの値のうち、そのカテゴリ変数として指定されている財務指標の値(例えば借入金依存度の値)を取得し、この値が含まれるグループ(すなわち評価対象が属するグループ)を特定する。例えばグループ特定情報が
図5に示した例であり、評価対象となる企業の借入金依存度が40%の場合、その評価対象はグループ2に属する。そして評価部230は、借入金依存度が35%超50%以下である複数の企業を母集団として、サポート変数として指定されている複数の財務指標それぞれの統計値を取得する。
【0036】
また評価部230は、評価対象の複数の財務指標それぞれの値のうち、サポート変数として指定されている複数の財務指標それぞれの値を取得する。そして評価部230は、特定したグループにおける複数のサポート変数(財務指標)それぞれの統計値と、評価対象における複数のサポート変数(財務指標)それぞれの値を用いて、複数のサポート変数それぞれの評価値を生成する。
【0037】
なお、組み合わせ特定情報においてカテゴリ変数及び複数のサポート変数の組み合わせが複数組指定されている場合、評価部230は、複数のカテゴリ変数別に、複数のサポート変数別の評価情報を生成する。
【0038】
評価部230が行う処理の詳細については、フローチャートを用いて後述する。
【0039】
なお、評価部230は、評価対象に関する情報を、対象データ記憶部240から取得する。また評価部230は、生成した評価情報を評価対象に紐づけて対象データ記憶部240に記憶させる。対象データ記憶部240は、評価装置20の一部であってもよいし、評価装置20の外部に設けられていてもよい。
【0040】
また、評価装置20は出力部250を備えている。出力部250は、評価情報を用いて出力情報を生成し、この出力情報を出力する。出力情報の出力先は、ディスプレイであってもよいし印刷装置であってもよい。上記したように、カテゴリ変数は、メインとなる指標であり、サポート変数は、カテゴリ変数の値の良否を解釈する際に参照される指標である。出力情報は、カテゴリ変数の種類を示す情報(例えば財務指標の名称)及び当該カテゴリ変数の値(例えばその財務指標の値)、サポート変数の種類を示す情報(例えば財務指標の名称)及び当該サポート変数の値(例えばその財務指標の値)、並びに当該カテゴリ変数と当該サポート変数の組み合わせの評価情報を含んでいる。
【0041】
なお、上記したように、一つのカテゴリ変数に対して複数のサポート変数が紐づいている。このため、すべてのカテゴリ変数とサポート変数の組み合わせ(すなわちすべての組み合わせ変数)に関する情報を出力情報に含めると、情報量は多くなりすぎる。そこで出力部250は、少なくともサポート変数が予め定められた基準(以下、第1基準と記載)を満たした組み合わせ変数に関する情報を選択して出力情報に含める。第1基準は、例えば、複数の組み合わせ変数に対して評価情報に基づいた順位付け(例えば評価値の大きさに基づいた順位付け)を行った場合において、上から第1の順位以内にあること、又は下から第2の順位以内にあることである。この所定の順位は、3位以上の所定の順位(1位の場合を含む)であってもよいし、5位以上の所定の順位であってもよい。また第1の順位と第2の順位は同じであってもよいし、異なっていてもよい。この所定の順位は、カテゴリ変数別に設定されていてもよい。
【0042】
図7は、対象データ記憶部240が記憶しているデータの第1例を示す図である。上記したように、対象データ記憶部240は、評価対象に関する情報を記憶している。具体的には、対象データ記憶部240は、評価対象別に、当該評価対象の各指標の値を記憶している。ここで記憶されている各指標の種類は、訓練データ記憶部130が記憶している各指標の種類と同じである。例えば評価対象が企業の場合、対象データ記憶部240が記憶している各指標は財務指標である。また評価対象が個人の場合、対象データ記憶部240が記憶している各指標は信用情報に含まれる指標である。
【0043】
なお、対象データ記憶部240は、複数の評価対象それぞれの各指標の値を記憶している。これらの値は、評価部230が上記した統計値を算出する際に用いられる。ただし上記した統計値は、評価部230の処理対象となる評価対象以外の対象の各指標の値を用いて算出されてもよい。例えば上記した統計値は、評価対象となる企業以外の企業の財務指標を用いて算出されてもよいし、評価対象となる個人以外の個人の信用情報を用いて算出されてもよい。これらの場合において、上記した統計値は、さらに、対象データ記憶部240が記憶している評価対象の統計値をさらに用いて算出されてもよい。
【0044】
また、対象データ記憶部240は、さらに上記した統計値そのものを記憶していてもよい。この場合、評価部230は、対象データ記憶部240から、評価対象の各指標の値を読み出すとともに、統計値を読み出す。
【0045】
図8は、対象データ記憶部240が記憶しているデータの第2例を示す図である。上記したように、対象データ記憶部240は、評価部230が生成した評価情報を記憶する。具体的には、対象データ記憶部240は、評価対象別に、カテゴリ変数及びサポート変数の組み合わせ毎(すなわち組み合わせ変数別)の評価情報を記憶する。ここで対象データ記憶部240は、すべての組み合わせ変数について評価情報を記憶しているのが好ましい。
【0046】
図9は、出力部250が出力するデータの一例を示す図である。本図に示す例において、出力部250は、ある評価対象における、特定の組み合わせ変数に関する情報を出力している。出力される情報は、その組み合わせ変数の評価情報(
図9においては指標評価スコアと記載)のほかに、その組み合わせ変数を構成するカテゴリ変数名(
図9においては「カテゴリ名」と記載)及びそのカテゴリ変数の値(
図9においては「カテゴリの値」と記載)、並びにその組み合わせ変数を構成するサポート変数名及びそのサポート変数の値を含んでいる。さらに
図9の例において、出力部250は、そのカテゴリ変数に関してその評価対象がどのグループに属しているかを示す情報(
図9に示す例では「閾値の条件」と記載)も出力している。
【0047】
また、出力部250は、組み合わせ変数の解釈結果を示す文章を出力している。この文章は、例えば組み合わせ変数の評価情報、その組み合わせ変数を構成するカテゴリ変数名及びそのカテゴリ変数の値、並びにその組み合わせ変数を構成するサポート変数名及びそのサポート変数の値を入力として、文章を出力とするモデルを用いて生成される。このモデルは、機械学習を用いて生成されていてもよい。なお、この文章は、
図9に示した結果を見た人が入力してもよい。
【0048】
なお、
図9に示す例において、出力部250は、組み合わせ変数毎に、補助評価情報を出力している。この補助評価情報は、評価部230によって生成されており、また、対象データ記憶部240に記憶されている。評価部230は、サポート変数を第2カテゴリ変数に設定し、その組み合わせ変数を構成するカテゴリ変数及びサポート変数とは異なる複数の指標を第2サポート変数に設定する。そして第2カテゴリ変数及び第2サポート変数の組み合わせに対して、上記した組み合わせ変数に対する処理と同様の処理を行うことにより、第2サポート変数に対する評価情報を、上記した補助評価情報として生成する。第2サポート変数は、サポート変数の値の良否を解釈する際に参照される指標である。そして出力部250は、組み合わせ変数毎に、最も補助評価情報が高い(例えば評価値が高い)第2サポート変数を選択し、当該第2サポート変数の名称(
図9においては「補助変数名」と記載)を、当該第2サポート変数の値(
図9においては「補助変数の値」と記載)と共に出力する。ここで出力部250は、さらに第2サポート変数の評価情報を出力してもよい。
【0049】
例えば評価対象が企業であり、カテゴリ変数が借入金依存度であり、サポート変数が有形固定資産回転率であり、第2サポート変数が流動性比率である場合を想定する。借入金依存度が例えば25%であり、有形固定資産回転率が5回である場合、一般的には、借入金が少なくても収益性は十分高くなっている、と判断する。ここで流動性比率が例えば300%と高い場合、短期的に資金難になる可能性は低いと解釈できる。一方、流動性比率が例えば100%と低い場合、必要な運転資金を確保できていないといえるため、不良債権や不良在庫によって、収益性が高く見えている可能性があると解釈できる。なお、この場合においても、例えば売上債権及び在庫量に問題がなければ、一時的な現金不足であり、借入金が少ないのは良い状態と判断してもよい。
【0050】
なお、評価部230は、この補助評価情報を生成しなくてもよい。
【0051】
また、組み合わせ変数の種類は多いため、上記したように、出力部250は、第1基準を満たす組み合わせ変数を、情報を出力すべき組み合わせ変数として選択している。一例として、出力部250は、複数の組み合わせ変数に対して評価情報に基づいた順位付けを行った場合において、上から第1の順位以内にある組み合わせ変数を選択するとともに、下から第2の順位以内にある組み合わせ変数を選択する。そして出力部250は、選択した組み合わせ変数の上記した情報を出力する。
【0052】
なお、出力部250は、所定の入力(例えば他の組み合わせ変数の評価情報を確認したい旨を示す入力)があったときに、評価情報が第1基準を満たさないサポート変数についても、評価情報が第1基準を満たしたサポート変数と同様の情報を出力する。
【0053】
また、出力部250は、複数のカテゴリ変数毎に、評価情報が第2基準を満たすサポート変数を選択し、選択したサポート変数及び当該カテゴリ変数を、出力部250が出力すべき組み合わせ変数の候補に設定するのが好ましい。この場合、出力部250は、選択した候補の中から、出力すべき組み合わせ変数を選択する。
【0054】
上記したように、サポート変数はカテゴリ変数の値の良否を解釈する際に参照される指標である。このため、この解釈が相反するようなサポート変数が選択されると、カテゴリ変数の解釈に混乱が生じる可能性がある。このため、第2基準は、選択されるサポート変数に統一性を持たせるために、設定される。例えば評価情報が標準化した値である場合、第2基準は、標準化した値の絶対値が最も大きいサポート変数と評価情報の正負が同一であること、である。例えば標準化した値の絶対値が最も大きいサポート変数の当該標準化した値が負の値であった場合、第2基準は「評価情報が負であること」になる。
【0055】
また、第2基準の他の例としては、複数の組み合わせ変数の全体で見たときに、同一の指標が所定回数以上(例えば3回以上)サポート変数として使用されていないこと、である。これは、ある指標が異常値である場合、その指標がサポート変数として繰り返し選択される可能性が高くなり、その評価対象の評価がその異常値に大きく影響されてしまうためである。
【0056】
また、評価部230は、複数の組み合わせ変数それぞれの評価結果を用いて、その評価対象の総合的な評価結果を示す情報(以下、統合評価情報)を生成する。例えば複数の組み合わせ変数それぞれの評価結果がスコアを有している場合、統合評価情報は、これらのスコアを統計処理した結果である。例えば各組み合わせ変数の評価結果が標準化した値を含んでいる場合、統合評価情報は、この標準化した値をすべて加算することにより生成される。
【0057】
図10は、指標選択装置10のハードウェア構成例を示す図である。指標選択装置10は、バス1010、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060を有する。
【0058】
バス1010は、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1020などを互いに接続する方法は、バス接続に限定されない。
【0059】
プロセッサ1020は、CPU(Central Processing Unit) やGPU(Graphics Processing Unit)などで実現されるプロセッサである。
【0060】
メモリ1030は、RAM(Random Access Memory)などで実現される主記憶装置である。
【0061】
ストレージデバイス1040は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、又はROM(Read Only Memory)などで実現される補助記憶装置である。ストレージデバイス1040は指標選択装置10の各機能(例えば取得部110、選択部120、及び送信部150)を実現するプログラムモジュールを記憶している。プロセッサ1020がこれら各プログラムモジュールをメモリ1030上に読み込んで実行することで、そのプログラムモジュールに対応する各機能が実現される。また、ストレージデバイス1040は訓練データ記憶部130及び組み合わせ特定情報記憶部140としても機能する。
【0062】
入出力インタフェース1050は、指標選択装置10と各種入出力機器とを接続するためのインタフェースである。
【0063】
ネットワークインタフェース1060は、指標選択装置10をネットワークに接続するためのインタフェースである。このネットワークは、例えばLAN(Local Area Network)やWAN(Wide Area Network)である。ネットワークインタフェース1060がネットワークに接続する方法は、無線接続であってもよいし、有線接続であってもよい。指標選択装置10は、ネットワークインタフェース1060を介して評価装置20と通信してもよい。
【0064】
なお、評価装置20のハードウェア構成も、
図10に示した指標選択装置10のハードウェア構成と同様である。そしてストレージデバイス1040は、評価装置20の各機能(例えば組み合わせ取得部210、評価部230、及び出力部250)を実現するプログラムモジュールを記憶している。またストレージデバイス1040は、組み合わせ記憶部220及び対象データ記憶部240としても機能する。
【0065】
図11は、指標選択装置10が行う処理の一例を示すフローチャートである。まず指標選択装置10の取得部110は、指標選択装置10の外部からカテゴリ変数指定情報を取得する(ステップS110)。例えば指標が200種類ある場合、カテゴリ変数指定情報が指定するカテゴリ変数の数は、50以下であるのが好ましい。
【0066】
そして選択部120は、カテゴリ変数指定情報が指定するカテゴリ変数の一つを選択する(ステップS120)。そして選択部120は、選択したカテゴリ変数を用いて複数の組み合わせ変数を生成する(ステップS130)。ここで生成される組み合わせ変数の数は、「用いられる指標の数-1」である。例えば指標が200種類ある場合、ここで生成される組み合わせ変数の数は199である。
【0067】
そして選択部120は、これら複数の組み合わせ変数を用いて上記した第1モデルを生成するとともに、複数の組み合わせ変数毎に上記した第1影響度を生成する(ステップS140)。そして選択部120は、これらの第1影響度を用いて、ステップS120で選択したカテゴリ変数に対するサポート変数を選択する(ステップS150)。これにより、組み合わせ変数が選択される。そして選択部120は、選択した組み合わせ変数を示す情報を、組み合わせ特定情報として組み合わせ特定情報記憶部140に記憶させる(ステップS160)。
【0068】
指標選択装置10は、カテゴリ変数指定情報が示すすべてのカテゴリ変数に対して、ステップS130~ステップS160に示した処理を行う(ステップS170及びステップS120)。
【0069】
なお、選択部120は、ステップS150及びステップS160に示した処理を、ステップS170の後に行ってもよい。この場合、選択部120は、すべての組み合わせ変数に対する第1影響度を算出した後、第1影響度が大きい順に所定の数の組み合わせ変数を選択することにより、組み合わせ特定情報を生成する。そして、この組み合わせ特定情報を組み合わせ特定情報記憶部140に記憶させる。この場合、サポート変数の数は、カテゴリ変数毎に異なり得る。例えば、複数のサポート変数が選択されるカテゴリ変数もあれば、サポート変数が全く選択されないカテゴリ変数も発生し得る。またこの場合、多重共線性を考慮して組み合わせ変数をさらに絞り込んでもよい。この絞り込みは、例えば人によって行われてもよいし、選択部120が行ってもよい。
【0070】
また指標選択装置10は、本図に示す処理とは別に、グループ特定情報を生成し、生成したグループ特定情報を組み合わせ特定情報記憶部140に記憶させておく。その後、指標選択装置10の送信部150は、所定のタイミングで組み合わせ特定情報及びグループ特定情報を評価装置20に送信する。
【0071】
図12は、
図11に示したステップS110の変形例を示す図である。本変形例において、取得部110は、訓練データ記憶部130が記憶している情報を処理することによってカテゴリ変数指定情報を生成する。
【0072】
具体的には、取得部110は、訓練データ記憶部130が記憶しているデータを用いて、第2モデルを生成する。この第2モデルは、複数の指標を説明変数として、評価結果を目的変数とする機械学習を実行することにより生成される。ここで用いられる手法の一例は、XGboost又はdotDATAである。また取得部110は、複数の指標毎に第2影響度を生成する。第2影響度は、例えばFeature Importanceであり、当該指標が第2モデルの精度に与える影響の大きさを示している(ステップS112)。
【0073】
そして取得部110は、第2影響度を用いて、複数の指標からカテゴリ変数を選択する。例えば取得部110は、第2影響度が大きい順に、所定の数の指標を、カテゴリ変数として選択する(ステップS114)。
【0074】
図13は、評価装置20が行う処理の第1例を示すフローチャートである。本図に示す処理は、評価対象を評価するための処理である。そしてこの処理の前に、評価装置20の組み合わせ取得部210は、指標選択装置10から組み合わせ特定情報及びグループ特定情報を取得して組み合わせ記憶部220に記憶させている。
【0075】
まず評価部230は、組み合わせ記憶部220から組み合わせ特定情報を読み出す(ステップS210)。組み合わせ特定情報は、カテゴリ変数、及びそのカテゴリ変数において用いられるサポート変数を示している。また評価部230は、評価対象の各指標のデータを対象データ記憶部240から読み出す(ステップS220)。そして評価部230は、組み合わせ特定情報が示す複数のカテゴリ変数のそれぞれに対して、ステップS240~ステップS262に示す処理を行う(ステップS230及びステップS270)。
【0076】
まず評価部230は、組み合わせ特定情報が示す複数のカテゴリ変数から、一つのカテゴリ変数を選択する(ステップS230)。この選択により、サポート変数として用いられるべき複数の指標も定まる。そして評価部230は、組み合わせ記憶部220から、選択したカテゴリ変数のグループ特定情報を読み出す(ステップS240)。そして評価部230は、グループ特定情報を用いて、その評価対象の当該カテゴリ変数の値が属するグループを特定する。そして評価部230は、そのグループにおける、各サポート変数の統計値を取得する(ステップS250)。そして評価部230は、これらの統計値と、その評価対象の各サポート変数の値とを用いて、各サポート変数の評価情報を生成し、対象データ記憶部240に記憶させる(ステップS260)。
【0077】
また評価部230は、各サポート変数の補助評価情報を生成し、対象データ記憶部240に記憶させる(ステップS262)。ステップS262の詳細については、
図14を用いて後述する。
【0078】
そして評価部230は、統合評価情報を生成して対象データ記憶部240に記憶させる(ステップS280)。その後、出力部250は、出力情報(例えば画面データ及び/又は印刷データ)を生成し、この出力情報を出力する(ステップS290)。
【0079】
図14は、
図13のステップS262の詳細を示すフローチャートである。評価部230は、複数のサポート変数(すなわち複数の第2カテゴリ変数)のそれぞれに対して、ステップS302~ステップS306に示す処理を行う(ステップS300及びステップS308)。
【0080】
まず評価部230は、一つのサポート変数(第2カテゴリ変数)を選択する(ステップS300)。この選択により、第2サポート変数として用いられるべき複数の指標も定まる。そして評価部230は、組み合わせ記憶部220から、選択した第2カテゴリ変数のグループ特定情報を読み出す(ステップS302)。そして評価部230は、グループ特定情報を用いて、その評価対象の当該第2カテゴリ変数の値が属するグループを特定する。そして評価部230は、そのグループにおける、各第2サポート変数の統計値を取得する(ステップS304)。そして評価部230は、これらの統計値と、その評価対象の各第2サポート変数の値とを用いて、各第2サポート変数の評価情報(すなわち補助評価情報)を生成し、対象データ記憶部240に記憶させる(ステップS306)。
【0081】
図15は、
図13の変形例を示す図である。本変形例は、第3基準を満たすグループについては、サポート変数の評価情報を生成しない点を除いて、
図14に示した例と同様である。
【0082】
具体的には、評価部230は、グループ特定情報を取得した(ステップS240)後、サポート変数の統計値を算出する(ステップS250)前に、第3基準を満たさないグループを、評価情報を生成すべきグループとして選択する(ステップS242)。そして評価部230は、評価対象の当該カテゴリ変数の値が、ステップS242で選択されたグループに属している場合にのみ(ステップS244:Yes)、ステップS260及びS262に示した処理を行う。
【0083】
第3基準は、例えば、そのグループはそのカテゴリ変数の標準的な値を有することを示している。評価対象のカテゴリ変数の値が第3基準を満たすグループに属している場合、そのカテゴリ変数に関してはその評価対象は標準的であるため、評価対象の評価結果に大きな影響を与えない。このため、第3基準を満たすグループについては、サポート変数の評価情報を生成しなくても、評価対象の評価結果はほとんど変わらない。なお、第3基準の一例は、そのグループがカテゴリ変数の最頻値、中央値、及び平均値の少なくとも一つを含むこと、である。
【0084】
なお、評価部230は、評価対象の当該カテゴリ変数の値が、ステップS242で選択されたグループに属していなかった場合(ステップS244:No)、ステップS260において、サポート変数の評価値として固定値を割り当ててもよい。この固定値は、評価値として標準的な値(例えば平均値、中央値、又は最頻値)である。
【0085】
以上、本実施形態によれば、指標選択装置10を用いることにより、評価対象を評価する場合において、組み合わせるべき2つの指標を選択しやすくなる。また評価装置20は、評価対象に対し、指標選択装置10が選択した2つの指標(すなわち組み合わせ変数)毎の評価情報を生成する。したがって、評価装置20の利用者は、これらの評価情報を確認することにより、評価対象を精度よく評価しやすくなる。
【0086】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
【0087】
また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。
【0088】
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1.評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得手段と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択手段と、
を備え、
前記選択手段は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択装置。
2.上記1に記載の指標選択装置において、
前記取得手段は、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第2モデルを生成し、
前記複数の指標毎に当該指標が前記第2モデルの精度に与える影響の大きさを示す第2影響度を取得し、当該第2影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、指標選択装置。
3.上記1又は2に記載の指標選択装置において、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択手段は、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第1影響度の取得を行い、
前記第1影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、指標選択装置。
4.上記1~3のいずれか一項に記載の指標選択装置において、
前記評価対象は企業であり、
前記複数の指標のそれぞれは財務指標である、指標選択装置。
5.上記1~3のいずれか一項に記載の指標選択装置において、
前記評価対象は個人であり、
前記複数の指標の少なくとも一つは、前記個人の信用情報、収入額、又は預金額である、指標選択装置。
6.コンピュータが、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得処理と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択処理と、
を行い、
前記選択処理において、前記コンピュータは、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択方法。
7.上記6に記載の指標選択方法において、
前記取得処理において、前記コンピュータは、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第2モデルを生成し、
前記複数の指標毎に当該指標が前記第2モデルの精度に与える影響の大きさを示す第2影響度を取得し、当該第2影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、指標選択方法。
8.上記6又は7に記載の指標選択方法において、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択処理において、前記コンピュータは、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第1影響度の取得を行い、
前記第1影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、指標選択方法。
9.上記6~8のいずれか一項に記載の指標選択方法において、
前記評価対象は企業であり、
前記複数の指標のそれぞれは財務指標である、指標選択方法。
10.上記6~8のいずれか一項に記載の指標選択方法において、
前記評価対象は個人であり、
前記複数の指標の少なくとも一つは、前記個人の信用情報、収入額、又は預金額である、指標選択方法。
11.コンピュータに、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得機能と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択機能と、
を持たせ、
前記選択機能は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第1モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第1モデルの精度に与える影響の大きさを示す第1影響度を取得し、当該第1影響度を用いて、前記複数の指標から前記サポート変数を選択する、プログラム。
12.上記11に記載のプログラムにおいて、
前記取得機能は、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第2モデルを生成し、
前記複数の指標毎に当該指標が前記第2モデルの精度に与える影響の大きさを示す第2影響度を取得し、当該第2影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、プログラム。
13.上記11又は12に記載のプログラムにおいて、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択機能は、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第1影響度の取得を行い、
前記第1影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、プログラム。
14.上記11~13のいずれか一項に記載のプログラムにおいて、
前記評価対象は企業であり、
前記複数の指標のそれぞれは財務指標である、プログラム。
15.上記11~13のいずれか一項に記載のプログラムにおいて、
前記評価対象は個人であり、
前記複数の指標の少なくとも一つは、前記個人の信用情報、収入額、又は預金額である、プログラム。
【0089】
この出願は、2021年1月26日に出願された日本出願特願2021-010113号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【符号の説明】
【0090】
10 指標選択装置
20 評価装置
110 取得部
120 選択部
130 訓練データ記憶部
140 組み合わせ特定情報記憶部
150 送信部
210 組み合わせ取得部
220 組み合わせ記憶部
230 評価部
240 対象データ記憶部
250 出力部