特許7643469 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7643469指標選択装置、指標選択方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-03-03

(45)【発行日】2025-03-11

(54)【発明の名称】指標選択装置、指標選択方法、及びプログラム

(51)【国際特許分類】

G06F 16/906 20190101AFI20250304BHJP

G06Q 40/12 20230101ALI20250304BHJP

【ＦＩ】

G06F16/906

G06Q40/12 420

【請求項の数】 19

(21)【出願番号】P 2022578116

(86)(22)【出願日】2021-12-10

(86)【国際出願番号】 JP2021045470

(87)【国際公開番号】W WO2022163163

(87)【国際公開日】2022-08-04

【審査請求日】2023-07-05

(31)【優先権主張番号】P 2021010113

(32)【優先日】2021-01-26

(33)【優先権主張国・地域又は機関】JP

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100110928

【弁理士】

【氏名又は名称】速水進治

(72)【発明者】

【氏名】西山智之

【審査官】原秀人

(56)【参考文献】

【文献】国際公開第２０１７／２０３６０１（ＷＯ，Ａ１）

【文献】特開２０１８－０４５５１６（ＪＰ，Ａ）

【文献】特開２００７－２８００１８（ＪＰ，Ａ）

【文献】有賀友紀外，ＲとＰｙｔｈｏｎで学ぶ［実践的］データサイエンス＆機械学習，初版，日本，株式会社技術評論社，2019年12月21日，p. 147

【文献】呂建軍外，遺伝的プログラミングによる階層的ルール生成を用いたクラスタ検索システムの構成，電子情報通信学会技術研究報告，日本，社団法人電子情報通信学会，2005年09月09日，Vol. 105 No. 277，pp. 85-90

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｑ４０／１２

(57)【特許請求の範囲】

【請求項1】

評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得手段と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択手段と、
を備え、
前記選択手段は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択装置。

【請求項2】

請求項１に記載の指標選択装置において、
前記取得手段は、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第２モデルを生成し、
前記複数の指標毎に当該指標が前記第２モデルの精度に与える影響の大きさを示す第２影響度を取得し、当該第２影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、指標選択装置。

【請求項3】

請求項１又は２に記載の指標選択装置において、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択手段は、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第１影響度の取得を行い、
前記第１影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、指標選択装置。

【請求項4】

請求項１～３のいずれか一項に記載の指標選択装置において、
前記評価対象は企業であり、
前記複数の指標のそれぞれは財務指標である、指標選択装置。

【請求項5】

請求項１～３のいずれか一項に記載の指標選択装置において、
前記評価対象は個人であり、
前記複数の指標の少なくとも一つは、前記個人の信用情報、収入額、又は預金額である、指標選択装置。

【請求項6】

コンピュータが、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得処理と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択処理と、
を行い、
前記選択処理において、前記コンピュータは、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択方法。

【請求項7】

請求項６に記載の指標選択方法において、
前記取得処理において、前記コンピュータは、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第２モデルを生成し、
前記複数の指標毎に当該指標が前記第２モデルの精度に与える影響の大きさを示す第２影響度を取得し、当該第２影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、指標選択方法。

【請求項8】

請求項６又は７に記載の指標選択方法において、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択処理において、前記コンピュータは、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第１影響度の取得を行い、
前記第１影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、指標選択方法。

【請求項9】

コンピュータに、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得機能と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択機能と、
を持たせ、
前記選択機能は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、プログラム。

【請求項10】

請求項９に記載のプログラムにおいて、
前記取得機能は、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第２モデルを生成し、
前記複数の指標毎に当該指標が前記第２モデルの精度に与える影響の大きさを示す第２影響度を取得し、当該第２影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、プログラム。

【請求項11】

請求項１～５のいずれか一項に記載の指標選択装置において、
前記選択手段は、前記複数の組み合わせ変数の中で前記第１影響度の大きさが大きい組み合わせ変数ほど優先して選択し、選択した組み合わせ変数に含まれる前記異なる指標を前記サポート変数として選択する、指標選択装置。

【請求項12】

請求項１１に記載の指標選択装置において、
前記選択手段は、前記複数の組み合わせ変数の中で前記第１影響度が基準値より大きい組み合わせ変数を優先して選択する、指標選択装置。

【請求項13】

請求項１１に記載の指標選択装置において、
前記選択手段は、前記第１影響度の大きさに基づいて決まる前記複数の組み合わせ変数の順序において、上から数えて所定の順位以内にある組み合わせ変数を優先して選択する、指標選択装置。

【請求項14】

請求項６～８のいずれか一項に記載の指標選択方法において、
前記コンピュータが、前記選択処理において、前記複数の組み合わせ変数の中で前記第１影響度の大きさが大きい組み合わせ変数ほど優先して選択し、選択した組み合わせ変数に含まれる前記異なる指標を前記サポート変数として選択する、指標選択方法。

【請求項15】

請求項１４に記載の指標選択方法において、
前記コンピュータが、前記選択処理において、前記複数の組み合わせ変数の中で前記第１影響度が基準値より大きい組み合わせ変数を優先して選択する、指標選択方法。

【請求項16】

請求項１４に記載の指標選択方法において、
前記コンピュータが、前記選択処理において、前記第１影響度の大きさに基づいて決まる前記複数の組み合わせ変数の順序において、上から数えて所定の順位以内にある組み合わせ変数を優先して選択する、指標選択方法。

【請求項17】

請求項９又は１０に記載のプログラムにおいて、
前記選択機能は、前記複数の組み合わせ変数の中で前記第１影響度の大きさが大きい組み合わせ変数ほど優先して選択し、選択した組み合わせ変数に含まれる前記異なる指標を前記サポート変数として選択する、プログラム。

【請求項18】

請求項１７に記載のプログラムにおいて、
前記選択機能は、前記複数の組み合わせ変数の中で前記第１影響度が基準値より大きい組み合わせ変数を優先して選択する、プログラム。

【請求項19】

請求項１７に記載のプログラムにおいて、
前記選択機能は、前記第１影響度の大きさに基づいて決まる前記複数の組み合わせ変数の順序において、上から数えて所定の順位以内にある組み合わせ変数を優先して選択する、プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、指標選択装置、指標選択方法、及びプログラムに関する。

【背景技術】

【0002】

近年は大量のデータを分析することにより、目的変数と説明変数の関係を見つけ出すことが行われている。一方、特許文献１に記載されているように、複数の説明変数の組み合わせを取ってデータ分析に用いる特徴量を生成する場合、特徴量の数が多くなりすぎることがある。これに対して特許文献１には、目的変数との相関係数がしきい値以上になる特徴量を生成することが記載されている。

【0003】

また特許文献２には、データを学習したモデルを用いて、データに含まれる複数の項目値に関する条件の組み合わせごとの、当該データにおける共起性の度合いである指標値を計算し、当該条件又は指標値に基づいて特定の組み合わせを抽出することが記載されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０２０－１３５１１号公報

【文献】特開２０２０－１４０５８１号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

評価対象の評価方法の一つに、複数の指標で評価する方法がある。本発明者は、これら複数の指標のうち特定の２つ以上の指標を組み合わせると、評価対象を精度よく評価できると考えた。本発明の目的は、評価対象を評価する場合において、組み合わせるべき２つ以上の指標を選択しやすくすることにある。

【課題を解決するための手段】

【0006】

本発明によれば、評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得手段と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択手段と、
を備え、
前記選択手段は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択装置が提供される。

【0007】

本発明によれば、コンピュータが、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得処理と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択処理と、
を行い、
前記選択処理において、前記コンピュータは、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択方法が提供される。

【0008】

本発明によれば、コンピュータに、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得機能と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択機能と、
を持たせ、
前記選択機能は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、プログラムが提供される。

【発明の効果】

【0009】

本発明によれば、評価対象を評価する場合において、組み合わせるべき２つ以上の指標を選択しやすくなる。

【図面の簡単な説明】

【0010】

【図1】指標選択装置及び評価装置の利用環境を説明するための図である。

【図2】指標選択装置の機能構成の一例を示す図である。

【図3】訓練データ記憶部が記憶しているデータの一例を示す図である。

【図4】組み合わせ特定情報記憶部が記憶している組み合わせ特定情報の一例を示す図である。

【図5】組み合わせ特定情報記憶部が記憶しているグループ特定情報の一例を示す図である。

【図6】評価装置の機能構成の一例を示す図である。

【図7】対象データ記憶部が記憶しているデータの第１例を示す図である。

【図8】対象データ記憶部が記憶しているデータの第２例を示す図である。

【図9】出力部が出力するデータの一例を示す図である。

【図10】指標選択装置のハードウェア構成例を示す図である。

【図11】指標選択装置が行う処理の一例を示すフローチャートである。

【図12】図１１に示したステップＳ１１０の変形例を示す図である。

【図13】評価装置が行う処理の第１例を示すフローチャートである。

【図14】図１３のステップＳ２６２の詳細を示すフローチャートである。

【図15】図１３の変形例を示す図である。

【発明を実施するための形態】

【0011】

以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。

【0012】

図１は、実施形態に係る指標選択装置１０及び評価装置２０の利用環境を説明するための図である。評価装置２０は、評価対象の評価結果を示す情報（以下、評価情報と記載）を生成する。評価装置２０は、評価情報を生成する際に、指標選択装置１０が生成した評価モデルを使用する。

【0013】

詳細には、評価対象の状態は、複数の指標によって示されている。例えば評価対象が企業であり、評価結果がその企業の健全性（例えば倒産確率）を示している場合、複数の指標のそれぞれは財務指標である。また、評価対象が個人であり、評価結果がその個人の信用力である場合、複数の指標の少なくとも一つは、その個人の信用情報、収入額、又は預金額である。

【0014】

そして指標選択装置１０が生成する評価モデルは、カテゴリ変数と、サポート変数を組み合わせた指標を用いて評価情報を生成する。以下、カテゴリ変数とサポート変数の組み合わせを組み合わせ変数と記載する。カテゴリ変数及びサポート変数は、いずれも上記した複数の指標の一つである。詳細には、カテゴリ変数は、メインとなる指標であり、サポート変数は、カテゴリ変数の値の良否を解釈する際に参照される指標（ただし当該カテゴリ変数とは異なる指標）である。例えば評価対象が企業であり、カテゴリ変数が安全性指標（例えば借入金依存率）である場合、サポート変数の一例は、収益性指標（例えば総資本利益率：ＲＯＡ）である。

【0015】

評価モデルが用いるカテゴリ変数の数は、一つでもよいが、複数であるのが好ましい。ただしカテゴリ変数の数は、上記した指標の数よりも少ない。そして一つのカテゴリ変数に対して、一つ以上のサポート変数（好ましくは複数のサポート変数）が設定されている。

【0016】

図２は、指標選択装置１０の機能構成の一例を示す図である。指標選択装置１０は、取得部１１０及び選択部１２０を有しており、上記した組み合わせ変数を少なくとも一つ（好ましくは複数）生成する。

【0017】

取得部１１０は、カテゴリ変数を指定する情報（以下、カテゴリ変数指定情報と記載）を取得する。取得部１１０は、指標選択装置１０の外部からカテゴリ変数指定情報を取得してもよいし、データを処理することによってカテゴリ変数指定情報を生成してもよい。前者の場合、取得部１１０は、ユーザ入力によってカテゴリ変数指定情報を取得してもよいし、通信によってカテゴリ変数指定情報を取得してもよい。後者の場合、取得部１１０は、例えば後述する訓練データ記憶部１３０が記憶しているデータを用いて、カテゴリ変数指定情報を生成する。

【0018】

選択部１２０は、カテゴリ変数毎に、上記した複数の指標からサポート変数を選択する。言い換えると、選択部１２０は、少なくとも一つ（好ましくは複数）の組み合わせ変数を選択し、選択した組み合わせ変数を特定する情報（以下、組み合わせ特定情報と記載）を設定する。具体的には、選択部１２０は、上記した組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成する。ここで用いられる手法の一例は、XGboost又はdotDATAである。そして複数の組み合わせ変数毎に第１影響度を生成する。第１影響度は、当該組み合わせ変数が第１モデルの精度に与える影響の大きさを示している。そして選択部１２０は、この第１影響度を用いてサポート変数を選択する。例えば選択部１２０は、第１影響度が大きい順に、必要な数のサポート変数を選択する。第１影響度の一例は、Feature Importanceである。

【0019】

なお、選択部１２０は、カテゴリ変数毎にサポート変数を選択せずに、複数の組み合わせ変数のうち第１影響度が基準を満たす組み合わせ変数を選択することにより、組み合わせ特定情報を生成してもよい。ここで用いられる基準の一例は、「第１影響度が基準値より大きい」であるが、「第１影響度が上から数えて所定の順位以内にあること」であってもよい。

【0020】

図２に示す例において、指標選択装置１０は、さらに訓練データ記憶部１３０、組み合わせ特定情報記憶部１４０、及び送信部１５０を備えている。

【0021】

訓練データ記憶部１３０は、第１モデルを生成するための訓練データを記憶している。選択部１２０は、訓練データ記憶部１３０が記憶している訓練データを用いて第１モデルを生成するとともに、複数の前記組み合わせ変数毎に第１影響度を生成する。

【0022】

なお、上記したように、訓練データは、組み合わせ変数を説明変数として、評価対象の評価結果を目的変数としている。訓練データ記憶部１３０は、訓練データそのものを記憶していなくても、組み合わせ変数の生成に必要なデータ（例えば複数の指標それぞれの値）及び評価結果を記憶していればよい。この場合、選択部１２０は、訓練データ記憶部１３０が記憶しているデータを用いて訓練データを生成する。

【0023】

組み合わせ特定情報記憶部１４０は、上記した組み合わせ特定情報を記憶する。この組み合わせ特定情報は、評価装置２０が用いる評価モデルを示す情報となる。

【0024】

なお、詳細を後述するように、カテゴリ変数の値に応じて複数のグループが定められている。そして評価装置２０は、評価対象が属しているグループに応じて、その評価対象の評価方法を変更する。組み合わせ特定情報記憶部１４０は、これらのグループを特定する情報（以下、グループ特定情報と記載）も記憶している。

【0025】

送信部１５０は、組み合わせ特定情報記憶部１４０が記憶している組み合わせ特定情報及びグループ特定情報を評価装置２０に送信する。

【0026】

図３は、訓練データ記憶部１３０が記憶しているデータの一例を示す図である。上記したように、訓練データ記憶部１３０は訓練データ又は訓練データの元になる情報を記憶している。本図に示す例において、訓練データ記憶部１３０は、訓練データの元になる複数のデータセットを記憶している。図３は、一つのデータセットを示している。複数のデータセットの各々は、図３に示すように、複数の指標それぞれの値及び評価結果の値を含んでいる。一つのデータセットは、評価対象と同一種類の対象における実際のデータである。例えば評価対象が企業である場合、一つのデータセットは、ある企業における、複数の財務指標それぞれの値（複数の指標それぞれの値に該当）及び所定期間後に倒産したか否かを２値で示したデータ（評価結果の値に該当）を含んでいる。また、評価対象が個人である場合、一つのデータセットは、ある個人における、信用情報に含まれる複数の指標それぞれの値及び信用力を示す値（評価結果の値に該当）を含んでいる。

【0027】

図４は、組み合わせ特定情報記憶部１４０が記憶している組み合わせ特定情報の一例を示す図である。組み合わせ特定情報は、カテゴリ変数となる指標を示す情報と、そのカテゴリ変数のサポート変数となる指標を示す情報と、を含んでいる。ここで一つのカテゴリ変数に対して複数のサポート変数が指定されていてもよい。また、カテゴリ変数が複数ある場合、組み合わせ特定情報は、カテゴリ変数別にそのカテゴリ変数のサポート変数となる指標を示す情報を含んでいる。

【0028】

また、評価対象の種類が複数ある場合、組み合わせ特定情報記憶部１４０は、これら種類毎に組み合わせ特定情報を記憶している。例えば組み合わせ特定情報記憶部１４０は、企業を評価するための組み合わせ特定情報と、個人を評価するための組み合わせ特定情報と、を記憶している。

【0029】

図５は、組み合わせ特定情報記憶部１４０が記憶しているグループ特定情報の一例を示す図である。上記したように、カテゴリ変数の値に応じて複数のグループが定められている。グループ特定情報は、グループ毎に、そのグループの定義である、値の範囲を示す情報を記憶している。複数のカテゴリ変数が設定されている場合、組み合わせ特定情報記憶部１４０は、複数のカテゴリ変数毎にグループ特定情報を記憶している。

【0030】

図６は、評価装置２０の機能構成の一例を示す図である。評価装置２０は、組み合わせ取得部２１０及び評価部２３０を備えている。

【0031】

組み合わせ取得部２１０は、指標選択装置１０から組み合わせ特定情報及びグループ特定情報を取得し、組み合わせ記憶部２２０に記憶させる。組み合わせ記憶部２２０は、評価装置２０の一部であってもよいし、評価装置２０の外部に設けられていてもよい。

【0032】

評価部２３０は、組み合わせ記憶部２２０が記憶している組み合わせ特定情報及びグループ特定情報を用いた処理を行うことにより、複数のサポート変数それぞれの評価結果を示す情報、すなわち上記した評価情報を生成する。

【0033】

詳細には、上記したように、カテゴリ変数の値に基づいて複数のグループが定められている。そして、複数のグループ毎に、サポート変数の統計値が生成されている。この統計値は、カテゴリ変数の値がそのグループに属する評価対象を母集団として生成されている。この統計値は、例えば当該サポート変数の平均値であるが、他の統計手法に基づいた値であってもよい。そして評価部２３０は、サポート変数毎に、評価対象の当該サポート変数の値と、当該評価対象のカテゴリ変数の値が属しているグループの当該サポート変数の統計値を用いて、評価情報、例えば評価値を生成する。評価値の一例は、標準化した値である。

【0034】

以下、評価対象が企業であり、評価結果が倒産確率であり、カテゴリ変数及びサポート変数が財務指標である場合を例に挙げる。

【0035】

複数のグループのそれぞれは、カテゴリ変数に指定された財務指標の値の範囲として定義されている。例えば図５に示す例では、借入金依存度の値によって複数のグループが定義されている。また、カテゴリ変数の各々には、サポート変数として複数の財務指標が指定されている。評価部２３０は、評価対象の複数の財務指標それぞれの値のうち、そのカテゴリ変数として指定されている財務指標の値（例えば借入金依存度の値）を取得し、この値が含まれるグループ（すなわち評価対象が属するグループ）を特定する。例えばグループ特定情報が図５に示した例であり、評価対象となる企業の借入金依存度が４０％の場合、その評価対象はグループ２に属する。そして評価部２３０は、借入金依存度が３５％超５０％以下である複数の企業を母集団として、サポート変数として指定されている複数の財務指標それぞれの統計値を取得する。

【0036】

また評価部２３０は、評価対象の複数の財務指標それぞれの値のうち、サポート変数として指定されている複数の財務指標それぞれの値を取得する。そして評価部２３０は、特定したグループにおける複数のサポート変数（財務指標）それぞれの統計値と、評価対象における複数のサポート変数（財務指標）それぞれの値を用いて、複数のサポート変数それぞれの評価値を生成する。

【0037】

なお、組み合わせ特定情報においてカテゴリ変数及び複数のサポート変数の組み合わせが複数組指定されている場合、評価部２３０は、複数のカテゴリ変数別に、複数のサポート変数別の評価情報を生成する。

【0038】

評価部２３０が行う処理の詳細については、フローチャートを用いて後述する。

【0039】

なお、評価部２３０は、評価対象に関する情報を、対象データ記憶部２４０から取得する。また評価部２３０は、生成した評価情報を評価対象に紐づけて対象データ記憶部２４０に記憶させる。対象データ記憶部２４０は、評価装置２０の一部であってもよいし、評価装置２０の外部に設けられていてもよい。

【0040】

また、評価装置２０は出力部２５０を備えている。出力部２５０は、評価情報を用いて出力情報を生成し、この出力情報を出力する。出力情報の出力先は、ディスプレイであってもよいし印刷装置であってもよい。上記したように、カテゴリ変数は、メインとなる指標であり、サポート変数は、カテゴリ変数の値の良否を解釈する際に参照される指標である。出力情報は、カテゴリ変数の種類を示す情報（例えば財務指標の名称）及び当該カテゴリ変数の値（例えばその財務指標の値）、サポート変数の種類を示す情報（例えば財務指標の名称）及び当該サポート変数の値（例えばその財務指標の値）、並びに当該カテゴリ変数と当該サポート変数の組み合わせの評価情報を含んでいる。

【0041】

なお、上記したように、一つのカテゴリ変数に対して複数のサポート変数が紐づいている。このため、すべてのカテゴリ変数とサポート変数の組み合わせ（すなわちすべての組み合わせ変数）に関する情報を出力情報に含めると、情報量は多くなりすぎる。そこで出力部２５０は、少なくともサポート変数が予め定められた基準（以下、第１基準と記載）を満たした組み合わせ変数に関する情報を選択して出力情報に含める。第１基準は、例えば、複数の組み合わせ変数に対して評価情報に基づいた順位付け（例えば評価値の大きさに基づいた順位付け）を行った場合において、上から第１の順位以内にあること、又は下から第２の順位以内にあることである。この所定の順位は、３位以上の所定の順位（１位の場合を含む）であってもよいし、５位以上の所定の順位であってもよい。また第１の順位と第２の順位は同じであってもよいし、異なっていてもよい。この所定の順位は、カテゴリ変数別に設定されていてもよい。

【0042】

図７は、対象データ記憶部２４０が記憶しているデータの第１例を示す図である。上記したように、対象データ記憶部２４０は、評価対象に関する情報を記憶している。具体的には、対象データ記憶部２４０は、評価対象別に、当該評価対象の各指標の値を記憶している。ここで記憶されている各指標の種類は、訓練データ記憶部１３０が記憶している各指標の種類と同じである。例えば評価対象が企業の場合、対象データ記憶部２４０が記憶している各指標は財務指標である。また評価対象が個人の場合、対象データ記憶部２４０が記憶している各指標は信用情報に含まれる指標である。

【0043】

なお、対象データ記憶部２４０は、複数の評価対象それぞれの各指標の値を記憶している。これらの値は、評価部２３０が上記した統計値を算出する際に用いられる。ただし上記した統計値は、評価部２３０の処理対象となる評価対象以外の対象の各指標の値を用いて算出されてもよい。例えば上記した統計値は、評価対象となる企業以外の企業の財務指標を用いて算出されてもよいし、評価対象となる個人以外の個人の信用情報を用いて算出されてもよい。これらの場合において、上記した統計値は、さらに、対象データ記憶部２４０が記憶している評価対象の統計値をさらに用いて算出されてもよい。

【0044】

また、対象データ記憶部２４０は、さらに上記した統計値そのものを記憶していてもよい。この場合、評価部２３０は、対象データ記憶部２４０から、評価対象の各指標の値を読み出すとともに、統計値を読み出す。

【0045】

図８は、対象データ記憶部２４０が記憶しているデータの第２例を示す図である。上記したように、対象データ記憶部２４０は、評価部２３０が生成した評価情報を記憶する。具体的には、対象データ記憶部２４０は、評価対象別に、カテゴリ変数及びサポート変数の組み合わせ毎（すなわち組み合わせ変数別）の評価情報を記憶する。ここで対象データ記憶部２４０は、すべての組み合わせ変数について評価情報を記憶しているのが好ましい。

【0046】

図９は、出力部２５０が出力するデータの一例を示す図である。本図に示す例において、出力部２５０は、ある評価対象における、特定の組み合わせ変数に関する情報を出力している。出力される情報は、その組み合わせ変数の評価情報（図９においては指標評価スコアと記載）のほかに、その組み合わせ変数を構成するカテゴリ変数名（図９においては「カテゴリ名」と記載）及びそのカテゴリ変数の値（図９においては「カテゴリの値」と記載）、並びにその組み合わせ変数を構成するサポート変数名及びそのサポート変数の値を含んでいる。さらに図９の例において、出力部２５０は、そのカテゴリ変数に関してその評価対象がどのグループに属しているかを示す情報（図９に示す例では「閾値の条件」と記載）も出力している。

【0047】

また、出力部２５０は、組み合わせ変数の解釈結果を示す文章を出力している。この文章は、例えば組み合わせ変数の評価情報、その組み合わせ変数を構成するカテゴリ変数名及びそのカテゴリ変数の値、並びにその組み合わせ変数を構成するサポート変数名及びそのサポート変数の値を入力として、文章を出力とするモデルを用いて生成される。このモデルは、機械学習を用いて生成されていてもよい。なお、この文章は、図９に示した結果を見た人が入力してもよい。

【0048】

なお、図９に示す例において、出力部２５０は、組み合わせ変数毎に、補助評価情報を出力している。この補助評価情報は、評価部２３０によって生成されており、また、対象データ記憶部２４０に記憶されている。評価部２３０は、サポート変数を第２カテゴリ変数に設定し、その組み合わせ変数を構成するカテゴリ変数及びサポート変数とは異なる複数の指標を第２サポート変数に設定する。そして第２カテゴリ変数及び第２サポート変数の組み合わせに対して、上記した組み合わせ変数に対する処理と同様の処理を行うことにより、第２サポート変数に対する評価情報を、上記した補助評価情報として生成する。第２サポート変数は、サポート変数の値の良否を解釈する際に参照される指標である。そして出力部２５０は、組み合わせ変数毎に、最も補助評価情報が高い（例えば評価値が高い）第２サポート変数を選択し、当該第２サポート変数の名称（図９においては「補助変数名」と記載）を、当該第２サポート変数の値（図９においては「補助変数の値」と記載）と共に出力する。ここで出力部２５０は、さらに第２サポート変数の評価情報を出力してもよい。

【0049】

例えば評価対象が企業であり、カテゴリ変数が借入金依存度であり、サポート変数が有形固定資産回転率であり、第２サポート変数が流動性比率である場合を想定する。借入金依存度が例えば２５％であり、有形固定資産回転率が５回である場合、一般的には、借入金が少なくても収益性は十分高くなっている、と判断する。ここで流動性比率が例えば３００％と高い場合、短期的に資金難になる可能性は低いと解釈できる。一方、流動性比率が例えば１００％と低い場合、必要な運転資金を確保できていないといえるため、不良債権や不良在庫によって、収益性が高く見えている可能性があると解釈できる。なお、この場合においても、例えば売上債権及び在庫量に問題がなければ、一時的な現金不足であり、借入金が少ないのは良い状態と判断してもよい。

【0050】

なお、評価部２３０は、この補助評価情報を生成しなくてもよい。

【0051】

また、組み合わせ変数の種類は多いため、上記したように、出力部２５０は、第１基準を満たす組み合わせ変数を、情報を出力すべき組み合わせ変数として選択している。一例として、出力部２５０は、複数の組み合わせ変数に対して評価情報に基づいた順位付けを行った場合において、上から第１の順位以内にある組み合わせ変数を選択するとともに、下から第２の順位以内にある組み合わせ変数を選択する。そして出力部２５０は、選択した組み合わせ変数の上記した情報を出力する。

【0052】

なお、出力部２５０は、所定の入力（例えば他の組み合わせ変数の評価情報を確認したい旨を示す入力）があったときに、評価情報が第１基準を満たさないサポート変数についても、評価情報が第１基準を満たしたサポート変数と同様の情報を出力する。

【0053】

また、出力部２５０は、複数のカテゴリ変数毎に、評価情報が第２基準を満たすサポート変数を選択し、選択したサポート変数及び当該カテゴリ変数を、出力部２５０が出力すべき組み合わせ変数の候補に設定するのが好ましい。この場合、出力部２５０は、選択した候補の中から、出力すべき組み合わせ変数を選択する。

【0054】

上記したように、サポート変数はカテゴリ変数の値の良否を解釈する際に参照される指標である。このため、この解釈が相反するようなサポート変数が選択されると、カテゴリ変数の解釈に混乱が生じる可能性がある。このため、第２基準は、選択されるサポート変数に統一性を持たせるために、設定される。例えば評価情報が標準化した値である場合、第２基準は、標準化した値の絶対値が最も大きいサポート変数と評価情報の正負が同一であること、である。例えば標準化した値の絶対値が最も大きいサポート変数の当該標準化した値が負の値であった場合、第２基準は「評価情報が負であること」になる。

【0055】

また、第２基準の他の例としては、複数の組み合わせ変数の全体で見たときに、同一の指標が所定回数以上（例えば３回以上）サポート変数として使用されていないこと、である。これは、ある指標が異常値である場合、その指標がサポート変数として繰り返し選択される可能性が高くなり、その評価対象の評価がその異常値に大きく影響されてしまうためである。

【0056】

また、評価部２３０は、複数の組み合わせ変数それぞれの評価結果を用いて、その評価対象の総合的な評価結果を示す情報（以下、統合評価情報）を生成する。例えば複数の組み合わせ変数それぞれの評価結果がスコアを有している場合、統合評価情報は、これらのスコアを統計処理した結果である。例えば各組み合わせ変数の評価結果が標準化した値を含んでいる場合、統合評価情報は、この標準化した値をすべて加算することにより生成される。

【0057】

図１０は、指標選択装置１０のハードウェア構成例を示す図である。指標選択装置１０は、バス１０１０、プロセッサ１０２０、メモリ１０３０、ストレージデバイス１０４０、入出力インタフェース１０５０、及びネットワークインタフェース１０６０を有する。

【0058】

バス１０１０は、プロセッサ１０２０、メモリ１０３０、ストレージデバイス１０４０、入出力インタフェース１０５０、及びネットワークインタフェース１０６０が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ１０２０などを互いに接続する方法は、バス接続に限定されない。

【0059】

プロセッサ１０２０は、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）などで実現されるプロセッサである。

【0060】

メモリ１０３０は、ＲＡＭ（Random Access Memory）などで実現される主記憶装置である。

【0061】

ストレージデバイス１０４０は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、メモリカード、又はＲＯＭ（Read Only Memory）などで実現される補助記憶装置である。ストレージデバイス１０４０は指標選択装置１０の各機能（例えば取得部１１０、選択部１２０、及び送信部１５０）を実現するプログラムモジュールを記憶している。プロセッサ１０２０がこれら各プログラムモジュールをメモリ１０３０上に読み込んで実行することで、そのプログラムモジュールに対応する各機能が実現される。また、ストレージデバイス１０４０は訓練データ記憶部１３０及び組み合わせ特定情報記憶部１４０としても機能する。

【0062】

入出力インタフェース１０５０は、指標選択装置１０と各種入出力機器とを接続するためのインタフェースである。

【0063】

ネットワークインタフェース１０６０は、指標選択装置１０をネットワークに接続するためのインタフェースである。このネットワークは、例えばＬＡＮ（Local Area Network）やＷＡＮ（Wide Area Network）である。ネットワークインタフェース１０６０がネットワークに接続する方法は、無線接続であってもよいし、有線接続であってもよい。指標選択装置１０は、ネットワークインタフェース１０６０を介して評価装置２０と通信してもよい。

【0064】

なお、評価装置２０のハードウェア構成も、図１０に示した指標選択装置１０のハードウェア構成と同様である。そしてストレージデバイス１０４０は、評価装置２０の各機能（例えば組み合わせ取得部２１０、評価部２３０、及び出力部２５０）を実現するプログラムモジュールを記憶している。またストレージデバイス１０４０は、組み合わせ記憶部２２０及び対象データ記憶部２４０としても機能する。

【0065】

図１１は、指標選択装置１０が行う処理の一例を示すフローチャートである。まず指標選択装置１０の取得部１１０は、指標選択装置１０の外部からカテゴリ変数指定情報を取得する（ステップＳ１１０）。例えば指標が２００種類ある場合、カテゴリ変数指定情報が指定するカテゴリ変数の数は、５０以下であるのが好ましい。

【0066】

そして選択部１２０は、カテゴリ変数指定情報が指定するカテゴリ変数の一つを選択する（ステップＳ１２０）。そして選択部１２０は、選択したカテゴリ変数を用いて複数の組み合わせ変数を生成する（ステップＳ１３０）。ここで生成される組み合わせ変数の数は、「用いられる指標の数－１」である。例えば指標が２００種類ある場合、ここで生成される組み合わせ変数の数は１９９である。

【0067】

そして選択部１２０は、これら複数の組み合わせ変数を用いて上記した第１モデルを生成するとともに、複数の組み合わせ変数毎に上記した第１影響度を生成する（ステップＳ１４０）。そして選択部１２０は、これらの第１影響度を用いて、ステップＳ１２０で選択したカテゴリ変数に対するサポート変数を選択する（ステップＳ１５０）。これにより、組み合わせ変数が選択される。そして選択部１２０は、選択した組み合わせ変数を示す情報を、組み合わせ特定情報として組み合わせ特定情報記憶部１４０に記憶させる（ステップＳ１６０）。

【0068】

指標選択装置１０は、カテゴリ変数指定情報が示すすべてのカテゴリ変数に対して、ステップＳ１３０～ステップＳ１６０に示した処理を行う（ステップＳ１７０及びステップＳ１２０）。

【0069】

なお、選択部１２０は、ステップＳ１５０及びステップＳ１６０に示した処理を、ステップＳ１７０の後に行ってもよい。この場合、選択部１２０は、すべての組み合わせ変数に対する第１影響度を算出した後、第１影響度が大きい順に所定の数の組み合わせ変数を選択することにより、組み合わせ特定情報を生成する。そして、この組み合わせ特定情報を組み合わせ特定情報記憶部１４０に記憶させる。この場合、サポート変数の数は、カテゴリ変数毎に異なり得る。例えば、複数のサポート変数が選択されるカテゴリ変数もあれば、サポート変数が全く選択されないカテゴリ変数も発生し得る。またこの場合、多重共線性を考慮して組み合わせ変数をさらに絞り込んでもよい。この絞り込みは、例えば人によって行われてもよいし、選択部１２０が行ってもよい。

【0070】

また指標選択装置１０は、本図に示す処理とは別に、グループ特定情報を生成し、生成したグループ特定情報を組み合わせ特定情報記憶部１４０に記憶させておく。その後、指標選択装置１０の送信部１５０は、所定のタイミングで組み合わせ特定情報及びグループ特定情報を評価装置２０に送信する。

【0071】

図１２は、図１１に示したステップＳ１１０の変形例を示す図である。本変形例において、取得部１１０は、訓練データ記憶部１３０が記憶している情報を処理することによってカテゴリ変数指定情報を生成する。

【0072】

具体的には、取得部１１０は、訓練データ記憶部１３０が記憶しているデータを用いて、第２モデルを生成する。この第２モデルは、複数の指標を説明変数として、評価結果を目的変数とする機械学習を実行することにより生成される。ここで用いられる手法の一例は、XGboost又はdotDATAである。また取得部１１０は、複数の指標毎に第２影響度を生成する。第２影響度は、例えばFeature Importanceであり、当該指標が第２モデルの精度に与える影響の大きさを示している（ステップＳ１１２）。

【0073】

そして取得部１１０は、第２影響度を用いて、複数の指標からカテゴリ変数を選択する。例えば取得部１１０は、第２影響度が大きい順に、所定の数の指標を、カテゴリ変数として選択する（ステップＳ１１４）。

【0074】

図１３は、評価装置２０が行う処理の第１例を示すフローチャートである。本図に示す処理は、評価対象を評価するための処理である。そしてこの処理の前に、評価装置２０の組み合わせ取得部２１０は、指標選択装置１０から組み合わせ特定情報及びグループ特定情報を取得して組み合わせ記憶部２２０に記憶させている。

【0075】

まず評価部２３０は、組み合わせ記憶部２２０から組み合わせ特定情報を読み出す（ステップＳ２１０）。組み合わせ特定情報は、カテゴリ変数、及びそのカテゴリ変数において用いられるサポート変数を示している。また評価部２３０は、評価対象の各指標のデータを対象データ記憶部２４０から読み出す（ステップＳ２２０）。そして評価部２３０は、組み合わせ特定情報が示す複数のカテゴリ変数のそれぞれに対して、ステップＳ２４０～ステップＳ２６２に示す処理を行う（ステップＳ２３０及びステップＳ２７０）。

【0076】

まず評価部２３０は、組み合わせ特定情報が示す複数のカテゴリ変数から、一つのカテゴリ変数を選択する（ステップＳ２３０）。この選択により、サポート変数として用いられるべき複数の指標も定まる。そして評価部２３０は、組み合わせ記憶部２２０から、選択したカテゴリ変数のグループ特定情報を読み出す（ステップＳ２４０）。そして評価部２３０は、グループ特定情報を用いて、その評価対象の当該カテゴリ変数の値が属するグループを特定する。そして評価部２３０は、そのグループにおける、各サポート変数の統計値を取得する（ステップＳ２５０）。そして評価部２３０は、これらの統計値と、その評価対象の各サポート変数の値とを用いて、各サポート変数の評価情報を生成し、対象データ記憶部２４０に記憶させる（ステップＳ２６０）。

【0077】

また評価部２３０は、各サポート変数の補助評価情報を生成し、対象データ記憶部２４０に記憶させる（ステップＳ２６２）。ステップＳ２６２の詳細については、図１４を用いて後述する。

【0078】

そして評価部２３０は、統合評価情報を生成して対象データ記憶部２４０に記憶させる（ステップＳ２８０）。その後、出力部２５０は、出力情報（例えば画面データ及び／又は印刷データ）を生成し、この出力情報を出力する（ステップＳ２９０）。

【0079】

図１４は、図１３のステップＳ２６２の詳細を示すフローチャートである。評価部２３０は、複数のサポート変数（すなわち複数の第２カテゴリ変数）のそれぞれに対して、ステップＳ３０２～ステップＳ３０６に示す処理を行う（ステップＳ３００及びステップＳ３０８）。

【0080】

まず評価部２３０は、一つのサポート変数（第２カテゴリ変数）を選択する（ステップＳ３００）。この選択により、第２サポート変数として用いられるべき複数の指標も定まる。そして評価部２３０は、組み合わせ記憶部２２０から、選択した第２カテゴリ変数のグループ特定情報を読み出す（ステップＳ３０２）。そして評価部２３０は、グループ特定情報を用いて、その評価対象の当該第２カテゴリ変数の値が属するグループを特定する。そして評価部２３０は、そのグループにおける、各第２サポート変数の統計値を取得する（ステップＳ３０４）。そして評価部２３０は、これらの統計値と、その評価対象の各第２サポート変数の値とを用いて、各第２サポート変数の評価情報（すなわち補助評価情報）を生成し、対象データ記憶部２４０に記憶させる（ステップＳ３０６）。

【0081】

図１５は、図１３の変形例を示す図である。本変形例は、第３基準を満たすグループについては、サポート変数の評価情報を生成しない点を除いて、図１４に示した例と同様である。

【0082】

具体的には、評価部２３０は、グループ特定情報を取得した（ステップＳ２４０）後、サポート変数の統計値を算出する（ステップＳ２５０）前に、第３基準を満たさないグループを、評価情報を生成すべきグループとして選択する（ステップＳ２４２）。そして評価部２３０は、評価対象の当該カテゴリ変数の値が、ステップＳ２４２で選択されたグループに属している場合にのみ（ステップＳ２４４：Ｙｅｓ）、ステップＳ２６０及びＳ２６２に示した処理を行う。

【0083】

第３基準は、例えば、そのグループはそのカテゴリ変数の標準的な値を有することを示している。評価対象のカテゴリ変数の値が第３基準を満たすグループに属している場合、そのカテゴリ変数に関してはその評価対象は標準的であるため、評価対象の評価結果に大きな影響を与えない。このため、第３基準を満たすグループについては、サポート変数の評価情報を生成しなくても、評価対象の評価結果はほとんど変わらない。なお、第３基準の一例は、そのグループがカテゴリ変数の最頻値、中央値、及び平均値の少なくとも一つを含むこと、である。

【0084】

なお、評価部２３０は、評価対象の当該カテゴリ変数の値が、ステップＳ２４２で選択されたグループに属していなかった場合（ステップＳ２４４：Ｎｏ）、ステップＳ２６０において、サポート変数の評価値として固定値を割り当ててもよい。この固定値は、評価値として標準的な値（例えば平均値、中央値、又は最頻値）である。

【0085】

以上、本実施形態によれば、指標選択装置１０を用いることにより、評価対象を評価する場合において、組み合わせるべき２つの指標を選択しやすくなる。また評価装置２０は、評価対象に対し、指標選択装置１０が選択した２つの指標（すなわち組み合わせ変数）毎の評価情報を生成する。したがって、評価装置２０の利用者は、これらの評価情報を確認することにより、評価対象を精度よく評価しやすくなる。

【0086】

以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。

【0087】

また、上述の説明で用いた複数のフローチャートでは、複数の工程（処理）が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。

【0088】

上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
１．評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得手段と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択手段と、
を備え、
前記選択手段は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択装置。
２．上記１に記載の指標選択装置において、
前記取得手段は、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第２モデルを生成し、
前記複数の指標毎に当該指標が前記第２モデルの精度に与える影響の大きさを示す第２影響度を取得し、当該第２影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、指標選択装置。
３．上記１又は２に記載の指標選択装置において、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択手段は、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第１影響度の取得を行い、
前記第１影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、指標選択装置。
４．上記１～３のいずれか一項に記載の指標選択装置において、
前記評価対象は企業であり、
前記複数の指標のそれぞれは財務指標である、指標選択装置。
５．上記１～３のいずれか一項に記載の指標選択装置において、
前記評価対象は個人であり、
前記複数の指標の少なくとも一つは、前記個人の信用情報、収入額、又は預金額である、指標選択装置。
６．コンピュータが、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得処理と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択処理と、
を行い、
前記選択処理において、前記コンピュータは、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、指標選択方法。
７．上記６に記載の指標選択方法において、
前記取得処理において、前記コンピュータは、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第２モデルを生成し、
前記複数の指標毎に当該指標が前記第２モデルの精度に与える影響の大きさを示す第２影響度を取得し、当該第２影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、指標選択方法。
８．上記６又は７に記載の指標選択方法において、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択処理において、前記コンピュータは、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第１影響度の取得を行い、
前記第１影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、指標選択方法。
９．上記６～８のいずれか一項に記載の指標選択方法において、
前記評価対象は企業であり、
前記複数の指標のそれぞれは財務指標である、指標選択方法。
１０．上記６～８のいずれか一項に記載の指標選択方法において、
前記評価対象は個人であり、
前記複数の指標の少なくとも一つは、前記個人の信用情報、収入額、又は預金額である、指標選択方法。
１１．コンピュータに、
評価対象に関する複数の指標の少なくとも一つをカテゴリ変数として指定するカテゴリ変数指定情報を取得する取得機能と、
前記カテゴリ変数毎に、前記複数の指標の一部であるサポート変数を選択する選択機能と、
を持たせ、
前記選択機能は、
当該カテゴリ変数及び当該カテゴリ変数とは異なる前記指標の組み合わせである組み合わせ変数を説明変数として、評価対象の評価結果を目的変数とする機械学習を実行して第１モデルを生成し、
複数の前記組み合わせ変数毎に当該組み合わせ変数が前記第１モデルの精度に与える影響の大きさを示す第１影響度を取得し、当該第１影響度を用いて、前記複数の指標から前記サポート変数を選択する、プログラム。
１２．上記１１に記載のプログラムにおいて、
前記取得機能は、
前記複数の指標を説明変数として、前記評価結果を目的変数とする機械学習を実行して第２モデルを生成し、
前記複数の指標毎に当該指標が前記第２モデルの精度に与える影響の大きさを示す第２影響度を取得し、当該第２影響度を用いて、前記複数の指標から前記カテゴリ変数を選択する、プログラム。
１３．上記１１又は１２に記載のプログラムにおいて、
前記カテゴリ変数指定情報は複数の前記カテゴリ変数を指定しており、
前記選択機能は、
前記複数のカテゴリ変数のそれぞれに対して、前記複数の組み合わせ変数の生成、第1モデルの生成、及び前記第１影響度の取得を行い、
前記第１影響度が基準を満たす前記組み合わせ変数を選択することにより、前記サポート変数を選択する、プログラム。
１４．上記１１～１３のいずれか一項に記載のプログラムにおいて、
前記評価対象は企業であり、
前記複数の指標のそれぞれは財務指標である、プログラム。
１５．上記１１～１３のいずれか一項に記載のプログラムにおいて、
前記評価対象は個人であり、
前記複数の指標の少なくとも一つは、前記個人の信用情報、収入額、又は預金額である、プログラム。

【0089】

この出願は、２０２１年１月２６日に出願された日本出願特願２０２１－０１０１１３号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

【符号の説明】

【0090】

１０指標選択装置
２０評価装置
１１０取得部
１２０選択部
１３０訓練データ記憶部
１４０組み合わせ特定情報記憶部
１５０送信部
２１０組み合わせ取得部
２２０組み合わせ記憶部
２３０評価部
２４０対象データ記憶部
２５０出力部

【図1】