(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-13
(45)【発行日】2023-11-21
(54)【発明の名称】推定プログラム、装置、および方法
(51)【国際特許分類】
G06F 16/907 20190101AFI20231114BHJP
【FI】
G06F16/907
(21)【出願番号】P 2019040528
(22)【出願日】2019-03-06
【審査請求日】2021-12-08
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】池 祐一
(72)【発明者】
【氏名】▲高▼木 拓也
【審査官】酒井 恭信
(56)【参考文献】
【文献】特開2008-070956(JP,A)
【文献】特開2007-034700(JP,A)
【文献】特開2006-040181(JP,A)
【文献】特開2005-165736(JP,A)
【文献】国際公開第2008/146807(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00 - 16/958
(57)【特許請求の範囲】
【請求項1】
対象に関する複数の属性に対応した複数の属性値に基づいて判定を行う判定モデルの判定結果に対して、それぞれが前記複数の属性のうちの所定の条件を満たす属性から選択された
複数の判定属性
のうちの少なくとも1つと、前記複数の属性のうちの所定の条件を満たす属性以外の属性から選択された非判定属性とを含む組合せからなる複数の組合せパターンであって、前記判定属性を1つ含む組合せ及び複数含む組合せを有する複数の組合せパターンのそれぞれ
、及び前記非判定属性のみを含む組合せを有する組合せパターンと、前記判定結果と、の相関の度合を、前記組合せパターンに含まれる前記属性がとり得る各属性値の組合せに対する前記判定結果の比率に基づいて、推定し、
前記複数の組合せパターンに含まれる前記判定属性のうちの注目した判定属性を含む
複数の第1の組合せパターンのそれぞれについて、前記第1の組合せパターンと前記判定結果との相関の度合と、当該注目した判定属性
が前記第1の組合せパターンから除かれた組合せパターンである第2の組合せパターンと前記判定結果との相関の度合と、の差
を求め、前記複数の第1の組合せパターンのそれぞれについて求めた前記相関の度合の差の各々の和を、前記注目した判定属性の前記判定結果に対する影響の度合
とし、
前記複数の判定属性のそれぞれを、前記注目した判定属性として、前記複数の判定属性のそれぞれの前記判定結果に対する影響の度合を求めて、前記複数の判定属性を順位付けする、
ことを含む処理をコンピュータに実行させるための推定プログラム。
【請求項2】
対象に関する複数の属性に対応した複数の属性値に基づいて判定を行う判定モデルの判定結果に対して、それぞれが前記複数の属性のうちの所定の条件を満たす属性から選択された
複数の判定属性
のうちの少なくとも1つと、前記複数の属性のうちの所定の条件を満たす属性以外の属性から選択された非判定属性とを含む組合せからなる複数の組合せパターンであって、前記判定属性を1つ含む組合せ及び複数含む組合せを有する複数の組合せパターンのそれぞれ
、及び前記非判定属性のみを含む組合せを有する組合せパターンと、前記判定結果と、の相関の度合を、前記組合せパターンに含まれる前記属性がとり得る各属性値の組合せに対する前記判定結果の比率に基づいて、推定する第一推定部と、
前記複数の組合せパターンに含まれる前記判定属性のうちの注目した判定属性を含む
複数の第1の組合せパターンのそれぞれについて、前記第1の組合せパターンと前記判定結果との相関の度合と、当該注目した判定属性
が前記第1の組合せパターンから除かれた組合せパターンである第2の組合せパターンと前記判定結果との相関の度合と、の差
を求め、前記複数の第1の組合せパターンのそれぞれについて求めた前記相関の度合の差の各々の和を、前記注目した判定属性の前記判定結果に対する影響の度合
とし、前記複数の判定属性のそれぞれを、前記注目した判定属性として、前記複数の判定属性のそれぞれの前記判定結果に対する影響の度合を求めて、前記複数の判定属性を順位付けする、第二推定部と、
を含む推定装置。
【請求項3】
対象に関する複数の属性に対応した複数の属性値に基づいて判定を行う判定モデルの判定結果に対して、それぞれが前記複数の属性のうちの所定の条件を満たす属性から選択された
複数の判定属性
のうちの少なくとも1つと、前記複数の属性のうちの所定の条件を満たす属性以外の属性から選択された非判定属性とを含む組合せからなる複数の組合せパターンであって、前記判定属性を1つ含む組合せ及び複数含む組合せを有する複数の組合せパターンのそれぞれ
、及び前記非判定属性のみを含む組合せを有する組合せパターンと、前記判定結果と、の相関の度合を、前記組合せパターンに含まれる前記属性がとり得る各属性値の組合せに対する前記判定結果の比率に基づいて、推定し、
前記複数の組合せパターンに含まれる前記判定属性のうちの注目した判定属性を含む
複数の第1の組合せパターンのそれぞれについて、前記第1の組合せパターンと前記判定結果との相関の度合と、当該注目した判定属性
が前記第1の組合せパターンから除かれた組合せパターンである第2の組合せパターンと前記判定結果との相関の度合と、の差
を求め、前記複数の第1の組合せパターンのそれぞれについて求めた前記相関の度合の差の各々の和を、前記注目した判定属性の前記判定結果に対する影響の度合
とし、
前記複数の判定属性のそれぞれを、前記注目した判定属性として、前記複数の判定属性のそれぞれの前記判定結果に対する影響の度合を求めて、前記複数の判定属性を順位付けする、
ことを含む処理をコンピュータが実行することを特徴とする推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推定プログラム、装置、および方法に関する。
【背景技術】
【0002】
データの属性について、属性とラベルとの相関の度合を推定する技術がある。例えば、ある属性について、単純に当該属性がラベルに対して相関があるか否かを表すp値を計算して、保護すべき属性を順位付けしている。また、当該属性と他の属性の各々との全ての組合せの相関の度合を考慮することも考えられる。
【0003】
また、例えば、データの属性を変更することによるラベルの結果への影響を予測する技術がある。
【先行技術文献】
【非特許文献】
【0004】
【文献】" The What-If Tool: Code-Free Probing of Machine Learning Models","https://ai.googleblog.com/2018/09/the-what-if-tool-code-free-probing-of.html"
【発明の概要】
【発明が解決しようとする課題】
【0005】
もっとも、一つの属性について、他の全ての属性との組合せの相関を単純に考慮してしまうと、部分的な組合せによる影響、および他の属性からの影響等を考慮できない場合がある。
【0006】
本発明は、一つの側面として、属性の組合せの相関を捉え、かつ、他の属性の影響を考慮して属性の順位付けを行うことを目的とする。
【課題を解決するための手段】
【0007】
一つの態様として、対象に関する複数の属性に対応した複数の属性値に基づいて判定を行う判定モデルの判定結果に対して、相関の度合を推定する。それぞれが前記複数の属性のうちの所定の条件を満たす属性から選択された1以上の属性がある。前記複数の属性のうちの所定の条件を満たす属性以外の属性から選択された0以上の属性がある。属性の組合せである複数の組合せパターンのそれぞれと、前記判定結果と、の相関の度合を推定する。前記複数の組合せパターンのうちの第1の組合せパターンがある。前記第1の組合せパターンに含まれる前記所定の条件を満たす属性のうちの第1の属性が前記第1の組合せパターンから除かれた組合せパターンである第2の組合せパターンがある。前記第1の組合せパターンと第2の組合せパターンとの前記判定結果との相関の度合の差に基づいて、前記第1の属性の前記判定結果に対する影響の度合を推定する。
【発明の効果】
【0008】
一つの側面として、属性の組合せの相関を捉え、かつ、他の属性の影響を考慮して属性の順位付けを行うことができる、という効果を有する。
【図面の簡単な説明】
【0009】
【
図1】合否の結果において性別の影響の度合が高いと判断したい場合の表の一例を示す図である。
【
図2】合否の結果において国籍の影響の度合が高いと判断したい場合の表の一例を示す図である。
【
図3】属性の組合せを階層で検討した場合の一例を示す図である。
【
図4】属性の組合せを階層で検討した場合の一例を示す図である。
【
図5】本発明の実施形態に係る推定装置の概略構成を示すブロック図である。
【
図6】判定属性の組合せパターンを表す階層構造の一例を示す図である。
【
図7】階層構造のノードごとにノード影響度を求めた場合の一例を示す図である。
【
図8】組合せパターンにおける判定属性の影響度の計算方法の一例を示す図である。
【
図9】推定装置の入出力のイメージの一例を示す図である。
【
図10】推定装置として機能するコンピュータの概略構成を示すブロック図である。
【
図11】推定装置の処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照して本発明に係る実施形態の一例を詳細に説明する。
【0011】
まず、本発明の実施形態の前提について説明する。
【0012】
本発明の実施形態では、属性のラベルに対する影響の度合を順位付けしたい場合を想定する。本発明の実施形態では、説明の便宜のため、順位付けの対象として着目する属性を「判定属性」、順位付けの対象として着目しない属性を「非判定属性」とし、区別しない場合を単に「属性」と表記して説明する。判定属性が、所定の条件を満たす属性の一例である。非判定属性が、所定の条件を満たす属性以外の属性の一例である。ラベルは、対象に関する複数の属性に対応した複数の属性値に基づいて判定を行う判定モデルの判定結果の一例である。ラベルの具体例については後述する。
【0013】
上記課題において説明したように、単純に全ての属性の組合せの相関を求めるだけでは、ラベルへの影響の度合の由来が、判定属性にあるのかを正しく判別できているとはいえない。具体的には、判定属性と非判定属性とを組合せた場合の相関、および非判定属性自体の相関を考慮することができていない。
【0014】
このような課題を鑑みて、本発明の実施形態では、属性の組合せの包含関係、すなわち属性の組合せの階層構造を考慮して、順位付けすべき判定属性を除いた組合せパターンの相関の度合を指標として用いて、判定属性の影響の度合を順位付けする。このように順位付けることで、属性の組合せの影響を考慮し、かつ、非判定属性自体の相関の影響を受けずに判定属性の順位付けが可能になる。
【0015】
判定属性については、判定属性自体がラベルに与える影響度の順に順位をつけたい。なぜならば、判定属性自体が、ラベルにどれだけの影響を与えるのかを明らかにしたいケースが考えられるからである。例えば、ラベルが試験の結果である場合は、属性が試験の結果に影響していないかを調べたい。また、ラベルが購買の結果である場合は、マーケットにおいてどの属性が購買に影響するのかを調べたい。
【0016】
以下、ラベルが、入社試験の合否結果である場合について検討する。入社試験の合否結果は、入社希望者に対して行った入社試験の点数に基づいて合否{0,1}の判定を行った結果である。ラベルが入社試験の合否結果であれば、属性は、例えば、性別、国籍、分野、学歴、TOEIC(Test of English for International Communication)スコア等である。合否結果は、複数の属性の属性値によって判定される。
【0017】
ここでは、入社試験の合否に差別的な判断がなされていないか否かを調べたいとする。このような差別の文脈で捉えると、属性のうち、「性別」、および「国籍」は合否に影響を与えてほしくない属性である。すなわち、合否に影響を与えてほしくない属性の合否結果への影響を調べたいので、「性別」、および「国籍」は判定属性である。また、「分野」は合否に影響を与えてもよい属性である。合否に影響を与えてもよい属性は、影響を調べなくてもよいので、非判定属性である。
【0018】
このように、入社試験における差別の文脈では、保護すべき属性(性別・国籍など)とそれ以外の属性とで、判定属性、および非判定属性が分けられる。なお、この例では、ラベルに影響を与えてほしくない属性を判定属性としているが、このような場合に限定されない。例えば、マーケットの文脈において、調整可能な属性とそれ以外の固定された属性とで、判定属性、および非判定属性を分けるなど、調べたい内容に応じて、判定属性および非判定属性を分けることができる。
【0019】
上記、判定属性、および非判定属性の組合せについては、属性の影響に関して二つの課題を持った状況が想定される。(1)判定属性と非判定属性との組合せがラベルに高い影響を与えると判断してほしい状況と、(2)判定属性と非判定属性との組合せがラベルに影響を与えないと判断してほしい状況とである。以下それぞれの状況について入社試験の場合を例に説明する。
【0020】
(1)の状況は、判定属性自体は合否に相関はないが、判定属性と非判定属性との組合せに相関があり、かつ、非判定属性単体では相関がない状況である。
【0021】
図1は、合否の結果において性別の影響の度合が高いと判断したい場合の表の一例を示す図である。
図1においては、属性「分野」、「性別」、「国籍」を0または1の値で表し、ラベル「×○(合否)」も同様に0または1の値で表している。以下、表を用いた図において同様である。例えば、属性単体でみた場合に、属性の値が全て0で、ラベルの値が全て1であれば相関は1であり、正の相関といえる。相関は1に近いほど高いといえる。逆に、属性の値が0および1で半々であり、ラベルの値が全て1であれば相関は0であり、相関がないといえる。
【0022】
図1の例を用いて(1)の状況を説明する。
図1に示すように、判定属性「性別」と合否の結果とには相関がない。また、判定属性「国籍」と合否の結果とにはやや相関がある。このように、判定属性単体だけで見ると、判定属性「国籍」のほうが影響を与えているようにも捉えられる。しかし、判定属性「性別」と非判定属性「分野」との組合せは、合否の結果と高い相関がある。また、判定属性「国籍」と非判定属性「分野」との組合せは相関が高くない。この場合、非判定属性「分野」ごとに見ると判定属性「性別」が合否の結果に高く影響していると捉えられる。また、非判定属性「分野」自体は合否の結果と相関がない。そのため、「性別」のほうが「国籍」よりも影響の度合が高いと判断したい。
【0023】
上記(1)の状況では、単に属性単体の相関だけを取り出してしまうと、「国籍」のほうが「性別」よりも影響の度合が高いと判断してしまう。つまり、属性単体の相関だけでは、ラベルへの影響の度合を正しく計算できないという課題がある。
【0024】
(2)の状況は、判定属性自体は合否に相関はないが、判定属性と非判定属性との組合せに相関があるものの、非判定属性単体でも相関がある状況である。
【0025】
図2は、合否の結果において国籍の影響の度合が高いと判断したい場合の表の一例を示す図である。
【0026】
図2の例を用いて(2)の状況を説明する。
図2に示すように、判定属性「性別」と合否の結果とには相関がない。また、判定属性「国籍」と合否の結果とにはやや相関がある。判定属性「性別」と非判定属性「分野」との組合せは、合否の結果と高い相関がある。判定属性「国籍」と非判定属性「分野」との組合せは、合否の結果とやや相関がある。つまり、非判定属性「分野」の相関が大きく、「分野」自体が合否の結果に強く影響していると捉えられる。逆に判定属性「性別」と非判定属性「分野」との組合せ自体が、合否の結果に及ぼしている影響は小さいと捉えられる。そのため、組合せの影響は除外して、「国籍」のほうが「性別」よりも影響の度合が高いと判断したい。
【0027】
上記(2)の状況では、判定属性と非判定属性との組合せの相関をそのまま取り出して判定属性の影響の度合に反映してしまうと、「性別」のほうが「国籍」よりも影響の度合が高いと判断してしまう。つまり、単に組合せの相関を考慮するだけでは、ラベルへの影響の度合を正しく計算できないという課題がある。
【0028】
上記(1)および(2)の状況の課題を解決するには、影響を及ぼしている属性の由来を正しく反映する必要がある。
【0029】
そこで、本発明の実施形態では、属性の包含関係、すなわち属性の組合せの階層構造を考慮することを考える。
図3および
図4は、属性の組合せを階層で検討した場合の一例を示す図である。
図3は(1)の影響の度合が性別>国籍である状況を示し、
図4は(2)の影響の度合が国籍>性別である状況を示している。
図3と
図4とでは、非判定属性「分野」の相関の度合だけが異なっており、
図3では低、
図4では高となっている。このように非判定属性「分野」の相関の度合に応じて考慮する事柄が異なってくる。
【0030】
そこで、本発明の実施形態に係る手法では、組合せの相関を捉え、かつ、非判定属性の影響を考慮できる階層構造を用いて属性の順位付けを行う。
【0031】
以下、本発明の実施形態の構成の一例について、図面を参照して詳細に説明する。
【0032】
図5は、本発明の実施形態に係る推定装置10の概略構成を示すブロック図である。
図5に示すように、本実施形態に係る推定装置10は、取得部20と、構成部22と、ノード計算部24と、判定属性計算部26と、順位計算部28とを含んで構成されている。ノード計算部24が第一推定部の一例であり、判定属性計算部26が第二推定部の一例である。
【0033】
取得部20は、解析対象のデータであって属性およびラベルを含むデータと、データのうち対象とする判定属性と、ノード計算部24の計算に用いる影響度関数とを取得する。影響度関数については後述する。判定属性は、推定装置10を操作するユーザによる操作によって選択した1以上の判定属性とする。
【0034】
構成部22は、判定属性の組合せを網羅する複数の組合せパターンの階層構造であって、組合せパターンをノードとして、各ノードを結ぶエッジが判定属性の組合せの包含関係を持つ階層構造を構成する。
図6は、判定属性の組合せパターンを表す階層構造の一例を示す図である。
図6では、判定属性はS1~S3、非判定属性のべき集合はPと表している。例えば、非判定属性をR1およびR2とすると、P={0,R1,R2,R1∧R2}であり、ノードP*S3は、P*S3={S3,R1∧S3,R2∧S3,R1∧R2∧S3}という組合せパターンを持つ。P以外のノードは、判定属性と、判定属性および非判定属性との組による組合せパターンを構成する。
【0035】
ノード計算部24は、構成部22で構成した各ノードについて、ノードに含まれる判定属性と、ラベルとの相関の度合として、影響度関数に基づいて、ノードに含まれる判定属性のラベルに対する影響度を表すノード影響度を計算する。
図7は、階層構造のノードごとにノード影響度を求めた場合の一例を示す図である。ノード影響度が、相関の度合の一例である。
【0036】
影響度関数の一例を説明する。影響度関数は、例えば、属性の組合せのラベルに対する比率の相関を求める場合、以下(1)式で表される。
【0037】
【0038】
ここでlはラベル、xは属性の組が取り得る値の組合せ、n(・)は解析対象のデータ全体におけるデータ「・」の出現数を表す。R1∧S3の組の相関であれば、C(R1∧S3)と書ける。ノード影響度は、ノードに含まれる各組の相関の総和とする。ノードのノード影響度はC(P*S3)と書ける。また、各組の影響度のうちの最小値、最大値、または中央値をノード影響度としてもよい。
【0039】
判定属性計算部26は、注目した判定属性ごとに、階層構造のエッジのノード影響度の変化量に基づいて、当該注目した判定属性についての影響度を計算する。具体的には、注目した判定属性を含む組合せパターンのノードのノード影響度から、当該注目した判定属性を含まない組合せパターンの下層のノードのノード影響度を差し引いた影響度の変化量を計算する。つまり、注目エッジの各々についてノード影響度の変化量を計算する。注目エッジとは、注目した判定属性を含む組合せパターンのノードと、当該注目した判定属性を含まない組合せパターンの下層のノードとを結ぶエッジである。そして、当該注目した判定属性についての注目エッジの各々についてのノード影響度の変化量の和を計算することで、当該注目した判定属性のラベルに対する影響度を計算する。注目した判定属性を含む組合せパターンが、第1の組合せパターンの一例である。注目した判定属性を含まない組合せパターンが、第2の組合せパターンの一例である。
【0040】
図8は、組合せパターンにおける判定属性の影響度の計算方法の一例を示す図である。
図8に示すように、注目した判定属性がS1であれば、P*(S1∧S2∧S3)のノードとP*(S2∧S3)のノードとを結ぶエッジは注目エッジとなる。この場合、P*(S1∧S2∧S3)のノード影響度7からP*(S2∧S3)のノード影響度7を差し引いた7-7=0を、注目エッジの変化量として計算する。同様にP*(S1∧S2)、およびP*S2等の注目エッジについても変化量を計算する。
図8に示すS1の場合は、0+4+3+2=9を、S1の影響度として計算できる。
【0041】
順位計算部28は、判定属性の各々について計算した影響度に基づいて、判定属性を順位付けし、影響度と共に出力する。
図9は、推定装置10の入出力のイメージの一例を示す図である。
図9に示すように、推定装置10は、データ、判定属性、および影響度関数が入力されると、上述した各処理部の処理を行って、判定属性の順位を出力する。
【0042】
推定装置10は、例えば
図10に示すコンピュータ50で実現することができる。コンピュータ50は、Central Processing Unit(CPU)51と、一時記憶領域としてのメモリ52と、不揮発性の記憶部53とを備える。また、コンピュータ50は、入出力装置54と、記憶媒体59に対するデータの読み込みおよび書き込みを制御するRead/Write(R/W)部55と、インターネット等のネットワークに接続される通信インターフェース(I/F)56とを備える。CPU51、メモリ52、記憶部53、入出力装置54、R/W部55、および通信I/F56は、バス57を介して互いに接続される。
【0043】
記憶部53は、Hard Disk Drive(HDD)、Solid State Drive(SSD)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部53には、コンピュータ50を推定装置10として機能させるための推定プログラム60が記憶される。推定プログラム60は、取得プロセス62と、構成プロセス63と、ノード計算プロセス64と、判定属性計算プロセス65と、順位計算プロセス66とを有する。
【0044】
CPU51は、推定プログラム60を記憶部53から読み出してメモリ52に展開し、推定プログラム60が有するプロセスを順次実行する。CPU51は、取得プロセス62を実行することで、
図5に示す取得部20として動作する。また、CPU51は、構成プロセス63を実行することで、
図5に示す構成部22として動作する。また、CPU51は、ノード計算プロセス64を実行することで、
図5に示すノード計算部24として動作する。また、CPU51は、判定属性計算プロセス65を実行することで、
図5に示す判定属性計算部26として動作する。また、CPU51は、順位計算プロセス66を実行することで、
図5に示す順位計算部28として動作する。これにより、推定プログラム60を実行したコンピュータ50が、推定装置10として機能することになる。なお、プログラムを実行するCPU51はハードウェアである。
【0045】
なお、推定プログラム60により実現される機能は、例えば半導体集積回路、より詳しくはApplication Specific Integrated Circuit(ASIC)等で実現することも可能である。
【0046】
次に、本実施形態に係る推定装置10の作用について
図11のフローチャートを参照して説明する。
【0047】
ステップS100で、取得部20が、解析対象のデータであって属性およびラベルを含むデータ、データのうち対象とする判定属性、およびノード計算部24の計算に用いる影響度関数とを取得する。
【0048】
ステップS102で、構成部22が、判定属性の組合せを網羅する複数の組合せパターンの階層構造であって、組合せパターンをノードとして、各ノードを結ぶエッジが判定属性の組合せの包含関係を持つ階層構造を構成する。
【0049】
ステップS104で、ノード計算部24は、構成部22で構成した各ノードについて、ノードに含まれる判定属性と、ラベルとの相関の度合として、獲得関数に基づいて、ノードに含まれる判定属性のラベルに対する影響度を表すノード影響度を計算する。
【0050】
ステップS106で、判定属性計算部26が、注目した判定属性ごとに、階層構造のエッジのノード影響度の変化量に基づいて、当該注目した判定属性についての影響度を計算する。
【0051】
ステップS108で、順位計算部28が、判定属性の各々について計算した影響度に基づいて、判定属性を順位付けし、影響度と共に出力する。
【0052】
以上説明したように、本実施形態に係る推定装置によれば、階層構造の各ノードについて、ノード影響度を計算し、注目した判定属性ごとに、階層構造のエッジのノード影響度の変化量に基づいて、当該注目した判定属性についての影響度を計算する。そして、判定属性の各々について計算した影響度に基づいて、判定属性を順位付けする。このため、属性の組合せの相関を捉え、かつ、他の属性の影響を考慮して属性の順位付けを行うことができる。
【0053】
以上の実施形態に関し、更に以下の付記を開示する。
【0054】
(付記1)
対象に関する複数の属性に対応した複数の属性値に基づいて判定を行う判定モデルの判定結果に対して、それぞれが前記複数の属性のうちの所定の条件を満たす属性から選択された1以上の属性と、前記複数の属性のうちの所定の条件を満たす属性以外の属性から選択された0以上の属性とを含む組合せである複数の組合せパターンのそれぞれと、前記判定結果と、の相関の度合を推定し、
前記複数の組合せパターンのうちの第1の組合せパターンと、前記第1の組合せパターンに含まれる前記所定の条件を満たす属性のうちの第1の属性が前記第1の組合せパターンから除かれた組合せパターンである第2の組合せパターンとの前記判定結果との相関の度合の差に基づいて、前記第1の属性の前記判定結果に対する影響の度合を推定する、
ことを含む処理をコンピュータに実行させるための推定プログラム。
【0055】
(付記2)
前記相関の度合は、前記組合せパターンに対する前記判定結果の比率に基づいて推定される付記1に記載の推定プログラム。
【0056】
(付記3)
前記第1の属性が複数あり、かつ、前記第1の組合せパターンが複数ある場合において、
前記第1の属性について、前記第1の組合せパターンの各々について対応する前記第2の組合せパターンとの前記相関の度合の差を求め、求めた前記相関の度合の差の各々の和を前記影響の度合いとして、前記第1の属性を順位付けする付記1または付記2に記載の推定プログラム。
【0057】
(付記4)
対象に関する複数の属性に対応した複数の属性値に基づいて判定を行う判定モデルの判定結果に対して、それぞれが前記複数の属性のうちの所定の条件を満たす属性から選択された1以上の属性と、前記複数の属性のうちの所定の条件を満たす属性以外の属性から選択された0以上の属性とを含む組合せである複数の組合せパターンのそれぞれと、前記判定結果と、の相関の度合を推定する第一推定部と、
前記複数の組合せパターンのうちの第1の組合せパターンと、前記第1の組合せパターンに含まれる前記所定の条件を満たす属性のうちの第1の属性が前記第1の組合せパターンから除かれた組合せパターンである第2の組合せパターンとの前記判定結果との相関の度合の差に基づいて、前記第1の属性の前記判定結果に対する影響の度合を推定する第二推定部と、
を含む推定装置。
【0058】
(付記5)
前記相関の度合は、前記組合せパターンに対する前記判定結果の比率に基づいて推定する付記4に記載の推定装置。
【0059】
(付記6)
前記第1の属性が複数あり、かつ、前記第1の組合せパターンが複数ある場合において、
前記第1の属性について、前記第1の組合せパターンの各々について対応する前記第2の組合せパターンとの前記相関の度合の差を求め、求めた前記相関の度合の差の各々の和を前記影響の度合いとして、前記第1の属性を順位付けする順位計算部をさらに含む付記4または付記5に記載の推定装置。
【0060】
(付記7)
対象に関する複数の属性に対応した複数の属性値に基づいて判定を行う判定モデルの判定結果に対して、それぞれが前記複数の属性のうちの所定の条件を満たす属性から選択された1以上の属性と、前記複数の属性のうちの所定の条件を満たす属性以外の属性から選択された0以上の属性とを含む組合せである複数の組合せパターンのそれぞれと、前記判定結果と、の相関の度合を推定し、
前記複数の組合せパターンのうちの第1の組合せパターンと、前記第1の組合せパターンに含まれる前記所定の条件を満たす属性のうちの第1の属性が前記第1の組合せパターンから除かれた組合せパターンである第2の組合せパターンとの前記判定結果との相関の度合の差に基づいて、前記第1の属性の前記判定結果に対する影響の度合を推定する、
ことを含む処理をコンピュータが実行することを特徴とする推定方法。
【0061】
(付記8)
前記相関の度合は、前記組合せパターンに対する前記判定結果の比率に基づいて推定される付記7に記載の推定方法。
【0062】
(付記9)
前記第1の属性が複数あり、かつ、前記第1の組合せパターンが複数ある場合において、
前記第1の属性について、前記第1の組合せパターンの各々について対応する前記第2の組合せパターンとの前記相関の度合の差を求め、求めた前記相関の度合の差の各々の和を前記影響の度合いとして、前記第1の属性を順位付けする付記7または付記8に記載の推定方法。
【符号の説明】
【0063】
10 推定装置
20 取得部
22 構成部
24 ノード計算部
26 判定属性計算部
28 順位計算部
50 コンピュータ
51 CPU
52 メモリ
53 記憶部
54 入出力装置
59 記憶媒体
60 推定プログラム