IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-112049評価プログラム,評価方法および情報処理装置
<>
  • 特開-評価プログラム,評価方法および情報処理装置 図1
  • 特開-評価プログラム,評価方法および情報処理装置 図2
  • 特開-評価プログラム,評価方法および情報処理装置 図3
  • 特開-評価プログラム,評価方法および情報処理装置 図4
  • 特開-評価プログラム,評価方法および情報処理装置 図5
  • 特開-評価プログラム,評価方法および情報処理装置 図6
  • 特開-評価プログラム,評価方法および情報処理装置 図7
  • 特開-評価プログラム,評価方法および情報処理装置 図8
  • 特開-評価プログラム,評価方法および情報処理装置 図9
  • 特開-評価プログラム,評価方法および情報処理装置 図10
  • 特開-評価プログラム,評価方法および情報処理装置 図11
  • 特開-評価プログラム,評価方法および情報処理装置 図12
  • 特開-評価プログラム,評価方法および情報処理装置 図13
  • 特開-評価プログラム,評価方法および情報処理装置 図14
  • 特開-評価プログラム,評価方法および情報処理装置 図15
  • 特開-評価プログラム,評価方法および情報処理装置 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024112049
(43)【公開日】2024-08-20
(54)【発明の名称】評価プログラム,評価方法および情報処理装置
(51)【国際特許分類】
   G06F 16/906 20190101AFI20240813BHJP
【FI】
G06F16/906
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023016871
(22)【出願日】2023-02-07
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110003649
【氏名又は名称】弁理士法人真田特許事務所
(74)【代理人】
【識別番号】100189201
【弁理士】
【氏名又は名称】横田 功
(72)【発明者】
【氏名】金森 憲太朗
(72)【発明者】
【氏名】▲高▼木 拓也
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FA03
(57)【要約】
【課題】欠損を含むデータに対しても、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なう。
【解決手段】入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、複数パターンのそれぞれの補完データによって予測されるラベルを変更するために補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、複数パターンのうちの一つのパターンの補完データにおいて決定された摂動情報が複数のパターンのうちの他のパターンの補完データに対してもラベルを変更可能か否かに関する判定結果に基づいて、摂動情報の評価を行なう。
【選択図】図7
【特許請求の範囲】
【請求項1】
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理をコンピュータに実行させることを特徴とする評価プログラム。
【請求項2】
前記摂動情報の評価を行なう処理において
決定された前記摂動情報に伴うコスト関数のコスト値と前記判定結果とを含み、前記ラベルを変更可能と判定される他のパターンの数が多くなるほど、及び前記コスト値が小さくなるほど、増加及び減少のどちらか一方に変化する評価指標を用いて、前記摂動情報の評価を行なう、
処理を前記コンピュータに実行させることを特徴とする、請求項1に記載の評価プログラム。
【請求項3】
前記複数のパターンのそれぞれの補完データと対応する前記摂動情報との組において、未選択の組の中から前記評価指標に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返す、
処理を前記コンピュータに実行させることを特徴とする、請求項2に記載の評価プログラム。
【請求項4】
選択された前記組に基づいて推奨するアクションについての情報を外部に出力する、
処理を前記コンピュータに実行させることを特徴とする、請求項3に記載の評価プログラム。
【請求項5】
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理をコンピュータが実行することを特徴とする評価方法。
【請求項6】
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理を実行する制御部を有することを特徴とする情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、評価プログラム,評価方法および情報処理装置に関する。
【背景技術】
【0002】
コンピュータを用いた機械学習等により、予測対象である事柄、物、人などについての複数の属性と属性値を入力値として、予測対象が属するラベルを予測するモデルを生成することができる。予測対象が属する予測結果であるラベルを変更するために、その予測対象のどの属性値をどれだけ変更すればよいかを知りたい場合がある。このとき変更するのに適切な属性値を、コンピュータを用いて提案することが考えられる。
【0003】
一例において、反事実説明(CE:Counterfactual Explanation)においては、ラベルを変更するための1以上の変更属性と当該属性の変更量とを含む摂動ベクトルがユーザに提供される。摂動ベクトルが与えられると、ユーザは、摂動ベクトルを自分が望む決定結果を得るための「アクション」として解釈することができる。このような技術によれば、予測結果に関して建設的な説明をユーザに与えることができるため、ユーザからの信頼醸成につながる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】国際公開2022/003816号
【発明の概要】
【発明が解決しようとする課題】
【0005】
入力データにおいて属性値の一部が欠損している場合においては、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことが困難であるという課題がある。
【0006】
1つの側面では、本発明は、入力データにおいて属性値の一部が欠損している場合において、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことができるようにすることを目的とする。
【課題を解決するための手段】
【0007】
このため、この評価プログラムは、入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう処理をコンピュータに実行させる。
【発明の効果】
【0008】
一実施形態によれば、本発明は、入力データにおいて属性値の一部が欠損している場合において、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことができる。
【図面の簡単な説明】
【0009】
図1】実施形態の一例としての情報処理装置において、入力データに欠損がない場合のアクション推薦処理の一例を示す図である。
図2】ラベルを変更するための摂動ベクトルの決定処理の一例について説明する図である。
図3】実施形態の一例としての情報処理装置において、入力データに欠損がある場合のアクション推薦処理の一例を示す図である。
図4】実施形態の一例としての情報処理装置のハードウェア構成を例示する図である。
図5】実施形態の一例としての情報処理装置の機能構成を例示する図である。
図6】実施形態の一例としての情報処理装置における補完データの作成処理の一例を示す図である。
図7】実施形態の一例としての情報処理装置におけるアクション最適化処理の一例を示す図である。
図8】補完_アクション組とコスト値について例示する図である。
図9】補完_アクション組の選択処理について例示する図である。
図10】補完_アクション組の選択処理の詳細について例示する図である。
図11】補完_アクション組から第1の組を選択する段階の一例を示す図である。
図12図11に後続して補完_アクション組から第2の組を選択する段階の一例を示す図である。
図13図12に後続して補完_アクション組から第3の組を選択する段階の一例を示す図である。
図14】実施形態の一例としての情報処理装置におけるアクション推薦処理を説明するためのフローチャートである。
図15】入力データに欠損がある場合における、与信審査でローン否認から承認に予測を変えるアクション推薦を実行する実施例を示す図である。
図16】健康状態の改善のアクション推薦における実施形態の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して本評価プログラム,評価方法および情報処理装置にかかる実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
【0011】
(A)構成
図1は、実施形態の一例としての情報処理装置100において、入力データ1に欠損がない場合のアクション推薦処理の一例を示す図である。情報処理装置100は、アクション推薦装置として機能してよい。図1は、情報処理装置100が、与信審査でローン否認から承認に予測を変えるアクション推薦を行なう場合の例を示す。
【0012】
入力データ1は、複数の属性11-1~11-4(属性11と総称する場合がある)と、各属性の属性値12-1~12-4(属性値12と総称する場合がある)とを含む。入力データは、属性データとも呼ばれる。一例において、入力データ1は、ユーザPC200(すなわち、ユーザ端末)からユーザによって入力されてよい。
【0013】
入力データ1は、判定モデル10に入力される。判定モデル10は、既存の方法によって機械学習された機械学習モデルであってよい。判定モデル10は、入力データ1に基づいて、ラベルを予測する。一例によって、判定モデル10は、与信審査においてローン否認またはローン承認を予測する。判定モデル10の構成は、従来の機械学習モデルと同様であるので、判定モデル10自体の詳細な説明は省略する。
【0014】
情報処理装置100は、判定モデル10によって予測されるラベルを所望のラベルに変更するために、摂動ベクトル3a、すなわち、複数の属性11の中から変更対象の属性4aと変更量5aとを決定する。本実施形態においては、情報処理装置100は、与信審査でローン否認から承認に予測を変更するための変更対象の属性4a及び変更量5aを決定する。変更対象の属性4aは、一つであってもよく、複数であってよい。図1の例では、変更対象の属性4aは、入力データ1の属性11-3「未返済ローン数」である。変更量5aは、2件減(すなわち、-2)である。決定された摂動ベクトル3a、すなわち、変更対象の属性4aと変更量5aとは、ユーザに提示される推薦アクションに対応する。
【0015】
図2は、ラベルを変更するための摂動ベクトル3aの決定処理の一例について説明する図である。各属性4aを座標軸とする座標系30において、一例において、第1ラベル領域31は、判定モデル10によってローン否認のラベルが予測される領域である。第2ラベル領域32は、判定モデル10によってローン承認のラベルが予測される領域である。
【0016】
訓練された判定モデル10は、現在の各属性値12によって表される状況(インスタンス)xでは、ローン否認と判定する。情報処理装置100は、目的の結果(すなわち、ラベルの変更)が可能であることを意味するf(x+a)=yを満たすために、実行可能な摂動ベクトルの集合Aのうちコスト関数c(a)のコスト値を低くすることができるa(摂動ベクトル3a)を決定する。摂動ベクトル3aを決定する処理は、摂動ベクトル最適化処理またはアクション最適化処理と呼ばれる場合がある。
【0017】
コスト関数c(a)は、摂動ベクトル3a、すなわちアクションの実行にかかる労力等のコストを示す関数である。一例において、コスト関数c(a)は、TLPS(Total Log-Percentile Shift)またはDACE(Distribution-Aware Counterfactual Explanation)等の混合整数線形最適化問題ベースの反事実説明技術において使用される既存のコスト関数であってよい。従って、コスト関数c(a)及びコスト関数のコスト値の算出についての詳しい説明を省略する。コスト値は、摂動ベクトル3aを決定する処理において算出されてよい。
【0018】
図3は、実施形態の一例としての情報処理装置100において、入力データ1に欠損がある場合のアクション推薦処理の一例を示す図である。実施形態の情報処理装置100は、このように入力データ1に欠損がある場合にも、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことができ、アクション推薦を行なうことができる。入力データ1における属性値の欠損には、属性値が入力されていない状態(すなわち、空白の状態)、及び読み取れない場合等が含まれる。
【0019】
図3に示される例において、入力データ1は、複数の属性11-1~11-4のうち、属性11-2である月収の項目における属性値12-2を欠いている。入力データ1における欠損は、種々の原因によって生じうる。計器の故障等に起因して一部の属性値12が測定できない場合のように偶発的な理由により欠損が生じる場合がある。また、プライバシー情報を入力することについての不安から, ユーザが月収等の属性値12を入力しなかった等の人為的な理由に起因して欠損が生じる場合もある。
【0020】
入力データ1に欠損がある場合に、平均値等の単一の補完値によって欠損を補完し、図2で説明した手法に基づいて、推薦するアクションに関する摂動ベクトル3aを決定することも考えられる。但し、単一の補完値(補完方法)が欠落した本来の値と乖離している場合には、予測結果を変更するアクション(摂動ベクトル3a)を提案することが難しい。
【0021】
本実施形態の情報処理装置100は、入力データ1に含まれる複数の属性11の属性値12の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データ2-1~2-6を生成する。情報処理装置100は、図2と同様の手法によって、複数パターンのそれぞれの補完データ2-1~2-6によって予測されるラベルを変更するために補完データ2-1~2-6のそれぞれの摂動ベクトル3-1~3-6を決定する。各摂動ベクトル3-1~3-6は、変更対象の属性4-1~4-6と変更量5-1~5-6とを含む。情報処理装置100は、各補完データ2-1~2-6(補完データ2と総称する場合がある)と摂動ベクトル3-1~3-6(摂動ベクトル3と総称する場合がある)との組(「補完_アクション組」と称する場合がある)を生成してよい。なお、摂動ベクトル3は、摂動情報の一例である。摂動情報は、複数パターンのそれぞれの補完データによって予測されるラベルを変更するために補完データの複数の属性の中から変更対象の属性と変更量とを含む情報であれば、ベクトル形式で表現されていなくてもよい。
【0022】
情報処理装置100は、複数のパターンのうちの一つのパターンの補完データ(例えば、補完データ2-1)において決定された摂動ベクトル(例えば、摂動ベクトル3-1)が他のパターンの補完データ2-2~2-6に対してラベルを変更可能か判定し判定結果を得る。情報処理装置100は、判定結果7-1~7-6(判定結果7と総称する場合がある)と、各摂動ベクトル3に伴うコスト値6-1~6-6(コスト値6と総称する場合がある)とに基づく評価指標8-1~8-6(評価指標8と総称する場合がある)を算出する。
【0023】
情報処理装置100は、判定結果7に基づいて、各摂動ベクトル3、換言すれば、各補完_アクション組について評価を行なう。情報処理装置100は、例示的に、決定された各摂動ベクトル3に伴うコスト値6と判定結果7とを含む評価指標8を用いて、各摂動ベクトル3、換言すれば、各補完_アクション組について評価を行なう。
【0024】
情報処理装置100は、評価結果に基づいて、複数の補完_アクション組のなかから、所定の組数の補完_アクション組を選択して、1つ以上の推薦アクションを出力する。
【0025】
図4は、実施形態の一例としての情報処理装置100のハードウェア構成を例示する図である。
【0026】
情報処理装置100は、例えば、図4に示すように、プロセッサ121,メモリ122,記憶装置123,グラフィック処理装置124,入力インタフェース125,光学ドライブ装置126,機器接続インタフェース127およびネットワークインタフェース128を構成要素として有する。これらの構成要素121~128は、バス129を介して相互に通信可能に構成される。
【0027】
プロセッサ(制御部)121は、情報処理装置100全体を制御する。プロセッサ121は、マルチプロセッサであってもよい。プロセッサ121は、例えばCPU,MPU(Micro Processing Unit),DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit),PLD(Programmable Logic Device),FPGA(Field Programmable Gate Array)のいずれか一つであってもよい。また、プロセッサ121は、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。
【0028】
そして、プロセッサ121が制御プログラム(評価プログラム123aあるいはアクション推薦プログラム)を実行することにより、図5に例示する制御部101としての機能が実現される。
【0029】
なお、情報処理装置100は、例えばコンピュータ読み取り可能な非一時的な記録媒体に記録されたプログラム[評価プログラム123aやOS(Operating System)プログラム]を実行することにより、評価装置またはアクション推薦装置としての機能を実現する。
【0030】
情報処理装置100に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、情報処理装置100に実行させるプログラムを記憶装置123に格納しておくことができる。プロセッサ121は、記憶装置123内のプログラムの少なくとも一部をメモリ122にロードし、ロードしたプログラムを実行する。
【0031】
また、情報処理装置100(プロセッサ121)に実行させるプログラムを、光ディスク126a,メモリ装置127a,メモリカード127c等の非一時的な可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ121からの制御により、記憶装置123にインストールされた後、実行可能になる。また、プロセッサ121が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
【0032】
メモリ122は、ROM(Read Only Memory)およびRAM(Random Access Memory)を含む記憶メモリである。メモリ122のRAMは情報処理装置100の主記憶装置として使用される。RAMには、プロセッサ121に実行させるOSプログラムや制御プログラムの少なくとも一部が一時的に格納される。また、メモリ122には、プロセッサ121による処理に必要な各種データが格納される。
【0033】
記憶装置123は、ハードディスクドライブ(Hard Disk Drive:HDD)、SSD(Solid State Drive)、ストレージクラスメモリ(Storage Class Memory:SCM)等の記憶装置であって、種々のデータを格納するものである。記憶装置123は、本情報処理装置100の補助記憶装置として使用される。記憶装置123には、OSプログラム,制御プログラムおよび各種データが格納される。制御プログラムには、評価プログラム123a等が含まれてよい。
【0034】
なお、補助記憶装置としては、SCMやフラッシュメモリ等の半導体記憶装置を使用することもできる。また、複数の記憶装置123を用いてRAID(Redundant Arrays of Inexpensive Disks)を構成してもよい。
【0035】
また、記憶装置123には、後述する制御部101が各処理を実行する際に生成される各種データを格納してもよい。
【0036】
グラフィック処理装置124は、モニタ124a等の出力装置に対する画面表示制御を行なう。グラフィック処理装置124としては、種々の演算処理装置、例えば、GPU(Graphics Processing Unit)、APU、DSP、ASICまたはFPGA等の集積回路(IC)が挙げられる。また、グラフィック処理装置124は、機械学習モデルを利用した機械学習処理および推論処理を実行するアクセラレータとしての構成を有してよい。グラフィック処理装置124が、プログラム(評価プログラム123aやOSプログラム)の少なくとも一部を実行してもよい。
【0037】
グラフィック処理装置124には、モニタ124aが接続されている。グラフィック処理装置124は、プロセッサ121からの命令に従って、画像をモニタ124aの画面に表示させる。モニタ124aとしては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置等が挙げられる。
【0038】
入力インタフェース125には、キーボード125aおよびマウス125bが接続されている。入力インタフェース125は、キーボード125aやマウス125bから送られてくる信号をプロセッサ121に送信する。なお、マウス125bは、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル,タブレット,タッチパッド,トラックボール等が挙げられる。
【0039】
光学ドライブ装置126は、レーザ光等を利用して、光ディスク126aに記録されたデータの読み取りを行なう。光ディスク126aは、光の反射によって読み取り可能にデータを記録された可搬型の非一時的な記録媒体である。光ディスク126aには、DVD(Digital Versatile Disc),DVD-RAM,CD-ROM(Compact Disc Read Only Memory),CD-R(Recordable)/RW(ReWritable)等が挙げられる。
【0040】
機器接続インタフェース127は情報処理装置100に周辺機器を接続するための通信インタフェースである。例えば、機器接続インタフェース127には、メモリ装置127aやメモリリーダライタ127bを接続することができる。メモリ装置127aは、機器接続インタフェース127との通信機能を搭載した非一時的な記録媒体、例えばUSB(Universal Serial Bus)メモリである。メモリリーダライタ127bは、メモリカード127cへのデータの書き込み、またはメモリカード127cからのデータの読み出しを9*/行なう。メモリカード127cは、カード型の非一時的な記録媒体である。
【0041】
ネットワークインタフェース128は、図示しないネットワークに接続される。ネットワークインタフェース128は、ネットワークを介して、ユーザPC200や通信機器,他の情報処理装置等が接続されてもよい。
【0042】
図5は、実施形態の一例としての情報処理装置100の機能構成を例示する図である。情報処理装置100においては、プロセッサ121が制御プログラム(評価プログラム123aまたはアクション推薦プログラム)を実行することによって、評価装置あるいは摂動ベクトル出力装置(アクション推薦装置)として機能してよい。
【0043】
図5に示すように、情報処理装置100は、制御部101及びメモリ部110を有する。制御部101は、例示的に、補完データ生成部102,摂動ベクトル決定部103,判定部104,評価部105,選択部107,及び出力部108を備える。
【0044】
メモリ部110は、記憶領域の一例であり、制御部101が利用する種々のデータを記憶する。メモリ部120は、例えば、図4に示すメモリ122及び記憶装置123のうちの一方又は双方が有する記憶領域により実現されてもよい。
【0045】
図5に示すように、メモリ部110は、例示的に、領域情報111及びコスト情報112を記憶可能であってよい。領域情報111は、属性11の種別ごとの座標を有する座標系30(図2)内の領域に設定されたクラス(すなわち、ラベル)を示すデータである。クラス(すなわちラベル)には、例えばポジティブのクラスとネガティブのクラスがある。領域情報111は、判定モデル10において機械学習された結果に基づいて取得されてよい。一例において、領域情報111は、図2における第1ラベル領域31及び第2ラベル領域32を規定するための座標情報を含んでいてよい。
【0046】
コスト情報112は、摂動ベクトル決定部103によって摂動ベクトル3を決定する処理において算出されるコスト値6を含む。
【0047】
図6図13を参照しつつ、図5の各部の機能を説明する。
【0048】
制御部101は、入力データ1に基づいて各種の演算処理を実行する。制御部101は、属性値に欠損がある不完全データが入力された場合においても、複数パターンの補完データ2-1~2-6を生成し、代表的な補完データを抽出することにより不完全データに対応可能なアクション推薦を行なう。一例において、制御部101は、補完データ2-1~2-6と各補完データ2-1~2-6における摂動ベクトル3との組を複数生成し、生成した複数の組から代表的な組を抽出する。代表的な組(あるいは補完データまたは摂動ベクトル3)を抽出することを「要約」と称する場合がある。制御部101は、正確な属性値が欠損していて不明な場合においても、所望の予測結果に変更する摂動ベクトル3を評価し、提供する。
【0049】
補完データ生成部102は、入力データ1に含まれる複数の属性11における属性値12の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データ2を生成する。
【0050】
図6は、実施形態の一例としての情報処理装置100における補完データの作成処理の一例を示す図である。補完データ生成部102は、欠損を補完する値を属性空間(例えば座標系30)上でサンプリングしてよい。欠損属性値において取り得る範囲についての情報がメモリ部110に格納されてよい。補完データ生成部102は、範囲内において、複数の補完値をサンプリングする。図6においては、月収の属性値12-2についての補完値として、0円、5万円、34万円、58万円、82万円、107万円という値がサンプリングされる。補完データ生成部102は、取り得る範囲において網羅的に複数の補完値をサンプリングしてよい。サンプリングには一様サンプリングのほか,既存の補完手法(例: 非欠損属性の値から欠損値を推定する確率モデル)も利用可能である。サンプリングされる間隔は、等間隔であってもよく、等間隔でなくてもよい。
【0051】
補完データ生成部102は、入力データ1における欠損した属性値を複数の補完値に置換することによって、複数パターンの補完データ2-1~2-6を生成する。1つの欠損において、作成される補完データの数2-1~2-6は、図6の場合に限定されない。
【0052】
摂動ベクトル決定部103は、複数パターンのそれぞれの補完データ2において、予測されるラベルを変更するための変更対象の属性4と変更量5とを含む各摂動ベクトル3を決定する。
【0053】
図7は、実施形態の一例としての情報処理装置におけるアクション最適化処理の一例を示す図である。アクション最適化処理において、摂動ベクトル決定部103は、各摂動ベクトル3-1~3-6を決定してよい。摂動ベクトル決定部103による処理は、入力データ1に代えて複数の補完データ2-1~2-6のそれぞれから摂動ベクトル3-1~3-6を決定することを除いて、図2で説明した処理と同様である。従って、繰り返しの説明を省略する。摂動ベクトル決定部103は、補完データ2-1~2-6の数に対応した組数の補完_アクション組9-1~9-6の集合を生成する。
【0054】
図8は、補完_アクション組9とコスト値6について例示する図である。摂動ベクトル決定部103が各摂動ベクトル3-1~3-6を決定するとき、それぞれの摂動ベクトル3-1~3-6に対応するコスト値6が算出される。
【0055】
選択部107は、複数のパターンのそれぞれの補完データ2-1~2-6と対応する摂動ベクトル3-1~3-6とを含む補完_アクション組9-1~9-6において、未選択の組の中から評価指標8に基づいて組を選択する。なお、評価指標8の値が複数の補完_アクション組9間において同値となった場合には、選択部107は、予め定められた基準に従って組を選択してもよい。例えば、選択部107は、補完値が属性値の平均値に近い組を選択してよい。これと異なり、評価指標8の値が同値で最小値になった場合は、選択部107は、当該評価指標8を示すすべての組を選択するようにしてもよい。
【0056】
図9は、補完_アクション組9の選択処理について例示する図である。選択部107は、生成した補完_アクション組9-1~9-6の集合から、限定された数の代表的な組を選択(抽出)する。図9では、各補完_アクション組9-1~9-6は、それぞれ補完データ#1~#6(補完データ2-1~2-6)と摂動ベクトル#1~#6とを含む。摂動ベクトル#1~#6が、推奨されるアクション#1~#6に対応する。図9の例においては、選択部107は、補完_アクション組9-1,9-3,及び9-5を選択する。選択する組数は、3組に限られず、ユーザの指示によって決定されてよい。
【0057】
図10は、補完_アクション組9の選択処理の詳細について例示する図である。摂動ベクトル決定部103によって、所定の組数の補完_アクション組9-1~9-6が生成される。生成された補完_アクション組9-1~9-6が選択部107に入力される。
【0058】
選択部107は、補完_アクション組9をP組(但しPは自然数)選択する場合には、各段階において1組を選択する段階をP回繰り返すことによってP組の補完_アクション組9を選択する。図10においては、選択部107は、各段階において1組を選択する段階を3回繰り返すことによって合計3組(P=3)の補完_アクション組9を選択する。
【0059】
図10に示すように、第1段階では、選択部107は、補完_アクション組#1~#6(補完_アクション組9-1~9-6)全体から、評価指標8を最小化できる組(図10では、補完_アクション組#1)を選択する。但し、評価指標8の内容によっては、評価指標8を最大化できる組を選択する場合もある。
【0060】
第2段階では、選択部107は、既に選択された補完_アクション組#1を除いた残りの補完_アクション組#2~#6のなかから評価指標8を最小化できる組(図10では、組#5)を選択する。
【0061】
第3段階では、選択部1-7は、既に選択された補完_アクション組#1及び#5を除いた残りの補完_アクション組#2~#4,#6のなかから評価指標8を最小化できる組(図10では、組#3)を選択する。
【0062】
出力部108は、選択された補完_アクション組9に基づいて推奨するアクションについての情報を外部に出力する。出力部108は、情報をモニタ124aに出力してもよく、ユーザPC200等の他のコンピュータに出力してもよい。
【0063】
判定部104は、複数のパターンのうちの1つのパターンの補完データ(例えば、補完データ2-1)において決定された摂動ベクトル(例えば、摂動ベクトル3-1)が他のパターンの補完データ2-2~2-6に対してラベルを変更可能か判定し判定結果7を得る。判定部104は、ラベルを変更可能な他のパターンの補完データの個数を判定してよい。
【0064】
図11は、補完_アクション組9から第1の組を選択する段階の一例を示す図である。判定部104が、複数のパターンうちの一つパターンの補完データ(例えば、補完データ2-1)において決定された摂動ベクトル(例えば3-1)について判定する場合を説明する。摂動ベクトル3-1は、未返済ローン数を2件減及び返済遅延数を1件減という変更対象の属性4-1及び変更量5-1を含む。従って、摂動ベクトル3-1によって、他の摂動ベクトル3-2~3-6の各内容を満たすので、摂動ベクトル3-1は、他のパターンの補完データ2-2~2-6のそれぞれに対してラベルを変更することができると判定される。
【0065】
図11に示される例では、補完データ2-1について決定された摂動ベクトル3-1は、他の全ての補完データ2-2~2-6に対してもラベルをローン否認から承認へと変更することができる。従って、判定部104は、判定結果7として、1つのパターンの摂動ベクトルに従属してラベルが変更されない他のパターンの補完データ2-2~2-6の数(非従属数)は0個という結果を得る。換言すれば、判定部104は、判定結果7として、従属して補完データ2-1~2-6においてラベルが変更可能となる総数(従属数)が6個という結果を得る。判定部104は、各摂動ベクトル3-1~3-6について同様の処理を行なう。
【0066】
評価部105は、判定部104による判定結果に基づいて、各摂動ベクトル3-1~3-6の評価を行なう。「評価」は、摂動ベクトル3-1~3-6によって、予測ラベルを変更するための有効性、有用性の評価であってよく、摂動ベクトル3-1~3-6を選択するための選択順位に関する評価指標8を算出することを意味してよい。摂動ベクトル3-1~3-6は、推奨アクションに対応する。従って、「評価」は、推奨アクションによって、予測ラベルを変更するための有効性、有用性の評価であってよく、推奨アクションを選択するための選択順位に関する評価指標8を算出することを意味してよい。
【0067】
本実施形態においては、評価指標8は、決定された摂動ベクトル3に伴うコスト関数のコスト値6と判定結果7とを含む。評価指標8は、ラベルを変更可能と判定される他のパターンの数が多くなるほど、及びコスト値6が小さくなるほど減少する。
【0068】
選択部107は、複数のパターンのそれぞれの補完データ2-1~2-6と対応する摂動ベクトル3-1~3-6とを含む補完_アクション組9-1~9-6において、未選択の組の中から評価指標8に基づいて組を選択する。選択部107は、ラベルを変更可能と判定される他のパターンの数が多くなるほど、及びコスト値6が小さくなるほど減少する評価指標8を用いてよい。この場合、選択部107は、1つの段階において、未選択の組の中で評価指標8が最小となる補完_アクション組9を選択してよい。
【0069】
但し、本実施形態と異なり、評価部105は、評価指標として、ラベルを変更可能と判定される他のパターンの数が多くなるほど、及びコスト値6が小さくなるほど増加する評価指標を算出してもよい。この場合、選択部107は、1つの選択段階において、未選択の組の中で評価指標が最大となる補完_アクション組9を選択してよい。
【0070】
一例において、評価指標は、〔総コスト〕+〔ラベルを変えるための有効なアクションがない補完の総数〕で表される。
【0071】
選択部107によってm個(mは1以上の自然数)の摂動ベクトル3s1,3S2,・・・3Smが選択される場合を考える。摂動ベクトル3s1,3S2,・・・3Smに伴うそれぞれのコスト値をC,C,・・・Cとし、摂動ベクトル3s1,3S2,・・・3Smが担当する摂動ベクトル3の数(すなわち、担当数)をT,T,・・・Tとすると、総コストは、以下の通りとなる。
【0072】
総コスト=C・T+C・T+C・T・・・+C・T
【0073】
なお、担当する摂動ベクトルには、ラベルを変更可能と判定される他のパターンの補完データにおける摂動ベクトル3を含む。但し、選択された摂動ベクトル3s1,3S2,・・・3Snのうちの複数の摂動ベクトルが、共にラベルを変更可能と判定される他のパターンについては、摂動ベクトル3s1,3S2,・・・3Snのうち、コスト値が低い摂動ベクトルが担当する。担当する摂動ベクトルには、選択された摂動ベクトル自体も含まれる。
【0074】
図11において摂動ベクトル3-1が選択される場合の総コストは、コスト値Cである摂動ベクトル3-1が全て(自身を含む6個)の摂動ベクトル3を担当するので、0.70に6を乗じた値となる。さらに、図11に示す場合、1つのパターンの摂動ベクトルに従属してラベルが変更されない他のパターンの補完データ2-2~2-6の数(非従属数)は0である。従って、ラベルを変えるための有効なアクションがない補完の総数は0である。従って、摂動ベクトル3-1が選択される場合の評価指標は4.20となる。
【0075】
同様に、摂動ベクトル3-2が選択される場合の総コストは、コスト値Cである摂動ベクトル3-2が、摂動ベクトル3-2~3-4,3-6の変更対象の属性及び変更量を満たす。一方、摂動ベクトル3-2は、摂動ベクトル3-1,3-5の変更対象の属性及び変更量を満たさない。従って、摂動ベクトル3-2が選択される場合の担当数は4となり、総コストは、0.61に4を乗じて2.44となる。ラベルを変えるための有効なアクションがない補完の総数は2である。従って、摂動ベクトル3-2が選択される場合の評価指標は4.44となる。
【0076】
評価部105は、以下、同様に摂動ベクトル3-3、3-4、3-5、3-6がそれぞれ採用された場合の評価指標8を算出する。評価部105は、選択した場合に最も評価指標8を低くすることができる摂動ベクトル3-1を選択(すなわち、補完_アクション組9-1を選択)する。
【0077】
図12は、図11に後続して補完_アクション組9から第2の組を選択する段階の一例を示す図である。選択部107は、未選択の組の中から評価指標8に基づいて組を選択する。選択部107が既に選択されている摂動ベクトル3-1に加えて3-5を選択する場合、評価部105は、以下のように評価指標を算出する。
【0078】
判定部104は、判定結果として、補完データ2-5における摂動ベクトル3-5に従属して他の補完データ2-6においてラベルが変更可能となると判定する。摂動ベクトル3-5自体と摂動ベクトル3-6とは、既に選択されている摂動ベクトル3-1によっても、従属してラベル変更可能である。しかし、摂動ベクトル3-5の方が、摂動ベクトル3-1よりもコスト値6が低いので、摂動ベクトル3-5自体と摂動ベクトル3-6とは、摂動ベクトル3-5が担当する。
【0079】
摂動ベクトル3-5の担当数は2となり、摂動ベクトル3-1の担当数は4に削減される。評価部105は、摂動ベクトル3-1に加えて3-5が選択される場合の総コストを0.70×4+0.30×2=3.40と算出する。また、選択される摂動ベクトル3-1及び3-5にって、全ての摂動ベクトル3の条件を満たすことができるので、ラベルを変えるための有効なアクションがない補完の総数は0となる。従って、摂動ベクトル3-1,3-5が選択される場合の評価指標は3.40となる。
【0080】
同様に、選択部107が既に選択されている摂動ベクトル3-1に加えて3-2を選択する場合、評価部105は、以下のように評価指標を算出する。
【0081】
判定部104は、判定結果として、補完データ2-2における摂動ベクトル3-2に従属して、他の補完データ2-3,2-4,2-6においてラベルが変更可能となると判定する。摂動ベクトル3-2自体と、摂動ベクトル3-3,3-4,3-6は、既に選ばれている摂動ベクトル3-1によっても、従属してラベル変更可能である。しかし、摂動ベクトル3-2の方が、摂動ベクトル3-1よりもコスト値が低いので、摂動ベクトル3-2,3-3,3-4,3-6は、摂動ベクトル3-2が担当する。
【0082】
摂動ベクトル3-2の担当数は、4となり、摂動ベクトル3-1の担当数は2となる。ラベルを変えるための有効なアクションがない補完の総数は0である。この結果、摂動ベクトル3-1,3-2が選択される場合の評価指標は0.70×2+0.61×4=3.84となる。同様に、既に選択されている摂動ベクトル3-1に加えて摂動ベクトル3-3を選択する場合の評価指標は、3.8となる。摂動ベクトル3-1に加えて摂動ベクトル3-4を選択する場合の評価指標は3.88である。
【0083】
なお、選択部107が既に選択されている摂動ベクトル3-1に加えて、摂動ベクトル3-6を選択する場合、評価部105は、以下のように評価指標を算出する。
【0084】
判定部104は、判定結果として、補完データ2-6における摂動ベクトル3-6に従属して、他の補完データ2-1~2-5のいずれもラベル変更することができない。従って、摂動ベクトル3-6は、摂動ベクトル3-6自体を担当し、他の摂動ベクトル3-1~3-5は、摂動ベクトル3-1が担当する。摂動ベクトル3-6の担当数は1であり、摂動ベクトル3-1の担当数は5である。この結果、摂動ベクトル3-1,3-6が選択される場合の評価指標は、0.70×5+0.20×1=3.70となる。
【0085】
選択部107は、既に選択されている摂動ベクトル3-1に加えて、さらに選択した場合に最も評価指標8を低くすることができる摂動ベクトル3-5を選択(すなわち、補完_アクション組9-5を選択)する。
【0086】
図13は、図12に後続して補完_アクション組9から第3の組を選択する段階の一例を示す図である。図13においても、判定部104が、複数パターンのうちの一つのパターンの補完データ2において決定された摂動ベクトル3が複数のパターンのうちの他のパターンの補完データ2に対してもラベルを変更可能か否かに関する判定をする。
【0087】
そして、評価部105は、判定結果7に基づいて摂動ベクトル3の評価を行なう。選択部107は、既に選択されている摂動ベクトル3-1、3-5の他に、さらに選択した場合に最も評価指標8を低くすることができる摂動ベクトル3-3を選択(すなわち、補完_アクション組9-3を選択)する。
【0088】
図11から図13に示された処理によれば、情報処理装置100は、コスト値6のみによって複数の摂動ベクトル3を評価するわけではない。情報処理装置100は、複数パターンのうちの一つのパターンの補完データにおいて決定された摂動ベクトル3が複数のパターンのうちの他のパターンの補完データに対してもラベルを変更可能か否かについて考慮して摂動ベクトル3を評価する。これにより、欠損を含む不完全データに対しても、所望の結果を得るために推薦するアクションに対応する摂動ベクトル3(すなわち、変更対象の属性4と変更量5)の評価を行なうことができる。このような評価に基づいて、推薦するアクションに対応する摂動ベクトル3を選択することができるので、入力データ1に欠損がある場合においても、ユーザに対して推薦アクションを提案することができる。
【0089】
(B)動作
上述の如く構成された実施形態の一例としての情報処理装置100におけるアクション推薦処理を、図14に示すフローチャート(ステップS1~S13)に従って説明する。
【0090】
ステップS1において、情報処理装置100の制御部101は入力データ1をユーザPC200等からネットワーク回線を通じて受け取る(ステップS1)。
【0091】
ステップS2において、制御部101は、入力データ1の属性値12の一部に欠損があるか否かを判断する。
【0092】
判断の結果、入力データ1に欠損がない場合には(ステップS2のNOルート参照)、処理がステップS3に移行する。
【0093】
ステップS3において、摂動ベクトル決定部103は、入力データ1によって予測されるラベルを変更するための摂動ベクトル3aを算出する(ステップS3)。摂動ベクトル3aは、入力データ1の属性11の中から選ばれた少なくとも1つの変更対象の属性4aと当該属性4aにおける変更量5aを含む。
【0094】
ステップS4において、出力部108は、算出された摂動ベクトル3aに対応する奨励アクションの情報を出力する。
【0095】
一方、判断の結果、入力データ1に欠損がある場合には(ステップS2のYESルート参照)、処理がステップS5に移行する。
【0096】
ステップS5において、補完データ生成部102は、欠損を複数通りに補完した複数パターンの補完データ2を生成する。
【0097】
ステップS6において、摂動ベクトル決定部103は、複数パターンのそれぞれの補完データ2において、予測されるラベルを変更するための変更対象の属性4と変更量5とを含む各摂動ベクトル3を決定する。換言すれば、摂動ベクトル決定部103は、補完データ2と摂動ベクトル3とを含む組である補完_アクション組9の集合を生成する。
【0098】
ステップS7において、選択部107は、未選択の補完データ2と摂動ベクトル3を含む補完_アクション組9の中から1つの組を選択候補として取得する。
【0099】
ステップS8において、判定部104は、選択候補として取得された組の補完データ(例えば、補完データ2-1)の摂動ベクトル(例えば、摂動ベクトル3-1)が他のパターンの補完データ2-2~2-6に対してラベルを変更できる個数を判定する。
【0100】
ステップS9において、評価部105は、摂動ベクトル3-1~3-6の評価を行なう処理において、評価指標8を算出する。評価指標8は、取得された組の摂動ベクトル3に伴うコスト関数のコスト値6と変更できる個数の判定結果7とを含む。一例において、評価指標8は、ラベルを変更可能と判定される他のパターンの個数が多くなるほど、及びコスト値6が小さくなるほど減少する指標である。
【0101】
ステップS10において、選択部107は、選択候補として未取得の組があるか確認する。
【0102】
選択候補として未取得の組がある場合には(ステップS10のYESルート参照)、処理がステップS7に移行する。
【0103】
一方、選択候補として未取得の組がない場合には(ステップS10のNOルート参照)、処理がステップS11に移行する。選択候補として未取得の組がないことは、換言すれば、未選択の組を、全て選択候補として取得したことを意味する。
【0104】
ステップS11において、選択部107は、選択候補の中で評価指標8を最も改善できる補完データ2と摂動ベクトル3(推定アクション)の組である補完_アクション組9を一つ選択する。
【0105】
ステップS12において、選択部107は、既に所定数の補完_アクション組9を選択したか否かを判断する。
【0106】
選択部107が、まだ所定数の補完_アクション組9を選択し終えていない場合(ステップS12のNOルート参照)、処理がステップS7に移行する。
【0107】
一方、選択部107が、所定数の補完_アクション組9を選択済みの場合(ステップS12のYESルート参照)、処理がステップS13に移行する。
【0108】
ステップS13において、出力部108は、選択された所定数の補完_アクション組9、すなわち、補完データ2と摂動ベクトル3の組を出力する。出力部108は、補完方法(補完値等)とともに、選択された摂動ベクトル3に対応する推薦アクションの情報を出力する。
【0109】
図15は、入力データに欠損がある場合における、与信審査でローン否認から承認に予測を変えるアクション推薦を実行する実施例を示す図である。図15においては、月収の値が欠損している場合における与信審査のアクション推薦に実施形態の技術を適用した。
【0110】
本来の月収は3000ドルであったが、ユーザが月収についてプライバシー等の観点から入力しなかったため欠損が生じた。情報処理装置100は、符号(a)、(b)、(c)に示す計3組の補完_アクション組9-1b,9-2b,9-3bを選択し、出力した。これら3組は、図11図13に示したように、摂動ベクトル3に伴うコスト値6のみに基づいて選択されたのではなく、他のパターンの補完データにおけるラベル変更可能性を考慮して選択された。
【0111】
符号(a)は、情報処理装置100が、月収の額が欠損した入力データ1において、月収の額を0ドル(範囲0ドル以上0ドル以下)の補完値で補完した補完データ2-1bの場合を示す。この場合、選択部107は、「30-59日の返済遅延数を1個減、及び未返済のローン数を1個減」の摂動ベクトル3-1bを選択した。換言すれば、選択部107は、補完データ2-1bと摂動ベクトル3-1bを含む補完_アクション組9-1bを選択した。
【0112】
符号(b)は、情報処理装置100が、月収の額が欠損した入力データ1において、月収の額を8227ドル(範囲8227ドル以上10750ドル以下)の補完値で補完した補完データ2-2bの場合を示す。この場合、選択部107は、「未返済のローン数を4個減」の摂動ベクトル3-2bを選択した。換言すれば、選択部107は、補完データ2-2bと摂動ベクトル3-2bを含む補完_アクション組9-2bを選択した。
【0113】
符号(c)は、情報処理装置100が、月収の額が欠損した入力データ1において、月収の額を3471ドル(範囲553ドル以上5831ドル以下)の補完値で補完した補完データ2-3bの場合を示す。この場合、選択部107は、「30-59日の返済遅延数を1個減」の摂動ベクトル3-3bを選択した。換言すれば、選択部107は、補完データ2-3bと摂動ベクトル3-3bを含む補完_アクション組9-3bを選択した。
【0114】
情報処理装置100は、選択された補完_アクション組9-1b,9-2b,9-3bに基づいて、3種類のアクション推薦をユーザPC200の画面上に提示した。(a)第1組(補完方法0ドル)及び(c)第3組(補完方法 3471ドル (553ドル以上5831ドル以下))においては、補完値の範囲を真の属性値3000ドルが満たしている。従って、(a)または(c)で奨励されたアクションをユーザが実行することで、ローン否認のラベルからローン承認のラベルへと変更することができる。
【0115】
一方、(b)第2組(補完方法 8227ドル(8227ドル以上10750ドル以下))においては、補完値の範囲を真の属性値3000ドルが満たしていない。従って、(b)で奨励されたアクションをユーザ実行しても、ローン否認のラベルからローン初認のラベルへと変更することはできない。但し、図15のように、アクション(換言すれば、摂動ベクトル3)のみならず、補完方法(補完値または補完値の範囲)についても提示することで、適切なアクションをユーザ自身が選択することができた。
【0116】
図15に示される実施例においても、欠損を含む入力データに対して、ラベルを変更可能なアクション推薦を行なうことが可能であった。情報処理装置100は、与信審査でローン否認から承認に予測を変えるアクション推薦への応用において、3個から4組程度の適切な補完_アクション組9を1分以内に推薦可能であった。ベンチマーク実験においては、欠損を含む入力データ1に対して、与信審査でローン否認から承認に予測を変えるアクション推薦をユーザに提供できる率を37%から96%に改善することができた。
【0117】
図1から図15においては、主として、実施形態の情報処理装置100をローン否認から承認に予測を変えるアクション推定の場合を例にとって説明した。但し、本発明の実施形態の情報処理装置100は、この場合に限られない。
【0118】
図16は、健康状態の改善のアクション推薦における実施形態の一例を示す図である。図16においては、入力データ1aは、年齢、血糖値、体脂肪率などの項目を含む属性を有する。図16では、属性値である「血糖値」が欠損している。この場合にも、情報処理装置100は、欠損値に対して複数の補完値を代入して複数パターンの補完データを生成してよい。情報処理装置100は、複数パターンの補完データのそれぞれについて摂動ベクトルを決定することで、複数組の補完_アクション組9-1a~9-Na(#1~#N)を生成する。情報処理装置100は、複数パターンのうちの1つのパターンの補完データにおいて決定された摂動ベクトル3が複数のパターンのうちの他のパターンの補完データに対してもラベルを変更可能か否かの判定結果7を考慮して、補完_アクション組#j~#kを選択する。情報処理装置100は、選択された補完_アクション組#j~#kを出力してよい。情報処理装置100は、補完_アクション組#j~#kに対応する推薦アクション14-j~14-kをユーザ端末200等に提示してよい。
【0119】
なお、情報処理装置100が選択部107及び出力部108を含む場合を説明したが、情報処理装置100が、選択部107及び出力部108を含まなくてもよい。この場合も、欠損を含むデータに対して、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことができる評価技術として利用できる。評価された変更属性と変更量は、他の装置が種々の解析等に利用することもできる。
【0120】
(C)効果
実施形態の一例としての情報処理装置100によれば、補完データ生成部102が、入力データ1に含まれる複数の属性11の属性値12の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データ2を生成する。この結果、摂動ベクトル決定部103が、複数パターンのそれぞれの補完データ2によって予測されるラベルを変更するために補完データの複数の属性の中から変更対象の属性4と変更量5とを含む摂動ベクトル3(摂動情報)を決定する。そして、評価部105は、複数パターンのうちの一つのパターンの補完データにおいて決定された摂動ベクトル3が複数のパターンのうちの他のパターンの補完データ2に対してもラベルを変更可能か否かに関する判定結果7に基づいて、摂動ベクトル3の評価を行なう。
【0121】
これにより、欠損を含むデータに対しても、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことが可能となる。さらに、単なる平均値等によって欠損値を置換することで1つの補完データを生成する場合に比べて、評価制度を高めることができる。
【0122】
他パターンに対してラベルを変更可能か否かの判定結果7を考慮して摂動ベクトル3について評価することができるので、欠損値の予測が困難である場合において、実際の欠損値が取り得る範囲に対する許容性を高めることがきる。これにより、予測されるラベルを変更可能な変更属性と変更量を選択する可能性が高まる。
【0123】
ユーザが開示したくない属性値を開示しない場合おいても、情報処理装置100は、ラベルを変更可能な摂動ベクトル3の評価を行なうことができる。
【0124】
評価部105は、評価指標8を用いて、摂動ベクトル3の評価をする。評価指標8は、摂動ベクトル3に伴うコスト関数のコスト値6と判定結果7とを含む。評価指標8は、ラベルを変更可能と判定される他のパターンの数が多くなるほど、及びコスト値6が小さくなるほど、増加及び減少のどちらか一方に変化する。
【0125】
これにより、実際の欠損値が取り得る範囲に対する許容性を高める観点と、コスト値6を低くする観点とのバランスを考慮して、用途に応じ摂動ベクトル3についての評価を実現することができる。
【0126】
選択部107は、複数のパターンのそれぞれの補完データ2と対応する摂動ベクトル3との補完_アクション組9において、未選択の組の中から評価指標8に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返す。従って、複数の補完_アクション組9を選択することができる。評価に基づいて選択されるアクションの種類を増やすことがきる。従って、提示を受けたユーザへ提示するアクションの選択肢が増える。また、各選択肢のアクションのみならず、補完値または補完値の範囲等の補完方法を提供することが可能となる。
【0127】
出力部108は、選択された組に基づいて推奨するアクションについての情報を外部に出力する。従って、入力データ1に欠損がある不完全データに対しても、推奨するアクションを提示することができる。ユーザは、プライバシー等の観点から開示したくない属性値を開示することなく、ラベルを変更するために推薦されるアクションを得ることができるようになる。
【0128】
想定されるビジネスシーンにおける効能としては、健康、経営、取引、ローン承認等のユーザの意思決定タスクに関係する判定モデルが使用されるすべての分野に本実施形態の手法を適用することができる。ユーザの意思決定タスクに関係するすべての分野において、ユーザのプライバシー等を尊重しつつ、ユーザが所望する決定に導くための行動指針を提供することができる。これにより、ユーザの意思決定を助けることができる。
【0129】
(D)その他
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
【0130】
(E)付記
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理をコンピュータに実行させることを特徴とする評価プログラム。
【0131】
(付記2)
前記摂動情報の評価を行なう処理において
決定された前記摂動情報に伴うコスト関数のコスト値と前記判定結果とを含み、前記ラベルを変更可能と判定される他のパターンの数が多くなるほど、及び前記コスト値が小さくなるほど、増加及び減少のどちらか一方に変化する評価指標を用いて、前記摂動情報の評価を行なう、
処理を前記コンピュータに実行させることを特徴とする、付記1に記載の評価プログラム。
【0132】
(付記3)
前記複数のパターンのそれぞれの補完データと対応する前記摂動情報との組において、未選択の組の中から前記評価指標に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返す、
処理を前記コンピュータに実行させることを特徴とする、付記2に記載の評価プログラム。
【0133】
(付記4)
選択された前記組に基づいて推奨するアクションについての情報を外部に出力する、
処理を前記コンピュータに実行させることを特徴とする、付記3に記載の評価プログラム。
【0134】
(付記5)
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理をコンピュータが実行することを特徴とする評価方法。
【0135】
(付記6)
前記摂動情報の評価を行なう処理において
決定された前記摂動情報に伴うコスト関数のコスト値と前記判定結果とを含み、前記ラベルを変更可能と判定される他のパターンの数が多くなるほど、及び前記コスト値が小さくなるほど、増加及び減少のどちらか一方に変化する評価指標を用いて、前記摂動情報の評価を行なう、
処理を前記コンピュータが実行することを特徴とする、付記5に記載の評価方法。
【0136】
(付記7)
前記複数のパターンのそれぞれの補完データと対応する前記摂動情報との組において、未選択の組の中から前記評価指標に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返す、
処理を前記コンピュータが実行することを特徴とする、付記6に記載の評価方法。
【0137】
(付記8)
選択された前記組に基づいて推奨するアクションについての情報を外部に出力する、
処理を前記コンピュータが実行することを特徴とする、付記7に記載の評価方法。
【0138】
(付記9)
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理を実行する制御部を有することを特徴とする情報処理装置。
【0139】
(付記10)
前記制御部は、
前記摂動情報の評価を行なう処理において、決定された前記摂動情報に伴うコスト関数のコスト値と前記判定結果とを含み、前記ラベルを変更可能と判定される他のパターンの数が多くなるほど、及び前記コスト値が小さくなるほど、増加及び減少のどちらか一方に変化する評価指標を用いて、前記摂動情報の評価を行なうことを特徴とする、付記9に記載の情報処理装置。
【0140】
(付記11)
前記制御部は、前記複数のパターンのそれぞれの補完データと対応する前記摂動情報との組において、未選択の組の中から前記評価指標に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返すことを特徴とする、付記10に記載の情報処理装置。
【0141】
(付記12)
前記制御部は、選択された前記組に基づいて推奨するアクションについての情報を外部に出力することを特徴とする、付記11に記載の情報処理装置。
【符号の説明】
【0142】
1 入力データ
2,2-1~2-6,2-1b~2-3b 補完データ
3a,3,3-1~3-6,3-1b~3-3b 摂動ベクトル
4a,4,4-1~4-6 変更対象の属性
5a,5,5-1~5-6 変更量
6,6-1~6-6 コスト値
7,7-1~7-6 判定結果、
8,8-1~8-6 評価指標
9,9-1~9-6,9-1a~9-Na,9-1b~9-3b 補完_アクション組
10 判定モデル
14-j~14-k 推薦アクション
30 座標系
31 第1ラベル領域
32 第2ラベル領域
11,11-1~11-4 属性
12,12-1~12-4 属性値
100 情報処理装置
101 制御部
102 補完データ生成部
103 摂動ベクトル決定部
104 判定部
105 評価部
107 選択部
108 出力部
110 メモリ部
111 領域情報
112 コスト情報
121 プロセッサ
122 メモリ
123 記憶装置
123a 評価プログラム
124 グラフィック処理装置
124a モニタ
125 入力インタフェース
125a キーボード
125b マウス
126 光学ドライブ装置
126a 光ディスク
127 機器接続インタフェース
127a メモリ装置
127b メモリリーダライタ
127c メモリカード
128 ネットワークインタフェース
129 バス
200 ユーザPC
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16