特開2024-112049 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 富士通株式会社の特許一覧

特開2024-112049評価プログラム，評価方法および情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024112049

(43)【公開日】2024-08-20

(54)【発明の名称】評価プログラム，評価方法および情報処理装置

(51)【国際特許分類】

G06F 16/906 20190101AFI20240813BHJP

【ＦＩ】

G06F16/906

【審査請求】未請求

【請求項の数】6

【出願形態】ＯＬ

(21)【出願番号】P 2023016871

(22)【出願日】2023-02-07

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110003649

【氏名又は名称】弁理士法人真田特許事務所

(74)【代理人】

【識別番号】100189201

【弁理士】

【氏名又は名称】横田功

(72)【発明者】

【氏名】金森憲太朗

(72)【発明者】

【氏名】▲高▼木拓也

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175FA03

(57)【要約】

【課題】欠損を含むデータに対しても、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なう。
【解決手段】入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、複数パターンのそれぞれの補完データによって予測されるラベルを変更するために補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、複数パターンのうちの一つのパターンの補完データにおいて決定された摂動情報が複数のパターンのうちの他のパターンの補完データに対してもラベルを変更可能か否かに関する判定結果に基づいて、摂動情報の評価を行なう。
【選択図】図７

【特許請求の範囲】

【請求項1】

入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理をコンピュータに実行させることを特徴とする評価プログラム。

【請求項2】

前記摂動情報の評価を行なう処理において
決定された前記摂動情報に伴うコスト関数のコスト値と前記判定結果とを含み、前記ラベルを変更可能と判定される他のパターンの数が多くなるほど、及び前記コスト値が小さくなるほど、増加及び減少のどちらか一方に変化する評価指標を用いて、前記摂動情報の評価を行なう、
処理を前記コンピュータに実行させることを特徴とする、請求項１に記載の評価プログラム。

【請求項3】

前記複数のパターンのそれぞれの補完データと対応する前記摂動情報との組において、未選択の組の中から前記評価指標に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返す、
処理を前記コンピュータに実行させることを特徴とする、請求項２に記載の評価プログラム。

【請求項4】

選択された前記組に基づいて推奨するアクションについての情報を外部に出力する、
処理を前記コンピュータに実行させることを特徴とする、請求項３に記載の評価プログラム。

【請求項5】

入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理をコンピュータが実行することを特徴とする評価方法。

【請求項6】

入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理を実行する制御部を有することを特徴とする情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、評価プログラム，評価方法および情報処理装置に関する。

【背景技術】

【0002】

コンピュータを用いた機械学習等により、予測対象である事柄、物、人などについての複数の属性と属性値を入力値として、予測対象が属するラベルを予測するモデルを生成することができる。予測対象が属する予測結果であるラベルを変更するために、その予測対象のどの属性値をどれだけ変更すればよいかを知りたい場合がある。このとき変更するのに適切な属性値を、コンピュータを用いて提案することが考えられる。

【0003】

一例において、反事実説明（ＣＥ：Counterfactual Explanation）においては、ラベルを変更するための１以上の変更属性と当該属性の変更量とを含む摂動ベクトルがユーザに提供される。摂動ベクトルが与えられると、ユーザは、摂動ベクトルを自分が望む決定結果を得るための「アクション」として解釈することができる。このような技術によれば、予測結果に関して建設的な説明をユーザに与えることができるため、ユーザからの信頼醸成につながる。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】国際公開２０２２／００３８１６号

【発明の概要】

【発明が解決しようとする課題】

【0005】

入力データにおいて属性値の一部が欠損している場合においては、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことが困難であるという課題がある。

【0006】

１つの側面では、本発明は、入力データにおいて属性値の一部が欠損している場合において、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことができるようにすることを目的とする。

【課題を解決するための手段】

【0007】

このため、この評価プログラムは、入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう処理をコンピュータに実行させる。

【発明の効果】

【0008】

一実施形態によれば、本発明は、入力データにおいて属性値の一部が欠損している場合において、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことができる。

【図面の簡単な説明】

【0009】

【図1】実施形態の一例としての情報処理装置において、入力データに欠損がない場合のアクション推薦処理の一例を示す図である。

【図2】ラベルを変更するための摂動ベクトルの決定処理の一例について説明する図である。

【図3】実施形態の一例としての情報処理装置において、入力データに欠損がある場合のアクション推薦処理の一例を示す図である。

【図4】実施形態の一例としての情報処理装置のハードウェア構成を例示する図である。

【図5】実施形態の一例としての情報処理装置の機能構成を例示する図である。

【図6】実施形態の一例としての情報処理装置における補完データの作成処理の一例を示す図である。

【図7】実施形態の一例としての情報処理装置におけるアクション最適化処理の一例を示す図である。

【図8】補完＿アクション組とコスト値について例示する図である。

【図9】補完＿アクション組の選択処理について例示する図である。

【図10】補完＿アクション組の選択処理の詳細について例示する図である。

【図11】補完＿アクション組から第１の組を選択する段階の一例を示す図である。

【図12】図１１に後続して補完＿アクション組から第２の組を選択する段階の一例を示す図である。

【図13】図１２に後続して補完＿アクション組から第３の組を選択する段階の一例を示す図である。

【図14】実施形態の一例としての情報処理装置におけるアクション推薦処理を説明するためのフローチャートである。

【図15】入力データに欠損がある場合における、与信審査でローン否認から承認に予測を変えるアクション推薦を実行する実施例を示す図である。

【図16】健康状態の改善のアクション推薦における実施形態の一例を示す図である。

【発明を実施するための形態】

【0010】

以下、図面を参照して本評価プログラム，評価方法および情報処理装置にかかる実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。

【0011】

（Ａ）構成
図１は、実施形態の一例としての情報処理装置１００において、入力データ１に欠損がない場合のアクション推薦処理の一例を示す図である。情報処理装置１００は、アクション推薦装置として機能してよい。図１は、情報処理装置１００が、与信審査でローン否認から承認に予測を変えるアクション推薦を行なう場合の例を示す。

【0012】

入力データ１は、複数の属性１１－１～１１－４（属性１１と総称する場合がある）と、各属性の属性値１２－１～１２－４（属性値１２と総称する場合がある）とを含む。入力データは、属性データとも呼ばれる。一例において、入力データ１は、ユーザＰＣ２００（すなわち、ユーザ端末）からユーザによって入力されてよい。

【0013】

入力データ１は、判定モデル１０に入力される。判定モデル１０は、既存の方法によって機械学習された機械学習モデルであってよい。判定モデル１０は、入力データ１に基づいて、ラベルを予測する。一例によって、判定モデル１０は、与信審査においてローン否認またはローン承認を予測する。判定モデル１０の構成は、従来の機械学習モデルと同様であるので、判定モデル１０自体の詳細な説明は省略する。

【0014】

情報処理装置１００は、判定モデル１０によって予測されるラベルを所望のラベルに変更するために、摂動ベクトル３ａ、すなわち、複数の属性１１の中から変更対象の属性４ａと変更量５ａとを決定する。本実施形態においては、情報処理装置１００は、与信審査でローン否認から承認に予測を変更するための変更対象の属性４ａ及び変更量５ａを決定する。変更対象の属性４ａは、一つであってもよく、複数であってよい。図１の例では、変更対象の属性４ａは、入力データ１の属性１１－３「未返済ローン数」である。変更量５ａは、２件減（すなわち、－２）である。決定された摂動ベクトル３ａ、すなわち、変更対象の属性４ａと変更量５ａとは、ユーザに提示される推薦アクションに対応する。

【0015】

図２は、ラベルを変更するための摂動ベクトル３ａの決定処理の一例について説明する図である。各属性４ａを座標軸とする座標系３０において、一例において、第１ラベル領域３１は、判定モデル１０によってローン否認のラベルが予測される領域である。第２ラベル領域３２は、判定モデル１０によってローン承認のラベルが予測される領域である。

【0016】

訓練された判定モデル１０は、現在の各属性値１２によって表される状況（インスタンス）ｘでは、ローン否認と判定する。情報処理装置１００は、目的の結果（すなわち、ラベルの変更）が可能であることを意味するｆ（ｘ＋ａ）＝ｙを満たすために、実行可能な摂動ベクトルの集合Ａのうちコスト関数ｃ（ａ）のコスト値を低くすることができるａ（摂動ベクトル３ａ）を決定する。摂動ベクトル３ａを決定する処理は、摂動ベクトル最適化処理またはアクション最適化処理と呼ばれる場合がある。

【0017】

コスト関数ｃ（ａ）は、摂動ベクトル３ａ、すなわちアクションの実行にかかる労力等のコストを示す関数である。一例において、コスト関数ｃ（ａ）は、ＴＬＰＳ（Total Log-Percentile Shift）またはＤＡＣＥ（Distribution-Aware Counterfactual Explanation）等の混合整数線形最適化問題ベースの反事実説明技術において使用される既存のコスト関数であってよい。従って、コスト関数ｃ（ａ）及びコスト関数のコスト値の算出についての詳しい説明を省略する。コスト値は、摂動ベクトル３ａを決定する処理において算出されてよい。

【0018】

図３は、実施形態の一例としての情報処理装置１００において、入力データ１に欠損がある場合のアクション推薦処理の一例を示す図である。実施形態の情報処理装置１００は、このように入力データ１に欠損がある場合にも、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことができ、アクション推薦を行なうことができる。入力データ１における属性値の欠損には、属性値が入力されていない状態（すなわち、空白の状態）、及び読み取れない場合等が含まれる。

【0019】

図３に示される例において、入力データ１は、複数の属性１１－１～１１－４のうち、属性１１－２である月収の項目における属性値１２－２を欠いている。入力データ１における欠損は、種々の原因によって生じうる。計器の故障等に起因して一部の属性値１２が測定できない場合のように偶発的な理由により欠損が生じる場合がある。また、プライバシー情報を入力することについての不安から, ユーザが月収等の属性値１２を入力しなかった等の人為的な理由に起因して欠損が生じる場合もある。

【0020】

入力データ１に欠損がある場合に、平均値等の単一の補完値によって欠損を補完し、図２で説明した手法に基づいて、推薦するアクションに関する摂動ベクトル３ａを決定することも考えられる。但し、単一の補完値（補完方法）が欠落した本来の値と乖離している場合には、予測結果を変更するアクション（摂動ベクトル３ａ）を提案することが難しい。

【0021】

本実施形態の情報処理装置１００は、入力データ１に含まれる複数の属性１１の属性値１２の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データ２－１～２－６を生成する。情報処理装置１００は、図２と同様の手法によって、複数パターンのそれぞれの補完データ２－１～２－６によって予測されるラベルを変更するために補完データ２－１～２－６のそれぞれの摂動ベクトル３－１～３－６を決定する。各摂動ベクトル３－１～３－６は、変更対象の属性４－１～４－６と変更量５－１～５－６とを含む。情報処理装置１００は、各補完データ２－１～２－６（補完データ２と総称する場合がある）と摂動ベクトル３－１～３－６（摂動ベクトル３と総称する場合がある）との組（「補完＿アクション組」と称する場合がある）を生成してよい。なお、摂動ベクトル３は、摂動情報の一例である。摂動情報は、複数パターンのそれぞれの補完データによって予測されるラベルを変更するために補完データの複数の属性の中から変更対象の属性と変更量とを含む情報であれば、ベクトル形式で表現されていなくてもよい。

【0022】

情報処理装置１００は、複数のパターンのうちの一つのパターンの補完データ（例えば、補完データ２－１）において決定された摂動ベクトル（例えば、摂動ベクトル３－１）が他のパターンの補完データ２－２～２－６に対してラベルを変更可能か判定し判定結果を得る。情報処理装置１００は、判定結果７－１～７－６（判定結果７と総称する場合がある）と、各摂動ベクトル３に伴うコスト値６－１～６－６（コスト値６と総称する場合がある）とに基づく評価指標８－１～８－６（評価指標８と総称する場合がある）を算出する。

【0023】

情報処理装置１００は、判定結果７に基づいて、各摂動ベクトル３、換言すれば、各補完＿アクション組について評価を行なう。情報処理装置１００は、例示的に、決定された各摂動ベクトル３に伴うコスト値６と判定結果７とを含む評価指標８を用いて、各摂動ベクトル３、換言すれば、各補完＿アクション組について評価を行なう。

【0024】

情報処理装置１００は、評価結果に基づいて、複数の補完＿アクション組のなかから、所定の組数の補完＿アクション組を選択して、１つ以上の推薦アクションを出力する。

【0025】

図４は、実施形態の一例としての情報処理装置１００のハードウェア構成を例示する図である。

【0026】

情報処理装置１００は、例えば、図４に示すように、プロセッサ１２１，メモリ１２２，記憶装置１２３，グラフィック処理装置１２４，入力インタフェース１２５，光学ドライブ装置１２６，機器接続インタフェース１２７およびネットワークインタフェース１２８を構成要素として有する。これらの構成要素１２１～１２８は、バス１２９を介して相互に通信可能に構成される。

【0027】

プロセッサ（制御部）１２１は、情報処理装置１００全体を制御する。プロセッサ１２１は、マルチプロセッサであってもよい。プロセッサ１２１は、例えばＣＰＵ，ＭＰＵ（Micro Processing Unit），ＤＳＰ（Digital Signal Processor），ＡＳＩＣ（Application Specific Integrated Circuit），ＰＬＤ（Programmable Logic Device），ＦＰＧＡ（Field Programmable Gate Array）のいずれか一つであってもよい。また、プロセッサ１２１は、ＣＰＵ，ＭＰＵ，ＤＳＰ，ＡＳＩＣ，ＰＬＤ，ＦＰＧＡのうちの２種類以上の要素の組み合わせであってもよい。

【0028】

そして、プロセッサ１２１が制御プログラム（評価プログラム１２３ａあるいはアクション推薦プログラム）を実行することにより、図５に例示する制御部１０１としての機能が実現される。

【0029】

なお、情報処理装置１００は、例えばコンピュータ読み取り可能な非一時的な記録媒体に記録されたプログラム［評価プログラム１２３ａやＯＳ（Operating System）プログラム］を実行することにより、評価装置またはアクション推薦装置としての機能を実現する。

【0030】

情報処理装置１００に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、情報処理装置１００に実行させるプログラムを記憶装置１２３に格納しておくことができる。プロセッサ１２１は、記憶装置１２３内のプログラムの少なくとも一部をメモリ１２２にロードし、ロードしたプログラムを実行する。

【0031】

また、情報処理装置１００（プロセッサ１２１）に実行させるプログラムを、光ディスク１２６ａ，メモリ装置１２７ａ，メモリカード１２７ｃ等の非一時的な可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ１２１からの制御により、記憶装置１２３にインストールされた後、実行可能になる。また、プロセッサ１２１が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。

【0032】

メモリ１２２は、ＲＯＭ（Read Only Memory）およびＲＡＭ（Random Access Memory）を含む記憶メモリである。メモリ１２２のＲＡＭは情報処理装置１００の主記憶装置として使用される。ＲＡＭには、プロセッサ１２１に実行させるＯＳプログラムや制御プログラムの少なくとも一部が一時的に格納される。また、メモリ１２２には、プロセッサ１２１による処理に必要な各種データが格納される。

【0033】

記憶装置１２３は、ハードディスクドライブ（Hard Disk Drive：ＨＤＤ）、ＳＳＤ（Solid State Drive）、ストレージクラスメモリ（Storage Class Memory：ＳＣＭ）等の記憶装置であって、種々のデータを格納するものである。記憶装置１２３は、本情報処理装置１００の補助記憶装置として使用される。記憶装置１２３には、ＯＳプログラム，制御プログラムおよび各種データが格納される。制御プログラムには、評価プログラム１２３ａ等が含まれてよい。

【0034】

なお、補助記憶装置としては、ＳＣＭやフラッシュメモリ等の半導体記憶装置を使用することもできる。また、複数の記憶装置１２３を用いてＲＡＩＤ（Redundant Arrays of Inexpensive Disks）を構成してもよい。

【0035】

また、記憶装置１２３には、後述する制御部１０１が各処理を実行する際に生成される各種データを格納してもよい。

【0036】

グラフィック処理装置１２４は、モニタ１２４ａ等の出力装置に対する画面表示制御を行なう。グラフィック処理装置１２４としては、種々の演算処理装置、例えば、ＧＰＵ（Graphics Processing Unit）、ＡＰＵ、ＤＳＰ、ＡＳＩＣまたはＦＰＧＡ等の集積回路（ＩＣ）が挙げられる。また、グラフィック処理装置１２４は、機械学習モデルを利用した機械学習処理および推論処理を実行するアクセラレータとしての構成を有してよい。グラフィック処理装置１２４が、プログラム（評価プログラム１２３ａやＯＳプログラム）の少なくとも一部を実行してもよい。

【0037】

グラフィック処理装置１２４には、モニタ１２４ａが接続されている。グラフィック処理装置１２４は、プロセッサ１２１からの命令に従って、画像をモニタ１２４ａの画面に表示させる。モニタ１２４ａとしては、ＣＲＴ（Cathode Ray Tube）を用いた表示装置や液晶表示装置等が挙げられる。

【0038】

入力インタフェース１２５には、キーボード１２５ａおよびマウス１２５ｂが接続されている。入力インタフェース１２５は、キーボード１２５ａやマウス１２５ｂから送られてくる信号をプロセッサ１２１に送信する。なお、マウス１２５ｂは、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル，タブレット，タッチパッド，トラックボール等が挙げられる。

【0039】

光学ドライブ装置１２６は、レーザ光等を利用して、光ディスク１２６ａに記録されたデータの読み取りを行なう。光ディスク１２６ａは、光の反射によって読み取り可能にデータを記録された可搬型の非一時的な記録媒体である。光ディスク１２６ａには、ＤＶＤ（Digital Versatile Disc），ＤＶＤ－ＲＡＭ，ＣＤ－ＲＯＭ（Compact Disc Read Only Memory），ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等が挙げられる。

【0040】

機器接続インタフェース１２７は情報処理装置１００に周辺機器を接続するための通信インタフェースである。例えば、機器接続インタフェース１２７には、メモリ装置１２７ａやメモリリーダライタ１２７ｂを接続することができる。メモリ装置１２７ａは、機器接続インタフェース１２７との通信機能を搭載した非一時的な記録媒体、例えばＵＳＢ（Universal Serial Bus）メモリである。メモリリーダライタ１２７ｂは、メモリカード１２７ｃへのデータの書き込み、またはメモリカード１２７ｃからのデータの読み出しを９＊／行なう。メモリカード１２７ｃは、カード型の非一時的な記録媒体である。

【0041】

ネットワークインタフェース１２８は、図示しないネットワークに接続される。ネットワークインタフェース１２８は、ネットワークを介して、ユーザＰＣ２００や通信機器，他の情報処理装置等が接続されてもよい。

【0042】

図５は、実施形態の一例としての情報処理装置１００の機能構成を例示する図である。情報処理装置１００においては、プロセッサ１２１が制御プログラム（評価プログラム１２３ａまたはアクション推薦プログラム）を実行することによって、評価装置あるいは摂動ベクトル出力装置（アクション推薦装置）として機能してよい。

【0043】

図５に示すように、情報処理装置１００は、制御部１０１及びメモリ部１１０を有する。制御部１０１は、例示的に、補完データ生成部１０２，摂動ベクトル決定部１０３，判定部１０４，評価部１０５，選択部１０７，及び出力部１０８を備える。

【0044】

メモリ部１１０は、記憶領域の一例であり、制御部１０１が利用する種々のデータを記憶する。メモリ部１２０は、例えば、図４に示すメモリ１２２及び記憶装置１２３のうちの一方又は双方が有する記憶領域により実現されてもよい。

【0045】

図５に示すように、メモリ部１１０は、例示的に、領域情報１１１及びコスト情報１１２を記憶可能であってよい。領域情報１１１は、属性１１の種別ごとの座標を有する座標系３０（図２）内の領域に設定されたクラス（すなわち、ラベル）を示すデータである。クラス（すなわちラベル）には、例えばポジティブのクラスとネガティブのクラスがある。領域情報１１１は、判定モデル１０において機械学習された結果に基づいて取得されてよい。一例において、領域情報１１１は、図２における第１ラベル領域３１及び第２ラベル領域３２を規定するための座標情報を含んでいてよい。

【0046】

コスト情報１１２は、摂動ベクトル決定部１０３によって摂動ベクトル３を決定する処理において算出されるコスト値６を含む。

【0047】

図６～図１３を参照しつつ、図５の各部の機能を説明する。

【0048】

制御部１０１は、入力データ１に基づいて各種の演算処理を実行する。制御部１０１は、属性値に欠損がある不完全データが入力された場合においても、複数パターンの補完データ２－１～２－６を生成し、代表的な補完データを抽出することにより不完全データに対応可能なアクション推薦を行なう。一例において、制御部１０１は、補完データ２－１～２－６と各補完データ２－１～２－６における摂動ベクトル３との組を複数生成し、生成した複数の組から代表的な組を抽出する。代表的な組（あるいは補完データまたは摂動ベクトル３）を抽出することを「要約」と称する場合がある。制御部１０１は、正確な属性値が欠損していて不明な場合においても、所望の予測結果に変更する摂動ベクトル３を評価し、提供する。

【0049】

補完データ生成部１０２は、入力データ１に含まれる複数の属性１１における属性値１２の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データ２を生成する。

【0050】

図６は、実施形態の一例としての情報処理装置１００における補完データの作成処理の一例を示す図である。補完データ生成部１０２は、欠損を補完する値を属性空間（例えば座標系３０）上でサンプリングしてよい。欠損属性値において取り得る範囲についての情報がメモリ部１１０に格納されてよい。補完データ生成部１０２は、範囲内において、複数の補完値をサンプリングする。図６においては、月収の属性値１２－２についての補完値として、０円、５万円、３４万円、５８万円、８２万円、１０７万円という値がサンプリングされる。補完データ生成部１０２は、取り得る範囲において網羅的に複数の補完値をサンプリングしてよい。サンプリングには一様サンプリングのほか，既存の補完手法（例: 非欠損属性の値から欠損値を推定する確率モデル）も利用可能である。サンプリングされる間隔は、等間隔であってもよく、等間隔でなくてもよい。

【0051】

補完データ生成部１０２は、入力データ１における欠損した属性値を複数の補完値に置換することによって、複数パターンの補完データ２－１～２－６を生成する。１つの欠損において、作成される補完データの数２－１～２－６は、図６の場合に限定されない。

【0052】

摂動ベクトル決定部１０３は、複数パターンのそれぞれの補完データ２において、予測されるラベルを変更するための変更対象の属性４と変更量５とを含む各摂動ベクトル３を決定する。

【0053】

図７は、実施形態の一例としての情報処理装置におけるアクション最適化処理の一例を示す図である。アクション最適化処理において、摂動ベクトル決定部１０３は、各摂動ベクトル３－１～３－６を決定してよい。摂動ベクトル決定部１０３による処理は、入力データ１に代えて複数の補完データ２－１～２－６のそれぞれから摂動ベクトル３－１～３－６を決定することを除いて、図２で説明した処理と同様である。従って、繰り返しの説明を省略する。摂動ベクトル決定部１０３は、補完データ２－１～２－６の数に対応した組数の補完＿アクション組９－１～９－６の集合を生成する。

【0054】

図８は、補完＿アクション組９とコスト値６について例示する図である。摂動ベクトル決定部１０３が各摂動ベクトル３－１～３－６を決定するとき、それぞれの摂動ベクトル３－１～３－６に対応するコスト値６が算出される。

【0055】

選択部１０７は、複数のパターンのそれぞれの補完データ２－１～２－６と対応する摂動ベクトル３－１～３－６とを含む補完＿アクション組９－１～９－６において、未選択の組の中から評価指標８に基づいて組を選択する。なお、評価指標８の値が複数の補完＿アクション組９間において同値となった場合には、選択部１０７は、予め定められた基準に従って組を選択してもよい。例えば、選択部１０７は、補完値が属性値の平均値に近い組を選択してよい。これと異なり、評価指標８の値が同値で最小値になった場合は、選択部１０７は、当該評価指標８を示すすべての組を選択するようにしてもよい。

【0056】

図９は、補完＿アクション組９の選択処理について例示する図である。選択部１０７は、生成した補完＿アクション組９－１～９－６の集合から、限定された数の代表的な組を選択（抽出）する。図９では、各補完＿アクション組９－１～９－６は、それぞれ補完データ＃１～＃６（補完データ２－１～２－６）と摂動ベクトル＃１～＃６とを含む。摂動ベクトル＃１～＃６が、推奨されるアクション＃１～＃６に対応する。図９の例においては、選択部１０７は、補完＿アクション組９－１，９－３，及び９－５を選択する。選択する組数は、３組に限られず、ユーザの指示によって決定されてよい。

【0057】

図１０は、補完＿アクション組９の選択処理の詳細について例示する図である。摂動ベクトル決定部１０３によって、所定の組数の補完＿アクション組９－１～９－６が生成される。生成された補完＿アクション組９－１～９－６が選択部１０７に入力される。

【0058】

選択部１０７は、補完＿アクション組９をＰ組（但しＰは自然数）選択する場合には、各段階において１組を選択する段階をＰ回繰り返すことによってＰ組の補完＿アクション組９を選択する。図１０においては、選択部１０７は、各段階において１組を選択する段階を３回繰り返すことによって合計３組（Ｐ＝３）の補完＿アクション組９を選択する。

【0059】

図１０に示すように、第１段階では、選択部１０７は、補完＿アクション組＃１～＃６（補完＿アクション組９－１～９－６）全体から、評価指標８を最小化できる組（図１０では、補完＿アクション組＃１）を選択する。但し、評価指標８の内容によっては、評価指標８を最大化できる組を選択する場合もある。

【0060】

第２段階では、選択部１０７は、既に選択された補完＿アクション組＃１を除いた残りの補完＿アクション組＃２～＃６のなかから評価指標８を最小化できる組（図１０では、組＃５）を選択する。

【0061】

第３段階では、選択部１－７は、既に選択された補完＿アクション組＃１及び＃５を除いた残りの補完＿アクション組＃２～＃４，＃６のなかから評価指標８を最小化できる組（図１０では、組＃３）を選択する。

【0062】

出力部１０８は、選択された補完＿アクション組９に基づいて推奨するアクションについての情報を外部に出力する。出力部１０８は、情報をモニタ１２４ａに出力してもよく、ユーザＰＣ２００等の他のコンピュータに出力してもよい。

【0063】

判定部１０４は、複数のパターンのうちの１つのパターンの補完データ（例えば、補完データ２－１）において決定された摂動ベクトル（例えば、摂動ベクトル３－１）が他のパターンの補完データ２－２～２－６に対してラベルを変更可能か判定し判定結果７を得る。判定部１０４は、ラベルを変更可能な他のパターンの補完データの個数を判定してよい。

【0064】

図１１は、補完＿アクション組９から第１の組を選択する段階の一例を示す図である。判定部１０４が、複数のパターンうちの一つパターンの補完データ（例えば、補完データ２－１）において決定された摂動ベクトル（例えば３－１）について判定する場合を説明する。摂動ベクトル３－１は、未返済ローン数を２件減及び返済遅延数を１件減という変更対象の属性４－１及び変更量５－１を含む。従って、摂動ベクトル３－１によって、他の摂動ベクトル３－２～３－６の各内容を満たすので、摂動ベクトル３－１は、他のパターンの補完データ２－２～２－６のそれぞれに対してラベルを変更することができると判定される。

【0065】

図１１に示される例では、補完データ２－１について決定された摂動ベクトル３－１は、他の全ての補完データ２－２～２－６に対してもラベルをローン否認から承認へと変更することができる。従って、判定部１０４は、判定結果７として、１つのパターンの摂動ベクトルに従属してラベルが変更されない他のパターンの補完データ２－２～２－６の数（非従属数）は０個という結果を得る。換言すれば、判定部１０４は、判定結果７として、従属して補完データ２－１～２－６においてラベルが変更可能となる総数（従属数）が６個という結果を得る。判定部１０４は、各摂動ベクトル３－１～３－６について同様の処理を行なう。

【0066】

評価部１０５は、判定部１０４による判定結果に基づいて、各摂動ベクトル３－１～３－６の評価を行なう。「評価」は、摂動ベクトル３－１～３－６によって、予測ラベルを変更するための有効性、有用性の評価であってよく、摂動ベクトル３－１～３－６を選択するための選択順位に関する評価指標８を算出することを意味してよい。摂動ベクトル３－１～３－６は、推奨アクションに対応する。従って、「評価」は、推奨アクションによって、予測ラベルを変更するための有効性、有用性の評価であってよく、推奨アクションを選択するための選択順位に関する評価指標８を算出することを意味してよい。

【0067】

本実施形態においては、評価指標８は、決定された摂動ベクトル３に伴うコスト関数のコスト値６と判定結果７とを含む。評価指標８は、ラベルを変更可能と判定される他のパターンの数が多くなるほど、及びコスト値６が小さくなるほど減少する。

【0068】

選択部１０７は、複数のパターンのそれぞれの補完データ２－１～２－６と対応する摂動ベクトル３－１～３－６とを含む補完＿アクション組９－１～９－６において、未選択の組の中から評価指標８に基づいて組を選択する。選択部１０７は、ラベルを変更可能と判定される他のパターンの数が多くなるほど、及びコスト値６が小さくなるほど減少する評価指標８を用いてよい。この場合、選択部１０７は、１つの段階において、未選択の組の中で評価指標８が最小となる補完＿アクション組９を選択してよい。

【0069】

但し、本実施形態と異なり、評価部１０５は、評価指標として、ラベルを変更可能と判定される他のパターンの数が多くなるほど、及びコスト値６が小さくなるほど増加する評価指標を算出してもよい。この場合、選択部１０７は、１つの選択段階において、未選択の組の中で評価指標が最大となる補完＿アクション組９を選択してよい。

【0070】

一例において、評価指標は、〔総コスト〕＋〔ラベルを変えるための有効なアクションがない補完の総数〕で表される。

【0071】

選択部１０７によってｍ個（ｍは１以上の自然数）の摂動ベクトル３_ｓ１，３_Ｓ２，・・・３_Ｓｍが選択される場合を考える。摂動ベクトル３_ｓ１，３_Ｓ２，・・・３_Ｓｍに伴うそれぞれのコスト値をＣ_１，Ｃ_２，・・・Ｃ_ｍとし、摂動ベクトル３_ｓ１，３_Ｓ２，・・・３_Ｓｍが担当する摂動ベクトル３の数（すなわち、担当数）をＴ_１，Ｔ_２，・・・Ｔ_ｍとすると、総コストは、以下の通りとなる。

【0072】

総コスト＝Ｃ_１・Ｔ_１＋Ｃ_２・Ｔ_２＋Ｃ_３・Ｔ_３・・・＋Ｃ_ｍ・Ｔ_ｍ

【0073】

なお、担当する摂動ベクトルには、ラベルを変更可能と判定される他のパターンの補完データにおける摂動ベクトル３を含む。但し、選択された摂動ベクトル３_ｓ１，３_Ｓ２，・・・３_Ｓｎのうちの複数の摂動ベクトルが、共にラベルを変更可能と判定される他のパターンについては、摂動ベクトル３_ｓ１，３_Ｓ２，・・・３_Ｓｎのうち、コスト値が低い摂動ベクトルが担当する。担当する摂動ベクトルには、選択された摂動ベクトル自体も含まれる。

【0074】

図１１において摂動ベクトル３－１が選択される場合の総コストは、コスト値Ｃ_１である摂動ベクトル３－１が全て（自身を含む６個）の摂動ベクトル３を担当するので、０．７０に６を乗じた値となる。さらに、図１１に示す場合、１つのパターンの摂動ベクトルに従属してラベルが変更されない他のパターンの補完データ２－２～２－６の数（非従属数）は０である。従って、ラベルを変えるための有効なアクションがない補完の総数は０である。従って、摂動ベクトル３－１が選択される場合の評価指標は４．２０となる。

【0075】

同様に、摂動ベクトル３－２が選択される場合の総コストは、コスト値Ｃ_１である摂動ベクトル３－２が、摂動ベクトル３－２～３－４，３－６の変更対象の属性及び変更量を満たす。一方、摂動ベクトル３－２は、摂動ベクトル３－１，３－５の変更対象の属性及び変更量を満たさない。従って、摂動ベクトル３－２が選択される場合の担当数は４となり、総コストは、０．６１に４を乗じて２．４４となる。ラベルを変えるための有効なアクションがない補完の総数は２である。従って、摂動ベクトル３－２が選択される場合の評価指標は４．４４となる。

【0076】

評価部１０５は、以下、同様に摂動ベクトル３－３、３－４、３－５、３－６がそれぞれ採用された場合の評価指標８を算出する。評価部１０５は、選択した場合に最も評価指標８を低くすることができる摂動ベクトル３－１を選択（すなわち、補完＿アクション組９－１を選択）する。

【0077】

図１２は、図１１に後続して補完＿アクション組９から第２の組を選択する段階の一例を示す図である。選択部１０７は、未選択の組の中から評価指標８に基づいて組を選択する。選択部１０７が既に選択されている摂動ベクトル３－１に加えて３－５を選択する場合、評価部１０５は、以下のように評価指標を算出する。

【0078】

判定部１０４は、判定結果として、補完データ２－５における摂動ベクトル３－５に従属して他の補完データ２－６においてラベルが変更可能となると判定する。摂動ベクトル３－５自体と摂動ベクトル３－６とは、既に選択されている摂動ベクトル３－１によっても、従属してラベル変更可能である。しかし、摂動ベクトル３－５の方が、摂動ベクトル３－１よりもコスト値６が低いので、摂動ベクトル３－５自体と摂動ベクトル３－６とは、摂動ベクトル３－５が担当する。

【0079】

摂動ベクトル３－５の担当数は２となり、摂動ベクトル３－１の担当数は４に削減される。評価部１０５は、摂動ベクトル３－１に加えて３－５が選択される場合の総コストを０．７０×４＋０．３０×２＝３．４０と算出する。また、選択される摂動ベクトル３－１及び３－５にって、全ての摂動ベクトル３の条件を満たすことができるので、ラベルを変えるための有効なアクションがない補完の総数は０となる。従って、摂動ベクトル３－１，３－５が選択される場合の評価指標は３．４０となる。

【0080】

同様に、選択部１０７が既に選択されている摂動ベクトル３－１に加えて３－２を選択する場合、評価部１０５は、以下のように評価指標を算出する。

【0081】

判定部１０４は、判定結果として、補完データ２－２における摂動ベクトル３－２に従属して、他の補完データ２－３，２－４，２－６においてラベルが変更可能となると判定する。摂動ベクトル３－２自体と、摂動ベクトル３－３，３－４，３－６は、既に選ばれている摂動ベクトル３－１によっても、従属してラベル変更可能である。しかし、摂動ベクトル３－２の方が、摂動ベクトル３－１よりもコスト値が低いので、摂動ベクトル３－２，３－３，３－４，３－６は、摂動ベクトル３－２が担当する。

【0082】

摂動ベクトル３－２の担当数は、４となり、摂動ベクトル３－１の担当数は２となる。ラベルを変えるための有効なアクションがない補完の総数は０である。この結果、摂動ベクトル３－１，３－２が選択される場合の評価指標は０．７０×２＋０．６１×４＝３．８４となる。同様に、既に選択されている摂動ベクトル３－１に加えて摂動ベクトル３－３を選択する場合の評価指標は、３．８となる。摂動ベクトル３－１に加えて摂動ベクトル３－４を選択する場合の評価指標は３．８８である。

【0083】

なお、選択部１０７が既に選択されている摂動ベクトル３－１に加えて、摂動ベクトル３－６を選択する場合、評価部１０５は、以下のように評価指標を算出する。

【0084】

判定部１０４は、判定結果として、補完データ２－６における摂動ベクトル３－６に従属して、他の補完データ２－１～２－５のいずれもラベル変更することができない。従って、摂動ベクトル３－６は、摂動ベクトル３－６自体を担当し、他の摂動ベクトル３－１～３－５は、摂動ベクトル３－１が担当する。摂動ベクトル３－６の担当数は１であり、摂動ベクトル３－１の担当数は５である。この結果、摂動ベクトル３－１，３－６が選択される場合の評価指標は、０．７０×５＋０．２０×１＝３．７０となる。

【0085】

選択部１０７は、既に選択されている摂動ベクトル３－１に加えて、さらに選択した場合に最も評価指標８を低くすることができる摂動ベクトル３－５を選択（すなわち、補完＿アクション組９－５を選択）する。

【0086】

図１３は、図１２に後続して補完＿アクション組９から第３の組を選択する段階の一例を示す図である。図１３においても、判定部１０４が、複数パターンのうちの一つのパターンの補完データ２において決定された摂動ベクトル３が複数のパターンのうちの他のパターンの補完データ２に対してもラベルを変更可能か否かに関する判定をする。

【0087】

そして、評価部１０５は、判定結果７に基づいて摂動ベクトル３の評価を行なう。選択部１０７は、既に選択されている摂動ベクトル３－１、３－５の他に、さらに選択した場合に最も評価指標８を低くすることができる摂動ベクトル３－３を選択（すなわち、補完＿アクション組９－３を選択）する。

【0088】

図１１から図１３に示された処理によれば、情報処理装置１００は、コスト値６のみによって複数の摂動ベクトル３を評価するわけではない。情報処理装置１００は、複数パターンのうちの一つのパターンの補完データにおいて決定された摂動ベクトル３が複数のパターンのうちの他のパターンの補完データに対してもラベルを変更可能か否かについて考慮して摂動ベクトル３を評価する。これにより、欠損を含む不完全データに対しても、所望の結果を得るために推薦するアクションに対応する摂動ベクトル３（すなわち、変更対象の属性４と変更量５）の評価を行なうことができる。このような評価に基づいて、推薦するアクションに対応する摂動ベクトル３を選択することができるので、入力データ１に欠損がある場合においても、ユーザに対して推薦アクションを提案することができる。

【0089】

（Ｂ）動作
上述の如く構成された実施形態の一例としての情報処理装置１００におけるアクション推薦処理を、図１４に示すフローチャート（ステップＳ１～Ｓ１３）に従って説明する。

【0090】

ステップＳ１において、情報処理装置１００の制御部１０１は入力データ１をユーザＰＣ２００等からネットワーク回線を通じて受け取る（ステップＳ１）。

【0091】

ステップＳ２において、制御部１０１は、入力データ１の属性値１２の一部に欠損があるか否かを判断する。

【0092】

判断の結果、入力データ１に欠損がない場合には（ステップＳ２のＮＯルート参照）、処理がステップＳ３に移行する。

【0093】

ステップＳ３において、摂動ベクトル決定部１０３は、入力データ１によって予測されるラベルを変更するための摂動ベクトル３ａを算出する（ステップＳ３）。摂動ベクトル３ａは、入力データ１の属性１１の中から選ばれた少なくとも１つの変更対象の属性４ａと当該属性４ａにおける変更量５ａを含む。

【0094】

ステップＳ４において、出力部１０８は、算出された摂動ベクトル３ａに対応する奨励アクションの情報を出力する。

【0095】

一方、判断の結果、入力データ１に欠損がある場合には（ステップＳ２のＹＥＳルート参照）、処理がステップＳ５に移行する。

【0096】

ステップＳ５において、補完データ生成部１０２は、欠損を複数通りに補完した複数パターンの補完データ２を生成する。

【0097】

ステップＳ６において、摂動ベクトル決定部１０３は、複数パターンのそれぞれの補完データ２において、予測されるラベルを変更するための変更対象の属性４と変更量５とを含む各摂動ベクトル３を決定する。換言すれば、摂動ベクトル決定部１０３は、補完データ２と摂動ベクトル３とを含む組である補完＿アクション組９の集合を生成する。

【0098】

ステップＳ７において、選択部１０７は、未選択の補完データ２と摂動ベクトル３を含む補完＿アクション組９の中から１つの組を選択候補として取得する。

【0099】

ステップＳ８において、判定部１０４は、選択候補として取得された組の補完データ（例えば、補完データ２－１）の摂動ベクトル（例えば、摂動ベクトル３－１）が他のパターンの補完データ２－２～２－６に対してラベルを変更できる個数を判定する。

【0100】

ステップＳ９において、評価部１０５は、摂動ベクトル３－１～３－６の評価を行なう処理において、評価指標８を算出する。評価指標８は、取得された組の摂動ベクトル３に伴うコスト関数のコスト値６と変更できる個数の判定結果７とを含む。一例において、評価指標８は、ラベルを変更可能と判定される他のパターンの個数が多くなるほど、及びコスト値６が小さくなるほど減少する指標である。

【0101】

ステップＳ１０において、選択部１０７は、選択候補として未取得の組があるか確認する。

【0102】

選択候補として未取得の組がある場合には（ステップＳ１０のＹＥＳルート参照）、処理がステップＳ７に移行する。

【0103】

一方、選択候補として未取得の組がない場合には（ステップＳ１０のＮＯルート参照）、処理がステップＳ１１に移行する。選択候補として未取得の組がないことは、換言すれば、未選択の組を、全て選択候補として取得したことを意味する。

【0104】

ステップＳ１１において、選択部１０７は、選択候補の中で評価指標８を最も改善できる補完データ２と摂動ベクトル３（推定アクション）の組である補完＿アクション組９を一つ選択する。

【0105】

ステップＳ１２において、選択部１０７は、既に所定数の補完＿アクション組９を選択したか否かを判断する。

【0106】

選択部１０７が、まだ所定数の補完＿アクション組９を選択し終えていない場合（ステップＳ１２のＮＯルート参照）、処理がステップＳ７に移行する。

【0107】

一方、選択部１０７が、所定数の補完＿アクション組９を選択済みの場合（ステップＳ１２のＹＥＳルート参照）、処理がステップＳ１３に移行する。

【0108】

ステップＳ１３において、出力部１０８は、選択された所定数の補完＿アクション組９、すなわち、補完データ２と摂動ベクトル３の組を出力する。出力部１０８は、補完方法（補完値等）とともに、選択された摂動ベクトル３に対応する推薦アクションの情報を出力する。

【0109】

図１５は、入力データに欠損がある場合における、与信審査でローン否認から承認に予測を変えるアクション推薦を実行する実施例を示す図である。図１５においては、月収の値が欠損している場合における与信審査のアクション推薦に実施形態の技術を適用した。

【0110】

本来の月収は３０００ドルであったが、ユーザが月収についてプライバシー等の観点から入力しなかったため欠損が生じた。情報処理装置１００は、符号（ａ）、（ｂ）、（ｃ）に示す計３組の補完＿アクション組９－１ｂ，９－２ｂ，９－３ｂを選択し、出力した。これら３組は、図１１～図１３に示したように、摂動ベクトル３に伴うコスト値６のみに基づいて選択されたのではなく、他のパターンの補完データにおけるラベル変更可能性を考慮して選択された。

【0111】

符号（ａ）は、情報処理装置１００が、月収の額が欠損した入力データ１において、月収の額を０ドル（範囲０ドル以上０ドル以下）の補完値で補完した補完データ２－１ｂの場合を示す。この場合、選択部１０７は、「３０－５９日の返済遅延数を１個減、及び未返済のローン数を１個減」の摂動ベクトル３－１ｂを選択した。換言すれば、選択部１０７は、補完データ２－１ｂと摂動ベクトル３－１ｂを含む補完＿アクション組９－１ｂを選択した。

【0112】

符号（ｂ）は、情報処理装置１００が、月収の額が欠損した入力データ１において、月収の額を８２２７ドル（範囲８２２７ドル以上１０７５０ドル以下）の補完値で補完した補完データ２－２ｂの場合を示す。この場合、選択部１０７は、「未返済のローン数を４個減」の摂動ベクトル３－２ｂを選択した。換言すれば、選択部１０７は、補完データ２－２ｂと摂動ベクトル３－２ｂを含む補完＿アクション組９－２ｂを選択した。

【0113】

符号（ｃ）は、情報処理装置１００が、月収の額が欠損した入力データ１において、月収の額を３４７１ドル（範囲５５３ドル以上５８３１ドル以下）の補完値で補完した補完データ２－３ｂの場合を示す。この場合、選択部１０７は、「３０－５９日の返済遅延数を１個減」の摂動ベクトル３－３ｂを選択した。換言すれば、選択部１０７は、補完データ２－３ｂと摂動ベクトル３－３ｂを含む補完＿アクション組９－３ｂを選択した。

【0114】

情報処理装置１００は、選択された補完＿アクション組９－１ｂ，９－２ｂ，９－３ｂに基づいて、３種類のアクション推薦をユーザＰＣ２００の画面上に提示した。（ａ）第１組（補完方法０ドル）及び（ｃ）第３組（補完方法３４７１ドル（５５３ドル以上５８３１ドル以下））においては、補完値の範囲を真の属性値３０００ドルが満たしている。従って、（ａ）または（ｃ）で奨励されたアクションをユーザが実行することで、ローン否認のラベルからローン承認のラベルへと変更することができる。

【0115】

一方、（ｂ）第２組（補完方法８２２７ドル（８２２７ドル以上１０７５０ドル以下））においては、補完値の範囲を真の属性値３０００ドルが満たしていない。従って、（ｂ）で奨励されたアクションをユーザ実行しても、ローン否認のラベルからローン初認のラベルへと変更することはできない。但し、図１５のように、アクション（換言すれば、摂動ベクトル３）のみならず、補完方法（補完値または補完値の範囲）についても提示することで、適切なアクションをユーザ自身が選択することができた。

【0116】

図１５に示される実施例においても、欠損を含む入力データに対して、ラベルを変更可能なアクション推薦を行なうことが可能であった。情報処理装置１００は、与信審査でローン否認から承認に予測を変えるアクション推薦への応用において、３個から４組程度の適切な補完＿アクション組９を１分以内に推薦可能であった。ベンチマーク実験においては、欠損を含む入力データ１に対して、与信審査でローン否認から承認に予測を変えるアクション推薦をユーザに提供できる率を３７％から９６％に改善することができた。

【0117】

図１から図１５においては、主として、実施形態の情報処理装置１００をローン否認から承認に予測を変えるアクション推定の場合を例にとって説明した。但し、本発明の実施形態の情報処理装置１００は、この場合に限られない。

【0118】

図１６は、健康状態の改善のアクション推薦における実施形態の一例を示す図である。図１６においては、入力データ１ａは、年齢、血糖値、体脂肪率などの項目を含む属性を有する。図１６では、属性値である「血糖値」が欠損している。この場合にも、情報処理装置１００は、欠損値に対して複数の補完値を代入して複数パターンの補完データを生成してよい。情報処理装置１００は、複数パターンの補完データのそれぞれについて摂動ベクトルを決定することで、複数組の補完＿アクション組９－１ａ～９－Ｎａ（＃１～＃Ｎ）を生成する。情報処理装置１００は、複数パターンのうちの１つのパターンの補完データにおいて決定された摂動ベクトル３が複数のパターンのうちの他のパターンの補完データに対してもラベルを変更可能か否かの判定結果７を考慮して、補完＿アクション組＃ｊ～＃ｋを選択する。情報処理装置１００は、選択された補完＿アクション組＃ｊ～＃ｋを出力してよい。情報処理装置１００は、補完＿アクション組＃ｊ～＃ｋに対応する推薦アクション１４－ｊ～１４－ｋをユーザ端末２００等に提示してよい。

【0119】

なお、情報処理装置１００が選択部１０７及び出力部１０８を含む場合を説明したが、情報処理装置１００が、選択部１０７及び出力部１０８を含まなくてもよい。この場合も、欠損を含むデータに対して、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことができる評価技術として利用できる。評価された変更属性と変更量は、他の装置が種々の解析等に利用することもできる。

【0120】

（Ｃ）効果
実施形態の一例としての情報処理装置１００によれば、補完データ生成部１０２が、入力データ１に含まれる複数の属性１１の属性値１２の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データ２を生成する。この結果、摂動ベクトル決定部１０３が、複数パターンのそれぞれの補完データ２によって予測されるラベルを変更するために補完データの複数の属性の中から変更対象の属性４と変更量５とを含む摂動ベクトル３（摂動情報）を決定する。そして、評価部１０５は、複数パターンのうちの一つのパターンの補完データにおいて決定された摂動ベクトル３が複数のパターンのうちの他のパターンの補完データ２に対してもラベルを変更可能か否かに関する判定結果７に基づいて、摂動ベクトル３の評価を行なう。

【0121】

これにより、欠損を含むデータに対しても、所望の結果を得るために推薦するアクションに対応する変更属性と変更量の評価を行なうことが可能となる。さらに、単なる平均値等によって欠損値を置換することで１つの補完データを生成する場合に比べて、評価制度を高めることができる。

【0122】

他パターンに対してラベルを変更可能か否かの判定結果７を考慮して摂動ベクトル３について評価することができるので、欠損値の予測が困難である場合において、実際の欠損値が取り得る範囲に対する許容性を高めることがきる。これにより、予測されるラベルを変更可能な変更属性と変更量を選択する可能性が高まる。

【0123】

ユーザが開示したくない属性値を開示しない場合おいても、情報処理装置１００は、ラベルを変更可能な摂動ベクトル３の評価を行なうことができる。

【0124】

評価部１０５は、評価指標８を用いて、摂動ベクトル３の評価をする。評価指標８は、摂動ベクトル３に伴うコスト関数のコスト値６と判定結果７とを含む。評価指標８は、ラベルを変更可能と判定される他のパターンの数が多くなるほど、及びコスト値６が小さくなるほど、増加及び減少のどちらか一方に変化する。

【0125】

これにより、実際の欠損値が取り得る範囲に対する許容性を高める観点と、コスト値６を低くする観点とのバランスを考慮して、用途に応じ摂動ベクトル３についての評価を実現することができる。

【0126】

選択部１０７は、複数のパターンのそれぞれの補完データ２と対応する摂動ベクトル３との補完＿アクション組９において、未選択の組の中から評価指標８に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返す。従って、複数の補完＿アクション組９を選択することができる。評価に基づいて選択されるアクションの種類を増やすことがきる。従って、提示を受けたユーザへ提示するアクションの選択肢が増える。また、各選択肢のアクションのみならず、補完値または補完値の範囲等の補完方法を提供することが可能となる。

【0127】

出力部１０８は、選択された組に基づいて推奨するアクションについての情報を外部に出力する。従って、入力データ１に欠損がある不完全データに対しても、推奨するアクションを提示することができる。ユーザは、プライバシー等の観点から開示したくない属性値を開示することなく、ラベルを変更するために推薦されるアクションを得ることができるようになる。

【0128】

想定されるビジネスシーンにおける効能としては、健康、経営、取引、ローン承認等のユーザの意思決定タスクに関係する判定モデルが使用されるすべての分野に本実施形態の手法を適用することができる。ユーザの意思決定タスクに関係するすべての分野において、ユーザのプライバシー等を尊重しつつ、ユーザが所望する決定に導くための行動指針を提供することができる。これにより、ユーザの意思決定を助けることができる。

【0129】

（Ｄ）その他
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。

【0130】

（Ｅ）付記
以上の実施形態に関し、さらに以下の付記を開示する。
（付記１）
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理をコンピュータに実行させることを特徴とする評価プログラム。

【0131】

（付記２）
前記摂動情報の評価を行なう処理において
決定された前記摂動情報に伴うコスト関数のコスト値と前記判定結果とを含み、前記ラベルを変更可能と判定される他のパターンの数が多くなるほど、及び前記コスト値が小さくなるほど、増加及び減少のどちらか一方に変化する評価指標を用いて、前記摂動情報の評価を行なう、
処理を前記コンピュータに実行させることを特徴とする、付記１に記載の評価プログラム。

【0132】

（付記３）
前記複数のパターンのそれぞれの補完データと対応する前記摂動情報との組において、未選択の組の中から前記評価指標に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返す、
処理を前記コンピュータに実行させることを特徴とする、付記２に記載の評価プログラム。

【0133】

（付記４）
選択された前記組に基づいて推奨するアクションについての情報を外部に出力する、
処理を前記コンピュータに実行させることを特徴とする、付記３に記載の評価プログラム。

【0134】

（付記５）
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理をコンピュータが実行することを特徴とする評価方法。

【0135】

（付記６）
前記摂動情報の評価を行なう処理において
決定された前記摂動情報に伴うコスト関数のコスト値と前記判定結果とを含み、前記ラベルを変更可能と判定される他のパターンの数が多くなるほど、及び前記コスト値が小さくなるほど、増加及び減少のどちらか一方に変化する評価指標を用いて、前記摂動情報の評価を行なう、
処理を前記コンピュータが実行することを特徴とする、付記５に記載の評価方法。

【0136】

（付記７）
前記複数のパターンのそれぞれの補完データと対応する前記摂動情報との組において、未選択の組の中から前記評価指標に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返す、
処理を前記コンピュータが実行することを特徴とする、付記６に記載の評価方法。

【0137】

（付記８）
選択された前記組に基づいて推奨するアクションについての情報を外部に出力する、
処理を前記コンピュータが実行することを特徴とする、付記７に記載の評価方法。

【0138】

（付記９）
入力データに含まれる複数の属性の値の一部に欠損がある場合に、当該欠損を複数通りに補完した複数パターンの補完データを生成し、
前記複数パターンのそれぞれの補完データによって予測されるラベルを変更するために前記補完データの複数の属性の中から変更対象の属性と変更量とを含む摂動情報を決定し、
前記複数パターンのうちの一つのパターンの補完データにおいて決定された前記摂動情報が前記複数のパターンのうちの他のパターンの補完データに対しても前記ラベルを変更可能か否かに関する判定結果に基づいて、前記摂動情報の評価を行なう
処理を実行する制御部を有することを特徴とする情報処理装置。

【0139】

（付記１０）
前記制御部は、
前記摂動情報の評価を行なう処理において、決定された前記摂動情報に伴うコスト関数のコスト値と前記判定結果とを含み、前記ラベルを変更可能と判定される他のパターンの数が多くなるほど、及び前記コスト値が小さくなるほど、増加及び減少のどちらか一方に変化する評価指標を用いて、前記摂動情報の評価を行なうことを特徴とする、付記９に記載の情報処理装置。

【0140】

（付記１１）
前記制御部は、前記複数のパターンのそれぞれの補完データと対応する前記摂動情報との組において、未選択の組の中から前記評価指標に基づいて組を選択することを、予め定められた組の数が選択されるまで繰り返すことを特徴とする、付記１０に記載の情報処理装置。

【0141】

（付記１２）
前記制御部は、選択された前記組に基づいて推奨するアクションについての情報を外部に出力することを特徴とする、付記１１に記載の情報処理装置。

【符号の説明】

【0142】

１入力データ
２，２－１～２－６，２－１ｂ～２－３ｂ補完データ
３ａ，３，３－１～３－６，３－１ｂ～３－３ｂ摂動ベクトル
４ａ，４，４－１～４－６変更対象の属性
５ａ，５，５－１～５－６変更量
６，６－１～６－６コスト値
７，７－１～７－６判定結果、
８，８－１～８－６評価指標
９，９－１～９－６，９－１ａ～９－Ｎａ，９－１ｂ～９－３ｂ補完＿アクション組
１０判定モデル
１４－ｊ～１４－ｋ推薦アクション
３０座標系
３１第１ラベル領域
３２第２ラベル領域
１１，１１－１～１１－４属性
１２，１２－１～１２－４属性値
１００情報処理装置
１０１制御部
１０２補完データ生成部
１０３摂動ベクトル決定部
１０４判定部
１０５評価部
１０７選択部
１０８出力部
１１０メモリ部
１１１領域情報
１１２コスト情報
１２１プロセッサ
１２２メモリ
１２３記憶装置
１２３ａ評価プログラム
１２４グラフィック処理装置
１２４ａモニタ
１２５入力インタフェース
１２５ａキーボード
１２５ｂマウス
１２６光学ドライブ装置
１２６ａ光ディスク
１２７機器接続インタフェース
１２７ａメモリ装置
１２７ｂメモリリーダライタ
１２７ｃメモリカード
１２８ネットワークインタフェース
１２９バス
２００ユーザＰＣ

【図1】