特許7197391 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社オービックの特許一覧

特許7197391データ分析装置、データ分析方法およびデータ分析プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-12-19

(45)【発行日】2022-12-27

(54)【発明の名称】データ分析装置、データ分析方法およびデータ分析プログラム

(51)【国際特許分類】

G06Q 10/06 20120101AFI20221220BHJP

【ＦＩ】

G06Q10/06 300

【請求項の数】 8

(21)【出願番号】P 2019017207

(22)【出願日】2019-02-01

(65)【公開番号】P2020126331

(43)【公開日】2020-08-20

【審査請求日】2021-11-15

(73)【特許権者】

【識別番号】398040527

【氏名又は名称】株式会社オービック

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】前沢諒也

(72)【発明者】

【氏名】廣川慶樹

(72)【発明者】

【氏名】金子洋央

(72)【発明者】

【氏名】上野剛光

【審査官】速水雄太

(56)【参考文献】

【文献】国際公開第２０１７／０４６９０６（ＷＯ，Ａ１）

【文献】特開２０１５－０７６０７６（ＪＰ，Ａ）

【文献】Kim, S. J., Lee, K. B. ，Constructing decision trees with multiple response variables，7th Asia-Pacific Decision Science Institute Conference [online]，2002年07月24日，[retrieved on 2022.09.09]，Retrieved from the Internet: <URL: http://gebrc.nccu.edu.tw/proceedings/APDSI/2002/title.htm>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

制御部を備えるデータ分析装置であって、
前記制御部は、
説明変数と複数の目的変数とを有するレコードを複数含む分析対象データ中の前記レコードを、特定の前記説明変数を基準として、当該基準とした説明変数の値ごとにレコード群に分割するレコード分割手段と、
前記レコード分割手段で分割して求めた前記レコード群ごとに、同一の前記目的変数内における最頻値および当該最頻値が占める割合を、前記複数の目的変数すべてについて算出する割合算出手段と、
前記レコード分割手段で前記分割の基準とした前記説明変数の値ごとに、前記複数の目的変数すべてについて前記割合算出手段で算出した前記最頻値および前記割合を含む分析結果を作成する分析結果作成手段と、
を備えること、
を特徴とするデータ分析装置。

【請求項2】

前記レコード分割手段は、
前記分割の基準とした前記説明変数以外の前記説明変数を新たな基準として前記分割を繰り返し、前記分割して求めた前記レコード群中の前記レコードの数、前記分割を実行した回数および前記分割前と前記分割後の間での前記目的変数についての不純度の改善量である不純度改善量のうちの少なくとも１つに応じて、前記分割を停止すること、
を特徴とする請求項１に記載のデータ分析装置。

【請求項3】

前記制御部は、
前記分割前の不純度から前記分割後の不純度を差し引いた値を、前記不純度改善量として前記目的変数ごとに算出する改善量算出手段と、
前記分析結果のうち、前記改善量算出手段で算出した前記不純度改善量が所定の値以上となった前記目的変数についての前記分割後の前記最頻値および前記割合のみを出力する分析結果出力手段と、
を更に備えること、
を特徴とする請求項２に記載のデータ分析装置。

【請求項4】

前記制御部は、
１から、同一の前記目的変数内での各値の割合の２乗の和を差し引いた値を、前記不純度として算出する不純度算出手段
を更に備えること、
を特徴とする請求項２または３に記載のデータ分析装置。

【請求項5】

前記分析結果作成手段は、
前記分析結果として、前記レコード分割手段で前記分割の基準とした前記説明変数および当該説明変数の値に基づいて階層的に分岐させた枝ごとに、前記複数の目的変数すべてについて前記割合算出手段で算出した前記最頻値および前記割合を含む決定木を作成すること、
を特徴とする請求項１から４のいずれか一つに記載のデータ分析装置。

【請求項6】

前記説明変数が、社員の身分を特定するための項目であり、
前記目的変数が、前記社員に対する給与についての計算の仕方または支給の仕方を決定するための項目であること、
を特徴とする請求項１から５のいずれか一つに記載のデータ分析装置。

【請求項7】

制御部を備える情報処理装置で実行されるデータ分析方法であって、
前記制御部で実行される、
説明変数と複数の目的変数とを有するレコードを複数含む分析対象データ中の前記レコードを、特定の前記説明変数を基準として、当該基準とした説明変数の値ごとにレコード群に分割するレコード分割ステップと、
前記レコード分割ステップで分割して求めた前記レコード群ごとに、同一の前記目的変数内における最頻値および当該最頻値が占める割合を、前記複数の目的変数すべてについて算出する割合算出ステップと、
前記レコード分割ステップで前記分割の基準とした前記説明変数の値ごとに、前記複数の目的変数すべてについて前記割合算出ステップで算出した前記最頻値および前記割合を含む分析結果を作成する分析結果作成ステップと、
を含むこと、
を特徴とするデータ分析方法。

【請求項8】

制御部を備える情報処理装置に実行させるためのデータ分析プログラムであって、
前記制御部に実行させるための、
説明変数と複数の目的変数とを有するレコードを複数含む分析対象データ中の前記レコードを、特定の前記説明変数を基準として、当該基準とした説明変数の値ごとにレコード群に分割するレコード分割ステップと、
前記レコード分割ステップで分割して求めた前記レコード群ごとに、同一の前記目的変数内における最頻値および当該最頻値が占める割合を、前記複数の目的変数すべてについて算出する割合算出ステップと、
前記レコード分割ステップで前記分割の基準とした前記説明変数の値ごとに、前記複数の目的変数すべてについて前記割合算出ステップで算出した前記最頻値および前記割合を含む分析結果を作成する分析結果作成ステップと、
を含むこと、
を特徴とするデータ分析プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データ分析装置、データ分析方法およびデータ分析プログラムに関する。

【背景技術】

【0002】

特許文献１には、商品の特徴と過去の販売実績との関係の分析に基づいて広告物の作成を支援する広告物作成支援装置が開示されており（０００６段落参照）、決定木分析における説明変数として、予め定めた商品の属性を設定しており、目的変数として、商品の過去の販売実績を設定している（０００７段落参照）。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１０－２３７９２３号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

このように、説明変数の値によって目的変数の値が決定される何かしらのルールを推測する際に、従来においては、複数の目的変数を同時に扱うことはできなかった。例えば、上記特許文献１においては、目的変数として、「商品の過去の販売実績」のみを設定している。

【0005】

このため、従来においては、複数の目的変数の値を推測するためには、説明変数と目的変数の組み合わせが膨大になり、分析結果を理解するのが難しいという問題があった。言い換えると、従来においては、分析対象となるデータが含む目的変数の数だけ分析結果も作成しなければならず、分析結果が膨大な量となり理解するのが難しいという問題があった。

【0006】

本発明は、上記問題点に鑑みてなされたものであって、分析対象となるデータが複数の目的変数を含む場合においても１つの分析結果としてまとめて出力可能な態様でデータ分析できるデータ分析装置、データ分析方法およびデータ分析プログラムを提供することを目的とする。

【課題を解決するための手段】

【0007】

上述した課題を解決し、目的を達成するために、本発明に係るデータ分析装置は、制御部を備えるデータ分析装置であって、前記制御部が、説明変数と複数の目的変数とを有するレコードを複数含む分析対象データ中の前記レコードを、特定の前記説明変数を基準として、当該基準とした説明変数の値ごとにレコード群に分割するレコード分割手段と、前記レコード分割手段で分割して求めた前記レコード群ごとに、同一の前記目的変数内における最頻値および当該最頻値が占める割合を、前記複数の目的変数すべてについて算出する割合算出手段と、前記レコード分割手段で前記分割の基準とした前記説明変数の値ごとに、前記複数の目的変数すべてについて前記割合算出手段で算出した前記最頻値および前記割合を含む分析結果を作成する分析結果作成手段と、を備えること、を特徴とする。

【0008】

また、本発明に係るデータ分析装置は、前記レコード分割手段が、前記分割の基準とした前記説明変数以外の前記説明変数を新たな基準として前記分割を繰り返し、前記分割して求めた前記レコード群中の前記レコードの数、前記分割を実行した回数および前記分割前と前記分割後の間での前記目的変数についての不純度の改善量である不純度改善量のうちの少なくとも１つに応じて、前記分割を停止すること、を特徴とする。

【0009】

また、本発明に係るデータ分析装置は、前記制御部が、前記分割前の不純度から前記分割後の不純度を差し引いた値を、前記不純度改善量として前記目的変数ごとに算出する改善量算出手段と、前記分析結果のうち、前記改善量算出手段で算出した前記不純度改善量が所定の値以上となった前記目的変数についての前記分割後の前記最頻値および前記割合のみを出力する分析結果出力手段と、を更に備えること、を特徴とする。

【0010】

また、本発明に係るデータ分析装置は、前記制御部が、１から、同一の前記目的変数内での各値の割合の２乗の和を差し引いた値を、前記不純度として算出する不純度算出手段を更に備えること、を特徴とする。

【0011】

また、本発明に係るデータ分析装置は、前記分析結果作成手段が、前記分析結果として、前記レコード分割手段で前記分割の基準とした前記説明変数および当該説明変数の値に基づいて階層的に分岐させた枝ごとに、前記複数の目的変数すべてについて前記割合算出手段で算出した前記最頻値および前記割合を含む決定木を作成すること、を特徴とする。

【0012】

また、本発明に係るデータ分析装置は、前記説明変数が、社員の身分を特定するための項目であり、前記目的変数が、前記社員に対する給与についての計算の仕方または支給の仕方を決定するための項目であること、を特徴とする。

【0013】

また、本発明に係るデータ分析方法は、制御部を備える情報処理装置で実行されるデータ分析方法であって、前記制御部で実行される、説明変数と複数の目的変数とを有するレコードを複数含む分析対象データ中の前記レコードを、特定の前記説明変数を基準として、当該基準とした説明変数の値ごとにレコード群に分割するレコード分割ステップと、前記レコード分割ステップで分割して求めた前記レコード群ごとに、同一の前記目的変数内における最頻値および当該最頻値が占める割合を、前記複数の目的変数すべてについて算出する割合算出ステップと、前記レコード分割ステップで前記分割の基準とした前記説明変数の値ごとに、前記複数の目的変数すべてについて前記割合算出ステップで算出した前記最頻値および前記割合を含む分析結果を作成する分析結果作成ステップと、を含むこと、を特徴とする。

【0014】

また、本発明に係るデータ分析プログラムは、制御部を備える情報処理装置に実行させるためのデータ分析プログラムであって、前記制御部に実行させるための、説明変数と複数の目的変数とを有するレコードを複数含む分析対象データ中の前記レコードを、特定の前記説明変数を基準として、当該基準とした説明変数の値ごとにレコード群に分割するレコード分割ステップと、前記レコード分割ステップで分割して求めた前記レコード群ごとに、同一の前記目的変数内における最頻値および当該最頻値が占める割合を、前記複数の目的変数すべてについて算出する割合算出ステップと、前記レコード分割ステップで前記分割の基準とした前記説明変数の値ごとに、前記複数の目的変数すべてについて前記割合算出ステップで算出した前記最頻値および前記割合を含む分析結果を作成する分析結果作成ステップと、を含むこと、を特徴とする。

【発明の効果】

【0015】

本発明によれば、分析対象となるデータが複数の目的変数を含む場合においても１つの分析結果としてまとめて出力可能な態様でデータ分析できるという効果を奏する。

【図面の簡単な説明】

【0016】

【図1】図１は、情報処理装置の構成の一例を示すブロック図である。

【図2】図２は、分析対象データの一例を示す図である。

【図3】図３は、不純度の計算の一例を示す図である。

【図4】図４は、Ｘ１を基準として分析対象データを分割した場合における不純度の改善量の合計の計算の一例を示す図である。

【図5】図５は、Ｘ２を基準として分析対象データを分割した場合における不純度の改善量の合計の計算の一例を示す図である。

【図6】図６は、Ｘ３を基準として分析対象データを分割した場合における不純度の改善量の合計の計算の一例を示す図である。

【図7】図７は、Ｘ３を基準として分析対象データを分割した場合における分割後のデータの一例を示す図である。

【図8】図８は、更にデータの分割を続けた場合における分割後のデータの一例を示す図である。

【図9】図９は、更にデータの分割を続けた場合における分割後のデータの一例の一部を抜き出した図である。

【図10】図１０は、各分割での分割前後の不純度の改善量（分割の影響スコア）の計算の一例を示す図である。

【図11】図１１は、分析結果を条件別（説明変数別）に出力する場合の一例を示す図である。

【図12】図１２は、分割の影響スコアを考慮して、分析結果を条件別（説明変数別）に出力する場合の一例を示す図である。

【図13】図１３は、分析結果をツリー（決定木）により出力する場合の一例を示す図である。

【図14】図１４は、分割の影響スコアまたは分割後の不純度を考慮して、分析結果をツリー（決定木）により出力する場合の一例を示す図である。

【図15】図１５は、社員の入社時における社員情報の設定の一例を示すイメージ図である。

【図16】図１６は、社員の入社時における社員情報の設定の一例を示すイメージ図である。

【図17】図１７は、複数の新入社員（５０人）についての複数の項目（５０項目）の登録の一例を示すイメージ図である。

【図18】図１８は、新入社員についての社員情報の登録漏れに起因する給与誤支給の発生の一例を示すイメージ図である。

【図19】図１９は、社員データの内容の一例を示す図である。

【図20】図２０は、各マスタの内容の一例を示す図である。

【図21】図２１は、テンプレートの登録（定義マスタの内容の登録）までの処理の流れの概要を示す図である。

【図22】図２２は、テンプレートの登録（定義マスタの内容の登録）から社員情報の登録までの処理の流れの概要を示す図である。

【図23】図２３は、分析実行画面の一例を示す図である。

【図24】図２４は、選択された枝についての登録候補の表示（ＭＡ４で示す）、項目別調整の表示（ＭＡ５で示す）および項目別調整における選択結果を受けての最終的な登録候補の表示（ＭＡ３で示す）をパターン登録画面で行う際の一例を示す図である。

【図25】図２５は、最終的な登録候補として表示したパターンに対する定義名の設定（ＭＢ１で示す）およびパターンの登録（ＭＢ２で示す）をパターン登録画面で行う際の一例を示す図である。

【図26】図２６は、登録したパターンの情報を社員情報登録・変更画面で確認および編集する際の一例を示す図である。

【図27】図２７は、社員情報登録・変更画面からのパターンの呼び出しの仕方および呼び出されたパターンの別画面における表示の仕方の一例を示す図である。

【図28】図２８は、呼び出されたパターンから特定のパターンの選択することで社員情報が自動設定された社員情報登録・変更画面の一例を示す図である。

【図29】図２９は、社員情報の設定の一例を示すイメージ図である。

【図30】図３０は、社員情報の変更の一例を示すイメージ図である。

【図31】図３１は、社員情報の変更時に給与担当者が行うべき作業の一例を示すイメージ図である。

【図32】図３２は、既に存在する社員についての社員情報の変更漏れに起因する給与誤支給の発生の一例を示すイメージ図である。

【図33】図３３は、テンプレートの登録（定義マスタの内容の登録）から社員情報の変更までの処理の流れの概要を示す図である。

【図34】図３４は、選択された枝についての登録候補の表示（ＭＦ４で示す）、項目別調整の表示（ＭＦ５で示す）および項目別調整における選択結果を受けての最終的な登録候補の表示（ＭＦ３で示す）をパターン登録画面で行う際の一例を示す図である。

【図35】図３５は、最終的な登録候補として表示したパターンに対する定義名の設定（ＭＧ１で示す）およびパターンの登録（ＭＧ２で示す）をパターン登録画面で行う際の一例を示す図である。

【図36】図３６は、登録したパターンの情報を定義情報登録・変更画面で確認および編集する際の一例を示す図である。

【図37】図３７は、社員情報登録・変更画面からの社員区分の変更の一例を示す図である。

【図38】図３８は、変更された社員区分に基づいて表示される登録したパターン一覧および当該パターンの内容を確認するために表示される定義情報登録・変更画面の一例を示す図である。

【図39】図３９は、表示されたパターン一覧から特定のパターンを選択することで社員情報が自動変更された社員情報登録・変更画面の一例を示す図である。

【発明を実施するための形態】

【0017】

以下に、データ分析装置、データ分析方法およびデータ分析プログラムの実施形態を、図面に基づいて詳細に説明する。なお、本実施形態により本発明が限定されるものではない。

【0018】

以下、具体的な構成および動作について説明するが、データ分析装置、データ分析方法、データ分析プログラムについての内容は、主に、以下の［１－１］、［２－１］、［３－１］および［４－１］で説明する。

【0019】

［１．構成］
本発明を包含する情報処理装置１００の構成の一例について、図１を参照して説明する。図１は、情報処理装置１００の構成の一例を示すブロック図である。

【0020】

情報処理装置１００は、市販のデスクトップ型パーソナルコンピュータである。なお、情報処理装置１００は、デスクトップ型パーソナルコンピュータのような据置型情報処理装置に限らず、市販されているノート型パーソナルコンピュータ、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔｓ）、スマートフォン、タブレット型パーソナルコンピュータなどの携帯型情報処理装置であってもよい。

【0021】

情報処理装置１００は、制御部１０２と通信インターフェース部１０４と記憶部１０６と入出力インターフェース部１０８と、を備えている。情報処理装置１００が備えている各部は、任意の通信路を介して通信可能に接続されている。

【0022】

通信インターフェース部１０４は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、情報処理装置１００をネットワーク３００に通信可能に接続する。通信インターフェース部１０４は、他の装置と通信回線を介してデータを通信する機能を有する。ここで、ネットワーク３００は、情報処理装置１００とサーバ２００とを相互に通信可能に接続する機能を有し、例えばインターネットやＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）等である。なお、後述する各種マスタ等のデータは、例えばサーバ２００に格納されてもよい。

【0023】

入出力インターフェース部１０８には、入力装置１１２および出力装置１１４が接続されている。出力装置１１４には、モニタ（家庭用テレビを含む）の他、スピーカやプリンタを用いることができる。入力装置１１２には、キーボード、マウス、及びマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。なお、以下では、出力装置１１４をモニタ１１４とし、入力装置１１２をキーボード１１２またはマウス１１２として記載する場合がある。

【0024】

記憶部１０６には、各種のデータベース、テーブルおよびファイルなどが格納される。記憶部１０６には、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）と協働してＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）に命令を与えて各種処理を行うためのコンピュータプログラムが記録される。記憶部１０６として、例えば、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）・ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）等のメモリ装置、ハードディスクのような固定ディスク装置、フレキシブルディスク、および光ディスク等を用いることができる。

【0025】

記憶部１０６は、例えば、分析対象データ１０６ａと、定義マスタとしての自動更新定義マスタ１０６ｂ（以下、単に「定義マスタ１０６ｂ」という。）と、社員区分マスタ１０６ｃと、給与区分マスタ１０６ｄと、役職マスタ１０６ｅと、等級マスタ１０６ｆと、職種マスタ１０６ｇと、勤務地マスタ１０６ｈと、計算定義マスタ１０６ｉと、を備えている。

【0026】

分析対象データ１０６ａは、図２に示すように、説明変数（Ｘ１、Ｘ２およびＸ３）と複数の目的変数（Ｙ１およびＹ２）とを有するレコードを複数含む。前記説明変数とは、前記目的変数を説明する変数のことであり、物事の原因ととらえることもできる。前記目的変数とは、予測したい変数のことであり、物事の結果ととらえることもできる。本実施形態に係る情報処理装置１００においては、複数の前記目的変数（Ｙ１およびＹ２）を扱えることが大きな特徴である。

【0027】

分析対象データ１０６ａは、給与支払いの場面では、例えば、社員データ１０６ａ１に相当する。

【0028】

分析対象データ１０６ａが社員データ１０６ａ１である場合、前記説明変数は、社員の身分を特定するための項目である身分項目に相当し、前記説明変数の値は、前記身分項目の値である身分項目値に相当する。前記身分項目としては、例えば、社員区分、性別、役職、勤務地、資格の有無および業務等が挙げられる。前記身分項目値としては、例えば、前記身分項目「社員区分」の前記身分項目値である「正社員」、前記身分項目「性別」の前記身分項目値である「男」および前記身分項目「業務」の前記身分項目値である「販売登録者」等が挙げられる。

【0029】

分析対象データ１０６ａが社員データ１０６ａ１である場合、前記目的変数は、前記社員に対する給与についての計算の仕方または支給の仕方を決定するための項目である給与項目に相当し、前記目的変数の値は、前記給与項目の値である給与項目値に相当する。前記給与項目としては、例えば、給与区分、給与支給日区分、労働条件区分、保険種別および各種手当の有無等が挙げられる。前記給与項目値としては、例えば、前記給与項目「給与区分」の前記給与項目値である「２：日給月給者」および前記給与項目「給与支給日区分」の前記給与項目値である「１：２５日払い」等が挙げられる。

【0030】

社員データ１０６ａ１の内容を図１９に例示するが、図１９においては、多数存在する前記説明変数および前記目的変数のうちの一部のみが示されている。社員データ１０６ａ１においては、各社員のデータが給与支給年月日ごとに保持されている。

【0031】

定義マスタ１０６ｂは、前記身分項目および前記身分項目値ならびに前記給与項目および前記給与項目値から構成されるパターンを定義するためのマスタである。定義マスタ１０６ｂは、例えば、前記パターンと、前記パターンを定義するためのパターン定義データ（定義名および定義番号等）と、を紐付けて含む。

【0032】

社員区分マスタ１０６ｃ、給与区分マスタ１０６ｄ、役職マスタ１０６ｅ、等級マスタ１０６ｆ、職種マスタ１０６ｇ、勤務地マスタ１０６ｈおよび計算定義マスタ１０６ｉの内容は、例えば、図２０に示すとおりである。社員区分マスタ１０６ｃの内容については、会社によってあまり差が無い。等級マスタ１０６ｆの内容については、会社によって全く異なる設定を行うことがある。給与計算時には、社員データ１０６ａ１の「職種」や「調整給区分」に対応する計算定義マスタ１０６ｉ中の「更新条件」を取得し、当該取得した「更新条件」と紐付く計算定義マスタ１０６ｉ中の「更新式」に基づいて給与計算を行うことができる。

【0033】

制御部１０２は、情報処理装置１００を統括的に制御するＣＰＵ等である。制御部１０２は、ＯＳ等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、格納されているこれらのプログラムに基づいて種々の情報処理を実行する。

【0034】

制御部１０２は、機能概念的に、例えば、（１）説明変数と複数の目的変数とを有するレコードを複数含む分析対象データ中の前記レコードを、特定の前記説明変数を基準として、当該基準とした説明変数の値ごとにレコード群に分割するレコード分割手段としてのレコード分割部１０２ａと、（２）前記レコード分割手段で分割して求めた前記レコード群ごとに、同一の前記目的変数内における最頻値および当該最頻値が占める割合を、前記複数の目的変数すべてについて算出する割合算出手段としての割合算出部１０２ｂと、（３）前記レコード分割手段で前記分割の基準とした前記説明変数の値ごとに、前記複数の目的変数すべてについて前記割合算出手段で算出した前記最頻値および前記割合を含む分析結果を作成する分析結果作成手段しての分析結果作成部１０２ｃと、（４）前記分割前の不純度から前記分割後の不純度を差し引いた値を、前記不純度改善量として前記目的変数ごとに算出する改善量算出手段としての改善量算出部１０２ｄと、（５）前記分析結果のうち、前記改善量算出手段で算出した前記不純度改善量が所定の値以上となった前記目的変数についての前記分割後の前記最頻値および前記割合のみを出力する分析結果出力手段としての分析結果出力部１０２ｅと、（６）１から、同一の前記目的変数内での各値の割合の２乗の和を差し引いた値を、前記不純度として算出する不純度算出手段としての不純度算出部１０２ｆと、（７）前記身分項目および前記身分項目値に基づいて階層的に分岐させた枝のうち選択された枝で特定される前記社員の集合について、同一の前記給与項目内において占める割合が最も大きい前記給与項目値を、当該最も大きい割合と併せて、前記パターンの前記登録を行うための画面であるパターン登録画面に表示し、前記最も大きい割合が所定の閾値以上である場合は、前記閾値以上の割合の前記給与項目値を、前記登録の候補として識別可能な態様で、前記閾値以上の割合と併せて、前記パターン登録画面に表示する登録候補パターン表示手段としての登録候補パターン表示部１０２ｇと、（８）前記選択された枝についての前記身分項目および前記身分項目値ならびに前記登録候補パターン表示手段が前記識別可能な前記態様で表示した前記給与項目値およびこれに対応する前記給与項目から構成される前記パターンと、当該パターンを定義するためのパターン定義データであってオペレータにより設定されたものと、を紐付けて定義マスタに登録するパターン登録手段としてのパターン登録部１０２ｈと、（９）前記定義マスタから、前記社員単位で前記身分項目値および前記給与項目値の新規登録または変更を行うための画面である社員情報登録・変更画面において指定されたパターン定義データと紐付く前記パターンについての前記項目および前記値を取得し、当該取得した項目についての当該値を、前記新規登録の候補として前記社員情報登録・変更画面に表示する登録候補項目表示手段としての登録候補項目表示部１０２ｉと、（１０）前記社員単位で前記身分項目値および前記給与項目値の新規登録または変更を行うための画面である社員情報登録・変更画面において特定の前記身分項目についての前記身分項目値が変更されると、前記定義マスタから、変更の対象となった前記身分項目および変更後の前記身分項目値と紐付くパターン定義データを取得し、当該取得したパターン定義データを表示するパターン定義表示手段としてのパターン定義表示部１０２ｊと、（１１）前記定義マスタから、前記パターン定義表示手段が表示した前記パターン定義データのうち指定されたものと紐付く前記パターンについての前記項目および前記値を取得し、当該取得した項目についての当該値を、前記変更の候補として前記社員情報登録・変更画面に表示する変更候補項目表示手段としての変更候補項目表示部１０２ｋと、を備えている。以下、各部が実行する動作を説明する。

【0035】

［１－１．決定木の作成についての動作］
レコード分割部１０２ａは、説明変数と複数の目的変数とを有するレコードを複数含む分析対象データ１０６ａ中の前記レコードを、特定の前記説明変数を基準として、当該基準とした説明変数の値ごとにレコード群に分割する。例えば、レコード分割部１０２ａは、図８に示すように、分析対象データ１０６ａ中のレコード１０個を、説明変数Ｘ３を基準として、Ｘ３＝１を有する２個のレコードからなるレコード群Ａと、Ｘ３＝２を有する６個のレコードからなるレコード群Ｄと、Ｘ３＝３を有する２個のレコードからなるレコード群Ｉと、に分割する。

【0036】

レコード分割部１０２ａは、前記分割の基準とした前記説明変数以外の前記説明変数を新たな基準として前記分割を繰り返し、前記分割して求めた前記レコード群中の前記レコードの数、前記分割を実行した回数および前記分割前と前記分割後の間での前記目的変数についての不純度の改善量である不純度改善量のうちの少なくとも１つに応じて、前記分割を停止してもよい。例えば、レコード分割部１０２ａは、図８に示すように、レコード群Ａ中のレコード２個を、Ｘ２＝１を有する１個のレコードからなるレコード群Ｂと、Ｘ２＝２を有する１個のレコードからなるレコード群Ｃと、に分割し、レコード群Ｄ中のレコード６個を、Ｘ１＝１を有する３個のレコードからなるレコード群Ｅと、Ｘ１＝２を有する２個のレコードからなるレコード群Ｆと、に分割する。更に続けて、レコード分割部１０２ａは、図８に示すように、レコード群Ｅ中のレコード３個を、Ｘ２＝１を有する２個のレコードからなるレコード群Ｇと、Ｘ２＝２を有する１個のレコードからなるレコード群Ｈと、に分割する。このようにして、レコード分割部１０２ａは、図８に示すように、分析対象データ１０６ａ中のレコード１０個を、レコード群Ａ～Ｉに分割する。

【0037】

割合算出部１０２ｂは、レコード分割部１０２ａで分割して求めた前記レコード群ごとに、同一の前記目的変数内における最頻値および当該最頻値が占める割合を、前記複数の目的変数すべてについて算出する。例えば、図８のレコード群Ａに注目した場合、割合算出部１０２ｂは、目的変数Ｙ１については、最頻値を１と算出し、当該最頻値１が占める割合を１／２×１００＝５０％と算出し、また、目的変数Ｙ２については、最頻値を１と算出し、当該最頻値１が占める割合を２／２×１００＝１００％と算出する。同様に、図８のレコード群Ｅに注目した場合、割合算出部１０２ｂは、目的変数Ｙ１については、最頻値を１と算出し、当該最頻値１が占める割合を２／３×１００≒６７％と算出し、また、目的変数Ｙ２については、最頻値を２と算出し、当該最頻値２が占める割合を３／３×１００＝１００％と算出する。

【0038】

分析結果作成部１０２ｃは、レコード分割部１０２ａで前記分割の基準とした前記説明変数の値ごとに、前記複数の目的変数すべてについて割合算出部１０２ｂで算出した前記最頻値および前記割合を含む分析結果を作成する。例えば、図８のレコード群Ａに注目した場合、分析結果作成部１０２ｃは、「分割の基準が説明変数『Ｘ３＝１』である場合、目的変数Ｙ１の最頻値が１でありその割合が５０％、目的変数Ｙ２の最頻値が１でありその割合が１００％である」という分析結果を作成する。同様に、図８のレコード群Ｅに注目した場合、分析結果作成部１０２ｃは、「分割の基準が説明変数『Ｘ３＝２、Ｘ１＝１』である場合、目的変数Ｙ１の最頻値が１でありその割合が約６７％、目的変数Ｙ２の最頻値が２でありその割合が１００％である」という分析結果を作成する。作成される分析結果のイメージを、図１１に示す。

【0039】

分析結果作成部１０２ｃは、前記分析結果として、レコード分割部１０２ａで前記分割の基準とした前記説明変数の値に基づいて階層的に分岐させた枝ごとに、前記複数の目的変数すべてについて割合算出部１０２ｂで算出した前記最頻値および前記割合を含む決定木を作成してもよい。作成される決定木のイメージを、図１３に示す。なお、決定木による分析とは、例えば、全データの中で分析したい変数（目的変数）とデータを分岐させる変数（説明変数）とを設定し、分岐を繰り返していき、分析結果をツリー構造の樹木図で表現する分析手法のことである。

【0040】

改善量算出部１０２ｄは、前記分割前の不純度から前記分割後の不純度を差し引いた値を、前記不純度改善量として前記目的変数ごとに算出する。ここで、前記不純度は、不純度算出部１０２ｆが、同一の前記目的変数内での各値の割合の２乗の和を差し引くことにより算出することができる。例えば、図８において、分析対象データ１０６ａ（＝分割前）とレコード群Ａ（＝分割後）とに注目する。

【0041】

不純度算出部１０２ｆは、分析対象データ１０６ａ（＝分割前）における目的変数Ｙ１の不純度を、１－（Ｙ１＝１となる割合）^２－（Ｙ１＝２となる割合）^２＝１－（６／１０）^２－（４／１０）^２＝０．４８と算出する。同様に、不純度算出部１０２ｆは、分析対象データ１０６ａ（＝分割前）における目的変数Ｙ２の不純度を、１－（Ｙ２＝１となる割合）^２－（Ｙ２＝２となる割合）^２－（Ｙ２＝３となる割合）^２－（Ｙ２＝４となる割合）^２＝１－（２／１０）^２－（３／１０）^２－（３／１０）^２－（２／１０）^２＝０．５３と算出する。

【0042】

不純度算出部１０２ｆは、レコード群Ａ（＝分割後）における目的変数Ｙ１の不純度を、１－（Ｙ１＝１となる割合）^２－（Ｙ１＝２となる割合）^２＝１－（１／２）^２－（１／２）^２＝０．５と算出する。同様に、不純度算出部１０２ｆは、レコード群Ａ（＝分割後）における目的変数Ｙ２の不純度を、１－（Ｙ２＝１となる割合）^２＝１－（２／２）^２＝０と算出する。

【0043】

以上より、改善量算出部１０２ｄは、目的変数Ｙ１についての不純度改善量を、分割前の不純度０．４８－分割後の不純度０．５＝－０．０２と算出する。同様に、改善量算出部１０２ｄは、目的変数Ｙ２についての不純度改善量を、分割前の不純度０．５３－分割後の不純度０＝０．５３と算出する。

【0044】

分析結果出力部１０２ｅは、前記分析結果のうち、改善量算出部１０２ｄで算出した前記不純度改善量が所定の値以上となった前記目的変数についての前記分割後の前記最頻値および前記割合のみを出力してもよい。例えば、前記所定の値を仮に「０．０５」とした場合、分析結果出力部１０２ｅは、不純度改善量が－０．０２である目的変数Ｙ１についての前記分割後の最頻値である１およびその割合である５０％については出力せず、不純度改善量が０．５３である目的変数Ｙ２についての前記分割後の最頻値である１およびその割合である１００％のみを出力する。このような不純度改善量を考慮した分析結果の表示のイメージを、図１２および図１４に示す。

【0045】

［１－２．社員情報の登録および変更についての動作］
登録候補パターン表示部１０２ｇは、前記身分項目および前記身分項目値に基づいて階層的に分岐させた枝のうち選択された枝（具体的には、図２４および図３４のパターン登録画面における画面左側の「条件分岐」の枝）で特定される前記社員の集合について、同一の前記給与項目内において占める割合が最も大きい前記給与項目値を、当該最も大きい割合と併せて、前記パターンの前記登録を行うための画面であるパターン登録画面（具体的には、図２４のＭＡ４および図３４のＭＦ４で示す領域）に表示する。この際、登録候補パターン表示部１０２ｇは、前記最も大きい割合が所定の閾値以上である場合は、前記閾値以上の割合の前記給与項目値を、登録の候補として識別可能な態様で（具体的には、斜線およびドットのハッチングで）、前記閾値以上の割合と併せて、前記パターン登録画面（具体的には、図２４のＭＡ４および図３４のＭＦ４で示す領域）に表示する。

【0046】

登録候補パターン表示部１０２ｇは、前記閾値以上の割合が属する数値範囲に応じて、異なる前記態様で（具体的には、割合が１００％に属する給与項目値は斜線のハッチングで、割合が９０％以上１００％未満に属する給与項目値はドットのハッチングで）、前記閾値以上の割合の前記給与項目値を表示してもよい。

【0047】

登録候補パターン表示部１０２ｇは、前記表示した前記給与項目値のうち前記登録の候補として最終的に表示するものを調整するためのボタンである調整ボタン（具体的には、図２４のＭＡ２および図３４のＭＦ２に示す「項目別調整」ボタン）が前記パターン登録画面（図２４および図３４参照）において選択されると、前記表示した前記給与項目値に対応するチェックボックスを表示し、チェックが入れられた前記チェックボックスに対応する前記給与項目値を、前記登録の最終的な候補として識別可能な態様で前記パターン登録画面（具体的には、図２４のＭＡ３および図３４のＭＦ３で示す「選択結果」の領域）に表示してもよい。

【0048】

パターン登録部１０２ｈは、前記選択された枝についての前記身分項目および前記身分項目値ならびに登録候補パターン表示部１０２ｇが前記識別可能な前記態様で表示した前記給与項目値およびこれに対応する前記給与項目から構成される前記パターン（具体的には、図２４にＭＡ３で示すパターン１および図３４にＭＦ３で示すパターン２）と、当該パターンを定義するためのパターン定義データであってオペレータにより設定されたもの（具体的には、図２５にＭＡＢ１で示す前記パターン１に対応する定義名「男性一般社員（販売登録者）」および図３５にＭＧ１で示す前記パターン２に対応する定義名「女性アルバイト社員（販売登録者）」）と、を紐付けて定義マスタ１０６ｂに登録する。

【0049】

登録候補項目表示部１０２ｉは、定義マスタ１０６ｂから、前記社員単位で前記身分項目値および前記給与項目値の新規登録または変更を行うための画面である社員情報登録・変更画面（図２７等参照）において指定されたパターン定義データと紐付く前記パターンについての前記項目および前記値を取得し、当該取得した項目についての当該値を、前記新規登録の候補として前記社員情報登録・変更画面に表示する（具体的には、図２８におけるＭＥ２の領域の表示を指す）。

【0050】

パターン定義表示部１０２ｊは、前記社員情報登録・変更画面（図３７等参照）において特定の前記身分項目についての前記身分項目値が変更されると、定義マスタ１０６ｂから、変更の対象となった前記身分項目および変更後の前記身分項目値と紐付くパターン定義データを取得し、当該取得したパターン定義データを表示する（具体的には、図３８の上画面における定義名の表示を指す）。パターン定義表示部１０２ｊは、前記取得したパターン定義データと併せて、これと紐付く定義マスタ１０６ｂ中の前記パターンについての前記身分項目および前記身分項目値を表示してもよい（具体的には、図３８の上画面における条件項目の表示を指す）。

【0051】

変更候補項目表示部１０２ｋは、定義マスタ１０６ｂから、パターン定義表示部１０２ｊが表示した前記パターン定義データのうち指定されたものと紐付く前記パターンについての前記項目および前記値を取得し、当該取得した項目についての当該値を、前記変更の候補として前記社員情報登録・変更画面に表示する（具体的には、図３９におけるＭＫ１の領域の表示を指す）。

【0052】

［２．背景と概要］
本項目では、決定木の作成、社員情報の登録および社員情報の変更のそれぞれについて、背景と概要を説明する。

【0053】

［２－１．決定木の作成の背景と概要］
従来の決定木アルゴリズムにおいては、目的変数として一つの値のみを取り扱っていた。複数の値を同時に予測するためには、それぞれに分析を行う必要があるが、その場合、条件値と目的変数の組み合わせが膨大になり、利用者が分析結果を理解しにくいという問題があった。また、条件の分岐が深くなると、どの条件が結果に影響を与えているのかの理解が難しくなるという問題もあった。

【0054】

そこで、本実施形態においては、例えば、複数の目的変数を同時に取り扱えるようにすることで、簡潔な条件値と目的変数の値の組を利用者に示すことを可能とした。また、本実施形態においては、例えば、分岐ごとにその条件が目的変数の決定に役に立っているかをスコア化することで、条件と目的変数との間にあるルールをより簡潔に理解することを可能とし、分析を専門としないシステムのユーザであっても、分析結果の活用をできるようにした。

【0055】

そして、本実施形態においては、例えば、条件となりうる複数の値と、それによって決まると考えられる複数の値の間にあるルールを見つけだすために、業務システムのデータにおいて、大量のデータがある中でどのようなルールでそのデータが入力されているのかを分析することで、少数の項目をもとに他の設定値を予測できるようし、以降の入力ミスの削減や入力時の効率をあげるといった活用を可能とした。入力値としては、例えば、区分値のような離散的な値を想定する。なお、決定木アルゴリズムとしては、CARTやC4.5等が公知であるが、本実施形態においては、これら公知の決定木アルゴリズムを改良することで、業務システムのような離散値項目を数多く持つようなデータへの適用を可能とし、分析結果の理解をより容易にした。

【0056】

［２－２．社員情報の登録の背景と概要］
会社ごとに給与規定は異なるため、給与計算を行うために管理している「社員の情報」の項目とその内容は会社によってさまざまである。ここで、会社の給与規定に則った計算を行うためには、給与規定や契約書をもとに「社員の情報」をシステム上で設定する必要があるが、契約書に表記している内容から給与規定に記載してある内容を紐づけ、システムに登録すべき項目とその内容をすべて網羅して把握することは困難であり、登録漏れ・登録ミスが発生していた。結果として、誤支給が発生してしまうケースがあった。また、登録が必要なシステムの項目数は多く、同時期に多くの入社者がいる場合は、作業量が膨大であった。

【0057】

そこで、本実施形態においては、例えば、「社員の情報」の登録を行う際に、既存の大量データの分析を行い、同時に入力すべき項目とその内容を提案できるような仕組みを提供することにより、例えば、作業の効率化および誤支給の未然防止を実現する。具体的には、本実施形態においては、社員を登録する際に、同時に登録すべき項目を知りたいという課題を解決するために、他の社員の情報を分析し、関連度の高い項目を確認できることで、同時に登録すべき項目を把握することができる仕組みを構築した。また、本実施形態においては、同じような社員を登録する際の入力作業を容易に行いたいという課題を解決するために、他の社員の情報を分析し、関連度の高い項目とその内容を候補から選択することで、登録を容易にできる仕組みを構築した。

【0058】

以下、本項目［２－２］では、社員情報の登録の際の課題および背景について詳細に説明する。

【0059】

まず、図１５および図１６に示すように、社員の入社時には、給与規定および雇用契約書の内容をシステムに入力するが、この際に、本来システムに入力することが必要な項目であるにも関わらず入力漏れが生じてしまうことがある。例えば、雇用契約書には記載がない項目、複雑な条件で入力の有無が決まる項目および会社独自のルールで設定が必要な項目等は、入力漏れや入力ミスが生じやすい。

【0060】

図１６には、給与規定（通常は分厚い紙面等であることが多い）を参照しないとわからない情報として、等級の情報および調整給手当（2010年以降に中途入社した社員のみ月額２万円支給）の情報が例示されている。システムの入力担当者は、給与規定における調整給手当の情報を参照しつつ、調整支給区分を「１：対象（20,000円が支給されることを意味する区分）」としてシステム入力する必要がある。

【0061】

しかしながら、システムの入力担当者は、多数の新入社員についてシステム入力を行う必要があるため、入力漏れや入力ミスが生じやすいという問題があった。例えば、図１７に示すように、５０人の新入社員の各々に対して５０項目をシステム入力する場合、合計で５０人×５０項目＝２５００項目という膨大な項目数を入力する必要がある。

【0062】

このような事情により、入力漏れや入力ミスが生じてしまうと、給与の誤支給に繋がる可能性がある。例えば、図１８に示すように、調整支給区分「１：対象」の入力漏れが生じると、結果として、本来は調整給手当２万円の支給対象だった者に対して、当該手当が支給されないこととなってしまい、誤支給に繋がるという問題があった。

【0063】

［２－３．社員情報の変更の背景と概要］
会社の給与規定に則った計算を行うためには、「社員の情報」をシステム上で設定する必要があるが、会社ごとに給与規定が異なるため、給与計算を行うために管理している「社員の情報」の項目とその内容は会社によってさまざまである。ここで、給与計算には、「社員の情報」の複数の項目が複雑に関係するため、１つの項目を変更する際に、同時に多くの項目を変更する必要が生じることが多い。しかし、「社員の情報」の変更が必要になる際の資料には、システム上で変更が必要な項目についての記載はないことが一般的である。そのため、１つの項目を変更する際に、同時に変更する必要がある項目を調べるためには、他の社員の登録情報と見比べて判断しており、作業が効率的でなかった。また、変更が必要な項目を全て捉えられず、変更漏れが発生することにより、結果として、誤支給が発生してしまうケースがあった。

【0064】

そこで、本実施形態においては、例えば、「社員の情報」の変更を行う際に、既存の大量データの分析を行い、同時に変更すべき項目とその内容を提案できるような仕組みを提供するこれにより、例えば、作業の効率化および誤支給の未然防止を実現する。具体的には、本実施形態においては、社員情報の項目を変更する際に、他に変更すべき項目がないか知り、変更漏れを防ぎたいという課題を解決するために、他の社員の情報を分析し、変更内容に関連度の高い項目を確認できることで、他に変更すべき項目を把握することができる仕組みを構築した。また、本実施形態においては、社員情報の項目を変更する際に、他の必要な項目変更についての登録を容易に行いたいという課題を解決するために、他の社員の情報を分析し、変更内容に関連度の高い項目とその内容を候補から選択することで、登録を容易にできる仕組みを構築した。

【0065】

以下、本項目［２－３］では、社員情報の変更の際の課題および背景について詳細に説明する。

【0066】

まず、図２９に示すように、社員の入社時やシステム導入時には、給与規定や雇用契約書をもとに、社員の情報の設定を行う。ここで、図３０に示すように、社員についての情報の変更がある場合、人事部長等から給与の支払を担当する者に対して、昇格対象者リスト、所属異動対象者リスト、退職後再雇用対象者リスト、アルバイトから正規雇用への変更対象リストおよび育休・産休対象者リスト等が送られる。ここで、これらのリストからは、変更の対象がどの社員であるかという情報しかわからず、すなわち例えば昇格対象者リストを例にとった場合、課長代理から課長への昇格対象者が、社員Ａ、社員Ｅおよび社員Ｆの３人であるという情報しかわからない。このため、当該３人の社員について、「職種」の項目を一般職から管理職に変更する必要が本来あるとしても、この情報はわからない。

【0067】

そして、仮に図３１に示すように、「職種」が管理職である場合には管理職手当50,000円を支給し、「職種」が管理職以外である場合には管理職手当を支給しないという規定が存在する場合に、システム上で前記３人の社員の「職種」を一般職から管理職へと変更するのを忘れてしまうと、図３２に示すように、本来は管理職手当の支給対象だった者（社員Ａ、社員Ｅおよび社員Ｆ）に対して、当該手当が支給されないこととなってしまい、誤支給に繋がるという問題があった。

【0068】

［３．処理の詳細］
本項目では、本実施形態に係る処理の具体例を説明する。決定木の作成処理、社員情報の登録処理および社員情報の変更処理の順に説明する。

【0069】

［３－１．決定木の作成処理］
最初に、決定木の作成処理を、図２～図１４を用いて詳細に説明する。なお、本実施形態における決定木アルゴリズムにおいては、以下の（６）において分割ごとの改善量の計算を行い、当該計算の結果を、以下の（７）においてユーザにとってわかりやすい結果表示のために用いていることが特徴の一つである。

【0070】

（０）分析対象となるデータ
前提として、分析対象（＝分割対象）となるデータである分析対象データ１０６ａは、図２に示すとおりであるとする。図２の分析対象データ１０６ａにおいて、Ｘ１、Ｘ２およびＸ３は、説明変数であり、Ｙ１およびＹ２は、目的変数である。前記説明変数および前記目的変数は、質的変数とする。以下においては、前記説明変数の値によって、前記目的変数の値が決定される何かしらのルールがあると推測するものとする。

【0071】

（１）現状の不純度を計算する
まず、不純度算出部１０２ｆは、データのばらつき具合を表す指標として、不純度を以下のようにして算出する。不純度の計算には、例えば、一般的な決定木アルゴリズムで用いられる情報エントロピーやジニー係数（Gini係数）等を用いることができる。

【0072】

例えば、図２の分析対象データ１０６ａ中のＹ１の不純度を、ジニー係数（Gini係数）を用いて計算すると、以下のようになる。ジニー係数は、図３に示すように、１－（Ｙ１＝１となる割合）^２－（Ｙ１＝２となる割合）^２という計算式で表される。図２を参照すると、Ｙ１＝１となる割合は６／１０であり、Ｙ１＝２となる割合は、４／１０であるため、不純度算出部１０２ｆは、ジニー係数を、１－（６／１０）^２－（４／１０）^２＝０．４８と算出する。以上より、不純度算出部１０２ｆは、Ｙ１についての分割前の不純度を０．４８と算出する。また、不純度算出部１０２ｆは、同様の計算により、Ｙ２についての分割前の不純度を０．５３と算出する。

【0073】

（２）各条件項目について、分割したときの不純度の改善量を計算する
次に、不純度算出部１０２ｆは、Ｘ１～Ｘ３のそれぞれについて、その値で分割した場合の不純度の改善量を算出する。

【0074】

（２－１）Ｘ１で分割する場合
Ｘ１を基準として分割する場合、レコード分割部１０２ａは、図４に示すように、図２の分析対象データ１０６ａ中の１０個のレコードを、Ｘ１＝１を有する５個のレコード（ｉｄ＝ａ、ｂ、ｃ、ｄ、ｅ）からなるレコード群（Ｘ１＝１のデータ）と、Ｘ１＝２を有する５個のレコード（ｉｄ＝ｆ、ｇ、ｈ、ｉ、ｊ）からなるレコード群（Ｘ１＝２のデータ）と、に分割する。

【0075】

ここで、不純度算出部１０２ｆは、前記（１）で説明した計算法により、図４に示すように、Ｘ１＝１のデータにおけるＹ１の不純度を０．４８と算出し、Ｘ１＝１のデータにおけるＹ２の不純度を０．４８と算出し、Ｘ１＝２のデータにおけるＹ１の不純度を０．４８と算出し、Ｘ１＝２のデータにおけるＹ２の不純度を０．４８と算出する。

【0076】

そして、不純度算出部１０２ｆは、前段落で算出したＹ１の不純度の加重平均をとり、Ｙ１についての分割後の不純度を０．４８と算出する。同様に、不純度算出部１０２ｆは、前段落で算出したＹ２の不純度の加重平均をとり、Ｙ２についての分割後の不純度を０．４８と算出する。

【0077】

最後に、改善量算出部１０２ｄは、Ｙ１についての分割前の不純度（０．４８）からＹ１についての分割後の不純度（０．４８）を差し引くことにより、Ｙ１についての不純度の改善量を０と算出する。同様に、改善量算出部１０２ｄは、Ｙ２についての分割前の不純度（０．５３）からＹ２についての分割後の不純度（０．４８）を差し引くことにより、Ｙ２についての不純度の改善量を０．０５と算出する。そして、改善量算出部１０２ｄは、Ｙ１についての不純度の改善量（０）とＹ２についての不純度の改善量（０．０５）とを足すことにより、不純度の改善量の合計を０．０５と算出する。

【0078】

（２－２）Ｘ２で分割する場合
Ｘ２を基準として分割する場合、レコード分割部１０２ａは、図５に示すように、図２の分析対象データ１０６ａ中の１０個のレコードを、Ｘ２＝１を有する４個のレコード（ｉｄ＝ａ、ｃ、ｄ、ｈ）からなるレコード群（Ｘ２＝１のデータ）と、Ｘ２＝２を有する６個のレコード（ｉｄ＝ｂ、ｅ、ｆ、ｇ、ｉ、ｊ）からなるレコード群（Ｘ２＝２のデータ）と、に分割する。

【0079】

ここで、不純度算出部１０２ｆは、前記（１）で説明した計算法により、図５に示すように、Ｘ２＝１のデータにおけるＹ１の不純度を０と算出し、Ｘ２＝１のデータにおけるＹ２の不純度を０．６２５と算出し、Ｘ２＝２のデータにおけるＹ１の不純度を０．４４４４と算出し、Ｘ２＝２のデータにおけるＹ２の不純度を０．７２２２と算出する。

【0080】

そして、不純度算出部１０２ｆは、前段落で算出した不純度について、加重平均を、例えば、件数で重みづけした以下の計算式により算出する。すなわち、加重平均＝｛（Ｘ２＝１のデータの不純度）×（Ｘ２＝１のデータ中のレコード件数）／（分割前のデータ中のレコード件数）｝＋｛（Ｘ２＝２のデータの不純度）×（Ｘ２＝２のデータ中のレコード件数）／（分割前のデータ中のレコード件数）｝である。この計算式に従い、不純度算出部１０２ｆは、Ｙ１についての分割後の不純度を、（０×４／１０）＋（０．４４４４×６／１０）≒０．２６６７と算出する。同様に、不純度算出部１０２ｆは、Ｙ２についての分割後の不純度を、（０．６２５×４／１０）＋（０．７２２２×６／１０）≒０．６８３３と算出する。

【0081】

最後に、改善量算出部１０２ｄは、Ｙ１についての分割前の不純度（０．４８）からＹ１についての分割後の不純度（０．２６６７）を差し引くことにより、Ｙ１についての不純度の改善量を０．２１３３と算出する。同様に、改善量算出部１０２ｄは、Ｙ２についての分割前の不純度（０．５３）からＹ２についての分割後の不純度（０．６８３３）を差し引くことにより、Ｙ２についての不純度の改善量を－０．１５３と算出する。そして、改善量算出部１０２ｄは、Ｙ１についての不純度の改善量（０．２１３３）とＹ２についての不純度の改善量（－０．１５３）とを足すことにより、不純度の改善量の合計を０．０６と算出する。

【0082】

（２－３）Ｘ３で分割する場合
Ｘ３を基準として分割する場合、レコード分割部１０２ａは、図６に示すように、図２の分析対象データ１０６ａ中の１０個のレコードを、Ｘ３＝１を有する２個のレコード（ｉｄ＝ａ、ｂ）からなるレコード群（Ｘ３＝１のデータ）と、Ｘ３＝２を有する６個のレコード（ｉｄ＝ｃ、ｄ、ｅ、ｆ、ｇ、ｈ）からなるレコード群（Ｘ３＝２のデータ）と、Ｘ３＝３を有する２個のレコード（ｉｄ＝ｉ、ｊ）からなるレコード群（Ｘ３＝３のデータ）と、に分割する。

【0083】

ここで、不純度算出部１０２ｆは、前記（１）で説明した計算法により、図６に示すように、Ｘ３＝１のデータにおけるＹ１の不純度を０．５と算出し、Ｘ３＝１のデータにおけるＹ２の不純度を０と算出し、Ｘ３＝２のデータにおけるＹ１の不純度を０．５と算出し、Ｘ３＝２のデータにおけるＹ２の不純度を０．５と算出し、Ｘ３＝３のデータにおけるＹ１の不純度を０と算出し、Ｘ３＝３のデータにおけるＹ２の不純度を０と算出する。

【0084】

そして、不純度算出部１０２ｆは、前段落で算出した不純度について、（２－２）で説明した計算式により加重平均を算出する。すなわち、不純度算出部１０２ｆは、Ｙ１についての分割後の不純度を、（０．５×２／１０）＋（０．５×６／１０）＋（０×２／１０）＝０．４と算出する。同様に、不純度算出部１０２ｆは、Ｙ２についての分割後の不純度を、（０×２／１０）＋（０．５×６／１０）＋（０×２／１０）＝０．３と算出する。

【0085】

最後に、改善量算出部１０２ｄは、Ｙ１についての分割前の不純度（０．４８）からＹ１についての分割後の不純度（０．４）を差し引くことにより、Ｙ１についての不純度の改善量を０．０８と算出する。同様に、改善量算出部１０２ｄは、Ｙ２についての分割前の不純度（０．５３）からＹ２についての分割後の不純度（０．３）を差し引くことにより、Ｙ２についての不純度の改善量を０．２３と算出する。そして、改善量算出部１０２ｄは、Ｙ１についての不純度の改善量（０．０８）とＹ２についての不純度の改善量（０．２３）とを足すことにより、不純度の改善量の合計を０．３１と算出する。

【0086】

（２－４）まとめ
以上（２－１）～（２－３）で算出したように、Ｙ１の不純度の改善量とＹ２の不純度の改善量の合計は、Ｘ１を基準として分割した場合は０．０５、Ｘ２を基準として分割した場合は０．０６、Ｘ３を基準として分割した場合は０．３１となったため、Ｘ３を基準として分割した場合に最も不純度が改善する（すなわち、情報利得が大きい）ことがわかった。

【0087】

なお、本例においては、目的変数（Ｙ１およびＹ２）の不純度の改善量の「合計」に着目して、説明変数（Ｘ１、Ｘ２およびＸ３）のうちＸ３を採用したが、例えば、各目的変数（Ｙ１およびＹ２）の改善量の「最大値」に着目して、説明変数（Ｘ１、Ｘ２およびＸ３）のうちどれを採用するかを決定してもよい。本例だと、Ｘ１で分割した場合のＹ１についての不純度の改善量０、Ｘ１で分割した場合のＹ２についての不純度の改善量０．０５、Ｘ２で分割した場合のＹ１についての不純度の改善量０．２１３３、Ｘ２で分割した場合のＹ２についての不純度の改善量－０．１５３、Ｘ３で分割した場合のＹ１についての不純度の改善量０．０８およびＸ３で分割した場合のＹ２についての不純度の改善量０．２３の６つの改善量のうち、Ｘ３で分割した場合のＹ２についての不純度の改善量０．２３が「最大値」に該当するため、Ｘ３が採用されることとなる。このように、「最大値」に着目することで、その条件（説明変数）が、特定の目的項目列（特定の目的変数）についてのみいい分割（不純度が改善する分割）を出来るようにするものであったとしても、採用されやすくすることができる。

【0088】

（３）最も情報利得の大きい条件項目で、その値ごとにデータを分割する
次に、レコード分割部１０２ａは、（２－４）で述べた最も情報利得の大きい条件項目（目的変数）であるＸ３を基準として、Ｘ３がとる値ごとに、図２の分析対象データ１０６ａ中のレコードを分割する。

【0089】

具体的には、レコード分割部１０２ａは、図７に示すように、図２の分析対象データ１０６ａ中の１０個のレコードを、Ｘ３＝１を有する２個のレコード（ｉｄ＝ａ、ｂ）からなるレコード群Ａと、Ｘ３＝２を有する６個のレコード（ｉｄ＝ｃ、ｄ、ｅ、ｆ、ｇ、ｈ）からなるレコード群Ｄと、Ｘ３＝３を有する２個のレコード（ｉｄ＝ｉ、ｊ）からなるレコード群Ｉと、に分割する。

【0090】

（４）分割されたデータのそれぞれについて、更に分割を繰り返す
レコード分割部１０２ａは、（３）で分割して求めた３つのレコード群（レコード群Ａ、ＤおよびＩ）それぞれについて、更に分割を繰り返す。

【0091】

具体的には、レコード分割部１０２ａは、図８に示すように、レコード群Ａ中のレコード２個を、Ｘ２＝１を有する１個のレコード（ｉｄ＝ａ）からなるレコード群Ｂと、Ｘ２＝２を有する１個のレコード（ｉｄ＝ｂ）からなるレコード群Ｃと、に分割する。ここまでの分割により、各レコード群が含むレコード数はともに１個しかないため、すなわち、分割できるレコードがこれ以上ないため、レコード分割部１０２ａは分割を停止する。

【0092】

また、レコード分割部１０２ａは、図８に示すように、レコード群Ｄ中のレコード６個を、Ｘ１＝１を有する３個のレコード（ｉｄ＝ｃ、ｄ、ｅ）からなるレコード群Ｅと、Ｘ１＝２を有する３個のレコード（ｉｄ＝ｆ、ｇ、ｈ）からなるレコード群Ｆと、に分割する。更に、レコード分割部１０２ａは、図８に示すように、レコード群Ｅ中のレコード３個を、Ｘ２＝１を有する２個のレコード（ｉｄ＝ｃ、ｄ）からなるレコード群Ｇと、Ｘ２＝２を有する１個のレコード（ｉｄ＝ｅ）からなるレコード群Ｈと、に分割する。

【0093】

なお、レコード群Ｉ中の２個のレコードは、Ｘ１はともに２であり、Ｘ２もともに２であり、分割の基準となる目的変数が存在しないため、分割は打ち止めとなる。

【0094】

（５）いくつかの終了条件に基づいて分割を停止する
（４）で述べたとおり、レコード分割部１０２ａは、再帰的な分割の処理を行うが、例えば、以下に示す終了条件に基づいて分割を停止する。

【0095】

終了条件の一つ目として、データ件数（分割後のレコード群中のレコード件数）が挙げられる。具体的には、分割後のレコード群中のレコード件数が少ない場合（例えば、分析対象データ１０６ａの５％を閾値とし、分割後のレコード群中のレコード件数が当該閾値以下となった場合）、それ以上の分割を打ち止めるといった対応が考えられる。

【0096】

終了条件の二つ目として、深さ（分割を実行した回数）が挙げられる。具体的には、分割を実行した回数が予め設定した回数を超えたらそれ以上の分割を打ち止めるといった対応等が考えられ、これにより、条件が複雑になりすぎることを防ぐことができる。

【0097】

終了条件の三つ目として、不純度の改善が挙げられる。具体的には、分割の結果、不純度の改善が小さい場合にはそれ以上の分割を打ち止めるといった対応が考えられる。

【0098】

（６）分割ごとの改善量を計算する
データの分割を行った際に、目的変数がよりきれいに区別されるように分割されることが望ましいが、一回のデータ分割で、すべての目的変数について不純度が改善されるわけではない。このため、以下で説明するように、目的変数ごとに不純度の改善量を算出することで、その分割がどの程度その目的変数に影響を与えているのかを把握することができる。

【0099】

例えば、図９に示すように、Ｘ３＝１を基準として分割１を行い、更に、Ｘ２＝１を基準として分割２を行った場合、改善量算出部１０２ｄは、以下のようにして、分割１および分割２のそれぞれについて、改善量を算出する。なお、図９は、図８におけるレコード群およびＢを切り出したものである。

【0100】

分割１（Ｘ３＝１という条件での分割）について考える。Ｙ１についての分割１前の不純度は０．４８であり、Ｙ１についての分割１後の不純度は０．５であるため、改善量算出部１０２ｄは、分割１前後でのＹ１についての不純度の改善量を、０．４８－０．５＝－０．０２と算出する。同様に、Ｙ２についての分割１前の不純度は０．５３であり、Ｙ２についての分割１後の不純度は０であるため、改善量算出部１０２ｄは、分割１前後でのＹ２についての不純度の改善量を、０．５３－０＝０．５３と算出する。この結果から、Ｘ３＝１という条件での分割は、Ｙ１に対しては効果がないが、Ｙ２に対しては効果があることがわかる。この結果を、図１０に示す。

【0101】

分割２（Ｘ３＝１かつＸ２＝１という条件での分割）について考える。Ｙ１についての分割２前の不純度は０．５であり、Ｙ１についての分割２後の不純度は０であるため、改善量算出部１０２ｄは、分割２前後でのＹ１についての不純度の改善量を、０．５－０＝０．５と算出する。同様に、Ｙ２についての分割２前の不純度は０であり、Ｙ２についての分割２後の不純度は０であるため、改善量算出部１０２ｄは、分割２前後でのＹ２についての不純度の改善量を、０－０＝０と算出する。この結果から、Ｘ３＝１かつＸ２＝１という条件での分割は、Ｙ１に対しては効果があるが、Ｙ２に対しては効果がないことがわかる。この結果を、図１０に示す。

【0102】

このように算出した不純度の改善量を、分割の影響スコアとして保持しておく。

【0103】

（７）分析結果の出力
（６）までの結果から、特徴項目（説明変数）に対する条件と、その際に目的変数がとるべき値のルールを取得することができる。

【0104】

（７－１）条件別（説明変数別）の出力
具体的には、割合算出部１０２ｂは、図８にＣで示すレコード群について、Ｙ１＝２の割合を１／１×１００＝１００％と算出し、Ｙ２＝１の割合も１／１×１００＝１００％と算出する。同様に、割合算出部１０２ｂは、図８にＧで示すレコード群について、Ｙ１＝１の割合を２／２×１００＝１００％と算出し、Ｙ２＝２の割合も２／２×１００＝１００％と算出する。更に同様に、割合算出部１０２ｂは、図８にＩで示すレコード群について、Ｙ１＝１の割合を２／２×１００＝１００％と算出し、Ｙ２＝４の割合も２／２×１００＝１００％と算出する。そして、分析結果出力部１０２ｅは、当該算出の結果を図１１に示すように出力する。図１１に示す出力においては、割合には、学習に使用したデータの割合を示しており、行ごとに重複するデータがないような表示としている。

【0105】

更に、（６）で算出した分割の影響スコアを用いることで、効果の高い条件のみを出力するように選択することもできる。例えば、（６）で説明した分割１および２について考える。仮に、「目的変数に対する不純度の改善量が、０．０５以上のもの」という条件だとする。（６）の分割１で説明したように、Ｘ３＝１という条件での分割では、Ｙ１についての不純度の改善量は－０．０２であり、Ｙ２についての不純度の改善量は０．５３であり、また、（６）の分割２で説明したように、Ｘ３＝１かつＸ２＝１という条件での分割では、Ｙ１についての不純度の改善量は０．５であり、Ｙ２についての不純度の改善量は０であった。このため、前記条件に合致する説明変数および目的変数の組合せは、「Ｘ３＝１およびＹ２」という組合せと、「Ｘ３＝１、Ｘ２＝１およびＹ１」という組合せと、の２つの組合せとなる。

【0106】

分析結果出力部１０２ｅは、前段落で述べた２つの組合せのみを表示する。すなわち、分析結果出力部１０２ｅは、図１２に示すように、Ｘ３＝１のときＹ２＝１の割合が１００％であることを示す行と、Ｘ３＝１かつＸ２＝１のときＹ１＝１の割合が１００％であることを示す行と、を表示する。これにより、ユーザは、意味のある分割がされている目的変数のみを一覧で確認することができる。なお、図１２の表示においては、複数行の条件（複数の説明変数）に該当するようなデータが存在する可能性があるが、（６）での結果を用いない場合と比べ、シンプルな条件（説明変数）および目的変数の組合せをユーザに示すことができる。

【0107】

（７－２）ツリーによる出力
（６）までの結果は、以下のようにして、ツリー（決定木）状で表現することもできる。

【0108】

具体的には、割合算出部１０２ｂは、図８の分析対象データ１０６ａについて、Ｙ１＝１の割合を６／１０×１００＝６０％と算出し、Ｙ２＝２の割合を３／１０×１００＝３０％と算出する。同様に、割合算出部１０２ｂは、図８にＡで示すレコード群について、Ｙ１＝１の割合を１／２×１００＝５０％と算出し、Ｙ２＝１の割合を２／２×１００＝１００％と算出する。更に同様の方法で、割合算出部１０２ｂは、図８にＢ～Ｉで示すレコード群についても、図１３に示すように割合を算出する。そして、分析結果出力部１０２ｅは、当該算出の結果を図１３に示すように表示する。なお、図１３の表においては、目的変数の値として、その条件の場合の（説明変数の値ごとの）最頻値と、当該最頻値が占める割合と、を表記している。

【0109】

更に、分析結果出力部１０２ｅは、目的変数に対する不純度の改善量が大きいもの、または、分割後の不純度が一定値以下のもののみを表示することで、ユーザにとって理解しやすく使いやすい結果表示をすることができる。当該結果表示のツリーのイメージ例を、図１４に示す。当該結果表示をすれば、ユーザは目的変数の値が入力されている箇所にのみ注目すればよく、少ない条件（説明変数）で目的変数の値が決定されるのはどこであるのかを把握することができる。また、条件（説明変数の値）ごとに、目的変数の最頻値およびその値が占める割合をツリーで示すことで、ユーザは、当該結果表示で示されるツリーが確かに図８における分割結果に合致していることを認識することができる。

【0110】

（８）給与システムに対するアルゴリズムの適用例
本項目［３－１］で説明した決定木アルゴリズムは、例えば、以下の［３－２］および［３－３］で説明する、給与システムにおける社員情報の登録および修正処理に適用することができる。

【0111】

本項目［３－１］で説明した説明変数Ｘ１、Ｘ２およびＸ３としては、例えば、社員区分（管理職、一般社員、アルバイト等）、性別、役職、勤務地および資格の有無等の項目を用いることができる。当該項目は、社員の身分を特定するための項目であり、システム外で決定され、システムに入力すべき値が明らかな項目である。

【0112】

本項目［３－１］で説明した目的変数Ｙ１およびＹ２としては、例えば、給与区分、給与支給日区分、労働条件区分、保険種別および各種手当の有無等の項目を用いることができる。当該項目は、前記社員に対する給与についての計算の仕方または支給の仕方を決定するための項目であり、給与の計算のために給与システムの中で使用され、前記説明変数として挙げられた項目や社内のルール等に基づいて判断および入力される項目である。

【0113】

そして、（６）までの分析結果を（７）で説明した表示方法により表示することで、前記目的変数として何を入力するかを提案（サジェスト）できる。これにより、例えば、給与誤支給を防止することができる。

【0114】

［３－２．社員情報の登録処理］
次に、社員情報の登録処理を、図２１～図２８を用いて詳細に説明する。

【0115】

本項目では、（１）まず、定義マスタ１０６ｂの内容を登録するまでの処理を、図２１をベースとして図２３～図２６を参照しつつ説明し、（２）次に、定義マスタ１０６ｂの内容を登録した後に行う社員情報の登録処理を、図２２をベースとして図２７および図２８を参照しつつ説明する。

【0116】

（１）定義マスタ１０６ｂの内容を登録するまでの処理
（１－１）図２１の「分析実行」について
まず、図２１の「分析実行」について詳細に説明する。図２１に示すように、分析実行画面が表示されて「分析実行」されることにより、社員データ１０６ａ１中の既存の大量データが分析システムにより分析されて、分析結果として「画面に同時変更の候補項目が表示」される。前記分析実行画面の例を、図２３に示す。前記分析実行画面において対象年月を指定した上で「実行」が選択されると、当該指定された対象年月に合致する社員データ１０６ａ１中の情報が分析の対象となる。また、前記分析システムは、特に制限されず、例えば、［３－１］で説明した分析方法であってもよいし、これ以外の既知の分析方法であってもよい。

【0117】

（１－２）図２１の「画面に同時変更の候補項目を表示」について
次に、図２１の「画面に同時変更の候補項目を表示」について詳細に説明する。登録候補パターン表示部１０２ｇは、前記分析の結果をパターン登録画面に表示する。具体的には、図２４に示すパターン登録画面においては、左部に示す条件分岐の枝のうち、「社員区分＝一般社員」、「性別＝男」、「職掌＝入力なし」および「業務＝販売登録者」の４つの枝にチェックが付されて選択されている。なお、「全条件集計」は、分析対象の全件の集計結果を表示する項目であり、社員情報および登録定義の分析の場合は、初期値でチェックが入る設定となっている。

【0118】

登録候補パターン表示部１０２ｇは、図２４の左部に示す条件分岐の枝で選択された内容に対し、適合率が９０％以上のスコアの項目を登録対象として識別可能に表示する。すなわち、登録候補パターン表示部１０２ｇは、選択された枝で特定される社員の集合について、同一の給与項目内において占める割合が最も大きい給与項目値を、当該最も大きい割合と併せて、図２４のパターン登録画面に表示する。この際、登録候補パターン表示部１０２ｇは、前記割合が最も大きい給与項目値を、前記最も大きい割合が１００％の場合は斜線のハッチングで、前記最も大きい割合が９０％以上の場合はドットのハッチングで、図２４のパターン登録画面に表示する。つまり、登録候補パターン表示部１０２ｇは、９０％を閾値として表示をするということであるが、当該閾値は、オペレータの設定により任意に変更可能である。

【0119】

具体的には、登録候補パターン表示部１０２ｇは、図２４のＭＡ４に示すように、
●「全条件集計」の枝に対しては、「給与区分＝４、８３％」、「給与支給日区分＝２、８３％」、「賞与支給日区分＝１、９９％」、「労働条件区分＝２、８３％」、「健康保険区分＝０、７０％」、「厚生年金区分＝０、７０％」、「社保徴収区分＝０、１００％」、「社保取得区分＝１、８１％」、「社保損失区分＝０、１００％」、「保険種別＝０、６２％」、「雇用保険区分＝０、６８％」、「労災保険区分＝１、７０％」および「有給付与表区分＝１、５２％」を表示し、これらの中でも、割合が１００％である「社保徴収区分＝０、１００％」および「社保損失区分＝０、１００％」を登録の候補として斜線のハッチングで表示し、割合が９０％以上である「賞与支給日区分＝１、９９％」を登録の候補としてドットのハッチングで表示し（なお、「社保取得区分＝１、８１％」のハッチングは、本処理で付されるものではなく、後述する「項目別調整」からの処理により付されるものである）、
●「社員区分＝一般社員」の枝に対しては、「給与区分＝２、１００％」、「給与支給日区分＝１、１００％」、「労働条件区分＝１、１００％」、「健康保険区分＝１、９９％」、「厚生年金区分＝１、９９％」、「保険種別＝１、８６％」、「雇用保険区分＝１、１００％」、「労災保険区分＝１、１００％」および「有給付与表区分＝１、９５％」を表示し、これらの中でも、割合が１００％である「給与区分＝２、１００％」、「給与支給日区分＝１、１００％」、「労働条件区分＝１、１００％」、「雇用保険区分＝１、１００％」および「労災保険区分＝１、１００％」を登録の候補として斜線のハッチングで表示し、割合が９０％以上である「健康保険区分＝１、９９％」、「厚生年金区分＝１、９９％」および「有給付与表区分＝１、９５％」を登録の候補としてドットのハッチングで表示し、
●「性別＝男」の枝に対しては、割合が９０％以上である「保険種別＝１、９９％」を登録の候補としてドットのハッチングで表示し、
●「業務＝販売登録者」の枝に対しては、割合が９０％以上である「有給付与表区分＝１、９８％」を登録の候補としてドットのハッチングで表示する。
当該表示が意味する所を簡単に説明すると、例えば、「社員区分＝一般社員」かつ「性別＝男」に該当する社員の集合の場合、保険種別が１となる割合は、９９％であるということである。

【0120】

そして、登録候補パターン表示部１０２ｇは、図２４のＭＡ４に登録の候補としてハッチングで表示した給与項目値をそのまま図２４のＭＡ３に表示してもよいが、以下で説明するように、図２４の画面右上にＭＡ２で示す「項目別調整」のボタンからオペレータにより選択された給与項目値のみを図２４のＭＡ３に表示してもよい。

【0121】

（１－３）図２１の「候補から選択」について
最後に、図２１の「候補から選択」について詳細に説明する。図２４の画面右上にＭＡ２で示す「項目別調整」が選択されると、登録候補パターン表示部１０２ｇは、図２４のＭＡ５に示すように、図２４のＭＡ４に表示した給与項目値に対応するチェックボックスを表示する。ここで、登録候補パターン表示部１０２ｇは、図２４のＭＡ４においてハッチングで表示した給与項目値（すなわち、割合が９０％以上の給与項目値）に対応するチェックボックスには、初期値でチェックが入った状態で表示してもよい。具体的には、図２４のＭＡ５においては、登録候補パターン表示部１０２ｇは、「社保徴収区分＝０、１００％」および「社保喪失区分＝０、１００％」の２つに対応するチェックボックスを最初からチェックが入った状態で表示する。なお、図２５のＭＡ５には、実際は、前々段落においてハッチングで表示されると説明したすべての「給与項目＝給与項目値、割合」に対応するチェックボックスが表示されるが、便宜上、一部のみを切り取って表示している。

【0122】

そして、オペレータは、チェックが入ったチェックボックスのチェックを外すことができるし、逆に、チェックが入っていないチェックボックスにチェックを入れることもできる。つまり、オペレータは、任意の給与項目値を選択可能であるということである。図２４のＭＡ５においては、「社保取得区分＝１、８１％」に対応するチェックボックスには最初はチェックが入っていなかったが、オペレータにより、選択されて、チェックが入れられている。なお、登録候補パターン表示部１０２ｇは、選択されているチェックボックスに対応する給与項目値を、図２４のＭＡ５およびＭＡ４に示すように、横線のハッチングで表示してもよい。つまり、登録候補パターン表示部１０２ｇは、適合率が閾値（本例では９０％）を超えている項目や「項目別調整」から選択した項目については、ハッチングにより表示してもよいということである。

【0123】

最終的に、登録候補パターン表示部１０２ｇは、チェックが入れられたチェックボックス（チェックが初期値として入っていたものおよびオペレータによりチェックが入れられたものの両方を含む）に対応する給与項目値を、最終的な登録の候補として、図２４にＭＡ３で示す「選択結果」の箇所に表示する。具体的には、登録候補パターン表示部１０２ｇは、図２４にＭＡ３で示すように、最終的な登録の候補として、「給与区分＝２」、「給与支給日区分＝１」、「賞与支給日区分＝１」、「労働条件区分＝１」、「健康保険区分＝１」、「厚生年金区分＝１」、「社保徴収区分＝０」、「社保取得区分＝１」、「社保喪失区分＝０」、「保険種別＝１」、「雇用保険区分＝１」、「労災保険区分＝１」および「有給付与表区分＝１」というパターンを表示する。

【0124】

そして、図２５のＭＢ１において当該パターンに対して「男性一般社員（販売登録者）」という定義名が設定されて、図２５のＭＢ２における「登録」ボタンが選択されると、パターン登録部１０２ｈは、１つのパターンを定義マスタ１０６ｂに登録する。すなわち、パターン登録部１０２ｈは、条件選択において選択された枝についての身分項目および身分項目値である「社員区分＝一般社員」、「性別＝男」、「職掌＝入力なし」および「業務＝販売登録者」、ならびに、登録候補パターン表示部１０２ｇが最終的な登録の候補として表示した給与項目および給与項目値である「給与区分＝２」、「給与支給日区分＝１」、「賞与支給日区分＝１」、「労働条件区分＝１」、「健康保険区分＝１」、「厚生年金区分＝１」、「社保徴収区分＝０」、「社保取得区分＝１」、「社保喪失区分＝０」、「保険種別＝１」、「雇用保険区分＝１」、「労災保険区分＝１」および「有給付与表区分＝１」から構成されるパターン（以下、「パターン１」という。）を、「定義番号：１００、定義名：男性一般社員（販売登録者）」と定義して、定義マスタ１０６ｂに登録する。

【0125】

なお、図２６の画面（社員情報を登録する画面と同様の構成である）において、当該登録したパターンの確認および編集を行うことができる。具体的には、図２６にＭＣ１で示す箇所において、同時に更新する値を編集可能である。

【0126】

以上（１）で説明してきたように、本実施形態に係る情報処理装置１００によれば、図２４のＭＡ４に斜線とドットのハッチングで示したように、登録の候補となる給与項目値のパターンを割合と併せて表示することができるため、オペレータは、当該表示を参照しつつ、給与項目値のパターンを容易かつ正確に登録することができる。更に、当該表示されたパターンはそのまま図２４のＭＡ３に表示されてもよいが、本実施形態に係る情報処理装置１００においては、図２４にＭＡ２で示す「項目別調整」のボタンを選択することで、項目単位（給与項目値単位）での細かい手動調整（＝チェックを外すまたはチェックを入れる）をした上で、最終的な登録の候補となる給与項目値のパターンを図２４のＭＡ３に表示することもできるので、給与項目値のパターンをオペレータの意思に応じて柔軟に調整した上で登録することもできる。

【0127】

（２）定義マスタ１０６ｂの内容を登録した後に行う社員情報の登録処理
まず、図２２に示すように、事前に設定している社員の登録パターンが選択される。具体的には、図２７の社員情報登録・変更画面に示すようにＭＤ１のボタンが選択されると、図２７の別画面（「登録定義・候補一覧」の画面）に、定義マスタ１０６ｂに登録されている複数の定義が呼び出されて表示される。本例では、図２７にＭＤ２で示すように「定義番号：１００、定義名：男性一般社員（販売登録者）」の定義が指定されて、図２７にＭＤ３で示す「実行」ボタンが押下されるものとする。なお、図２７の社員情報登録・変更画面においては、ＭＤ１のすぐ左に示す空欄に定義番号が直接入力されることにより、定義が指定されてもよい。つまり、定義の指定は、社員情報登録・変更画面とは別画面に表示された複数の定義からの選択によるものであってもよいし、社員情報登録・変更画面への直接入力によるものであってもよい。

【0128】

続いて、図２２に示すように、パターンの内容が初期値として社員情報登録・変更画面に表示される。具体的には、登録候補項目表示部１０２ｉは、定義マスタ１０６ｂから、前記指定された定義「定義番号：１００、定義名：男性一般社員（販売登録者）」と紐付くパターンとして、前記パターン１（身分項目および身分項目値ならびに給与項目および給与項目値から構成される。詳細は、（１－３）を参照。）についての前記項目および前記値を取得する。そして、登録候補項目表示部１０２ｉは、図２８のＭＥ２に示すように、当該取得した身分項目「社員区分」についての当該取得した身分項目値「２（正社員）」、当該取得した給与項目「給与区分」についての当該取得した給与項目値「２」、当該取得した給与項目「給与支給日区分」についての当該取得した給与項目値「１」および当該取得した給与項目「賞与支給日区分」についての当該取得した給与項目値「１」を、新規登録の候補として社員情報登録・変更画面に表示する。言い換えると、図２８のＭＥ２には、パターンの内容通りの項目が自動で設定される。なお、図２８にＭＥ１で示す箇所は、個人で入力が必要な部分であるために、社員ごとに異なった情報が入力される。

【0129】

最後に、図２２に示すように、社員情報登録・変更画面に表示された内容が、社員情報として社員データ１０６ａ１に登録される。具体的には、図２８にＭＥ３で示す「登録」ボタンが押下されると、図２８の社員情報登録・変更画面に表示されている社員の情報である「氏名、氏名カナ、性別：男、生年月日、入社年月日、社員区分：２（正社員）、給与区分：２、給与支給日区分：１、および賞与支給日区分：１」が、社員データ１０６ａ１に登録される。

【0130】

以上（２）で説明してきたように、本実施形態に係る情報処理装置１００によれば、オペレータが社員情報登録・変更画面において定義を指定するのみで、図２８のＭＥ２に示すように、社員情報（身分項目値および給与項目値）の登録の候補を表示することができるため、オペレータは、社員情報を１から入力する必要がなくなり、結果として、容易かつ正確な社員情報の登録が可能となる。

【0131】

［３－３．社員情報の変更処理］
最後に、社員情報の変更処理を、図２１および図３３～図３９を用いて詳細に説明する。

【0132】

本項目では、（１）まず、定義マスタ１０６ｂの内容を登録するまでの処理を、図２１をベースとして図３４～図３６を参照しつつ説明し、（２）次に、定義マスタ１０６ｂの内容を登録した後に行う社員情報の変更処理を、図３３をベースとして図３７～図３９を参照しつつ説明する。

【0133】

（１）定義マスタ１０６ｂの内容を登録するまでの処理
定義マスタ１０６ｂの内容を登録するまでの処理内容は、［３－２］の（１）と同様であるため、詳細な説明を省略し、異なる点のみ簡潔に説明する。

【0134】

図３４に示すパターン登録画面においては、左部に示す条件分岐の枝のうち、「社員区分＝アルバイト」、「職掌＝入力なし」、「性別＝女」および「業務＝販売登録者」の４つの枝にチェックが付されて選択されている。

【0135】

登録候補パターン表示部１０２ｇは、図３４のＭＦ４に示すように、
●「社員区分＝アルバイト」の枝に対しては、「給与区分＝４、１００％」、「給与支給日区分＝２、１００％」、「労働条件区分＝４、１００％」、「健康保険区分＝０、８０％」、「厚生年金区分＝０、８０％」、「保険種別＝０、６８％」、「雇用保険区分＝１、７８％」および「労災保険区分＝１、８０％」を表示し、これらの中でも、割合が１００％である「給与区分＝４、１００％」、「給与支給日区分＝２、１００％」および「労働条件区分＝４、１００％」を登録の候補として斜線のハッチングで表示し、
●「性別＝女」の枝に対しては、「保険種別＝２、５３％」を表示し、
●「業務＝販売登録者」の枝に対しては、「保険種別＝２、９４％」、「雇用保険区分＝１、１００％」、「労災保険区分＝１、１００％」および「有給付与表区分＝７、８２％」を表示し、これらの中でも、割合が１００％である「雇用保険区分＝１、１００％」および「労災保険区分＝１、１００％」を登録の候補として斜線のハッチングで表示し、割合が９０％以上である「保険種別＝２、９４％」を登録の候補としてドットのハッチングで表示する。

【0136】

そして、登録候補パターン表示部１０２ｇは、図３４のＭＦ４に登録の候補としてハッチングで表示した給与項目値をそのまま図３４のＭＦ３に表示してもよいが、以下で説明するように、図３４の画面右上にＭＦ２で示す「項目別調整」のボタンからオペレータにより選択された給与項目値のみを図３４のＭＦ３に表示してもよい。

【0137】

最終的に、登録候補パターン表示部１０２ｇが図３４のＭＦ３に表示したパターンに対して、図３５のＭＧ１に示すように「女性アルバイト社員（販売登録者）」という定義名が設定されて、図３５のＭＧ２における「登録」ボタンが選択されると、パターン登録部１０２ｈは、１つのパターンを定義マスタ１０６ｂに登録する。すなわち、パターン登録部１０２ｈは、条件選択において選択された枝についての身分項目および身分項目値である「社員区分＝１０（アルバイト）」、「職掌＝入力なし」、「性別＝女」および「業務＝販売登録者」、ならびに、登録候補パターン表示部１０２ｇが最終的な登録の候補として表示した給与項目および給与項目値である「給与区分＝４」、「給与支給日区分＝２」、「労働条件区分＝４」、「保険種別＝２」、「雇用保険区分＝１」および「労災保険区分＝１」から構成されるパターン（以下、「パターン２」という。）を、「定義番号：７００、定義名：女性アルバイト社員（販売登録者）」と定義して、定義マスタ１０６ｂに登録する。

【0138】

なお、図３６の定義情報登録・変更画面において、当該登録したパターンの確認および編集を行うことができる。具体的には、図３６にＭＨ１で示す箇所において、同時に更新する値を編集可能である。

【0139】

（２）定義マスタ１０６ｂの内容を登録した後に行う社員情報の変更処理
まず、図３３に示すように、社員データ１０６ａ１を参照して、社員情報が表示される。具体的には、図３７の社員情報登録・変更画面において社員コードとして「1000000001」が指定されると、社員データ１０６ａ１から社員コード「1000000001」の社員情報が自動取得されて、図３７に示すように表示される。

【0140】

続いて、図３３に示すように、社員区分が手動で変更される。具体的には、図３７のＭＩ１に示すように、社員区分が「４（正社員）」から「１０（アルバイト）」に変更される。

【0141】

当該変更が行われると、図３３に示すように、定義マスタ１０６ｂを参照して同時変更候補項目がないか確認され、画面に同時変更のパターンが表示される。具体的には、前段落で説明した社員区分「４」から「１０」への変更が行われると、パターン定義表示部１０２ｊは、定義マスタ１０６ｂから、変更の対象となった身分項目「社員区分」および変更後の身分項目値「１０」と紐付く定義名として、「女性アルバイト社員（販売登録者）」および「嘱託社員（資格未取得者）」を取得する。そして、パターン定義表示部１０２ｊは、図３８の上画面に示すように、当該取得した定義名「女性アルバイト社員（販売登録者）」を、これと紐付く身分項目および身分項目値（社員区分：１０、職掌：－１、性別：２、業務：７０）と併せて表示し、また、当該取得した定義名「嘱託社員（資格未取得者）を、これと紐付く身分項目および身分項目値（社員区分：１０、給与区分：１、勤務地：－１、資格：ＮＯＴ７０、職種：１０）と併せて表示する。このように、パターン定義表示部１０２ｊは、図３８の上画面の「条件項目」の列に、変更項目が含まれる定義を表示するが、分析結果の適合率に従い、表示順を変更することも可能である。

【0142】

なお、図３８の上画面にＭＪ２で示す「確認」が選択されると、図３８の下部に示す定義情報登録・変更画面（定義を登録した際の画面）において社員情報を確認できる。

【0143】

最後に、図３３に戻り、特定のパターンが選択されることで、当該選択されたパターンに該当する複数項目を同時に自動で変更し、社員データ１０６ａ１の内容を更新することが可能である。具体的には、図３８の上画面にＭＪ３で示す「実行」が選択されることにより、定義名「女性アルバイト社員（販売登録者）」が指定されると、変更候補項目表示部１０２ｋは、定義マスタ１０６ｂから、当該指定された定義名「女性アルバイト社員（販売登録者）」と紐付くパターンとして、前記パターン２（身分項目および身分項目値ならびに給与項目および給与項目値から構成される。詳細は、（１）を参照。）についての前記項目および前記値を取得する。そして、変更候補項目表示部１０２ｋは、図３９のＭＫ１に示すように、当該取得した給与項目「給与区分」についての当該取得した給与項目値「４」および当該取得した給与項目「給与支給日区分」についての当該取得した給与項目値「２」を、変更の候補として社員情報登録・変更画面に表示する。言い換えると、変更候補項目表示部１０２ｋは、定義のセット項目（＝図３９にＭＫ２で示す）を自動で変更するのみならず、今回変更した条件項目以外の残りの項目（図３９にＭＫ３で示す）も変更する必要があるはずなので、補完して自動で変更することができる。そして、当該変更した社員情報を社員データ１０６ａ１に登録すれば、社員コード「1000000001」の社員の社員情報を、正社員用のものからアルバイト用のものへと更新することができる。

【0144】

以上（２）で説明してきたように、本実施形態に係る情報処理装置１００によれば、オペレータが社員情報登録・変更画面において社員区分を「４（正社員）」から「１０（アルバイト）」に変更するのみで、図３９のＭＫ１に示すように、給与区分を「１」から「４」に自動変更し、給与支給日区分を「１」から「２」に自動変更して、変更の候補を表示することができた。すなわち、本実施形態に係る情報処理装置１００によれば、社員情報を変更する際に、オペレータは、ある１つの項目のみを変更すればよく他の項目（通常は膨大な項目数がある）を変更する必要がない。結果として、容易かつ正確な社員情報の変更が可能となる。

【0145】

（３）社員情報の変更のその他の活用例
以上、（１）および（２）において、社員の情報を変更するシーンとして「身分変更」を例にとって説明をしたが、本実施形態に係る社員情報の変更は、例えば、以下のようなシーンにおいても活用可能である。

【0146】

一つ目の例としては、「所属の異動」が挙げられる。所属部署の変更により、社員の取り扱いが変わる場合があるため、同時に変更すべき項目があると想定されるためである。

【0147】

二つ目の例としては、「勤務地の変更」が挙げられる。勤務する場所により特有の手当（寒冷地手当）などが存在するため、同時に変更すべき項目があると想定されるためである。

【0148】

三つ目の例としては、「育児休業・産前産後休業などの休業」が挙げられる。手当が発生しなくなる、または、特別な手当が発生するというような特別な取り扱いが会社の独特なルールとして存在するため、同時に変更すべき項目があると想定されるためである。また、社会保険の免状により、システムで管理している複数の項目を変更する必要があるためである。

【0149】

［４．本実施形態のまとめ］
［４－１．決定木のまとめ］
このように、本実施形態に係る情報処理装置１００によれば、［１－１］および［３－１］で説明したように、分析対象となるデータが複数の目的変数を含む場合においても１つの分析結果としてまとめて出力可能な態様でデータ分析できる。

【0150】

ここで、項目のルールを分析するアルゴリズムとしては、決定木アルゴリズムが知られているが、既存の決定木アルゴリズムでは、複数の目的変数を扱うことができなかったため、本実施形態においては、この点を改良し、複数の目的変数を扱えるようにした。また、本実施形態においては、例えば、どの項目（どの説明変数）の値がどの項目（どの目的変数）の値の決定に影響を与えているかをスコア化することで、利用者にとって意味が解釈しやすい表示を可能とした。本実施形態に係る決定木アルゴリズムは、例えば、以下のような場面において利用可能である。

【0151】

例えば、業務データの登録時に、ある項目を変更したら他の項目も併せて変える必要があることがある。本実施形態においては、この項目間のルールを既存のデータから導き出せるようにした。具体的には、既存の決定木アルゴリズムを改良することで、項目間（前記ある項目と前記他の項目の間）のルールをシンプルに提示することを実現した。また、例えば、個社ごとに運用ルールが様々であるまたは明確ではない場合、システムでの事前設定が難しいことがある。本実施形態においては、既存のデータを用いてルールを導出することで、以降の入力時のサポートやチェックに使用することができ、結果として、入力ミスの軽減や入力効率の向上に繋がる。

【0152】

［４－２．社員情報の登録および変更のまとめ］
このように、本実施形態に係る情報処理装置１００によれば、［１－２］、［３－２］および［３－３］で説明したように、身分項目値（例えば、社員区分は正社員かアルバイトか、性別は男か女か等）をオペレータが選択するのみで、当該選択された身分項目値に対して登録するべき給与項目値（例えば、給与区分は何か、保険種別は何か、雇用保険区分は何か等）のパターンの候補を画面上に表示することにより、前記パターンの登録の業務を支援できる。

【0153】

ここで、給与を計算する際に設定（すなわち新規登録）すべき社員の情報には、膨大な項目数がある。また、項目を１つ変更する際には、給与規定により、同時に変更すべき項目が多数存在することが多い。しかしながら、給与規定は会社ごとに異なることが多いため、従来においては、システム上で項目の新規登録および変更を行うことはできなかった。このため、手作業により、項目の新規登録および変更を行う必要があり、登録漏れ、登録ミス、変更漏れおよび変更ミス等が度々発生していた。

【0154】

そこで、本実施形態においては、例えば、システムに登録された大量の社員データを例えばＡＩ分析することで、社員情報の値の登録および変更時に、登録すべき項目および変更すべき項目を提案できるようにした。このように、自社の給与規定に沿った登録および変更の内容をシステムが提案することにより、例えば、登録漏れ、登録ミス、変更漏れおよび変更ミス等を未然に防ぎ、給与の誤支給を防止することができる。更に、例えば、登録作業および変更作業を容易にすることもできる。

【0155】

［５．他の実施形態］
本発明は、上述した実施形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。

【0156】

例えば、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。

【0157】

また、本明細書中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。

【0158】

また、情報処理装置１００に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。

【0159】

例えば、情報処理装置１００が備える処理機能、特に制御部にて行われる各処理機能については、その全部または任意の一部を、ＣＰＵおよび当該ＣＰＵにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、本実施形態で説明した処理を情報処理装置に実行させるためのプログラム化された命令を含む一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて情報処理装置１００に機械的に読み取られる。すなわち、ＲＯＭまたはＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）などの記憶部などには、ＯＳと協働してＣＰＵに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、ＲＡＭにロードされることによって実行され、ＣＰＵと協働して制御部を構成する。

【0160】

また、このコンピュータプログラムは、情報処理装置１００に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。

【0161】

また、本実施形態で説明した処理を実行するためのプログラムを、一時的でないコンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリ、ＳＤ（ＳｅｃｕｒｅＤｉｇｉｔａｌ）カード、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＥＰＲＯＭ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＥＥＰＲＯＭ（登録商標）（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅａｎｄＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＣＤ－ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｋＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＭＯ（Ｍａｇｎｅｔｏ－Ｏｐｔｉｃａｌｄｉｓｋ）、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）、および、Ｂｌｕ－ｒａｙ（登録商標）Ｄｉｓｃ等の任意の「可搬用の物理媒体」を含むものとする。

【0162】

また、「プログラム」とは、任意の言語または記述方法にて記述されたデータ処理方法であり、ソースコードまたはバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、ＯＳに代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成および読み取り手順ならびに読み取り後のインストール手順等については、周知の構成や手順を用いることができる。

【0163】

記憶部に格納される各種のデータベース等は、ＲＡＭ、ＲＯＭ等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。

【0164】

また、情報処理装置１００は、既知のパーソナルコンピュータまたはワークステーション等の情報処理装置として構成してもよく、また、任意の周辺装置が接続された当該情報処理装置として構成してもよい。また、情報処理装置１００は、当該装置に本実施形態で説明した処理を実現させるソフトウェア（プログラムまたはデータ等を含む）を実装することにより実現してもよい。

【0165】

更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じてまたは機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。

【産業上の利用可能性】

【0166】

本発明は、あらゆる業界および業種において有用であるが、特に、給与の支払を管理する分野においては極めて有用である。

【符号の説明】

【0167】

１００情報処理装置
１０２制御部
１０２ａレコード分割部
１０２ｂ割合算出部
１０２ｃ分析結果作成部
１０２ｄ改善量算出部
１０２ｅ分析結果出力部
１０２ｆ不純度算出部
１０２ｇ登録候補パターン表示部
１０２ｈパターン登録部
１０２ｉ登録候補項目表示部
１０２ｊパターン定義表示部
１０２ｋ変更候補項目表示部
１０４通信インターフェース部
１０６記憶部
１０６ａ分析対象データ
１０６ａ１社員データ
１０６ｂ自動更新定義マスタ
１０６ｃ社員区分マスタ
１０６ｄ給与区分マスタ
１０６ｅ役職マスタ
１０６ｆ等級マスタ
１０６ｇ職種マスタ
１０６ｈ勤務地マスタ
１０６ｉ計算定義マスタ
１０８入出力インターフェース部
１１２入力装置
１１４出力装置
２００サーバ
３００ネットワーク

【図1】