(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024106283
(43)【公開日】2024-08-07
(54)【発明の名称】習熟度推定方法および習熟度推定プログラム
(51)【国際特許分類】
G06Q 10/0639 20230101AFI20240731BHJP
【FI】
G06Q10/0639
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023010549
(22)【出願日】2023-01-26
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100104190
【弁理士】
【氏名又は名称】酒井 昭徳
(72)【発明者】
【氏名】宮本 晶規
【テーマコード(参考)】
5L010
5L049
【Fターム(参考)】
5L010AA06
5L049AA06
(57)【要約】
【課題】作業者の習熟度の推定精度を向上させること。
【解決手段】習熟度推定装置は、候補グループ数(2,3,…,10)の各候補グループ数について、複数の案件データ710を特徴量に基づき候補グループ数のグループに分類する。習熟度推定装置は、各候補グループ数について、分類した各候補グループ数のグループに含まれるグループごとの特性曲線モデルCvと、各職員A,B,Cの習熟度θとを算出する。習熟度推定装置は、各候補グループ数について、グループごとの特性曲線モデルCvから特定されるトライ数の推定値と、当該グループ内の案件データ710が表すトライ数の実測値との誤差を評価することにより、誤差評価値V[2]~V[10]を算出する。習熟度推定装置は、候補グループ数(2,3,…,10)のうち、誤差評価値が最小となる候補グループ数のグループについて算出した各職員A,B,Cの習熟度θを出力する。
【選択図】
図7
【特許請求の範囲】
【請求項1】
各作業者が処理した案件の特徴量と前記案件の処理にかかる作業量の実測値とをそれぞれ表す複数の案件データを取得し、
複数の異なる候補グループ数それぞれについて、取得した前記複数の案件データを前記特徴量に基づき前記候補グループ数のグループに分類し、
分類した前記候補グループ数のグループに含まれるグループ内の案件データが表す前記作業量の実測値に基づいて、作業者の習熟度と案件の処理にかかる作業量との関係を表す特性曲線モデルに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、
算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、当該グループ内の案件データが表す前記作業量の実測値との誤差を評価し、
前記複数の異なる候補グループ数のうち、評価した前記誤差が最小となる候補グループ数のグループについて算出した前記各作業者の習熟度を出力する、
処理をコンピュータが実行することを特徴とする習熟度推定方法。
【請求項2】
取得した前記複数の案件データを、訓練データとテストデータとに分割する、処理を前記コンピュータが実行し、
前記分類する処理は、
前記複数の異なる候補グループ数それぞれについて、分割した前記訓練データを前記特徴量に基づき前記候補グループ数のグループに分類し、
前記算出する処理は、
分類した前記候補グループ数のグループに含まれるグループ内の訓練データが表す前記作業量の実測値に基づいて、前記フィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、
前記評価する処理は、
算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、分割したテストデータのうち、当該グループに分類されるテストデータが表す前記作業量の実測値との誤差を評価する、
ことを特徴とする請求項1に記載の習熟度推定方法。
【請求項3】
分類した前記候補グループ数のグループに含まれるグループ内の案件データを、訓練データとテストデータとに分割する、処理を前記コンピュータが実行し、
前記算出する処理は、
分類した前記候補グループ数のグループに含まれるグループ内の案件データのうち、分割した前記訓練データが表す前記作業量の実測値に基づいて、前記フィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、
前記評価する処理は、
算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、当該グループ内の案件データのうち、分割した前記テストデータが表す前記作業量の実測値との誤差を評価する、
ことを特徴とする請求項1に記載の習熟度推定方法。
【請求項4】
前記分類する処理は、
前記作業量を目的変数とし、前記特徴量を説明変数として、取得した前記複数の案件データを回帰木により複数のリーフに分類し、
前記複数のリーフそれぞれについて、前記リーフに属する案件データが表す前記特徴量と前記作業量の実測値とに基づいて、前記リーフの座標を算出し、
前記複数の異なる候補グループ数それぞれについて、算出した前記リーフの座標に基づいて、前記複数のリーフを前記候補グループ数のグループに分類し、
前記算出する処理は、
分類した前記候補グループ数のグループに含まれるグループ内のリーフが表す前記作業量の実測値に基づいて、前記フィッティングを行うことにより、当該グループごとの前記特性曲線モデルと、前記各作業者の習熟度とを算出し、
前記評価する処理は、
算出した前記グループごとの前記特性曲線モデルから特定される前記作業量の推定値と、当該グループ内のリーフが表す前記作業量の実測値との誤差を評価する、
ことを特徴とする請求項1に記載の習熟度推定方法。
【請求項5】
各作業者が処理した案件の特徴量と前記案件の処理にかかる作業量の実測値とをそれぞれ表す複数の案件データを取得し、
複数の異なる候補グループ数それぞれについて、取得した前記複数の案件データを前記特徴量に基づき前記候補グループ数のグループに分類し、
分類した前記候補グループ数のグループに含まれるグループ内の案件データが表す前記作業量の実測値に基づいて、作業者の習熟度と案件の処理にかかる作業量との関係を表す特性曲線モデルに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、
算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、当該グループ内の案件データが表す前記作業量の実測値との誤差を評価し、
前記複数の異なる候補グループ数のうち、評価した前記誤差が最小となる候補グループ数のグループについて算出した前記各作業者の習熟度を出力する、
処理をコンピュータに実行させることを特徴とする習熟度推定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、習熟度推定方法および習熟度推定プログラムに関する。
【背景技術】
【0002】
近年、AI(Artificial Intelligence)による業務支援や教育支援により、人手不足を補ったり、成長促進したりすることが求められている。例えば、職員の業務支援や教育支援のために、業務中の処理データから職員の習熟度を推定したい場合がある。
【0003】
先行技術としては、スポーツをプレーするユーザのモーションに基づいて定義されたプレーイベントを示すデータを取得し、プレーイベントの中から同じ種類に分類される複数のプレーイベントを抽出し、抽出された複数のプレーイベントを示すデータを解析するものがある。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術では、業務中に職員が処理した業務案件などのデータから、職員の習熟度を精度よく推定することが難しい。
【0006】
一つの側面では、本発明は、作業者の習熟度の推定精度を向上させることを目的とする。
【課題を解決するための手段】
【0007】
1つの実施態様では、各作業者が処理した案件の特徴量と前記案件の処理にかかった作業量の実測値とをそれぞれ表す複数の案件データを取得し、複数の異なる候補グループ数それぞれについて、取得した前記複数の案件データを前記特徴量に基づき前記候補グループ数のグループに分類し、分類した前記候補グループ数のグループに含まれるグループ内の案件データが表す前記作業量の実測値に基づいて、作業者の習熟度と案件の処理にかかる作業量との関係を表す特性曲線モデルに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、当該グループ内の案件データが表す前記作業量の実測値との誤差を評価し、前記複数の異なる候補グループ数のうち、評価した前記誤差が最小となる候補グループ数のグループについて算出した前記各作業者の習熟度を出力する、習熟度推定方法が提供される。
【発明の効果】
【0008】
本発明の一側面によれば、作業者の習熟度の推定精度を向上させることができるという効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施の形態1にかかる習熟度推定方法の一実施例を示す説明図である。
【
図2】
図2は、情報処理システム200のシステム構成例を示す説明図である。
【
図3】
図3は、習熟度推定装置201のハードウェア構成例を示すブロック図である。
【
図4】
図4は、案件データDB220の記憶内容の一例を示す説明図である。
【
図5】
図5は、実施の形態1にかかる習熟度推定装置201の機能的構成例を示すブロック図である。
【
図6】
図6は、誤差評価用テーブル600の記憶内容の一例を示す説明図である。
【
図7】
図7は、実施の形態1にかかる習熟度推定装置201の動作例を示す説明図である。
【
図8A】
図8Aは、グループ1の職員別のトライ数分布を示す説明図である。
【
図8B】
図8Bは、グループ2の職員別のトライ数分布を示す説明図である。
【
図9A】
図9Aは、グループ1のフィッティング結果を示す説明図である。
【
図9B】
図9Bは、グループ2のフィッティング結果を示す説明図である。
【
図10】
図10は、実施の形態1にかかる習熟度推定装置201の習熟度推定処理手順の一例を示すフローチャートである。
【
図11】
図11は、実施の形態2にかかる習熟度推定装置201の動作例を示す説明図である。
【
図12】
図12は、実施の形態2にかかる習熟度推定装置201の習熟度推定処理手順の一例を示すフローチャートである。
【
図13】
図13は、実施の形態3にかかる習熟度推定装置201の動作例を示す説明図である。
【
図14】
図14は、実施の形態3にかかる習熟度推定装置201の習熟度推定処理手順の一例を示すフローチャートである。
【
図15】
図15は、実施の形態4にかかる習熟度推定装置201の動作例を示す説明図である。
【
図16】
図16は、リーフのグループ分け例を示す説明図である。
【
図17】
図17は、実施の形態4にかかる習熟度推定装置201の習熟度推定処理手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下に図面を参照して、本発明にかかる習熟度推定方法および習熟度推定プログラムの実施の形態を詳細に説明する。
【0011】
(実施の形態1)
図1は、実施の形態1にかかる習熟度推定方法の一実施例を示す説明図である。
図1において、情報処理装置101は、作業者の習熟度を推定するコンピュータである。作業者は、習熟度の推定対象となる者である。作業者は、案件を処理する。案件は、処理すべき事柄(作業、仕事)である。作業者は、例えば、企業や役所などの職員である。
【0012】
習熟度は、習熟の度合いである。習熟度は、例えば、職務を遂行する能力の高さを表す。業務支援や教育支援のためには、個人の習熟度(能力)を把握することが重要となる。例えば、職員の業務支援や教育支援を行うにあたり、職員の習熟度を把握できていないと、職員にあった適切な案件を割り振ったり、適切な支援を行ったりすることが難しい。
【0013】
ここで、職員が案件を完了するまでにかかった作業時間などから、職員の習熟度を推定することが考えられる。例えば、各職員が過去に処理した案件の平均作業時間に基づいて、各職員の習熟度を推定することが考えられる。ところが、案件によって、その難易度が異なる場合があり、易しい案件を多く担当した職員が、難しい案件を多く担当した職員に比べて、習熟度が高く推定されるという問題がある。
【0014】
このため、案件を過去の作業時間などに応じてグループ分けして、習熟度と作業量との関係をグループごとに捉えることが考えられる。しかし、従来技術では、一般的にグループ分けの実行時に、グループ数(グループの個数)を自動的に決定することができず、人手によりグループ数を指定していた。
【0015】
例えば、特徴量の近いデータ同士をまとめて、クラスタ(グループ)に分けるクラスタリングと呼ばれる技術がある。クラスタリング手法としては、k-means法、凝集型クラスタリングなどがある。既存のクラスタリング手法では、事前にユーザがクラスタ数(グループ数)を指定することになる。
【0016】
ところが、人手により適切なグループ数を判断することは難しい。グループ数を適切に判断できないと、職員の習熟度を精度よく推定することができない。例えば、グループ数が少ないと、本来別の難易度を持つものが1つに混ざることが起きて、混ざった案件の中で、易しい案件をたまたま多く処理した人の習熟度が実際より高く推定されるといった問題が生じる。また、グループ数が多いと、本来1つの特性のグループを、2つ、3つに分割することになり、グループ内のデータ数が少なくなる。データにはばらつきが含まれるため、グループ内のデータ数が少ないほど、習熟度の推定精度の低下を招く。
【0017】
そこで、本実施の形態では、複数の異なる候補グループ数の中から、適切な候補グループ数を判断して、作業者の習熟度の推定精度を向上させる習熟度推定方法について説明する。ここで、情報処理装置101の処理例について説明する。
【0018】
(1)情報処理装置101は、複数の案件データ110を取得する。ここで、案件データ110は、各作業者が処理した案件の特徴量と、案件の処理にかかる作業量の実測値とを表す。特徴量は、案件の特徴を表す情報である。特徴量は、案件を処理する前に特定可能な情報である。
【0019】
自治体での住民税賦課業務を例に挙げると、案件は、個人に対して住民税を割り当てて負担させる作業に相当する。この場合、案件の特徴量は、例えば、対象者が給与所得者であるか否かの情報や、対象者の世帯人数、所得の数などを表す情報である。
【0020】
作業量は、案件を処理する作業者の習熟度によって増減する値である。習熟度が高いほど、作業量は少なくなり、習熟度が低いほど、作業量は多くなる傾向がある。作業量は、例えば、案件の処理にかかった作業時間によって表される。また、作業量は、案件の処理に要した作業の回数によって表されてもよい。案件データ110には、作業者を識別する識別情報が含まれる。
【0021】
(2)情報処理装置101は、複数の異なる候補グループ数それぞれについて、取得した複数の案件データ110を特徴量に基づき候補グループ数のグループに分類する。ここで、候補グループ数は、分類するグループの個数の候補である。複数の異なる候補グループ数は、任意に設定可能である。
【0022】
複数の異なる候補グループ数は、例えば、「2,3,4,5,6,7,8,9,10」などに設定される。具体的には、例えば、情報処理装置101は、既存のクラスタリング手法により、各案件データ110が表す案件の特徴量に基づいて、複数の案件データ110を各候補グループ数のグループに分類する。
【0023】
図1の例では、複数の異なる候補グループ数を、「2,3,4」とする。この場合、情報処理装置101は、候補グループ数「2」について、複数の案件データ110を2つのグループに分類する。また、情報処理装置101は、候補グループ数「3」について、複数の案件データ110を3つのグループに分類する。また、情報処理装置101は、候補グループ数「4」について、複数の案件データ110を4つのグループに分類する。
【0024】
(3)情報処理装置101は、分類した候補グループ数のグループに含まれるグループ内の案件データ110が表す作業量の実測値に基づいて、特性曲線モデルに対するフィッティングを行う。フィッティングとは、回帰分析や内挿(補完)などの技術を用いて、データに当てはまるような曲線を求めることである(曲線あてはめ)。これにより、情報処理装置101は、候補グループ数のグループに含まれるグループごとの特性曲線モデルと、各作業者の習熟度とを算出する。
【0025】
ここで、特性曲線モデルは、作業者の習熟度と案件の処理にかかる作業量との関係を表す。特性曲線モデルは、例えば、案件の処理にかかる作業量を、作業者の習熟度の2次式によって表す右下がりの2次曲線(2次関数)である。特性曲線モデルは、グループごとに算出される。一方、各作業者の習熟度は、候補グループ数のグループを通して同一の値である。
【0026】
具体的には、例えば、情報処理装置101は、作業者の習熟度と、特性曲線モデル(2次関数)の各項の係数をパラメータとして、パラメータの値を調節することにより、グループ内の案件データ110が表す作業量の実測値に当てはまるような特性曲線モデルを作成する。この際、情報処理装置101は、案件の処理にかかる作業量が多いほど、作業者の習熟度が低くなるような条件の下で、パラメータの値を調節する。
【0027】
図1の例では、情報処理装置101は、候補グループ数「2」のグループについて、2つのグループそれぞれの特性曲線モデルと、各作業者の習熟度とを算出する。また、情報処理装置101は、候補グループ数「3」のグループについて、3つのグループそれぞれの特性曲線モデルと、各作業者の習熟度とを算出する。また、情報処理装置101は、候補グループ数「4」のグループについて、4つのグループそれぞれの特性曲線モデルと、各作業者の習熟度とを算出する。
【0028】
(4)情報処理装置101は、算出したグループごとの特性曲線モデルから特定される作業量の推定値と、当該グループ内の案件データ110が表す作業量の実測値との誤差を評価する。誤差は、特性曲線モデルにより推定される作業量と、案件データ110が表す実測された作業量との差に相当する。
【0029】
ここで、候補グループ数「2」のグループを例に挙げて、誤差の評価例について説明する。ここでは、誤差の評価を「誤差評価値」を算出することとする。また、候補グループ数「2」のグループを「グループg1,g2」と表記し、グループg1,g2の特性曲線モデルを「特性曲線モデルCv1,Cv2」と表記し、作業者の習熟度を「習熟度θ(2)」と表記する。なお、習熟度θ(2)は、候補グループ数「2」における作業者ごとの習熟度を表すものとする。
【0030】
まず、情報処理装置101は、算出したグループg1の特性曲線モデルCv1と各作業者の習熟度θ(2)とから、各作業者の作業量の推定値を特定する。また、情報処理装置101は、特定した各作業者の作業量の推定値と、グループg1内の案件データ110が表す各作業者の作業量の実測値との誤差(グループg1内の案件データ110の数分の誤差)を累計することにより、グループg1の誤差の合計値を算出する。なお、作業量の推定値と実測値との誤差は、例えば、2乗誤差によって表される。
【0031】
同様に、情報処理装置101は、算出したグループg2の特性曲線モデルCv2と各作業者の習熟度θ(2)とから、各作業者の作業量の推定値を特定する。また、情報処理装置101は、特定した各作業者の作業量の推定値と、グループg2内の案件データ110が表す各作業者の作業量の実測値との誤差(グループg2内の案件データ110の数分の誤差)を累計することにより、グループg2の誤差の合計値を算出する。そして、情報処理装置101は、候補グループ数「2」のグループについて、算出したグループg1,g2ごとの誤差の合計値を足し合わせることにより、誤差評価値を算出する。
【0032】
図1の例では、候補グループ数「2」のグループについての誤差評価値と、候補グループ数「3」のグループについての誤差評価値と、候補グループ数「4」のグループについての誤差評価値とが算出される。
【0033】
(5)情報処理装置101は、複数の異なる候補グループ数のうち、評価した誤差が最小となる候補グループ数のグループについて算出した各作業者の習熟度を出力する。評価した誤差が最小となる候補グループ数のグループとは、例えば、誤差評価値が最小となる候補グループ数のグループである。
【0034】
図1の例では、候補グループ数「2,3,4」のグループそれぞれの誤差評価値のうち、候補グループ数「2」のグループの誤差評価値が最小であるとする。この場合、情報処理装置101は、候補グループ数「2」のグループについて算出した各作業者の習熟度θ(2)を、習熟度推定結果120として出力する。
【0035】
このように、情報処理装置101によれば、複数の異なる候補グループ数のそれぞれについて、各作業者の習熟度と案件の処理にかかる作業量との関係をグループごとに捉えることができる。そして、情報処理装置101によれば、複数の異なる候補グループ数の中から、案件の処理にかかる作業量について、特性曲線による推定値と実測値との誤差が最も小さい候補グループ数を選択することができる。
【0036】
これにより、情報処理装置101は、各作業者の習熟度を精度よく推定することができる。
図1の例では、情報処理装置101は、候補グループ数「2,3,4」のうち、案件の処理にかかる作業量について、特性曲線による推定値と実測値との誤差が最も小さい候補グループ数「2」を選択することで、各作業者の習熟度の推定精度を向上させることができる。
【0037】
(情報処理システム200のシステム構成例)
つぎに、
図1に示した情報処理装置101を含む情報処理システム200のシステム構成例について説明する。ここでは、
図1に示した情報処理装置101を、情報処理システム200内の習熟度推定装置201に適用した場合を例に挙げて説明する。情報処理システム200は、例えば、組織における個人の業務や教育を支援するコンピュータシステムに適用される。
【0038】
図2は、情報処理システム200のシステム構成例を示す説明図である。
図2において、情報処理システム200は、習熟度推定装置201と、ユーザ端末202と、を含む。情報処理システム200において、習熟度推定装置201およびユーザ端末202は、有線または無線のネットワーク210を介して接続される。ネットワーク210は、例えば、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)などである。
【0039】
ここで、習熟度推定装置201は、案件データDB(Database)220を有し、作業者の習熟度を推定するコンピュータである。案件データDB220の記憶内容については、
図4を用いて後述する。習熟度推定装置201は、例えば、サーバによって実現される。
【0040】
ユーザ端末202は、情報処理システム200のユーザが使用するコンピュータである。ユーザは、例えば、企業や役所などの職員の習熟度(能力)を分析する分析者である。ユーザ端末202は、例えば、PC、タブレットPCなどである。
【0041】
なお、ここでは、習熟度推定装置201とユーザ端末202とを別体に設けることにしたが、これに限らない。例えば、習熟度推定装置201は、ユーザ端末202により実現されてもよい。また、情報処理システム200には、複数のユーザ端末202が含まれていてもよい。
【0042】
(習熟度推定装置201のハードウェア構成例)
つぎに、習熟度推定装置201のハードウェア構成例について説明する。
【0043】
図3は、習熟度推定装置201のハードウェア構成例を示すブロック図である。
図3において、習熟度推定装置201は、CPU(Central Processing Unit)301と、メモリ302と、ディスクドライブ303と、ディスク304と、通信I/F(Interface)305と、可搬型記録媒体I/F306と、可搬型記録媒体307と、を有する。また、各構成部は、バス300によってそれぞれ接続される。
【0044】
ここで、CPU301は、習熟度推定装置201の全体の制御を司る。CPU301は、複数のコアを有していてもよい。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMがOSのプログラムを記憶し、ROMがアプリケーションプログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
【0045】
ディスクドライブ303は、CPU301の制御に従ってディスク304に対するデータのリード/ライトを制御する。ディスク304は、ディスクドライブ303の制御で書き込まれたデータを記憶する。ディスク304は、例えば、磁気ディスク、光ディスクなどである。
【0046】
通信I/F305は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部のコンピュータ(例えば、
図2に示したユーザ端末202)に接続される。そして、通信I/F305は、ネットワーク210と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。通信I/F305は、例えば、モデムやLANアダプタなどである。
【0047】
可搬型記録媒体I/F306は、CPU301の制御に従って可搬型記録媒体307に対するデータのリード/ライトを制御する。可搬型記録媒体307は、可搬型記録媒体I/F306の制御で書き込まれたデータを記憶する。可搬型記録媒体307は、例えば、CD(Compact Disc)-ROM、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリなどである。
【0048】
なお、習熟度推定装置201は、上述した構成部のほかに、例えば、入力装置、ディスプレイなどを有してもよい。また、習熟度推定装置201は、上述した構成部のうち、例えば、可搬型記録媒体I/F306、可搬型記録媒体307を有さなくてもよい。また、
図2に示したユーザ端末202についても、習熟度推定装置201と同様のハードウェア構成により実現することができる。ただし、ユーザ端末202は、上述した構成部のほかに、例えば、入力装置、ディスプレイなどを有する。
【0049】
(案件データDB220の記憶内容)
つぎに、
図4を用いて、習熟度推定装置201が有する案件データDB220の記憶内容について説明する。案件データDB220は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0050】
図4は、案件データDB220の記憶内容の一例を示す説明図である。
図4において、案件データDB220は、案件ID、職員ID、トライ数、特徴量1、特徴量2および特徴量3のフィールドを有し、各フィールドに情報を設定することで、案件データ(例えば、案件データ400-1~400-3)をレコードとして記憶する。
【0051】
ここで、案件IDは、案件を一意に識別する識別子である。職員IDは、案件を処理した職員を一意に識別する識別子である。トライ数は、案件の処理にかかった作業量の実測値である。トライ数は、案件の処理にかかった作業時間によって表されてもよく、また、案件の処理に要した作業の回数によって表されてもよい。トライ数は、整数であっても、小数であってもよい。
【0052】
特徴量1、特徴量2および特徴量3は、案件の特徴を表す。例えば、案件が、自治体での住民税賦課業務において、個人に対して住民税を割り当てて負担させる作業であるとする。この場合、特徴量1は、例えば、対象者が給与所得者であるか否かを示す。特徴量2は、例えば、対象者の世帯人数を示す。特徴量3は、例えば、対象者の所得の数(給与、事業、利子、配当、不動産などの数)を示す。
【0053】
(習熟度推定装置201の機能的構成例)
つぎに、
図5を用いて、習熟度推定装置201の機能的構成例について説明する。
【0054】
図5は、実施の形態1にかかる習熟度推定装置201の機能的構成例を示すブロック図である。
図5において、習熟度推定装置201は、取得部501と、分類部502と、算出部503と、評価部504と、出力部505と、を含む。取得部501~出力部505は制御部500となる機能であり、具体的には、例えば、
図3に示したメモリ302、ディスク304、可搬型記録媒体307などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、通信I/F305により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク304などの記憶装置に記憶される。
【0055】
取得部501は、複数の案件データを取得する。ここで、案件データは、各作業者が処理した案件の特徴量と、案件の処理にかかる作業量の実測値とを表す情報である。案件データには、作業者を一意に識別する識別情報が含まれる。特徴量は、案件の特徴を表す情報であり、例えば、数値によって表される。作業量は、例えば、案件の処理にかかった作業時間によって表されてもよく、また、案件の処理に要した作業の回数によって表されてもよい。
【0056】
具体的には、例えば、取得部501は、
図2に示したユーザ端末202から受信することにより、複数の案件データ(例えば、
図4に示した案件データ400-1~400-3)を取得する。また、取得部501は、不図示の入力装置を用いたユーザの操作入力により、複数の案件データを取得してもよい。また、取得部501は、習熟度の推定対象となる作業者(例えば、職員)の端末からそれぞれ受信することにより、複数の案件データを取得してもよい。
【0057】
取得された案件データは、例えば、
図4に示した案件データDB220に記憶される。
【0058】
分類部502は、複数の異なる候補グループ数それぞれについて、取得された複数の案件データを特徴量に基づき候補グループ数のグループに分類する。候補グループ数は、分類するグループの個数の候補である。複数の異なる候補グループ数は、任意に設定可能である。
【0059】
以下の説明では、複数の異なる候補グループ数を「候補グループ数(n1,n2,…,nc)」と表記し、候補グループ数(n1,n2,…,nc)のうちのいずれかの候補グループ数を「候補グループ数ni」と表記する場合がある(i=1,2,…,C)。
【0060】
具体的には、例えば、分類部502は、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、既存のクラスタリング手法により、案件データDB220を参照して、各案件データが表す案件の特徴量1,2,3に基づいて、複数の案件データを各候補グループ数niのグループに分類する。既存のクラスタリング手法は、k-means法や凝集型クラスタリングなどである。
【0061】
算出部503は、各候補グループ数niについて、分類された各候補グループ数niのグループに含まれるグループ内の案件データが表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する。習熟度θは、例えば、作業者間で相対的な値であり、職務を遂行する能力が高い作業者ほど値が高くなるように算出される。
【0062】
特性曲線モデルCvは、作業者の習熟度と案件の処理にかかる作業量との関係を表す。特性曲線モデルCvは、例えば、下記式(1)を用いて表すことができる。ただし、θは、作業者の習熟度を示す。a,b,cは、係数を示す。I(θ)は、案件の処理にかかるトライ数(作業量)を示す。
【0063】
I(θ)=aθ2+bθ+c ・・・(1)
【0064】
具体的には、例えば、算出部503は、候補グループ数niのグループに含まれるグループ内の個々の案件データのトライ数(作業量)と、特性曲線モデルCvとの誤差が小さくなるように、各作業者の習熟度θと、各グループの特性曲線モデルCvの係数a,b,cをフィッティングにより推定する。フィッティングは、例えば、全グループ一括で、Nelder-Mead法、COBYLA法などの非線形最適化のアルゴリズムを用いて実行することができる。
【0065】
誤差は、例えば、下記式(2)を用いて表すことができる。ただし、Tkは、案件ID「k」の案件のトライ数を示す。g(k)は、候補グループ数niのグループのうち、案件ID「k」の案件データが属するグループを示す。p(k)は、案件ID「k」の案件を処理した職員(作業者)の職員IDを示す。ag(k),bg(k),cg(k)は、案件ID「k」の案件データが属するグループの特性曲線モデルCvの係数a,b,cを示す。θp(k)は、職員ID「p(k)」の職員(作業者)の習熟度を示す。
【0066】
誤差=Σk{Tk-(ag(k)θp(k)
2+bg(k)θp(k)+cg(k))}2・・・(2)
【0067】
各候補グループ数n
iのグループごとの特性曲線モデルCvと各作業者の習熟度θの算出例については、
図8A、
図8B、
図9Aおよび
図9Bを用いて後述する。各候補グループ数n
iのグループについて算出された算出結果は、例えば、
図6に示すような誤差評価用テーブル600に記憶される。
【0068】
図6は、誤差評価用テーブル600の記憶内容の一例を示す説明図である。
図6において、誤差評価用テーブル600は、候補グループ数、グループ、a、b、c、θ1、θ2、θ3、および誤差評価値のフィールドを有する。各フィールドに情報を設定することで、誤差評価情報(例えば、誤差評価情報600-1~600-3)がレコードとして記憶される。
【0069】
ここで、候補グループ数は、候補グループ数(n1,n2,…,nc)に対応する。グループは、候補グループ数niのグループに含まれるグループを示す。a、b、cは、特性曲線モデルCvの係数a,b,cを示す。θ1、θ2、θ3は、各職員(作業者)の習熟度を示す。ただし、ここでは3人の職員を想定する。
【0070】
誤差評価値は、特性曲線モデルCvから特定されるトライ数(作業量)の推定値と、案件データが表すトライ数(作業量)の実測値との誤差を評価した結果に相当する。誤差評価値は、初期状態では「空」である。例えば、誤差評価情報600-1は、候補グループ数「2」のグループについて、各グループ1,2の特性曲線モデルCvの係数a,b,cと、各職員の習熟度θ1~θ3とを示す。
【0071】
評価部504は、各候補グループ数niについて、算出したグループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内の案件データが表す作業量の実測値との誤差を評価する。具体的には、例えば、評価部504は、各候補グループ数niのグループについて、誤差評価値を算出する。
【0072】
より詳細に説明すると、例えば、評価部504は、候補グループ数n
iのグループに含まれるグループごとに、算出されたグループの特性曲線モデルCvと各職員(作業者)の習熟度θとから、各職員のトライ数(作業量)の推定値を特定する。特性曲線モデルCvおよび各職員の習熟度θは、例えば、
図6に示した誤差評価用テーブル600から特定される。
【0073】
つぎに、評価部504は、特定した各職員のトライ数の推定値と、グループ内の案件データが表す各職員のトライ数の実測値との誤差を累計することにより、グループの誤差の合計値を算出する。そして、評価部504は、算出したグループごとの誤差の合計値を足し合わせることにより、各候補グループ数niのグループについての誤差評価値を算出する。
【0074】
各候補グループ数n
iのグループについての誤差評価値の算出例については、
図8A、
図8B、
図9Aおよび
図9Bを用いて後述する。算出された誤差評価値は、例えば、
図6に示した誤差評価用テーブル600に記憶される。
【0075】
出力部505は、候補グループ数(n1,n2,…,nc)のうち、評価された誤差が最小となる候補グループ数niのグループについて算出された各作業者の習熟度θを出力する。出力部505の出力形式としては、例えば、メモリ302、ディスク304などの記憶装置への記憶、通信I/F305による他のコンピュータへの送信、不図示のディスプレイへの表示、不図示のプリンタへの印刷出力などがある。
【0076】
具体的には、例えば、出力部505は、誤差評価用テーブル600を参照して、誤差評価値が最小となる候補グループ数n
iのグループについて算出された各作業者の習熟度θを習熟度推定結果として、
図2に示したユーザ端末202に出力してもよい。
【0077】
(習熟度推定装置201の動作例)
つぎに、
図7を用いて、習熟度推定装置201の動作例について説明する。ここでは、候補グループ数(n
1,n
2,…,n
c)を「候補グループ数(2,3,…,10)」とする。また、案件データを「案件データ710」とし、複数の案件データ710の案件を処理した作業者を「職員A,B,C」とする。
【0078】
図7は、実施の形態1にかかる習熟度推定装置201の動作例を示す説明図である。
図7において、習熟度推定装置201は、候補グループ数(2,3,…,10)の各候補グループ数n
iについて、複数の案件データ710を特徴量に基づき候補グループ数n
iのグループに分類する。
【0079】
習熟度推定装置201は、各候補グループ数niのグループについて、各候補グループ数niのグループに含まれるグループごとの特性曲線モデルCvと、各職員A,B,Cの習熟度θとを算出する。ここで、複数の案件データ710を、候補グループ数「2」のグループ1,2に分類した場合を例に挙げて説明する。
【0080】
図7において、トライ数分布711は、グループ1に属する案件の処理にかかった職員Aのトライ数の分布を表す。トライ数分布712は、グループ1に属する案件の処理にかかった職員Bのトライ数の分布を表す。トライ数分布713は、グループ1に属する案件の処理にかかった職員Cのトライ数の分布を表す。ただし、縦軸をトライ回数とし、横軸をトライ回数の出現頻度とする。
【0081】
トライ数分布721は、グループ2に属する案件の処理にかかった職員Aのトライ数の分布を表す。トライ数分布722は、グループ2に属する案件の処理にかかった職員Bのトライ数の分布を表す。トライ数分布723は、グループ2に属する案件の処理にかかった職員Cのトライ数の分布を表す。
【0082】
また、特性曲線Cv1は、グループ1に対応する特性曲線であり、職員(作業者)の習熟度と案件の処理にかかるトライ数(作業量)との関係を表す。特性曲線Cv2は、グループ2に対応する特性曲線であり、職員(作業者)の習熟度と案件の処理にかかるトライ数(作業量)との関係を表す。特性曲線Cv1,Cv2は、例えば、上記式(1)によって表される。
【0083】
習熟度推定装置201は、各グループ1,2内の個々の案件データ710のトライ数と、各特性曲線モデルCv1,Cv2との誤差が小さくなるように、各職員A,B,Cの習熟度θと、各特性曲線モデルCv1,Cv2の係数a,b,cをフィッティングにより推定する。誤差は、例えば、上記式(2)によって表される。
【0084】
これにより、候補グループ数「2」のグループ1,2について、グループ1,2ごとの特性曲線モデルCv1,Cv2と、各職員A,B,Cの習熟度θとが算出される。
【0085】
習熟度推定装置201は、候補グループ数(2,3,…,10)の各候補グループ数niについて、算出したグループごとの特性曲線モデルCvから特定されるトライ数の推定値と、当該グループ内の案件データ710が表すトライ数の実測値との誤差を評価する。
【0086】
候補グループ数「2」のグループ1,2を例に挙げると、習熟度推定装置201は、グループ1の特性曲線モデルCv1と各職員A,B,Cの習熟度θとから、グループ1の各職員A,B,Cのトライ数の推定値を特定する。つぎに、習熟度推定装置201は、特定した各職員A,B,Cのトライ数の推定値と、グループ1内の案件データが表す各職員A,B,Cのトライ数の実測値との誤差を累計することにより、グループ1の誤差の合計値を算出する。
【0087】
また、習熟度推定装置201は、グループ2の特性曲線モデルCv2と各職員A,B,Cの習熟度θとから、グループ2の各職員A,B,Cのトライ数の推定値を特定する。つぎに、習熟度推定装置201は、特定した各職員A,B,Cのトライ数の推定値と、グループ2内の案件データが表す各職員A,B,Cのトライ数の実測値との誤差を累計することにより、グループ2の誤差の合計値を算出する。
【0088】
そして、習熟度推定装置201は、算出したグループ1,2ごとの誤差の合計値を足し合わせることにより、候補グループ数「2」のグループ1,2についての誤差評価値V[2]を算出する。同様に、習熟度推定装置201は、候補グループ数(3,4,…,10)のグループについての誤差評価値V[3]~V[10]を算出する。なお、誤差評価値V[#]は、候補グループ数「#」のグループについての誤差評価値を示す。
【0089】
習熟度推定装置201は、候補グループ数(2,3,…,10)のうち、算出した誤差評価値が最小となる候補グループ数niのグループについて算出した各職員A,B,Cの習熟度θを出力する。ここでは、誤差評価値V[2]~V[10]のうち誤差評価値V[2]が最小であるとする。この場合、習熟度推定装置201は、候補グループ数「2」のグループについて算出した各職員A,B,Cの習熟度θを、習熟度推定結果720として出力する。
【0090】
これにより、習熟度推定装置201は、候補グループ数が異なる複数のパターンの中から、トライ数についての特性曲線による推定値と実測値との誤差が最も小さいパターンを選択することで、各職員A,B,Cの習熟度θを精度よく推定することができる。
【0091】
(誤差評価値の算出例)
ここで、候補グループ数「2」のグループ1,2を例に挙げて、誤差評価値V[2]の算出例について説明する。まず、候補グループ数「2」のグループ1,2について、グループ1,2ごとの特性曲線モデルCvと、各職員A,B,Cの習熟度θの算出例について説明する。
【0092】
図8Aは、グループ1の職員別のトライ数分布を示す説明図である。
図8Aにおいて、トライ数分布テーブル801は、グループ1に含まれる案件データ710が表す各職員A,B,Cのトライ数(実測値)の分布を示す。例えば、グループ1に含まれる案件を職員Aが処理したときのトライ数は「1,4,3,3,2,4,2,3」である。
【0093】
図8Bは、グループ2の職員別のトライ数分布を示す説明図である。
図8Bにおいて、トライ数分布テーブル802は、グループ2に含まれる案件データ710が表す各職員A,B,Cのトライ数(実測値)の分布を示す。例えば、グループ2に含まれる案件を職員Aが処理したときのトライ数は「5,6,5」である。
【0094】
図9Aは、グループ1のフィッティング結果を示す説明図である。
図9Aにおいて、特性曲線901は、グループ1内の案件データ710が表すトライ数(作業量)の実測値に基づくフィッティング結果を示す。ただし、
図9Aでは、点が重ならないように、各職員A,B,Cの習熟度を推定値から横軸方向に少しずらした位置に表示している。
【0095】
図9Bは、グループ2のフィッティング結果を示す説明図である。
図9Bにおいて、特性曲線902は、グループ2内の案件データ710が表すトライ数(作業量)の実測値に基づくフィッティング結果を示す。ただし、
図9Bでは、点が重ならないように、各職員A,B,Cの習熟度を推定値から横軸方向に少しずらした位置に表示している。
【0096】
この場合、グループ1の特性曲線901(特性曲線モデルCv1)は、下記式(3)によって表される。また、グループ2の特性曲線902(特性曲線モデルCv2)は、下記式(4)によって表される。ただし、yは、トライ数(作業量)を示す。θは、職員(作業者)の習熟度を示す。
【0097】
y=-0.24θ2-0.40θ+2.58 ・・・(3)
y=0.01θ2-1.51θ+4.27 ・・・(4)
【0098】
また、各職員A,B,Cの習熟度θは、下記式(5)~(7)によって表される。ただし、θAは、職員Aの習熟度を示す。θBは、職員Bの習熟度を示す。θCは、職員Cの習熟度を示す。
【0099】
θA=-0.70 ・・・(5)
θB=-0.04 ・・・(6)
θC=0.68 ・・・(7)
【0100】
習熟度推定装置201は、上記式(3)および上記式(5)~(7)から、グループ1の各職員A,B,Cのトライ数の推定値を特定する。グループ1の各職員A,B,Cのトライ数の推定値は、以下のようになる。
【0101】
職員Aのトライ数の推定値=2.750
職員Bのトライ数の推定値=2.600
職員Cのトライ数の推定値=2.200
【0102】
また、習熟度推定装置201は、上記式(4)および上記式(5)~(7)から、グループ2の各職員A,B,Cのトライ数の推定値を特定する。グループ2の各職員A,B,Cのトライ数の推定値は、以下のようになる。
【0103】
職員Aのトライ数の推定値=5.333
職員Bのトライ数の推定値=4.333
職員Cのトライ数の推定値=3.250
【0104】
そして、習熟度推定装置201は、各グループ1,2の各職員A,B,Cのトライ数の推定値と、各グループ1,2内の案件データ710が表す各職員A,B,Cのトライ数の実測値(例えば、トライ数分布テーブル801,802参照)との誤差を評価する。これにより、習熟度推定装置201は、候補グループ数「2」のグループについての誤差評価値V[2]を算出する。
【0105】
具体的には、例えば、習熟度推定装置201は、上記式(2)を用いて、各グループ1,2について、各グループ1,2の各職員A,B,Cのトライ数の推定値と、各グループ1,2内の案件データ710が表す各職員A,B,Cのトライ数の実測値との2乗誤差を累計することにより、誤差評価値V[2]を算出する。
【0106】
各グループ1,2の各職員A,B,Cについてのトライ数の推定値と実測値との2乗誤差の和は、以下のようになる。ただし、小数点第3位を切り上げる。
【0107】
グループ1、職員A:(1-2.75)2+(4-2.75)2+(3-2.75)2+…+(3-2.75)2
グループ1、職員B:(2-2.6)2+(3-2.6)2+(3-2.6)2+…+(1-2.6)2
グループ1、職員C:(2-2.2)2+…(1-2.2)2
グループ2、職員A:(5-5.333)2+…(5-5.333)2
グループ2、職員B:(3-4.333)2+…(4-4.333)2
グループ2、職員C:(3-3.25)2+…(4-3.25)2
【0108】
候補グループ数「2」のグループについての誤差評価値V[2]は、上記6つの値の和となる。ここでは、誤差評価値V[2]は、「V[2]=26.25」となる。算出された誤差評価値V[2]は、例えば、誤差評価用テーブル600内の誤差評価情報600-1に設定される。
【0109】
図7の例では、誤差評価値V[2]~V[10]のうち誤差評価値V[2]が最小となる。この場合、
図7に示した習熟度推定結果720には、候補グループ数「2」のグループについて算出された、上記式(5)~(7)の各職員A,B,Cの習熟度「θ
A=-0.70,θ
B=-0.04,θ
C=0.68」が含まれる。
【0110】
(習熟度推定装置201の習熟度推定処理手順)
つぎに、習熟度推定装置201の習熟度推定処理手順について説明する。
【0111】
図10は、実施の形態1にかかる習熟度推定装置201の習熟度推定処理手順の一例を示すフローチャートである。
図10において、習熟度推定装置201は、複数の案件データを取得する(ステップS1001)。つぎに、習熟度推定装置201は、候補グループ数(n
1,n
2,…,n
c)を取得する(ステップS1002)。候補グループ数(n
1,n
2,…,n
c)は、例えば、メモリ302、ディスク304などに記憶されている。
【0112】
そして、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち選択されていない未選択の候補グループ数niを選択する(ステップS1003)。つぎに、習熟度推定装置201は、取得した複数の案件データを特徴量に基づき、選択した候補グループ数niのグループに分類する(ステップS1004)。
【0113】
そして、習熟度推定装置201は、分類した候補グループ数niのグループに含まれるグループ内の案件データが表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する(ステップS1005)。
【0114】
つぎに、習熟度推定装置201は、グループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内の案件データが表す作業量の実測値との誤差を評価することにより、候補グループ数niのグループについて、誤差評価値を算出する(ステップS1006)。
【0115】
そして、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち選択されていない未選択の候補グループ数があるか否かを判断する(ステップS1007)。ここで、未選択の候補グループ数がある場合(ステップS1007:Yes)、習熟度推定装置201は、ステップS1003に戻る。
【0116】
一方、未選択の候補グループ数がない場合(ステップS1007:No)、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち、算出した誤差評価値が最小となる候補グループ数niを特定する(ステップS1008)。つぎに、習熟度推定装置201は、特定した候補グループ数niのグループについて算出した各作業者の習熟度θを特定する(ステップS1009)。
【0117】
そして、習熟度推定装置201は、特定した各作業者の習熟度θを含む習熟度推定結果を出力して(ステップS1010)、本フローチャートによる一連の処理を終了する。これにより、習熟度推定装置201は、各作業者の習熟度θを精度よく推定することができる。
【0118】
以上説明したように、実施の形態1にかかる習熟度推定装置201によれば、各作業者が処理した案件の特徴量と案件の処理にかかる作業量の実測値とをそれぞれ表す複数の案件データを取得することができる。そして、習熟度推定装置201によれば、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、取得した複数の案件データを特徴量に基づき候補グループ数niのグループに分類することができる。また、習熟度推定装置201によれば、分類した候補グループ数niのグループに含まれるグループ内の案件データが表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出することができる。特性曲線モデルCvは、作業者の習熟度と案件の処理にかかる作業量との関係を表す。特性曲線モデルCvは、例えば、右下がりの2次曲線を表す関数(2次関数)である。
【0119】
これにより、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、各作業者の習熟度と案件の処理にかかる作業量との関係をグループごとに捉えることができる。
【0120】
また、習熟度推定装置201によれば、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、算出したグループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内の案件データが表す作業量の実測値との誤差を評価することができる。そして、習熟度推定装置201によれば、候補グループ数(n1,n2,…,nc)のうち、評価した誤差が最小となる候補グループ数niのグループについて算出した各作業者の習熟度θを出力することができる。
【0121】
これにより、習熟度推定装置201は、複数の異なる候補グループ数の中から、案件の処理にかかる作業量について、特性曲線による推定値と実測値との誤差が最も小さい候補グループ数を選択することで、各作業者の習熟度θを精度よく推定することができる。
【0122】
(実施の形態2)
つぎに、実施の形態2にかかる習熟度推定装置201について説明する。なお、実施の形態1で説明した箇所と同様の箇所については、図示および説明を省略する。
【0123】
ここで、複数の案件データを用いて誤差評価を行うにあたり、グループを小さく分けるほど(グループ数が多いほど)、誤差が小さくなる、過学習になっている可能性がある。そこで、実施の形態2では、習熟度推定装置201は、複数の案件データを訓練データとテストデータとに分割し、訓練データでグループ分けと特性曲線モデルへのフィッティングを行い、そのグループ分けモデルと特性曲線モデルをテストデータで誤差評価する。
【0124】
まず、
図11を用いて、習熟度推定装置201の動作例について説明する。なお、実施の形態2にかかる習熟度推定装置201の機能的構成例については、実施の形態1にかかる習熟度推定装置201の機能的構成例と同様のため図示を省略する。
【0125】
図11は、実施の形態2にかかる習熟度推定装置201の動作例を示す説明図である。
図11において、習熟度推定装置201の分類部502は、複数の案件データ1110を訓練データ1120とテストデータ1130とに分割する。具体的には、例えば、分類部502は、所定の比率に従って、複数の案件データ1110を訓練データ1120とテストデータ1130とにランダムに分割する。
【0126】
所定の比率は、訓練データ数とテストデータ数との比率であり、任意に設定可能である。所定の比率は、例えば、「訓練データ数:テストデータ数=6:4」などの比率に設定される。また、分類部502は、複数の案件データ1110を分割するにあたり、特定の作業者の案件データ1110が、訓練データ1120やテストデータ1130に偏らないようにしてもよい。
【0127】
そして、分類部502は、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、分割した訓練データ1120を特徴量に基づき各候補グループ数niのグループに分類する。
【0128】
習熟度推定装置201の算出部503は、各候補グループ数niについて、各候補グループ数niのグループに含まれるグループ内の訓練データ1120が表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する。
【0129】
習熟度推定装置201の評価部504は、各候補グループ数niについて、算出されたグループごとの特性曲線モデルCvから特定される作業量の推定値と、分割されたテストデータ1130のうち、当該グループに分類されるテストデータ1130が表す作業量の実測値との誤差を評価する。
【0130】
具体的には、例えば、評価部504は、分割されたテストデータ1130を、テストデータ1130が表す特徴量に基づいて、各候補グループ数niのグループのいずれかのグループに分類する。この際、評価部504は、例えば、分類部502による訓練データの分類で学習したモデルを用いて、テストデータ1130を分類する。
【0131】
そして、評価部504は、グループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内のテストデータ1130が表す作業量の実測値との誤差を評価することにより、各候補グループ数niのグループについての誤差評価値を算出する。
【0132】
より詳細に説明すると、例えば、評価部504は、算出されたグループの特性曲線モデルCvと各作業者の習熟度θとから、各作業者の作業量の推定値を特定する。つぎに、評価部504は、特定した各作業者の作業量の推定値と、グループ内の各テストデータ1130が表す各作業者の実測値との誤差を累計することにより、グループの誤差の合計値を算出する。そして、評価部504は、算出したグループごとの誤差の合計値を足し合わせることにより、各候補グループ数niのグループについての誤差評価値を算出する。
【0133】
習熟度推定装置201の出力部505は、候補グループ数(n1,n2,…,nc)のうち、評価された誤差が最小となる候補グループ数niのグループについて算出された各作業者の習熟度θを出力する。具体的には、例えば、出力部505は、誤差評価値が最小となる候補グループ数niのグループについて算出された各作業者の習熟度θを、習熟度推定結果1140として出力する。
【0134】
(習熟度推定装置201の習熟度推定処理手順)
つぎに、習熟度推定装置201の習熟度推定処理手順について説明する。
【0135】
図12は、実施の形態2にかかる習熟度推定装置201の習熟度推定処理手順の一例を示すフローチャートである。
図12において、習熟度推定装置201は、複数の案件データを取得する(ステップS1201)。そして、習熟度推定装置201は、取得した複数の案件データを訓練データとテストデータとに分割する(ステップS1202)。
【0136】
つぎに、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)を取得する(ステップS1203)。そして、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち選択されていない未選択の候補グループ数niを選択する(ステップS1204)。
【0137】
つぎに、習熟度推定装置201は、分割した訓練データを特徴量に基づき、選択した候補グループ数niのグループに分類する(ステップS1205)。そして、習熟度推定装置201は、分類した候補グループ数niのグループに含まれるグループ内の訓練データが表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する(ステップS1206)。
【0138】
つぎに、習熟度推定装置201は、分割したテストデータを特徴量に基づき、候補グループ数niのグループのいずれかのグループに分類する(ステップS1207)。そして、習熟度推定装置201は、グループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループに分類されたテストデータが表す作業量の実測値との誤差を評価することにより、候補グループ数niのグループについて、誤差評価値を算出する(ステップS1208)。
【0139】
つぎに、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち選択されていない未選択の候補グループ数があるか否かを判断する(ステップS1209)。ここで、未選択の候補グループ数がある場合(ステップS1209:Yes)、習熟度推定装置201は、ステップS1204に戻る。
【0140】
一方、未選択の候補グループ数がない場合(ステップS1209:No)、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち、算出した誤差評価値が最小となる候補グループ数niを特定する(ステップS1210)。つぎに、習熟度推定装置201は、特定した候補グループ数niのグループについて算出した各作業者の習熟度θを特定する(ステップS1211)。
【0141】
そして、習熟度推定装置201は、特定した各作業者の習熟度θを含む習熟度推定結果を出力して(ステップS1212)、本フローチャートによる一連の処理を終了する。これにより、習熟度推定装置201は、各作業者の習熟度θを精度よく推定することができる。
【0142】
以上説明したように、実施の形態2にかかる習熟度推定装置201によれば、複数の案件データを、訓練データとテストデータとに分割し、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、分割した訓練データを特徴量に基づき候補グループ数niのグループに分類することができる。また、習熟度推定装置201によれば、分類した候補グループ数niのグループに含まれるグループ内の訓練データが表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出することができる。そして、習熟度推定装置201によれば、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、算出したグループごとの特性曲線モデルCvから特定される作業量の推定値と、分割したテストデータのうち、当該グループに分類されるテストデータが表す作業量の実測値との誤差を評価することができる。習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち、評価した誤差が最小となる候補グループ数niのグループについて算出した各作業者の習熟度θを出力する。
【0143】
これにより、習熟度推定装置201は、複数の案件データを特性曲線へのフィッティング用の訓練データと誤差評価用のテストデータとに分けることで、過学習を防いで、各作業者の習熟度θの推定精度を向上させることができる。
【0144】
(実施の形態3)
つぎに、実施の形態3にかかる習熟度推定装置201について説明する。なお、実施の形態1,2で説明した箇所と同様の箇所については、図示および説明を省略する。
【0145】
実施の形態2で説明したように、複数の案件データを用いて誤差評価を行うにあたり、グループを小さく分けるほど(グループ数が多いほど)、誤差が小さくなる、過学習になっている可能性がある。一方、グループ分け手法によっては、学習したモデル(データを分類したグループ)が、新しいデータのグループ分けには適用できない場合がある。新しいデータのグループ分けには適用できない手法としては、例えば、凝集型クラスタリングがある。
【0146】
そこで、実施の形態3では、習熟度推定装置201は、複数の案件データをグループ分けした後に、訓練データとテストデータとに分割し、訓練データで特性曲線モデルへのフィッティングを行い、テストデータで特性曲線モデルを誤差評価する。
【0147】
まず、
図13を用いて、習熟度推定装置201の動作例について説明する。なお、実施の形態3にかかる習熟度推定装置201の機能的構成例については、実施の形態1にかかる習熟度推定装置201の機能的構成例と同様のため図示を省略する。
【0148】
図13は、実施の形態3にかかる習熟度推定装置201の動作例を示す説明図である。
図13において、習熟度推定装置201の分類部502は、候補グループ数(n
1,n
2,…,n
c)の各候補グループ数n
iについて、複数の案件データ1310を各候補グループ数n
iのグループに分類する。
【0149】
つぎに、分類部502は、各候補グループ数niについて、分類した各候補グループ数niのグループに含まれるグループ内の案件データ1310を、訓練データ1320とテストデータ1330とに分割する。具体的には、例えば、分類部502は、グループ内の案件データ1310を訓練データ1320とテストデータ1330とにランダムに分割する。この際、分類部502は、特定の作業者の案件データ1310が、訓練データ1320やテストデータ1330に偏らないようにしてもよい。
【0150】
習熟度推定装置201の算出部503は、各候補グループ数niについて、各候補グループ数niのグループに含まれるグループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する。具体的には、例えば、算出部503は、各候補グループ数niのグループに含まれるグループ内の案件データ1310のうち、分割された訓練データ1320が表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行う。これにより、算出部503は、グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する。
【0151】
習熟度推定装置201の評価部504は、各候補グループ数niについて、算出されたグループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内の案件データ1310のうち、分割されたテストデータ1330が表す作業量の実測値との誤差を評価する。
【0152】
具体的には、例えば、評価部504は、グループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内のテストデータ1330が表す作業量の実測値との誤差を評価することにより、各候補グループ数niのグループについての誤差評価値を算出する。
【0153】
より詳細に説明すると、例えば、評価部504は、算出されたグループの特性曲線モデルCvと各作業者の習熟度θとから、各作業者の作業量の推定値を特定する。つぎに、評価部504は、特定した各作業者の作業量の推定値と、グループ内の各テストデータ1330が表す各作業者の実測値との誤差を累計することにより、グループの誤差の合計値を算出する。そして、評価部504は、算出したグループごとの誤差の合計値を足し合わせることにより、各候補グループ数niのグループについての誤差評価値を算出する。
【0154】
習熟度推定装置201の出力部505は、候補グループ数(n1,n2,…,nc)のうち、評価された誤差が最小となる候補グループ数niのグループについて算出された各作業者の習熟度θを出力する。具体的には、例えば、出力部505は、誤差評価値が最小となる候補グループ数niのグループについて算出された各作業者の習熟度θを、習熟度推定結果1340として出力する。
【0155】
(習熟度推定装置201の習熟度推定処理手順)
つぎに、習熟度推定装置201の習熟度推定処理手順について説明する。
【0156】
図14は、実施の形態3にかかる習熟度推定装置201の習熟度推定処理手順の一例を示すフローチャートである。
図14において、習熟度推定装置201は、複数の案件データを取得する(ステップS1401)。つぎに、習熟度推定装置201は、候補グループ数(n
1,n
2,…,n
c)を取得する(ステップS1402)。
【0157】
そして、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち選択されていない未選択の候補グループ数niを選択する(ステップS1403)。つぎに、習熟度推定装置201は、複数の案件データを特徴量に基づき、選択した候補グループ数niのグループに分類する(ステップS1404)。
【0158】
そして、習熟度推定装置201は、分類した候補グループ数niのグループに含まれるグループ内の案件データを、訓練データとテストデータとに分割する(ステップS1405)。つぎに、習熟度推定装置201は、候補グループ数niのグループに含まれるグループ内の案件データのうち、分割した訓練データが表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する(ステップS1406)。
【0159】
そして、習熟度推定装置201は、グループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内の案件データのうち、分割したテストデータが表す作業量の実測値との誤差を評価することにより、候補グループ数niのグループについて、誤差評価値を算出する(ステップS1407)。
【0160】
つぎに、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち選択されていない未選択の候補グループ数があるか否かを判断する(ステップS1408)。ここで、未選択の候補グループ数がある場合(ステップS1408:Yes)、習熟度推定装置201は、ステップS1403に戻る。
【0161】
一方、未選択の候補グループ数がない場合(ステップS1408:No)、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち、算出した誤差評価値が最小となる候補グループ数niを特定する(ステップS1409)。つぎに、習熟度推定装置201は、特定した候補グループ数niのグループについて算出した各作業者の習熟度θを特定する(ステップS1410)。
【0162】
そして、習熟度推定装置201は、特定した各作業者の習熟度θを含む習熟度推定結果を出力して(ステップS1411)、本フローチャートによる一連の処理を終了する。これにより、習熟度推定装置201は、各作業者の習熟度θを精度よく推定することができる。
【0163】
以上説明したように、実施の形態3にかかる習熟度推定装置201によれば、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、複数の案件データを特徴量に基づき候補グループ数niのグループに分類し、候補グループ数数niのグループに含まれるグループ内の案件データを、訓練データとテストデータとに分割することができる。また、習熟度推定装置201によれば、分類した候補グループ数niのグループに含まれるグループ内の案件データのうち、分割した訓練データが表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出することができる。そして、習熟度推定装置201によれば、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、算出したグループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内の案件データのうち、分割したテストデータが表す作業量の実測値との誤差を評価することができる。習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち、評価した誤差が最小となる候補グループ数niのグループについて算出した各作業者の習熟度θを出力する。
【0164】
これにより、習熟度推定装置201は、複数の案件データを候補グループ数niのグループに分類した上で、グループ内の案件データを特性曲線へのフィッティング用の訓練データと誤差評価用のテストデータとに分けることができる。このため、習熟度推定装置201は、新しいデータのグループ分けに学習したモデル(データを分類したグループ)を適用できないグループ分け手法を採用した場合であっても、過学習を防いで、各作業者の習熟度θの推定精度を向上させることができる。
【0165】
(実施の形態4)
つぎに、実施の形態4にかかる習熟度推定装置201について説明する。なお、実施の形態1~3で説明した箇所と同様の箇所については、図示および説明を省略する。
【0166】
実施の形態4では、回帰木の手法により案件データをリーフに分け、リーフを単位としてグループ分けする習熟度推定方法について説明する。
【0167】
そこで、実施の形態4では、習熟度推定装置201は、複数の案件データをグループ分けした後に、訓練データとテストデータとに分割し、訓練データで特性曲線モデルへのフィッティングを行い、テストデータで特性曲線モデルを誤差評価する。
【0168】
まず、
図15を用いて、習熟度推定装置201の動作例について説明する。なお、実施の形態4にかかる習熟度推定装置201の機能的構成例については、実施の形態1にかかる習熟度推定装置201の機能的構成例と同様のため図示を省略する。
【0169】
図15は、実施の形態4にかかる習熟度推定装置201の動作例を示す説明図である。
図15において、習熟度推定装置201の分類部502は、案件の処理にかかる作業量を目的変数とし、案件の特徴量を説明変数として、取得された複数の案件データ1510を回帰木により複数のリーフに分類する。回帰木(決定木)は、木構造によってデータを分類するための情報や手法である。回帰木では、目的変数の値が偏るように(値のばらつきが小さくなるよう)、データ領域を見つけていく。
【0170】
例えば、分類部502は、複数の異なる回帰木の深さそれぞれについて、作業量を目的変数とし、特徴量を説明変数として、当該深さの回帰木により、複数の案件データ1510を複数のリーフに分類する。回帰木の深さは、任意に設定可能である。回帰木の深さを制限することで、例えば、階層の深い複雑な回帰木ができるのを防いで過学習を防ぐことができる。
【0171】
以下の説明では、複数の異なる回帰木の深さを「候補深さ(d1,d2,…,dc)」と表記し、候補深さ(d1,d2,…,dc)のうちのいずれかの候補深さを「候補深さdi」と表記する場合がある(i=1,2,…,C)。
【0172】
また、分類部502は、分類した候補深さdiの複数のリーフそれぞれについて、リーフに属する案件データ1510が表す特徴量と作業量の実測値とに基づいて、リーフの座標を算出する。リーフの座標は、例えば、リーフに属する案件データ1510が表す特徴量の平均と、作業量の実測値の平均とによって表される。
【0173】
図4に示した案件データ400-1~400-3を例に挙げると、リーフの座標は、例えば、(トライ数の平均,特徴量1の平均,特徴量2の平均,特徴量3の平均)となる。トライ数の平均は、リーフに属する案件データが表すトライ数の平均値である。特徴量1の平均は、リーフに属する案件データが表す特徴量1の平均値である。特徴量2の平均は、リーフに属する案件データが表す特徴量2の平均値である。特徴量3の平均は、リーフに属する案件データが表す特徴量3の平均値である。
【0174】
そして、分類部502は、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、算出したリーフの座標に基づいて、候補深さdiの複数のリーフを各候補グループ数niのグループに分類する。候補グループ数niのグループは、例えば、候補深さdiと候補グループ数niとの組合せの数分生成される。
【0175】
リーフのグループ分け例については、
図16を用いて後述する。
【0176】
習熟度推定装置201の算出部503は、各候補グループ数niについて、各候補グループ数niのグループに含まれるグループ内のリーフが表す作業量の実測値(作業者ごとの値)に基づいて、特性曲線モデルCvに対するフィッティングを行う。これにより、算出部503は、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する。
【0177】
ここで、グループ内のリーフが表す作業量の実測値は、例えば、リーフに属する案件データ1510に基づく作業者ごとの作業量の実測値の平均である。また、グループ内のリーフが表す作業量の実測値は、リーフに属する個々の案件データ1510の作業量の実測値であってもよい。また、グループ内のリーフが表す作業量の実測値は、リーフの座標として求めた、リーフに属する案件データ1510が表す作業量の実測値の平均であってもよい。
【0178】
具体的には、例えば、算出部503は、候補グループ数niのグループに含まれるグループ内の個々のリーフの座標(作業量の実測値の平均)と、特性曲線モデルCvとの誤差が小さくなるように、各作業者の習熟度θと、各グループの特性曲線モデルCvの係数a,b,cをフィッティングにより推定する。また、算出部503は、候補グループ数niのグループに含まれるグループ内のリーフに属する個々の案件データ1510の作業量と、特性曲線モデルCvとの誤差が小さくなるように、各作業者の習熟度θと、各グループの特性曲線モデルCvの係数a,b,cをフィッティングにより推定してもよい。
【0179】
このように、算出部503は、フィッティングに用いる1データを、グループ内の各リーフの座標(作業量の実測値の平均)としてもよいし、グループ内のリーフに属する案件データ1510が表す作業量の実測値としてもよい。
【0180】
習熟度推定装置201の評価部504は、各候補グループ数niについて、算出されたグループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内のリーフが表す作業量の実測値との誤差を評価する。
【0181】
具体的には、例えば、評価部504は、グループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内のリーフが表す作業量の実測値との誤差を評価することにより、各候補グループ数niのグループについての誤差評価値を算出する。
【0182】
より詳細に説明すると、例えば、評価部504は、算出されたグループの特性曲線モデルCvと各作業者の習熟度θとから、各作業者の作業量の推定値を特定する。つぎに、評価部504は、特定した各作業者の作業量の推定値と、グループ内のリーフが表す各作業者の実測値との誤差を累計することにより、グループの誤差の合計値を算出する。そして、評価部504は、算出したグループごとの誤差の合計値を足し合わせることにより、各候補グループ数niのグループについての誤差評価値を算出する。
【0183】
習熟度推定装置201の出力部505は、候補グループ数(n1,n2,…,nc)のうち、評価された誤差が最小となる候補グループ数niのグループについて算出された各作業者の習熟度θを出力する。具体的には、例えば、出力部505は、誤差評価値が最小となる候補グループ数niのグループについて算出された各作業者の習熟度θを、習熟度推定結果1520として出力する。
【0184】
(リーフのグループ分け例)
ここで、
図16を用いて、リーフのグループ分け例について説明する。ここでは、案件データが表す作業量の実測値を「トライ数」とし、案件データが表す特徴量を「特徴量X,Y」とする。
【0185】
図16は、リーフのグループ分け例を示す説明図である。
図16において、X軸を「特徴量X」とし、Y軸を「特徴量Y」とし、Z軸を「トライ数」とする座標系1600において、案件データを表す点(
図16中、●)が表示されている。
【0186】
案件データは、トライ数を目的変数とし、特徴量X,Yを説明変数として、回帰木によりリーフに分類される。点線枠は、目的変数に応じて分けられたリーフの区切りを表す。各リーフの座標は、リーフに属する案件データが表すトライ数の平均と、特徴量X,Yの平均とである。トライ数と、特徴量X,Yとのスケールは、同程度の広がりを持つように座標変換するものとする。
【0187】
習熟度推定装置201は、リーフを単位としてクラスタリングする。ここでは、模様の違いよりグループの違い(クラスタリング結果)を表している。例えば、同一模様の領域(リーフに相当)1601,1602,1603,1604は、同一グループに属するリーフを表している。習熟度推定装置201は、トライ数のばらつきが小さいリーフ単位でクラスタリングすることで、トライ数の特徴を持ったグループに案件データを分類することができる。
【0188】
(習熟度推定装置201の習熟度推定処理手順)
つぎに、習熟度推定装置201の習熟度推定処理手順について説明する。
【0189】
図17は、実施の形態4にかかる習熟度推定装置201の習熟度推定処理手順の一例を示すフローチャートである。
図17において、習熟度推定装置201は、複数の案件データを取得する(ステップS1701)。つぎに、習熟度推定装置201は、候補グループ数(n
1,n
2,…,n
c)と、候補深さ(d
1,d
2,…,d
c)とを取得する(ステップS1702)。
【0190】
そして、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)と候補深さ(d1,d2,…,dc)との組合せのうち選択されていない未選択の組合せ(ni,di)を選択する(ステップS1703)。つぎに、習熟度推定装置201は、作業量を目的変数とし、特徴量を説明変数として、選択した候補深さdiの回帰木により、複数の案件データを複数のリーフに分類する(ステップS1704)。
【0191】
そして、習熟度推定装置201は、分類した各リーフに属する案件データが表す特徴量と作業量の実測値とに基づいて、各リーフの座標を算出する(ステップS1705)。つぎに、習熟度推定装置201は、算出した各リーフの座標に基づき、複数のリーフを、選択した候補グループ数niのグループに分類する(ステップS1706)。
【0192】
そして、習熟度推定装置201は、分類した候補グループ数niのグループに含まれるグループ内のリーフが表す作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出する(ステップS1707)。
【0193】
そして、習熟度推定装置201は、グループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内のリーフが表す作業量の実測値との誤差を評価することにより、候補グループ数niのグループについて、誤差評価値を算出する(ステップS1708)。
【0194】
つぎに、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)と候補深さ(d1,d2,…,dc)との組合せのうち選択されていない未選択の組合せがあるか否かを判断する(ステップS1709)。ここで、未選択の組合せがある場合(ステップS1709:Yes)、習熟度推定装置201は、ステップS1703に戻る。
【0195】
一方、未選択の組合せがない場合(ステップS1709:No)、習熟度推定装置201は、候補グループ数(n1,n2,…,nc)と候補深さ(d1,d2,…,dc)との組合せのうち、算出した誤差評価値が最小となる組合せ(ni,di)を特定する(ステップS1710)。つぎに、習熟度推定装置201は、特定した組合せ(ni,di)のグループについて算出した各作業者の習熟度θを特定する(ステップS1711)。
【0196】
そして、習熟度推定装置201は、特定した各作業者の習熟度θを含む習熟度推定結果を出力して(ステップS1712)、本フローチャートによる一連の処理を終了する。これにより、習熟度推定装置201は、各作業者の習熟度θを精度よく推定することができる。
【0197】
以上説明したように、実施の形態4にかかる習熟度推定装置201によれば、案件の処理にかかる作業量を目的変数とし、案件の特徴量を説明変数として、複数の案件データを回帰木により複数のリーフに分類することができる。また、習熟度推定装置201によれば、分類した複数のリーフそれぞれについて、各リーフに属する案件データが表す特徴量と作業量の実測値とに基づいて、各リーフの座標を算出することができる。そして、習熟度推定装置201によれば、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、算出した各リーフの座標に基づいて、複数のリーフを各候補グループ数niのグループに分類することができる。また、習熟度推定装置201によれば、分類した候補グループ数niのグループに含まれるグループ内のリーフの各作業者ごとの作業量の実測値に基づいて、特性曲線モデルCvに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルCvと、各作業者の習熟度θとを算出することができる。そして、習熟度推定装置201によれば、候補グループ数(n1,n2,…,nc)の各候補グループ数niについて、算出したグループごとの特性曲線モデルCvから特定される作業量の推定値と、当該グループ内のリーフが表す作業量の実測値との誤差を評価することができる。習熟度推定装置201は、候補グループ数(n1,n2,…,nc)のうち、評価した誤差が最小となる候補グループ数niのグループについて算出した各作業者の習熟度θを出力する。
【0198】
これにより、習熟度推定装置201は、トライ数のばらつきが小さいリーフ単位でクラスタリングすることで、トライ数の特徴を持ったグループに案件データを分類することができ、各作業者の習熟度θの推定精度を向上させることができる。
【0199】
また、習熟度推定装置201によれば、候補深さ(d1,d2,…,dc)の各候補深さdiについて、作業量を目的変数とし、特徴量を説明変数として、当該深さの回帰木により、複数の案件データを複数のリーフに分類することができる。
【0200】
これにより、習熟度推定装置201は、異なる深さの回帰木を用いた複数のパターンで案件データをリーフに分類しつつ、回帰木の深さを制限することで、階層の深い複雑な回帰木ができるのを防いで過学習を防ぐことができる。
【0201】
これらのことから、実施の形態1~4にかかる習熟度推定装置201によれば、例えば、企業や役所などの組織において、各職員が処理した案件の特徴量とトライ数から、各職員の習熟度を精度よく推定することができる。これにより、習熟度推定装置201は、各職員の習熟度を適切に把握して、各職員の業務支援や教育支援を行うことができる。
【0202】
例えば、特性曲線モデルCvは、案件の難易度と解釈することができる。分析者は、グループごとの特性曲線モデルCvを比較することで、グループに属する案件の難易度を相対的に評価することができる。このため、分析者は、新規の案件データを、学習したモデル(過去の案件データを分類したグループ)に適用することで、新規の案件データの難易度を評価することができる。分析者は、新規の案件データの難易度を評価することで、各職員の習熟度と合っている、または、各職員の成長を促すようなやや難しい案件を、各職員に優先的に割り当てることが可能となる。また、職員と案件の組み合わせで、トライ数が予測可能となるため、分析者は、例えば、全体のトライ数を最小化する割り当てを実現することができる。
【0203】
本習熟度推定方法は、例えば、自治体での住民税の賦課業務や、税金の滞納者への取り立て業務などに適用することができる。税金の滞納者への取り立て業務に適用する場合、案件の特徴量は、例えば、滞納者の特徴となる。また、案件の作業量は、滞納者の財産調査回数や、滞納者への督促回数などである。
【0204】
なお、本実施の形態で説明した習熟度推定方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本習熟度推定プログラムは、ハードディスク、フレキシブルディスク、CD-ROM、DVD、USBメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本習熟度推定プログラムは、インターネット等のネットワークを介して配布してもよい。
【0205】
また、本実施の形態で説明した情報処理装置101(習熟度推定装置201)は、スタンダードセルやストラクチャードASIC(Application Specific Integrated Circuit)などの特定用途向けICやFPGAなどのPLD(Programmable Logic Device)によっても実現することができる。
【0206】
上述した実施の形態に関し、さらに以下の付記を開示する。
【0207】
(付記1)各作業者が処理した案件の特徴量と前記案件の処理にかかる作業量の実測値とをそれぞれ表す複数の案件データを取得し、
複数の異なる候補グループ数それぞれについて、取得した前記複数の案件データを前記特徴量に基づき前記候補グループ数のグループに分類し、
分類した前記候補グループ数のグループに含まれるグループ内の案件データが表す前記作業量の実測値に基づいて、作業者の習熟度と案件の処理にかかる作業量との関係を表す特性曲線モデルに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、
算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、当該グループ内の案件データが表す前記作業量の実測値との誤差を評価し、
前記複数の異なる候補グループ数のうち、評価した前記誤差が最小となる候補グループ数のグループについて算出した前記各作業者の習熟度を出力する、
処理をコンピュータが実行することを特徴とする習熟度推定方法。
【0208】
(付記2)取得した前記複数の案件データを、訓練データとテストデータとに分割する、処理を前記コンピュータが実行し、
前記分類する処理は、
前記複数の異なる候補グループ数それぞれについて、分割した前記訓練データを前記特徴量に基づき前記候補グループ数のグループに分類し、
前記算出する処理は、
分類した前記候補グループ数のグループに含まれるグループ内の訓練データが表す前記作業量の実測値に基づいて、前記フィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、
前記評価する処理は、
算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、分割したテストデータのうち、当該グループに分類されるテストデータが表す前記作業量の実測値との誤差を評価する、
ことを特徴とする付記1に記載の習熟度推定方法。
【0209】
(付記3)分類した前記候補グループ数のグループに含まれるグループ内の案件データを、訓練データとテストデータとに分割する、処理を前記コンピュータが実行し、
前記算出する処理は、
分類した前記候補グループ数のグループに含まれるグループ内の案件データのうち、分割した前記訓練データが表す前記作業量の実測値に基づいて、前記フィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、
前記評価する処理は、
算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、当該グループ内の案件データのうち、分割した前記テストデータが表す前記作業量の実測値との誤差を評価する、
ことを特徴とする付記1に記載の習熟度推定方法。
【0210】
(付記4)前記分類する処理は、
前記作業量を目的変数とし、前記特徴量を説明変数として、取得した前記複数の案件データを回帰木により複数のリーフに分類し、
前記複数のリーフそれぞれについて、前記リーフに属する案件データが表す前記特徴量と前記作業量の実測値とに基づいて、前記リーフの座標を算出し、
前記複数の異なる候補グループ数それぞれについて、算出した前記リーフの座標に基づいて、前記複数のリーフを前記候補グループ数のグループに分類し、
前記算出する処理は、
分類した前記候補グループ数のグループに含まれるグループ内のリーフが表す前記作業量の実測値に基づいて、前記フィッティングを行うことにより、当該グループごとの前記特性曲線モデルと、前記各作業者の習熟度とを算出し、
前記評価する処理は、
算出した前記グループごとの前記特性曲線モデルから特定される前記作業量の推定値と、当該グループ内のリーフが表す前記作業量の実測値との誤差を評価する、
ことを特徴とする付記1に記載の習熟度推定方法。
【0211】
(付記5)前記分類する処理は、
複数の異なる回帰木の深さそれぞれについて、前記作業量を目的変数とし、前記特徴量を説明変数として、前記深さの回帰木により、前記複数の案件データを複数のリーフに分類する、ことを特徴とする付記4に記載の習熟度推定方法。
【0212】
(付記6)前記特性曲線モデルは、右下がりの2次曲線を表す関数である、ことを特徴とする付記1~5のいずれか一つに記載の習熟度推定方法。
【0213】
(付記7)各作業者が処理した案件の特徴量と前記案件の処理にかかる作業量の実測値とをそれぞれ表す複数の案件データを取得し、
複数の異なる候補グループ数それぞれについて、取得した前記複数の案件データを前記特徴量に基づき前記候補グループ数のグループに分類し、
分類した前記候補グループ数のグループに含まれるグループ内の案件データが表す前記作業量の実測値に基づいて、作業者の習熟度と案件の処理にかかる作業量との関係を表す特性曲線モデルに対するフィッティングを行うことにより、当該グループごとの特性曲線モデルと、前記各作業者の習熟度とを算出し、
算出した前記グループごとの特性曲線モデルから特定される前記作業量の推定値と、当該グループ内の案件データが表す前記作業量の実測値との誤差を評価し、
前記複数の異なる候補グループ数のうち、評価した前記誤差が最小となる候補グループ数のグループについて算出した前記各作業者の習熟度を出力する、
処理をコンピュータに実行させることを特徴とする習熟度推定プログラム。
【符号の説明】
【0214】
101 情報処理装置
110,710,1110,1310,1510 案件データ
120,720,1140,1340,1520 習熟度推定結果
200 情報処理システム
201 習熟度推定装置
202 ユーザ端末
210 ネットワーク
220 案件データDB
300 バス
301 CPU
302 メモリ
303 ディスクドライブ
304 ディスク
305 通信I/F
306 可搬型記録媒体I/F
307 可搬型記録媒体
500 制御部
501 取得部
502 分類部
503 算出部
504 評価部
505 出力部
600 誤差評価用テーブル
711,712,713,721,722,723 トライ数分布
801,802 トライ数分布テーブル
901,902 特性曲線
1120,1320 訓練データ
1130,1330 テストデータ