(58)【調査した分野】(Int.Cl.,DB名)
請求項1に記載のシステムにおいて、従業員の異動特徴に基づいて前記取引時系列のセットをフィルタリングすることは、死亡した従業員をフィルタリングすることを含む、システム。
請求項1に記載のシステムにおいて、従業員の異動特徴に基づいて前記取引時系列のセットをフィルタリングすることは、退職した従業員をフィルタリングすることを含む、システム。
請求項1に記載のシステムにおいて、従業員の異動特徴に基づいて前記取引時系列のセットをフィルタリングすることは、臨時従業員をフィルタリングすることを含む、システム。
請求項1に記載のシステムにおいて、従業員の異動特徴に基づいて前記取引時系列のセットをフィルタリングすることは、短時間勤務の従業員をフィルタリングすることを含む、システム。
請求項1に記載のシステムはさらに、前記時系列に関連する雇用期間に少なくとも部分的に基づいて、時系列の前記サブセットを1または複数のサブセットに分けるためのバケッタを備える、システム。
【発明を実施するための形態】
【0023】
本発明は、処理、装置、システム、物質の組成、コンピュータ読み取り可能な格納媒体上に具現化されたコンピュータプログラム製品、および/または、プロセッサ(プロセッサに接続されたメモリに格納および/またはそのメモリによって提供される命令を実行するよう構成されたプロセッサ)を含め、様々な形態で実装されうる。本明細書では、これらの実装または本発明が取りうる任意の他の形態を、技術と呼ぶ。一般に、開示された処理の工程の順序は、本発明の範囲内で変更されてもよい。特に言及しない限り、タスクを実行するよう構成されるものとして記載されたプロセッサまたはメモリなどの構成要素は、ある時間にタスクを実行するよう一時的に構成された一般的な構成要素として、または、タスクを実行するよう製造された特定の構成要素として実装されてよい。本明細書では、「プロセッサ」という用語は、1または複数のデバイス、回路、および/または、コンピュータプログラム命令などのデータを処理するよう構成された処理コアを指すものとする。
【0024】
以下では、本発明の原理を示す図面を参照しつつ、本発明の1または複数の実施形態の詳細な説明を行う。本発明は、かかる実施形態に関連して説明されているが、どの実施形態にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定されるものであり、本発明は、多くの代替物、変形物、および、等価物を含む。以下の説明では、本発明の完全な理解を提供するために、多くの具体的な詳細事項が記載されている。これらの詳細事項は、例示を目的としたものであり、本発明は、これらの具体的な詳細事項の一部または全てがなくとも特許請求の範囲に従って実施可能である。簡単のために、本発明に関連する技術分野で周知の技術要素については、本発明が必要以上にわかりにくくならないように、詳細には説明していない。
【0025】
離職リスクを判定するためのシステムが開示されている。離職リスクを判定するためのシステムは、雇用データを用いて取引時系列のセット(1セットの取引時系列)を決定するためのグループ化器(grouper)と、各取引時系列は、1従業員に関連し、従業員の異動特徴に基づいて取引時系列のセットをフィルタリングして、時系列のサブセットを決定するためのフィルタと、時系列のサブセットを正規化することにより、時系列のモデルセットを決定するための正規化器と、特徴ベクトルのセット(1セットの特徴ベクトル)を決定するための特徴ベクトル抽出器と、特徴ベクトルセットの各特徴ベクトルは、時系列のモデルセットの中の時系列から決定され、特徴ベクトルのセットに少なくとも部分的に基づいて1または複数のモデルを決定するためのモデル構築器と、1または複数のモデルを用いて所与の従業員の離職リスクを予測するための予測器と、を備える。
【0026】
離職リスク判定のためのシステムが開示されている。いくつかの実施形態において、離職リスク決定のためのシステムは、従業員取引データのセット(1セットの従業員取引データ)(例えば、従業員の職名変更、従業員の転勤、会社部署の異動など)を受信し、所与の従業員が(例えば、翌年の内に)会社を退職する可能性すなわちリスクを決定するためのモデルを生成する。離職リスク決定のためのシステムは、従業員取引データセットからの取引を従業員でグループ化し、各従業員に関連する取引をソートして、取引時系列のセットを生成し、各時系列は1人の従業員に関連する。様々な実施形態において、取引は、昇進、転勤、職名(job title)変更、管理職変更、給料変更、シフト変更、雇用、解雇、一時解雇、自主退職、または、任意のその他の適切な従業員取引を含む。或る従業員に関連する取引時系列は、取引の時間(例えば、日時)で順序付けられた一連の取引を含み、会社での従業員の職歴の経過を記載する。例えば、ある従業員の取引時系列は、雇用取引、最初の昇給取引、最初の昇進取引、転勤取引、2回目の昇給取引、2回目の昇進取引、管理職変更取引、および、自主退職取引を含む。各取引は、適切な取引情報(例えば、取引タイプ、取引日、新しい給与、新しい勤務地、新しい管理職、新しい職名、新しい職種など)を含む。取引時系列のセットは、モデルにとって有用な情報に寄与しない従業員を除去するために、異動特徴に少なくとも部分的に基づいてフィルタリングされる(例えば、異動特徴は、以下の内の1または複数を含む:残留実践に関連しない理由で退職した従業員、死亡した従業員、退職した従業員、臨時で雇用された従業員、請負人、非常に短期間しか会社に在籍しなかった従業員、など)。次いで、時系列のモデルセットが、取引を正規化することによって、フィルタリングされたセットの取引時系列から決定される。いくつかの実施形態において、取引を正規化することは、取引に関連する正規化された職名および/または正規化された職位(job level)を決定することを含む。いくつかの実施形態において、正規化された職名は、正規化された職名のセットから選択された職名を含んでおり、ここで、正規化された職名のセットは、職名のセットよりも小さい(例えば、取引のセットに関連する職名を正規化すると、取引のセットに関連する職名の総数が削減される)。いくつかの実施形態において、正規化された職位は、正規化された職位のセットから選択された職位を含んでおり、ここで、正規化された職位のセットは、職位のセットよりも小さい(例えば、取引のセットに関連する職位を正規化すると、取引のセットに関連する職位の総数が削減される)。いくつかの実施形態において、時系列のモデルセットは、雇用期間で分けられる(例えば、バケッタモジュールすなわちバケッタを用いてバケット化を行い、1〜5年間雇用されている従業員に関連する時系列が、最初のカテゴリ(または、n〜m年間)にソートされ、5〜10年間雇用されている従業員に関連する時系列が、第2のカテゴリ(または、m〜k年間)にソートされる、などである)。様々な実施形態において、バケッタモジュールは、データの複数のモデルを可能にするために、特徴ベクトル抽出前、特徴ベクトル抽出後、または、任意のその他の適切な時にある。次いで、特徴ベクトルが、時系列のモデルセットの各時系列から決定される。いくつかの実施形態において、特徴ベクトルの各特徴は、時系列から決定されたデータ計量値を含む(例えば、総雇用時間、職種の数、昇進間の平均期間、従業員が職種を異動したことがあるか否か、従業員が勤務した勤務地の総数、現在の職種の期間、など)。モデルは、時系列のセットと、時系列から決定された特徴ベクトルのセットとに基づいて、機械学習アルゴリズム(例えば、サポートベクターマシン)を用いて構築され、各従業員は特徴ベクトルで表される。いくつかの実施形態では、教師あり学習モデルが利用され、各特徴ベクトルは、関連する従業員が会社を自主的に辞職したか否かを表すラベルを含む。教師あり学習モデルは、最良の離職リスク予測精度を提供することにおける特徴の影響および相関を示す各特徴の重みを決定する。いくつかの実施形態において、例えば、第1のセットの従業員特徴ベクトルでモデルをトレーニングして、トレーニングされたモデルを第2のセットの従業員特徴ベクトルに適用することにより、交差検証が、予測の統計的有意性および精度を測るために用いられる。第1のセットの従業員特徴ベクトルおよび第2のセットの従業員特徴ベクトルは、トレーニングにおけるバイアスを避けると共にモデルを一般化可能にするために重複していない。次いで、トレーニングされたモデルは、時系列および特徴ベクトルによって表された在職中の従業員が(例えば、翌年の内に)会社を辞職する可能性を決定するために用いられる。いくつかの実施形態では、別個のモデルが、各雇用期間の区分に対して構築される。モデルが構築されると、予測器が、モデルを用いて、所与の従業員の離職リスクを決定できる。予測器は、所与の従業員に関連する取引の時系列を受信し、時系列を正規化し、正規化された時系列から特徴ベクトルを決定し、特徴ベクトルおよびモデルに基づいて予測を行う。
【0027】
いくつかの実施形態において、正規化器は、職種、職名、および/または、職務(job families)の数が削減されるように、職種、職名、職務の内の1または複数を正規化する。様々な実施形態において、正規化器は、グループ化の前後、フィルタリングの前後、特徴ベクトルの生成前、または、任意のその他の適切な時点に、その機能を実行する。
【0028】
図1は、ネットワークシステムの一実施形態を示すブロック図である。いくつかの実施形態において、
図1のネットワークシステムは、離職リスクを判定するためのシステムを備える。図の例において、
図1は、ネットワーク100を含む。様々な実施形態において、ネットワーク100は、以下の内の1または複数を含む。ローカルエリアネットワーク、ワイドエリアネットワーク、有線ネットワーク、無線ネットワーク、インターネット、イントラネット、ストレージエリアネットワーク、または、任意のその他の適切な通信ネットワーク。管理者システム102、従業員データサーバ104、および、離職リスク判定器106が、ネットワーク100を介して通信する。様々な実施形態において、管理者システム102は、管理者が、従業員データサーバ104上のデータにアクセスするため、離職リスク判定器106を用いて離職リスクを判定するため、または、任意のその他の適切な目的を遂行するためのシステムを備える。従業員データサーバ104は、従業員データを格納するためのシステムを備える。いくつかの実施形態において、従業員データサーバ104は、会社の従業員データを格納するためのシステムを備える。様々な実施形態において、従業員データサーバ104は、現在の従業員データ、過去の従業員データ、従業員取引データ、または、任意のその他の適切な従業員データを格納するためのシステムを備える。離職リスク判定器106は、離職リスクを判定するためのシステムを備える。いくつかの実施形態において、離職リスク判定器106は、離職リスクを判定するモデルを構築するためのシステムを備える。いくつかの実施形態において、離職リスクを判定するためのモデルは、従業員データサーバ104に格納されたデータに少なくとも部分的に基づく。いくつかの実施形態において、離職リスク判定器106は、モデルに少なくとも部分的に基づいて、所与の従業員の離職リスクを判定するためのシステムを備える。いくつかの実施形態において、離職リスク判定器106は、従業員に関する従業員データサーバ104からの履歴データを用いて、離職のモデルを構築およびテストし、そのモデルを用いて所与の従業員の離職リスクを判定する。
【0029】
図2は、従業員データサーバの一実施形態を示すブロック図である。いくつかの実施形態において、従業員データサーバ200は、
図1の従業員データサーバ104を含む。図の例において、従業員データサーバ200は、従業員ディレクトリ202および取引データベース204を備える。従業員ディレクトリ202は、従業員情報を含む。様々な実施形態において、従業員情報は、従業員の名前、従業員の識別子、従業員の職名、従業員の部署、従業員の勤務地、従業員の給与、従業員の上司、従業員の年齢、または、任意のその他の適切な従業員情報を含む。取引データベース204は、従業員取引のセットを含む。いくつかの実施形態において、従業員取引は、従業員イベントの記録を含む。様々な実施形態において、従業員イベントは、雇用、解雇、昇進、降格、グループ変更、転勤、給与額変更、上司変更、退職、死亡、または、任意のその他の適切な従業員イベントを含む。いくつかの実施形態において、取引は、従業員イベント前後の従業員情報の記録を含む。
【0030】
図3Aは、離職リスク判定器の一実施形態を示すブロック図である。いくつかの実施形態において、離職リスク判定器300は、
図1の離職リスク判定器106を含む。図の例において、離職リスク判定器300は、グループ化器(グルーパ)302を備える。いくつかの実施形態において、グループ化器302は、1人の従業員に関連する従業員データ(例えば、取引)を時系列にグループ化するためのグループ化器を含む。いくつかの実施形態において、グループ化器302は、従業員ごとに従業員データを集計する。いくつかの実施形態において、グループ化器302は、さらに、(例えば、取引日で)従業員データをソートする。いくつかの実施形態において、グループ化器302は、プロセッサを用いて実装される。離職リスク判定器300は、さらに、フィルタ304を備える。いくつかの実施形態において、フィルタ304は、(例えば、時系列のセットからある従業員に関連する時系列を取り除くために)従業員をフィルタリングするためのフィルタを含む。様々な実施形態において、フィルタは、異動特徴に基づいてフィルタリングを行い、退職した従業員、死亡した従業員、短期間しか会社で働いていない従業員、臨時雇用の従業員、請負人、または、任意のその他の適切な従業員を除去するためのフィルタを含む。いくつかの実施形態において、フィルタ304は、プロセッサを用いて実装される。離職リスク判定器300は、さらに、正規化器306を備える。いくつかの実施形態において、正規化器306は、取引を正規化するための正規化器を含む。様々な実施形態において、取引の正規化は、従業員の職名に関連する正規化された従業員職名を決定すること、従業員の職位に関連する正規化された従業員職位を決定すること、従業員の給与に関連する正規化された通貨価値を決定すること(例えば、該当日の交換レートに基づいて特定の通貨へ通貨価値を変換すること)(例えば、給与が変更または入金された日にドルに変換すること)、または、任意のその他の適切な方法で取引データを正規化することを含む。いくつかの実施形態において、正規化器は、職種、職名、および/または、職務の数が削減されるように、職種、職名、職務の内の1または複数を正規化する。様々な実施形態において、正規化器は、グループ化の前後、フィルタリングの前後、特徴ベクトルの生成前、または、任意のその他の適切な時点に、その機能を実行する。いくつかの実施形態において、正規化器306は、プロセッサを用いて実装される。離職リスク判定器300は、さらに、特徴ベクトル抽出器308を備える。いくつかの実施形態において、特徴ベクトル抽出器308は、時系列から特徴ベクトルを抽出するためのコンポーネントまたはモジュールを備える。いくつかの実施形態において、時系列からの特徴ベクトルを抽出することは、時系列から特徴のセットを決定することを含む。様々な実施形態において、特徴ベクトルの特徴は、職種の数、総雇用時間、昇進間の平均期間、職種が変わったか否か、勤務地の数、現在の職種の期間、または、任意のその他の適切な特徴を含む。いくつかの実施形態において、特徴ベクトル抽出器308は、プロセッサを用いて実装される。離職リスク判定器300は、さらに、モデル構築器310を備える。いくつかの実施形態において、モデル構築器310は、特徴ベクトルのセットを受信し、1または複数のモデルを構築する。いくつかの実施形態において、モデルは、重みベクトルを含む。いくつかの実施形態において、モデル構築器310は、プロセッサを用いて実装される。離職リスク判定器300は、さらに、予測器312を備える。いくつかの実施形態において、予測器312は、モデルに基づいて離職リスクを予測するための予測器を含む。いくつかの実施形態において、モデルに基づいて離職リスクを予測することは、特徴ベクトルと重みベクトルとのドット積を計算することを含む。いくつかの実施形態において、予測器312は、プロセッサを用いて実装される。様々な実施形態において、離職リスク判定器300のモジュールは、すべてが単一のプロセッサ上に実装される、各々が別個のプロセッサ上に実装される、任意の適切な方法で複数のプロセッサ上に組み合わせて実装される、もしくは、任意の他の適切な方法で実装される。様々な実施形態において、離職リスク判定器300は、さらに、(例えば、取引を受信するための)入力インターフェース、(例えば、離職リスクを提供するための)出力インターフェース、(例えば、従業員特徴(例えば、会社で働いた期間)によって、時系列を分けるための)バケッタ(bucketer)、または、任意のその他の適切なモジュールを備える。
【0031】
いくつかの実施形態において、バケッタ機能は、特徴ベクトル抽出308後およびモデル構築器310前に実行される。いくつかの実施形態において、バケッタモジュールは、従業員特徴を用いて入力データをバケット化する。例えば、従業員は、4つのバケット(例えば、会社での従業員の在職期間:1〜5年、6〜10年、11〜15年、および、16年以上)に分けられる。様々な実施形態において、各データバケットは、別個のモデルを作成するために用いられる(例えば、会社での従業員在職期間の各バケットについて1つ)。様々な実施形態において、バケッタモジュールは、従業員特徴(例えば、従業員の部門、従業員のレベル(例えば、取締役、管理職、役員、部長、社員、技術職など)を用いてバケット化し、モデルが実際の行動により良く適合するように、各バケットについて別個のモデルが構築される。
【0032】
図3Bは、離職リスク判定器の一実施形態を示すブロック図である。いくつかの実施形態において、
図3Bの離職リスク判定器は、
図1の離職リスク判定器106を含む。図の例において、生取引350は、取引のセットを含む。いくつかの実施形態において、生取引350は、
図1の従業員データサーバ104から受信される。図の例において、生取引350は、通貨正規化352によって受信される。通貨正規化352は、通貨情報を正規化する(例えば、価値を直接比較できるように異なる通貨を共通通貨に正規化することによって、インフレーションを考慮することによって、など)。通貨正規化352によって正規化された取引は、職正規化354によって受信される。職正規化354は、職名、職務、および/または、職名について取引を(例えば、職務正規化356、職名正規化358、および、職種正規化360を用いて)正規化する。いくつかの実施形態において、職正規化は、職情報(例えば、職名)を正規化された職情報に置き換えることを含んでおり、その結果、異なる職をより直接的に比較できるようになる。例えば、2つの異なる会社/部署/事業単位が、同等の役割に対して異なる職名を用いて、それらの比較を困難にしている。職正規化は、異なる会社/部署/事業単位での同等の役割が、同じ正規化された職名に関連付けられるように、会社の一方または両方の職名を正規化された職名に置き換える。職正規化354によって正規化された取引は、ユーザグループ化362によってグループ化される。ユーザグループ化362は、単一のユーザに関連する取引をそのユーザに関連する取引の時系列にグループ化する。フィルタリング364は、異動特徴に少なくとも部分的に基づいて、ユーザグループ化362によって生成された一連の時系列をフィルタリングする。様々な実施形態において、フィルタリング364は、異動特徴に関連する時系列、例えば、以下の内の1または複数に関連する時系列をフィルタリング(例えば、除去)する:(例えば、臨時従業員フィルタ366を用いて)臨時従業員に関連する時系列、(例えば、死亡従業員フィルタ368を用いて)死亡した従業員に関連する時系列、(例えば、退職者フィルタ370を用いて)退職者に関連する時系列、(例えば、雇用6ヶ月未満フィルタ372を用いて)会社での雇用が6ヶ月未満の従業員に関連する時系列、または、任意のその他の適切なフィルタ。特徴抽出374は、フィルタリング364から受信した時系列から特徴を抽出する。様々な実施形態において、特徴抽出374は、(例えば、就業時間特徴抽出376を用いて)就業時間に関連する特徴、(例えば、職種異動特徴抽出378を用いて)職種異動に関連する特徴、(例えば、職種期間特徴抽出380を用いて)職種期間に関連する特徴、(例えば、勤務地平均数特徴抽出382を用いて)勤務地の平均数に関連する特徴、または、(例えば、その他の特徴の特徴抽出384を用いて)任意のその他の適切な特徴、を抽出する。いくつかの実施形態において、特徴ベクトルは、順序付けられた組み合わせで特徴を含む。特徴抽出374によって抽出された特徴ベクトルは、トレーニング386および予測390によって受信される。トレーニング386は、受信した特徴ベクトルを用いてモデル388をトレーニングする。いくつかの実施形態において、モデルは、抽出された特徴ベクトルのサブセットでトレーニングされ、抽出された特徴ベクトルの異なるサブセットでテストされる。いくつかの実施形態において、モデルは、所定の閾値を超えるテスト特徴ベクトルについて離職リスクを正確に予測すると、別個のセットの従業員(例えば、会社からまだ移っていない従業員)に関連する特徴ベクトルについての離職リスクを予測するために用いられる。いくつかの実施形態において、特徴ベクトルについて離職リスクを正確に予測することは、特徴ベクトルが離職した従業員に関連する場合に閾値リスクを超える離職リスクを決定し、特徴ベクトルが在職中であった従業員に関連する場合に閾値リスク未満の離職リスクを決定することを含む。次いで、予測390は、モデル388を用いて、受信した特徴ベクトルに関連するユーザの離職リスクを判定する。
【0033】
図4は、取引の一実施形態を示す図である。いくつかの実施形態において、任意の適切な数の取引(例えば、取引400)が、取引データベース(例えば、
図2の取引データベース204)に格納される。図の例において、取引400は、従業員識別子402(例えば、従業員ID、一意的な従業員識別子など)、日付404(例えば、取引日)、新しい職情報406、および、以前の職情報408を含む。新しい職情報406は、任意の適切な新しい職情報(例えば、職名、職種、ランク、勤務地、会社、上司、給与、シフトなど)を含む。いくつかの実施形態において、新しい職情報は、別の会社または勤務先無し(会社無し)、を示す(例えば、取引400は、従業員が会社を離職したことを示す)。いくつかの実施形態において、取引400は、会社内での職の異動(例えば、新しいランク、職名、勤務地、上司、給与など)を示す。以前の職情報408は、任意の適切な以前の職情報(例えば、職名、ランク、勤務地、会社、上司、給与など)を含む。いくつかの実施形態において、以前の職情報は、別の会社または勤務先無し、を示す(例えば、取引400は、従業員が会社に入社したことを示す)。
【0034】
図5Aは、特徴ベクトルの一実施形態を示す図である。いくつかの実施形態において、特徴ベクトル500は、取引(例えば、
図4の取引400)の時系列から抽出された特徴を表すための特徴ベクトルを含む。いくつかの実施形態において、特徴ベクトル500の各特徴は、取引の時系列から決定された計算結果を含む。いくつかの実施形態において、計算された特徴ベクトルは、特徴ベクトル値のセットを含む。図の例において、特徴ベクトル500は、従業員の例に対して決定された特徴ベクトルのセットを含む。特徴502は、「職種数」を含む。いくつかの実施形態において、特徴502を決定することは、時系列で表された職種の総数を決定することを含む。図の例では、3つの職種が時系列に表されると決定されている。特徴504は、「在職期間」を含む。いくつかの実施形態において、特徴504を計算することは、時系列における会社での総期間を決定することを含む。図の例において、時系列は、15年間の在職期間を表すと決定されている。特徴506は、「x年ごとの昇進」を含む。いくつかの実施形態において、特徴506を計算することは、時系列において見いだされた昇進間の平均期間を決定することを含む。図の例において、時系列は、昇進の間が平均3年間であることを表すと決定されている。特徴508は、「職種異動」を含む。いくつかの実施形態において、特徴508を計算することは、従業員が時系列において職種を異動したことがあるか否かを決定することを含む。図の例では、時系列から、従業員が職種を異動したと決定されている。特徴510は、「勤務地数」を含む。いくつかの実施形態において、特徴510を計算することは、時系列で表された勤務地の総数(例えば、従業員が勤務した勤務地の数)を決定することを含む。図の例では、時系列から、従業員が2カ所の勤務地で勤務したことがあると決定されている。特徴512は、「現在の職種の期間」を含む。いくつかの実施形態において、特徴512を計算することは、時系列に見いだされた現在の職種における総期間を決定することを含む。図の例において、時系列から、従業員が現在の職種に4年間就いていたことが決定されている。
【0035】
図5Bは、重みベクトルの一実施形態を示す図である。いくつかの実施形態において、重みベクトル550は、特徴のセット(例えば、
図5Aの特徴ベクトル500で示した特徴のセット)に関連する重みのセットを含む。いくつかの実施形態において、重みベクトル550は、モデル構築器(例えば、
図3Aのモデル構築器310)からの出力を含む。いくつかの実施形態において、重みベクトル550は、モデルを含む。いくつかの実施形態において、重みベクトル550の重みの符号は、関連する特徴の離職リスクへの寄与の方向性を表し、重みベクトル550の重みの値は、関連する特徴の離職リスクへの寄与の強さを表す。重み552は、「職種数」の重みを含む。いくつかの実施形態では、重み552と、時系列で表された職種の総数とを乗じて、その積が離職リスク値に加算される。図の例において、重み552は、−0.625を含む。重み554は、「在職期間」の重みを含む。いくつかの実施形態では、重み554と、時系列で表された在職期間とを乗じて、その積が離職リスク値に加算される。図の例において、重み554は、−0.556を含む。重み556は、「x年ごとの昇進」の重みを含む。いくつかの実施形態では、重み付け556と、時系列に見いだされた昇進間の平均期間を乗じて、その結果が離職リスク値に加算される。図の例において、重み付け556は、−0.461を含む。重み558は、「職種異動」の重みを含む。いくつかの実施形態では、重み558と、従業員が時系列において職種を異動したか否か(例えば、従業員が職種を異動した場合には1、そうでない場合には0)とを乗じて、その結果が離職リスク値に加算される。図の例において、重み558は、−0.278を含む。重み560は、「勤務地数」の重みを含む。いくつかの実施形態では、重み560と、時系列で表された勤務地の総数(例えば、従業員が勤務した勤務地の数)とを乗じて、その結果が離職リスク値に加算される。図の例において、重み560は、−0.067を含む。特徴562は、「現在の職種の期間」の重みを含む。いくつかの実施形態では、重み562と、時系列において見いだされた現在の職種の総期間とを乗じて、その結果が離職リスク値に加算される。図の例において、重み562は、0.313を含む。
【0036】
図6Aは、職階層の一実施形態を示す図である。図の例では、職種600が、最上位の事業単位を表す。例えば、製造、事業、経理、法務など、会社の部門である。職種600のサブユニットは、職務(例えば、職務602、職務604、および、職務606)である。例えば、製造部門の中には、品質保証、梱包、組み立て、機械加工など、いくつかの職務がサブユニットになっている。職務604のサブユニットは、職名(例えば、職名608、職名610、および、職名612)である。例えば、機械加工の中には、機械工1、機械工2、機械工管理者などがある。
【0037】
図6Bは、職種の階層クラスタリングの一実施形態を示す図である。いくつかの実施形態において、職種の階層クラスタリングは、職名に関連して正規化された職種の決定を含む。図の例において、
図6Bに示す職種の階層ツリーは、会社で見いだされたすべての職種を含んだ階層ツリーを含む。いくつかの実施形態において、例えば、
図3Aの離職リスク判定器300によって処理される職種の総数は、正規化によって(例えば、
図3Aの正規化器306によって)削減される。いくつかの実施形態において、正規化は、職名に関連して正規化された職種を決定することを含む。いくつかの実施形態において、正規化された職種は、職の階層クラスタリングを用いて決定された職名を含む。図の例では、職種が、階層構造に編成されている。選択された職種グループ(例えば、グループを囲む破線で示されている)が、階層構造内で近いと決定され、その結果、それらの正規化された職種は、同じ職種を含む。いくつかの実施形態において、職種の正規化は、職種の総数を削減するために、いくつかの職種を単一の正規化された職種にまとめることを含む。図の例では、戦略および経理が1つの職種にまとめられ、コンプライアンスおよび法務が1つの職種にまとめられ、マーケティング、営業、および、営業&マーケティングサポートが1つの職種にまとめられ、臨床、品質保証、および、規制関連業務が1つの職種にまとめられ、技術および製造が1つの職種にまとめられている。図の例では、24の職種が、このように17まで削減される。いくつかの実施形態では、職位が、同様の方法でクラスタリングされて、職位の総数が削減される。いくつかの実施形態において、職種の階層クラスタリングのための処理は、凝集クラスタリングを用いる。正規化された職種が、各職種に対応して割り当てられる。一連の工程が実行され、各工程では、どの2つの職種が、職種内の職名と、従業員がそれらの職種間で異動することの点で近いのかに基づいて、2つの職種が、正規化された職種に統合される。処理は、職名および異動が停止を決定づけた時に停止する(例えば、最も近いと判定された2つの職種が近さの閾値ほど近くなくなった時)。様々な実施形態において、クラスタリングは、職名および/または職務のクラスタリングにも用いられる。いくつかの実施形態において、クラスタリングは、すべての職名をクラスタに対応付けるテーブルを生成して、職名の数を圧縮する。例えば、職名数の圧縮は、元の職名数の50〜90%を実現する。
【0038】
図7は、離職リスクを予測するための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、
図7の処理は、
図1の離職リスク判定器106によって実行される。工程700に示す例では、取引時系列のセットが、雇用データを用いて決定され、ここで、各取引時系列は、1従業員に関連する。いくつかの実施形態において、雇用データは、パフォーマンスデータ(例えば、年当たりの昇進回数、パフォーマンス評価、販売実績など)を含む。工程702において、取引時系列のセットは、時系列のサブセットを決定するために、従業員の異動特徴に基づいてフィルタリングされる。工程704において、時系列のモデルセットが、時系列のサブセットを正規化することによって決定される。様々な実施形態において、時系列のサブセットを正規化することは、従業員の職名に関連する正規化された従業員職名を決定すること、従業員の職位に関連する正規化された従業員職位を決定すること、従業員の給与に関連する正規化された通貨価値を決定すること、または、任意の他の適切な方法で時系列のサブセットを正規化することを含む。工程706において、特徴ベクトルのセットが決定され、ここで、特徴ベクトルセットの各ベクトルは、時系列のモデルセットの時系列から決定される。工程708において、1または複数のモデルが、特徴ベクトルのセットに少なくとも部分的に基づいて決定される。工程710において、離職リスクが、1または複数のモデルを用いて所与の従業員に対して予測される。
【0039】
図8は、雇用データを用いて、取引の時系列のセットを決定するための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、
図8の処理は、
図7の工程700を実施する。図の例では、工程800において、次の取引が選択される。いくつかの実施形態において、次の取引は、最初の取引を含む。いくつかの実施形態において、次の取引は、従業員データサーバ(例えば、
図1の従業員データサーバ104)から受信した取引のセットの内の1つを含む。工程802で、選択された取引に関連する従業員IDが決定される。工程804で、選択された取引が、従業員IDに関連する時系列に追加される。いくつかの実施形態において、選択された取引は、従業員IDに関連する時系列の最後に追加される。いくつかの実施形態において、選択された取引は、時系列が日付でソートされたままになるように、従業員IDに関連する時系列内の適切な時点に追加される。いくつかの実施形態において、従業員IDに関連する時系列が存在しない場合、従業員IDに関連する新しい時系列が作成され、選択された取引は、新しい時系列に追加される。工程806で、さらなるの取引(例えば、従業員データサーバから受信されたさらなる取引)が存在するか否かが判定される。さらなる取引が存在すると判定された場合、制御は、工程800に戻る。さらなる取引が存在しないと判定された場合、処理は終了する。いくつかの実施形態において、取引の時系列のセットが決定された後、時系列セットの各時系列が時間でソートされる(例えば、取引のセットが時系列になるように)。
【0040】
図9は、取引の時系列のセットをフィルタリングするための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、
図9の処理は、
図7の工程702を実施する。いくつかの実施形態において、
図9の処理は、取引時系列のセットを決定するための処理(例えば、
図8の処理)から受けた取引時系列のセットをフィルタリングする。いくつかの実施形態では、異動特徴が、フィルタリングを行うか否かを判定するために用いられる。様々な実施形態において、異動特徴は、以下の内の1または複数を含む:従業員の退職、会社で雇用中の従業員の死亡、従業員の臨時雇用であったこと、従業員が閾値期間未満の雇用であったこと、または、任意のその他の適切な異動特徴。図の例において、工程900で、次の時系列が選択される。いくつかの実施形態において、次の時系列は、最初の時系列を含む。工程902で、時系列に関連する従業員が決定される。様々な実施形態において、従業員を決定することは、従業員の名前を決定すること、従業員識別子を決定すること、関連する従業員情報を決定すること、または、任意のその他の適切な方法で従業員を決定することを含む。工程904で、従業員が退職したか否かが判定される。従業員が退職したと判定された場合、制御は、工程912に進む。従業員が退職していなかったと判定された場合、制御は、工程906に進む。工程906で、従業員がこの会社に雇われている間に死亡したか否かが判定される。従業員がこの会社に雇われている間に死亡したと判定された場合、制御は、工程912に進む。従業員がこの会社に雇われている間に死亡しなかったと判定された場合、制御は、工程908に進む。工程908で、従業員が臨時雇用であったか否かが判定される。従業員が臨時雇用であったと判定された場合、制御は、工程912に進む。従業員が臨時雇用でなかったと判定された場合、制御は、工程910に進む。工程910で、従業員が閾値期間未満の雇用であったか否かが判定される。従業員が閾値期間未満の雇用であったと判定された場合、制御は、工程912に進む。従業員が閾値期間未満の雇用ではなかったと判定された場合、制御は、工程914に進む。工程912において、時系列が時系列セットから削除される(例えば、関連する従業員が時系列セットからフィルタリング除去される)。次いで、制御は、工程914に進む。工程914において、さらなる時系列があるか否かが判定される。さらなる時系列があると判定された場合、制御は、工程900に進む。さらなる時系列がないと判定された場合、制御は終了する。
【0041】
図10Aは、時系列のサブセットを正規化することによって時系列のモデルセットを決定するための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、
図10Aの処理は、
図7の工程704を実施する。図の例において、工程1000で、次の時系列が選択される。いくつかの実施形態において、次の時系列は、最初の時系列を含む。工程1002において、次の取引(例えば、選択された時系列の次の取引)が選択される。いくつかの実施形態において、次の取引は、最初の取引を含む。工程1004で、選択された取引が正規化される。工程1006で、さらなる取引(例えば、選択された時系列内のさらなる取引)があるか否かが判定される。さらなる取引が存在すると判定された場合、制御は、工程1002に戻る。さらなる取引がないと判定された場合、制御は、工程1008に進む。工程1008において、さらなる時系列があるか否かが判定される。さらなる時系列があると判定された場合、制御は、工程1000に進む。さらなる時系列がないと判定された場合、制御は終了する。いくつかの実施形態において、各時系列の各取引が正規化された後の時系列のセットは、時系列のモデルセットを含む。
【0042】
図10Bは、取引を正規化するための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、
図10Bの処理は、
図10Aの工程1004を実施する。図の例において、工程1050で、新しい職名が決定される(例えば、取引の新しい職に関連した職名)。工程1052で、関連する正規化された新しい職名が決定される。いくつかの実施形態において、関連する正規化された新しい職名は、職名正規化テーブルを用いて決定される。いくつかの実施形態において、関連する正規化された新しい職名は、取引の一部として格納される。いくつかの実施形態において、関連する正規化された新しい職名は、取引内の新しい職名に取って代わる。工程1054で、新しい職位が決定される(例えば、取引の新しい職に関連する職位)。工程1056で、関連する正規化された新しい職位が決定される。いくつかの実施形態において、関連する正規化された新しい職位は、職位正規化テーブルを用いて決定される。いくつかの実施形態において、関連する正規化された新しい職位は、取引の一部として格納される。いくつかの実施形態において、関連する正規化された新しい職位は、取引内の新しい職位に取って代わる。工程1058で、以前の職名が決定される(例えば、取引の以前の職に関連する職名)。工程1060で、関連する正規化された以前の職名が決定される。いくつかの実施形態において、関連する正規化された以前の職名は、職名正規化テーブルを用いて決定される。いくつかの実施形態において、関連する正規化された以前の職名は、取引の一部として格納される。いくつかの実施形態において、関連する正規化された以前の職名は、取引内の以前の職名に取って代わる。工程1062で、以前の職位が決定される(例えば、取引の以前の職に関連する職位)。工程1064で、関連する正規化された以前の職位が決定される。いくつかの実施形態において、関連する正規化された以前の職位は、職位正規化テーブルを用いて決定される。いくつかの実施形態において、関連する正規化された以前の職位は、取引の一部として格納される。いくつかの実施形態において、関連する正規化された以前の職位は、取引内の以前の職位に取って代わる。
【0043】
図11は、時系列セット内の時系列をバケットにソートするための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、
図11の処理は、
図1の離職リスク判定器106のバケッタモジュールによって実行される。図の例において、工程1100で、バケット情報が受信される(例えば、システム管理者から、格納されたバケット情報から、など)。いくつかの実施形態において、バケット情報は、カテゴリのセット(1セットのカテゴリ)を記述する。いくつかの実施形態において、時系列セット内の各時系列は、カテゴリセット内の1つのカテゴリ(例えば、1つの「バケット」)に関連する。いくつかの実施形態において、カテゴリセットは、従業員在職期間カテゴリを含む(例えば、会社に1〜5年間在籍している従業員、会社に5〜10年間在籍している授業員、会社に10〜20年間在籍している従業員など)。工程1102で、次の時系列が選択される。いくつかの実施形態において、次の時系列は、最初の時系列を含む。工程1104で、時系列に関連するバケットが決定される。いくつかの実施形態において、時系列に関連するバケットは、バケット情報および従業員情報から決定される。工程1106において、さらなる時系列があるか否かが判定される。さらなる時系列があると判定された場合、制御は、工程1102に進む。さらなる時系列がないと判定された場合、制御は終了する。
【0044】
図12は、特徴ベクトルのセットを決定するための処理の一実施形態を示すフローチャートであり、各特徴ベクトルは、時系列セットの時系列から決定される。いくつかの実施形態において、
図12の処理は、
図7の工程706を実施する。図の例において、工程1200で、次の時系列が選択される。いくつかの実施形態において、次の時系列は、最初の時系列を含む。工程1202で、従業員の職種数が決定される。いくつかの実施形態において、従業員は、時系列に関連する従業員を含む。いくつかの実施形態において、従業員の職種数は、時系列に見られる従業員に関連する職種の総数を含む。工程1204で、従業員の総雇用時間が決定される。いくつかの実施形態において、従業員の総雇用時間は、時系列に見られる会社在籍の総時間を含む。工程1206で、従業員の昇進間の平均期間が決定される。いくつかの実施形態において、従業員の昇進間の平均期間は、時系列に見られる昇進間の平均期間を含む。工程1208で、従業員が職種を異動したか否かが決定される。いくつかの実施形態において、従業員が職種を異動したか否かは、職種の異動が時系列内で見られるか否かを判定することによって決定される。工程1210で、従業員の勤務地数が決定される。いくつかの実施形態において、従業員の勤務地数は、時系列に見られる勤務地数を含む。工程1212で、従業員の現在の職種の期間が決定される。いくつかの実施形態において、従業員の現在の職種の期間は、時系列に見られる現在の職種の期間を含む。工程1216において、さらなる時系列があるか否かが判定される。さらなる時系列があると判定された場合、制御は、工程1200に進む。さらなる時系列がないと判定された場合、制御は終了する。
【0045】
図13は、モデルを決定するための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、
図13の処理は、
図7の工程708を実施する。図の例において、工程1300で、次のバケットが選択される。いくつかの例において、次のバケットは、最初のバケットを含む。いくつかの実施形態において、各時系列および関連する特徴ベクトルが、バケットに関連付けられる。いくつかの実施形態において、各時系列は、
図11の処理を用いてバケットに関連付けられる。いくつかの実施形態では、バケットが決定されていない(例えば、すべての時系列および関連する特徴ベクトルが、同じバケットに関連付けられる)。工程1302で、新しいモデルが、選択されたバケット内の特徴ベクトルを用いてトレーニングされる。いくつかの実施形態において、モデルは、(例えば、1年以内に)自主退職した従業員(例えば、特徴ベクトルによって表された従業員)と、自主退職しなかった従業員とを区別するための分類子を含む。いくつかの実施形態において、モデルは、線形サポートベクターマシンかを含む。工程1304で、さらなるバケットがあるか否かが判定される。さらなるバケットがある場合、制御は、工程1300に戻る。さらなるバケットがない場合、処理は終了する。
【0046】
図14は、1または複数のモデルを用いて所与の従業員の離職リスクを予測するための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、
図14の処理は、
図7の工程710を実施する。図の例において、工程1400で、従業員に関連する時系列が受信される。いくつかの実施形態において、従業員に関連する時系列は、グループ化器(例えば、
図3Aのグループ化器302)から受信される。いくつかの実施形態において、従業員に関連する時系列は、従業員に関連するグループ化された取引のセット(例えば、
図2の取引データベース204に格納された取引)を含む。工程1402で、時系列が(例えば、
図3Aの正規化器306によって)正規化される。工程1404で、特徴ベクトルが(例えば、
図3Aの特徴ベクトル抽出器によって)正規化された時系列から決定される。工程1406で、離職リスクが、特徴ベクトルおよびモデルに基づいて決定される。いくつかの実施形態において、離職リスクを決定することは、特徴ベクトルと分類子閾値との間の距離を決定することを含む。いくつかの実施形態において、離職リスクを決定することは、特徴ベクトルと重みベクトルとの間のドット積を計算することを含む。
【0047】
図15は、リスク予測表示の一実施形態を示すグラフの一実施形態である。図の例では、リスク予測が、他の雇用データ(例えば、パフォーマンスデータ)に対してプロットされている。グラフ1500は、x軸1504の離職リスク(例えば、翌年内に離れる可能性の百分率)対y軸のパフォーマンス(例えば、パーセンタイル順位)をプロットしている。グラフ1500は、プルダウンメニュー1506(例えば、マーケティング部門)およびプルダウンメニュー1508(例えば、すべての職名)を含むユーザ選択可能なパラメータを有する。離職リスクおよびパフォーマンスを高低に分けて、グラフ1500内に4つの象限を設けている。高リスク高パフォーマンスの人が、右上の象限に認められる。
【0048】
図16は、リスク予測表示の一実施形態を示す表の一実施形態である。図の例において、表1600は、リスク依存度を示す。各依存度は、相対的な重み付け(例えば、重み1602)およびリスク区分(例えば、高リスク、低リスク、中リスクなど)を示す。現在の職種の期間は、50%の重みであり、>5年では高リスク、3〜5年では中リスク、および、<3年では低リスクであると、離職リスクの予測を示している。在職期間は、29%の重みであり、<3年では高リスク、3〜6年では中リスク、および、>6年では低リスクであると、離職リスクの予測を示している。勤務地数は、11%での重みであり、0〜1カ所では高リスク、2カ所では中リスク、および、>2カ所では低リスクであると、離職リスクの予測を示している。職種数は、7%の重みであり、0〜2の職種では高リスク、3の職種では中リスク、および、>3の職種では低リスクであると、離職リスクの予測を示している。昇進間の期間は、2%の重みであり、>4年では高リスク、2〜4年では中リスク、および、<2年では低リスクであると、離職リスクの予測を示している。従業員が職種を異動したか否かについては、1%の重みであり、否定では高リスク、肯定では低リスクであると、離職リスクの予測を示している。
【0049】
上述の実施形態は、理解しやすいようにいくぶん詳しく説明されているが、本発明は、提供された詳細事項に限定されるものではない。本発明を実施する多くの代替方法が存在する。開示された実施形態は、例示であり、限定を意図するものではない。