(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-05-13
(45)【発行日】2022-05-23
(54)【発明の名称】退職リスク学習モデル構築システム、退職リスク学習モデル構築方法及び退職リスク学習モデル構築プログラム
(51)【国際特許分類】
G06Q 10/10 20120101AFI20220516BHJP
G06N 20/00 20190101ALI20220516BHJP
G06Q 10/06 20120101ALI20220516BHJP
【FI】
G06Q10/10 322
G06N20/00 130
G06Q10/06 326
(21)【出願番号】P 2019236340
(22)【出願日】2019-12-26
【審査請求日】2020-11-30
(73)【特許権者】
【識別番号】518128997
【氏名又は名称】株式会社アッテル
(74)【代理人】
【識別番号】100104396
【氏名又は名称】新井 信昭
(72)【発明者】
【氏名】塚本 鋭
【審査官】渡邉 加寿磨
(56)【参考文献】
【文献】特開2016-136380(JP,A)
【文献】特開2016-207165(JP,A)
【文献】特開2019-164738(JP,A)
【文献】特開2018-142308(JP,A)
【文献】特開2017-182663(JP,A)
【文献】特開2019-79216(JP,A)
【文献】特開2018-10458(JP,A)
【文献】特開2019-135662(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G16H 10/00-80/00
G06F 16/00-16/958
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
採用企業の現在又は過去における複数の社員(以下、
本請求項において「既存社員等」という)それぞれに関する相異なる複数種のデータからなるデータ群を取得するデータ群取得手段と、
当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得手段と、
当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築手段群と、
当該予測モデル構築手段群それぞれが構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みから作成した在職・退職判別式に代入することにより、当該既存社員等の退職リスク予測のための統合予測モデルを構築する統合予測モデル構築手段と、を備え
、
前記在職・退職判別式は、当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより作成したモデル式である、
ことを特徴とする退職リスク学習モデル構築システム。
【請求項2】
採用企業の現在又は過去における複数の社員(以下、本請求項及び従属項において「既存社員等
」という)それぞれに関する相異なる複数種のデータからなるデータ群を取得するデータ群取得手段と、
当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得手段と、
当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築手段群と、
当該予測モデル構築手段群それぞれが構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該既存社員等の退職リスク予測のための統合予測モデルを構築する統合予測モデル構築手段と、を備える、
ことを特徴とする退職リスク学習モデル構築システム。
【請求項3】
当該データ群取得手段が取得したデータ群は、既存社員等の給与データ及び既存社員等の履歴データである、
ことを特徴とする請求項
2記載の退職リスク学習モデル構築システム。
【請求項4】
前記複数のデータ群のうち、少なくとも一部は、前記
採用企業とは異なる他企業の現在又は過去の社員」(以下、「他社既存社員等」という)のデータもしくはデータ群を含む、
ことを特徴とする請求項
2又は
3記載の退職リスク学習モデル構築システム。
【請求項5】
採用企業の現在又は過去における複数の社員(以下、本請求項において「既存社員等
」という)それぞれに関する給与データ及び履歴データからなる複数種のデータ群を取得するデータ群取得手段と、
当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得手段と、
当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築手段群と、
当該予測モデル構築手段群それぞれが構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該既存社員等の退職リスク予測のための統合予測モデルを構築する統合予測モデル構築手段と、を備える、
ことを特徴とする退職リスク学習モデル構築システム。
【請求項6】
コンピュータが実行する、
採用企業の現在又は過去における複数の
社員(以下、本請求項において「既存社員等
」という)それぞれに関する複数種の相異な
るデータ群を取得する
データ群取得ステップと、
当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得ステップと、
当
該データ群取得ステップで取得した学習データ群それぞれと、これらに対応する当該在職・退職データ取得ステップで取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築ステップと、
当該予測モデル構築ステップで構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得ステップで取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該既存社員等の退職リスク予測のための予測モデル
群を構築する統合予測モデル構築ステップと、を備える、
ことを特徴とする退職リスク学習モデル構築方法。
【請求項7】
コンピュータを、
採用企業の現在又は過去における複数の社員(以下、本請求項において「既存社員等
」という)それぞれに関する相異なる複数種のデータからなるデータ群を取得するデータ群取得手段と、
当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得手段と、
当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築手段群と、
当該予測モデル構築手段群それぞれが構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該既存社員等の退職リスク予測のための統合予測モデルを構築する統合予測モデル構築手段と、
として機能させる退職リスク学習モデル構築プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、退職リスク学習モデル構築システム、退職リスク学習モデル構築方法及び退職リスク学習モデル構築プログラムに関するものである。
【背景技術】
【0002】
人なくして企業は存続し得ない。このため企業は社員(名称、正規・非正規その他形態を問わず雇用されている者を含む。以下、同じ)に対して多大な投資をする。一方、そのような社員が退職すれば、それを補うため企業には新たな投資が必要になる。すなわち、退職者の代わりとなる社員(新入社員)の採用費用、引継期間における退職(予定)者と新入社員を併存させる費用、新入社員が退職社員と同程度の能力を身に着けるまでの生産性低下の穴埋め費用、その他、人事部門の経費等、がそれである。中間管理層が次々に退職したなら、その企業の存続さえ危うくする。したがって、企業は社員採用だけでなく、社員の退職リスクにも気を使わなくてはならない。しかし、社員の将来を人の感や眼力だけで予測することは難しい。そこで、社員の退職リスクを低減するため、退職しそうな社員を予測する試みがなされている。
【0003】
特許文献1は、組織に所属する者又は新規採用予定者による交替勤務耐性を把握するための問診回答結果と各問診項目に付される回帰係数に基づき、交替勤務を行う者の離職・休職確率及び/又は生産性低下リスクを数値として算定することにより、組織の人事管理を支援するシステムを開示する。
【0004】
特許文献2は、職場組織における離職リスクを、複数の従業員のストレスチェックのデータと勤怠データに応じて離職リスクを評価し、管理者に対してGUI提示する離職リスクを管理するシステムを提供する。
【0005】
特許文献3には、退職した職員の過去の勤怠情報と在職者の過去の勤怠情報とを教師データとし、退職する可能性が高い職員と、退職する可能性が低い職員とに職員を分類する分類モデルを生成し、この分類モデルに現時点から所定期間前までの在職者の勤怠情報を入力して得られる結果に基づいて、退職職員の勤務傾向と類似する勤務傾向を有する在職者を特定するように構成された情報処理装置が開示されている。
【先行技術文献】
【特許文献】
【0006】
【文献】特許第6472152号
【文献】特開2016-207165
【文献】特開2019-67281
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1ないし3に示す技術は、そもそも人間の行動は感情に支配されているものであるから完全な予測は不可能である。であるから、退職理由の一側面だけに着目した評価では、その精度がまだまだ十分に確保できない、という問題点がある。そこで、本発明が解決しようとする課題は、社員の退職リスクの予想をより高精度化し、これによって、企業の人事戦略を側面から効果的に補助することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために本発明は、次の構成を備えている。なお、何れかの請求項記載の発明を説明するに当たって行う用語の定義等は、発明のカテゴリや記載順などに関係なくその性質上可能な範囲において他の発明にも適用されるものとする。
【0009】
(請求項1記載の発明)
請求項1記載の発明に係る退職リスク学習モデル構築システム(以下、「請求項1の構築システム」という)は、採用企業の現在又は過去における複数の社員(以下、本請求項において「既存社員等」という)それぞれに関する相異なる複数種のデータからなるデータ群を取得するデータ群取得手段と、当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得手段と、当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築手段群と、当該予測モデル構築手段群それぞれが構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みから作成した在職・退職判別式に代入することにより、当該既存社員等の退職リスク予測のための統合予測モデルを構築する統合予測モデル構築手段と、を備え、前記在職・退職判別式は、当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより作成したモデル式である、ことを特徴とする。
【0010】
請求項1の構築システムによれば、まず、相異なるデータ群を用いて構築した予想モデル群を用いて統合予測モデルを構築することができる。この統合予測モデルを用いて学習すれば、高精度の退職リスクを予測することができる。高精度予測を可能とする理由は、相異なるデータ(学習データ)を用いていることから既存社員等の退職リスクを多面的に評価できるからである。すなわち、仮に一部のデータが欠損していたとしても、これらを基礎として構築した統合予測モデルであれば、その欠損を他の入手可能な学習データで補完することにより精度低下をできるだけ抑えてリスクを評価できるからである。現在又は過去の既存社員等のデータ群を用いているのは、そのようにすることによって社風や当該企業特有の事情といった当該企業の実態に即した退職リスクの予測が可能となるからである。なお、この補完以外の方法として、たとえば、相異なるデータを時間軸に紐づけて評価する方法がある。たとえば、勤怠について1か月ごとのデータを使い、給与や評価についてのデータは半年ごとのものを用いる方法である。上記例の学習データを一緒にしてリスク予測を行うと、対象期間が相違するために予測精度が低下するからである。また、教師あり学習を行うことにより、一定量の在職・正解付きデータが入手できることが前提となるものの、人間の期待する分類に近い結果が得られやすいというメリットがある。
【0011】
(請求項2記載の発明)
請求項2記載の発明に係る退職リスク学習モデル構築システム(以下、「請求項1の構築システム」という)は、採用企業の現在又は過去における複数の社員(以下、本請求項及び従属項において「既存社員等」という)それぞれに関する相異なる複数種のデータからなるデータ群を取得するデータ群取得手段と、当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得手段と、当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築手段群と、当該予測モデル構築手段群それぞれが構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該既存社員等の退職リスク予測のための統合予測モデルを構築する統合予測モデル構築手段と、を備える、ことを特徴とする。
【0012】
請求項2の構築システムによれば、まず、相異なるデータ群を用いて構築した予想モデル群を用いて統合予測モデルを構築することができる。この統合予測モデルを用いて学習すれば、高精度の退職リスクを予測することができる。高精度予測を可能とする理由は、相異なるデータ(学習データ)を用いていることから既存社員等の退職リスクを多面的に評価できるからである。すなわち、仮に一部の学習データが欠損していたとしても、これらを基礎として構築した統合予測モデルであれば、その欠損を他の入手可能な学習データで補完することにより精度低下をできるだけ抑えてリスクを評価できるからである。現在又は過去の既存社員等の学習データ群を用いているのは、そのようにすることによって社風や当該企業特有の事情といった当該企業の実態に即した退職リスクの予測が可能となるからである。なお、この補完以外の方法として、たとえば、相異なる学習データを時間軸に紐づけて評価する方法がある。たとえば、勤怠について1か月ごとの学習データを使い、給与や評価についての学習データは半年ごとのものを用いる方法である。上記例の学習データを一緒にしてリスク予測を行うと、対象期間が相違するために予測精度が低下するからである。
【0013】
(請求項3記載の発明)
請求項3記載の発明に係る退職リスク学習モデル構築システム(以下、「請求項3の構築システム」という)は、請求項2の構築システムであって、当該データ群取得手段が取得したデータ群は、既存社員等の給与データ及び既存社員等の履歴データである、ことを特徴とする。
【0014】
請求項3の構築システムによれば、給与データ及び履歴データを学習データとして活用することで、高精度な退職リスクの予想を期待することができる。給与データ及び履歴データを唯一の学習データとする趣旨ではなく、発明者らの研究によれば、一般的な業種・業態やその会社特有の事情などの違いにもよるが、退職リスクを予想するうえで給与データが有意な結果を得ることができたからである。
【0015】
(請求項4記載の発明)
請求項4記載の発明に係る退職リスク学習モデル構築システム(以下、「請求項4の構築システム」という)は、請求項2又は3の構築システムであって、前記複数の学習データ群のうち、少なくとも一部は、前記採用企業とは異なる他企業の現在又は過去の社員」(以下、「他社既存社員等」という)の学習データもしくは学習データ群を含む、ことを特徴とする。他社既存社員等の学習データ群の取得は、既存社員等の学習データ群を取得するための学習データ群取得手段に担わせてもよいし、他社既存社員等の学習データ群を取得するための他社学習データ群取得手段を構築しこれに負わせてもよい。
【0016】
請求項4のシステムによれば、既存社員等すなわち自社の社員の学習データ群が存在しないか評価基礎として十分な量ではない場合に他社既存社員等の学習データ群を用いてこれを代替・補完すること、もしくは他社既存社員等の学習データ群を取り入れたほうが実態に即した評価を行いうる場合にこれを現実化することができる。
【0017】
(請求項5記載の発明)
請求項5記載の発明に係る退職リスク学習モデル構築システム(以下、「請求項5の構築システム」という)は、採用企業の現在又は過去における複数の社員(以下、本請求項において「既存社員等」という)それぞれに関する給与データ及び履歴データからなる複数種のデータ群を取得するデータ群取得手段と、当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得手段と、当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築手段群と、当該予測モデル構築手段群それぞれが構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該既存社員等の退職リスク予測のための統合予測モデルを構築する統合予測モデル構築手段と、を備える、ことを特徴とする。
【0018】
請求項5のシステムによれば、給与データ及び履歴データに基づいた退職リスクの予想モデルを構築することができ、これを学習データの一つとして活用することで、高精度な退職リスクの予想を期待することができる。
【0019】
(請求項6記載の発明)
請求項6記載の発明に係る退職リスク学習モデル構築方法(以下、「請求項6の構築方法」という)は、コンピュータが実行する、採用企業の現在又は過去における複数の社員(以下、本請求項において「既存社員等」という)それぞれに関する複数種の相異なるデータ群を取得するデータ群取得ステップと、当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得ステップと、当該データ群取得ステップで取得した学習データ群それぞれと、これらに対応する当該在職・退職データ取得ステップで取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築ステップと、当該予測モデル構築ステップで構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得ステップで取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該既存社員等の退職リスク予測のための予測モデル群を構築する統合予測モデル構築ステップと、を備える、ことを特徴とする。
【0020】
請求項6の構築方法によれば、コンピュータを用いて次の処理が可能となる。すなわち、相異なる学習データ群を用いて構築した予想モデル群を用いて統合予測モデルを構築することができる。この統合予測モデルを用いて学習すれば、高精度の退職リスクを予想することができる。なぜなら相異なる学習データを用いていることから既存社員等の退職リスクを多面的に評価でき、これを基礎として構築した統合予測モデルであれば、退職リスクを俯瞰的に評価できるからである。現在又は過去の既存社員等の学習データ群を用いているのは、そのようにすることによって社風や当該企業特有の事情といった当該企業の実態に即した退職リスクの予想が可能となるからである。
【0021】
(請求項7記載の発明)
請求項7記載の発明に係る退職リスク学習モデル構築プログラム(以下、「請求項7の構築プログラム」という)は、コンピュータを、採用企業の現在又は過去における複数の社員(以下、本請求項において「既存社員等」という)それぞれに関する相異なる複数種のデータからなるデータ群を取得するデータ群取得手段と、当該既存社員等それぞれの在職・退職状況を示す在職・退職データ群を取得する在職・退職データ取得手段と、当該データ群取得手段が取得したデータ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する予測モデル構築手段群と、当該予測モデル構築手段群それぞれが構築した予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行うことにより、当該既存社員等の退職リスク予測のための統合予測モデルを構築する統合予測モデル構築手段と、として機能させるプログラムである。
【0022】
請求項7の構築プログラムによれば、コンピュータを用いて次の処理が可能となる。すなわち、相異なるデータ群を用いて構築した予想モデル群を用いて統合予測モデルを構築することができる。この統合予測モデルを用いて学習すれば、高精度の退職リスクを予測することができる。高精度予測を可能とする理由は、相異なるデータ(学習データ)を用いていることから既存社員等の退職リスクを多面的に評価できるからである。すなわち、仮に一部の学習データが欠損していたとしても、これらを基礎として構築した統合予測モデルであれば、その欠損を他の入手可能な学習データで補完することにより精度低下をできるだけ抑えてリスクを評価できるからである。現在又は過去の既存社員等の学習データ群を用いているのは、そのようにすることによって社風や当該企業特有の事情といった当該企業の実態に即した退職リスクの予測が可能となるからである。なお、この補完以外の方法として、たとえば、相異なる学習データを時間軸に紐づけて評価する方法がある。たとえば、勤怠について1か月ごとの学習データを使い、給与や評価についての学習データは半年ごとのものを用いる方法である。上記例の学習データを一緒にしてリスク予測を行うと、対象期間が相違するために予測精度が低下するからである。
【発明の効果】
【0023】
本発明によれば、学習モデルを提供することで社員の退職リスクの予想をより高精度化し、これによって、企業の人事戦略を側面から効果的に補助することができる。
【図面の簡単な説明】
【0024】
【
図1】学習モデルシステムの概略を示すブロック図である。
【
図2】退職リスク予想モデルの構築方法を示すフロー図である。
【
図3】退職リスク予想モデルの構築方法を示すフローチャートである。
【
図4】退職リスク予想モデルの構築方法を示すフローチャートである。
【発明を実施するための最良の形態】
【0025】
(本実施形態)
以下、図面を参照しながら、本発明を実施するための最良の形態(以下、「本実施形態」という)を説明する。以下では、最初に主要用語を定義づけし、その後に具体的な形態の説明を行う。
【0026】
(退職リスク学習モデル構築システムの概略)
図1は、企業社員の退職リスクを予想するための退職リスク学習モデル構築システム1(以下、「構築システム1」という)の構成例を示す機能ブロック図である。構築システム1は、情報処理装置3と、情報処理装置3に接続された入力装置3aと表示装置3bとを備えている。情報システム1には、インターネット
(ネットワーク)Nのような通信回線を介してアクセス可能な、他社既存社員等データベース17(他社社員等DB17)や他社提供適正試験結果エータベース(他社適正試験DB19)などを含めてもよい。これらは、バスBなどによってデータ交換可能に相互接続されている。
【0027】
情報処理装置3は、たとえば、スマートホン、タブレット型コンピュータ、汎用コンピュータ、ワークステーションなどの情報処理装置(コンピュータ)であって、内部に組み込まれているため図示は省略するが、中央演算処理装置(CPU)、主メモリ(RAM)、読出し専用メモリ(ROM)、入出力装置(I/O)、及び必要に応じてハードディスク装置等の外部記憶装置(図示を省略)を具備している装置で構成されている。また、情報処理装置3は、1台の装置により構成されなければならないものではなく、ネットワークによって互いに通信可能に接続された複数台の装置によって構成されるものであってもよい。入力装置3aは、たとえば外付けのマウスやキーボードなどから構成されるが、情報処理装置3に組み込まれている場合もある。表示装置3bは、たとえば液晶ディスプレイやプリンターなどからなるものであるが、特に液晶ディスプレイは情報処理装置3に組み込まれている場合もある。
【0028】
上述のROM、もしくは外部記憶装置などには情報処理装置を情報処理装置3もしくはこれに含まれるとして機能させるためのプログラム、さらに退職リスク学習モデル構築方法(以下、「構築方法」という)をコンピュータに実行させるためのプログラム15が記憶されている。このようなプログラムを主メモリ上に載せ、CPUがこれを実行することにより情報処理装置3もしくはこれに含まれる構築手段(後述)が実現され、また構築方法が実行される。
【0029】
また、プログラム15は必ずしも情報処理装置内の記憶装置に記憶されていなくともよく、磁気ディスク、光ディスク、光磁気ディスク、CD(Compact Disc)、DVD(Digital Video Disc)などのコンピュータ読み取り可能なプログラム記録媒体や、外部の装置(例えば、ASP(Application Service Provider)のサーバなど)、さらにクラウドコンピューティングなどから提供され、これを主メモリに乗せる構成であることを妨げない。以下、情報処理装置3の具体的構成を説明する。
【0030】
(情報処理装置の構造)
図1に示す情報処理装置3は、評価群構築手段5、統合予測モデル構築手段7、退職リスク予測実行手段11、データベース群13と、プログラム15によって概ね構成されている。情報処理装置3は、入出力装置(図示を省略)を介して外部のインターネット
(ネットワーク)Nなどに接続可能であることは上述した。
【0031】
(データベース群の構造)
説明の都合上、データベース群13についてまず言及する。データベース群13は、データ群取得手段5に退職リスク予測モデルを構築するための社員の在職・退職データや関連する学習データを供給するために構築された複数種類のデータベースからなる。データベース群13は、既存社員等退職情報データベース13a(在職・退職DB13a)、既存社員等個人履歴データベース13b(履歴DB13b)、既存社員等給与・評価・等級履歴データベース13c(給与等DB13c)、既存社員等適正試験データベース13d(適正試験DB13d)、既存社員等勤怠情報データベース13e(勤怠DB13e)、既存社員等異動履歴データベース13f(異動DB13f)、既存社員等アンケート結果データベース13g(アンケートDB13g)、既存社員等外部情報データベース13h(外部情報DB13h)、教師データベース13kから構成されている。これらはいずれも評価群構築手段5を構成するデータ取得・構築手段のアクセスに応じた各種データを供給可能に構成されている。
【0032】
データベース群13を構成する各データベースのうち、特に学習モデルを提供するデータベースは適宜増減変更することができる。ここで大事なことは、複数種類のデータを元に複数種類のデータベースを構築し、これらに基づいて複数種類の予測モデルを構築する、ということである。この点は、後述する評価群構築手段5を構成する各取得手段についても同じである。以下、個々のデータベースの詳細を説明する。なお、本明細書では、データベース群13から提供されるデータを、単にデータ(データ群)と呼ぶ場合と、学習データ(学習データ群)と扱う場合がある。ここで単にデータもしくはデータ群という場合はデータベース群13から提供されるデータを在職・退職判別式に適用する場合の呼び名であって、学習データもしくは学習データ群は教師あり学習に適用する場合の呼称である。しかし両者は同じデータであって、適用される対象の異なりに合わせるために言い換えているにすぎない。混同を避けるために以下の記載では、必要な場合を除き両者を区別して記載しない点に留意されたい。
【0033】
在職・退職DB13aは、既存社員等の在職・退職データが既存社員等それぞれの個人データと紐づけして検索可能に格納するデータベースである。
【0034】
個人履歴DB13bは、既存社員等の個人履歴としてそれぞれの所属・役職のほか、たとえば、面接結果、評価(コメント)履歴、勤続年数、上司履歴、研修履歴、スキル情報、イベントへの参加履歴などに関するデータ(個人履歴データ)を含めることが好ましい。様々な個人履歴情報を取り入れることにより、当該社員の時系列的変化を通じた多面的リスク予測の精度向上に貢献するからである。この精度向上への貢献は、個人履歴の多面化に限られず、次に順次説明する既存社員等の各種関連データと、場合によっては各種関連データ同士を適宜組み合わせることで保持もしくはさらに度合いを高めることができる。
【0035】
給与等DB13cは、既存社員等それぞれの給与(評価・等級・昇進)の給与等データを、それぞれの個人データに紐づけして検索可能に格納するデータベースである。給与は、所定期間ごとに支払われる給与と同期間ごとに行われる昇給の程度・頻度などを含むのが一般的である。評価とは、人事評価すなわち業務の遂行度、業績、能力を評価し、給与や昇進等の人事施策の履歴であり、対象者の人物像(実態)を多面的に浮き彫りにするために当該社員の上司、同僚、部下など、立場や対象者との関係性が異なる複数の評価者によって評価する360度評価を含めることがリスク予想制度を高めるうえで好ましい。
【0036】
適正試験DB13dは、適正試験結果データを、それぞれの個人データに紐づけして検索可能に格納するデータベースである。適正試験とは、入社希望者の能力・適正や人となりを把握する目的で行われる試験のことをいい、「職業適性検査」「職業適性診断」「適性検査」などと呼ばれることもある。適正試験には、業者が提供する試験や、企業独自で開発した試験などもある。業者が提供する試験には、たとえば、株式会社リクルートマネジメントソリューションズが提供する「SPI」(商標)、日本エス・エイチ・エル株式会社が提供するGAB(商標)、CAB(商標)、玉手箱(商標)、株式会社ヒューマネージが提供するTG-WEB(商標)、一般社団法人日本MBTI協会が提供するMBTI(商標)、e-人事株式会社が提供するCUBICなどがある。本明細書では、このような業者提供の職務適正試験のことを「業者提供試験」ということにする。退職リスクの予想精度を高めるために、複数種類の適正試験(たとえば、業者提供試験と企業独自で開発した試験の組み合わせ)の結果を合わせて活用することもよい。
【0037】
勤怠DB13eは、既存社員等の就業状況を示す勤怠データをそれぞれの個人データに紐づけして検索可能に格納するデータベースである。勤怠データは、たとえば、タイムカードやICカードなどの勤怠管理システムを利用し、始業から終業までの時刻、フレックスタイム制の下でのコアタイム・フレキシブルタイム内の労働、時間外労働、有給休暇取得の状況などを記録したデータである。
【0038】
異動DB13fは、既存社員等それぞれの人事異動の履歴データを、好ましくは異動理由データなどを添え、それぞれの個人データに紐づけして検索可能に格納するデータベースである。そもそも人事異動は、社員の人材育成、適材適所の人員配置、慣れによる意欲低下の防止、企業戦略のための配置変更、不正の防止と発見などを目的とするものであり上手に活用すれば企業にプラスとなる一方、意に反する場合を含め社員への負担が大きいことも事実である。異動履歴に限られないが、既存社員等の在職・退職ついて過去に学び将来に活用するためである。
【0039】
アンケートDB13gは、会社の運営や自分に対する処遇などについての社員の意見のアンケートの調査結果データを、それぞれの個人データに紐づけして検索可能に格納するデータベースである。人事担当者その他の関係者の意見を加えることもよい。社員等の意見は、社員の退職理由を推し量るうえで重要であり、そのための推測基礎データとして価値がある。アンケートには、企業に対する社員の愛着心に関するエンゲージメント調査、社員のストレス状況を把握するためのストレスチェック調査、社員の能力や資質をテストやインタビューなどによって客観的に評価するためのアセスメント調査等がある。このような調査結果を学習データとし、在職・退職レベルの組み合わせによる教師学習を行って退職リスク予想モデルを構築し、このモデルを使った予測結果を上記アンケートデータとして活用することもできる。
【0040】
外部情報DB13hは、各種サービスの利用状況や当該社員のプライベート情報に関する外部情報データを、それぞれの個人データに紐づけして検索可能に格納するデータベースである。上記の各種サービスとは、社員の退職準備行動につながる可能性のあるサービスのことをいい、たとえば、対外メール、社内チャット、検索エンジン、ウェブサイト、当該会社の定款や社員規則などを閲覧させる社内システムなどをいう。これらに関し一般的に次のことが言える。対外的メールの頻度が上がっている社員には転職候補先と連絡している前兆とみられることが多く、社内チャットの回数が減っている社員にはモチベーション低下の傾向がみられやすい。「求人」のような退職・転職に関係するキーワードを検索エンジンで検索したり「転職サイトなどを閲覧したりする社員は、退職の前触れとみるべき場合が多い。定款や社員規則などを閲覧する社員には、退職準備のため退職制度を確認している気配が見て取れる。ここで得られる情報は、先に説明した履歴DB13bの個人履歴と一緒にすることもできるが、ここではより詳細なデータを処理しやすくするために別にした。
【0041】
アルゴリズムDB13kは、取得したデータ(学習データ)をガイドに、在職・退職判別する方法もしくは学習する方法を検索可能に格納するデータベースである。学習方法として、たとえば、決定木、ランダムフォレスト、ニューラルネットワーク、ディープラーニング、ロジスティック回帰、サポートベクターマシン、ナイーブベイズ、ブースティング、バギングや、これらを組み合わせるなどして構築した独自アルゴリズムがある。もちろん上記以外の教師あり学習の手法をも自由に採用しうることは言うまでもない。
【0042】
(評価群構築手段の構造)
評価群構築手段5は、個人履歴データ取得・退職予測モデル構築手段5a(個人履歴モデル構築手段5a)、給与(評価・等級)データ取得・退職予測モデル構築手段5b(給与等モデル構築手段5b)、適正試験データ取得・退職予測モデル構築手段5c(適正試験モデル構築手段5c)、勤怠データ取得・退職予測モデル構築手段5e(勤怠モデル構築手段5d)、異動履歴データ取得・退職予想モデル構築手段5f(異動モデル構築手段5e)、アンケート結果データ取得・退職予測モデル構築手段5g(アンケート結果モデル構築手段5f)、外部情報データ取得・予測モデル構築手段5h(外部情報モデル構築手段5g)から構成されている。これらの手段はいずれも、在職・退職データを必須とする既存社員等に関する各種データを取得する手段(それぞれがデータ群取得手段の構成要素となる)と、取得したデータ群に基づいて予測モデル群を構築する手段を兼ね備えていて、データの種類に応じた予測モデル群を構築する装置である。
【0043】
評価群構築手段5を構成するモデル構築手段それぞれは、データベース群13を構成するいずれのデータベース(DB)にもアクセスでき、これらから相異なる各種のデータ(学習データ)を取得し追加・統合することができるように構成されている。このため、次の説明におけるモデル構築手段それぞれが取得するデータ(学習データ)は、それらに限る趣旨ではなく、そこに記載されていない他の学習データを取り入れることを妨げない。以下において、適宜「主として」と記載しているのは、その趣旨である(後述する本実施形態の変形例で同じ)。
【0044】
個人履歴モデル構築手段5aは、主として在職・退職DB13aと履歴DB13bにアクセスし、それらから既存社員等それぞれの在職・退職データと履歴データを取得するように構成されている。すなわち、個人履歴モデル構築手段5aは、既存社員それぞれの在職・退職状況を示す在職・退職データを在職・退職DB13aから取得する在職・退職データ取得手段として機能する。そのうえで、取得した在職・退職データと履歴データに基づく在職・退職ラベルの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する。もしくは、履歴データと、在職・退職データからなるラベルとの組み合わせを学習データとして教師あり学習を行い、履歴データに基づく退職予想モデルを構築する。構築されたモデルは、後述する統合予測モデル構築手段7に送られる。
【0045】
なお、本明細書における「在職・退職判別式」とは、たとえば回帰式、判別式のことをいう。また同じく「教師あり学習」とは、事前に与えられたデータを教師の助言とみなして、それをガイドに学習する一つの機械学習のことをいう。教師あり学習の好適例として、決定木、ランダムフォレスト、ニューラルネットワーク、ディープラーニング、ロジスティック回帰、サポートベクターマシン、ナイーブベイズ、ブースティング、バギングや、これらを組み合わせるなどして構築した独自アルゴリズムがある。もちろん上記以外の教師あり学習の手法をも自由に採用しうることは言うまでもない。
【0046】
給与等モデル構築手段5bは、主として在職・退職DB13aと給与・評価等DB13cにアクセスし、それらから既存社員等それぞれの在職・退職データ(学習データ)と既存社員等給与・評価・等級履歴データ(学習データ)を取得するように構成されている。そのうえで、取得した在職・退職データと在職・退職データに基づく在職・退職ラベルの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する、もしくは、既存社員等給与・評価・等級履歴データと、在職・退職データからなるラベルとの組み合わせを学習データとして教師あり学習を行い、既存社員等給与・評価・等級履歴データに基づく退職予想モデルを構築する。構築されたモデルは、後述する統合予測モデル構築手段7に送られる。
【0047】
適正試験モデル構築手段5cは、主として在職・退職DB13aと適正試験DB13dにアクセスし、それらから既存社員等それぞれの在職・退職データと適正試験データを取得するように構成されている。そのうえで、取得した在職・退職データと適正試験データに基づく在職・退職ラベルの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する、もしくは、在職・退職データと、適正試験データからなるラベルとの組み合わせを学習データとして教師あり学習を行い、適正試験データに基づく退職予想モデルを構築する。構築されたモデルは、後述する統合予測モデル構築手段7に送られる。
【0048】
勤怠モデル構築手段5dは、主として在職・退職DB13aと、勤怠DB13eにアクセスし、それらから既存社員等それぞれの在職・退職データと、勤怠データを取得するように構成されている。そのうえで、取得した在職・退職データと勤怠データに基づく在職・退職ラベルの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する、もしくは、在職・退職データと、勤怠データからなるラベルとの組み合わせを学習データとして教師あり学習を行い、勤怠データに基づく退職予想モデルを構築する。構築されたモデルは、後述する統合予測モデル構築手段7に送られる。
【0049】
異動モデル構築手段5eは、主として在職・退職DB13aと、異動DB13fにアクセスし、それらから既存社員等それぞれの在職・退職データと、異動データを取得するように構成されている。そのうえで、取得した在職・退職データと異動データに基づく在職・退職ラベルの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する、もしくは、在職・退職データと、異動データからなるラベルとの組み合わせを学習データとして教師あり学習を行い、異動データに基づく退職予想モデルを構築する。構築されたモデルは、後述する統合予測モデル構築手段7に送られる。
【0050】
アンケート結果モデル構築手段5fは、主として在職・退職DB13aと、アンケートDB13gにアクセスし、それらから既存社員等それぞれの在職・退職データと、アンケートデータを取得するように構成されている。そのうえで、取得した在職・退職データとアンケートデータに基づく在職・退職ラベルの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する、もしくは、在職・退職データと、アンケートデータからなるラベルとの組み合わせを学習データとして教師あり学習を行い、アンケートデータに基づく退職予想モデルを構築する。構築されたモデルは、後述する統合予測モデル構築手段7に送られる。
【0051】
外部情報モデル構築手段5gは、主として在職・退職DB13aと、外部情報DB13hにアクセスし、それらから既存社員等それぞれの在職・退職データと、外部情報データを取得するように構成されている。そのうえで、取得した在職・退職データと在職・退職ラベルの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する、もしくは、在職・退職データと、外部情報データからなるラベルとの組み合わせを学習データとして教師あり学習を行い、外部情報データに基づく退職予想モデルを構築する。構築されたモデルは、後述する統合予測モデル構築手段7に送られる。なお、表示をシンプルにするため上述した7種類のモデル構築手段を、モデル構築手段5a~5gのように総称する場合がある。
【0052】
なお、上述した学習データ群は、自社の既存社員等について収集したものであることが原則である。自社であるからこそ、伝統的な社風、事業ポリシー、社内状況、取引環境などが共通するので、対象社員の退職リスクを予測するうえで好ましいからである。その一方で小規模企業における場合や、たとえば大企業の事業部における社員だけを対象社員とする場合など、退職予測モデルを構築するには十分な学習データ群を得られないことが考えられる。また、十分な学習データ群を得られるにしても、特殊な事情により、他社の学習データ群を取り入れたほうが予測精度を高められる場合もあり得る。ここで特殊な事情とは、たとえば、自社において大規模な組織構造の変化が起きた場合や、自社において前例のない新しい取り組みを行う組織を作る場合などがある。このような場合、たとえば、外部に存する他社既存社員等データベース17(他社社員等DB17)、他社適正試験データベース19(他社適正DB19)などからインターネット(ネットワーク)Nを介して他社の学習データ群を取得し、これを自社の学習データ群に合成することもできる。
【0053】
(統合予測モデル構築手段の構造)
統合予測モデル構築手段7は、各構築手段5a~5g(予想構築手段群)から送られる予測モデル群を統合して得た統合データ群それぞれと、これらに対応する当該在職・退職データ取得手段が取得した在職・退職ラベルそれぞれの組みを学習データとして教師あり学習を行う。そしてこの学習により、当該既存社員等の退職リスク予測のための統合予測モデルを構築する。統合の方法例は、後述する。
【0054】
(退職リスク予測実行手段)
退職リスク予測実行手段11は、統合予測モデル構築手段7が構築した統合予測モデルを用いて退職リスクを予測するための装置である。具体的には、退職リスク予測実行手段11は、予測対象となる対象社員(通常は複数人)に関連して必要となる各種の関連データを後述する在職・退職DB13a及び各DB13a~13hに適宜アクセスして必要なデータを取得する機能を担っている。さらに退職リスク予測実行手段11は、取得した関連データを元に対象社員の退職リスクの予想を実行する機能をも有する。
【0055】
(退職リスク予想モデルの構築方法と退職リスクの予想方法)
図2および3を参照しながら説明を行う。プログラム15の命令に基づき情報処理装置(コンピュータ)3が行う退職リスク予測モデルの構築方法と、構築した退職リスク予測モデルを用いた社員の退職リスクの予測方法について説明する。
【0056】
モデル構築手段5a~5gが、在職・退職DB13aから既存社員等の退職・在職データ群を取得する(S1)。退職・在職データそれぞれは、これらに対応する当該在職・退職データ取得手段が取得した在職・退職データに基づく在職・退職ラベルそれぞれの組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する。
【0057】
次に、情報処理装置3は、データベース群13(DB13a~13h)にアクセスし、それらから複数種のデータ群を取得する(S3)。すなわち、個人履歴モデル構築手段5aが個人履歴DB13bから個人履歴データを取得する。データ群の中には個人履歴DB13bから取得する個人履歴データが含まれ、この個人履歴データに含まれる個人名などに紐づけて、給与等その他のその個人に関連するデータ群を取得する。具体的には、給与等モデル構築手段5bが主として給与等DB13cから給与等データを取得する。同様にして適正試験モデル構築手段5cが適正DB13dから適正データを取得する。同様にして勤怠モデル構築手段5dが勤怠DB13eから勤怠データを取得する。同様にして異動モデル構築手段5eが異動DB13fから異動データを取得する。同様にしてアンケートモデル構築手段5fがアンケートDB13fからアンケート結果データを取得する。同様にして外部情報モデル構築手段5gが外部情報DB13hから外部情報データを取得する。各モデル構築手段による学習データ取得のタイミングは同時であっても、逐次であっても構わない。
【0058】
図2の符号13ctは、在職・退職DB13aと給与等DB13cから給与等モデル構築手段5b(
図1参照)が取得した、社員A~Gに関する給与等データと在職・退職データを示す給与等履歴テーブルを示す。たとえば、所定期間(たとえば、半年間)に、社員Aは60万円から63万円に増額されていて在職中(在退欄の「1」)であり、社員Eは30万円が31万円に昇給したが退職した(在退欄の「0」)であることを示す。また、
図2の符号13dtは、社員A~Gに関する適正試験データと在職・退職データを示す適正試験テーブルを示す。社員Aは、1つ目の項目が57点、2つ目の項目が43点で、在職している。一方、社員Eは、1つ目の項目が25点、2つ目の項目が53点で、退職した。紙面の関係から上記二つのテーブル以外の五つのテーブルの記載を省略したが、これら五つのテーブルについても学習データと在職・退職の組み合わせで表示される。
【0059】
複数種の学習データ群を取得した情報処理装置3は、取得した学習データ群が予測モデル群を構築するために十分な質・量に達しているかを判断する(S5)。ここで十分でないと判断するなら、他社既存社員等DB17から対応する学習データを取得し(S17)、取得した学習データを自社の既存社員等の学習データと合成した学習データを作成し(S19)、この合成学習データを用いて次のS7に進む。S5で十分な学習データ群を取得できたと判断するなら、直接S7に進む。なお、不要と考えるなら、S5、S19およびS21は省略可能である。
【0060】
かくして十分なデータ群が揃ったところで情報処理装置3は、アルゴリズムDB13kにアクセスし、そこに格納されている在職・退職判別式群の中から使用者の操作により適当なものを選択する(S6)。S7における情報処理装置3の予測モデル構築手段群5a~5gは、S3もしくはS21で取得したデータ群それぞれと在職・在職ラベルとを組みから作成した在職・退職判別式に代入することにより、当該採用企業に入社した場合の退職リスク予測のための予測モデル群を構築する。その結果、構築されたのが
図2に示す個人履歴予想モデル13bmと並ぶ予想モデル群13cm~13hmなどである。このうちから、二つの予測モデルの中身を紹介する。一つは、給与等予測モデル13cfで、他の一つは適正試験予想モデル13dfである。紙面の関係から上記二つの予想モデル以外の五つのモデルの記載を省略した。
【0061】
情報処理装置3の統合予想モデル構築手段7は、こうして出揃った予想モデル群を統合して統合予測モデル14m(
図2)を構築する(S9)。
【0062】
次は、構築した統合予測モデル14mを用いて既存社員の退職リスクの予測を行う。すなわち統合予測モデル構築手段7は、履歴データと紐づけして既存社員の学習データ群を取得し(S11)、統合予測モデル14mを用いて当該既存社員それぞれの退職リスクを予測する(S13)。予測結果を表示装置3bに表示することで(S15、
図1)、使用者が既存社員それぞれの退職リスクを閲覧することができる。表示装置3bの代わりに、プリンター(図示を省略)で印刷することで視覚化を図ってもよい。 退職リスクは、本実施形態では
図2に符号14rで示す予測結果テーブルで示される。
【0063】
(本実施形態の変形例)
図1.4に基づいて本実施形態の変形例(以下、「本変形例」という)を説明する。本変形例が本実施形態と異なるのは、本実施形態では基本的に使用者に委ねていた判別式の種類の選択を、本変形例では複数種のなかからより好適なものを選ぶ方式になっている点である。以下、その点を中心にして本変形例の説明を行う。
【0064】
本変形例に係る情報処理装置は、本実施形態の情報処理装置3と、次の点を除き同じである。このため、この相違点を除き、情報処理装置3の説明を援用する。本変形例と本実施形態との相違点は、統合予測モデル構築手段7の機能、すなわち、プログラム15の機能が拡大されている点である。したがって、以下では、この相違点を中心に説明し、本実施形態におけるそれらと共通する部分についての説明は説明を省略する。
【0065】
本変形例ではモデル構築手段5a~5gが、在職・退職DB13aから既存社員等の退職・在職データ群を取得する(S31)。退職・在職データは、既存社員等の在職・退職を判別するときの在職・退職ラベルとなる。
【0066】
次に、情報処理装置3は、データベース群13(DB13a~13h)にアクセスし、それらから複数種のデータ群を取得する(S33)。すなわち、個人履歴モデル構築手段5aが個人履歴DBから個人履歴データを取得する。データ群の中には個人履歴DB13bから取得する個人履歴データが含まれ、この個人履歴データに含まれる個人名などに紐づけて、給与等その他のその個人に関連する学習データ群を取得する。つまり、給与等モデル構築手段5bが主として給与等DB13cから給与等データを取得する。同様にして適正試験モデル構築手段5cが主として適正DB13dから適正データを取得する。同様にして勤怠モデル構築手段5dが主として勤怠DB13eから勤怠データを取得する。同様にして異動モデル構築手段5eが主として異動DB13fから異動データを取得する。同様にしてアンケートモデル構築手段5fが主としてアンケートDB13fからアンケート結果データを取得する。同様にして外部情報モデル構築手段5gが主として外部情報DB13hから外部情報データを取得する。各モデル構築手段による学習データ取得のタイミングは同時であっても、逐次であっても構わない。また、S33は、S31と同時もしくは前でもよい。
【0067】
複数種の学習データ群を取得した情報処理装置3(統合予測モデル構築手段7)は、アルゴリズムDB13kにアクセスし、既存社員等の在職・退職判別式を呼び出し選択する(S35、ここでは、回帰式を選択したことにする)。ここで、データ群が量的・質的に充分かを検証し、不足ならこれを補充・代替・変更する(S37、S61、S63)。こうして必要なデータ群が出揃ったら、統合予測モデル構築手段7が、選択した在職・退職判別式を用いて在職・退職のラベルとデータそれぞれの組み合わせによる予測モデル群を構築し(S39)、これらの予測モデルそれぞれを用いて既存社員の在職・退職を予測する(S41)。つまり、試し予測を行う。
【0068】
統合予測モデル選定手段7は、既存社員の試し予測の結果と同じ既存社員の在職・退職の実態とを比較し、所定の予測精度が得られたかを検証する(S43、S45)。すなわち試し予測と実態とのズレの幅が予め定めた許容範囲内にあるかを検証する。より具体的に説明すると、あるデータ(たとえば、給与等データとする)についてS35で選択した在職・退職判別式(ここではS35で選択した回帰式)に所定データを代入して演算を行い、その結果が許容範囲内にあるかを検証し、あるのであればS47に進み、なければS35に戻って異なる在職・退職判別式(たとえば、判別式)を選択し、これを繰り返しながら同じデータについて判別を行い(S37~S45)、それぞれ実態とのズレが最小の複数種の予測モデル(最適予測モデル群)を選定する(S47)。
【0069】
最適予測モデルを選定した統合予測モデル選定手段7は、アルゴリズムDB13kに再度アクセスして在職・退職判別式を再選択(S48)したのち、こうして出揃った複数種の最適予想モデル群を統合して統合予測モデルを構築する(S49)。以上により、統合予測モデルの構築が完了する。
【0070】
次に退職リスク予測実行手段11は、履歴データと紐づけして既存社員に関する複数種のデータ群を取得し(S51)、構築した統合予測モデルを用いて既存社員の退職リスク(在職・退職)の予測を行う(S53)。ここでも既存社員の在職・退職との比較を行い、両者間のズレが予め定めた許容範囲内にあるかを検証する(S55)。許容範囲内にあるなら次のS57へ進み、なければS48に戻る。こうして戻ったS48では、先に用いた在職・退職判別式とは異なる判別式を逐次選択してS49からS55までズレが許容範囲内に収まるまで繰り返す。
【0071】
S57での情報処理装置3は、繰り返されたS49からS55までのうち、合致度が一番高い(ズレが一番小さい)統合予測モデルを「最適統合予測モデル」に選定する。次いで、この最適統合予測モデルを用いて既存社員の在職・退職を予測し(S59)、予測結果を表示装置3b(
図1)に表示する。これにより、構築システム1の使用者等は、既存社員それぞれの退職予測、すなわち、退職リスクを把握し、その後の人事政策等に活用することができる。
【0072】
なお、これまでは、在職・退職判別式を用いて既存社員の退職リスクを把握する方式を説明したが、その代わりに同じデータ群を学習データ群として教師あり学習を行うようにしてもよい。
【符号の説明】
【0073】
1 退職リスク学習モデル構築システム(構築システム)
3 情報処理システム
3a 入力装置
3b 表示装置
5 データ群(学習データ群)取得手段
5a 個人履歴データ取得・退職予測モデル構築手段(在職・退職データ取得手段、個人履歴モデル構築手段)
5b 給与/評価/等級データ取得・退職予測モデル構築手段(給与等モデル構築手段)
5c 適正試験データ取得・退職予測モデル構築手段(適正試験モデル構築手段)
5d 勤怠データ取得・退職予測モデル構築手段(勤怠モデル構築手段)
5e 異動履歴データ取得・退職予想モデル構築手段(異動モデル構築手段)
5f アンケート結果データ取得・退職予測モデル構築手段(アンケート結果モデル構築手段)
5g 外部情報データ取得・予測モデル構築手段(外部情報モデル構築手段)
7 統合予測モデル構築手段
7A 統合予測モデル構築手段
7a 予想モデル構築手段本体
7b 最適予想モデル選定手段
7c 統合最適予想モデル構築手段
11 退職リスク予測実行手段
11a 各種学習データ取得手段
11b 予測実行手段本体
13 データベース群(データベースの総称)
13a 既存社員等退職情報データベース(在職・退職DB)
13b 既存社員等個人履歴データベース(履歴DB)
13bm 個人履歴予想モデル。
13c 既存社員等給与・評価・等級履歴データベース(給与等DB)
13cf 給与等予測結果テーブル
13cm 給与等予想モデル
13ct 給与・評価・等級履歴テーブル(給与等履歴テーブル)
13d 既存社員等適正試験データベース(適正試験DB)
13df 適正試験予測結果テーブル
13dm 適正試験予想モデル
13dt 適正試験テーブル
13e 既存社員等勤怠情報データベース(勤怠DB)
13em 勤怠予想モデル
13f 既存社員等異動履歴データベース(異動DB)
13fm 異動予想モデル
13g 既存社員等アンケート結果データベース(アンケートDB)
13gm アンケート予想モデル
13h 既存社員等外部情報データベース(外部情報DB)
13hm 外部情報予想モデル
13k 教師データベース
14m 統合予測モデル
14r 予測結果テーブル
15 プログラム
17 他社既存社員等データベース(他社社員等DB)
19 他社適正試験データベース(他社適正DB)
B バス
N インターネット(ネットワーク)