(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-08-07
(45)【発行日】2024-08-16
(54)【発明の名称】情報処理システム、情報処理方法及びプログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240808BHJP
【FI】
G06Q50/10
(21)【出願番号】P 2024059247
(22)【出願日】2024-04-01
【審査請求日】2024-04-02
【早期審査対象出願】
(73)【特許権者】
【識別番号】512313953
【氏名又は名称】株式会社ビズリーチ
(74)【代理人】
【識別番号】110002789
【氏名又は名称】弁理士法人IPX
(72)【発明者】
【氏名】中江 俊博
(72)【発明者】
【氏名】林 勝悟
【審査官】谷川 智秀
(56)【参考文献】
【文献】特開2024-013110(JP,A)
【文献】特開2016-062322(JP,A)
【文献】特開2005-258519(JP,A)
【文献】特開2020-126664(JP,A)
【文献】特許第7403027(JP,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
情報処理システムであって、
少なくとも1つのプロセッサを備え、
前記プロセッサは、プログラムを読み出すことで次の各ステップを実行するように構成され、
取得ステップでは、求職者に関する属性情報を取得し、
ここで、前記属性情報は、前記求職者の登録情報及び前記求職者の求職に関連する行動履歴の少なくとも一方を含み、
ここで、前記行動履歴には、特定の求人に対する行動、前記情報処理システムが提供するサービスへのログイン、及び前記登録情報の編集の少なくとも1つが含まれ、前記特定の求人に対する行動は、求人への応募、求人のブックマークリストへの登録、求人に基づいて送信されたスカウト文書の受信、及び前記スカウト文書への返信のいずれかに該当する行動であり、
算出ステップでは、前記属性情報と、前記登録情報の登録からの経過時間とに基づき、前記求職者の求人成約確率及び前記求職者の予測売上額を算出するとともに、前記求人成約確率と前記予測売上額との積
自体、当該積に他の数値を乗じた値、又は当該積に他の数値を加算若しくは減算した値を、前記求職者の顧客生涯価値
として算出し、
ここで、前記求人成約確率は、前記経過時間を変数とし、前記経過時間の増加に伴い、初期値から前記初期値よりも大きい収束値に収束する確率計算関数によって算出され、
前記予測売上額は、求人成約に伴って生じる売上が従う確率分布に基づいて算出され、
ここで、前記確率分布は、前記売上を確率変数とした、前記売上とその発生確率との関係を示す分布であり、前記予測売上額は、前記確率分布における前記売上の期待値として算出される、情報処理システム。
【請求項2】
請求項1に記載の情報処理システムにおいて、
前記算出ステップでは、前記求人成約確率及び前記予測売上額の算出前に、前記属性情報をパラメータ出力モデルに入力し、前記パラメータ出力モデルに、前記確率計算関数の前記収束値と、前記確率計算関数に含まれる少なくとも1つの特定定数と、前記確率分布の母数とを出力させ、ここで、前記特定定数は、前記経過時間の係数、又は前記経過時間に対し加算若しくは減算される定数のうち、前記パラメータ出力モデルの出力対象となる数値であり、
前記パラメータ出力モデルは、前記登録情報の登録時における前記属性情報と、前記登録情報に紐付けられた、求人成約の有無及び実際に発生した前記売上の額とを学習データと
して、前記属性情報を入力とし、予め設定された前記確率計算関数の前記収束値及び前記特定定数と、予め設定された前記確率分布の前記母数とを出力させるように学習された後に、実際の求人成約確率が取得されている複数の前記属性情報を用いて、前記求人成約確率の予測値と、前記実際の求人成約確率との損失が小さくなるように学習され、
ここで、前記損失は、前記予測値と前記実際の求人成約確率との乖離量であり、前記予測値は、前記属性情報を入力として前記パラメータ出力モデルが出力する前記収束値及び前記特定定数を用いた前記確率計算関数に、任意の前記経過時間を入力して得られる値であり、
前記実際の求人成約確率は、前記予測値の取得時に前記パラメータ出力モデルに入力された前記属性情報を有する求職者が、前記予測値の取得時に前記確率計算関数に入力された前記経過時間において求人成約する確率を表した統計データである、情報処理システム。
【請求項3】
請求項
2に記載の情報処理システムにおいて、
前記確率計算関数は、単調増加関数である、情報処理システム。
【請求項4】
請求項
3に記載の情報処理システムにおいて、
前記確率計算関数は、前記初期値がゼロである、情報処理システム。
【請求項5】
請求項
3に記載の情報処理システムにおいて、
前記確率計算関数の導関数は、単調減少関数である、情報処理システム。
【請求項6】
請求項
3に記載の情報処理システムにおいて、
前記確率計算関数は、下記式(1)のp(t)で表され、式(1)中、pは前記収束値、αは正の値の前記特定定数、tは前記経過時間である、情報処理システム。
p(t)=p[1-exp(-αt)] ・・・(1)
【請求項7】
請求項
2に記載の情報処理システムにおいて、
前記確率分布は、連続確率分布である、情報処理システム。
【請求項8】
請求項
7に記載の情報処理システムにおいて、
前記確率分布は、対数正規分布、ガンマ分布、切断正規分布、又はパレート分布である、情報処理システム。
【請求項9】
請求項
8に記載の情報処理システムにおいて、
前記確率分布は、対数正規分布であり、
前記算出ステップでは、前記パラメータ出力モデルに、前記母数として前記確率分布の平均及び分散を出力させる、情報処理システム。
【請求項10】
情報処理方法であって、
請求項1から請求項9のいずれか1項に記載の情報処理システムが実行する各ステップを備える、情報処理方法。
【請求項11】
プログラムであって、
コンピュータに、請求項1から請求項
9のいずれか1項に記載の情報処理システムの各ステップを実行させるための、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1に開示されるように、顧客データを用いて、顧客の将来の収益性を示す顧客生涯価値を算出する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えば、求職・求人サービスでは、顧客である求職者の登録から、求人成約に基づく売上の発生までに一定の期間が必要となる。このように、サービスや顧客の性質によっては、従来の技術で顧客生涯価値を算出することは難しい。
【0005】
本発明では上記事情に鑑み、求職者についての顧客生涯価値を予測できる情報処理システム等を提供することとした。
【課題を解決するための手段】
【0006】
本発明の一態様によれば、情報処理システムが提供される。この情報処理システムは、少なくとも1つのプロセッサを備える。プロセッサは、プログラムを読み出すことで次の各ステップを実行するように構成される。取得ステップでは、求職者に関する属性情報を取得する。ここで、属性情報は、求職者の登録情報及び求職者の求職に関連する行動履歴の少なくとも一方を含む。算出ステップでは、属性情報と、登録情報の登録からの経過時間とに基づき、求職者の求人成約確率及び求職者の予測売上額を算出するとともに、求人成約確率と予測売上額との積を用いて求職者の顧客生涯価値を算出する。ここで、求人成約確率は、経過時間を変数とし、経過時間の増加に伴い、初期値から初期値よりも大きい収束値に収束する確率計算関数によって算出される。予測売上額は、求人成約に伴って生じる売上が従う確率分布に基づいて算出される。算出ステップでは、求人成約確率及び予測売上額の算出前に、属性情報をパラメータ出力モデルに入力し、パラメータ出力モデルに、確率計算関数の収束値と、確率計算関数に含まれる少なくとも1つの特定定数と、確率分布の母数とを出力させる。ここで、パラメータ出力モデルは、属性情報を入力とし、収束値、特定定数及び母数を出力することが可能なように学習された学習モデルである。
【0007】
このような態様によれば、求職者の属性情報に基づいてパラメータが設定され、かつ、登録情報の登録からの経過時間を変数とする確率計算関数から算出される求人成約確率と、求職者の属性情報に基づいてパラメータが設定される確率分布から算出される予測売上額とを用いることで、任意の経過時間における求職者の顧客生涯価値を算出することができる。また、登録からの経過時間によらず、求職者の登録情報をパラメータ出力モデルの学習に用いられる学習データとして使用することができるため、多数の登録情報を学習に利用できるとともに、登録直後の登録情報も学習データとして使用できる。そのため、顧客生涯価値の算出精度が高められる。
【図面の簡単な説明】
【0008】
【
図2】サーバ装置10のハードウェア構成を示すブロック図である。
【
図3】求人者端末20及び求職者端末30のハードウェア構成を示すブロック図である。
【
図4】サーバ装置10(制御部11)、求人者端末20(制御部21)及び求職者端末30(制御部31)によって実現される機能を示すブロック図である。
【
図5】式(1)及び式(2)で表される確率計算関数p(t)のグラフの一例を示す図である。
【
図6】式(3)及び式(4)で表される確率計算関数p(t)のグラフの一例を示す図である。
【
図7】パラメータ出力モデルが含むニューラルネットワークの一例を示す図である。
【
図8】情報処理システム1によって実行される情報処理(顧客生涯価値の算出処理)の流れを示すアクティビティ図である。
【発明を実施するための形態】
【0009】
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。
【0010】
ところで、一実施形態に登場するソフトウェアを実現するためのプログラムは、コンピュータが読み取り可能な非一時的な記録媒体(Non-Transitory Computer-Readable Medium)として提供されてもよいし、外部のサーバからダウンロード可能に提供されてもよいし、外部のコンピュータで当該プログラムを起動させてクライアント端末でその機能を実現(いわゆるクラウドコンピューティング)するように提供されてもよい。
【0011】
また、一実施形態に係る種々の情報処理において、入力と、入力に応じた出力とが実現されうる。ここで、入力の結果として出力が得られれば、かかる情報処理において参照される情報(以下、参照情報と称する。)の態様は、限定されない。参照情報は、例えば、データベース、ルックアップテーブル、所定の関数(統計学的手法によって構築された、回帰式等の判定式を含む。)等のルールベースの情報でもよいし、入力と出力との相関を予め学習させた学習済みモデルでもよいし、プロンプトを入力することで所望の結果を出力可能な大規模言語モデルでもよい。
【0012】
また、一実施形態において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、一実施形態においては様々な情報を取り扱うが、これら情報は、例えば電圧・電流を表す信号値の物理的な値、0又は1で構成される2進数のビット集合体としての信号値の高低、又は量子的な重ね合わせ(いわゆる量子ビット)によって表され、広義の回路上で通信・演算が実行されうる。
【0013】
さらに、広義の回路とは、回路(Circuit)、回路類(Circuitry)、プロセッサ(Processor)、及びメモリ(Memory)等を少なくとも適当に組み合わせることによって実現される回路である。また、プロセッサは、汎用プロセッサでもよいし、専用の回路でもよい。すなわち、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等を含むものである。
【0014】
1.ハードウェア構成
本節では、ハードウェア構成について説明する。
【0015】
<情報処理システム1>
図1は、情報処理システム1を表す構成図である。情報処理システム1は、通信回線2と、サーバ装置10と、複数の求人者端末20と、複数の求職者端末30とを備える。サーバ装置10と、求人者端末20と、求職者端末30とは、通信回線2を通じて通信可能に構成されている。サーバ装置10、求人者端末20及び求職者端末30の接続は有線でも無線でもよい。
【0016】
情報処理システム1は、複数の求人者(第1求人者U1及び第2求人者U2)と、複数の求職者(第1求職者U3及び第2求職者U4)が利用する求人・求職システムの一部を構成する。情報処理システム1は、求職者の登録情報の管理を主に行う。一実施形態において、情報処理システム1とは、1つ又はそれ以上の装置又は構成要素からなるものである。以下、これらの構成要素について説明する。
【0017】
<サーバ装置10>
図2は、サーバ装置10のハードウェア構成を示すブロック図である。サーバ装置10は、制御部11と、記憶部12と、通信部13と、通信バス14とを備える。制御部11、記憶部12、及び通信部13は、サーバ装置10の内部において通信バス14を介して電気的に接続されている。
【0018】
<制御部11>
制御部11は、サーバ装置10に関連する全体動作の処理・制御を行う。制御部11は、例えば中央処理装置(Central Processing Unit:CPU)である。制御部11は、記憶部12に記憶された所定のプログラムを読み出すことによって、サーバ装置10に係る種々の機能を実現する。すなわち、記憶部12に記憶されているソフトウェアによる情報処理が、ハードウェアの一例である制御部11によって具体的に実現されることで、制御部11に含まれる各機能部として実行されうる。これらについては、次節においてさらに詳述する。なお、制御部11は単一であることに限定されず、機能毎に複数の制御部11を有するように実施してもよい。またそれらの組合せであってもよい。
【0019】
<記憶部12>
記憶部12は、前述の記載により定義される様々な情報を記憶する。これは、例えば、制御部11によって実行されるサーバ装置10に係る種々のプログラム等を記憶するソリッドステートドライブ(Solid State Drive:SSD)等のストレージデバイスとして、あるいは、プログラムの演算に係る一時的に必要な情報(引数、配列等)を記憶するランダムアクセスメモリ(Random Access Memory:RAM)等のメモリとして実施されうる。記憶部12は、制御部11によって実行されるサーバ装置10に係る種々のプログラム、変数等を記憶している。
【0020】
<通信部13>
通信部13は、USB、IEEE1394、Thunderbolt(登録商標)、有線LANネットワーク通信等といった有線型の通信手段が好ましいものの、無線LANネットワーク通信、3G/LTE/5G等のモバイル通信、BLUETOOTH(登録商標)通信等を必要に応じて含めてもよい。すなわち、これら複数の通信手段の集合として実施することがより好ましい。すなわち、サーバ装置10は、通信部13及びネットワークを介して、外部から種々の情報を通信してもよい。
【0021】
サーバ装置10は、オンプレミス形態であってもよく、クラウド形態であってもよい。クラウド形態のサーバ装置10としては、例えば、SaaS(Software as a Service)、クラウドコンピューティングという形態で、上述の機能や処理を提供してもよい。
【0022】
<求人者端末20>
図3は、求人者端末20及び求職者端末30のハードウェア構成を示すブロック図である。
図3Aに示されるように、求人者端末20は、制御部21と、記憶部22と、通信部23と、入力部24と、出力部25と、通信バス26とを備える。制御部21、記憶部22、通信部23、入力部24、及び出力部25は、求人者端末20の内部において通信バス26を介して電気的に接続されている。制御部21、記憶部22及び通信部23の説明は、サーバ装置10における各部の説明と同様のため省略する。なお、求人者端末20は、求人者の代わりに求職者とのやり取りを行う人材仲介業者が操作する端末であってもよい。
【0023】
<入力部24>
入力部24は、ユーザによってなされた操作入力を受け付ける。操作入力は、命令信号として通信バス26を介して制御部21に転送される。制御部21は、必要に応じて、転送された命令信号に基づいて所定の制御や演算を実行しうる。入力部24は、求人者端末20の筐体に含まれるものであってもよいし、外付けされるものであってもよい。例えば、入力部24は、出力部25と一体となってタッチパネルとして実施されてもよい。入力部24がタッチパネルとして実施される場合、ユーザは、入力部24に対してタップ操作、スワイプ操作等を入力することができる。入力部24としては、タッチパネルに代えて、スイッチボタン、マウス、トラックパッド、QWERTYキーボード等が採用可能である。
【0024】
<出力部25>
出力部25は、ユーザが操作可能なグラフィカルユーザインターフェース(Graphical User Interface:GUI)の画面を表示する。出力部25は、求人者端末20の筐体に含まれるものであってもよいし、外付けされるものであってもよい。具体的には、出力部25は、CRTディスプレイ、液晶ディスプレイ、有機ELディスプレイ、又はプラズマディスプレイ等の表示デバイスとして実施されうる。これらの表示デバイスは、求人者端末20の種類に応じて使い分けて実施されることが好ましい。
【0025】
<求職者端末30>
図3Bに示されるように、求職者端末30は、制御部31と、記憶部32と、通信部33と、入力部34と、出力部35と、通信バス36とを備える。制御部31、記憶部32、通信部33、入力部34、及び出力部35は、求職者端末30の内部において通信バス36を介して電気的に接続されている。制御部31、記憶部32、通信部33、入力部34及び出力部35の説明は、求人者端末20における各部の説明と同様のため省略する。
【0026】
2.機能構成
本節では、本実施形態の機能構成について説明する。記憶部12に記憶されているソフトウェアによる情報処理がハードウェアの一例である制御部11によって具体的に実現されることで、制御部11(情報処理システム1が備えるプロセッサ)に含まれる各機能部として実行されうる。
【0027】
図4は、サーバ装置10(制御部11)、求人者端末20(制御部21)及び求職者端末30(制御部31)によって実現される機能を示すブロック図である。
【0028】
図4Aに示されるように、サーバ装置10(制御部11)は、基本表示制御部111と、取得部112と、算出部113と、人工知能部120とを備える。
図4Bに示されるように、求人者端末20(制御部21)は、表示部211と、操作取得部212とを備える。
図4Cに示されるように、求職者端末30(制御部31)は、表示部311と、操作受付部312とを備える。
【0029】
<基本表示制御部111>
基本表示制御部111は、種々の情報を求人者端末20及び求職者端末30に表示させるように構成される。例えば、基本表示制御部111は、求職者が作成した履歴書及び職務経歴書、求人者が作成した求人票及びスカウト文書等を、求人者端末20の表示部211又は求職者端末30の表示部311に表示させる。
【0030】
求人者には、営利法人(例えば企業等)、非営利法人(例えば、協同組合、財団法人等)、公的法人(例えば地方公共団体等)等の組織が含まれる。また、求人者には、組織の代理人として、求職者と組織とを仲介する人材仲介業者も含まれる。人材仲介業者は、ヘッドハンター、エージェント等とも呼ばれる。
【0031】
<取得部112>
取得部112は、求職者に関する属性情報を取得するように構成される。属性情報は、求職者の登録情報及び求職者の求職に関連する行動履歴の少なくとも一方を含む。求職者の登録情報及び行動履歴は、例えば記憶部12に記憶された求職者データベースに登録されている。取得部112は、求職者データベースから属性情報を取得する。
【0032】
求職者の登録情報には、求職者の履歴書、職務経歴書、その他のプロフィール情報等が含まれる。「履歴書」は、主に求職者のプロフィール、現況、学歴、職歴、希望の労働条件等が記載された文書であり、「職務経歴書」は、レジュメとも呼ばれ、求職者が求人者に対して、自身のこれまでの職務に関する経歴、経験、スキル、資格等を伝える文書である。また、求職者登録情報には、求職者の希望条件(希望業種、希望職種等)が含まれてもよい。
【0033】
「求職に関連する行動履歴」には、求人への応募、求人のブックマークリストへの登録、求人に基づいて送信されたスカウト文書の受信やスカウト文書への返信等の、特定の求人に対する行動に加え、情報処理システム1へのログイン、自身の登録情報の編集等の、求職に関連する種々の行動が含まれる。なお、ブックマークリストは、求職者がブックマーク(特定ラベル)を付与した求人が登録されたリストであり、求職者は、ブックマークリストを参照することで、閲覧、応募等の行動を取るための求人を選択することができる。求職者データベースには、応募した求人の情報(求人票)、ブックマークリストに登録した求人の情報、スカウト文書に返信した求人の情報、情報処理システム1へのログイン日時(又は回数)、登録情報の編集日時等が、求職者ごとの行動履歴として登録される。
【0034】
なお、求人票には、募集するポジション名、仕事内容・労働条件(年収、職種、業種、勤務地、勤務形態、職場環境等)、応募資格(スキル)、求める人物像、アピールポイント等の複数の項目ごとに、求人情報が記載される。また、求人票には、求人のタイトル、見出し、求人者の情報(会社規模(売上、従業員数等)、業種等)などの項目が内容として含まれてもよい。
【0035】
取得部112は、例えば、求人者端末20から、後述する顧客生涯価値の算出対象となる求職者(以下、「対象求職者」)の入力(選択)を受け付け、当該求職者の属性情報を取得する。また、取得部112は、求職者データベースに登録されている全ての求職者を顧客生涯価値の対象求職者として、これらの対象求職者の属性情報を自動取得してもよい。
【0036】
<算出部113>
算出部113は、取得部112が取得した属性情報と、対象求職者の登録情報の登録からの経過時間とに基づき、対象求職者の求人成約確率及び対象求職者の予測売上額を算出するとともに、求人成約確率と予測売上額との積を用いて対象求職者の顧客生涯価値を算出するように構成される。すなわち、算出部113は、対象求職者の属性情報と経過時間とを入力とし、当該対象求職者の顧客生涯価値を出力するように構成される。
【0037】
求人成約に伴う売上が発生するタイミング(登録からの経過時間)は、求職者によって異なるところ、経過時間を変数として含む式によって顧客生涯価値を算出することで、任意の経過時間での顧客生涯価値を予測することができる。また、後述されるパラメータ出力モデルの学習データとして、特定の経過時間に固定されず、任意の経過時間の売上発生データを適用することができる。
【0038】
なお、算出部113は、求人成約確率と予測売上額との積自体を、対象求職者の顧客生涯価値としてもよいし、求人成約確率と予測売上額との積にさらに演算を行った値(例えば、当該積にさらに他の数値を乗じた値や、他の数値を加算又は減算した値等)を顧客生涯価値としてもよい。
【0039】
<求人成約確率>
求人成約確率は、経過時間を変数とし、経過時間の増加に伴い、初期値から初期値よりも大きい収束値に収束する確率計算関数によって算出される。すなわち、算出部113は、対象求職者の経過時間をこのような確率計算関数に入力することで、求人成約確率を算出する。
【0040】
確率計算関数は、単調増加関数であるとよい。すなわち、確率計算関数は、経過時間の増加に伴って求人成約確率が減少することなく増加する関数であるとよい。つまり、確率計算関数は、経過時間の増加に伴って求人成約確率が減少することなく増加するとともに、無限時刻で一定値(収束値)に収束する関数であるとよい。これにより、求職者情報の登録からの経過時間が大きくなるほど成約確率が高くなる(成約に至る求職者が増加していく)という、実際の求職者の成約傾向に沿って、対象求職者の求人成約確率を予測することができる。そのため、算出部113が算出する顧客生涯価値の精度を高めることができる。
【0041】
単調増加関数である確率計算関数の例としては、下記式(1)、式(2)、式(3)、式(4)等が挙げられる。式(1)、式(2)、式(3)、及び式(4)中、pは収束値、αは正の値の特定定数、tは経過時間(変数)、t0は正の値の特定定数である。収束値pは、経過時間tを無限時刻とした際の成約確率(無限時刻での売上発生確率(上限確率))であり、確率計算関数の初期値p(0)よりも大きい値を有し、典型的には0<p≦1である。各式におけるパラメータ(収束値及び特定定数)の設定方法については後述する。
p(t)=p[1-exp(-αt)] ・・・(1)
p(t)=p[1-(1+t)-α] ・・・(2)
p(t)=p/{1+exp[-α(t-t0)]} ・・・(3)
p(t)=p/[1+(t/t0)-α] ・・・(4)
【0042】
図5は、式(1)及び式(2)で表される確率計算関数p(t)のグラフの一例を示す図である。また、
図6は、式(3)及び式(4)で表される確率計算関数p(t)のグラフの一例を示す図である。式(1)の確率計算関数p(t)は、
図5Aのような形で、無限時刻(t→∞)で収束値pに収束する。式(2)の確率計算関数p(t)は、
図5Bのような形で、無限時刻(t→∞)で収束値pに収束する。式(3)の確率計算関数p(t)は、
図6Aのような形で、無限時刻(t→∞)で収束値pに収束する。式(4)の確率計算関数p(t)は、
図6Bのような形で、無限時刻(t→∞)で収束値pに収束する。
【0043】
また、確率計算関数は、初期値がゼロであるとよい。これにより、求職者の情報の登録直後では求人成約が発生しないとみなせる実際の成約傾向に沿って、対象求職者の求人成約確率を予測することができる。そのため、算出部113が算出する顧客生涯価値の精度が高められる。上記式(1)-(4)の中では、式(1)、式(2)、及び式(4)の確率計算関数p(t)は、t=0としたときの値である初期値p(0)がゼロである。
【0044】
さらに、確率計算関数の導関数は、単調減少関数であるとよい。すなわち、確率計算関数は、求人成約確率の経過時間に対する増加率である導関数が、経過時間の増加に伴って小さくなる(少なくとも大きくならない)とよい。これにより、経過時間が小さい初期段階で成約確率が大きく増加し、その後徐々に成約確率の増加率が減少していくような成約傾向に沿って、対象求職者の求人成約確率を予測することができる。そのため、算出部113が算出する顧客生涯価値の精度が高められる。上記式(1)-(4)の確率計算関数p(t)の中では、式(1)及び式(2)の導関数p'(t)が単調減少関数である。すなわち、式(1)及び式(2)の確率計算関数は、グラフにおける傾きの変化点を含まず、かつ、経過時間によって指数関数的に求人成約確率が増加する。
【0045】
算出部113が求人成約確率を算出する確率計算関数としては、上記式(1)の確率計算関数p(t)が好ましい。式(1)を用い、式(1)のパラメータを後述する学習モデルによって設定することで、求人成約確率の予測精度を高めることができる。
【0046】
<予測売上額>
予測売上額は、求人成約に伴って生じる売上が従う確率分布に基づいて算出される。具体的には、算出部113は、対象求職者と同一又は類似の属性を有する多数の求職者が構成する、求人成約に伴って生じる売上の確率分布(つまり売上を確率変数とする確率分布)を予測し、当該確率分布における売上の期待値を、対象求職者の予測売上額として算出する。なお、「求人成約に伴って生じる売上」は、求人者が、求人の成約ごとに、求職・求人サービスの提供者に支払う手数料(成果報酬)の金額であり、正の値である。なお、確率分布を決定するパラメータ(母数)の設定方法については後述する。
【0047】
予測売上額を求めるための確率分布は、連続確率分布であるとよい。すなわち、売上の確率分布は、連続した売上の値を扱ったものであるとよい。これにより、求職者の属性によって変化する売上の分布を反映した確率分布によって、対象求職者の予測売上額を予測することができる。その結果、算出部113が算出する顧客生涯価値の精度が高められる。
【0048】
予測売上額を求めるための確率分布は、対数正規分布、ガンマ分布、切断正規分布、又はパレート分布であるとよい。これにより、求人成約による売上の分布が再現されやすくなり、対象求職者の予測売上額の精度が向上する。そのため、算出部113が算出する顧客生涯価値の精度が高められる。
【0049】
予測売上額を求めるための確率分布は、対数正規分布であるとよい。確率分布として対数正規分布を用い、対数正規分布の母数(平均及び分散)を後述する学習モデルによって設定することで、予測売上額の予測精度を高めることができる。
【0050】
算出部113において確率分布として対数正規分布が用いられる場合、対象求職者の予測売上額は、平均μ及び分散σを用いて、μ・exp(1+σ2/2)で表される。したがって、例えば、算出部113が式(1)の確率計算関数p(t)と、対数正規分布との組み合わせを用いる場合、対象求職者の顧客生涯価値LTVは、下記式(5)で求められる。
LTV=p[1-exp(-αt)]×μ・exp(1+σ2/2) ・・・(5)
【0051】
<パラメータ設定>
算出部113は、求人成約確率及び予測売上額の算出前に、対象求職者の属性情報を人工知能部120のパラメータ出力モデルに入力し、パラメータ出力モデルに、確率計算関数の収束値と、確率計算関数に含まれる少なくとも1つの特定定数と、確率分布の母数とを出力させる。パラメータ出力モデルは、属性情報を入力とし、収束値、特定定数及び母数を出力することが可能なように学習された学習モデルである。
【0052】
上述した求人成約確率の収束値及び特定定数、並びに予測売上額の母数は、それぞれ、対象求職者の属性情報に応じてパラメータ出力モデルから出力されるため、対象求職者の属性情報に依存するパラメータである。また、これらのパラメータは、対象求職者の登録情報の経過時間には依存しない。
【0053】
パラメータ出力モデルに入力する、対象求職者の属性情報には、対象求職者の登録情報から取得される第1情報と、対象求職者の行動履歴から取得される第2情報とが含まれる。算出部113は、第1情報のみをパラメータ出力モデルに入力してもよいし、第2情報のみをパラメータ出力モデルに入力してもよいし、第1情報及び第2情報の双方をパラメータ出力モデルに入力してもよい。
【0054】
第1情報には、例えば、登録情報から抽出される特徴量が含まれる。この特徴量は、登録情報のフォーマットによらず、登録情報に記載されている内容から導かれるデータ(数値)である。特徴量としては、例えば、登録情報の内容を、その特徴を表現するベクトルに変換した特徴ベクトルが使用される。ここで、1つの登録情報から複数の特徴ベクトルが取得されてもよい。例えば、登録情報におけるカテゴリごとに、特徴ベクトルが取得されてもよい。登録情報におけるカテゴリとしては、例えば、年齢、学歴、現在の所属組織、現在の業種、現在の職種、現在の役職、現在の年収、保有スキル、保有資格、経験した組織(組織ごとの在席年数)、経験した業種(業種ごとの経験年数)、経験した職種(職種ごとの経験年数)、希望の業種、希望の職種、希望の年収、希望の勤務地等が挙げられる。
【0055】
第1情報の特徴ベクトルには、登録情報に含まれる文章のベクトル化により得られる第1ベクトルと、登録情報に含まれる属性のベクトル化により得られる第2ベクトルとが含まれる。算出部113は、パラメータ出力モデルに入力する特徴量として、第1ベクトルのみを用いてもよいし、第2ベクトルのみを用いてもよいし、第1ベクトルと第2ベクトルとの双方を用いてもよい。
【0056】
算出部113は、例えば、以下の手順で登録情報に含まれる文章を第1ベクトルに変換する。まず、算出部113は、登録情報に含まれるテキストデータを形態素解析し、文章を単語単位で分割する。さらに、分割した単語のフィルタリングによって、ストップワード(助詞、助動詞等の機能語)を除去するとともに、名詞だけを抽出する。ストップワードは、例えば、辞書による定義、出現頻度等に基づいて判定される。次に、算出部113は、抽出した名詞に対し、単語の正規化(表記揺れの吸収)を行う。単語の正規化には、文字種の統一、数字の置き換え、辞書を用いた単語の統一等の手順が含まれる。文字種の統一は、大文字の小文字への統一、半角カナの全角カナへの統一等である。数字の置き換えは、単語に含まれる数字の、数字を表す代表記号(例えば「0」)への置き換えである。
【0057】
その後、算出部113は、登録情報の文章及び上述の処理を行った単語を用いて、TF-IDF法等の任意のベクトル化の手法により、第1ベクトルを取得する。
【0058】
TF-IDF法は、文章中の単語の出現頻度を用いて重要度を数値化する手法で、算出部113は、登録情報の文章に含まれる単語それぞれの、当該登録情報における出現回数を算出する。出現回数の算出は、例えば、Bag of Words等の文章分析モデルによって行われる。次に、算出部113は、1つの登録情報における単語の出現回数を単語の出現頻度(tf:term frequency)に変換し、さらに、各登録情報における単語の出現頻度(tf)に基づいて、データを取得した登録情報全体において、各単語の出現頻度の希少度である逆文書頻度(idf:inverse document frequency)を求める。最後に、算出部113は、出現頻度(tf)と逆文書頻度(idf:inverse document frequency)とから、各求人票における各単語の重要度(tf-idf)を算出し、各単語の重要度を成分とする第1ベクトルを生成する。第1ベクトルの次元は、重要度が算出される単語の数である。
【0059】
なお、各単語の数値化には、上述のTF-IDF法以外に、LSI法、LDA法等を用いてもよい。さらに、算出部113は、Word2vec、BERT等の単語の分散表現に基づくベクトル化を行うモデルを用いて求人票の文章から第1ベクトルを生成してもよい。なお、TF-IDF法は、キーワード処理に強く、処理が軽いという利点がある。求職者の登録情報では、出現するキーワードに特徴があるため、TF-IDF法の使用が好ましい。また、TF-IDF法では、例えば、求人成約の有無にかかわらず、多数の登録情報に出てくる単語の重みが小さくなるため、好適に登録情報の特徴量を決定できる。
【0060】
算出部113は、例えば、以下の手順で登録情報に含まれる属性を第2ベクトルに変換する。算出部113は、属性である数値データ又はカテゴリカル(質的)データを、例えば、One-Hotエンコーディング等の手法によって、ベクトルに変換する。One-Hotエンコーディングでは、算出部113は、属性を示す数値データ又はカテゴリカル(質的)データを、各成分が0又は1であるOne-Hotベクトルに変換する。算出部113は、各属性のOne-Hotベクトルを合成することで、第2ベクトルを生成する。「属性」は、例えば、性別、年齢、年収、業種等、所定のカテゴリや数値から選択されることにより入力される情報である。
【0061】
算出部113は、大規模言語モデルを含む生成AIであるベクトル化モデルを用いて登録情報をベクトル化してもよい。この場合、算出部113は、登録情報を入力とし、登録情報をベクトル化して出力する指示を含むプロンプトをベクトル化モデルに入力し、第1ベクトル及び/又は第2ベクトルをベクトル化モデルに出力させる。また、算出部113は、登録情報のベクトル化・出力指示と登録情報とに加え、入力及び出力のサンプルとして、例えば、1以上の登録情報のサンプルと、それに対応する1以上の第1ベクトル及び/又は第2ベクトルのサンプルとを挿入したプロンプトをベクトル化モデルに入力してもよい。
【0062】
登録情報の特徴量は、ベクトル化以外の手法によって抽出されてもよい。また、第1情報には、登録情報の情報量(文字数)が特徴量として含まれてもよい。登録情報の情報量は、登録情報全体の情報量であってもよいし、項目(カテゴリ)ごとの情報量であってもよい。したがって、登録情報の情報量は、例えば、求職者のレジュメの文字数であってもよい。
【0063】
第2情報には、例えば、求職者の行動履歴に含まれる行動対象求人の内容(求人票)から抽出される特徴量が含まれる。行動対象求人には、求職者が応募した求人、求職者がブックマークリストへ登録した求人、求職者がスカウト文書を受信した求人、求職者が受信したスカウト文書への返信を行った求人、審査(書類審査、面接審査等)を通過した求人等が含まれる。この特徴量は、求人票のフォーマットによらず、求人票に記載されている内容から導かれるデータ(数値)である。特徴量としては、例えば、求人票の内容を、その特徴を表現するベクトルに変換した特徴ベクトルが使用される。ここで、1つの求人票から複数の特徴ベクトルが取得されてもよい。例えば、求人票におけるカテゴリごとに、特徴ベクトルが取得されてもよい。求人票におけるカテゴリとしては、例えば、求人者(組織名)、募集業種、募集職種、募集役職、必要スキル、必要資格、想定年収等が挙げられる。
【0064】
第2情報の特徴ベクトルには、第1情報の特徴ベクトルと同様に、求人票に含まれる文章のベクトル化により得られる第1ベクトルと、求人票に含まれる属性のベクトル化により得られる第2ベクトルとが含まれる。算出部113は、パラメータ出力モデルに入力する特徴量として、第1ベクトルのみを用いてもよいし、第2ベクトルのみを用いてもよいし、第1ベクトルと第2ベクトルとの双方を用いてもよい。第2情報における第1ベクトル及び第2ベクトルの取得手順は、上述の第1情報における第1ベクトル及び第2ベクトルの取得手順における登録情報を求人票に置き換えたものである。
【0065】
行動履歴の特徴量は、ベクトル化以外の手法によって抽出されてもよい。また、第2情報には、所定の期間における、求職者の情報処理システム1へのログイン回数、求職者による求人への応募回数、求職者のスカウト文書の受信数、求職者によるスカウト文書への返信数、求職者による審査(書類審査、面接審査等)の通過回数等が特徴量として含まれてもよい。
【0066】
パラメータ出力モデルは、学習用の多数の求職者の登録情報の登録時における属性情報と、当該登録情報にそれぞれ紐付けられた、求人成約の有無及び実際に発生した売上の額とを第1学習データとする機械学習(第1学習)によって構築される。これにより、多数の求職者の登録情報に基づいて、求人成約確率及び予測売上額の予測に最適なパラメータを出力するようにパラメータ出力モデルを学習することができる。そのため、算出部113が算出する顧客生涯価値の精度が高められる。
【0067】
なお、第1学習データにおいて、求人成約の有無が、売上がゼロであるか否かで表現されてもよい。つまり、第1学習データは、求人成約の無い求職者の売上がゼロとされたデータであってもよい。したがって、第1学習データは、登録情報の登録時における属性情報と、当該登録情報にそれぞれ紐付けられた、実際に発生した売上の額のみとで構成されてもよい。また、第1学習データでは、それぞれの求職者の任意の時点における売上金額が測定(記録)されている。売上金額が測定される任意の時点は、求職者によって異なる時点であってもよい。
【0068】
具体的には、パラメータ出力モデルは、求職者の属性情報の特徴量を入力(説明変数)とし、収束値、特定定数及び母数を出力(目的変数)とするニューラルネットワークを含む。
図7は、パラメータ出力モデルが含むニューラルネットワークの一例を示す図である。ニューラルネットワークは、入力層と、隠れ層(中間層)と、出力層とを有する。なお、ニューラルネットワークは2層以上の隠れ層を有してもよい。
図7のニューラルネットワークでは、互いに異なる4つの属性情報の入力に対し、確率計算関数の収束値pの予測値と、売上の確率分布の母数であるμ(平均)及びσ(分散)の予測値と、確率計算関数の特定定数αの予測値とが出力される。第1学習では、求職者の属性から、売上金額が従う対数正規分布のパラメータである母数(μ、σ)と、成約確率を算出するためのパラメータ(p、α)とをニューラルネットワークが出力するための学習が行われる。
【0069】
なお、パラメータ出力モデルのニューラルネットワークに入力される属性情報の数は4に限定されない。また、確率計算関数の特定定数が複数ある場合は、パラメータ出力モデルのニューラルネットワークは、複数の特定定数を出力する。例えば、算出部113が式(3)又は式(4)の確率計算関数を用いる場合は、パラメータ出力モデルのニューラルネットワークは、α及びt0の2つの特定定数を出力することで、予測売上額を算出するための売上確率分布のパラメータを出力する。そのため、ニューラルネットワークが出力するパラメータの数は、算出部113が用いる確率計算関数及び売上確率分布の形によって変化する。
【0070】
売上の確率分布として対数正規分布を用いる場合、算出部113は、
図7に示されるように、パラメータ出力モデルのニューラルネットワークに、母数として確率分布の平均μ及び分散σを出力させる。また、対数正規分布以外の確率分布を用いる場合、パラメータ出力モデルのニューラルネットワークは、確率分布に応じた母数を出力層から出力する。そのため、ニューラルネットワークが出力するパラメータの数や種類は、確率分布の種類(母数となるパラメータの数や種類)によって変化する。例えば、確率分布がガンマ分布の場合は、母数として、形状母数及び尺度母数が出力され、確率分布が切断正規分布の場合は、母数として、平均、拡散、上限及び下限が出力され、確率分布がパレート分布の場合は、母数として、形状母数及び尺度母数が出力される。
【0071】
第1学習では、求人成約確率に関する第1損失と、売上に関する第2損失とが、それぞれ小さくなるように、ニューラルネットワークの重み付け(重み係数)が調整される。第1損失は、ニューラルネットワークの入力層に第1学習データの属性情報を入力した際に、出力層に出力される確率計算関数の収束値(無限時刻での求人成約確率)と第1学習データにおける求人成約の有無から算出又は予測される求人成約確率との損失(例えば、両者の乖離量や、損失関数によって評価される値等)である。第2損失は、出力層に出力される母数で定義される確率分布の期待値(予測売上値)と第1学習データにおける実際の売上の額との損失である。
【0072】
さらに、パラメータ出力モデル(ニューラルネットワーク)には、第2学習データを用いた第2学習が行われる。具体的には、パラメータ出力モデルは、求人成約確率の予測値と、第2学習データに含まれる実際の求人成約確率との損失が小さくなるように学習される。求人成約確率の予測値は、第2学習データに含まれる属性情報を入力としてパラメータ出力モデルが出力する収束値及び特定定数を用いた確率計算関数に、経過時間を入力して得られる値である。実際の求人成約確率は、予測値の取得時にパラメータ出力モデルに入力された属性情報と、確率計算関数に入力された経過時間とに紐付けられた値である。実際の求人成約確率は、実際の求人成約数と同義であってもよく、特定の経過時間において、どのくらいの数の求人成約が実際に発生したかを示す値である。これにより、経過時間をニューラルネットワークの説明変数に組み込むことなく、経過時間に応じた求人成約確率を予測するための特定定数を出力可能なパラメータ出力モデルを構築できる。すなわち、経過時間を入力(説明変数)としてパラメータ出力モデルを学習した場合、顧客生涯価値が経過時間に対して単調増加するといった特性を考慮することが難しく、予測の精度を向上させることが困難であるが、上述の学習によれば、求職者の登録からの経過時間をパラメータ出力モデルの説明変数としないことで、顧客生涯価値の特性を再現することができる。その結果、経過時間を考慮した求人成約確率を高い精度で予測することができるため、算出部113が算出する顧客生涯価値の精度が高められる。
【0073】
経過時間は、ニューラルネットワークの入力層に入力するパラメータとして用いられず、学習モデル(ニューラルネットワーク)の重み付けパラメータを調整するための損失を算出する際の、成約確率の予測値の算出の段階で使用される。これにより、経過時間によって変化する売上金額分布を考慮したパラメータの設定が精度よく行われる。
【0074】
第2学習における第2学習データは、学習用の属性情報と、当該属性情報を有する求職者の経過時間による求人成約確率の変化データ(確率計算関数の出力)とを含む。求人成約確率の変化データは、多数の求職者の経過時間ごとの成約の有無のデータから構築される。
【0075】
第2学習データが含む学習用の属性情報は、第1学習データが含む学習用の属性情報と同じものであってもよい。つまり、第1学習で用いられる求職者のデータと、第2学習で用いられる求職者のデータとは共通していてもよい。
【0076】
第2学習では、ニューラルネットワークの入力層に第2学習データの属性情報を入力した際に、出力層に出力される確率計算関数の収束値p及び特定定数α(さらに必要に応じてt0)と、第2学習データにおける経過時間tとを用いて確率計算関数p(t)から算出される求人成約確率と、第2学習データにおける求人成約確率との損失(例えば、両者の乖離量や、損失関数によって評価される値等)が小さくなるように(最小化されるように)、パラメータ出力モデルが学習される。つまり、ニューラルネットワークによって出力されるパラメータに基づいて算出される成約確率と実際の成約確率との合致度が高くなるように、ニューラルネットワークの重み付け(重み係数)が調整されることで、パラメータ出力モデルが学習される。
【0077】
第2学習は、例えば、第1学習によってある程度ニューラルネットワークの重み付けが調整されてから実行される。第1学習と第2学習とは交互に実行されてもよい。
【0078】
第1学習で用いられる第1学習データ及び第2学習で用いられる第2学習データは、それぞれ、求職者データベースに登録された全ての求職者を対象とすることができる。すなわち、第1学習データ及び第2学習データには、求人成約した求職者及び求人成約していない求職者の双方の属性情報等が含まれる。また、第1学習データ及び第2学習データには、登録情報の登録からの経過期間が異なる多数の求職者の属性情報等が含まれる。さらに、第2学習データには、同一の求職者の異なる経過時間における複数のデータが含まれてもよい。
【0079】
パラメータ出力モデルは、新たな求職者の登録情報が求職者データベースに登録されたタイミングや、新たな求人成約が発生し、売上が確定したタイミング等で、新たな学習データを用いた第1学習及び/又は第2学習によって逐次アップデートされる。
【0080】
算出部113が出力した顧客生涯価値は、例えば、顧客生涯価値に基づくスコアリング等による顧客(求職者)の管理、求職・求人サービスにおける広告効果の推定等に用いることができる。顧客の管理には、例えば、顧客生涯価値が高い求職者に対してスカウト文書を優先して送信することや、顧客生涯価値の大きさで求職者のリストをソートすること等が含まれる。
【0081】
<人工知能部120>
人工知能部120は、各機能部から入力を受け付け、指示された出力を返すように構成されている。なお、サーバ装置10が各機能部において使用する人工知能は、共通のものであってもよいし、機能部毎に個別に用意されたものであってもよい。
【0082】
人工知能部120は、GPT(Generative Pretrained Transformer、GPT-1、GPT-2、GPT-3を含む)、BERT(Bidirectional Encoder Representations from Transformers)、BART(Bidirectional and Auto-regressive Transformer)等を含むトランスフォーマ(Transformer)や再帰型ニューラルネットワーク(Recurrent Neural Network(RNN))等の言語モデル等の学習モデルを備えるAI(Artificial Intelligence)であって、生成AIを含んでもよい。
【0083】
言語モデルは、機械学習アルゴリズムによる学習モデルの一例である。機械学習の具体的なアルゴリズムとしては、最近傍法、ナイーブベイズ法、決定木、サポートベクターマシン、ニューラルネットワークを利用した深層学習(ディープラーニング)等が挙げられる。人工知能部120は、上記のアルゴリズムを適宜適用することができる。
【0084】
人工知能部120は、教師あり学習、教師なし学習、又は自己教師あり学習等の学習方法によって構築された学習済みモデルを有してもよい。教師あり学習では、教師データ(学習データ)を用いて機械学習を行う。教師データは、学習用の入力データ及び出力データ(正解データ)のペアで構成される。また、言語モデルは、特定のタスクのために訓練されたものだけでなく、幅広いタスクに対して汎用的に用いることができる汎用モデルであってもよい。
【0085】
人工知能部120は、人工知能として、膨大なデータを学習した大規模言語モデル(Large Language Models(LLM))のような汎用的な自然言語処理の学習モデルであってもよい。LLMは、テキストデータ等で構成される大規模なデータ(例えば、(i)インターネット上にあるWebコンテンツ、又は、(ii)所定のデータベースに蓄積されたデータ)を事前に大量に学習した学習モデルであり、タスクを与えることで様々な言語処理タスクを実行することができるものである。このような汎用的な学習モデルは、One-shot LearningやFew-shot Learning等により、ファインチューニングなしで様々なタスクに対応可能な言語モデルを含む。また、汎用的な学習モデルは、Zero-shot Learningによっても、様々なタスクに対応可能に構成されてもよい。制御部11の各機能部において用いられる人工知能は、それぞれ別個の学習モデルであってもよいし、共通した汎用的な学習モデルであってもよい。
【0086】
人工知能部120に含まれる学習モデル(パラメータ出力モデル等の、各機能部において使用される学習モデル)は、転移学習又はファインチューニングとして追加の学習を行うことが可能である。例えば、人工知能部120は、新たな求職者の登録情報及び求人票の登録が発生する都度、これらを新たな教師データとして、追加の学習を行ってファインチューニングされてもよい。これにより、学習モデルから出力される情報の精度が向上する。
【0087】
人工知能部120に含まれる学習モデルは、元となる学習モデルを用いた知識蒸留(Knowledge Distillation)により得られた学習モデル(蒸留モデル)であってもよい。知識蒸留では、大規模言語モデルなどの、学習済みモデルを教師モデルとし、教師モデルの出力(Sоft Target)に対する生徒モデル(蒸留モデル)の出力の損失(Sоft Target Loss)が小さくなるように、生徒モデルのパラメータを調整することで、生徒モデルの学習が行われ、その生徒モデルが蒸留モデルとなる。また、教師データ(学習モデルの入力データと出力データとの組合わせ)の正解ラベル(Hard Target)に対する生徒モデルの出力の損失(Hard Target Loss)が小さくなるように生徒モデルの学習が行われてもよい。蒸留モデルは、元となる学習モデル(教師モデル)に比べて、当該学習モデルと近い性能をもちつつ、パラメータ数が小さく、処理負荷が小さくなる。そのため、蒸留モデルを用いることで、情報処理システム1のコストを低減できる。
【0088】
例えば、パラメータ出力モデル等は、大規模言語モデルにおける入力データと出力データとの組み合わせを教師データとして学習された蒸留モデルであってもよい。また、情報処理システム1の導入時にはパラメータ出力モデル等として大規模言語モデルを使用し、当該大規模言語モデルによる教師データが蓄積された時点で、当該教師データによる知識蒸留によって得られた蒸留モデルをパラメータ出力モデル等として使用してもよい。
【0089】
<表示部>
求人者端末20の表示部211及び求職者端末30の表示部311は、それぞれ、サーバ装置10から送信されてきた画面データが示す画面を表示する。
【0090】
<操作取得部>
求人者端末20の操作取得部212は、求人者端末20を利用するユーザ(求人者)による操作を受け付ける。求職者端末30の操作受付部312は、求職者端末30を利用するユーザ(求職者)による操作を受け付ける。
【0091】
3.情報処理方法
本節では、サーバ装置10の情報処理方法について説明する。この情報処理方法は、サーバ装置10の各部が、各ステップとしてコンピュータにより実行される。
【0092】
この情報処理は、取得ステップと、算出ステップとを備える。取得ステップでは、対象求職者に関する属性情報を取得する。算出ステップでは、属性情報と、登録情報の登録からの経過時間とに基づき、対象求職者の求人成約確率及び対象求職者の予測売上額を算出するとともに、求人成約確率と予測売上額との積を用いて対象求職者の顧客生涯価値を算出する。また、算出ステップでは、求人成約確率及び予測売上額の算出前に、属性情報をパラメータ出力モデルに入力し、パラメータ出力モデルに、確率計算関数の収束値と、確率計算関数に含まれる少なくとも1つの特定定数と、確率分布の母数とを出力させる。
【0093】
図8は、情報処理システム1によって実行される情報処理(顧客生涯価値の算出処理)の流れを示すアクティビティ図である。以下では、このアクティビティ図の各アクティビティに沿って、情報処理を説明する。
【0094】
顧客生涯価値の算出処理は、例えば、求人者による、顧客生涯価値を算出する対象求職者の選択から開始される。求人者は、求人者端末20において、対象求職者を入力する(アクティビティA101)。サーバ装置10は、求人者端末20における対象求職者の入力を受けて、対象求職者の属性情報を取得する(アクティビティA102)。
【0095】
サーバ装置10は、取得した対象求職者の属性情報をパラメータ出力モデルに入力し、収束値、特定定数及び母数を取得する(アクティビティA103)。これにより、確率計算関数及び売上の確率分布が確定する。続いて、サーバ装置10は、確率計算関数に対象求職者の登録情報の経過時間を入力し、求人成約確率を算出する(アクティビティA104)。さらに、サーバ装置10は、算出した求人成約確率と、確率分布に基づく予測売上額との積を用いて、顧客生涯価値を算出する(アクティビティA105)。
【0096】
4.作用
本実施形態の作用をまとめると、次の通りとなる。すなわち、求職者の属性情報に基づいてパラメータが設定され、かつ、登録情報の登録からの経過時間を変数とする確率計算関数から算出される求人成約確率と、求職者の属性情報に基づいてパラメータが設定される確率分布から算出される予測売上額とを用いることで、任意の経過時間における求職者の顧客生涯価値を算出することができる。また、登録からの経過時間によらず、求職者の登録情報をパラメータ出力モデルの学習に用いられる学習データとして使用することができるため、求職者の登録からの経過期間によらず、多数の登録情報を学習に利用できるとともに、登録直後の最新の登録情報も学習データとして使用できる。これにより、成約(売上発生)に関する最新の傾向を学習データとして考慮し、学習モデルを構築することができるため、顧客生涯価値の算出精度が高められる。
【0097】
特に、売上の分布がゼロに偏っており、かつ売上が観測されるまでの時間が長い傾向にあるサービスについて、本実施形態により、直近までの期間のデータを学習に使うことができることで、求人成約(売上)の予測精度が改善されるとともに、顧客生涯価値の予測において、予測する将来の時期(求人成約までの経過期間)を任意に設定することができるため、顧客生涯価値を算出する学習モデルの自由度が向上する。
【0098】
例えば、求人・求職サービスの場合、一般的に、求職者の登録から売上発生までに数か月以上かかるため、求職者の成約(採用決定)によって発生する売上実績がゼロの会員が非常に多い分布となる傾向となる。そのため、従来の顧客生涯価値の予測によれば、登録から長い期間(例えば、1年以上)経過した求職者の学習データが必要になる。これに対し、本実施形態では、売上発生確率を、求職者の属性だけでなく、経過時間によって変化する関数から算出し、この関数のパラメータを求職者の属性から予測することで、売上の時間依存性を考慮することができる。また、任意の時点で観測された求職者ごとの売上データを学習モデルの学習に用いることができ、かつ、顧客生涯価値の予測時点においても任意の予測対象期間を設定することができる。
【0099】
以上、本発明の実施形態について説明したが、本発明はこれに限定されることなく、その発明の技術的思想を逸脱しない範囲で適宜変更可能である。
【0100】
5.その他
上記実施形態では、サーバ装置10が種々の記憶・制御を行ったが、サーバ装置10に代えて、複数の外部装置が用いられてもよい。すなわち、種々の情報やプログラムは、ブロックチェーン技術等を用いて複数の外部装置に分散して記憶されてもよい。特に、人工知能部120は、サーバ装置10の外部構成であってもよい。その場合、外部構成である人工知能部120は、例えば、人工知能のサービスサーバによって提供され、サーバ装置10の各機能部から入力を受け付け、人工知能のサービスを実行する要求を受け付け、処理結果として指示された出力をサーバ装置10に返すように構成される。人工知能のサービスサーバは、学習モデルとして言語モデルを用いてサービスを提供するサーバであってもよいし、言語モデルを用いて言語処理タスクを実行するサーバであってもよい。人工知能のサービスサーバは、LLMによって構築されてもよい。人工知能のサービスサーバは、テキスト、画像、音声等によるプロンプトの入力を受け付け、当該プロンプトに対する回答を生成して応答する。
【0101】
本実施形態の態様は、情報処理システム1に限定されず、情報処理方法であっても、プログラムであってもよい。情報処理方法は、情報処理システム1が実行する各ステップを備える。プログラムは、コンピュータに、情報処理システム1の各ステップを実行させる。
【0102】
なお、本実施形態は、求人・求職サービスに限らず、他の顧客サービスにおける顧客生涯価値の予測に適用されてもよい。すなわち、上記実施形態において「求職者」を「顧客」とし、「求職に関する行動履歴」を「顧客サービスに関する行動履歴」とし、「求人成約」を「売上発生」とし、「求人成約確率」を「売上発生確率」としてもよい。この場合、顧客サービスにおける売上発生確率を、顧客の属性と、顧客のサービスへの登録からの経過時間によって変化する関数から算出し、当該関数のパラメータを、顧客の登録情報又は行動履歴を含む顧客の属性情報に基づき、ニューラルネットワーク等の学習モデルによって算出してもよい。これにより、顧客による売上の時間依存性を考慮することができるとともに、任意の時点で観測された顧客ごとの売上データを学習モデルの学習に用いることができる。
【0103】
次に記載の各態様で提供されてもよい。
【0104】
(1)情報処理システムであって、少なくとも1つのプロセッサを備え、前記プロセッサは、プログラムを読み出すことで次の各ステップを実行するように構成され、取得ステップでは、求職者に関する属性情報を取得し、ここで、前記属性情報は、前記求職者の登録情報及び前記求職者の求職に関連する行動履歴の少なくとも一方を含み、算出ステップでは、前記属性情報と、前記登録情報の登録からの経過時間とに基づき、前記求職者の求人成約確率及び前記求職者の予測売上額を算出するとともに、前記求人成約確率と前記予測売上額との積を用いて前記求職者の顧客生涯価値を算出し、ここで、前記求人成約確率は、前記経過時間を変数とし、前記経過時間の増加に伴い、初期値から前記初期値よりも大きい収束値に収束する確率計算関数によって算出され、前記予測売上額は、求人成約に伴って生じる売上が従う確率分布に基づいて算出され、前記算出ステップでは、前記求人成約確率及び前記予測売上額の算出前に、前記属性情報をパラメータ出力モデルに入力し、前記パラメータ出力モデルに、前記確率計算関数の前記収束値と、前記確率計算関数に含まれる少なくとも1つの特定定数と、前記確率分布の母数とを出力させ、ここで、前記パラメータ出力モデルは、前記属性情報を入力とし、前記収束値、前記特定定数及び前記母数を出力することが可能なように学習された学習モデルである、情報処理システム。
【0105】
(2)上記(1)に記載の情報処理システムにおいて、前記パラメータ出力モデルは、前記登録情報の登録時における前記属性情報と、前記登録情報に紐付けられた、求人成約の有無及び実際に発生した前記売上の額とを学習データとする機械学習によって構築される、情報処理システム。
【0106】
(3)上記(2)に記載の情報処理システムにおいて、前記パラメータ出力モデルは、前記求人成約確率の予測値と、実際の求人成約確率との損失が小さくなるように学習され、ここで、前記予測値は、前記属性情報を入力として前記パラメータ出力モデルが出力する前記収束値及び前記特定定数を用いた前記確率計算関数に、前記経過時間を入力して得られる値であり、前記実際の求人成約確率は、前記予測値の取得時に前記パラメータ出力モデルに入力された前記属性情報と、前記確率計算関数に入力された前記経過時間とに紐付けられた値である、情報処理システム。
【0107】
(4)上記(1)から(3)のいずれか1つに記載の情報処理システムにおいて、前記確率計算関数は、単調増加関数である、情報処理システム。
【0108】
(5)上記(4)に記載の情報処理システムにおいて、前記確率計算関数は、前記初期値がゼロである、情報処理システム。
【0109】
(6)上記(4)又は(5)に記載の情報処理システムにおいて、前記確率計算関数の導関数は、単調減少関数である、情報処理システム。
【0110】
(7)上記(4)から(6)のいずれか1つに記載の情報処理システムにおいて、前記確率計算関数は、下記式(1)のp(t)で表され、式(1)中、pは前記収束値、αは正の値の前記特定定数、tは前記経過時間である、情報処理システム。p(t)=p[1-exp(-αt)] ・・・(1)
【0111】
(8)上記(1)から(7)のいずれか1つに記載の情報処理システムにおいて、前記確率分布は、連続確率分布である、情報処理システム。
【0112】
(9)上記(8)に記載の情報処理システムにおいて、前記確率分布は、対数正規分布、ガンマ分布、切断正規分布、又はパレート分布である、情報処理システム。
【0113】
(10)上記(9)に記載の情報処理システムにおいて、前記確率分布は、対数正規分布であり、前記算出ステップでは、前記パラメータ出力モデルに、前記母数として前記確率分布の平均及び分散を出力させる、情報処理システム。
【0114】
(11)情報処理方法であって、上記(1)から(10)のいずれか1つに記載の情報処理システムが実行する各ステップを備える、情報処理方法。
【0115】
(12)プログラムであって、コンピュータに、上記(1)から(10)のいずれか1つに記載の情報処理システムの各ステップを実行させるための、プログラム。
もちろん、この限りではない。
【0116】
最後に、本開示に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。当該新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。当該実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0117】
1 :情報処理システム
2 :通信回線
10 :サーバ装置
11 :制御部
12 :記憶部
13 :通信部
14 :通信バス
20 :求人者端末
21 :制御部
22 :記憶部
23 :通信部
24 :入力部
25 :出力部
26 :通信バス
30 :求職者端末
31 :制御部
32 :記憶部
33 :通信部
34 :入力部
35 :出力部
36 :通信バス
111 :基本表示制御部
112 :取得部
113 :算出部
120 :人工知能部
211 :表示部
212 :操作取得部
311 :表示部
312 :操作受付部
【要約】 (修正有)
【課題】求職者についての顧客生涯価値を予測する情報処理システム、方法及びプログラムを提供する。
【解決手段】情報処理方法は、サーバ装置が、求職者の登録情報及び求職に関連する行動履歴を含む属性情報を求人者端末から取得する取得ステップと、属性情報と、登録情報の登録からの経過時間とに基づき、求職者の求人成約確率及び予測売上額を算出し、その積を用いて顧客生涯価値を算出する算出ステップと、を含む。ここで求人成約確率は、経過時間を変数とし、経過時間の増加に伴い、初期値から初期値よりも大きい収束値に収束する確率計算関数にて算出する。予測売上額は、求人成約に伴って生じる売上の確率分布に基づいて算出する。求人成約確率及び予測売上額の算出前に、学習モデルであるパラメータ出力モデルは、属性情報を入力し、確率計算関数の収束値と、確率計算関数に含まれる特定定数と、確率分布の母数とを出力する。
【選択図】
図8