(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-21
(45)【発行日】2023-05-01
(54)【発明の名称】応募者の情報を収集するための装置、方法及びそのためのプログラム
(51)【国際特許分類】
G06Q 10/1053 20230101AFI20230424BHJP
【FI】
G06Q10/1053
(21)【出願番号】P 2018152789
(22)【出願日】2018-08-14
【審査請求日】2021-08-12
(73)【特許権者】
【識別番号】517147663
【氏名又は名称】株式会社HERP
(74)【代理人】
【識別番号】110003605
【氏名又は名称】弁理士法人六本木通り特許事務所
(72)【発明者】
【氏名】小島 裕敬
(72)【発明者】
【氏名】宮崎 章太
【審査官】小山 和俊
(56)【参考文献】
【文献】特許第6308604(JP,B1)
【文献】特開2017-016298(JP,A)
【文献】特表2014-522030(JP,A)
【文献】特開2006-185409(JP,A)
【文献】特開2007-156546(JP,A)
【文献】立山 秀利,Excel VBAで「ドル/円」為替情報をスクレイピング,日経ソフトウエア,日本,日経BP社,2017年07月24日, 第20巻第10号,第40-49頁
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
複数の求人サイトから求人企業に対する応募者の情報を収集するための方法であって、
コンピュータが、前記コンピュータ上で実行されるウェブブラウザに、前記複数の求人サイトの少なくともいずれかに対するログイン処理を行わせるステップと、
前記コンピュータが、前記ログインの後に前記ウェブブラウザで表示可能となる画面に前記求人企業に対する1又は複数の応募者の一覧が表示されない求人サイトの場合、前記ウェブブラウザを、前記一覧を含む一覧画面に遷移させるステップと、
前記コンピュータが、前記一覧画面に含まれる各応募者の応募情報を、前記一覧画面を表示するための一覧画面表示情報を分析することによって抽出するステップと、
前記コンピュータが、前記一覧画面に含まれる各応募者の詳細情報を、各応募者の詳細情報を表示する詳細画面をキャプチャすることによって取得するステップと
を含む。
【請求項2】
請求項1に記載の方法であって、
前記応募情報は、各応募者のIDを含む。
【請求項3】
請求項2に記載の方法であって、
前記応募情報は、応募された職種又はポジションをさらに含む。
【請求項4】
コンピュータに、複数の求人サイトから求人企業に対する応募者の情報を収集するための方法を実行させるためのプログラムであって、前記方法は、
前記コンピュータ上で実行されるウェブブラウザに、前記複数の求人サイトの少なくともいずれかに対するログイン処理を行わせるステップと、
前記ログインの後に前記ウェブブラウザで表示可能となる画面に前記求人企業に対する1又は複数の応募者の一覧が表示されない求人サイトの場合、前記ウェブブラウザを、前記一覧を含む一覧画面に遷移させるステップと、
前記一覧画面に含まれる各応募者の応募情報を、前記一覧画面を表示するための一覧画面表示情報を分析することによって抽出するステップと、
前記一覧画面に含まれる各応募者の詳細情報を、各応募者の詳細情報を表示する詳細画面をキャプチャすることによって取得するステップと
を含む。
【請求項5】
複数の求人サイトから求人企業に対する応募者の情報を収集するための装置であって、
前記装置上で実行されるウェブブラウザに、前記複数の求人サイトの少なくともいずれかに対するログイン処理を行わせ、
前記ログインの後に前記ウェブブラウザで表示可能となる画面に前記求人企業に対する1又は複数の応募者の一覧が表示されない求人サイトの場合、前記ウェブブラウザを、前記一覧を含む一覧画面に遷移させ、
前記一覧画面に含まれる各応募者の応募情報を、前記一覧画面を表示するための一覧画面表示情報を分析することによって抽出し、
前記一覧画面に含まれる各応募者の詳細情報を、各応募者の詳細情報を表示する詳細画面をキャプチャすることによって取得する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、応募者の情報を収集するための装置、方法及びそのためのプログラムに関する。
【背景技術】
【0002】
求人広告の掲載の主流が紙媒体からインターネット上の求人サイトに移っている。求人サイトは働き方の多様化の影響も受けてさまざまな種類があり、企業は、複数の求人サイトを同時に利用することが多くなっている。
【0003】
企業の採用担当者は、利用する各求人サイトの管理画面をウェブブラウザのタブでそれぞれ開き、応募状況等に変化があれば、別途自社で利用する採用管理システムに入力する。
【発明の概要】
【発明が解決しようとする課題】
【0004】
こうした事務作業は手入力の工数に加えて、採用に関するセンシティブな情報であることからミスの生じないよう入力結果をチェックする工数もかかり、大きな負担となっている。複数の求人サイトと自動的に連動して自社に対する応募状況を一元管理することができれば、採用担当者の事務負担は大幅に軽減され、採用すべき人材の要件定義等のより戦略的な思考に時間を割くことが可能となる。
【0005】
本発明は、このような問題点に鑑みてなされたものであり、その目的は、複数の求人サイトから求人企業に対する応募者の情報を収集するための装置、方法及びそのためのプログラムにおいて、情報収集の自動化を推し進めることにある。
【課題を解決するための手段】
【0006】
このような問題を解決するために、本発明の第1の態様は、複数の求人サイトから求人企業に対する応募者の情報を収集するための方法であって、ウェブブラウザに、前記複数の求人サイトの少なくともいずれかに対するログイン処理を行わせるステップと、前記ログインの後に前記ウェブブラウザで表示可能となる画面に前記求人企業に対する1又は複数の応募者の一覧が表示されない求人サイトの場合、前記ウェブブラウザを、前記一覧を含む一覧画面に遷移させるステップと、前記一覧画面に含まれる各応募者の応募情報を抽出するステップと、前記一覧画面に含まれる各応募者の詳細情報を取得するステップとを含むことを特徴とする。
【0007】
また、本発明の第2の態様は、第1の態様において、前記遷移は、前記一覧画面を指定するURLに対する表示要求によって生じることを特徴とする。
【0008】
また、本発明の第3の態様は、第1の態様において、前記遷移は、前記一覧画面に切り替えるためのタブの選択によって生じることを特徴とする。
【0009】
また、本発明の第4の態様は、第1から第3のいずれかの態様において、前記抽出は、前記一覧画面を表示するための一覧画面表示情報を分析することによって行うことを特徴とする。
【0010】
また、本発明の第5の態様は、第4の態様において、前記抽出は、各求人サイトにおける前記一覧画面表示情報のデータ構造に応じて記述されたコードを実行することによって行うことを特徴とする。
【0011】
また、本発明の第6の態様は、第1から第5のいずれかの態様において、前記応募情報は、各応募者のID又は名前及び応募された職種又はポジションを含むことを特徴とする。
【0012】
また、本発明の第7の態様は、第1から第6のいずれかの態様において、前記取得は、各応募者の詳細情報を表示する詳細画面をキャプチャすることによって行うことを特徴とする。
【0013】
また、本発明の第8の態様は、第7の態様において、前記詳細画面は、前記ウェブブラウザに、前記一覧画面に含まれる各応募者に関連づけられたいずれかの要素を選択させることによって表示されることを特徴とする。
【0014】
また、本発明の第9の態様は、コンピュータに、複数の求人サイトから求人企業に対する応募者の情報を収集するための方法を実行させるためのプログラムであって、前記方法は、前記コンピュータ上で実行されるウェブブラウザに、前記複数の求人サイトの少なくともいずれかに対するログイン処理を行わせるステップと、前記ログインの後に前記ウェブブラウザで表示可能となる画面に前記求人企業に対する1又は複数の応募者の一覧が表示されない求人サイトの場合、前記ウェブブラウザを、前記一覧を含む一覧画面に遷移させるステップと、前記一覧画面に含まれる各応募者の応募情報を抽出するステップと、前記一覧画面に含まれる各応募者の詳細情報を取得するステップとを含むことを特徴とする。
【0015】
また、本発明の第10の態様は、複数の求人サイトから求人企業に対する応募者の情報を収集するための装置であって、前記装置上で実行されるウェブブラウザに、前記複数の求人サイトの少なくともいずれかに対するログイン処理を行わせ、前記ログインの後に前記ウェブブラウザで表示可能となる画面に前記求人企業に対する1又は複数の応募者の一覧が表示されない求人サイトの場合、前記ウェブブラウザを、前記一覧を含む一覧画面に遷移させ、前記一覧画面に含まれる各応募者の応募情報を抽出し、前記一覧画面に含まれる各応募者の詳細情報を取得することを特徴とする。
【発明の効果】
【0016】
本発明の一態様によれば、複数の求人サイトから求人企業に対する応募者の情報を収集するための方法において、当該吸引企業に対する1又は複数の応募者の一覧を含む一覧画面では各応募者の応募情報を抽出し、各応募者についての詳細画面では各応募者の詳細情報をキャプチャにより取得することによって、各求人サイトにおける変更により妨げられることなく、自動的な情報収集を行うことができる。
【図面の簡単な説明】
【0017】
【
図1】本発明の一実施形態にかかる情報収集装置を示す図である。
【
図2】本発明の一実施形態にかかる情報収集の流れを示す図である。
【
図3】本発明の一実施形態において一覧画面に表示される一覧の例を示す図である。
【発明を実施するための形態】
【0018】
以下、図面を参照して本発明の実施形態を詳細に説明する。
【0019】
図1に、本発明の一実施形態にかかる情報収集装置を示す。情報収集装置101は、インターネット等のコンピュータ・ネットワークを介して第1の求人サイト111、第2の求人サイト112、及び第3の求人サイト113にアクセス可能である。情報収集装置101は、これらの複数の求人サイトから採用管理システム100を利用する各求人企業に対する応募者の情報を収集して、記憶部101-3又は情報収集装置101からコンピュータ・ネットワークを介してアクセス可能な第1のデータベース102に当該情報を記憶する。ここで、
図1では一例として求人サイトを3つ示しているが、これに限定するものではなく、以下の説明では第1の求人サイト111を単に「求人サイト」と呼ぶことがある。
【0020】
情報収集装置101が求人サイト111から求人企業に対する応募者の情報を収集するためには、求人サイト111のための当該求人企業のアカウントにログインする必要があり、記憶部101-3又は情報収集装置101からコンピュータ・ネットワークを介してアクセス可能な第2のデータベース103に各求人企業の各求人サイトのためのログイン情報が記憶されているものとする。ログイン情報は、一般にID及びパスワードで構成されている。
【0021】
第2のデータベース103に対するログイン情報の記憶は、管理装置104が提供するウェブサイトに求人企業が採用担当者のアカウントでログインをして、情報収集を行う求人サイトを設定することによって行うことができる。ここで、管理装置104は、情報収集装置101と同一の装置とすることが可能であり、また、第2のデータベース103を第1のデータベース102と同一のものとすることが可能である。また、第1のデータベース102は、情報収集装置101の記憶部101-3と同一のものとすることが可能であり、第2のデータベース103は、管理装置104の記憶部(図示せず)又は情報収集装置101の記憶部101-3と同一のものとすることが可能である。
【0022】
管理装置104が提供するウェブサイトでは、求人サイトに対する各企業のログイン情報の設定に加えて、情報収集装置101、管理装置104又はその他の装置(図示せず)によって提供される採用管理のためのウェブサイトに対する各求人企業の従業員のログイン情報の設定を可能としてもよい。各従業員は、情報収集装置101が収集した当該従業員が属する企業に対する応募者の情報の少なくとも一部を当該採用管理ウェブサイト上で閲覧可能である。閲覧可能な情報の範囲は、各従業員に採用担当者、面接担当者又は選考担当者として付与する権限によって異なるものとすることができる。
【0023】
情報収集装置101は、通信インターフェースなどの通信部101-1と、プロセッサ、CPU等の処理部101-2と、メモリ、ハードディスク等の記憶装置又は記憶媒体を含む記憶部101-3とを備え、各処理を行うためのプログラムを実行することによって構成することができ、1又は複数の装置ないしサーバを含むことがある。また当該プログラムは、1又は複数のプログラムを含むことがあり、また、コンピュータ読み取り可能な記憶媒体に記録して非一過性のプログラムプロダクトとすることができる。
【0024】
情報収集装置101は、記憶部101-3又は情報収集装置101からアクセス可能な記憶装置又は記憶媒体に記憶されたウェブブラウザを操作可能であり、必要に応じてウェブブラウザを操作するためのライブラリを用いて書かれたコードを実行することによって当該ウェブブラウザを操作可能である。ウェブブラウザの例としては、Chrome(登録商標)が挙げられる。求人サイト111からの情報収集は自動的に行うため、ヘッドレスでウェブブラウザを操作すればよい。
【0025】
図2に、本発明の一実施形態にかかる情報収集の流れを示す。まず、情報処理装置101は、求人企業に関連づけられた複数の求人サイトのうちのいずれかの求人サイト111に対するログイン処理をウェブブラウザに行わせる(S201)。
【0026】
ログインに成功した後、ウェブブラウザはトップページなど、求人サイト111においてログイン後に表示される画面を表示するための表示情報を受け取る。ここで表示情報はHTML形式とすることができる。当該画面に当該求人企業に対する1又は複数の応募者の一覧が表示されない求人サイトの場合、情報収集装置101は、ウェブブラウザを、当該求人企業に対する1又は複数の応募者の一覧を含む一覧画面に遷移させる(S202)。ログイン後にウェブブラウザで表示可能となる画面に一覧が表示される場合は遷移をさせることは必要ではない。
【0027】
一覧画面に個別のURLが与えられている場合、当該遷移はウェブラウザが当該URLに対する表示要求を求人サイト111又はこれを提供するサーバに送信することによって生じる。一覧画面を表示するための一覧画面表示情報がログインの後に既に情報収集装置101に対して送信されている場合には、ログイン後の画面で表示を切り替えるためのタブ等の要素を選択することによってローカルに画面遷移が生じることがある。
【0028】
次に、情報収集装置101は、一覧画面に含まれる各応募者の応募情報を抽出する(S203)。この処理は「スクレイピング」と呼ばれることがある。
図3に、一覧画面に表示される一覧300の一例を示す。ID039975の応募者ないし求職者が2018年7月7日に「1000社以上が導入するATSのインフラを支えるエンジニアを募集!」という求人に対して興味を示し、応募していることが示されている。応募された求人に加えて又は代替して、応募対象の職種又はポジションが表示されることがある。また、一覧300には、応募後の書類選考、面接、内定といった進捗管理のための項目が表示されることがある。
【0029】
一覧300を表示するための一覧画面表示情報を分析することによって、情報収集装置101は、各応募者の応募情報を文字列として抽出することができるが、求人サイトによって一覧画面表示情報のデータ構造が異なり得ることから、当該抽出は、求人サイトごとにデータ構造に応じて記述されたコードを予め記憶部101-3又は情報収集装置101からアクセス可能な記憶装置又は記憶媒体に記憶しておき、これを実行することによって行うことができる。抽出する応募情報には、各応募者のID及び名前の少なくとも一方が含まれ、さらに応募された職種又はポジションを含むことができる。また、応募情報には、応募された求人がスカウトによる求人か否かを含むことができる。
【0030】
スクレイピングを行う場合、各求人サイトでいつデータ構造の変更があるかは知り得ず、変更があった際には抽出のためのコードを書き直す必要があるが、応募状況を把握するための一覧画面のデータ構造は大きな変更が高い頻度で生じる性質のものではないことから、各求人サイトにおける不定期の変更によって応募者の情報収集に支障を来すおそれは低い。抽出する応募情報が名前又はID、応募された職種又はポジションなど、限られた数の項目である場合には支障は特に生じにくい。例示として、応募情報は、名前又はID及び応募された職種又はポジションに限定したり、名前又はID、応募された職種又はポジション及び応募日に限定したり、名前又はID、応募された職種又はポジション及びスカウトによる求人か否かに限定したりすることが挙げられる。
【0031】
そして、情報収集装置101は、ウェブブラウザに、一覧画面に含まれる各応募者に関連づけられたいずれかの要素を選択させて、ウェブブラウザを、各応募者の詳細情報を表示する詳細画面に遷移させる(S204)。当該遷移は、詳細画面を指定するURLに対する表示要求を行い、詳細画面を表示するための詳細画面表示情報を受け取って当該詳細画面を表示させるか、詳細画面表示情報を既に受け取っていて、上記要素の選択によって当該詳細画面を表示させることによって生じさせることが可能である。
【0032】
詳細画面を表示させるための上記要素は、一例として
図3に示すように応募者のID又は名前であることがある。
図3には示されていないが、IDに加えて又は代替して、応募者の名前が表示されることがある。媒体におけるIDは、応募者のユニーク性を担保するため、抽出することが強く望まれる項目であるのに対し、名前は、採用管理ウェブサイトの利用者の利便性を高めるためのものであり、付加的な項目とすることができる。
【0033】
情報収集装置101は、各応募者の詳細画面において、当該応募者の詳細情報を取得する(S205)。詳細情報は、経歴、希望条件等を含むことがある。ここで、詳細情報の取得は、詳細画面表示情報を分析して求める項目のデータを抽出するのではなく、詳細画面をキャプチャすることによって行う。詳細画面は、データ構造の変更が適宜行われる性質があり、スクレイピングをこの画面で行うとコードのアップデートが変更の度に発生してしまうのに対し、キャプチャリングによって情報を収集すれば、データ構造の変更の影響を回避又は抑制することができる。キャプチャリングした詳細画面は、PDF形式で記憶することができる。
【0034】
たとえば、学歴が「〇〇大学YYYY年MM月卒業」という形式で記載されている求人サイトに対して、この形式を想定して大学名を抽出するコードを実行している場合に「卒業」の文言の代わりに「中退」「在学中」などの文言も用いられるようになると、正しく大学名を抽出するためにコードのアップデートが必要となり得る。開発者が想定していないような表示形式について、キャプチャリングであれば、広く対応することができる。
【0035】
求人サイトによっては、詳細画面にヘッダ、バナー、その他の各応募者と直接的に関連しない要素が表示されることがある。こうした要素は、求人企業が採用管理ウェブサイトを用いて応募者の情報を閲覧する際に不要なものであるため、詳細画面表示情報に必要な変更を加えた上で表示される詳細画面をキャプチャするのが好ましい。ここで、変更を加える詳細画面表示情報には、HTMLファイル、CSSファイル等が含まれる。
【0036】
上述の説明では、一覧画面において文字列のスクレイピングを行い、詳細画面において画面のキャプチャリングを行うものとしてしたが、一覧画面において追加的にキャプチャリングを行うことを排除するものではなく、詳細画面において追加的にスクレイピングを行うことを排除するものではない。
【0037】
また、上述の説明では、各応募者に対して、詳細画面からの詳細情報の取得を行ったが、既に詳細情報を取得した応募者であるか否かの判定を行い、否である場合にのみ、詳細情報の取得を行うようにしてもよい。このようにした場合、データの保存容量を少なく抑えることができる。
【0038】
また、求人サイトによっては、応募者の詳細情報が閲覧出来なくなることがあり、無条件に詳細画面をキャプチャして更新してしまうと詳細情報が表示されていない詳細画面が保存されてしまうおそれがある。したがって、必要な詳細情報が閲覧可能か否かの判定を行い、可である場合にのみ、詳細情報の取得を行うようにしてもよい。
【0039】
なお、「××のみに基づいて」、「××のみに応じて」、「××のみの場合」というように「のみ」との記載がなければ、本明細書においては、付加的な情報も考慮し得ることが想定されていることに留意されたい。また、一例として、「Aの場合にBする」という記載は、「Aの場合に常にBする」ことを必ずしも意味しないことに留意されたい。
【0040】
また、念のため、なんらかの方法、プログラム、端末、装置、サーバ又はシステム(以下「方法等」)において、本明細書で記述された動作と異なる動作を行う側面があるとしても、本発明の各態様は、本明細書で記述された動作のいずれかと同一の動作を対象とするものであり、本明細書で記述された動作と異なる動作が存在することは、当該方法等を本発明の各態様の範囲外とするものではないことを付言する。
【符号の説明】
【0041】
100 採用管理システム
101 情報収集装置
101-1 通信部
101-2 処理部
101-3 記憶部
102 第1のデータベース
103 第2のデータベース
104 管理装置
111 第1の求人サイト
112 第2の求人サイト
113 第3の求人サイト
300 応募者の一覧