IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社クリエイトの特許一覧

<>
  • 特許-掲載情報検索システム 図1
  • 特許-掲載情報検索システム 図2A
  • 特許-掲載情報検索システム 図2B
  • 特許-掲載情報検索システム 図3
  • 特許-掲載情報検索システム 図4
  • 特許-掲載情報検索システム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-02-02
(45)【発行日】2022-02-10
(54)【発明の名称】掲載情報検索システム
(51)【国際特許分類】
   G06F 16/951 20190101AFI20220203BHJP
【FI】
G06F16/951
【請求項の数】 2
(21)【出願番号】P 2018221220
(22)【出願日】2018-11-27
(65)【公開番号】P2020086996
(43)【公開日】2020-06-04
【審査請求日】2020-06-30
(73)【特許権者】
【識別番号】399063839
【氏名又は名称】株式会社クリエイト
(74)【代理人】
【識別番号】110000800
【氏名又は名称】特許業務法人創成国際特許事務所
(74)【代理人】
【識別番号】100086689
【弁理士】
【氏名又は名称】松井 茂
(74)【代理人】
【識別番号】100157772
【弁理士】
【氏名又は名称】宮尾 武孝
(72)【発明者】
【氏名】金子 香深
(72)【発明者】
【氏名】愛澤 俊彦
(72)【発明者】
【氏名】山竹 伸一
(72)【発明者】
【氏名】藤村 隆弘
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特表2012-523047(JP,A)
【文献】米国特許出願公開第2014/0236919(US,A1)
【文献】特開2003-157283(JP,A)
【文献】特開2007-193591(JP,A)
【文献】米国特許出願公開第2011/0119242(US,A1)
【文献】特開2010-231253(JP,A)
【文献】国際公開第2016/075829(WO,A1)
【文献】特開2007-018153(JP,A)
【文献】特開2018-173769(JP,A)
【文献】特開2002-140423(JP,A)
【文献】韓国公開特許第2003-0040768(KR,A)
【文献】藤野 真人、外3名,UCEE研究者データベースのコンセプト,情報管理,日本,独立行政法人科学技術振興機構,2007年08月01日,第50巻,第5号,p.266-279
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
ユーザが必要とする求人情報を、誰でも閲覧可能な求人情報が掲載された複数の求人情報会社のウェブサイトを検索し、収集する掲載情報検索システムであって、
前記収集された求人情報を管理するサーバと、
前記収集された求人情報を記憶するデータベースと、
前記サーバにネットワーク接続され、前記ユーザが指示した検索条件に基づいて前記ユーザが必要とする求人情報の検索及び検索結果の表示を行うユーザ端末と、を備え、
前記サーバは、
前記ユーザが必要とする求人情報を検索する場合に、所定の巡回ルールに従って前記ウェブサイトを巡回して、それぞれの前記ウェブサイトのウェブサーバから当該求人情報に関連するカテゴリーを特定して検索範囲を限定する検索範囲限定手段と、
前記検索範囲限定手段により限定された検索範囲で前記検索条件に合致するヒット情報を前記データベースに記憶する記憶手段と、
前記ヒット情報を前記データベースに記憶する際、当該ヒット情報に対して表記揺れ補正を行った後、重複情報があるか否かを検査し、重複情報と判断された複数のヒット情報を1つのヒット情報に統合する情報資源検査手段と、
を有することを特徴とする掲載情報検索システム。
【請求項2】
前記検索範囲限定手段は、それぞれの前記ウェブサイトのうち、前記ユーザがアクセスにより生成される動的生成ページを指定可能であることを特徴とする請求項1に記載の掲載情報検索システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ウェブサイトに掲載された情報を検索、収集して、営業活動等に利用するためにリストアップする掲載情報検索システムに関する。
【背景技術】
【0002】
従来、インターネット上に公開されている同業種のウェブサイトから検索条件に合致した宿泊施設情報、賃貸物件情報、求人情報等をピックアップするサイトが知られている。このようなサイトを利用すると、ユーザは、各社のウェブサイトに都度アクセスすることなく、必要な情報を一度に取得することができる。
【0003】
例えば、下記の特許文献1の求人情報の自動収集方法は、求人情報の収集手段を含むサーバと、各求人企業が所有する求人企業サーバと、各求職者が利用する求職者端末とで構成されている。
【0004】
上記収集手段は、求人関連情報ページにアクセスし、ページの記述情報を受信し、一旦サーバ上のメモリに記憶する。また、解析手段は、収集手段により取得したページの記述情報に対して、HTML等のマークアップ言語の仕様に基づいた解析を行い、文章及びそのレイアウト情報を抽出する。
【0005】
この結果、サーバの求人情報データベースには、各企業がホームページ上で公開している最新の求人情報が求人案件構成要素毎に整理されて記憶されるので、求職者は、即座にウェブサイトから求人情報を閲覧することができる(特許文献1/段落0020~0027)。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2004-326712号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1の求人情報の自動収集方法では、クローラーと呼ばれる手法で情報を収集しているため、本来必要でない情報も取得してしまい、時間がかかる上、出力される情報を閲覧用に整理する手間も生じていた。
【0008】
本発明は、このような事情に鑑みてなされたものであり、掲載情報の検索から閲覧用の表示までを効率良く実行することができる掲載情報検索システムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明は、ユーザが必要とする情報資源を、誰でも閲覧可能な情報資源が掲載された複数のウェブサイトを検索し、収集する掲載情報検索システムであって、前記収集された情報資源を管理するサーバと、前記収集された情報資源を記憶するデータベースと、前記サーバにネットワーク接続され、前記ユーザが必要とする情報資源の検索及び検索結果の表示を行うユーザ端末と、を備え、前記サーバは、前記ユーザが必要とする情報資源を検索する場合に、それぞれの前記ウェブサイトのウェブサーバから当該情報資源に関連するカテゴリーを特定して検索範囲を限定する検索範囲限定手段を有していることを特徴とする。
【0010】
本発明の掲載情報検索システムでは、ユーザが、サーバにネットワーク接続されたユーザ端末を利用してウェブサイトから必要な情報資源を検索し、収集する。このとき、サーバの検索範囲限定手段は、検索範囲を当該情報資源に関連するカテゴリーに限定して検索することができるため、検索時に不要な情報資源を拾わず、時間の短縮が可能となる。そして、検索条件に合致した情報資源は、サーバに接続されたユーザ側のデータベースに記憶される。これにより、ユーザは、必要な情報資源を効率良く収集し、ユーザ端末により検索結果を閲覧することができる。
【0011】
本発明の掲載情報検索システムにおいて、前記検索範囲限定手段は、それぞれの前記ウェブサイトのうち、前記ユーザがアクセスにより生成される動的生成ページを指定可能であることが好ましい。
【0012】
この構成によれば、ユーザ端末の検索範囲限定手段は、動的生成ページを指定することができる。このため、ユーザは動的生成ページに掲載された情報資源についても検索によりヒットさせ、当該情報資源を利用することができる。
【0013】
また、本発明の掲載情報検索システムにおいて、前記サーバは、前記収集された情報資源を前記データベースに記憶する際、当該情報資源を検査する情報資源検査手段を有し、前記情報資源検査手段は、前記収集された情報資源に対して表記揺れ補正を行った後、重複情報があるか否かを検査することが好ましい。
【0014】
この構成によれば、サーバの情報資源検査手段は、検索して収集された情報資源をデータベースに記憶する際、当該情報資源を検査する。複数のウェブサイトで同じ情報資源を異なる態様で掲載している場合があるため、情報資源検査手段は、表記揺れの補正を行った後、重複情報であるか否かを判定する。これにより、重複した情報資源を効率良く発見することができる。
【0015】
また、本発明の掲載情報検索システムにおいて、前記情報資源検査手段は、重複情報と判断された複数の前記収集された情報資源を1つの情報資源に統合することが好ましい。
【0016】
この構成によれば、ユーザ端末の情報資源検査手段は、重複情報と判断された複数の情報資源を1つの情報資源に統合することができる。これにより、最終的なリストアップの際、重複した情報資源を排除することができる。
【図面の簡単な説明】
【0017】
図1】本発明の実施形態に係る掲載情報検索システムの概略図。
図2A】情報検索時の範囲限定機能を説明する図。
図2B】ヒット情報のデータクレンジングを説明する図。
図3】掲載情報検索システムの情報閲覧を説明する図。
図4図3の情報閲覧画面(ウェブ画面)の表示例。
図5図3の情報閲覧画面(スプレッドシート)の表示例。
【発明を実施するための形態】
【0018】
以下では、図面を参照しながら、本発明の掲載情報検索システムの実施形態について説明する。
【0019】
図1は、本発明の実施形態に係る掲載情報検索システム1の概略図である。掲載情報検索システム1は、当該システムを利用する社員Hが所属する会社Xのサーバである自社サーバ2と、自社サーバ2に接続された自社データベース3と、自社サーバ2に社内LAN等でネットワーク接続され、掲載情報検索ツール(アプリケーション)がインストールされたユーザ端末7とから構成される。
【0020】
検索対象としては、賃貸情報や宿泊施設等が考えられるが、ここでは、誰でも閲覧可能な正社員、アルバイト等の求人情報とする。すなわち、会社Xは求人情報を取り扱う企業であり、社員H(本発明の「ユーザ」に相当)はユーザ端末7を利用して、同業他社のウェブサイトから必要とする求人情報を検索、収集することができる。
【0021】
図示するように、ウェブサイトに様々な職種の求人情報、求人広告を掲載している会社として、会社A、会社B及び会社Cの3つがある。また、会社A、会社B、会社Cのウェブサーバを、それぞれ管理サーバ5A、管理サーバ5B、管理サーバ5Cとし、そのウェブサイトを、それぞれウェブサイトA、ウェブサイトB、ウェブサイトCとする。
【0022】
このとき、会社Xの社員Hがユーザ端末7の掲載情報検索ツールにより、検索条件をテキスト(キーワード)、チェックボックス等から入力すると、自社サーバ2は、管理サーバ5A、管理サーバ5B及び管理サーバ5Cに順次アクセスして検索を行う。そして、検索条件に合致し、ヒットした情報(以下、ヒット情報という)があれば、ヒット情報を取得して自社データベース3に記憶する。
【0023】
自社データベース3はハードディスク等の記憶装置であり、登録データの領域3Aと、正規化データの領域3Bとで構成されている。領域3Aには、検索対象のウェブサイトを巡回する巡回ルールに基づいて収集された企業名、職種等の情報が格納される。また、領域Bには、収集された情報から電話番号や住所を所定のフォーマットに正規化する正規化ルールに基づいて編集された正規化データが格納される。
【0024】
その後、自社サーバ2でソート等の処理が行われ、ヒット情報がリストアップされる。また、検索結果リスト(後述するリスト画面、スプレッドシート)がユーザ端末7の表示画面7aに表示されるので、社員Hは、検索結果リストを元に営業活動を行うことができる。
【0025】
次に、図2A図2Bを参照して、掲載情報検索システム1、特に自社サーバ2による情報検索の特徴について説明する。
【0026】
まず、自社サーバ2による情報検索時の範囲限定機能について説明する。図2Aは、検索対象のウェブサイトのページ構造(リンク)を示している。
【0027】
社員Hは、ユーザ端末7の掲載情報検索ツールでキーワードや住所を入力して求人情報の検索を行う。この作業により、自社サーバ2がA社、B社、C社のそれぞれの管理サーバ5A、管理サーバ5B及び管理サーバ5Cを巡回するようにアクセスする。そして、ウェブサイトA~Cから検索条件に合致したヒット情報を取得する(図1参照)。
【0028】
ここで、本発明における情報検索は、ウェブサイトを構成する全ページを検索対象とするクローラー型の情報取得とは異なり、社員Hが必要とする情報に関連するカテゴリーを特定して、所定の範囲を限定して検索を行うことができる。
【0029】
具体的には、従来のクローラー型の情報取得では、トップページPtop、動的生成ページPdyn、その他のページP1~P8を含むリンクされた全てのページを検索対象とする。
【0030】
一方、掲載情報検索システム1の自社サーバ2は、特定のカテゴリーのページを検索対象に指定することができる。例えば、ウェブサイトA~Cの求人情報のページは、企業名、電話番号、URL等のある程度決まった情報で構成され、ページが切替わったとき枠内の文字のみが入れ替わる動的生成ページである。自社サーバ2は、動的生成ページPdynのみ、又はこれに加えて所定の情報が掲載されたページP1を検索対象とすることができる。
【0031】
その方法として、リクエストメソッドの種類、固有の属性(地域名等)、推測可能な要素(ページ数等)、その他の変化する値の条件やタイミングを指定する方法がある。自社サーバ2は、例えば、属性「tokyo(東京)」を指定して対象となる1~500ページを検索し、その後、属性「kanagawa(神奈川)」を指定して同じ1~500ページを検索するといった巡回検索処理を行うことができる。
【0032】
また、自社サーバ2は、特定の条件で巡回検索処理をスキップする設定を行うこともできる。例えば、固有の属性や推測可能な要素をURLにもつ情報一覧ページ内を巡回し、その中で新規に取得できるリンクがなく、それが所定のページ数連続した場合に、巡回検索処理をスキップする。
【0033】
これにより、情報検索の際、不要なページの検索に時間をかけたり、不要な情報を取得して自社データベース3の容量を圧迫したりすることがなくなる。その結果、掲載情報検索システム1のランニングコストを抑えつつ、各社員のシステム利用時の負担を軽減することができる。
【0034】
次に、図2Bを参照して、ヒット情報に対して行われるデータクレンジングについて説明する。
【0035】
ウェブサイトA~Cには同じ求人情報が掲載されている場合があるので、情報検索を行うと重複してヒットしたと思われる求人情報が取得されることがある。自社サーバ2(図示省略)は、重複ヒットした求人情報(例えば、企業名、住所、電話番号等)の表記が全く同じであれば、一情報と判断して自社データベース3に記憶する。
【0036】
しかし、ウェブサイトにより、表記揺れが生じている場合がある。企業名の例では、ウェブサイトAにおいて「(株)エース」の表記であるが、ウェブサイトBにおいて「株式会社エース」という表記となっていることがあり得る。
【0037】
また、住所の例では、ウェブサイトAにおいて「東京都千代田区〇丁目・・・」という表記であるが、ウェブサイトBにおいて「千代田区〇丁目・・・」という都道府県名が省略された表記になっていることがあり得る。
【0038】
このような場合、自社サーバ2は、求人情報を自社データベース3に記憶する前段階で当該情報の欠落部分や表記揺れの補正、すなわち、データクレンジングを行う。その後、改めて重複ヒットしたと思われる求人情報のマッチングを行い、マッチした場合には一情報と判断して自社データベース3に記憶する。
【0039】
電話番号については、「-(ハイフン)」の有無の違いや、カッコを使用するか否かの違いがある。このようなルールに則り電話番号の表記を統一する作業は正規化と呼ばれ、データクレンジングの一態様として実行される。なお、この正規化を行うと、自社サーバ2は、容易に複数の求人情報の同一性を判断することができる。
【0040】
また、自社サーバ2は、取得したページ内のどの箇所をどのように抽出してデータクレンジングを行うかをデータ分類毎に指定することができる。具体的には、自社サーバ2は、電話番号、住所等のラベル(指標)に対して、個別に「抽出方法」、「正規化方法」、「検証方法」を指定することができる。
【0041】
電話番号の例では、所定の文字列(指標)の直後に出現する「-(ハイフン)」で区切られた全角数字又は半角数字を抽出し、全角数字部分を半角数字に変換する。その後、数字部分のみを抜き出し、その結果が空文字列ではなく、かつ比較先(既にリストに存在する電話番号)に同じ電話番号がなければ、新規の電話番号と判断する。
【0042】
電話番号(例えば、“09012341234”の11桁)の場合、3桁の数字を取り出し(“090”、“901”、“012”等)、同様の処理を行った比較先の3桁の数字と比較し、スコアを付ける。そして、一致すれば、ハイスコアを付与し、全てのスコアが規定値以下であれば、新規の番号とみなす。
【0043】
これにより、ウェブサイトA~Cを検索した際に発生する、重複ヒットした求人情報をそのまま自社データベース3に記憶してしまうことを防止することができる。求人情報をリストアップしたとき求人情報に重複があると、社員Hは同じ企業に対して何度も営業活動を行うという事態が生じうるが、掲載情報検索システム1を使用することで、営業効率の向上を図ることができる。
【0044】
次に、図3図5を参照して、掲載情報検索システム1によるヒット情報の閲覧について説明する。
【0045】
まず、図3に示すように、社員Hがユーザ端末7(掲載情報検索ツール)を用いて、検索条件をテキスト等で入力する。また、図4はユーザ端末7の表示画面7aを示しており、表示画面7aの上方が検索指定画面の例である。
【0046】
検索指定画面では「キーワード」による検索が基本となるため、社員Hは、「製造業」、「経理」といったキーワードを入力し、キーワードのAND検索かOR検索かを選択する。また、「取得日範囲」において求人情報が掲載された日付を指定することができ、「住所検索」において求人情報の中の勤務地を指定することができる。
【0047】
社員Hが「キーワード」、「取得日範囲」及び「住所検索」から検索条件を入力して、検索ボタン7bをクリックすると、自社サーバ2(図示省略)が会社Aの管理サーバ5Aにアクセスして、ウェブサイトAから検索情報に合致したヒット情報を取得する。また、ここでは図示を省略したが、自社サーバ2は、会社Bの管理サーバB、会社Cの管理サーバCにも順次アクセスする。
【0048】
次に、自社サーバ2は、上述したデータクレンジングを実行した後、ヒット情報を自社データベース3に記憶する。さらに、自社データベース3に記憶されたヒット情報は、ユーザ端末7の表示画面7a下方のリスト画面に表示される。
【0049】
リスト画面では、ヒット情報を「取得日」、「媒体名」、「企業名」、「住所」等の複数の項目でソート(昇順又は降順)し、表示することができる。上述したように、重複ヒットした求人情報は一情報にまとまるため、リスト画面には同じ求人情報がリストアップされることはない。また、以前求人情報を出した企業が改めて求人情報を出す場合があるが、最新情報が1つだけ表示される。
【0050】
リスト画面において、社員Hは、「LINK」項目のURLをクリックして、求人情報の掲載元のウェブサイト(例えば、A社のウェブサイトA)にジャンプすることができる。また、社員Hは、「詳細表示」項目の詳細ボタン7cをクリックして、求人情報の詳細が記載された詳細ページにジャンプすることができる。なお、この詳細ページは、社員Hの会社Xで作成し、自社データベース3に記憶されている求人情報である。
【0051】
詳細ページに記載された求人情報は、リスト画面に表示されている情報の他に、「E-mail」、「事業内容」、「仕事内容」、「勤務時間」、「雇用形態」、「待遇」、「給与」等がある。社員Hは、リスト画面に表示された求人情報のうち、特に興味がある求人情報について、その詳細を確認することができる。
【0052】
また、社員Hは、図4の検索指定画面のエクスポートボタン7dをクリックして、自社データベース3に記憶されたヒット情報をスプレッドシートに出力することができる。図5は、ユーザ端末7の表示画面7aに表示された、又はプリンタしたスプレッドシートの例である。
【0053】
スプレッドシートでは、1段目に「企業名」、「電話番号」、「LINK」等の項目を表示し、2段目以降は、今回のヒット情報が列挙される。スプレッドシートは、基本的に図4のリスト画面と同じ項目が含まれるが、出力する際に社員Hが必要な項目を選択するようにしてもよい。
【0054】
スプレッドシートを出力する際、ヒット情報をソートできる点、重複情報が排除される点は、図4のリスト画面と同じである。また、スプレッドシートをユーザ端末7の表示画面7aに表示している場合には、「LINK」項目のURLから求人情報が掲載されたウェブサイトにジャンプすることもできる。
【0055】
社員Hは、スプレッドシートを個人用にカスタマイズすることもできる。例えば、営業用の「連絡済」項目や、「メモ記入欄」項目を追加してもよい。これにより、社員Hは、職種や住所等で絞り込んだ連絡先に対して、電話等により効率良く営業活動を行うことができる。
【0056】
上記説明は、本発明の実施形態の一部であり、これ以外にも種々な実施形態が考えられる。実施形態において示した検索対象の会社数(図1参照)やウェブサイトの構成(図2A参照)は、例示に過ぎない。ユーザ端末7は、社内のデスクトップPC、ノートPCに限られず、タブレット端末やスマートフォン等、インターネットに接続可能なモバイル機器であってもよい。
【0057】
また、検索対象の情報も求人情報に限られない。例えば、検索したい情報が飲食店であった場合、ユーザは、ユーザ端末7の掲載情報検索ツールから「韓国料理」、「世田谷区」等の検索条件を指定する。これにより、自社サーバ2が飲食店を紹介する複数のウェブサイトの管理サーバにアクセスして(検索範囲は限定)、検索情報に合致したヒット情報を取得する。
【0058】
さらに、自社サーバ2は、ヒット情報のデータクレンジングを行い、自社データベース3に記憶する。その後、ユーザ端末7にヒット情報を所定のソートを実行したうえ、リスト画面に表示する。これにより、ユーザは、複数のウェブサイトに都度アクセスすることなく、また、重複ヒットした情報は排除して、飲食店に関する検索結果を閲覧することができる。
【0059】
また、上記実施形態では、ユーザが自社サーバ2にアクセスできるという設定であるが、ユーザは、外部の企業や人であってもよい。その場合には、外部の企業や人に対して、自社サーバ2に対する特定のアクセス権を付与し、外部の企業や人が、自社サーバ2の上記システムを利用して情報検索ができるようにすることができる。そして、自社サーバ2を有する会社は、外部の企業や人に対して上記サービスを提供することにより、利用料等を請求するビジネスを展開することができる。
【符号の説明】
【0060】
1…掲載情報検索システム、2…自社サーバ、3…自社データベース、5A~5C…管理サーバ、7…ユーザ端末、7a…表示画面、7b…検索ボタン、7c…詳細ボタン、7d…エクスポートボタン。
図1
図2A
図2B
図3
図4
図5