IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アイエムエス ソフトウェア サービシズ リミテッドの特許一覧

特開2024-176395分析支援サーバ、分析支援方法及びプログラム
<>
  • 特開-分析支援サーバ、分析支援方法及びプログラム 図1
  • 特開-分析支援サーバ、分析支援方法及びプログラム 図2
  • 特開-分析支援サーバ、分析支援方法及びプログラム 図3
  • 特開-分析支援サーバ、分析支援方法及びプログラム 図4
  • 特開-分析支援サーバ、分析支援方法及びプログラム 図5
  • 特開-分析支援サーバ、分析支援方法及びプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024176395
(43)【公開日】2024-12-19
(54)【発明の名称】分析支援サーバ、分析支援方法及びプログラム
(51)【国際特許分類】
   G06Q 40/00 20230101AFI20241212BHJP
【FI】
G06Q40/00
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023094893
(22)【出願日】2023-06-08
(71)【出願人】
【識別番号】506369036
【氏名又は名称】アイエムエス ソフトウェア サービシズ リミテッド
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】鶴飼 太郎
(72)【発明者】
【氏名】吉田 重人
【テーマコード(参考)】
5L040
5L055
【Fターム(参考)】
5L040BB55
5L055BB55
(57)【要約】
【課題】ユーザによる企業情報の効率的な分析を支援するための技術を提供する。
【解決手段】企業の分析を支援するための情報を提供するための分析支援サーバは、検索キーワードの指定をユーザから取得する取得部と、複数のデータソースから読み出された複数のレコードから検索キーワードを含む1つ以上のレコードを特定し、1つ以上のレコードから1つ以上の企業を特定する特定部と、特定された1つ以上の企業を示すリストを表示する表示部と、を含む。
【選択図】図5
【特許請求の範囲】
【請求項1】
企業の分析を支援するための情報を提供するための分析支援サーバであって、
検索キーワードの指定をユーザから取得する取得手段と、
複数のデータソースから読み出された複数のレコードから前記検索キーワードを含む1つ以上のレコードを特定し、前記1つ以上のレコードから1つ以上の企業を特定する特定手段と、
前記特定された1つ以上の企業を示すリストを表示する表示手段と、を備える分析支援サーバ。
【請求項2】
前記表示手段は、前記リストにおいて示される企業を特定するために用いられたレコードが読み出されたデータソースを、当該企業に関連付けて示す、請求項1に記載の分析支援サーバ。
【請求項3】
前記分析支援サーバは、企業に割り当てられた分類を管理する管理手段を更に備え、
前記表示手段は、前記リストにおいて示される企業に割り当てられた前記分類を、当該企業に関連付けて示す、請求項1に記載の分析支援サーバ。
【請求項4】
前記分類は、複数の階層を含む階層構造を有し、
前記表示手段は、複数の階層のそれぞれにおける分類を、前記リストにおいて示される企業に関連付けて示す、請求項3に記載の分析支援サーバ。
【請求項5】
前記分析支援サーバは、複数の企業を前記階層構造に分類する分類手段を更に備え、
前記階層構造は、第1階層と、前記第1階層よりも下位にある第2階層とを含み、
前記分類手段は、前記第1階層と前記第2階層とにおいて企業を異なる手法で分類する、請求項4に記載の分析支援サーバ。
【請求項6】
前記分類手段は、前記第1階層において企業を文章ベースの自然言語処理を用いて分類し、前記第2階層において企業を単語ベースの自然言語処理を用いて分類する、請求項5に記載の分析支援サーバ。
【請求項7】
コンピュータを請求項1乃至6の何れか1項に記載の分析支援サーバの各手段として機能させるためのプログラム。
【請求項8】
企業の分析を支援するための情報を提供するためにコンピュータによって実行される分析支援方法であって、
検索キーワードの指定をユーザから取得する取得工程と、
複数のデータソースから読み出された複数のレコードから前記検索キーワードを含む1つ以上のレコードを特定し、前記1つ以上のレコードから1つ以上の企業を特定する特定工程と、
前記特定された1つ以上の企業を示すリストを表示する表示工程と、を備える分析支援方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析支援サーバ、分析支援方法及びプログラムに関する。
【背景技術】
【0002】
投資対象を検討するために、企業について記載された文章を分析するための技術が知られている。特許文献1には、複数の企業に関して企業ごとの評価文章に含まれるキーワードの評価値に基づいて、評価対象企業の企業評価値を算出する技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007-183796号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
企業に関する情報、すなわち企業情報は、様々なデータソースから収集されうる。様々なデータソースから収集された企業情報をデータソースごとに別々に提示すると、ユーザが企業情報を効率的に分析することが困難でありうる。本発明の一部の側面は、ユーザによる企業情報の効率的な分析を支援するための技術を提供することを目的とする。
【課題を解決するための手段】
【0005】
一部の実施形態によれば、企業の分析を支援するための情報を提供するための分析支援サーバであって、検索キーワードの指定をユーザから取得する取得手段と、複数のデータソースから読み出された複数のレコードから前記検索キーワードを含む1つ以上のレコードを特定し、前記1つ以上のレコードから1つ以上の企業を特定する特定手段と、前記特定された1つ以上の企業を示すリストを表示する表示手段と、を備える分析支援サーバが提供される。
【発明の効果】
【0006】
一部の実施形態によれば、ユーザによる企業情報の効率的な分析を支援できる。
【図面の簡単な説明】
【0007】
図1】一部の実施形態に係るシステムの構成例について説明するブロック図。
図2】一部の実施形態に係るコンピュータのハードウェア構成例について説明するブロック図。
図3】一部の実施形態に係る様々なレコードについて説明する模式図。
図4】一部の実施形態に係る分類レコードの生成方法例について説明するフロー図。
図5】一部の実施形態に係る企業情報の検索方法例について説明するフロー図。
図6】一部の実施形態に係る検索結果の表示画面例について説明する模式図。
【発明を実施するための形態】
【0008】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうち二つ以上の特徴は任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。
【0009】
図1を参照して、一部の実施形態に係る分析支援サーバ100を含むシステムの構成例を説明する。分析支援サーバ100は、ユーザによる企業の分析を支援するための処理を行うサーバである。この処理の詳細については後述する。分析支援サーバ100は、ネットワーク107を通じて、1つ以上のデータベース(DB)サーバと通信可能である。例えば、分析支援サーバ100は、企業DBサーバ101、投資家DBサーバ102、文献DBサーバ103、知的財産DBサーバ104、及び臨床試験DBサーバ105と通信可能であってもよい。各DBサーバは、分析支援サーバ100からの要求に応じて、自身が管理する情報を分析支援サーバ100に提供する。このように、各DBサーバは、データソースとして機能する。分析支援サーバ100は、これらのDBサーバのうちの一部のみをデータソースとして利用してもよいし、他のDBサーバを追加のデータソースとして利用してもよい。
【0010】
企業DBサーバ101は、企業に関する一般的な情報を記憶するDBを管理するサーバである。投資家DBサーバ102は、投資家に関する情報を記憶するDBを管理するサーバである。投資家とは、企業等の法人であってもよいし、自然人であってもよい。文献DBサーバ103は、文献に関する情報を記憶するDBを管理するサーバである。例えば、文献DBサーバ103は、技術文献に関する情報を記憶してもよい。技術文献は、論文などの学術文献を含んでもよい。知的財産DBサーバ104は、知的財産に関する情報を記憶するDBを管理するサーバである。知的財産は、特許、意匠、商標などを含んでもよい。臨床試験DBサーバ105は、臨床試験に関する情報を記憶するDBを管理するサーバである。
【0011】
分析支援サーバ100は、ネットワーク107を通じて、クライアント端末106とさらに通信可能であってもよい。クライアント端末106は、分析支援サーバ100によって提供される分析支援サービスをユーザが利用するために使用されてもよい。例えば、分析支援サーバ100は、ウェブアプリケーションによって分析支援サービスを提供してもよい。クライアント端末106は、自身のブラウザ又は専用アプリケーションを使用して、分析支援サーバ100のウェブアプリケーションにアクセスしてもよい。クライアント端末106は、例えばパーソナルコンピュータ、スマートフォン、タブレットなどであってもよい。
【0012】
ネットワーク107は、分析支援サーバ100に他の装置(DBサーバやクライアント端末106)との通信を提供する任意のネットワークである。例えば、ネットワーク107は、ローカル・エリア・ネットワーク(LAN)を含んでもよいし、インターネットのような広域ネットワークを含んでもよいし、クラウドシステム内の内部ネットワークを含んでもよい。
【0013】
図2を参照して、コンピュータ200のハードウェア構成例を説明する。コンピュータ200は、図2に示される構成要素を含んでもよい。コンピュータ200は、図2に示される構成要素の一部を含まなくてもよいし、図2に示されない構成要素を含んでもよい。コンピュータ200は、分析支援サーバ100、企業DBサーバ101、投資家DBサーバ102、文献DBサーバ103、知的財産DBサーバ104、臨床試験DBサーバ105、及びクライアント端末106の何れとして使用されてもよい。図1に示される複数のサーバは、別個のコンピュータ200によって実現されてもよい。これに代えて、図1に示される複数のサーバの一部は、単一のコンピュータ200によって実現されてもよい。
【0014】
プロセッサ201は、コンピュータ200の全体的な動作を制御する装置である。プロセッサ201は、例えばCPU(中央処理装置)として機能する。メモリ202は、コンピュータ200の動作に必要なプログラム及び一時データを記憶する装置である。メモリ202は、例えばRAM(ランダムアクセスメモリ)やROM(リードオンリメモリ)によって構成される。コンピュータ200の動作は、例えばメモリ202に格納されたプログラムをプロセッサ201が実行することによって行われてもよい。これにかえて、コンピュータ200の動作の一部又は全部は、ASIC(特定用途向け集積回路)やFPGA(フィールドプログラマブルゲートアレイ)のような専用回路によって実行されてもよい。
【0015】
入力装置203は、コンピュータ200のユーザからの入力を取得するための装置である。入力装置203は、例えばキーボードやマウスによって構成される。出力装置204は、コンピュータ200のユーザへの出力を行うための装置である。出力装置204は、例えばディスプレイやスピーカによって構成される。通信装置205は、コンピュータ200がネットワーク107に接続するための装置である。通信装置205は、例えばネットワーク・インタフェース・カード(NIC)や無線通信モジュールによって構成される。
【0016】
記憶装置206は、コンピュータ200の動作に使用されるデータを記憶する装置である。記憶装置206は、例えばハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)又はデジタル多目的ディスク(DVD)のような記憶媒体によって構成される。
【0017】
図3を参照して、分析支援サーバ100及びDBサーバ101~105によって管理される情報について説明する。企業DBサーバ101は、企業ごとに企業レコード301を管理する。一般に、企業DBサーバ101は、複数の企業レコード301を管理する。企業レコード301とは、個別の企業の情報を表すレコードのことである。複数の企業レコード301はテーブル形式で管理されてもよいし、他の形式で管理されてもよい。以下に説明する他のレコードについても同様である。
【0018】
企業レコード301は、図3に示される項目を有する。企業レコード301は、図3に示される項目のうちの一部を含まなくてもよいし、他の項目を含んでもよい。以下に説明する他のレコードについても同様である。企業レコード301のディスクリプションは、企業について説明する文章であり、自然言語で記載されている。企業レコード301のキーワードは、企業を表す1つ以上の単語である。企業レコード301の各項目の情報は、企業DBサーバ101を管理する管理者によって登録されてもよい。
【0019】
投資家DBサーバ102は、投資家ごとに投資家レコード302を管理する。一般に、投資家DBサーバ102は、複数の投資家レコード302を管理する。投資家レコード302とは、個別の投資家の情報を表すレコードのことである。投資家レコード302の各項目の情報は、投資家DBサーバ102を管理する管理者によって登録されてもよい。投資家レコード302は、例えば投資家名を含んでもよい。投資家名は、投資を行う自然人又は法人(例えば、企業)の名称のことであってもよい。
【0020】
文献DBサーバ103は、文献ごとに文献レコード303を管理する。一般に、文献DBサーバ103は、複数の文献レコード303を管理する。文献レコード303とは、個別の文献の情報を管理するためのレコードのことである。文献レコード303の各項目の情報は、文献DBサーバ103を管理する管理者によって登録されてもよい。文献レコード303は、例えば著者名及び所属名を含んでもよい。著者名は、文献を作成した自然人の名称のことであってもよく、所属名はこの自然人が所属する企業の名称のことであってもよい。
【0021】
知的財産DBサーバ104は、知的財産権の事件ごとに知的財産レコード304を管理する。一般に、知的財産DBサーバ104は、複数の知的財産レコード304を管理する。知的財産レコード304とは、知的財産権に係る個別の事件(例えば、特許出願事件、意匠登録出願事件など)の情報を管理するためのレコードのことである。知的財産レコード304の各項目の情報は、知的財産DBサーバ104を管理する管理者によって登録されてもよい。知的財産レコード304は、例えば出願人名及び特許権者名を含んでもよい。出願人は、出願を行った自然人又は法人(例えば、企業)の名称のことであってもよい。権利者名は、知的財産権を有する自然人又は法人(例えば、企業)の名称のことであってもよい。
【0022】
臨床試験DBサーバ105は、臨床試験ごとに臨床試験レコード305を管理する。一般に、臨床試験DBサーバ105は、複数の臨床試験レコード305を管理する。臨床試験レコード305とは、個別の臨床試験の情報を管理するためのレコードのことである。臨床試験レコード305の各項目の情報は、臨床試験DBサーバ105を管理する管理者によって登録されてもよい。臨床試験レコード305は、例えば実施者名、スポンサー名、及び協力者名を含んでもよい。実施者名は、臨床試験を実施する企業の名称のことであってもよい。スポンサー名は、臨床試験に出資する企業の名称のことであってもよい。協力者名は、臨床試験に協力する企業の名称のことであってもよい。
【0023】
分析支援サーバ100は、企業ごとに分類レコード300を管理する。一般に、分析支援サーバ100は、複数の分類レコード300を管理する。分類レコード300とは、個別の企業の分類を管理するためのレコードのことである。分類レコード300の各項目の情報は、分析支援サーバ100を管理する管理者によって登録されてもよいし、分析支援サーバ100によって設定されてもよい。分析支援サーバ100は、企業DBサーバ101によって管理される複数の企業レコード301のすべてについて分類レコード300を管理してもよいし、企業DBサーバ101によって管理される複数の企業レコード301の一部について分類レコード300を管理してもよい。例えば、分析支援サーバ100は、企業DBサーバ101によって管理される複数の企業レコード301のうち、ヘルスケア・医療分野に関連する企業の分類を管理してもよい。1つの分類レコード300は、何れかの企業レコード301に対応する。
【0024】
分類レコード300の企業レコードIDは、企業DBサーバ101によって管理される企業レコード301を一意に識別するための識別情報である。企業レコードIDは、企業レコード301に含まれる企業名であってもよいし、企業レコード301に含まれる法人名であってもよい。これに代えて、企業DBサーバ101によって各企業レコード301に一意の識別情報が割り当てられている場合に、企業レコードIDは、この識別情報であってもよい。
【0025】
分析支援サーバ100は、各企業に、複数のセグメントのうちの何れかのセグメントを割り当てる。言い換えると、分析支援サーバ100は、複数のデータソース(例えば、DBサーバ101~105)から情報を取得した複数の企業を複数のセグメントに分類する。分析支援サーバ100は、各企業を、単一の段階で複数のセグメントに分類してもよいし、複数の段階の階層構造で複数のセグメントに分類してもよい。
【0026】
一部の実施形態において、分析支援サーバ100は、各企業を4段階(例えば、セクタ、セグメント、テック・セグメント、詳細セグメント)の階層構造で分類してもよい。この例では、セクタが最上位の階層であり、その次の階層がセグメントであり、その次の階層がテック・セグメントであり、最下位の階層が詳細セグメントである。これらの4段階の階層構造は、ツリー構造を有してもよい。具体的に、各セクタが複数のセグメントに分割され、各セグメントが複数のテック・セグメントに分割され、各テック・セグメントが複数の詳細セグメントに分割されてもよい。
【0027】
最上位の階層であるセクタは、ビジネスモデル単位での企業の分類を表す。例えば、セクタは、B2C(企業対顧客)やB2B(企業対企業)のような分類を有してもよい。
【0028】
2番目の階層であるセグメントは、ビジネスモデル内で各企業が戦略的に注力する技術領域の分類を表す。例えば、セグメントは、ヘルスケアやモノのインターネット(IoT)のような分類を有してもよい。
【0029】
3番目の階層であるテック・セグメントは、注力する技術領域内でのテクノロジー/サービス単位での分類を表す。例えば、テック・セグメントは、生体監視のような分類を有してもよい。
【0030】
最下位の階層である詳細セグメントは、テクノロジー単位内の要素技術や、具体的なサービス単位での分類を表す。例えば、詳細セグメントは、疾患監視のような分類を有してもよい。
【0031】
図4を参照して、分析支援サーバ100が企業DBサーバの企業レコード301によって表される企業を分類し、分類レコード300を生成するための動作について説明する。図4の各工程は、分析支援サーバ100として動作するコンピュータ200のプロセッサ201が、メモリ202に読み出されたプログラムを実行することによって行われてもよい。この場合に、プロセッサ201が、各工程の動作を実行する処理主体となる。これに代えて、図4の方法の一部又は全部の工程は、特定用途向け集積回路(ASIC)のような専用回路によって実行されてもよい。この場合に、専用回路が、各工程の動作を実行する処理主体となる。以下の図5の動作についても同様である。図4の動作は、分析支援サーバ100の管理者からの指示に応じて開始されてもよい。図4の動作の開始時点で、企業DBサーバ101に複数の企業レコード301が記憶されているとする。
【0032】
S401で、分析支援サーバ100は、企業DBサーバ101から複数の企業レコード301を読み出し、後続の処理のために記憶装置206に記憶する。分析支援サーバ100は、企業DBサーバ101が管理するすべての企業レコード301を読み出してもよいし、その一部のみ(例えば、ヘルスケア・医療分野に関連する企業)の企業レコード301を読み出してもよい。
【0033】
S402で、分析支援サーバ100は、企業レコード301を読み出した複数の企業のそれぞれについて分類レコード300を生成し、記憶装置206に記憶する。分析支援サーバ100は、個別の分類レコード300の企業レコードIDとして、個別の企業レコード301の企業名、法人名又は他の識別情報を設定する。この時点で、分類レコード300の他の項目(例えば、セクタなど)はブランクである。
【0034】
S403で、分析支援サーバ100は、分類レコード300が生成された複数の企業のそれぞれにセクタを設定し、このセクタを分類レコード300のセクタ項目に記憶する。分析支援サーバ100は、分析支援サーバ100の管理者によって指定されたルールに従って各企業のセクタを設定してもよい。
【0035】
S404で、分析支援サーバ100は、各セクタ内の複数の企業のそれぞれにセグメントを設定し、このセグメントを分類レコード300のセグメント項目に記憶する。分析支援サーバ100は、セグメントを設定するために、機械学習による自然言語処理(以下、単に「自然言語処理」と表す)を使用することによって、各セクタ内の複数の企業を複数のグループに分割してもよい。
【0036】
自然言語処理を使用して各セクタ内の複数の企業を複数のグループに分割する方法の一例について説明する。例えば、分析支援サーバ100は、文章ベースの自然言語処理を行うことによって各セクタ内の複数の企業を複数のグループに分割してもよい。例えば、分析支援サーバ100は、各セクタ内の複数の企業の企業レコード301に含まれる文章(例えば、ディスクリプション)を使用して自然言語処理を行ってもよい。このような文章ベースの自然言語処理は、既存の技術を使用して行われてもよく、例えばtop2vecを使用して行われてもよい。top2vecでは、文章に含まれる各段落の文脈及び段落間の繋がりを解釈できる。
【0037】
以下、文章ベースの自然言語処理の一例について説明する。まず、分析支援サーバ100は、1つのセクタに含まれる複数の企業の企業レコード301からディスクリプションを抽出し、各企業レコード301のディスクリプションを表すベクトルを生成する。このベクトルは、例えば300次元ベクトルであってもよい。その後、分析支援サーバ100は、各ベクトルを低次元(例えば、5次元)ベクトルに変換する。最後に、分析支援サーバ100は、複数の企業を表す低次元ベクトルをクラスタリングすることによって、1つのセクタに含まれる複数の企業を複数のグループに分割する。例えば、分析支援サーバ100は、各企業レコード301のディスクリプションに含まれる段落の文脈や繋がりの類似度をスコアリングし、スコアが所定の閾値よりも互い場合に、ディスクリプションを同じグループに分類してもよい。分析支援サーバ100は、複数のセクタのそれぞれについて上述の処理を行う。
【0038】
その後、分析支援サーバ100は、各グループに対してセグメント名を設定する。セグメント名は、所定のルールで分析支援サーバ100によって決定されてもよいし、分析支援サーバ100の管理者によって設定されてもよい。
【0039】
一部のセクタ(例えば、企業数が500以下であるセクタ)について、分析支援サーバ100は、上述のように自然言語処理を行う代わりに、分析支援サーバ100の管理者によって指定されたルールに従ってセグメントを設定してもよい。
【0040】
S405で、分析支援サーバ100は、各セグメント内の複数の企業のそれぞれにテック・セグメントを設定し、このテック・セグメントを分類レコード300のテック・セグメント項目に記憶する。分析支援サーバ100は、テック・セグメントを設定するために、自然言語処理を使用することによって、各セグメント内の複数の企業を複数のグループに分割してもよい。S405における分割は、S404における分割と同様に、top2vecが使用されてもよい。
【0041】
S406で、分析支援サーバ100は、各テック・セグメント内の複数の企業のそれぞれに詳細セグメントを設定し、この詳細セグメントを分類レコード300の詳細セグメント項目に記憶する。例えば、分析支援サーバ100は、各テック・セグメント内の複数の企業の企業レコード301に含まれる単語を使用して自然言語処理を行ってもよい。自然言語処理に使用される単語は、企業レコード301のディスクリプションから抽出された単語であってもよいし、企業レコード301のキーワードであってもよい。このような単語ベースの自然言語処理は、既存の技術を使用して行われてもよく、例えばword2vecを使用して行われてもよい。
【0042】
以下、単語ベースの自然言語処理の一例について説明する。まず、分析支援サーバ100は、1つのテック・セグメントに含まれる複数の企業の企業レコード301からディスクリプションを抽出する。分析支援サーバ100は、ディスクリプションに含まれる単語を対象として機械学習を行うことによって、モデル(word2vecモデル)を生成する。この学習は、企業DBサーバ101から取得されたデータのみを使用する学習であってもよいし、汎用的なコーパスを使用して学習済みのモデルに対する追加学習であってもよい。
【0043】
その後、分析支援サーバ100は、企業レコード301に含まれるキーワードをモデルに入力することによって、ベクトルを取得する。このベクトルは、例えば300次元ベクトルであってもよい。企業レコード301に複数のキーワードが含まれる場合に、分析支援サーバ100は、これらのキーワードのそれぞれのベクトルに基づいて(例えば、最大値を抽出したり、平均したりすることによって)、1つのベクトルを生成してもよい。
【0044】
その後、分析支援サーバ100は、各ベクトルを低次元(例えば、5次元)ベクトルに変換する。最後に、分析支援サーバ100は、複数の企業を表す低次元ベクトルをクラスタリングすることによって、1つのテック・セグメントに含まれる複数の企業を複数のグループに分割する。このクラスタリングは、例えばk-means法などによって行われてもよい。クラスタ数は、分析支援サーバ100の管理者によって設定されてもよい。分析支援サーバ100は、複数のテック・セグメントのそれぞれについて上述の処理を行う。
【0045】
その後、分析支援サーバ100は、各クラスタに対して詳細セグメント名を設定する。詳細セグメント名は、所定のルールで分析支援サーバ100によって決定されてもよいし、分析支援サーバ100の管理者によって設定されてもよい。
【0046】
以上のように、分析支援サーバ100は、セグメント及びテック・セグメントの分類と、詳細セグメントの分類を異なる手法で行う。具体的に、上位階層であるセグメント及びテック・セグメントの分類を文章ベースの手法で行い、下位階層である詳細セグメントの分類を単語ベースの手法で行う。下位の階層ほど、分類対象の企業数が少なくなる。発明者らは、実験を通じて、分類対象が多い場合に、文章ベースの手法の方が精度よく分類でき、分類対象が少ない場合に、単語ベースの手法の方が精度よく分類できることを見出した。そこで、上述のように分類を異なる手法で行うことによって、精度のよい分類を実現できる。
【0047】
図5を参照して、分析支援サーバ100が特定の条件を満たす企業の情報を提供するための動作の一例について説明する。図5の動作は、分析支援サーバ100のユーザからの指示に応じて開始されてもよい。図5の動作の開始時点で、DBサーバ101~105及び分析支援サーバ100に、図3の各項目が記憶されているとする。
【0048】
S501で、分析支援サーバ100は、検索条件を取得するための画面を生成し、ユーザに提示する。例えば、ユーザがクライアント端末106を使用して分析支援サーバ100を利用している場合に、分析支援サーバ100は、このような画面をクライアント端末106へ送信し、クライアント端末106が自身の出力装置204にこの画面を表示してもよい。これに代えて、ユーザが分析支援サーバ100を直接利用している場合に、分析支援サーバ100は、このような画面を自身の出力装置204に表示してもよい。
【0049】
図6を参照して、検索条件を取得するための画面600の一例について説明する。画面600は、例えば、検索対象のデータベースの指定を取得するためのプルダウンリスト601と、検索キーワードを取得するためのテキストボックス602と、検索実行の指示を取得するためのボタン603と、検索結果を表示するための表示領域604とを含んでもよい。S601の時点で(すなわち、検索実行前に)、表示領域604には何も表示されていなくてもよい。
【0050】
S502で、分析支援サーバ100は、画面600のプルダウンリスト601及びテキストボックス602を通じて、検索対象のデータベースの指定と、検索キーワードとをユーザから取得する。プルダウンリスト601に代えて、複数の項目から1つの項目の選択を受け付けるための他のグラフィカルオブジェクト、例えばチェックボックス付きのリストが使用されてもよい。検索対象のデータベースは、例えば、「企業情報」、「投資家情報」、「文献情報」、「知的財産情報」、「臨床試験情報」との5つから選択可能であってもよい。検索キーワードは、任意の単語であってもよい。例えば、検索キーワードは、企業名であってもよいし、疾患名であってもよい。
【0051】
S503で、分析支援サーバ100は、検索対象のデータベースの指定と、検索キーワードと使用して検索を実行する。例えば、検索対象のデータベースとして「企業情報」が指定されたとする。この場合に、分析支援サーバ100は、企業DBサーバ101によって管理される複数の企業レコード301のうち、企業名、法人名、ディスクリプション及びキーワードの何れかに検索キーワードが含まれる企業レコード301を特定してもよい。これに代えて、分析支援サーバ100は、検索キーワードが他の項目に含まれる企業レコード301を特定してもよい。その後、分析支援サーバ100は、分析支援サーバ100によって管理されている複数の分類レコード300のうち、特定された企業レコード301の企業名によって示される企業に関するレコードを一致レコードとして特定する。
【0052】
検索対象のデータベースとして「投資家情報」が指定されたとする。この場合に、分析支援サーバ100は、投資家DBサーバ102によって管理される複数の投資家レコード302のうち、投資家名及びキーワードの何れかに検索キーワードが含まれる投資家レコード302を特定してもよい。これに代えて、分析支援サーバ100は、検索キーワードが他の項目に含まれる投資家レコード302を特定してもよい。その後、分析支援サーバ100は、分析支援サーバ100によって管理されている複数の分類レコード300のうち、特定された投資家レコード302の投資家名によって示される企業に関するレコードを一致レコードとして特定する。投資家名に代えて又はこれに加えて、投資家レコード302の含まれる項目のうち企業を表す他の項目が使用されてもよい。
【0053】
検索対象のデータベースとして「文献情報」が指定されたとする。この場合に、分析支援サーバ100は、文献DBサーバ103によって管理される複数の文献レコード303のうち、雑誌名、アブストラクト及びキーワードの何れかに検索キーワードが含まれる文献レコード303を特定してもよい。これに代えて、分析支援サーバ100は、検索キーワードが他の項目に含まれる文献レコード303を特定してもよい。その後、分析支援サーバ100は、分析支援サーバ100によって管理されている複数の分類レコード300のうち、特定された文献レコード303の所属名によって示される企業に関するレコードを一致レコードとして特定する。所属名に代えて又はこれに加えて、文献レコード303の含まれる項目のうち企業を表す他の項目が使用されてもよい。
【0054】
検索対象のデータベースとして「知的財産情報」が指定されたとする。この場合に、分析支援サーバ100は、知的財産DBサーバ104によって管理される複数の知的財産レコード304のうち、名称、アブストラクト、特許請求の範囲及びキーワードの何れかに検索キーワードが含まれる知的財産レコード304を特定してもよい。これに代えて、分析支援サーバ100は、検索キーワードが他の項目に含まれる知的財産レコード304を特定してもよい。その後、分析支援サーバ100は、分析支援サーバ100によって管理されている複数の分類レコード300のうち、特定された知的財産レコード304の出願人名又は権利者名によって示される企業に関するレコードを一致レコードとして特定する。出願人名又は権利者名に代えて又はこれに加えて、知的財産レコード304の含まれる項目のうち企業を表す他の項目が使用されてもよい。
【0055】
検索対象のデータベースとして「臨床試験情報」が指定されたとする。この場合に、分析支援サーバ100は、臨床試験DBサーバ105によって管理される複数の臨床試験レコード305のうち、スポンサー名、協力者名及びキーワードの何れかに検索キーワードが含まれる臨床試験レコード305を特定してもよい。これに代えて、分析支援サーバ100は、検索キーワードが他の項目に含まれる臨床試験レコード305を特定してもよい。その後、分析支援サーバ100は、分析支援サーバ100によって管理されている複数の分類レコード300のうち、特定された臨床試験レコード305の実施者名、スポンサー名、又は協力者名によって示される企業に関するレコードを一致レコードとして特定する。実施者名、スポンサー名、又は協力者名に代えて又はこれに加えて、臨床試験レコード305の含まれる項目のうち企業を表す他の項目が使用されてもよい。
【0056】
S504で、分析支援サーバ100は、画面600の表示領域604に検索結果を表示する。例えば、図6に示されるように、分析支援サーバ100は、検索結果の概要を示すメッセージ605と、ヒットレコードのテーブル606とを表示領域604に含める。テーブル606の各レコードは、S503で特定された一致レコードを表す。テーブル606は、複数のカラム607~612を含む。カラム607は、プルダウンリスト601で指定されたデータベースを示す。カラム608は、特定された企業のセクタを示す。カラム609は、特定された企業のセグメントを表す。カラム610は、特定された企業のテック・セグメントを表す。カラム611は、特定された企業の詳細セグメントを表す。カラム612は、特定された企業の企業名を表す。
【0057】
カラム610、611及び612の各フィールドは、詳細ページへのリンクとなっていてもよい。分析支援サーバ100は、これらのリンクがユーザによって選択されたことに応じて、テック・セグメント、詳細セグメント又は企業の詳細を示すページをユーザに提示してもよい。カラム608~612のそれぞれをキーとしてテーブル606のレコードがソート可能であってもよい。カラム609~611のそれぞれについてテーブル606のレコードがフィルトレーション可能であってもよい。
【0058】
以上のように、図6の画面600によれば、複数のデータソースから検索キーワードを含むレコードが抽出され、このレコードに関連付けられた企業のリストが表示される。また、検索条件を満たす企業の企業名とともに、セクタ、セグメント、テック・セグメント及び詳細セグメントが表示される。さらに、検索条件を満たす企業の企業名とともに、検索キーワードを含むレコードを記憶するデータソースが表示される。そのため、ユーザは、指定した検索条件を満たす企業の傾向を精度よく把握できる。
【0059】
発明は上記の実施形態に制限されるものではなく、発明の要旨の範囲内で、種々の変形・変更が可能である。
【符号の説明】
【0060】
100 分析支援サーバ、101 企業DBサーバ、106 クライアント端末
図1
図2
図3
図4
図5
図6