(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024036965
(43)【公開日】2024-03-18
(54)【発明の名称】情報処理システム、情報処理方法、およびプログラム
(51)【国際特許分類】
G06F 16/953 20190101AFI20240311BHJP
G06Q 10/063 20230101ALI20240311BHJP
【FI】
G06F16/953
G06Q10/06 300
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2022141545
(22)【出願日】2022-09-06
【新規性喪失の例外の表示】新規性喪失の例外適用申請有り
(71)【出願人】
【識別番号】519314364
【氏名又は名称】ストックマーク株式会社
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】海老原 隆太
(72)【発明者】
【氏名】近江 崇宏
(72)【発明者】
【氏名】金子 望
(72)【発明者】
【氏名】田中 和生
(72)【発明者】
【氏名】中尾 有伸
(72)【発明者】
【氏名】西村 元一
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175DA01
5B175HB01
5L049AA01
(57)【要約】
【課題】ネットワーク上で取得可能な情報である、ユーザが所望する企業や業界などの主体についての将来に関する情報を、ユーザに適切に提供することを目的とする。
【解決手段】ユーザによって設定されるキーワードを前記ユーザから取得する取得部と、ネットワーク上に公開されている情報のうち、前記キーワードに関する将来の内容を示すキーワード情報を特定する特定部と、前記キーワード情報から、将来の時期を示す時期情報と、前記キーワード情報の主体の名称を示す名称情報と、将来の内容を示す将来文情報と、を抽出する抽出部と、前記時期情報と、前記名称情報と、前記将来文情報と、を関連付けて表示部に表示させる表示処理部と、を含む。
【選択図】
図5
【特許請求の範囲】
【請求項1】
ユーザによって設定されるキーワードを前記ユーザから取得する取得部と、
ネットワーク上に公開されている情報のうち、前記キーワードに関する将来の内容を示すキーワード情報を特定する特定部と、
前記キーワード情報から、将来の時期を示す時期情報と、前記キーワード情報の主体の名称を示す名称情報と、将来の内容を示す将来文情報と、を抽出する抽出部と、
前記時期情報と、前記名称情報と、前記将来文情報と、を関連付けて表示部に表示させる表示処理部と、
を含む情報処理システム。
【請求項2】
前記抽出部は、前記キーワード情報が示すテキストデータに含まれる文のうち、将来の時期を示すワードを含む文を、前記将来文情報として抽出する、
請求項1に記載の情報処理システム。
【請求項3】
前記抽出部は、前記キーワード情報が示すテキストデータに含まれる文のうち、当該テキストデータの冒頭から所定の数の文に前記将来の時期を示すワードが含まれている場合、前記将来の時期を示すワードを含む文を前記将来文情報として抽出する、
請求項1に記載の情報処理システム。
【請求項4】
前記抽出部は、前記キーワード情報が示すテキストデータに含まれる文のうち、前記キーワードに関する情報を含む文を、前記将来文情報として抽出する、
請求項1に記載の情報処理システム。
【請求項5】
前記抽出部は、前記キーワード情報が示すテキストデータに含まれる文のうち、前記主体の名称を含む文を、前記将来文情報として抽出する、
請求項1に記載の情報処理システム。
【請求項6】
前記表示処理部によって表示部に表示される前記将来文情報の個数を集計する集計部をさらに備え、
前記表示処理部は、前記集計された個数が最も多い年度を示す情報を表示する表示領域を表示部に表示させる、
請求項1から請求項5のいずれか一項に記載の情報処理システム。
【請求項7】
前記表示処理部によって表示部に表示される前記名称情報が示す主体の名称の個数を集計する集計部をさらに備え、
前記表示処理部は、前記集計された個数が最も多い主体の名称を示す情報を表示する表示領域を表示部に表示させる、
請求項1から請求項5のいずれか一項に記載の情報処理システム。
【請求項8】
前記キーワードと、前記将来文情報に含まれる将来の内容と、が類似する度合いである類似度を算出する類似度算出部をさらに備え、
前記表示処理部は、前記将来の時期のそれぞれにおいて、前記類似度が高い順に前記将来文情報を表示部に表示させる、
請求項1から請求項5のいずれか一項に記載の情報処理システム。
【請求項9】
前記表示処理部は、前記将来の時期のそれぞれにおいて、前記類似度が高い順に所定の個数の前記将来文情報を抽出して、前記抽出された将来文情報のそれぞれと、前記名称情報と、を表示部に表示させる、
請求項8に記載の情報処理システム。
【請求項10】
前記類似度算出部は、前記表示部におけるユーザの操作入力の履歴に基づいて、前記類似度を算出する、
請求項8に記載の情報処理システム。
【請求項11】
前記取得部は、ユーザによって設定される、業界の名称を示す前記キーワードを取得し、
前記抽出部は、前記キーワード情報が示すテキストデータに含まれる文のうち、前記キーワードである業界の名称に関する情報を含む文を抽出し、
前記表示処理部は、業界の名称と、当該業界の主要な企業の名称と、を関連付けたデータベースに基づいて、前記抽出されたキーワードである業界の名称に関する情報を含む文のうち、前記業界の主要な企業の名称を含む文を前記将来文情報として、前記時期情報と、前記名称情報と、を関連付けて表示部に表示させる、
請求項1に記載の情報処理システム。
【請求項12】
コンピュータが、
ユーザによって設定されるキーワードを前記ユーザから取得することと、
ネットワーク上に公開されている情報のうち、前記キーワードに関する将来の内容を示すキーワード情報を特定することと、
前記キーワード情報から、将来の時期を示す時期情報と、前記キーワード情報の主体の名称を示す名称情報と、将来の内容を示す将来文情報と、を抽出することと、
前記時期情報と、前記名称情報と、前記将来文情報と、を関連付けて表示部に表示させることと、
を実行する情報処理方法。
【請求項13】
コンピュータに、
ユーザによって設定されるキーワードを前記ユーザから取得することと、
ネットワーク上に公開されている情報のうち、前記キーワードに関する将来の内容を示すキーワード情報を特定することと、
前記キーワード情報から、将来の時期を示す時期情報と、前記キーワード情報の主体の名称を示す名称情報と、将来の内容を示す将来文情報と、を抽出することと、
前記時期情報と、前記名称情報と、前記将来文情報と、を関連付けて表示部に表示させることと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
膨大な情報の中から所定のテーマに沿って情報を収集、整理、編集するキュレーションと呼ばれる技術が知られている。例えば、特許文献1には、日々の膨大な記事データの中から企業のリスク情報を抽出してユーザに提供するリスク情報提供システムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載のリスク情報提供システムは、リスクのカテゴリ、記事データから抽出した企業の名称、企業の所在地を示す情報および記事の識別コードを関連付けて記憶部に記憶する。当該リスク情報提供システムは、クライアント端末から企業の名称を示す検索リクエストを受け付けて、記憶部を検索して、当該企業の名称に関連付けられるリスク情報を抽出する。当該リスク情報提供システムは、抽出したリスク情報をリスト化して検索結果画面として、ユーザ端末に提供する。これにより、当該リスク情報提供システムは、簡易な操作によって、日々発生する膨大な記事データの中からリスク情報を抽出してリスト化したものをユーザに提供できるため、ユーザにおけるリスク回避を容易にさせる。
【0005】
しかしながら、当該リスク情報提供システムでは、インターネット等のネットワーク上に公開されている、企業や業界などの将来に関する情報を、ユーザに適切に提供できない。
【0006】
そこで、本発明は、上記の課題を解決するために、ユーザが所望する企業や業界などの主体についての将来に関する情報を、ユーザに適切に提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一態様に係る情報処理システムは、 ユーザによって設定されるキーワードを前記ユーザから取得する取得部と、ネットワーク上に公開されている情報のうち、前記キーワードに関する将来の内容を示すキーワード情報を特定する特定部と、前記キーワード情報から、将来の時期を示す時期情報と、前記キーワード情報の主体の名称を示す名称情報と、将来の内容を示す将来文情報と、を抽出する抽出部と、前記時期情報と、前記名称情報と、前記将来文情報と、を関連付けて表示部に表示させる表示処理部と、を含む。
【0008】
本発明の一態様に係る情報処理方法は、コンピュータが、ユーザによって設定されるキーワードを前記ユーザから取得することと、ネットワーク上に公開されている情報のうち、前記キーワードに関する将来の内容を示すキーワード情報を特定することと、前記キーワード情報から、将来の時期を示す時期情報と、前記キーワード情報の主体の名称を示す名称情報と、将来の内容を示す将来文情報と、を抽出することと、前記時期情報と、前記名称情報と、前記将来文情報と、を関連付けて表示部に表示させることと、を実行する。
【0009】
本発明の一態様に係るプログラムは、コンピュータに、ユーザによって設定されるキーワードを前記ユーザから取得することと、ネットワーク上に公開されている情報のうち、前記キーワードに関する将来の内容を示すキーワード情報を特定することと、前記キーワード情報から、将来の時期を示す時期情報と、前記キーワード情報の主体の名称を示す名称情報と、将来の内容を示す将来文情報と、を抽出することと、前記時期情報と、前記名称情報と、前記将来文情報と、を関連付けて表示部に表示させることと、を実行させる。
【発明の効果】
【0010】
本発明によれば、ユーザが所望する企業や業界などの主体についての将来に関する情報を、ユーザに適切に提供することができる。
【図面の簡単な説明】
【0011】
【
図1】将来年表生成システムの構成の概要を示す図である。
【
図2】将来年表生成システムに含まれる各装置の機能構成を示す図である。
【
図3】キーワード関連データベースD111を示す図である。
【
図5】表示処理部で生成される画像T1の一例を示す図である。
【
図7】将来年表生成システムにおけるフローチャートの一例である。
【
図8】ユーザ端末のハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0012】
以下に、本発明の一実施形態における将来年表生成システム10について、図面を参照して詳細に説明する。ただし、以下に説明する実施形態は、あくまでも例示であり、以下に明示しない種々の変形や技術の適用を排除する意図はない。すなわち、本発明は、その趣旨を逸脱しない範囲で種々変形し、または各実施例を組み合わせるなどして実施することができる。また、以下の図面の記載において、同一または類似の部分には同一または類似の符号を付して表している。
【0013】
===将来年表生成システム10の構成===
<<概要>>
図1を参照して、将来年表生成システム10の構成の概要について説明する。
図1は、将来年表生成システム10の構成の概要を示す図である。
【0014】
将来年表生成システム10は、例えば、ユーザによって設定されるキーワードに基づき、ネットワーク上に公開されているキーワードに関する将来の内容を示す情報を、将来の内容を示す情報の主体の名称とともに、ユーザに提供するシステムである。なお、本実施形態においてネットワーク上に「公開」された情報とは、ネットワーク上で取得可能な情報であればよく、例えば、特定の会員のみがアクセスできるような情報であってもよい。
【0015】
ネットワークは、例えば、WAN(Wide Area Network)、LAN(Local Area Network)、イントラネット、インターネットなどであってもよい。
【0016】
キーワードは、例えば、ユーザによって設定されるテキストデータである。具体的には、キーワードは、例えば、製品の名称、技術の名称、会社の名称、業界の名称などである。また、キーワードは、例えば、期間を示す情報を含んでいてもよい。
【0017】
将来の内容を示す情報は、例えば、将来の時期を示すワード(例えば、20XX年やY年後など)を含む情報である。
【0018】
主体は、例えば、企業、業界、業界団体、官公庁などを含み、一定の活動の主体となり得るものであればよい。
【0019】
将来年表生成システム10は、例えば、ユーザからキーワードを取得した場合、キーワードに関する将来の内容を示す情報(以下、「キーワード情報」という。)を、ネットワーク上から取得する。
【0020】
キーワード情報は、例えば、キーワードおよびキーワードに類似するワードのうち少なくともいずれかを含んでいてもよい。また、キーワード情報は、例えば、将来の時期を示すワードを含んでいてもよい。
【0021】
具体的には、キーワード情報は、例えば、ニュース記事、企業が公開している各種データ(例えばアニュアルレポートなど)および論文データなどのテキストデータ(以下、「文章データ」という。)を含む。なお、キーワード情報は、文章データにアクセス可能なURL(Uniform Resource locator)を、文章データに関連付けた情報であってもよい。
【0022】
すなわち、キーワード情報は、例えば、キーワードに関連する事業を行う企業、業界および官公庁などにおける将来的の内容を含む情報である。
【0023】
将来年表生成システム10は、例えば、文章データに含まれる、時期を示す情報(以下、「時期情報」という。)、企業または業界などの主体の名称を示す情報(以下、「名称情報」という。)、文章データのうちの少なくとも一部であり、将来の内容を示す情報(以下、「将来文情報」という。)を関連付けてユーザに提供する。以下、便宜上、時期情報、名称情報および将来文情報を関連付けた情報を、「将来年表」という。
【0024】
このような、将来年表生成システム10は、例えば、年表生成サーバ100と、ユーザ端末200とを含む。
【0025】
年表生成サーバ100は、例えば、将来年表を生成して、ユーザ端末200に提供するサーバ装置である。年表生成サーバ100は、例えば、ユーザによって設定されたキーワードに関連する情報を将来年表にまとめて、ユーザ端末200の表示部に表示させる。
【0026】
年表生成サーバ100は、例えば、クラウドコンピュータ、サーバコンピュータ、パーソナルコンピュータ(例えば、デスクトップ、ラップトップ、タブレットなど)、メディアコンピュータプラットホーム(例えば、ケーブル、衛星セットトップボックス、デジタルビデオレコーダ)、ハンドヘルドコンピュータデバイス(例えば、PDA、電子メールクライアントなど)、あるいは他種のコンピュータ、またはコミュニケーションプラットホームなどの情報処理装置であってもよい。なお、年表生成サーバ100における処理の少なくとも一部は、1以上のコンピュータ(限定ではなく例として、1以上のコンピュータにより構成されるクラウドコンピューティング)により実現されていてもよいし、そうでなくてもよい。
【0027】
ユーザ端末200は、例えば、各種情報を年表生成サーバ100との間で送受信する端末装置である。具体的には、ユーザ端末200は、例えば、ユーザの操作入力に基づいてキーワードを示すテキストデータを年表生成サーバ100に送信する。また、ユーザ端末200は、例えば、年表生成サーバ100から将来年表を取得して、将来年表を表示部に表示させる。
【0028】
ユーザ端末200は、例えば、スマートフォン、携帯電話(フィーチャーフォン)、パーソナルコンピュータ(例えば、デスクトップ、ラップトップ、タブレットなど)、メディアコンピュータプラットホーム(例えば、ケーブル、衛星セットトップボックス、デジタルビデオレコーダ)、ハンドヘルドコンピュータデバイス(例えば、PDA(Personal Digital Assistant)、電子メールクライアントなど)、ウェアラブル端末(メガネ型デバイス、時計型デバイスなど)、他種のコンピュータ、またはコミュニケーションプラットホームなどの情報処理装置であってもよい。
【0029】
<<年表生成サーバ100>>
図2を参照して、年表生成サーバ100の機能構成について説明する。
図2は、将来年表生成システム10に含まれる各装置の機能構成を示す図である。
【0030】
図2に示すように、年表生成サーバ100は、例えば、記憶部110と、取得部120と、特定部130と、抽出部140と、類似度算出部150と、集計部160と、表示処理部170とを含む。
【0031】
記憶部110は、例えば、キーワード関連データベースD111と、業界データベースD112とを含む。
【0032】
図3を参照して、キーワード関連データベースD111について説明する。
図3は、キーワード関連データベースD111を示す図である。文章データベースD111は、後述する特定部130で特定されるキーワード情報(文章データなど)および抽出部140で抽出される将来文などを格納するデータベースである。
図3に示すように、キーワード関連データベースD111は、例えば、[キーワード情報ID]、[キーワード]、[文章データ]、[URL]、[時期]、[名称]、[将来文]、[類似度]の項目を含んでいてもよい。[キーワード情報ID]はキーワード情報を一意に特定可能な文章IDを記憶する。[キーワード]は特定部130で特定する際に用いたキーワードが格納される。[文章データ]はキーワード情報が示す文章データが格納される。[URL]はキーワード情報にアクセスするためのURLが格納される。[時期]はキーワード情報(文章データ)に含まれる時期(例えば年月日)を示すテキストデータが格納される。[名称]は企業の名称や業界の名称が格納される。[将来文]はキーワード情報(文章データ)が示すテキストデータのうち将来の内容を示す文(例えば、一つの文)が格納される。[類似度]はキーワードと将来文との類似する度合い(以下、「類似度」という。)が格納される。類似度については類似度算出部150において詳細に説明する。
【0033】
なお、
図3に示すキーワード関連データベースD111は、例えば、予め設定されるキーワードについて予め生成されるデータベースであってもよいし、ユーザによってキーワードが設定された場合に後述する特定部130で特定されたキーワード情報を格納したデータベースであってもよい。
【0034】
以下、便宜上、
図3に示すキーワード関連データベースD111は、後述する特定部130で特定されるキーワード情報を格納したデータベースであるものとして説明する。
【0035】
図4を参照して、業界データベースD112について説明する。
図4は、業界データベースD112を示す図である。
図4に示すように、業界データベースD112は、例えば、[業界ID]、[業界名]、[主要企業]の項目を含んでいてもよい。[業界ID]は業界を一意に特定可能な業界IDを記憶する。[業界名]は業界の名称が格納される。[主要企業]は当該業界における主要な企業の名称が格納される。
【0036】
取得部120は、例えば、ユーザ端末200などの他の装置から各種情報を取得する。例えば、取得部120は、ユーザの操作入力によって設定されるキーワードを示すテキストデータをユーザ端末200から取得する。また、例えば、取得部120は、後述する特定部130で特定されるキーワード情報を取得する。
【0037】
特定部130は、例えば、ネットワーク上に公開されている情報のうち、キーワードに関する将来の内容を示すキーワード情報を特定する。
【0038】
例えば、特定部130は、将来の時期を示すワードとキーワードとを含む文章データを、キーワード情報として特定してもよい。
【0039】
具体的には、特定部130は、将来の時期を示すワード(例えば、20XX年やY年後など)と、キーワード(例えば「自然言語処理」)とを含むニュース記事や論文データを特定してもよい。また、特定部130は、例えば、将来の時期を示すワードとキーワードとを含む文章データにリンクするURLを特定してもよい。
【0040】
また、例えば、特定部130は、将来の時期を示すワードとキーワードとを含む文章データのうち、ユーザによって設定される過去の期間(以下、「過去期間」という。)に作成(または掲載)された文章データを、キーワード情報として特定してもよい。
【0041】
具体的には、特定部130は、例えば、現在の2022年に対する過去期間である「2010年~2020年」がユーザによって設定された場合、当該過去期間に作成された文章データを、キーワード情報として特定する。これにより、将来年表生成システム10は、ユーザが所望する過去期間に掲載された将来の内容を含む文章データを簡易にユーザに提供できる。
【0042】
また、例えば、特定部130は、キーワードを含む文章データのうち、ユーザによって設定される将来の期間(以下、「将来期間」という。)に含まれる所定の将来の時期を示すワードを含む文章データを、キーワード情報として特定してもよい。
【0043】
具体的には、特定部130は、例えば、将来期間である2025年~2030年がユーザによって設定された場合、キーワード情報が示す文章データに当該将来期間に含まれる将来の時期を示すワード(例えば2027年)が含まれる文章データを、キーワード情報として特定する。これにより、将来年表生成システム10は、ユーザが所望する将来の期間を示す情報を含む文章データを簡易にユーザに提供できる。
【0044】
すなわち、特定部130は、例えば、ネットワーク上に公開されている情報のうち、将来の時期を示すワード(ユーザによって設定された期間であってもよい)と、キーワードとを含み、ユーザによって設定される過去期間に作成(または掲載)された文章データを、キーワード情報として特定してもよい。
【0045】
なお、特定部130は、将来の時期を示すワードと、キーワードに類似するワードとを含む文章データを、キーワード情報として特定してもよい。この場合、年表生成サーバ100は、例えば、類語をまとめたデータベースを有していてもよい。
【0046】
また、例えば、特定部130は、将来の時期を示すワードと、キーワードとを含む文章データのうち、キーワード情報の主体を示すワードを含む文章データを、キーワード情報として特定してもよい。この場合、特定部130は、例えば、主体を示すワードが記憶されるデータベース(不図示)を参照して、主体を示すワードを含む文章データを特定する。これにより、将来年表生成システム10は、ユーザが所望する主体に関する情報を含む文章データを簡易にユーザに提供できる。
【0047】
なお、特定部130は、例えば、ネットワーク上に公開されている情報のうち将来の時期を示すワードを含む情報を予めクローリングして格納したデータベース(不図示)からキーワード情報を特定してもよいし、ネットワーク上に公開されている情報から将来の時期を示すワードとキーワード情報とを直接にリアルタイムで特定してもよい。
【0048】
抽出部140は、例えば、特定部130で特定されたキーワード情報が示す文章データ(例えば、ニュース記事や論文データ)に含まれる文のうち、所定の条件を充たす文(以下、「将来文」という。)を示す情報を、将来文情報として抽出する。また、抽出部140は、例えば、文章データに含まれる将来文から時期情報を抽出し、文章データから名称情報を抽出する。抽出部140は、例えば、将来文情報、時期情報および名称情報を記憶部110に記憶させる。
【0049】
例えば、抽出部140は、キーワード情報が示す文章データに含まれる文のうち、将来の時期(例えば年月日)を示す時期情報を含む文を将来文として抽出してもよい。
【0050】
具体的には、抽出部140は、例えば、文章データに「2024年3月にA社が人工衛星を打ち上げる」という文が含まれる場合、時期情報として「2024年」を抽出して、当該文を将来文として抽出してもよい。これにより、年表生成サーバ100は、将来の内容が記載されている将来文を確実に抽出できるため、ユーザに適切な将来文を提供できる。
【0051】
この場合、抽出部140は、例えば、キーワード情報が示す文章データに含まれる文のうち、テキストデータの冒頭から所定の数の文に将来の時期を示すワードが含まれている場合、将来の時期を示すワードが含まれる文を将来文として抽出してもよい。
【0052】
具体的には、抽出部140は、文章データであるニュース記事のうち、ニュースの表題に対応する本文の冒頭から四つの文に将来の時期を示すワード(例えば、20XX年やY年後など)が含まれるか判定する。抽出部140は、将来の時期を示すワードが含まれていると判定した場合、将来の時期を示すワードを含む文を将来文として抽出する。
【0053】
これにより、本文の冒頭部分には、将来を示す時期、企業の名称およびキーワードに関する重要なポイントが書かれる傾向が高いため、冒頭部分に限定して将来文を抽出することによって、年表生成サーバ100の情報処理量を減らすことができる。
【0054】
さらに、年表生成サーバ100は、冒頭に近ければ近いほど重要なポイントが書かれる傾向を考慮して将来文を抽出できることから、ユーザにとってより有益な情報を抽出できる。なお、抽出部140は、例えば、文章データを示すHTMLデータを、既存の技術を用いて解析することによって、本文の冒頭部分を特定可能である。
【0055】
なお、抽出部140は、将来の時期を示す時期情報を含む文が文章データに複数含まれる場合、将来の時期が最も遅い時期を含む文を将来文として抽出してもよい。これにより、年表生成サーバ100は、遠い将来の時期を含む文ほど有益な情報が含まれている傾向があることから、ユーザに有益な将来文を適切に抽出できる。
【0056】
また、例えば、抽出部140は、キーワード情報が示す文章データに含まれる文のうち、企業の名称または業界の名称を含む文を将来文として抽出してもよい。これにより、年表生成サーバ100は、重要なポイントが書かれている文を適切に抽出できる。
【0057】
この場合、抽出部140は、例えば、企業の名称または業界の名称を含む文が複数ある場合、企業の名称または業界の名称が最初に出現する文を抽出してもよい。これにより、年表生成サーバ100は、キーワードに関連する企業や業界に関することが書かれている文を抽出できるため、ユーザにとってより有益な情報を抽出できる。
【0058】
また、例えば、抽出部140は、キーワード情報が示す文章データに含まれる文のうち、キーワード(またはキーワードに類似するワード)を含む文を将来文として抽出してもよい。これにより、年表生成サーバ100は、重要なポイントが書かれている文を適切に抽出できる。
【0059】
この場合、抽出部140は、例えば、キーワードを含む文が複数ある場合、キーワードを含む文のうちの最初に出現する文を抽出してもよい。これにより、年表生成サーバ100は、キーワードに関することが書かれている文を抽出できるため、ユーザにとってより有益な情報を抽出できる。
【0060】
また、例えば、抽出部140は、キーワード情報が示す文章データから将来の時期(例えば年月日)を示す時期情報および企業の名称または業界の名称を示す名称情報を含む文を、優先的に将来文として抽出してもよい。
【0061】
具体的には、抽出部140は、例えば、「2024年3月に人工衛星を打ち上げる」という文と、「2024年3月にA社が人工衛星を打ち上げる」という文とが特定される場合、時期情報および名称情報を含む「2024年3月にA社が人工衛星を打ち上げる」を、将来文として抽出してもよい。
【0062】
なお、抽出部140は、例えば、抽出した将来文に名称情報が含まれない場合、抽出した将来文に近い文から名称情報を抽出してもよい。
【0063】
具体的には、抽出部140は、先ず、将来の時期を示す情報と、キーワードとを含む文を将来文として抽出して、次に、将来文に名称情報がない場合、将来文の前後の文から将来文に近い方から順に名称情報を抽出する。これにより、年表生成サーバ100は、将来文に名称情報が含まれなくても、当該将来文に関連する企業や業界を特定できる。
【0064】
類似度算出部150は、例えば、キーワードと、キーワード情報が示す文章データとが類似する度合いである類似度を算出する。類似度算出部150は、算出した類似度を記憶部110のキーワード関連データベースD111に格納する。
【0065】
類似度は、将来年表において将来文情報の表示順を調整するための指標である。類似度算出部150は、例えば、言語モデルを用いてキーワードおよび文章データをベクトルに変換する。類似度算出部150は、当該ベクトルのそれぞれのコサイン類似度を「類似度」として算出する。なお、キーワードおよび文章データをベクトルに変換する手法は、例えば、Word2Vec、Sentence2Vec、Bag of Wordsなどであり、特に限定されない。
【0066】
例えば、類似度算出部150は、キーワードと、抽出部140で抽出される将来文との類似度を算出してもよい。
【0067】
また、例えば、類似度算出部150は、ユーザによって設定される企業の名称または業界の名称を示すキーワードと、キーワード情報が示す文章データまたは抽出部140で抽出される将来文との類似度を算出してもよい。
【0068】
集計部160は、例えば、将来年表に表示させる将来文の個数を集計する。具体的には、集計部160は、例えば、年度別で将来文の個数を集計してもよいし、業界または企業ごとに将来文の個数を集計してもよい。集計部160は、将来文の個数を集計した結果を示す情報(以下、「集計結果」という。)を記憶部110に記憶するとともに、表示処理部170に提供してもよい。
【0069】
表示処理部170は、例えば、ユーザ端末200の表示部に表示させる将来年表を含む画像を生成する。以下、
図5を参照して、表示処理部170で生成される画像T1について説明する。
図5は、表示処理部170で生成される画像T1の一例を示す図である。なお、画像T1は、例えばブラウザに画像を表示させるためのHTMLなどのコードに基づき表示される画像であってもよい。
【0070】
図5に示すように、画像T1は、キーワード設定領域T11と、期間設定領域T12と、将来年表表示領域T13と、集計結果表示領域T14と、絞込設定領域T15とを含む。
【0071】
キーワード設定領域T11は、ユーザによってキーワードが設定される入力領域である。キーワード設定領域T11は、例えば、ユーザが任意に入力可能なテキストボックスであってもよいし、プルダウンなどによってユーザがキーワードを選択可能な選択領域であってもよい。また、キーワード設定領域T11は、複数のキーワードをAND条件、ОR条件またはNОT条件で列挙されるように構成されていてもよい。キーワード設定領域T11に設定されたキーワードに基づいて、将来年表が生成される。
【0072】
具体的には、例えば、キーワード設定領域T11に「宇宙」「省エネ」を入力してAND条件で接続した場合、特定部130は、「宇宙」「省エネ」を含むキーワード情報を特定する。
【0073】
期間設定領域T12は、例えば、特定部130においてキーワード情報を特定するための期間を設定する領域である。期間設定領域T12は、例えば、第1期間設定領域T121と、第2期間設定領域T122とを含む。
【0074】
第1期間設定領域T121は、例えば、ユーザによって将来の期間が設定される設定領域である。第1期間設定領域T121に将来の期間が設定された場合、特定部130は、当該将来の期間に含まれる所定の時期を示すワードを含むキーワード情報を特定する。これにより、表示処理部170は、例えば、年表表示領域T13に、設定された将来の期間に含まれる将来文(
図5では一例として2024年~2030年を示すワードを含む将来文)を表示できる。
【0075】
第2期間設定領域T122は、例えば、ユーザによって過去の期間が設定される設定領域である。第2期間設定領域T122に過去の期間が設定された場合、特定部130は、当該過去の期間に作成されたキーワード情報を特定する。これにより、表示処理部170は、例えば、年表表示領域T13に、設定された過去の期間に作成されたキーワード情報に含まれる将来文(
図5では一例として2021年5月から2021年12月に作成された将来文)を表示できる。
【0076】
将来年表表示領域T13は、キーワード設定領域T11及び期間設定領域T12に設定された条件に基づいて生成された将来年表を表示する領域である。将来年表表示領域T13は、例えば、年度表示領域T131と、企業関連表示領域T132と、将来文表示領域T133とを含む。
【0077】
年度表示領域T131は、第1期間設定領域T121に設定された期間に含まれる年度(時期情報)を示すテキストを表示する領域である。具体的には、例えば、年度表示領域T131には、特定部130で特定されるキーワード情報が示す文章データに含まれる年月日(例えば2027年4月1日など)などを示す情報によって特定される時期に基づいて、少なくとも年度(例えば2027年)を表示する。
【0078】
企業関連表示領域T132は、年度表示領域T131に表示された年度に対応するキーワード情報に含まれる企業の名称または業界の名称(名称情報)を示すテキストを表示する領域である。具体的には、例えば、企業関連表示領域T132には、特定部130で特定されるキーワード情報が示す文章データに含まれる企業の名称(例えばA社)または業界の名称(例えば自動車業界)を表示する。
【0079】
将来文表示領域T133は、年度表示領域T131に表示された年度及び企業関連表示領域T132に表示された主体の名称に対応するキーワード情報が示す文章データに含まれる将来文を示すテキストを表示する領域である。具体的には、将来文表示領域T133には、抽出部140で抽出される将来文情報が示す将来文を表示する。このとき、将来文表示領域T133には、将来文に含まれる時期情報及び/又は名称情報に下線を引いたり、太字にするなど、将来文に含まれる他の部分と区別可能に表示してもよい。これにより、ユーザが将来動向をより効率的に把握することを可能としている。また、将来文表示領域T133には、文章データから抽出した将来文に加えて、文章データの引用元を示すテキストを表示したり、当該文章データの引用元にアクセスするためのリンクを設けてもよい。
【0080】
表示処理部170は、年度表示領域T131に表示される年度のそれぞれと、企業関連表示領域T132に表示される企業の名称または業界の名称のそれぞれと、将来文表示領域T133に表示される将来文のそれぞれとを関連付けて、画像T1を生成する。
【0081】
具体的には、
図5に示すように、画像T1では、年度表示領域T131の「2024」と、企業関連表示領域T132の「A官庁」と、将来文表示領域T133の「日本においても・・・求めています。」とが視覚的に関連付けられて表示される。これにより、将来年表生成システム10は、将来のいつ、どの企業や業界が、どのようなことを実施しようとしているのかを視覚的に容易にユーザに提供できるため、ユーザの利便性を高めることができる。
【0082】
なお、
図5に示すように、年度表示領域T131の年度を示すテキストデータ(例えば「2024」や「2025」)は、企業関連表示領域T132および将来文表示領域T133のテキストデータのそれぞれと関連付けられている必要はなく、年度(例えば「2024」)ごとに一つのテキストデータを表示してもよい。これにより、将来年表生成システム10は、少ない情報によって将来年表を生成できるため、ユーザの視認性を向上できる。
【0083】
表示処理部170は、例えば、キーワード関連データベースD111を参照して、抽出部140で抽出される将来文のうち名称情報(例えば、企業名や業界名など)が含まれる将来文を将来年表表示領域T13において優先的に表示させてもよい。これにより、将来年表生成システム10は、企業や業界の名称とともに将来文を適切にユーザに提供できる。
【0084】
具体的には、
図5では名称情報が将来文に含まれているか否かによって表示順を調整していないところ、例えば、
図5において、将来文に名称情報である、「A官庁」が含まれるA官庁に対応する将来文と、「D社」が含まれるD社に対応する将来文とを、B社およびC社に対応する将来文よりも上段に表示させる。
【0085】
また、表示処理部170は、例えば、キーワード関連データベースD111([類似度]の項目)を参照して、抽出部140で抽出される将来文の類似度が高い順に将来文を将来年表表示領域T13において優先的に表示させてもよい。これにより、将来年表生成システム10は、ユーザが設定したキーワードにより関係性が高い将来文を優先的に表示させることができるため、ユーザの利便性を向上できる。
【0086】
また、表示処理部170は、例えば、企業または業界の名称が同じものの将来文のそれぞれを、年度のそれぞれにおいて連続した順で、将来年表表示領域T13に表示させてもよい。これにより、将来年表生成システム10は、企業や業界ごとに将来文をまとめて表示させることができるため、ユーザの視認性を向上できる。
【0087】
さらに、表示処理部170は、例えば、企業または業界の名称が同じものの将来文を、年度のそれぞれにおいて類似度が高い順に連続した順で、将来年表表示領域T13に表示させてもよい。これにより、将来年表生成システム10は、企業や業界ごとに将来文をまとめて表示させるとともに、キーワードにより関連性が高い将来文を上位に表示させることができるため、ユーザの視認性を向上できる。
【0088】
集計結果表示領域T14は、例えば、集計部160で集計した結果を表示する領域である。集計結果表示領域T14には、集計部160において将来文の個数を集計した結果を表示させてもよい。集計結果表示領域T14は、例えば、第1集計結果表示領域T141と、第1集計結果表示領域T141とを含む。
【0089】
第1集計結果表示領域T141は、例えば、集計部160において各年度の将来文の個数を集計した結果、年度における将来文の多寡を示す情報を表示させる領域である。例えば、2024年の将来文が最も多いことを示す結果を得られた場合、第1集計結果表示領域T141には、「将来文が最も多い年は2024年です」のようなコメントを表示させてもよい。これにより、将来年表生成システム10は、将来文が最も多い年を容易に把握可能な情報をユーザに提供できるため、ユーザが将来計画などを検討しやすくなることから、ユーザの利便性を向上できる。
【0090】
第2集計結果表示領域T142は、例えば、集計部160において対象となる期間の将来文の個数を集計した結果、将来文が最も多い企業(または業界)について「2024年~2030年において将来文が最も多い企業はA社です」のようなコメントを表示させてもよい。これにより、将来年表生成システム10は、将来文が最も多い企業や業界を容易に把握可能な情報をユーザに提供できるため、ユーザが将来計画などを検討しやすくなることから、ユーザの利便性を向上できる。
【0091】
絞込設定ボタンT15は、例えば、将来年表表示領域T13に表示させる将来文を所定のキーワードで絞り込むためのオブジェクトである。
【0092】
具体的には、表示処理部170は、例えば、キーワードによって生成される将来年表について、さらに企業名や業界名で絞り込んで将来年表を生成してもよい。この場合、表示処理部170は、絞込設定ボタンT15に対するユーザの操作入力を受け付けたとき、企業名や業界名を入力(選択入力でもよい)可能な入力オブジェクトを表示させる。表示処理部170は、例えば、キーワード関連データベースD111を参照して、入力オブジェクトに入力された名称を示す名称情報を特定し、当該名称情報に対応する将来文を、将来年表表示領域T13に表示させてもよい。これにより、将来年表生成システム10は、ユーザが所望する限定的な企業や業界などの情報をユーザに提供できるため、ユーザの利便性を向上できる。
【0093】
また、具体的には、表示処理部170は、例えば、キーワードによって生成される将来年表について、さらに業界における主要な企業名で絞り込んで将来年表を生成してもよい。この場合、表示処理部170は、絞込設定ボタンT15に対するユーザの操作入力を受け付けたとき、業界名を入力(選択入力でもよい)可能な入力オブジェクトを表示させる。表示処理部170は、例えば、業界データベースD112を参照して、入力オブジェクトに入力された業界を示す名称情報に対応する主要な企業の名称を示す情報(以下、「主要企業情報」という。)を特定し、当該企業の名称に対応する将来文を、将来年表表示領域T13に表示させてもよい。これにより、将来年表生成システム10は、業界における主要な企業に限定した情報をユーザに提供できるため、ユーザの利便性を向上できる。
【0094】
<<第1の変形例>>
表示処理部170は、将来の時期のそれぞれにおいて、類似度が高い順に所定の個数の将来文情報を抽出して、抽出された将来文情報のそれぞれと、名称情報とを表示部に表示させてもよい。
【0095】
具体的には、表示処理部170は、例えば、2025年に20個の将来文情報が抽出された場合、キーワード関連データベースD111を参照して、2025年の将来文情報のそれぞれの類似度を特定する。表示処理部170は、例えば、2025年の類似度の高い方から5個の将来文情報を抽出して、将来文表示領域T133に表示させる。この場合、表示処理部170は、類似度が高い順に将来文情報を将来文表示領域T133に表示させてもよい。
【0096】
これにより、将来年表生成システム10は、全ての将来文を提示するのではなく、キーワードと特に関連性が高い将来文に限定してユーザに提示するため、ユーザの利便性を向上できる。
【0097】
<<第2の変形例>>
類似度算出部150は、例えば、画像T1に対する操作入力の履歴に基づき、将来文の類似度を算出してもよい。
【0098】
具体的には、年表生成サーバ100は、記憶部110にユーザの操作入力の履歴に関する情報(以下、「操作情報」という。)を記憶してもよい。類似度算出部150は、例えば、操作情報に含まれる、所定の企業の将来文の閲覧履歴の回数に基づき類似度を調整してもよい。この場合、類似度算出部150は、閲覧の回数が1回増えるごとに類似度が高くなるように、類似度に所定の値を加算してもよい。
【0099】
これにより、将来年表生成システム10は、ユーザによる操作入力を分析して自動的に類似度を調整することによって、ユーザにとってより適切な将来文を上位に表示させるため、ユーザの利便性を向上できる。
【0100】
<<第3の変形例>>
図6を参照して、年表生成サーバ100の第2の変形例について説明する。
図6は、年表生成サーバ100の変形例を示す図である。
図6に示すように、年表生成サーバ100は、例えば、学習部180をさらに備えていてもよい。
【0101】
学習部180は、例えば、記憶部110に記憶された各情報を用いて機械学習を実行する評価モデルを学習させる。評価モデルは、例えば、キーワード情報が示す文章データに含まれる文が将来文に該当するか否かの可能性を評価するモデルである。なお、評価モデルは、年表生成サーバ100に含まれるモデルであってもよいし、そうでなくてもよい。
【0102】
評価モデルは、例えば、文章データに含まれる少なくとも一つの文を示す情報と、当該文が将来文であるか否かを示す情報とを教師データとして学習したモデルである。評価モデルは、例えば、文章データが入力されると、当該文章データに含まれる文のそれぞれが将来文である可能性の度合いを示す情報(以下、「将来文推定指標」という。)を出力する。
【0103】
具体的には、学習部180は、将来文に該当するか否かを示すフラグを目的変数(正解データ)として、文章データに含まれる少なくとも一つの文を示す情報を説明変数(素性)とし、説明変数に重み値を示す係数として、評価モデルを学習させる。なお、目的変数および説明変数となる各情報は、記憶部110のキーワード関連データベースD111に格納されていてもよい。
【0104】
表示処理部170は、例えば、評価モデルから出力される将来文推定指標が所定の閾値を超える場合、評価モデルに入力された文が将来文であると特定してもよい。そして、表示処理部170は、特定した将来文に関する将来文情報、時期情報、名称情報および類似度をキーワード関連データベースD111から取得して、将来年表表示領域T13に、将来文情報、時期情報および名称情報を関連付けて表示させる。
【0105】
これにより、将来年表生成システム10は、キーワード情報をより正確に特定することができるため、ユーザの利便性を向上できる。
【0106】
<<ユーザ端末200>>
次に、
図2を参照して、ユーザ端末200の構成について説明する。
図2に示すように、ユーザ端末200は、例えば、記憶部210と、取得部220と、出力部230との機能部を含む。各機能部は、例えば、プロセッサ1001がメモリ1002に格納されているプログラムを読み出して実現される機能である。記憶部210は、例えば各種情報を記憶する。取得部220は、例えば、年表生成サーバ100などの他の装置から情報を取得する。取得部220で取得された各種情報は、記憶部210に記憶される。出力部230は、例えば、年表生成サーバ100などの他の装置に情報を出力する。
【0107】
===将来年表生成システム10の処理手順===
次に、
図7を参照して、将来年表生成システム10な処理手順について説明する。
図7は、将来年表生成システム10におけるフローチャートの一例である。以下では、ユーザがキーワードを入力して将来年表が作成され、さらに所定のキーワードで絞り込むことによって将来年表を作成する処理手順について説明する。
【0108】
まず、ステップS100において、ユーザ端末200は、例えば、キーワードおよび期間を入力するための画面(以下、
図5に示す画像T1であって、キーワード設定領域T11および期間設定領域T12に設定されていない画面とする。)を表示部に表示させる。ユーザ端末200は、ユーザの操作入力を受け付けて、画像T1のキーワード設定領域T11に設定されたキーワードと、画像T1の期間設定領域T12に設定された期間を示す情報とを取得する。ユーザ端末200は、キーワードに関する情報および期間を示す情報を年表生成サーバ100に送信する。
【0109】
ステップS101において、年表生成サーバ100は、例えば、ネットワーク上において、設定された期間に基づき、キーワードを含む将来の内容を示すキーワード情報(例えば、記事や論文データ)を特定する。
【0110】
ステップS102において、年表生成サーバ100は、例えば、キーワード情報のそれぞれにおける、将来文情報、時期情報および名称情報を抽出する。
【0111】
ステップS103において、年表生成サーバ100は、例えば、キーワードと、将来文情報が示す将来文との類似度を算出する。
【0112】
ステップS104において、年表生成サーバ100は、例えば、将来文の個数を集計する。なお、ステップS104は、ステップS103よりも前に実行されてもよい。
【0113】
ステップS105において、年表生成サーバ100は、例えば、時期情報、名称情報および将来文情報を関連付けた画像T1を生成する。将来年表生成システム10は、例えば、画像T1をユーザ端末200に送信する。
【0114】
ステップS106において、ユーザ端末200は、例えば、表示部に画像T1を表示させる。ユーザ端末200は、例えば、絞込設定領域T15に対するユーザの操作入力を受け付けて、将来文を絞り込むための所定のキーワードが設定される。ユーザ端末200は、所定のキーワードに関する情報を年表生成サーバ100に送信する。
【0115】
ステップS107において、年表生成サーバ100は、例えば、ステップS101で特定されたキーワード情報のうち、所定のキーワードに関する情報を含むキーワード情報を特定する。年表生成サーバ100は、特定されたキーワード情報のそれぞれについて、将来文情報、時期情報および名称情報を抽出して画像T1を生成する。年表生成サーバ100は、画像T1をユーザ端末200に送信する。
【0116】
ステップS108において、ユーザ端末200は、表示部に画像T1を表示させる。
【0117】
===ハードウェア構成===
図8を参照して、年表生成サーバ100およびユーザ端末200をコンピュータ1000により実現する場合のハードウェア構成の一例について説明する。なお、年表生成サーバ100およびユーザ端末200の各種機能は、複数台の装置に分けて実現できる。
【0118】
図8は、コンピュータのハードウェア構成の一例を示す図である。
図8に示すように、コンピュータ1000は、例えば、プロセッサ1001と、メモリ1002と、記憶装置1003と、入力I/F部1004と、データI/F部1005と、通信I/F部1006および表示部1007を含む。
【0119】
プロセッサ1001は、メモリ1002に記憶されているプログラムを実行することによりコンピュータ1000における各種の処理を制御する制御部である。
【0120】
メモリ1002は、例えばRAM(Random Access Memory)等の記憶媒体である。メモリ1002は、プロセッサ1001によって実行されるプログラムのプログラムコードや、プログラムの実行時に必要となるデータを一時的に記憶する。
【0121】
記憶装置1003は、例えばハードディスクドライブ(HDD)やフラッシュメモリ等の不揮発性の記憶媒体である。記憶装置1003は、オペレーティングシステムや、上記各構成を実現するための各種プログラムを記憶する。
【0122】
入力I/F部1004は、ユーザからの入力を受け付けるためのデバイスである。入力I/F部1004の具体例としては、キーボードやマウス、タッチパネル、各種センサ、ウェアラブル・デバイス等である。入力I/F部1004は、例えばUSB(Universal Serial Bus)等のインタフェースを介してコンピュータ1000に接続されてもよい。
【0123】
データI/F部1005は、コンピュータ1000の外部からデータを入力するためのデバイスである。データI/F部1005の具体例としては、各種記憶媒体に記憶されているデータを読み取るためのドライブ装置等がある。データI/F部1005は、コンピュータ1000の外部に設けられることも考えられる。その場合、データI/F部1005は、例えばUSB等のインタフェースを介してコンピュータ1000へと接続される。
【0124】
通信I/F部1006は、コンピュータ1000の外部の装置と有線又は無線により、ネットワークNを介したデータ通信を行うためのデバイスである。通信I/F部1006は、コンピュータ1000の外部に設けられることも考えられる。その場合、通信I/F部1006は、例えばUSB等のインタフェースを介してコンピュータ1000に接続される。
【0125】
表示部1007は、各種情報を表示するためのデバイスである。表示部1007の具体例としては、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ、ウェアラブル・デバイスのディスプレイ等が挙げられる。表示部1007は、コンピュータ1000の外部に設けられてもよい。その場合、表示部1007は、例えばディスプレイケーブル等を介してコンピュータ1000に接続される。また、入力I/F部1004としてタッチパネルが採用される場合には、表示部1007は、入力I/F部1004と一体化して構成することが可能である。
【0126】
===まとめ===
本実施形態における将来年表生成システム10は、ユーザによって設定されるキーワードをユーザから取得する取得部120と、ネットワーク上に公開されている情報のうち、キーワードに関する将来の内容を示すキーワード情報を特定する特定部130と、キーワード情報から、将来の時期を示す時期情報と、キーワード情報の主体の名称を示す名称情報と、将来の内容を示す将来文情報と、を抽出する抽出部140と、時期情報と、名称情報と、将来文情報と、を関連付けて表示部に表示させる表示処理部170と、を含む。これにより、将来年表生成システム10は、ネットワーク上で取得可能な情報である、ユーザが所望する企業や業界などの主体についての将来に関する情報を、ユーザに簡易に提供することができる。
【0127】
また、将来年表生成システム10の抽出部140は、キーワード情報が示すテキストデータに含まれる文のうち、将来の時期を示すワードを含む文を、将来文情報として抽出する。これにより、将来年表生成システム10は、将来の内容が記載されている将来文を確実に抽出できるため、ユーザに適切な将来文を提供できる。
【0128】
また、将来年表生成システム10の抽出部140は、キーワード情報が示すテキストデータに含まれる文のうち、当該テキストデータの冒頭から所定の数の文に将来の時期を示すワードが含まれている場合、将来の時期を示すワードを含む文を将来文情報として抽出する。これにより、将来年表生成システム10は、キーワードに関する重要なポイントが書かれる傾向が高い冒頭の数行を抽出することによって、ユーザにより有益な情報を提供できる。
【0129】
また、将来年表生成システム10の抽出部140は、キーワード情報が示すテキストデータに含まれる文のうち、キーワードに関する情報を含む文を、、将来文情報として抽出する。これにより、将来年表生成システム10は、キーワードに関することが書かれている文を抽出できるため、ユーザにとってより有益な情報を抽出できる。
【0130】
また、将来年表生成システム10の抽出部140は、キーワード情報が示すテキストデータに含まれる文のうち、企業の名称または業界の名称を含む文を、将来文情報として抽出する。これにより、将来年表生成システム10は、キーワードに関連する企業や業界に関することが書かれている文を抽出できるため、ユーザにとってより有益な情報を抽出できる。
【0131】
また、将来年表生成システム10は、表示処理部170によって表示部に表示される将来文情報の個数を集計する集計部160をさらに備え、表示処理部170は、集計された個数が最も多い年度を示す情報を表示する表示領域をユーザ端末200の表示部に表示させる。これにより、将来年表生成システム10は、将来文が最も多い年を容易に把握可能な情報をユーザに提供できるため、ユーザが将来計画などを検討しやすくなることから、ユーザの利便性を向上できる。
【0132】
また、将来年表生成システム10は、表示処理部170によって表示部に表示される名称情報が示す主体の名称(例えば、企業の名称、業界の名称、官公庁の名称など)の個数を集計する集計部160をさらに備え、表示処理部170は、集計された個数が最も多い主体の名称を示す情報を表示する表示領域をユーザ端末200の表示部に表示させる。これにより、将来年表生成システム10は、将来文が最も多い企業や業界を容易に把握可能な情報をユーザに提供できるため、ユーザが将来計画などを検討しやすくなることから、ユーザの利便性を向上できる。
【0133】
また、将来年表生成システム10は、キーワードと、将来文情報に含まれる将来の内容と、が類似する度合いである類似度を算出する類似度算出部150をさらに備え、表示処理部170は、将来の時期のそれぞれにおいて、類似度が高い順に、将来年表表示領域T13の上から将来文情報をユーザ端末200の表示部に表示させる。これにより、将来年表生成システム10は、企業や業界ごとに将来文をまとめて表示させるとともに、キーワードにより関連性が高い将来文を画像上の上位に表示させることができるため、ユーザの視認性を向上できる。
【0134】
また、将来年表生成システム10は、表示処理部170は、将来の時期のそれぞれにおいて、類似度が高い順に所定の個数の将来文情報を抽出して、抽出された将来文情報のそれぞれと、名称情報と、をユーザ端末200の表示部に表示させる。これにより、将来年表生成システム10は、全ての将来文を提示するのではなく、キーワードと特に関連性が高い将来文に限定してユーザに提示するため、ユーザの利便性を向上できる。
【0135】
また、将来年表生成システム10は、類似度算出部150は、表示部におけるユーザの操作入力の履歴に基づいて、類似度を算出する。これにより、将来年表生成システム10は、ユーザによる操作入力を分析して自動的に類似度を調整することによって、ユーザにとってより適切な将来文を上位に表示させるため、ユーザの利便性を向上できる。
【0136】
また、将来年表生成システム10は、取得部120は、ユーザによって設定される、業界の名称を示すキーワードを取得し、抽出部140は、キーワード情報が示すテキストデータに含まれる文のうち、キーワードである業界の名称に関する情報を含む文を抽出し、表示処理部170は、業界の名称と、当該業界の主要な企業の名称と、を関連付けた業界データベースD112(データベース)に基づいて、抽出されたキーワードである業界の名称に関する情報を含む文のうち、業界の主要な企業の名称を含む文の内容を示す情報を将来文情報として、時期情報と、名称情報と、を関連付けてユーザ端末200の表示部に表示させる。これにより、将来年表生成システム10は、業界における主要な企業に限定した情報をユーザに提供できるため、ユーザの利便性を向上できる。
【符号の説明】
【0137】
10…将来年表生成システム、100…年表生成サーバ、110…記憶部、120…取得部、130…特定部、140…抽出部、150…類似度算出部、160…集計部、170…表示処理部170、180…学習部、200…ユーザ端末。