(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023096472
(43)【公開日】2023-07-07
(54)【発明の名称】情報処理システム、情報処理方法および情報処理プログラム
(51)【国際特許分類】
G06F 40/279 20200101AFI20230630BHJP
G06Q 30/0203 20230101ALI20230630BHJP
G06F 40/295 20200101ALI20230630BHJP
G06F 40/216 20200101ALI20230630BHJP
G06F 16/35 20190101ALI20230630BHJP
【FI】
G06F40/279
G06Q30/02 312
G06F40/295
G06F40/216
G06F16/35
【審査請求】有
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2021212271
(22)【出願日】2021-12-27
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (1)令和3年12月6日にストックマーク株式会社のウェブサイト(https://astrategy.stockmark.ai/)にて公開 (2)令和3年12月23日に株式会社レッジにて行われたウェビナー動画の事前収録において公開
(71)【出願人】
【識別番号】519314364
【氏名又は名称】ストックマーク株式会社
(74)【代理人】
【識別番号】100131451
【弁理士】
【氏名又は名称】津田 理
(74)【代理人】
【識別番号】100184181
【弁理士】
【氏名又は名称】野本 裕史
(72)【発明者】
【氏名】中尾 有伸
(72)【発明者】
【氏名】近江 崇宏
(72)【発明者】
【氏名】田中 和生
【テーマコード(参考)】
5B091
5B175
5L049
【Fターム(参考)】
5B091AA15
5B091AB06
5B091CA01
5B091EA01
5B175DA01
5B175FA03
5L049BB02
(57)【要約】
【課題】事業者が「何をしているか」という事例の調査を迅速に行うことを支援できる技術を提供する。
【解決手段】情報処理装置は、キーワードの入力を受け付ける入力受付部と、前記キーワードに関連する1または複数の文書を取得する文書取得部と、取得された文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定する文書解析部と、1または複数の文書のそれぞれについて前記事例文を出力する出力制御部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
キーワードの入力を受け付ける入力受付部と、
前記キーワードに関連する1または複数の文書を取得する文書取得部と、
取得された文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定する文書解析部と、
1または複数の文書のそれぞれについて前記事例文を出力する出力制御部と、
を備えた情報処理装置。
【請求項2】
前記文書解析部は、あらかじめ用意された複数の文のそれぞれについて事例文にあたるか否かがラベル付けされた教師データを機械学習した学習済みモデルを用いて、取得された文書の中に、前記事例文があるか否かを判定する、
請求項1に記載の情報処理装置。
【請求項3】
前記文書解析部は、事業者としての活動を示す用言または体言止めがリストされている辞書データベースを参照して、取得された文書の中に、前記事例文があるか否かを判定する、
請求項1に記載の情報処理装置。
【請求項4】
前記文書解析部は、取得された文書の中から、事例の主体である事業者の名称を主題企業として抽出し、
前記出力制御部は、1または複数の文書のそれぞれについて前記主題企業を前記事例文と並んで表示するテーブルを出力する
請求項1~3のいずれかに記載の情報処理装置。
【請求項5】
前記文書解析部は、あらかじめ用意された複数の単語のそれぞれについて事業者の名称にあたるか否かがラベル付けされた教師データを機械学習した学習済みモデルを用いて、取得された文書の中から、前記主題企業を抽出する、
請求項4に記載の情報処理装置。
【請求項6】
前記文書解析部は、事業者の名称がリストされている辞書データベースを参照して、取得された文書の中から、前記主題企業を抽出する、
請求項4に記載の情報処理装置。
【請求項7】
前記文書解析部は、取得された文書の中から、事業者が取り組んでいる対象を表す単語を解決策キーワードとして抽出し、
前記出力制御部は、1または複数の文書のそれぞれについて前記解決策キーワードを前記事例文と並んで表示するテーブルを出力する、
請求項1~6のいずれかに記載の情報処理装置。
【請求項8】
前記出力制御部は、前記事例文が前記解決策キーワードを含んでいる場合には、前記事例文を表示する際に、当該事例文の中に含まれる前記解決策キーワードを強調表示する、
請求項7に記載の情報処理装置。
【請求項9】
前記文書解析部は、取得された文書の中から、事業者が取り組んでいることの課題を表す単語を課題キーワードとして抽出し、
前記出力制御部は、1または複数の文書のそれぞれについて前記課題キーワードを前記事例文と並んで表示するテーブルを出力する、
請求項1~8のいずれかに記載の情報処理装置。
【請求項10】
前記出力制御部は、1または複数の文書のそれぞれについて前記文書のタイトルおよび/または配信元を前記事例文と並んで表示するテーブルを出力する、
請求項1~9のいずれかに記載の情報処理装置。
【請求項11】
前記出力制御部は、1または複数の文書のそれぞれについて前記事例文を前記文書の日付順に出力する、
請求項1~10のいずれかに記載の情報処理装置。
【請求項12】
前記事業者は、企業、大学、学校、国、地方自治体、団体、組合、組織体、人のうちの1つまたは2つ以上を含む、
請求項1~11のいずれかに記載の情報処理装置。
【請求項13】
前記文書は、ニュース記事、プレスリリース、議事録、報告書、論文、特許文献、SNSのうちの1つまたは2つ以上を含む、
請求項1~12のいずれかに記載の情報処理装置。
【請求項14】
前記入力受付部は、期間の指定をさらに受け付け、
前記出力制御部は、前記期間内に配信された1または複数の文書のそれぞれについて前記事例文を出力する、
請求項1~13のいずれかに記載の情報処理装置。
【請求項15】
コンピュータが実行する情報処理方法であって、
キーワードの入力を受け付けるステップと、
前記キーワードに関連する1または複数の文書を取得するステップと、
取得された文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定するステップと、
1または複数の文書のそれぞれについて前記事例文を出力するステップと、
を含む情報処理方法。
【請求項16】
コンピュータに、
キーワードの入力を受け付けるステップと、
前記キーワードに関連する1または複数の文書を取得するステップと、
取得された文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定するステップと、
1または複数の文書のそれぞれについて前記事例文を出力するステップと、
を実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法および情報処理プログラムに関する。
【背景技術】
【0002】
ニュース記事を収集してデータベースに蓄積し、ユーザからキーワードの入力を受け付けると、当該キーワードを含むニュース記事をデータベースから抽出してユーザに提示する技術が知られている。たとえば、特許文献1には、ユーザからキーワードとして企業名の入力を受け付けると、M&Aに関する記事が蓄積されたデータベースを参照して、当該企業名を含む記事を取得し、取得された記事のタイトルをユーザに提示する技術が開示されている(段落0174~0177、
図19など)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
現在、市場において新規ビジネス、新サービスが次々と登場しており、技術企画(知財)、経営・事業企画、マーケティングの担当者にとって、「誰が」「どの機会に対して」「何をしているか」を調べきれないという課題がある。
【0005】
これに対し、上記従来の技術では、キーワードでのマッチングでヒットした記事についてそのタイトルを機械的に提示するだけであり、記事の中身に踏み込んでいない。そのため、企業などの事業者が「何をしているか」という具体的な事例を把握するためには、提示された記事の中身をユーザが一つ一つ読み込んで確認する必要があり、時間がかかるという問題がある。
【0006】
本発明は、以上のような点を考慮してなされたものである。本発明の目的は、事業者が「何をしているか」という事例の調査を迅速に行うことを支援できる情報処理装置、情報処理方法および情報処理プログラムを提供することにある。
【課題を解決するための手段】
【0007】
本発明の第1の態様に係る情報処理装置は、
キーワードの入力を受け付ける入力受付部と、
前記キーワードに関連する1または複数の文書を取得する文書取得部と、
取得された文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定する文書解析部と、
1または複数の文書のそれぞれについて前記事例文を出力する出力制御部と、
を備える。
【0008】
このような態様によれば、キーワードの入力を受け付けると、キーワードに関連する1または複数の文書を取得したのち、取得した文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定し、1または複数の文書のそれぞれについて当該事例文を出力するため、ユーザは、提示された文書の中身を一つ一つ読み込んで確認しなくても、事業者が「何をしているか」という具体的な事例を一目で容易に把握することが可能となる。したがって、事業者が「何をしているか」という事例の調査を迅速に行うことを支援できる。
【0009】
本発明の第2の態様に係る情報処理装置は、第1の態様に係る情報処理装置であって、
前記文書解析部は、あらかじめ用意された複数の文のそれぞれについて事例文にあたるか否かがラベル付けされた教師データを機械学習した学習済みモデルを用いて、取得された文書の中に、前記事例文があるか否かを判定する。
【0010】
本発明の第3の態様に係る情報処理装置は、第1の態様に係る情報処理装置であって、
前記文書解析部は、事業者としての活動を示す用言または体言止めがリストされている辞書データベースを参照して、取得された文書の中に、前記事例文があるか否かを判定する。
【0011】
本発明の第4の態様に係る情報処理装置は、第1~3のいずれかの態様に係る情報処理装置であって、
前記文書解析部は、取得された文書の中から、事例の主体である事業者の名称を主題企業として抽出し、
前記出力制御部は、1または複数の文書のそれぞれについて前記主題企業を前記事例文と並んで表示するテーブルを出力する。
【0012】
このような態様によれば、テーブル上に事業者の名称が事例文と並んで表示されるため、特定の事業者に注目して事例の調査を迅速に行うことが可能となる。
【0013】
本発明の第5の態様に係る情報処理装置は、第4の態様に係る情報処理装置であって、
前記文書解析部は、あらかじめ用意された複数の単語のそれぞれについて事業者の名称にあたるか否かがラベル付けされた教師データを機械学習した学習済みモデルを用いて、取得された文書の中から、前記主題企業を抽出する。
【0014】
本発明の第6の態様に係る情報処理装置は、第4の態様に係る情報処理装置であって、
前記文書解析部は、事業者の名称がリストされている辞書データベースを参照して、取得された文書の中から、前記主題企業を抽出する。
【0015】
本発明の第7の態様に係る情報処理装置は、第1~6のいずれかの態様に係る情報処理装置であって、
前記文書解析部は、取得された文書の中から、事業者が取り組んでいる対象を表す単語を解決策キーワードとして抽出し、
前記出力制御部は、1または複数の文書のそれぞれについて前記解決策キーワードを前記事例文と並んで表示するテーブルを出力する。
【0016】
このような態様によれば、テーブル上に解決策キーワードが事例文と並んで表示されるため、特定の解決策に注目して事例の調査を迅速に行うことが可能となる。
【0017】
本発明の第8の態様に係る情報処理装置は、第7の態様に係る情報処理装置であって、
前記出力制御部は、前記事例文が前記解決策キーワードを含んでいる場合には、前記事例文を表示する際に、当該事例文の中に含まれる前記課題キーワードを強調表示する。
【0018】
本発明の第9の態様に係る情報処理装置は、第1~8のいずれかの態様に係る情報処理装置であって、
前記文書解析部は、取得された文書の中から、事業者が取り組んでいることの課題を表す単語を課題キーワードとして抽出し、
前記出力制御部は、1または複数の文書のそれぞれについて前記課題キーワードを前記事例文と並んで表示するテーブルを出力する。
【0019】
このような態様によれば、テーブル上に課題キーワードが事例文と並んで表示されるため、特定の課題に注目して事例の調査を迅速に行うことが可能となる。
【0020】
本発明の第10の態様に係る情報処理装置は、第1~9のいずれかの態様に係る情報処理装置であって、
前記出力制御部は、1または複数の文書のそれぞれについて前記文書のタイトルおよび/または配信元を前記事例文と並んで表示するテーブルを出力する。
【0021】
本発明の第11の態様に係る情報処理装置は、第1~10のいずれかの態様に係る情報処理装置であって、
前記出力制御部は、1または複数の文書のそれぞれについて前記事例文を前記文書の日付順に出力する。
【0022】
本発明の第12の態様に係る情報処理装置は、第1~11のいずれかの態様に係る情報処理装置であって、
前記事業者は、企業、大学、学校、国、地方自治体、団体、組合、組織体、人のうちの1つまたは2つ以上を含む。
【0023】
本発明の第13の態様に係る情報処理装置は、第1~12のいずれかの態様に係る情報処理装置であって、
前記文書は、ニュース記事、プレスリリース、議事録、報告書、論文、特許文献、SNSのうちの1つまたは2つ以上を含む。
【0024】
本発明の第14の態様に係る情報処理装置は、第1~13のいずれかの態様に係る情報処理装置であって、
前記入力受付部は、期間の指定をさらに受け付け、
前記出力制御部は、前記期間内に配信された1または複数の文書のそれぞれについて前記事例文を出力する。
【0025】
このような態様によれば、指定された期間内に配信された文書に対して事例文が出力されるため、特定の期間を指定して事例の調査を迅速に行うことが可能となる。
【0026】
本発明の第15の態様に係る情報処理方法は、
コンピュータが実行する情報処理方法であって、
キーワードの入力を受け付けるステップと、
前記キーワードに関連する1または複数の文書を取得するステップと、
取得された文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定するステップと、
1または複数の文書のそれぞれについて前記事例文を出力するステップと、
を含む。
【0027】
本発明の第16の態様に係る情報処理プログラムは、
コンピュータに、
キーワードの入力を受け付けるステップと、
前記キーワードに関連する1または複数の文書を取得するステップと、
取得された文書の中に、事業者が何かに取り組んでいることを伝える事例文を抽出するステップと、
1または複数の文書のそれぞれについて前記事例文を出力するステップと、
を実行させる。
【発明の効果】
【0028】
本発明によれば、事業者が「何をしているか」という事例の調査を迅速に行うことを支援できる。
【図面の簡単な説明】
【0029】
【
図1】
図1は、一実施の形態に係る情報処理システムの概略的な構成を示す図である。
【
図2】
図2は、情報処理システムの動作の一例を示すフローチャートである。
【
図3A】
図3Aは、各文書の中に事例文があるか否かを判定する処理の一例を示すフローチャートである。
【
図3B】
図3Bは、各文書の中に事例文があるか否かを判定する処理の一変形例を示すフローチャートである。
【
図4B】
図4Bは、事例文の別の一例を説明するための図である。
【
図4C】
図4Cは、事例文の別の一例を説明するための図である。
【
図5A】
図5Aは、情報処理システムにより表示される画面の一例を示す図である。
【
図5B】
図5Bは、情報処理システムにより表示される画面の一例を示す図である。
【発明を実施するための形態】
【0030】
以下に、添付の図面を参照して、本発明の実施の形態を詳細に説明する。なお、以下の説明および以下の説明で用いる図面では、同一に構成され得る部分について、同一の符号を用いるとともに、重複する説明を省略する。
【0031】
(情報処理システムの構成)
図1は、一実施の形態に係る情報処理システム1の概略的な構成を示す図である。
【0032】
図1に示すように、情報処理システム1は、端末装置2と、サーバ3とを備えている。端末装置2とサーバ3とは、インターネット等のネットワーク4を介して互いに通信可能に接続されている。ネットワーク4は、有線回線と無線回線のいずれでもよく、回線の種類や形態は問わない。なお、端末装置2およびサーバ3の少なくとも一部は、コンピュータにより実現される。
【0033】
端末装置2は、ユーザが使用するものであり、たとえば、スマートフォンやタブレット端末などのモバイル端末、ノートブックコンピュータ、またはデスクトップコンピュータなどの電子機器である。
【0034】
図1に示すように、端末装置2は、端末通信部21と、端末制御部22と、端末記憶部23と、端末入力部24と、端末表示部25とを有している。各部21~25は、バスを介して互いに通信可能に接続されている。
【0035】
端末通信部21は、端末装置2とネットワーク4との間の通信インターフェースである。端末通信部21は、ネットワーク4を介して端末装置2とサーバ3との間で情報を送受信する。
【0036】
端末制御部22は、端末装置2の各種処理を行う制御手段である。端末制御部22は、端末装置2内のプロセッサが所定のプログラムを実行することにより実現されてもよいし、ハードウェアで実装されてもよい。
【0037】
端末記憶部23は、たとえばフラッシュメモリ等の不揮発性データストレージである。端末記憶部23には、端末制御部22が取り扱う各種データが記憶される。なお、端末記憶部23は、必ずしも端末装置2内に設けられていなくてもよく、端末記憶部23の一部または全部は、ネットワーク4を介して端末装置2と通信可能に接続された別の装置内に設けられていてもよい。
【0038】
端末入力部24は、ユーザが端末装置2に情報を入力するためのインターフェースであり、たとえばモバイル端末におけるタッチパネルやマイクロフォン、ノートブックコンピュータにおけるタッチパッド、キーボードまたはマウスなどである。
【0039】
端末表示部25は、端末装置2からユーザに対して各種情報を表示するインターフェースであり、たとえば液晶ディスプレイ等の映像表示手段である。具体的には、たとえば、端末表示部25は、ユーザからの操作を受け付けるためのGUI(Graphical User Interface)を表示してもよい。
【0040】
次に、サーバ3について説明する。
図1に示すように、サーバ3は、たとえばクラウド型のサーバであり、サーバ通信部31と、サーバ制御部32と、サーバ記憶部33とを有している。各部31~33は、バスやネットワークを介して互いに通信可能に接続されている。
【0041】
このうちサーバ通信部31は、サーバ3とネットワーク4との間の通信インターフェースである。サーバ通信部31は、ネットワーク4を介してサーバ3と端末装置2との間で情報を送受信する。
【0042】
サーバ記憶部33は、たとえばフラッシュメモリやハードディスク等の不揮発性データストレージである。サーバ記憶部33には、サーバ制御部32が取り扱う各種データが記憶される。たとえば、サーバ記憶部33は、文書データベース33aを含んでいる。
【0043】
文書データベース33aには、後述する文書収集部32eによりインターネットを介して収集される文書(電子文書)が記憶されている。文書は、新聞社(業界紙や地方紙を含む)や出版社、テレビ局などの各種メディア、政府、企業、大学などのウェブサイトにて配信される、ニュース記事、プレスリリース、議事録、報告書、論文、特許文献、SNS(ソーシャル・ネットワーキング・サイト)のうちの1つまたは2つ以上を含んでいてもよい。
【0044】
文書データベース33aに記憶されている文書の情報は、文書収集部32eの動作に応じて所定のタイミング(たとえば、文書収集部32eにより文書が収集された日の翌日の朝など)で更新されてもよい。
【0045】
なお、サーバ記憶部33は、必ずしもサーバ3内に設けられていなくてもよく、サーバ記憶部33の一部または全部は、ネットワーク4を介してサーバ3と通信可能に接続された別の装置内に設けられていてもよい。
【0046】
図1に示すように、サーバ制御部32は、入力受付部32aと、文書取得部32bと、文書解析部32cと、出力制御部32dと、文書収集部32eとを有している。これらの各部32a~32eは、サーバ3内のプロセッサが所定のプログラムを実行することにより実現されてもよいし、ハードウェアで実装されてもよい。
【0047】
文書収集部32eは、各種メディア、政府、企業、大学などのウェブサイトやSNSを定期的に(たとえば毎日)クロールして、公開されている電子文書を収集する。文書収集部32eにより収集された文書は、文書データベース33aに記憶される。
【0048】
入力受付部32aは、ユーザからキーワードの入力を受け付ける。たとえば、ユーザが端末装置2を操作して、文書データベース33aに収集されている文書を検索するためのウェブサイト(
図5A参照)にアクセスし、端末表示部25に表示された画面内の検索ボックス51に端末入力部24を介してキーワード(図示された例では「全固体電池」)を入力すると、入力されたキーワードが端末装置2からサーバ3へと送信され、入力受付部32aが当該キーワードの入力を受け付ける。
【0049】
文書取得部32bは、文書データベース33aを参照し、入力受付部32aにより取得されたキーワードに関連する1または複数の文書を取得する。たとえば、文書取得部32bは、キーワードに関連する文書として、当該キーワードが含まれる文書を文書データベース33aから取得してもよい。一変形例として、文書取得部32bは、キーワードに関連する文書として、当該キーワードの一部が含まれる文書を文書データベース33aから取得してもよい。
【0050】
文書解析部32cは、文書取得部32bにより取得された1または複数の文書のそれぞれについて、文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定する。ここで、事業者は、企業、大学、学校、国、地方自治体、団体、組合、組織体、人のうちの1つまたは2つ以上を含んでいてもよい。
【0051】
図4Aは、事例文の一例を示している。
図4Aに示す例では、「ストックマークは自然言語処理を活用した新サービスを発表した。」という文について、主語が、事業者名(「ストックマーク」)を含んでおり、述語が、事業者としての活動を表す用言または体言止め(「発表した」)を含んでいることから、事例文であると判定される。ここで、「事業者としての活動を表す用言または体言止め」とは、「食べた」「遊んだ」などの個人の私的な活動を表す用言または体言止めを除いたものであり、たとえば「発表した」「開発した」「開発。」「リリースした」「参入する」などが該当する。なお、事例文は、事業者名を含むものに限定されるものではなく、事業者名を含んでいなくてもよい。
図4Bは、事例文の別の一例を示している。
図4Bに示す例では、「同社は、先日のイベントでは自然言語処理を活用した新サービスを発表した。」という文について、主語に事業者名が含まれないものの、述語が、事業者としての活動を表す用言または体言止め(「発表した」)を含んでいることから、事例文であると判定される。
図4Cは、事例文のさらに別の一例を示している。
図4Cに示す例では、「先日のイベントでは自然言語処理を活用した新サービスを発表した。」という文について、主語が省略されているものの、述語が、事業者としての活動を表す用言または体言止め(「発表した」)を含んでいることから、事例文であると判定される。
【0052】
一例として、文書解析部32cは、あらかじめ用意された複数の文のそれぞれについて事例文にあたるか否かがラベル付けされた教師データを機械学習した学習済みモデルを用いて、取得された文章の中に、事例文があるか否かを判定してもよい。別例として、文書解析部32cは、あらかじめ「事業者としての活動を表す用言または体言止め」がリストされている辞書データベース(不図示)(あるいは私的な活動を表す用言または体言止めがリストされているデータベース(不図示))を参照して、取得された文章の中に、事例文があるか否かを判定してもよい。
【0053】
文書解析部32cは、取得された文書の最初のN文を抜き出し、当該N文の中に事例文があるか否かを判定してもよい。Nは、10以下の自然数であってもよいし、8以下の自然数であってもよいし、6以下の自然数であってもよいし、4以下の自然数であってもよい。また、Nは、ユーザが任意に設定(または変更)可能な変数であってもよい。この場合、入力受付部32aが、ユーザからNに対する設定値の入力を受け付けると、文書解析部32cは、入力受付部32aにより取得された設定値にてNを設定(または変更)する。取得された文書の最初のN文の中に事例文があるか否かを判定することで、取得された文書全体に対して事例文があるか否かを判定する場合に比べて、判定処理に要する時間を大幅に短縮することが可能となる。
【0054】
文書解析部32cは、取得された文書の中に事例文があると判定された場合には、当該文書の中から、事例の主体となる事業者の名称を主題企業として抽出してもよい。たとえば、
図4Aに示す例では、事例文の主語に含まれる「ストックマーク」が、事業者の名称にあたることから、「ストックマーク」が主題企業として抽出される。
図4Bおよび
図4Cに示す例では、事例文の周辺にある文に含まれる「ストックマーク」が、事業者の名称にあたることから、「ストックマーク」が主題企業として抽出される。なお、事例文の周辺とは、事例文の前および/または後のM文を意味する。Mは、3以下の自然数であってもよいし、2以下の自然数であってもよいし、1であってもよい。事例文の周辺にある複数の文から事業者の名称が複数抽出される場合には、事例文に最も近い位置にある文に含まれる事業者名の名称が、主題企業として採用されてもよい。
【0055】
一例として、文書解析部32cは、あらかじめ用意された複数の単語のそれぞれについて事業者の名称にあたるか否かがラベル付けされた教師データを機械学習した学習済みモデルを用いて、取得された文書の中に、主題企業があるか否かを判定してもよい。別例として、文書解析部32cは、あらかじめ事業者の名称がリストされている辞書データベース(不図示)を参照して、取得された文書の中に、主題企業があるか否かを判定してもよい。
【0056】
文書解析部32cは、取得された文書の中に事例文があると判定された場合には、当該文書の中から、事業者が取り組んでいる対象を表す単語を解決策キーワードとして抽出してもよい。一例として、事例文または事例文の周辺の中に「○○を」または「○○に」という表現が含まれる場合には、文書解析部32cは、当該「○○」を解決策キーワードとして抽出してもよい。文書解析部32cは、抽出される単語の中から、一般的な単語を除いたものを、解決策キーワードとして採用してもよい。たとえば、
図4A~Cに示す例では、事例文の中に「○○を」という表現として「自然言語処理を」と「新サービスを」という表現が含まれるが、そのうち「新サービス」は一般的な単語にあたることから、「自然言語処理」が解決策キーワードとして抽出される。別例として、文書解析部32cは、あらかじめ解決策キーワード(たとえば、自然言語処理、電気容量、走行距離、など)がリストされている辞書データベース(不図示)と照合することにより、取得された文書(たとえば、事例文または事例文の周辺)の中から、解決策キーワードを抽出してもよい。
【0057】
文書解析部32cは、取得された文書の中に事例文があると判定された場合には、当該文書の中から、事業者が取り組んでいることの課題を表す単語を課題キーワードとして抽出してもよい。一例として、取得された文書の中に「○○性」または「○○化」という単語が含まれる場合には、文書解析部32cは、当該「○○性」または「○○化」を課題キーワードとして抽出してもよい。別例として、文書解析部32cは、あらかじめ課題キーワード(たとえば、安全性、低価格化、など)がリストされている辞書データベース(不図示)と照合することにより、取得された文書(たとえば、事例文または事例文の周辺)の中から、課題キーワードを抽出してもよい。
【0058】
出力制御部32dは、文書取得部32bにより取得された1または複数の文書のそれぞれについて、文書解析部32cにより抽出される事例文を出力する。たとえば、出力制御部32dは、取得された1または複数の文書のそれぞれについて事例文を出力するための制御信号を端末装置2へと送信し、端末表示部25を介して事例文を出力させてもよい。一変形例として、出力制御部32dは、取得された1または複数の文書のそれぞれについて事例文をテーブル形式でファイルに出力し、当該ファイルを端末装置2へと送信してもよい。1または複数の文書のそれぞれについて事例文が出力されることで、ユーザは、1または複数の文書の中身を一つ一つ読み込んで確認しなくても、事業者が「何をしているか」という具体的な事例を一目で容易に把握することが可能となる。
【0059】
文書解析部32cにより、取得された文書の中から主題企業が抽出される場合には、
図5Bを参照し、出力制御部32dは、文書取得部32bにより取得された1または複数の文書のそれぞれについて、主題企業を事例文と並んで表示するテーブル52を出力してもよい。テーブル52上に主題企業(事例の主体である事業者の名称)が事例文と並んで表示されることで、ユーザは、特定の事業者に注目して事例の調査を迅速に行うことが可能となる。
【0060】
文書解析部32cにより、取得された文書の中から解決策キーワードが抽出される場合には、
図5Bを参照し、出力制御部32dは、1または複数の文書のそれぞれについて解決策キーワードを事例文と並んで表示するテーブル52を出力してもよい。テーブル52上に解決策キーワードが事例文と並んで表示されることで、ユーザは、特定の解決策に注目して事例の調査を迅速に行うことが可能となる。
【0061】
文書解析部32cにより事例文の中から解決策キーワードが抽出される場合(すなわち、事例文が解決策キーワードを含んでいる場合)には、
図5Bを参照し、出力制御部32dは、事例文を表示する際に、当該事例文の中に含まれる解決策キーワードを強調表示してもよい。
図5Bに示す例では、事例文中の解決策キーワードが太字で強調表示されているが、強調表示の態様はこれに限定されるものではなく、解決策キーワードに下線が付されたり、フォントのサイズが大きく変更されたり、フォントの色が変更されたり、網掛けで表示されたりしてもよいし、これらの組み合わせで強調表示されてもよい。事例文が表示される際に、当該事例文中の解決策キーワードが強調表示されることで、ユーザは、特定の解決策に注目して事例の調査を迅速に行うことが可能となる。
【0062】
文書解析部32cにより、取得された文書の中から課題キーワードが抽出される場合には、
図5を参照し、出力制御部32dは、1または複数の文書のそれぞれについて課題キーワードを事例文と並んで表示するテーブル52を出力してもよい。テーブル52上に課題キーワードが事例文と並んで表示されることで、ユーザは、特定の課題に注目して事例の調査を迅速に行うことが可能となる。
【0063】
図5Bを参照し、出力制御部32dは、1または複数の文書のそれぞれについて文書のタイトル(見出し)および/または配信元を事例文と並んで表示するテーブル52を出力してもよい。なお、本明細書において「Aおよび/またはB」とは、AおよびBのうちいずれか一方または両方を意味する。
【0064】
図5Bを参照し、出力制御部32dは、1または複数の文書のそれぞれについて事例文を文書の日付順に出力してもよいし、文書の日付を事例文と並んで表示するテーブル52を出力してもよい。ここで、「文書の日付」とは、文書中にテキストで記載されている公開日(配信日)であってもよいし、文書収集部32eにより文書が収集された日付であってもよい。テーブル52上において文書の日付が事例文と並んで表示される場合には、文書の日付は、最も端のカラム(例えば左端または右端のカラム)に配置されてもよい。この場合、ユーザは、特定の日付(または期間)に注目して事例の調査を迅速に行うことが可能となる。
【0065】
図5Bを参照し、ユーザが、端末表示部25に表示された画面内の期間指定ボックス53に端末入力部24を介して特定の期間(図示された例では「2019/01/01~2021/12/15」)を入力すると、入力された期間の情報が端末装置2からサーバ3へと送信され、入力受付部32aが、当該期間の指定をさらに受け付けてもよい。この場合、出力制御部32dは、指定された期間外に配信された1または複数の文書については非表示とし、指定された期間内に配信された1または複数の文書のそれぞれについてのみ事例文を出力してもよい。指定された期間内に配信された文書に対して事例文が出力されることで、特定の期間を指定して事例の調査を迅速に行うことが可能となる。
【0066】
(動作の一例)
次に、
図2および
図3Aを参照して、情報処理システム1の動作の一例について説明する。
図2は、情報処理システム1の動作の一例を示すフローチャートである。
図3Aは、各文書の中に事例文があるか否かを判定する処理の一例を示すフローチャートである。
【0067】
図2に示すように、まず、ユーザが端末装置2を操作して、文書データベース33aに収集されている文書を検索するためのウェブサイト(
図5A参照)にアクセスし、端末表示部25に表示された画面内の検索ボックス51に端末入力部24を介してキーワード(図示された例では「全固体電池」)を入力すると、入力されたキーワードが端末装置2からサーバ3へと送信され、サーバ3の入力受付部32aが当該キーワードの入力を受け付ける(ステップS10)。
【0068】
次に、文書取得部32bが、文書データベース33aを参照し、入力受付部32aにより取得されたキーワードに関連する1または複数の文書を取得する(ステップS20)。
【0069】
次いで、文書解析部32cが、文書取得部32bにより取得された1または複数の文書のそれぞれについて、文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定する(ステップS30)。
【0070】
具体的には、たとえば、
図3Aを参照し、文書解析部32cは、文書取得部32bにより取得された1または複数の文書のうちの1つを選択して最初のN文を抜き出す(ステップS31)。
【0071】
次に、文書解析部32cは、抜き出されたN文の各々に対して、事業者が何かに取り組んでいることを伝える事例文であるか否かを判定する(ステップS32)。たとえば、文書解析部32cは、あらかじめ用意された複数の文のそれぞれについて事例文にあたるか否かがラベル付けされた教師データを機械学習した学習済みモデルを用いて、抜き出されたN文の各々に対して、事例文にあたるか否かを判定してもよい。別例として、文書解析部32cは、事業者としての活動を示す用言または体言止めがリストされている辞書データベースを参照して、抜き出されたN文の各々に対して、事例文にあたるか否かを判定してもよい。
【0072】
ステップS32において事例文があると判定された場合には(ステップS321:YES)、文書解析部32cは、選択している1つの文書の中から、当該事例文にかかる事例の主体である事業者の名称を、主題企業として抽出する(ステップS33)。たとえば、文書解析部32cは、あらかじめ用意された複数の単語のそれぞれについて事業者の名称にあたるか否かがラベル付けされた教師データを機械学習した学習済みモデルを用いて、選択している1つの文書の中に、主題企業があるか否かを判定してもよい。別例として、文書解析部32cは、あらかじめ事業者の名称がリストされている辞書データベース(不図示)を参照して、選択している1つの文書の中に、主題企業があるか否かを判定してもよい。
【0073】
次いで、文書解析部32cは、選択している1つの文書の中から、事業者が取り組んでいる対象を表す単語を解決策キーワードとして抽出する(ステップS34)。
【0074】
次に、文書解析部32cは、選択している1つの文書の中から、事業者が取り組んでいることの課題を表す単語を課題キーワードとして抽出する(ステップS35)。
【0075】
そして、文書解析部32cは、文書取得部32bにより取得された1または複数の文書の全てに対して事例文の有無の判定処理(ステップS32)を行った否かを確認する(ステップS36)。
【0076】
文書取得部32bにより取得された1または複数の文書の全てに対して事例文の有無の判定処理を行っていることが確認された場合には(ステップS36:YES)、ステップS30の処理を終了する。他方、文書取得部32bにより取得された1または複数の文書の全てに対して事例文の有無の判定処理を行っていることが確認できなかった場合には(ステップS36:NO)、ステップS31に戻って未処理の文章に対する判定処理を行う。
【0077】
図2を参照し、ステップS30の処理が終了したのち、出力制御部32dは、文書取得部32bにより取得された1または複数の文書のそれぞれについて、文書解析部32cにより抽出された事例文を出力する(ステップS40)。たとえば、出力制御部32dは、取得された1または複数の文書のそれぞれについて事例文を出力するための制御信号を端末装置2へと送信し、端末表示部25を介して事例文を出力させる(
図5B参照)。
【0078】
図5Bに示すように、出力制御部32dは、文書取得部32bにより取得された1または複数の文書のそれぞれについて、主題企業を事例文と並んで表示するテーブル52を出力してもよい。
【0079】
また、
図5Bに示すように、出力制御部32dは、テーブル52上において、文書解析部32cにより抽出された課題キーワードおよび解決策キーワードを、事例文と並んで表示されるように出力してもよい。さらに、出力制御部32dは、テーブル52上において、文書のタイトル(見出し)および/または配信元を、事例文と並んで表示されるように出力してもよい。
【0080】
図5Bに示すように、出力制御部32dは、テーブル52上において、事例文を表示する際に、当該事例文の中に含まれる解決策キーワードを(たとえば太字で)強調表示してもよい。また、出力制御部32dは、テーブル52上において、1または複数の文書のそれぞれについて事例文を文書の日付順に出力してもよい。
【0081】
図5Bを参照し、ユーザが、端末表示部25に表示された画面内の期間指定ボックス53に端末入力部24を介して特定の期間(図示された例では「2019/01/01~2021/12/15」)を入力すると、入力された期間の情報が端末装置2からサーバ3へと送信され、入力受付部32aが、当該期間の指定をさらに受け付けてもよい。この場合、出力制御部32dは、指定された期間外に配信された1または複数の文書については非表示とし、指定された期間内に配信された1または複数の文書のそれぞれについてのみ事例文を出力させる。
【0082】
また、
図5Bを参照し、ユーザが、端末表示部25に表示された画面内の言語指定ボックス54に端末入力部24を介して特定の言語(図示された例では「日本語」)を入力すると、入力された言語の情報が端末装置2からサーバ3へと送信され、入力受付部32aが、当該言語の指定をさらに受け付けてもよい。この場合、出力制御部32dは、指定された言語以外で記述された1または複数の文書については非表示とし、指定された言語で記述された1または複数の文書のそれぞれについてのみ事例文を出力させる。
【0083】
図5Bを参照し、ユーザが、端末表示部25に表示された画面内の絞り込み用キーワード入力ボックス57に端末入力部24を介して絞り込み用キーワードを入力すると、入力された絞り込み用キーワードの情報が端末装置2からサーバ3へと送信され、入力受付部32aが、当該絞り込み用キーワードの入力をさらに受け付けてもよい。この場合、出力制御部32dは、入力された絞り込みキーワードを含まない1または複数の文書については非表示とし、入力された絞り込みキーワードを含む1または複数の文書のそれぞれについてのみ事例文を出力させる。
【0084】
図5Bを参照し、ユーザが、端末表示部25に表示された画面内の業種指定ボックス58に端末入力部24を介して特定の事業者(たとえば企業)を入力すると、入力された事業者(企業)の情報が端末装置2からサーバ3へと送信され、入力受付部32aが、当該事業者(企業)の指定をさらに受け付けてもよい。この場合、出力制御部32dは、主題企業が指定された事業者(企業)にあたらない1または複数の文書については非表示とし、主題企業が指定された事業者(企業)にあたる1または複数の文書のそれぞれについてのみ事例文を出力させる。
【0085】
図5Bを参照し、ユーザが、端末表示部25に表示された画面内の必須カラムのチェックボックス55のうち「解決策キーワード」のチェックボックスに端末入力部24を介してチェックを入れると、出力制御部32dは、テーブル52上において、解決策キーワードが空欄の文書(図示された例では最下行)については非表示にしてもよい。同様に、ユーザが、端末表示部25に表示された画面内の必須カラムのチェックボックス55のうち「課題キーワード」のチェックボックスに端末入力部24を介してチェックを入れると、出力制御部32dは、テーブル52上において、課題キーワードが空欄の文書(図示された例では上から1~3行)を非表示にしてもよい。
【0086】
図5Bを参照し、ユーザが、端末表示部25に表示された画面内の「レポート出力」ボタン56に対して、端末入力部24を介して入力操作を行うと、出力制御部32dは、文書取得部32bにより取得された1または複数の文書のそれぞれについて事例文をテーブル形式でファイルに出力し、当該ファイルを端末装置2へと送信してもよい。
【0087】
以上のような実施の形態によれば、ユーザからキーワードの入力を受け付けると、キーワードに関連する1または複数の文書を取得したのち、取得した文書の中に、事業者が何かに取り組んでいることを伝える事例文があるか否かを判定し、1または複数の文書のそれぞれについて当該事例文を出力するため、ユーザは、提示された文書の中身を一つ一つ読み込んで確認しなくても、事業者が「何をしているか」という具体的な事例を一目で容易に把握することが可能となる。したがって、事業者が「何をしているか」という事例の調査を迅速に行うことを支援できる。
【0088】
なお、上述した実施の形態では、各文書の中に事例文があるか否かを判定する処理の一例として、
図3Aに示すように、文書解析部32cは、まず、文書の中に事例文があるか否かを判定し、文書の中に事例文があると判定された場合には、当該文書の中から主題企業、解決策キーワード、課題キーワードをそれぞれ抽出する処理を行っていたが、各文書の中に事例文があるか否かを判定する処理は、これに限定されるものではない。
【0089】
図3Bは、各文書の中に事例文があるか否かを判定する処理の一変形例を示すフローチャートである。
図3Bに示す例では、文書解析部32cは、上述した実施の形態と同様に、文書取得部32bにより取得された1または複数の文書のうちの1つを選択して最初のN文を抜き出したのち(ステップS31)、抜き出されたN文の各々に対して、事業者の名称が含まれているか否かを判定する(ステップS132)。
【0090】
次いで、ステップS132において事業者の名称を含む文があると判定された場合には、文書解析部32cは、当該事業者の名称を含む文が、事業者が何かに取り組んでいることを伝える事例文にあたるか否かを判定する(ステップS133)。
【0091】
そして、ステップS133において事業者の名称を含む文が事例文にあたると判定された場合には、当該事業者の名称を主題企業として抽出する。また、文書解析部32cは、上述した実施の形態と同様に、当該文書の中から解決策キーワード、課題キーワードをそれぞれ抽出する(ステップS34、S35)。その後、文書解析部32cは、文書取得部32bにより取得された1または複数の文書の全てに対して事例文の有無の判定処理(ステップS132~133)を行った否かを確認し(ステップS36)、事例文の有無の判定処理を行っていることが確認された場合には(ステップS36:YES)、ステップS30の処理を終了する。
【0092】
以上のような一変形例に係る判定処理によっても、各文書の中に事例文があるか否かを判定することは可能である。
【0093】
なお、上述した実施の形態および個々の変形例の記載ならびに図面の開示は、特許請求の範囲に記載された発明を説明するための一例に過ぎず、上述した実施の形態および個々の変形例の記載または図面の開示によって特許請求の範囲に記載された発明が限定されることはない。上述した実施の形態および個々の変形例の構成要素は、発明の主旨を逸脱しない範囲で任意に組み合わせることが可能である。
【0094】
また、上述した実施の形態に係る情報処理システム1は1つまたは複数のコンピュータによって構成され得るが、1つまたは複数のコンピュータに情報処理システム1を実現させるためのプログラム及び当該プログラムを非一時的(non-transitory)に記録したコンピュータ読取可能な記録媒体も、本件の保護対象である。
【符号の説明】
【0095】
1 情報処理システム
2 端末装置
21 端末通信部
22 端末制御部
23 端末記憶部
24 端末入力部
25 端末表示部
3 サーバ
31 サーバ通信部
32 サーバ制御部
32a 入力受付部
32b 文書取得部
32c 文書解析部
32d 出力制御部
32e 文書収集部
33 サーバ記憶部
33a 文書データベース
4 ネットワーク