(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024017977
(43)【公開日】2024-02-08
(54)【発明の名称】情報提供プログラム、情報提供方法、および情報提供システム
(51)【国際特許分類】
G06F 16/632 20190101AFI20240201BHJP
G06F 16/332 20190101ALI20240201BHJP
【FI】
G06F16/632
G06F16/332
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022120990
(22)【出願日】2022-07-28
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100104190
【弁理士】
【氏名又は名称】酒井 昭徳
(72)【発明者】
【氏名】小木曽 貴大
(72)【発明者】
【氏名】田島 圭
(72)【発明者】
【氏名】久米 伸
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175FA01
5B175GA04
(57)【要約】
【課題】ユーザにとって有用な情報を提供すること。
【解決手段】情報処理装置101は、複数の記事情報の各記事情報からキーワードを抽出する。情報処理装置101は、1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出する。情報処理装置101は、音声認識結果から抽出したキーワードと各記事情報から抽出したキーワードとの一致数と、音声認識結果から抽出したキーワードの各記事情報における出現数とに基づいて、複数の記事情報から、出力対象の記事情報を検索する。情報処理装置101は、1または複数のユーザに対して、検索した記事情報に関する情報を出力する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の記事情報の各記事情報からキーワードを抽出し、
1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出し、
前記音声認識結果から抽出したキーワードと前記各記事情報から抽出したキーワードとの一致数と、前記音声認識結果から抽出したキーワードの前記各記事情報における出現数とに基づいて、前記複数の記事情報から、出力対象の記事情報を検索し、
前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、
処理をコンピュータに実行させることを特徴とする情報提供プログラム。
【請求項2】
前記検索する処理は、
前記複数の記事情報から、前記一致数が第1の閾値以上、かつ、前記出現数が第2の閾値以上となる記事情報を、前記出力対象の記事情報として検索する、ことを特徴とする請求項1に記載の情報提供プログラム。
【請求項3】
前記各記事情報からキーワードを抽出する処理は、
前記各記事情報から、予め設定されたストップワードを除外したキーワードを抽出し、
前記音声認識結果からキーワードを抽出する処理は、
前記音声認識結果から前記ストップワードを除外したキーワードを抽出する、
ことを特徴とする請求項1に記載の情報提供プログラム。
【請求項4】
前記各記事情報からキーワードを抽出する処理は、
所定のアルゴリズムで前記各記事情報の本文を形態素解析することにより、前記各記事情報から名詞をキーワードとして抽出し、
前記音声認識結果からキーワードを抽出する処理は、
前記所定のアルゴリズムで前記音声認識結果を形態素解析することにより、前記音声認識結果から名詞をキーワードとして抽出する、
ことを特徴とする請求項1に記載の情報提供プログラム。
【請求項5】
ネットワークを介して接続される情報配信システムから、複数の記事情報を取得する、
処理を前記コンピュータに実行させ、
前記各記事情報からキーワードを抽出する処理は、
取得した前記複数の記事情報の各記事情報からキーワードを抽出する、ことを特徴とする請求項1に記載の情報提供プログラム。
【請求項6】
前記1または複数のユーザは、オンラインコミュニケーションを行うユーザである、ことを特徴とする請求項1に記載の情報提供プログラム。
【請求項7】
複数の分類からいずれかの分類の選択を受け付ける、
処理を前記コンピュータに実行させ、
前記出力する処理は、
前記1または複数のユーザに対して、検索した前記記事情報のうち、選択された前記分類に属する記事情報に関する情報を出力する、ことを特徴とする請求項1~6のいずれか一つに記載の情報提供プログラム。
【請求項8】
複数の記事情報の各記事情報からキーワードを抽出し、
1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出し、
前記音声認識結果から抽出したキーワードと前記各記事情報から抽出したキーワードとの一致数と、前記音声認識結果から抽出したキーワードの前記各記事情報における出現数とに基づいて、前記複数の記事情報から、出力対象の記事情報を検索し、
前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、
処理をコンピュータが実行することを特徴とする情報提供方法。
【請求項9】
1または複数のユーザが使用する端末と、
複数の記事情報の各記事情報からキーワードを抽出し、前記1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出し、前記音声認識結果から抽出したキーワードと前記各記事情報から抽出したキーワードとの一致数と、前記音声認識結果から抽出したキーワードの前記各記事情報における出現数とに基づいて、前記複数の記事情報から、出力対象の記事情報を検索し、検索した前記記事情報に関する情報を前記端末に出力する情報提供装置と、
を含むことを特徴とする情報提供システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報提供プログラム、情報提供方法、および情報提供システムに関する。
【背景技術】
【0002】
近年、リモートワークの普及にともなって、ウェブ会議を利用する機会が増えている。ウェブ会議は、異なる場所にいるユーザ同士が、インターネットなどを通じてデータを共有したり、会話したりできるシステムである。
【0003】
先行技術としては、利用者の会話から話題となっているキーワードを抽出し、キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納しているナレッジベースを参照し、抽出したキーワードに紐付けられているレコメンドアイテムおよびコミュニケーションコンテキストを抽出するものがある。また、コンテンツにかかる推薦スコアに基づいてユーザに対する推薦情報の提示を制御する技術がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】国際公開第2021/250833号
【特許文献2】特開2019-95832号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術では、ウェブ会議などの参加ユーザに対して、議論を活発化させるような有用な情報(記事)を提供することが難しい。
【0006】
一つの側面では、本発明は、ユーザにとって有用な情報を提供することを目的とする。
【課題を解決するための手段】
【0007】
1つの実施態様では、複数の記事情報の各記事情報からキーワードを抽出し、1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出し、前記音声認識結果から抽出したキーワードと前記各記事情報から抽出したキーワードとの一致数と、前記音声認識結果から抽出したキーワードの前記各記事情報における出現数とに基づいて、前記複数の記事情報から、出力対象の記事情報を検索し、前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、情報提供プログラムが提供される。
【発明の効果】
【0008】
本発明の一側面によれば、ユーザにとって有用な情報を提供することができるという効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施の形態にかかる情報提供方法の一実施例を示す説明図である。
【
図2】
図2は、情報提供システム200のシステム構成例を示す説明図である。
【
図3】
図3は、情報提供装置201のハードウェア構成例を示すブロック図である。
【
図4】
図4は、ユーザ端末204のハードウェア構成例を示すブロック図である。
【
図5】
図5は、記事マスタ220の記憶内容の一例を示す説明図である。
【
図6】
図6は、タグマスタ230の記憶内容の一例を示す説明図である。
【
図7】
図7は、記事タグテーブル240の記憶内容の一例を示す説明図である。
【
図8】
図8は、情報提供装置201の機能的構成例を示すブロック図である。
【
図9】
図9は、ストップワードテーブル900の記憶内容の一例を示す説明図である。
【
図10】
図10は、記事別タグ出現数テーブル1000の記憶内容の一例を示す説明図である。
【
図11】
図11は、情報提供システム200の第1の動作例を示す説明図である。
【
図12】
図12は、情報提供システム200の第2の動作例を示す説明図である。
【
図13】
図13は、会議管理テーブル1300の記憶内容の一例を示す説明図である。
【
図14】
図14は、情報提供システム200の第3の動作例を示す説明図である。
【
図15】
図15は、記事情報の第1の検索例を示す説明図である。
【
図16】
図16は、記事情報の第2の検索例を示す説明図である。
【
図17】
図17は、記事情報の第3の検索例を示す説明図である。
【
図18】
図18は、ウェブ会議画面の画面例を示す説明図(その1)である。
【
図19】
図19は、分類選択画面1900の画面例を示す説明図である。
【
図20】
図20は、ウェブ会議画面の画面例を示す説明図(その2)である。
【
図21】
図21は、情報提供装置201の記事収集処理手順の一例を示すフローチャートである。
【
図22】
図22は、情報提供装置201の記事解析処理手順の一例を示すフローチャートである。
【
図23】
図23は、情報提供装置201の記事検索処理手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下に図面を参照して、本発明にかかる情報提供プログラム、情報提供方法、および情報提供システムの実施の形態を詳細に説明する。
【0011】
(実施の形態)
図1は、実施の形態にかかる情報提供方法の一実施例を示す説明図である。
図1において、情報処理装置101は、1または複数のユーザに対して、記事に関する情報を出力するコンピュータである。1または複数のユーザは、例えば、オンラインコミュニケーションを行うユーザである。
【0012】
オンラインコミュニケーションとは、インターネットなどのネットワークを介して相互に対話するコミュニケーションである。ただし、1または複数のユーザは、対面で会話するオフラインコミュニケーションを行うユーザであってもよい。記事は、事物を文章で表す情報である。記事は、例えば、ウェブサイトで公開される記事である。
【0013】
ここで、ウェブ会議などにおいて、ユーザにとって有用な情報を提供することは、議論を活性化させる上で重要である。例えば、ユーザに予備知識がないと、他のユーザが発言した単語の意味がわからず、会議中に議論から脱落してしまう場合がある。また、議論が煮詰まってしまうと、誰も発言しなくなり、無為に時間が過ぎてしまうことがある。また、新規事業のためのアイデア出しなどを行う際に、似たようなアイデアしか出てこない場合がある。
【0014】
このため、例えば、予めキーワードと記事とを対応付けて登録しておき、会議中の音声認識結果の中から予め登録されたキーワードを抽出し、そのキーワードを使って記事を検索することが考えられる。しかし、この手法では、予め登録されたキーワードに対応付けられた範囲内で記事を検索することになる。このため、会議中に発せられたキーワードを柔軟に拾って、会議の目的、内容などによりマッチした記事を検索することが難しい。
【0015】
そこで、本実施の形態では、各記事情報と音声認識結果との両方についてキーワードの解析を行って、ユーザの発話内容にマッチした情報を検索することで、ユーザにとって有用な情報を提供可能にする情報提供方法について説明する。以下、情報処理装置101の処理例(下記(1)~(4)の処理に対応)について説明する。
【0016】
(1)情報処理装置101は、複数の記事情報の各記事情報からキーワードを抽出する。ここで、複数の記事情報は、例えば、インターネットなどを介して情報処理装置101と接続された情報配信システム(例えば、後述の
図2に示す情報配信システム203)から取得される。具体的には、例えば、情報処理装置101は、各記事情報の本文を形態素解析することにより、各記事情報から名詞をキーワードとして抽出する。
【0017】
図1の例では、複数の記事情報を「記事11,12,13」とする。また、記事11から抽出されたキーワードを「キーワード群K1」とし、記事12から抽出されたキーワードを「キーワード群K2」とし、記事13から抽出されたキーワードを「キーワード群K3」とする。各キーワード群K1~K3は、それぞれ1以上のキーワードを含む。
【0018】
(2)情報処理装置101は、1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出する。所定期間は、任意に設定可能であり、例えば、直近の数秒程度の期間である。音声認識結果は、音声データをテキストデータに変換したものである。
【0019】
音声認識には、例えば、AI(Artificial Intelligence)などを利用した既存の音声認識技術を用いることができる。具体的には、例えば、情報処理装置101は、音声認識結果(テキストデータ)を形態素解析することにより、音声認識結果から名詞をキーワードとして抽出する。
【0020】
図1の例では、1または複数のユーザを「ユーザU1,U2,U3」とする。ユーザU1~U3は、オンラインコミュニケーションを行うユーザである。また、ユーザU1~U3の所定期間の発話内容を記録した音声データの音声認識結果を「音声認識結果110」とし、音声認識結果110から抽出されたキーワードを「キーワード群X」とする。キーワード群Xは、1以上のキーワードを含む。
【0021】
(3)情報処理装置101は、音声認識結果から抽出したキーワードと各記事情報から抽出したキーワードとの一致数と、音声認識結果から抽出したキーワードの各記事情報における出現数とに基づいて、複数の記事情報から、出力対象の記事情報を検索する。
【0022】
ここで、音声認識結果から抽出したキーワードと各記事情報から抽出したキーワードとの一致数が多い記事情報ほど、ユーザの発話内容にマッチした記事情報である可能性が高いといえる。また、音声認識結果から抽出したキーワードの出現数が多い記事情報ほど、ユーザの発話内容にマッチした記事情報である可能性が高いといえる。
【0023】
このため、情報処理装置101は、例えば、複数の記事情報から、キーワードの一致数が第1の閾値以上、かつ、キーワードの出現数が第2の閾値以上となる記事情報を、出力対象の記事情報として検索してもよい。キーワードの一致数は、音声認識結果から抽出したキーワードと各記事情報から抽出したキーワードとの一致数である。
【0024】
キーワードの出現数は、音声認識結果から抽出したキーワードの各記事情報における出現数である。第1の閾値および第2の閾値は、任意に設定可能であり、例えば、上述した所定期間の長さに応じて設定される。所定期間が数秒程度の期間の場合、第1の閾値および第2の閾値は、例えば、1~3程度の値に設定される。
【0025】
図1の例では、情報処理装置101は、キーワード群Xと各キーワード群K1~K3とのキーワードの一致数と、キーワード群Xに含まれるキーワードの各記事11~13における出現数とに基づいて、記事11~13から、出力対象の記事を検索する。ここでは、記事11~13から、キーワードの一致数が第1の閾値以上、かつ、キーワードの出現数が第2の閾値以上となる記事12が検索された場合を想定する。
【0026】
(4)情報処理装置101は、1または複数のユーザに対して、検索した記事情報に関する情報を出力する。記事情報に関する情報は、例えば、記事のタイトル、要約、URL(Uniform Resource Locator)などである。また、記事情報に関する情報は、記事の本文であってもよい。
【0027】
図1の例では、ユーザU1~U3に対して、記事12に関する情報が出力される。これにより、ユーザU1~U3は、例えば、記事12のタイトル、要約、URLなどを確認することができる。また、ユーザU1~U3は、記事12のURLから、記事12の本文などの詳細を確認することができる。
【0028】
このように、情報処理装置101によれば、ユーザの発話内容にマッチした記事情報を検索することができる。この際、情報処理装置101は、各記事情報と音声認識結果との両方についてキーワードの解析を行うことで、柔軟に会話中のキーワードを拾って、広範囲の記事情報の中から、ユーザの発話内容に、よりマッチした記事情報を検索することができる。
【0029】
これにより、情報処理装置101は、ユーザにとって有用な情報を提供することができる。
図1の例では、ユーザU1~U3の発話内容にマッチした記事12の情報を提供することで、ユーザU1~U3による議論の活性化を図ることができる。
【0030】
(情報提供システム200のシステム構成例)
つぎに、
図1に示した情報処理装置101を含む情報提供システム200のシステム構成例について説明する。ここでは、
図1に示した情報処理装置101を、情報提供システム200内の情報提供装置201に適用した場合を例に挙げて説明する。情報提供システム200は、例えば、ウェブ会議を支援するサービスに適用される。
【0031】
図2は、情報提供システム200のシステム構成例を示す説明図である。
図2において、情報提供システム200は、情報提供装置201と、音声解析システム202と、情報配信システム203と、複数のユーザ端末204と、を含む。情報提供システム200において、情報提供装置201、音声解析システム202、情報配信システム203およびユーザ端末204は、有線または無線のネットワーク210を介して接続される。ネットワーク210は、例えば、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)などである。
【0032】
ここで、情報提供装置201は、記事マスタ220、タグマスタ230、記事タグテーブル240を有し、オンラインコミュニケーションを支援するコンピュータである。情報提供装置201は、例えば、アプリケーションサーバ、データベースサーバなどにより実現される。
【0033】
なお、記事マスタ220、タグマスタ230および記事タグテーブル240の記憶内容については、
図5~
図7を用いて後述する。
【0034】
音声解析システム202は、音声データをテキストデータに変換するコンピュータである。音声解析システム202は、例えば、Web API(Application Programming Interface)により音声解析機能を提供する外部サービスである。
【0035】
情報配信システム203は、各種の記事情報を配信するコンピュータである。情報配信システム203は、例えば、新聞社、通信社、テレビ局などが運営するニュースサイトであってもよい。音声解析システム202および情報配信システム203は、例えば、1または複数のサーバによりそれぞれ実現される。
【0036】
ユーザ端末204は、ユーザが使用するコンピュータである。ユーザ端末204は、オンラインコミュニケーションを行う1または複数のユーザの発話内容を音声データとして記録する機能を有する。オンラインコミュニケーションは、例えば、ウェブ会議である。1または複数のユーザは、例えば、ウェブ会議の参加メンバーである。
【0037】
ユーザ端末204は、例えば、Web APIを利用して、音声解析システム202にアクセスすることにより、1または複数のユーザの発話内容を記録した音声データから音声認識結果を取得することができる。ユーザ端末204は、例えば、PC(Personal Computer)、タブレットPC、スマートフォンなどである。
【0038】
なお、ここでは情報提供装置201とユーザ端末204とを別体に設けることにしたが、これに限らない。例えば、情報提供装置201は、ユーザ端末204により実現されることにしてもよい。また、音声解析システム202の機能は、情報提供装置201やユーザ端末204により実現されてもよい。
【0039】
(情報提供装置201のハードウェア構成例)
つぎに、情報提供装置201のハードウェア構成例について説明する。
【0040】
図3は、情報提供装置201のハードウェア構成例を示すブロック図である。
図3において、情報提供装置201は、CPU(Central Processing Unit)301と、メモリ302と、ディスクドライブ303と、ディスク304と、通信I/F(Interface)305と、可搬型記録媒体I/F306と、可搬型記録媒体307と、を有する。また、各構成部は、バス300によってそれぞれ接続される。
【0041】
ここで、CPU301は、情報提供装置201の全体の制御を司る。CPU301は、複数のコアを有していてもよい。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMがOSのプログラムを記憶し、ROMがアプリケーションプログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
【0042】
ディスクドライブ303は、CPU301の制御に従ってディスク304に対するデータのリード/ライトを制御する。ディスク304は、ディスクドライブ303の制御で書き込まれたデータを記憶する。ディスク304としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
【0043】
通信I/F305は、通信回線を通じてネットワーク210(
図2参照)に接続され、ネットワーク210を介して外部のコンピュータ(例えば、
図2に示した音声解析システム202、情報配信システム203、ユーザ端末204)に接続される。そして、通信I/F305は、ネットワーク210と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。通信I/F305には、例えば、モデムやLANアダプタなどを採用することができる。
【0044】
可搬型記録媒体I/F306は、CPU301の制御に従って可搬型記録媒体307に対するデータのリード/ライトを制御する。可搬型記録媒体307は、可搬型記録媒体I/F306の制御で書き込まれたデータを記憶する。可搬型記録媒体307としては、例えば、CD(Compact Disc)-ROM、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリなどが挙げられる。
【0045】
なお、情報提供装置201は、上述した構成部のほかに、例えば、入力装置、ディスプレイなどを有することにしてもよい。また、
図2に示した音声解析システム202、情報配信システム203についても、情報提供装置201と同様のハードウェア構成により実現することができる。
【0046】
(ユーザ端末204のハードウェア構成例)
つぎに、ユーザ端末204のハードウェア構成例について説明する。
【0047】
図4は、ユーザ端末204のハードウェア構成例を示すブロック図である。
図4において、ユーザ端末204は、CPU401と、メモリ402と、通信I/F403と、カメラ404と、ディスプレイ405と、入力装置406と、スピーカ407と、マイクロフォン408と、を有する。また、各構成部はバス400によってそれぞれ接続される。
【0048】
ここで、CPU401は、ユーザ端末204の全体の制御を司る。CPU401は、複数のコアを有していてもよい。メモリ402は、例えば、ROM、RAMおよびフラッシュROMなどを有する記憶部である。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU401のワークエリアとして使用される。メモリ402に記憶されるプログラムは、CPU401にロードされることで、コーディングされている処理をCPU401に実行させる。
【0049】
通信I/F403は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部のコンピュータ(例えば、情報提供装置201)に接続される。そして、通信I/F403は、ネットワーク210と自装置内部とのインターフェースを司り、外部装置からのデータの入出力を制御する。
【0050】
カメラ404は、画像(静止画または動画)を撮影して画像データを出力する撮影装置である。カメラ404は、例えば、ユーザ端末204を利用するユーザの顔を撮影可能な位置に設置される。
【0051】
ディスプレイ405は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する表示装置である。ディスプレイ405は、例えば、液晶ディスプレイや有機EL(Electroluminescence)ディスプレイなどであってもよい。
【0052】
入力装置406は、文字、数字、各種指示などの入力のためのキーを有し、データの入力を行う。入力装置406は、タッチパネル式の入力パッドやテンキーなどであってもよく、また、キーボードやマウスなどであってもよい。スピーカ407は、電気信号を音声に変換して、音声を出力する。マイクロフォン408は、音声を受音して電気信号に変換する音声入力デバイスである。
【0053】
なお、ユーザ端末204は、上述した構成部のほかに、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、近距離無線通信I/F、可搬型記録媒体I/F、可搬型記録媒体などを有することにしてもよい。
【0054】
(記事マスタ220の記憶内容)
つぎに、
図5を用いて、情報提供装置201が有する記事マスタ220の記憶内容について説明する。記事マスタ220は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0055】
図5は、記事マスタ220の記憶内容の一例を示す説明図である。
図5において、記事マスタ220は、メディアID、記事ID、タイトル、URL、本文、要約、ジャンルおよびカテゴリのフィールドを有し、各フィールドに情報を設定することで、記事情報(例えば、記事情報500-1)をレコードとして記憶する。
【0056】
ここで、メディアIDは、ウェブサイトを一意に識別する識別子である。記事IDは、記事を一意に識別する識別子である。タイトルは、記事のタイトルである。URLは、ウェブサイト内の記事が掲載されたページのURLである。本文は、記事の本文である。要約は、記事の要約である。
【0057】
ジャンルは、記事が属するジャンルである。カテゴリは、記事が属するカテゴリである。ジャンルは、記事を分類するための大分類に相当する。カテゴリは、同一ジャンル内の記事を分類するための小分類に相当する。なお、記事情報には、例えば、掲載日時、掲載企業名、掲載メディア名、サムネイルURLなどが含まれていてもよい。
【0058】
(タグマスタ230の記憶内容)
つぎに、
図6を用いて、情報提供装置201が有するタグマスタ230の記憶内容について説明する。タグマスタ230は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0059】
図6は、タグマスタ230の記憶内容の一例を示す説明図である。
図6において、タグマスタ230は、タグIDおよびタグ名のフィールドを有し、各フィールドに情報を設定することで、タグ情報(例えば、タグ情報600-1~600-16)をレコードとして記憶する。
【0060】
ここで、タグIDは、タグを一意に識別する識別子である。タグは、記事の本文から抽出されたキーワードに相当する。タグ名は、タグを示す文字列(キーワード)である。
【0061】
(記事タグテーブル240の記憶内容)
つぎに、
図7を用いて、情報提供装置201が有する記事タグテーブル240の記憶内容について説明する。記事タグテーブル240は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0062】
図7は、記事タグテーブル240の記憶内容の一例を示す説明図である。
図7において、記事タグテーブル240は、記事ID、タグID、タグ出現数およびスコアのフィールドを有し、各フィールドに情報を設定することで、タグ記事情報(例えば、タグ記事情報700-1~700-8)をレコードとして記憶する。
【0063】
ここで、記事IDは、記事を一意に識別する識別子である。タグIDは、タグを一意に識別する識別子である。タグ出現数は、記事IDにより識別される記事における、タグIDにより識別されるタグの出現数を示す。スコアは、タグのスコアを示す。スコアは、記事におけるタグの重要度を示す。スコアは、値が大きいほど重要度が高いことを表す。
【0064】
例えば、タグ記事情報700-1は、記事ID「25894」により識別される記事の本文における、タグID「30014」により識別されるタグ(キーワード)のタグ出現数「2」およびスコア「0.352578612」を示す。
【0065】
(情報提供装置201の機能的構成例)
図8は、情報提供装置201の機能的構成例を示すブロック図である。
図8において、情報提供装置201は、取得部801と、抽出部802と、検索部803と、受付部804と、出力部805と、を含む。取得部801~出力部805は制御部800となる機能であり、具体的には、例えば、
図3に示したメモリ302、ディスク304、可搬型記録媒体307などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、通信I/F305により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク304などの記憶装置に記憶される。
【0066】
取得部801は、複数の記事情報を取得する。ここで、記事情報は、記事を表す情報である。記事情報は、例えば、記事のタイトル、本文、ジャンル、カテゴリなどを含む。具体的には、例えば、取得部801は、
図2に示した情報配信システム203(外部サービス)から、複数の記事情報を取得する。
【0067】
より詳細に説明すると、例えば、取得部801は、記事一覧情報(不図示)を参照して、記事情報が掲載されたページ(ウェブページ)のURLを特定する。記事一覧情報は、各種ウェブサイトの各ページのURLなどをリスト化して示す情報である。記事一覧情報は、例えば、情報提供装置201の管理者によって作成・更新されて、メモリ302、ディスク304などの記憶装置に記憶される。
【0068】
そして、取得部801は、特定したURLを用いて情報配信システム203にアクセスすることにより、各ページのHTMLデータから記事情報を取得する。HTMLデータには、例えば、記事のタイトル、本文、ジャンル、カテゴリ、掲載日時などが含まれる。取得された記事情報は、例えば、
図5に示した記事マスタ220に記憶される。
【0069】
例えば、取得部801は、メディアIDおよび記事IDと対応付けて、取得した記事情報を記事マスタ220に登録する。メディアIDは、ウェブサイトを一意に識別するIDであり、例えば、HTMLデータから特定される。記事IDは、記事を一意に識別するIDであり、例えば、情報提供装置201によって生成される。
【0070】
また、記事情報には、記事の要約が含まれてもよい。記事の要約は、例えば、HTMLデータから特定されてもよく、また、情報提供装置201によって生成されてもよい。要約は、例えば、LSA(Latent Semantic Analysis)やLuhnなどの既存のアルゴリズムを用いて生成されてもよい。
【0071】
抽出部802は、取得された複数の記事情報の各記事情報からキーワードを抽出する。具体的には、例えば、所定のアルゴリズムで各記事情報の本文を形態素解析することにより、各記事情報から名詞をキーワードとして抽出する。所定のアルゴリズムは、任意に設定可能である。記事情報の本文は、例えば、記事マスタ220から特定される。
【0072】
より詳細に説明すると、例えば、抽出部802は、記事によってばらつきのある全角半角を全角または半角に統一し、本文の形態素解析を実施する。そして、抽出部802は、分割した形態素の中から、品詞が「名詞」の語をキーワードとして抽出する。抽出されたキーワード(名詞)は、例えば、記事IDと対応付けて、不図示のキーワードテーブルに登録される。
【0073】
また、抽出部802は、各記事情報から、予め設定されたストップワードを除外したキーワードを抽出してもよい。ここで、ストップワードとは、処理対象外とする単語である。単語の中には、一般的であるといった理由で処理対象外としたいものがある。このような単語は、ストップワードとして設定しておくことで、処理対象外とすることができる。
【0074】
ストップワードは、例えば、
図9に示すようなストップワードテーブル900から特定される。どのような単語をストップワードとするかは、例えば、情報提供装置201の管理者によって判断される。ここで、ストップワードテーブル900の記憶内容について説明する。
【0075】
図9は、ストップワードテーブル900の記憶内容の一例を示す説明図である。
図9において、ストップワードテーブル900は、ストップワードを記憶する。
図9の例では、ストップワードとして、「私」、「ユーザ」が記憶されている。
【0076】
具体的には、例えば、抽出部802は、ストップワードテーブル900を参照して、キーワードテーブル(不図示)からストップワードを除外したキーワードを抽出してもよい。抽出されたキーワードは、例えば、
図6に示したタグマスタ230にタグとして記憶される。
【0077】
また、抽出部802は、各記事情報から抽出したキーワードの当該各記事情報における出現数を計数する。具体的には、例えば、抽出部802は、各記事情報について、タグマスタ230を参照して、各記事情報におけるタグ(キーワード)の出現数を計数してもよい。計数されたタグ(キーワード)の出現数は、例えば、
図10に示すような記事別タグ出現数テーブル1000に記憶される。
【0078】
図10は、記事別タグ出現数テーブル1000の記憶内容の一例を示す説明図である。
図10において、記事別タグ出現数テーブル1000は、記事ID、タグIDおよびタグ出現数のフィールドを有する。各フィールドに情報を設定することで、記事別タグ出現数情報(例えば、記事別タグ出現数1000-1~1000-16)がレコードとして記憶される。
【0079】
ここで、記事IDは、記事を一意に識別する識別子である。タグIDは、タグ(キーワード)を一意に識別する識別子である。タグ出現数は、記事IDにより識別される記事(記事情報)における、タグIDにより識別されるタグ(キーワード)の出現数である。例えば、記事別タグ出現数1000-1は、記事ID「1」により識別される記事における、タグID「1」により識別されるタグの出現数「6」を示す。
【0080】
また、抽出部802は、各記事情報から抽出したキーワードごとに、各記事情報におけるキーワードの出現頻度と、複数の記事情報におけるキーワードを含む記事情報の割合とに基づいて、スコアを算出してもよい。スコアは、各記事情報におけるキーワードの重要度を表す指標値である。
【0081】
スコアとしては、例えば、tf-idf値を用いることができる。ここで、tf(term frequency)は、各記事情報におけるキーワードの出現頻度に相当する。tf値は、記事の本文中に出現する頻度が高いほど、そのキーワードは重要である可能性が高いという考え方に基づく指標値である。
【0082】
idf(inverse document frequency)は、複数の記事情報におけるキーワードを含む記事情報の割合の逆数に相当する。idf値は、多くの記事に出現するキーワードは、一つの記事の特徴語にはなりにくいという考え方に基づく指標値である。tf-idf値は、tf値とidf値とを掛け合わせた値である。tf-idf値の算出には、既存の計算式を用いることができる。
【0083】
より詳細に説明すると、例えば、抽出部802は、
図10に示した記事別タグ出現数テーブル1000を参照して、tf-idfモデルを作成する。なお、tf-idfモデルを作成するとは、例えば、tf-idf値の計算に用いられる変数(全記事数、各キーワードが出現する記事数など)を記録することである。
【0084】
そして、抽出部802は、作成したtf-idfモデルを用いて、記事情報ごとに、各記事情報から抽出した各キーワードのスコア(tf-idf値)を算出する。算出されたスコア(tf-idf値)は、例えば、
図7に示した記事タグテーブル240に記憶される。例えば、抽出部802は、記事IDと対応付けて、各タグ(キーワード)のタグID、タグ出現数およびスコアを、記事タグテーブル240に登録する。
【0085】
また、取得部801は、1または複数のユーザの所定期間Tの発話内容を記録した音声データの音声認識結果を取得する。ここで、1または複数のユーザは、オンラインコミュニケーションを行うユーザであり、例えば、ウェブ会議の参加メンバーである。所定期間Tは、任意に設定可能である。
【0086】
所定期間Tは、例えば、一定時間ごとの期間である。一定時間は、例えば、3秒~10秒程度である。具体的には、例えば、取得部801は、
図2に示したユーザ端末204から、一定時間が経過するたびに、1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得する。
【0087】
また、音声認識結果は、
図2に示した音声解析システム202から取得されてもよい。例えば、取得部801は、音声解析システム202から、一定時間が経過するたびに、1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得してもよい。
【0088】
また、情報提供装置201は、例えば、音声データをテキストデータに変換する機能を有していてもよい。この場合、取得部801は、例えば、ユーザ端末204から、一定時間が経過するたびに、1または複数のユーザの当該一定時間分の発話内容を記録した音声データを取得する。そして、取得部801は、取得した音声データを解析してテキストデータに変換することにより、音声認識結果を取得してもよい。
【0089】
また、抽出部802は、取得された音声認識結果からキーワードを抽出する。具体的には、例えば、抽出部802は、音声認識結果が取得されたことに応じて、取得された音声認識結果を所定のアルゴリズムで形態素解析することにより、音声認識結果から名詞をキーワードとして抽出する。所定のアルゴリズムは、各記事情報からキーワードを抽出する際のアルゴリズムと同じアルゴリズムである。
【0090】
また、抽出部802は、音声認識結果から、予め設定されたストップワードを除外したキーワードを抽出してもよい。具体的には、例えば、抽出部802は、ストップワードテーブル900を参照して、音声認識結果からストップワードを除外したキーワードを抽出してもよい。抽出されたキーワードは、例えば、検索用タグとして記憶される。
【0091】
検索部803は、音声認識結果から抽出されたキーワードと各記事情報から抽出されたキーワードとの一致数と、音声認識結果から抽出されたキーワードの各記事情報における出現数とに基づいて、複数の記事情報から、出力対象の記事情報を検索する。
【0092】
具体的には、例えば、検索部803は、複数の記事情報から、キーワードの一致数が閾値α以上、かつ、キーワードの出現数が閾値β以上となる記事情報を、出力対象の記事情報として検索してもよい。ここで、キーワードの一致数は、音声認識結果から抽出したキーワードと各記事情報から抽出したキーワード(タグ)との一致数である。
【0093】
また、キーワードの出現数は、音声認識結果から抽出したキーワードの各記事情報における出現数である。キーワードの出現数が閾値β以上とは、例えば、音声認識結果から抽出した少なくともいずれかのキーワードの記事情報における出現数が閾値β以上であることを意味する。
【0094】
ただし、キーワードの出現数が閾値β以上は、音声認識結果から抽出したすべてのキーワードの記事情報における出現数が閾値β以上であることを意味してもよい。キーワードの一致数および出現数は、例えば、記事タグテーブル240から特定される。閾値αおよび閾値βは、任意に設定可能である。
【0095】
また、検索部803は、各記事情報について、各記事情報から抽出されたキーワードのうち、算出されたスコアが閾値γ以上となるキーワードを特定してもよい。閾値γは、任意に競って可能である。また、各記事情報について、各記事情報から抽出されたキーワードのうち、算出されたスコアが高い上位N個のキーワードを特定してもよい。Nは、任意に設定可能であり、30程度の値に設定される。各キーワードのスコアは、例えば、tf-idf値であり、記事タグテーブル240から特定される。
【0096】
そして、検索部803は、音声認識結果から抽出されたキーワードと各記事情報について特定したキーワードとの一致数と、各記事情報について特定したキーワードのうち音声認識結果から抽出したキーワードの各記事情報における出現数とに基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。
【0097】
これにより、検索部803は、記事における重要度がある程度高いキーワード(タグ)を対象として、音声認識結果から抽出されたキーワードと比較することができる。なお、出力対象となる記事情報の検索例については、
図15~
図17を用いて後述する。
【0098】
出力部805は、1または複数のユーザに対して、検索された記事情報に関する情報を出力する。出力部805の出力形式としては、例えば、通信I/F305による他のコンピュータ(例えば、ユーザ端末204)への送信、ディスプレイ405への表示、メモリ302、ディスク304などの記憶装置への記憶、不図示のプリンタへの印刷出力などがある。
【0099】
ここで、記事情報に関する情報は、例えば、記事のタイトル、要約、URLなどである。また、記事情報に関する情報は、記事の本文であってもよい。具体的には、例えば、出力部805は、ウェブ会議画面上に、検索された記事情報に関する情報を出力してもよい。
【0100】
ウェブ会議画面は、ウェブ会議を行う際に表示される操作画面である。ウェブ会議画面は、例えば、ウェブ会議の参加メンバー(1または複数のユーザ)のユーザ端末204のディスプレイ405に表示される。なお、ウェブ会議画面の画面例については、
図18を用いて後述する。
【0101】
受付部804は、複数の分類からいずれかの分類の選択を受け付ける。分類は、記事を分けるためのジャンル(大分類)、カテゴリ(小分類)などである。ジャンルとしては、例えば、経済、技術、国内、国際、イベントなどがある。例えば、ジャンルを「経済」とすると、カテゴリとしては、経済対策、金融政策などがある。
【0102】
各記事の分類は、例えば、記事マスタ220から特定される。分類の選択は、例えば、後述する
図19に示すような分類選択画面1900において行われる。具体的には、例えば、受付部804は、ユーザ端末204から、分類選択画面1900において選択されたジャンルやカテゴリを受け付ける。
【0103】
また、出力部805は、1または複数のユーザに対して、検索された記事情報のうち、選択された分類に属する記事情報に関する情報を出力してもよい。具体的には、例えば、出力部805は、ウェブ会議画面上に、選択されたジャンル/カテゴリと対応付けて、選択されたジャンル/カテゴリに属する記事情報に関する情報を出力してもよい。
【0104】
この際、出力部805は、選択されていない他のジャンル/カテゴリに属する記事情報に関する情報については出力しない。なお、ジャンル/カテゴリは、ジャンルとカテゴリとの組合せを示す。例えば、経済/経済対策は、ジャンル「経済」のカテゴリ「経済対策」を示す。
【0105】
また、出力部805は、1または複数のユーザに対して、検索された記事情報に関する情報を、複数の分類に含まれる分類ごとに分けて出力してもよい。具体的には、例えば、出力部805は、ウェブ会議画面上に、ジャンル/カテゴリごとに、当該ジャンル/カテゴリに属する記事情報に関する情報を出力してもよい。
【0106】
(情報提供システム200の動作例)
つぎに、情報提供システム200の動作例について説明する。まず、
図11を用いて、情報提供システム200の第1の動作例について説明する。第1の動作例は、例えば、1日に1回決められた時刻(0時など)にバッチ処理として行われる。
【0107】
図11は、情報提供システム200の第1の動作例を示す説明図である。
図11において、情報提供装置201は、記事一覧情報(不図示)を参照して、情報配信システム203から、複数の記事情報を取得する。情報提供装置201は、取得した記事情報を記事マスタ220に登録する。
【0108】
つぎに、情報提供装置201は、取得した複数の記事情報の各記事情報からキーワードを抽出する。また、情報提供装置201は、各記事情報から抽出したキーワードの当該各記事情報における出現数を計数する。つぎに、情報提供装置201は、各記事情報から抽出したキーワードごとに、スコア(tf-idf値)を算出する。
【0109】
そして、情報提供装置201は、記事IDと対応付けて、各タグ(キーワード)のタグID、タグ出現数およびスコアを、記事タグテーブル240に登録する。これにより、情報提供装置201は、各種ウェブサイト上の情報をクローリングして、記事情報を収集することができる。また、情報提供装置201は、記事情報を解析して、各タグ(キーワード)の出現数やスコア(tf-idf値)を求めることができる。
【0110】
つぎに、
図12を用いて、情報提供システム200の第2の動作例について説明する。第2の動作例は、例えば、ウェブ会議を行うための準備処理として行われる。
【0111】
図12は、情報提供システム200の第2の動作例を示す説明図である。
図12において、ユーザ端末204は、会議作成リクエストを情報提供装置201に送信する。会議作成リクエストは、新たなウェブ会議を作成するための要求である。会議作成リクエストには、例えば、会議ID、パスなどが含まれる。
【0112】
情報提供装置201は、会議作成リクエストを受信すると、例えば、受信した会議作成リクエストに含まれる会議ID、パスを用いて、
図13に示すような会議管理テーブル1300に新たな会議情報を登録する。ここで、会議管理テーブル1300の記憶内容について説明する。
【0113】
図13は、会議管理テーブル1300の記憶内容の一例を示す説明図である。
図13において、会議管理テーブル1300は、会議ID、パス、検索用タグおよび検索記事IDのフィールドを有し、各フィールドに情報を設定することで、会議管理情報(例えば、会議管理情報1300-1)がレコードとして記憶される。
【0114】
ここで、会議IDは、ウェブ会議を一意に識別する識別子である。パスは、ウェブ会議にアクセスするためのパスである。検索用タグは、記事を検索するためのタグである。検索記事IDは、検索用タグを用いて検索された記事の記事IDである。検索用タグおよび検索記事IDは、初期状態では「空」である。
【0115】
ウェブ会議の会議IDおよびパスは、ウェブ会議の参加メンバーに通知される。各参加メンバーは、通知された会議IDおよびパスを指定することで、同じウェブ会議に参加することができる。例えば、ユーザ端末204を用いて、ウェブ会議に参加すると、ウェブ会議画面(例えば、
図18参照)がディスプレイ405に表示される。
【0116】
つぎに、
図14を用いて、情報提供システム200の第3の動作例について説明する。第3の動作例は、例えば、ウェブ会議中に行われる。
【0117】
図14は、情報提供システム200の第3の動作例を示す説明図である。
図14において、ユーザ端末204は、ウェブ会議の参加メンバー(1または複数のユーザ)の発話内容を記録した音声データを音声解析システム202に送信する。ユーザ端末204は、例えば、参加メンバーのうちのいずれかのユーザが使用するユーザ端末204である。
【0118】
音声解析システム202は、ユーザ端末204から音声データを受信すると、受信した音声データに対する音声解析処理を実施する。そして、音声解析システム202は、受信した音声データの音声認識結果をユーザ端末204に送信する。
【0119】
ユーザ端末204は、音声解析システム202から音声認識結果を受信すると、受信した音声認識結果を情報提供装置201に送信する。この際、ユーザ端末204は、例えば、会議IDと対応付けて、音声認識結果を情報提供装置201に送信する。これにより、情報提供装置201は、音声認識結果に対応するウェブ会議を特定することができる。
【0120】
情報提供装置201は、音声認識結果を受信すると、受信した音声認識結果からキーワードを抽出する。つぎに、情報提供装置201は、記事タグテーブル240を参照して、音声認識結果から抽出したキーワードに基づいて、出力対象の記事情報を検索する。そして、情報提供装置201は、ウェブ会議画面上に、検索した記事情報に関する情報を出力する。これにより、情報提供装置201は、ウェブ会議の参加メンバーに対して、議論を活発化させるような有用な情報を提供する。
【0121】
(記事情報の検索例)
つぎに、
図15~
図17を用いて、出力対象となる記事情報の検索例について説明する。ここでは、情報提供装置201は、複数の記事情報から、キーワードの一致数が閾値α以上、かつ、キーワードの出現数が閾値β以上となる記事情報を、出力対象の記事情報として検索する場合を想定する。
【0122】
ただし、各記事情報から抽出したキーワード(タグ)のうち、スコアが閾値γ以上となるキーワードを処理対象とする。例えば、キーワードの一致数は、音声認識結果から抽出されたキーワードと、記事情報から抽出されたスコアが閾値γ以上のキーワードとの一致数とする。また、キーワードの出現数は、記事情報から抽出されたスコアが閾値γ以上のキーワードのうち音声認識結果から抽出したキーワードについての記事情報における出現数とする。
【0123】
まず、
図15を用いて、記事情報の第1の検索例について説明する。
【0124】
図15は、記事情報の第1の検索例を示す説明図である。
図15において、検索用タグ1500は、音声認識結果から抽出されたキーワードの一例である。ここでは、検索条件パターンとして、閾値αを「α=1」とする。また、閾値βを「β=1」とする。また、閾値γを「γ=0」とする。
【0125】
まず、情報提供装置201は、タグマスタ230を参照して、検索用タグ1500と一致するタグ名のタグIDを特定する。ここでは、検索用タグ1500の「黒字」と一致するタグ名のタグID「30014」が特定される。また、検索用タグ1500の「観光」と一致するタグ名のタグID「2896」が特定される。
【0126】
つぎに、情報提供装置201は、記事タグテーブル240を参照して、特定したタグIDに対応する記事IDを特定する。この際、情報提供装置201は、記事タグテーブル240内のスコアが0以上のレコードを処理対象とする(γ=0のため)。
図15の例では、記事タグテーブル240内のすべてのレコードが処理対象となる。
【0127】
ここでは、タグID「30014」に対応する記事ID「25894」、「25893」が特定される。また、タグID「2896」に対応する記事ID「25893」が特定される。
【0128】
ここで、記事ID「25894」の記事(記事情報)は、検索用タグ1500とのキーワードの一致数が「1」である。また、記事ID「25894」の記事は、検索用タグ1500の「黒字」について、キーワードの出現数が「2」である。記事ID「25894」の記事は、キーワードの一致数が閾値α以上となり、かつ、キーワードの出現数が閾値β以上となる。このため、情報提供装置201は、記事ID「25894」の記事を、出力対象の記事情報として検索する。
【0129】
また、記事ID「25893」の記事(記事情報)は、検索用タグ1500とのキーワードの一致数が「2」である。また、記事ID「25893」の記事は、検索用タグ1500の「黒字」について、キーワードの出現数が「2」である。また、記事ID「25893」の記事は、検索用タグ1500の「観光」について、キーワードの出現数が「3」である。記事ID「25893」の記事は、キーワードの一致数が閾値α以上となり、かつ、キーワードの出現数が閾値β以上となる。このため、情報提供装置201は、記事ID「25893」の記事を、出力対象の記事情報として検索する。
【0130】
検索された記事(記事情報)の記事ID「25894」、「25893」は、例えば、会議IDと対応付けて、
図13に示した会議管理テーブル1300に記憶される。情報提供装置201は、会議管理テーブル1300を参照して、ウェブ会議画面に表示する記事(記事情報)を特定することができる。
【0131】
つぎに、
図16を用いて、記事情報の第2の検索例について説明する。
【0132】
図16は、記事情報の第2の検索例を示す説明図である。
図16において、検索用タグ1600は、音声認識結果から抽出されたキーワードの一例である。ここでは、検索条件パターンとして、閾値αを「α=2」とする。また、閾値βを「β=1」とする。また、閾値γを「γ=0.2」とする。
【0133】
まず、情報提供装置201は、タグマスタ230を参照して、検索用タグ1600と一致するタグ名のタグIDを特定する。ここでは、検索用タグ1600の「黒字」と一致するタグ名のタグID「30014」が特定される。また、検索用タグ1600の「観光」と一致するタグ名のタグID「2896」が特定される。
【0134】
つぎに、情報提供装置201は、記事タグテーブル240を参照して、特定したタグIDに対応する記事IDを特定する。この際、情報提供装置201は、記事タグテーブル240内のスコアが0.2以上のレコードを処理対象とする(γ=0.2のため)。
図16の例では、記事タグテーブル240内のすべてのレコードが処理対象となる。
【0135】
ここでは、タグID「30014」に対応する記事ID「25894」、「25893」が特定される。また、タグID「2896」に対応する記事ID「25893」が特定される。
【0136】
ここで、記事ID「25894」の記事(記事情報)は、検索用タグ1600とのキーワードの一致数が「1」である。このため、記事ID「25894」の記事(記事情報)は、キーワードの一致数が閾値α未満となり、出力対象の記事情報として検索されない。
【0137】
また、記事ID「25893」の記事(記事情報)は、検索用タグ1600とのキーワードの一致数が「2」である。また、記事ID「25893」の記事は、検索用タグ1600の「黒字」について、キーワードの出現数が「2」である。また、記事ID「25893」の記事は、検索用タグ1600の「観光」について、キーワードの出現数が「3」である。
【0138】
記事ID「25893」の記事は、キーワードの一致数が閾値α以上となり、かつ、キーワードの出現数が閾値β以上となる。このため、情報提供装置201は、記事ID「25893」の記事を、出力対象の記事情報として検索する。
【0139】
つぎに、
図17を用いて、記事情報の第3の検索例について説明する。
【0140】
図17は、記事情報の第3の検索例を示す説明図である。
図17において、検索用タグ1700は、音声認識結果から抽出されたキーワードの一例である。ここでは、検索条件パターンとして、閾値αを「α=1」とする。また、閾値βを「β=3」とする。また、閾値γを「γ=0」とする。
【0141】
まず、情報提供装置201は、タグマスタ230を参照して、検索用タグ1700と一致するタグ名のタグIDを特定する。ここでは、検索用タグ1700の「黒字」と一致するタグ名のタグID「30014」が特定される。また、検索用タグ1700の「観光」と一致するタグ名のタグID「2896」が特定される。
【0142】
つぎに、情報提供装置201は、記事タグテーブル240を参照して、特定したタグIDに対応する記事IDを特定する。この際、情報提供装置201は、記事タグテーブル240内のスコアが0以上のレコードを処理対象とする(γ=0のため)。
図17の例では、記事タグテーブル240内のすべてのレコードが処理対象となる。
【0143】
ここでは、タグID「30014」に対応する記事ID「25894」、「25893」が特定される。また、タグID「2896」に対応する記事ID「25893」が特定される。
【0144】
ここで、記事ID「25894」の記事(記事情報)は、検索用タグ1700とのキーワードの一致数が「1」である。また、記事ID「25894」の記事は、検索用タグ1500の「黒字」について、キーワードの出現数が「2」である。このため、記事ID「25894」の記事(記事情報)は、キーワードの出現数が閾値β未満となり、出力対象の記事情報として検索されない。
【0145】
また、記事ID「25893」の記事(記事情報)は、検索用タグ1700とのキーワードの一致数が「2」である。また、記事ID「25893」の記事は、検索用タグ1700の「黒字」について、キーワードの出現数が「2」である。また、記事ID「25893」の記事は、検索用タグ1700の「観光」について、キーワードの出現数が「3」である。
【0146】
記事ID「25893」の記事は、キーワードの一致数が閾値α以上となり、かつ、キーワードの出現数が閾値β以上となる。このため、情報提供装置201は、記事ID「25893」の記事を、出力対象の記事情報として検索する。
【0147】
なお、記事タグテーブル240には、各記事について、スコアが閾値γ以上となるタグ(または、スコアが高い上位N件のタグ)のみが登録されることにしてもよい。この場合、情報提供装置201は、記事タグテーブル240内のすべてのレコードを処理対象として、検索用タグと一致するタグ名のタグIDに対応する記事IDを特定してもよい。
【0148】
(ウェブ会議画面の画面例)
つぎに、
図18を用いて、ウェブ会議画面の画面例について説明する。ウェブ会議画面は、例えば、ウェブ会議の各参加メンバーが使用するユーザ端末204のディスプレイ405に表示される。
【0149】
図18は、ウェブ会議画面の画面例を示す説明図(その1)である。
図18において、ウェブ会議画面1800は、ウェブ会議を行う際に表示される操作画面の一例である。ウェブ会議画面1800において、画像m1~m5は、参加メンバーの顔画像である。ウェブ会議画面1800は、記事表示部1810を含む。
【0150】
記事表示部1810には、記事データd1~d4が表示されている。記事データd1~d4は、情報提供装置201によって検索された記事情報に関する情報の一例である。例えば、記事データd1は、記事1のタイトルt1と要約s1とを含む。
【0151】
ウェブ会議画面1800によれば、ユーザ(参加メンバー)は、情報提供装置201によって検索された各記事のタイトルと要約を確認することができる。また、ウェブ会議画面1800において、
図4に示した入力装置406を用いたユーザの操作入力により、カーソルcrを移動させて、記事データd1~d4のいずれかを選択すると、選択された記事データに対応するページを表示することができる。
【0152】
例えば、ウェブ会議画面1800において、ユーザの操作入力により、記事データd1を選択すると、記事1のURLが指定されて、記事1のページを表示することができる。これにより、ユーザ(参加メンバー)は、記事1の詳細な内容を確認することができる。
【0153】
また、ウェブ会議画面1800において、ユーザの操作入力により、所定の操作を行うと、
図19に示すような分類選択画面1900を表示することができる。
【0154】
図19は、分類選択画面1900の画面例を示す説明図である。
図19において、分類選択画面1900は、複数の分類からいずれかの分類を選択するための操作画面の一例である。分類選択画面1900において、ユーザの操作入力により、カーソルcrを移動させて、ジャンルボタンB1を選択すると、ジャンルを選択することができる。
【0155】
ここでは、ジャンルとして「ジャンル1」が選択されている。また、分類選択画面1900において、ユーザの操作入力により、カーソルcrを移動させて、カテゴリボタンB2~B5のいずれかを選択することにより、カテゴリを選択することができる。
図19に示すカテゴリa~dは、ジャンル1内のカテゴリである。
【0156】
分類選択画面1900によれば、ユーザ(参加メンバー)は、複数の分類(ジャンル/カテゴリ)の中から所望の分類を選択することができる。例えば、カテゴリボタンB2を選択すると、分類(ジャンル/カテゴリ)として「ジャンル1/カテゴリa」が選択される。
【0157】
分類(ジャンル/カテゴリ)として「ジャンル1/カテゴリa」が選択されると、
図20に示すようなウェブ会議画面2000が表示される。
【0158】
図20は、ウェブ会議画面の画面例を示す説明図(その2)である。
図20において、ウェブ会議画面2000は、ウェブ会議を行う際に表示される操作画面の一例である。ウェブ会議画面2000において、画像m1~m5は、参加メンバーの顔画像である。ウェブ会議画面2000は、記事表示部2010を含む。記事表示部2010には、ジャンル1/カテゴリaと対応付けて、ジャンル1/カテゴリaに属する記事データd1,d3が表示されている。
【0159】
ウェブ会議画面2000によれば、ユーザ(参加メンバー)は、所望の分類(ジャンル1/カテゴリa)に属する各記事のタイトルと要約を確認することができる。また、ウェブ会議画面2000において、カーソルcrを移動させて、記事データd1,d3のいずれかを選択すると、選択された記事データに対応するページを表示することができる。
【0160】
(情報提供装置201の各種処理手順)
つぎに、情報提供装置201の各種処理手順について説明する。まず、
図21を用いて、情報提供装置201の記事収集処理手順について説明する。情報提供装置201の記事収集処理は、例えば、所定のタイミングまたは定期的(毎日0時など)に実行される。
【0161】
図21は、情報提供装置201の記事収集処理手順の一例を示すフローチャートである。
図21のフローチャートにおいて、まず、情報提供装置201は、記事一覧情報(不図示)を参照して、記事が掲載されたページのうち選択されていない未選択のページを選択する(ステップS2101)。
【0162】
つぎに、情報提供装置201は、選択したページのURLを用いて情報配信システム203にアクセスすることにより、ページのHTMLデータから記事情報を取得する(ステップS2102)。そして、情報提供装置201は、取得した記事情報を記事マスタ220に登録する(ステップS2103)。
【0163】
つぎに、情報提供装置201は、記事一覧情報を参照して、記事が掲載されたページのうち選択されていない未選択のページがあるか否かを判断する(ステップS2104)。ここで、未選択のページがある場合(ステップS2104:Yes)、情報提供装置201は、ステップS2101に戻る。
【0164】
一方、未選択のページがない場合(ステップS2104:No)、情報提供装置201は、本フローチャートによる一連の処理を終了する。これにより、情報提供装置201は、各種ウェブサイト上の情報をクローリングして、記事情報を収集することができる。
【0165】
つぎに、
図22を用いて、情報提供装置201の記事解析処理手順について説明する。情報提供装置201の記事解析処理は、例えば、情報提供装置201の記事収集処理の実行後に、続けて実行される。
【0166】
図22は、情報提供装置201の記事解析処理手順の一例を示すフローチャートである。
図22のフローチャートにおいて、まず、情報提供装置201は、記事マスタ220を参照して、複数の記事情報のうち選択されていない未選択の記事情報を選択する(ステップS2201)。
【0167】
つぎに、情報提供装置201は、選択した記事情報の本文を形態素解析することにより、記事情報から名詞をキーワードとして抽出する(ステップS2202)。そして、情報提供装置201は、ストップワードテーブル900を参照して、抽出したキーワードからストップワードを除外する(ステップS2203)。
【0168】
つぎに、情報提供装置201は、抽出したキーワードのうちストップワードを除外したキーワードをタグマスタ230にタグとして登録する(ステップS2204)。そして、情報提供装置201は、タグマスタ230を参照して、選択した記事情報における各タグ(キーワード)の出現数を計数する(ステップS2205)。
【0169】
つぎに、情報提供装置201は、計数した各タグの出現数を、記事IDおよびタグIDと対応付けて、記事別タグ出現数テーブル1000に登録する(ステップS2206)。そして、情報提供装置201は、記事別タグ出現数テーブル1000を参照して、選択した記事情報におけるタグ(キーワード)の出現頻度と、複数の記事情報におけるタグを含む記事情報の割合とに基づいて、各タグのスコアを算出する(ステップS2207)。
【0170】
つぎに、情報提供装置201は、選択した記事情報の記事IDと対応付けて、各タグのタグID、出現数(タグ出現数)およびスコアを記事タグテーブル240に登録する(ステップS2208)。そして、情報提供装置201は、記事マスタ220を参照して、複数の記事情報のうち選択されていない未選択の記事情報があるか否かを判断する(ステップS2209)。
【0171】
ここで、未選択の記事情報がある場合(ステップS2209:Yes)、情報提供装置201は、ステップS2201に戻る。一方、未選択の記事情報がない場合(ステップS2209:No)、情報提供装置201は、本フローチャートによる一連の処理を終了する。
【0172】
これにより、情報提供装置201は、各記事情報を解析して、各タグ(キーワード)の出現数やスコア(例えば、tf-idf値)を求めることができる。
【0173】
つぎに、
図23を用いて、情報提供装置201の記事検索処理手順について説明する。情報提供装置201の記事検索処理は、例えば、一定時間ごとに実行される。一定時間は、例えば、3秒~10秒程度である。
【0174】
図23は、情報提供装置201の記事検索処理手順の一例を示すフローチャートである。
図23のフローチャートにおいて、まず、情報提供装置201は、ユーザ端末204から、1または複数のユーザの直近一定時間分の発話内容を記録した音声データの音声認識結果を取得する(ステップS2301)。
【0175】
つぎに、情報提供装置201は、取得した音声認識結果を形態素解析することにより、音声認識結果から名詞をキーワードとして抽出する(ステップS2302)。音声認識結果を形態素解析は、例えば、
図22に示したステップS2202の記事情報の本文に対する形態素解析と同一のアルゴリズムで実施される。
【0176】
そして、情報提供装置201は、ストップワードテーブル900を参照して、抽出したキーワードからストップワードを除外する(ステップS2303)。つぎに、情報提供装置201は、抽出したキーワードのうちストップワードを除外したキーワードを検索用タグとして会議管理テーブル1300に登録する(ステップS2304)。
【0177】
そして、情報提供装置201は、タグマスタ230を参照して、検索用タグと一致するタグ名のタグIDを特定する(ステップS2305)。つぎに、情報提供装置201は、記事タグテーブル240を参照して、特定したタグIDに対応する記事のうち検索条件を満たす記事(記事情報)を検索する(ステップS2306)。
【0178】
検索条件は、例えば、キーワードの一致数が閾値α以上、かつ、キーワードの出現数が閾値β以上という条件である。この際、情報提供装置201は、各記事情報から抽出したキーワード(タグ)のうち、スコアが閾値γ以上となるキーワードを処理対象としてもよい。
【0179】
つぎに、情報提供装置201は、検索した記事の記事IDを検索記事IDとして会議管理テーブル1300に登録する(ステップS2307)。そして、情報提供装置201は、会議管理テーブル1300を参照して、ウェブ会議画面上に、検索した記事に関する情報を出力して(ステップS2308)、本フローチャートによる一連の処理を終了する。
【0180】
これにより、情報提供装置201は、ウェブ会議の参加メンバーに対して、会議中の発話内容に応じて、議論を活発化させるような有用な情報を提供することができる。
【0181】
以上説明したように、実施の形態にかかる情報提供装置201によれば、複数の記事情報の各記事情報からキーワードを抽出し、1または複数のユーザの所定期間Tの発話内容を記録した音声データの音声認識結果からキーワードを抽出することができる。そして、情報提供装置201によれば、音声認識結果から抽出したキーワードと各記事情報から抽出したキーワードとの一致数と、音声認識結果から抽出したキーワードの各記事情報における出現数とに基づいて、複数の記事情報から、出力対象の記事情報を検索し、1または複数のユーザに対して、検索した記事情報に関する情報を出力することができる。1または複数のユーザは、例えば、オンラインコミュニケーションを行うユーザである。
【0182】
これにより、情報提供装置201は、オンラインコミュニケーションを行うユーザに対して、ユーザの発話内容に沿った有用な記事の情報を提供することができる。
【0183】
また、情報提供装置201によれば、複数の記事情報から、キーワードの一致数が閾値α以上、かつ、キーワードの出現数が閾値β以上となる記事情報を、出力対象の記事情報として検索することができる。
【0184】
これにより、情報提供装置201は、会話の中で出現したキーワードをより多く含む記事や、会話の中で出現したキーワードの出現数が多い記事を検索することができる。
【0185】
また、情報提供装置201によれば、各記事情報から、予め設定されたストップワードを除外したキーワードを抽出し、音声認識結果からストップワードを除外したキーワードを抽出することができる。
【0186】
これにより、情報提供装置201は、一般的であるなどの理由で有用な情報の検索に寄与しないようなワードを排除して、情報検索の精度を向上させることができる。
【0187】
また、情報提供装置201によれば、所定のアルゴリズムで各記事情報の本文を形態素解析することにより、各記事情報から名詞をキーワードとして抽出し、当該アルゴリズムで音声認識結果を形態素解析することにより、音声認識結果から名詞をキーワードとして抽出することができる。
【0188】
これにより、情報提供装置201は、記事と音声認識結果に対して同じアルゴリズム(ロジック)でキーワードを抽出することで、記事と音声認識結果とのマッチング率を向上させることができる。
【0189】
また、情報提供装置201によれば、各記事情報から抽出したキーワードごとに、各記事情報におけるキーワードの出現頻度と、複数の記事情報におけるキーワードを含む記事情報の割合とに基づいて、各記事情報におけるキーワードの重要度を表すスコアを算出することができる。また、情報提供装置201によれば、各記事情報について、各記事情報から抽出したキーワードのうち、算出したスコアが閾値γ以上となるキーワード、または、スコアが高い上位N個のキーワードを特定することができる。そして、情報提供装置201によれば、音声認識結果から抽出したキーワードと各記事情報について特定したキーワードとの一致数と、各記事情報について特定したキーワードのうち音声認識結果から抽出したキーワードの各記事情報における出現数とに基づいて、複数の記事情報から、出力対象の記事情報を検索することができる。
【0190】
これにより、情報提供装置201は、記事における重要度がある程度高いキーワードを対象として、音声認識結果から抽出したキーワードと比較して記事を検索することができ、ユーザにとって有用となる情報の検索精度を高めることができる。
【0191】
また、情報提供装置201によれば、ネットワーク210を介して接続される情報配信システム203から、複数の記事情報を取得することができる。
【0192】
これにより、情報提供装置201は、各種ウェブサイト上の情報をクローリングして、記事情報を収集することができる。
【0193】
また、情報提供装置201によれば、複数の分類からいずれかの分類の選択を受け付け、1または複数のユーザに対して、検索した記事情報のうち、選択された分類に属する記事情報に関する情報を出力することができる。
【0194】
これにより、情報提供装置201は、ユーザが所望するジャンルやカテゴリの記事のみを提供することができる。また、情報提供装置201は、特定の分類の記事に絞り込むことで、情報過多となるのを防いでユーザの利便性を向上させることができる。
【0195】
また、情報提供装置201によれば、一定時間が経過するたびに、1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得し、音声認識結果を取得したことに応じて、当該音声認識結果からキーワードを抽出することができる。一定時間は、例えば、3秒~10秒程度である。
【0196】
これにより、情報提供装置201は、ウェブ会議などにおけるユーザ(参加メンバー)の直近数秒程度の発言内容に応じた記事を検索することができ、ユーザに対してタイムリーな情報提供を行うことができる。
【0197】
また、情報提供装置201によれば、各記事情報から抽出したキーワードの当該各記事情報における出現数を計数し、計数した各記事情報におけるキーワードの出現数を参照して、音声認識結果から抽出したキーワードの各記事情報における出現数を特定することができる。
【0198】
これにより、情報提供装置201は、各記事におけるキーワードの出現数を事前にカウント(計数)しておくことで、音声認識結果から抽出したキーワードの各記事における出現数の特定にかかる時間を短縮することができる。
【0199】
これらのことから、実施の形態にかかる情報提供システム200および情報提供装置201によれば、オンラインコミュニケーションにおける議論を活性化させるような有用な情報を提供することができる。例えば、情報提供装置201は、ウェブ会議において、参加メンバーの発言内容に応じて、議論の前提となる情報、議論を広げられる情報、議論の打開策となる情報などを提供することができる。これにより、情報提供装置201は、タイミリーなインプットを参加メンバーに行うことが可能となり、ウェブ会議をより本質的で生産性のある価値創出の場とすることができる。
【0200】
なお、上述した説明では、音声によるコミュニケーションを行う場合について説明したが、これに限らない。例えば、本情報提供方法は、テキストによるコミュニケーションに適用されてもよい。この場合、情報提供装置201は、例えば、1または複数のユーザの音声認識結果の代わりに、1または複数のユーザによって入力された発話内容を表すテキストデータを取得し、テキストデータに対して音声認識結果と同様の処理を行う。
【0201】
なお、本実施の形態で説明した情報提供方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本情報提供プログラムは、ハードディスク、フレキシブルディスク、CD-ROM、DVD、USBメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本情報提供プログラムは、インターネット等のネットワークを介して配布してもよい。
【0202】
また、本実施の形態で説明した情報処理装置101(情報提供装置201)は、スタンダードセルやストラクチャードASIC(Application Specific Integrated Circuit)などの特定用途向けICやFPGAなどのPLD(Programmable Logic Device)によっても実現することができる。
【0203】
上述した実施の形態に関し、さらに以下の付記を開示する。
【0204】
(付記1)複数の記事情報の各記事情報からキーワードを抽出し、
1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出し、
前記音声認識結果から抽出したキーワードと前記各記事情報から抽出したキーワードとの一致数と、前記音声認識結果から抽出したキーワードの前記各記事情報における出現数とに基づいて、前記複数の記事情報から、出力対象の記事情報を検索し、
前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、
処理をコンピュータに実行させることを特徴とする情報提供プログラム。
【0205】
(付記2)前記検索する処理は、
前記複数の記事情報から、前記一致数が第1の閾値以上、かつ、前記出現数が第2の閾値以上となる記事情報を、前記出力対象の記事情報として検索する、ことを特徴とする付記1に記載の情報提供プログラム。
【0206】
(付記3)前記各記事情報からキーワードを抽出する処理は、
前記各記事情報から、予め設定されたストップワードを除外したキーワードを抽出し、
前記音声認識結果からキーワードを抽出する処理は、
前記音声認識結果から前記ストップワードを除外したキーワードを抽出する、
ことを特徴とする付記1または2に記載の情報提供プログラム。
【0207】
(付記4)前記各記事情報からキーワードを抽出する処理は、
所定のアルゴリズムで前記各記事情報の本文を形態素解析することにより、前記各記事情報から名詞をキーワードとして抽出し、
前記音声認識結果からキーワードを抽出する処理は、
前記所定のアルゴリズムで前記音声認識結果を形態素解析することにより、前記音声認識結果から名詞をキーワードとして抽出する、
ことを特徴とする付記1~3のいずれか一つに記載の情報提供プログラム。
【0208】
(付記5)前記各記事情報から抽出したキーワードごとに、前記各記事情報における前記キーワードの出現頻度と、前記複数の記事情報における前記キーワードを含む記事情報の割合とに基づいて、前記各記事情報における前記キーワードの重要度を表すスコアを算出する、処理を前記コンピュータに実行させ、
前記検索する処理は、
前記各記事情報について、前記各記事情報から抽出したキーワードのうち、算出した前記スコアが第3の閾値以上となるキーワード、または、前記スコアが高い上位所定数のキーワードを特定し、
前記音声認識結果から抽出したキーワードと前記各記事情報について特定したキーワードとの一致数と、前記各記事情報について特定したキーワードのうち前記音声認識結果から抽出したキーワードの前記各記事情報における出現数とに基づいて、前記複数の記事情報から、前記出力対象の記事情報を検索する、ことを特徴とする付記1~4のいずれか一つに記載の情報提供プログラム。
【0209】
(付記6)ネットワークを介して接続される情報配信システムから、複数の記事情報を取得する、
処理を前記コンピュータに実行させ、
前記各記事情報からキーワードを抽出する処理は、
取得した前記複数の記事情報の各記事情報からキーワードを抽出する、ことを特徴とする付記1~5のいずれか一つに記載の情報提供プログラム。
【0210】
(付記7)前記1または複数のユーザは、オンラインコミュニケーションを行うユーザである、ことを特徴とする付記1~6のいずれか一つに記載の情報提供プログラム。
【0211】
(付記8)複数の分類からいずれかの分類の選択を受け付ける、
処理を前記コンピュータに実行させ、
前記出力する処理は、
前記1または複数のユーザに対して、検索した前記記事情報のうち、選択された前記分類に属する記事情報に関する情報を出力する、ことを特徴とする付記1~7のいずれか一つに記載の情報提供プログラム。
【0212】
(付記9)前記所定期間は、一定時間ごとの期間であり、
前記一定時間が経過するたびに、前記1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得する、
処理を前記コンピュータに実行させ、
前記音声認識結果からキーワードを抽出する処理は、
前記音声認識結果を取得しことに応じて、当該音声認識結果からキーワードを抽出する、ことを特徴とする付記1~8のいずれか一つに記載の情報提供プログラム。
【0213】
(付記10)前記各記事情報から抽出したキーワードの当該各記事情報における出現数を計数する、処理を前記コンピュータに実行させ、
前記検索する処理は、
計数した前記各記事情報におけるキーワードの出現数を参照して、前記音声認識結果から抽出したキーワードの前記各記事情報における出現数を特定する、
ことを特徴とする付記1~9のいずれか一つに記載の情報提供プログラム。
【0214】
(付記11)複数の記事情報の各記事情報からキーワードを抽出し、
1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出し、
前記音声認識結果から抽出したキーワードと前記各記事情報から抽出したキーワードとの一致数と、前記音声認識結果から抽出したキーワードの前記各記事情報における出現数とに基づいて、前記複数の記事情報から、出力対象の記事情報を検索し、
前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、
処理をコンピュータが実行することを特徴とする情報提供方法。
【0215】
(付記12)1または複数のユーザが使用する端末と、
複数の記事情報の各記事情報からキーワードを抽出し、前記1または複数のユーザの所定期間の発話内容を記録した音声データの音声認識結果からキーワードを抽出し、前記音声認識結果から抽出したキーワードと前記各記事情報から抽出したキーワードとの一致数と、前記音声認識結果から抽出したキーワードの前記各記事情報における出現数とに基づいて、前記複数の記事情報から、出力対象の記事情報を検索し、検索した前記記事情報に関する情報を前記端末に出力する情報提供装置と、
を含むことを特徴とする情報提供システム。
【符号の説明】
【0216】
11,12,13 記事
101 情報処理装置
110 音声認識結果
200 情報提供システム
201 情報提供装置
202 音声解析システム
203 情報配信システム
204 ユーザ端末
210 ネットワーク
220 記事マスタ
230 タグマスタ
240 記事タグテーブル
300,400 バス
301,401 CPU
302,402 メモリ
303 ディスクドライブ
304 ディスク
305,403 通信I/F
306 可搬型記録媒体I/F
307 可搬型記録媒体
404 カメラ
405 ディスプレイ
406 入力装置
407 スピーカ
408 マイクロフォン
800 制御部
801 取得部
802 抽出部
803 検索部
804 受付部
805 出力部
900 ストップワードテーブル
1000 記事別タグ出現数テーブル
1300 会議管理テーブル
1500,1600,1700 検索用タグ
1800,2000 ウェブ会議画面
1810,2010 記事表示部
1900 分類選択画面