IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-25935情報提供プログラム、情報提供方法、および情報提供システム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024025935
(43)【公開日】2024-02-28
(54)【発明の名称】情報提供プログラム、情報提供方法、および情報提供システム
(51)【国際特許分類】
   G06F 16/33 20190101AFI20240220BHJP
   G06F 16/63 20190101ALI20240220BHJP
   G06F 16/383 20190101ALI20240220BHJP
【FI】
G06F16/33
G06F16/63
G06F16/383
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022129320
(22)【出願日】2022-08-15
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100104190
【弁理士】
【氏名又は名称】酒井 昭徳
(72)【発明者】
【氏名】田島 圭
(72)【発明者】
【氏名】小木曽 貴大
(72)【発明者】
【氏名】林 未実子
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175GA04
(57)【要約】
【課題】ユーザの意に沿った情報を検索しやすくすること。
【解決手段】情報処理装置は、ウェブ会議の参加メンバーの発話内容を記録した音声データの音声認識結果を取得するたびに、音声認識結果から抽出したキーワード(例えば、キーワード1721~1723)に基づいて、複数の記事情報から、出力対象の記事情報を検索する。例えば、情報処理装置は、記事データd1~d3を出力する際に、音声認識結果から抽出したキーワード1721~1723を、当該キーワード1721~1723ごとに固定、修正および削除のいずれかの状態を指定可能に出力する。情報処理装置は、出力対象の記事情報を検索する次回以降の検索処理の際に、固定と指定されたキーワードを含めた検索を行い、修正された修正後のキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う。
【選択図】図18
【特許請求の範囲】
【請求項1】
1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した前記音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索し、前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、処理をコンピュータに実行させ、
検索した前記記事情報に関する情報を出力する際に、前記音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力し、
次回以降の前記出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う、
ことを特徴とする情報提供プログラム。
【請求項2】
前記次回以降の前記出力対象の記事情報を検索する処理の際に、前記複数の記事情報から、前記固定と指定されたキーワードを含み、かつ、前記削除と指定されたキーワードを含まない記事情報を検索する、ことを特徴とする請求項1に記載の情報提供プログラム。
【請求項3】
検索した前記記事情報に関する情報を出力する際に、さらに、前記音声認識結果から抽出したキーワードを当該キーワードごとに修正可能に出力し、
前記次回以降の前記出力対象の記事情報を検索する処理の際に、さらに、修正された修正後のキーワードを含めた検索を行う、ことを特徴とする請求項1に記載の情報提供プログラム。
【請求項4】
前記次回以降の前記出力対象の記事情報を検索する処理の際に、前記複数の記事情報から、前記固定と指定されたキーワードおよび前記修正後のキーワードの少なくともいずれかを含み、かつ、前記削除と指定されたキーワードを含まない記事情報を検索する、ことを特徴とする請求項3に記載の情報提供プログラム。
【請求項5】
一定時間が経過するたびに、前記1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得する、
処理を前記コンピュータに実行させることを特徴とする請求項3に記載の情報提供プログラム。
【請求項6】
前記抽出する処理は、
前記音声認識結果から当該音声認識結果における出現数が多い上位所定数のキーワードを抽出する、ことを特徴とする請求項1~5のいずれか一つに記載の情報提供プログラム。
【請求項7】
1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した前記音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索し、前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、処理をコンピュータが実行し、
検索した前記記事情報に関する情報を出力する際に、前記音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力し、
次回以降の前記出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う、
ことを特徴とする情報提供方法。
【請求項8】
1または複数のユーザが使用する端末と、
前記1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した前記音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索し、検索した前記記事情報に関する情報を前記端末に出力する情報提供装置と、を含み、
前記情報提供装置は、
検索した前記記事情報に関する情報を出力する際に、前記音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力し、
次回以降の前記出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う、
ことを特徴とする情報提供システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報提供プログラム、情報提供方法、および情報提供システムに関する。
【背景技術】
【0002】
近年、リモートワークの普及にともなって、ウェブ会議を利用する機会が増えている。ウェブ会議は、異なる場所にいるユーザ同士が、インターネットなどを通じてデータを共有したり、会話したりできるシステムである。また、音声データからキーワードを抽出し、キーワードに関連する情報を検索して提示する機能を有するシステムがある。
【0003】
先行技術としては、音声データを音声認識してテキストデータを生成し、テキストデータからキーワードを抽出し、キーワードに対する一般サービス情報があれば表示画面に表示させ、それが地域情報にリンクされていると、地域識別とキーワードにより、地域サービス情報を表示するものがある。また、会話からキーワードが抽出されていない状況でも、一度検索された検索結果の中から未表示の文書タイトルを表示させる技術がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2002-165193号公報
【特許文献2】特開2007-304776号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術では、ユーザの意に沿った情報(検索結果)を提供することができない場合がある。
【0006】
一つの側面では、本発明は、ユーザの意に沿った情報を検索しやすくすることを目的とする。
【課題を解決するための手段】
【0007】
1つの実施態様では、1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した前記音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索し、前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、処理をコンピュータに実行させ、検索した前記記事情報に関する情報を出力する際に、前記音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力し、次回以降の前記出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う、情報提供プログラムが提供される。
【発明の効果】
【0008】
本発明の一側面によればユーザの意に沿った情報を検索しやすくすることができるという効果を奏する。
【図面の簡単な説明】
【0009】
図1図1は、実施の形態にかかる情報提供方法の一実施例を示す説明図である。
図2図2は、情報提供システム200のシステム構成例を示す説明図である。
図3図3は、情報提供装置201のハードウェア構成例を示すブロック図である。
図4図4は、ユーザ端末204のハードウェア構成例を示すブロック図である。
図5図5は、記事マスタ220の記憶内容の一例を示す説明図である。
図6図6は、タグマスタ230の記憶内容の一例を示す説明図である。
図7図7は、記事タグテーブル240の記憶内容の一例を示す説明図である。
図8図8は、情報提供装置201の機能的構成例を示すブロック図である。
図9図9は、記事別タグ出現数テーブル900の記憶内容の一例を示す説明図である。
図10図10は、キーワード出現数テーブル1000の記憶内容の一例を示す説明図である。
図11図11は、条件マスタ1100の記憶内容の一例を示す説明図である。
図12図12は、情報提供システム200の第1の動作例を示す説明図である。
図13図13は、情報提供システム200の第2の動作例を示す説明図である。
図14図14は、会議管理テーブル1400の記憶内容の一例を示す説明図である。
図15図15は、情報提供システム200の第3の動作例を示す説明図である。
図16図16は、記事情報の検索例を示す説明図である。
図17図17は、ウェブ会議画面の第1の画面例を示す説明図(その1)である。
図18図18は、ウェブ会議画面の第1の画面例を示す説明図(その2)である。
図19図19は、ウェブ会議画面の第1の画面例を示す説明図(その3)である。
図20図20は、キーワード出現数テーブル1000の記憶内容の変遷例を示す説明図である。
図21図21は、条件マスタ1100の記憶内容の変遷例を示す説明図である。
図22図22は、ウェブ会議画面の第2の画面例を示す説明図である。
図23図23は、情報提供装置201の記事収集処理手順の一例を示すフローチャートである。
図24図24は、情報提供装置201の記事解析処理手順の一例を示すフローチャートである。
図25図25は、情報提供装置201の情報提供処理手順の一例を示すフローチャート(その1)である。
図26図26は、情報提供装置201の情報提供処理手順の一例を示すフローチャート(その2)である。
図27図27は、情報提供装置201の情報提供処理手順の一例を示すフローチャート(その3)である。
【発明を実施するための形態】
【0010】
以下に図面を参照して、本発明にかかる情報提供プログラム、情報提供方法、および情報提供システムの実施の形態を詳細に説明する。
【0011】
(実施の形態)
図1は、実施の形態にかかる情報提供方法の一実施例を示す説明図である。図1において、情報処理装置101は、1または複数のユーザに対して、記事情報に関する情報を出力するコンピュータである。1または複数のユーザは、例えば、オンラインコミュニケーションを行うユーザである。
【0012】
オンラインコミュニケーションとは、インターネットなどのネットワークを介して相互に対話するコミュニケーションである。ただし、1または複数のユーザは、対面で会話するオフラインコミュニケーションを行うユーザであってもよい。記事情報は、事物を文章で表す情報である。記事情報は、例えば、ウェブサイトで公開される記事である。
【0013】
ここで、ウェブ会議などにおいて、ユーザにとって有用な情報を提供することは、議論を活性化させる上で重要である。例えば、ユーザに予備知識がないと、他のユーザが発言した単語の意味がわからず、会議中に議論から脱落してしまう場合がある。また、議論が煮詰まってしまうと、誰も発言しなくなり、無為に時間が過ぎてしまうことがある。また、新規事業のためのアイデア出しなどを行う際に、似たようなアイデアしか出てこない場合がある。
【0014】
このため、会議中の音声認識結果からキーワードを抽出し、AI(Artificial Intelligence)などの技術を利用して、ユーザに対して、キーワードに関連する情報を検索して提示することが考えられる。キーワード(KW:keyword)は、例えば、1以上の単語からなる語句である。
【0015】
この際、ユーザの意に沿わない記事が検索結果に含まれるなどの理由で、その根拠となった「検索に使われたキーワード」をユーザが知りたい場合がある。また、一定の時間間隔で検索結果が更新されるような場合に、キーワードによっては、次回以降の検索に引き続き使用したいとユーザが思うものもあれば、次回以降の検索には使われたくないと思うものもある。
【0016】
そこで、本実施の形態では、記事情報の検索に用いられたキーワードについて、固定および削除のいずれかの状態を指定可能に出力することで、検索結果の根拠となったキーワードを把握可能にしつつ、ユーザの意に沿った情報を検索しやすくする情報提供方法について説明する。ここで、情報処理装置101の処理例(下記(1)~(3)の処理に対応)について説明する。
【0017】
(1)情報処理装置101は、1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索する。ここで、音声認識結果は、音声データをテキストデータに変換したものである。
【0018】
音声認識には、例えば、AIなどを利用した既存の音声認識技術を用いることができる。音声認識結果は、例えば、一定時間が経過するたびに取得される。一定時間は、例えば、数秒~数分程度の時間である。出力対象の記事情報は、情報提供の対象となる記事情報である。複数の記事情報は、例えば、インターネットなどを介して情報処理装置101と接続された情報配信システム(例えば、後述の図2に示す情報配信システム203)から取得される。
【0019】
具体的には、例えば、情報処理装置101は、音声認識結果(テキストデータ)を形態素解析することにより、音声認識結果から名詞をキーワードとして抽出する。そして、情報処理装置101は、複数の記事情報から、抽出したキーワードを含む記事情報を、出力対象の記事情報として検索する。
【0020】
図1の例では、音声認識結果から抽出されたキーワードを「キーワードKW1,KW2」とし、キーワードKW1,KW2に基づいて、複数の記事情報から検索結果110(出力対象の記事情報)が検索された場合を想定する。
【0021】
(2)情報処理装置101は、1または複数のユーザに対して、検索した記事情報に関する情報を出力する際に、音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力する。ここで、記事情報に関する情報は、例えば、記事のタイトル、要約、URL(Uniform Resource Locator)などである。また、記事情報に関する情報は、記事の本文であってもよい。
【0022】
固定の状態は、例えば、次回以降の検索に引き続き使用したいキーワードが指定される。また、削除の状態は、例えば、次回以降の検索に使われたくないキーワードが指定される。固定および削除の指定は、例えば、出力されたキーワードの中から指定対象のキーワードを選択することによって行われる。
【0023】
図1の例では、検索結果110とともに、キーワードKW1,KW2が当該キーワードKW1,KW2ごとに固定および削除のいずれかの状態を指定可能に出力される。
【0024】
(3)情報処理装置101は、次回以降の出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う。固定と指定されたキーワードを含めた検索は、例えば、固定と指定されたキーワードを用いたAND検索やOR検索である。また、削除と指定されたキーワードを除外した検索は、例えば、削除と指定されたキーワードを用いたNOT検索である。
【0025】
図1の例では、キーワードKW1について固定が指定され、キーワードKW2について削除が指定された場合を想定する。この場合、情報処理装置101は、次回以降の検索処理の際に、固定と指定されたキーワードKW1を含めた検索であって、削除と指定されたキーワードKW2を除外した検索を行う。
【0026】
ここでは、次回の検索処理において、キーワードKW1,KW3,KW4に基づいて、複数の記事情報から検索結果120(出力対象の記事情報)が検索された場合を想定する。キーワードKW1は、固定と指定されたキーワードである。キーワードKW3,KW4は、直前に取得された音声認識結果(最新の音声認識結果)から抽出されたキーワードである。
【0027】
このように、情報処理装置101によれば、記事情報の検索に用いられたキーワードについて、固定および削除のいずれかの状態を指定可能に出力することで、検索結果の根拠となったキーワードを把握可能にしつつ、ユーザの意に沿った情報を検索しやすくすることができる。
【0028】
図1の例では、ユーザが、引き続き検索に使用したいキーワードKW1を固定と指定することで、次回以降の検索時に、キーワードKW1を含めた検索を行うことができ、検索結果120を自分の意に沿ったものに近づけることができる。また、ユーザは、次回以降の検索には使われたくないキーワードKW2を削除と指定することで、次回以降の検索時に、キーワードKW2を除外した検索を行うことができ、検索結果120を自分の意に沿ったものに近づけることができる。
【0029】
(情報提供システム200のシステム構成例)
つぎに、図1に示した情報処理装置101を含む情報提供システム200のシステム構成例について説明する。ここでは、図1に示した情報処理装置101を、情報提供システム200内の情報提供装置201に適用した場合を例に挙げて説明する。情報提供システム200は、例えば、ウェブ会議を支援するサービスに適用される。
【0030】
図2は、情報提供システム200のシステム構成例を示す説明図である。図2において、情報提供システム200は、情報提供装置201と、音声解析システム202と、情報配信システム203と、複数のユーザ端末204と、を含む。情報提供システム200において、情報提供装置201、音声解析システム202、情報配信システム203およびユーザ端末204は、有線または無線のネットワーク210を介して接続される。ネットワーク210は、例えば、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)などである。
【0031】
ここで、情報提供装置201は、記事マスタ220、タグマスタ230、記事タグテーブル240を有し、オンラインコミュニケーションを支援するコンピュータである。情報提供装置201は、例えば、アプリケーションサーバ、データベースサーバなどにより実現される。
【0032】
なお、記事マスタ220、タグマスタ230および記事タグテーブル240の記憶内容については、図5図7を用いて後述する。
【0033】
音声解析システム202は、音声データをテキストデータに変換するコンピュータである。音声解析システム202は、例えば、Web API(Application Programming Interface)により音声解析機能を提供する外部サービスである。
【0034】
情報配信システム203は、各種の記事情報を配信するコンピュータである。情報配信システム203は、例えば、新聞社、通信社、テレビ局などが運営するニュースサイトであってもよい。音声解析システム202および情報配信システム203は、例えば、1または複数のサーバによりそれぞれ実現される。
【0035】
ユーザ端末204は、ユーザが使用するコンピュータである。ユーザ端末204は、オンラインコミュニケーションを行う1または複数のユーザの発話内容を音声データとして記録する機能を有する。オンラインコミュニケーションは、例えば、ウェブ会議である。ユーザは、例えば、ウェブ会議の参加メンバーである。
【0036】
また、ユーザ端末204は、例えば、Web APIを利用して、音声解析システム202にアクセスすることにより、1または複数のユーザの発話内容を記録した音声データから音声認識結果を取得することができる。ユーザ端末204は、例えば、PC(Personal Computer)、タブレットPC、スマートフォンなどである。
【0037】
なお、ここでは情報提供装置201とユーザ端末204とを別体に設けることにしたが、これに限らない。例えば、情報提供装置201は、ユーザ端末204により実現されることにしてもよい。また、音声解析システム202の機能は、情報提供装置201やユーザ端末204により実現されてもよい。
【0038】
(情報提供装置201のハードウェア構成例)
つぎに、情報提供装置201のハードウェア構成例について説明する。
【0039】
図3は、情報提供装置201のハードウェア構成例を示すブロック図である。図3において、情報提供装置201は、CPU(Central Processing Unit)301と、メモリ302と、ディスクドライブ303と、ディスク304と、通信I/F(Interface)305と、可搬型記録媒体I/F306と、可搬型記録媒体307と、を有する。また、各構成部は、バス300によってそれぞれ接続される。
【0040】
ここで、CPU301は、情報提供装置201の全体の制御を司る。CPU301は、複数のコアを有していてもよい。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMがOSのプログラムを記憶し、ROMがアプリケーションプログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
【0041】
ディスクドライブ303は、CPU301の制御に従ってディスク304に対するデータのリード/ライトを制御する。ディスク304は、ディスクドライブ303の制御で書き込まれたデータを記憶する。ディスク304としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
【0042】
通信I/F305は、通信回線を通じてネットワーク210(図2参照)に接続され、ネットワーク210を介して外部のコンピュータ(例えば、図2に示した音声解析システム202、情報配信システム203、ユーザ端末204)に接続される。そして、通信I/F305は、ネットワーク210と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。通信I/F305には、例えば、モデムやLANアダプタなどを採用することができる。
【0043】
可搬型記録媒体I/F306は、CPU301の制御に従って可搬型記録媒体307に対するデータのリード/ライトを制御する。可搬型記録媒体307は、可搬型記録媒体I/F306の制御で書き込まれたデータを記憶する。可搬型記録媒体307としては、例えば、CD(Compact Disc)-ROM、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリなどが挙げられる。
【0044】
なお、情報提供装置201は、上述した構成部のほかに、例えば、入力装置、ディスプレイなどを有することにしてもよい。また、図2に示した音声解析システム202、情報配信システム203についても、情報提供装置201と同様のハードウェア構成により実現することができる。
【0045】
(ユーザ端末204のハードウェア構成例)
つぎに、ユーザ端末204のハードウェア構成例について説明する。
【0046】
図4は、ユーザ端末204のハードウェア構成例を示すブロック図である。図4において、ユーザ端末204は、CPU401と、メモリ402と、通信I/F403と、カメラ404と、ディスプレイ405と、入力装置406と、スピーカ407と、マイクロフォン408と、を有する。また、各構成部はバス400によってそれぞれ接続される。
【0047】
ここで、CPU401は、ユーザ端末204の全体の制御を司る。CPU401は、複数のコアを有していてもよい。メモリ402は、例えば、ROM、RAMおよびフラッシュROMなどを有する記憶部である。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU401のワークエリアとして使用される。メモリ402に記憶されるプログラムは、CPU401にロードされることで、コーディングされている処理をCPU401に実行させる。
【0048】
通信I/F403は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部のコンピュータ(例えば、情報提供装置201)に接続される。そして、通信I/F403は、ネットワーク210と自装置内部とのインターフェースを司り、外部装置からのデータの入出力を制御する。
【0049】
カメラ404は、画像(静止画または動画)を撮影して画像データを出力する撮影装置である。カメラ404は、例えば、ユーザ端末204を利用するユーザの顔を撮影可能な位置に設置される。
【0050】
ディスプレイ405は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する表示装置である。ディスプレイ405は、例えば、液晶ディスプレイや有機EL(Electroluminescence)ディスプレイなどであってもよい。
【0051】
入力装置406は、文字、数字、各種指示などの入力のためのキーを有し、データの入力を行う。入力装置406は、タッチパネル式の入力パッドやテンキーなどであってもよく、また、キーボードやマウスなどであってもよい。スピーカ407は、電気信号を音声に変換して、音声を出力する。マイクロフォン408は、音声を受音して電気信号に変換する音声入力デバイスである。
【0052】
なお、ユーザ端末204は、上述した構成部のほかに、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、近距離無線通信I/F、可搬型記録媒体I/F、可搬型記録媒体などを有することにしてもよい。
【0053】
(記事マスタ220の記憶内容)
つぎに、図5を用いて、情報提供装置201が有する記事マスタ220の記憶内容について説明する。記事マスタ220は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0054】
図5は、記事マスタ220の記憶内容の一例を示す説明図である。図5において、記事マスタ220は、メディアID、記事ID、タイトル、URL、本文、要約、ジャンルおよびカテゴリのフィールドを有し、各フィールドに情報を設定することで、記事情報(例えば、記事情報500-1)をレコードとして記憶する。
【0055】
ここで、メディアIDは、ウェブサイトを一意に識別する識別子である。記事IDは、記事を一意に識別する識別子である。タイトルは、記事のタイトルである。URLは、ウェブサイト内の記事が掲載されたページのURLである。本文は、記事の本文である。要約は、記事の要約である。
【0056】
ジャンルは、記事が属するジャンルである。カテゴリは、記事が属するカテゴリである。ジャンルは、記事を分類するための大分類に相当する。カテゴリは、同一ジャンル内の記事を分類するための小分類に相当する。なお、記事情報には、例えば、掲載日時、掲載企業名、掲載メディア名、サムネイルURLなどが含まれていてもよい。
【0057】
(タグマスタ230の記憶内容)
つぎに、図6を用いて、情報提供装置201が有するタグマスタ230の記憶内容について説明する。タグマスタ230は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0058】
図6は、タグマスタ230の記憶内容の一例を示す説明図である。図6において、タグマスタ230は、タグIDおよびタグ名のフィールドを有し、各フィールドに情報を設定することで、タグ情報(例えば、タグ情報600-1~600-16)をレコードとして記憶する。
【0059】
ここで、タグIDは、タグを一意に識別する識別子である。タグは、記事の本文から抽出されたキーワードに相当する。タグ名は、タグを示す文字列(キーワード)である。
【0060】
(記事タグテーブル240の記憶内容)
つぎに、図7を用いて、情報提供装置201が有する記事タグテーブル240の記憶内容について説明する。記事タグテーブル240は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
【0061】
図7は、記事タグテーブル240の記憶内容の一例を示す説明図である。図7において、記事タグテーブル240は、記事ID、タグID、タグ出現数およびスコアのフィールドを有し、各フィールドに情報を設定することで、タグ記事情報(例えば、タグ記事情報700-1~700-8)をレコードとして記憶する。
【0062】
ここで、記事IDは、記事を一意に識別する識別子である。タグIDは、タグを一意に識別する識別子である。タグ出現数は、記事IDにより識別される記事における、タグIDにより識別されるタグの出現数を示す。スコアは、タグのスコアを示す。スコアは、記事におけるタグの重要度を示す。スコアは、値が大きいほど重要度が高いことを表す。
【0063】
例えば、タグ記事情報700-1は、記事ID「25894」により識別される記事の本文における、タグID「30014」により識別されるタグ(キーワード)のタグ出現数「2」およびスコア「0.352578612」を示す。
【0064】
(情報提供装置201の機能的構成例)
図8は、情報提供装置201の機能的構成例を示すブロック図である。図8において、情報提供装置201は、取得部801と、抽出部802と、検索部803と、受付部804と、出力部805と、を含む。取得部801~出力部805は制御部800となる機能であり、具体的には、例えば、図3に示したメモリ302、ディスク304、可搬型記録媒体307などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、通信I/F305により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク304などの記憶装置に記憶される。
【0065】
取得部801は、複数の記事情報を取得する。ここで、記事情報は、記事を表す情報である。記事情報は、例えば、記事のタイトル、本文、ジャンル、カテゴリなどを含む。具体的には、例えば、取得部801は、図2に示した情報配信システム203(外部サービス)から、複数の記事情報を取得する。
【0066】
より詳細に説明すると、例えば、取得部801は、記事一覧情報(不図示)を参照して、記事情報が掲載されたページ(ウェブページ)のURLを特定する。記事一覧情報は、各種ウェブサイトの各ページのURLなどをリスト化して示す情報である。記事一覧情報は、例えば、情報提供装置201の管理者によって作成・更新されて、メモリ302、ディスク304などの記憶装置に記憶される。
【0067】
そして、取得部801は、特定したURLを用いて情報配信システム203にアクセスすることにより、各ページのHTMLデータから記事情報を取得する。HTMLデータには、例えば、記事のタイトル、本文、ジャンル、カテゴリ、掲載日時などが含まれる。取得された記事情報は、例えば、図5に示した記事マスタ220に記憶される。
【0068】
例えば、取得部801は、メディアIDおよび記事IDと対応付けて、取得した記事情報を記事マスタ220に登録する。メディアIDは、ウェブサイトを一意に識別するIDであり、例えば、HTMLデータから特定される。記事IDは、記事を一意に識別するIDであり、例えば、情報提供装置201によって生成される。
【0069】
また、記事情報には、記事の要約が含まれてもよい。記事の要約は、例えば、HTMLデータから特定されてもよく、また、情報提供装置201によって生成されてもよい。要約は、例えば、LSA(Latent Semantic Analysis)やLuhnなどの既存のアルゴリズムを用いて生成されてもよい。
【0070】
ただし、記事マスタ220は、例えば、情報提供装置201がアクセス可能な他のコンピュータが有していてもよい。この場合、情報提供装置201は、他のコンピュータにアクセスすることにより、記事マスタ220内の複数の記事情報を取得してもよい。また、記事マスタ220は、例えば、情報提供システム200の管理者などにより人手で作成されてもよい。
【0071】
抽出部802は、取得された複数の記事情報の各記事情報からキーワードを抽出する。具体的には、例えば、所定のアルゴリズムで各記事情報の本文を形態素解析することにより、各記事情報から名詞をキーワードとして抽出する。所定のアルゴリズムは、任意に設定可能である。記事情報の本文は、例えば、記事マスタ220から特定される。
【0072】
より詳細に説明すると、例えば、抽出部802は、記事によってばらつきのある全角半角を全角または半角に統一し、本文の形態素解析を実施する。そして、抽出部802は、分割した形態素の中から、品詞が「名詞」の語をキーワードとして抽出する。抽出されたキーワード(名詞)は、例えば、記事IDと対応付けて、不図示のキーワードテーブルに登録される。
【0073】
また、抽出部802は、各記事情報から、予め設定されたストップワードを除外したキーワードを抽出してもよい。ここで、ストップワードとは、処理対象外とする単語である。単語の中には、一般的であるといった理由で処理対象外としたいものがある。このような単語は、ストップワードとして設定しておくことで、処理対象外とすることができる。抽出されたキーワードは、例えば、図6に示したタグマスタ230にタグとして記憶される。
【0074】
また、抽出部802は、各記事情報から抽出したキーワードの当該各記事情報における出現数を計数する。具体的には、例えば、抽出部802は、各記事情報について、タグマスタ230を参照して、各記事情報におけるタグ(キーワード)の出現数を計数してもよい。計数されたタグ(キーワード)の出現数は、例えば、図9に示すような記事別タグ出現数テーブル900に記憶される。
【0075】
図9は、記事別タグ出現数テーブル900の記憶内容の一例を示す説明図である。図9において、記事別タグ出現数テーブル900は、記事ID、タグIDおよびタグ出現数のフィールドを有する。各フィールドに情報を設定することで、記事別タグ出現数情報(例えば、記事別タグ出現数900-1~900-16)がレコードとして記憶される。
【0076】
ここで、記事IDは、記事を一意に識別する識別子である。タグIDは、タグ(キーワード)を一意に識別する識別子である。タグ出現数は、記事IDにより識別される記事(記事情報)における、タグIDにより識別されるタグ(キーワード)の出現数である。例えば、記事別タグ出現数情報900-1は、記事ID「1」により識別される記事における、タグID「1」により識別されるタグの出現数「6」を示す。
【0077】
また、抽出部802は、各記事情報から抽出したキーワードごとに、各記事情報におけるキーワードの出現頻度と、複数の記事情報におけるキーワードを含む記事情報の割合とに基づいて、スコアを算出してもよい。スコアは、各記事情報におけるキーワードの重要度を表す指標値である。
【0078】
スコアとしては、例えば、tf-idf値を用いることができる。ここで、tf(term frequency)は、各記事情報におけるキーワードの出現頻度に相当する。tf値は、記事の本文中に出現する頻度が高いほど、そのキーワードは重要である可能性が高いという考え方に基づく指標値である。
【0079】
idf(inverse document frequency)は、複数の記事情報におけるキーワードを含む記事情報の割合の逆数に相当する。idf値は、多くの記事に出現するキーワードは一つの記事の特徴語にはなりにくいという考え方に基づく指標値である。tf-idf値は、tf値とidf値とを掛け合わせた値である。tf-idf値の算出には、既存の計算式を用いることができる。
【0080】
より詳細に説明すると、例えば、抽出部802は、図9に示した記事別タグ出現数テーブル900を参照して、tf-idfモデルを作成する。なお、tf-idfモデルを作成するとは、例えば、tf-idf値の計算に用いられる変数(全記事数、各キーワードが出現する記事数など)を記録することである。
【0081】
そして、抽出部802は、作成したtf-idfモデルを用いて、記事情報ごとに、各記事情報から抽出した各キーワードのスコア(tf-idf値)を算出する。算出されたスコア(tf-idf値)は、例えば、図7に示した記事タグテーブル240に記憶される。例えば、抽出部802は、記事IDと対応付けて、各タグ(キーワード)のタグID、タグ出現数およびスコアを、記事タグテーブル240に登録する。
【0082】
また、取得部801は、1または複数のユーザの所定期間Tの発話内容を記録した音声データの音声認識結果を取得する。ここで、1または複数のユーザは、オンラインコミュニケーションを行うユーザであり、例えば、ウェブ会議の参加メンバーである。所定期間Tは、任意に設定可能である。
【0083】
所定期間Tは、例えば、一定時間ごとの期間である。一定時間は、例えば、数秒~数分程度である。具体的には、例えば、取得部801は、図2に示したユーザ端末204から、一定時間が経過するたびに、1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得する。
【0084】
また、音声認識結果は、図2に示した音声解析システム202から取得されてもよい。例えば、取得部801は、音声解析システム202から、一定時間が経過するたびに、1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得してもよい。
【0085】
また、情報提供装置201は、例えば、音声データをテキストデータに変換する機能を有していてもよい。この場合、取得部801は、例えば、ユーザ端末204から、一定時間が経過するたびに、1または複数のユーザの当該一定時間分の発話内容を記録した音声データを取得する。そして、取得部801は、取得した音声データを解析してテキストデータに変換することにより、音声認識結果を取得してもよい。
【0086】
抽出部802は、取得された音声認識結果からキーワードを抽出する。具体的には、例えば、抽出部802は、音声認識結果が取得されるたびに、取得された音声認識結果からキーワードを抽出する。
【0087】
より詳細に説明すると、例えば、抽出部802は、取得された音声認識結果を所定のアルゴリズムで形態素解析することにより、音声認識結果から名詞をキーワードとして特定する。所定のアルゴリズムは、各記事情報からキーワードを抽出する際のアルゴリズムと同じアルゴリズムである。
【0088】
つぎに、抽出部802は、特定したキーワードの音声認識結果における出現数を計数する。特定されたキーワードと、計数されたキーワードの出現数は、例えば、図10に示すようなキーワード出現数テーブル1000に記憶される。
【0089】
図10は、キーワード出現数テーブル1000の記憶内容の一例を示す説明図である。図10において、キーワード出現数テーブル1000は、キーワードおよび出現数のフィールドを有し、各フィールドに情報を設定することで、出現数情報(例えば、出現数情報1000-1~1000-3)をレコードとして記憶する。
【0090】
ここで、キーワードは、音声認識結果から特定されたキーワードである。出現数は、音声認識結果においてキーワードが出現した回数である。キーワード出現数テーブル1000には、出現数が多い順に出現数情報が記憶される。
【0091】
そして、抽出部802は、音声認識結果から当該音声認識結果における出現数が多い上位N個のキーワードを抽出してもよい。Nは、任意に設定可能であり、例えば、2~5程度の値に設定される。また、抽出部802は、音声認識結果から当該音声認識結果における出現数が閾値以上のキーワードを抽出してもよい。
【0092】
例えば、抽出部802は、キーワード出現数テーブル1000を参照して、出現数が多い上位N個のキーワードを抽出する。閾値は、任意に設定可能であり、例えば、5~10程度の値に設定される。抽出されたキーワードは、例えば、検索用タグとして記憶される。なお、キーワード出現数テーブル1000は、例えば、新たな音声認識結果が取得されるたびに初期化される。また、キーワード出現数テーブル1000は、ウェブ会議が行われている間は随時更新されて、キーワードおよび出現数が蓄積されてもよい。
【0093】
また、抽出部802は、音声認識結果から、予め設定されたストップワードを除外したキーワードを抽出してもよい。具体的には、例えば、抽出部802は、音声認識結果から、ストップワードを除外したキーワードのうち当該音声認識結果における出現数が多い上位N個のキーワードを抽出してもよい。
【0094】
また、抽出部802は、音声認識結果から、固定と指定されたキーワードを除外したキーワードを抽出してもよい。固定と指定されたキーワードは、同一のオンラインコミュニケーション(例えば、同じウェブ会議)において固定と指定されたキーワードである。具体的には、例えば、抽出部802は、音声認識結果から、固定と指定されたキーワードを除外したキーワードのうち当該音声認識結果における出現数が多い上位N個のキーワードを抽出してもよい。
【0095】
また、抽出部802は、音声認識結果から、修正された修正前後のキーワードを除外したキーワードを抽出してもよい。修正された修正前後のキーワードは、同一のオンラインコミュニケーション(例えば、同じウェブ会議)において修正された修正前後のキーワードである。具体的には、例えば、抽出部802は、音声認識結果から、修正された修正前後のキーワードを除外したキーワードのうち当該音声認識結果における出現数が多い上位N個のキーワードを抽出してもよい。
【0096】
検索部803は、音声認識結果から抽出されたキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索する。具体的には、例えば、検索部803は、音声認識結果から抽出されたキーワードと各記事情報から抽出されたキーワードとの一致数に基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。
【0097】
ここで、キーワードの一致数は、音声認識結果から抽出したキーワードと各記事情報から抽出したキーワード(タグ)との一致数である。より詳細に説明すると、例えば、検索部803は、複数の記事情報から、キーワードの一致数が閾値α以上となる記事情報を、出力対象の記事情報として検索してもよい。閾値αは、任意に設定可能である。キーワードの一致数は、例えば、記事タグテーブル240から特定される。
【0098】
また、検索部803は、例えば、音声認識結果から抽出されたキーワードの各記事情報における出現数に基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。キーワードの出現数は、音声認識結果から抽出したキーワードの各記事情報における出現数である。
【0099】
より詳細に説明すると、例えば、検索部803は、複数の記事情報から、キーワードの出現数が閾値β以上となる記事情報を、出力対象の記事情報として検索してもよい。キーワードの出現数が閾値β以上とは、例えば、音声認識結果から抽出した少なくともいずれかのキーワードの記事情報における出現数が閾値β以上であることを意味する。
【0100】
ただし、キーワードの出現数が閾値β以上は、音声認識結果から抽出したすべてのキーワードの記事情報における出現数が閾値β以上であることを意味してもよい。キーワードの出現数は、例えば、記事タグテーブル240から特定される。閾値βは、任意に設定可能である。
【0101】
また、検索部803は、音声認識結果から抽出されたキーワードと各記事情報から抽出されたキーワードとの一致数と、音声認識結果から抽出されたキーワードの各記事情報における出現数とに基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。具体的には、例えば、検索部803は、複数の記事情報から、キーワードの一致数が閾値α以上、かつ、キーワードの出現数が閾値β以上となる記事情報を、出力対象の記事情報として検索してもよい。
【0102】
また、検索部803は、各記事情報について、各記事情報から抽出されたキーワードのうち、算出されたスコアが閾値γ以上となるキーワードを特定してもよい。閾値γは、任意に設定可能である。また、検索部803は、各記事情報について、各記事情報から抽出されたキーワードのうち、算出されたスコアが高い上位M個のキーワードを特定してもよい。Mは、任意に設定可能であり、30程度の値に設定される。各キーワードのスコアは、例えば、tf-idf値であり、記事タグテーブル240から特定される。
【0103】
そして、検索部803は、音声認識結果から抽出されたキーワードと各記事情報について特定したキーワードとの一致数に基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。また、検索部803は、各記事情報について特定したキーワードのうち音声認識結果から抽出したキーワードの各記事情報における出現数に基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。
【0104】
例えば、検索部803は、キーワードの一致数や出現数を、各記事情報について特定されたキーワード(スコアが高い上位M個のキーワード)と、音声認識結果から抽出されたキーワードとを比較することによって判断する。これにより、検索部803は、記事における重要度がある程度高いキーワード(タグ)を対象として、キーワードの一致数や出現数を判断することができる。なお、出力対象となる記事情報の検索例については、図16を用いて後述する。
【0105】
出力部805は、1または複数のユーザに対して、検索された記事情報に関する情報を出力する。ここで、記事情報に関する情報は、例えば、記事のタイトル、要約、URLなどである。また、記事情報に関する情報は、記事の本文であってもよい。
【0106】
具体的には、例えば、出力部805は、検索した記事情報に関する情報を出力する際に、音声認識結果から抽出されたキーワード(直前に抽出されたキーワード)のうち、検索された記事情報に対応するキーワードを当該記事情報と対応付けて出力してもよい。
【0107】
また、出力部805は、検索された記事情報に関する情報を出力する際に、音声認識結果から抽出されたキーワードを、当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力する。固定の状態は、例えば、次回以降の検索に引き続き使用したいキーワードが指定される。削除の状態は、例えば、次回以降の検索に使われたくないキーワードが指定される。
【0108】
また、出力部805は、検索された記事情報に関する情報を出力する際に、音声認識結果から抽出されたキーワードを、当該キーワードごとに修正可能に出力してもよい。具体的には、例えば、出力部805は、検索された記事情報に関する情報を出力する際に、音声認識結果から抽出されたキーワードを、当該キーワードごとに固定および削除のいずれかの状態を指定可能かつ修正可能に出力してもよい。
【0109】
なお、削除と指定されたキーワードが、以降の一定時間分の発話内容を記録した音声データの音声認識結果に一定数以上出現した場合、削除を解除するかを提示してもよい。そして、情報提供装置201は、例えば、削除と指定されたキーワードについて、削除を解除するとの指定を受け付けた場合、削除の指定を解除してもよい。
【0110】
なお、出力部805は、検索された記事情報に関する情報を出力する際に、固定と指定されたキーワードがある場合、固定と指定されたキーワードを、音声認識結果から抽出されたキーワードと判別可能に出力してもよい。同様に、削除と指定されたキーワードがある場合、出力部805は、削除と指定されたキーワードを、音声認識結果から抽出されたキーワードと判別可能に出力してもよい。同様に、修正された修正後のキーワードがある場合、出力部805は、修正後のキーワードを、音声認識結果から抽出されたキーワードと判別可能に出力してもよい。
【0111】
出力部805の出力形式としては、例えば、通信I/F305による他のコンピュータ(例えば、ユーザ端末204)への送信、図4に示したユーザ端末204のディスプレイ405への表示、メモリ302、ディスク304などの記憶装置への記憶、不図示のプリンタへの印刷出力などがある。
【0112】
より詳細に説明すると、例えば、出力部805は、ウェブ会議画面上に、検索された記事情報に関する情報を出力する際に、音声認識結果から抽出されたキーワードを、当該キーワードごとに固定および削除のいずれかの状態を指定可能かつ修正可能に出力してもよい。
【0113】
ウェブ会議画面は、ウェブ会議を行う際に表示される操作画面である。ウェブ会議画面は、例えば、ウェブ会議の参加メンバー(1または複数のユーザ)のユーザ端末204のディスプレイ405に表示される。ウェブ会議画面において、キーワードの固定および削除の指定や、キーワードの修正は、例えば、ユーザ端末204の入力装置406を用いたユーザの操作入力により行われる。
【0114】
なお、ウェブ会議画面の画面例については、図17図19および図22を用いて後述する。
【0115】
受付部804は、出力されたキーワード(音声認識結果から抽出されたキーワード)のうちのいずれかのキーワードの固定の指定を受け付ける。具体的には、例えば、受付部804は、ユーザ端末204から、ウェブ会議画面において行われたキーワードの固定の指定結果を受信することにより、キーワードの固定の指定を受け付ける。
【0116】
また、受付部804は、出力されたキーワード(音声認識結果から抽出されたキーワード)のうちのいずれかのキーワードの削除の指定を受け付ける。具体的には、例えば、受付部804は、ユーザ端末204から、ウェブ会議画面において行われたキーワードの削除の指定結果を受信することにより、キーワードの削除の指定を受け付ける。
【0117】
また、受付部804は、出力されたキーワード(音声認識結果から抽出されたキーワード)のうちのいずれかのキーワードについて、修正後のキーワードを受け付ける。具体的には、例えば、受付部804は、ユーザ端末204から、ウェブ会議画面において行われたキーワードの修正結果を受信することにより、修正された修正後のキーワードを受け付ける。
【0118】
受け付けたキーワードの固定、削除の指定、および、修正後のキーワードについての情報は、例えば、図11に示すような条件マスタ1100に記憶される。
【0119】
図11は、条件マスタ1100の記憶内容の一例を示す説明図である。図11において、条件マスタ1100は、キーワードおよび固定/修正/削除のフィールドを有し、各フィールドに情報を設定することで、検索条件情報(例えば、検索条件情報1100-1~1100-3)をレコードとして記憶する。
【0120】
ここで、キーワードは、固定と指定されたキーワード、削除と指定されたキーワード、または、修正されたキーワードを示す。固定/修正/削除は、キーワードが、固定と指定されたのか、削除と指定されたのか、修正されたのかを示す。
【0121】
例えば、検索条件情報1100-1は、固定と指定されたキーワード「A社」を示す。検索条件情報1100-2は、削除と指定されたキーワード「半導体」を示す。検索条件情報1100-3は、修正された修正後のキーワード「医薬品」を示す。検索条件情報1100-3には、修正前のキーワード「違約金」も示されている。
【0122】
なお、条件マスタ1100は、例えば、ウェブ会議が行われている間は随時更新されて、ウェブ会議が終了したら初期化される。
【0123】
検索部803は、次回以降の出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う。また、検索部803は、次回以降の出力対象の記事情報を検索する処理の際に、修正された修正後のキーワードを含めた検索を行ってもよい。
【0124】
固定と指定されたキーワードは、例えば、ウェブ会議画面に表示された、音声認識結果から抽出されたキーワードうち、ユーザの操作入力により、固定と指定されたキーワードである。また、削除と指定されたキーワードは、例えば、ウェブ会議画面に表示された、音声認識結果から抽出されたキーワードうち、ユーザの操作入力により、削除と指定されたキーワードである。また、修正後のキーワードは、例えば、ウェブ会議画面に表示された、音声認識結果から抽出されたキーワードうち、ユーザの操作入力により、修正された修正後のキーワードである。
【0125】
具体的には、例えば、検索部803は、複数の記事情報から、固定と指定されたキーワードを含み、かつ、削除と指定されたキーワードを含まない記事情報を検索してもよい。また、検索部803は、複数の記事情報から、固定と指定されたキーワードおよび修正後のキーワードの少なくともいずれかを含み、かつ、削除と指定されたキーワードを含まない記事情報を検索してもよい。
【0126】
より詳細に説明すると、例えば、検索部803は、図11に示した条件マスタ1100を参照して、固定と指定されたキーワードを検索キーワードとして特定する。また、検索部803は、条件マスタ1100を参照して、修正された修正後のキーワードを検索キーワードとして特定する。
【0127】
また、検索部803は、条件マスタ1100を参照して、削除と指定されたキーワードを非検索キーワードとして特定する。そして、検索部803は、特定した検索キーワードと、非検索キーワードとに基づいて、複数の記事情報から、出力対象の記事情報を検索する。
【0128】
例えば、検索部803は、検索キーワードと各記事情報から抽出されたキーワードとの一致数に基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。この際、検索部803は、非検索キーワードを含む記事情報を除外する。非検索キーワードを含む記事情報は、例えば、非検索キーワードを本文に含む記事情報である。
【0129】
具体的には、例えば、検索部803は、複数の記事情報から、検索キーワードの一致数が閾値α以上となる記事情報を、出力対象の記事情報として検索してもよい。ただし、検索部803は、非検索キーワードを含む記事情報を除外する。検索キーワードの一致数は、例えば、記事タグテーブル240から特定される。
【0130】
また、検索部803は、例えば、検索キーワードの各記事情報における出現数に基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。この際、検索部803は、非検索キーワードを含む記事情報を除外する。
【0131】
具体的には、例えば、検索部803は、複数の記事情報から、検索キーワードの出現数が閾値β以上となる記事情報を、出力対象の記事情報として検索してもよい。ただし、検索部803は、非検索キーワードを含む記事情報を除外する。
【0132】
検索キーワードの出現数が閾値β以上とは、例えば、検索キーワードの少なくともいずれかのキーワードの記事情報における出現数が閾値β以上であることを意味する。ただし、検索キーワードの出現数が閾値β以上は、すべての検索キーワードの記事情報における出現数が閾値β以上であることを意味してもよい。検索キーワードの出現数は、例えば、記事タグテーブル240から特定される。
【0133】
また、検索部803は、検索キーワードと各記事情報から抽出されたキーワードとの一致数と、検索キーワードの各記事情報における出現数とに基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。この際、検索部803は、非検索キーワードを含む記事情報を除外する。
【0134】
具体的には、例えば、検索部803は、複数の記事情報から、検索キーワードの一致数が閾値α以上、かつ、検索キーワードの出現数が閾値β以上となる記事情報を、出力対象の記事情報として検索してもよい。ただし、検索部803は、非検索キーワードを含む記事情報を除外する。
【0135】
また、検索部803は、各記事情報について、各記事情報から抽出されたキーワードのうち、算出されたスコアが閾値γ以上となるキーワードを特定してもよい。また、検索部803は、各記事情報について、各記事情報から抽出されたキーワードのうち、算出されたスコアが高い上位M個のキーワードを特定してもよい。
【0136】
そして、検索部803は、検索キーワードと各記事情報について特定したキーワードとの一致数に基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。また、検索部803は、各記事情報について特定したキーワードのうち検索キーワードの各記事情報における出現数に基づいて、複数の記事情報から、出力対象の記事情報を検索してもよい。ただし、検索部803は、非検索キーワードを含む記事情報を除外する。
【0137】
例えば、検索部803は、検索キーワードの一致数や出現数を、各記事情報について特定されたキーワード(スコアが高い上位M個のキーワード)と、検索キーワードとを比較することによって判断する。これにより、検索部803は、記事における重要度がある程度高いキーワード(タグ)を対象として、検索キーワードの一致数や出現数を判断することができる。
【0138】
また、出力部805は、次回以降の出力対象の記事情報を検索する処理が実行された結果、1または複数のユーザに対して、検索した記事情報に関する情報を出力する際に、固定と指定されたキーワードに対応する記事情報と対応付けて、当該固定と指定されたキーワードを出力してもよい。
【0139】
また、出力部805は、次回以降の出力対象の記事情報を検索する処理が実行された結果、1または複数のユーザに対して、検索した記事情報に関する情報を出力する際に、修正後のキーワードに対応する記事情報と対応付けて、当該修正後のキーワードを出力してもよい。
【0140】
なお、情報提供装置201は、複数の分類からいずれかの分類の選択を受け付けてもよい。分類は、記事を分けるためのジャンル(大分類)、カテゴリ(小分類)などである。ジャンルとしては、例えば、経済、技術、国内、国際、イベントなどがある。例えば、ジャンルを「経済」とすると、カテゴリとしては、経済対策、金融政策などがある。
【0141】
各記事の分類は、例えば、記事マスタ220から特定される。
【0142】
また、情報提供装置201は、1または複数のユーザに対して、検索した記事情報のうち、選択された分類に属する記事情報に関する情報を出力してもよい。具体的には、例えば、情報提供装置201は、ウェブ会議画面上に、選択されたジャンル/カテゴリと対応付けて、選択されたジャンル/カテゴリに属する記事情報に関する情報を出力してもよい。
【0143】
この際、情報提供装置201は、選択されていない他のジャンル/カテゴリに属する記事情報に関する情報については出力しない。なお、ジャンル/カテゴリは、ジャンルとカテゴリとの組合せを示す。例えば、経済/経済対策は、ジャンル「経済」のカテゴリ「経済対策」を示す。
【0144】
また、情報提供装置201は、1または複数のユーザに対して、検索した記事情報に関する情報を、複数の分類に含まれる分類ごとに分けて出力してもよい。具体的には、例えば、情報提供装置201は、ウェブ会議画面上に、ジャンル/カテゴリごとに、当該ジャンル/カテゴリに属する記事情報に関する情報を出力してもよい。
【0145】
(情報提供システム200の動作例)
つぎに、情報提供システム200の動作例について説明する。まず、図12を用いて、情報提供システム200の第1の動作例について説明する。第1の動作例は、例えば、1日に1回決められた時刻(0時など)にバッチ処理として行われる。
【0146】
図12は、情報提供システム200の第1の動作例を示す説明図である。図12において、情報提供装置201は、記事一覧情報(不図示)を参照して、情報配信システム203から、複数の記事情報を取得する。情報提供装置201は、取得した記事情報を記事マスタ220に登録する。
【0147】
つぎに、情報提供装置201は、取得した複数の記事情報の各記事情報からキーワードを抽出する。また、情報提供装置201は、各記事情報から抽出したキーワードの当該各記事情報における出現数を計数する。つぎに、情報提供装置201は、各記事情報から抽出したキーワードごとに、スコア(tf-idf値)を算出する。
【0148】
そして、情報提供装置201は、記事IDと対応付けて、各タグ(キーワード)のタグID、タグ出現数およびスコアを、記事タグテーブル240に登録する。これにより、情報提供装置201は、各種ウェブサイト上の情報をクローリングして、記事情報を収集することができる。また、情報提供装置201は、記事情報を解析して、各タグ(キーワード)の出現数やスコア(tf-idf値)を求めることができる。
【0149】
つぎに、図13を用いて、情報提供システム200の第2の動作例について説明する。第2の動作例は、例えば、ウェブ会議を行うための準備処理として行われる。
【0150】
図13は、情報提供システム200の第2の動作例を示す説明図である。図13において、ユーザ端末204は、会議作成リクエストを情報提供装置201に送信する。会議作成リクエストは、新たなウェブ会議を作成するための要求である。会議作成リクエストには、例えば、会議ID、パスなどが含まれる。
【0151】
情報提供装置201は、会議作成リクエストを受信すると、例えば、受信した会議作成リクエストに含まれる会議ID、パスを用いて、図14に示すような会議管理テーブル1400に新たな会議情報を登録する。ここで、会議管理テーブル1400の記憶内容について説明する。
【0152】
図14は、会議管理テーブル1400の記憶内容の一例を示す説明図である。図14において、会議管理テーブル1400は、会議ID、パスおよび検索記事IDのフィールドを有し、各フィールドに情報を設定することで、会議管理情報(例えば、会議管理情報1400-1)がレコードとして記憶される。
【0153】
ここで、会議IDは、ウェブ会議を一意に識別する識別子である。パスは、ウェブ会議にアクセスするためのパスである。検索記事IDは、検索された記事(記事情報)の記事IDである。検索記事IDは、初期状態では「空」である。
【0154】
ウェブ会議の会議IDおよびパスは、ウェブ会議の参加メンバーに通知される。各参加メンバーは、通知された会議IDおよびパスを指定することで、同じウェブ会議に参加することができる。例えば、ユーザ端末204を用いて、ウェブ会議に参加すると、ウェブ会議画面(例えば、図17参照)がディスプレイ405に表示される。
【0155】
つぎに、図15を用いて、情報提供システム200の第3の動作例について説明する。第3の動作例は、例えば、ウェブ会議中に行われる。
【0156】
図15は、情報提供システム200の第3の動作例を示す説明図である。図15において、ユーザ端末204は、ウェブ会議の参加メンバー(1または複数のユーザ)の発話内容を記録した音声データを音声解析システム202に送信する。ユーザ端末204は、例えば、参加メンバーのうちのいずれかのユーザが使用するユーザ端末204である。
【0157】
音声解析システム202は、ユーザ端末204から音声データを受信すると、受信した音声データに対する音声解析処理を実施する。そして、音声解析システム202は、受信した音声データの音声認識結果をユーザ端末204に送信する。
【0158】
ユーザ端末204は、音声解析システム202から音声認識結果を受信すると、受信した音声認識結果を情報提供装置201に送信する。この際、ユーザ端末204は、例えば、会議IDと対応付けて、音声認識結果を情報提供装置201に送信する。これにより、情報提供装置201は、音声認識結果に対応するウェブ会議を特定することができる。
【0159】
情報提供装置201は、音声認識結果を受信すると、受信した音声認識結果からキーワードを抽出する。つぎに、情報提供装置201は、記事タグテーブル240を参照して、音声認識結果から抽出したキーワードに基づいて、出力対象の記事情報を検索する。そして、情報提供装置201は、ウェブ会議画面上に、検索した記事情報に関する情報を出力する。
【0160】
この際、情報提供装置201は、音声認識結果から抽出されたキーワードを、当該キーワードごとに固定および削除のいずれかの状態を指定可能かつ修正可能に出力する。そして、情報提供装置201は、次回以降の出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、修正された修正後のキーワードを含めた検索を行う。ただし、情報提供装置201は、削除と指定されたキーワードを除外した検索を行う。
【0161】
(記事情報の検索例)
つぎに、図16を用いて、出力対象となる記事情報の検索例について説明する。ここでは、音声認識結果から抽出されたキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索する場合を例に挙げて説明する。また、情報提供装置201は、複数の記事情報から、キーワードの一致数が閾値α以上、かつ、キーワードの出現数が閾値β以上となる記事情報を、出力対象の記事情報として検索する場合を想定する。
【0162】
ただし、各記事情報から抽出したキーワード(タグ)のうち、スコアが閾値γ以上となるキーワードを処理対象とする。例えば、キーワードの一致数は、音声認識結果から抽出されたキーワードと、記事情報から抽出されたスコアが閾値γ以上のキーワードとの一致数とする。また、キーワードの出現数は、記事情報から抽出されたスコアが閾値γ以上のキーワードのうち音声認識結果から抽出したキーワードについての記事情報における出現数とする。
【0163】
図16は、記事情報の検索例を示す説明図である。図16において、検索用タグ1600は、音声認識結果から抽出されたキーワードの一例である。ここでは、検索条件として、閾値αを「α=1」とする。また、閾値βを「β=1」とする。また、閾値γを「γ=0」とする。
【0164】
まず、情報提供装置201は、タグマスタ230を参照して、検索用タグ1600と一致するタグ名のタグIDを特定する。ここでは、検索用タグ1600の「黒字」と一致するタグ名のタグID「30014」が特定される。また、検索用タグ1600の「観光」と一致するタグ名のタグID「2896」が特定される。
【0165】
つぎに、情報提供装置201は、記事タグテーブル240を参照して、特定したタグIDに対応する記事IDを特定する。この際、情報提供装置201は、記事タグテーブル240内のスコアが0以上のレコードを処理対象とする(γ=0のため)。図16の例では、記事タグテーブル240内のすべてのレコードが処理対象となる。
【0166】
ここでは、タグID「30014」に対応する記事ID「25894」、「25893」が特定される。また、タグID「2896」に対応する記事ID「25893」が特定される。
【0167】
ここで、記事ID「25894」の記事(記事情報)は、検索用タグ1600とのキーワードの一致数が「1」である。また、記事ID「25894」の記事は、検索用タグ1600の「黒字」について、キーワードの出現数が「2」である。記事ID「25894」の記事は、キーワードの一致数が閾値α以上となり、かつ、キーワードの出現数が閾値β以上となる。このため、情報提供装置201は、記事ID「25894」の記事を、出力対象の記事情報として検索する。
【0168】
また、記事ID「25893」の記事(記事情報)は、検索用タグ1600とのキーワードの一致数が「2」である。また、記事ID「25893」の記事は、検索用タグ1600の「黒字」について、キーワードの出現数が「2」である。また、記事ID「25893」の記事は、検索用タグ1600の「観光」について、キーワードの出現数が「3」である。記事ID「25893」の記事は、キーワードの一致数が閾値α以上となり、かつ、キーワードの出現数が閾値β以上となる。このため、情報提供装置201は、記事ID「25893」の記事を、出力対象の記事情報として検索する。
【0169】
検索された記事(記事情報)の記事ID「25894」、「25893」は、例えば、会議IDと対応付けて、図14に示した会議管理テーブル1400に記憶される。情報提供装置201は、会議管理テーブル1400を参照して、ウェブ会議画面に表示する記事(記事情報)を特定することができる。
【0170】
(ウェブ会議画面の画面例)
つぎに、ウェブ会議画面の画面例について説明する。ウェブ会議画面は、例えば、ウェブ会議の各参加メンバーが使用するユーザ端末204のディスプレイ405に表示される。ここでは、キーワード出現数テーブル1000および条件マスタ1100の記憶内容の変遷例とともに、ウェブ会議画面の画面例について説明する。
【0171】
まず、図17図20を用いて、ウェブ会議画面の第1の画面例について説明する。
【0172】
図17図19は、ウェブ会議画面の第1の画面例を示す説明図である。図17において、ウェブ会議画面1700は、ウェブ会議を行う際に表示される操作画面の一例である。ウェブ会議画面1700において、画像m1~m5は、参加メンバーの顔画像である。ウェブ会議画面1700は、記事表示部1710を含む。
【0173】
記事表示部1710には、記事データd1~d3が表示されている。記事データd1~d3は、情報提供装置201によって検索された記事情報に関する情報の一例である。例えば、記事データd1は、記事1のタイトルt1と要約s1とを含む。
【0174】
また、記事表示部1710内のキーワード欄1720には、キーワード1721~1723が表示されている。キーワード1721~1723は、参加メンバーの発話内容を記録した音声データの音声認識結果から抽出された出現数が多い上位3個のキーワードであり、記事情報の検索に用いられたキーワードである。
【0175】
図20は、キーワード出現数テーブル1000の記憶内容の変遷例を示す説明図である。図20において、(20-1)、(20-2)および(20-3)は、新たな音声認識結果が取得されるたびに更新されたキーワード出現数テーブル1000の記憶内容を示している。
【0176】
(20-1)に示すキーワード出現数テーブル1000では、「A社」、「先端技術」および「半導体」が、出現数が多い上位3個のキーワードである。この場合、「A社」、「先端技術」および「半導体」のキーワードを用いて記事情報の検索が行われ、図17に示すようなウェブ会議画面1700が表示される。
【0177】
ウェブ会議画面1700によれば、ユーザ(参加メンバー)は、情報提供装置201によって検索された各記事のタイトルと要約を確認することができる。また、ウェブ会議画面1700において、入力装置406を用いたユーザの操作入力により、カーソルcrを移動させて、記事データd1~d3のいずれかを選択すると、選択された記事データに対応するページを表示することができる。
【0178】
例えば、ウェブ会議画面1700において、ユーザの操作入力により、記事データd1を選択すると、記事1のURLが指定されて、記事1のページを表示することができる。これにより、ユーザ(参加メンバー)は、記事1の詳細な内容を確認することができる。
【0179】
また、ウェブ会議画面1700によれば、ユーザは、記事データd1~d3の検索に用いられたキーワード1721~1723を確認することができる。これにより、ユーザは、検索結果の根拠となったキーワードを把握することができ、検索キーワードとして適切なものであるかどうかを判断することができる。
【0180】
また、ウェブ会議画面1700において、ユーザの操作入力により、キーワード欄1720のキーワード1721~1723のいずれかのキーワードを選択すると、選択したキーワードを、固定と指定したり、削除と指定したり、修正したりすることができる。
【0181】
例えば、ウェブ会議画面1700において、キーワード1723を選択すると、図18の(18-1)に示すようなメニュー1800が表示される。そして、ウェブ会議画面1700において、カーソルcrを移動させて、メニュー1800内の固定、修正、削除のいずれかを選択すると、キーワード1723を、固定と指定したり、削除と指定したり、修正したりすることができる。
【0182】
ここでは、キーワード1721について、ユーザが引き続き検索に使用したいと考え、キーワード1721が固定と指定された場合を想定する。また、キーワード1723について、ユーザが次回以降の検索には使われたくないと考え、キーワード1723が削除と指定された場合を想定する。この場合、キーワード1721,1723についての指定内容が条件マスタ1100に記憶される。
【0183】
図21は、条件マスタ1100の記憶内容の変遷例を示す説明図である。図21において、(21-1)、(21-2)および(21-3)は、キーワードの固定、削除の指定、あるいは、修正が行われたことに応じて更新された条件マスタ1100の記憶内容を示している。
【0184】
(21-1)に示す条件マスタ1100は、初期状態のため、検索条件情報が記憶されていない。ここで、キーワード1721が固定と指定されると、検索条件情報1100-1が条件マスタ1100に登録される。また、キーワード1723が削除と指定されると、検索条件情報1100-2が条件マスタ1100に登録される。
【0185】
この後、図20の(20-2)に示すように、キーワード出現数テーブル1000の記憶内容が更新され、次の検索が行われた場合を想定する。この場合、図18の(18-2)に示すようなウェブ会議画面1700が表示される。
【0186】
(18-2)に示すウェブ会議画面1700において、記事表示部1710には、記事データd11,d12,d13が表示されている。ウェブ会議画面1700によれば、ユーザは、情報提供装置201によって検索された各記事(記事データd11~d13)のタイトルと要約を確認することができる。
【0187】
また、記事表示部1710内のキーワード欄1720には、キーワード1724~1726が表示されている。キーワード1724~1726は、音声認識結果から抽出された出現数が多い上位3個のキーワードである(図20の(20-2)参照)。また、記事表示部1710内のキーワード欄1730には、固定と指定されたキーワード1721と、削除と指定されたキーワード1723とが表示されている。
【0188】
ウェブ会議画面1700によれば、ユーザは、記事データd11~d13の検索に用いられたキーワード1721,1724~1726を確認することができる。また、キーワード1721が、キーワード1724~1726とは異なるキーワード欄1730に表示されている。
【0189】
このため、ユーザは、固定と指定されたキーワード1721を、音声認識結果から抽出されたキーワード1724~1726と容易に区別することができる。また、キーワード欄1730において、キーワード1723が反転表示されている。このため、ユーザは、キーワード1723が削除と指定され、キーワード1723を除外した検索が行われたことを把握することができる。
【0190】
ここでは、キーワード1725について、ユーザが誤認識されたキーワードだと考え、キーワード1725を修正したいと考えた場合を想定する。この場合、ウェブ会議画面1700において、キーワード1725を選択すると、図19の(19-1)に示すようなメニュー1900が表示される。
【0191】
そして、ウェブ会議画面1700において、カーソルcrを移動させて、メニュー1900内の修正を選択すると、キーワード1725を修正することができる。ここでは、キーワード1725が「違約金」から「医薬品」に修正された場合を想定する。この場合、キーワード1725についての修正内容が条件マスタ1100に記憶される。
【0192】
図21の(21-3)に示すように、キーワード1725が「違約金」から「医薬品」に修正されると、検索条件情報1100-3が条件マスタ1100に登録される。この後、図20の(20-3)に示すように、キーワード出現数テーブル1000の記憶内容が更新され、次の検索が行われた場合を想定する。
【0193】
この場合、図19の(19-2)に示すようなウェブ会議画面1700が表示される。(19-2)に示すウェブ会議画面1700において、記事表示部1710には、記事データd111,d122,d133が表示されている。ウェブ会議画面1700によれば、ユーザは、情報提供装置201によって検索された各記事(記事データd111,d122,d133)のタイトルと要約を確認することができる。
【0194】
また、記事表示部1710内のキーワード欄1720には、キーワード1727~1729が表示されている。キーワード1727~1729は、音声認識結果から抽出された出現数が多い上位3個のキーワードである(図20の(20-3)参照)。ただし、「違約金」については、修正されたキーワード1725と同一キーワードのため、抽出対象から除外されている。
【0195】
また、記事表示部1710内のキーワード欄1730には、固定と指定されたキーワード1721と、削除と指定されたキーワード1723と、修正後のキーワード1725とが表示されている。
【0196】
ウェブ会議画面1700によれば、ユーザは、記事データd111,d122,d133の検索に用いられたキーワード1721,1725,1727~1729を確認することができる。また、キーワード1721,1725が、キーワード1727~1729とは異なるキーワード欄1730に表示されている。
【0197】
このため、ユーザは、固定と指定されたキーワード1721と修正後のキーワード1725を、音声認識結果から抽出されたキーワード1727~1729と容易に区別することができる。また、キーワード欄1730において、例えば、キーワード1721とキーワード1725は、異なる態様(背景模様)で表示されている。このため、ユーザは、各キーワード1721,1725が、固定と指定されたものであるか、修正されたものであるかを判別することができる。
【0198】
このように、ウェブ会議画面1700によれば、記事情報の検索に用いられたキーワードを、ユーザが固定にしたり、削除したり、修正したりすることで、検索結果をユーザの意に沿ったものに近づけることができる。
【0199】
つぎに、図22を用いて、ウェブ会議画面の第2の画面例について説明する。
【0200】
図22は、ウェブ会議画面の第2の画面例を示す説明図である。図22において、ウェブ会議画面2200は、ウェブ会議を行う際に表示される操作画面の一例である。ウェブ会議画面2200において、画像m1~m5は、参加メンバーの顔画像である。
【0201】
ウェブ会議画面2200は、キーワード欄2210とキーワード欄2220とを含む。キーワード欄2210には、キーワード2211~2213が表示されている。キーワード2211~2213は、音声認識結果から抽出された出現数が多い上位3個のキーワードである。
【0202】
キーワード欄2220には、キーワード2221~2223が表示されている。キーワード2221は、修正された修正後のキーワードである。キーワード2222は、固定と指定されたキーワードである。キーワード2223は、削除と指定されたキーワードである。
【0203】
また、ウェブ会議画面2200は、記事表示部2230を含む。記事表示部2230には、記事データ2231~2233が表示されている。記事データ2231~2233は、情報提供装置201によって検索された記事情報に関する情報の一例である。各記事データ2231~2233は、記事タイトルと要約(図22中、「…」に相当)とを含む。
【0204】
また、各記事データ2231~2233は、各記事データ2231~2233に対応するキーワードが対応付けて表示されている。例えば、記事データ2231には、記事データ2231に対応するキーワード2213,2222が対応付けて表示されている。
【0205】
ウェブ会議画面2200によれば、ユーザは、情報提供装置201によって検索された各記事(記事データ2231~2233)のタイトルと要約を確認することができる。また、ユーザは、記事データ2231~2233の検索に用いられたキーワード2211~2213,2221,2222を確認することができる。
【0206】
ユーザは、各記事データ2231~2233が、どのキーワードでヒットしたものなのかを把握することができる。例えば、ユーザは、記事データ2231が、キーワード2213,2222でヒットしたものであることを把握でき、記事データ2231の詳細を確認すべきかどうかの判断に役立てることができる。
【0207】
(情報提供装置201の各種処理手順)
つぎに、情報提供装置201の各種処理手順について説明する。まず、図23を用いて、情報提供装置201の記事収集処理手順について説明する。情報提供装置201の記事収集処理は、例えば、所定のタイミングまたは定期的(毎日0時など)に実行される。
【0208】
図23は、情報提供装置201の記事収集処理手順の一例を示すフローチャートである。図23のフローチャートにおいて、まず、情報提供装置201は、記事一覧情報(不図示)を参照して、記事が掲載されたページのうち選択されていない未選択のページを選択する(ステップS2301)。
【0209】
つぎに、情報提供装置201は、選択したページのURLを用いて情報配信システム203にアクセスすることにより、ページのHTMLデータから記事情報を取得する(ステップS2302)。そして、情報提供装置201は、取得した記事情報を記事マスタ220に登録する(ステップS2303)。
【0210】
つぎに、情報提供装置201は、記事一覧情報を参照して、記事が掲載されたページのうち選択されていない未選択のページがあるか否かを判断する(ステップS2304)。ここで、未選択のページがある場合(ステップS2304:Yes)、情報提供装置201は、ステップS2301に戻る。
【0211】
一方、未選択のページがない場合(ステップS2304:No)、情報提供装置201は、本フローチャートによる一連の処理を終了する。これにより、情報提供装置201は、各種ウェブサイト上の情報をクローリングして、記事情報を収集することができる。
【0212】
つぎに、図24を用いて、情報提供装置201の記事解析処理手順について説明する。情報提供装置201の記事解析処理は、例えば、情報提供装置201の記事収集処理の実行後に、続けて実行される。
【0213】
図24は、情報提供装置201の記事解析処理手順の一例を示すフローチャートである。図24のフローチャートにおいて、まず、情報提供装置201は、記事マスタ220を参照して、複数の記事情報のうち選択されていない未選択の記事情報を選択する(ステップS2401)。
【0214】
つぎに、情報提供装置201は、選択した記事情報の本文を形態素解析することにより、記事情報から名詞をキーワードとして抽出する(ステップS2402)。つぎに、情報提供装置201は、抽出したキーワードをタグマスタ230にタグとして登録する(ステップS2403)。この際、情報提供装置201は、例えば、抽出したキーワードからストップワードを除外してもよい。
【0215】
そして、情報提供装置201は、タグマスタ230を参照して、選択した記事情報における各タグ(キーワード)の出現数を計数する(ステップS2404)。つぎに、情報提供装置201は、計数した各タグの出現数を、記事IDおよびタグIDと対応付けて、記事別タグ出現数テーブル900に登録する(ステップS2405)。
【0216】
そして、情報提供装置201は、記事別タグ出現数テーブル900を参照して、選択した記事情報におけるタグ(キーワード)の出現頻度と、複数の記事情報におけるタグを含む記事情報の割合とに基づいて、各タグのスコアを算出する(ステップS2406)。
【0217】
つぎに、情報提供装置201は、選択した記事情報の記事IDと対応付けて、各タグのタグID、出現数(タグ出現数)およびスコアを記事タグテーブル240に登録する(ステップS2407)。そして、情報提供装置201は、記事マスタ220を参照して、複数の記事情報のうち選択されていない未選択の記事情報があるか否かを判断する(ステップS2408)。
【0218】
ここで、未選択の記事情報がある場合(ステップS2408:Yes)、情報提供装置201は、ステップS2401に戻る。一方、未選択の記事情報がない場合(ステップS2408:No)、情報提供装置201は、本フローチャートによる一連の処理を終了する。
【0219】
これにより、情報提供装置201は、各記事情報を解析して、各タグ(キーワード)の出現数やスコア(例えば、tf-idf値)を求めることができる。
【0220】
つぎに、図25図27を用いて、情報提供装置201の記事検索処理手順について説明する。ここでは、情報提供装置201が、一定時間が経過するたびに、1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得する場合を想定する。一定時間は、例えば、数秒~数分秒程度である。
【0221】
図25図27は、情報提供装置201の情報提供処理手順の一例を示すフローチャートである。図25のフローチャートにおいて、まず、情報提供装置201は、ユーザ端末204から、1または複数のユーザの直近一定時間分の発話内容を記録した音声データの音声認識結果を取得する(ステップS2501)。
【0222】
つぎに、情報提供装置201は、取得した音声認識結果を形態素解析することにより、音声認識結果から、当該音声認識結果における出現数が多い上位N個の名詞をキーワードとして抽出する(ステップS2502)。この際、情報提供装置201は、例えば、抽出対象からストップワードを除外してもよい。
【0223】
なお、音声認識結果の形態素解析は、例えば、図24に示したステップS2402の記事情報の本文に対する形態素解析と同一のアルゴリズムで実施される。
【0224】
つぎに、情報提供装置201は、抽出したキーワードを検索用タグとして登録する(ステップS2503)。そして、情報提供装置201は、タグマスタ230を参照して、検索用タグと一致するタグ名のタグIDを特定する(ステップS2504)。つぎに、情報提供装置201は、記事タグテーブル240を参照して、特定したタグIDに対応する記事のうち検索条件を満たす記事(記事情報)を検索する(ステップS2505)。
【0225】
検索条件は、例えば、キーワードの一致数が閾値α以上、かつ、キーワードの出現数が閾値β以上という条件である。この際、情報提供装置201は、各記事情報から抽出したキーワード(タグ)のうち、スコアが閾値γ以上となるキーワードを処理対象としてもよい。
【0226】
そして、情報提供装置201は、検索した記事の記事IDを検索記事IDとして会議管理テーブル1400に登録する(ステップS2506)。つぎに、情報提供装置201は、会議管理テーブル1400を参照して、ウェブ会議画面上に、検索した記事に関する情報を出力する(ステップS2507)。この際、情報提供装置201は、ステップS2502において抽出されたキーワードを、当該キーワードごとに固定および削除のいずれかの状態を指定可能かつ修正可能に出力する。
【0227】
そして、情報提供装置201は、図26に示すステップS2601に移行する。
【0228】
図26のフローチャートにおいて、まず、情報提供装置201は、出力したキーワードうちのいずれかのキーワードについて、固定、修正、削除の指定を受け付けたか否かを判断する(ステップS2601)。ここで、固定、修正、削除の指定を受け付けていない場合(ステップS2601:No)、情報提供装置201は、ステップS2603に移行する。
【0229】
一方、固定、修正、削除の指定を受け付けた場合(ステップS2601:Yes)、情報提供装置201は、指定内容を条件マスタ1100に登録する(ステップS2602)。指定内容は、例えば、固定と指定されたキーワード、削除と指定されたキーワード、修正前後のキーワードなどである。
【0230】
つぎに、情報提供装置201は、ユーザ端末204から、新たな音声認識結果を取得したか否かを判断する(ステップS2603)。ここで、新たな音声認識結果を取得していない場合(ステップS2603:No)、情報提供装置201は、ステップS2601に戻る。
【0231】
一方、新たな音声認識結果を取得した場合(ステップS2603:Yes)、情報提供装置201は、取得した音声認識結果を形態素解析することにより、音声認識結果から、当該音声認識結果における出現数が多い上位N個の名詞をキーワードとして抽出する(ステップS2604)。この際、情報提供装置201は、例えば、抽出対象からストップワードを除外してもよい。
【0232】
つぎに、情報提供装置201は、条件マスタ1100を参照して、固定と指定されたキーワード、修正された修正後のキーワードを特定する(ステップS2605)。そして、情報提供装置201は、抽出したキーワードと、特定したキーワードとを検索用タグとして登録する(ステップS2606)。この際、情報提供装置201は、例えば、抽出したキーワードを第1検索用タグとして登録し、特定したキーワードを第2検索用タグとして登録してもよい。
【0233】
つぎに、情報提供装置201は、条件マスタ1100を参照して、削除と指定されたキーワードを特定する(ステップS2607)。そして、情報提供装置201は、特定したキーワードを非検索用タグとして登録して(ステップS2608)、図27に示すステップS2701に移行する。
【0234】
図27のフローチャートにおいて、まず、情報提供装置201は、タグマスタ230を参照して、検索用タグと一致するタグ名の第1タグIDを特定する(ステップS2701)。そして、情報提供装置201は、タグマスタ230を参照して、非検索用タグと一致するタグ名の第2タグIDを特定する(ステップS2702)。
【0235】
つぎに、情報提供装置201は、記事タグテーブル240を参照して、特定した第1タグIDに対応し、特定した第2タグIDに対応しない記事のうち検索条件を満たす記事(記事情報)を検索する(ステップS2703)。
【0236】
なお、情報提供装置201は、例えば、第1検索用タグおよび第2検索用タグそれぞれについて、ステップS2701~S2703の処理を実行してもよい。また、情報提供装置201は、第1検索用タグおよび第2検索用タグそれぞれを区別せずに、ステップS2701~S2703の処理を実行してもよい。
【0237】
そして、情報提供装置201は、検索した記事の記事IDを検索記事IDとして会議管理テーブル1400に登録する(ステップS2704)。つぎに、情報提供装置201は、会議管理テーブル1400を参照して、ウェブ会議画面上に、検索した記事に関する情報を出力する(ステップS2705)。
【0238】
この際、情報提供装置201は、ステップS2604において抽出されたキーワードを、当該キーワードごとに固定および削除のいずれかの状態を指定可能かつ修正可能に出力する。また、情報提供装置201は、例えば、ステップS2605,S2607において特定されたキーワードを、その状態(固定、修正、削除)を特定可能に出力してもよい。
【0239】
そして、情報提供装置201は、ウェブ会議を終了するか否かを判断する(ステップS2706)。ウェブ会議は、例えば、ユーザ端末204から終了指示を受け付けたことに応じて終了する。
【0240】
ここで、ウェブ会議を終了しない場合には(ステップS2706:No)、情報提供装置201は、ステップS2603に戻る。一方、ウェブ会議を終了する場合(ステップS2706:Yes)、情報提供装置201は、本フローチャートによる一連の処理を終了する。
【0241】
これにより、情報提供装置201は、ウェブ会議の参加メンバーに対して、会議中の発話内容に応じて、議論を活発化させるような有用な情報を提供することができる。また、情報提供装置201は、記事情報の検索に用いられたキーワードについて、固定したり、削除したり、修正したりできるように出力することで、ユーザの意に沿った情報を検索しやすくすることができる。
【0242】
以上説明したように、実施の形態にかかる情報提供装置201によれば、1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索し、1または複数のユーザに対して、検索した記事情報に関する情報を出力することができる。1または複数のユーザは、例えば、オンラインコミュニケーションを行うユーザである。そして、情報提供装置201によれば、検索した記事情報に関する情報を出力する際に、音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力し、次回以降の出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行うことができる。
【0243】
これにより、情報提供装置201は、記事情報の検索に用いられたキーワードについて、固定および削除のいずれかの状態を指定可能に出力することで、ユーザの意に沿った情報を検索しやすくすることができる。例えば、ユーザは、引き続き検索に使用したいキーワードがあれば、そのキーワードを固定と指定することで、次回以降の検索時に、そのキーワードを含めた検索を行うことができ、検索結果を自分の意に沿ったものに近づけることができる。また、ユーザは、次回以降の検索には使われたくないキーワードがあれば、そのキーワードを削除と指定することで、次回以降の検索時に、そのキーワードを除外した検索を行うことができ、検索結果を自分の意に沿ったものに近づけることができる。
【0244】
また、情報提供装置201によれば、次回以降の出力対象の記事情報を検索する処理の際に、複数の記事情報から、固定と指定されたキーワードを含み、かつ、削除と指定されたキーワードを含まない記事情報を検索することができる。
【0245】
これにより、情報提供装置201は、次回以降の検索時に、例えば、ウェブ会議の話題に関係のあるキーワードを含み、話題に関係のないキーワードを含まない記事を検索でき、ユーザにとって有用な記事の情報を提供することが可能となる。
【0246】
また、情報提供装置201によれば、検索した記事情報に関する情報を出力する際に、さらに、音声認識結果から抽出したキーワードを当該キーワードごとに修正可能に出力することができる。そして、情報提供装置201によれば、次回以降の出力対象の記事情報を検索する処理の際に、さらに、修正された修正後のキーワードを含めた検索を行うことができる。
【0247】
これにより、情報提供装置201は、記事情報の検索に用いられたキーワードについて、修正可能に出力することで、ユーザの意に沿った情報を検索しやすくすることができる。例えば、発言者の滑舌が悪いなどの理由で、あるキーワードが別のキーワードとして認識される場合がある。このような場合、ユーザは、そのキーワードを本来意図したキーワードに修正することで、次回以降の検索時に、そのキーワードを含めた検索を行うことができ、検索結果を自分の意に沿ったものに近づけることができる。
【0248】
また、情報提供装置201によれば、次回以降の出力対象の記事情報を検索する処理の際に、複数の記事情報から、固定と指定されたキーワードおよび修正後のキーワードの少なくともいずれかを含み、かつ、削除と指定されたキーワードを含まない記事情報を検索することができる。
【0249】
これにより、情報提供装置201は、次回以降の検索時に、例えば、ウェブ会議の話題に関係のあるキーワードを含み、話題に関係のないキーワードを含まない記事を検索でき、ユーザにとって有用な記事の情報を提供することが可能となる。
【0250】
また、情報提供装置201によれば、一定時間が経過するたびに、1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得することができる。
【0251】
これにより、情報提供装置201は、一定時間ごとにキーワードが更新されるタイミングで、固定と指定されたキーワードおよび修正後のキーワードを含めた検索や、削除と指定されたキーワードを除外した検索を行うことができる。
【0252】
また、情報提供装置201によれば、検索した記事情報に関する情報を出力する際に、音声認識結果から抽出したキーワードのうち、検索した記事情報に対応するキーワードを当該記事情報と対応付けて出力することができる。
【0253】
これにより、情報提供装置201は、記事がどのキーワードでヒットしたものであるかを把握可能にして、記事の詳細を確認すべきかどうかの判断に役立てることができる。
【0254】
また、情報提供装置201によれば、音声認識結果から当該音声認識結果における出現数が多い上位所定数のキーワードを抽出することができる。
【0255】
これにより、情報提供装置201は、ユーザの話題に合ったキーワードを抽出しやすくすることができる。
【0256】
また、情報提供装置201によれば、次回以降の出力対象の記事情報を検索する処理が実行された結果、1または複数のユーザに対して、検索した記事情報に関する情報を出力する際に、固定と指定されたキーワードに対応する記事情報と対応付けて、当該固定と指定されたキーワードを出力することができる。
【0257】
これにより、情報提供装置201は、検索結果のうちユーザが固定と指定したキーワードでヒットした記事を把握可能にして、記事の詳細を確認すべきかどうかの判断に役立てることができる。
【0258】
また、情報提供装置201によれば、次回以降の出力対象の記事情報を検索する処理が実行された結果、1または複数のユーザに対して、検索した記事情報に関する情報を出力する際に、修正後のキーワードに対応する記事情報と対応付けて、当該修正後のキーワードを出力することができる。
【0259】
これにより、情報提供装置201は、検索結果のうちユーザが修正した修正後のキーワードでヒットした記事を把握可能にして、記事の詳細を確認すべきかどうかの判断に役立てることができる。
【0260】
これらのことから、実施の形態にかかる情報提供システム200および情報提供装置201によれば、オンラインコミュニケーションにおいてユーザにとって有用な情報を提供することができる。例えば、情報提供装置201は、ウェブ会議において、参加メンバーの発言内容に応じて、議論の前提となる情報、議論を広げられる情報、議論の打開策となる情報などを提供することができる。これにより、情報提供装置201は、タイミリーなインプットを参加メンバーに行うことが可能となり、ウェブ会議をより本質的で生産性のある価値創出の場とすることができる。
【0261】
なお、上述した説明では、音声によるコミュニケーションを行う場合について説明したが、これに限らない。例えば、本情報提供方法は、テキストによるコミュニケーションに適用されてもよい。この場合、情報提供装置201は、例えば、1または複数のユーザの音声認識結果の代わりに、1または複数のユーザによって入力された発話内容を表すテキストデータを取得し、テキストデータに対して音声認識結果と同様の処理を行う。
【0262】
なお、本実施の形態で説明した情報提供方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本情報提供プログラムは、ハードディスク、フレキシブルディスク、CD-ROM、DVD、USBメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本情報提供プログラムは、インターネット等のネットワークを介して配布してもよい。
【0263】
また、本実施の形態で説明した情報処理装置101(情報提供装置201)は、スタンダードセルやストラクチャードASIC(Application Specific Integrated Circuit)などの特定用途向けICやFPGAなどのPLD(Programmable Logic Device)によっても実現することができる。
【0264】
上述した実施の形態に関し、さらに以下の付記を開示する。
【0265】
(付記1)1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した前記音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索し、前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、処理をコンピュータに実行させ、
検索した前記記事情報に関する情報を出力する際に、前記音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力し、
次回以降の前記出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う、
ことを特徴とする情報提供プログラム。
【0266】
(付記2)前記次回以降の前記出力対象の記事情報を検索する処理の際に、前記複数の記事情報から、前記固定と指定されたキーワードを含み、かつ、前記削除と指定されたキーワードを含まない記事情報を検索する、ことを特徴とする付記1に記載の情報提供プログラム。
【0267】
(付記3)検索した前記記事情報に関する情報を出力する際に、さらに、前記音声認識結果から抽出したキーワードを当該キーワードごとに修正可能に出力し、
前記次回以降の前記出力対象の記事情報を検索する処理の際に、さらに、修正された修正後のキーワードを含めた検索を行う、ことを特徴とする付記1または2に記載の情報提供プログラム。
【0268】
(付記4)前記次回以降の前記出力対象の記事情報を検索する処理の際に、前記複数の記事情報から、前記固定と指定されたキーワードおよび前記修正後のキーワードの少なくともいずれかを含み、かつ、前記削除と指定されたキーワードを含まない記事情報を検索する、ことを特徴とする付記3に記載の情報提供プログラム。
【0269】
(付記5)一定時間が経過するたびに、前記1または複数のユーザの当該一定時間分の発話内容を記録した音声データの音声認識結果を取得する、
処理を前記コンピュータに実行させることを特徴とする付記3に記載の情報提供プログラム。
【0270】
(付記6)検索した前記記事情報に関する情報を出力する際に、前記音声認識結果から抽出したキーワードのうち、検索した前記記事情報に対応するキーワードを当該記事情報と対応付けて出力する、ことを特徴とする付記1に記載の情報提供プログラム。
【0271】
(付記7)前記抽出する処理は、
前記音声認識結果から当該音声認識結果における出現数が多い上位所定数のキーワードを抽出する、ことを特徴とする付記1~6のいずれか一つに記載の情報提供プログラム。
【0272】
(付記8)前記次回以降の前記出力対象の記事情報を検索する処理が実行された結果、前記1または複数のユーザに対して、検索した記事情報に関する情報を出力する際に、前記固定と指定されたキーワードに対応する記事情報と対応付けて、当該固定と指定されたキーワードを出力する、ことを特徴とする付記1に記載の情報提供プログラム。
【0273】
(付記9)前記次回以降の前記出力対象の記事情報を検索する処理が実行された結果、前記1または複数のユーザに対して、検索した記事情報に関する情報を出力する際に、前記修正後のキーワードに対応する記事情報と対応付けて、当該修正後のキーワードを出力する、ことを特徴とする付記3に記載の情報提供プログラム。
【0274】
(付記10)前記1または複数のユーザは、オンラインコミュニケーションを行うユーザである、ことを特徴とする付記1~9のいずれか一つに記載の情報提供プログラム。
【0275】
(付記11)1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した前記音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索し、前記1または複数のユーザに対して、検索した前記記事情報に関する情報を出力する、処理をコンピュータが実行し、
検索した前記記事情報に関する情報を出力する際に、前記音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力し、
次回以降の前記出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う、
ことを特徴とする情報提供方法。
【0276】
(付記12)1または複数のユーザが使用する端末と、
前記1または複数のユーザの発話内容を記録した音声データの音声認識結果を取得するたびに、取得した前記音声認識結果から抽出したキーワードに基づいて、複数の記事情報から、出力対象の記事情報を検索し、検索した前記記事情報に関する情報を前記端末に出力する情報提供装置と、を含み、
前記情報提供装置は、
検索した前記記事情報に関する情報を出力する際に、前記音声認識結果から抽出したキーワードを当該キーワードごとに固定および削除のいずれかの状態を指定可能に出力し、
次回以降の前記出力対象の記事情報を検索する処理の際に、固定と指定されたキーワードを含めた検索を行い、削除と指定されたキーワードを除外した検索を行う、
ことを特徴とする情報提供システム。
【符号の説明】
【0277】
101 情報処理装置
110,120 検索結果
200 情報提供システム
201 情報提供装置
202 音声解析システム
203 情報配信システム
204 ユーザ端末
210 ネットワーク
220 記事マスタ
230 タグマスタ
240 記事タグテーブル
300,400 バス
301,401 CPU
302,402 メモリ
303 ディスクドライブ
304 ディスク
305,403 通信I/F
306 可搬型記録媒体I/F
307 可搬型記録媒体
404 カメラ
405 ディスプレイ
406 入力装置
407 スピーカ
408 マイクロフォン
800 制御部
801 取得部
802 抽出部
803 検索部
804 受付部
805 出力部
900 記事別タグ出現数テーブル
1000 キーワード出現数テーブル
1100 条件マスタ
1400 会議管理テーブル
1600 検索用タグ
1700,2200 ウェブ会議画面
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27