特許第6904435号(P6904435)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 京セラドキュメントソリューションズ株式会社の特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6904435
(24)【登録日】2021年6月28日
(45)【発行日】2021年7月14日
(54)【発明の名称】情報処理装置及び発話解析方法
(51)【国際特許分類】
   G10L 15/10 20060101AFI20210701BHJP
   G10L 15/22 20060101ALI20210701BHJP
   G10L 15/00 20130101ALI20210701BHJP
【FI】
   G10L15/10 200W
   G10L15/22 460Z
   G10L15/00 200U
【請求項の数】11
【全頁数】17
(21)【出願番号】特願2019-562805(P2019-562805)
(86)(22)【出願日】2018年11月2日
(86)【国際出願番号】JP2018040837
(87)【国際公開番号】WO2019130817
(87)【国際公開日】20190704
【審査請求日】2020年3月10日
(31)【優先権主張番号】特願2017-248460(P2017-248460)
(32)【優先日】2017年12月25日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】100129997
【弁理士】
【氏名又は名称】田中 米藏
(72)【発明者】
【氏名】小林 祐毅
(72)【発明者】
【氏名】西村 菜美
(72)【発明者】
【氏名】真野 知子
【審査官】 山下 剛史
(56)【参考文献】
【文献】 特開2008−9552(JP,A)
【文献】 特開2006−251898(JP,A)
【文献】 特開2010−224715(JP,A)
【文献】 特開2011−66794(JP,A)
【文献】 特開2011−100355(JP,A)
【文献】 国際公開第2017/038794(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00−15/34
G06F 16/00
G06Q 10/00
(57)【特許請求の範囲】
【請求項1】
複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する第1検出部と、
前記第1検出部によって検出された前記各発言の内容をテキスト化するテキスト化部と、
前記テキスト化部によってテキスト化されたテキストデータに基づいて、前記各発言に含まれる予め定められたキーワードを検出する第2検出部と、
表示部と、
前記第2検出部によって検出された前記予め定められたキーワードを前記表示部に表示させる表示制御部と、
前記テキストデータから、前記予め定められたキーワード以外の単語を抽出する抽出部と、を備え
前記表示制御部は、前記抽出部によって抽出された単語のうち、検出数が予め定められた第1の値以上である単語を、前記表示部に表示させる情報処理装置。
【請求項2】
複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する第1検出部と、
前記第1検出部によって検出された前記各発言の内容をテキスト化するテキスト化部と、
前記テキスト化部によってテキスト化されたテキストデータに基づいて、前記各発言に含まれる予め定められたキーワードを検出する第2検出部と、
表示部と、
前記第2検出部によって検出された前記予め定められたキーワードを前記表示部に表示させる表示制御部と、を備え、
前記予め定められたキーワードが複数とされ、当該各キーワードには、検出回数1回毎に予め定められたポイントが設定されており、
前記表示制御部は、前記キーワード毎に検出回数に応じて当該ポイントを集計して、各キーワードを当該ポイントと共に前記表示部に表示させる情報処理装置。
【請求項3】
前記表示制御部は、前記第2検出部によって検出された前記予め定められたキーワードのうち、検出数が予め定められた第2の値以上であるキーワードを、前記表示部に表示させる請求項1又は請求項2に記載の情報処理装置。
【請求項4】
前記第2検出部によって検出された前記予め定められたキーワードを、予め定められた各種別に仕分ける仕分部を更に備え、
前記表示制御部は、属する各キーワードの検出数合計が予め定められた第3の値以上である種別及び当該種別に属するキーワードを、前記表示部に表示させる請求項1乃至請求項3のいずれかに記載の情報処理装置。
【請求項5】
前記表示制御部は、前記検出されたキーワードを、タグクラウドによる視覚的記述により前記表示部に表示させ、当該キーワードの大きさを、検出数が多くなるにつれて大きくし、検出数が最多のキーワードを最も大きく表示させる請求項1乃至請求項4のいずれかに記載の情報処理装置。
【請求項6】
前記表示制御部は、前記予め定められたキーワードのそれぞれについて、前記表示部の表示画面における異なる表示位置を設定して、前記予め定められたキーワードのそれぞれを前記表示部に表示させる請求項5に記載の情報処理装置。
【請求項7】
前記表示部の表示画面における位置を指定するポインター部を更に備え、
前記表示制御部は、前記ポインター部により指定された位置に表示されているキーワードに対応付けられている付加情報を、更に前記表示部に表示させる請求項5又は請求項6に記載の情報処理装置。
【請求項8】
前記表示制御部は、前記抽出部によって抽出された単語であって、検出数が予め定められた第1の値以上である単語を、他のキーワードとは表示形態を異ならせて前記表示部に表示させる請求項1に記載の情報処理装置。
【請求項9】
複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する発言検出ステップと、
前記発言検出ステップで検出された前記各発言の内容をテキスト化するテキスト化ステップと、
前記テキスト化ステップでテキスト化されたテキストデータに基づいて、前記各発言に含まれる予め定められたキーワードを検出するキーワード検出ステップと、
前記キーワード検出ステップで検出された前記予め定められたキーワードを表示部に表示させる表示制御ステップと、
前記テキストデータから、前記予め定められたキーワード以外の単語を抽出する抽出ステップと、を備え、
前記表示制御ステップにおいて、前記抽出ステップで抽出された単語のうち、検出数が予め定められた第1の値以上である単語を、前記表示部に表示させる発話解析方法。
【請求項10】
表示部と、
音声を示す電気信号が入力される音声入力部と、
前記音声入力部に前記電気信号が入力される度に、入力された前記電気信号に基づく音声データを、前記音声を発した人ごとに記憶する記憶部と、
プロセッサーを含み、当該プロセッサーが発話解析プログラムを実行することにより、
前記音声データから発言に対応する部分を抽出し、抽出された前記部分を発言として検出する第1検出部と、
前記第1検出部によって検出された前記発言の内容をテキスト化するテキスト化部と、
前記テキスト化部によってテキスト化されたテキストデータに基づいて、前記発言に含まれる予め定められたキーワードを検出する第2検出部と、
前記第2検出部によって検出された前記予め定められたキーワードを前記表示部に表示させる表示制御部と、
前記テキストデータから、前記予め定められたキーワード以外の単語を抽出する抽出部と、して機能する制御ユニットと、を備え、
前記表示制御部は、前記抽出部によって抽出された単語のうち、検出数が予め定められた第1の値以上である単語を、前記表示部に表示させる情報処理装置。
【請求項11】
前記記憶部はさらに、前記人を特定するための識別情報と、前記人が属するグループを特定するためのグループ情報とを対応付けて予め記憶し、
前記制御ユニットはさらに、前記音声入力部に前記電気信号が入力されると、前記音声データを、前記識別情報に対応付けて記憶する制御部として機能し、
前記表示制御部は、前記第2検出部によって検出された前記予め定められたキーワードを、前記グループ毎に前記表示部に表示させる、請求項10に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び発話解析方法に関し、特に、人により発話された内容を解析する技術に関する。
【背景技術】
【0002】
今日では、グループ毎に討論の活性化を推定してその状況を明示する技術が提案されている(下記特許文献1参照)。この技術は、グループの各メンバーが発話した発話時刻及び発話時間長を記憶しておき、グループ毎に、各メンバーの発話時刻及び発話時間長を時系列に区分し、グループ全メンバーの発話時間長に対する各メンバーの発話時間長の比を算出して、グループ毎に、各メンバーの発話密度寄与率を描画したグラフを生成するというものである。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2016−162339号公報
【発明の概要】
【0004】
しかしながら、上記技術は、グループ内における各メンバーの発話時間に基づいて当該各メンバーの貢献度を示すものに過ぎず、当該グループによる討論においてされた発言の内容を表示することを実現するものではない。
【0005】
本発明は、上記の事情に鑑みなされたものであり、グループでの会議等においてされた発言の内容を表示することを目的とする。
【0006】
本発明の一局面に係る情報処理装置は、複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する第1検出部と、第1検出部によって検出された各発言の内容をテキスト化するテキスト化部と、テキスト化部によってテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する第2検出部と、表示部と、第2検出部によって検出された予め定められたキーワードを表示部に表示させる表示制御部と、前記テキストデータから、前記予め定められたキーワード以外の単語を抽出する抽出部と、を備え、前記表示制御部は、前記抽出部によって抽出された単語のうち、検出数が予め定められた第1の値以上である単語を、前記表示部に表示させるものである。
本発明の他の一局面に係る情報処理装置は、複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する第1検出部と、第1検出部によって検出された各発言の内容をテキスト化するテキスト化部と、テキスト化部によってテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する第2検出部と、表示部と、第2検出部によって検出された予め定められたキーワードを表示部に表示させる表示制御部と、を備え、前記予め定められたキーワードが複数とされ、当該各キーワードには、検出回数1回毎に予め定められたポイントが設定されており、前記表示制御部は、前記キーワード毎に検出回数に応じて当該ポイントを集計して、各キーワードを当該ポイントと共に前記表示部に表示させるものである。
【0007】
また、本発明の他の一局面に係る発話解析方法は、複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する発言検出ステップと、発言検出ステップで検出された各発言の内容をテキスト化するテキスト化ステップと、テキスト化ステップでテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出するキーワード検出ステップと、キーワード検出ステップで検出された予め定められたキーワードを表示部に表示させる表示制御ステップと、前記テキストデータから、前記予め定められたキーワード以外の単語を抽出する抽出ステップと、を備え、前記表示制御ステップにおいて、前記抽出ステップで抽出された単語のうち、検出数が予め定められた第1の値以上である単語を、前記表示部に表示させるものである。
【0008】
また、本発明の他の一局面に係る情報処理装置は、表示部と、音声を示す電気信号が入力される音声入力部と、音声入力部に電気信号が入力される度に、入力された電気信号に基づく音声データを、音声を発した人ごとに記憶する記憶部と、プロセッサーを含み、当該プロセッサーが評価プログラムを実行することにより、音声データから発言に対応する部分を抽出し、抽出された部分を発言として検出する第1検出部と、第1検出部によって検出された発言の内容をテキスト化するテキスト化部と、テキスト化部によってテキスト化されたテキストデータに基づいて、発言に含まれる予め定められたキーワードを検出する第2検出部と、第2検出部によって検出された前記予め定められたキーワードを前記表示部に表示させる表示制御部と、前記テキストデータから、前記予め定められたキーワード以外の単語を抽出する抽出部と、して機能する制御ユニットと、を備え、前記表示制御部は、前記抽出部によって抽出された単語のうち、検出数が予め定められた第1の値以上である単語を、前記表示部に表示させる。
【0009】
本発明によれば、グループでの会議等においてされた発言の内容を表示することが可能になる。
【図面の簡単な説明】
【0010】
図1】本発明の第1実施形態に係る情報処理装置、及び当該情報処理装置により発話解析が行われる対象者を示す図である。
図2】情報処理装置の内部構成の概略を示すブロック図である。
図3】音声データの一例を示す図である。
図4】第1実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。
図5】表示部の表示画面の一例を示す図である。
図6】表示部の表示画面の一例を示す図である。
図7】表示部の表示画面の一例を示す図である。
図8】第2実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。
図9】表示部の表示画面の一例を示す図である。
図10】第3実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。
図11A】ポイント例を示す図である。
図11B】表示部の表示画面の一例を示す図である。
図12】第4実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。
図13】種別、種別に属するキーワード、及び検出数の例を示す図である。
図14】表示部の表示画面の一例を示す図である。
図15】第5実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。
図16】表示部の表示画面の一例を示す図である。
図17】表示部の表示画面の一例を示す図である。
図18】第6実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。
図19】表示部の表示画面の一例を示す図である。
図20】表示部に表示されている各キーワードについての付加情報を表示させる処理を示すフローチャートである。
図21】表示部の表示画面の一例を示す図である。
【発明を実施するための形態】
【0011】
以下、本発明の一実施形態に係る情報処理装置、発話解析方法、及び発話解析プログラムについて図面を参照して説明する。図1は、本発明の第1実施形態に係る情報処理装置、及び当該情報処理装置により発話解析が行われる対象者を示す図である。
【0012】
情報処理装置1は、予め定められた複数人からなる複数の会話グループG1〜G3に属する各人が発した音声を音声データとして取得する。例えば、グループG1に属する人P11,P12,P13、グループG2に属する人P21,P22,P23、グループG3に属する人P31,P32,P33からなる複数人(本実施形態では3つのグループに属する各人からなる合計9人として説明するが、これに限定されるものではない。)が、グループ単位でミーティング、討論、授業、又は会議など(以下、総称して単に「会議」という。)を行っているものとする。
【0013】
当該会話グループの各人は、マイクロフォン機能を備えたヘッドセット2を使用した状態で発声する。すなわち、当該各人が用いるそれぞれのヘッドセット2は、ヘッドセット2を装着した人の会話の音声を取得し、当該音声を示す電気信号に変換して、情報処理装置1に出力する。情報処理装置1と、各ヘッドセット2とは、例えば、ケーブル接続による有線通信、又は、Bluetooth(登録商標)若しくは無線LAN等の無線通信により接続されている。情報処理装置1は、各ヘッドセット2から出力されてくる上記音声を示す電気信号を、ディジタルの音声信号からなる音声データに変換し、ヘッドセット2毎、すなわち、上記人P11〜P33の9人についての音声データをそれぞれに蓄積する。
【0014】
次に、第1実施形態に係る情報処理装置1の構成について説明する。図2は、情報処理装置1の内部構成の概略を示すブロック図である。
【0015】
情報処理装置1は、例えばコンピューターである。情報処理装置1は、制御ユニット10と、ROM(Read Only Memory)112と、RAM(Random Access Memory)113と、HDD(Hard Disk Drive)114と、表示部115と、通信インターフェイス118と、指示入力部119とを備える。これら各部は、互いにCPU(Central Processing Unit)バスによりデータ又は信号の送受信が可能とされている。
【0016】
制御ユニット10は、情報処理装置1全体の動作制御を司る。ROM112は、情報処理装置1の基本動作についての動作プログラムを記憶する。RAM113は、制御ユニット10の動作領域等として使用される。
【0017】
HDD114は、その記憶領域の一部に、本発明の第1実施形態に係る発話解析プログラムを記憶している。また、HDD114は、上記人P11〜P33の9人についてのそれぞれの上記音声データを記憶する。なお、HDD114は、特許請求の範囲における記憶部の一例でもある。但し、情報処理装置1が備える不揮発性ROM(例えば、制御ユニット10が内蔵)が当該記憶部として機能してもよい。
【0018】
情報処理装置1と接続されているヘッドセット2には、当該ヘッドセット2を特定するための識別情報が予め付されている。識別情報としては、ヘッドセット2を特定可能な情報であれば特に限定されないが、例えば、識別番号がある。HDD114は、ヘッドセット2ごとに当該識別情報を予め記憶している。HDD114はまた、指示入力部119を介してユーザーによって入力される指示に応じて、識別情報のそれぞれを、グループを特定するためのグループ情報と対応付けて記憶している。
【0019】
本実施の形態では、HDD114は、人P1,P2,P3がそれぞれ使用しているヘッドセット2の識別情報を、グループG1を特定するグループ情報と対応付けて記憶している。HDD114はまた、人P21,P22,P23がそれぞれ使用しているヘッドセット2の識別情報を、グループG2を特定するグループ情報と対応付けて記憶している。HDD114はさらに、人P31,P32,P33がそれぞれ使用しているヘッドセット2の識別情報を、グループG3を特定するグループ情報と対応付けて記憶している。
【0020】
表示部115は、LCD(Liquid Crystal Display)等からなり、情報処理装置1を操作する操作者に対する操作案内等が表示される。
【0021】
通信インターフェイス118は、USBインターフェイス又は無線LANインターフェイス等を有する。通信インターフェイス118は、上記各ヘッドセット2とのデータ通信を行うためのインターフェイスとして機能する。通信インターフェイス118は、特許請求の範囲における音声入力部の一例である。
【0022】
指示入力部119は、キーボード又はマウス等から構成され、操作指示が操作者によって入力される。
【0023】
制御ユニット10は、プロセッサー、RAM、及びROMなどから構成される。プロセッサーは、CPU、MPU(Micro Processing Unit)、又はASIC(Application Specific Integrated Circuit)等である。この制御ユニット10は、HDD114に記憶されている発話解析プログラムが上記のプロセッサーで実行されることにより、制御部100、第1検出部101、テキスト化部102、第2検出部103、表示制御部104、仕分部105、及び抽出部106として機能する。なお、制御部100、第1検出部101、テキスト化部102、第2検出部103,表示制御部104、仕分部105、及び抽出部106は、ハード回路により構成されてもよい。
【0024】
制御部100は、情報処理装置1全体の動作制御を司る機能を有する。
【0025】
第1検出部(発言検出部)101は、HDD114に記憶されている人P11〜P33の9人についての音声データのそれぞれから、音声データに記録されている発話の中でされている発言を検出する。図3は、音声データの一例を示す図である。図3の縦軸は音の振幅(単位dB)、横軸は時刻を示す。第1検出部101は、音声データを解析し、音声データが示す振幅のうち、予め定められた規定時間(例えば、0.25秒)以上連続して、予め定められた大きさ以上の振幅(例えば、20dB)が続く部分を発言として検出する。図3に示す音声データでは、第1検出部101は、a部分、b部分、及びc部分を発言として検出する。
【0026】
テキスト化部102は、既知の音声認識機能を備え、これにより、上記音声データに含まれる上記各人の発言の内容をキャラクター変換してテキスト化する。
【0027】
第2検出部(キーワード検出部)103は、テキスト化部102によってテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する。
【0028】
表示制御部104は、第2検出部103によって検出された上記予め定められたキーワードを表示部115に表示させる。また、表示制御部104は、第2検出部103によって検出された上記予め定められたキーワードのうち、検出数が予め定められた第1の値以上であるキーワードを、表示部115に表示させる。
【0029】
仕分部(種別仕分部)105は、第2検出部103によって検出された上記予め定められたキーワードを、予め定められたそれぞれの種別に仕分ける。表示制御部104は、属する各キーワードの検出数の合計が予め定められた第2の値以上である種別及び当該種別に属するキーワードを、表示部115に表示させる。
【0030】
抽出部(単語抽出部)106は、テキスト化部102によってテキスト化されたテキストデータから、上記予め定められたキーワード以外の単語を抽出する。表示制御部104は、抽出部106によって抽出された単語のうち、検出数が予め定められた第3の値以上である単語を表示部115に表示させる。
【0031】
次に、第1実施形態に係る情報処理装置1による発話解析処理について説明する。図4は、第1実施形態に係る情報処理装置1による発話解析処理を示すフローチャートである。
【0032】
当該発話解析が行われる場面は、会話グループG1〜G3に属する各人が、それぞれのグループ毎に会議を行っている場面である。人P11〜P33は、各自がヘッドセット2を装着し、各ヘッドセット2は上述したように情報処理装置1に対して通信可能に接続されている。この状態で、人P11〜P33は、各自が属するそれぞれのグループにおいて会議中に発話を行う。人P11〜P33によって発話された音声は、人P11〜P33のそれぞれのヘッドセット2により集音され、情報処理装置1に出力される。
【0033】
情報処理装置1は、通信インターフェイス118を介して、各ヘッドセット2から音声データを取得する(ステップS1)。すなわち、通信インターフェイス118が、各ヘッドセット2から出力されてくる上記音声を示す電気信号を受信すると、第1検出部101が、当該取得された音声を示す電気信号を、ディジタルの音声信号からなる音声データに変換してHDD114に記憶させる。第1検出部101は、人P11〜P33毎に、すなわち、HDD114に記憶されている識別情報に対応付けて、当該音声データをHDD114に記憶させる。
【0034】
続いて、第1検出部101は、人P11〜P33毎にHDD114に記憶されている音声データのそれぞれから、当該音声データが示す発話の中でされている各発言を、上述したようにして検出する(ステップS2)。
【0035】
そして、テキスト化部102は、上記音声データに含まれる上記各人の発言の内容を、音声認識機能によりキャラクター変換してテキスト化する(ステップS3)。第1検出部101は、上記音声データにおける、人P11〜P33の各発言にあたる時間帯をHDD114に記憶させており、テキスト化部102は、上記音声データにおける当該時間帯部分を発言と認識して、当該発言の内容をキャラクター変換してテキスト化する。
【0036】
続いて、第2検出部103は、テキスト化部102によって上記のようにテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する(ステップS4)。例えば、HDD114に、予め定められたキーワードとして、「水蒸気」、「気圧」、「変化」及び「融解」が記憶されている場合、第2検出部103は、上記発言がテキスト化されてなるテキストデータに、当該キーワードが含まれているか否かを判断する。第2検出部103は、当該キーワードが含まれている場合には、キーワードを検出して、当該キーワードの出現数をカウントアップする。第2検出部103は、各キーワードの出現数を識別情報に対応付けて、HDD114に記憶させておく。
【0037】
そして、表示制御部104は、第2検出部103によって検出された上記各キーワードを表示部115に表示させる(ステップS5)。予め定められたキーワードが上記の例に示すものである場合、図5に示すように、表示制御部104は、HDD114に記憶されている識別情報及びグループ情報に基づいて、各キーワードの出現数をグループ毎に集計し、人P11〜P33のグループ毎に、各キーワードと各キーワードの出現数とを示す画像を表示部115に表示させる。なお、図5に示すように、表示制御部104は、第2検出部103によって検出されなかったキーワード(検出数「0」のキーワード)を、検出数「0」として表示部115に表示させてもよい。
【0038】
また、表示制御部104は、指示入力部119の操作で操作者から入力される画面切換指示に従って、図6に示すように、全グループを通じた、各キーワードと各キーワードの出現数とを示す画像を表示部115に表示させる。或いは、表示制御部104は、指示入力部119の操作で操作者から入力される画面切換指示に従って、図7に示すように、全グループを通じて、出現数が上位の3つのキーワードを、出現数が多い順に並べた画像を表示部115に表示させる。
【0039】
図8は、第2実施形態に係る情報処理装置1による発話解析処理を示す図である。図8に示すように、第2実施形態では、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS11〜ステップS14)、表示制御部104は、第2検出部103によって検出されたキーワードのうち、検出数が予め定められた第1の値以上であるキーワードを検出して(ステップS15)、当該検出した各キーワードをそれぞれの検出数と共に、表示部115に表示させる(ステップS16)。
【0040】
例えば、表示制御部104は、図9に示すように、第1の値が「12」である場合、検出数が第1の値以上であるキーワードを検出して、当該検出したキーワード及びその検出数のみをグループ毎に表示部115に表示させる。
【0041】
これら第1及び第2実施形態によれば、グループでの会議等においてされた発言の内容を、ユーザーが視認可能となるように表示することができる。これにより、ユーザーは、当該表示を視認して、会議出席者による発言の内容を正確に把握することが可能になる。
【0042】
図10は、第3実施形態に係る情報処理装置1による発話解析処理を示す図である。第3の実施形態では、図10に示すように、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS21〜ステップS24)、表示制御部104は、各キーワードの検出回数に応じて、各キーワードに予め付されているポイントをキーワード毎に集計し(ステップS25)、集計したポイントと共に、各キーワードを表示部115に表示させる(ステップS26)。更には、表示制御部104は、グループG1〜G3毎に、全キーワードのポイントの合計を算出して表示してもよい。なお、第3実施形態では、予め定められたキーワードは複数とされる。
【0043】
HDD114は、各キーワードについて、検出回数1回毎に加算される予め定められたポイントを記憶している。当該ポイントは、会議における重要度等に応じて主催者等が予め設定し、例えば指示入力部119の操作によりHDD114に記憶させる。表示制御部104は、キーワードを1回検出する度にそのキーワードに付されたポイントを加算する。このため、多く検出されたキーワードは、集計されるポイントが高くなる。
【0044】
例えば、図11Aに示すように、HDD114が、キーワードごとに設定されているポイントとして、「水蒸気」に対して2ポイント、「気圧」に対して3ポイント、「変化」に対して1ポイント、「融解」に対して5ポイントを記憶しているとき、表示制御部104は、各キーワードの検出回数に応じてポイントをキーワード毎に集計する。表示制御部104は更に、グループG1〜G3毎に、全キーワードのポイント合計を算出し、図11Bに示す「集計結果」のような表示画面を表示部115に表示させることにより、集計したポイント及び各キーワードと、全キーワードのポイントの合計とをグループG1〜G3毎に、表示部115に表示させる。
【0045】
この第3実施形態によれば、ユーザーは、表示されたキーワード及び集計ポイントを視認することで、その会議において、重要なキーワードがどの程度用いられているかを把握でき、更には、全キーワードのポイント合計を視認することで、どのグループが最も有意義な会議を行ったかを判断するための指標を得ることができる。
【0046】
次に、第4実施形態に係る情報処理装置1による発話解析処理について説明する。図12は、第4実施形態に係る情報処理装置1による発話解析処理を示すフローチャートである。
【0047】
第4実施形態では、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS31〜ステップS34)、仕分部105が、第2検出部103によって検出されたキーワードを、予め定められた種別に仕分ける(ステップS35)。例えば、HDD114は、予め定められた種別として、「天気」、「スポーツ」、及び「社会」を記憶している。HDD114は、更に、種別「天気」に属するキーワードとして、「晴れ」「曇り」「雨」「雲」「白い」「煙」というキーワードを予め記憶している。また、HDD114は、更に、種別「スポーツ」に属するキーワードとして、「テニス」「野球」「サッカー」「中止」「決勝」「勝敗」というキーワードを予め記憶している。また、HDD114は、更に、種別「社会」に属するキーワードとして、「経済」「企業」「株価」「景気」「売上」「損益」というキーワードを予め記憶している。
【0048】
この場合、第2検出部103は、各人による各発言から、まず、「晴れ」「曇り」「雨」「雲」「白い」「煙」「テニス」「野球」「サッカー」「中止」「決勝」「勝敗」「企業」「株価」「景気」「売上」「損益」を検出する。そして、仕分部105は、検出された各キーワードを、種別「天気」「スポーツ」「社会」のいずれの種別に属するかを判断し、検出された各キーワードを種別毎に仕分ける。図13に、種別、種別に属するキーワード、及び検出数の例を示す。仕分部105は、出現したキーワードを各種別に仕分け、各種別に属する各キーワードの検出数をカウントしておき、当該検出数をキーワードと共にHDD114に記憶させる。
【0049】
続いて、表示制御部104は、検出数が予め定められた第2の値以上である種別を検出する(ステップS36)。すなわち、表示制御部104は、種別に属する各キーワードの検出数の合計が上記第2の値以上である種別を検出する。例えば、第2の値が「150」であり、図13に示した種別、種別に属するキーワード、及び検出数の場合、表示制御部104は、例えば、グループG1については、種別「社会」を検出する。
【0050】
そして、表示制御部104は、当該検出した種別を、当該種別に属する各キーワードのそれぞれの検出数と共に、表示部115に表示させる(ステップS37)。表示制御部104は、上記のように、グループG1については種別「社会」を検出し、グループG2については種別「天気」を検出し、グループG3についても種別「天気」を検出した場合、図14に例を示すように、検出した種別と、当該種別に属する各キーワード及びそれぞれの検出数を表示部115に表示させる。
【0051】
この第4実施形態によれば、検出したキーワードを各種別に仕分けし、更に、属する各キーワードの検出数の合計が第2の値以上である種別が表示されるので、ユーザーは、予め定められた各キーワードが多く出現する種別を的確に把握することが可能になる。
【0052】
次に、第5実施形態に係る情報処理装置1による発話解析処理について説明する。図15は、第5実施形態に係る情報処理装置1による発話解析処理を示すフローチャートである。
【0053】
第5実施形態では、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS41〜ステップS44)、抽出部106が、ステップS33でテキスト化されたテキストデータから、上記予め定められたキーワード以外の単語を抽出する(ステップS45)。すなわち、第実施形態では、表示制御部104が、上記予め定められたキーワードを検出すると共に、抽出部106が、上記予め定められたキーワード以外の単語を抽出する。
【0054】
表示制御部104は、抽出部106によって抽出された上記単語のうち、検出数が予め定められた第3の値以上である単語を検出して(ステップS46)、当該検出した各単語をそれぞれの検出数と共に、表示部115に表示させる(ステップS47)。
【0055】
例えば、表示制御部104は、第3の値が例えば「15」である場合、図16に示すように、上記予め定められたキーワード以外の単語であって、検出数が第3の値以上である単語と、その検出数とを表示部115に表示させる。
【0056】
この第5実施形態によれば、グループでの会議等において、予め定められたキーワードではなくても、出現数の多い単語があれば検出して表示するため、ユーザーは、当初はユーザーが注目していなかったが、実際に会議をしてみると会議出席者が注目して発言した単語を把握することが可能になる。
【0057】
なお、表示制御部104は、ステップS36で検出した各単語を、例えば図17に例を示すように、ステップS34で検出された各キーワードとは異なる表示形態で表示部115に表示させてもよい(図15のステップS47における括弧書)。
【0058】
次に、第6実施形態に係る情報処理装置1による発話解析処理について説明する。図18は、第6実施形態に係る情報処理装置1による発話解析処理を示すフローチャートである。
【0059】
第6実施形態では、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS51〜ステップS54)、表示制御部104は、第2検出部103によって検出された各キーワードについて、各キーワードの検出数をカウントする。そして、表示制御部104は、カウントした各キーワードの検出数に応じて、当該キーワードを表示部115に表示する際の画像の大きさを決定する(ステップS55)。表示制御部104は、検出数が多いキーワードほど、画像の大きさを大きくする。更に、表示制御部104は、カウントした各キーワードの検出数に応じて、当該キーワードを表示部115に表示する際の画像の表示位置を決定する(ステップS55)。例えば、表示制御部104は、検出数が多いキーワードほど、画像の表示位置を、表示部115の表示画面の縦方向中央部に近い位置とする。このとき、表示制御部104は、キーワードのそれぞれについて、表示部115の表示画面における異なる表示位置を設定する。
【0060】
また、表示制御部104は、このように画像大きさ及び表示位置を決定したキーワードを、表示部115に表示するとき、図19に例を示すようにして、タグクラウド形式で表示させる(ステップS56)。
【0061】
この第6実施形態によれば、ユーザーは、視覚的及び直感的に、いずれのキーワードが最も出現数が多いかを把握することが可能になる。
【0062】
次に、表示部115に表示されている各キーワードについての付加情報を表示させる処理を説明する。図20は、表示部115に表示されている各キーワードについての付加情報を表示させる処理を示すフローチャートである。
【0063】
第6実施形態において、表示制御部104が、表示部115にタグクラウド形式で各キーワード又は上記単語を表示させているときに、操作者によるマウス等からなる入力部119の操作で、表示部115の表示画面における位置が指定されたとき(S61でYES)、表示制御部104は、入力部119により指定された当該位置に表示されているキーワードを検出し(ステップS62)、当該検出したキーワードに対応付けてHDD114に記憶されている付加情報を特定する(ステップS63)。表示制御部104は、当該特定した付加情報を、図21に例を示すようにして、更に表示部115の表示画面に表示させる(ステップS64)。ここで、付加情報とは、例えば、キーワードの出現数、会議での発言時刻、誰による発言か、等の情報である。付加情報は、HDD114が記憶している。
【0064】
この第6実施形態によれば、ユーザーは、簡単な操作で、表示されているキーワードについての付加情報を視認することが可能である。
【0065】
また、上記実施形態において、図1乃至図21を用いて示した構成及び処理は、本発明の一実施形態に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11A
図11B
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21