(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0011】
以下、本発明の一実施形態に係る情報処理装置、発話解析方法、及び発話解析プログラムについて図面を参照して説明する。
図1は、本発明の第1実施形態に係る情報処理装置、及び当該情報処理装置により発話解析が行われる対象者を示す図である。
【0012】
情報処理装置1は、予め定められた複数人からなる複数の会話グループG1〜G3に属する各人が発した音声を音声データとして取得する。例えば、グループG1に属する人P11,P12,P13、グループG2に属する人P21,P22,P23、グループG3に属する人P31,P32,P33からなる複数人(本実施形態では3つのグループに属する各人からなる合計9人として説明するが、これに限定されるものではない。)が、グループ単位でミーティング、討論、授業、又は会議など(以下、総称して単に「会議」という。)を行っているものとする。
【0013】
当該会話グループの各人は、マイクロフォン機能を備えたヘッドセット2を使用した状態で発声する。すなわち、当該各人が用いるそれぞれのヘッドセット2は、ヘッドセット2を装着した人の会話の音声を取得し、当該音声を示す電気信号に変換して、情報処理装置1に出力する。情報処理装置1と、各ヘッドセット2とは、例えば、ケーブル接続による有線通信、又は、Bluetooth(登録商標)若しくは無線LAN等の無線通信により接続されている。情報処理装置1は、各ヘッドセット2から出力されてくる上記音声を示す電気信号を、ディジタルの音声信号からなる音声データに変換し、ヘッドセット2毎、すなわち、上記人P11〜P33の9人についての音声データをそれぞれに蓄積する。
【0014】
次に、第1実施形態に係る情報処理装置1の構成について説明する。
図2は、情報処理装置1の内部構成の概略を示すブロック図である。
【0015】
情報処理装置1は、例えばコンピューターである。情報処理装置1は、制御ユニット10と、ROM(Read Only Memory)112と、RAM(Random Access Memory)113と、HDD(Hard Disk Drive)114と、表示部115と、通信インターフェイス118と、指示入力部119とを備える。これら各部は、互いにCPU(Central Processing Unit)バスによりデータ又は信号の送受信が可能とされている。
【0016】
制御ユニット10は、情報処理装置1全体の動作制御を司る。ROM112は、情報処理装置1の基本動作についての動作プログラムを記憶する。RAM113は、制御ユニット10の動作領域等として使用される。
【0017】
HDD114は、その記憶領域の一部に、本発明の第1実施形態に係る発話解析プログラムを記憶している。また、HDD114は、上記人P11〜P33の9人についてのそれぞれの上記音声データを記憶する。なお、HDD114は、特許請求の範囲における記憶部の一例でもある。但し、情報処理装置1が備える不揮発性ROM(例えば、制御ユニット10が内蔵)が当該記憶部として機能してもよい。
【0018】
情報処理装置1と接続されているヘッドセット2には、当該ヘッドセット2を特定するための識別情報が予め付されている。識別情報としては、ヘッドセット2を特定可能な情報であれば特に限定されないが、例えば、識別番号がある。HDD114は、ヘッドセット2ごとに当該識別情報を予め記憶している。HDD114はまた、指示入力部119を介してユーザーによって入力される指示に応じて、識別情報のそれぞれを、グループを特定するためのグループ情報と対応付けて記憶している。
【0019】
本実施の形態では、HDD114は、人P
11,P
12,P
13がそれぞれ使用しているヘッドセット2の識別情報を、グループG1を特定するグループ情報と対応付けて記憶している。HDD114はまた、人P21,P22,P23がそれぞれ使用しているヘッドセット2の識別情報を、グループG2を特定するグループ情報と対応付けて記憶している。HDD114はさらに、人P31,P32,P33がそれぞれ使用しているヘッドセット2の識別情報を、グループG3を特定するグループ情報と対応付けて記憶している。
【0020】
表示部115は、LCD(Liquid Crystal Display)等からなり、情報処理装置1を操作する操作者に対する操作案内等が表示される。
【0021】
通信インターフェイス118は、USBインターフェイス又は無線LANインターフェイス等を有する。通信インターフェイス118は、上記各ヘッドセット2とのデータ通信を行うためのインターフェイスとして機能する。通信インターフェイス118は、特許請求の範囲における音声入力部の一例である。
【0022】
指示入力部119は、キーボード又はマウス等から構成され、操作指示が操作者によって入力される。
【0023】
制御ユニット10は、プロセッサー、RAM、及びROMなどから構成される。プロセッサーは、CPU、MPU(Micro Processing Unit)、又はASIC(Application Specific Integrated Circuit)等である。この制御ユニット10は、HDD114に記憶されている発話解析プログラムが上記のプロセッサーで実行されることにより、制御部100、第1検出部101、テキスト化部102、第2検出部103、表示制御部104、仕分部105、及び抽出部106として機能する。なお、制御部100、第1検出部101、テキスト化部102、第2検出部103,表示制御部104、仕分部105、及び抽出部106は、ハード回路により構成されてもよい。
【0024】
制御部100は、情報処理装置1全体の動作制御を司る機能を有する。
【0025】
第1検出部(発言検出部)101は、HDD114に記憶されている人P11〜P33の9人についての音声データのそれぞれから、音声データに記録されている発話の中でされている発言を検出する。
図3は、音声データの一例を示す図である。
図3の縦軸は音の振幅(単位dB)、横軸は時刻を示す。第1検出部101は、音声データを解析し、音声データが示す振幅のうち、予め定められた規定時間(例えば、0.25秒)以上連続して、予め定められた大きさ以上の振幅(例えば、20dB)が続く部分を発言として検出する。
図3に示す音声データでは、第1検出部101は、a部分、b部分、及びc部分を発言として検出する。
【0026】
テキスト化部102は、既知の音声認識機能を備え、これにより、上記音声データに含まれる上記各人の発言の内容をキャラクター変換してテキスト化する。
【0027】
第2検出部(キーワード検出部)103は、テキスト化部102によってテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する。
【0028】
表示制御部104は、第2検出部103によって検出された上記予め定められたキーワードを表示部115に表示させる。また、表示制御部104は、第2検出部103によって検出された上記予め定められたキーワードのうち、検出数が予め定められた第1の値以上であるキーワードを、表示部115に表示させる。
【0029】
仕分部(種別仕分部)105は、第2検出部103によって検出された上記予め定められたキーワードを、予め定められたそれぞれの種別に仕分ける。表示制御部104は、属する各キーワードの検出数の合計が予め定められた第2の値以上である種別及び当該種別に属するキーワードを、表示部115に表示させる。
【0030】
抽出部(単語抽出部)106は、テキスト化部102によってテキスト化されたテキストデータから、上記予め定められたキーワード以外の単語を抽出する。表示制御部104は、抽出部106によって抽出された単語のうち、検出数が予め定められた第3の値以上である単語を表示部115に表示させる。
【0031】
次に、第1実施形態に係る情報処理装置1による発話解析処理について説明する。
図4は、第1実施形態に係る情報処理装置1による発話解析処理を示すフローチャートである。
【0032】
当該発話解析が行われる場面は、会話グループG1〜G3に属する各人が、それぞれのグループ毎に会議を行っている場面である。人P11〜P33は、各自がヘッドセット2を装着し、各ヘッドセット2は上述したように情報処理装置1に対して通信可能に接続されている。この状態で、人P11〜P33は、各自が属するそれぞれのグループにおいて会議中に発話を行う。人P11〜P33によって発話された音声は、人P11〜P33のそれぞれのヘッドセット2により集音され、情報処理装置1に出力される。
【0033】
情報処理装置1は、通信インターフェイス118を介して、各ヘッドセット2から音声データを取得する(ステップS1)。すなわち、通信インターフェイス118が、各ヘッドセット2から出力されてくる上記音声を示す電気信号を受信すると、第1検出部101が、当該取得された音声を示す電気信号を、ディジタルの音声信号からなる音声データに変換してHDD114に記憶させる。第1検出部101は、人P11〜P33毎に、すなわち、HDD114に記憶されている識別情報に対応付けて、当該音声データをHDD114に記憶させる。
【0034】
続いて、第1検出部101は、人P11〜P33毎にHDD114に記憶されている音声データのそれぞれから、当該音声データが示す発話の中でされている各発言を、上述したようにして検出する(ステップS2)。
【0035】
そして、テキスト化部102は、上記音声データに含まれる上記各人の発言の内容を、音声認識機能によりキャラクター変換してテキスト化する(ステップS3)。第1検出部101は、上記音声データにおける、人P11〜P33の各発言にあたる時間帯をHDD114に記憶させており、テキスト化部102は、上記音声データにおける当該時間帯部分を発言と認識して、当該発言の内容をキャラクター変換してテキスト化する。
【0036】
続いて、第2検出部103は、テキスト化部102によって上記のようにテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する(ステップS4)。例えば、HDD114に、予め定められたキーワードとして、「水蒸気」、「気圧」、「変化」及び「融解」が記憶されている場合、第2検出部103は、上記発言がテキスト化されてなるテキストデータに、当該キーワードが含まれているか否かを判断する。第2検出部103は、当該キーワードが含まれている場合には、キーワードを検出して、当該キーワードの出現数をカウントアップする。第2検出部103は、各キーワードの出現数を識別情報に対応付けて、HDD114に記憶させておく。
【0037】
そして、表示制御部104は、第2検出部103によって検出された上記各キーワードを表示部115に表示させる(ステップS5)。予め定められたキーワードが上記の例に示すものである場合、
図5に示すように、表示制御部104は、HDD114に記憶されている識別情報及びグループ情報に基づいて、各キーワードの出現数をグループ毎に集計し、人P11〜P33のグループ毎に、各キーワードと各キーワードの出現数とを示す画像を表示部115に表示させる。なお、
図5に示すように、表示制御部104は、第2検出部103によって検出されなかったキーワード(検出数「0」のキーワード)を、検出数「0」として表示部115に表示させてもよい。
【0038】
また、表示制御部104は、指示入力部119の操作で操作者から入力される画面切換指示に従って、
図6に示すように、全グループを通じた、各キーワードと各キーワードの出現数とを示す画像を表示部115に表示させる。或いは、表示制御部104は、指示入力部119の操作で操作者から入力される画面切換指示に従って、
図7に示すように、全グループを通じて、出現数が上位の3つのキーワードを、出現数が多い順に並べた画像を表示部115に表示させる。
【0039】
図8は、第2実施形態に係る情報処理装置1による発話解析処理を示す図である。
図8に示すように、第2実施形態では、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS11〜ステップS14)、表示制御部104は、第2検出部103によって検出されたキーワードのうち、検出数が予め定められた第1の値以上であるキーワードを検出して(ステップS15)、当該検出した各キーワードをそれぞれの検出数と共に、表示部115に表示させる(ステップS16)。
【0040】
例えば、表示制御部104は、
図9に示すように、第1の値が「12」である場合、検出数が第1の値以上であるキーワードを検出して、当該検出したキーワード及びその検出数のみをグループ毎に表示部115に表示させる。
【0041】
これら第1及び第2実施形態によれば、グループでの会議等においてされた発言の内容を、ユーザーが視認可能となるように表示することができる。これにより、ユーザーは、当該表示を視認して、会議出席者による発言の内容を正確に把握することが可能になる。
【0042】
図10は、第3実施形態に係る情報処理装置1による発話解析処理を示す図である。第3の実施形態では、
図10に示すように、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS21〜ステップS24)、表示制御部104は、各キーワードの検出回数に応じて、各キーワードに予め付されているポイントをキーワード毎に集計し(ステップS25)、集計したポイントと共に、各キーワードを表示部115に表示させる(ステップS26)。更には、表示制御部104は、グループG1〜G3毎に、全キーワードのポイントの合計を算出して表示してもよい。なお、第3実施形態では、予め定められたキーワードは複数とされる。
【0043】
HDD114は、各キーワードについて、検出回数1回毎に加算される予め定められたポイントを記憶している。当該ポイントは、会議における重要度等に応じて主催者等が予め設定し、例えば指示入力部119の操作によりHDD114に記憶させる。表示制御部104は、キーワードを1回検出する度にそのキーワードに付されたポイントを加算する。このため、多く検出されたキーワードは、集計されるポイントが高くなる。
【0044】
例えば、
図11Aに示すように、HDD114が、キーワードごとに設定されているポイントとして、「水蒸気」に対して2ポイント、「気圧」に対して3ポイント、「変化」に対して1ポイント、「融解」に対して5ポイントを記憶しているとき、表示制御部104は、各キーワードの検出回数に応じてポイントをキーワード毎に集計する。表示制御部104は更に、グループG1〜G3毎に、全キーワードのポイント合計を算出し、
図11Bに示す「集計結果」のような表示画面を表示部115に表示させることにより、集計したポイント及び各キーワードと、全キーワードのポイントの合計とをグループG1〜G3毎に、表示部115に表示させる。
【0045】
この第3実施形態によれば、ユーザーは、表示されたキーワード及び集計ポイントを視認することで、その会議において、重要なキーワードがどの程度用いられているかを把握でき、更には、全キーワードのポイント合計を視認することで、どのグループが最も有意義な会議を行ったかを判断するための指標を得ることができる。
【0046】
次に、第4実施形態に係る情報処理装置1による発話解析処理について説明する。
図12は、第4実施形態に係る情報処理装置1による発話解析処理を示すフローチャートである。
【0047】
第4実施形態では、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS31〜ステップS34)、仕分部105が、第2検出部103によって検出されたキーワードを、予め定められた種別に仕分ける(ステップS35)。例えば、HDD114は、予め定められた種別として、「天気」、「スポーツ」、及び「社会」を記憶している。HDD114は、更に、種別「天気」に属するキーワードとして、「晴れ」「曇り」「雨」「雲」「白い」「煙」というキーワードを予め記憶している。また、HDD114は、更に、種別「スポーツ」に属するキーワードとして、「テニス」「野球」「サッカー」「中止」「決勝」「勝敗」というキーワードを予め記憶している。また、HDD114は、更に、種別「社会」に属するキーワードとして、「経済」「企業」「株価」「景気」「売上」「損益」というキーワードを予め記憶している。
【0048】
この場合、第2検出部103は、各人による各発言から、まず、「晴れ」「曇り」「雨」「雲」「白い」「煙」「テニス」「野球」「サッカー」「中止」「決勝」「勝敗」「企業」「株価」「景気」「売上」「損益」を検出する。そして、仕分部105は、検出された各キーワードを、種別「天気」「スポーツ」「社会」のいずれの種別に属するかを判断し、検出された各キーワードを種別毎に仕分ける。
図13に、種別、種別に属するキーワード、及び検出数の例を示す。仕分部105は、出現したキーワードを各種別に仕分け、各種別に属する各キーワードの検出数をカウントしておき、当該検出数をキーワードと共にHDD114に記憶させる。
【0049】
続いて、表示制御部104は、検出数が予め定められた第2の値以上である種別を検出する(ステップS36)。すなわち、表示制御部104は、種別に属する各キーワードの検出数の合計が上記第2の値以上である種別を検出する。例えば、第2の値が「150」であり、
図13に示した種別、種別に属するキーワード、及び検出数の場合、表示制御部104は、例えば、グループG1については、種別「社会」を検出する。
【0050】
そして、表示制御部104は、当該検出した種別を、当該種別に属する各キーワードのそれぞれの検出数と共に、表示部115に表示させる(ステップS37)。表示制御部104は、上記のように、グループG1については種別「社会」を検出し、グループG2については種別「天気」を検出し、グループG3についても種別「天気」を検出した場合、
図14に例を示すように、検出した種別と、当該種別に属する各キーワード及びそれぞれの検出数を表示部115に表示させる。
【0051】
この第4実施形態によれば、検出したキーワードを各種別に仕分けし、更に、属する各キーワードの検出数の合計が第2の値以上である種別が表示されるので、ユーザーは、予め定められた各キーワードが多く出現する種別を的確に把握することが可能になる。
【0052】
次に、第5実施形態に係る情報処理装置1による発話解析処理について説明する。
図15は、第5実施形態に係る情報処理装置1による発話解析処理を示すフローチャートである。
【0053】
第5実施形態では、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS41〜ステップS44)、抽出部106が、ステップS33でテキスト化されたテキストデータから、上記予め定められたキーワード以外の単語を抽出する(ステップS45)。すなわち、第
5実施形態では、表示制御部104が、上記予め定められたキーワードを検出すると共に、抽出部106が、上記予め定められたキーワード以外の単語を抽出する。
【0054】
表示制御部104は、抽出部106によって抽出された上記単語のうち、検出数が予め定められた第3の値以上である単語を検出して(ステップS46)、当該検出した各単語をそれぞれの検出数と共に、表示部115に表示させる(ステップS47)。
【0055】
例えば、表示制御部104は、第3の値が例えば「15」である場合、
図16に示すように、上記予め定められたキーワード以外の単語であって、検出数が第3の値以上である単語と、その検出数とを表示部115に表示させる。
【0056】
この第5実施形態によれば、グループでの会議等において、予め定められたキーワードではなくても、出現数の多い単語があれば検出して表示するため、ユーザーは、当初はユーザーが注目していなかったが、実際に会議をしてみると会議出席者が注目して発言した単語を把握することが可能になる。
【0057】
なお、表示制御部104は、ステップS36で検出した各単語を、例えば
図17に例を示すように、ステップS34で検出された各キーワードとは異なる表示形態で表示部115に表示させてもよい(
図15のステップS47における括弧書)。
【0058】
次に、第6実施形態に係る情報処理装置1による発話解析処
理について説明する。
図18は、第6実施形態に係る情報処理装置1による発話解析処理を示すフローチャートである。
【0059】
第6実施形態では、第1実施形態におけるステップS1〜ステップS4と同様にしてキーワード検出までの処理を終えた後(ステップS51〜ステップS54)、表示制御部104は、第2検出部103によって検出された各キーワードについて、各キーワードの検出数をカウントする。そして、表示制御部104は、カウントした各キーワードの検出数に応じて、当該キーワードを表示部115に表示する際の画像の大きさを決定する(ステップS55)。表示制御部104は、検出数が多いキーワードほど、画像の大きさを大きくする。更に、表示制御部104は、カウントした各キーワードの検出数に応じて、当該キーワードを表示部115に表示する際の画像の表示位置を決定する(ステップS55)。例えば、表示制御部104は、検出数が多いキーワードほど、画像の表示位置を、表示部115の表示画面の縦方向中央部に近い位置とする。このとき、表示制御部104は、キーワードのそれぞれについて、表示部115の表示画面における異なる表示位置を設定する。
【0060】
また、表示制御部104は、このように画像大きさ及び表示位置を決定したキーワードを、表示部115に表示するとき、
図19に例を示すようにして、タグクラウド形式で表示させる(ステップS56)。
【0061】
この第6実施形態によれば、ユーザーは、視覚的及び直感的に、いずれのキーワードが最も出現数が多いかを把握することが可能になる。
【0062】
次に、表示部115に表示されている各キーワードについての付加情報を表示させる処理を説明する。
図20は、表示部115に表示されている各キーワードについての付加情報を表示させる処理を示すフローチャートである。
【0063】
第6実施形態において、表示制御部104が、表示部115にタグクラウド形式で各キーワード又は上記単語を表示させているときに、操作者によるマウス等からなる入力部119の操作で、表示部115の表示画面における位置が指定されたとき(S61でYES)、表示制御部104は、入力部119により指定された当該位置に表示されているキーワードを検出し(ステップS62)、当該検出したキーワードに対応付けてHDD114に記憶されている付加情報を特定する(ステップS63)。表示制御部104は、当該特定した付加情報を、
図21に例を示すようにして、更に表示部115の表示画面に表示させる(ステップS64)。ここで、付加情報とは、例えば、キーワードの出現数、会議での発言時刻、誰による発言か、等の情報である。付加情報は、HDD114が記憶している。
【0064】
この第6実施形態によれば、ユーザーは、簡単な操作で、表示されているキーワードについての付加情報を視認することが可能である。
【0065】
また、上記実施形態において、
図1乃至
図21を用いて示した構成及び処理は、本発明の一実施形態に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。