(58)【調査した分野】(Int.Cl.,DB名)
前記選択部は、継続したい会議の絞込みを、前記会議の出席者、前記会議に関する時刻、および前記議事録から抽出されたキーワードのうち少なくとも1つで絞込みを行う、請求項1に記載の会議支援装置。
前記選択部は、継続したい会議の2回目以降の絞り込みの際に、前記会議の出席者を追加して提示、および前記議事録から抽出されたキーワードを追加して提示のうち少なくとも1つを行うようにする、請求項1から請求項3のいずれか1項に記載の会議支援装置。
【発明を実施するための形態】
【0016】
以下、本発明の実施の形態について図面を参照しながら説明する。
【0017】
まず、本実施形態の会議支援装置が使用される状況例を説明する。
本実施形態の会議支援装置は、例えば2人以上が参加して行われる会議で用いられる。会議支援装置は、会議の終了時に、その会議が中断なのか終了なのかフラグを付与して記憶する。そして、会議支援装置は、会議に関する情報(参加者、キーワード等)を議事録に関連づけて記憶する。会議支援装置は、会議が再開される際に、利用者の音声を音声認識した結果に基づいて中断されている会議の議事録から候補の議事録を提示する。会議支援装置は、利用者の音声によって、候補の中から再開したい会議を選び、再開された会議の議事録の作成を継続する。
【0018】
図1は、本実施形態に係る会議支援装置1の構成例を示すブロック図である。
図1に示すように、会議支援装置1は、収音部101、取得部102、音声認識辞書DB103(音声認識用辞書)、音声認識部104、テキスト変換部105(音声認識部)、係り受け解析部106(音声認識部)、議事録作成部107(キーワード抽出部)、議事録記憶部108、議事録選択部109(選択部)、画像生成部110、表示部111、および操作部112を備える。
【0019】
会議支援装置1は、例えばタブレット端末、スマートフォン、ノートパソコン等である。
【0020】
収音部101は、マイクロフォンである。収音部101は、利用者の音声信号を収音し、収音した音声信号を取得部102に出力する。なお、収音部101は、参加者毎に装着される。また、収音部101は、マイクロフォンアレイであってもよい。
【0021】
取得部102は、収音部101が出力する音声信号をアナログ信号からデジタル信号に変換して、デジタル信号に変換した音声信号を音声認識部104に出力する。なお、収音部101が複数の場合、取得部102は、収音部101毎に例えば時分割処理を行う。
【0022】
音声認識辞書DB103は、例えば音響モデル、言語モデル、単語辞書等を格納しているデータベースである。音響モデルとは、音の特徴量に基づくモデルであり、言語モデルとは、単語とその並び方の情報のモデルである。また、単語辞書とは、多数の語彙による辞書であり、例えば大語彙単語辞書である。なお、会議支援装置1は、音声認識辞書DB103に格納されていない単語等を格納して更新するようにしてもよい。なお、音声認識辞書DB103は、例えば会議毎にDB(データベース)を備えている。例えば、第1のDBが一般の会議用で有り、第2のDBが発表会用であり、第3のDBが国際会議用である。このように会議に合わせたDBを用いることで、同音異義語等の変換等を適切に行わせることができる。
【0023】
音声認識部104は、取得部102が出力する音声信号を取得する。音声認識部104は、音声信号から発話区間の音声信号を検出する。発話区間の検出は、例えば所定のしきい値以上の音声信号を発話区間として検出する。なお、音声認識部104は、発話区間の検出を周知の他の手法を用いて行ってもよい。音声認識部104は、検出した発話区間の音声信号に対して、音声認識辞書DB103を参照して、周知の手法を用いて音声認識を行う。なお、音声認識部104は、例えば特開2015−64554号公報に開示されている手法等を用いて音声認識を行う。音声認識部104は、認識した認識結果と音声信号をテキスト変換部105に出力する。なお、音声認識部104は、認識結果と音声信号とを、例えば1文毎、または発話句間毎、または話者毎に対応つけて出力する。
なお、音声認識部104は、音声信号が同時に入力された場合、例えば時分割処理によって収音部101毎に音声認識を行う。また、音声認識部104は、マイクロフォンがマイクロフォンアレイの場合、音源分離処理、音源定位処理、音源同定処理等、周知の音声認識処理も行う。
音声認識部104は、議事録選択部109が出力する使用する音声認識辞書DB103を示す情報に基づいて、音声認識処理等に使用する音声認識辞書DB103を切り替える。
【0024】
テキスト変換部105は、音声認識部104が出力する認識結果に対して、音声認識辞書DB103を参照して、テキストに変換する。なお、テキスト情報は、少なくとも1文字の情報を含む。テキスト変換部105は、変換したテキスト情報と、取得した音声信号を係り受け解析部106に出力する。なお、テキスト変換部105は、発話情報を認識した結果から「あー」、「えーと」、「えー」、「まあ」等の間投詞を削除してテキストに変換するようにしてもよい。
【0025】
係り受け解析部106は、テキスト変換部105が出力したテキスト情報に対して、音声認識辞書DB103を参照して、形態素解析と係り受け解析を行う。なお、係り受け解析には、例えば、Shift−reduce法や全域木の手法やチャンク同定の段階適用手法においてSVM(Support Vector Machines)を用いる。
係り受け解析部106は、会議を再開する際、形態素解析と係り受け解析を行ったテキスト情報と、解析した結果を議事録選択部109に出力する。
なお、議事録の作成は、例えば、「会議を開始します」等、予め定められたキーワードを検出した後に開始される。または、議事録の作成は、表示部111上に表示されるアイコン(例えば
図7参照)を利用者が操作部112を操作した結果に基づいて開始される。会議開始後に、係り受け解析部106は、形態素解析と係り受け解析を行ったテキスト情報と、解析した結果を議事録作成部107に出力する。なお、係り受け解析部106は、テキスト変換部105が出力する音声信号も議事録作成部107に出力する。
また、係り受け解析部106は、議事録作成部107が会議の終了または中断後に議事録を作成する場合、解析した結果に発話者と発話時間を付与して画像生成部110に出力する。なお、発話者(参加者)名は、参加者が使用する収音部101毎に予め係り受け解析部106が記憶していてもよく、会議開始時に参加者が発話によって入力してもよい。
【0026】
議事録作成部107は、係り受け解析部106が出力したテキスト情報に基づいて、発話者毎に分けて、議事録を作成する。議事録作成部107は、作成した議事録(テキスト情報)と対応する音声信号を議事録記憶部108に記憶させる。なお、議事録作成部107は、会議の開催中に議事録を作成するようにしてもよく、会議が終了または中断された後に議事録を作成するようにしてもよい。議事録作成部107は、議事録を作成する際、または議事録作成後に会議におけるキーワードを抽出し、抽出したキーワードを議事録に関連づけて記憶させる。議事録作成部107は、例えばキーワードマッチングや表層パターンや特開2008−146150号公報に記載の発明の手法等を用いてキーワードを抽出する。または、議事録作成部107は、出現回数が多い言葉をキーワードとして抽出するようにしてもよい。また、議事録作成部107は、発話毎に発話者と発話日時を付与する。なお、発話者(参加者)名は、参加者が使用する収音部101毎に予め議事録作成部107が記憶していてもよく、会議開始時に参加者が発話によって入力してもよい。なお、議事録作成部107は、「あー」、「えーと」、「えー」、「まあ」等の間投詞を削除して議事録を作成するようにしてもよい。
議事録作成部107は、議事録選択部109が出力する選択された議事録を示す情報と、継続指示に応じて、選択された議事録の作成を継続する(再開する)。
【0027】
議事録記憶部108は、議事録と音声信号を対応付けて記憶する。なお、議事録記憶部108は、議事録に、参加者やキーワードを関連づけて、さらに会議状態(終了か中断か)を関連づけて記憶する。なお、議事録記憶部108が記憶する情報については後述する。
【0028】
議事録選択部109は、係り受け解析部106が出力する形態素解析と係り受け解析を行ったテキスト情報と、解析した結果を取得する。議事録選択部109は、取得した情報に基づいて、条件に合う議事録を、議事録記憶部108を参照して探索する。議事録選択部109は、探索した議事録に関する情報を画像生成部110に出力する。また、議事録選択部109は、会議開始前に議事録選択のために行われた発話のテキスト情報を画像生成部110に出力する。
また、議事録選択部109は、議事録作成部107が会議の開催中に議事録を作成している場合、作成させた議事録を議事録記憶部108から読み出し、読み出した議事録を画像生成部110に出力する。
議事録選択部109は、中断されている会議の中から、発話によって入力された音声信号に対して音声認識処理等を行った結果に基づいて、継続する会議を選択する。議事録選択部109は、選択した会議の議事録を示す情報と継続指示を議事録作成部107に出力する。また、議事録選択部109は、選択した会議の議事録に含まれる使用する音声認識辞書DB103を示す情報を音声認識部104に出力する。
【0029】
画像生成部110は、議事録選択部109が出力する議事録に関する情報とテキスト情報とに基づいて画像データを生成する。画像生成部110は、生成した画像データを表示部111に出力する。
【0030】
表示部111は、例えば液晶表示装置、有機EL表示装置、電子インク表示装置等である。表示部111は、画像生成部110が出力する画像データを表示する。
【0031】
操作部112は、例えば表示部111上に設けられたタッチパネル式のセンサー、または優先接続または無線接続のキーボード等である。操作部112は、利用者の操作を検出し、検出した結果を議事録選択部109に出力する。
【0032】
<議事録記憶部108が記憶する情報>
次に、議事録記憶部108が記憶する情報例を説明する。
図2は、本実施形態に係る議事録記憶部108が記憶する情報例を示す図である。
図2に示すように、議事録記憶部108は、会議の名称に、番号と、出席者と、議事録の最終更新日時と、会議状態と、キーワードと、を関連付けて記憶する。例えば、議事録記憶部108は、会議の名称が「経営会議A」に、番号「1」と、出席者「山田、佐藤、竹田」と、最終更新日時「2018.1.13 17:30」と、会議状態「中断」と、キーワード「開発方針、経費削減、業務改善、・・・」を関連付けて記憶する。なお、会議の名称は、利用者が音声で入力してもよく、操作部112を操作して入力してもよい。また、キーワードは、利用者が音声で入力してもよく、操作部112を操作して入力してもよい。なお、最終更新日時は、例えば会議が終了または中断された日時である。
【0033】
<会議状態>
次に、会議状態と議事録の作成例を説明する。
図3は、本実施形態に係る会議状態と議事録の作成例を示す図である。
図3において、横軸は時間tである。
符号g11の示す例では、新規会議が時刻t1に開始され時刻t2に終了した例である。
符号g12の示す例では、新規会議が時刻t11に開始され時刻t12に中断され、時刻12〜t13の期間に休憩が入り、時刻t13に再開され時刻t14に終了した例である。
【0034】
符号g13の示す例では、新規会議Aが時刻t21に開始され時刻t22に中断され、時刻22〜t23の期間に休憩が入り、新規会議Bが時刻t23に開始され時刻t24に中断され、時刻24〜t25の期間に休憩が入り、新規会議Aが翌日の時刻t25に再開され時刻t26に終了した例である。
【0035】
このように、会議によっては、再開が別の日になる場合がある。また、中断された会議の間に、他の会議が行われ、その他の会議も中断状態の場合もあり得る。符号g13の場合、中断された会議が2つあるため、会議を再開する際に、どの会議を再開するか選択する必要が生じる。中断された会議が多数の場合や、中断された日時が数日前や数週間前の場合、継続したい会議のデータである議事録を探すのは会議名称だけでは困難である。
このため、本実施形態では、利用者の音声入力に応じて、中断されている会議の議事録に関する情報(会議の名称、出席者、議事録の最終更新日時、会議状態、キーワード)を提示し、更に提示された情報から利用者の音声入力によって絞り込みを行う。
【0036】
<中断した会議を再開する際に表示部に提示される情報>
次に、中断した会議を再開する際に表示部に提示される情報例を説明する。
図4は、本実施形態に係る中断した会議を再開する際に表示部に提示される情報例を示す図である。
【0037】
画像g20は、中断した会議を再開する際に、まず表示部111に提示される画像例である。符号g21は、中断された会議のリストであり、右のスクロール部を操作部112を操作することで、リストを上下にスクロールさせることができる。符号g22は、利用者が、再開したい会議を選択するために入力した音声に対して音声認識処理を行った結果である。この場合、音声入力は「伊藤さんと一緒に会議をやった続きを再開したい。」である。
【0038】
画像g30は、画像g20において入力された音声に基づいて抽出された議事録の候補を提示した画像である。
符号g31は、第1候補であり、番号、会議の名称、参加者、最終更新日時およびキーワードを含む。符号g32は、第2候補であり、番号、会議の名称、参加者、最終更新日時およびキーワードを含む。
符号g33は、利用者が入力した音声に対して音声認識処理を行った結果である。この場合、音声入力は「管理職会議Bをお願いします。」である。
【0039】
画像g40は、画像g30において入力された音声に基づいて抽出された議事録の候補を提示した画像である。
符号g41は、候補であり、番号、会議の名称、参加者、最終更新日時およびキーワードを含む。
符号g42は、利用者が、利用者が入力した音声に対して音声認識処理を行った結果である。この場合、音声入力は「それでお願いします。」である。
【0040】
画像g50は、再開したい会議の議事録が選択された後、会議が再開した際に、表示部111上に表示される画像である。
符号g51は、会議の参加者の発話を音声認識した結果のテキスト情報である。テキスト情報には、例えば、発話者と発話日時が含まれている。
なお、
図4に示した表示例は一例であり、これに限らない。
【0041】
図5は、本実施形態に係る会議録記憶部118が記憶する情報を説明するための図である。
図5に示すように、会議状態が終了の場合、会議録記憶部118は、その会議の議事録を記憶(保存)するが、その議事録に対して継続して記録することができない。
また、会議状態が中断の場合、会議録記憶部118は、その会議の議事録を記憶(保存)し、その議事録に対して再開が選択された場合、中断された議事録に再開された会議に議事録を追加して記録することができる。
【0042】
<会議支援装置1の処理>
次に、会議支援装置1が行う処理手順例を説明する。
図6は、本実施形態に係る会議開始時に会議支援装置1が行う処理手順例を示すフローチャートである。
【0043】
(ステップS1)利用者は、音声入力によって、ログイン手続きを行う。例えば、利用者は、利用者を識別する識別情報(利用者ID)とパスワードを入力する。または、利用者は、操作部112を操作して、ログイン手続きを行う。会議支援装置1は、参加者毎にログイン手続きを行う。
【0044】
(ステップS2)議事録選択部109は、参加者の音声、または操作部112が操作指された結果に基づいて、新規の会議を行うのか、中断された会議を再開するのかを設定する。なお、ステップS3〜S11の処理は、会議を再開する際の処理である。新規の会議の場合は、ステップS3〜S1の処理が行われない。また、会議支援装置1は、その会議に参加する参加者名の登録、参加者が使用する収音部101の登録等、会議の設定を行う。会議の設定には、収音部101がピンマイクであるのかマイクロフォンアレイであるか等の設定も含まれている。なお、議事録作成部107は、これらの会議の設定情報を議事録に対応付けて、議事録記憶部108に記憶させる。なお、議事録作成部107は、終了した会議については、会議の設定情報を記憶させないようにしてもよい。
【0045】
(ステップS3)議事録選択部109は、議事録記憶部108が記憶する情報を探索して、中断されている会議の議事録のリストの画像データ(例;
図4、画像g20、符号g21)を生成し、生成した画像データを画像生成部110に出力して表示部111上に表示させる。続けて、議事録選択部109は、どの会議を継続するか選択するため、発話を促す画像データ(例;
図4、画像g20の「継続中の会議は以下のとおりです。音声を発話してください」)を生成し、生成した画像データを画像生成部110に出力して表示部111上に表示させる。
【0046】
(ステップS4)参加者は、発話(例;
図4、画像g20、「伊藤さんと一緒に会議をやった続きを再開したい。」)を行う。収音部101は、発話された音声を取得する。
【0047】
(ステップS5)会議支援装置1は、収音部101が収音した音声信号に対して、音声認識処置、テキスト変換処理、係り受け解析処理を行う。
【0048】
(ステップS6)議事録選択部109は、ステップS5の処理により取得したテキスト情報(例;「伊藤さんと一緒に会議をやった続きを再開したい。」)に基づいて、その条件に合う中断されている会議の議事録を絞り込んで議事録記憶部108から読み出す。なお、絞り込みに使用するワードは、参加者名、会議に関する時刻(開催開始日時、または終了日時)、および会議で用いられたキーワードのうちの少なくとも1つである。
【0049】
(ステップS7)議事録選択部109は、読み出した条件に合う会議の議事録の画像データ(例;
図5、画像g30、符号g31、符号g32)を生成し、生成した画像データを画像生成部110に出力して表示部111上に表示させる。
【0050】
(ステップS8)参加者は、発話(例;
図4、画像g30の符号g33「管理職会議Bを御願いします。」または
図4、画像g40の符号42「それで御願いします。」)を行う。収音部101は、発話された音声を取得する。
【0051】
(ステップS9)会議支援装置1は、収音部101が収音した音声信号に対して、音声認識処置、テキスト変換処理、係り受け解析処理を行う。
【0052】
(ステップS10)議事録選択部109は、再開したい(継続したい)会議を絞り込めたか否かを判定する。例えば、議事録選択部109は、表示した結果に対して同意する発話内容であった場合に絞り込めたと判定し、同意しない発話であった場合に絞り込めていないと判定する。または、議事録選択部109は、ステップS7で表示部111上に表示させた候補の議事録が1つであった場合、再開したい(継続したい)会議を絞り込めたと判定し、ステップS7で表示部111上に表示させた候補の議事録が2つ以上であった場合、再開したい(継続したい)会議を絞り込めていないと判定する。議事録選択部109は、再開したい(継続したい)会議を絞り込めたと判定した場合(ステップS10;YES)、ステップS11の処理に進め、再開したい(継続したい)会議を絞り込めていないと判定した場合(ステップS10;NO)、ステップS7の処理に戻す。
【0053】
(ステップS11)会議支援装置1は、会議の再開が音声入力または操作部112の操作によって行われたとき、選択した議事録に対して議事録の作成を再開する。なお、会議支援装置1は、会議が再開された場合、ステップS2で設定された会議の設定を議事録記憶部108から読み出す。これにより、参加者は、再開する会議の再設定を行わずに済む。続けて、会議支援装置1は、会議を継続し、選択した議事録に継続した会議の内容を使いして1つの議事録として作成を継続する。続けて、会議支援装置1は、会議の終了時に会議を終了するか中断するかを示す情報を表示させる(
図7参照)。続けて、会議支援装置1は、会議を中断する際に、議事録に会議が中断されたことを示す情報(フラグ)を付加して議事録記憶部108に記憶させる。なお、会議支援装置1は、会議の設定情報を表示部111上に表示させる。これにより、参加者は、参加者の確認、参加者が使用する収音部101の番号を確認することができる。
【0054】
<会議中と会議終了時に表示部111上に表示される画像>
次に、会議中と会議終了時に表示部111上に表示される画像例を説明する。
図7は、本実施形態に係る会議中と会議終了時に表示部111上に表示される画像例を示す図である。
画像g100は、表示部111上に表示される画像である。
【0055】
領域g101は、参加者情報編集を行う領域である。領域g101の画像には、参加者に対応したアイコン画像、参加者の名前、参加者が使用するマイクロフォンの番号(または識別情報)等が含まれている。
【0056】
領域g102は、議事録を表示する領域である。なお、
図7では、ログイン後の状態を示している。領域g102の画像には、ログイン/ログアウトのボタン画像、会議の開始/終了のボタン画像、会議の開催中に点灯する表示、議事録の表示や音声信号の再生を行うボタン画像、収音部101の使用有無を選択するボタン画像、参加者の人数を示す画像、参加者の音声入力を音声認識処理した結果の画像等が含まれている。
【0057】
会議の終了が指示された場合、例えば操作部112の操作によって会議終了のボタン画像g103が選択された場合、議事録選択部109は、画像g110を表示させる指示を画像生成部110に出力することで、画像g110を表示部111上に表示させる。
画像g110には、会議の中断のボタン画像g111、会議終了のボタン画像g112、および会議終了の選択をキャンセルのボタン画像g113が含まれている。参加者は、操作部112を操作して、または音声入力によって、これら3つのうちから1つを選択する。
なお、会議開催中は、画像g110が表示されず、領域g101と領域g102の画像が表示部111上に表示される。聴覚障がい者の参加者は、表示部111上に表示される音声認識されて結果を見ることで、他の参加者の発話内容を理解することができる。
【0058】
図8は、
図7において、会議終了または会議継続が選択された場合に表示部111上に表示される画像例である。
画像g200は、表示部111上に表示される画像である。
【0059】
画像g210は、ログアウト処理を開始することを示す画像である。画像g210には、処理に同意するOKのボタン画像g211が含まれている。なお、OKのボタン画像g211が選択されない場合であっても、会議支援装置1は、所定の時間(例えば3秒)後にログアウト処理を行う。
【0060】
なお、
図7と
図8に示した画像は一例であり、表示部111上に表示される画像は、会議によって異なる。また、画像g110や画像g210も一例であり、画像は異なっていてもよい。例えば画像g210にはキャンセルのボタン画像が含まれていてもよい。
【0061】
<会議開始時に表示部111上に表示される画像>
次に、会議開始時に表示部111上に表示される画像例を説明する。
図9は、本実施形態に係る会議開始時に表示部111上に表示される画像例を示す図である。利用者は、操作部112を操作して、各設定を行う。画像g300は、表示部111上に表示される画像である。
領域g301の画像は、会議設定を行う画像である。領域g301の画像には、例えば、音声認識を行うマイクロフォンの設定領域、音声録音の選択を行う設定領域、および会議形態(会議、テレビ会議、ワイガヤ、発表会等)を選択する設定領域等が含まれている。なお、「ワイガヤ」とは、ワイワイガヤガヤの略であり、自由に発言を行う会議である。
なお、各設定領域は一例であり、これに限らない。
【0062】
また、
図9に示すように、会議支援装置1は、会議の開始時に、画像g310の画像を表示させる。画像g310の画像には、新規の会議を開催する際に選択される新規のボタン画像g311、中断していた会議を再開する際に選択される継続のボタン画像g312が含まれる。
利用者は、操作部112を操作、または音声入力により、新規の会議を行うのか、中断されている会議を継続するのかを選択する。継続が選択された場合、
図4に示した画像g20が表示される。
【0063】
図10は、本実施形態に係る中断された会議リストの画像の他の例である。
画像g400は、表示部111上に表示される画像である。
領域301は、
図9と同様に会議設定の領域の画像である。
符号g410は、中断された会議リストの画像の他の例である。中断された会議リストは、会議の名称、会議が行われた場所、開催日時(開始時間)との情報を含んでいてもよい。なお、
図10に示した画像は一例であり、中断された会議リストに含まれる情報は、これに限らない。
【0064】
上述した実施形態によれば、中断されている会議の中から再開したい(継続したい)会議を、参加者の発話に基づいて絞って提示するようにした。これにより、参加者は、中断されている会議の中から再開したい(継続したい)会議を音声によって選択することができる。
【0065】
<第1変形例>
図4に示した例では、画像g30において音声入力によって画像g40のように1つの議事録に絞り込めた(会議を絞り込めた)例を説明したが、この処理によっても議事録を絞り込めない場合もあり得る。変形例では、このような場合の処理例を説明する。
【0066】
図11は、本実施形態の第1変形例における会議継続時に議事録を絞り込めなかった際に表示される画像例を示す図である。
画像g30aは、例えば2回の音声入力によっても会議を絞り込めなかった例に表示される画像例である。画像g30aには、第1の候補の画像g31aと、第2の候補の画像g32aが含まれている。参加者は、この画像からでは、再開したい会議を絞り込めなかったため、音声入力「絞り込めません。」(画像g33a)を行う。
【0067】
議事録選択部109は、音声入力「絞り込めません。」に基づいて、第1の候補と第2の候補について、情報を追加して再表示させる。画像g30bは、情報を追加して再表示させた画像例である。画像g30bでは、第1の候補の画像g31aに対して画像g31bのように、参加者として「鈴木」が追加され、キーワードとして「課題、欧州」が追加されている。また、画像g30bでは、第2の候補の画像g32aに対して画像g32bのように、参加者として「渡辺」が追加され、キーワードとして「米国、中国」が追加されている。
なお、追加される情報の個数は1つ以上であればよい。また、議事録選択部109は、追加した情報のみを表示させるようにしてもよい。
【0068】
利用者は、この追加された情報によって、継続したい会議を1つに絞り込みことができる。なお、参加者である利用者は、画像g30aの表示の際、追加してほしい情報を音声によって入力するようにしてもよい。利用者は、例えば、「絞り込めないので、キーワードをもっと表示してください。」等の発話を行うようにしてもよい。会議支援装置1は、この発話に対して音声認識等の処理を行い、画像g30bを表示させるようにしてもよい。
【0069】
第1変形例によれば、参加者が発話した内容で会議を絞りきれなかった場合に、候補の会議の議事録の情報を追加して提示する。これにより、参加者は、中断されている会議の中から再開したい(継続したい)会議を音声によって選択することができる。
【0070】
<第2変形例>
上述した会議支援装置1では、
図1に示す構成例を説明したが、会議支援装置に子機が接続されていてもよい。
この場合は、例えば会議の進行者が会議支援装置を使用し、他の参加者が子機を使用する。
【0071】
参加者のうち、発話が不自由な人が会議に参加していてもよい。発話可能な参加者は、参加者毎に収音部を装着するか、収音部を備える端末(スマートフォン、タブレット端末、パーソナルコンピュータ等)を用いる。聴覚障がいの参加者は、テキストを入力可能な端末を用いる。会議支援装置は、参加者の発話した音声信号に対して音声認識、テキスト化して、各自の端末にテキストを表示させる。また、会議支援装置は、聴覚障がい者が入力したテキスト情報を各自の端末にテキストを表示させる。
【0072】
図12は、本実施形態に係る第2変形例における会議支援システム2の構成例を示すブロック図である。
図12に示すように、会議支援システム2は、会議支援装置1Aと、子機3a、3b、・・・を備える。なお、子機3a、子機3b、・・・のうち1つを特定しない場合は、単に子機3という。
会議支援装置1Aと子機3とは、有線または無線のネットワークを介して接続されている。
【0073】
会議支援装置1Aは、収音部101、取得部102A、音声認識辞書DB103、音声認識部104、テキスト変換部105、係り受け解析部106A、議事録作成部107A、議事録記憶部108、議事録選択部109、画像生成部110A、表示部111、操作部112、および通信部113を備える。なお、会議支援装置1と同様の機能を有する機能部には同じ符号を用いて説明を省略する。
【0074】
子機3は、収音部301、操作部302(テキスト入力部)、処理部303、表示部304、および通信部305を備える。収音部301、操作部302、処理部303、表示部304(子機表示部)、および通信部305は、バス306を介して接続されている。
【0075】
子機3は、例えばスマートフォン、タブレット端末、パーソナルコンピュータ等である。なお、子機3は、音声出力部、モーションセンサー、GPS(Global Positioning System;全地球測位システム)等を備えていてもよい。
【0076】
収音部301は、マイクロフォンである。収音部301は、利用者の音声信号を収音し、収音した音声信号をアナログ信号からデジタル信号に変換して、デジタル信号に変換した音声信号を処理部303に出力する。
【0077】
操作部302は、利用者の操作を検出し、検出した結果を処理部303に出力する。操作部302は、例えば表示部304上に設けられたタッチパネル式のセンサー、または優先接続または無線接続のキーボード等である。
【0078】
処理部303は、操作部302が操作された操作結果に基づいて設定情報を生成し、生成した設定情報を通信部305に出力する。ここで、設定情報には、参加者の識別情報が含まれている。処理部303は、操作部302が操作された操作結果に基づいてログイン指示を生成し、生成したログイン指示を通信部305に出力する。ここで、ログイン指示には、参加者の識別情報、子機3の識別情報が含まれている。処理部303は、操作部302が操作された操作結果に基づくテキスト情報に識別情報を付加して通信部305に出力する。処理部303は、収音部301が出力する音声信号に識別情報を付加して通信部305に出力する。処理部303は、通信部305が出力する画像データを取得し、取得した画像データを表示部304に出力する。処理部303は、通信部305が出力するログインを許可する情報に基づいて、会議支援装置1Aとの通信を確立する。処理部303は、会議支援装置1Aから発言制限指示(入力制限指示)を受信した場合、テキスト入力に対して制限を行う。また、処理部303は、会議支援装置1Aから発言制限指示を受信した場合、音声入力に対しても制限を行うようにしてもよい。
【0079】
表示部304は、処理部303が出力した画像データを表示する。表示部304は、例えば液晶表示装置、有機EL(エレクトロルミネッセンス)表示装置、電子インク表示装置等である。なお、表示部304上に表示される画像については後述する。
【0080】
通信部305は、処理部303が出力する設定情報を、ネットワークを介して会議支援装置1Aへ送信する。通信部305は、処理部303が出力するログイン指示を、ネットワークを介して会議支援装置1Aへ送信する。通信部305は、処理部303が出力するテキスト情報または音声信号を、ネットワークを介して会議支援装置1Aへ送信する。なお、送信するテキスト情報または音声信号には、利用者の識別情報と子機3の識別情報が含まれている。通信部305は、会議支援装置1Aが送信した画像データを受信し、受信した画像データを処理部303に出力する。通信部305は、会議支援装置1Aが送信したログインを許可する情報を受信した場合、受信したログインを許可する情報を処理部303に出力する。
【0081】
取得部102Aは、取得部102が行う処理に加えて、通信部113が出力する子機3が送信した音声信号を取得する。
【0082】
係り受け解析部106Aは、係り受け解析部106が行う処理に加えて、通信部113が出力する子機3が送信したテキスト情報を取得する。
【0083】
議事録作成部107Aは、議事録作成部107が行う処理に加えて、通信部113が出力する子機3が送信した設定情報を取得する。
【0084】
画像生成部110Aは、生成した画像データを通信部113に出力する。画像データには、会議中に参加者が発話した結果を音声認識等の処理を行った結果(例えば
図7の符号g102の領域)が含まれている。
【0085】
通信部113は、子機3が送信した設定情報を取得し、取得した設定情報を議事録作成部107Aに出力する。通信部113は、子機3が送信したログイン指示を受信する。会議支援装置1Aは、受信したログイン指示に応じて、子機3のログイン手続きを行う。通信部113は、子機3から受信した音声信号を取得部102Aに出力する。通信部113は、子機3から受信した音声信号を係り受け解析部106Aに出力する。通信部113は、画像生成部110Aが出力する画像データを子機3へ送信する。
【0086】
この構成によって、第2変形例によれば、参加者は、他の参加者の発話内容を子機3の表示部304の表示によって理解することができる。この結果、第2変形例によれば、健聴者と聴覚障がい者とが一緒に会議に参加しやすくすることができる。
【0087】
なお、本発明における会議支援装置1(または1A)の機能の全てまたは一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより会議支援装置1(または1A)が行う処理の全てまたは一部を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0088】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0089】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形および置換を加えることができる。