(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-03-28
(45)【発行日】2025-04-07
(54)【発明の名称】会議システム、会議方法、及び会議プログラム
(51)【国際特許分類】
H04M 3/56 20060101AFI20250331BHJP
H04R 3/00 20060101ALI20250331BHJP
【FI】
H04M3/56
H04R3/00 310
(21)【出願番号】P 2021089301
(22)【出願日】2021-05-27
【審査請求日】2024-03-21
(73)【特許権者】
【識別番号】000005049
【氏名又は名称】シャープ株式会社
(74)【代理人】
【識別番号】100167302
【氏名又は名称】種村 一幸
(74)【代理人】
【識別番号】100135817
【氏名又は名称】華山 浩伸
(72)【発明者】
【氏名】齋藤 健允
【審査官】山中 実
(56)【参考文献】
【文献】特開2019-140517(JP,A)
【文献】米国特許第07835774(US,B1)
【文献】特開2017-028351(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04M 3/56
H04R 3/00
(57)【特許請求の範囲】
【請求項1】
第1ユーザーと第2ユーザーとを含む複数のユーザーのそれぞれに対してマイク及びスピーカーが割り当てられ、前記複数のユーザーがそれぞれ各自に割り当てられたマイク及びスピーカーを利用して会議を行う会議システムであって、
前記第1ユーザーに対して割り当てられた第1マイクが第1取得音声を取得して、当該第1取得音声を前記第2ユーザーに割り当てられた第2スピーカーから出力すると共に、前記第2ユーザーに対して割り当てられた第2マイクが第2取得音声を取得して、当該第2取得音声を前記第1ユーザーに割り当てられた第1スピーカーから出力する通話システムと、
前記第1ユーザー及び前記第2ユーザーの状態が前記通話システムを介さずに直接会話可能な直接会話状態であるか否かを判定する会話状態判定部と、
前記会話状態判定部の判定結果に基づき、前記通話システムに対して前記第1取得音声を前記第2スピーカーから出力させるか否かを制御する出力制御部と、
を備え
、
前記会話状態判定部は、前記第1マイクから取得した前記第1取得音声と前記第2マイクから取得した前記第2取得音声とが一致する場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定し、前記第1取得音声と前記第2取得音声とが一致しない場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定し、
前記出力制御部は、
前記会話状態判定部が前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定した場合に、前記通話システムに対して前記第1取得音声を前記第2スピーカーから出力させず、
前記会話状態判定部が前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定した場合に、前記通話システムに対して前記第1取得音声を前記第2スピーカーから出力させる、会議システム。
【請求項2】
前記出力制御部は、前記会話状態判定部の判定結果に基づき、前記通話システムに対して前記第2取得音声を前記第1スピーカーから出力させるか否かを制御する、
請求項
1に記載の会議システム。
【請求項3】
前記出力制御部は、
前記会話状態判定部が前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定した場合に、前記通話システムに対して前記第2取得音声を前記第1スピーカーから出力させず、
前記会話状態判定部が前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定した場合に、前記通話システムに対して前記第2取得音声を前記第1スピーカーから出力させる、
請求項
2に記載の会議システム。
【請求項4】
前記会話状態判定部は、前記第1取得音声に前記第2ユーザーの発話音声が含まれるか否かを判定し、前記第1取得音声に前記第2ユーザーの発話音声が含まれると判定した場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定する、
請求項1から請求項
3のいずれか1項に記載の会議システム。
【請求項5】
前記会話状態判定部は、前記第1取得音声に含まれる発話音声の発話者を特定し、特定結果に基づいて前記第1取得音声に前記第2ユーザーの発話音声が含まれるか否かを判定する、
請求項
4に記載の会議システム。
【請求項6】
前記会話状態判定部は、前記第2取得音声に前記第1ユーザーの発話音声が含まれるか否かを判定し、前記第2取得音声に前記第1ユーザーの発話音声が含まれると判定した場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定する、
請求項1から請求項
3のいずれか1項に記載の会議システム。
【請求項7】
前記会話状態判定部は、前記第2取得音声に含まれる発話音声の発話者を特定し、特定結果に基づいて前記第2取得音声に前記第1ユーザーの発話音声が含まれるか否かを判定する、
請求項
6に記載の会議システム。
【請求項8】
第1ユーザーと第2ユーザーとを含む複数のユーザーのそれぞれに対してマイク及びスピーカーが割り当てられ、前記複数のユーザーがそれぞれ各自に割り当てられたマイク及びスピーカーを利用して会議を行う会議方法であって、
一又は複数のプロセッサーが、
前記第1ユーザーに対して割り当てられた第1マイクが第1取得音声を取得して、当該第1取得音声を前記第2ユーザーに割り当てられた第2スピーカーから出力すると共に、前記第2ユーザーに対して割り当てられた第2マイクが第2取得音声を取得して、当該第2取得音声を前記第1ユーザーに割り当てられた第1スピーカーから出力する通話ステップと、
前記第1ユーザー及び前記第2ユーザーの状態が前記通話ステップを介さずに直接会話可能な直接会話状態であるか否かを判定する判定ステップと、
前記判定ステップにおける判定結果に基づき、前記通話ステップにおいて前記第1取得音声を前記第2スピーカーから出力させるか否かを制御する制御ステップと、
を実行
し、
前記判定ステップにおいて、前記第1マイクから取得した前記第1取得音声と前記第2マイクから取得した前記第2取得音声とが一致する場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定し、前記第1取得音声と前記第2取得音声とが一致しない場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定し、
前記制御ステップにおいて、
前記判定ステップで前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定した場合に、前記第1取得音声を前記第2スピーカーから出力させず、
前記判定ステップで前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定した場合に、前記第1取得音声を前記第2スピーカーから出力させる、会議方法。
【請求項9】
第1ユーザーと第2ユーザーとを含む複数のユーザーのそれぞれに対してマイク及びスピーカーが割り当てられ、前記複数のユーザーがそれぞれ各自に割り当てられたマイク及びスピーカーを利用して会議を行う会議プログラムであって、
前記第1ユーザーに対して割り当てられた第1マイクが第1取得音声を取得して、当該第1取得音声を前記第2ユーザーに割り当てられた第2スピーカーから出力すると共に、前記第2ユーザーに対して割り当てられた第2マイクが第2取得音声を取得して、当該第2取得音声を前記第1ユーザーに割り当てられた第1スピーカーから出力する通話ステップと、
前記第1ユーザー及び前記第2ユーザーの状態が前記通話ステップを介さずに直接会話可能な直接会話状態であるか否かを判定する判定ステップと、
前記判定ステップにおける判定結果に基づき、前記通話ステップにおいて前記第1取得音声を前記第2スピーカーから出力させるか否かを制御する制御ステップと、
を一又は複数のプロセッサーに実行させ
、
前記判定ステップにおいて、前記第1マイクから取得した前記第1取得音声と前記第2マイクから取得した前記第2取得音声とが一致する場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定し、前記第1取得音声と前記第2取得音声とが一致しない場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定し、
前記制御ステップにおいて、
前記判定ステップで前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定した場合に、前記第1取得音声を前記第2スピーカーから出力させず、
前記判定ステップで前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定した場合に、前記第1取得音声を前記第2スピーカーから出力させる、会議プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、会議システム、会議方法、及び会議プログラムに関する。
【背景技術】
【0002】
従来、複数の拠点で複数のユーザー(会議参加者)が会議を行うことが可能な会議システムが知られている。例えば特許文献1には、各拠点に配置された無線機器をネットワーク接続して各拠点間の音声データを送受信することにより会議を行う会議システムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、近年、各ユーザーが自身のPC(ユーザー端末)を所持して会議に参加する場合がある。このような会議では、以下の問題が生じる場合がある。例えば同じ拠点(会議室)にいるユーザーA,BのうちユーザーAが発言した場合に、ユーザーBは、ユーザーAの発言(発話音声)を直接聞き取ることができる。また、ユーザーBのユーザー端末は、会議アプリケーションを利用して、ユーザーAのユーザー端末のマイクが集音したユーザーAの発話音声を自端末のスピーカーから出力することができる。この場合、ユーザーBは、ユーザーAから直接聞こえる音声と、ユーザー端末から聞こえる音声との同一音声が二重に聞こえてしまう問題が生じる。
【0005】
本発明の目的は、ユーザーの発話音声を適切に聞き取らせることを可能にする会議システム、会議方法、及び会議プログラムを提供することにある。
【課題を解決するための手段】
【0006】
本発明の一の態様に係る会議システムは、第1ユーザーと第2ユーザーとを含む複数のユーザーのそれぞれに対してマイク及びスピーカーが割り当てられ、前記複数のユーザーがそれぞれ各自に割り当てられたマイク及びスピーカーを利用して会議を行う会議システムであって、前記第1ユーザーに対して割り当てられた第1マイクが第1取得音声を取得して、当該第1取得音声を前記第2ユーザーに割り当てられた第2スピーカーから出力すると共に、前記第2ユーザーに対して割り当てられた第2マイクが第2取得音声を取得して、当該第2取得音声を前記第1ユーザーに割り当てられた第1スピーカーから出力する通話システムと、前記第1ユーザー及び前記第2ユーザーの状態が前記通話システムを介さずに直接会話可能な直接会話状態であるか否かを判定する会話状態判定部と、前記会話状態判定部の判定結果に基づき、前記通話システムに対して前記第1取得音声を前記第2スピーカーから出力させるか否かを制御する出力制御部と、を備えるシステムである。
【0007】
本発明の他の態様に係る会議方法は、第1ユーザーと第2ユーザーとを含む複数のユーザーのそれぞれに対してマイク及びスピーカーが割り当てられ、前記複数のユーザーがそれぞれ各自に割り当てられたマイク及びスピーカーを利用して会議を行う会議方法であって、一又は複数のプロセッサーが、前記第1ユーザーに対して割り当てられた第1マイクが第1取得音声を取得して、当該第1取得音声を前記第2ユーザーに割り当てられた第2スピーカーから出力すると共に、前記第2ユーザーに対して割り当てられた第2マイクが第2取得音声を取得して、当該第2取得音声を前記第1ユーザーに割り当てられた第1スピーカーから出力する通話ステップと、前記第1ユーザー及び前記第2ユーザーの状態が前記通話ステップを介さずに直接会話可能な直接会話状態であるか否かを判定する判定ステップと、前記判定ステップにおける判定結果に基づき、前記通話ステップにおいて前記第1取得音声を前記第2スピーカーから出力させるか否かを制御する制御ステップと、を実行する方法である。
【0008】
本発明の他の態様に係る会議プログラムは、第1ユーザーと第2ユーザーとを含む複数のユーザーのそれぞれに対してマイク及びスピーカーが割り当てられ、前記複数のユーザーがそれぞれ各自に割り当てられたマイク及びスピーカーを利用して会議を行う会議プログラムであって、前記第1ユーザーに対して割り当てられた第1マイクが第1取得音声を取得して、当該第1取得音声を前記第2ユーザーに割り当てられた第2スピーカーから出力すると共に、前記第2ユーザーに対して割り当てられた第2マイクが第2取得音声を取得して、当該第2取得音声を前記第1ユーザーに割り当てられた第1スピーカーから出力する通話ステップと、前記第1ユーザー及び前記第2ユーザーの状態が前記通話ステップを介さずに直接会話可能な直接会話状態であるか否かを判定する判定ステップと、前記判定ステップにおける判定結果に基づき、前記通話ステップにおいて前記第1取得音声を前記第2スピーカーから出力させるか否かを制御する制御ステップと、を一又は複数のプロセッサーに実行させるためのプログラムである。
【発明の効果】
【0009】
本発明によれば、ユーザーの発話音声を適切に聞き取らせることを可能にする会議システム、会議方法、及び会議プログラムが提供される。
【図面の簡単な説明】
【0010】
【
図1】
図1は、本発明の実施形態に係る会議システムの概略構成を示す模式図である。
【
図2】
図2は、本発明の実施形態に係る会議システムの構成を示す機能ブロック図である。
【
図3】
図3は、本発明の実施形態に係る会議システムで利用される会議室情報の一例を示す図である。
【
図4】
図4は、本発明の実施形態に係る会議システムで利用されるユーザー情報の一例を示す図である。
【
図5】
図5は、本発明の実施形態に係る会議システムで利用される会議情報の一例を示す図である。
【
図6】
図6は、従来の会議システムにおける音声出力方法を示す模式図である。
【
図7】
図7は、本発明の実施形態に係る会議システムにおける音声出力方法の一例を示す模式図である。
【
図8】
図8は、本発明の実施形態に係る会議システムにおける音声出力方法の一例を示す模式図である。
【
図9】
図9は、本発明の実施形態に係る会議システムにおける音声出力方法の一例を示す模式図である。
【
図10】
図10は、本発明の実施形態に係る会議システムで実行される会議処理の手順の一例を説明するためのフローチャートである。
【発明を実施するための形態】
【0011】
以下、添付図面を参照しながら、本発明の実施形態について説明する。なお、以下の実施形態は、本発明を具体化した一例であって、本発明の技術的範囲を限定する性格を有さない。
【0012】
本発明に係る会議システムは、例えば複数の拠点(会議室)において一又は複数のユーザーが参加する会議に適用することができる。例えば本実施形態に係る会議システムでは、各会議室に、会議に参加する各ユーザーが利用するユーザー端末と、当該ユーザー端末の表示画面などの各種情報を表示する表示装置とが配置される。また、各ユーザー端末には、マイク及びスピーカーが搭載されている。
【0013】
[会議システム100]
図1は、本発明の実施形態に係る会議システムの概略構成を示す図である。会議システム100は、会議サーバー1と、ユーザー端末2と、表示装置DPとを含んでいる。例えば
図1に示すように、会議室R1には、会議の参加者であるユーザーAが利用するユーザー端末2aと、会議の参加者であるユーザーBが利用するユーザー端末2bと、表示装置DP1とが配置されており、会議室R2には、会議の参加者であるユーザーCが利用するユーザー端末2cと、会議の参加者であるユーザーDが利用するユーザー端末2dと、表示装置DP2とが配置されている。
【0014】
会議システム100は、第1ユーザーと第2ユーザーとを含む複数のユーザーのそれぞれに対してマイク及びスピーカーが割り当てられ、前記複数のユーザーがそれぞれ各自に割り当てられたマイク及びスピーカーを利用して会議を行うシステムである。例えば、ユーザーAには、ユーザー端末2aのマイク及びスピーカーが割り当てられ、ユーザーBには、ユーザー端末2bのマイク及びスピーカーが割り当てられている。
【0015】
また、会議システム100は、前記第1ユーザーに対して割り当てられた第1マイクが第1取得音声を取得して、当該第1取得音声を前記第2ユーザーに割り当てられた第2スピーカーから出力すると共に、前記第2ユーザーに対して割り当てられた第2マイクが第2取得音声を取得して、当該第2取得音声を前記第1ユーザーに割り当てられた第1スピーカーから出力する通話システムを備える。例えば、会議システム100は、ユーザーAに割り当てられたユーザー端末2aのマイクが取得したユーザーAの発話音声を、ユーザーCに割り当てられたユーザー端末2cのスピーカーから出力し、ユーザーCに割り当てられたユーザー端末2cのマイクが取得したユーザーCの発話音声を、ユーザーAに割り当てられたユーザー端末2aのスピーカーから出力する。
【0016】
[会議サーバー1]
図2に示すように、会議サーバー1は、制御部11、記憶部12、操作表示部13、通信部14などを備える。会議サーバー1は、1台又は複数台の仮想サーバ(クラウドサーバ)であってもよいし、1台又は複数台の物理サーバーであってもよい。
【0017】
通信部14は、会議サーバー1を有線又は無線でネットワークN1に接続し、ネットワークN1を介して他の機器(例えばユーザー端末2、表示装置DP)との間で所定の通信プロトコルに従ったデータ通信を実行するための通信インターフェースである。
【0018】
操作表示部13は、各種の情報を表示する液晶ディスプレイ又は有機ELディスプレイのような表示部と、操作を受け付けるマウス、キーボード、又はタッチパネルのような操作部とを備えるユーザーインターフェースである。
【0019】
記憶部12は、各種の情報を記憶するフラッシュメモリー、HDD(Hard Disk Drive)又はSSD(Solid State Drive)などの不揮発性の記憶部である。記憶部12には、制御部11に後述の会議処理(
図10参照)を実行させるための会議プログラムなどの制御プログラムが記憶されている。例えば、前記会議プログラムは、CD又はDVDなどのコンピュータ読取可能な記録媒体に非一時的に記録され、会議サーバー1が備えるCDドライブ又はDVDドライブなどの読取装置(不図示)で読み取られて記憶部12に記憶されてもよい。
【0020】
また、記憶部12には、会議室情報D1、ユーザー情報D2、会議情報D3などのデータが記憶される。
【0021】
図3には会議室情報D1の一例を示している。会議室情報D1には、会議室ごとに、対応する「会議室ID」、「会議室名」などの情報が互いに関連付けられて登録される。「会議室ID」は、会議室の識別情報である。「会議室名」は会議室の名前であり、部屋番号などが登録される。
【0022】
図4にはユーザー情報D2の一例を示している。ユーザー情報D2には、ユーザーごとに、対応する「ユーザーID」、「ユーザー名」、「パスワード」などの情報が互いに関連付けられて登録される。ユーザー情報D2には、会議に参加するユーザーだけでなく、会議システム100を利用する権限を有する全てのユーザーに関する情報が事前に登録される。例えば、企業の全社員の情報がユーザー情報D2に登録される。「ユーザーID」はユーザーの識別情報であり、「ユーザー名」はユーザーの名前である。「ユーザーID」及び「パスワード」はユーザーが会議に参加する際のログイン処理に利用される情報である。
【0023】
例えば、会議に参加するユーザーは、会議を開始する際に自身のユーザー端末2において会議アプリケーションを起動させて、ログイン画面にログイン情報である前記ユーザーID及び前記パスワードを入力する。会議サーバー1は前記ログイン情報に基づいてログイン処理(認証処理)を行う。ログインしたユーザーは、会議アプリケーションを利用した会議に参加することが可能となる。
【0024】
図5には会議情報D3の一例を示している。会議情報D3には、会議ごとに、対応する「会議ID」、「会議名」、「会議室ID」、「開始日時」、「終了日時」、「参加者ID」、「ファイルID」などの情報(予約情報)が互いに関連付けられて登録される。「会議ID」は会議の識別情報であり、「会議名」は会議の名称(件名)である。「開始日時」は会議の開始予定日時であり、「終了日時」は会議の終了予定日時である。「参加者ID」は、会議に参加するユーザーの識別情報(ユーザーID)である。「ファイルID」は、会議に使用されるファイル(資料)の識別情報であり、ファイルIDに対応するファイルデータは、記憶部12又はデータベース(不図示)に記憶される。会議情報D3は、会議の開催予定が決定すると責任者などにより事前に登録される。
【0025】
なお、会議室情報D1、ユーザー情報D2、会議情報D3などの情報の一部又は全部が、会議サーバー1、ユーザー端末2、及び他のサーバー(不図示)のいずれかに記憶されてもよいし、これら複数の装置に分散して記憶されてもよい。
【0026】
制御部11は、CPU、ROM、及びRAMなどの制御機器を有する。前記CPUは、各種の演算処理を実行するプロセッサーである。前記ROMは、前記CPUに各種の処理を実行させるためのBIOS及びOSなどの制御プログラムを予め記憶する。前記RAMは、各種の情報を記憶し、前記CPUが実行する各種の処理の一時記憶メモリー(作業領域)として使用される。そして、制御部11は、前記ROM又は記憶部12に予め記憶された各種の制御プログラムを前記CPUで実行することにより会議サーバー1を制御する。
【0027】
制御部11は、前記CPUで前記制御プログラムに従った各種の処理を実行することによって前記各種の処理部として機能する。また、制御部11に含まれる一部又は全部の処理部が電子回路で構成されていてもよい。なお、前記制御プログラムは、複数のプロセッサーを前記各種の処理部として機能させるためのプログラムであってもよい。
【0028】
具体的には、制御部11は、会議室情報D1、ユーザー情報D2、及び会議情報D3を登録する。制御部11は、ユーザーによる登録操作に基づいて各情報を記憶部12に予め登録する。例えばユーザーが自身のユーザー端末2においてユーザー情報D2及び会議情報D3を登録する操作を行うと、制御部11は、当該操作を受け付けてユーザー情報D2及び会議情報D3を記憶部12に登録する。また、例えば会議室の管理者が自身のユーザー端末2又は管理端末において会議室情報D1を登録する操作を行うと、制御部11は、当該操作を受け付けて会議室情報D1を記憶部12に登録する。
【0029】
また、制御部11は、会議に参加するユーザーのログイン処理(認証処理)を実行する。例えば、会議に参観するユーザーがログイン画面にログイン情報である前記ユーザーID及び前記パスワードを入力すると、制御部11は、ユーザー情報D2及び会議情報D3を参照して、ログイン処理を実行する。
【0030】
また、制御部11は、会議が開始されると、ユーザー端末2から音声データを取得し、取得した音声データを各ユーザー端末2に出力する。例えば、制御部11は、ユーザーAが発言した発話音声Vaの音声データをユーザー端末2aから取得すると、当該音声データをユーザー端末2c及びユーザー端末2dに出力する。また例えば、制御部11は、ユーザーCが発言した発話音声Vcの音声データをユーザー端末2cから取得すると、当該音声データをユーザー端末2a及びユーザー端末2bに出力する。
【0031】
[ユーザー端末2]
図2に示すように、ユーザー端末2は、制御部21、記憶部22、操作表示部23、マイク24、スピーカー25、通信部26などを備える。
図1では、会議室R1に配置されるユーザー端末2a及びユーザー端末2bと、会議室R2に配置されるユーザー端末2c及びユーザー端末2dとを例示している。ユーザー端末2a~2dは、互いに同一の機能を備える。
【0032】
操作表示部23は、各種の情報を表示する液晶ディスプレイ又は有機ELディスプレイのような表示部と、操作を受け付けるマウス、キーボード、又はタッチパネルのような操作部とを備えるユーザーインターフェースである。
【0033】
マイク24は、ユーザー端末2のユーザーの発話音声を集音する。マイク24により集音された発話音声のデータ(音声データ)は制御部21に入力される。スピーカー25は、制御部21の命令に基づいて音声を出力(放音)する。例えば、スピーカー25は、会議サーバー1を介してユーザー端末2が取得する音声データの音声を制御部21の命令に従って外部に出力する。
【0034】
通信部26は、ユーザー端末2を有線又は無線でネットワークN1に接続し、ネットワークN1を介して他の機器(例えば会議サーバー1など)との間で所定の通信プロトコルに従ったデータ通信を実行するための通信インターフェースである。
【0035】
記憶部22は、各種の情報を記憶するフラッシュメモリー、HDD又はSSDなどの不揮発性の記憶部である。記憶部22には、制御部21に後述の会議処理(
図10参照)を実行させるための会議プログラムなどの制御プログラムが記憶されている。例えば、前記会議プログラムは、CD又はDVDなどのコンピュータ読取可能な記録媒体に非一時的に記録され、ユーザー端末2が備えるCDドライブ又はDVDドライブなどの読取装置(不図示)で読み取られて記憶部22に記憶されてもよい。
【0036】
制御部21は、CPU、ROM、及びRAMなどの制御機器を有する。前記CPUは、各種の演算処理を実行するプロセッサーである。前記ROMは、前記CPUに各種の処理を実行させるためのBIOS及びOSなどの制御プログラムを予め記憶する。前記RAMは、各種の情報を記憶し、前記CPUが実行する各種の処理の一時記憶メモリー(作業領域)として使用される。そして、制御部21は、前記ROM又は記憶部22に予め記憶された各種の制御プログラムを前記CPUで実行することによりユーザー端末2を制御する。
【0037】
ところで、各ユーザーが自身のユーザー端末2を所持して会議に参加する場合、以下の問題が生じることがある。例えば
図6に示すように、同じ会議室R1にいるユーザーA,BのうちユーザーAが発言した場合に、ユーザーBは、ユーザーAが発言した発話音声Vaを直接聞き取ることができる。また、ユーザーBのユーザー端末2bは、会議アプリケーションを利用して、ユーザーAのユーザー端末2aのマイク24が集音したユーザーAの発話音声Vaを会議サーバー1を介してユーザー端末2bのスピーカー25から出力することができる。この場合、ユーザーBは、ユーザーAから直接聞こえる音声と、ユーザー端末2bから聞こえる音声との同一音声が二重に聞こえてしまう問題が生じる。これに対して、本実施形態に係る会議システム100によれば、ユーザーの発話音声を適切に聞き取らせることが可能である。
【0038】
具体的には、制御部21は、
図2に示すように、音声取得部211、会話状態判定部212、出力制御部213、位置取得部214などの各種の処理部を含む。なお、制御部21は、前記CPUで前記制御プログラムに従った各種の処理を実行することによって前記各種の処理部として機能する。また、制御部21に含まれる一部又は全部の処理部が電子回路で構成されていてもよい。なお、前記制御プログラムは、複数のプロセッサーを前記各種の処理部として機能させるためのプログラムであってもよい。
【0039】
音声取得部211は、マイク24が集音した発話音声の音声データを取得する。例えば、ユーザー端末2aのマイク24がユーザーAの発言した発話音声Vaを集音すると、ユーザー端末2aの音声取得部211は、ユーザー端末2aのマイク24から当該発話音声Vaの音声データを取得する。制御部21は、音声取得部211が取得した前記音声データを会議サーバー1に出力する。
【0040】
ここで、例えば
図7に示すように、ユーザー端末2bがユーザーAの近くにいる場合、ユーザー端末2bのマイク24がユーザーAの発言した発話音声Vaを集音する。この場合、ユーザー端末2bの音声取得部211は、ユーザー端末2bのマイク24から当該発話音声Vaの音声データを取得する。また、ユーザー端末2bの音声取得部211は、会議サーバー1から出力される発話音声Vaの音声データを取得する(
図7参照)。
【0041】
会話状態判定部212は、第1ユーザー及び第2ユーザーの状態が直接会話可能な直接会話状態であるか否かを判定する。例えば、第1ユーザー及び第2ユーザーが同じ会議室内で近くにいる場合、直接会話することが可能である。この場合、第1ユーザー及び第2ユーザーは直接会話状態にある。前記第1ユーザー及び前記第2ユーザーは、例えば、会議室R1にいるユーザーA及びユーザーB、又は、会議室R2にいるユーザーC及びユーザーDである。
【0042】
具体的には、第1ユーザーのユーザー端末2の会話状態判定部212は、第1ユーザーのユーザー端末2のマイク24が取得(集音)した第1取得音声に第2ユーザーの発話音声が含まれるか否かを判定する。例えば、第1ユーザーのユーザー端末2の会話状態判定部212は、第1ユーザーのユーザー端末2のマイク24が取得した第1取得音声と、第2ユーザーのユーザー端末2のマイク24が取得した第2取得音声とを比較して、比較結果に基づいて前記第1取得音声に前記第2ユーザーの発話音声が含まれるか否かを判定する。
【0043】
例えば、ユーザー端末2bの会話状態判定部212は、ユーザー端末2bのマイク24が取得した音声(第1取得音声)と、ユーザー端末2aのマイク24が取得した音声(第2取得音声)とを比較して、両音声が一致する場合に前記第1取得音声に前記第2ユーザーの発話音声が含まれると判定する。
【0044】
会話状態判定部212は、前記第1取得音声に前記第2ユーザーの発話音声が含まれると判定した場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定する。例えば、ユーザー端末2bの会話状態判定部212は、ユーザー端末2bのマイク24が取得した前記第1取得音声にユーザーAの発話音声Vaが含まれると判定した場合に、ユーザーA及びユーザーBの状態が前記直接会話状態であると判定する。
【0045】
同様に、第2ユーザーのユーザー端末2の会話状態判定部212は、第2ユーザーのユーザー端末2のマイク24が取得(集音)した第2取得音声に第1ユーザーの発話音声が含まれるか否かを判定する。例えば、第2ユーザーのユーザー端末2の会話状態判定部212は、第2ユーザーのユーザー端末2のマイク24が取得した第2取得音声と、第1ユーザーのユーザー端末2のマイク24が取得した第1取得音声とを比較して、比較結果に基づいて前記第2取得音声に前記第1ユーザーの発話音声が含まれるか否かを判定する。
【0046】
例えば、ユーザー端末2aの会話状態判定部212は、ユーザー端末2aのマイク24が取得した音声(第2取得音声)と、ユーザー端末2bのマイク24が取得した音声(第1取得音声)とを比較して、両音声が一致する場合に前記第2取得音声に前記第1ユーザーの発話音声が含まれると判定する。
【0047】
会話状態判定部212は、前記第2取得音声に前記第1ユーザーの発話音声が含まれると判定した場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定する。例えば、ユーザー端末2aの会話状態判定部212は、ユーザー端末2aのマイク24が取得した前記第2取得音声にユーザーBの発話音声Vbが含まれると判定した場合に、ユーザーA及びユーザーBの状態が前記直接会話状態であると判定する。
【0048】
なお、例えば
図8に示すように、ユーザー端末2bの会話状態判定部212は、ユーザー端末2bのマイク24がユーザーCの発話音声Vcを取得しないため、ユーザー端末2bのマイク24が取得した音声にユーザーCの発話音声Vcが含まれないと判定する。この場合、ユーザー端末2bの会話状態判定部212は、ユーザーB及びユーザーCの状態が前記直接会話状態ではないと判定する。
【0049】
出力制御部213は、会話状態判定部212の判定結果に基づき、前記第1取得音声をスピーカー25から出力させるか否かを制御する。
【0050】
具体的には、会話状態判定部212が前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定した場合に、出力制御部213は、前記第1取得音声をスピーカー25から出力させない。例えば
図9に示すように、ユーザー端末2bの会話状態判定部212がユーザーA及びユーザーBの状態が前記直接会話状態であると判定した場合に、ユーザー端末2bの出力制御部213は、会議サーバー1から取得したユーザーAの発話音声Vaをユーザー端末2bのスピーカー25から出力させない。例えば、ユーザー端末2bの出力制御部213は、会議サーバー1から取得したユーザーAの発話音声Vaの音声信号に逆位相の音声信号を重ねることにより発話音声Vaをキャンセルする。
【0051】
また、会話状態判定部212が前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定した場合には、出力制御部213は、前記第1取得音声をスピーカーから出力させる。例えば
図8に示すように、ユーザー端末2bの会話状態判定部212がユーザーB及びユーザーCの状態が前記直接会話状態ではないと判定した場合に、ユーザー端末2bの出力制御部213は、会議サーバー1から取得したユーザーCの発話音声Vcをユーザー端末2bのスピーカー25から出力させる。
【0052】
同様に、出力制御部213は、会話状態判定部212の判定結果に基づき、前記第2取得音声をスピーカー25から出力させるか否かを制御する。
【0053】
具体的には、会話状態判定部212が前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定した場合に、出力制御部213は、前記第2取得音声をスピーカー25から出力させない。例えば、ユーザー端末2aの会話状態判定部212がユーザーA及びユーザーBの状態が前記直接会話状態であると判定した場合に、ユーザー端末2aの出力制御部213は、会議サーバー1から取得したユーザーBの発話音声Vbをユーザー端末2aのスピーカー25から出力させない。例えば、ユーザー端末2aの出力制御部213は、会議サーバー1から取得したユーザーBの発話音声Vbの音声信号に逆位相の音声信号を重ねることにより発話音声Vbをキャンセルする。
【0054】
また、会話状態判定部212が前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態ではないと判定した場合には、出力制御部213は、前記第2取得音声をスピーカーから出力させる。例えば、ユーザー端末2cの会話状態判定部212がユーザーB及びユーザーCの状態が前記直接会話状態ではないと判定した場合に、ユーザー端末2cの出力制御部213は、会議サーバー1から取得したユーザーBの発話音声Vbをユーザー端末2cのスピーカー25から出力させる。
【0055】
[会議処理]
以下、
図10を参照しつつ、会議システム100において実行される会議処理の手順の一例について説明する。
【0056】
なお、本発明は、前記会議処理に含まれる一又は複数のステップを実行する会議方法(本発明の会議方法の一例)の発明として捉えることができる。また、ここで説明する前記会議処理に含まれる一又は複数のステップが適宜省略されてもよい。また、前記会議処理における各ステップは、同様の作用効果を生じる範囲で実行順序が異なってもよい。さらに、ここでは会議システム100に含まれるユーザー端末2の制御部21が前記会議処理における各ステップを実行する場合を例に挙げて説明するが、他の実施形態では、1又は複数のプロセッサーが前記会議処理における各ステップを分散して実行してもよい。
【0057】
なお、前記会議処理は、例えば、各ユーザー端末2において、個別に並行して実行される。ここでは、ユーザーBのユーザー端末2bにおいて実行される前記会議処理を例に挙げて説明する。
【0058】
先ずステップS1において、ユーザーBのユーザー端末2bの制御部21は、音声を取得したか否かを判定する。例えば、ユーザー端末2bの制御部21は、会議サーバー1から出力される第1ユーザーの音声データの音声、ユーザー端末2bのマイク24が集音する第2ユーザーの音声を取得する。
【0059】
次にステップS2において、ユーザー端末2bの制御部21は、取得した音声に、ユーザー端末2bのマイク24が取得した第2ユーザー(例えばユーザーA)の発話音声(マイク音声)が含まれるか否かを判定する。前記取得した音声にユーザーAの発話音声が含まれる場合(S2:Yes)(
図7参照)、処理はステップS3に移行する。一方、前記取得した音声にユーザーAの発話音声が含まれない場合(S2:No)、処理はステップS21に移行する。
【0060】
ステップS3では、ユーザー端末2bの制御部21は、ユーザーA及びユーザーBの状態が直接会話状態であると判定する。その後、処理はステップS4に移行する。
【0061】
ステップS4では、ユーザー端末2bの制御部21は、ユーザーAの発話音声をユーザー端末2bのスピーカー25から出力させない。例えば
図9に示すように、ユーザー端末2bの制御部21は、ユーザーA及びユーザーBの状態が前記直接会話状態であると判定した場合に、会議サーバー1から取得したユーザーAの発話音声Vaをユーザー端末2bのスピーカー25から出力させない。例えば、ユーザー端末2bの制御部21は、ユーザーAの発話音声Vaの音声信号に逆位相の音声信号を重ねることにより発話音声Vaをキャンセルする。その後、処理はステップS1に戻る。
【0062】
これに対して、例えばステップS1において取得した音声が会議サーバー1から出力されたユーザーC(第1ユーザー)の音声であった場合に、ユーザー端末2bの制御部21は、ステップS21では、ユーザーB及びユーザーCの状態が直接会話状態ではないと判定する。例えば、ユーザー端末2bの制御部21は、会議サーバー1からユーザーCの発話音声Vcを取得した場合に、ユーザーB及びユーザーCの状態が直接会話状態ではないと判定する。その後、処理はステップS22に移行する。
【0063】
ステップS22では、ユーザー端末2bの制御部21は、会議サーバー1から取得したユーザーC(第1ユーザー)の発話音声Vcをユーザー端末2bのスピーカー25から出力させる(
図8参照)。その後、処理はステップS1に戻る。
【0064】
各ユーザー端末2の制御部21は、上述の会議処理を繰り返し実行する。
【0065】
以上のように、本実施形態に係る会議システム100は、第1ユーザーと第2ユーザーとを含む複数のユーザーのそれぞれに対してマイク及びスピーカーが割り当てられ、前記複数のユーザーがそれぞれ各自に割り当てられたマイク及びスピーカーを利用して会議を行うシステムである。また、会議システム100は、前記第1ユーザーに対して割り当てられた第1マイクが第1取得音声を取得して、当該第1取得音声を前記第2ユーザーに割り当てられた第2スピーカーから出力すると共に、前記第2ユーザーに対して割り当てられた第2マイクが第2取得音声を取得して、当該第2取得音声を前記第1ユーザーに割り当てられた第1スピーカーから出力する。また、会議システム100は、前記第1ユーザー及び前記第2ユーザーの状態が前記通話システムを介さずに直接会話可能な直接会話状態であるか否かを判定し、前記会話状態判定部の判定結果に基づき、前記通話システムに対して前記第1取得音声を前記第2スピーカーから出力させるか否かを制御する。
【0066】
これにより、例えば同じ会議室R1でユーザーA及びユーザーBが会議に参加する場合において、ユーザーAが発言した場合に、ユーザー端末2bからユーザーAの発話音声が出力されず、ユーザーBは、ユーザーAの発話音声を直接聞き取ることができる。よって、ユーザーAの発話音声が二重に聞こえてしまう問題を防ぐことができる。
【0067】
本発明の会議システムは上述の実施形態に限定されない。例えば、本発明の他の実施形態として、会話状態判定部212は、マイク24が取得したマイク音声に含まれる発話音声の発話者を特定する特定処理を実行し、特定処理の結果に基づいて前記マイク音声に第1ユーザーの発話音声が含まれるか否かを判定してもよい。例えば、ユーザー端末2bの会話状態判定部212は、ユーザー端末2bのマイク24が取得したマイク音声に基づいて発話者を特定する。例えば会話状態判定部212は、ユーザーごとの音声識別情報を記憶したデータベース(発話者リスト)を参照して発話者を特定する。ユーザー端末2bの会話状態判定部212は、ユーザー端末2bのマイク24が取得した音声の発話者としてユーザーAを特定した場合に、前記マイク音声にユーザーAの発話音声が含まれると判定する。この場合、会話状態判定部212は、ユーザーA及びユーザーBの状態が前記直接会話状態であると判定する。
【0068】
同様に、ユーザー端末2aの会話状態判定部212は、ユーザー端末2aのマイク24が取得したマイク音声に基づいて発話者を特定する。ユーザー端末2aの会話状態判定部212は、ユーザー端末2aのマイク24が取得した音声の発話者としてユーザーBを特定した場合に、前記マイク音声にユーザーBの発話音声が含まれると判定する。この場合、会話状態判定部212は、ユーザーA及びユーザーBの状態が前記直接会話状態であると判定する。
【0069】
また、本発明の他の実施形態として、制御部21は、第1ユーザーの位置情報と第2ユーザーの位置情報とを取得する位置取得部214(
図2参照)を備えてもよい。この場合、会話状態判定部212は、前記第1ユーザーの位置と前記第2ユーザーの位置とが所定の位置関係にある場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定する。
【0070】
例えば、会話状態判定部212は、前記第1ユーザーの位置と前記第2ユーザーの位置との離間距離が所定距離以下である場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定する。また、会話状態判定部212は、前記第1ユーザーの位置と前記第2ユーザーの位置とが同一の部屋(会議室)にある場合に、前記第1ユーザー及び前記第2ユーザーの状態が前記直接会話状態であると判定する。
【0071】
上述の実施形態では、会議システム100が本発明の会議システムに相当するが、本発明の会議システムは、これに限定されない。例えば、本発明の会議システムは、ユーザー端末2単体で構成されてもよいし、会議サーバー1単体で構成されてもよいし、ユーザー端末2及び会議サーバー1により構成されてもよい。例えば、会議サーバー1が、ユーザー端末2の音声取得部211、会話状態判定部212、出力制御部213、位置取得部214の各機能を備えてもよい。
【0072】
また、マイク24、スピーカー25、及び通信部26を含むユーザー端末2と、会議サーバー1と、ネットワークN1とは、本発明の通話システムの一例である。すなわち、本発明の通話システムは、通信機能を利用して音声データを送受信することにより会話を実現するための複数の構成要素を備えている。
【0073】
なお、本発明の会議システムは、各請求項に記載された発明の範囲において、以上に示された各実施形態を自由に組み合わせること、或いは各実施形態を適宜、変形又は一部を省略することによって構成されることも可能である。
【符号の説明】
【0074】
1 :会議サーバー
2 :ユーザー端末
21 :制御部
22 :記憶部
23 :操作表示部
24 :マイク
25 :スピーカー
26 :通信部
100 :会議システム
211 :音声取得部
212 :会話状態判定部
213 :出力制御部
214 :位置取得部