(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-29
(45)【発行日】2024-08-06
(54)【発明の名称】コミュニケーションシステム
(51)【国際特許分類】
H04M 3/56 20060101AFI20240730BHJP
H04M 1/72 20210101ALI20240730BHJP
【FI】
H04M3/56 Z
H04M1/72
(21)【出願番号】P 2021000968
(22)【出願日】2021-01-06
【審査請求日】2024-01-09
【早期審査対象出願】
(73)【特許権者】
【識別番号】524009026
【氏名又は名称】ボイット株式会社
(74)【代理人】
【識別番号】100087398
【氏名又は名称】水野 勝文
(74)【代理人】
【識別番号】100128783
【氏名又は名称】井出 真
(74)【代理人】
【識別番号】100128473
【氏名又は名称】須澤 洋
(72)【発明者】
【氏名】掛村 篤
【審査官】山岸 登
(56)【参考文献】
【文献】特開2006-033430(JP,A)
【文献】特開2005-184852(JP,A)
【文献】特開2006-324832(JP,A)
【文献】特開2008-227592(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04M1/00
1/24-3/00
3/16-3/20
3/38-3/58
7/00-7/16
11/00-11/10
99/00
(57)【特許請求の範囲】
【請求項1】
コミュニケーショングループ内の複数の各ユーザがそれぞれ携帯する移動通信端末と、移動通信端末から受信した発話音声データをコミュニケーショングループ内の各移動通信端末に同報配信するコミュニケーションサーバと、を有するコミュニケーションシステムであって、
前記移動通信端末は、
前記コミュニケーションサーバから送信される発話音声データの受信チャネルを確立してグループ通話通信モードを実行するとともに、前記グループ通話通信モード中に発話ボタンが押されたとき、確立中の受信チャネルとは別に前記コミュニケーションサーバに発話音声データを送信するための送信チャネルを確立し、自分の発話音声データの送信とコミュニケーショングループ内の発話音声データの受信とを双方向で同時に行う通信部と、
コミュニケーショングループ内の全二重通信による同時接続
上限数と、同時接続中のユーザ及び同時接続ユーザ数を含む全二重通話ログと、を記憶する記憶部と、
前記全二重通話ログと前記同時接続上限数とに基づいて、前記送信チャネルの確立を許容しない制限全二重通信制御を行う制限全二重通信制御部と、
を有することを特徴とするコミュニケーションシステム。
【請求項2】
前記制限全二重通信制御部は、
前記コミュニケーションサーバから受信するコミュニケーショングループ内の発話音声データに基づいて前記全二重通話ログを更新し、
前記発話ボタンが押されたときに、前記全二重通話ログに含まれる同時接続中のユーザに存在しない自身を新たに加算した後の同時接続ユーザ数が前記同時接続上限数を超過するか否かを判別し、前記同時接続上限数を超過すると判別された場合、前記発話ボタンの押下に伴う前記送信チャネルの確立処理を行わないように制御することを特徴とする請求項1に記載のコミュニケーションシステム。
【請求項3】
前記制限全二重通信制御部は、
前記コミュニケーションサーバから発話音声データを受信したとき、受信した発話音声データが前記全二重通話ログに含まれる同時接続中のユーザか否かを判別する第1判定処理と、前記第1判定処理において前記全二重通話ログに存在しない新たなユーザと判別された場合に、前記新たなユーザを加算した後の同時接続ユーザ数が前記同時接続上限数を超過するか否かを判別する第2判定処理と、を行い、
前記第2判定処理において前記同時接続上限数を超過していないと判別された場合、前記新たなユーザを加えて前記全二重通話ログを更新するとともに、前記新たなユーザが自身であれば、受信した発話音声データを破棄して再生を許容しないように制御し、
前記同時接続上限数を超過していると判別された場合、受信した前記発話音声データを破棄して再生を許容しないように制御することを特徴とする請求項2に記載のコミュニケーションシステム。
【請求項4】
前記制限全二重通信制御部は、
前記送信チャネルを通じて自ら発した発話音声データを、前記コミュニケーションサーバから受信したとき、前記全二重通話ログに含まれる同時接続中のユーザに存在しない自身を新たに加算した後の同時接続ユーザ数が前記同時接続上限数を超過するか否かを判別し、前記同時接続上限数を超過すると判別された場合、前記発話ボタンの押下に伴って確立されていた前記送信チャネルを遮断することを特徴とする請求項1に記載のコミュニケーションシステム。
【請求項5】
前記制限全二重通信制御部は、
前記コミュニケーションサーバから受信した自分が発した発話音声データ及び他のユーザの発話音声データに基づいて前記全二重通話ログを更新し、
前記コミュニケーションサーバから発話音声データを受信したとき、受信した発話音声データが前記全二重通話ログに含まれる同時接続中のユーザか否かを判別する第1判定処理と、前記第1判定処理において前記全二重通話ログに存在しない新たなユーザと判別された場合に、前記新たなユーザを加算した後の同時接続ユーザ数が前記同時接続上限数を超過するか否かを判別する第2判定処理と、を行い、
前記第2判定処理において前記同時接続上限数を超過していないと判別された場合、前記新たなユーザを加えて前記全二重通話ログを更新するとともに、前記新たなユーザが自身であれば、受信した発話音声データを破棄して再生を許容しないように制御しつつ、前記発話ボタンが押されたことに伴って確立されていた前記送信チャネルをそのまま維持し、前記新たなユーザが自身以外のユーザであれば、受信した前記発話音声データの再生を許容し、
前記同時接続上限数を超過していると判別された場合、受信した前記発話音声データを破棄して再生を許容しないように制御するとともに、前記新たなユーザが自身であれば、前記発話ボタンが押されたことに伴って確立されていた前記送信チャネルを遮断する、
ことを特徴とする請求項4に記載のコミュニケーションシステム。
【請求項6】
前記制限全二重通信制御部は、前記送信チャネルの確立を許容しない場合、同時通話に参加できない旨のメッセージを出力することを特徴とする請求項1から5のいずれか1つに記載のコミュニケーションシステム。
【請求項7】
前記制限全二重通信制御部は、発話終了ボタンが押されたとき、前記送信チャネルを通じて終了フラグを前記コミュニケーションサーバに送信するとともに、前記送信チャネルを遮断し、
前記制限全二重通信制御部は、前記コミュニケーションサーバから前記終了フラグを受信したとき、受信した前記終了フラグのユーザを前記全二重通話ログから削除して前記同時接続ユーザ数をデクリメントすることを特徴とする請求項1から6のいずれか1つに記載のコミュニケーションシステム。
【請求項8】
前記制限全二重通信制御部は、前記発話終了ボタンが押されたとき、前記終了フラグを含む音声データを生成し、接続中の前記送信チャネルに乗せて終了フラグ付き音声データを前記コミュニケーションサーバに送信し、
前記コミュニケーションサーバは、受信した前記終了フラグ付き音声データを、コミュニケーショングループ内の前記各移動通信端末に同報配信する、
ことを特徴とする請求項7に記載のコミュニケーションシステム。
【請求項9】
前記コミュニケーションサーバは、
前記移動通信端末から受信した発話音声データをコミュニケーショングループ内の前記移動通信端末それぞれに同報配信する第1処理と、受信した発話音声データを音声認識処理して得られる発話音声認識結果を、コミュニケーション履歴として時系列に蓄積するとともに、前記各移動通信端末において前記コミュニケーション履歴が同期して表示されるようにテキスト配信制御を行う第2処理と、を行うコミュニケーション制御部を有し、
前記コミュニケーション制御部は、
同時接続中の各ユーザから受信する連続した音声データにおいて、一のユーザの隣り合う発話の間隔が所定時間以上離間している場合、隣り合う発話の各発話音声認識結果が分離した状態で前記移動通信端末に表示されるように制御し、隣り合う発話の間隔が所定時間未満であれば、隣り合う発話の各発話音声認識結果を分離せずに表示されるように制御し、
複数のユーザの発話が混在する区間において、
前記コミュニケーションサーバが受信した各ユーザの発話開始時刻順に、ユーザ別の発話音声認識結果が吹き出し表示されるように制御することを特徴とする請求項1から8のいずれか1つに記載のコミュニケーションシステム。
【請求項10】
コミュニケーショングループ内の複数の各ユーザがそれぞれ携帯する移動通信端末を通じた発話音声が、コミュニケーションサーバを介してコミュニケーショングループ内の各移動通信端末に同報配信されるコミュニケーションシステムにおける前記移動通信端末によって実行されるプログラムであって、
前記コミュニケーションサーバから送信される発話音声データの受信チャネルを確立してグループ通話通信モードを実行するとともに、前記グループ通話通信モード中に発話ボタンが押されたとき、確立中の受信チャネルとは別に前記コミュニケーションサーバに発話音声データを送信するための送信チャネルを確立し、自分の発話音声データの送信とコミュニケーショングループ内の発話音声データの受信とを双方向で同時に行う第1機能と、
コミュニケーショングループ内の全二重通信による同時接続
上限数と、同時接続中のユーザ及び同時接続ユーザ数を含む全二重通話ログと、を記憶する第2機能と、
前記全二重通話ログと前記同時接続上限数とに基づいて、前記送信チャネルの確立を許容しない制限全二重通信制御を行う第3機能と、
を実現させるためのプログラム。
【請求項11】
コミュニケーショングループ内の複数の各ユーザがそれぞれ携帯する移動通信端末を通じた発話音声が、コミュニケーションサーバを介してコミュニケーショングループ内の各移動通信端末に同報配信されるコミュニケーションシステムで利用される前記移動通信端末であって、
前記コミュニケーションサーバから送信される発話音声データの受信チャネルを確立してグループ通話通信モードを実行するとともに、前記グループ通話通信モード中に発話ボタンが押されたとき、確立中の受信チャネルとは別に前記コミュニケーションサーバに発話音声データを送信するための送信チャネルを確立し、自分の発話音声データの送信とコミュニケーショングループ内の発話音声データの受信とを双方向で同時に行う通信部と、
コミュニケーショングループ内の全二重通信による同時接続
上限数と、同時接続中のユーザ及び同時接続ユーザ数を含む全二重通話ログと、を記憶する記憶部と、
前記全二重通話ログと前記同時接続上限数とに基づいて、前記送信チャネルの確立を許容しない制限全二重通信制御を行う制限全二重通信制御部と、
を有することを特徴とする移動通信端末。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、複数ユーザによるグループ通話の全二重通信技術に関する。
【背景技術】
【0002】
音声コミュニケーションの一例として、トランシーバ(transceiver)がある。トランシーバは、無線電波の送信機能と受信機能を兼ね備えた無線機であり、1人のユーザが複数人のユーザと通話(一方向又は双方向の情報伝達)を行うことができる。トランシーバの活用例は、工事現場やイベント会場、ホテルや旅館などの施設等で目にすることができる。また、タクシー無線もトランシーバ活用の一例として挙げることができる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ネットワーク回線負荷及び処理負荷を低減させ、グループ通話の全二重通信(full-duplex transmission)を円滑に行うことができるコミュニケーションシステムを提供することを目的とする。
【課題を解決するための手段】
【0005】
実施形態のコミュニケーションシステムは、コミュニケーショングループ内の複数の各ユーザがそれぞれ携帯する移動通信端末と、移動通信端末から受信した発話音声データをコミュニケーショングループ内の各移動通信端末に同報配信するコミュニケーションサーバと、を有する。前記移動通信端末は、前記コミュニケーションサーバから送信される発話音声データの受信チャネルを確立してグループ通話通信モードを実行するとともに、前記グループ通話通信モード中に発話ボタンが押されたとき、確立中の受信チャネルとは別に前記コミュニケーションサーバに発話音声データを送信するための送信チャネルを確立し、自分の発話音声データの送信とコミュニケーショングループ内の発話音声データの受信とを双方向で同時に行う通信部と、コミュニケーショングループ内の全二重通信による同時接続上限数と、同時接続中のユーザ及び同時接続ユーザ数を含む全二重通話ログと、を記憶する記憶部と、前記全二重通話ログと前記同時接続上限数とに基づいて、前記送信チャネルの確立を許容しない制限全二重通信制御を行う制限全二重通信制御部と、を有する。
【図面の簡単な説明】
【0006】
【
図1】第1実施形態のコミュニケーションシステムのネットワーク構成図である。
【
図2】第1実施形態のコミュニケーション管理装置、ユーザ端末の各構成ブロック図である。
【
図3】第1実施形態の各種情報の一例を示す図である。
【
図4】第1実施形態の制限全二重通信制御の説明図である。
【
図5】第1実施形態のコミュニケーションシステムの制限全二重通信制御(A)を含む処理フローを示す図である。
【
図6】第1実施形態のコミュニケーションシステムの制限全二重通信制御(B)を含む処理フローを示す図である。
【
図7】第1実施形態のコミュニケーションシステムの制限全二重通信制御(C)を含む処理フローを示す図である。
【
図8】第2実施形態の制限全二重通信制御の説明図である。
【
図9】第2実施形態のコミュニケーションシステムの制限全二重通信制御(A)-1を含む処理フローを示す図である。
【
図10】第2実施形態の制限全二重通信制御の全二重通話ログ更新と制限制御を説明するための図である。
【
図11】第3実施形態のコミュニケーション管理装置、ユーザ端末の各構成ブロック図である。
【
図12】第3実施形態のコミュニケーションシステムのコミュニケーション履歴を説明するための図である。
【
図13】第3実施形態の全二重通信(全二重通話)における音声認識結果の一例である。
【
図14】第3実施形態の全二重通信(全二重通話)における音声認識結果の一例である。
【
図15】第3実施形態の音声認識結果に基づく表示処理を説明するための図である。
【
図16】第3実施形態の複数ユーザの会話が重なり合う領域を含む音声認識結果に基づく表示処理を説明するための図である。
【発明を実施するための最良の形態】
【0007】
(第1実施形態)
図1から
図7は、第1実施形態を説明するための図であり、
図1は、コミュニケーションシステムのネットワーク構成図である。コミュニケーションシステムは、コミュニケーション管理装置(以下、管理装置と称する)100を中心に、グループ通話通信モードを用いた情報伝達支援機能を提供する。
【0008】
管理装置100は、複数の各ユーザがそれぞれ携帯するユーザ端末(移動通信端末)500が無線通信で接続し、ユーザの発話音声をコミュニケーショングループ内の各ユーザ端末500に同報配信する。一のユーザの発話音声が他の複数のユーザ端末500に同報配信される範囲は、コミュニケーショングループとして設定され、対象ユーザのユーザ端末500それぞれが登録される。
【0009】
ユーザ端末500は、例えば、スマートフォンなどの多機能携帯電話機やPDA(Personal Digital Assistant)、タブレット型端末などの持ち運び可能な携帯端末(モバイル端末)である。ユーザ端末500は、通信機能、演算機能及び入力機能を備え、IP(Internet protocol)網又は移動通信回線網(Mobile communication network)を通じて無線通信で管理装置100と接続し、データ通信を行う。
【0010】
本実施形態のコミュニケーションシステムは、例えば、複数の各ユーザが対話を行い、認識共有や意思疎通のための情報伝達環境を提供する。また、ハンズフリーで対話を行うことができる情報伝達環境を提供することもでき、例えば、施設管理を行う複数の従業員等が連携して連絡を取り合うなどの、ユーザ間の様々な連絡系統における情報伝達を支援することができる。
【0011】
ここで、通話形態について説明する。複数のユーザが参加するグループ通話は、半二重(half duplex)通信による通話(半二重通話)と、全二重(FULL DUPLEX)通信による通話(全二重通話)とがある。半二重通信は、トランシーバ通信方式、全二重通信は、双方向通信とも称される。
【0012】
半二重通信は、データの送信と受信を同時に行えず、例えば、相手の発話を聞いている間は自分が発話できず、自分が発話している間は相手の発話を聞くことができない通信方式である。一般的にトランシーバのように自分の発話が終わるたびに、送信と受信の切り換えを行う必要があり、音声データの送信路と受信路とが、1つの通信路(1つの帯域)を共有して使用する。具体的な仕組みとしては、複数のユーザのうち、一のユーザが発話ボタンを押すと、他のユーザが発話できないようにロックを掛ける。これにより、発話の送信権を獲得したユーザの発話音声のみが他のユーザに送信される。
【0013】
全二重通信は、データの流れる経路が2つ用意され、方向の異なるデータが同時に流れることを許容する通信方式である。つまり、複数のユーザが互いに同時にしゃべったり、聞いたりすることが可能な通信方式であり、送信と受信の2つの通信路(2つの帯域)を使用し、自分が発話している間に相手の発話も聞くことができる。
【0014】
一方で、全二重通信は、帯域を多く使用するのでトラフィック量の増加によるネットワーク負荷の課題がある。また、参加ユーザ数が多くなればなるほど、発話音声の送信及び受信の処理負荷が大きくなり、サーバ負荷の課題もある。このような課題に対し、全二重通信での発話に参加できるユーザ数をサーバ側で制限する仕組みを導入する技術が提案されている。
【0015】
しかしながら、複数のユーザに向けた発話音声の配信を管理するサーバ側が、全二重通信に参加可能なユーザを制限すると、サーバ処理負荷が増大する。つまり、複数の各ユーザ端末に対し、発話の許可/不可を集中して制御しなければならない。
【0016】
さらに、サーバで発話の許可/不可を集中して制御すると、発話の遅延及びしゃべり出し冒頭箇所が欠落するなどの課題がある。
【0017】
つまり、サーバ側で制限に基づく発話の許可/不許可を制御すると、ユーザ(端末)は、発話音声をサーバに送信する前に、発話可能かどうかを当該サーバに問合せしなければならない。このため、発話したくてもサーバの許可が下りるまで発話ができない、もしくは、発話してもサーバに送信できない。このため、発話タイミングに遅延が発生し、円滑なグループ通話を提供することが難しい。
【0018】
また、発話ボタンを押した後、ユーザは、すぐにしゃべり始める傾向がある。つまり、発話ボタンを押しても、サーバ側に一度発話可能かを問い合わせて許可が下りるまでの間のタイムラグが生じ、このタイムラグ中に発話した内容は、許可された後に送信された発話音声データには含まれず、しゃべり出し冒頭の発話内容が欠損した音声データが、他のユーザに送信されることになる。
【0019】
そこで、本実施形態のコミュニケーションシステムは、コミュニケーショングループ内で全二重通信を行う人数に制限を設けつつ、制限に基づく全二重通信環境の制御をユーザ端末500側で行う。これにより、ネットワーク回線負荷及び処理負荷を低減させ、全二重通信を含む円滑なグループ通話を実現することができる。
【0020】
図1に示すように、グループ通話通信モードは、管理装置100が各ユーザ端末500との間で、管理装置100から送信する発話音声データに対する受信チャネルを確立する。これにより、1人のユーザの発話音声が、他の複数のユーザに届けられ、聞くことができる。
【0021】
グループ通話通信モード中に発話ボタンが押されたとき、確立中の受信チャネルとは別に管理装置100に発話音声データを送信するための送信チャネルが、ユーザ端末500との間で形成される。ユーザによる発話ボタンの押下により、ユーザ端末500別に、自分の発話音声データの送信とコミュニケーショングループ内の発話音声データの受信とを双方向で同時に行う全二重通信環境が構築される。
図1の例では、ユーザAとユーザBが発話ボタンを押し、これら二人のユーザの全二重通信環境が構築され、他のユーザは、全二重通信で会話する2人のユーザの発話を聞く(受信する)だけである。
【0022】
図2は、管理装置100、ユーザ端末500の各構成ブロック図である。管理装置100は、制御装置110、記憶装置120及び通信装置130を含む。
【0023】
通信装置130は、複数の各ユーザ端末500との間の通信接続管理及びデータ通信制御を行う。通信装置130は、グループ通話機能に対応して、一のユーザによる発話音声データを複数の各ユーザ端末500に一斉に送る同報配信通信制御を行う。さらに、発話するユーザのユーザ端末500との間で送信チャネルを確立し、ユーザ端末500との受信チャネルを維持したまま、発話音声データを受け付ける環境を構築する。
【0024】
制御装置110は、ユーザ管理部111、コミュニケーション制御部112、グループ通話制御部112Aを含んで構成されている。記憶装置120は、ユーザ情報121、グループ情報122、同時接続上限数123を含んで構成されている。
【0025】
ユーザ端末500は、通信・通話部510、コミュニケーションApp制御部520、制限全二重通信制御部521、マイク530、スピーカー540、タッチパネル等の表示入力部550、及び記憶部560を含んで構成されている。なお、スピーカー540は、実際には、イヤホンやヘッドホン(有線又はワイヤレス)などで構成される。
【0026】
図3は、各種情報の一例を示す図であり、ユーザ情報121は、本コミュニケーションシステムを利用するユーザ登録情報である。ユーザ管理部111は、所定の管理画面を通じて、ユーザID、ユーザ名、属性、グループを設定することができるように制御する。また、ユーザ管理部111は、各ユーザ端末500における本コミュニケーションシステムへのログイン履歴と、ログインしたユーザIDとそのユーザ端末500の識別情報(ユーザ端末500固有のMACアドレスや固体識別情報など)との対応リストと、を管理する。
【0027】
グループ情報122は、コミュニケーショングループに区画するグループ識別情報である。コミュニケーショングループID別に伝達情報の送受信及び同報配信を制御し、異なるコミュニケーショングループ間で情報が混在しないように制御される。ユーザ情報121において、グループ情報122に登録されたコミュニケーショングループを、各ユーザに紐付けることができる。本実施形態のユーザ管理部111は、複数の各ユーザの登録制御を行い、グループ通話を行うコミュニケーショングループを設定する機能を提供する。
【0028】
なお、グループ分けについては、本実施形態のコミュニケーションシステムを導入する場所や目的に応じて任意に設定することができる。例えば、施設等に応じて施設を複数の部門に分割して管理することもできる。例えば、宿泊施設を一例に説明すると、ベルパーソン(荷物運び)、コンシェルジュ、ハウスキーピング(清掃)をそれぞれ異なるグループに設定し、客室管理をそれぞれのグループ毎に細分化したコミュニケーション環境を構築することもできる。他の観点として、役割的にコミュニケーションが不要なケースも考えられる。例えば、料理の配膳係と、ベルパーソン(荷物運び)は、直接コミュニケーションをとる必要がないのでグループを分けることができる。また、地理的にコミュニケーションが不要なケースも考えられ、例えば、A支店、B支店などが地理的に離れており、かつ頻繁にコミュニケーションをする必要がない場合などは、グループを分けることができる。
【0029】
同時接続上限数123は、制限全二重通信制御の設定情報であり、全二重通話に参加できる人数を規定している。この同時接続上限数123は、例えば、コミュニケーショングループ内の管理者がユーザ端末500を操作して、管理者権限でログインし、コミュニケーション制御部112が提供する所定の設定画面から入力・設定することができる。また、本システムの運営管理者が、管理装置100に対して所定の管理画面から入力・設定することができる。
【0030】
管理装置100のコミュニケーション制御部112は、グループ通話制御部112Aを含む。グループ通話制御部112Aは、第1制御部として機能する。第1制御部は、グループ通話通信モードに参加するコミュニティグループ内の各ユーザ端末500との間で第1チャネルを確立し、発話音声データの送信路(ユーザ端末500からの観点では、受信チャネル)を形成する。また、ユーザ端末500側の発話アクション(発話ボタンの押下)に伴う発話音声データの受信チャネルを確立し、受信路(ユーザ端末500からの観点では、送信チャネル)を形成する。
【0031】
そして、グループ通話制御部112Aは、一のユーザ端末500から受信した発話音声データを他の複数のユーザ端末500それぞれに同報配信制御を行う。このとき、グループ通話制御部112Aは、発話したユーザ端末500にも自身の発話音声データを送信することができる。この場合、発話したユーザのユーザ端末500では、自身の発話音声データであるか否かを判別し、自身の発話音声データである場合は、音声再生を行わずに破棄し、自分以外の発話音声データである場合に音声再生を行うように構成することができる。
【0032】
ユーザ端末500から受け付ける発話音声データは、ユーザを識別するための情報、例えば、ユーザ端末500の識別情報又はユーザIDなどを含むように構成することができる。グループ通話制御部112Aは、受け付けた発話音声データをコミュニケーショングループ内の各ユーザ端末500に送信する際に、ユーザ識別情報を含む発話音声データを同報配信するように制御することができる。
【0033】
本実施形態の管理装置100は、ユーザ端末500から受け付けた発話音声データをコミュニケーショングループ内の各ユーザ端末500に一律に同報配信するだけであり、配信先のユーザを選定したり、ユーザ別に発話音声データを受け付けたりするなどの制御は行わず、シンプルな制御体制を構築することができる。このため、本実施形態のグループ通話制御部112Aは、上述したように、発話者の発話音声データが、本人のユーザ端末500にも送信されるように構成され、ユーザ端末500側で、音声再生可否の制御を行う。
【0034】
図4は、本実施形態の制限全二重通信制御の説明図である。
図4に示すように、まず同時接続上限数が設定され、コミュニケーショングループ内の各ユーザ端末500には、同時接続上限数が登録されている。
【0035】
ユーザ端末500のコミュニケーションApp制御部520は、管理装置100から送信される発話音声データの受信チャネルを管理装置100との間で確立してグループ通話通信モードを実行するとともに、グループ通話通信モード中に発話ボタンが押されたとき、確立中の受信チャネルとは別に管理装置100に発話音声データを送信するための送信チャネルを当該ユーザ端末500から確立し、自分の発話音声データの送信とコミュニケーショングループ内の発話音声データの受信とを双方向で同時に行うように制御する。
【0036】
つまり、
図4の例では、ユーザA~Eの各ユーザ端末500は、グループ通話通信モードを実行すると、管理装置100との間で発話音声データを受信するための受信チャネルをそれぞれ確立する。そして、ユーザAが発話ボタンを押して発話すると、ユーザAのユーザ端末500は、管理装置100との間で、確立済みの受信チャネルとは別に、発話音声データ送信用の送信チャネルを確立し、発話音声データを管理装置100に送信する。ユーザAの発話音声データは、管理装置100から各ユーザB~Eにそれぞれに配信される。各ユーザ端末500では、発話音声データにユーザ識別情報が含まれているので、発話音声データの受信をトリガーに、制限全二重通信に参加している発話ユーザをカウントする。同時接続上限数と比較して、同時接続上限数未満であれば、自分も発話することができ、自分の発話が同時接続上限数を超える参加人数となる場合、発話が制限される。
【0037】
図4の例では、ユーザA、ユーザB及びユーザCがそれぞれ発話ボタンを押して発話している状態を示している。このとき、同時接続上限数が3に設定されているため、例えば、ユーザDが発話ボタンを押して発話しようとすると、ユーザDのユーザ端末500は、同時接続上限数の制限により、ユーザDの発話を規制する。つまり、すでにユーザA、ユーザB及びユーザCの各発話音声データを受信しているので、発話ユーザのカウント数は「3」となっており、ユーザDが全二重通信に参加すると、同時接続上限数「3」を超えてしまうからである。ユーザDのユーザ端末500は、発話ボタンが押されても、管理装置100との間で送信チャネルを確立しないように制御し、所定のメッセージを音声出力することができる。例えば、「3人が発話中です。誰かの発話が終わるまで、お待ちください」といった音声メッセージを出力することができる。
【0038】
ユーザ端末500の制限全二重通信制御部521は、コミュニケーショングループ内の全二重通信による同時接続上限数と、同時接続中のユーザ及び同時接続ユーザ数を含む全二重通話ログと、を記憶部560に記憶し、管理装置100から受信する発話音声データに基づいて全二重通話ログを更新し、全二重通話ログと同時接続上限数とに基づいて、送信チャネルの確立を許容しない又は許容する制限全二重通信制御を行う。
【0039】
図5は、本コミュニケーションシステムの処理フロー(制限全二重
通信制御処理(A)を含む)を示す図である。管理装置100は、コミュニケーショングループ別に、同時接続上限数の設定(入力)を受け付け(S101)、記憶装置120に記憶する。
【0040】
各ユーザは、ユーザ端末500において、コミュニケーションApp制御部520を起動し、コミュニケーションApp制御部520が管理装置100との接続処理を行う。そして、所定のログイン画面から自分のユーザID及びパスワードを入力して管理装置100にログインする(S501a,S501b,S501c)。ログイン認証処理は、ユーザ管理部111によって遂行される(S102)。なお、初回ログイン後は、ユーザID及びパスワードの入力操作を省略して、コミュニケーションApp制御部520が起動に伴い、初回ログイン時に入力されたユーザID及びパスワードを用いて自動的にログイン処理を行うことができる。
【0041】
管理装置100は、ログイン認証処理に伴い、各ユーザが属するコミュニケーショングループを判別し(S102)、コミュニケーショングループ別に設定されている同時接続上限数を取得する(S103)。
【0042】
管理装置100は、複数の各ユーザ端末500に対し、取得した同時接続上限数を送信すると共に、自動的にグループ通話通信モードでの通信チャネル確立処理を行い、管理装置100を中心としたグループ通話チャネルを開通させる(S104)。
【0043】
ログイン後の各ユーザ端末500は、受信した同時接続上限数を記憶部560に記憶すると共に、グループ通話通信モードを開始し、管理装置100との間で発話音声データの受信チャネルを確立する(S502a,S502b,S502c)。以後、任意のタイミングで又は所定の時間間隔で、管理装置100との間で情報取得処理を行う。
【0044】
ユーザAは、発話する際、不図示の発話ボタンを押す。発話ボタンは、グループ通話モードを実行している所定の画面に設けられたボタンである。
【0045】
ユーザ端末500の制限全二重通信制御部521は、発話ボタンが押下されると、ステップS503aの制限全二重通信制御処理(A)を行う。発話ボタンが押下されると(S5001)、自身が既に全二重通話に参加しているユーザか否かを判別する(S5002)。全二重通話ログには、発話ユーザとその人数が記録されているので、全二重通話ログを参照して判別することができる。制限全二重通信制御部521は、自身が全二重通話ログに記録されていない新たな参加ユーザであると判別された場合、自身が全二重通話に参加して発話すると、自分の発話が同時接続上限数を超えるか否かを判別する。言い換えれば、全二重通話ログの同時接続ユーザ数を「1」インクリメントしたとき、同時接続ユーザ数が同時接続上限数以下となるか否かを判別する(S5003)。
【0046】
全二重通話ログの同時接続ユーザ数を「1」インクリメントしても、同時接続ユーザ数が同時接続上限数以下となると判別された場合(S5003のYES)、制限全二重通信制御部521は、発話ボタンの押下に伴う送信チャネルの確立処理を行う(S5004)。そして、発話音声を集音し、発話音声データを管理装置100に送信する(S5005)。
【0047】
一方、全二重通話ログの同時接続ユーザ数を「1」インクリメントしたら、同時接続ユーザ数が同時接続上限数を超えてしまうと判別された場合(S5003のNO)、制限全二重通信制御部521は、予め設定された所定の音声メッセージ(エラーメッセージ)を出力し(S5006)、発話ボタンの押下に伴う送信チャネルの確立処理を行わないように制御する(S5007)。
【0048】
このように、
図5の制限全二重
通信制御処理(A)では、発話ボタンが押されたときに、全二重通話ログに含まれる同時接続中のユーザに存在しない自身を新たに加算した後の同時接続ユーザ数が同時接続上限数を超過するか否かを判別し、同時接続上限数を超過すると判別された場合、発話ボタンの押下に伴う送信チャネルの確立処理を行わないように制御する。これにより、ユーザ端末500側で、上限数以下での発話ユーザ数制限を行い、ネットワーク負荷及び管理装置100側の処理負荷を低減させた全二重通話環境を実現することができる。ステップS503b,ステップS503cについても同様である。
【0049】
図6は、本コミュニケーションシステムの制限全二重通信制御処理(B)を含む処理フローを示す図である。ステップS504aの制限全二重通信制御処理(B)は、管理装置100から発話音声データを受信した際の制御である。ステップS504b,S504cも同様である。
【0050】
図6に示すように、各ユーザ端末500は、管理装置100から発話音声データを受信する。このとき、ユーザ識別情報(発話者)も含まれる。制限全二重通信制御部521は、管理装置100から発話音声データを受信したとき(S5041)、受信した発話音声データが全二重通話ログに含まれる同時接続中のユーザか否かを判別する第1判定処理を行う(S5042)。
【0051】
第1判定処理において受信した発話音声データのユーザが、全二重通話ログに存在するユーザであると判別された場合に(S5042のYES)、ステップS5045に進む。つまり、同時接続ユーザとして既に参加し、その参加が維持されているユーザは、本人または他のユーザに関わらず、全二重通話ログによる制限判定を行わず、ステップS5045による再生可否の判定処理に進む。
【0052】
そして、第1判定処理において受信した発話音声データのユーザが、全二重通話ログに存在しない新たなユーザと判別された場合に(S5042のNO)、新たなユーザを加算した(「1」インクリメント)後の同時接続ユーザ数が同時接続上限数を超過するか否かを判別する第2判定処理を行う(S5043)。
【0053】
第2判定処理において同時接続上限数を超過していない、言い換えれば、同時接続上限数以下と判別された場合(S5043のYES)、新たなユーザを加えて全二重通話ログを更新する。同時接続ユーザリストに新たなユーザを加え、同時接続ユーザ数を「1」インクリメントするログ更新を行う(S5044)。次に、新たなユーザが自分自身であれば、受信した発話音声データを破棄して再生を許容しないように制御する(S5045)。つまり、自分自身の発話音声データか否かを判別し、自分自身の発話音声データであると判別された場合は(S5045のYES)、受信した発話音声データを破棄して再生しない(S5047)。一方、自分自身以外の他のユーザの発話音声データであると判別された場合は(S5045のNO)、受信した発話音声データを再生する(S5046)。
【0054】
ステップS5043(第2判定処理)において、同時接続上限数を超過していると判別された場合(S5043のNO)、ステップS5047に進み、受信した発話音声データを破棄して再生を許容しないように制御する。
【0055】
図7は、本コミュニケーションシステムの制限全二重通信制御処理(C)を含む処理フローを示す図である。ステップS507aの制限全二重通信制御処理(C)は、全二重通話による発話を終了する際の制御である。
【0056】
ユーザAは、発話を終了する際、不図示の発話終了ボタンを押す(S505a)。発話終了ボタンは、グループ通話モードを実行している所定の画面に設けられたボタンである。
【0057】
制限全二重通信制御部521は、発話終了ボタンが押されたとき、送信チャネルを通じて終了フラグを管理装置100に送信する(S506a)。このとき、制限全二重通信制御部521は、終了フラグを含む音声データを生成し、接続中の送信チャネルに乗せて終了フラグ付き音声データを管理装置100に送信するように構成することができる。終了フラグ送信後、制限全二重通信制御部521は、送信チャネルを遮断する(S507a)。
【0058】
管理装置100のグループ通話制御部112Aは、終了フラグを受け付け、各ユーザ端末との間の通信チャネル(ユーザ端末500側の受信チャネル)を通じて終了フラグを送信する(S106)。このとき、発話音声データの配信同様に、受信した終了フラグ付き音声データを、コミュニケーショングループ内の各ユーザ端末500に同報配信することができる。
【0059】
制限全二重通信制御部521は、管理装置100から終了フラグを受信したとき(S5081)、受信した終了フラグのユーザが全二重通話ログに存在することを確認する(S5082)。全二重通話ログに存在していると確認ができた後、制限全二重通信制御部521は、全二重通話ログから該当のユーザを削除して同時接続ユーザ数を「1」デクリメントする(S5083)。
【0060】
(第2実施形態)
図8から
図10は、第2実施形態を説明するための図であり、
図8は、本実施形態の制限全二重通信制御の説明図であり、上記第1実施形態に対して、送信チャネルの確立及び遮断の制御が異なる。
【0061】
図8に示すように、本実施形態においても上記第1実施形態同様、発話者の発話音声データが、本人のユーザ端末500にも一斉に配信される。そして、本実施形態では、ユーザDが発話ボタンを押下したとき、制限制御を行わずに送信チャネルを確立して発話音声データを管理装置100に送信するが、その後管理装置100から受信する発話音声データを用いて、同時接続上限数に基づいて全二重通話に参加できるか否かを判定し、参加できないと判定された場合に、一旦確立していた送信チャネルを遮断して閉じるように制御する。
【0062】
図9は、本実施形態のコミュニケーションシステムの制限全二重通信制御(A)-1を含む処理フローを示す図である。なお、以下の説明では、同じ機能等については上記第1実施形態と同符号を付してその説明を省略し、相違点を中心に説明する。
【0063】
ステップS5061aの制限全二重通信制御(A)-1は、送信チャネルを通じて自ら発した発話音声データを受信したとき、全二重通話ログに含まれる同時接続中のユーザに存在しない自身を新たに加算した後の同時接続ユーザ数が同時接続上限数を超過するか否かを判別し、同時接続上限数を超過すると判別された場合、発話ボタンの押下に伴って確立されていた送信チャネルを遮断するように制御する。
【0064】
図9に示すように、ログイン後の各ユーザ端末500は、受信した同時接続上限数を記憶部560に記憶すると共に、グループ通話通信モードを開始し、管理装置100との間で発話音声データの受信チャネルを確立する(S502a,S502b,S502c)。
【0065】
ユーザAは、発話する際、不図示の発話ボタンを押す。ユーザ端末500の制限全二重通信制御部521は、発話ボタンが押下されると(S5031a)、同時接続上限数と全二重通話ログとに基づく制限処理をここでは行わずに、発話ボタンの押下をトリガーに、一旦送信チャネルの確立処理を行う(S5041a)。そして、発話音声を集音し、発話音声データを管理装置100に送信する(S5051a)。
【0066】
管理装置100は、受け付けた発話音声データを、発話者本人を含むコミュニケーショングループ内の全てのユーザに、同報配信する(S105)。なお、発話音声データは、ユーザ識別情報を含む。
【0067】
ユーザ端末500は、管理装置100から発話音声データを受信する(S5601)。制限全二重通信制御部521は、受信した自分が発した発話音声データ及び他のユーザの発話音声データに基づいて全二重通話ログを更新する。
【0068】
制限全二重通信制御部521は、発話音声データを受信すると、受信した発話音声データが全二重通話ログに含まれる同時接続中のユーザか否かを判別する第1判定処理を行う(S5602)。第1判定処理において、受信した発話音声データのユーザが、全二重通話ログに存在するユーザであると判別された場合に(S5602YES)、ステップS5605に進む。同時接続ユーザとして既に参加し、その参加が維持されているユーザは、本人または他のユーザに関わらず、全二重通話ログによる制限判定を行わず、ステップS5605による再生可否の判定処理に進む。
【0069】
第1判定処理において全二重通話ログに存在しない新たなユーザと判別された場合(S5602のNO)、新たなユーザを加算した後の同時接続ユーザ数が同時接続上限数を超過するか否か、つまり、新たなユーザを加算した後の同時接続ユーザ数が同時接続上限数以下であるか否かを判別する第2判定処理を行う(S5603)。
【0070】
第2判定処理において同時接続上限数を超過していないと判別された場合(S5603のYES)、新たなユーザを加えて全二重通話ログを更新し(S5604)、新たなユーザが自身であれば(S5605のYES)、受信した発話音声データを破棄して再生を許容しない(再生しない)ように制御する(S5607)。発話ボタンの押下に伴って確立されている送信チャネルは維持される(S5608)。新たなユーザが自分自身以外の他のユーザであれば(S5605のNO)、受信した発話音声データの再生を許容するように制御する(S5606)。
【0071】
第2判定処理において同時接続上限数を超過していると判別された場合(S5603のNO)、受信した発話音声データを破棄して再生を許容しないように制御するとともに、新たなユーザが自分自身であれば(S5609のYES)、発話ボタンが押されたことに伴って一旦確立していた送信チャネルを遮断し(S5611)、送信チャネルの確立を許容しないように制御する。このとき、上記第1実施形態同様に、同時通話に参加できない旨のメッセージを音声出力するように構成することができる(S5610)。ステップS5609において、自分自身以外の他のユーザの発話音声データである場合は(S5609のNO)、送信チャネルの遮断制御等に関係なく、受信した発話音声データを破棄して再生しないように制御する。
【0072】
図10に示した制限全二重通信制御(A)-1は、
図5の制限全二重通信制御(A)と
図6の制限全二重通信制御(B)の双方の処理に相当するものである。また、
図7の制限全二重通信制御(C)については、本実施形態においても同様に適用される。
【0073】
図10は、本実施形態の制限全二重通信制御の全二重通話ログ更新と制限制御を説明するための図である。
図10の例において、ユーザ1が発話ボタンを押して発話すると、ユーザ1を含む全てのユーザに発話音声データが、管理装置100から配信される。ユーザ1からユーザ7の各ユーザ端末500は、制限全二重通信制御(A)-1を経て、さらに自分自身の発話音声データであれば再生せず、自分以外の発話音声データであれば再生する。
【0074】
ユーザ1の発話音声データを受信すると、全二重通話ログの同時接続ユーザに「ユーザ1」が追加され、かつ同時接続ユーザ数が「1」に更新される。続いて、ユーザ3が発話ボタンを押下して発話すると、ユーザ3を含む全てのユーザに発話音声データが、管理装置100から配信され、同様に、制限全二重通信制御(A)-1を経て、ユーザ3の発話音声データの受信に伴い、全二重通話ログの同時接続ユーザに「ユーザ3」が追加されて、かつ同時接続ユーザ数が「2」に更新される。その後、ユーザ6も発話ボタンを押下した発話すると、ユーザ6を含む全てのユーザに発話音声データが、管理装置100から配信され、制限全二重通信制御(A)-1を経て、ユーザ6の発話音声データの受信に伴い、全二重通話ログの同時接続ユーザに「ユーザ6」が追加されて、かつ同時接続ユーザ数が「3」に更新される。
【0075】
同時接続上限数は「3」に設定されている場合、この時点でユーザ1,ユーザ3及びユーザ6が全二重通話に参加しており、上限に達している状態である。上限に達している状態でユーザ4が発話ボタンを押下して発話すると、ユーザ4のユーザ端末500は、一旦送信チャネルを確立してユーザ4の発話音声データを管理装置100に送信するが、管理装置100から配信される発話音声データを受信すると、各ユーザ端末500側での制限全二重通信制御(A)-1により、ユーザ4の発話音声データの破棄及び再生NG制御が行われ、ユーザ4自身のユーザ端末500は、管理装置100に対する送信チャネルを閉じる。そして、全二重通話に参加できない旨のエラーメッセージを流す。
【0076】
一方、全二重通話に参加していたユーザ3が、発話終了ボタンを押下すると、制限全二重通信制御部521は、送信チャネルを通じて終了フラグ付き音声データを管理装置100に送信する。フラグ送信後、制限全二重通信制御部521は、送信チャネルを遮断する。
【0077】
管理装置100は、受け付けた終了フラグ付き音声データをコミュニケーショングループ内のユーザ3を含む全てのユーザ端末500に同報配信する。各ユーザ端末500は、受信した終了フラグのユーザを、全二重通話ログから削除して同時接続ユーザ数を「1」デクリメントする。
図10に示すように、ユーザ3の発話終了に伴い、全二重通話ログの同時接続ユーザが「ユーザ1,ユーザ6」となり、同時接続ユーザ数が「2」に更新されている。
【0078】
なお、本実施形態及び上記第1実施形態において、
図7の発話終了ボタンの押下に伴って送信チャネルを遮断するタイミングは、終了フラグ付き音声データの送信とセットではなく、例えば、自分自身を含んで管理装置100から終了フラグ付き音声データを受信したことをトリガーとして、確立していた送信チャネルの遮断処理を行うように構成してもよい。
【0079】
(第3実施形態)
図11から
図16は、第3実施形態を説明するための図である。本実施形態は、上記第1実施形態及び第2実施形態のコミュニケーションシステムが、コミュニケーション履歴を蓄積し、各ユーザ端末500においてコミュニケーション履歴を表示させる機能を備えた態様である。なお、以下の説明では、同じ機能等については上記第1,第2実施形態と同符号を付してその説明を省略し、相違点を中心に説明する。
【0080】
図11は、本実施形態のコミュニケーションシステムの機能ブロックを示す図であり、音声認識部113、コミュニケーション履歴情報124、及び音声認識辞書125が追加されている。本実施形態では、管理装置100が受け付けたユーザの発話音声を音声認識処理した音声認識結果(発話テキスト)を、コミュニケーション履歴として蓄積しつつ、コミュニケーショングループ内の各ユーザ端末500に、コミュニケーション履歴を同期して表示させる機能を提供する。
【0081】
管理装置100のグループ通話制御部112Aは、上述したユーザによる発話音声データの同報配信制御に加え、その発話内容のテキスト情報(発話音声データを音声認識処理して得られたテキスト情報)を複数の各ユーザ端末500に一斉に送る同報配信制御を行う。
【0082】
このため、グループ通話制御部112Aは、第1制御部と第2制御部とを備え、第1制御部は、上述した、一のユーザ端末500から受信した発話音声データをコミュニケーショングループ内の複数のユーザ端末500それぞれに同報配信制御を行う。第2制御部は、受信した発話音声データを音声認識処理して得られる発話音声認識結果を、ユーザ同士のコミュニケーション履歴124として時系列に蓄積するとともに、発話したユーザのユーザ端末500を含む全てのユーザ端末500においてコミュニケーション履歴124が同期して表示されるようにテキスト配信制御を行う。
【0083】
つまり、ユーザ端末500において再生される音声は、すべてテキスト化されてコミュニケーション履歴124に時系列に蓄積され、各ユーザ端末500において同期して表示される。音声認識部113は、音声認識辞書125を用いて音声認識処理を行い、発話音声認識結果としてテキストデータを出力する。音声認識処理については公知の技術を適用することができる。
【0084】
コミュニケーション履歴情報124は、各ユーザの発話内容が時間情報と共に、テキストベースで時系列に蓄積されたログ情報である。なお、各テキストに対応する音声データは、音声ファイルとして所定の記憶領域に格納してもよく、この場合、コミュニケーション履歴124には、音声ファイルの格納場所も記録される。コミュニケーション履歴情報124は、コミュニケーショングループ別にそれぞれ生成され、蓄積される。
【0085】
図12は、各ユーザ端末500で表示されるコミュニケーション履歴124の一例を示す図である。ユーザ端末500それぞれは、管理装置100からリアルタイムに又は所定のタイミングでコミュニケーション履歴124を受信し、複数のユーザ間で表示同期が取られる。各ユーザは、時系列に過去のコミュニケーションログを参照することができる。
【0086】
図12の例のように、各ユーザ端末500は、自分の発話内容及び自分以外の他のユーザの発話内容が表示欄Dに時系列に表示され、管理装置100に蓄積されるコミュニケーション履歴124がログ情報として共有される。なお、表示欄Dにおいて、ユーザ自身の発話音声に対応するテキストには、マイクマークHを表示し、発話者以外の他のユーザに対しては、マイクマークHの代わりに、表示欄DにおいてスピーカーマークMを表示したりすることができる。
【0087】
このような音声認識技術を用いたテキスト化及び表示技術は、複数のユーザで全二重通話による双方向対話している場合、各ユーザの発話音声が完了するのを待って、音声認識処理を行い、テキスト化することが考えられる。しかしながら、対話中の「発話のキャッチボール」を識別せずに、各ユーザの発話開始から終了までの音声データそれぞれを、単に音声認識してしまうと、
図13の例のように、複数ユーザ間の「発話のキャッチボール」を理解することができない状態となる。
【0088】
対話中の発話のキャッチボールを考慮したコミュニケーション履歴の表示を行うためには、
図14の例のように、音声認識処理又は音声認識結果を、双方向の発話の時系列情報に基づいて細分化する必要がある。特に、対話が長ければ長いほど、
図13の例のように対話を理解することが難しい音声認識結果となってしまうため、全二重通話では、特に、双方向の発話の時系列性を考慮した、言い換えれば、複数ユーザ間の発話のキャッチボールを考慮した音声認識処理及びテキスト表示を行う必要がある。
【0089】
そこで、本実施形態のコミュニケーション制御部112は、全二重通話で同時接続中の各ユーザから受信する連続した音声データにおいて、一のユーザの隣り合う発話の間隔が所定時間以上離間している場合、隣り合う発話の各発話音声認識結果が分離した状態でユーザ端末500に表示されるように制御し、隣り合う発話の間隔が所定時間未満であれば、隣り合う発話の各発話音声認識結果を分離せずに表示されるように制御する。
【0090】
そして、複数のユーザの発話音声が混在する区間において、受信した各ユーザの発話開始時刻順に、ユーザ別の発話音声認識結果が吹き出し表示されるように制御する。
【0091】
このように構成することで、
図14の例のように、複数ユーザによる全二重通話のコミュニケーション履歴が理解しやすい形で、各ユーザ端末に提供することができる。
【0092】
図15は、本実施形態の音声認識結果に基づく表示処理を説明するための図である。説明の便宜上、発話開始から発話終了までの区間を、1マス1秒で表し、マス内の英字は、発話音声に対応する音声認識結果を示している。
図16も同様である。
【0093】
図15において、発話開始時刻から発話音声が記録され、時間を空けてまた発話音声が記憶される。これは、全二重通話における発話のキャッチボールであり、自分が発話し、それに対して相手の発話を聞き、聞いた相手の発話に対してさらに自分が発話する。
図15の例では、自分の発話が英字で表現され、相手の発話を聞いている状態を空欄で表現している。
【0094】
本実施形態では、発話開始から発話終了までの間に複数点在する発話の間隔に設定値を設ける。例えば、6秒を設定することができる。なお、設定値の秒数は任意である。そして、隣り合う発話の間隔が6秒以上離間している場合、隣り合う発話の各発話音声認識結果を分離し、6秒未満であれば、分離せずに一括する(隣り合う発話を一緒にする)。このような区画制御を行い、区画された領域で、発話音声認識結果が時系列に吹き出し表示されるように制御する。
【0095】
図16は、複数ユーザの会話が重なり合う領域を含む音声認識結果に基づく表示処理を説明するための図である。
【0096】
図16においても同様であり、各ユーザA,B,Cが、全二重通話で対話し、各ユーザ別に、発話開始から発話終了までに間隔を空けて複数点在する各発話を、設定値を用いて区画する。区画された各発話の開始時刻に基づいて、各ユーザA,B,Cの発話吹き出しを時系列に並べて表示するように制御する。
【0097】
以上、実施形態について説明したが、コミュニケーション管理装置100及びユーザ端末500の各機能は、プログラムによって実現可能であり、各機能を実現するために予め用意されたコンピュータプログラムが補助記憶装置に格納され、CPU等の制御部が補助記憶装置に格納されたプログラムを主記憶装置に読み出し、主記憶装置に読み出された該プログラムを制御部が実行することで、各部の機能を動作させることができる。
【0098】
また、上記プログラムは、コンピュータ読取可能な記録媒体に記録された状態で、コンピュータに提供することも可能である。コンピュータ読取可能な記録媒体としては、CD-ROM等の光ディスク、DVD-ROM等の相変化型光ディスク、MO(Magnet Optical)やMD(Mini Disk)などの光磁気ディスク、フロッピー(登録商標)ディスクやリムーバブルハードディスクなどの磁気ディスク、コンパクトフラッシュ(登録商標)、スマートメディア、SDメモリカード、メモリスティック等のメモリカードが挙げられる。また、本発明の目的のために特別に設計されて構成された集積回路(ICチップ等)等のハードウェア装置も記録媒体として含まれる。
【0099】
なお、本発明の実施形態を説明したが、当該実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0100】
100 コミュニケーション管理装置
110 制御装置
111 ユーザ管理部
112 コミュニケーション制御部
112A グループ通話制御部
113 音声認識部
120 記憶装置
121 ユーザ情報
122 グループ情報
123 同時接続上限数
124 コミュニケーション履歴情報
125 音声認識辞書
130 通信装置
500 ユーザ端末(移動通信端末)
510 通信・通話部
520 コミュニケーションApp制御部
521 制限全二重通信制御部
530 マイク(集音部)
540 スピーカー(音声出力部)
550 表示・入力部
560 記憶部
D 表示欄