【課題を解決するための手段】
【0005】
本発明では、請求項1に記載の特徴を備えた会議システムを提案する。さらに、請求項11に記載の特徴を備えた処理方法についても説明する。従属請求項、以下の説明及び添付の図面には、本発明の好ましい又は有利な実施形態が示されている。
【0006】
本発明によれば、会議室又は大会議場に設置して動作可能な会議システムが提供される。この会議システムは例えば、互いに議論し合う政治家又は他の参加者によって利用される。なお、このような会議システムを会議施設と称する場合もある。
【0007】
この会議システムは、複数のデリゲートユニットを備えている。好ましくは50台よりも多くのデリゲートユニット、特に100台よりも多くのデリゲートユニットが、会議システムにおいて使用される。各デリゲートユニットは、周囲からオーディオ信号を受信するためのマイクロフォンを備えている。オーディオ信号は特に、デリゲートユニットの前つまりはマイクロフォンの前に立っている又は座っている参加者からの音声信号である。好ましくはデリゲートユニットは、オプションとしてスピーカを備えた又は備えていないベースボディを有するテーブルトップユニットとして実現されており、マイクロフォンはベースボディ上に配置されている。データを処理するために好ましいのは、デリゲートユニットがローカル処理ユニットを備えていることであり、このユニットは好ましくはベースボディに組み込まれている。
【0008】
さらに会議システムは、中央サービスモジュールを備えている。このモジュールは、複数のコントリビューションチャネル即ち発言チャネルを処理するように動作可能であり、特にチャネルの増幅を行う。この場合、各発言チャネルのオーディオ出力によって、会議システムの増幅されたオーディオ出力が構成される。会議システムの増幅されたオーディオ出力は、周囲環境の中に設けられた会議システムによって供給される合成されたオーディオ環境である。好ましくはこの会議システムは、発言チャネルを利用することで、デリゲートユニットから到来するオーディオ信号を増幅して、増幅されたオーディオ信号を形成するように動作可能であり、この場合、増幅されたオーディオ信号は、例えば大会議場又はミーティングルーム内のオーディオ環境の一部分である。
【0009】
各デリゲートユニットは、発言チャネルにコミットする要求を中央サービスモジュールへ送信又は伝達するように構成されている。この要求によってデリゲートユニットは、自身のオーディオ信号を発言チャネルへ伝達する目的で、複数の発言チャネルのうち1つの発言チャネルとの接続を要請し、それによってオーディオ信号が増幅されて、増幅されたオーディオ出力の一部分が形成され、従って、オーディオ環境の一部分が形成される。中央サービスモジュールは、この要求を許可し、複数の発言チャネルのうち1つの発言チャネルを、要求送出側のデリゲートユニットへ割り当てるように構成されている。この手順によって、要求送出側のデリゲートユニットはアクティブ状態にセットされ、パッシブ状態のデリゲートユニットからアクティブ状態のデリゲートユニットへ、その状態が変更される。
【0010】
中央サービスモジュールをコンピュータとして実現することができ、特にサーバとして実現することができる。中央サービスモジュールとデリゲートユニットとの通信は、要求の送信及び/又はオーディオ信号の伝送のために、好ましくはディジタル通信であり、特に何らかのネットワークプロトコルを利用したディジタル通信である。
【0011】
本発明によれば、デリゲートユニットは、ボイスアクティベーションにより要求をトリガし、それに続いてその要求を伝送するように構成されている。従って、この会議システムによれば、デリゲートユニットをボイスアクティベーションによって、パッシブ状態からアクティブ状態に変更することができる。ボイスアクティベーションとは、要求のトリガを起こすために、デリゲートユニットの前にいる話者が話し始めるだけでよい、ということである。ボイスアクティベーションモードの利点は、ディスカッション参加者は、ボタンなどを押してディスカッションに対する発言要求を送出する必要がなく、単に話し始めるだけでディスカッションに加わることができる点である。ボイスアクティベーション方式は、対話形式のディスカッションに役立つだけでなく、他のディスカッション方式において議場オーディオを構成するチャネル数の制限にも利用できる。
【0012】
複数のデリゲートユニットのうち、要求をトリガしてよいデリゲートユニットのことを、要求送出側の候補デリゲートユニットと称し、デリゲートユニットのいずれであっても、このような要求送出側の候補ユニットになることができる。要求送出側の候補デリゲートユニットは、少なくとも第1のトリガ条件が満たされた場合に要求をトリガするように構成されており、この第1のトリガ条件とは、要求送出側の候補デリゲートユニットのオーディオ信号レベルが、アクティブ状態にある他のいずれのデリゲートユニットの個々のテスト値よりも高い、ということを要求するものである。要求送出側の候補デリゲートユニットの固有のオーディオ信号レベルは、要求送出側の候補デリゲートユニットのマイクロフォンによって受信されたオーディオ信号のレベルである。他のアクティブなデリゲートユニットのいずれについても、固有のテスト値が推定又は算出される。個々のテスト値は、アクティブ状態にある他のデリゲートユニットから供給された、及び、要求送出側の候補ユニットのマイクロフォンに入力されたオーディオ信号又は音声信号から得られる、要求送出側の候補デリゲートユニットの推定又は計算されたオーディオ信号レベルである。
【0013】
本発明の基礎を成す着想として挙げられるのは、デリゲートユニットが互いに密接して配置されているケースでは、例えば1mよりも近い間隔で、特に60cmよりも近い間隔で配置されているケースでは、デリゲートユニットのオーディオ入力ダイナミックレンジが広い場合が多い点を考慮すると、デリゲートユニットは、それが要求送出側の候補デリゲートユニットであるのか、近隣のデリゲートユニットであるのか、付加的な情報がなければ判断できない、というものである。しかも、室内の条件(反射及び残響)によっては、誤って話者であると認識されてしまうレベルにまで音声が蓄積して増大する複数のポイントが、室内に発生する可能性がある。
【0014】
第1のトリガ条件のテストを実施することにより、要求送出側の候補デリゲートユニットは、自身のオーディオ信号が、自身のマイクロフォンに向けて話している話者ないしは参加者から受信されたものであるのか、或いは近隣のデリゲートユニットに向けて話している話者ないしは参加者から受信されたものであるのか、をテストする。ここでは、近隣のデリゲートユニットの個々のテスト値が、自身のオーディオ信号レベルよりも高いものとし、その場合、要求送出側の候補デリゲートユニットは、ボイスアクティベーションすべきではない、との結論を出す。つまり要求送出側の候補デリゲートユニットは、第1のトリガ条件の真偽についてテストする。
【0015】
テストデリゲートユニットに対する個々のテスト値は、好ましくは以下のようにして推定され、特に算出される。即ちこの場合、要求送出側の候補デリゲートユニットとテストデリゲートユニットから成る各ペアについて規定された個々の音響結合係数を、テスト期間中のテストデリゲートユニットのオーディオ信号レベルと、オプションとして閾値係数と、乗算するのである。つまり各ペア(要求送出側の候補デリゲートユニット<−>テストデリゲートユニット)ごとに、固有の音響結合係数が規定される。テストデリゲートユニットのオーディオ信号レベルは、個々のテストデリゲートユニットのマイクロフォンによって受信されるオーディオ信号のレベルとして規定される。テスト期間は、好ましくは1秒よりも短く、特に0.1秒よりも短い。この場合、アクティブなデリゲートユニットだけがデリゲートユニットとして評価されるのが好ましい。
【0016】
本発明の1つの択一的な実施形態によれば、最後の数回の期間にわたるテストデリゲートユニットのオーディオ信号レベルの最大値が、現在のテスト期間のオーディオ信号レベルの代わりに用いられる。最大値を求めるために、例えば最後の3回、5回又は10回の期間が用いられる。この択一的な実施形態によって、値のロバストネスが向上し、つまりはボイスアクティベーションのロバストネスが向上する。
【0017】
本発明のさらに別の実施形態によれば、複数のサンプルから成る1つのブロックごとに個々のテスト値が更新され、例えば1024個のサンプルから成る1ブロックごとに48kHzのサンプリングレートで更新され、従って、この場合、個々のテスト値は21msごとに更新される。サンプリングレート及びブロック長について、これ以外の値を用いてもよい。さらに好ましいのは、第1のトリガ条件のテストをサンプルごとに実施することである。従って、上述の例であれば、1/48000秒ごとにテストが実施される。
【0018】
個々の音響結合係数は、要求送出側の候補デリゲートユニットのオーディオ信号レベルと、テストデリゲートユニットを使用する話者から音声信号が発せられた場合のテストデリゲートユニットのオーディオ信号レベルとの比を記述又は表現するものである。換言すれば、個々の音響結合係数は、テストデリゲートユニットのマイクロフォンに向けて話者が発声している状況において導出することができ、その際、音響結合係数を取り出すために、要求送出側の候補デリゲートユニットのオーディオ信号
レベルが、
テストデリゲートユニットのオーディオ信号レベルによって除算される。つまり音響結合係数は、要求送出側の候補デリゲートユニットのマイクロフォンと、テストデリゲートユニットマイクロフォンが、音声信号からどれだけ受信したかの比を表す。
【0019】
さらにこの会議システムは、要求送出側の候補デリゲートユニットが、自身のスピーカ又は他のスピーカからオーディオ信号を受信した場合の耐性もある。この場合、個々の音響結合係数は、そのつど同様にスピーカからのオーディオに向かって収束することになり、このことからスピーカの信号によって要求がトリガされてしまうような事態が回避される。これが可能である理由は、どの(アクティブな)デリゲートユニットがそのスピーカ信号に寄与しているのかが既知だからである。ローカルスピーカがマイクロフォンに結合されるのを低減するため、短い音響エコーのためのエコーキャンセラを実装することができ、これによればデリゲートユニットのスピーカの信号が自身のマイクロフォン信号からフィルタリングされて取り除かれる。
【0020】
1つの有利な実施形態によれば、各デリゲートユニットは、(アクティブ状態及びパッシブ状態のデリゲートユニットから成る)他のデリゲートユニットの個々のIDと個々の結合係数とを含む係数テーブルを有している。ここで強調しておきたいのは、種々のデリゲートユニットの結合テーブルは互いに異なる、ということである。さらにこのデリゲートユニットは、アクティブ状態にある他のデリゲートユニットの個々のIDとテスト期間中のオーディオ信号レベルとを含むオーディオ信号レベルテーブルを有している。これら2つのテーブルを用いることによって、要求送出側の候補デリゲートユニットは、第1のトリガ条件に関するテストを実行することができる。
【0021】
本発明の1つの有利な実施形態によれば、係数テーブルは各デリゲートユニットにより管理され、好ましくは各デリゲートユニットに格納される。例えばデリゲートユニットは、係数テーブルを格納するための記憶装置を有している。オーディオ信号レベルテーブルは、中央サービスモジュールによって供給される。オーディオ信号レベルテーブルは、テスト周期ごとに更新する必要があるので、例えばブロードキャスト又はマルチキャストによる分配方式によって、オーディオ信号レベルテーブルを各デリゲートユニットに分配することができる。
【0022】
本発明の1つの実現可能な改良形態によれば、デリゲートユニットは、他のデリゲートユニット各々に関する個々の音響結合係数を繰り返し推定するように構成されており、反復ステップごとに、個々の結合係数の初期値が改善される。1つの実現可能な実施形態によれば、すべての個々の結合係数は、会議システムのインストール又は初期化の際に1.0=0dBにセットされる。個々の結合係数を推定するための状況が発生するとただちに、次の繰り返しステップが実施される。この種の状況とは、1人の話者だけが会議システムの1つのデリゲートユニットを使用している場合である。このような状況であると、使用されているデリゲートユニットに関して、他のすべてのデリゲートユニットの個々の結合係数を、反復ステップにおいて改善することができる。従って、この会議システムは自己学習型であり、つまり時間の経過につれて自己最適化されていく。
【0023】
本発明のさらに別の実現可能な改良形態によれば、第1のテスト期間のデータに基づき発言チャネルを要求し、1つの発言チャネルが自身に割り当てられたことによりこの発言チャネル専用にされたデリゲートユニットは、第2のテスト期間のデータに基づき、少なくとも第1のトリガ条件を再テストすることによって、要求従ってその割り当てをチェックするように構成されている。本発明の基礎を成す着想とは、以下のような状況である。即ち、例えば他のデリゲートユニット各々と隣り合った例えば3つのデリゲートユニットは、第1のテスト期間中、パッシブ状態にあり、これら3つのデリゲートユニットすべては同じ音声信号を受信する、というものである。このような状況において起こり得る可能性があるのは、3つのデリゲートユニットすべてがパッシブ状態であり、互いにテストし合わないことから、これら3つのデリゲートユニットすべてが上述のように要求をトリガすることである。3つのデリゲートユニットがそれぞれ1つの発言チャネルに割り当てられた後、第2のテスト期間のデータに基づき第1の条件が再テストされる。この第2のテスト期間は、好ましくは第1のテスト期間以降の期間であり、特に、第1のテスト期間後の次のテスト期間である。第2のテスト期間中、上述の3つのデリゲートユニットはアクティブ状態である。第2のテスト期間のデータに基づき第1のトリガ条件をテストすることにより、3つのデリゲートユニットのうち2つのデリゲートユニットは、第1のトリガ条件をテストして、偽と判定する。その理由は、このとき3つのデリゲートユニットは、第1のトリガ条件について互いにテストし合うことになるからである。
【0024】
本発明のさらに別の改良実施形態によれば、第1のトリガ条件と、要求送出側の候補デリゲートユニットのオーディオ信号レベルがテスト期間中の基準ノイズレベルよりも高いということを要求する第2のトリガ条件とが少なくとも満たされた場合に、要求をトリガするように、デリゲートユニットが構成されている。ノイズレベルのデータは、好ましくは中央サービスモジュールによって供給され、特にオーディオ信号レベルテーブルとともに供給される。
【0025】
同じ音声信号に由来する2つのデリゲートユニットからの要求が許可されてしまわないようにするための、さらに別の実現可能な改良形態によれば、中央サービスモジュールは、予め選定されたデッドタイム中、ただ1つの要求だけしか許可しないように構成されている。先に挙げた例で述べたように、すべてのデリゲートユニットはそれらの要求を著しく短い時間期間内で送信する。中央サービスモジュールは、最初の要求だけを許可し、デッドタイム中、他の要求は拒否することになる。
【0026】
本発明のさらに別の改良形態によれば、デリゲートユニットは、自身の話者のステータスを表すための話者表示装置を備えており、第1の表示条件としてデリゲートユニットがアクティブ状態にあるとき、かつ第2の表示条件としてボイスピッチが検出されたとき、話者表示が起動にされる。この改良形態によって保証されるのは、トリガとなるオーディオ信号が音声信号である場合だけ、表示装置が起動されることである。
【0027】
本発明の1つの実施形態に関する以下の説明を通して、本発明のさらに別の特徴、利点、及び詳細な点が明らかになるであろう。