【実施例】
【0170】
以下では、エコー抑制が前処理アプローチとして実行される個別的実施形態について詳細に述べる。
【0171】
特に、オーディオ通信装置のラウドスピーカーによって生成される非線形歪みを低減するために遠端信号を前処理することに向けたサブバンド・ベースのアプローチの記述および解析が提供される。記述されるアプローチは、(記載された第一のサブバンド信号に対応する)遠端サブバンド信号および(記載された残留サブバンド信号に対応する)多数の残留サブバンド信号における信号イベントおよび特性の間の相関を評価する。これらの相関は、類似性値として使われ、各遠端サブバンドの、残留信号における結果的な歪みに対する影響を定量化する、歪み指標を導出するために使われる。前処理器関数のパラメータを適応させることによって、全体的なシステムの目標は、結果として得られる非線形歪みを最小にするものであり、この個別的な例では、その一方で線形音響エコー成分を最大にする。
【0172】
まず、非線形歪みの根底にあるモデルを提示する。
【0173】
図1に示した音響エコー打ち消しシステムが考慮されてもよい。ここで、x(n)、e(n)、z(n)およびr(n)はそれぞれ、遠端信号(第一のオーディオ信号)、エコー信号、マイクロフォン信号および音響エコー・キャンセラー(AEC: acoustic echo canceller)残留信号を表わす。
【0174】
AECは、周波数または時間領域における線形適応的フィルタを使って、フィルタ係数/パラメータの更新を制御する規格化最小平均二乗(NLMS)アルゴリズムのようなアルゴリズムを用いて、実装されると想定される。よって、適応フィルタは、音響エコー経路の線形部分をモデル化するだけであり、推定値
【0175】
【数1】
を生成する。
【0176】
時間領域音響エコー・キャンセラー残留信号は
【0177】
【数2】
によって与えられる。
【0178】
信号がフィルタバンクまたは別の周波数領域分解を使って解析されて、1≦k≦Mとしてサブバンドkを生成する場合、(1)は次のように書ける。
【0179】
【数3】
近端発話信号またはノイズのようなローカルな擾乱がなければ、マイクロフォン・サブバンド信号Z(k)はエコー成分E(k)のみからなり、これは線形および非線形(nonlinear)部分にさらに分解できる。すなわち、
Z(k)=Y(k)+Y
nl(k)=Y(k)+H(k)X
nl(k) (3)
そして、線形エコー成分はY(k)=H(k)X(k)である。ここで、非線形効果は主としてパワー増幅器およびラウドスピーカー非線形性に起因し、よって非線形信号成分はラウドスピーカーからマイクロフォンへの伝達関数を受けると想定した。
【0180】
よって、サブバンド残留信号は次式によって与えられる。
【0181】
【数4】
さらに、音響エコー・キャンセラーが音響エコーの線形部分を正確にモデル化する、すなわち
【0182】
【数5】
と想定すると、
R(k)=H(k)X
nl(k)
となり、残差に存在する全音響エコーの非線形部分のみを残す。こうして、このシナリオでは、残留信号は非線形エコーのみを含む。
【0183】
X
nl(k)についての表式は、想定される、非線形歪みの根底にあるモデルに依存する。
【0184】
典型的には、特に低周波数において、ラウドスピーカー・システムの非線形特性を記述するためには、高調波モデルが使われる。(共鳴より下の)こうした低周波数については、抑制システムの復元力は、ラウドスピーカーのコーン変位の多項式関数によって近似できる。それは、基本周波数の倍数のところのスペクトル成分の生成につながる。
【0185】
発話調音器官(speech articulator)は2ないし20Hzの範囲のレートで動き、発話包絡におけるゆっくりした変調を生じる。これらの変調は、発話信号についての音声(phonetic)情報を含み、背景ノイズおよび残響を含む過酷な音響環境における劣化を受けないことが知られている。
【0186】
記載された具体例では、類似性値および歪み指標は、発話包絡におけるゆっくりした変調を考慮することによって、第一のオーディオ信号のサブバンドについて計算される。具体的には、第一のオーディオ信号のサブバンド信号および残留サブバンド信号の包絡における変調の間の相関が決定され、類似性値として使われる。これらの相関は次いで、歪み指標に組み合わされる。
【0187】
よって、各サブバンドについて(発話変調)包絡信号が生成される。これは具体的には、たとえばフィルタバンクによって、まず個々のサブバンドを生成することによって達成されてもよい。
【0188】
いくつかの実施形態では、信号は、DFTまたはSTFTのような一様なフィルタバンクを使って生成される等間隔の、等帯域幅のサブバンド信号の集合に基づいて処理される。
【0189】
他の実施形態では、低周波数でのより細かい周波数分解能およびより高い周波数でのより粗い周波数分解能をもつワープト・フィルタバンクのような非一様なフィルタバンクが使われる。ワープトDFTフィルタバンクのような非一様なフィルタバンクは、関心対象の信号を分解し、再合成するためにより少数のサブバンドを使うことができる、つまり複雑さが低減できるという利点をもつ。
【0190】
用いられるフィルタバンクに依存して、各サブバンド内での群遅延は異なることがあり、信号の適正な再構成を達成するためには、周波数合成前のサブバンド毎の遅延要素または周波数合成後の補償フィルタの使用を必要とする。しかしながら、今の特定の例では、提案される処理は、サブバンド信号の包絡を利用し、よって、包絡が適正に整列される限り、実際の遅延値はそれほど正確である必要はない。
【0191】
音響エコー経路と、ラウドスピーカーおよびマイクロフォン経路における他の信号処理コンポーネントとが遅延を導入するため、遅延補償のもう一つの形が含められてもよい。これは、ラウドスピーカー信号における基本周波数の相関付けられた包絡が、向上された出力信号、たとえば残留信号における歪み包絡と適正に整列されることを保証する。
【0192】
関心対象の信号が一組の(複素)サブバンドに分解されたのち、各チャネルの包絡はこの特定の例において計算される。
【0193】
フィルタバンクの型(臨界サンプリングか過剰サンプリングか)に依存して、これは以下の段階を含むことができる。
各サブバンドにおける複素数値の信号の絶対値(大きさ)を計算する。
絶対値信号を低域通過フィルタ処理する。
過剰サンプリングされるフィルタバンクについては、結果として得られる信号がダウンサンプリングされることができる。
【0194】
低域通過フィルタは、発話の変調包絡における変動のみが捕捉されるよう、サブバンド包絡の平滑化を実行する。これを達成するために、しばしば16〜20Hzのカットオフ周波数をもつ低域通過フィルタが有利に使用できる。サブバンド振幅の低域通過フィルタ処理は、提案される発明のある種の実施形態において必須であってもなくてもよい。
【0195】
DFTフィルタバンクを使ってまたは単に短時間フーリエ変換(STFT)を適用することによって、ダウンサンプリングは通例、変換に内在しているまたはフィルタバンク構造に存在している。(過剰サンプリングされる)ワープト・フィルタバンクについては、ダウンサンプリングは、包絡を計算するときに明示的に実行される。ダウンサンプリングは、本発明のある種の実施形態において必要とされてもされなくてもよく、低域通過フィルタ処理動作に依存する。サブバンド信号が低域通過フィルタ処理される場合、特に多数のサブバンドが考慮されるときは、ダウンサンプリングは計算量を減らすことができる。
【0196】
いくつかの実施形態では、その後の処理において考慮される包絡信号の数を減らすために、隣接するサブバンドにおける包絡は(典型的には総和または平均によって)組み合わされてもよい。
【0197】
今の特定の例では、包絡サブバンド信号を生成するために以下の処理が適用されてもよい:
サブバンド信号の半波整流または全波整流。
低域通過フィルタを使った、整流された信号の平滑化。
平滑化された信号のダウンサンプリング。
平滑化された信号の高域通過フィルタ処理または差分による零平均包絡の生成。
【0198】
結果として得られるサブバンド信号は典型的には、音声(phonetic)イベントに関連付けられた活動バーストを有する。これらのイベントの時間における形状および局在化は、今の特定の例では、類似性値の生成の基礎をなす。こうして、類似性値は、遠端信号(第一のオーディオ信号)のサブバンドにおけるイベントおよびAEC残留信号の対応する(たとえば高調波の)サブバンドを横断したイベントの間での相関を反映するよう生成されてもよい。
【0199】
【数6】
がそれぞれ
【0200】
【数7】
の包絡を表わすとする。すると、残留包絡は非線形遠端包絡:
【0201】
【数8】
を用いて書くことができる。ここで、H(k)の値はチルダ付きのX
nl(k)よりずっと遅いレートで変化すると想定される。
【0202】
加法的高調波歪みモデルでは、非線形遠端包絡〔チルダ付きのX
nl(k)〕は、そのエネルギーに寄与する諸基本周波数を用いて書くことができる。
【0203】
【数9】
実数の係数a
k,mは、何らかの整数q=2,3,…,N
har+1について遠端の第一の信号のサブバンドm=k/q、m≠kの部分を、捕捉されたエコー信号におけるその高調波サブバンドkに関係付ける。N
harはモデルにおいて考えられている高調波の数を表わす。
【0204】
式(6)における残留非線形音響エコーについての表式を与えられると、残留包絡〔チルダ付きのR(k)〕は次のようになる。
【0205】
【数10】
図4および
図5は、それぞれ第一のオーディオ信号および残留信号についての平滑化され、ダウンサンプリングされたサブバンドの例を示している。今の例では、サブバンド信号は16チャネルのワープト(Warped)離散フーリエ変換(DFT: Discrete Fourier Transform)フィルタバンクを使って生成される。遠端サブバンド包絡(すなわち、第一のオーディオ信号の異なるサブバンド)の間にも、遠端サブバンド包絡と残留サブバンド包絡の間(すなわち、第一のオーディオ信号と残留信号のサブバンド信号どうしの間)にも相関があることを注意しておいてもよいだろう。
【0206】
発話サブバンドの包絡の間の相関は、サブバンド中心周波数の間の差が増大するにつれて減少する傾向があることが知られている。したがって、初期解析を単純化するために、まず、遠端サブバンド包絡(第一のオーディオ信号のサブバンド信号)は無相関であり、積の項b
k,m=H(k)a
k.mが
【0207】
【数11】
として推定されることができると想定する。
【0208】
包絡が長さNの(重複する)ブロックにおいて処理される場合、(9)は次のように書ける。
【0209】
【数12】
κはブロック・インデックスを表わす。
【0210】
これらの値、すなわち^付きのb
k,mは類似性値として直接使用されてもよい。よって、
【0211】
【数13】
となる。
【0212】
多くの実施形態において、本システムは、G
pre(m)によって表わされる、各サブバンド信号についての適応可能な前処理利得を含んでもよい。この場合、利得は、歪み指標に基づいて設定され、よって適応的なフィードバック・ループが生成されうる。
【0213】
前処理器機能が利得関数G
pre(m)によって与えられて
【0214】
【数14】
となる場合、チルダ付きのR(k)を(10)または(11)に代入すると、次の類似性値(similarity values)が得られる。
【0215】
【数15】
m=kについての相関指標Sim(k,m)は、チルダ付きのX(m)と、残留信号
【0216】
【数16】
に残っている線形エコー成分、すなわち線形音響エコー・キャンセラーと真のエコー経路との間の線形モデル不一致に起因する抑制できなかった線形エコーの量との間の線形関係に対応する。
【0217】
典型的には、処理は、ブロック・ベースであってもよく、類似性値/相互相関はこのブロック処理に基づいていてもよい。典型的なブロック長は10〜50msである。
【0218】
もう一つの例として、類似性値Sim
k,mはいくつかのブロックにわたって
【0219】
【数17】
として計算されてもよい。ここで、i
maxは
【0220】
【数18】
のピーク値が位置しているブロックκ内のサンプル・インデックスに対応する。
【0221】
先述したように、
図4および
図5は、16チャネルのワープトDFTフィルタバンク(16kHzサンプリング周波数)から帰結する9個の正周波数チャネルの平滑化され、ダウンサンプリングされた包絡を示している。
図4は第一のオーディオ信号のサブバンド信号、すなわち
【0222】
【数19】
を示し、
図5は残留信号のサブバンド信号、すなわち
【0223】
【数20】
を示す。信号長は約19秒である。最も顕著な高調波成分はT=16秒のところに観察される。ここで、中心周波数1340Hzをもつサブバンドにおけるイベントは、1952Hzを中心とする残留サブバンド信号におけるイベントに明瞭に相関している。他の相関されたイベントが、たとえば907Hzと1340Hzを中心とするサブバンドの間に、存在する。
【0224】
第一のオーディオ信号のサブバンドmについての可能な歪み指標が、たとえば全非線形音響エコー・パワーの、サブバンドmによって生成される全エコー・パワー(線形および非線形)に対する比として生成されてもよい(よって、全高調波歪み(THD: total harmonic distortion)を決定するためのアプローチと同様)。
【0225】
たとえば、次の歪み指標が計算されてもよい。
【0226】
【数21】
ここで、P
q(m)はサブバンドmのq次高調波のパワーを表わす。I(m)の値は0と1の間に制限され、I(m)=0は高調波歪みなしに対応し、I(m)=1は100%歪みに対応する。
【0227】
可変前処理利得の例については、歪み指標はTHD推定値として次式に従って計算されてもよい。
【0228】
【数22】
ブロック形では、歪み指標は次のように表わされてもよい。
【0229】
【数23】
H(m)の値は、遠端および線形適応フィルタ出力信号を使って推定できる。
【0230】
【数24】
ここで、チルダ付きのY(m)は適応フィルタの出力包絡のブロックを表わす。
【0231】
項|H(m)|
2G
pre2(m)は、線形適応フィルタのインパルス応答および前処理器利得関数から、あるいは単に次のようにして推定できる。
【0232】
【数25】
全高調波歪み(THD)指標は、入力パワーの、高調波歪みとして再生される割合を関係する。この歪みは主として、大きなラウドスピーカー変位を生じる高い遠端信号振幅によって引き起こされるので、観察されるTHD値は、高いTHD値をもつサブバンドmを減衰させるまたは制限することによって低減されることができる。
【0233】
今の例では、式(11)は、k≠mのときにサブバンドkについて式(9)および(10)の類似性値を組み合わせることによって、サブバンドmについての歪み指標を計算するために使用されてもよい。さらに、歪み指標は、線形エコーについてのエコー・パワーが補償信号のパワーから決定される場合、全推定されたエコー・パワーに関して規格化されてもよい。
【0234】
いくつかの実施形態では、相互相関指標は、所与の入力において活動が検出される場合に更新されるのみである。この活動指標は、サブバンド毎のノイズフロアに基づくことができる。ここで、ノイズフロアはたとえば最小統計法(minimum statistics methods)を使って推定される。
【0235】
包絡
【0236】
【数26】
の間の相互相関指標は、入力サブバンドmと残留サブバンドkの間の高調波関係の推定値を提供し、類似性値についての好適な指標を提供する。しかしながら、他の実施形態では他の類似性指標が使われてもよいことは理解されるであろう。
【0237】
一つのそのような指標は、第一のオーディオ信号および残留信号の諸ブロックの特定の特徴、たとえばブロック内の極大および極小の数またはサブバンド内のアクティブな領域のオンセット/オフセット時間に基づいていてもよい。後者の場合、0または1の二値の類似性値が使用できる。二値の類似性指標については、H(m)の値は1に設定されてもよい。二値の類似性値が使われる場合は、歪み指標はたとえば、サブバンドmについての類似性指標の最大または和を取ることによって
【0238】
【数27】
あるいは諸サブバンドmを横断した類似性の最大/平均値として
【0239】
【数28】
計算されることができる。ここで、K(m)はサブバンドmによって影響される高調波の数を表わす。
【0240】
今の特定の例では、エコー抑制は、前処理を実行するエコー抑制器207によって実行される。本アプローチは、特に、
図6の等価回路に関して記述される。
【0241】
エコー抑制器207の前処理器関数は、第一のオーディオ信号x(n)の線形または非線形関数でありうる。
【0242】
前処理関数をX
p(m)=F{X(m)}と表わすと、(8)における非線形残留エコー成分は、残留エコーが今や修正された第一のオーディオ信号(前処理された遠端信号)X
p(m)に依存するという事実を反映するよう、次のように書き直せる。
【0243】
【数29】
類似性値H(k)a
k,mは、X(m)の代わりにX
p(m)に関して、(9)における規格化された相互相関の式を使って推定されることもできる。
【0244】
しかしながら、これは、いくつかのシナリオでは、第一のオーディオ信号の非常に低振幅のサブバンドに起因するエコーの過大評価につながることがある。これに対処するために、歪み指標は、何らかのレベルの活動を含むサブバンドについて計算されるだけであってもよく、さらに、前処理によって導入される減衰の量がある最小値に制限されてもよい。係数b
k,mも最小二乗(least-squares)または最小平均二乗(least mean squares)法を使った合同推定によって決定されてもよい。
【0245】
たとえば、重み更新の式は、
【0246】
【数30】
によって与えられてもよい。ここで、μは更新レートを調整するパラメータであり、
【0247】
【数31】
である。
【0248】
以下では、装置のラウドスピーカーによって生成される非線形歪みの量を低減することに向けられた二つのサブバンド前処理関数が記述される。前処理パラメータの最適化は、第一のオーディオ信号サブバンドの絶対値に適用できる何らかの最大利得または限界があり、非線形歪みの量は何らかのユーザー定義される閾値以内に低減されるという想定に基づく。
【0249】
数学的には、係数a
k,m=f{X
p(m)}であれば、X
p(m)>0である何らかの最適な前処理関数について寄与a
k,mX
p(m)は無視できる。換言すれば、a
k,m=f{X
p(m)}X
p(m)は、X
p(m)の単調増加関数であり、減少するX
p(m)について0に近づき、a
k,mはX
p(m)より速く減少すると想定される。
【0250】
まず、適応的な実数値のサブバンド利得関数からなる線形前処理について述べる。
【0251】
この場合、前処理は実数の利得関数G(m)によって与えられ、
X
p(m)=G(m)X(m) (26)
となる。
【0252】
すると、サブバンド包絡は
【0253】
【数32】
として与えられる。
【0254】
前処理は、(グローバルな)最大遠端絶対値によって引き起こされる歪みが、線形音響エコー成分が最大化されるという制約条件の下での何らかの閾値より低いような、実数の利得値の集合を導出しようとする。
【0255】
これらの要求は、前処理遠端サブバンド包絡の影響が何らかの閾値より低いような最大の利得値を見出すことに相当する。影響が対応する絶対値の増加関数であると想定される場合、この最大の利得値はグローバルな最大遠端絶対値と、歪み指標が歪み閾値要求を満たすのにちょうど十分小さくなる最も大きな絶対値との両方の関数であるべきである。すなわち、
【0256】
【数33】
ここで、c(m;κ)はI(m)≦I
minとなるような|X(m;κ)|の最大値に対応し、I
minは歪み指標閾値である(0≦I
min≪1)。
【0257】
現在の包絡ブロックκについて、I(m;κ)≦I
minであり、かつ、現在の極大絶対値(包絡ではない)X
max(m;κ)がc(m;κ−1)より大きい場合には、
c(m;κ)=β
cc(m;κ−1)+(1−β
c)X
max(m;κ) (28)
ここで、β
cは1に近い値をもつ平滑化定数である(0<β
c<1)。
【0258】
I(m;κ)>I
minであれば、
c(m;κ)=max{c
min(m),β
dc(m;κ−1)} (29)
である。ここで、β
dは1に近い値をもつ減衰因子であり(0<β
d<1)、c
min(m)はサブバンド依存であってもよい最小の許容可能な制限値である。
【0259】
サブバンドmのブロックκについての(28)における極大絶対値(包絡ではない)は
X
max(m;κ)=max|X(m;κ)| (30)
である。(29)におけるX
max,g(m;κ)はサブバンドmにおけるグローバルな最大絶対値を表わす。
【0260】
α=1の値は、所与のサブバンド内の最大ピークがI
minによって設定されるものを超える歪みを導入しないことを保証する。0<α<1については、この厳しい要求は緩和され、一方、α>1は過剰減衰を与える。
【0261】
推定された利得レベルは典型的には、出力信号における散発的な変化を防止するために、時間的に平滑化もされる。
【0262】
G'(m;κ)=γG(m;κ)+(1−γ)G(m;κ−1) (31)
ここで、0<γ<1であり、γの典型的な値は1のほうにより近い。
【0263】
もう一つの例として、前処理はクリッピング関数のような非線形関数であってもよい。
【0264】
具体的には、(27)におけるグローバルなピーク絶対値およびc(m;κ)に基づく実数値の利得関数を推定するのではなく、c(m;κ)の値はX(m)の絶対値をクリッピングするために直接使用されてもよい。
【0265】
その際、出力信号は
【0266】
【数34】
として決定されてもよい。ここで、F{・}は硬/軟クリッピング関数または固定した圧縮因子および適応的な閾値をもつ圧縮器である。
【0267】
(32)に示されるように、複素数値のサブバンドについて、この関数はサブバンドの絶対値に適用され、次いで結果がもとの位相と組み合わされる。
【0268】
推定されたクリッピング・レベルは、典型的には、出力信号における散発的な変化を防止するために、たとえば
c'(m;κ)=γc(m;κ)+(1−γ)c(m;κ−1) (33)
として時間的に平滑化されてもよい。ここで、0<γ<1であり、γの典型的な値は1により近い。
【0269】
これらの例において、歪み指標は前処理された/修正された第一のオーディオ信号包絡
【0270】
【数35】
に基づくことを注意しておくべきである。しかしながら、前処理器関数は実際には、第一のオーディオ信号X(k)の絶対値から導出される。これは、前処理器パラメータの安定な適応を保証しうる。
【0271】
いくつかの実施形態では、エコー抑制は、エコー抑制器207による残留信号の後処理であってもよい。
【0272】
(10)において計算される類似性指標は、非線形音響エコー成分を推定するために使われることもできる。
【0273】
【数36】
いくつかの実施形態では、非線形エコーのためのこの推定値は、歪み指標として直接使われてもよい。よって、この特定の例では、残留サブバンドkについての歪み指標は、(残留サブバンド信号と一致しない)第一のオーディオ信号の各サブバンドについての諸類似性指標の和に、第一のオーディオ信号のそのサブバンドの振幅を乗算したものとして計算されうる。
【0274】
上式を行列の形で書き直すと次のようになる。
【0275】
【数37】
ここで、MかけるM行列Aの行kはm≠kについてのX(m)とR(k)の間の類似性指標を含む。
【0276】
Aの要素は時間的に平滑化されることができる。
【0277】
A(κ)=ζA(κ)+(1−ζ)A(κ−1) (36)
ここで、0<ζ<1である。
【0278】
すると、推定値
【0279】
【数38】
は、具体例として、後処理器利得関数を導出するためのスペクトル減算方式において使用されてもよい。残響の存在は、各サブバンド内の包絡を、サブバンドに依存してさまざまな度合いで、ぼかす。提案される前処理器利得間数は最大統計に基づくので、その性能は、種々の音響環境においてきわめて堅牢である。しかしながら、利得推定の正確さは、X(m)とR(k)の間の類似性を計算するときに残響の効果をモデル化することによって改善できる。後処理については、残響のモデルを組み込むことで非線形音響エコー抑制の性能を有意に改善できる。
【0280】
すると、サブバンドについての利得値はたとえば
【0281】
【数39】
として推定されてもよい。ここで、γ
osは過剰減算因子(over-subtraction factor)であり、γ
os≧1である。計算される利得G
post(k)に対する下限も制限することが一般的である。すなわち、
G'
post(k)=max(G
post(k),min(k)) (38)。
【0282】
このように、これらの例において、各残留サブバンド信号について、該残留サブバンドと、異なる周波数をもつ前記第一のオーディオ信号の諸サブバンドとの諸ペアリングについての諸類似性値の組み合わせによって、歪み指標が計算される。こうして、その残留信号のある周波数区間について歪み指標が生成され、該歪み指標は、この周波数区間において残留信号に導入される非線形歪みを示す。次いで、その周波数区間についての利得は、この歪み値に応答して設定される。特に、歪みが増大すると利得は低減される。
【0283】
いくつかの実施形態では、システムは、エコー抑制を、合同の前処理および後処理として実行してもよい。初期には、すべての前処理利得は一定であってもよく、よって非線形エコーは後処理によって扱われる必要がある。しかしながら、前処理器利得が適応し、帰結する非線形歪みを低減するので、XとRの間の類似性指標値は減少し、よってA(κ)→0となる。つまり、非線形音響エコーが初期には前処理利得によって回避されないので、初期には、後処理器は、非線形音響エコーを除去することにおいて仕事の大半を行なうことになる。しかしながら、ひとたび前処理が適応して、非線形歪みを低減したら、後処理器利得関数による補償は、より低い類似性指標値の結果として、自動的に低減される。
【0284】
いくつかの実施形態では、システムは、残留信号の、近端発話信号対非線形エコー・パワーの比を測ってもよい。この比がある閾値より上であれば、第一のオーディオ信号の抑制の量は低減されることができる。しかしながら、この比がある閾値より下であれば、残留信号のさらなる抑制は所望される近端発話信号の望まれない歪みにつながることがある。したがって、この場合、第一のオーディオ信号の抑制の量が増大されることができる。このようにして、システムは、遠端に送信される近端発話歪みの量とラウドスピーカーによって生成される非線形歪みの量とを効果的にバランスさせる。
【0285】
いくつかの実施形態では、類似性値は、残響推定値を考慮に入れてもよい。実際、残響の存在は、各サブバンド内の包絡を、サブバンドに依存してさまざまな度合いでぼかす傾向がある。提案される前処理利得関数は最大統計に基づくので、その性能は、種々の音響環境においてきわめて堅牢である。しかしながら、利得推定の正確さは、X(m)とR(k)の間の類似性を計算するときに残響の効果をモデル化することによって改善できる。後処理については、残響のモデルを組み込むことで非線形音響エコー抑制の性能を有意に改善できる。
【0286】
上記の記述は明確のため本発明の諸実施形態を種々の機能的な回路、ユニットおよびプロセッサに言及して記述していることは理解されるであろう。しかしながら、種々の機能的な回路、ユニットおよびプロセッサの間での機能のいかなる好適な分配も、本発明を損なうことなく使用されうることは明白であろう。たとえば、別個のプロセッサまたはコントローラによって実行されると示される機能が同じプロセッサまたはコントローラによって実行されてもよい。よって、個別的な機能ユニットまたは回路への言及は、厳密な論理的または物理的構造または組織を示すのではなく、単に、記載される機能を提供するための好適な手段への言及と理解されるべきである。
【0287】
本発明は、ハードウェア、ソフトウェア、ファームウェアまたはこれらの任意の組み合わせを含むいかなる好適な形で実装されることもできる。本発明は任意的に、一つまたは複数のデータ・プロセッサおよび/またはデジタル信号プロセッサ上で走るコンピュータ・ソフトウェアとして少なくとも部分的に実装されてもよい。本発明のある実施形態の要素およびコンポーネントはいかなる好適な仕方で物理的、機能的および論理的に実装されてもよい。実際、機能は単一のユニットにおいて、複数のユニットにおいてまたは他の機能ユニットの一部として実装されてもよい。よって、本発明は、単一のユニットにおいて実装されてもよく、あるいは異なるユニット、回路およびプロセッサの間で物理的および機能的に分配されてもよい。
【0288】
本発明はいくつかの実施形態との関連で記述されたが、本稿に記載される個別的な形に限定されることは意図されていない。むしろ、本発明の範囲は、付属の請求項によってのみ限定される。さらに、ある特徴が特定の実施形態との関連で記述されているように見えることがありうるが、当業者は、記述される実施形態のさまざまな特徴が本発明に基づいて組み合わされうることを認識するであろう。請求項においては、有する/含むの用語は、他の要素や段階の存在を排除するものではない。
【0289】
さらに、個々に挙げられていても、複数の手段、要素、回路または方法段階はたとえば単一の回路、ユニットまたはプロセッサによって実装されてもよい。さらに、個々の特徴は異なる請求項に含まれることがあるが、これらは可能性としては有利に組み合わされてもよく、異なる請求項に含まれることは、特徴の組み合わせが実現可能でないおよび/または有利でないことを含意するものではない。また、ある特徴があるカテゴリーの請求項に含まれることは、このカテゴリーへの限定を含意するものではなく、もしろ、その特徴が他の請求項カテゴリーにも適宜等しく適用可能であることを示す。さらに、請求項における特徴の順序は、特徴が機能させられなければならないいかなる特定の順序を含意するものでもなく、特に、方法請求項における個々の段階の順序は、それらの段階がその順序で実行されなければならないことを含意するものではない。むしろ、それらの段階はいかなる好適な順序で実行されてもよい。さらに、単数形での言及は複数を排除しない。「ある」「第一の」「第二の」などの言及は複数を排除するものではない。請求項に参照符号があったとしても、単に明確にする例として与えられているのであって、いかなる仕方であれ請求項の範囲を限定するものと解釈してはならない。