特表2019-537074 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

特表2019-537074オーディオ信号を処理するための装置および方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】特表2019-537074(P2019-537074A)

(43)【公表日】2019年12月19日

(54)【発明の名称】オーディオ信号を処理するための装置および方法

(51)【国際特許分類】

G10L 21/0208 20130101AFI20191122BHJP

G10L 21/0232 20130101ALI20191122BHJP

G10L 25/78 20130101ALI20191122BHJP

G10L 21/0316 20130101ALI20191122BHJP

G10L 21/0364 20130101ALN20191122BHJP

【ＦＩ】

G10L21/0208 100B

G10L21/0232

G10L25/78

G10L21/0316

G10L21/0364

【審査請求】有

【予備審査請求】未請求

【全頁数】39

(21)【出願番号】特願2019-541884(P2019-541884)

(86)(22)【出願日】2017年10月17日

(85)【翻訳文提出日】2019年6月10日

(86)【国際出願番号】EP2017076483

(87)【国際公開番号】WO2018073253

(87)【国際公開日】20180426

(31)【優先権主張番号】16194467.3

(32)【優先日】2016年10月18日

(33)【優先権主張国】EP

(81)【指定国】 AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DJ,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JO,JP,KE,KG,KH,KN,KP,KR,KW,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．Ｂｌｕ−ｒａｙ

(71)【出願人】

【識別番号】500341779

【氏名又は名称】フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン

(74)【代理人】

【識別番号】100134119

【弁理士】

【氏名又は名称】奥町哲行

(72)【発明者】

【氏名】ロンバード・アンソニー

(72)【発明者】

【氏名】ビッツァー・ベルンハルト

(72)【発明者】

【氏名】マーン・ダーク

(72)【発明者】

【氏名】マバンデ・エドウィン

(72)【発明者】

【氏名】クッヒ・ファビアン

(72)【発明者】

【氏名】ハーベッツ・エマニュエル

(72)【発明者】

【氏名】アニバーレ・パオロ

(57)【要約】

オーディオ信号を処理するための装置は、オーディオ信号分析器と、フィルタとを備える。オーディオ信号分析器は、オーディオ信号を分析してオーディオ信号の複数の帯域に対する複数のノイズ抑制フィルタ値を決定するように構成され、分析器は、ノイズ抑制フィルタ値が最小ノイズ抑制フィルタ値以上になるように、かつ最小ノイズ抑制値がオーディオ信号の特性に依存するようにノイズ抑制フィルタ値を決定するように構成される。フィルタは、オーディオ信号をフィルタリングするように構成され、フィルタは、ノイズ抑制フィルタ値に基づいて調整される。

【特許請求の範囲】

【請求項1】

オーディオ信号（１１０）を処理するための装置（１００；３００；４００；８００；９００）であって、
オーディオ信号を分析して前記オーディオ信号（２１５；３５４）の複数の帯域に対する複数のノイズ抑制フィルタ値（２６０；３６４、３６４ａ〜ｃ）を決定するためのオーディオ信号分析器（１３０；８３０；９３０）であって、
前記分析器は、ノイズ抑制フィルタ値が最小ノイズ抑制フィルタ値（１３０ｂ’；２４０；３５８ｃ、３６０ａ）以上になるように前記ノイズ抑制フィルタ値を決定するように構成され、かつ
前記最小ノイズ抑制フィルタ値が前記オーディオ信号（１３０ｃ’）の特性に依存するように構成されるオーディオ信号分析器と、
前記オーディオ信号をフィルタリングするためのフィルタ（１２０；３１０；４１０；８２０）であって、前記フィルタは、前記ノイズ抑制フィルタ値に基づいて調整されるフィルタとを備える、装置。

【請求項2】

前記オーディオ信号分析器が、複数の制約のないノイズ抑制フィルタ値（２２０；３５６ａ）および前記最小ノイズ抑制フィルタ値に基づく最大決定を使用して前記ノイズ抑制フィルタ値を決定するように構成され、前記最小ノイズ抑制フィルタ値が、前記オーディオ信号の前記複数の帯域に等しい、請求項１に記載の装置。

【請求項3】

前記オーディオ信号分析器が、前記オーディオ信号の前記特性として前記オーディオ信号のフレームから利得値を計算するように構成される、請求項１または２に記載の装置。

【請求項4】

前記オーディオ信号分析器が、
所定のノイズ抑制値、および
前記利得値
に基づいて、前記最小ノイズ抑制フィルタ値を計算するように構成される、請求項３に記載の装置。

【請求項5】

前記オーディオ信号分析器が、前記最小ノイズ抑制フィルタ値が利得値の増加と共に減少するように前記最小ノイズ抑制フィルタ値を計算するように構成される、請求項３または４に記載の装置。

【請求項6】

前記オーディオ信号分析器が、所定のノイズ抑制値および所定のノイズ抑制値と前記利得値との商に依存する最小決定を使用して前記最小ノイズ抑制フィルタ値を計算するように構成される、請求項３〜５のいずれか一項に記載の装置。

【請求項7】

前記オーディオ信号分析器が、第１の最小決定に従って前記最小ノイズ抑制フィルタ値を決定するように構成され、前記第１の最小決定が、
所定のノイズ抑制値、および
第２の最小決定の結果に依存し、前記第２の最小決定の前記結果が、
前記利得値の逆数、および
最大決定の結果に依存し、前記最大決定の前記結果が、
所定の歪み限界値の前記逆数、および
前記所定のノイズ抑制値と前記利得値との商に依存する、請求項３〜６のいずれか一項に記載の装置。

【請求項8】

前記オーディオ信号分析器が、前記オーディオ信号の前記複数の帯域のうちの１つの帯域を分析し、前記帯域が前記オーディオ信号の第１の特性または前記オーディオ信号の第２の特性を有するかを決定し、前記第１の特性が、前記第２の特性とは異なり、かつ第２の特性が前記帯域に対して決定されたときに前記ノイズ抑制フィルタ値を決定するように構成され、
その結果、前記ノイズ抑制フィルタ値が、前記利得値が０〜１であるとき、所定のノイズ抑制値と前記利得値との積に等しく、または
その結果、前記ノイズ抑制フィルタ値が、前記利得値が１と、前記所定のノイズ抑制値と所定の歪み限界との前記積との間にあるとき、前記所定のノイズ抑制値に等しく、または
その結果、前記ノイズ抑制フィルタ値が、前記利得値が前記所定のノイズ抑制値と前記所定の歪み限界との前記積の間にあるとき、前記利得値と前記所定の歪み限界との前記商に等しく、または
その結果、前記ノイズ抑制フィルタ値が、前記利得値が前記所定の歪み限界よりも大きいとき、１に等しい、請求項３〜７のいずれか一項に記載の装置。

【請求項9】

前記オーディオ信号分析器が、前記オーディオ信号の第１のフレームについて、第１の最小ノイズ抑制値をもたらす第１の利得値を計算するように構成され、
前記オーディオ信号分析器が、前記オーディオ信号の第２のフレームについて、平滑化されていない第２の最小ノイズ抑制フィルタ値をもたらす第２の利得値を計算するように構成され、
前記第２のフレームが、時間的に前記第１のフレームに続き、
前記オーディオ信号分析器が、前記平滑化されていない第２の最小ノイズ抑制フィルタ（３５８ｃ）値および前記第１の最小ノイズ抑制フィルタ値を使用して、前記第２のフレームの平滑化された最小ノイズ抑制フィルタ値（３６０ａ）を計算するように構成される、請求項３〜８のいずれか一項に記載の装置。

【請求項10】

前記装置が、前記オーディオ信号の前記複数の帯域を提供する、前記オーディオ信号の周波数ドメイン表現を提供する第１の時間／周波数変換器（３２０ａ）を備え、
前記オーディオ信号分析器が、
前記オーディオ信号の前記複数の帯域の１つまたは複数の帯域、および
前記最小ノイズ抑制値に基づいて、前記オーディオ信号の前記複数の帯域のうちの１つまたは複数の帯域のノイズ抑制フィルタ値を計算するように構成され、前記最小ノイズ抑制フィルタ値が、
前記オーディオ信号の前記複数の帯域の各帯域に等しい所定のノイズ抑制値、または前記オーディオ信号の複数の帯域に等しい所定の歪み限界、および
前記オーディオ信号の前記特性から導出された値に基づき、前記値が、前記オーディオ信号の前記複数の帯域の各帯域に等しい、請求項１〜９のいずれか一項に記載の装置。

【請求項11】

前記オーディオ信号分析器が、前記オーディオ信号の振幅情報、および
前記振幅情報および所定の目標値に基づいて、前記オーディオ信号の特性として、利得値を計算するように構成され、前記オーディオ信号が、前記利得値によって調整される、請求項１〜１０のいずれか一項に記載の装置。

【請求項12】

前記オーディオ信号分析器が、前記振幅情報の計算の前に心理音響フィルタ（３４２）で前記オーディオ信号をフィルタリングするように構成され、
前記心理音響フィルタが、第１の周波数範囲の第１の減衰値、および
第２の周波数範囲の第２の減衰値、および
第３の周波数範囲の第３の減衰値を含むように構成され、
前記フィルタが、前記第２の周波数範囲が前記第１の周波数範囲と前記第３の周波数範囲との間にあるように構成され、
前記フィルタが、前記第２の減衰値が前記第１の減衰値および前記第３の減衰値よりも小さくなるように構成される、請求項１１に記載の装置。

【請求項13】

前記オーディオ信号分析器が、前記オーディオ信号の前記第１のフレームの第１の音声アクティビティ情報、および前記オーディオ信号の前記第２のフレームの第２の音声アクティビティ情報を提供する音声アクティビティ検出ユニット（３４０）と、前の利得値を記憶するメモリユニット（３４６）とを備え、
前記オーディオ信号分析器が、
音声が前記第２の音声アクティビティ情報に従って検出された前記オーディオ信号の第２のフレームに基づいて、利得値を推定し、または
音声が前記第１の音声アクティビティ情報に基づいて前記第１のフレームで検出されたとき、音声アクティビティが前記第２の音声アクティビティ情報に従って前記第２のフレームで検出されなかった場合に第１のフレームの利得値を保つように構成され、
前記第２のフレームが、時間的に前記第１のフレームに続く、請求項３〜１２のいずれか一項に記載の装置。

【請求項14】

前記オーディオ信号分析器が、
現在のフレームについて計算された前記オーディオ信号の特性から導出された値
に基づいて、現在のフレームの前記最小ノイズ抑制値を計算するように構成され、
前記オーディオ信号分析器が、前記オーディオ信号の特性から導出された前記値を決定するために前記オーディオ信号を分析するように構成され、
前記フィルタが、第１のフィルタ段と、第２のフィルタ段とを含み、
前記第１のフィルタ段が、前記オーディオ信号の前記特性から導出された前記値を使用して調整され、
前記第２のフィルタ段が、前記ノイズ抑制フィルタ値に従って調整される、請求項１に記載の装置。

【請求項15】

前記オーディオ信号分析器が、
第１のフレームについて計算された、前記オーディオ信号の前記特性から導出された値
に基づいて、第２のフレームの前記最小ノイズ抑制値を計算するように構成され、
前記フィルタが、第１のフィルタ段（８２２）と、第２のフィルタ段（８２４）とを含み、
前記第１のフィルタ段が、前記ノイズ抑制フィルタ値に従って調整され、
前記第２のフィルタ段が、前記オーディオ信号の前記特性から導出された前記値を使用して調整され、
前記オーディオ信号分析器が、前記オーディオ信号の特性から導出された前記値を決定するために前記第１のフィルタ段の出力を分析するように構成され、
前記第２のフレームが、時間的に前記第１のフレームに続く、請求項１に記載の装置。

【請求項16】

前記オーディオ信号分析器が、
音声アクティビティ情報および前記オーディオ信号、または前記ノイズ抑制フィルタ値によってフィルタリングされた後の音声アクティビティ情報および前記オーディオ信号に基づいて、前記利得値を決定するように構成され、
前記オーディオ信号分析器が、前記オーディオ信号に基づいて、前記音声アクティビティ情報を得るように構成され、または前記オーディオ信号分析器が、前記フィルタによってフィルタリングされた後の前記オーディオ信号に基づいて、前記音声アクティビティ情報を得るように構成され、または前記オーディオ信号分析器が、スピーチが存在しないことを示す音声アクティビティ情報を使用して前記利得値を減少させるように構成される、請求項３〜１５のいずれか一項に記載の装置。

【請求項17】

前記オーディオ信号分析器（１３０；８３０；９３０）が、時間的に第１のフレームと前記第１のフレームに続く第２のフレームとを備える一連のフレームで前記オーディオ信号を分析し、前記第１のフレームについて、第１の複数のノイズ抑制値を決定し、かつ前記第２のフレームについて、第２の複数のノイズ抑制値を決定するように構成され、
前記分析器が、前記第１の複数のノイズ抑制フィルタ値の前記ノイズ抑制フィルタ値が前記第１のフレームに対して決定された第１の最小ノイズ抑制フィルタ値（１３０ｂ’；２４０；３５８ｃ、３６０ａ）以上になるように、かつ前記第１の最小ノイズ抑制フィルタ値が前記オーディオ信号（１３０ｃ’）の前記第１のフレームの第１の特性に依存するように前記第１の複数のノイズ抑制フィルタ値を決定するように構成され、
前記分析器が、前記第２の複数のノイズ抑制フィルタ値の前記ノイズ抑制フィルタ値が前記第２のフレームに対して決定された第２の最小ノイズ抑制フィルタ値（１３０ｂ’；２４０；３５８ｃ、３６０ａ）以上になるように、かつ前記第２の最小ノイズ抑制フィルタ値が前記オーディオ信号（１３０ｃ’）の前記第２のフレームの第２の特性に依存するように前記第２の複数のノイズ抑制フィルタ値を決定するようにさらに構成され、
前記フィルタ（１２０；３１０；４１０；８２０）が、前記一連のフレームの前記オーディオ信号をフィルタリングするように構成され、前記第１のフレームの第１のフィルタが、前記第１の複数のノイズ抑制値に基づいて調整され、前記第２のフレームの第２のフィルタが、前記第２の複数のノイズ抑制値に基づいて調整され、
前記フィルタ（１２０；３１０；４１０；８２０）が、前記第１のフィルタで前記オーディオ信号の前記第１のフレームをフィルタリングし、かつ前記第２のフィルタで前記オーディオ信号の前記第２のフレームをフィルタリングするように構成される、請求項１〜１６のいずれか一項に記載の装置。

【請求項18】

オーディオ信号を処理するための方法であって、
オーディオ信号を分析して前記オーディオ信号の複数の帯域に対する複数のノイズ抑制フィルタ値を決定することと、
ノイズ抑制フィルタ値が最小ノイズ抑制フィルタ値以上になるように、かつ
前記最小ノイズ抑制フィルタ値が前記オーディオ信号の特性に依存するように前記ノイズ抑制フィルタ値を決定することと、
前記ノイズ抑制フィルタ値に基づいて、前記オーディオ信号をフィルタリングすることとを含む、方法。

【請求項19】

前記コンピュータプログラムがコンピュータまたはマイクロコントローラで実行されるときに請求項１８に記載の方法を実行するためのプログラムコードを有する、コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、一般に、オーディオ信号処理に関する。具体的には、本発明は、オーディオ信号のスピーチおよびノイズレベルの自動的制御の技術および方法に関する。

【背景技術】

【0002】

全二重スピーチ通信シナリオが図１３に示されており、近端話者の音声は、１つまたは複数のマイクロフォンによってキャプチャされ、拡声器またはヘッドフォンを介してキャプチャされた音を聴取する遠端話者に送信される。遠端の聴取者にとっての聴取快適性と了解度の両方を向上させるために、近端話者の音声を維持しながら、音響エコーまたは背景およびセンサノイズを含む不要な音成分を除去または少なくとも減衰させるいくつかのオーディオ信号処理技術を適用することができる。聴取快適性および了解度を向上させるための別の重要な側面は、強調された信号のレベルを遠端の聴取者にとって快適なレベルに調整することである。これにより、音キャプチャデバイスの感度および近端話者からマイクロフォンまでの距離に関係なく、一貫したスピーチレベルを提供することができる。

【0003】

そのような全二重スピーチ通信シナリオでは、例えば［１、２、３］に記載されているように、音響エコーキャンセレーション、音響エコー抑制、または両方の技術の組合せを使用して、散発的なエコーを完全に除去する必要がある。対照的に、背景またはセンサノイズのようなより持続的な妨害は通常、例えば［４］に記載されているように、いくつかのノイズ低減方法を使用してスピーチ品質を維持するために一定量までしか減衰させることができない。したがって、要求が厳しい（すなわち、複雑なまたは悪い）音響環境では、結果として生じる信号は、減衰しているが依然として可聴のノイズ成分を含む可能性がある。自動利得制御の目的は、強調されたスピーチ信号のレベルを所定の快適なレベルにすることである。音響エコーキャンセレーションまたは音響エコー抑制のいずれかに基づくいくつかのエコー制御、ノイズ低減モジュール、および自動利得制御モジュールを含む典型的なオーディオ信号処理チェーンが、図１４に示されている。処理チェーンの最後にあるコンフォートノイズモジュールは、システム出力で快適かつ時間的に滑らかなノイズレベルを保証するために、人工のランダムなノイズを生成する。コンフォートノイズの導入は、例えば［５］に記載されているように、例えば遠端アクティビティの期間中のエコー制御によってトリガされる。

【0004】

さらに、スピーチ通信では、ノイズ低減は、所望のスピーチ信号を維持しながら、オーディオ信号に存在する定常的なまたはゆっくり時間的に変化する背景またはセンサノイズを減衰させることを目的とする。これは、例えば、フレームごとに周波数ドメインで実行される。例えば、各時間フレームに対して、低い信号対ノイズ比（ＳＮＲ）を示すスペクトル領域は減衰され、一方、高いＳＮＲ領域は変化しないままである。さらに、上述のように、スペクトル領域を処理するためにより一般的な信号対干渉（ＳＩＲ）比を考慮することができる。

【0005】

［６］では、第１のＮＲ（＝ノイズ低減）フィルタは、ＡＧＣ（＝自動利得制御）利得とは独立して算出される。次に、第２のＮＲフィルタは、第１のＮＲフィルタをＡＧＣ利得の関数としてスケーリングすることによって算出され、すなわち大きいＡＧＣ利得の場合、ＮＲ利得は減少し（ノイズ減衰が強い）、小さいＡＧＣ利得の場合、ＮＲ利得は増加する（ノイズ低減が少ない）。第２のフィルタは、入力信号に適用される。対照的に、本発明の一態様は、ＮＲとＡＧＣを同時に実行するフィルタを導出することである。これにより、スピーチレベルとノイズレベルを別々に完全に制御することができる。

【発明の概要】

【発明が解決しようとする課題】

【0006】

そのようなシステムでは、特に最小ノイズ抑制フィルタ値が固定的に設定され、処理されたオーディオ信号のオーディオ品質が低下するという問題がある。

【0007】

オーディオ信号を処理することについて説明した問題に関して、処理されたオーディオ信号の改善されたオーディオ品質を提供する、改善された概念に対する要望が存在する。

【課題を解決するための手段】

【0008】

本発明による好ましい実施形態は、オーディオ信号を処理するための装置であって、オーディオ信号を分析してオーディオ信号の複数の帯域に対する複数のノイズ抑制フィルタ値を決定するためのオーディオ信号分析器を備え、分析器は、ノイズ抑制フィルタ値が最小ノイズ抑制フィルタ値以上になるようにノイズ抑制フィルタ値を決定するように構成される、装置を提供する。さらに、オーディオ信号分析器は、最小ノイズ抑制フィルタ値がオーディオ信号の特性に依存するように構成される。また、装置は、オーディオ信号をフィルタリングするためのフィルタであって、フィルタは、ノイズ抑制フィルタ値に基づいて調整されるフィルタを備える。

【0009】

記載の実施形態は、処理されたオーディオ信号の改善されたオーディオ品質を提供することにおいて利点を提供する。改善は、信号をフィルタリングするために使用されるノイズ抑制フィルタ値によるものであり、ノイズ抑制フィルタ値は、最小ノイズ抑制フィルタ値以上になるように調整される。記載の方法でノイズ抑制フィルタ値を選択することは有利であり、その結果、小さいノイズ抑制フィルタ値による信号処理によって引き起こされる信号歪みが回避され得る。さらに、最小ノイズ抑制フィルタ値の選択は、オーディオ信号の特性に基づいて、柔軟な方法で実行される。最小ノイズ抑制フィルタ値の柔軟性は、例えば、オーディオ信号の特性が大きいときに小さい最小ノイズ抑制値を決定し、またはオーディオ信号の特性が小さいときに最小ノイズ抑制フィルタ値を大きい値に設定することができるように実現することができる。それによって、最小ノイズ抑制フィルタは、多種多様な潜在的なオーディオ信号に対して調整することができる。記載のノイズ抑制フィルタ値を用いてオーディオ信号をフィルタリングすることにより、例えばノイズ抑制によるより一定のノイズレベルによって特徴付けられる、より高品質のオーディオ信号を得ることができる。また、フィルタが柔軟な最小ノイズ抑制フィルタ値によりノイズを効果的に抑制するので、処理されたオーディオ信号のより快適な聴取体験が達成され得る。

【0010】

さらに、記載の装置は、オーディオ信号を処理するのに有利であることができ、それにより不要な信号成分、例えば背景ノイズ成分が抑制または減衰され、所望の信号成分が維持または強調される。特に、例えばスピーチ信号がオーディオ信号の所望の成分と見なされるとき、記載の実施形態は、スピーチ信号の維持を可能にする。さらに、不要な信号成分が減少するため、スピーチ信号の了解度を高めることができる。さらに、例えば聴覚障害のある聴取者は、スピーチ信号の了解度が聴覚障害のある人々にとって最も重要な課題であるので、前述の実施形態で処理した後の信号から非常に利益を得ることができる。加えて、記載の実施形態は、信号の不要な気を散らす成分が減衰または除去されるので、聴取者にとって快適な聴取体験を可能にする。さらに、記載の実施形態は、オーディオ信号が例えばマイクロフォンによって取得され、所望の信号成分のエネルギーが、例えば音源のマイクロフォンまでの距離の変化、マイクロフォンの感度の変化または音源（例えば発話者）によって放出されるエネルギーの量の変化により変化するとき、所望の信号成分を強調することを可能にする。

【0011】

好ましい実施形態によれば、オーディオ信号分析器は、複数の制約のないノイズ抑制フィルタ値および最小ノイズ抑制フィルタ値に基づく最大決定を使用してノイズ抑制フィルタ値を決定するように構成され、最小ノイズ抑制フィルタ値は、オーディオ信号の複数の帯域に等しい。上述したようなオーディオ信号分析器は、例えば積極的なノイズ抑制により、スピーチ歪みまたは楽音を回避するのに有利であり得る。例えば、ある帯域のノイズ抑制フィルタ値がＳＮＲ（＝信号対ノイズ比）に基づいて推定され、例えばＳＮＲが０であることを示す信頼できないＳＮＲ推定量が用いられ、まだいくらかの所望の信号成分が存在する場合、帯域は、完全に抑制され得る。帯域が完全に抑制されると、スピーチが帯域に実際に存在していた場合には不要なアーティファクト、例えばスピーチ歪み、または例えばノイズシェーピングが原因で楽音をもたらす可能性がある。加えて、記載の実施形態は、複数の帯域に対して同量の最小ノイズ抑制を容易にする。

【0012】

好ましい実施形態によれば、オーディオ信号分析器は、オーディオ信号の特性としてオーディオ信号のフレームから利得値を計算するように構成される。利得値は、オーディオ信号を強調するのに有利であり得る。例えば、オーディオ信号が強く変化するエネルギーを有する所望の信号成分を含む場合、利得値は、エネルギーの変化を補償するために信号に適用することができる。例えば、所望の信号成分がスピーチ信号であるとき、了解度は、オーディオ信号への利得値の適用から非常に利益を得ることができる。さらに、例えば、利得値を適用することによってより一定の所望の信号エネルギーが達成されるとき、聴取快適性もまた向上され得る。

【0013】

好ましい実施形態によれば、オーディオ信号分析器は、所定のノイズ抑制値および利得値に基づいて、最小ノイズ抑制フィルタ値を計算するように構成される。前述のように最小ノイズ抑制フィルタ値を計算することは、最小ノイズ抑制フィルタ値を適応させることで、オーディオ信号の所望の信号成分を利得値の適用によって増幅させることができるが、不要な信号成分、例えば背景ノイズを依然として効率的に抑制することができるために有益であり得る。したがって、例えば不要な信号成分に対する記載の好ましい実施形態の全体的なシステム応答は、増幅されない、すなわち不要な信号成分は、減衰されるかまたは変更されずに通過する。

【0014】

さらなる好ましい実施形態では、オーディオ信号分析器は、最小ノイズ抑制フィルタ値が利得値の増加と共に減少するように最小ノイズ抑制フィルタ値を計算するように構成される。最小ノイズ抑制フィルタ値と利得値との間の上述の反比例は、利得値をオーディオ信号に適用するときに有益であり得る。例えば、大きい利得値が提供されると、利得値の影響を受けるオーディオ信号のノイズ成分は、それに応じて増幅される。したがって、利得値に比例して最小ノイズ抑制フィルタを減少させることは、好ましい実施形態によって達成される一定の全体的なノイズ抑制をもたらすことができる。

【0015】

さらなる好ましい実施形態では、オーディオ信号分析器は、所定のノイズ抑制値および所定のノイズ抑制値と利得値との商の最小決定を使用して最小ノイズ抑制フィルタ値を計算するように構成される。上述のように最小決定を使用することは、例えば小さい利得値が提供されるときに所定のノイズ抑制値と利得値との商が大きいように、快適な聴取体験を達成するために有益であり得る。したがって、この商に基づくノイズ低減は、不十分な量のノイズが低減される結果となり得るが、記載の好ましい実施形態では、最小ノイズ抑制が保証される。それによって、ノイズが所望の所定の量に少なくとも低減されるので、快適な聴取体験を提供することができる。

【0016】

さらなる好ましい実施形態では、オーディオ信号分析器は、第１の最小決定に従って最小ノイズ抑制フィルタ値を決定するように構成され、第１の最小決定は、所定のノイズ抑制値および第２の最小決定の結果に依存する。第２の最小決定の結果は、利得値の逆数および最大決定の結果に依存する。最大決定の結果は、所定の歪み限界値の逆数および所定のノイズ抑制値と利得値との商に依存する。オーディオ信号分析器の記載の構成は、例えば積極的なノイズ抑制によるスピーチ歪みのような、ノイズ低減アーティファクトを低減するために有益であり得る。特に、大きい利得値は、所定のノイズ抑制値と利得値との小さい商をもたらし、潜在的に０に近い値となり、したがって最小ノイズ抑制値として適用されたときに潜在的に信号歪みを引き起こす可能性がある。最小ノイズ抑制フィルタ値の推定に含まれる最大決定によって実行される、好ましい実施形態で説明されたような下限を用いることは、この可能性を回避し、潜在的により快適な聴取体験を可能にする。

【0017】

さらなる好ましい実施形態では、オーディオ信号分析器は、利得値が０〜１であるとき、または利得値が１よりも大きいときに所定のノイズ抑制値と利得値との商に等しいとき、所定のノイズ抑制値に等しくなるように最小ノイズ抑制フィルタ値を決定するように構成される。オーディオ信号分析器の記載の構成は、大きい利得値が達成可能なノイズ低減を減少させないように、利得値に応じて柔軟な最小ノイズ抑制フィルタ値を提供するために有利である。

【0018】

さらなる好ましい実施形態では、オーディオ信号分析器は、利得値が０〜１であるときに所定のノイズ抑制値に等しくなるように最小ノイズ抑制フィルタ値を決定するように構成される。そうでなければ、最小ノイズ抑制フィルタ値は、利得値が１と、所定のノイズ抑制値と所定の歪み限界との積との間にあるとき、所定のノイズ抑制値と利得値との商に等しい。そうでなければ、最小ノイズ抑制フィルタ値は、利得値が所定のノイズ抑制値と所定の歪み限界との積よりも大きく、かつ所定の歪み限界よりも小さいとき、所定の歪み限界の逆数に等しい。そうでなければ、最小ノイズ抑制フィルタ値は、利得値が所定の歪み限界よりも大きいときに利得値の逆数に等しい。上述のように構成されたオーディオ信号分析器は、大きい利得値に対してもより大きい最小ノイズ抑制フィルタ値を提供し、それによって積極的なノイズ抑制を回避することによって、スピーチ歪みまたは楽音を回避するのに有益である。

【0019】

さらなる好ましい実施形態では、オーディオ信号分析器は、オーディオ信号の複数の帯域のうちの１つの帯域を分析し、帯域がオーディオ信号の第１の特性またはオーディオ信号の第２の特性を有するかを決定するように構成され、第１の特性は、第２の特性とは異なる。さらに、オーディオ信号分析器は、第２の特性が帯域に対して決定されたときにノイズ抑制フィルタ値を決定するように構成され、その結果、ノイズ抑制フィルタ値は、利得値が０〜１であるとき、所定のノイズ抑制値と利得値との積に等しい。そうでなければ、ノイズ抑制フィルタ値は、利得値が１と、所定のノイズ抑制値と所定の歪み限界との積との間にあるとき、所定のノイズ抑制値に等しい。そうでなければ、ノイズ抑制フィルタ値は、利得値が所定のノイズ抑制値と所定の歪み限界との積よりも大きく、かつ所定の歪み限界よりも小さいとき、利得値と所定の歪み限界との商に等しい。そうでなければ、ノイズ抑制フィルタ値は、利得値が所定の歪み限界よりも大きいとき、１に等しい。上述のようなオーディオ信号分析器は、例えば第２の特性がオーディオ信号のノイズ内容を表すシナリオにおいてノイズ抑制フィルタ値を提供するのに有益であり得る。第２の特性は、例えば音声アクティビティが、音声がフレームまたは帯域に存在しないことを示すので、非アクティブフレームまたは帯域であり得る。説明されたノイズシナリオでは、全体的なシステム応答は、ノイズの増幅をもたらさない。

【0020】

さらなる好ましい実施形態では、オーディオ信号分析器は、オーディオ信号の第１のフレームについて、第１の最小ノイズ抑制値をもたらす第１の利得値を計算するように構成される。さらに、オーディオ信号分析器は、オーディオ信号の第２のフレームについて、平滑化されていない第２の最小ノイズ抑制フィルタ値をもたらす第２の利得値を計算するように構成され、第２のフレームは、時間的に第１のフレームに続く。さらに、オーディオ信号分析器は、平滑化されていない第２の最小ノイズ抑制フィルタ値および第１の最小ノイズ抑制フィルタ値を使用して、第２のフレームの平滑化された最小ノイズ抑制フィルタ値を計算するように構成される。上述のように構成されたオーディオ信号分析器は、最小ノイズ抑制フィルタ値の大きな変動を回避し、それによって不快なノイズポンピング効果を回避する滑らかな残留ノイズレベルを提供するのに有益であり得る。

【0021】

さらなる好ましい実施形態では、装置は、オーディオ信号の複数の帯域を提供する、オーディオ信号の周波数ドメイン表現を提供する第１の時間／周波数変換器を備える。また、オーディオ信号分析器は、オーディオ信号の複数の帯域の１つまたは複数の帯域および最小ノイズ抑制値に基づいて、オーディオ信号の複数の帯域のうちの１つまたは複数の帯域のノイズ抑制フィルタ値を計算するように構成される。さらに、最小ノイズ抑制フィルタ値は、オーディオ信号の複数の帯域の各帯域に等しい所定のノイズ抑制値、またはオーディオ信号の複数の帯域に等しい所定の歪み限界、およびオーディオ信号の特性から導出された値に基づき、値は、オーディオ信号の複数の帯域の各帯域に等しい。オーディオ信号の特性から導出された値は、例えば利得値とすることができる。さらに、上述の装置は、第１の時間／周波数変換器に基づいて、柔軟なスペクトル分解能を提供し、それによってオーディオ信号の複数の帯域の各帯域に対する個別の処理を可能にするのに有益であり得る。

【0022】

さらなる好ましい実施形態では、フィルタは、第２の複数の帯域を得るために帯域に対するノイズ抑制フィルタ値を適用することによって、オーディオ信号の複数の帯域の各帯域を修正するように構成される。さらに、装置は、第２の複数の帯域から時間ドメイン出力信号を提供するように構成される第２の時間／周波数変換器を備える。上述の装置は、第２の複数の帯域から導出された出力において可聴オーディオ信号を生成するのに有益であり得る。

【0023】

さらなる好ましい実施形態では、装置は、オーディオ信号分析器によって提供される、ノイズ抑制フィルタ値の時間ドメイン変換を提供するように構成される第２の時間／周波数変換器を備える。さらに、フィルタは、時間ドメイン変換されたノイズ抑制フィルタ値とオーディオ信号とを畳み込むことによって得られる、出力オーディオ信号を提供するように構成される。上述の装置は、フレームベースの処理による遅延がフィルタリングに必要ではないので、リアルタイムに近い動作をする低遅延システムを得るのに有利である。

【0024】

さらなる好ましい実施形態では、オーディオ信号分析器は、オーディオ信号の振幅情報を計算するように構成される。また、オーディオ信号分析器は、振幅情報（オーディオ信号の特性）および所定の目標値に基づいて、オーディオ信号の特性（から導出された値）として、利得値を計算するように構成され、オーディオ信号は、利得値によって調整される。提供された利得値は、例えばオーディオ信号の所望の信号成分のエネルギーを変化させることにより、例えば信号を目標値に増幅または減衰させるために有利に用いることができる。

【0025】

さらなる実施形態では、オーディオ信号分析器は、振幅情報の計算の前に心理音響フィルタでオーディオ信号をフィルタリングするように構成される。さらに、心理音響フィルタは、第１の周波数範囲の第１の減衰値、第２の周波数範囲の第２の減衰値、および第３の周波数範囲の第３の減衰値を示すように構成される。さらに、フィルタは、第２の周波数範囲が第１の周波数範囲と第３の周波数範囲との間にあるように構成される。第１の周波数範囲、第２の周波数範囲および第３の周波数範囲は、重ならないように構成され得る。さらに、フィルタは、第２の減衰値が第１の減衰値および第３の減衰値よりも小さくなるように構成される。上述したように、心理音響フィルタに依存する振幅情報の計算は、振幅情報に基づく利得値の主観的により適切な計算を提供するのに有益であり得る。心理音響尺度、例えばｄＢ（Ａ）、ｄＢ（Ｂ）またはｄＢ（Ｃ）に基づいて計算された利得値は、オーディオ信号に適用されるときにより快適な聴取体験をもたらすことができる。

【0026】

さらなる好ましい実施形態では、オーディオ信号分析器は、オーディオ信号の第１のフレームの第１の音声アクティビティ情報、およびオーディオ信号の第２のフレームの第２の音声アクティビティ情報を提供する音声アクティビティ検出ユニットと、前の利得値を記憶するメモリユニットとを備える。さらに、オーディオ信号分析器は、音声が第２の音声アクティビティ情報に従って検出されたオーディオ信号の第２のフレームに基づいて、利得値を推定するように構成される。あるいは、オーディオ信号分析器は、音声が第１の音声アクティビティ情報に基づいて第１のフレームで検出されたとき、音声アクティビティが第２の音声アクティビティ情報に従って第２のフレームで検出されなかった場合に第１のフレームの利得値を保つように構成され、第２のフレームは、時間的に第１のフレームに続く。上述のような装置は、関心のある信号が存在しないオーディオ信号のセグメントにおける利得値の算出を回避し、それによって例えば不要な信号成分の増幅を回避するのに有利であり得る。

【0027】

好ましい実施形態では、オーディオ信号分析器は、現在のフレームについて計算されたオーディオ信号の特性から導出された値に基づいて、現在のフレームの最小ノイズ抑制値を計算するように構成される。さらに、オーディオ信号分析器は、オーディオ信号の特性から導出された値を決定するためにオーディオ信号を分析するように構成される。さらに、フィルタは、第１のフィルタ段と、第２のフィルタ段とを含み、第１のフィルタ段は、オーディオ信号の特性から導出された値（例えば利得値）を使用して調整される。また、第２のフィルタ段は、ノイズ抑制フィルタ値に従って調整される。記載の好ましい実施形態は、例えば互いに依存せずに第１の段が第２の段に続くことができるので、柔軟なフィルタ構造を可能にする。

【0028】

さらなる好ましい実施形態では、オーディオ信号分析器は、第１のフレームについて計算された、オーディオ信号の特性から導出された値に基づいて、第２のフレームの最小ノイズ抑制値を計算するように構成される。また、フィルタは、第１のフィルタ段と、第２のフィルタ段とを含み、第１のフィルタ段は、ノイズ抑制フィルタ値に従って調整され、第２のフィルタ段は、オーディオ信号の特性から導出された値を使用して調整される。さらに、オーディオ信号分析器は、オーディオ信号の特性から導出された値を決定するために第１のフィルタ段の出力を分析するように構成され、第２のフレームは、時間的に第１のフレームに続く。上述のように構成されたオーディオ信号分析器は、以前に算出された利得値を用いることができるので、オーディオ信号の柔軟で低遅延のフィルタリングを可能にするのに有益である。

【0029】

さらなる好ましい実施形態では、オーディオ信号分析器は、音声アクティビティ情報およびオーディオ信号に基づいて、利得値を決定するように構成される。あるいは、オーディオ信号分析器は、ノイズ抑制フィルタ値によってフィルタリングされた後の音声アクティビティ情報およびオーディオ信号に基づいて、利得値を決定するように構成される。さらに、オーディオ信号分析器は、オーディオ信号に基づいて、音声アクティビティ情報を得るように構成される。加えて、オーディオ信号分析器は、フィルタによってフィルタリングされた後のオーディオ信号に基づいて、音声アクティビティ情報を得るように構成される。あるいは、オーディオ信号分析器は、スピーチが存在しないことを示す音声アクティビティ情報を使用して利得値を減少させるように構成される。上述のオーディオ信号分析器は、どの信号が利得計算に使用されるか、またはどの信号が音声アクティビティ検出に使用されるかに関して柔軟性を提供し、スピーチ休止中に利得値を減少させることによって、またはスピーチ休止中に利得を適用しないことによってノイズ増幅を回避する。

【0030】

本発明の実施形態は、オーディオ信号を処理するための方法を提供し、方法は、オーディオ信号を分析してオーディオ信号の複数の帯域に対する複数のノイズ抑制フィルタ値を決定することと、ノイズ抑制フィルタ値が最小ノイズ抑制フィルタ値以上になるように、かつ最小ノイズ抑制フィルタ値がオーディオ信号の特性に依存するようにノイズ抑制フィルタ値を決定することと、ノイズ抑制フィルタ値に基づいて、オーディオ信号をフィルタリングすることとを含む。記載の方法は、例えば、オーディオ信号の特性を使用してオーディオ信号に適用され得る利得値を推定するときに有利である。加えて、利得値に応じて必要なノイズ抑制フィルタ値を適切に選択することによって、柔軟なノイズ抑制フィルタをこの値に調整することができる。それによって、不要な信号成分の増幅を回避することができ、所望の成分の維持または強調を達成することができ、快適な聴取体験を可能にする。

【0031】

さらなる好ましい実施形態は、コンピュータプログラムがコンピュータまたはマイクロコントローラで実行されるときに方法を実行するためのプログラムコードを有するコンピュータプログラムを含む。

【0032】

さらに、態様は、ノイズ抑制フィルタ値を決定するためにオーディオ信号を分析することであって、最小抑制フィルタ値は、オーディオ信号の特性に依存することと、ノイズ抑制フィルタ値に基づいて、オーディオ信号をフィルタリングすることとのための装置に関する。

【0033】

さらに、本発明の実施形態は、ノイズレベルの任意の増幅または急激な変動を防止しながら、出力信号のスピーチ信号レベルを自動的に制御する手段を提供する、共同ノイズ低減および自動利得制御のための装置および方法に関する。本発明のさらなる実施形態は、大きい利得値、例えばＡＧＣ（＝自動利得制御）利得の信号歪みを軽減する制御機構を含む装置および方法を説明する。また、本発明の一実施形態は、ＮＲ（＝ノイズ低減）およびＡＧＣを共同で実行することに関する。本発明のさらなる態様は、ノイズレベルの任意の増幅または不要な変動を防止しながら、所望のスピーチ成分の自動利得制御機構を提供することである。

【0034】

さらに、本発明の態様は、オーディオ信号を処理する分野に関し、より具体的には、オーディオ信号、例えばいくつかの所望のスピーチ成分ならびにいくつかの不要なノイズ成分を含むオーディオ信号のレベルを自動的に調整するための手法に関する。

【0035】

加えて、本発明の態様は、ノイズレベルの任意の増幅または急激な変動を防止しながら、出力信号のスピーチ信号レベルを自動的に制御する手段を提供する、共同ノイズ低減および自動利得制御のための一実施形態に関する。本発明の態様は、大きいＡＧＣ利得の信号歪みを軽減する制御機構をさらに含む。

【0036】

以下では、本発明の実施形態を、添付の図面を参照して説明する。

【図面の簡単な説明】

【0037】

【図1】本発明による一実施形態のブロック図である。

【図2】図１による装置の実施形態のオーディオ信号分析器のブロック図である。

【図3】本発明による装置の一実施形態のブロック図である。

【図4】本発明による装置の一実施形態のブロック図である。

【図5】図２によるオーディオ信号分析器のフィルタ値選択段のブロック図である。

【図6】図２によるオーディオ信号分析器のフィルタ値選択段のブロック図である。

【図7】図２によるオーディオ信号分析器のフィルタ値選択段のブロック図である。

【図8】本発明による好ましい実施形態のブロック図である。

【図9】本発明による好ましい実施形態のブロック図である。

【図10】全体的なシステム応答の図である。

【図11】利得値に応じた最小ノイズ抑制フィルタ値の図である。

【図12】信号処理前後の信号のグラフである。

【図13】全二重スピーチ通信シナリオのブロック図である。

【図14】全二重スピーチ通信シナリオの受信機または送信機側のブロック図である。

【図15】本発明の一態様によるブロック図である。

【図16】本発明の一態様によるブロック図である。

【図17】本発明の一態様によるブロック図である。

【図18】本発明による、好ましい実施形態によるブロック図である。

【図19】本発明による、好ましい実施形態によるブロック図である。

【発明を実施するための形態】

【0038】

図１は、オーディオ信号１１０を処理するための本発明の一実施形態による装置１００のブロック図を示し、オーディオ信号１１０は、スペクトル表現で示され、フィルタ１２０は、オーディオ信号分析器１３０によって提供されるノイズ抑制フィルタ値に従って調整される。ノイズ抑制フィルタ値は、最小ノイズ抑制フィルタ値１３０ｂ’よりも大きくなるようにオーディオ信号分析器で決定される１３０ａ。最小ノイズ抑制フィルタ値１３０ｂ’は、１３０ｃにおいてオーディオ信号分析器１３０で決定されるオーディオ信号１３０ｃ’の特性に基づいて、１３０ｂにおいて決定される。また、推定は、オーディオ信号の複数の帯域に対して１３０ｄにおいて推定される制約のないノイズ抑制フィルタ値１３０ｄ’に基づく。さらに、オーディオ信号１３０ｃ’の特性は、オーディオ信号の複数の帯域に等しい。制約のないノイズ抑制フィルタ値１３０ｄ’は、オーディオ信号１１０、例えば入力オーディオ信号のパワースペクトル密度（ＰＳＤ）

、およびオーディオ信号１１０に含まれるノイズのＰＳＤ

に基づいて、例えばウィーナーフィルタのような最適なフィルタに従って推定することができ、

式中、例えばｍは、時間フレーム指数であり、ｋは、スペクトルサブバンド指数である。ウィーナーフィルタH_NR,Wiener(m,k)は、上述のように算出された、ノイズのある信号から所望の信号を抽出する。実際には、ＰＳＤは、ウィーナーフィルタに対して推定する必要がある。

【0039】

オーディオ信号、例えば入力スペクトルの複数の帯域に、例えばフレームごとに上記のフィルタH_NR,Wiener(m,k)を乗算することによって、強調信号を周波数ドメインで得ることができる。

【0040】

ＳＮＲが以下のように定義することができることを観察することによって、

ウィーナーフィルタH_NR,Wiener(m,k)の式は、以下のように再定式化することができる。

したがって、ウィーナーフィルタH_NR,Wiener(m,k)は、SNR(m,k)＝０に対してゼロの値をとり、大きいＳＮＲ値に対して１の値に収束し、これは、所望の信号成分を維持しながらノイズを減衰させるのに望ましい挙動である。あるいは、スペクトル振幅推定量［４］のような異なるタイプのフィルタを、制約のないノイズ抑制フィルタ値を推定するために使用することができる。さらに、制約のないノイズ抑制フィルタ値は、発見的関数に基づくことができる。

【0041】

オーディオ信号１００は、所望の成分、例えばスピーチと、何らかの不要な成分、例えば背景ノイズとを含み得る。フィルタ１２０は、例えばオーディオ信号１１０のスピーチ信号成分がフィルタ１２０でオーディオ信号１１０をフィルタリングした後により明瞭になるように、信号分析器１３０によって調整される。また、オーディオ信号１１０の不要な成分は、フィルタ１２０でオーディオ信号１１０をフィルタリングした後に抑制することができる。制約のないノイズ抑制フィルタ値に対する制約として作用する最小ノイズ抑制フィルタ値は、信号強調を可能にし、スピーチ歪みまたは楽音を回避する。

【0042】

装置１００は、信号強調とノイズ抑制との間のトレードオフを提供しながら、オーディオ信号１１０の所望の信号成分の強調を容易にする。このトレードオフは、信号歪みを回避するために、より多くの不要な信号成分を除去するか、または不要な信号成分の除去を低減するように調整することができるので、制約として作用する最小ノイズ抑制フィルタ値によって特徴付けられる。

【0043】

図２は、図１に示すような装置１００による本発明の一実施形態のオーディオ信号分析器１３０のブロック図を示す。オーディオ信号分析器１３０は、オーディオ信号２１５の複数の帯域に基づいて、制約のないノイズ抑制フィルタ値推定２１０を実行する。オーディオ信号２１５の複数の帯域の各帯域に対して、制約のないノイズ抑制フィルタ値２２０は、オーディオ信号分析器１３０で推定される。また、オーディオ信号２３２の特性から導出された値（例えば利得値）および所定のノイズ抑制値２３４に基づいて、最小ノイズ抑制値推定２３０が実行される。制約のないノイズ抑制フィルタ値２２０および最小ノイズ抑制フィルタ値２４０を使用して、ノイズ抑制フィルタ値２５０を決定する。これは、例えば最大演算を実行することによって行うことができ、その結果、オーディオ信号２１５の複数の帯域に対する複数のノイズ抑制フィルタ値２６０が得られる。最大演算２５０によって得られるノイズ抑制フィルタ値２６０は、最小ノイズ抑制フィルタ値２４０よりも大きいことが保証され、それによって小さい値またはノイズ抑制フィルタ値の０に等しい値を回避することができる。小さい値またはノイズ抑制フィルタ値２６０の０に等しい値を回避することによって、達成可能なノイズ抑制は、最小ノイズ抑制フィルタ２４０の値によって制限され、積極的なノイズ抑制による潜在的な歪みを回避する。

【0044】

図３は、本発明の好ましい実施形態による装置３００のブロック図を示す。装置３００は、オーディオ信号分析器１３０と、フィルタ３１０とを備える。さらに、装置３００は、第１の時間／周波数変換器３２０ａと、第２の時間／周波数変換器３２０ｂとを備える。さらに、装置３００は、フィルタ３１０でオーディオ信号１１０をフィルタリングする前後に利得値をオーディオ信号１１０に適用することを可能にする。この選択性は、スイッチ３３０ａおよび３３０ｂによって示されている。さらに、装置３００は、フィルタ３１０でオーディオ信号１１０をフィルタリングする前後にオーディオ信号１１０の特性から導出された値（例えば利得値）を計算することを可能にする、別のスイッチ３３０ｃを備える。さらに、オーディオ信号分析器１３０は、音声アクティビティ検出３４０と、心理音響フィルタ３４２と、メモリユニット３４６とを備える。音声アクティビティ検出３４０の結果に応じて、音響信号３４８ａの特性、例えば振幅情報は、音声が検出されたとき、心理音響フィルタ３４２によってフィルタリングされたオーディオ信号１１０に基づいて、算出される３４８。

【0045】

さらに、音声が音声アクティビティ検出３４０によって検出されたとき、新しい利得値が振幅情報３４８ａおよび目標値に基づいて算出される３５０。さらに、スイッチ３５２は、音声が音声アクティビティ検出３４０によって検出されなかった場合、メモリユニット３４６に保持されている古い利得値の使用を可能にする。対照的に、音声が音声アクティビティ検出３４０によって検出されたとき、メモリ３４６の古い利得値は、現在のフレーム３５０ａの利得値によって上書きされる。

【0046】

さらに、オーディオ信号分析器１３０は、オーディオ信号３５４の複数の帯域に基づいて、例えばウィーナーフィルタに基づいて、制約のないノイズ抑制フィルタ値３５６を算出するように構成される。また、オーディオ信号分析器１３０は、所定のノイズ抑制値g_des２３４、例えばノイズ減衰限界g_lim、または所定の歪み限界３５８ａおよびオーディオ信号の特性、例えば利得値から導出された値に基づく最小ノイズ抑制フィルタ値を推定する３５８ように構成される。音声アクティビティが音声アクティビティ検出３４０によって検出されなかった場合、現在のフレームにおいて、最小ノイズ抑制フィルタ値推定３５８は、メモリユニット３４６に記憶される利得値に基づく最小ノイズ抑制値３５８ｃの算出に頼ることができる。音声が現在のフレームでアクティブである場合、現在の利得値は、最小ノイズ抑制値推定３５８に用いることができ、古い利得値と新しい利得値との間の選択は、スイッチ３５８ｂによって容易にされる。

【0047】

最小ノイズ抑制フィルタ値推定３５８で得られる最小ノイズ抑制フィルタ値３５８ｃは、任意選択の平滑化３６０を受けることができる。オーディオ信号３５４の複数の帯域に等しい平滑化されたまたは平滑化されていない最小ノイズ抑制フィルタ値３６０ａ、および制約のないノイズ抑制フィルタ値推定３５６によって得られる複数の制約のないノイズ抑制フィルタ値３５６ａは、最大演算３６２を受ける。最大演算３６２は、フィルタ３１０を調整するために、オーディオ信号３５４の複数の帯域について、ノイズ抑制フィルタ値３６４を提供する。

【0048】

その最も単純な形では、一定の最小ノイズ抑制値が適用される。ウィーナーフィルタH_NR,Wiener(m,k)は、SNR(m,k)＝０に対してゼロの値をとり、大きいＳＮＲ値に対して１の値に収束し、これは、オーディオ信号の所望の信号成分、例えばスピーチを維持しながら、不要な信号成分、例えばノイズを減衰させるのに望ましい挙動である。一定の最小ノイズ抑制フィルタ値g_lim＝g_desを用いて、積極的なノイズ低減を回避することができる。したがって、ノイズ抑制フィルタ値は、以下のように最大ノイズ減衰量に制限される：

、
ここでは、ウィーナーフィルタベースの制約のないノイズ抑制フィルタ値H_NR,Wiener(m,k)について説明したが、それに応じて、異なる方法で得られる制約のないノイズ抑制フィルタ値H_NR(m,k)にも適用することができる。ノイズ減衰限界g_limは、

のように定義することができる。これは、フィルタの最大ノイズ減衰G_NR,Wiener(m,k)に対応し、これはまた、スピーチ休止中の所望の量のノイズ減衰、すなわち

として解釈することもできる。典型的には、−２０ｄＢ〜−１０ｄＢの間で選択される。他のフィルタリング規則もウィーナーフィルタの代わりに用いることができるので、上述の式は、以下のように一般化することができる：

式中、H_NR(m,k)は、任意のノイズ低減規則に基づく、任意の制約のないノイズ抑制フィルタ値を指す。

【0049】

フィルタ３１０は、オーディオ信号３５４ａ〜ｄの各帯域に適切な値のノイズ抑制フィルタ値３６４ａ〜ｄを適用する。フィルタ３１０でオーディオ信号３５４の複数の帯域をフィルタリングすることによって、第２の複数の帯域３６６が得られる。第２の複数の帯域３６６は、第２の時間／周波数変換器３２０ｂで時間ドメインに変換することができ、それによって可聴信号が得られる。

【0050】

また、スイッチ３３０ａおよび３３０ｂで示される、オーディオ信号１１０をフィルタリングする前後の利得値との乗算は、装置３００がオーディオ信号１１０の低レベルの所望の信号成分を補償することを可能にする。さらに、装置３００は、フィルタ３１０で周波数ドメインのオーディオ信号１１０をフィルタリングすることによって、時間ドメインベースの畳み込みと比較して周波数ドメインの動作による省電力を提供する。

【0051】

所与のＡＧＣ利得値G_AGC(m)に対して、オーディオ信号１１０の特性から導出された値として、共同ＮＲ＋ＡＧＣタスクは、所望の信号がもはやオーディオ信号１１０の所望の信号成分、例えばスピーチ信号自体ではなく、ＡＧＣ利得によってスケーリングされた所望の信号成分であるフィルタリング問題として考えられる。例えば、ノイズのある入力信号からスケーリングされた所望の信号成分、例えばスピーチ信号を抽出するウィーナーフィルタを導出すると、以下のフィルタリング規則が得られる：

これは、ノイズ低減について上述したように、ウィーナーフィルタ

の関数として再定式化することができる：

、
式中、G_AGC(m)は、利得値、例えばＡＧＣスケーリングファクタである。

【0052】

前述のように、信号歪みを制限するノイズ減衰限界g_lim＝g_desが導入される：

したがって、

の検査から、ＮＲおよびＡＧＣを共同で実行することは、最小ノイズ抑制値、例えばＡＧＣ利得に比例するノイズ減衰限界を条件として、ウィーナーフィルタの出力において（またはその入力において等価的に）ＡＧＣスケーリングファクタG_AGC(m)を適用することと等価であることは明らかである。

【0053】

さらに、

の上述の式は、任意の最適なまたは発見的フィルタリング規則に一般化することができ、以下の式が得られる

式中、

である。

【0054】

また、最小ノイズ抑制値、したがってノイズ抑制フィルタ値は、オーディオ信号１１０の所望の信号成分、例えばスピーチ、および出力におけるノイズレベルのレベルをよりよく制御することを可能にするので、ＡＧＣおよびＮＲ処理を共同で実行することによって推定することができる。ＶＡＤ（＝音声アクティビティ検出）がレベル推定および利得算出ステップをトリガするために利用されるが、ＮＲ出力信号とＡＧＣ利得との乗算は、スピーチアクティビティに関係なく、各フレームに対して実行される。本発明の一態様によれば、フィルタリングは、固定の最小ノイズ抑制値、例えば固定のノイズ減衰限界に依存しない。対照的に、オーディオ信号１１０の特性から導出された値、例えばＡＧＣ利得に依存する（したがって例えば時変）最小ノイズ抑制フィルタ値、例えばノイズ減衰限界

が適用され、ＮＲフィルタが得られる

、
式中、

は、所望のノイズ減衰

およびＡＧＣ利得の関数としてフレームごとに適応される。上付き文字［ＵＣ］は、後で提示される制約のある場合とは対照的に、制約のない場合を指す。

【0055】

本発明の一態様によれば、利得値に依存する最小ノイズ抑制フィルタ値、例えば、ノイズ減衰限界、

は、

に従って得ることができる。さらなる態様によれば、ＡＧＣが信号を減衰させるときにノイズのよりよい減衰を得るために、最小ノイズ抑圧値、例えば制約のないノイズ減衰限界が定義される（すなわちG_AGC(m)＜１）：

。

【0056】

ＡＧＣ利得は、ＡＧＣ利得の関数としてＮＲ利得をスケーリングするためには使用されない。その代わりに、ＡＧＣ利得は、最小ノイズ抑制フィルタ値

、例えばノイズ減衰限界を介してＮＲフィルタ

設計に直接含まれる。

【0057】

固定の限界

の代わりに時変ノイズ減衰限界

を使用する利点を説明するために、フィルタ全体の応答

は、スピーチ（高ＳＮＲ）またはノイズ（低ＳＮＲ）のどちらかが支配的な時間／周波数領域に対して導出される：
・ケース

・ノイズが支配的な低ＳＮＲ時間／周波数領域では、ＮＲフィルタ

がその最小値

に達し、したがって全体的なシステム応答

が以下のようになると仮定することができる：

、
これは、ノイズが支配的なセグメントが、ＡＧＣ利得に関係なく、所望の量のノイズ低減によってスケーリングされることを示す。

【0058】

・スピーチが支配的な高ＳＮＲ時間／周波数領域では、ＮＲフィルタがスピーチをほとんど不変のままにする、すなわち

、したがって全応答が以下のようになると仮定することができる：

、
これは、スピーチが支配的なセグメントが、所望の量のノイズ低減に関係なく、所望通りにＡＧＣ利得によってスケーリングされることを示す。

【0059】

・ケースG_AGC(m)＜１
上記と同じ推論を使用して、以下のように書くことができる。

、

、
これは、スピーチセグメントが予想通りにＡＧＣ利得G_AGC(m)によってスケーリングされ、ノイズが所望の量のノイズ減衰g_desによって少なくとも減衰されることを示す。

【0060】

したがって、ノイズ減衰限界を所望のノイズ減衰およびＡＧＣ利得の関数として以下の式

に従って適応させることが、ＡＧＣ利得をプラスにするためにシステム出力でスピーチおよびノイズレベルを完全に制御することは明らかである。したがって、グラフ１２５０に示すように、一貫したスピーチおよびノイズレベルを達成することができ、ノイズポンピング効果を回避することができる。

【0061】

ＡＧＣが入力信号を減衰させると、すなわちG_AGC(m)＜１、以下

から、ノイズが入力と比較して出力で増幅されず、最小量のノイズ減衰が保証されることがわかる。この場合、これは時変ＡＧＣ減衰によって引き起こされる低レベルの時変ノイズフロアを招くことに注意されたい。しかしながら、実際には、入力スピーチレベルは比較的一定のままであると仮定することができる。ＶＡＤがスピーチの存在を正確に検出することができる場合、ＡＧＣ利得は収束後ゆっくりとしか変動せず、システム出力における絶対ノイズレベルはゆっくりとしか変動せず、これはノイズポンピング効果を回避する。

【0062】

前述のように、最小ノイズ抑制フィルタ値３６０ａは、所望のノイズ減衰およびＡＧＣ利得の関数として導出される。これは、例えば

に基づいて達成することができる。

【0063】

この手法は、大きいＡＧＣ利得G_AGC(m)に対して任意に小さいノイズ減衰限界を生成することができる。積極的なノイズ低減を適用すると、可聴アーティファクトが実際には発生する可能性がある。発生する典型的なアーティファクトは、以下の通りである：
・特にスピーチが最も弱い高周波数でのスピーチ歪み
・背景ノイズが非常に非定常的に着色されていることによって特徴付けられる楽音。

【0064】

大きいＡＧＣ利得に対してそれほど積極的ではないノイズ低減、すなわち適度なノイズ低減を得るために、したがってノイズ低減アーティファクトを軽減するために、制約をノイズ減衰限界に課すことができる。本発明の一態様によれば、最小ノイズ抑制フィルタ値３６０ａは、ＡＧＣ利得G_AGC(m)、所定のノイズ抑制値g_des２３４、例えば所望の量のノイズ減衰、および歪み限界g_DL３５８ａの関数として算出され、以下の式が得られる

、
式中、上付き文字［ＤＣ］は、上付き文字［ＵＣ］で示される前述の場合とは対照的に、歪み制約付きの場合を示す。この手法は、図７および図９にさらに詳細に示されている。

【0065】

歪み制約付きの場合のＮＲフィルタは、前述と同様にして得られ、すなわち

、
であり、
これにより、フィルタ全体でＮＲおよびＡＧＣが実行される：

歪み限界g_DL３５８ａは、満たすべき定数

である。これは、システムによって許容されるＳＮＲ改善の量としても理解することができる。低い値g_DLに設定すると、ノイズ低減アーティファクトから適切に保護されるが、ノイズの減衰量が少なくなる。これはグラフ１２６０に示されており、ここではスピーチが増幅されるにつれてノイズレベルが増加する。非常に大きい歪み限界g_DL３５８ａが基本的に制約を緩和し、

がその制約のない対応物

と等価になることは容易に確認することができる。歪み限界は、典型的には、１５ｄＢ〜２５ｄＢの間で選択される。

【0066】

加えて、時間的平滑化のような処理ツールを

または

に使用して、ノイズ減衰限界、すなわち最小ノイズ抑制フィルタ値を経時的に平滑化することができる。

【0067】

図４は、本発明の好ましい実施形態による装置４００のブロック図を示す。装置４００は、装置３００に関して図３に記載のようなオーディオ信号分析器１３０を備える。また、装置４００は、オーディオ信号３５４の複数の帯域をオーディオ信号分析器１３０に提供するように構成される、第１の時間／周波数変換器３２０ａを備える。さらに、装置４００は、ノイズ抑制フィルタ値３６４の時間ドメイン表現を提供するように構成される第２の時間／周波数変換器３２０ｂを備える。第２の時間／周波数変換器３２０ｂは、ノイズ抑制フィルタ値４６４の時間ドメイン表現を提供する。さらに、装置４００は、ノイズ抑制フィルタ値４６４の時間ドメイン表現に従って調整されるフィルタ４１０を備える。

【0068】

フィルタ４１０は、オーディオ信号１１０の時間ドメイン畳み込みおよびノイズ抑制フィルタ値４６４の時間ドメイン表現を実行するように構成される。装置３００と同様に、装置４００は、スイッチ３２０ｃによって示される、フィルタ４１０によるフィルタリングの前またはフィルタ４１０によるフィルタリングの後にオーディオ信号１１０に基づいて、オーディオ信号分析器において音声アクティビティ検出３４０を適用する可能性を提供する。また、利得値は、スイッチ３３０ａおよび３３０ｂによって示される、フィルタ４１０によるフィルタリングの前またはフィルタ４１０によるフィルタリングの後にオーディオ信号に適用され得る。装置４００は、装置３００に関して説明したように、その時間ドメインベースのフィルタリングを通して、周波数ドメインにおけるフレームワイズ処理と比較してより低い遅延を提供する。

【0069】

図５は、オーディオ信号分析器１３０のノイズ抑制フィルタ値決定を示す。第１のステップ５１０において、所定のノイズ抑制値g_des２３４と利得値G_AGC(m)との間の商が算出され、それによって最小ノイズ抑制フィルタ値３５８ｃを決定する。次のステップ５２０において、制約のないノイズ抑制フィルタ値H_NR(m,k)３５６ａが各々最小ノイズ抑制値と比較され、その結果、最小ノイズ抑制フィルタ値３５８ｃよりも小さい制約のないノイズ抑制フィルタ値３５６ａの値が、最小ノイズ抑制フィルタ値３５８ｃに設定される。これは、以下によって説明することができ：

それによって、ノイズ抑制フィルタ値３６４が得られる。ノイズ抑制フィルタ値の上述の下限は、過度に積極的なノイズ低減による歪みを回避するのに有利であり得る。

【0070】

図６は、本発明の好ましい実施形態によるオーディオ信号分析器１３０におけるノイズ抑制フィルタ値の選択を示す。第１のステップ５１０において、所定のノイズ抑制値２３４と利得値との間の商が算出される。次のステップにおいて、所定のノイズ抑制値２３４と利得値との商と、所定のノイズ抑制値２３４との間で最小決定６２０が行われる。それによって、最小決定が最小ノイズ抑制フィルタ値３５８ｃを所定のノイズ抑制値２３４に上限を定めるため、利得値が小さいときに大きい最小ノイズ抑制フィルタ値３５８ｃを回避することができる。言い換えれば、所定のノイズ抑制値２３４によって上限が定められる最小ノイズ抑制フィルタ値３５８ｃが得られる。最小ノイズ抑制フィルタ値３５８ｃの選択は、以下の式で要約することができる：

最後のステップにおいて、最小ノイズ抑制フィルタ値３５８ｃは、制約のないノイズ抑制フィルタ値３５６ａと比較され、その結果最大決定６３０に基づいて、最小ノイズ抑制フィルタ値３５８ｃによって下限が定められるノイズ抑制フィルタ値３６４が得られる。記載の推定は、小さい利得値G_AGC(m)が提供されるがノイズ抑制を確実にし、それによって小さい利得値によって達成される全体的な信号減衰を超えてノイズ低減が得られる。

【0071】

図７では、本発明の好ましい実施形態によるオーディオ信号分析器１３０において実行されるような、最小ノイズ抑制フィルタ値決定が説明されている。第１のステップにおいて、所定のノイズ抑制値２３４と利得値との商が算出される。所定のノイズ抑制値２３４と利得値との間の商は、所定の歪み限界３５８ａの逆数を用いて第１の最大決定７１０を受ける。第１の最大決定７１０の結果は、利得値７０５の逆数に関して第１の最小決定７２０を受ける。さらに、第１の最小７２０の決定の結果は、所定のノイズ抑制２３４の値に関して第２の最小決定７３０を受ける。それによって、第２の最小決定７３０の結果として、最小ノイズ抑制フィルタ値３５８ｃが得られる。この手順は、いわゆる歪み制約付き最小ノイズ抑制フィルタ値、例えば歪み制約付きノイズ減衰限界をもたらす。制約の意味をよりよく理解するために、以下のように再定式化することができる：

上述のように算出されたノイズ減衰限界の更新規則は、以下のように等価的に定式化することができ

、
図１１のグラフに実線で「歪み制約付き」と表示されて示されている。

【0072】

第２の最大決定７４０において、最小ノイズ抑制フィルタ値３５８ｃは、各個々の制約のないノイズ抑制フィルタ値３５６ａと比較され、その結果、最小ノイズ抑制フィルタ値３５８ｃよりも小さい制約のないノイズ抑制値が、最小ノイズ抑制フィルタ値３５８ｃに設定され、それによってノイズ抑制フィルタ値３６４が得られる。上述のようなノイズ抑制フィルタ値決定は、積極的なノイズ低減による信号歪みを回避するために有益である。

【0073】

図８は、本発明の好ましい実施形態による装置８００のブロック図を示し、これは制約のないノイズ減衰限界

の自動利得制御による共同ＮＲ／ＡＧＣ処理を提供する。

【0074】

装置８００は、オーディオ信号分析器８３０と、フィルタ８２０とを備える。さらに、入力信号がフィルタ８２０に提供され、第１のフィルタ段８２２によって処理されてノイズ低減を適用する。さらに、第１のフィルタ段８２２の出力は、オーディオ信号分析器８３０およびフィルタ８２０の第２のフィルタ段８２４に提供され、そこで利得値が適用される。

【0075】

さらに、フィルタは、出力信号を提供する。第１のフィルタ段８２２の出力信号は、オーディオ信号分析器８３０で使用されて音声アクティビティ検出を算出する８４０。音声アクティビティ検出の結果８４０に基づいて、オーディオ信号の特性として、信号レベルおよび目標レベルに基づいて新しいＡＧＣ利得を算出する８４４ために使用される信号レベルを算出する８４２ために信号を転送するか、または古いＡＧＣ利得を保つ８４６かの決定８４２が行われる。新しい利得を算出するか古い利得を保つかの決定は、音声起動検出器に提供される信号に存在するスピーチに基づく８４０。

【0076】

決定された利得値は、次に第２のフィルタ段に提供され８４０、そこで信号に適用される。さらに、利得値は、利得値および所望のノイズ減衰、すなわち所定のノイズ抑制値２３４に基づいて、制約のないノイズ減衰限界、すなわち最小ノイズ抑制フィルタ値を算出するためにオーディオ信号分析器８３０で使用される。また、制約のないノイズ減衰限界、入力信号およびＡＧＣ利得を使用して、ノイズ抑制フィルタ値が決定され８６２、フィルタ８２０の第１のフィルタ段８２２に提供される。

【0077】

ＡＧＣが（減衰ではなく）信号増幅をトリガするとき、図１７と同様に、スピーチ期間のみの間にＡＧＣ利得を適用することも可能である。次に、ＡＧＣ利得をスピーチ休止中に一時的に減少させるか、または１に直接設定する。ＡＧＣ利得がノイズ減衰限界

の算出において考慮されるので、たとえＡＧＣ利得が大きく変動しても、ノイズポンピング効果が回避されることが保証される。記載の手法は、大きいＡＧＣ利得に対してもノイズ低減を確実にするという利点を有する。さらに、記載の手法は、他の手法が受けるノイズポンピング効果を回避し、これはスピーチオンセット時のノイズフロアの急速な増加およびスピーチオフセット時の急激な減少をもたらす。

【0078】

ノイズ抑制フィルタ値の推定８６２は、例えば、図５に従って、または図６で説明したように実行することができる。記載の装置８００は、所定のノイズ抑制を達成し、了解度を高めるために必要なときに信号を増幅または減衰するのに適している。

【0079】

図９は、本発明の好ましい実施形態による装置９００のブロック図を示しており、ここでは歪み制約下でノイズ減衰限界の自動制御を伴う共同ＮＲおよびＡＧＣ処理が実行される。あるいは、ＡＧＣ利得の算出は、未処理のオーディオ入力信号に基づいて、すなわちノイズ低減を適用する前に実行することができる。装置９００は、図８の装置８００とほとんど同じ機能を有するが、ノイズ抑制フィルタ値の推定８６２のために、追加のパラメータが歪み限界３５８ａ、またはより一般的には所定の歪み限界と見なされる。装置９００は、潜在的に大きいＡＧＣ利得によって引き起こされる小さい最小ノイズ抑制値によって導入される積極的なノイズ抑制に起因する、スピーチ歪みまたは楽音のような信号歪みを回避するのに特に適している。

【0080】

図１０は、システムへの入力信号が主にノイズとして特徴付けられるときのシステム応答の図を示す。言い換えれば、ＮＲおよびＡＧＣを制約付きまたは制約のないノイズ減衰限界（それぞれ実線および破線）で適用したときのＡＧＣ利得の関数としての全ノイズ応答が示されている。

【0081】

制約なしと表示された線は、例えば図８に記載のような本発明の好ましい実施形態として装置８００に記載の好ましい実施形態に関する。さらに、歪み制約付きの線は、例えば図９に記載のような本発明の好ましい実施形態として装置９００に関する。図１０のシステム応答は、対数値で与えられた利得値に応じて対数値で表示される。図１０は、低い利得値（０ｄＢよりも小さい利得値）に対して、共同ノイズ低減および利得制御により、実際に減衰が全体的なシステム応答に対して実現されることを示す。利得値が０ｄＢと、所定のノイズ抑制値と歪み限界との積との間にあるとき、一定のノイズ抑制が制約のない装置および歪み制約付き装置、例えばそれぞれ装置８００および装置９００によって等しく実現される。利得値が所定のノイズ抑制値と所定の歪み限界との積と、所定の歪み限界との間にあるとき、歪み制約付きグラフの全体的なシステム応答は、例えば線形に０ｄＢに増加する。さらに、「制約なし」と表示されたグラフは、利得値が所定のノイズ抑制値と所定の歪み限界との積と、歪み限界との間にあるとき、所定のノイズ抑制値の値で一定のままである。さらに、「歪み制約付き」と表示されたグラフは、０ｄＢで、所定の歪み限界よりも大きい利得値に対して一定のままである。さらに、「制約なし」と表示されたグラフは、所定の歪み限界よりも大きい利得値に対して、所定のノイズ抑制値の値で一定のままである。言い換えれば、歪み制約付きの場合、主にノイズとして特徴付けられるオーディオ信号に対する全体的なシステム応答は、以下のように書くことができる：

要約すると、図１０は、例えば装置８００に関する「制約なし」と表示されたグラフと、例えば装置９００に関する「歪み制約付き」と表示されたグラフとで、ノイズが両方の装置によって増幅されない状況を説明し、入力信号は、ノイズによってのみ特徴付けられる。それによって、不快なノイズ増幅を回避することができる。

【0082】

図１１は、それぞれ図６または図７で説明したような最小ノイズ抑制フィルタ値に関する、２つの線、「制約なし」と表示されたグラフ、および別の「歪み制約付き」と表示されたグラフを示す。言い換えれば、制約付きの場合と制約なしの場合（それぞれ実線および破線）についてのＡＧＣ利得の関数としてのノイズ減衰限界が示されている。

【0083】

最小ノイズ抑制フィルタ値は、例えば、ここで対数値で与えられるノイズ減衰限界であり得る。さらに、グラフは、対数値で利得値に応じて示されている。「制約なし」と表示されたグラフは、０よりも小さい利得値に対して所定のノイズ抑制値で一定である。さらに、「制約なし」と表示されたグラフは、０ｄＢよりも大きい利得値に対して、例えば線形に減少する。さらに、「歪み制約付き」と表示されたグラフは、０ｄＢよりも小さい利得値に対して所定のノイズ抑制値の値で一定であり、０ｄＢよりも大きく、所定のノイズ抑制値と所定の歪み限界との積よりも小さい利得値に対して、所定のノイズ抑制値から所定の歪み限界の逆数まで例えば線形に減少する。さらに、「歪み制約付き」と表示されたグラフは、所定のノイズ抑制値と所定の歪み限界との積と、所定の歪み限界との間の利得値に対して、所定の歪み限界値の逆数の値で一定のままである。また、「歪み制約付き」と表示されたグラフは、所定の歪み限界値よりも大きい利得値に対して、例えば線形に減少する。歪み制約付きの場合、これは、以下のように等価的に説明することができる：

比較のために、制約のない場合と制約付きの場合が、それぞれ破線および実線で示されている。歪み制約付きのノイズ減衰限界は、低から中程度のＡＧＣ利得

に対してその制約のない対応物のような挙動をとることが観察され得る。ＡＧＣ利得が増加するにつれて、

は１／g_DLまで減少し、

までこのレベルのままである。したがって、歪み制約は、歪み限界g_DLまでのＡＧＣ利得についてのみ満たされる。それを超えると、ノイズ低減限界は、再び減少し始める。これは、ノイズが入力と比較して出力で増幅されないようにするためであり、低ＳＮＲによって特徴付けられるノイズセグメントについて、図１０に示される全体的なシステム応答

を導出する場合に明らかになる。この場合、ＮＲフィルタ

がその最小値

に達したと仮定することができる。したがって、全ノイズ応答は、以下のように書くことができる：

ＡＧＣ利得を増加させると全ノイズ応答が増加することは明らかであるが、ノイズが増幅されないようにするために１未満のままである。全ノイズ応答は、図１０においてＡＧＣ利得の関数として実線で表されている。図１０では、比較のために制約のないノイズ応答が破線で示されている。

【0084】

図１１は、適用された（ＡＧＣ）利得に従って柔軟なノイズ低減を可能にするための、利得値に対する最小ノイズ抑制フィルタ値の有利な依存性を示す。さらに、「歪み制約付き」と表示されたグラフおよび「制約なし」と表示されたグラフは、最小ノイズ抑制フィルタ値を実質的に０より上に保ち、したがって信号歪みを回避する能力を示す。

【0085】

図１２は、例えば装置１００、３００、４００、８００または９００を用いた様々な処理後の信号レベルを示す。さらに、ＮＲ＋ＡＧＣ前（１２１０）およびＮＲ／ＡＧＣ処理後（１２２０、１２３０、１２４０、１２５０、１２６０）のスピーチおよびノイズレベルが示されている。

【0086】

グラフ１２１０は、オーディオ信号の実例であり、例えばオーディオ信号１１０を説明する。さらに、グラフ１２１０は、経時的に一定のノイズレベルと、スピーチがアクティブである２つの段階とを示す。スピーチは、アクティブ時にノイズよりも高い信号レベルを有し、その結果、正の信号対ノイズ比（ＳＮＲ）が得られる。また、グラフ１２１０は、目標レベルと表示された破線を示しており、これに対して、例えばスピーチ信号が快適な聴取体験を可能にするように調整されることになっている。

【0087】

グラフ１２２０は、いくつかのノイズ低減および利得制御、例えばいくつかの基本的な自動利得制御方式によって処理された後にグラフ１２１０に表示されるような信号を示す。より高いＳＮＲは、スピーチアクティビティの期間中に得られる。また、ノイズレベルも目標レベルに向かって増幅され、その結果、不快なノイズ増幅が生じる。

【0088】

グラフ１２３０は、処理後の信号、例えばグラフ１２１０に記載のような信号の出力レベルを表示し、例えば処理のために、自動利得制御は、音声アクティビティ検出を利用して自動利得制御更新を支援する。したがって、最初の時間間隔では、ノイズレベルは目標レベルに向かって増幅されず、増幅はスピーチアクティビティが検出された後にのみ開始される。

【0089】

グラフ１２４０は、信号処理後の信号、例えばグラフ１２１０に記載のような入力信号の出力レベルを示し、処理は、例えばノイズ低減および自動利得制御を含み、自動利得制御は、音声アクティビティ検出を利用して自動利得制御をスピーチのみの位相に適用する。

【0090】

グラフ１２５０は、信号処理後の、例えばグラフ１２１０に示すような入力信号の出力レベルを示し、信号処理は、例えば、装置８００に関して例えば図８に記載のような制約のないノイズ低減および自動利得制御を含む。それによって、ＳＮＲの大幅な増加がスピーチアクティビティの位相において観察可能である。さらに、ノイズレベルは、グラフ１２１０と比較した場合、実質的に一定のレベルにあり、低減されている。

【0091】

グラフ１２６０は、信号処理後の、例えばグラフ１２１０に示すような入力信号の出力レベルを示し、信号処理は、装置９００に関して例えば図９に記載のような歪み制約下での共同ノイズ低減自動利得制御を含む。グラフ１２１０と比較して、大きい信号対ノイズ比の増加を得ることができる。さらに、ノイズレベルは、実質的に一定のレベルにある。さらに、歪み制約は、処理の出力における不快な信号歪みを回避する。

【0092】

図１３は、本発明の好ましい実施形態による双方向全二重スピーチ通信システム１３００のブロック図を示す。システムは、近端側および遠端側と、その間の送信装置とを備える。さらに、近端側および遠端側は各々、拡声器およびマイクロフォン、ならびにオーディオ信号処理ユニットを備え、オーディオ信号処理ユニットは、装置１００、３００、４００、８００、９００のうちの１つを備えることができる。

【0093】

近端側では、人がマイクロフォンに向かって話し、拡声器を通してオーディオ情報を受信する。加えて、遠端側では、全二重システムであるため潜在的に同時に、別の人がマイクロフォンに向かって話し、近端側から拡声器を通して送信されたオーディオ情報を受信する。システム１３００は、快適な聴取体験を容易にし、近端側と遠端側との間で行われるスピーチ通信のスピーチ了解度を向上させる。特に、ユーザとマイクロフォンとの間の距離が変わり得るハンズフリーシナリオの場合、記載の実施形態は、了解度を向上させるのに適し得る。

【0094】

図１４は、スピーチ通信システム、例えばスピーチ通信システム１３００の近端または遠端側として用いることができる信号処理チェーンのブロック図を示す。

【0095】

図１５は、信号処理チェーンのブロック図を示し、ＮＲ処理とＡＧＣ処理を独立して適用する基本的な構成を示している。最初に、入力信号は、所定のノイズ抑制値、ここでは所望のノイズ減衰に基づくノイズ低減を受け、ノイズ低減後に得られる信号は、信号レベルを算出し、算出された信号レベルおよび所定の目標レベルに基づいて、利得値、例えば自動利得制御の利得を算出するために使用される。次のステップにおいて、算出された利得値、例えば算出されたＡＧＣ利得は、ノイズ低減が実行された後に信号に適用される。

【0096】

自動利得制御は、例えば図１５に示され以下に詳述される３ステップ手順を使用して、フレームごとにノイズ低減モジュールの出力に適用され得る：
１．レベル算出：Ｌ（ｍ）で示される信号レベルは、ＡＧＣ入力（ここではノイズ低減（ＮＲ）出力）で算出される。信号レベルの尺度は、単なる変動であり得る。あるいは、スペクトル重み付けを適用して、人間の聴覚系を模倣し、知覚される音量の尺度を得ることができる。

【0097】

２．利得算出：スカラ利得は、目標値として装置３００および４００について説明したように、Ｌ（ｍ）で示される現在の入力信号レベルを所定の目標スピーチレベルL_tar と比較することによって導出される。これは、以下のようにして達成することができる：

（６）
式中、G_AGC(m)は、フレームｍで算出されたＡＧＣ利得であり、

は、ＡＧＣ利得を時間的に平滑化するために使用される忘却係数である（

を使用）。

【0098】

３．利得乗算：最後のステップは、入力信号とＡＧＣ利得との乗算を含む。これは、時間ドメインまたは周波数ドメインのどちらでも等価的に行うことができる。

【0099】

上記の手順では、ＡＧＣ入力レベルＬ（ｍ）が目標レベルL_tarを下回ると、入力オーディオ信号が増幅される。対照的に、信号レベルＬ（ｍ）が目標レベルL_tar を上回ると、いくらかの減衰が適用される。それ故、ＡＧＣ利得は、経時的に自動的に調整され、したがって時間的に変化する。さらに、記載の利得算出は、記載の装置３００、４００、８００および９００の対応するモジュールで部分的にまたは完全に使用することができる。さらに、上述の装置で使用するために、例えば音声アクティビティ検出を用いることに基づいて、記載の方法に対する修正を適用することもできる。さらに、図１５の水平の破線で強調されるように、ＡＧＣモジュールとＮＲモジュールとの間に相互作用がないことに注意されたい。

【0100】

例えば、ＮＲフィルタリング後の背景ノイズレベルがスピーチレベルよりも低いとき、この手法の欠点は、ＡＧＣ入力において測定されたレベルＬ（ｍ）の減少を引き起こし、次にスピーチ休止中にＡＧＣ利得の増加を引き起こし、続いてスピーチオンセット時にＡＧＣ利得の減少を引き起こすことである。この現象は図１２に示されており、グラフ１２１０は、（ＮＲの前の）入力オーディオ信号のスピーチおよびノイズ成分のレベルを示す。グラフ１２２０は、上記の手順に従ってＮＲおよびＡＧＣを適用した後のスピーチおよびノイズレベルを示す。入力におけるスピーチおよびノイズレベルが一定であるにもかかわらず、この方法では時変音声レベルが生成されることがわかるが、これはＡＧＣには望ましい挙動ではない。さらに、時変ノイズレベルが生成され、出力信号において非常に不快なノイズポンピング効果をもたらす。これらの問題を解決するために、図３、図４、図８、図９、図１６および図１７に関して説明したように、音声アクティビティ検出（ＶＡＤ）が使用される。

【0101】

図１６は、信号を処理するための装置のブロック図を示しており、音声アクティビティ検出が利得更新をトリガしている別々のＮＲおよびＡＧＣ処理を示す。第１のステップにおいて、入力信号は、所定のノイズ抑制値、例えば所望のノイズ減衰に基づくノイズ低減を受ける。次のステップにおいて、ノイズ低減を受けた後の入力信号は、音声アクティビティ検出を算出するために使用され、それに基づいてスピーチアクティビティ決定が行われる。スピーチが検出されたとき、信号レベルがノイズ低減後の入力信号に基づいて算出される。さらなるステップにおいて、スピーチアクティビティを仮定して、利得値、例えば新しい自動利得制御の利得が、算出された信号レベルおよび所定の目標レベルに基づいて決定される。スピーチが音声アクティビティ検出によって検出されなかった場合、前の時点からの利得値が用いられる。最後のステップにおいて、前の時点からの利得値または現在の時点から算出された利得値のいずれかである利得値が、ノイズ低減後の信号に適用され、それによって出力信号が提供される。

【0102】

ノイズポンピング効果を回避し、一貫したスピーチレベルを提供するために、図１６に示すように、スピーチ休止中に利得更新を回避するようにＶＡＤ（＝音声アクティビティ検出）を適用することができる。スピーチアクティビティが確実に検出されることができると場合、ＡＧＣ利得は、スピーチ休止中は一定に保ちながら、アクティブスピーチセグメント中にのみ調整することができる。グラフ１２３０に示すように、この方法は、一貫したスピーチレベルを生成し、ノイズポンピング効果（収束後の一定のノイズレベル）を回避する。しかしながら、ＡＧＣ利得が大きい場合は絶対ノイズレベルが大幅に増加する可能性があり、実際にはスピーチ休止中に特に顕著になる。

【0103】

図１７は、ＶＡＤがＡＧＣ処理全体をトリガしている別々のＮＲおよびＡＧＣ処理を伴う、図１６に記載のブロック図と類似の信号処理のためのブロック図を示す。さらに、図１７のブロック図は、スピーチが検出されなかった場合に利得値を１に設定することを説明している。グラフ１２３０に示すように、スピーチ休止中のノイズ増幅を無効にするために、ＡＧＣ利得は、図１７に表されるように、スピーチ期間中にのみ適用される（スピーチ休止中に１を適用することは、ＡＧＣ利得を適用しないことと等価である）。この手法は、低いスピーチレベルを提供し、スピーチ休止中のノイズの増幅を防止する。しかしながら、これもまたノイズの時変スケーリングをもたらし（グラフ１２４０参照）、これは実際には厄介なノイズポンピング効果として知覚される。

【0104】

図１８は、本発明の好ましい実施形態による通信システム、例えば図１３で説明したようなスピーチ通信システム１３００の近端側または遠端側を示す。遠端側または近端側は、同様の構造で実現することができる。したがって、片側のみを説明するが、すべての機能は反対側でも使用可能であり得る。

【0105】

考慮される側は、オーディオ内容を聴取者に伝達するための拡声器１８１０と、所望の信号、例えば話者からのスピーチ信号を拾うためのマイクロフォン１８２０とを備える。また、エコー制御システム１８３０は、拡声器信号に基づいて、マイクロフォン信号のエコーを抑制する。エコー制御１８３０の後、共同ノイズ低減および利得制御１８４０が信号を処理する。共同ノイズ低減および利得制御１８４０は、例えば装置１００、３００、４００、８００および９００によって実現することができる。

【0106】

また、コンフォートノイズシステム１８５０は、例えば所望の信号成分がマイクロフォンの取得された信号に存在しない場合（すなわち、遠端のみアクティビティ）に、遠端のユーザに快適な聴取体験を可能にするために、共同ノイズ低減および利得制御１８４０の後にコンフォートノイズを信号に適用する。要約すると、図１８に記載のシステムは、例えば遠端側に送信される信号が、遠端側のユーザに送信された信号の明瞭なスピーチ成分および快適な聴取体験を提供するように信号処理を提供する。

【0107】

図１９は、本発明の好ましい実施形態による通信システムの遠端側のブロック図を示す。図１９のシステムは、音声コンテンツを聴取者に伝達するように構成された拡声器１８１０と、例えばスピーチ内容を含むオーディオ信号の記録を可能にするように構成されたマイクロフォン１８２０とを備える。さらに、図１９に記載のシステムは、拡声器１８１０に伝達される信号のための共同ノイズ低減および利得制御１８４０を含む。また、マイクロフォン１８２０によって記録された信号は、拡声器１８１０およびコンフォートノイズシステム１８５０に伝達された信号に基づくエコー制御１８３０を受ける。エコー制御１８３０およびコンフォートノイズシステム１８５０は、図１８に記載されているのと同じ機能を含む。さらに、共同ノイズ低減および利得制御１８４０は、例えば装置１００、３００、４００、８００または９００によって実現することができる。それによって、図１９に記載のシステムは、拡声器に伝達されたオーディオ信号がスピーチ成分を含むときに明瞭なスピーチ信号を提供する。さらに、ノイズ低減部品により、快適な聴取体験が実現される。

【0108】

さらなる実施形態は、一連のフレームにおけるオーディオ信号の処理に依存する。オーディオ信号分析器（１３０；８３０；９３０）は、時間的に第１のフレームと第１のフレームに続く第２のフレームとを備える一連のフレームでオーディオ信号を分析し、第１のフレームについて、第１の複数のノイズ抑制値を決定し、かつ第２のフレームについて、第２の複数のノイズ抑制値を決定するように構成される。分析器は、第１の複数のノイズ抑制フィルタ値のノイズ抑制フィルタ値が第１のフレームに対して決定された第１の最小ノイズ抑制フィルタ値（１３０ｂ’；２４０；３５８ｃ、３６０ａ）以上になるように、かつ第１の最小ノイズ抑制フィルタ値がオーディオ信号（１３０ｃ’）の第１のフレームの第１の特性に依存するように第１の複数のノイズ抑制フィルタ値を決定するように構成される。分析器は、第２の複数のノイズ抑制フィルタ値のノイズ抑制フィルタ値が第２のフレームに対して決定された第２の最小ノイズ抑制フィルタ値（１３０ｂ’；２４０；３５８ｃ、３６０ａ）以上になるように、かつ第２の最小ノイズ抑制フィルタ値がオーディオ信号（１３０ｃ’）の第２のフレームの第２の特性に依存するように第２の複数のノイズ抑制フィルタ値を決定するようにさらに構成される。フィルタ（１２０；３１０；４１０；８２０）は、一連のフレームのオーディオ信号をフィルタリングするように構成され、第１のフレームの第１のフィルタは、第１の複数のノイズ抑制値に基づいて調整され、第２のフレームの第２のフィルタは、第２の複数のノイズ抑制値に基づいて調整される。フィルタ（１２０；３１０；４１０；８２０）は、第１のフィルタでオーディオ信号の第１のフレームをフィルタリングし、かつ第２のフィルタでオーディオ信号の第２のフレームをフィルタリングするようにさらに構成される。

【0109】

結論として、本発明のいくつかの実施形態は、リストに要約することができる。好ましい実施形態では、ＮＲが最初に適用され、以下のステップを含む：
１．オーディオ入力信号を受信する。

【0110】

２．前の時間フレームで決定されたＡＧＣ利得、所望のノイズ減衰量、および任意選択で歪み限界にも基づいて、ノイズ減衰限界を決定する。

【0111】

３．オーディオ入力信号およびノイズ減衰限界に基づいて、ノイズ低減フィルタを決定する。

【0112】

４．目標信号レベル、任意選択の音声アクティビティ情報、およびオーディオ信号に基づいてＡＧＣ利得を決定する。

【0113】

ａ）オーディオ信号がオーディオ入力信号である、または
ｂ）オーディオ信号がノイズ低減フィルタをオーディオ入力信号に適用することによって得られるノイズ低減オーディオ信号である、
任意選択の音声アクティビティ情報は、スピーチ休止中にＡＧＣ利得を任意選択で減少させるために使用される。

【0114】

５．前のフレームで得られたノイズ低減フィルタおよびＡＧＣ利得をオーディオ入力信号に適用することによって出力オーディオ信号を生成する。

【0115】

さらに、本発明による別の好ましい実施形態は、以下に従って最初にＡＧＣを適用することが実行されることに特徴付けられる：
１．オーディオ入力信号を受信する。

【0116】

２．目標信号レベル、任意選択の音声アクティビティ情報、およびオーディオ入力信号に基づいてＡＧＣ利得を決定する、
任意選択の音声アクティビティ情報は、スピーチ休止中にＡＧＣ利得を任意選択で減少させるために使用される。

【0117】

３．ノイズ減衰限界を決定する
ａ）所望のノイズ減衰量および現在のＡＧＣ利得に基づく、または
ｂ）所望のノイズ減衰量、歪み限界、および現在のＡＧＣ利得に基づく。

【0118】

４．オーディオ入力信号およびノイズ減衰限界に基づいて、ノイズ低減フィルタを決定する。

【0119】

５．ノイズ低減フィルタおよび現在のＡＧＣ利得をオーディオ入力信号に適用することによって出力オーディオ信号を生成する。

【0120】

本発明は、ブロックが実際のまたは論理的ハードウェア構成要素を表すブロック図の文脈で説明されてきたが、本発明は、コンピュータ実装方法によっても実装することができる。後者の場合、ブロックは、対応する方法ステップを表し、これらのステップは、対応する論理的または物理的ハードウェアブロックによって実行される機能を表す。

【0121】

いくつかの態様は装置の文脈で説明されているが、これらの態様はまた、対応する方法の説明を表し、ブロックまたはデバイスが方法ステップまたは方法ステップの特徴に対応することは明らかである。同様に、方法ステップの文脈で説明された態様はまた、対応する装置の対応するブロックまたは項目または特徴の説明を表す。方法ステップのいくつかまたはすべては、例えばマイクロプロセッサ、プログラマブルコンピュータまたは電子回路などのハードウェア装置によって（または使用して）実施されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちの１つまたは複数は、そのような装置によって実施され得る。

【0122】

ある特定の実装要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装することができる。実装は、電子的に読み取り可能な制御信号が記憶され、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する（または協働することができる）デジタル記憶媒体、例えばフロッピーディスク、ＤＶＤ、Ｂｌｕ−Ｒａｙ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはＦＬＡＳＨメモリを使用して実行されてもよい。したがって、デジタル記憶媒体は、コンピュータ可読であり得る。

【0123】

本発明によるいくつかの実施形態は、本明細書に記載の方法の１つが実行されるように、プログラマブルコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。

【0124】

一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータで実行されるときに方法の１つを実行するように動作可能である。プログラムコードは、例えば、機械可読キャリアに記憶することができる。

【0125】

他の実施形態は、機械可読キャリアに記憶された、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを含む。

【0126】

言い換えれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムがコンピュータで実行されるときに、本明細書に記載の方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

【0127】

したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを記録したデータキャリア（またはデジタル記憶媒体、またはコンピュータ可読媒体などの非一時的記憶媒体）である。データキャリア、デジタル記憶媒体または記録された媒体は、典型的には、有形および／または非一時的である。

【0128】

したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。データストリームまたは一連の信号は、例えばデータ通信接続を介して、例えばインターネットを介して転送されるように構成されてもよい。

【0129】

さらなる実施形態は、本明細書に記載の方法の１つを実行するように構成されたまたは適合された処理手段、例えば、コンピュータまたはプログラマブルロジックデバイスを含む。

【0130】

さらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムをインストールしたコンピュータを含む。

【0131】

本発明によるさらなる実施形態は、本明細書に記載の方法のうちの１つを実行するためのコンピュータプログラムを（例えば、電子的または光学的に）受信機に転送するように構成された装置またはシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを含み得る。

【0132】

いくつかの実施形態では、プログラマブルロジックデバイス（例えばフィールドプログラマブルゲートアレイ）を使用して、本明細書に記載の方法の機能の一部またはすべてを実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法の１つを実行するためにマイクロプロセッサと協働することができる。一般に、方法は、好ましくは、任意のハードウェア装置によって実行される。

【0133】

上述の実施形態は、本発明の原理を説明するための例示にすぎない。本明細書に記載の構成および詳細の修正および変形は、当業者にとって明らかであるものと理解される。したがって、差し迫った特許請求の範囲だけによって制限され、本明細書の実施形態の記載および説明によって示される具体的な詳細によって制限されないことが意図される。
参考文献

【0134】

［１］Ｅ．ＨａｅｎｓｌｅｒａｎｄＧ．Ｓｃｈｍｉｄｔ： “Ｈａｎｄｓ−ｆｒｅｅｔｅｌｅｐｈｏｎｅｓ −ＪｏｉｎｔＣｏｎｔｒｏｌｏｆＥｃｈｏＣａｎｃｅｌｌａｔｉｏｎａｎｄＰｏｓｔｆｉｌｔｅｒｉｎｇ”，ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，Ｖｏｌｕｍｅ：８０，Ｉｓｓｕｅ：１１，ｐｐ．２２９５−２３０５，Ｓｅｐ．２０００．

【0135】

［２］Ｆ．Ｋｕｅｃｈ，Ｅ．ＭａｂａｎｄｅａｎｄＧ．Ｅｎｚｎｅｒ， “Ｓｔａｔｅ−ｓｐａｃｅａｒｃｈｉｔｅｃｔｕｒｅｏｆｔｈｅｐａｒｔｉｔｉｏｎｅｄ−ｂｌｏｃｋ−ｂａｓｅｄａｃｏｕｓｔｉｃｅｃｈｏｃｏｎｔｒｏｌｌｅｒ，” ｉｎＰｒｏｃ．ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ），Ｍａｙ２０１４．

【0136】

［３］Ａ．Ｆａｖｒｏｔ，Ｃ．Ｆａｌｌｅｒ，Ｍ．Ｋａｌｌｉｎｇｅｒ，Ｆ．Ｋｕｅｃｈ，ａｎｄＭ．Ｓｃｈｍｉｄｔ， “ＡｃｏｕｓｔｉｃＥｃｈｏＣｏｎｔｒｏｌＢａｓｅｄｏｎＴｅｍｐｏｒａｌＦｌｕｃｔｕａｔｉｏｎｓｏｆＳｈｏｒｔ−ＴｉｍｅＳｐｅｃｔｒａ，” ｉｎＰｒｏｃ．ＩｎｔｅｒｎａｔｉｏｎａｌＷｏｒｋｓｈｏｐｏｎＡｃｏｕｓｔｉｃＥｃｈｏａｎｄＮｏｉｓｅＣｏｎｔｒｏｌ（ＩＷＡＥＮＣ），Ｓｅｐｔ．２００８．

【0137】

［４］Ｙ．Ｅｐｈｒａｉｍ，Ｄ．Ｍａｌａｈ， “Ｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔｕｓｉｎｇａｍｉｎｉｍｕｍｍｅａｎ−ｓｑｕａｒｅｅｒｒｏｒｓｈｏｒｔ−ｔｉｍｅｓｐｅｃｔｒａｌａｍｐｌｉｔｕｄｅｅｓｔｉｍａｔｏｒ，” ＩＥＥＥＴｒａｎｓ．Ａｃｏｕｓｔ．ＳｐｅｅｃｈＳｉｇｎａｌＰｒｏｃｅｓｓ，Ｖｏｌ．３２，ｐｐ．１１０９−１１２１，Ｄｅｃ．１９８４．

【0138】

［５］ＧｕａｎｇｊｉＳｈｉａｎｄＣｈａｎｇｘｕｅＭａ， “ＳｕｂｂａｎｄＣｏｍｆｏｒｔＮｏｉｓｅＩｎｓｅｒｔｉｏｎｆｏｒａｎＡｃｏｕｓｔｉｃＥｃｈｏＳｕｐｐｒｅｓｓｏｒ，” ｉｎＰｒｏｃ．１３３ｒｄＡｕｄｉｏＥｎｇｉｎｅｅｒｉｎｇＳｏｃｉｅｔｙＣｏｎｖｅｎｔｉｏｎ，Ｏｃｔ．２０１２．

【0139】

［６］Ｍ．Ｍａｔｓｕｂａｒａ，Ｋ．Ｎｏｍｏｔｏ． “Ａｕｄｉｏｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇｄｅｖｉｃｅａｎｄｎｏｉｓｅｓｕｐｐｒｅｓｓｉｏｎｐｒｏｃｅｓｓｉｎｇｍｅｔｈｏｄｉｎａｕｔｏｍａｔｉｃｇａｉｎｃｏｎｔｒｏｌｄｅｖｉｃｅ．” ＰａｔｅｎｔｐｕｂｌｉｃａｔｉｏｎＮｏ．ＵＳ２００８／０１４７３８７Ａ１．

【図1】