特許5762956 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ オーディエンス，インコーポレイテッドの特許一覧

特許5762956ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7a
7b
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5762956

(24)【登録日】2015年6月19日

(45)【発行日】2015年8月12日

(54)【発明の名称】ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法

(51)【国際特許分類】

G10L 21/0232 20130101AFI20150723BHJP

【ＦＩ】

G10L21/0232

【請求項の数】18

【全頁数】20

(21)【出願番号】特願2011-516313(P2011-516313)

(86)(22)【出願日】2009年6月26日

(65)【公表番号】特表2011-527025(P2011-527025A)

(43)【公表日】2011年10月20日

(86)【国際出願番号】US2009003813

(87)【国際公開番号】WO2010005493

(87)【国際公開日】20100114

【審査請求日】2012年2月14日

(31)【優先権主張番号】12/215,980

(32)【優先日】2008年6月30日

(33)【優先権主張国】US

(73)【特許権者】

【識別番号】511001873

【氏名又は名称】オーディエンス，インコーポレイテッド

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100091214

【弁理士】

【氏名又は名称】大貫進介

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(72)【発明者】

【氏名】ゾルバッハ，ルドガー

(72)【発明者】

【氏名】ムルギア，カルロ

【審査官】毛利太郎

(56)【参考文献】

【文献】特表２００２−５４２６８９（ＪＰ，Ａ）

【文献】特開２００６−０９４５２２（ＪＰ，Ａ）

【文献】国際公開第２００７／０４９６４４（ＷＯ，Ａ１）

【文献】国際公開第２００７／０８１９１６（ＷＯ，Ａ１）

【文献】特表２００９−５２２９４２（ＪＰ，Ａ）

【文献】特開２００３−２７１１９１（ＪＰ，Ａ）

【文献】特開２００８−１３５９３３（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ２１／０２３２

(57)【特許請求の範囲】

【請求項1】

雑音を抑制する方法であって、
少なくとも第１及び第２音響信号を受信する段階、
周波数分析を用いて前記第１及び第２の音響信号を周波数サブバンドに分ける段階、
所望の信号成分を生成するために、音源の場所を表す係数を前記第１音響信号に適用する段階、
雑音成分信号を得るために、前記第２音響信号から前記所望の信号成分を減算する段階、
前記所望の信号成分及び前記雑音成分信号に関連する少なくとも１つのエネルギー比の第１の決定を行う段階、
前記少なくとも１つのエネルギー比に基づき、前記雑音成分信号を調整するか否かの第２の決定を行う段階、
前記第２の決定に基づき、前記雑音成分信号を調整する段階、
雑音の除去された信号を生成するために、前記第１音響信号から前記雑音成分信号を減算する段階、
前記雑音の除去された信号を出力する段階、
を有する方法。

【請求項2】

前記少なくとも１つのエネルギー比は、基準エネルギー比及び予測エネルギー比を有する、
ことを特徴とする請求項１に記載の方法。

【請求項3】

前記予測エネルギー比が前記基準エネルギー比より大きいとき、前記雑音成分信号に適用される適応係数を適応する段階、
を更に有する請求項２に記載の方法。

【請求項4】

前記予測エネルギー比が前記基準エネルギー比より小さいとき、前記雑音成分信号に適用される適応係数を固定する段階、
を更に有する請求項２に記載の方法。

【請求項5】

雑音の除去された信号からどれだけ多くの第１音響信号が除去されたかを示す少なくとも１つのエネルギー比に基づき、ＮＰゲインを決定する段階、
を更に有する請求項１に記載の方法。

【請求項6】

乗法性雑音抑制システムに前記ＮＰゲインを供給する段階、
を更に有する請求項５に記載の方法。

【請求項7】

前記雑音の除去された信号を出力する段階は、乗法性雑音抑制システムに前記雑音の除去された信号を出力する段階を有する、
ことを特徴とする請求項１に記載の方法。

【請求項8】

前記乗法性雑音抑制システムは、少なくとも前記雑音の除去された信号に基づくゲインマスクを生成する、
ことを特徴とする請求項７に記載の方法。

【請求項9】

音声出力信号を生成するために、前記雑音の除去された信号に前記ゲインマスクを適用する段階、
を更に有する請求項８に記載の方法。

【請求項10】

雑音を抑制するシステムであって、
少なくとも第１及び第２音響信号を受信するよう構成されたマイクロホン・アレイ、
前記第１及び第２の音響信号を周波数サブバンドに分け、音源の場所を表す係数を前記第１音響信号に適用し、所望の信号成分を生成する周波数分析モジュールであって、前記所望の信号成分は、雑音成分信号を得るために前記第２の音響信号から減算さる、周波数分析モジュール、
前記所望の信号成分及び前記雑音成分信号に関連する少なくとも１つのエネルギー比の第１の決定を行うよう構成されたゲイン・モジュール、
前記少なくとも１つのエネルギー比に基づき、前記雑音成分信号を調整するか否かの第２の決定を行うよう構成され、前記第２の決定に基づき前記雑音成分信号を調整するよう更に構成された適応モジュール、
雑音の除去された信号を生成するために、前記第２音響信号から前記所望の信号成分を減算し、前記第１音響信号から前記雑音成分信号を減算するよう構成された少なくとも１つの加算モジュール、
を有するシステム。

【請求項11】

前記少なくとも１つのエネルギー比は、基準エネルギー比及び予測エネルギー比を有する、
ことを特徴とする請求項１０に記載のシステム。

【請求項12】

前記適応モジュールは、前記予測エネルギー比が前記基準エネルギー比より大きいとき、前記雑音成分信号に適用される適応係数を適応するよう構成される、
ことを特徴とする請求項１１に記載のシステム。

【請求項13】

前記適応モジュールは、前記予測エネルギー比が前記基準エネルギー比より小さいとき、前記雑音成分信号に適用される適応係数を固定するよう構成される、
ことを特徴とする請求項１１に記載のシステム。

【請求項14】

雑音の除去された信号からどれだけ多くの第１音響信号が除去されたかを示す少なくとも１つのエネルギー比に基づき、ＮＰゲインを決定するよう構成されたゲイン・モジュール、
を更に有する請求項１０に記載のシステム。

【請求項15】

プログラムを有する機械可読記憶媒体であって、
前記プログラムは命令を格納し、前記命令はコンピュータにより実行されると前記コンピュータに雑音除去処理を用いて雑音を抑制する方法のための命令を実行させ、
前記方法は、
少なくとも第１及び第２音響信号を受信する段階、
前記第１及び第２の音響信号を周波数サブバンドに分ける段階、
所望の信号成分を生成するために、音源の場所を表す係数を前記第１音響信号に適用する段階、
雑音成分信号を得るために、前記所望の信号成分を前記第２音響信号から減算する段階、
前記所望の信号成分及び前記雑音成分信号に関連する少なくとも１つのエネルギー比の第１の決定を行う段階、
前記少なくとも１つのエネルギー比に基づき、前記雑音成分信号を調整するか否かの第２の決定を行う段階、
前記第２の決定に基づき、前記雑音成分信号を調整する段階、
雑音の除去された信号を生成するために、前記雑音成分信号を前記第１音響信号から減算する段階、
前記雑音の除去された信号を出力する段階、
を有する、
ことを特徴とする機械可読記憶媒体。

【請求項16】

前記少なくとも１つのエネルギー比は、基準エネルギー比及び予測エネルギー比を有する、
ことを特徴とする請求項１５に記載の機械可読記憶媒体。

【請求項17】

前記方法は、
前記予測エネルギー比が前記基準エネルギー比より大きいとき、前記雑音成分信号に適用される適応係数を適応する段階、
を更に有する、
ことを特徴とする請求項１６に記載の機械可読記憶媒体。

【請求項18】

前記方法は、
前記予測エネルギー比が前記基準エネルギー比より小さいとき、前記雑音成分信号に適用される適応係数を固定する段階、
を更に有する、
ことを特徴とする請求項１６に記載の機械可読記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、一般に音声処理に関し、より詳細には音声信号の適応型雑音抑制に関する。

【背景技術】

【0002】

現在、悪い音声環境における背景雑音を低減する多くの方法がある。このような方法のひとつは、定常雑音抑制システムを利用することである。定常雑音抑制システムは、常に、入力雑音よりも少ない一定量の出力雑音を提供する。標準的に、定常雑音抑制は、１２乃至１３デシベル（ｄＢ）の範囲内である。雑音抑制は、音声歪みを生成することを避けるため、この保守的なレベルに固定されている。音声歪みは、より高い雑音抑制において明らかになる。

【0003】

より高い雑音抑制を提供するために、信号対雑音比（ＳＮＲ）に基づく動的雑音抑制システムが利用されている。従って、このＳＮＲは抑制値を決定するために用いられうる。残念ながら、音声環境には様々な雑音の種類が存在するため、ＳＮＲそれ自体は、あまり良い音声歪みの予測因子ではない。ＳＮＲは、会話音声が、雑音よりどれだけ大きな音量であるかという比率である。しかしながら、会話音声は、絶えず変化し、中断を含みうる非定常信号でありうる。標準的に、ある期間にわたって、会話音声エネルギーは、発言、中断、発言、中断、以下同様を含む。更に、定常及び動的雑音が音声環境に存在しうる。ＳＮＲは、これらの定常及び非定常の会話音声及び雑音のすべてを平均化する。雑音信号の統計値に関しては考慮されていない。つまり、雑音の全体のレベルがどれだけかのみである。

【0004】

幾つかの従来技術のシステムでは、雑音スペクトルの推定値に基づき、拡張フィルタが得られうる。ある一般的な拡張フィルタのひとつは、ウィナー・フィルタである。不利なことに、この拡張フィルタは、標準的には、ユーザの知覚を考慮に入れず、ある数学的な誤差量を最小化するように構成される。その結果、ある量の音声劣化が雑音抑制の副作用として導入される。この音声劣化は、雑音レベルが上がり、更なる雑音抑制が適用されると、さらに深刻になる。つまり、ＳＮＲが低くなるほど、低いゲインが適用され、結果として更なる雑音抑制につながる。これにより、更なる音声損失歪み及び音声劣化が導入される。

【0005】

幾つかの従来技術システムは、汎用のサイドローブ・キャンセラを呼び出す。汎用サイドローブ・キャンセラは、所望の信号と受信信号に含まれる干渉信号とを識別するために用いられる。所望の信号は、所望の場所から伝搬し、干渉信号は、別の場所から伝搬する。干渉信号は、干渉を除去する目的で、該受信信号から差し引かれる。

【0006】

多くの雑音抑制処理は、マスキング・ゲインを計算し、このマスキング・ゲインを入力信号に適用する。したがって、音声信号がほとんど雑音である場合、低い値のマスキング・ゲインが、音声信号に適用されうる（つまり、増大されうる）。反対に、音声信号が会話音声のようにほとんど所望の音である場合、高い値のゲインマスクが音声信号に適用されうる。この処理は、一般に、乗法性雑音抑制として参照される。

【発明の概要】

【発明が解決しようとする課題】

【0007】

本発明は、ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法を提供する。

【課題を解決するための手段】

【0008】

本発明の実施形態は、雑音抑制及び会話音声の向上に関連する従来の問題を克服又は実質的に軽減する。例である実施形態では、マイクロホン・アレイにより、少なくとも第１及び第２音響信号が受信される。マイクロホン・アレイは、クローズ・マイクロホン・アレイ又はスプレッド・マイクロホン・アレイを有してもよい。

【0009】

雑音成分信号は、複素数係数σにより重み付けされた第１音響信号を第２音響信号から減算することにより、マイクロホンにより受信された信号の各サブバンドで決定されてもよい。次に、別の複素数係数αにより重み付けされた雑音成分信号は、第１音響信号から減算され、結果として目標信号（つまり、雑音の除去された信号）の推定値を生じてもよい。

【0010】

αを調整するか否かの決定が行われてもよい。例である実施形態では、基準エネルギー比（ｇ_１）及び予測エネルギー比（ｇ_２）に基づき決定が行われてもよい。前記予測エネルギー比が前記基準エネルギー比より大きいとき、前記雑音成分信号を調整するために複素数係数αが適応されてもよい。反対に、予測エネルギー比が基準エネルギー比より小さいとき、適応係数は固定されてもよい。次に、出力される雑音の除去された信号を生成するために、雑音成分信号は、第１音響信号から除去されてもよい。

【図面の簡単な説明】

【0011】

【図1】本発明の実施形態が実施されうる環境である。

【図2】本発明の実施形態を実施する例である音声装置のブロック図である。

【図3】スプレッド・マイクロホン・アレイを利用した例である音声処理システムのブロック図である。

【図4】図３の音声処理システムの例である雑音抑制システムのブロック図である。

【図5】クローズ・マイクロホン・アレイを利用した例である音声処理システムのブロック図である。

【図6】図５の音声処理システムの例である雑音抑制システムのブロック図である。

【図7A】例である雑音除去エンジンのブロック図である。

【図7B】雑音除去エンジンの動作を説明する概略図である。

【図8】音声装置の雑音抑制の例である方法のフローチャートである。

【図9】雑音除去処理を実行する例である方法のフローチャートである。

【発明を実施するための形態】

【0012】

本発明は、音声信号内の雑音の適応型抑制のための例であるシステム及び方法を提供する。実施形態は、雑音抑制と、最小限の又は全くない音声劣化（つまり、音声損失歪み）との調和を試みる。例である実施形態では、雑音抑制は、音源の場所に基づいており、単なる乗法性雑音抑制処理とは対照的に減法性雑音抑制処理を適用する。

【0013】

本発明の実施形態は、以下のものに限定されないが、携帯電話、電話のハンドセット、ヘッドセット及び会議システムのような音を受信するように構成された如何なる音声装置上で実施されてもよい。有利なことに、例である実施形態は、音声歪みを最小限に抑えながら、改善された雑音抑制を提供するよう構成される。本発明の幾つかの実施形態は携帯電話での動作を参照して説明されるが、本発明は、如何なる音声装置上で実施されてもよい。

【0014】

図１を参照すると、本発明の実施形態が実施されうる環境が示される。ユーザは、音声装置１０４に対して会話音源１０２として動作する。例である音声装置１０４は、マイクロホン・アレイを含んでもよい。マイクロホン・アレイは、クローズ・マイクロホン・アレイ又はスプレッド・マイクロホン・アレイを有する。

【0015】

例である実施形態では、マイクロホン・アレイは、会話音源１０２に関連する第１マイクロホン１０６を有し、第１マイクロホン１０６から離れた場所に第２マイクロホンを有してもよい。本発明の実施形態は、２つのマイクロホン１０６及び１０８を有することに関して議論されるが、代替の実施形態は、マイクロホン・アレイ内に如何なる数のマイクロホン又は音響センサを含んでもよい。幾つかの実施形態では、マイクロホン１０６及び１０８は、全方向性マイクロホンを有してもよい。

【0016】

マイクロホン１０６及び１０８は、音源１０２から音（つまり、音響信号）を受信すると同時に、マイクロホン１０６及び１０８は、雑音１１０も拾う。図１では、雑音１１０は、単一の場所から来るように示されるが、雑音１１０は、音源１０２とは異なる１以上の場所からの如何なる音を有してもよく、反響音やエコーを含んでもよい。雑音１１０は、定常、非定常、又は定常雑音及び非定常雑音の組み合わせであってもよい。

【0017】

図２を参照すると、例である音声装置１０４がより詳細に示される。例である実施形態では、音声装置１０４は、プロセッサ２０２、第１マイクロホン１０６、第２マイクロホン１０８、音声処理システム２０４及び出力装置２０６を有する音声受信装置である。音声装置１０４は、音声装置１０４の動作に必要な更なる構成要素（示されていない）を有してもよい。音声処理システム２０４は、図３に関連してより詳細に議論される。

【0018】

例である実施形態では、第１及び第２マイクロホン１０６及び１０８は、それらの間のエネルギー・レベルの差を考慮に入れるために、間隔を離して配置される。マイクロホン１０６及び１０８により受信されると、音響信号は、電気信号（つまり、第１電気信号及び第２電気信号）へと変換されてもよい。幾つかの実施形態によると、これらの電気信号自体は、処理のため、アナログデジタル変換器（示されない）によりデジタル信号に変換されてもよい。音響信号を区別するために、第１マイクロホン１０６により受信された音響信号は、本願明細書では第１音響信号として参照され、第２マイクロホン１０８により受信された音響信号は、本願明細書では第２音響信号として参照される。

【0019】

出力装置２０６は、ユーザに音声出力を提供する如何なる装置であってよい。たとえば、出力装置２０６は、ヘッドセット又はハンドセットのイヤホン、又は会議装置のスピーカを有してもよい。

【0020】

図３は、本発明のある実施形態による例である音声処理システム２０４ａの詳細なブロック図である。例である実施形態では、音声処理システム２０４ａは、メモリ装置内で実施される。図３の音声処理システム２０４ａは、スプレッド・マイクロホン・アレイを有する実施形態で利用されてもよい。

【0021】

実際には、第１及び第２マイクロホン１０６及び１０８で受信された音響信号は、電気信号に変換され、周波数分析モジュール３０２を通じて処理される。ある実施形態では、周波数分析モジュール３０２は、音響信号を取得し、フィルタ・バンクによってシミュレートされた蝸牛（つまり、蝸牛領域）の周波数分析を模倣する。ある例では、周波数分析モジュール３０２は、音響信号を周波数サブバンドに分割する。サブバンドは、フィルタの帯域幅が周波数分析モジュール３０２により受信された信号の帯域幅よりも狭いときの入力信号に対するフィルタリング動作の結果である。或いは、短時間フーリエ変換（ＳＴＦＴ）、サブバンド・フィルタ・バンク、変調複素重複変換、蝸牛モデル、ウェーブレット等のような他のフィルタも周波数分析及び合成に用いられうる。ほとんどの音（例えば、音響信号）は、複雑であり、１つ以上の周波数を有しているので、音響信号のサブバンド分析は、あるフレーム（例えば所定の時間期間）内の複雑な音響信号の中に、どんな個々の周波数が存在しているかを決定する。ある実施形態によると、そのフレームは、８ｍｓの長さである。別の実施形態は、他のフレーム長を利用してもよい。また、フレームを全く用いなくてもよい。その結果は、高速蝸牛変換（ＦＣＴ）領域内にサブバンド信号を有してもよい。

【0022】

サブバンド信号が決定されると、該サブバンド信号は、雑音除去エンジン３０４へ転送される。例である雑音除去エンジン３０４は、各サブバンドの第１音響信号から雑音成分を適応して除去するように構成される。このように、雑音除去エンジン３０４の出力は、雑音が除去されたサブバンド信号を有する雑音が除去された信号である。雑音除去エンジン３０４は、図７Ａ及び図７Ｂに関してより詳細に議論される。留意すべき点は、雑音が除去されたサブバンド信号は、会話音声又は非会話音声（例えば、音楽）である所望の音声を有してもよいことである。雑音除去エンジン３０４の結果は、ユーザへの出力であってよく、又は更なる雑音抑制システム（例えば、雑音抑制エンジン３０６）を通じて処理されてもよい。説明を目的として、本発明の実施形態は、雑音除去エンジン３０４の出力が、更なる雑音抑制システムを通じて処理される実施形態を議論する。

【0023】

第２音響信号のサブバンド信号と共に雑音が除去されたサブバンド信号は、次に雑音抑制エンジン３０６ａへと供給される。例である実施形態によると、雑音抑制エンジン３０６ａは、雑音が除去された会話音声信号に残っている雑音成分を更に低減させるために、雑音が除去されたサブバンド信号に適用されるべきゲインマスクを生成する。雑音抑制エンジン３０６ａは、以下の図４に関してより詳細に議論される。

【0024】

雑音抑制エンジン３０６ａによって決定されたゲインマスクは、次にマスキング・モジュール３０８において雑音が除去された信号に適用されてもよい。従って、各ゲインマスクは、マスクされた周波数サブバンドを生成するために、関連する雑音が除去された周波数サブバンドに適用されうる。図３に示されたように、乗法性雑音抑制システム３１２ａは、雑音抑制エンジン３０６ａ及びマスキング・モジュール３０８を有する。

【0025】

次に、マスクされた周波数サブバンドは、蝸牛領域から時間領域へと変換して戻される。この変換は、周波数合成モジュール３１０において、マスクされた周波数サブバンドを取得すること及び蝸牛チャネルの位相シフトされた信号と足し合わせることを有してもよい。或いは、この変換は、周波数合成モジュール３１０において、マスクされた周波数サブバンドを取得すること及び蝸牛チャネルの逆周波数とマスクされた周波数サブバンドを掛け合わせることを有してもよい。変換が完了すると、合成された音響信号がユーザへと出力されてもよい。

【0026】

図４を参照すると、図３の雑音抑制エンジン３０６ａが示される。例である雑音抑制エンジン３０６ａは、エネルギー・モジュール４０２、マイクロホン間レベル差（ＩＬＤ）モジュール４０４、適応型分類器４０６、雑音推定モジュール４０８及び適応型高機能抑制（ＡＩＳ）生成器４１０を有する。留意すべき点は、雑音抑制エンジン３０６ａは例であり、引用されることによりに援用される米国特許出願番号１１／３４３５２４に示され記載されているようなモジュールの他の組み合わせを有してもよいことである。

【0027】

本発明の例である実施形態によると、雑音が除去された信号内の雑音を抑制し、会話音声を強めるために、ＡＩＳ生成器４１０は、時間的及び周波数的に変動するゲイン、又はマスキング・モジュール３０８で用いられるゲインマスクを得る。しかしながら、ゲインマスクを得るために、ＡＩＳ生成器４１０には特定の入力が必要となる。これらの入力は、雑音のパワー・スペクトル密度（つまり、雑音スペクトル）、雑音が除去された信号のパワー・スペクトル密度（本願明細書では第１スペクトルとして参照される）及びマイクロホン間レベル差（ＩＬＤ）を有する。

【0028】

例である実施形態によると、雑音除去エンジン３０４の結果生じる雑音が除去された信号（ｃ’（ｋ））及び第２音響信号（ｆ’（ｋ））は、音響信号の各周波数帯に対するある時間間隔中のエネルギー／パワー推定値（つまり、パワー推定値）を計算するエネルギー・モジュール４０２へ転送される。図７Ｂに示すように、ｆ’（ｋ）は、状況に応じてｆ（ｋ）と等しくてもよい。その結果、全周波数帯域に渡る第１スペクトル（つまり、雑音が除去された信号のパワー・スペクトル密度）は、エネルギー・モジュール４０２によって決定されてもよい。この第１スペクトルは、ＡＩＳ生成器４１０及びＩＬＤモジュール４０４に供給されてもよい（本願明細書で更に議論される）。同様に、エネルギー・モジュール４０２は、全周波数帯域に渡る第２スペクトル（つまり、第２音響信号のパワー・スペクトル密度）も決定する。第２スペクトルも、ＩＬＤモジュール４０４に供給される。パワー推定値及びパワー・スペクトルの計算に関しての更なる詳細は、継続中の米国特許出願番号１１／３４３５２４及び継続中の米国特許出願番号１１／６９９７３２から分かる。これらの米国特許出願は参照されることにより本願明細書に援用される。

【0029】

２つのマイクロホンの実施形態では、パワー・スペクトルは、第１及び第２マイクロホン１０６及び１０８間のエネルギー比を決定するために、マイクロホン間レベル差（ＩＬＤ）モジュール４０４によって用いられる。例である実施形態では、ＩＬＤは、時間的及び周波数的に変動するＩＬＤであってもよい。第１及び第２マイクロホン１０６及び１０８は特定の方向に指向性があってもよいため、会話音声が活発なときはあるレベル差が生じ、雑音が活発なときは別のレベル差が生じうる。ＩＬＤは、次に、適応型分類器４０６及びＡＩＳ生成器４１０に転送される。ＩＬＤを計算するための実施形態に関しての更なる詳細は、継続中の米国特許出願番号１１／３４３５２４及び継続中の米国特許出願番号１１／６９９７３２から分かる。別の実施形態では、第１及び第２マイクロホン１０６及び１０８間の別の形式のＩＬＤ又はエネルギー差が利用されてもよい。例えば、第１及び第２マイクロホン１０６及び１０８のエネルギー比が用いられてもよい。留意すべき点は、代替の実施形態が適応型分類及び雑音抑制（つまり、ゲインマスク計算）にＩＬＤ以外のものを用いてもよいことである。例えば、雑音下限閾値が使われてもよい。また、ＩＬＤの利用への参照は、別のものにも適用可能であると考えられうる。例である適応型分類器４０６は、各フレームにおける各周波数帯の音響信号において、雑音及び混乱させるもの（例えば、負のＩＬＤを有する音源）を会話音声と区別するよう構成される。特徴（例えば、会話音声、雑音及び混乱させるもの）は、変化し、環境内の音響条件に依存するので、適応型分類器４０６は適応できると考えられる。例えば、ある状況で会話音声を示すＩＬＤは、別の状況では雑音を示しうる。従って、適応型分類器４０６は、ＩＬＤに基づいて分類境界を調整してもよい。

【0030】

例である実施形態によると、適応型分類器４０６は、雑音及び混乱させるものを会話音声と区別し、雑音推定値を導き出す雑音推定モジュール４０８へ、結果を供給する。最初に、適応型分類器４０６は、各周波数におけるチャネル間の最大エネルギーを決定してもよい。各周波数のローカルＩＬＤもまた決定される。グローバルＩＬＤは、エネルギーをローカルＩＬＤに適用することによって計算されてもよい。新たに計算されたグローバルＩＬＤに基づいて、移動平均グローバルＩＬＤ及び／又はＩＬＤ観測のための移動平均及び分散（つまり、グローバル・クラスタ）が更新されてもよい。次に、フレーム・タイプが、グローバル・クラスタに対するグローバルＩＬＤの位置に基づき分類されてもよい。フレーム・タイプは、音源、背景騒音及び混乱させるものを有してもよい。

【0031】

フレーム・タイプが決められると、適応型分類器４０６は、音源、背景騒音及び混乱させるものに対するグローバル平均の移動平均及び分散（つまり、クラスタ）を更新してもよい。ある例では、フレームが音源、背景騒音又は混乱させるものとして分類された場合、対応するグローバル・クラスタは活動的であると考えられ、グローバルＩＬＤの方へ動かされる。フレーム・タイプが一致しないグローバルな音源、背景騒音又は混乱させるもののグローバル・クラスタは、非活動的であると考えられる。所定の期間の間、非活動的なままの音源及び混乱させるもののグローバル・クラスタは、背景騒音のグローバル・クラスタの方へ移動しうる。背景騒音のグローバル・クラスタが所定の期間の間、非活動的なままの場合、背景騒音のグローバル・クラスタは、グローバル平均へと移動する。

【0032】

フレーム・タイプが決められると、適応型分類器４０６は、音源、背景騒音及び混乱させるものに対するローカル平均の移動平均及び分散（つまり、クラスタ）も更新してもよい。ローカルの活動的及び非活動的クラスタを更新する処理は、グローバルの活動的及び非活動的クラスタを更新する処理と同様である。

【0033】

音源及び背景騒音のクラスタの位置に基づき、エネルギー・スペクトル内の点は、音源又は雑音として分類される。この結果は、雑音推定モジュール４０８へと渡される。

【0034】

別の実施形態では、適応型分類器４０６の例は、最小統計量推定器を用いて、各周波数帯の最小ＩＬＤを追跡するものを有する。分類の閾は、各帯域の最小ＩＬＤより固定値（例えば、３ｄＢ）だけ上に置かれてもよい。或いは、閾値は、各帯域において観測されたＩＬＤ値の直近の観測範囲に基づき、各帯域の最小ＩＬＤから可変の距離だけ上に置かれてもよい。例えば、観測されたＩＬＤの範囲が６ｄＢを超えていた場合、ある特定の期間（例えば、２秒）に各帯域で観測される最小ＩＬＤと最大ＩＬＤの中ほどになるように、閾値が置かれうる。適応型分類器は、更に２００７年７月６日出願の米国非仮出願番号１１／８２５５６３、発明の名称「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＡｄａｐｔｉｖｅＩｎｔｅｌｌｉｇｅｎｔＮｏｉｓｅＳｕｐｒｅｓｓｉｏｎ」で議論されている。該出願は参照されることにより本願明細書に援用される。

【0035】

例である実施形態では、雑音推定は、第１マイクロホン１０６からの音響信号及び適用型分類器４０６からの結果に基づく。例である雑音推定モジュール４０８は、雑音推定値を生成する。本発明のある実施形態により、雑音推定値は、以下の式で数学的に近似されうる要素である。

【0036】

【数1】

示されるように、この実施形態の雑音推定値は、第１音響信号Ｅ_１（ｔ，ω）の現在のエネルギー推定値及び前の時間フレームＮ（ｔ−１，ω）の雑音推定値の最小統計量に基づく。結果として、雑音推定は、効率的かつ低遅延で実行される。

【0037】

上述の式中のλ_１（ｔ，ω）は、ＩＬＤモジュール４０４によって近似されたＩＬＤから以下のように導き出されうる。

【0038】

【数2】

つまり、第１マイクロホン１０６が閾（たとえば、閾＝０．５）よりも小さく、該閾より上に会話音声があると見込まれるとき、λ_１は小さい。従って、雑音推定モジュール４０８は、雑音を厳密に調べる。ＩＬＤが上がり出すとき（例えば、会話音声が大きなＩＬＤ範囲内にあるため）、λ_１は大きくなる。その結果、雑音推定モジュール４０８は、雑音推定処理のスピードを落とし、会話音声エネルギーは、最終的な雑音推定値にあまり寄与しない。別の実施形態は、雑音推定値又は雑音スペクトルを決定する別の方法を意図する。雑音スペクトル（つまり、音響信号の全周波数帯域の雑音推定値）は、次にＡＩＳ生成器４１０へ転送されてもよい。

【0039】

ＡＩＳ生成器４１０は、エネルギー・モジュール４０２から第１スペクトルの会話音声エネルギーを受け取る。この第１スペクトルは、雑音除去エンジン３０４による処理の後でも、幾つかの残余雑音も有しうる。ＡＩＳ生成器４１０は、雑音推定モジュール４０８から雑音スペクトルも受け取ってよい。これらの入力とＩＬＤモジュール４０４からの任意のＩＬＤに基づき、会話音声スペクトルが推測されてもよい。ある実施形態では、会話音声スペクトルは、第１スペクトルのパワー推定値から雑音スペクトルの雑音推定値を減算することによって推測される。次に、ＡＩＳ生成器４１０は、第１音響信号に適用するゲインマスクを決定してもよい。適応型分類器は、更に２００７年７月６日出願の米国特許出願番号１１／８２５５６３、発明の名称「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＡｄａｐｔｉｖｅＩｎｔｅｌｌｉｇｅｎｔＮｏｉｓｅＳｕｐｒｅｓｓｉｏｎ」から分かる。該出願は参照されることにより本願明細書に援用される。例である実施形態では、ＡＩＳ生成器４１０からの時間及び周波数に依存するゲインマスク出力は、音声損失歪みを抑制する一方で、雑音抑制を最大化する。

【0040】

留意すべき点は、この雑音抑制エンジン３０６ａのシステム・アーキテクチャは例であるということである。別の実施形態は、更なる構成要素、少ない構成要素又は同じ数の構成要素を有してもよい。また、本発明の実施形態の範囲に包含される。雑音抑制エンジン３０６ａの種々のモジュールは、１つのモジュールに結合されてもよい。例えば、ＩＬＤモジュール４０４の機能は、エネルギー・モジュール３０４の機能に結合されてもよい。

【0041】

図５を参照すると、代替の音声処理システム２０４ｂの詳細なブロック図が示される。図３の音声処理システム２０４ａとは対照的に、図５の音声処理システム２０４ｂは、クローズ・マイクロホン・アレイを有する実施形態に利用されてもよい。周波数分析モジュール３０２、マスキング・モジュール３０８及び周波数合成モジュール３１０の機能は、図３の音声処理システム２０４ａに関して説明されたものと同一である。よって、詳細には議論しない。

【0042】

周波数分析モジュール３０２によって決定されたサブバンド信号は、雑音除去エンジン３０４及びアレイ処理エンジン５０２へと転送されてもよい。例である雑音除去エンジン３０４は、各サブバンドの第１音響信号から雑音成分を適応して除去するように構成される。このように、雑音除去エンジン３０４の出力は、雑音が除去されたサブバンド信号を有する雑音が除去された信号である。本実施形態では、雑音除去エンジン３０４は、雑音抑制エンジン３０６ａに対しヌル処理（ＮＰ）ゲインも供給する。ＮＰゲインは、雑音が除去された信号からどれだけ多くの第１信号が除去されたかを示すエネルギー比を有する。第１信号が雑音で占められている場合、ＮＰゲインは大きくなる。反対に、第１信号が会話音声で占められている場合、ＮＰゲインはゼロに近くなる。雑音除去エンジン３０４は、以下の図７Ａ及び図７Ｂに関してより詳細に議論される。

【0043】

例である実施形態では、アレイ処理エンジン５０２は、クローズ・マイクロホン・アレイ（例えば、第１及び第２マイクロホン１０６及び１０８）のために指向性パターン（つまり、合成された指向性マイクロホン応答）第１信号及び第２信号のサブバンド信号を適応して処理するように構成される。指向性パターンは、第１音響（サブバンド）信号に基づく前方を向いたカージオイド・パターン及び第２（サブバンド）音響信号に基づく後方を向いたカージオイド・パターンを有する。ある実施形態では、サブバンド信号は、後方を向いたカージオイド・パターンが音源１０２の方を向くように適応されてもよい。アレイ処理エンジン５０２の実装及び機能に関しての更なる詳細は、米国特許出願番号１２／０８０１１５、発明の名称「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＰｒｏｖｉｄｉｎｇＣｌｏｓｅ−ＭｉｃｒｏｐｈｏｎｅＡｒｒａｙＮｏｉｓｅＲｅｄｕｃｔｉｏｎ」から分かる（適応型アレイ処理エンジンとして参照される。）。該出願は参照されることにより本願明細書に援用される。カージオイド信号（つまり、前方を向いたカージオイド・パターンを実装する信号及び後方を向いたカージオイド・パターンを実装する信号）は、次に、アレイ処理エンジン５０２によって、雑音抑制エンジン３０６ｂに供給される。

【0044】

雑音抑制エンジン３０６ｂは、カージオイド信号と共にＮＰゲインを受け取る。例である実施形態によると、雑音抑制エンジン３０６ｂは、雑音が除去された会話音声信号に残りうる雑音成分を更に低減するために、雑音除去エンジン３０４からの雑音が除去されたサブバンド信号に適用するためのゲインマスクを生成する。雑音抑制エンジン３０６ｂは、以下の図６に関してより詳細に議論される。

【0045】

雑音抑制エンジン３０６ｂによって決定されたゲインマスクは、次にマスキング・モジュール３０８において雑音が除去された信号に適用されてもよい。従って、各ゲインマスクは、マスクされた周波数サブバンドを生成するために、関連する雑音が除去された周波数サブバンドに適用されうる。

【0046】

次に、マスクされた周波数サブバンドは、周波数合成モジュール３１０により、蝸牛領域から時間領域へと変換して戻される。変換が完了すると、合成された音響信号がユーザへと出力されてもよい。図５に示されたように、乗法性雑音抑制システム３１２ｂは、アレイ処理エンジン５０２、雑音抑制エンジン３０６ｂ及びマスキング・モジュール３０８を有する。

【0047】

図６を参照すると、例である雑音抑制エンジン３０６ｂがより詳細に示されている。例である雑音抑制エンジン３０６ｂは、エネルギー・モジュール４０２、マイクロホン間レベル差（ＩＬＤ）モジュール４０４、適応型分類器４０６、雑音推定モジュール４０８及び適応型高機能抑制（ＡＩＳ）生成器４１０を有する。留意すべき点は、雑音抑制エンジン３０６ｂの種々のモジュールは、雑音抑制エンジン３０６ａのモジュールと同様に機能することである。

【0048】

例である実施形態によると、第１音響信号（ｃ’’（ｋ））及び第２音響信号（ｆ’’（ｋ））は、音響信号の各周波数帯に対するある時間間隔中のエネルギー／パワー推定値（つまり、パワー推定値）を計算するエネルギー・モジュール４０２によって受け取られる。その結果、全周波数帯域に渡る第１スペクトル（つまり、第１サブバンド信号のパワー・スペクトル密度）は、エネルギー・モジュール４０２によって決定されてもよい。この第１スペクトルは、ＡＩＳ生成器４１０及びＩＬＤモジュール４０４に供給されてもよい。同様に、エネルギー・モジュール４０２は、全周波数帯域に渡る第２スペクトル（つまり、第２サブバンド信号のパワー・スペクトル密度）も決定する。第２スペクトルも、ＩＬＤモジュール４０４に供給される。パワー推定値及びパワー・スペクトルの計算に関しての更なる詳細は、継続中の米国特許出願番号１１／３４３５２４及び継続中の米国特許出願番号１１／６９９７３２から分かる。これらの米国特許出願は参照されることにより本願明細書に援用される。

【0049】

前に議論したように、パワー・スペクトルは、第１及び第２マイクロホン１０６及び１０８間のエネルギー差を決定するために、ＩＬＤモジュール４０４によって用いられてもよい。ＩＬＤは、次に、適応型分類器４０６及びＡＩＳ生成器４１０に転送されてもよい。代替の実施形態では、第１及び第２マイクロホン１０６及び１０８間の別の形式のＩＬＤ又はエネルギー差が利用されてもよい。例えば、第１及び第２マイクロホン１０６及び１０８のエネルギー比が用いられてもよい。留意すべき点は、代替の実施形態が適応型分類及び雑音抑制（つまり、ゲインマスク計算）にＩＬＤ以外のものを用いてもよいことである。例えば、雑音下限閾値が使われてもよい。また、ＩＬＤの利用への参照は、別のものにも適用可能であると考えられうる。

【0050】

例である適応型分類器４０６及び雑音推定モジュール４０８は、図４に基づき説明したのと同様な機能を実行する。つまり、適応型分類器は、雑音及び混乱させるものを会話音声と区別し、雑音推定値を引き出す雑音推定モジュール４０８へ、その結果を供給する。

【0051】

ＡＩＳ生成器４１０は、エネルギー・モジュール４０２から第１スペクトルの会話音声エネルギーを受け取る。ＡＩＳ生成器４１０は、雑音推定モジュール４０８から雑音スペクトルも受け取ってよい。これらの入力とＩＬＤモジュール４０４からの任意のＩＬＤに基づき、会話音声スペクトルが推測されてもよい。ある実施形態では、会話音声スペクトルは、第１スペクトルのパワー推定値から雑音スペクトルの雑音推定値を減算することによって推測される。また、ＡＩＳ生成器４１０は、ＮＰゲインを用いる。ＮＰゲインは、第１音響信号に適用するゲインマスクを決定するために、信号が雑音抑制システム３０６ｂ（つまり、乗法性マスク）に届いた時までにどれだけ多くの雑音がすでに除去されたかを示す。ある例では、ＮＰゲインが増加するにつれて、入力の推定ＳＮＲが減少する。例である実施形態では、ＡＩＳ生成器４１０からの時間及び周波数に依存するゲインマスク出力は、音声損失歪みを抑制する一方で、雑音抑制を最大化してもよい。

【0052】

留意すべき点は、この雑音抑制エンジン３０６ｂのシステム・アーキテクチャは例であるということである。別の実施形態は、更なる構成要素、少ない構成要素又は同じ数の構成要素を有してもよい。また、本発明の実施形態の範囲に包含される。

【0053】

図７Ａは例である雑音除去エンジン３０４のブロック図である。例である雑音除去エンジン３０４は、減算処理を用いて雑音を抑制するよう構成されている。雑音除去エンジン３０４は、第１の分岐で、まず、第１信号から所望の成分（例えば、所望の会話音声成分）を減算することによって、雑音が除去された信号を決定し、従って雑音成分を生じてもよい。次に、第２の分岐で、第１信号から雑音成分を除去するために、適応が実行されてもよい。例である実施形態では、雑音除去エンジン３０４は、ゲイン・モジュール７０２、分析モジュール７０４、適応モジュール７０６及び信号減算を実行するよう構成された少なくとも１つの加算モジュール７０８を有する。種々のモジュール７０２−７０８の機能は、図７Ａに関して議論される。また、図７Ｂに関して動作中のところが更に示される。

【0054】

図７Ａを参照すると、例であるゲイン・モジュール７０２は、雑音除去エンジン３０４によって用いられる種々のゲインを決定するよう構成される。本実施形態の目的のために、これらのゲインは、エネルギー比を表す。第１の分岐で、どれだけの量の所望の成分が第１信号から除去されているかを示す基準エネルギー比（ｇ_１）が決められてもよい。第２の分岐で、雑音除去エンジン３０４の出力の際、どれだけの量のエネルギーが第１の分岐の結果から低減されたかを示す予測エネルギー比（ｇ_２）が決められてもよい。更に、エネルギー比（つまり、ＮＰゲイン）は、雑音除去エンジン３０４によって第１信号からどれだけの量の雑音が除去されたかを示すエネルギー比を表すように決められてもよい。前に議論したように、ＮＰゲインは、ゲインマスクを調整するために、クローズ・マイクロホンの実施形態において、ＡＩＳ生成器４１０によって用いられてもよい。

【0055】

例である分析モジュール７０４は、雑音除去エンジン３０４の第１の分岐において分析を実行するよう構成される。一方、例である適用モジュール３０６は、雑音除去エンジン３０４の第２の分岐において適応を実行するよう構成されている。

【0056】

図７ｂを参照すると、雑音除去エンジン３０４の動作を図示した概略図が示される。第１マイクロホン信号のサブバンド信号ｃ（ｋ）及び第２マイクロホン信号のサブバンド信号ｆ（ｋ）は、雑音除去エンジン３０４によって受け取られる。ここで、ｋは、離散時間又はサンプル・インデックスを表す。ｃ（ｋ）は、会話音声信号ｓ（ｋ）及び雑音信号ｎ（ｋ）の重ね合わせを表す。ｆ（ｋ）は、複素数の係数σによりスケーリングされた会話音声信号ｓ（ｋ）及び複素数の係数νによりスケーリングされた雑音信号ｎ（ｋ）の重ね合わせとしてモデル化されている。νは、どれだけの量の第１信号中の雑音が、第２信号の中にあるかを表す。例である実施形態では、雑音の音源は動的でありうるので、νは未知数である。

【0057】

例である実施形態では、σは、会話音声の場所（例えば、音声源の場所）を表す固定係数である。例である実施形態に従って、σは較正を通じて決定されてよい。１カ所以上に基づきキャリブレートすることによって、許容値は、較正に含まれうる。クローズ・マイクロホンでは、σの大きさは１に近い。スプレッド・マイクロホンでは、σの大きさは、話者の口に対して音声装置１０２がどこに置かれるかに依存する。σの大きさ及び位相は、それぞれのサブバンド（例えば、蝸牛タップ）によって表される周波数での話者の口の位置に対するチャネル間クロス・スペクトルを表す。雑音除去エンジン３０４は、σが何であるかを知っているので、分析モジュール７０４は、会話音声成分σｓ（ｋ）（つまり、所望の成分）を第２信号から除去するために、σを第１信号（つまり、σ（ｓ（ｋ）＋ν（ｋ）））に適用し、第２信号（つまり、σｓ（ｋ）＋ν（ｋ））からその結果を減算する。その結果、加算モジュール７０８から雑音成分が出る。会話音声がない実施形態では、αは、およそ１／（ν−σ）であり、適用モジュール７０６は自由に適応してもよい。

【0058】

話者の口の位置がσによって適切に表されているならば、ｆ（ｋ）−σｃ（ｋ）＝（ν―σ）ｎ（ｋ）である。この方程式は、適用モジュール７０６（適用モジュール７０６は、順々に、適用係数α（ｋ）を適用する）に与えられる加算モジュール７０８の出力信号が、σ（例えば、所望の会話音声信号）によって表される位置から生じる信号を欠いているということを示している。例である実施形態では、分析モジュール７０４は、σを第２信号ｆ（ｋ）に適用し、ｃ（ｋ）からその結果を減算する。加算モジュール７０８からの残りの信号（本願明細書では「雑音成分信号」として参照されている）は、第２の分岐において除去されてもよい。

【0059】

第１信号が会話場所（σで表される）でない音源１０２によって占められているとき、適応モジュール７０６は、適応してもよい。第１信号がσで表される会話場所から生ずる信号によって占められているとき、適応は、機能停止されてもよい。例である実施形態では、信号ｃ（ｋ）から雑音成分ｎ（ｋ）を除去するために、適用モジュール７０６は、一般的な最小二乗法の１つを用いて適応してもよい。ある実施形態によると、係数は、あるフレーム・レートにおいて更新されてもよい。

【0060】

ｎ（ｋ）が白色雑音であり、ｓ（ｋ）とｎ（ｋ）の相互相関が、あるフレーム内でゼロである実施形態では、適応は、完全に除去されている雑音ｎ（ｋ）及び完全に影響を受けていない会話音声ｓ（ｋ）を有する全てのフレームで生じてもよい。しかしながら、特にフレーム・サイズが短い場合は、実際にはこれらの条件が満たされることは生じ難い。このように、望ましくは、適応において制約が適用される。例である実施形態では、適用係数α（ｋ）は、基準エネルギー比ｇ_１及び予測エネルギー比ｇ_２が以下の条件を満たすとき、タップ毎／フレーム毎に基づき更新されてもよい。

【0061】

【数3】

ここで、γ＞０である。
例えば、

【0062】

【数4】

であり、ｓ（ｋ）及びｎ（ｋ）が無相関であると仮定すると、以下の式が得られる。

【0063】

【数5】

及び

【0064】

【数6】

ここで、Ｅ｛．．．｝は期待値、Ｓは信号エネルギー、そして、Ｎは雑音エネルギーである。

【0065】

前の３つの方程式から、以下の式が得られる。

【0066】

【数7】

ここで、ＳＮＲ＝Ｓ／Ｎである。雑音が、ターゲットの会話音声と同じ場所である（つまり、σ＝ν）とき、この条件は満たされない。よって、ＳＮＲに拘わらず、適応は起こりえない。雑音源がターゲットの場所から遠ければ遠いほど、より大きな｜ν−σ｜^４及びより大きなＳＮＲが許容され、依然として、雑音を除去することを試みる適応がなされる。例である実施形態では、第１の分岐とは対照的に第２の分岐でより多くの信号が除去されるフレームで、適応が起こってもよい。従って、ゲイン・モジュール７０２によって第１の分岐の後、エネルギーは計算され、ｇ_１が決められてもよい。αの適応を許すかどうかを示すｇ_２を決定するために、エネルギー計算も実行されてもよい。γ^２｜ν−σ｜^４＞ＳＮＲ^２＋ＳＮＲ^４が真ならば、αの適応が実行されてもよい。しかしながら、この方程式が真でなければ、αは適応されない。

【0067】

係数γは、αの適応と非適応の境界を定義するために選ばれてもよい。マイクロホン１０６及び１０８の間の直線に対して９０度の角度で遠距離場にある実施形態では、この実施形態では、信号は、マイクロホン１０６及び１０８の間で同じパワーとゼロの位相シフトを有してもよい（例えば、ν＝１）。ＳＮＲ＝１ならば、γ^２｜ν−σ｜^４＝２であり、これは次式と等価である。

【0068】

【数8】

この値に対してγを低くすることにより、雑音漏れの増加を代償として、除去からの近端音源の保護が改善されうる。留意すべき点は、マイクロホン１０６及び１０８において、ν＝１は９０度の角度の遠距離場状況の十分に良い近似ではなく、較正測定から得られる値に置き換えられなければならないかもしれないということである。

【0069】

図８は、音声装置の雑音抑制の例である方法のフローチャート８００である。段階８０２で、音声信号は音声装置１０２により受信される。例である実施形態では、複数のマイクロホン（例えば、第１及び第２マイクロホン１０６及び１０８）が、音声信号を受信する。この複数のマイクロホンは、クローズ・マイクロホン・アレイ又はスプレッド・マイクロホン・アレイを有する。

【0070】

段階８０４で、第１及び第２音響信号の周波数分析が実行されてもよい。ある実施形態では、周波数分析モジュール３０２は、第１及び第２音響信号の周波数サブバンドを決定するために、フィルタ・バンクを利用する。

【0071】

段階８０６で、雑音除去処理が実行される。段階８０６は、図９に関して、更に詳細に議論される。

【0072】

次に段階８０８で、雑音抑制処理が実行されてもよい。ある実施形態では、雑音抑制処理は、最初に、第１信号又は雑音が除去された信号、並びに第２信号のエネルギー・スペクトルを計算する。次に、２つの信号間のエネルギー差が決定されてもよい。続いて、会話音声及び雑音成分が、ある実施形態に従って適応して分類されてもよい。次に、雑音スペクトルが決定されてもよい。ある実施形態では、雑音推定値は、雑音成分に基づいてもよい。雑音推定値に基づき、ゲインマスクが、適応して決定されてもよい。

【0073】

次に段階８１０で、ゲインマスクが適用されてもよい。ある実施形態では、ゲインマスクは、サブバンド信号毎にマスキング・モジュール３０８によって適用されてもよい。幾つかの実施形態では、ゲインマスクは、雑音が除去された信号に適用されてもよい。次に段階８１２で、サブバンド信号は、出力を生成するために合成されてもよい。ある実施形態では、サブバンド信号は、周波数領域から時間領域へ変換して戻されてもよい。変換されると、段階８１４で、音声信号はユーザへと出力されてもよい。出力は、スピーカ、イヤホン又は他の類似の装置を介してもよい。

【0074】

図９を参照すると、雑音除去処理（段階８０６）を実行する例である方法のフローチャートが示される。段階９０２で、周波数が分析された信号（例えば、周波数サブバンド信号又は第１信号）が雑音除去エンジン３０４によって受け取られる。第１音響信号は、ｃ（ｋ）＝ｓ（ｋ）＋ｎ（ｋ）として表されてもよい。ここで、ｓ（ｋ）は、所望の信号（例えば、会話音声信号）を表し、ｎ（ｋ）は、雑音信号を表す。第２の周波数を分析された信号（例えば、第２信号）は、ｆ（ｋ）＝σｓ（ｋ）＋νｎ（ｋ）で表される。

【0075】

段階９０４で、σは、分析モジュール７０４によって第１信号に適用されてもよい。次に段階９０６で、第１信号へのσの適用結果は、加算モジュール７０８によって第２信号から減算されてもよい。この結果は、雑音成分信号を有する。

【0076】

段階９０８で、ゲイン・モジュール７０２によって、ゲインが計算されてもよい。これらのゲインは、種々の信号のエネルギー比を表す。第１の分岐で、どれだけの量の所望の成分が第１信号から除去されているかを示す基準エネルギー比（ｇ_１）が決められてもよい。第２の分岐で、雑音除去エンジン３０４の出力の際、どれだけの量のエネルギーが第１の分岐の結果から低減されたかを示す予測エネルギー比（ｇ_２）が決められてもよい。

【0077】

段階９１０で、αが適用されるべきかどうかの決定がなされる。ある実施形態に基づき、γ^２｜ν−σ｜^４＞ＳＮＲ^２＋ＳＮＲ^４が真ならば、段階９１２で、αの適応が実行されてもよい。しかしながら、この方程式が真でなければ、αは適応されず、段階９１４で機能停止される。

【0078】

段階９１６で、適応されるか否かに拘わらず、雑音成分信号は加算モジュール７０８によって第１信号から除去される。その結果は、雑音が除去された信号である。幾つかの実施形態では、雑音が除去された信号は、乗法性雑音抑制処理による更なる雑音抑制処理のために、雑音抑制エンジン３０６に供給される。別の実施形態では、雑音が除去された信号は、更なる雑音抑制処理なしに、ユーザへ出力されてもよい。留意すべき点は、１つより多い加算モジュール７０８が提供されてもよいことである（例えば、雑音除去エンジン３０４の各分岐に対して１つ）。

【0079】

段階９１８で、ＮＰゲインが計算されてもよい。ＮＰゲインは、雑音が除去された信号からどれだけ多くの第１信号が除去されたかを示すエネルギー比を有する。留意すべき点は、段階９１８は、任意（例えば、クローズ・マイクロホン・システムの場合）であることである。

【0080】

上述のモジュールは、機械可読媒体（例えば、コンピュータ可読媒体）のような記憶媒体に格納された命令を有してもよい。それらの命令は、プロセッサ２０２によって読み出され、実行されてもよい。命令の幾つかの例は、ソフトウェア、プログラム・コード及びファームウェアを含む。記憶媒体の幾つかの例は、メモリ装置及び集積回路を有する。命令は、プロセッサ２０２によって実行されるとき、プロセッサ２０２に本発明の実施形態に従って動作するよう指示するように動作可能である。当業者は、命令、プロセッサ及び記憶媒体に精通している。

【0081】

本発明は、例である実施形態を参照し上述された。本発明の広範な範囲から逸脱することなく、種々の変形がなされうること及び別の実施形態が使われうることは、当業者には明らかである。例えば、本願明細書で議論されたマイクロホン・アレイは、第１及び第２マイクロホン１０６及び１０８を有する。しかし、別の実施形態は、マイクロホン・アレイの中に更に多くのマイクロホンを利用することを意図してもよい。従って、例である実施形態についてのこれら及び他の変更は、本発明に含まれていると意図される。

【0082】

［関連出願の相互参照］
本出願は、２００７年７月６日出願の米国特許出願番号１１／８２５５６３、発明の名称「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＡｄａｐｔｉｖｅＩｎｔｅｌｌｉｇｅｎｔＮｏｉｓｅＳｕｐｐｒｅｓｓｉｏｎ」、２００８年３月３１日出願の米国特許出願番号１２／０８０１１５、発明の名称「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＰｒｏｖｉｄｉｎｇＣｌｏｓｅ−ＭｉｃｒｏｐｈｏｎｅＡｒｒａｙＮｏｉｓｅＲｅｄｕｃｔｉｏｎ」に関連する。両出願は参照されることにより本願明細書に援用される。

【0083】

本出願は、２００６年１月３０日出願の米国特許出願番号１１／３４３５２４、発明の名称「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＵｔｉｌｉｚｉｎｇＩｎｔｅｒ−ＭｉｃｒｏｐｈｏｎｅＬｅｖｅｌＤｉｆｆｅｒｅｎｃｅｓｆｏｒＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔ」、２００７年１月２９日出願の米国特許出願番号１１／６９９７３２、発明の名称「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＵｔｉｌｉｚｉｎｇＯｍｎｉ−ＤｉｒｅｃｔｉｏｎａｌＭｉｃｒｏｐｈｏｎｅｓｆｏｒＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔ」に関連する。両出願は参照されることにより本願明細書に援用される。

【図1】