(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-09-10
(45)【発行日】2025-09-19
(54)【発明の名称】ハウリング抑圧装置、ハウリング抑圧方法及びハウリング抑圧プログラム
(51)【国際特許分類】
H04R 3/02 20060101AFI20250911BHJP
【FI】
H04R3/02
(21)【出願番号】P 2023531467
(86)(22)【出願日】2022-04-22
(86)【国際出願番号】 JP2022018597
(87)【国際公開番号】W WO2023276424
(87)【国際公開日】2023-01-05
【審査請求日】2025-01-30
(31)【優先権主張番号】P 2021108505
(32)【優先日】2021-06-30
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】514136668
【氏名又は名称】パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ
【氏名又は名称原語表記】Panasonic Intellectual Property Corporation of America
(74)【代理人】
【識別番号】100115381
【氏名又は名称】小谷 昌崇
(74)【代理人】
【識別番号】100118049
【氏名又は名称】西谷 浩治
(72)【発明者】
【氏名】古川 博基
(72)【発明者】
【氏名】杠 慎一
【審査官】山本 章裕
(56)【参考文献】
【文献】特開2006-217542(JP,A)
【文献】特開2006-217257(JP,A)
【文献】特開昭63-234635(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/02
(57)【特許請求の範囲】
【請求項1】
マイクロホンによって収音された音声が、前記マイクロホンと同一空間内に設置されたスピーカにより拡声される際に、前記スピーカから前記マイクロホンへの音響フィードバックにより発生するハウリングを抑圧するハウリング抑圧装置であって、
前記スピーカへ出力される出力信号を参照信号として、前記スピーカから前記マイクロホンに入力される音響フィードバック音の特性を表す音響フィードバック特性を推定し、推定した前記音響フィードバック特性を用いて、前記マイクロホンから得られる入力信号から前記音響フィードバック音を消去する適応フィルタ部と、
推定された前記音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定する推定部と、
推定された前記音響フィードバック振幅周波数特性から、前記音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出する抑圧ゲイン算出部と、
算出された前記抑圧ゲインを用いて、前記適応フィルタ部からの出力信号を周波数領域で抑圧する抑圧部と、
を備えるハウリング抑圧装置。
【請求項2】
前記適応フィルタ部は、前記音響フィードバック特性を複数の分割ブロック毎に推定する周波数領域適応フィルタを含む、
請求項1記載のハウリング抑圧装置。
【請求項3】
前記複数の分割ブロックそれぞれの係数更新アルゴリズムは、正規化LMS(Le
ast Mean Square)である、
請求項2記載のハウリング抑圧装置。
【請求項4】
前記複数の分割ブロックそれぞれの係数更新アルゴリズムは、独立成分分析である、
請求項2記載のハウリング抑圧装置。
【請求項5】
前記複数の分割ブロックそれぞれの係数更新アルゴリズムの係数更新ゲインは、遅延が長くなるほど減少する、
請求項3又は4記載のハウリング抑圧装置。
【請求項6】
前記音響フィードバック特性は、前記周波数領域適応フィルタのフィルタ係数であり、
前記推定部は、前記複数の分割ブロック毎に推定された複数のフィルタ係数の合算値を算出し、算出した前記合算値を前記音響フィードバック振幅周波数特性として推定する、
請求項2~4のいずれか1項に記載のハウリング抑圧装置。
【請求項7】
前記抑圧ゲイン算出部は、前記推定部によって推定された前記音響フィードバック振幅周波数特性の平均値を各音響フィードバック振幅周波数特性で除算することで前記抑圧ゲインを算出する、
請求項6記載のハウリング抑圧装置。
【請求項8】
前記抑圧ゲイン算出部は、前記抑圧ゲインの最大値を制限する、
請求項7記載のハウリング抑圧装置。
【請求項9】
前記抑圧ゲイン算出部は、前記抑圧ゲインの最小値を制限する、
請求項7記載のハウリング抑圧装置。
【請求項10】
前記推定部は、前記適応フィルタ部によって推定された時間領域の前記音響フィードバック特性を周波数領域の前記音響フィードバック特性に変換し、周波数領域の前記音響フィードバック振幅周波数特性を推定する、
請求項1記載のハウリング抑圧装置。
【請求項11】
マイクロホンによって収音された音声が、前記マイクロホンと同一空間内に設置されたスピーカにより拡声される際に、前記スピーカから前記マイクロホンへの音響フィードバックにより発生するハウリングを抑圧するハウリング抑圧装置におけるハウリング抑圧方法であって、
適応フィルタ部が、前記スピーカへ出力される出力信号を参照信号として、前記スピーカから前記マイクロホンに入力される音響フィードバック音の特性を表す音響フィードバック特性を推定し、推定された前記音響フィードバック特性を用いて、前記マイクロホンから得られる入力信号から前記音響フィードバック音を消去し、
推定部が、推定された前記音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定し、
抑圧ゲイン算出部が、推定された前記音響フィードバック振幅周波数特性から、前記音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出し、
抑圧部が、算出した前記抑圧ゲインを用いて、前記適応フィルタ部からの出力信号を周波数領域で抑圧する、
ハウリング抑圧方法。
【請求項12】
マイクロホンによって収音された音声が、前記マイクロホンと同一空間内に設置されたスピーカにより拡声される際に、前記スピーカから前記マイクロホンへの音響フィードバックにより発生するハウリングを抑圧するためのハウリング抑圧プログラムであって、
前記スピーカへ出力される出力信号を参照信号として、前記スピーカから前記マイクロホンに入力される音響フィードバック音の特性を表す音響フィードバック特性を推定し、推定した前記音響フィードバック特性を用いて、前記マイクロホンから得られる入力信号から前記音響フィードバック音を消去する適応フィルタ部と、
推定された前記音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定する推定部と、
推定された前記音響フィードバック振幅周波数特性から、前記音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出する抑圧ゲイン算出部と、
算出された前記抑圧ゲインを用いて、前記適応フィルタ部からの出力信号を周波数領域で抑圧する抑圧部としてコンピュータを機能させる、
ハウリング抑圧プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、スピーカからマイクロホンへの音響フィードバックにより発生するハウリングを抑圧する技術に関するものである。
【背景技術】
【0002】
特許文献1は、スピーカに出力する音声信号を遅延手段および適応フィルタで処理した信号である模擬信号をマイクロホンから入力された音声信号から減算する適応ハウリングキャンセラと、適応ハウリングキャンセラの出力信号の特定周波数成分のレベルを低下させる減衰処理を行うノッチフィルタと、入力信号または適応ハウリングキャンセラが減算した後の誤差信号の周波数特性を検出し、この周波数特性に基づいてハウリングの発生およびその周波数を検出したとき、当該周波数を特定周波数成分としてノッチフィルタに設定して、減衰処理を行わせる制御部とを備えるハウリング抑制装置を開示している。
【0003】
しかしながら、上記従来の技術では、安定してハウリングを抑圧することが困難であり、更なる改善が必要とされていた。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示は、上記の問題を解決するためになされたもので、安定してハウリングを抑圧することができる技術を提供することを目的とするものである。
【課題を解決するための手段】
【0006】
本開示に係るハウリング抑圧装置は、マイクロホンによって収音された音声が、前記マイクロホンと同一空間内に設置されたスピーカにより拡声される際に、前記スピーカから前記マイクロホンへの音響フィードバックにより発生するハウリングを抑圧するハウリング抑圧装置であって、前記スピーカへ出力される出力信号を参照信号として、前記スピーカから前記マイクロホンに入力される音響フィードバック音の特性を表す音響フィードバック特性を推定し、推定した前記音響フィードバック特性を用いて、前記マイクロホンから得られる入力信号から前記音響フィードバック音を消去する適応フィルタ部と、推定された前記音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定する推定部と、推定された前記音響フィードバック振幅周波数特性から、前記音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出する抑圧ゲイン算出部と、算出された前記抑圧ゲインを用いて、前記適応フィルタ部からの出力信号を周波数領域で抑圧する抑圧部と、を備える。
【発明の効果】
【0007】
本開示によれば、安定してハウリングを抑圧することができる。
【図面の簡単な説明】
【0008】
【
図1】本開示の実施の形態における拡声システムの構成を示す図である。
【
図2】本実施の形態におけるハウリング抑圧装置の構成を示すブロック図である。
【
図3】
図2に示す適応フィルタ部の詳細な構成を示すブロック図である。
【
図4】MDF適応フィルタの複数の分割ブロックそれぞれにおいて推定されるフィルタ係数と、測定された音響フィードバック特性との一例を示す図である。
【
図5】推定部によって推定された音響フィードバック振幅周波数特性と、測定された音響フィードバック振幅周波数特性との一例を示す図である。
【
図6】
図2に示す抑圧ゲイン算出部の詳細な構成を示すブロック図である。
【
図7】スムージング処理部によって算出されたスムージング値smthΣW’と、平均値算出部によって算出された平均値AVEとの一例を示す図である。
【
図8】ゲイン算出部によって算出される抑圧ゲインGの一例を示す図である。
【
図9】
図2に示す抑圧部の詳細な構成を示すブロック図である。
【
図10】音響フィードバック特性(時間インパルス応答)の一例を示す図である。
【
図11】本開示の実施の形態におけるハウリング抑圧装置の動作を説明するためのフローチャートである。
【発明を実施するための形態】
【0009】
(本開示の基礎となった知見)
上述した特許文献1では、適応フィルタとノッチフィルタとを組み合わせたハウリング抑制装置が開示されている。しかしながら、特許文献1においては、制御部でハウリングの発生およびその周波数を検出する処理が必要となっている。スピーカから拡声された音がマイクロホンに回り込む音響フィードバックを含むループのゲインが1より大きくなった場合、ハウリングは発生する。ハウリングは、単一周波数で発生する場合もあるが、複数の周波数で同時に発生する場合もある。複数の周波数で同時にハウリングが発生した場合、音声とハウリングとを区別して、ハウリングのみを正確に検出することは困難である。
【0010】
特に、特許文献1では適応フィルタを用いているため、フィルタ係数の更新が正しく行われなかった場合、複数の周波数で同時にループゲインが1を超えるおそれがある。ハウリング抑制装置では、話者の音声がマイクロホンに入力されると同時にスピーカからの音響フィードバック音もマイクロホンに入力される。消去対象である音響フィードバック音と、音響フィードバック音と関係のない話者音声とが同時にマイクロホンに入力する場合、適応フィルタにおいて、フィルタ係数の更新が正しく行われないことがあり、複数の周波数で同時にハウリングが発生することがある。そのため、特許文献1では、適切にハウリングの発生とその周波数とを検出することが難しく、ノッチフィルタを正しく制御して、安定してハウリングを抑制することが困難であるという課題があった。
【0011】
以上の課題を解決するために、本開示の一態様に係るハウリング抑圧装置は、マイクロホンによって収音された音声が、前記マイクロホンと同一空間内に設置されたスピーカにより拡声される際に、前記スピーカから前記マイクロホンへの音響フィードバックにより発生するハウリングを抑圧するハウリング抑圧装置であって、前記スピーカへ出力される出力信号を参照信号として、前記スピーカから前記マイクロホンに入力される音響フィードバック音の特性を表す音響フィードバック特性を推定し、推定した前記音響フィードバック特性を用いて、前記マイクロホンから得られる入力信号から前記音響フィードバック音を消去する適応フィルタ部と、推定された前記音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定する推定部と、推定された前記音響フィードバック振幅周波数特性から、前記音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出する抑圧ゲイン算出部と、算出された前記抑圧ゲインを用いて、前記適応フィルタ部からの出力信号を周波数領域で抑圧する抑圧部と、を備える。
【0012】
この構成によれば、適応フィルタ部によってスピーカからマイクロホンに入力される音響フィードバック音が消去され、抑圧部によって音響フィードバック振幅周波数特性の周波数ピーク成分が抑圧されるので、安定してハウリングを抑圧することができる。
【0013】
また、上記のハウリング抑圧装置において、前記適応フィルタ部は、前記音響フィードバック特性を複数の分割ブロック毎に推定する周波数領域適応フィルタを含んでもよい。
【0014】
この構成によれば、音響フィードバック特性を複数の分割ブロック毎に推定する周波数領域適応フィルタにより、低遅延化を実現することができるとともに、演算量を削減することができる。
【0015】
また、上記のハウリング抑圧装置において、前記複数の分割ブロックそれぞれの係数更新アルゴリズムは、正規化LMS(Least Mean Square)であってもよい。
【0016】
この構成によれば、複数の分割ブロックそれぞれの係数更新アルゴリズムとして正規化LMSを用いて、スピーカからマイクロホンに入力される音響フィードバック音を消去することができる。
【0017】
また、上記のハウリング抑圧装置において、前記複数の分割ブロックそれぞれの係数更新アルゴリズムは、独立成分分析であってもよい。
【0018】
この構成によれば、複数の分割ブロックそれぞれの係数更新アルゴリズムとして独立成分分析を用いて、スピーカからマイクロホンに入力される音響フィードバック音を消去することができる。
【0019】
また、上記のハウリング抑圧装置において、前記複数の分割ブロックそれぞれの係数更新アルゴリズムの係数更新ゲインは、遅延が長くなるほど減少してもよい。
【0020】
この構成によれば、複数の分割ブロックそれぞれの係数更新アルゴリズムの係数更新ゲインは、遅延が長くなるほど減少するので、適応フィルタの収束速度を改善できる。
【0021】
また、上記のハウリング抑圧装置において、前記音響フィードバック特性は、前記周波数領域適応フィルタのフィルタ係数であり、前記推定部は、前記複数の分割ブロック毎に推定された複数のフィルタ係数の合算値を算出し、算出した前記合算値を前記音響フィードバック振幅周波数特性として推定してもよい。
【0022】
この構成によれば、複数の分割ブロック毎に推定された複数のフィルタ係数の合算値を音響フィードバック振幅周波数特性として推定することができる。
【0023】
また、上記のハウリング抑圧装置において、前記抑圧ゲイン算出部は、前記推定部によって推定された前記音響フィードバック振幅周波数特性の平均値を各音響フィードバック振幅周波数特性で除算することで前記抑圧ゲインを算出してもよい。
【0024】
この構成によれば、推定された音響フィードバック振幅周波数特性の平均値を各音響フィードバック振幅周波数特性で除算することで周波数領域の抑圧ゲインを算出することができる。
【0025】
また、上記のハウリング抑圧装置において、前記抑圧ゲイン算出部は、前記抑圧ゲインの最大値を制限してもよい。
【0026】
この構成によれば、抑圧ゲインの最大値が制限されるので、ハウリングが発生する音響フィードバック振幅周波数特性の周波数ピーク成分を抑圧することができる。
【0027】
また、上記のハウリング抑圧装置において、前記抑圧ゲイン算出部は、前記抑圧ゲインの最小値を制限してもよい。
【0028】
この構成によれば、抑圧ゲインの最小値が制限されるので、適応フィルタ部からの出力信号に含まれる話者の音声を抑圧することができ、音質が劣化するのを防止することができる。
【0029】
また、上記のハウリング抑圧装置において、前記推定部は、前記適応フィルタ部によって推定された時間領域の前記音響フィードバック特性を周波数領域の前記音響フィードバック特性に変換し、周波数領域の前記音響フィードバック振幅周波数特性を推定してもよい。
【0030】
この構成によれば、時間領域の音響フィードバック特性を推定する適応フィルタにより、マイクロホンから得られる入力信号から音響フィードバック音を消去することができる。
【0031】
また、本開示は、以上のような特徴的な構成を備えるハウリング抑圧装置として実現することができるだけでなく、ハウリング抑圧装置が備える特徴的な構成に対応する特徴的な処理を実行するハウリング抑圧方法などとして実現することもできる。また、このようなハウリング抑圧方法に含まれる特徴的な処理をコンピュータに実行させるコンピュータプログラムとして実現することもできる。したがって、以下の他の態様でも、上記のハウリング抑圧装置と同様の効果を奏することができる。
【0032】
本開示の他の態様に係るハウリング抑圧方法は、マイクロホンによって収音された音声が、前記マイクロホンと同一空間内に設置されたスピーカにより拡声される際に、前記スピーカから前記マイクロホンへの音響フィードバックにより発生するハウリングを抑圧するハウリング抑圧装置におけるハウリング抑圧方法であって、適応フィルタ部が、前記スピーカへ出力される出力信号を参照信号として、前記スピーカから前記マイクロホンに入力される音響フィードバック音の特性を表す音響フィードバック特性を推定し、推定された前記音響フィードバック特性を用いて、前記マイクロホンから得られる入力信号から前記音響フィードバック音を消去し、推定部が、推定された前記音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定し、抑圧ゲイン算出部が、推定された前記音響フィードバック振幅周波数特性から、前記音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出し、抑圧部が、算出した前記抑圧ゲインを用いて、前記適応フィルタ部からの出力信号を周波数領域で抑圧する。
【0033】
本開示の他の態様に係るハウリング抑圧プログラムは、マイクロホンによって収音された音声が、前記マイクロホンと同一空間内に設置されたスピーカにより拡声される際に、前記スピーカから前記マイクロホンへの音響フィードバックにより発生するハウリングを抑圧するためのハウリング抑圧プログラムであって、前記スピーカへ出力される出力信号を参照信号として、前記スピーカから前記マイクロホンに入力される音響フィードバック音の特性を表す音響フィードバック特性を推定し、推定した前記音響フィードバック特性を用いて、前記マイクロホンから得られる入力信号から前記音響フィードバック音を消去する適応フィルタ部と、推定された前記音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定する推定部と、推定された前記音響フィードバック振幅周波数特性から、前記音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出する抑圧ゲイン算出部と、算出された前記抑圧ゲインを用いて、前記適応フィルタ部からの出力信号を周波数領域で抑圧する抑圧部としてコンピュータを機能させる。
【0034】
以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下の実施の形態は、本開示を具体化した一例であって、本開示の技術的範囲を限定するものではない。
【0035】
(実施の形態)
図1は、本開示の実施の形態における拡声システムの構成を示す図である。
図1に示す拡声システムは、車両10内に搭載される。
【0036】
拡声システムは、マイクロホン1、アンプ2、スピーカ3及びハウリング抑圧装置100を備える。拡声システムは、第1列目シートにいるドライバー4の音声を第3列目シートにいる搭乗者5に伝えるために拡声を行う。
【0037】
マイクロホン1は、話者音声を収音する。マイクロホン1は、ドライバー4がいる第1列目シートの近傍に設置され、ドライバー4の発話する音声を収音する。
【0038】
スピーカ3は、マイクロホン1と同一空間内の第3列目シートの近傍に設置され、マイクロホン1によって収音されたドライバー4の音声を拡声する。第3列目シートにいる搭乗者5は、スピーカ3によって拡声されたドライバー4の音声を聞く。
【0039】
ハウリング抑圧装置100は、スピーカ3からマイクロホン1への音響フィードバックにより発生するハウリングを抑圧する。
【0040】
アンプ2は、ハウリング抑圧装置100の出力を増幅する。
【0041】
第1列目シートにいるドライバー4の音声は、マイクロホン1によって収音され、ハウリング抑圧装置100を通り、アンプ2で増幅され、第3列目シート付近のスピーカ3で拡声され、第3列目シートにいる搭乗者5に伝わる。
【0042】
なお、本実施の形態における拡声システムは、第1列目シートの近傍に設置されたマイクロホン1と、第3列目シートの近傍に設置されたスピーカ3とを備えているが、本開示は特にこれに限定されない。拡声システムは、第3列目シートの近傍に設置され、搭乗者5の発話する音声を収音する第2マイクロホンと、第1列目シートの近傍に設置され、第2マイクロホンによって収音された音声を拡声する第2スピーカとをさらに備えてもよい。この場合、拡声システムは、第2スピーカから第2マイクロホンへの音響フィードバックにより発生するハウリングを抑圧する第2ハウリング抑圧装置と、第2ハウリング抑圧装置の出力を増幅する第2アンプとをさらに備えてもよい。第2マイクロホン、第2スピーカ、第2ハウリング抑圧装置及び第2アンプの構成は、マイクロホン1、スピーカ3、ハウリング抑圧装置100及びアンプ2の構成と同じである。
【0043】
また、本実施の形態において、マイクロホン1及びスピーカ3は、車両10内に設置されているが、本開示は特にこれに限定されず、室内に設置されてもよい。
【0044】
図2は、本実施の形態におけるハウリング抑圧装置100の構成を示すブロック図である。
【0045】
ハウリング抑圧装置100は、適応フィルタ部101、推定部102、抑圧ゲイン算出部103及び抑圧部104を備える。
【0046】
適応フィルタ部101は、スピーカ3へ出力される出力信号を参照信号として、スピーカ3からマイクロホン1に入力される音響フィードバック音の特性を表す音響フィードバック特性を推定する。適応フィルタ部101は、推定した音響フィードバック特性を用いて、マイクロホン1から得られる入力信号から音響フィードバック音を消去する。適応フィルタ部101は、スピーカ3からマイクロホン1に至る音響経路における特性を係数更新アルゴリズム(適応アルゴリズム)により推定し、マイクロホン1からの入力信号に含まれるスピーカ3からマイクロホン1に回り込む音を消去する。
【0047】
推定部102は、適応フィルタ部101によって推定された音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定する。
【0048】
抑圧ゲイン算出部103は、推定部102によって推定された音響フィードバック振幅周波数特性から、音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出する。抑圧ゲイン算出部103は、推定部102によって推定された音響フィードバック振幅周波数特性から、スピーカ3からマイクロホン1に回り込む音響フィードバック振幅周波数特性のピークを抑圧するための抑圧ゲインを算出する。
【0049】
抑圧ゲイン算出部103は、推定部102によって推定された音響フィードバック振幅周波数特性の平均値を各音響フィードバック振幅周波数特性で除算することで抑圧ゲインを算出する。抑圧ゲイン算出部103は、抑圧ゲインの最大値を制限するとともに、抑圧ゲインの最小値を制限する。なお、抑圧ゲイン算出部103の詳細な構成については後述する。
【0050】
抑圧部104は、抑圧ゲイン算出部103によって算出された抑圧ゲインを用いて、適応フィルタ部101からの出力信号を周波数領域で抑圧する。抑圧部104は、適応フィルタ部101からの出力信号に抑圧ゲインを乗じる。なお、抑圧部104の詳細な構成については後述する。
【0051】
図3は、
図2に示す適応フィルタ部101の詳細な構成を示すブロック図である。
【0052】
適応フィルタ部101は、MDF(Multidelay Block Frequency Domain)適応フィルタである。MDF適応フィルタについては、文献「Multidelay Block Frequency Domain Adaptive Filter」(JIA-SIEN SOO及びKHEE K.PANG著、IEEE Transactions on Acoustics、Speech、and Signal Processing、1990年2月、vol.38、no.2、pp.373-376)に開示されている。そのため、MDF適応フィルタについての詳細な説明は割愛する。
【0053】
適応フィルタ部101は、シリアル/パラレル(S/P)変換部411,412、パラレル/シリアル(P/S)変換部413、高速フーリエ変換(FFT)部421,423、逆高速フーリエ変換(IFFT)部422、第1~第N周波数領域適応フィルタ431~43N、総和算出部44及び誤差算出部45を備える。
【0054】
シリアル/パラレル変換部411,412は、シリアルデータをパラレルデータに変換する。シリアル/パラレル変換部411は、抑圧部104からスピーカ3へ出力されるシリアルの出力信号をパラレルの出力信号に変換する。シリアル/パラレル変換部412は、マイクロホン1から得られるシリアルの入力信号をパラレルの入力信号に変換する。
【0055】
パラレル/シリアル変換部413は、パラレルデータをシリアルデータに変換する。パラレル/シリアル変換部413は、適応フィルタ部101から抑圧部104へ出力するパラレルの出力信号をシリアルの出力信号に変換する。
【0056】
高速フーリエ変換部421,423は、離散フーリエ変換を高速に行う。高速フーリエ変換部421は、シリアル/パラレル変換部411から第1~第N周波数領域適応フィルタ431~43Nに入力される時間領域の出力信号を周波数領域の出力信号に変換する。高速フーリエ変換部423は、誤差算出部45から出力された時間領域の誤差信号を周波数領域の誤差信号に変換する。
【0057】
逆高速フーリエ変換部422は、逆離散フーリエ変換を高速に行う。逆高速フーリエ変換部422は、総和算出部44から誤差算出部45に出力される、スピーカ3からマイクロホン1へフィードバックする音声信号を模した周波数領域の擬似信号を時間領域の擬似信号に変換する。
【0058】
第1~第N周波数領域適応フィルタ431~43Nは、FFT421によって周波数領域に変換された信号を順次ブロック単位で遅延させて得られる複数のブロックの参照信号から、マイクロホン1によって取得された入力信号に含まれる音響フィードバック音の成分を示す擬似信号を生成する。参照信号は、例えば、スピーカ3へ出力される出力信号である。第1~第N周波数領域適応フィルタ431~43Nは、音響フィードバック特性を複数の分割ブロック毎に推定する。音響フィードバック特性は、フィルタ係数である。第1~第N周波数領域適応フィルタ431~43Nは、複数の分割ブロック毎に生成したフィルタ係数と、複数の分割ブロック毎に遅延された参照信号とを周波数領域で畳み込むことにより、入力信号に含まれる音響フィードバック音の成分を示す擬似信号を生成する。
【0059】
総和算出部44は、第1~第N周波数領域適応フィルタ431~43Nによって生成された分割ブロック毎の擬似信号の総和を算出する。
【0060】
誤差算出部45は、マイクロホン1から得られる入力信号と、総和算出部44からの擬似信号との誤差信号を算出し、算出した誤差信号を第1~第N周波数領域適応フィルタ431~43Nへ出力する。第1~第N周波数領域適応フィルタ431~43Nは、入力された誤差信号に基づいてフィルタ係数を更新し、更新したフィルタ係数と参照信号とを畳み込むことにより擬似信号を生成する。第1~第N周波数領域適応フィルタ431~43Nは、係数更新アルゴリズム(適応アルゴリズム)を用いて、誤差信号が最小となるようにフィルタ係数を更新する。係数更新アルゴリズムとしては、例えば、正規化LMS(Least Mean Square)が用いられる。
【0061】
また、誤差算出部45は、マイクロホン1からの入力信号から、総和算出部44からの擬似信号を減算することにより、入力信号から音響フィードバック音を消去する。そのため、誤差算出部45は、音響フィードバック音を消去した入力信号を抑圧部104へ出力する。
【0062】
一般的に、スピーカからマイクロホンに至る音響フィードバック特性に対応した適応フィルタにおいて、推定する音響フィードバック特性の継続遅延時間は、数10ms~数100msとなる。そのため、継続遅延時間に相当するフィルタ係数が必要となり、演算量が大きくなる。また、拡声システムでは、同じ空間内で発話と拡声とが行われる。そのため、発話者の声が直接拡声対象者に聞こえる場合、ハウリング抑圧装置は、発話者の声と拡声音とに時間差が生じないようにすることが望ましい。発話者の声と拡声音とに大きな時間差がある場合、拡声対象者には発話者の声と拡声音とが分離して聴こえ、非常に聞こえにくくなり、明瞭度が低下するという問題がある。
【0063】
そのため、実用的には、ハウリング抑圧装置は、演算量を抑えつつ、ハウリング抑圧処理を低遅延で実行する必要がある。MDF適応フィルタは、
図3に示すように、複数のブロックに分割された第1~第N周波数領域適応フィルタ431~43Nで構成されるため、時間領域の適応フィルタより演算量を少なくすることができる。また、高速フーリエ変換部421,423が、比較的少ないサンプル数で時間領域のデータを周波数領域のデータに変換し、逆高速フーリエ変換部422が、比較的少ないサンプル数で周波数領域のデータを時間領域のデータに変換する。そのため、MDF適応フィルタは、処理遅延を短くすることができる。例えば、サンプリング周波数が16kHzであり、FFTサンプル数が128である場合、64サンプル毎にFFT及びIFFTが実行されることとなり、処理遅延は、64/16kHz=4msとなり、低遅延化も実現できる。
【0064】
また、MDF適応フィルタでは、第1~第N周波数領域適応フィルタ431~43Nは、各分割ブロックでスピーカ3からマイクロホン1への音響フィードバック特性を周波数領域で推定している。そのため、分割ブロック数がN個である場合、推定部102は、N個の分割ブロックにおけるフィルタ係数W’1、・・・、W’Nから容易に音響フィードバック振幅周波数特性ΣW’を演算できる。各フィルタ係数W’*(*は1、・・・、N)は、FFTポイント数と同じ周波数成分を有しており、ΣW’は、周波数成分毎の音響フィードバック振幅周波数特性となる。推定部102は、複数の分割ブロック毎に推定された複数のフィルタ係数W’の絶対値の合算値ΣW’を算出し、算出した合算値ΣW’を音響フィードバック振幅周波数特性として推定する。例えば、推定部102は、下記の式(1)を用いて、音響フィードバック振幅周波数特性を算出する。
【0065】
ΣW’(i)=|W’1(i)|+|W’2(i)|+・・・+|W’N(i)|・・・(1)
上記の式(1)において、iは、周波数成分の番号を表し(i=0,1,2,・・・,FFTポイント-1)、|*|は、複素数*の絶対値を表す。
【0066】
例えば、サンプリング周波数が16KHzであり、FFTポイント数が128であり、適応フィルタの等価遅延が48msである場合、分割ブロック数は12個(=0.048*16,000/64)となる。サンプリング周波数は、音声の帯域幅で決まる。FFTポイント数は、処理全体の遅延の長さを決める。適応フィルタの等価遅延が長ければ、長い遅延は消去されるが、演算量は増えることになる。そのため、等価遅延は、演算量と、消去したい音声レベル(例えば、30dB)とから決まる。
【0067】
図4は、MDF適応フィルタの複数の分割ブロックそれぞれにおいて推定されるフィルタ係数と、測定された音響フィードバック特性との一例を示す図である。
【0068】
図4の左上から右下に向かって第1分割ブロック~第12分割ブロックにおいて推定されたフィルタ係数と、測定された音響フィードバック特性とを示している。横軸は、周波数を示し、縦軸は、フィルタ係数及び音響フィードバック特性の絶対値を示している。破線は、各分割ブロックで推定したフィルタ係数の絶対値|W’1|、・・・、|W’12|を示し、実線は、各分割ブロックで予め測定したスピーカ3からマイクロホン1に至る音響フィードバック特性の絶対値|W1|、・・・、|W12|を示している。
【0069】
推定部102は、適応フィルタ部101内の各分割ブロックで推定したフィルタ係数の絶対値|W’1|、・・・、|W’12|の合算値ΣW’を算出する。
【0070】
なお、本実施の形態では、推定部102は、適応フィルタ部101内の複数の分割ブロックで推定した全てのフィルタ係数の絶対値の合算値を算出しているが、本開示は特にこれに限定されず、適応フィルタ部101内の複数の分割ブロックで推定した複数のフィルタ係数のうちの一部のフィルタ係数の絶対値の合算値を算出してもよい。例えば、
図4に示すように、第9~第12分割ブロックのフィルタ係数は0.1より小さくなっており、音響フィードバック音への寄与率が低くなっている。そのため、推定部102は、第9~第12分割ブロックで推定したフィルタ係数を用いずに、第1~第8分割ブロックで推定したフィルタ係数の絶対値の合算値を算出してもよい。
【0071】
図5は、推定部102によって推定された音響フィードバック振幅周波数特性と、測定された音響フィードバック振幅周波数特性との一例を示す図である。横軸は、周波数を示し、縦軸は、音響フィードバック振幅周波数特性を示している。破線は、推定部102によって推定された音響フィードバック振幅周波数特性、すなわち、MDF適応フィルタの各分割ブロックのフィルタ係数の絶対値の合算値ΣW’を示し、実線は、予め測定した音響フィードバック振幅周波数特性|W|を示している。
図5に示すように、MDF適応フィルタの各分割ブロックの係数W’1、・・・、W’12の絶対値の合算値ΣW’は、予め測定された音響フィードバック振幅周波数特性|W|とほぼ一致している。
【0072】
図6は、
図2に示す抑圧ゲイン算出部103の詳細な構成を示すブロック図である。
【0073】
抑圧ゲイン算出部103は、推定部102によって推定された音響フィードバック振幅周波数特性、すなわち、複数のフィルタ係数の合算値ΣW’から抑圧ゲインGを演算する。
【0074】
抑圧ゲイン算出部103は、スムージング処理部1031、平均値算出部1032及びゲイン算出部1033を備える。
【0075】
スムージング処理部1031は、入力された音響フィードバック振幅周波数特性、すなわち、複数のフィルタ係数の絶対値の合算値ΣW’を時間方向にスムージングしたスムージング値smthΣW’を算出する。
【0076】
スムージング処理部1031は、入力された音響フィードバック振幅周波数特性、すなわち、複数のフィルタ係数の絶対値の合算値ΣW’のスムージング値smthΣW’を算出する。スムージング処理部1031は、合算値ΣW’(i)がスムージング値smthΣW’(i)よりも小さい(smthΣW’(i)>ΣW’(i))場合、下記の式(2)に従い各周波数成分毎にスムージング処理を行う。
【0077】
smthΣW’(i)=(1-αdn)*smthΣW’(i)+αdn*ΣW’(i)・・・(2)
また、スムージング処理部1031は、合算値ΣW’(i)がスムージング値smthΣW’(i)以上である(smthΣW’(i)≦ΣW’(i))場合、下記の式(3)に従い各周波数成分毎にスムージング処理を行う。
【0078】
smthΣW’(i)=(1-αup)*smthΣW’(i)+αup*ΣW’(i)・・・(3)
なお、上記の式(2)及び式(3)において、iは、周波数成分の番号を表し(i=0,1,2,・・・,FFTポイント-1)、αupは、立ち上がり重み係数を表し、αdnは、立ち下がり重み係数を表し、αupは、αdnより大きい(αup>αdn)。
【0079】
ΣW’がsmthΣW’より大きい場合の方が、ΣW’がsmthΣW’より小さい場合より早くsmthΣW’が変化することで、スムージング処理はピークホールドとして働く。
【0080】
平均値算出部1032は、スムージング処理部1031によって算出されたスムージング値smthΣW’の全ての周波数の平均値AVEを算出する。
【0081】
図7は、スムージング処理部1031によって算出されたスムージング値smthΣW’と、平均値算出部1032によって算出された平均値AVEとの一例を示す図である。
【0082】
図7に示すように、スムージング値smthΣW’は、合算値ΣW’をスムージング(平滑化)したものであり、スムージング値smthΣW’の全周波数の平均値AVEは、例えば、1.5である。
【0083】
ゲイン算出部1033は、平均値算出部1032によって算出された全周波数の平均値AVEをスムージング値smthΣW’で除算し、除算結果の最大値を上限値Gmaxでクリップし、除算結果の最小値を下限値Gminでクリップすることで抑圧ゲインGを算出する。上限値Gmaxは、例えば1であり、下限値Gminは、例えば、上限値Gmaxの1/2~1/4程度の範囲である。
【0084】
図8は、ゲイン算出部1033によって算出される抑圧ゲインGの一例を示す図である。
【0085】
ゲイン算出部1033によって算出された抑圧ゲインGはGmin≦G≦1となる。
図8に示す下限値Gminは、例えば、0.5である。下限値Gminで抑圧ゲインGの最小値をクリップするのは、適応フィルタ部101の出力に含まれる話者の音声を大きく抑圧することで音質が劣化することを防止するためである。
【0086】
図9は、
図2に示す抑圧部104の詳細な構成を示すブロック図である。
【0087】
抑圧部104は、時間-周波数変換部1041、乗算部1042及び周波数-時間変換部1043を備える。
【0088】
時間-周波数変換部1041は、適応フィルタ部101によって出力された時間領域の出力信号を周波数領域の出力信号に変換する。
【0089】
乗算部1042は、周波数領域に変換された出力信号に、抑圧ゲイン算出部103によって算出された抑圧ゲインを乗じる。
【0090】
周波数-時間変換部1043は、乗算部1042によって抑圧ゲインが乗算された周波数領域の出力信号を時間領域の出力信号に変換する。上記の構成により、周波数領域で音響フィードバック特性のピーク成分を抑圧することができる。
【0091】
なお、時間-周波数変換部1041は、高速フーリエ変換を行ってもよく、周波数-時間変換部1043は、逆高速フーリエ変換を行ってもよい。また、時間-周波数変換部1041及び周波数-時間変換部1043のFFTポイント数は、適応フィルタ部101がMDF適応フィルタである場合、MDF適応フィルタで用いたFFTポイント数と同じであることが好ましい。これにより、時間-周波数変換部1041からの出力信号の周波数成分数が抑圧ゲインの周波数成分数と同じとなり、効率よく演算することができる。
【0092】
なお、適応フィルタ部101がMDF適応フィルタである場合、第1~第N周波数領域適応フィルタ431~43Nは、各分割ブロックのフィルタ更新ゲインを個別に設定可能である。
【0093】
図10は、音響フィードバック特性(時間インパルス応答)の一例を示す図である。
【0094】
図10に示すように、音響フィードバック特性は、直接波、反射波及び多重反射波を含む。直接波が最初に出力され、その後反射波及び多重反射波が出力される。そのため、音響フィードバック特性は、時間の経過とともに減少する。そこで、音響フィードバック特性が分割ブロック番号の増加とともに徐々に減少することに対応して、第1~第N周波数領域適応フィルタ431~43Nは、分割ブロックの時系列順に徐々にフィルタ更新ゲインを減少させるように設定してもよい。複数の分割ブロックそれぞれの係数更新アルゴリズムのフィルタ更新ゲイン(係数更新ゲイン)は、遅延が長くなるほど減少してもよい。このようにフィルタ更新ゲインが設定されることで適応フィルタの収束速度を改善できる。
【0095】
なお、本実施の形態において、第1~第N周波数領域適応フィルタ431~43Nの係数更新アルゴリズム(適応アルゴリズム)は、正規化LMSであるが、本開示は特にこれに限定されない。係数更新アルゴリズムは、LMS、独立成分分析、アフィン射影法、再帰的最小2乗法(RLS(Recursive Least Square)法)又はその他のアルゴリズムであってもよい。これらのアルゴリズムにおいても、正規化LMSと同様にフィルタ更新ゲインが設定されることで、収束速度を改善することができる。
【0096】
また、適応フィルタ部101は、周波数領域の音響フィードバック特性ではなく、時間領域の音響フィードバック特性を推定してもよい。この場合、推定部102は、適応フィルタ部101によって推定された時間領域の音響フィードバック特性を周波数領域の音響フィードバック特性に変換し、周波数領域の音響フィードバック振幅周波数特性を推定してもよい。すなわち、適応フィルタ部101が時間領域適応フィルタを含む場合、推定部102は、時間領域のフィルタ係数を周波数領域のフィルタ係数に変換し、変換した周波数領域のフィルタ係数の合算値Σ|W’|を音響フィードバック振幅周波数特性として推定してもよい。
【0097】
続いて、本開示の実施の形態におけるハウリング抑圧装置100の動作について説明する。
【0098】
図11は、本開示の実施の形態におけるハウリング抑圧装置100の動作を説明するためのフローチャートである。
【0099】
まず、ステップS1において、適応フィルタ部101は、スピーカ3へ出力される出力信号を参照信号として、スピーカ3からマイクロホン1に入力される音響フィードバック音の特性を表す音響フィードバック特性を推定する。
【0100】
次に、ステップS2において、適応フィルタ部101は、推定した音響フィードバック特性を用いて、マイクロホン1から得られる入力信号から音響フィードバック音を消去する。
【0101】
次に、ステップS3において、推定部102は、適応フィルタ部101によって推定された音響フィードバック特性に基づいて、周波数領域の音響フィードバック振幅周波数特性を推定する。
【0102】
次に、ステップS4において、抑圧ゲイン算出部103は、推定部102によって推定された音響フィードバック振幅周波数特性から、音響フィードバック振幅周波数特性の周波数ピークを平坦化するための周波数領域の抑圧ゲインを算出する。
【0103】
次に、ステップS5において、抑圧部104は、抑圧ゲイン算出部103によって算出された抑圧ゲインを用いて、適応フィルタ部101からの出力信号を周波数領域で抑圧する。
【0104】
このように、適応フィルタ部101によってスピーカ3からマイクロホン1に入力される音響フィードバック音が消去され、抑圧部104によって音響フィードバック振幅周波数特性の周波数ピーク成分が抑圧されるので、安定してハウリングを抑圧することができる。
【0105】
なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。また、プログラムを記録媒体に記録して移送することにより、又はプログラムをネットワークを経由して移送することにより、独立した他のコンピュータシステムによりプログラムが実施されてもよい。
【0106】
本開示の実施の形態に係る装置の機能の一部又は全ては典型的には集積回路であるLSI(Large Scale Integration)として実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。また、集積回路化はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後にプログラムすることが可能なFPGA(Field Programmable Gate Array)、又はLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
【0107】
また、本開示の実施の形態に係る装置の機能の一部又は全てを、CPU等のプロセッサがプログラムを実行することにより実現してもよい。
【0108】
また、上記で用いた数字は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された数字に制限されない。
【0109】
また、上記フローチャートに示す各ステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、同様の効果が得られる範囲で上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時(並列)に実行されてもよい。
【産業上の利用可能性】
【0110】
本開示に係る技術は、安定してハウリングを抑圧することができるので、スピーカからマイクロホンへの音響フィードバックにより発生するハウリングを抑圧する技術として有用である。