特許第5785674号(P5785674)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ゴーアテック インコーポレイテッドの特許一覧

特許5785674デュアルマイクに基づく音声残響低減方法及びその装置
<>
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000062
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000063
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000064
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000065
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000066
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000067
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000068
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000069
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000070
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000071
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000072
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000073
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000074
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000075
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000076
  • 特許5785674-デュアルマイクに基づく音声残響低減方法及びその装置 図000077
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5785674
(24)【登録日】2015年7月31日
(45)【発行日】2015年9月30日
(54)【発明の名称】デュアルマイクに基づく音声残響低減方法及びその装置
(51)【国際特許分類】
   H04R 3/00 20060101AFI20150910BHJP
【FI】
   H04R3/00 320
【請求項の数】10
【全頁数】28
(21)【出願番号】特願2015-524601(P2015-524601)
(86)(22)【出願日】2013年12月12日
(65)【公表番号】特表2015-523609(P2015-523609A)
(43)【公表日】2015年8月13日
(86)【国際出願番号】CN2013001557
(87)【国際公開番号】WO2014089914
(87)【国際公開日】20140619
【審査請求日】2015年1月30日
(31)【優先権主張番号】201210536578.X
(32)【優先日】2012年12月12日
(33)【優先権主張国】CN
【早期審査対象出願】
(73)【特許権者】
【識別番号】512280079
【氏名又は名称】ゴーアテック インコーポレイテッド
【氏名又は名称原語表記】GOERTEK INC
(74)【代理人】
【識別番号】100129425
【弁理士】
【氏名又は名称】小川 護晃
(74)【代理人】
【識別番号】100099623
【弁理士】
【氏名又は名称】奥山 尚一
(74)【代理人】
【識別番号】100087505
【弁理士】
【氏名又は名称】西山 春之
(74)【代理人】
【識別番号】100167025
【弁理士】
【氏名又は名称】池本 理絵
(74)【代理人】
【識別番号】100168642
【弁理士】
【氏名又は名称】関谷 充司
(74)【代理人】
【識別番号】100096769
【弁理士】
【氏名又は名称】有原 幸一
(74)【代理人】
【識別番号】100107319
【弁理士】
【氏名又は名称】松島 鉄男
(74)【代理人】
【識別番号】100114591
【弁理士】
【氏名又は名称】河村 英文
(72)【発明者】
【氏名】ルー,シャシャ
(72)【発明者】
【氏名】リー,ボー
(72)【発明者】
【氏名】ファン,ジョーチェン
【審査官】 下林 義明
(56)【参考文献】
【文献】 特開平09−321860(JP,A)
【文献】 特開2014−230280(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/00 − 3/14
H04R 25/00 − 25/04
H04M 1/24 − 1/82
(57)【特許請求の範囲】
【請求項1】
メインマイク入力信号及び補助マイク入力信号を受信し、フレームごとにメインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出する処理と、
前記伝達関数h(t)のテーリング部分h(t)を取得するとともに、該伝達関数h(t)によって残響の強さを判断して利得函数の調節因子βを算出する処理と、
前記補助マイク入力信号を用いてh(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得る処理と、
前記メインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得て、メインマイク入力信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルを得る処理と、
前記メインマイク入力信号の周波数スペクトル、前記利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって、利得函数を算出する処理と、
前記メインマイク入力信号の周波数スペクトルに利得函数を乗算して、メインマイク入力信号の残響除去後の周波数スペクトルを得る処理と、
前記メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得る処理と、
前記メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してからメインマイク入力信号の残響除去後の連続信号を出力する処理とを、
行うことを含むことを特徴とするデュアルマイクに基づく音声残響低減方法。
【請求項2】
前記メインマイク入力信号の後期残響推定信号を得た後、時間ドメインから周波数ドメインへの変換を行う前に、
前記メインマイクと補助マイクとの間の距離が大きいほど、メインマイク入力信号の後期残響推定信号に対して周波数補償を行う度合いが小さくなるように、前記メインマイク入力信号の後期残響推定信号に対して周波数補償を行うことと、
この周波数補償が行われた信号に対して時間ドメインから周波数ドメインへの変換を行って、前記メインマイク入力信号の後期残響スペクトルを得ることとを、
更に含むことを特徴とする請求項1に記載のデュアルマイクに基づく音声残響低減方法。
【請求項3】
前記伝達関数h(t)によって残響の強さを判断することは、下記の式によって残響の強さを表すパラメータρを算出し、


そのうち、h(t)が補助マイクからメインマイクまでの伝達関数、Tがh(t)の時間軸において指定された境界点であり、
前記利得函数の調節因子βを算出することは、下記の式によってβを算出し、


そのうち、ρとρが設定値である、
ことを特徴とする請求項1に記載のデュアルマイクに基づく音声残響低減方法。
【請求項4】
前記メインマイク入力信号の周波数スペクトル、前記利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって利得函数を算出することは、下記の式によって利得函数G(l,k)を算出し、


そのうち、lがフレーム番号、kが周波数ポイント番号、βが利得函数の調節因子、

がメインマイク入力信号の後期残響周波数スペクトル、Xがメインマイク入力信号の周波数スペクトルである、
ことを特徴とする請求項1に記載のデュアルマイクに基づく音声残響低減方法。
【請求項5】
前記伝達関数h(t)のテーリング部分h(t)を取得することは、
伝達関数h(t)の時間軸において早期残響と後期残響との境界点を取って、伝達関数h(t)の該境界点の前の値を0にセットして、伝達関数h(t)のテーリング部分h(t)を得ることを含む、
ことを特徴とする請求項1に記載のデュアルマイクに基づく音声残響低減方法。
【請求項6】
メインマイク及び補助マイクに受信された信号に対してフレームごとに処理を行い、残響スペクトル推定ユニットとスペクトル減算ユニットとを含み、そのうち、
前記残響スペクトル推定ユニットは、メインマイク入力信号及び補助マイク入力信号を受信し、前記メインマイク入力信号及び補助マイク入力信号によって、前記補助マイクからメインマイクまでの伝達関数h(t)を算出して、該伝達関数h(t)のテーリング部分h(t)を取得するとともに、前記伝達関数h(t)によって残響の強さを判断し、利得函数の調節因子βを算出してスペクトル減算ユニットに出力して、補助マイク入力信号を用いてh(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得て、メインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得てからスペクトル減算ユニットに出力するために用いられ、
前記スペクトル減算ユニットは、メインマイク入力信号、前記残響スペクトル推定ユニットから出力された利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルを受信し、メインマイク入力信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルを得て、前記メインマイク入力信号の周波数スペクトル、利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって利得函数を算出し、前記メインマイク入力信号の周波数スペクトルに利得函数を乗算して、メインマイク入力信号の残響除去後の周波数スペクトルを得て、前記メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得て、前記メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してからメインマイク入力信号の残響除去後の連続信号を出力するために用いられる、
ことを特徴とするデュアルマイクに基づく音声残響低減装置。
【請求項7】
前記残響スペクトル推定ユニットは、伝達関数算出ユニット、伝達関数テーリング算出ユニット、残響強さ判断ユニット、後期残響推定ユニット及び第一の時間/周波数変換ユニットを含み、更に周波数補償ユニットを含み、
前記スペクトル減算ユニットは、第二の時間/周波数変換ユニット、利得函数算出ユニット、残響除去ユニット、周波数/時間変換ユニット及び重畳加算ユニットを含み、そのうち、
伝達関数算出ユニットは、メインマイク入力信号及び補助マイク入力信号を受信し、メインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出して、伝達関数h(t)を伝達関数テーリング算出ユニット及び残響強さ判断ユニットに出力するために用いられ、
伝達関数テーリング算出ユニットは、前記伝達関数h(t)のテーリング部分h(t)を求めて後期残響推定ユニットに出力するために用いられ、
残響強さ判断ユニットは、前記伝達関数h(t)によって残響の強さを判断し、利得函数の調節因子βを算出して利得函数算出ユニットに出力するために用いられ、
後期残響推定ユニットは、前記補助マイク入力信号を受信し、補助マイク入力信号を用いてh(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得てから周波数補償ユニットに出力するために用いられ、
周波数補償ユニットは、前記メインマイク入力信号の後期残響推定信号に対して周波数補償を行って、第一の時間/周波数変換ユニットに出力するために用いられ、そのうち、メインマイクと補助マイクとの間の距離が大きいほど、メインマイク入力信号の後期残響推定信号に対して周波数補償を行う度合いが小さくなり、
第一の時間/周波数変換ユニットは、前記周波数補償されたメインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得てから利得函数算出ユニットに出力するために用いられ、
第二の時間/周波数変換ユニットは、前記メインマイク入力信号を受信し、時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルを得て利得函数算出ユニットに出力するために用いられ、
利得函数算出ユニットは、前記第二の時間/周波数変換ユニットから出力されたメインマイク入力信号の周波数スペクトル、残響強さ判断ユニットから出力された利得函数の調節因子β及び第一の時間/周波数変換ユニットから出力されたメインマイク入力信号の後期残響スペクトルによって、利得函数を算出して、残響除去ユニットに出力するために用いられ、
残響除去ユニットは、前記メインマイク入力信号の周波数スペクトルに利得函数を乗算して、メインマイク入力信号の残響除去後の周波数スペクトルを得て、周波数/時間変換ユニットに出力し、
周波数/時間変換ユニットは、前記メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得て、重畳加算ユニットに出力するために用いられ、
重畳加算ユニットは、前記メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してから、メインマイク入力信号の残響除去後の連続信号を出力するために用いられる、
ことを特徴とする請求項6に記載のデュアルマイクに基づく音声残響低減装置。
【請求項8】
前記残響強さ判断ユニットは、下記の式によって残響の強さを表すパラメータρを算出するために用いられ、


そのうち、h(t)が補助マイクからメインマイクまでの伝達関数、Tがh(t)の時間軸においての指定された境界点であり、
そして、下記の式によって利得函数の調節因子βを算出するために用いられ、


そのうち、ρとρが設定値である、
ことを特徴とする請求項7に記載のデュアルマイクに基づく音声残響低減装置。
【請求項9】
前記利得函数算出ユニットは、下記の式によって利得函数G(l,k)を算出するために用いられ、


そのうち、lがフレーム番号、kが周波数ポイント番号、βが利得函数の調節因子、

がメインマイク入力信号の後期残響周波数スペクトル、Xがメインマイク入力信号の周波数スペクトルである、
ことを特徴とする請求項7に記載のデュアルマイクに基づく音声残響低減装置。
【請求項10】
前記伝達関数テーリング算出ユニットは、前記伝達関数h(t)の時間軸において早期残響と後期残響との境界点を取って、伝達関数h(t)の該境界点の前の値を0にセットして、伝達関数h(t)のテーリング部分h(t)を得るために用いられることを特徴とする請求項7に記載のデュアルマイクに基づく音声残響低減装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声強調技術分野に関し、特に、デュアルマイクに基づく音声残響低減方法及びその装置に関する。
【背景技術】
【0002】
音響信号が室内での伝播過程中、壁、地面等のハードインターフェイスの音響に対する反射のため、マイクロフォンに到達した音響は、音源から直接に伝わってきた直接音に加えて、一回又は複数回の反射を経て伝わってきた音響信号も含まれており、これらの非直接音が残響信号を構成している。一回又は少ない回数の反射を経た音響信号が早期反射信号と称され、早期反射信号が早期残響信号を構成しており、早期残響信号が音声に対して強調作用を果たすことがある。複数回の反射を経た音響信号が後期反射信号と称され、後期反射信号が後期残響信号を構成しており、後期残響が強いと音声の明瞭度を低減することになる。
【0003】
一部のハンズフリー音声通信において、通話者がマイクロフォンから遠く離れており、音声の明瞭度が部屋の残響によって低下してしまい、通話品質が低下することになる。そのため、残響を低減し音声の明瞭度を高める技術が必要とされる。マイクロフォン受信信号は、直接音信号と残響信号とを含み、また、前述から分かるように、残響は、早期残響と後期残響に更に分かれている。そのうち、音声の明瞭度を低減するのは、主に後期残響であり、早期残響は、通常、音声に対して強調作用を果たす。従って、明瞭度を高める肝心な点は、後期残響信号を低減することである。
【0004】
種々の残響低減技術において、デュアルマイクに基づくスペクトル減算の残響除去方法が広く注目されている。従来の、デュアルマイクに基づくスペクトル減算の残響除去方法において、適応ビーム形成(GSC)構造は二つの通路の信号が得られ、第一通路の信号が遅延/加算ビームフォーマの出力であり、第二通路の信号がブロッキング行列の出力である。二つの通路の信号のエネルギーエンベロープは、適応フィルタによって第一通路信号の残響を推定してから、スペクトル減算法によって残響を除去する。この方法には、以下の欠点がある。
1)早期残響が除去されて、処理後の音響が薄くなる。
2)残響の強さに対して判断せず、異なる残響の場合においても同じスペクトル減算処理を用いることで、残響が弱く、音声の明瞭度がそもそも高い場合に音声品質を損傷する可能性がある。
3)直接音の到来方向を正確に推定して、直接音を分離する必要があるので、マイクロフォンに高い一致性が要求され、音響設計に対しても厳しい制限がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、上記問題に鑑みて、上記問題が解消されるか又は少なくとも部分的に解消されるデュアルマイクに基づく音声残響低減方法及びその装置を提供する。
【課題を解決するための手段】
【0006】
本発明の一つの局面によると、メインマイク入力信号及び補助マイク入力信号を受信し、フレームごとにメインマイク入力信号及び補助マイク入力信号によって補助マイクからメインマイクまでの伝達関数h(t)を算出する処理と、
前記伝達関数h(t)のテーリング部分h(t)を取得するとともに、該伝達関数h(t)によって残響の強さを判断して、利得函数の調節因子βを算出する処理と、
前記補助マイク入力信号を用いてh(t)に畳み込みを行ってメインマイク入力信号の後期残響推定信号を得る処理と、
前記メインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得て、メインマイク入力信号に対して時間ドメインから周波数ドメインへの変換を行ってメインマイク入力信号の周波数スペクトルを得る処理と、
前記メインマイク入力信号の周波数スペクトル、前記利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって、利得函数を算出する処理と、
前記メインマイク入力信号の周波数スペクトルに利得函数を乗算して、メインマイク入力信号の残響除去後の周波数スペクトルを得る処理と、
前記メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得る処理と、
前記メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してから、メインマイク入力信号の残響除去後の連続信号を出力する処理とを行う、
デュアルマイクに基づく音声残響低減方法が提供される。
【0007】
本発明のもう一つの局面によると、メインマイク及び補助マイクに受信された信号に対してフレームごとに処理を行い、残響スペクトル推定ユニットとスペクトル減算ユニットとを含み、
前記残響スペクトル推定ユニットは、メインマイク入力信号及び補助マイク入力信号を受信し、前記メインマイク入力信号及び補助マイク入力信号によって、前記補助マイクからメインマイクまでの伝達関数h(t)を算出して、該伝達関数h(t)のテーリング部分h(t)を取得するとともに、前記伝達関数h(t)によって残響の強さを判断し、利得函数の調節因子βを算出してスペクトル減算ユニットに出力し、補助マイク入力信号を用いてh(t)に畳み込みを行ってメインマイク入力信号の後期残響推定信号を得て、メインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行ってメインマイク入力信号の後期残響スペクトルを得てからスペクトル減算ユニットに出力するために用いられ、
前記スペクトル減算ユニットは、メインマイク入力信号、前記残響スペクトル推定ユニットから出力された利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルを受信し、メインマイク入力信号に対して時間ドメインから周波数ドメインへの変換を行ってメインマイク入力信号の周波数スペクトルを得て、前記メインマイク入力信号の周波数スペクトル、利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって利得函数を算出し、前記メインマイク入力信号の周波数スペクトルに利得函数を乗算してメインマイク入力信号の残響除去後の周波数スペクトルを得て、前記メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行ってメインマイク入力信号の残響除去後の時間ドメイン信号を得て、前記メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してから、メインマイク入力信号の残響除去後の連続信号を出力するために用いられる、デュアルマイクに基づく音声残響低減装置が提供される。
【発明の効果】
【0008】
上記から分かるように、本発明は、メインマイク入力信号及び補助マイク入力信号によって補助マイクからメインマイクまでの伝達関数h(t)を算出し、伝達関数h(t)のテーリング部分h(t)を取って、伝達関数h(t)によって残響の強さを判断して、利得函数の調節因子βを算出し、そして、補助マイク入力信号を用いてh(t)に畳み込みを行ってメインマイク入力信号の後期残響推定信号を得て、メインマイク入力信号の周波数スペクトル、利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって利得函数を算出し、メインマイク入力信号の周波数スペクトルに利得函数を乗算してメインマイク入力信号の残響除去後の周波数スペクトルを得て、即ち、スペクトル減算法によってメインマイク入力信号の周波数スペクトルからメインマイク入力信号の後期残響推定スペクトルを差し引くため、メインマイクの入力信号からその後期残響を効果的に除去するとともに早期残響を保留することができ、処理後の音響が薄くなることがなく、音声の品質が向上する。同時に、後期残響を推定するプロセスに、残響の強さによってスペクトル減算の強度を調節し、残響が弱い時にスペクトル減算を少なくするか又はしないようにして、残響が弱く、音声の明瞭度がそもそも高い場合に音声を損傷しないことが保証され、音声品質が保護される。そして、このような手段において、直接音の到来方向を正確に推定する必要がないため、マイクロフォンが高い一致性を持つことが要求されることなく、音響設計に対しても厳しい制限がない。
【図面の簡単な説明】
【0009】
図1】本発明の実施例に挙げられた励磁信号からマイクロフォン入力信号までの伝達関数のグラフである。
図2】本発明の実施例に挙げられた補助マイクからメインマイクまでの伝達関数のグラフである。
図3】本発明の一つの実施例におけるデュアルマイクに基づく音声残響低減方法の流れの模式図である。
図4】本発明のその他の実施例におけるデュアルマイクに基づく音声残響低減方法の全体的な流れの模式図である。
図5A】本発明の実施例における音源からメインマイクまでの距離が0.5mである時の補助マイクからメインマイクまでの伝達関数のグラフである。
図5B】本発明の実施例における音源からメインマイクまでの距離が1mである時の補助マイクからメインマイクまでの伝達関数のグラフである。
図5C】本発明の実施例における音源からメインマイクまでの距離が2mである時の補助マイクからメインマイクまでの伝達関数のグラフである。
図5D】本発明の実施例における音源からメインマイクまでの距離が4mである時の補助マイクからメインマイクまでの伝達関数のグラフである。
図6A】本発明の実施例におけるメインマイクと補助マイクとの間の間隔が6cmである時の周波数補償フィルタの振幅周波数特性のグラフである。
図6B】本発明の実施例におけるメインマイクと補助マイクとの間の間隔が18cmである時の周波数補償フィルタの振幅周波数特性のグラフである。
図7A】本発明の実施例におけるメインマイク入力信号の時間ドメインの図である。
図7B】本発明の実施例におけるメインマイクに対して残響除去後の時間ドメインの図である。
図7C】本発明の実施例におけるメインマイク入力信号の音声スペクトログラムである。
図7D】本発明の実施例におけるメインマイクに対して残響除去後の音声スペクトログラムである。
図8】本発明の実施例におけるデュアルマイクに基づく音声残響低減装置の全体構成図である。
図9】本発明の一つの好ましい実施例におけるデュアルマイクに基づく音声残響低減装置の詳細な構成及びその入出力模式図である。
【発明を実施するための形態】
【0010】
まず、初めに、本出願書類の記載において、出願書類の簡潔のために、「マイクロフォン」を「マイク」と略称することとする。
従来技術に対する分析により、より良く残響を低減するために、後期残響を除去すると同時に直接音と早期残響とを保護する必要があるので、正確で安定な後期残響推定及び残響強さ判断が必要とされる。
【0011】
本発明は、デュアルマイク(メインマイク及び補助マイク)に基づく残響除去の手段を提出しており、残響とデュアルマイク空間の伝達関数との間の近似関係を十分に利用しており、デュアルマイク空間の伝達関数によって後期残響を推定するとともに残響の強さを判断し、スペクトル減算モジュールに合わせて、種々の残響環境においても明瞭度が満たされると同時に、最適に近い音声品質が得られる。また、本発明における手段は、直接音を分離する必要もなく、到来方向の推定を行う必要もないため、マイクの一致性が要求されることなく、音響設計に対する要求が緩和される。
【0012】
本発明の基本的な原理は、下記の通りになる。デュアルマイクの間の伝達関数の尾部によって後期残響を推定するため、スペクトル減算において直接音と早期残響を良好に保留することができる。そして、後期残響を推定するプロセスに、更に、デュアルマイクの間の伝達関数の頭部と尾部とのエネルギー差によって部屋の残響度合いを推定し、スペクトル減算の強度を調節し、残響が弱い時にスペクトル減算を少なくするか又はしないようにして、音声品質を保護する。
【0013】
本発明の技術手段を明らかにするために、以下、本発明の技術原理について分析説明を行う。
早期残響信号は、音声に対して強調作用を果たすことができるが、後期残響は、音声の明瞭度を低減することになる。図1は、本発明の実施例に挙げられた励磁信号からマイク入力信号までの伝達関数のグラフである。図1を参照して、励磁信号からマイク入力信号までの伝達関数において、ピークが最大の箇所は、直接音に対応しており、通常、最大ピークから離れた或る点を、早期反射と後期反射との境界点として、最大ピークから境界点までの部分が早期残響に対応し、境界点以降の部分が後期残響に対応する。図1において、該境界点が50msである。
【0014】
励磁信号をs(t)、マイク入力信号をx(t)、励磁信号からマイク入力信号までの伝達関数をtf(t)、直接音と早期残響に対応する部分の伝達関数をtf(t)、後期残響に対応する部分の伝達関数をtf(t)とそれぞれ記すと、マイク入力信号は、励磁信号と伝達関数との畳み込みx(t)=s(t)*tf(t)と表すことができ、マイク入力信号の直接音と早期残響成分は、x(t)=s(t)*tf(t)と表すことができ、マイク入力信号の後期残響成分は、x(t)=s(t)*tf(t)と表すことができる。従って、マイク入力信号はx(t)=s(t)*tf(t)=s(t)*(tf(t)+tf(t))=x(t)+x(t)と表すこともできる。
【0015】
音声の明瞭度はC50で表してもよい。その数式は、下記の通りになる。

(1)
w(t)は、励磁信号からマイク入力信号までの伝達関数である。0〜50msが直接音と早期残響部分に対応し、50ms以降が後期残響部分に対応する。残響が強いほど、C50の値が小さくなる。残響除去前後のC50の向上が残響除去効果を反映し得るため、C50は、残響除去の客観的評価指標としてもよい。
【0016】
本発明において、デュアルマイク(メインマイク及び補助マイク)に基づく残響推定原理は、下記の通りになる。図2に示すように、メインマイクの入力信号をx(t)、補助マイクの入力信号をx(t)、補助マイクからメインマイクまでの伝達関数をh(t)とそれぞれ記す。図2は、本発明の実施例に挙げられた補助マイクからメインマイクまでの伝達関数h(t)のグラフである。
【0017】
メインマイクの入力信号x(t)が、補助マイクの入力信号x(t)と伝達関数h(t)との畳み込みに等しい。

(2)
h(t)は、頭部と尾部との二つの部分に分けることができる。

(3)
そのうち、h(t)がh(t)の頭部を表し、h(t)がh(t)の尾部を表す。
h(t)のテーリング部分h(t)は、信号の、空間における複数回の反射を反映しているため、h(t)のテーリング部分h(t)と補助マイク入力信号x(t)との畳み込み信号

は、メインマイクの後期残響成分に近く、メインマイク後期残響成分の推定信号とされる。h(t)において一つの点を選び取ってh(t)とh(t)の境界点として、h(t)の境界点の前の値を0にセットして、h(t)が得られる。境界点からh(t)の最大ピークまでの距離範囲を30ms〜80ms(経験値)に設置することができる。経験により、境界点からh(t)までの最大ピークが50ms以上である場合、メインマイクの後期残響推定信号

には、直接音と早期反射成分がまったく残留せず、音声への損傷を低減し得るため、本発明の実施例において、境界点として50msを取ることを例として説明を行う。
【0018】
本発明の目的、技術手段及び利点を更に明らかにするために、以下、図面を参照しながら、本発明の実施形態について更に詳しい説明を行う。
図3は、本発明の一つの実施例におけるデュアルマイクに基づく音声残響低減方法の流れの模式図である。図3に示すように、該方法は、主に、残響スペクトル推定部分とスペクトル減算部分とを含み、具体的には、フレームごとに下記の処理を行う。
【0019】
ステップ1.1 メインマイク入力信号x(t)及び補助マイク入力信号x(t)を受信し、メインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出する。
ステップ1.2 伝達関数h(t)のテーリング部分h(t)を取得する。
ステップ1.3 そして、伝達関数h(t)によって残響の強さを判断して、利得函数の調節因子βを算出する。
ステップ1.4 補助マイク入力信号を用いてh(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号

を得る。
ステップ1.5 メインマイク入力信号の後期残響推定信号

に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトル

を得る。
【0020】
ステップ2.1 メインマイク入力信号x(t)に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルXを得る。
ステップ2.2 メインマイク入力信号の周波数スペクトルX、利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトル

によって、利得函数Gを算出する。
ステップ2.3 メインマイク入力信号の周波数スペクトルXに利得函数Gを乗算して、メインマイク入力信号の残響除去後の周波数スペクトルDを得る。
ステップ2.4 メインマイク入力信号の残響除去後の周波数スペクトルDに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号d(t)を得る。
ステップ2.5 メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してから、メインマイク入力信号の残響低減後の連続信号x(t)を出力する。
【0021】
図3に示す方法において、補助マイク入力信号を用いてh(t)に畳み込みを行うことによりメインマイク入力信号の後期残響推定信号を得てから、スペクトル減算法によってメインマイク入力信号の周波数スペクトルからメインマイク入力信号の後期残響推定スペクトルを差し引くため、メインマイクの入力信号からその後期残響を効果的に除去するとともに早期残響を保留することができ、音声の品質が向上する。また、図3に示す方法では、後期残響を推定するプロセスに、残響の強さによってスペクトル減算の強度を調節し、残響が弱い時にスペクトル減算を少なくするか又はしないようにして、残響が弱く、音声の明瞭度がそもそも高い場合に音声品質を損傷しないことが保証され、音声品質が保護される。そして、このような方法において、直接音の到来方向を正確に推定する必要がないため、マイクが高い一致性を持つことが要求されることなく、音響設計に対しても厳しい制限がない。
【0022】
本発明の一つの実施例において、図3に示す方法に加えて、メインマイク入力信号の後期残響推定信号とメインマイク入力信号の真実の後期残響成分とを比べ、後期残響推定信号の低周波数域部分での推定不足という問題を更に考慮して、異なるマイク間隔に応じて、ローパスフィルタを設けて、後期残響推定信号に対して対応する周波数補償を行う。具体的には、図4に示す実施例を参照する。
【0023】
図4は、本発明のその他の実施例におけるデュアルマイクに基づく音声残響低減方法の全体的な流れの模式図である。図4に示すように、システム全体の入力が補助マイク入力信号x(t)及びメインマイク入力信号x(t)であり、出力が残響低減後の信号x(t)である。大きくいうと、残響スペクトル推定プロセスとスペクトル減算プロセスという二つの部分を含む。図4は、図3に示す方法の流れと比べると、後期残響推定信号に対して周波数補償を行うステップが追加される(図4において、後期残響推定信号に対して周波数補償を行うステップがステップ1.45であり、時間ドメイン/周波数ドメイン変換ステップは図3と同じくステップ1.5と記す)。以下、図4を参照しながら該方法を詳しく説明する。
【0024】
1.残響スペクトル推定
入力:補助マイクの入力信号x(t)、メインマイクの入力信号x(t)。
出力:利得函数の調節因子β(スペクトル減算プロセスにおいての一つの入力とする)、メインマイク入力信号の後期残響スペクトル

(スペクトル減算プロセスにおいての一つの入力とする)。
残響スペクトル推定は、ステップ1.1、ステップ1.2、ステップ1.3、ステップ1.4、ステップ1.45、ステップ1.5との六つのステップを含む。
【0025】
2.スペクトル減算
入力:メインマイク入力信号x(t)、利得函数の調節因子β(残響スペクトル推定プロセスにおいての出力)、メインマイク入力信号の後期残響スペクトル

(残響スペクトル推定プロセスにおいての出力)。
出力:メインマイク入力信号の残響低減後の信号x(t)(システム全体の出力でもある)。
スペクトル減算プロセスは、ステップ2.1、ステップ2.2、ステップ2.3、ステップ2.4、ステップ2.5との五つのステップを含む。
【0026】
以下、残響スペクトル推定プロセス及びスペクトル減算プロセスにおける各ステップ及びそれらの間の関係を詳しく説明する。
1.残響スペクトル推定プロセス
ステップ1.1 補助マイクからメインマイクまでの伝達関数h(t)を算出する。
ステップ1.1の入力:補助マイクの入力信号x(t)及びメインマイクの入力信号x(t)。
ステップ1.1の出力:補助マイクからメインマイクまでの伝達関数h(t)(ステップ1.2の入力とする)。
【0027】
本発明の一つの実施例において、補助マイク入力信号x(t)とメインマイク入力信号x(t)とのクロスパワースペクトルPx2x1及び補助マイク入力信号x(t)のパワースペクトルPx1x1を用いて伝達関数Hを算出する。

(4)
周波数ドメインの伝達関数Hに対して逆フーリエ変換を行って、時間ドメインの伝達関数h(t)を得る。
本発明のその他の実施例において、h(t)の計算は、例えば適応フィルタリングの方法等の異なる方法を用いてもよく、ここでは詳述しない。
【0028】
ステップ1.2 伝達関数h(t)のテーリング部分h(t)を求める。
ステップ1.2の入力:補助マイクからメインマイクまでの伝達関数h(t)(ステップ1.1の出力)。
ステップ1.2の出力:補助マイクからメインマイクまでの伝達関数のテーリング部分h(t)(ステップ1.4の入力とする)。
【0029】
本発明の実施例において、伝達関数h(t)の時間軸において、早期残響と後期残響との境界点を取って、伝達関数h(t)における該境界点の前の値を0にセットして、伝達関数h(t)のテーリング部分h(t)を得る。本発明の一つの好ましい実施例において、伝達関数h(t)において一つの点を選び取って、この点のh(t)までの最大ピークの距離を50msにして、h(t)における該点の前の値を0にセットして、テーリング部分h(t)と記す。
【0030】
ステップ1.3 補助マイクからメインマイクまでの伝達関数h(t)により残響の強さを判断し、利得函数の調節因子βを求める。
ステップ1.3の入力:補助マイクからメインマイクまでの伝達関数h(t)(ステップ1.1の出力)。
ステップ1.3の出力:利得函数の調節因子β(スペクトル減算プロセスにおいての一つの入力とする)。
【0031】
残響が弱い場合の残響除去による音声に対する損傷を減少するため、このステップ1.3において、残響の強さを判断することで利得函数の調節因子βを算出する。本発明の実施例において、補助マイクからメインマイクまでの伝達関数の頭部のエネルギーとテーリング部分のエネルギーとの比に対して、対数を取ってρと記す。

(5)
そのうち、h(t)が補助マイクからメインマイクまでの伝達関数であり、Tがh(t)の時間軸においての指定された境界点である。該境界点Tは、必ずしも早期残響と後期残響との境界点ではないが、該境界点Tの前は、必ず直接音を含み、更に、早期残響の一部又は全部を含んでもよい。
【0032】
図5Aは、本発明の実施例における音源からメインマイクまでの距離が0.5mである時の補助マイクからメインマイクまでの伝達関数のグラフである。音源からメインマイクまでの距離がL=0.5mであると、Tの数値範囲が20ms〜50msであり、ここでTが50ms(即ち境界点Tがh(t)の最大ピークから50ms離れた時間点)を取る時、音声の明瞭度指標がC50=12.3dB、ρ=9.4dBである。
【0033】
図5Bは、本発明の実施例における音源からメインマイクまでの距離が1mである時の補助マイクからメインマイクまでの伝達関数のグラフである。音源からメインマイクまでの距離がL=1mであると、Tの数値範囲が20ms〜50msであり、ここでTが50ms(即ち境界点Tがh(t)の最大ピークから50ms離れた時間点)を取る時、音声の明瞭度指標がC50=8.1dB、ρ=6.0dBである。
【0034】
図5Cは、本発明の実施例における音源からメインマイクまでの距離が2mである時の補助マイクからメインマイクまでの伝達関数のグラフである。音源からメインマイクまでの距離がL=2mであると、Tの数値範囲が20ms〜50msであり、ここでTが50ms(即ち境界点Tがh(t)の最大ピークから50ms離れた時間点)を取る時、音声の明瞭度指標がC50=5.4dB、ρ=3.7dBである。
【0035】
図5Dは、本発明の実施例における音源からメインマイクまでの距離が4mである時の補助マイクからメインマイクまでの伝達関数のグラフである。音源からメインマイクまでの距離がL=4mであると、Tの数値範囲が20ms〜50msであり、ここでTが50ms(即ち境界点Tがh(t)の最大ピークから50ms離れた時間点)を取る時、音声の明瞭度指標がC50=4.5dB、ρ=2.2dBである。
【0036】
音源がマイクから遠ざかるほど、残響が強くなる。図5A図5Dから分かるように、残響が強くなるにつれて、補助マイクからメインマイクまでの伝達関数の頭部のエネルギーが低くなり、テーリング部分のエネルギーが高くなり、二者の比について取る対数ρが残響の強さを反映することができる。残響が強くなるにつれて、ρの値がだんだん小さくなる。従って、ρの値によって残響の強さを判断するとともに、これによって利得函数の調節因子βを求める。
【0037】
前記調節因子βを算出するには複数の方式があり、式(6)は、本発明の実施例におけるβを算出する経験式である。

(6)
ρ及びρが設定値を取り、経験値であり、本発明の実施例において、ρが9dB、ρが2dBを取る(マイク間隔が6cmである)。
【0038】
ステップ1.4 補助マイクの入力信号x(t)と、補助マイクからメインマイクまでの伝達関数のテーリング部分h(t)とに畳み込みを行って、メインマイク入力信号の後期残響推定信号

を得る。
ステップ1.4の入力:補助マイクの入力信号x(t)、補助マイクからメインマイクまでの伝達関数のテーリング部分h(t)(ステップ1.2の出力)。
ステップ1.4の出力:メインマイク入力信号の後期残響推定信号

(ステップ1.45の入力とする)。
具体的には、下記の式のようになる。

(7)
【0039】
ステップ1.45 メインマイク入力信号の後期残響推定信号

に対して周波数補償を行い、補償後の信号

を得る。
ステップ1.45の入力:メインマイク入力信号の後期残響推定信号

(ステップ1.4の出力)。
ステップ1.45の出力:周波数補償が行われたメインマイク入力信号の後期残響推定信号

(ステップ1.5の入力とする)。
【0040】
メインマイク入力信号の後期残響推定信号

とメインマイク入力信号の真実の後期残響成分とを比べると、後期残響推定信号

は、低周波数域部分において推定不足である。そのため、本発明において、メインマイク入力信号の後期残響推定信号

に対して周波数補償を行う。メインマイクと補助マイクとの間の間隔は、後期残響推定信号

に影響を及ぼすため、本発明の実施例において、異なるマイク間隔に応じてローパスフィルタを設けて、後期残響推定信号に対して対応する周波数補償を行い、補償後の後期残響推定信号

を得る。
【0041】
図6Aは、本発明の実施例におけるメインマイクと補助マイクとの間の間隔が6cmである時の周波数補償フィルタの振幅周波数特性のグラフである。図6Bは、本発明の実施例におけるメインマイクと補助マイクとの間の間隔が18cmである時の周波数補償フィルタの振幅周波数特性のグラフである。ここから分かるように、本発明の実施例において、メインマイクと補助マイクとの間の距離が大きいほど、メインマイク入力信号の後期残響推定信号

の低周波数域部分に対して周波数補償を行う度合いが小さくなる。
【0042】
ステップ1.5 周波数補償が行われたメインマイク入力信号の後期残響推定信号

を時間ドメインから周波数ドメインに変換して、メインマイク入力信号の後期残響スペクトル

を得る。
ステップ1.5の入力:周波数補償が行われたメインマイク入力信号の後期残響推定信号

(ステップ1.45の出力)。
ステップ1.5の出力:メインマイク入力信号の後期残響スペクトル

(スペクトル減算プロセスにおいての一つの入力とする)。
周波数補償が行われたメインマイクの後期残響推定信号

を周波数ドメインに変換して、メインマイク入力信号の後期残響スペクトル

が得られる。

(8)
【0043】
2.スペクトル減算プロセス
ステップ2.1 メインマイクの入力信号x(t)を時間ドメインから周波数ドメインに変換して、Xと記す。
ステップ2.1の入力:メインマイクの入力信号x(t)。
ステップ2.1の出力:メインマイク入力信号の周波数スペクトルX(ステップ2.2の入力とされる)。
具体的には、下記の式のようになる。

(9)
【0044】
ステップ2.2 メインマイク入力信号の周波数スペクトルX及び推定されたメインマイクの後期残響スペクトル

から利得函数Gを算出するとともに、調節因子βによって利得函数を調節する。
ステップ2.2の入力:メインマイク入力信号の周波数スペクトルX(ステップ2.1の出力)、メインマイクの後期残響スペクトル

(残響スペクトル推定プロセスにおいてのステップ1.5の出力)、利得函数の調節因子β(残響スペクトル推定プロセスにおいてのステップ1.3の出力)。
ステップ2.2の出力:利得函数G(ステップ2.3の一つの入力とする)。
【0045】
本発明の一つの実施例において、パワースペクトル減算法を用いて、下記の式によって利得函数G(l,k)を算出する。

(10)
そのうち、lがフレーム番号、kが周波数ポイント番号、βが利得函数の調節因子、

がメインマイク入力信号の後期残響周波数スペクトル、Xがメインマイク入力信号の周波数スペクトルである。
【0046】
式(10)から分かるように、利得函数の調節因子βによって利得函数G(l,k)の大きさを調節することができる。こうして、残響が弱い時にスペクトル減算を少なくするか又はしないようにすることができ、残響が弱く、音声の明瞭度が高い場合に音声を損傷しないことが保証され、音声品質が保護される。
【0047】
ステップ2.3 メインマイク入力信号の振幅スペクトル|X|に利得函数Gを乗算して、メインマイク入力信号の位相と組合わせて、メインマイク入力信号の残響除去後の周波数スペクトルDを得る。
ステップ2.3の入力:メインマイク入力信号の周波数スペクトルX(ステップ2.1の出力)、利得函数G(ステップ2.2の出力)。
ステップ2.3の出力:メインマイク入力信号の残響除去後の周波数スペクトルD(ステップ2.4の入力とする)。
具体的には、下記の式によって、メインマイク入力信号の残響除去後の周波数スペクトルD(l,k)を算出する。

(11)
そのうち、lがフレーム番号、kが周波数ポイント番号、|X(l,k)|がメインマイク入力信号の振幅スペクトル、G(l,k)が利得函数、phase(l,k)がメインマイク入力信号の位相である。
【0048】
ステップ2.4 メインマイク入力信号の残響除去後の周波数スペクトルDを時間ドメインに変換して、d(t)と記す。
ステップ2.4の入力:メインマイク入力信号の残響除去後の周波数スペクトルD(ステップ2.3の出力)。
ステップ2.4の出力:メインマイク入力信号の残響除去後の時間ドメイン信号d(t)(ステップ2.5の入力とする)。

(12)
【0049】
ステップ2.5 メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算して、メインマイク入力信号の残響低減後の連続信号x(t)を得る。
ステップ2.5の入力:メインマイク入力信号の残響除去後の時間ドメイン信号d(t)(ステップ2.4の出力)。
ステップ2.5の出力:メインマイク入力信号の残響低減後の連続信号x(t)(システム全体の出力)。
【0050】
図7Aは、本発明の実施例におけるメインマイク入力信号の時間ドメインの図である。図7Bは、本発明の実施例におけるメインマイクに対して残響除去後の時間ドメインの図である。図7Cは、本発明の実施例におけるメインマイク入力信号の音声スペクトログラムである。図7Dは、本発明の実施例におけるメインマイクに対して残響除去後の音声スペクトログラムである。
【0051】
図7A〜7Dを参照して、本実施例において、メインマイク及び補助マイクは音源と正対面しており、音源からデュアルマイクまでの垂直距離が2mで、メインマイクと補助マイクとの間隔が18cmである時、メインマイク入力信号から残響除去する前のC50が6.8dBであり、図4に示す方法を用いて残響除去した後のC50が10.5dBであり、ここから分かるように、本発明の方法を採用した後、C50が3.7dB向上した。
【0052】
図8は、本発明の実施例におけるデュアルマイクに基づく音声残響低減装置の全体構成図である。該装置は、メインマイク及び補助マイクに受信された信号に対してフレームごとに処理を行い、図8に示すように、残響スペクトル推定ユニット700とスペクトル減算ユニット800とを含む。
【0053】
前記残響スペクトル推定ユニット700は、メインマイク入力信号及び補助マイク入力信号を受信し、メインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出して、伝達関数h(t)のテーリング部分h(t)を取得するとともに、伝達関数h(t)によって残響の強さを判断して、利得函数の調節因子βを算出してスペクトル減算ユニット800に出力し、そして、補助マイク入力信号を用いてh(t)に畳み込みを行ってメインマイク入力信号の後期残響推定信号を得て、メインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行ってメインマイク入力信号の後期残響スペクトルを得てからスペクトル減算ユニット800に出力するために用いられる。
【0054】
前記スペクトル減算ユニット800は、メインマイク入力信号、残響スペクトル推定ユニット700から出力された利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルを受信し、メインマイク入力信号に対して時間ドメインから周波数ドメインへの変換を行ってメインマイク入力信号の周波数スペクトルを得て、メインマイク入力信号の周波数スペクトル、利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって利得函数を算出し、メインマイク入力信号の周波数スペクトルに利得函数を乗算してメインマイク入力信号の残響除去後の周波数スペクトルを得て、メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得て、メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してから、メインマイク入力信号の残響低減後の連続信号を出力するために用いられる。
【0055】
本発明の一つの実施例において、残響スペクトル推定ユニット700は、補助マイク入力信号を用いてh(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得てから、まずメインマイク入力信号の後期残響推定信号に対して周波数補償を行い、そして、周波数補償された信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得てからスペクトル減算ユニット800に出力する。
【0056】
図9は、本発明の一つの好ましい実施例におけるデュアルマイクに基づく音声残響低減装置の詳細な構成及びその入出力模式図である。図9を参照して、該デュアルマイクに基づく音声残響低減装置は、残響スペクトル推定ユニット91とスペクトル減算ユニット92とを含む。そのうち、残響スペクトル推定ユニット91は、伝達関数算出ユニット911、伝達関数テーリング算出ユニット912、残響強さ判断ユニット913、後期残響推定ユニット914、周波数補償ユニット915及び第一の時間/周波数変換ユニット916を含む。スペクトル減算ユニット92は、第二の時間/周波数変換ユニット921、利得函数算出ユニット922、残響除去ユニット923、周波数/時間変換ユニット924及び重畳加算ユニット925を含む。
【0057】
前記伝達関数算出ユニット911は、メインマイク入力信号及び補助マイク入力信号を受信し、メインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出するとともに、伝達関数h(t)を伝達関数テーリング算出ユニット912及び残響強さ判断ユニット913に出力するために用いられる。
【0058】
前記伝達関数テーリング算出ユニット912は、伝達関数h(t)のテーリング部分h(t)を求めて後期残響推定ユニット914に出力するために用いられる。伝達関数テーリング算出ユニット912は、具体的に、伝達関数h(t)の時間軸において早期残響と後期残響との境界点を取って、伝達関数h(t)の該境界点の前の値を0にセットして、伝達関数h(t)のテーリング部分h(t)を得る。
【0059】
前記残響強さ判断ユニット913は、伝達関数h(t)によって残響の強さを判断するとともに、利得函数の調節因子βを算出して利得函数算出ユニット922に出力するために用いられる。具体的に、残響強さ判断ユニット913は、前記の式(5)によって残響の強さを表すパラメータρを算出する。即ち、


そのうち、h(t)が補助マイクからメインマイクまでの伝達関数、Tがh(t)の時間軸においての指定された境界点である。
そして、残響強さ判断ユニット913は、前記の式(6)によって利得函数の調節因子βを算出する。即ち、


そのうち、ρとρが設定値を取る。例えば、ρが9dB、ρが2dBを取る(マイクの間隔が6cmである)。
【0060】
後期残響推定ユニット914は、補助マイク入力信号を受信し、補助マイク入力信号を用いてh(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得てから周波数補償ユニット915に出力するために用いられる。
【0061】
周波数補償ユニット915は、メインマイク入力信号の後期残響推定信号に対して周波数補償を行い、周波数補償が行われた信号を第一の時間/周波数変換ユニット916に出力するために用いられる。メインマイクと補助マイクとの間の距離が大きいほど、周波数補償ユニット915がメインマイク入力信号の後期残響推定信号に対して周波数補償を行う度合いが小さくなる。
【0062】
第一の時間/周波数変換ユニット916は、周波数補償が行われたメインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得てから利得函数算出ユニット922に出力するために用いられる。
【0063】
第二の時間/周波数変換ユニット921は、メインマイク入力信号を受信し、時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルを得てから利得函数算出ユニット922及び残響除去ユニット923に出力するために用いられる。
【0064】
利得函数算出ユニット922は、第二の時間/周波数変換ユニット921から出力されたメインマイク入力信号の周波数スペクトル、残響強さ判断ユニット913から出力された利得函数の調節因子β及び第一の時間/周波数変換ユニット916から出力されたメインマイク入力信号の後期残響スペクトルによって、利得函数を算出してから残響除去ユニット923に出力するために用いられる。利得函数算出ユニット922は、前記の式(10)によって利得函数G(l,k)を算出し得る。即ち、


そのうち、lがフレーム番号、kが周波数ポイント番号、βが利得函数の調節因子、

がメインマイク入力信号の後期残響周波数スペクトル、Xがメインマイク入力信号の周波数スペクトルである。
【0065】
残響除去ユニット923は、メインマイク入力信号の周波数スペクトルに利得函数を乗算して、メインマイク入力信号の残響除去後の周波数スペクトルを得てから、周波数/時間変換ユニット924に出力する。本実施例において、残響除去ユニット923は、前記の式(11)によって、メインマイク入力信号の残響除去後の周波数スペクトルD(l,k)を算出する。即ち、


そのうち、lがフレーム番号、kが周波数ポイント番号、|X(l,k)|がメインマイク入力信号の振幅、G(l,k)が利得函数、phase(l,k)がメインマイク入力信号の位相である。
【0066】
周波数/時間変換ユニット924は、メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得てから重畳加算ユニット925に出力するために用いられる。
【0067】
重畳加算ユニット925は、周波数/時間変換ユニット924から出力された時間ドメイン信号に対してフレームごとに重畳加算して、メインマイク入力信号の残響除去後の連続信号を得るために用いられる。
【0068】
以上をまとめて、本発明の実施例のようなデュアルマイクに基づく音声残響低減装置は、メインマイク及び補助マイクに受信された信号に対して、フレームごとに処理を行う。該装置における残響スペクトル推定ユニット700は、メインマイクの入力信号x(t)及び補助マイク入力信号x(t)を受信し、x(t)及びx(t)によって補助マイクからメインマイクまでの伝達関数h(t)を算出して、h(t)のテーリング部分h(t)を取得するとともに、h(t)によって残響の強さを判断して、利得函数の調節因子βを算出して該装置におけるスペクトル減算ユニット800に出力する。このとき、x(t)を用いてh(t)に畳み込みを行って、x(t)の後期残響推定信号

を得て、

に対して時間ドメインから周波数ドメインへの変換を行って、x(t)の後期残響スペクトル

を得てから該装置におけるスペクトル減算ユニット800に出力するために用いられる。該装置におけるスペクトル減算ユニット800は、x(t)に対して時間ドメインから周波数ドメインへの変換を行って、x(t)の周波数スペクトルを得て、x(t)の周波数スペクトル、前記β及び

によって利得函数を算出し、x(t)の周波数スペクトルに利得函数を乗算して、x(t)の残響除去後の周波数スペクトルを得て、周波数ドメインから時間ドメインへの変換を行って、x(t)の残響除去後の時間ドメイン信号を得るために用いられる。
【0069】
本発明のような装置において、補助マイク入力信号x(t)とh(t)に畳み込みを行うことによりメインマイク入力信号x(t)の後期残響推定信号

を得てから、スペクトル減算法によって、メインマイク入力信号x(t)の周波数スペクトルからメインマイク入力信号の後期残響推定スペクトル

を差し引くため、メインマイクの入力信号x(t)からその後期残響を効果的に除去するとともに早期残響を保留することができ、音声の品質が向上する。同時に、本発明の後期残響を推定するプロセスに、残響の強さによってスペクトル減算の強度を調節し、残響が弱い時にスペクトル減算を少なくするか又はしないようにして、残響が弱く、音声の明瞭度が高い場合に音声を損傷しないことが保証され、音声品質が保護される。そして、このような装置において、直接音の到来方向を正確に推定する必要がないため、マイクが高い一致性を持つことが要求されることなく、音響設計に対しても厳しい制限がない。
【0070】
ここから分かるように、本発明の技術手段は、残響を除去すると同時に音声を有効に保護し、部屋の残響の強さの度合いを自動的に推定し、種々の環境においても適切な処理を選択して、最適に近い音声品質に達する。そして、マイクの一致性及び音響設計に対して厳しい制限がなく、応用がより柔軟で便利である。
【0071】
上述したのは、あくまでも本発明の好ましい実施例であり、本発明の保護範囲を限定するためのものではない。本発明の精神及び原則内になされたあらゆる変更、均等置換、改良等は、いずれも本発明の保護範囲内に含まれるものとする。
図1
図2
図3
図4
図5A
図5B
図5C
図5D
図6A
図6B
図7A
図7B
図7C
図7D
図8
図9