(58)【調査した分野】(Int.Cl.,DB名)
メインマイク入力信号及び補助マイク入力信号を受信し、フレームごとにメインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出する処理と、
前記伝達関数h(t)のテーリング部分hr(t)を取得するとともに、該伝達関数h(t)によって残響の強さを判断して利得函数の調節因子βを算出する処理と、
前記補助マイク入力信号を用いてhr(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得る処理と、
前記メインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得て、メインマイク入力信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルを得る処理と、
前記メインマイク入力信号の周波数スペクトル、前記利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって、利得函数を算出する処理と、
前記メインマイク入力信号の周波数スペクトルに利得函数を乗算して、メインマイク入力信号の残響除去後の周波数スペクトルを得る処理と、
前記メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得る処理と、
前記メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してからメインマイク入力信号の残響除去後の連続信号を出力する処理とを、
行うことを含むことを特徴とするデュアルマイクに基づく音声残響低減方法。
前記残響スペクトル推定ユニットは、伝達関数算出ユニット、伝達関数テーリング算出ユニット、残響強さ判断ユニット、後期残響推定ユニット及び第一の時間/周波数変換ユニットを含み、更に周波数補償ユニットを含み、
前記スペクトル減算ユニットは、第二の時間/周波数変換ユニット、利得函数算出ユニット、残響除去ユニット、周波数/時間変換ユニット及び重畳加算ユニットを含み、そのうち、
伝達関数算出ユニットは、メインマイク入力信号及び補助マイク入力信号を受信し、メインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出して、伝達関数h(t)を伝達関数テーリング算出ユニット及び残響強さ判断ユニットに出力するために用いられ、
伝達関数テーリング算出ユニットは、前記伝達関数h(t)のテーリング部分hr(t)を求めて後期残響推定ユニットに出力するために用いられ、
残響強さ判断ユニットは、前記伝達関数h(t)によって残響の強さを判断し、利得函数の調節因子βを算出して利得函数算出ユニットに出力するために用いられ、
後期残響推定ユニットは、前記補助マイク入力信号を受信し、補助マイク入力信号を用いてhr(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得てから周波数補償ユニットに出力するために用いられ、
周波数補償ユニットは、前記メインマイク入力信号の後期残響推定信号に対して周波数補償を行って、第一の時間/周波数変換ユニットに出力するために用いられ、そのうち、メインマイクと補助マイクとの間の距離が大きいほど、メインマイク入力信号の後期残響推定信号に対して周波数補償を行う度合いが小さくなり、
第一の時間/周波数変換ユニットは、前記周波数補償されたメインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得てから利得函数算出ユニットに出力するために用いられ、
第二の時間/周波数変換ユニットは、前記メインマイク入力信号を受信し、時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルを得て利得函数算出ユニットに出力するために用いられ、
利得函数算出ユニットは、前記第二の時間/周波数変換ユニットから出力されたメインマイク入力信号の周波数スペクトル、残響強さ判断ユニットから出力された利得函数の調節因子β及び第一の時間/周波数変換ユニットから出力されたメインマイク入力信号の後期残響スペクトルによって、利得函数を算出して、残響除去ユニットに出力するために用いられ、
残響除去ユニットは、前記メインマイク入力信号の周波数スペクトルに利得函数を乗算して、メインマイク入力信号の残響除去後の周波数スペクトルを得て、周波数/時間変換ユニットに出力し、
周波数/時間変換ユニットは、前記メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得て、重畳加算ユニットに出力するために用いられ、
重畳加算ユニットは、前記メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してから、メインマイク入力信号の残響除去後の連続信号を出力するために用いられる、
ことを特徴とする請求項6に記載のデュアルマイクに基づく音声残響低減装置。
前記伝達関数テーリング算出ユニットは、前記伝達関数h(t)の時間軸において早期残響と後期残響との境界点を取って、伝達関数h(t)の該境界点の前の値を0にセットして、伝達関数h(t)のテーリング部分hr(t)を得るために用いられることを特徴とする請求項7に記載のデュアルマイクに基づく音声残響低減装置。
【発明を実施するための形態】
【0010】
まず、初めに、本出願書類の記載において、出願書類の簡潔のために、「マイクロフォン」を「マイク」と略称することとする。
従来技術に対する分析により、より良く残響を低減するために、後期残響を除去すると同時に直接音と早期残響とを保護する必要があるので、正確で安定な後期残響推定及び残響強さ判断が必要とされる。
【0011】
本発明は、デュアルマイク(メインマイク及び補助マイク)に基づく残響除去の手段を提出しており、残響とデュアルマイク空間の伝達関数との間の近似関係を十分に利用しており、デュアルマイク空間の伝達関数によって後期残響を推定するとともに残響の強さを判断し、スペクトル減算モジュールに合わせて、種々の残響環境においても明瞭度が満たされると同時に、最適に近い音声品質が得られる。また、本発明における手段は、直接音を分離する必要もなく、到来方向の推定を行う必要もないため、マイクの一致性が要求されることなく、音響設計に対する要求が緩和される。
【0012】
本発明の基本的な原理は、下記の通りになる。デュアルマイクの間の伝達関数の尾部によって後期残響を推定するため、スペクトル減算において直接音と早期残響を良好に保留することができる。そして、後期残響を推定するプロセスに、更に、デュアルマイクの間の伝達関数の頭部と尾部とのエネルギー差によって部屋の残響度合いを推定し、スペクトル減算の強度を調節し、残響が弱い時にスペクトル減算を少なくするか又はしないようにして、音声品質を保護する。
【0013】
本発明の技術手段を明らかにするために、以下、本発明の技術原理について分析説明を行う。
早期残響信号は、音声に対して強調作用を果たすことができるが、後期残響は、音声の明瞭度を低減することになる。
図1は、本発明の実施例に挙げられた励磁信号からマイク入力信号までの伝達関数のグラフである。
図1を参照して、励磁信号からマイク入力信号までの伝達関数において、ピークが最大の箇所は、直接音に対応しており、通常、最大ピークから離れた或る点を、早期反射と後期反射との境界点として、最大ピークから境界点までの部分が早期残響に対応し、境界点以降の部分が後期残響に対応する。
図1において、該境界点が50msである。
【0014】
励磁信号をs(t)、マイク入力信号をx(t)、励磁信号からマイク入力信号までの伝達関数をtf(t)、直接音と早期残響に対応する部分の伝達関数をtf
d(t)、後期残響に対応する部分の伝達関数をtf
r(t)とそれぞれ記すと、マイク入力信号は、励磁信号と伝達関数との畳み込みx(t)=s(t)*tf(t)と表すことができ、マイク入力信号の直接音と早期残響成分は、x
d(t)=s(t)*tf
d(t)と表すことができ、マイク入力信号の後期残響成分は、x
r(t)=s(t)*tf
r(t)と表すことができる。従って、マイク入力信号はx(t)=s(t)*tf(t)=s(t)*(tf
d(t)+tf
r(t))=x
d(t)+x
r(t)と表すこともできる。
【0015】
音声の明瞭度はC
50で表してもよい。その数式は、下記の通りになる。
(1)
w(t)は、励磁信号からマイク入力信号までの伝達関数である。0〜50msが直接音と早期残響部分に対応し、50ms以降が後期残響部分に対応する。残響が強いほど、C
50の値が小さくなる。残響除去前後のC
50の向上が残響除去効果を反映し得るため、C
50は、残響除去の客観的評価指標としてもよい。
【0016】
本発明において、デュアルマイク(メインマイク及び補助マイク)に基づく残響推定原理は、下記の通りになる。
図2に示すように、メインマイクの入力信号をx
2(t)、補助マイクの入力信号をx
1(t)、補助マイクからメインマイクまでの伝達関数をh(t)とそれぞれ記す。
図2は、本発明の実施例に挙げられた補助マイクからメインマイクまでの伝達関数h(t)のグラフである。
【0017】
メインマイクの入力信号x
2(t)が、補助マイクの入力信号x
1(t)と伝達関数h(t)との畳み込みに等しい。
(2)
h(t)は、頭部と尾部との二つの部分に分けることができる。
(3)
そのうち、h
d(t)がh(t)の頭部を表し、h
r(t)がh(t)の尾部を表す。
h(t)のテーリング部分h
r(t)は、信号の、空間における複数回の反射を反映しているため、h(t)のテーリング部分h
r(t)と補助マイク入力信号x
1(t)との畳み込み信号
は、メインマイクの後期残響成分に近く、メインマイク後期残響成分の推定信号とされる。h(t)において一つの点を選び取ってh
d(t)とh
r(t)の境界点として、h(t)の境界点の前の値を0にセットして、h
r(t)が得られる。境界点からh(t)の最大ピークまでの距離範囲を30ms〜80ms(経験値)に設置することができる。経験により、境界点からh(t)までの最大ピークが50ms以上である場合、メインマイクの後期残響推定信号
には、直接音と早期反射成分がまったく残留せず、音声への損傷を低減し得るため、本発明の実施例において、境界点として50msを取ることを例として説明を行う。
【0018】
本発明の目的、技術手段及び利点を更に明らかにするために、以下、図面を参照しながら、本発明の実施形態について更に詳しい説明を行う。
図3は、本発明の一つの実施例におけるデュアルマイクに基づく音声残響低減方法の流れの模式図である。
図3に示すように、該方法は、主に、残響スペクトル推定部分とスペクトル減算部分とを含み、具体的には、フレームごとに下記の処理を行う。
【0019】
ステップ1.1 メインマイク入力信号x
2(t)及び補助マイク入力信号x
1(t)を受信し、メインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出する。
ステップ1.2 伝達関数h(t)のテーリング部分h
r(t)を取得する。
ステップ1.3 そして、伝達関数h(t)によって残響の強さを判断して、利得函数の調節因子βを算出する。
ステップ1.4 補助マイク入力信号を用いてh
r(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号
を得る。
ステップ1.5 メインマイク入力信号の後期残響推定信号
に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトル
を得る。
【0020】
ステップ2.1 メインマイク入力信号x
2(t)に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルX
2を得る。
ステップ2.2 メインマイク入力信号の周波数スペクトルX
2、利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトル
によって、利得函数Gを算出する。
ステップ2.3 メインマイク入力信号の周波数スペクトルX
2に利得函数Gを乗算して、メインマイク入力信号の残響除去後の周波数スペクトルDを得る。
ステップ2.4 メインマイク入力信号の残響除去後の周波数スペクトルDに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号d(t)を得る。
ステップ2.5 メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してから、メインマイク入力信号の残響低減後の連続信号x
d(t)を出力する。
【0021】
図3に示す方法において、補助マイク入力信号を用いてh
r(t)に畳み込みを行うことによりメインマイク入力信号の後期残響推定信号を得てから、スペクトル減算法によってメインマイク入力信号の周波数スペクトルからメインマイク入力信号の後期残響推定スペクトルを差し引くため、メインマイクの入力信号からその後期残響を効果的に除去するとともに早期残響を保留することができ、音声の品質が向上する。また、
図3に示す方法では、後期残響を推定するプロセスに、残響の強さによってスペクトル減算の強度を調節し、残響が弱い時にスペクトル減算を少なくするか又はしないようにして、残響が弱く、音声の明瞭度がそもそも高い場合に音声品質を損傷しないことが保証され、音声品質が保護される。そして、このような方法において、直接音の到来方向を正確に推定する必要がないため、マイクが高い一致性を持つことが要求されることなく、音響設計に対しても厳しい制限がない。
【0022】
本発明の一つの実施例において、
図3に示す方法に加えて、メインマイク入力信号の後期残響推定信号とメインマイク入力信号の真実の後期残響成分とを比べ、後期残響推定信号の低周波数域部分での推定不足という問題を更に考慮して、異なるマイク間隔に応じて、ローパスフィルタを設けて、後期残響推定信号に対して対応する周波数補償を行う。具体的には、
図4に示す実施例を参照する。
【0023】
図4は、本発明のその他の実施例におけるデュアルマイクに基づく音声残響低減方法の全体的な流れの模式図である。
図4に示すように、システム全体の入力が補助マイク入力信号x
1(t)及びメインマイク入力信号x
2(t)であり、出力が残響低減後の信号x
d(t)である。大きくいうと、残響スペクトル推定プロセスとスペクトル減算プロセスという二つの部分を含む。
図4は、
図3に示す方法の流れと比べると、後期残響推定信号に対して周波数補償を行うステップが追加される(
図4において、後期残響推定信号に対して周波数補償を行うステップがステップ1.45であり、時間ドメイン/周波数ドメイン変換ステップは
図3と同じくステップ1.5と記す)。以下、
図4を参照しながら該方法を詳しく説明する。
【0024】
1.残響スペクトル推定
入力:補助マイクの入力信号x
1(t)、メインマイクの入力信号x
2(t)。
出力:利得函数の調節因子β(スペクトル減算プロセスにおいての一つの入力とする)、メインマイク入力信号の後期残響スペクトル
(スペクトル減算プロセスにおいての一つの入力とする)。
残響スペクトル推定は、ステップ1.1、ステップ1.2、ステップ1.3、ステップ1.4、ステップ1.45、ステップ1.5との六つのステップを含む。
【0025】
2.スペクトル減算
入力:メインマイク入力信号x
2(t)、利得函数の調節因子β(残響スペクトル推定プロセスにおいての出力)、メインマイク入力信号の後期残響スペクトル
(残響スペクトル推定プロセスにおいての出力)。
出力:メインマイク入力信号の残響低減後の信号x
d(t)(システム全体の出力でもある)。
スペクトル減算プロセスは、ステップ2.1、ステップ2.2、ステップ2.3、ステップ2.4、ステップ2.5との五つのステップを含む。
【0026】
以下、残響スペクトル推定プロセス及びスペクトル減算プロセスにおける各ステップ及びそれらの間の関係を詳しく説明する。
1.残響スペクトル推定プロセス
ステップ1.1 補助マイクからメインマイクまでの伝達関数h(t)を算出する。
ステップ1.1の入力:補助マイクの入力信号x
1(t)及びメインマイクの入力信号x
2(t)。
ステップ1.1の出力:補助マイクからメインマイクまでの伝達関数h(t)(ステップ1.2の入力とする)。
【0027】
本発明の一つの実施例において、補助マイク入力信号x
1(t)とメインマイク入力信号x
2(t)とのクロスパワースペクトルP
x2x1及び補助マイク入力信号x
1(t)のパワースペクトルP
x1x1を用いて伝達関数Hを算出する。
(4)
周波数ドメインの伝達関数Hに対して逆フーリエ変換を行って、時間ドメインの伝達関数h(t)を得る。
本発明のその他の実施例において、h(t)の計算は、例えば適応フィルタリングの方法等の異なる方法を用いてもよく、ここでは詳述しない。
【0028】
ステップ1.2 伝達関数h(t)のテーリング部分h
r(t)を求める。
ステップ1.2の入力:補助マイクからメインマイクまでの伝達関数h(t)(ステップ1.1の出力)。
ステップ1.2の出力:補助マイクからメインマイクまでの伝達関数のテーリング部分h
r(t)(ステップ1.4の入力とする)。
【0029】
本発明の実施例において、伝達関数h(t)の時間軸において、早期残響と後期残響との境界点を取って、伝達関数h(t)における該境界点の前の値を0にセットして、伝達関数h(t)のテーリング部分h
r(t)を得る。本発明の一つの好ましい実施例において、伝達関数h(t)において一つの点を選び取って、この点のh(t)までの最大ピークの距離を50msにして、h(t)における該点の前の値を0にセットして、テーリング部分h
r(t)と記す。
【0030】
ステップ1.3 補助マイクからメインマイクまでの伝達関数h(t)により残響の強さを判断し、利得函数の調節因子βを求める。
ステップ1.3の入力:補助マイクからメインマイクまでの伝達関数h(t)(ステップ1.1の出力)。
ステップ1.3の出力:利得函数の調節因子β(スペクトル減算プロセスにおいての一つの入力とする)。
【0031】
残響が弱い場合の残響除去による音声に対する損傷を減少するため、このステップ1.3において、残響の強さを判断することで利得函数の調節因子βを算出する。本発明の実施例において、補助マイクからメインマイクまでの伝達関数の頭部のエネルギーとテーリング部分のエネルギーとの比に対して、対数を取ってρと記す。
(5)
そのうち、h(t)が補助マイクからメインマイクまでの伝達関数であり、Tがh(t)の時間軸においての指定された境界点である。該境界点Tは、必ずしも早期残響と後期残響との境界点ではないが、該境界点Tの前は、必ず直接音を含み、更に、早期残響の一部又は全部を含んでもよい。
【0032】
図5Aは、本発明の実施例における音源からメインマイクまでの距離が0.5mである時の補助マイクからメインマイクまでの伝達関数のグラフである。音源からメインマイクまでの距離がL=0.5mであると、Tの数値範囲が20ms〜50msであり、ここでTが50ms(即ち境界点Tがh(t)の最大ピークから50ms離れた時間点)を取る時、音声の明瞭度指標がC
50=12.3dB、ρ=9.4dBである。
【0033】
図5Bは、本発明の実施例における音源からメインマイクまでの距離が1mである時の補助マイクからメインマイクまでの伝達関数のグラフである。音源からメインマイクまでの距離がL=1mであると、Tの数値範囲が20ms〜50msであり、ここでTが50ms(即ち境界点Tがh(t)の最大ピークから50ms離れた時間点)を取る時、音声の明瞭度指標がC
50=8.1dB、ρ=6.0dBである。
【0034】
図5Cは、本発明の実施例における音源からメインマイクまでの距離が2mである時の補助マイクからメインマイクまでの伝達関数のグラフである。音源からメインマイクまでの距離がL=2mであると、Tの数値範囲が20ms〜50msであり、ここでTが50ms(即ち境界点Tがh(t)の最大ピークから50ms離れた時間点)を取る時、音声の明瞭度指標がC
50=5.4dB、ρ=3.7dBである。
【0035】
図5Dは、本発明の実施例における音源からメインマイクまでの距離が4mである時の補助マイクからメインマイクまでの伝達関数のグラフである。音源からメインマイクまでの距離がL=4mであると、Tの数値範囲が20ms〜50msであり、ここでTが50ms(即ち境界点Tがh(t)の最大ピークから50ms離れた時間点)を取る時、音声の明瞭度指標がC
50=4.5dB、ρ=2.2dBである。
【0036】
音源がマイクから遠ざかるほど、残響が強くなる。
図5A〜
図5Dから分かるように、残響が強くなるにつれて、補助マイクからメインマイクまでの伝達関数の頭部のエネルギーが低くなり、テーリング部分のエネルギーが高くなり、二者の比について取る対数ρが残響の強さを反映することができる。残響が強くなるにつれて、ρの値がだんだん小さくなる。従って、ρの値によって残響の強さを判断するとともに、これによって利得函数の調節因子βを求める。
【0037】
前記調節因子βを算出するには複数の方式があり、式(6)は、本発明の実施例におけるβを算出する経験式である。
(6)
ρ
1及びρ
2が設定値を取り、経験値であり、本発明の実施例において、ρ
1が9dB、ρ
2が2dBを取る(マイク間隔が6cmである)。
【0038】
ステップ1.4 補助マイクの入力信号x
1(t)と、補助マイクからメインマイクまでの伝達関数のテーリング部分h
r(t)とに畳み込みを行って、メインマイク入力信号の後期残響推定信号
を得る。
ステップ1.4の入力:補助マイクの入力信号x
1(t)、補助マイクからメインマイクまでの伝達関数のテーリング部分h
r(t)(ステップ1.2の出力)。
ステップ1.4の出力:メインマイク入力信号の後期残響推定信号
(ステップ1.45の入力とする)。
具体的には、下記の式のようになる。
(7)
【0039】
ステップ1.45 メインマイク入力信号の後期残響推定信号
に対して周波数補償を行い、補償後の信号
を得る。
ステップ1.45の入力:メインマイク入力信号の後期残響推定信号
(ステップ1.4の出力)。
ステップ1.45の出力:周波数補償が行われたメインマイク入力信号の後期残響推定信号
(ステップ1.5の入力とする)。
【0040】
メインマイク入力信号の後期残響推定信号
とメインマイク入力信号の真実の後期残響成分とを比べると、後期残響推定信号
は、低周波数域部分において推定不足である。そのため、本発明において、メインマイク入力信号の後期残響推定信号
に対して周波数補償を行う。メインマイクと補助マイクとの間の間隔は、後期残響推定信号
に影響を及ぼすため、本発明の実施例において、異なるマイク間隔に応じてローパスフィルタを設けて、後期残響推定信号に対して対応する周波数補償を行い、補償後の後期残響推定信号
を得る。
【0041】
図6Aは、本発明の実施例におけるメインマイクと補助マイクとの間の間隔が6cmである時の周波数補償フィルタの振幅周波数特性のグラフである。
図6Bは、本発明の実施例におけるメインマイクと補助マイクとの間の間隔が18cmである時の周波数補償フィルタの振幅周波数特性のグラフである。ここから分かるように、本発明の実施例において、メインマイクと補助マイクとの間の距離が大きいほど、メインマイク入力信号の後期残響推定信号
の低周波数域部分に対して周波数補償を行う度合いが小さくなる。
【0042】
ステップ1.5 周波数補償が行われたメインマイク入力信号の後期残響推定信号
を時間ドメインから周波数ドメインに変換して、メインマイク入力信号の後期残響スペクトル
を得る。
ステップ1.5の入力:周波数補償が行われたメインマイク入力信号の後期残響推定信号
(ステップ1.45の出力)。
ステップ1.5の出力:メインマイク入力信号の後期残響スペクトル
(スペクトル減算プロセスにおいての一つの入力とする)。
周波数補償が行われたメインマイクの後期残響推定信号
を周波数ドメインに変換して、メインマイク入力信号の後期残響スペクトル
が得られる。
(8)
【0043】
2.スペクトル減算プロセス
ステップ2.1 メインマイクの入力信号x
2(t)を時間ドメインから周波数ドメインに変換して、X
2と記す。
ステップ2.1の入力:メインマイクの入力信号x
2(t)。
ステップ2.1の出力:メインマイク入力信号の周波数スペクトルX
2(ステップ2.2の入力とされる)。
具体的には、下記の式のようになる。
(9)
【0044】
ステップ2.2 メインマイク入力信号の周波数スペクトルX
2及び推定されたメインマイクの後期残響スペクトル
から利得函数Gを算出するとともに、調節因子βによって利得函数を調節する。
ステップ2.2の入力:メインマイク入力信号の周波数スペクトルX
2(ステップ2.1の出力)、メインマイクの後期残響スペクトル
(残響スペクトル推定プロセスにおいてのステップ1.5の出力)、利得函数の調節因子β(残響スペクトル推定プロセスにおいてのステップ1.3の出力)。
ステップ2.2の出力:利得函数G(ステップ2.3の一つの入力とする)。
【0045】
本発明の一つの実施例において、パワースペクトル減算法を用いて、下記の式によって利得函数G(l,k)を算出する。
(10)
そのうち、lがフレーム番号、kが周波数ポイント番号、βが利得函数の調節因子、
がメインマイク入力信号の後期残響周波数スペクトル、X
2がメインマイク入力信号の周波数スペクトルである。
【0046】
式(10)から分かるように、利得函数の調節因子βによって利得函数G(l,k)の大きさを調節することができる。こうして、残響が弱い時にスペクトル減算を少なくするか又はしないようにすることができ、残響が弱く、音声の明瞭度が高い場合に音声を損傷しないことが保証され、音声品質が保護される。
【0047】
ステップ2.3 メインマイク入力信号の振幅スペクトル|X
2|に利得函数Gを乗算して、メインマイク入力信号の位相と組合わせて、メインマイク入力信号の残響除去後の周波数スペクトルDを得る。
ステップ2.3の入力:メインマイク入力信号の周波数スペクトルX
2(ステップ2.1の出力)、利得函数G(ステップ2.2の出力)。
ステップ2.3の出力:メインマイク入力信号の残響除去後の周波数スペクトルD(ステップ2.4の入力とする)。
具体的には、下記の式によって、メインマイク入力信号の残響除去後の周波数スペクトルD(l,k)を算出する。
(11)
そのうち、lがフレーム番号、kが周波数ポイント番号、|X
2(l,k)|がメインマイク入力信号の振幅スペクトル、G(l,k)が利得函数、phase(l,k)がメインマイク入力信号の位相である。
【0048】
ステップ2.4 メインマイク入力信号の残響除去後の周波数スペクトルDを時間ドメインに変換して、d(t)と記す。
ステップ2.4の入力:メインマイク入力信号の残響除去後の周波数スペクトルD(ステップ2.3の出力)。
ステップ2.4の出力:メインマイク入力信号の残響除去後の時間ドメイン信号d(t)(ステップ2.5の入力とする)。
(12)
【0049】
ステップ2.5 メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算して、メインマイク入力信号の残響低減後の連続信号x
d(t)を得る。
ステップ2.5の入力:メインマイク入力信号の残響除去後の時間ドメイン信号d(t)(ステップ2.4の出力)。
ステップ2.5の出力:メインマイク入力信号の残響低減後の連続信号x
d(t)(システム全体の出力)。
【0050】
図7Aは、本発明の実施例におけるメインマイク入力信号の時間ドメインの図である。
図7Bは、本発明の実施例におけるメインマイクに対して残響除去後の時間ドメインの図である。
図7Cは、本発明の実施例におけるメインマイク入力信号の音声スペクトログラムである。
図7Dは、本発明の実施例におけるメインマイクに対して残響除去後の音声スペクトログラムである。
【0051】
図7A〜7Dを参照して、本実施例において、メインマイク及び補助マイクは音源と正対面しており、音源からデュアルマイクまでの垂直距離が2mで、メインマイクと補助マイクとの間隔が18cmである時、メインマイク入力信号から残響除去する前のC
50が6.8dBであり、
図4に示す方法を用いて残響除去した後のC
50が10.5dBであり、ここから分かるように、本発明の方法を採用した後、C
50が3.7dB向上した。
【0052】
図8は、本発明の実施例におけるデュアルマイクに基づく音声残響低減装置の全体構成図である。該装置は、メインマイク及び補助マイクに受信された信号に対してフレームごとに処理を行い、
図8に示すように、残響スペクトル推定ユニット700とスペクトル減算ユニット800とを含む。
【0053】
前記残響スペクトル推定ユニット700は、メインマイク入力信号及び補助マイク入力信号を受信し、メインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出して、伝達関数h(t)のテーリング部分h
r(t)を取得するとともに、伝達関数h(t)によって残響の強さを判断して、利得函数の調節因子βを算出してスペクトル減算ユニット800に出力し、そして、補助マイク入力信号を用いてh
r(t)に畳み込みを行ってメインマイク入力信号の後期残響推定信号を得て、メインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行ってメインマイク入力信号の後期残響スペクトルを得てからスペクトル減算ユニット800に出力するために用いられる。
【0054】
前記スペクトル減算ユニット800は、メインマイク入力信号、残響スペクトル推定ユニット700から出力された利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルを受信し、メインマイク入力信号に対して時間ドメインから周波数ドメインへの変換を行ってメインマイク入力信号の周波数スペクトルを得て、メインマイク入力信号の周波数スペクトル、利得函数の調節因子β及びメインマイク入力信号の後期残響スペクトルによって利得函数を算出し、メインマイク入力信号の周波数スペクトルに利得函数を乗算してメインマイク入力信号の残響除去後の周波数スペクトルを得て、メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得て、メインマイク入力信号の残響除去後の時間ドメイン信号を、フレームごとに重畳加算してから、メインマイク入力信号の残響低減後の連続信号を出力するために用いられる。
【0055】
本発明の一つの実施例において、残響スペクトル推定ユニット700は、補助マイク入力信号を用いてh
r(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得てから、まずメインマイク入力信号の後期残響推定信号に対して周波数補償を行い、そして、周波数補償された信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得てからスペクトル減算ユニット800に出力する。
【0056】
図9は、本発明の一つの好ましい実施例におけるデュアルマイクに基づく音声残響低減装置の詳細な構成及びその入出力模式図である。
図9を参照して、該デュアルマイクに基づく音声残響低減装置は、残響スペクトル推定ユニット91とスペクトル減算ユニット92とを含む。そのうち、残響スペクトル推定ユニット91は、伝達関数算出ユニット911、伝達関数テーリング算出ユニット912、残響強さ判断ユニット913、後期残響推定ユニット914、周波数補償ユニット915及び第一の時間/周波数変換ユニット916を含む。スペクトル減算ユニット92は、第二の時間/周波数変換ユニット921、利得函数算出ユニット922、残響除去ユニット923、周波数/時間変換ユニット924及び重畳加算ユニット925を含む。
【0057】
前記伝達関数算出ユニット911は、メインマイク入力信号及び補助マイク入力信号を受信し、メインマイク入力信号及び補助マイク入力信号によって、補助マイクからメインマイクまでの伝達関数h(t)を算出するとともに、伝達関数h(t)を伝達関数テーリング算出ユニット912及び残響強さ判断ユニット913に出力するために用いられる。
【0058】
前記伝達関数テーリング算出ユニット912は、伝達関数h(t)のテーリング部分h
r(t)を求めて後期残響推定ユニット914に出力するために用いられる。伝達関数テーリング算出ユニット912は、具体的に、伝達関数h(t)の時間軸において早期残響と後期残響との境界点を取って、伝達関数h(t)の該境界点の前の値を0にセットして、伝達関数h(t)のテーリング部分h
r(t)を得る。
【0059】
前記残響強さ判断ユニット913は、伝達関数h(t)によって残響の強さを判断するとともに、利得函数の調節因子βを算出して利得函数算出ユニット922に出力するために用いられる。具体的に、残響強さ判断ユニット913は、前記の式(5)によって残響の強さを表すパラメータρを算出する。即ち、
そのうち、h(t)が補助マイクからメインマイクまでの伝達関数、Tがh(t)の時間軸においての指定された境界点である。
そして、残響強さ判断ユニット913は、前記の式(6)によって利得函数の調節因子βを算出する。即ち、
そのうち、ρ
1とρ
2が設定値を取る。例えば、ρ
1が9dB、ρ
2が2dBを取る(マイクの間隔が6cmである)。
【0060】
後期残響推定ユニット914は、補助マイク入力信号を受信し、補助マイク入力信号を用いてh
r(t)に畳み込みを行って、メインマイク入力信号の後期残響推定信号を得てから周波数補償ユニット915に出力するために用いられる。
【0061】
周波数補償ユニット915は、メインマイク入力信号の後期残響推定信号に対して周波数補償を行い、周波数補償が行われた信号を第一の時間/周波数変換ユニット916に出力するために用いられる。メインマイクと補助マイクとの間の距離が大きいほど、周波数補償ユニット915がメインマイク入力信号の後期残響推定信号に対して周波数補償を行う度合いが小さくなる。
【0062】
第一の時間/周波数変換ユニット916は、周波数補償が行われたメインマイク入力信号の後期残響推定信号に対して時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の後期残響スペクトルを得てから利得函数算出ユニット922に出力するために用いられる。
【0063】
第二の時間/周波数変換ユニット921は、メインマイク入力信号を受信し、時間ドメインから周波数ドメインへの変換を行って、メインマイク入力信号の周波数スペクトルを得てから利得函数算出ユニット922及び残響除去ユニット923に出力するために用いられる。
【0064】
利得函数算出ユニット922は、第二の時間/周波数変換ユニット921から出力されたメインマイク入力信号の周波数スペクトル、残響強さ判断ユニット913から出力された利得函数の調節因子β及び第一の時間/周波数変換ユニット916から出力されたメインマイク入力信号の後期残響スペクトルによって、利得函数を算出してから残響除去ユニット923に出力するために用いられる。利得函数算出ユニット922は、前記の式(10)によって利得函数G(l,k)を算出し得る。即ち、
そのうち、lがフレーム番号、kが周波数ポイント番号、βが利得函数の調節因子、
がメインマイク入力信号の後期残響周波数スペクトル、X
2がメインマイク入力信号の周波数スペクトルである。
【0065】
残響除去ユニット923は、メインマイク入力信号の周波数スペクトルに利得函数を乗算して、メインマイク入力信号の残響除去後の周波数スペクトルを得てから、周波数/時間変換ユニット924に出力する。本実施例において、残響除去ユニット923は、前記の式(11)によって、メインマイク入力信号の残響除去後の周波数スペクトルD(l,k)を算出する。即ち、
そのうち、lがフレーム番号、kが周波数ポイント番号、|X
2(l,k)|がメインマイク入力信号の振幅、G(l,k)が利得函数、phase(l,k)がメインマイク入力信号の位相である。
【0066】
周波数/時間変換ユニット924は、メインマイク入力信号の残響除去後の周波数スペクトルに対して周波数ドメインから時間ドメインへの変換を行って、メインマイク入力信号の残響除去後の時間ドメイン信号を得てから重畳加算ユニット925に出力するために用いられる。
【0067】
重畳加算ユニット925は、周波数/時間変換ユニット924から出力された時間ドメイン信号に対してフレームごとに重畳加算して、メインマイク入力信号の残響除去後の連続信号を得るために用いられる。
【0068】
以上をまとめて、本発明の実施例のようなデュアルマイクに基づく音声残響低減装置は、メインマイク及び補助マイクに受信された信号に対して、フレームごとに処理を行う。該装置における残響スペクトル推定ユニット700は、メインマイクの入力信号x
2(t)及び補助マイク入力信号x
1(t)を受信し、x
2(t)及びx
1(t)によって補助マイクからメインマイクまでの伝達関数h(t)を算出して、h(t)のテーリング部分h
r(t)を取得するとともに、h(t)によって残響の強さを判断して、利得函数の調節因子βを算出して該装置におけるスペクトル減算ユニット800に出力する。このとき、x
1(t)を用いてh
r(t)に畳み込みを行って、x
2(t)の後期残響推定信号
を得て、
に対して時間ドメインから周波数ドメインへの変換を行って、x
2(t)の後期残響スペクトル
を得てから該装置におけるスペクトル減算ユニット800に出力するために用いられる。該装置におけるスペクトル減算ユニット800は、x
2(t)に対して時間ドメインから周波数ドメインへの変換を行って、x
2(t)の周波数スペクトルを得て、x
2(t)の周波数スペクトル、前記β及び
によって利得函数を算出し、x
2(t)の周波数スペクトルに利得函数を乗算して、x
2(t)の残響除去後の周波数スペクトルを得て、周波数ドメインから時間ドメインへの変換を行って、x
2(t)の残響除去後の時間ドメイン信号を得るために用いられる。
【0069】
本発明のような装置において、補助マイク入力信号x
1(t)とh
r(t)に畳み込みを行うことによりメインマイク入力信号x
2(t)の後期残響推定信号
を得てから、スペクトル減算法によって、メインマイク入力信号x
2(t)の周波数スペクトルからメインマイク入力信号の後期残響推定スペクトル
を差し引くため、メインマイクの入力信号x
2(t)からその後期残響を効果的に除去するとともに早期残響を保留することができ、音声の品質が向上する。同時に、本発明の後期残響を推定するプロセスに、残響の強さによってスペクトル減算の強度を調節し、残響が弱い時にスペクトル減算を少なくするか又はしないようにして、残響が弱く、音声の明瞭度が高い場合に音声を損傷しないことが保証され、音声品質が保護される。そして、このような装置において、直接音の到来方向を正確に推定する必要がないため、マイクが高い一致性を持つことが要求されることなく、音響設計に対しても厳しい制限がない。
【0070】
ここから分かるように、本発明の技術手段は、残響を除去すると同時に音声を有効に保護し、部屋の残響の強さの度合いを自動的に推定し、種々の環境においても適切な処理を選択して、最適に近い音声品質に達する。そして、マイクの一致性及び音響設計に対して厳しい制限がなく、応用がより柔軟で便利である。
【0071】
上述したのは、あくまでも本発明の好ましい実施例であり、本発明の保護範囲を限定するためのものではない。本発明の精神及び原則内になされたあらゆる変更、均等置換、改良等は、いずれも本発明の保護範囲内に含まれるものとする。