(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0015】
<第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100の構成図である。
図1に例示される通り、音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号xを音響処理装置100に供給する。音響信号xは、発音源から放射された音響に対して音響空間内で反射または散乱した残響成分(初期反射成分および後期残響成分)を付加した音響の波形を示す時間領域信号である。例えば、収録音や合成音等の既存の音響に対して事後的に残響効果を付与した音響信号xや、残響効果がある音響空間(例えば音響ホール等)内で実際に収録された音響の音響信号xが好適に利用される。周囲の音響を収音して音響信号xを生成する収音装置や、可搬型または内蔵型の記録媒体から音響信号xを取得して音響処理装置100に供給する再生装置や、通信網から音響信号xを受信して音響処理装置100に供給する通信装置が信号供給装置12として採用され得る。
【0016】
第1実施形態の音響処理装置100は、音響信号xの残響成分(後期残響成分)を抑圧した時間領域の音響信号yを生成する残響抑圧装置である。放音装置14(例えばスピーカやヘッドホン)は、音響処理装置100が生成した音響信号yに応じた音波を放射する。なお、音響信号yをデジタルからアナログに変換するD/A変換器や音響信号yを増幅する増幅器等の図示は便宜的に省略した。
【0017】
図1に例示される通り、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号xを記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
【0018】
演算処理装置22は、記憶装置24に記憶されたプログラムを実行することで、音響信号xから音響信号yを生成するための複数の機能(周波数解析部32,残響解析部34,残響処理部36,波形生成部38)を実現する。なお、演算処理装置22の各機能を複数の装置に分散した構成や、専用の電子回路(例えばDSP)が演算処理装置22の一部の機能を実現する構成も採用され得る。
【0019】
周波数解析部32は、信号供給装置12から供給される音響信号xを解析することで、相異なる周波数(周波数帯域)に対応する複数の音響成分(周波数スペクトル)X(k,m)を時間軸上の単位区間(フレーム)毎に順次に生成する。記号kは、周波数軸上に離散的に設定された複数の周波数(周波数ビン)のうち任意の1個の周波数を意味し、記号mは、時間軸上の任意の1個の単位区間(時間軸上の特定の時点)を意味する。各音響成分X(k,m)の算定には、短時間フーリエ変換等の公知の周波数解析が任意に採用され得る。残響解析部34は、音響信号xの各音響成分X(k,m)を解析することで残響時間Tを算定する。
【0020】
残響処理部36は、残響解析部34が算定した残響時間Tに応じた残響分離処理(残響抑圧処理)を音響信号xの各音響成分X(k,m)に対して実行することで音響信号yの各音響成分(周波数スペクトル)Y(k,m)を生成する。残響分離処理は、音響成分X(k,m)の初期反射成分と後期残響成分とを分離(一方を他方に対して抑圧または強調)する処理である。残響分離処理には、音響信号xの各音響成分X(k,m)に応じた調整値G(k,m)が適用される。
【0021】
第1実施形態の調整値G(k,m)は、音響成分X(k,m)に含有される後期残響成分を抑圧する(初期反射成分を強調する)ための変数である。具体的には、音響成分X(k,m)にて後期残響成分が優勢である(直接音成分や初期反射成分が劣勢である)ほど調整値G(k,m)は小さい数値に設定されるという概略的な傾向がある(0≦G(k,m)≦1)。第1実施形態の残響処理部36は、調整値G(k,m)を音響成分X(k,m)に乗算することで音響成分Y(k,m)を生成する(Y(k,m)=G(k,m)X(k,m))。以上の説明から理解される通り、調整値G(k,m)は、音響信号xの音響成分X(k,m)に対するゲイン(スペクトルゲイン)に相当する。
【0022】
調整値G(k,m)の算定には例えば特開2013−130857号公報に開示された方法が好適に採用される。具体的には、調整値G(k,m)は以下の数式(1)で表現される。
【数1】
数式(1)の演算子min( )は、括弧内の各数値の最小値を採択する演算(調整値G(k,m)を1以下の範囲に制限する演算)である。数式(1)の記号CA(k,m)および記号CB(k,m)は、音響成分X(k,m)の強度(パワー)|X(k,m)|
2の移動平均に相当する。具体的には、以下の数式(2A)および数式(2B)で表現される通り、相異なる係数(αA,αB)を適用した強度|X(k,m)|
2の指数移動平均が強度CA(k,m)および強度CB(k,m)として算定される。
【数2】
【0023】
係数αAおよび係数αBは1以下の正数に設定され、係数αAは係数αBを上回る(αA>αB)。数式(2A)および数式(2B)から理解される通り、強度CA(k,m)および強度CB(k,m)は音響信号xの強度|X(k,m)|
2に追従して経時的に変動する。係数αAは係数αBを上回るから、強度CA(k,m)は、強度CB(k,m)と比較して高い追従性で強度|X(k,m)|
2の時間変化に追従する。第1実施形態の残響処理部36は、残響解析部34が算定した残響時間Tに応じて係数αAおよび係数αBを可変に設定する。具体的には、残響時間Tが長いほど、係数αAは大きい数値に設定され、係数αBは小さい数値に設定される。以上の説明から理解される通り、第1実施形態の残響処理部36は、残響解析部34が算定した残響時間Tに応じた調整値G(k,m)を利用した残響分離処理で音響成分X(k,m)から音響成分Y(k,m)を生成する。
【0024】
図1の波形生成部38は、残響処理部36が生成した各音響成分Y(k,m)から時間領域の音響信号yを生成する。音響信号yの生成には短時間逆フーリエ変換が好適に利用される。波形生成部38が生成した音響信号yが放音装置14に供給されて音波として放射される。
【0025】
図1に例示される通り、第1実施形態の残響解析部34は、強度算定部42と残響時間特定部44とを含んで構成される。強度算定部42は、音響信号xのうち一部の周波数帯域(以下「特定帯域」という)Bの各音響成分X(k,m)を解析することで初期反射成分の強度PERと後期残響成分の強度PLRとを算定する。強度PERおよび強度PLRは、例えばパワーの平均値(エネルギー)である。なお、強度PERおよび強度PLRの表記のように、以下の説明では、初期反射成分(Early Reflection)に関連する要素に添字ERを付加し、後期残響成分(Late Reverberation)に関連する要素に添字LRを付加する。
【0026】
初期反射成分は、音響信号xのうち発音源による直接音成分の発音の直後に音響空間内での反射(典型的には1回の反射)を経て受音点に到達する音響成分であり、後期残響成分は、初期反射音の到来後に音響空間内での多数回の反射を経て受音点に到達する音響成分である。なお、以下の説明では、直接音成分を初期反射成分の概念に便宜的に包含させる。強度PERおよび強度PLRの算定には、音響信号xのうち時間軸上の特定の区間(以下「評価区間」という)が利用される。評価区間は所定の時間長(例えば3秒程度)にわたる区間である。
図1の残響時間特定部44は、強度算定部42が算定した初期反射成分の強度PERと後期残響成分の強度PLRとに応じて残響時間Tを算定する。
【0027】
特定帯域Bは、残響処理部36による残響分離処理の対象となる周波数帯域と比較して狭い所定の周波数帯域に設定される。建築音響では一般的に可聴帯域の略全域にわたる音響の残響時間が500Hzの音響の残響時間に近似または合致するように音響ホール等の音響空間が設計される。以上の事情を考慮すると、設計基準となる500Hzを包含する所定幅の周波数帯域を特定帯域Bとして選定した構成が好適である。具体的には、500Hzに対して高域側に位置する所定個(例えば10個)の周波数と低域側に位置する所定個(例えば10個)の周波数とを含む周波数帯域が特定帯域Bとして選定される。
【0028】
図2は、強度算定部42の構成図である。
図2に例示される通り、第1実施形態の強度算定部42は、暫定処理部50と区間解析部60と演算処理部70とを含んで構成される。強度算定部42の各要素について以下に詳述する。
【0029】
<暫定処理部50>
暫定処理部50は、音響信号xのうち特定帯域B内の各音響成分X(k,m)に残響処理部36と同様の残響分離処理を実行することで、暫定的な初期反射成分(以下「暫定初期反射成分」という)ZER(k,m)の単位区間毎の強度QER(m)の時系列と暫定的な後期残響成分(以下「暫定後期残響成分」という)ZLR(k,m)の単位区間毎の強度QLR(m)の時系列とを算定する。
図2に例示される通り、第1実施形態の暫定処理部50は、残響分離部52と強度累算部54と平滑処理部56とを含んで構成される。
【0030】
残響分離部52は、残響時間Tを所定の暫定値t0に暫定的に設定した残響分離処理で特定帯域B内の各音響成分X(k,m)を暫定初期反射成分ZER(k,m)と暫定後期残響成分ZLR(k,m)とに分離する。すなわち、残響分離部52による残響分離処理に適用される調整値G(k,m)は残響時間Tの暫定値t0に応じて設定される。具体的には、第1実施形態の残響分離部52は、係数αAおよび係数αBを暫定値t0に応じた可変の数値に設定した数式(2A)および数式(2B)の演算で強度CA(k,m)および強度CB(k,m)を算定し、強度CA(k,m)および強度CB(k,m)を適用した数式(1)の演算で調整値G(k,m)を算定する。例えば係数αAは0.9程度の数値に設定され、係数αBは0.1程度の数値に設定される。
【0031】
暫定値t0に応じた調整値G(k,m)を以上の手順で算定すると、残響分離部52は、以下の数式(3A)で表現される通り、評価区間内の音響信号xのうち特定帯域B内の各音響成分X(k,m)に調整値G(k,m)を乗算する(すなわち後期残響成分を抑圧する)ことで暫定初期反射成分ZER(k,m)を算定する。他方、所定値(以下の例示では1)から調整値G(k,m)を減算した調整値{1−G(k,m)}は、調整値G(k,m)とは逆に、音響信号xの後期残響成分を強調する係数(初期反射成分を抑圧する係数)として機能する。第1実施形態の残響分離部52は、以下の数式(3B)で表現される通り、評価区間内の音響信号xのうち特定帯域B内の各音響成分X(k,m)に調整値{1−G(k,m)}を乗算することで暫定後期残響成分ZLR(k,m)を算定する。以上の説明から理解される通り、第1実施形態の残響分離部52は、残響時間Tを暫定値t0と仮定した暫定的な残響分離処理を実行する要素として機能する。
【数3】
【0032】
図2の強度累算部54および平滑処理部56は、暫定初期反射成分ZER(k,m)の強度QER(m)の時系列と暫定後期残響成分ZLR(k,m)の強度QLR(m)の時系列とを算定する。強度累算部54は、以下の数式(4A)で表現される通り、暫定初期反射成分ZER(k,m)の強度|ZER(k,m)|
2を特定帯域B内の全周波数にわたり平均(合計)することで単位区間毎に強度WER(m)を算定し、以下の数式(4B)で表現される通り、暫定後期残響成分ZLR(k,m)の強度|ZLR(k,m)|
2を特定帯域B内の全周波数にわたり平均(合計)することで単位区間毎に強度WLR(m)を算定する。
【数4】
【0033】
平滑処理部56は、以下の数式(5A)で表現される通り、評価区間内の複数の単位区間にわたる強度WER(m)の時系列を平滑化(移動平均)することで各単位区間の強度QER(m)の時系列を算定し、数式(5B)で表現される通り、評価区間内の複数の単位区間にわたる強度WER(m)の時系列を平滑化することで各単位区間の強度QLR(m)の時系列を算定する。数式(5A)および数式(5B)の数値Maおよび数値Mbは所定の非負値に設定される。
【数5】
【0034】
以上の説明から理解される通り、特定帯域B内の暫定初期反射成分ZER(k,m)の強度WER(m)の時系列を平滑化した各単位区間の強度QER(m)の時系列と、特定帯域B内の暫定後期残響成分ZLR(k,m)の強度WLR(m)の時系列を平滑化した各単位区間の強度QLR(m)の時系列とが算定される。
図2の暫定処理部50の具体的な構成および作用は以上の通りである。なお、平滑処理部56は省略され得る。
【0035】
<区間解析部60>
図2の区間解析部60は、暫定処理部50が算定した暫定初期反射成分ZER(k,m)の強度QER(m)の時系列と暫定後期残響成分ZLR(k,m)の強度QER(m)の時系列とを解析することで、音響信号xのうち初期反射成分が優勢に存在する初期反射区間SERと後期残響成分が優勢に存在する後期残響区間SLRとを特定する。
図2に例示される通り、第1実施形態の区間解析部60は、閾値設定部62と第1区間設定部64と第2区間設定部66とを含んで構成される。
【0036】
図3は、区間解析部60の動作の説明図である。
図3に例示される通り、第1区間設定部64は、暫定初期反射成分ZER(k,m)の各単位区間の強度QER(m)と閾値(第1閾値)HERとの比較結果に応じて時間軸上に信号区間AERを画定する。信号区間AERは、暫定初期反射成分ZER(k,m)が優勢に存在する区間(第1信号区間)である。具体的には、第1区間設定部64は、強度QER(m)が閾値HERを上回る区間を信号区間AERとして画定する。したがって、信号区間AER内の各単位区間の集合mA_ERは以下の数式(6A)で表現される。また、第1区間設定部64は、暫定後期残響成分ZLR(k,m)の各単位区間の強度QLR(m)と閾値(第2閾値)HLRとの比較結果に応じて時間軸上に信号区間ALRを画定する。信号区間ALRは、暫定後期残響成分ZLR(k,m)が優勢に存在する区間(第2信号区間)である。具体的には、第1区間設定部64は、強度QLR(m)が閾値HLRを上回る区間を信号区間ALRとして画定する。したがって、信号区間ALR内の各単位区間の集合mA_LRは以下の数式(6B)で表現される。
【数6】
【0037】
図2の閾値設定部62は、信号区間AERの画定に適用される閾値HERと信号区間ALRの画定に適用される閾値HLRとを可変に設定する。具体的には、閾値設定部62は、暫定初期反射成分ZER(k,m)の時間軸上の複数の強度QER(m)に応じて閾値HERを設定し、暫定後期残響成分ZLR(k,m)の時間軸上の複数の強度QLR(m)に応じて閾値HLRを設定する。第1実施形態の閾値設定部62は、評価区間内の各単位区間に対応する複数の強度QER(m)の中央値(メディアン)を閾値HERとして算定し、評価区間内の各単位区間に対応する複数の強度QLR(m)の中央値を閾値HLRとして算定する。なお、複数の強度QER(m)の平均値を閾値HERとして設定する構成や、複数の強度QLR(m)の平均値を閾値HLRとして設定する構成も採用され得る。
【0038】
以上に例示した処理で第1区間設定部64が設定した信号区間AERと信号区間ALRとは相互に重複する可能性がある。第2区間設定部66は、第1区間設定部64が設定した信号区間AERと信号区間ALRとを利用して、評価区間内で相互に重複しない初期反射区間SERと後期残響区間SLRとを特定する。第1実施形態の第2区間設定部66は、
図3に例示される通り、暫定後期残響成分ZLR(k,m)の強度QLR(m)が暫定初期反射成分ZER(k,m)の強度QER(m)を上回る区間(以下「減衰区間」という)Szを特定し、減衰区間Szと信号区間ALRとが相互に重複する区間を後期残響区間SLRとして画定する。すなわち、強度QLR(m)が閾値HLRを上回る信号区間ALRのうち強度QLR(m)が強度QER(m)を上回る区間が後期残響区間SLRとして設定される。また、第2区間設定部66は、
図3に例示される通り、後期残響区間SLR以外の区間と信号区間AERとが相互に重複する区間を初期反射区間SERとして画定する。すなわち、後期残響区間SLR以外で強度QER(m)が閾値HERを上回る区間が初期反射区間SERとして設定される。
【0039】
以上の説明から理解される通り、後期残響区間SLR内の各単位区間の集合mB_LRは以下の数式(7B)で表現され、初期反射区間SER内の各単位区間の集合mB_ERは以下の数式(7A)で表現される。なお、数式(7A)および数式(7B)における記号 ̄は否定を意味し、記号∩は積集合(AND)を意味する。
図2の区間解析部60の具体的な構成および作用は以上の通りである。
【数7】
【0040】
<演算処理部70>
図2の演算処理部70は、区間解析部60が設定した初期反射区間SERにおける暫定初期反射成分ZER(k,m)の強度QER(m)に応じて初期反射成分の強度PERを算定し、区間解析部60が設定した後期残響区間SLRにおける暫定後期残響成分ZLR(k,m)の強度QLR(m)に応じて後期残響成分の強度PLRを算定する。第1実施形態の演算処理部70は、以下の数式(8A)で表現される通り、初期反射区間SER内の複数の単位区間(数式(7A)の集合mB_ER)にわたる強度QER(m)の合計値を強度PERとして算定し、数式(8B)で表現される通り、後期残響区間SLR内の複数の単位区間(数式(7B)の集合mB_LR)にわたる強度QLR(m)の合計値を強度PLRとして算定する。以上の説明から理解される通り、第1実施形態では、暫定値t0のもとで算定された暫定的な強度QER(m)および強度QLR(m)が、初期反射区間SERおよび後期残響区間SLRの推定結果に応じて確定的な強度PERおよび強度PLRに補正される。以上が
図1の強度算定部42の構成および動作である。
【数8】
【0041】
図1の残響時間特定部44は、以上の手順で強度算定部42が算定した初期反射成分の強度PERと後期残響成分の強度PLRとに応じて残響時間Tを算定する。具体的には、初期反射成分の強度PERが後期残響成分の強度PLRに対して相対的に大きいほど残響時間Tは小さい数値に設定される。第1実施形態の残響時間特定部44は、以下の数式(9)の演算で残響時間Tを算定する。
【数9】
数式(9)の記号fsは音響信号xのサンプリング周波数を意味し、記号NEは、音響信号xのうち所定の初期反射区間の時間長(数十〜100msec)に相当するサンプルの個数を意味する。記号rは、後期残響成分の強度PLRに対する初期反射成分の強度PERの強度比(r=PER/PLR)である。残響時間特定部44は、強度算定部42が算定した強度PERおよび強度PLRから強度比rを算定し、強度比rを数式(9)に適用することで残響時間Tを算定する。残響時間Tと強度比rとの関係を規定する数式(9)について以下に詳述する。
【0042】
残響音(室内インパルス応答)h(n)は以下の数式(10)で表現される(Polackの統計モデル)。数式(10)の記号nは収録音のサンプルの番号を意味し、数式(10)の記号b(n)は平均零のガウス確率過程を意味する。
【数10】
【0043】
以下の数式(11)で表現される通り、音響信号xの強度(パワー)PX(k,m)(PX(k,m)=|X(k,m)|
2)は、初期反射成分の強度PER(k,m)と後期残響成分の強度PLR(k,m)とに分解される。記号σb
2は、確率過程b(n)の分散を意味し、記号Mは残響時間T内のフレームの個数を意味する。
【数11】
【0044】
数式(10)の残響音h(n)の統計モデルを想定すると、初期反射成分の強度PER(k,m)と後期残響成分の強度PLR(k,m)との強度比の期待値Em[PER(k,m)/PLR(k,m)]を表現する以下の数式(12)が導出される。
【数12】
【0045】
等比級数の和の公式を利用すると、数式(12)は以下の数式(13)に変形される。なお、数式(13)の導出では、残響時間Tの定義を考慮して変数e
-2ΔM・NEをゼロと近似した。
【数13】
【0046】
期待値Em[PER(k,m)/PLR(k,m)]を強度比rに置換して数式(13)を変形すると、以下の数式(14)が導出される。
【数14】
数式(14)の変数Δを展開して変形することで、残響時間Tと強度比rとの関係を規定する前掲の数式(9)が導出される。
【0047】
図4は、音響処理装置100が音響信号xから音響信号yを生成する処理のフローチャートである。入力装置(図示略)に対する利用者からの指示(残響抑圧の開始指示)を契機として
図4の処理が開始される。処理を開始すると、演算処理装置22(残響解析部34)は、評価区間内の音響信号xのうち特定帯域B内の音響成分X(k,m)を解析することで残響時間Tを算定する(S1〜S4)。具体的には、暫定処理部50による強度QER(m)および強度QLR(m)の算定(S1)と区間解析部60による初期反射区間SERおよび後期残響区間SLRの特定(S2)と演算処理部70による強度PERおよび強度PLRの算定(S3)とが順次に実行され、残響時間特定部44は、強度PERおよび強度PLRに応じた残響時間Tを算定する(S4)。残響時間Tの算定が完了すると、残響処理部36は、残響時間Tを適用した残響分離処理(残響抑圧)を音響信号xの全区間にわたり実行することで音響信号yを生成する(S5)。
【0048】
以上に説明した通り、第1実施形態では、特定帯域B内の音響成分X(k,m)の解析で算定される初期反射成分の強度PERと後期残響成分の強度PLRとに応じて残響時間Tが算定される。したがって、非特許文献1や非特許文献2と比較して演算量や記憶容量を低減した簡便な処理で音響信号xから残響時間Tを推定できるという利点がある。第1実施形態では、暫定初期反射成分ZER(k,m)の強度|ZER(k,m)|
2と暫定後期残響成分ZLR(k,m)の強度|ZLR(k,m)|
2とが特定帯域B内の複数の周波数について合計される(数式(4A),数式(4B))から、周波数毎の強度|ZER(k,m)|
2および|ZLR(k,m)|
2を利用する構成と比較して、記憶容量を削減できるという効果は格別に顕著である。
【0049】
第1実施形態では、残響時間Tを暫定値t0と仮定した暫定的な残響分離処理で暫定初期反射成分ZER(k,m)の強度QER(m)と暫定後期残響成分ZLR(k,m)の強度QLR(m)とが生成され、強度QER(m)の時系列と強度QLR(m)の時系列とから特定される初期反射区間SERおよび後期残響区間SLRについて強度QER(m)および強度QLR(m)の各々を合計することで確定的な初期反射成分の強度PERと後期残響成分の強度PLRとが算定される。したがって、強度QER(m)を初期反射成分の強度PERとして確定する構成や強度QLR(m)を後期残響成分の強度PLRとして確定する構成と比較すると、特に暫定値t0が実際の残響時間Tと乖離するような場合でも、強度PERと強度PLRとを頑健に算定できるという利点がある。
【0050】
第1実施形態では、暫定初期反射成分ZER(k,m)の強度QER(m)が閾値HERを上回る信号区間AERと、暫定後期残響成分ZLR(k,m)の強度QLR(m)が閾値HLRを上回る信号区間ALRと、強度QLR(m)が強度QER(m)を上回る減衰区間Szとを利用した簡便な処理で、音響信号xの初期反射区間SERと後期残響区間SLRとを特定できるという利点もある。
【0051】
また、暫定初期反射成分ZER(k,m)の複数の強度QER(m)の中央値が閾値HERに設定され、暫定後期残響成分ZLR(k,m)の複数の強度QLR(m)の中央値が閾値HLRに設定されるから、強度QER(m)や強度QLR(m)の数値範囲に関わらず信号区間AERと信号区間ALRとを適切に特定できるという利点がある。また、第1実施形態では、前述の通り、暫定初期反射成分ZER(k,m)の強度|ZER(k,m)|
2と暫定後期残響成分ZLR(k,m)の強度|ZLR(k,m)|
2とを特定帯域B内で合計する(数式(4A),数式(4B))ことで、閾値設定部62による中央値の算定時に並替え(ソート)の対象となる数値の個数が削減される。したがって、閾値設定部62の処理負荷が軽減されるという利点もある。
【0052】
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
【0053】
図5は、第2実施形態の音響処理装置100の構成図である。
図5に例示される通り、第2実施形態の音響処理装置100の演算処理装置22は、第1実施形態と同様の要素(周波数解析部32,残響解析部34,残響処理部36,波形生成部38)に加えて雑音抑圧部33として機能する。
【0054】
雑音抑圧部33は、周波数解析部32が単位区間毎に生成する音響成分X0(k,m)(第1実施形態の音響成分X(k,m))について雑音抑圧処理を実行することで音響成分X(k,m)を生成する。雑音抑圧処理は、音響信号xに包含される雑音成分を抑圧する処理である。雑音抑圧処理には公知の技術(例えば周波数領域で音響成分X(k,m)から推定雑音成分を減算するスペクトル減算)が任意に採用される。雑音抑圧部33による処理後の音響成分X(k,m)を適用した残響時間Tの算定(残響解析部34)や音響信号yの生成(残響処理部36)は第1実施形態と同様である。第2実施形態においても第1実施形態と同様の効果が実現される。
【0055】
<変形例>
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
【0056】
(1)残響分離処理の具体的な内容は前述の各形態の例示に限定されない。例えば、以下の数式(1A)で表現される通り、強度CA(k,m)および強度CB(k,m)の双方を分母に含む演算で調整値G(k,m)を算定することも可能である。
【数15】
【0057】
また、前述の各形態では、音響信号xの後期残響成分を抑圧する残響分離処理(残響抑圧処理)を残響処理部36が実行したが、音響信号xの後期残響成分を強調(初期反射成分を抑圧)する残響分離処理(残響強調処理)を残響処理部36が実行することも可能である。具体的には、残響処理部36は、数式(3B)と同様に、調整値G(k,m)を所定値(例えば1)から減算した調整値{1−G(k,m)}を音響信号xの各音響成分X(k,m)に乗算することで、後期残響成分が強調された音響成分Y(k,m)を生成する。
【0058】
(2)前述の各形態では、初期反射成分の強度PERおよび後期残響成分の強度PLR(強度比r)と残響時間Tとの関係を規定する数式(9)の演算で残響時間Tを算定したが、強度PERおよび強度PLRに応じて残響時間Tを特定するための処理は以上の例示に限定されない。例えば、強度PERおよび強度PLR(または強度比r)と残響時間Tとを対応付けるテーブルや統計モデル(回帰モデル)を利用して残響時間特定部44が強度PERおよび強度PLRに応じた残響時間Tを特定することも可能である。
【0059】
(3)前述の各形態では、1個の評価区間について算定された残響時間Tを音響信号xの全区間にわたる残響分離処理に共通に適用したが、時間軸上の相異なる評価区間について残響時間Tを順次に特定し、残響処理部36による残響分離処理に適用される残響時間Tを順次に更新することも可能である。具体的には、第1実施形態と同様の処理(
図4)を所定の周期で反復的に実行する構成が採用される。例えば、音響信号xを時間軸上で区分した複数の評価区間の各々について残響時間Tが順次に特定され、任意の1個の評価区間の残響時間Tが、当該評価区間内の各単位区間の音響信号xに対する残響分離処理に適用される。また、例えば、音響信号xの任意の1個の単位区間(以下「対象単位区間」という)を包含するように単位区間の1個分を単位として評価区間を時間軸上で順次に移動させ、各評価区間について特定された残響時間Tを当該評価区間の対象単位区間の音響信号xに対する残響分離処理に適用する構成(単位区間毎に残響時間Tを更新する構成)も好適である。
【0060】
(4)前述の各形態を公知の音声強調やエコー除去と併用することも可能である。例えば、音声強調やエコー除去等の処理後の音響信号xを対象として、残響解析部34による残響時間Tの特定や残響処理部36による残響分離処理が実行される。残響処理部36による処理後の音響信号yは、例えば音声認識や話者認識等の各種の音響処理の対象としても好適である。
【0061】
(5)携帯電話機等の端末装置と通信するサーバ装置(典型的にはウェブサーバ)で音響処理装置100を実現することも可能である。例えば、音響処理装置100は、端末装置から受信した音響信号xから音響信号yを生成して端末装置に送信する。なお、音響信号xの各音響成分X(k,m)が端末装置から送信される構成(例えば端末装置が周波数解析部32を具備する構成)では音響処理装置100から周波数解析部32が省略され、残響分離処理の実行後の音響成分Y(k,m)を音響処理装置100から端末装置に送信する構成(例えば端末装置が波形生成部38を具備する構成)では音響処理装置100から波形生成部38が省略される。また、端末装置が残響処理部36を具備する構成では、音響処理装置100から残響処理部36が省略され、残響解析部34が特定した残響時間Tが音響処理装置100から端末装置に提供される。以上の説明から理解される通り、本発明は、音響信号xの解析で残響時間Tを特定する装置(残響時間推定装置)としても実現され得る。
【0062】
(6)音響空間内での反射や散乱に起因した狭義の残響成分に加えて、例えば楽器の演奏音等の響き成分(共鳴成分)も残響成分に含意される。具体的には、ピアノ等の鍵盤楽器の響板による共鳴成分やバイオリン等の弦楽器の共鳴成分(胴鳴り,箱鳴り)の調整にも本発明を適用することが可能である。すなわち、本発明の残響成分は、経時的に減衰する成分(減衰成分)を意味する。