【課題を解決するための手段】
【0008】
この発明の目的は、特に自動利得制御を可能にする、改善された音響信号処理装置および方法を提供することである。
【0009】
上記および他の目的は、独立請求項の主題によって達成される。さらなる実現形式は、従属請求項、明細書および図面から明らかである。
【0010】
第1の態様によれば、この発明は、目的音源からの音響信号を向上させるための音響信号処理装置に関する。この音響信号処理装置は、複数のマイクロフォンであって、各マイクロフォンが目的音源からの音響信号を受信するように構成されている、複数のマイクロフォンと、複数のマイクロフォンのうちの第1のマイクロフォンによって受信された目的音源からの音響信号に基づく第1のパワー尺度と、第1のマイクロフォンよりも目的音源から遠くに位置する、複数のマイクロフォンのうちの少なくとも第2のマイクロフォンによって受信された目的音源からの音響信号に基づく第2のパワー尺度とを推定するように構成された推定器であって、推定器は、第2のパワー尺度と第1のパワー尺度との間の比に基づいて利得係数を決定するようにさらに構成されている、推定器と、第1のマイクロフォンによって受信された目的音源からの音響信号に利得係数を適用するように構成された増幅器と、を含む。
【0011】
よって、計算上効率的なやり方で目的音源とマイクロフォンとの間の距離変動に起因する音響信号レベル変動を等化することによって自動利得制御を可能にする改善された音響信号処理装置が提供される。
【0012】
この発明の第1の態様による音響信号処理装置の第1の可能な実現形式では、推定器は、第1のパワー尺度を、第1のマイクロフォンによって受信された目的音源からの音響信号の複数の周波数帯域での複数の帯域限定パワー尺度と、複数の周波数帯域で目的音源が活動中である尤度を定義する複数の確率とに基づいて推定するようにさらに構成されている。
【0013】
よって、目的音源と第1のマイクロフォンとの間の距離変動に起因する音響信号レベル変動のより強固な等化が提供される。
【0014】
この発明の第1の態様自体またはその第1の実現形式による音響信号処理装置の第2の可能な実現形式では、推定器は、第1のパワー尺度を、次式に基づいて推定するようにさらに構成されており、
【0015】
【数1】
【0016】
式中、s
iiは、第1のパワー尺度を表し、wは、複数の周波数帯域についての複数の重み付けを定義する重み付けベクトルを表し、x
iは、瞬間nについて第1のマイクロフォンによって受信された目的音源からの音響信号の複数の周波数帯域での複数の帯域限定パワー尺度を定義するパワー尺度ベクトルを表し、p
i(n)は、次式に基づく瞬間nについての複数の確率を定義する確率ベクトルを表し、
p
i(n)=[P
i(n,1),P
i(n,2),・・・,P
i(n,K)]
T、
式中、P
i(n,k)は、目的音源が瞬間nにおいて周波数帯域kで第1のマイクロフォンにおいて活動中である確率を表し、Kは、周波数帯域の数を表す。
【0017】
よって、異なるマイクロフォンが活動中である尤度を考慮に入れた、目的音源と第1のマイクロフォンとの間の距離変動に起因する音響信号レベル変動のより強固な等化が提供される。特定の周波数帯域の重要性に依存して、複数の重み付けが異なる周波数帯域を異なって重み付けすることを可能にする。
【0018】
瞬間nの間に第1のマイクロフォンによって受信された目的音源からの音響信号の複数の周波数帯域での複数の帯域限定パワー尺度を定義するパワー尺度ベクトルは、次式によって定義されることが可能であり、
x
i(n)=[|X
i(n,1)|
2,|X
i(n,2)|
2,・・・,|X
i(n,K)|
2]
T、
式中、X
i(n,k)は、瞬間nにおいて周波数帯域kで第1のマイクロフォンによって受信された目的音源からの音響信号の強度を表し、Kは、周波数帯域の数を表す。
【0019】
第1の態様の第1または第2の実現形式による音響信号処理装置の第3の可能な実現形式では、推定器は、第1のマイクロフォンによって受信された目的音源からの音響信号の第1のパワー尺度と第2のマイクロフォンによって受信された目的音源からの音響信号の第2のパワー尺度との間の差に基づいて各周波数帯域について複数の周波数帯域で目的音源が活動中である尤度を定義する複数の確率を決定するように構成されている。
【0020】
よって、目的音源からの信号を競合する音源からより良く分離する、目的音源が活動中である尤度を考慮に入れた、より信頼できる利得制御が提供される。
【0021】
第1の態様の第2または第3の実現形式による音響信号処理装置の第4の可能な実現形式では、推定器は、第1のパワー尺度を、次式によって定義される複数の確率を使用して推定するようにさらに構成されており、
【0022】
【数2】
【0023】
式中、P
i(n,k)は、目的音源が瞬間nにおいて周波数帯域kで第1のマイクロフォンにおいて活動中である確率を表し、X
i(n,k)は、瞬間nにおいて周波数帯域kで第1のマイクロフォンによって受信された目的音源からの音響信号の強度を表し、X
j(n,k)は、瞬間nにおいて周波数帯域kで第jのマイクロフォンによって受信された目的音源からの音響信号の強度を表す。
【0024】
よって、目的音源からの信号を競合する音源からより良く分離する、目的音源が活動中である尤度を考慮に入れた、より信頼できる利得の向上が提供される。
【0025】
この発明の第1の態様自体またはその第1から第4の実現形式のいずれか1つによる音響信号処理装置の第5の可能な実現形式では、推定器は、第2のパワー尺度を、第1のマイクロフォンによって受信された音響信号、第2のマイクロフォンによって受信された音響信号、および複数のマイクロフォンのうちの少なくとも1つのさらなるマイクロフォンによって受信された音響信号に基づいて推定するようにさらに構成されている。
【0026】
さらなるマイクロフォンを考慮に入れることは、第2のパワー尺度のより信頼できる推定を、したがって、利得係数についての改善された値を得ることを可能にする。
【0027】
この発明の第1の態様自体またはその第5の実現形式による音響信号処理装置の第6の可能な実現形式では、推定器は、第2のパワー尺度を、複数のマイクロフォン信頼性尺度にさらに基づいて推定するようにさらに構成されており、複数のマイクロフォンのうちの各マイクロフォンのマイクロフォン信頼性尺度は、マイクロフォンの目的音源までの距離と、マイクロフォンによって受信された目的音源からの音響信号の、雑音および/または干渉信号に対する比とに依存する。
【0028】
各マイクロフォンを信頼性尺度によって重み付けすることは、第2のパワー尺度のさらに改善された推定、したがって利得係数に導く。
【0029】
この発明の第1の態様自体またはその第1から第6の実現形式のいずれか1つによる音響信号処理装置の第7の可能な実現形式では、第2のパワー尺度と第1のパワー尺度との間の比は、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度によって重み付けされる。
【0030】
よって、利得制御の増加した強固さおよび平滑さが提供される。
【0031】
この発明の第1の態様自体またはその第7の実現形式による音響信号処理装置の第8の可能な実現形式では、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率は、複数の周波数帯域についての、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である複数の確率に基づく。
【0032】
よって、目的音源が活動中である確率の推定の増加した強固さが得られる。
【0033】
この発明の第1の態様自体またはその第8の実現形式による音響信号処理装置の第9の可能な実現形式では、推定器は、次式に基づいて目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度を決定するように構成されており、
【0034】
【数3】
【0035】
式中、μ
i(n)は、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度を表し、wは、複数の周波数帯域についての複数の重み付けを定義する重み付けベクトルを表し、p
i(n)は、複数の周波数帯域についての、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である複数の確率を定義する確率ベクトルを表す。
【0036】
よって、有利な利得係数平滑化が提供される。
【0037】
この発明の第1の態様自体またはその第9の実現形式による音響信号処理装置の第10の可能な実現形式では、確率ベクトルp
i(n)は、次式によって定義され、
p
i(n)=[P
i(n,1),P
i(n,2),・・・,P
i(n,K)]
T、
式中、P
i(n,k)は、目的音源が瞬間nにおいて周波数帯域kで第1のマイクロフォンにおいて活動中である確率を表し、Kは、周波数帯域の数を表し、確率P
i(n,k)は、次式に基づいて決定され、
【0038】
【数4】
【0039】
式中、X
i(n,k)は、瞬間nにおいて周波数帯域kで第1のマイクロフォンによって受信された目的音源からの音響信号の強度を表し、X
j(n,k)は、瞬間nにおいて周波数帯域kで第jのマイクロフォンによって受信された目的音源からの音響信号の強度を表す。
【0040】
よって、目的音源が活動中である確率は、音響信号の強度を考慮することによって効率的かつ強固に推定される。
【0041】
この発明の第1の態様自体またはその第1から第10の実現形式のいずれか1つによる音響信号処理装置の第11の可能な実現形式では、増幅器は、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度が既定の閾値より小さい場合、第1のマイクロフォンによって受信された目的音源からの音響信号に単位利得係数を適用するように構成されている。
【0042】
よって、目的音源が活動中である尤度が低すぎる場合、単位利得係数が提供される。
【0043】
この発明の第1の態様自体またはその第1から第11の実現形式のいずれか1つによる音響信号処理装置の第12の可能な実現形式では、増幅器は、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度が既定の確率閾値より小さい場合、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度に、ゲーティング関数、ローパスフィルタおよび/またはシュミットトリガを適用することによって、第1のマイクロフォンによって受信された目的音源からの音響信号に単位利得係数を適用するように構成されている。
【0044】
第2の態様によれば、この発明は、目的音源からの音響信号を向上させるための音響信号処理方法に関する。この音響信号処理方法は、複数のマイクロフォンによって目的音源からの音響信号を受信するステップと、複数のマイクロフォンのうちの第1のマイクロフォンによって受信された目的音源からの音響信号に基づく第1のパワー尺度と、第1のマイクロフォンよりも目的音源から遠くに位置する、複数のマイクロフォンのうちの少なくとも第2のマイクロフォンによって受信された目的音源からの音響信号に基づく第2のパワー尺度とを推定するステップと、第2のパワー尺度と第1のパワー尺度との間の比に基づいて利得係数を決定するステップと、第1のマイクロフォンによって受信された目的音源からの音響信号に利得係数を適用するステップと、を含む。
【0045】
この発明の第2の態様による音響信号処理方法の第1の可能な実現形式では、推定するステップは、第1のパワー尺度を、第1のマイクロフォンによって受信された目的音源からの音響信号の複数の周波数帯域での複数の帯域限定パワー尺度と、複数の周波数帯域で目的音源が活動中である尤度を定義する複数の確率とに基づいて推定するステップを含む。
【0046】
この発明の第2の態様自体またはその第1の実現形式による音響信号処理方法の第2の可能な実現形式では、推定するステップは、第1のパワー尺度を、次式に基づいて推定するステップを含み、
【0047】
【数5】
【0048】
式中、s
iiは、第1のパワー尺度を表し、wは、複数の周波数帯域についての複数の重み付けを定義する重み付けベクトルを表し、x
iは、瞬間nについて第1のマイクロフォンによって受信された目的音源からの音響信号の複数の周波数帯域での複数の帯域限定パワー尺度を定義するパワー尺度ベクトルを表し、p
i(n)は、次式に基づく瞬間nについての複数の確率を定義する確率ベクトルを表し、
p
i(n)=[P
i(n,1),P
i(n,2),・・・,P
i(n,K)]
T、
式中、P
i(n,k)は、目的音源が瞬間nにおいて周波数帯域kで第1のマイクロフォンにおいて活動中である確率を表し、Kは、周波数帯域の数を表す。
【0049】
瞬間nの間に第1のマイクロフォンによって受信された目的音源からの音響信号の複数の周波数帯域での複数の帯域限定パワー尺度を定義するパワー尺度ベクトルは、次式によって定義されることが可能であり、
x
i(n)=[|X
i(n,1)|
2,|X
i(n,2)|
2,・・・,|X
i(n,K)|
2]
T、
式中、X
i(n,k)は、瞬間nにおいて周波数帯域kで第1のマイクロフォンによって受信された目的音源からの音響信号の強度を表し、Kは、周波数帯域の数を表す。
【0050】
第2の態様の第1または第2の実現形式による音響信号処理方法の第3の可能な実現形式では、複数の周波数帯域で目的音源が活動中である尤度を定義する複数の確率は、第1のマイクロフォンによって受信された目的音源からの音響信号の第1のパワー尺度と第2のマイクロフォンによって受信された目的音源からの音響信号の第2のパワー尺度との間の差に基づいて各周波数帯域について決定される。
【0051】
第2の態様の第2または第3の実現形式による音響信号処理方法の第4の可能な実現形式では、推定するステップは、第1のパワー尺度を、次式によって定義される複数の確率を使用して推定するステップを含み、
【0052】
【数6】
【0053】
式中、P
i(n,k)は、目的音源が瞬間nにおいて周波数帯域kで第1のマイクロフォンにおいて活動中である確率を表し、X
i(n,k)は、瞬間nにおいて周波数帯域kで第1のマイクロフォンによって受信された目的音源からの音響信号の強度を表し、X
j(n,k)は、瞬間nにおいて周波数帯域kで第jのマイクロフォンによって受信された目的音源からの音響信号の強度を表す。
【0054】
この発明の第2の態様自体またはその第1から第4の実現形式のいずれか1つによる音響信号処理方法の第5の可能な実現形式では、推定するステップは、第2のパワー尺度を、第1のマイクロフォンによって受信された音響信号、第2のマイクロフォンによって受信された音響信号、および複数のマイクロフォンのうちの少なくとも1つのさらなるマイクロフォンによって受信された音響信号に基づいて推定するステップを含む。
【0055】
この発明の第2の態様自体またはその第5の実現形式による音響信号処理方法の第6の可能な実現形式では、推定するステップは、第2のパワー尺度を、複数のマイクロフォン信頼性尺度にさらに基づいて推定するステップを含み、複数のマイクロフォンのうちの各マイクロフォンのマイクロフォン信頼性尺度は、マイクロフォンの目的音源までの距離と、マイクロフォンによって受信された目的音源からの音響信号の、雑音および/または干渉信号に対する比とに依存する。
【0056】
この発明の第2の態様自体またはその第1から第6の実現形式のいずれか1つによる音響信号処理方法の第7の可能な実現形式では、第2のパワー尺度と第1のパワー尺度との間の比に基づいて利得係数を決定するステップは、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度によって比を重み付けするステップを含む。
【0057】
この発明の第2の態様自体またはその第7の実現形式による音響信号処理方法の第8の可能な実現形式では、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率は、複数の周波数帯域についての、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である複数の確率に基づく。
【0058】
この発明の第2の態様自体またはその第8の実現形式による音響信号処理方法の第9の可能な実現形式では、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度は次式に基づいて決定され、
【0059】
【数7】
【0060】
式中、μ
i(n)は、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度を表し、wは、複数の周波数帯域についての複数の重み付けを定義する重み付けベクトルを表し、p
i(n)は、複数の周波数帯域についての、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である複数の確率を定義する確率ベクトルを表す。
【0061】
この発明の第2の態様自体またはその第9の実現形式による音響信号処理方法の第10の可能な実現形式では、確率ベクトルp
i(n)は、次式によって定義され、
p
i(n)=[P
i(n,1),P
i(n,2),・・・,P
i(n,K)]
T、
式中、P
i(n,k)は、目的音源が瞬間nにおいて周波数帯域kで第1のマイクロフォンにおいて活動中である確率を表し、Kは、周波数帯域の数を表し、確率P
i(n,k)は、次式に基づいて決定され、
【0062】
【数8】
【0063】
式中、X
i(n,k)は、瞬間nにおいて周波数帯域kで第1のマイクロフォンによって受信された目的音源からの音響信号の強度を表し、X
j(n,k)は、瞬間nにおいて周波数帯域kで第jのマイクロフォンによって受信された目的音源からの音響信号の強度を表す。
【0064】
この発明の第2の態様自体またはその第1から第10の実現形式のいずれか1つによる音響信号処理方法の第11の可能な実現形式では、音響信号に利得係数を適用するステップは、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度が既定の閾値より小さい場合、第1のマイクロフォンによって受信された目的音源からの音響信号に単位利得係数を適用するステップを含む。
【0065】
この発明の第2の態様自体またはその第1から第11の実現形式のいずれか1つによる音響信号処理方法の第12の可能な実現形式では、音響信号に利得係数を適用するステップは、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度が既定の確率閾値より小さい場合、目的音源が瞬間nの間に第1のマイクロフォンにおいて活動中である確率についての正規化された尺度に、ゲーティング関数、ローパスフィルタおよび/またはシュミットトリガを適用することによって、第1のマイクロフォンによって受信された目的音源からの音響信号に単位利得係数を適用するステップを含む。
【0066】
この発明の第2の態様による音響信号処理方法は、この発明の第1の態様による音響信号処理装置によって実行されることが可能である。この発明の第2の態様による音響信号処理方法のさらなる特徴は、この発明の第1の態様およびその異なる実現形式による音響信号処理装置の機能から直接得られ、逆も同様である。
【0067】
第3の態様によれば、この発明は、コンピュータにおいて実行されるとき、この発明の第2の態様またはその実現形式のいずれかによる音響信号処理方法を実行するためのプログラムコードを含むコンピュータプログラムに関する。
【0068】
この発明は、ハードウェアおよび/またはソフトウェアにおいて実現されることが可能である。
【0069】
この発明のさらなる実施形態が、以下の図面に関連して説明される。