特許第6030660号(P6030660)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー・インターナショナル・アーベーの特許一覧

特許6030660音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置
<>
  • 特許6030660-音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 図000040
  • 特許6030660-音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 図000041
  • 特許6030660-音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 図000042
  • 特許6030660-音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 図000043
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6030660
(24)【登録日】2016年10月28日
(45)【発行日】2016年11月24日
(54)【発明の名称】音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置
(51)【国際特許分類】
   H04R 3/00 20060101AFI20161114BHJP
   H04S 5/02 20060101ALI20161114BHJP
   H04R 1/40 20060101ALI20161114BHJP
【FI】
   H04R3/00 320
   H04S5/02 N
   H04R1/40 320A
【請求項の数】6
【全頁数】21
(21)【出願番号】特願2014-540395(P2014-540395)
(86)(22)【出願日】2012年10月31日
(65)【公表番号】特表2014-535231(P2014-535231A)
(43)【公表日】2014年12月25日
(86)【国際出願番号】EP2012071535
(87)【国際公開番号】WO2013068283
(87)【国際公開日】20130516
【審査請求日】2015年10月30日
(31)【優先権主張番号】11306471.1
(32)【優先日】2011年11月11日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】510185767
【氏名又は名称】ドルビー・インターナショナル・アーベー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】コルドン,スベン
(72)【発明者】
【氏名】バトケ,ヨハン−マルクス
(72)【発明者】
【氏名】クルーガー,アレクサンダー
【審査官】 下林 義明
(56)【参考文献】
【文献】 特表2012−523731(JP,A)
【文献】 国際公開第2007/026827(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00 − 7/00
H04R 3/00 − 3/14
H04R 1/20 − 1/40
(57)【特許請求の範囲】
【請求項1】
剛体球上の球状マイクロホン・アレイのマイクロホン・カプセルにおいて測定されたマイクロホン・カプセル信号(P(Ωc,t))を処理する方法であって:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ωc,t))を、次数Nおよび方向性係数をもつ球面調和関数またはアンビソニックス表現Anm(t)に変換する段階と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号(P(Ωc,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数n(n=0……N)についての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算する段階と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数またはアンビソニックス表現Anm(t)に適用し、結果として適応された方向性係数dnm(t)を与える段階とを含む、
方法。
【請求項2】
前記ノイズ・パワー|Pnoise(k)|2が、|P0(k)|2=0であるような何の音源もない無音環境において得られる、請求項1記載の方法。
【請求項3】
前記平均源パワー|P0(k)|2が、前記マイクロホン・カプセルにおいて測定された圧力Pmicc,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、請求項1または2記載の方法。
【請求項4】
剛体球上の球状マイクロホン・アレイのマイクロホン・カプセルにおいて測定されたマイクロホン・カプセル信号(P(Ωc,t))を処理する装置であって:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ωc,t))を、次数Nおよび方向性係数をもつ球面調和関数またはアンビソニックス表現Anm(t)に変換するよう適応されている手段と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号(P(Ωc,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数n(n=0……N)についての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算するよう適応されている手段と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数またはアンビソニックス表現Anm(t)に適用し、結果として適応された方向性係数dnm(t)を与えるよう適応されている手段とを含む、
装置。
【請求項5】
前記ノイズ・パワー|Pnoise(k)|2が、|P0(k)|2=0であるような何の音源もない無音環境において得られる、請求項4記載の装置。
【請求項6】
前記平均源パワー|P0(k)|2が、前記マイクロホン・カプセルにおいて測定された圧力Pmicc,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、請求項4または5記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置であって、逆マイクロホン・アレイ応答に補正フィルタが適用されるものに関する。
【背景技術】
【0002】
球状マイクロホン・アレイは、三次元音場を捕捉する能力をもたらす。音場を記憶し、処理する一つの方法は、アンビソニックス表現である。アンビソニックスは、スイートスポットとしても知られる原点のまわりの領域における音場を記述するために正規直交な球面関数を使う。有限個のアンビソニックス係数が音場を記述する場合、その記述の精度はアンビソニックス次数Nによって決定される。球状アレイの最大アンビソニックス次数はマイクロホン・カプセルの数によって制限され、その数はアンビソニックス係数の数O=(N+1)2以上である必要がある。
【0003】
アンビソニックス表現の一つの利点は、音場の再生が、任意の所与のスピーカー配置に対して個々に適応されることができるということである。さらに、この表現は、ポストプロダクションにおいてビーム形成技法を使って、種々のマイクロホン特性のシミュレーションを可能にする。
【0004】
Bフォーマットはアンビソニックスの一つの既知の例である。Bフォーマット・マイクロホンは、アンビソニックス次数1の音場を捕捉するために四面体上の四つのカプセルを必要とする。
【0005】
1より大きい次数のアンビソニックスは高次アンビソニックス(HOA: Higher Order Ambisonics)と呼ばれ、HOAマイクロホンは典型的には剛体球上の球状マイクロホン・アレイ、たとえばmhAcousticsのアイゲンマイク(Eigenmike)である。アンビソニックス処理のためには、球の表面上の圧力分布がアレイのカプセルによってサンプリングされる。次いでサンプリングされた圧力がアンビソニックス表現に変換される。そのようなアンビソニックス表現は音場を表現するが、マイクロホン・アレイの影響を含む。捕捉される音場に対するマイクロホンの影響は、逆マイクロホン・アレイ応答を使って除去される。逆マイクロホン・アレイ応答は平面波の音場をマイクロホン・カプセルにおいて測定される圧力に変換する。それは、カプセルの指向性およびマイクロホン・アレイの音場との干渉をシミュレートする。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】S´ebastien Moreau, J´er^ome Daniel, St´ephanie Bertet、"3D Sound field Recording with Higher Order Ambisonics--Objective Measurements and Validation of a 4th Order Spherical Microphone"、Audio Engineering Society convention paper, 120th Convention 20-23 May 2006, Paris, France
【非特許文献2】Boaz Rafaely、"Analysis and Design of Spherical Microphone Arrays"、IEEE Transactions on Speech and Audio Processing, vol.13, no.1, pp.135-143, 2005
【非特許文献3】M.A.Poletti、"Three-Dimensional Surround Sound Systems Based on Spherical Harmonics"、Journal Audio Engineering Society、vol.53, no.11, pp.1004-1025、2005年
【非特許文献4】Morag Agmon, Boaz Rafaely、"Beamforming for a Spherical-Aperture Microphone"、IEEE, pp.227-230、2008年
【非特許文献5】Johann-Markus Batke, Florian Keiler、"Using VBAP-Derived Panning Functions for 3D Ambisonics Decoding"、Proc. of the 2nd International Symposium on Ambisonics and Spherical Acoustics、6-7 May 2010、Paris, France
【非特許文献6】Boaz Rafaely、"Plane-wave decomposition of the sound field on a sphere by spherical convolution"、J. Acoustical Society of America, vol.116, no.4, pp.2149-2157、2004年
【非特許文献7】mh acousticsのホームページ、オンライン(http://www.mhacoustics.com)、2007年2月1日アクセス
【非特許文献8】F. Zotter、"Sampling Strategies for Acoustic Holography/Holophony on the Sphere"、Proceedings of the NAG-DAGA, 23-26 March 2009, Rotterdam
【非特許文献9】J¨org Fliege, Ulrike Maier、"A Two-Stage Approach for Computing Cubature Formulae for the Sphere"、Technical report, 1996, Fachbereich Mathematik, Universit¨at Dortmund, Germany
【発明の概要】
【発明が解決しようとする課題】
【0007】
マイクロホン・アレイの伝達関数の等化はHOA記録にとって大きな問題である。アレイ応答のアンビソニックス表現が既知であれば、影響はアンビソニックス表現に逆アレイ応答を乗算することで除去できる。しかしながら、伝達関数の逆数を使うことは、伝達関数の小さな値および0について大きな利得を引き起こしうる。したがって、マイクロホン・アレイは堅牢な逆伝達関数に鑑みて設計すべきである。たとえば、Bフォーマットのマイクロホンは、無指向性カプセルの伝達関数の零点を克服するためにカージオイド・カプセルを使う。
【0008】
本発明は、剛体球上の球状マイクロホン・アレイに関する。剛体球のシェーディング(shading)効果は、アレイの直径に対して小さな波長をもつ周波数について良好な指向性を可能にする。他方、これらのマイクロホン・アレイのフィルタ応答は低周波数および高いアンビソニックス次数(すなわち1より大きい次数)について非常に小さな値をもつ。したがって、捕捉された圧力のアンビソニックス表現は小さい高次係数をもち、これはアレイのサイズに比べて長い波長についてはカプセルにおける小さな圧力差を表わす。圧力差は、よって高次係数も、トランスデューサ・ノイズによって影響される。よって、低周波数については、逆フィルタ応答は主として、高次アンビソニックス係数ではなくノイズを増幅する。
【0009】
この問題を克服するある既知の技法は、低周波数について高次係数をフェードアウトする(または高域通過フィルタリングする)ことである(すなわち、低周波でフィルタ利得を制限する)。これは一方では低周波数についての空間分解能を低下させるが、他方では(高度に歪められた)HOA係数を除去し、それにより完全なアンビソニックス表現を損なう。ティホノフ正規化(Tikhonov regularisation)フィルタを使ってこの問題を解決しようとする対応する補償フィルタ設計が非特許文献1のセクション4に記載されている。ティホノフ正規化フィルタは、アンビソニックス次数の制限から帰結する二乗誤差を最小化する。しかしながら、ティホノフ・フィルタは、「試行錯誤」によって記録された信号の特性に手動で適応させる必要のある正規化パラメータを必要とし、このパラメータを定義する解析的な表現はない。非特許文献2の球状マイクロホン・アレイの解析に基づいて、本発明は、マイクロホン信号の信号統計からいかにして正規化パラメータを自動的に取得するかを示す。
【0010】
本発明によって解決されるべき課題は、剛体球上に配置された球状マイクロホン・アレイの信号のアンビソニックス表現において、ノイズ、特に低周波ノイズを最小化することである。
【課題を解決するための手段】
【0011】
この問題は、請求項1記載の方法によって解決される。この方法を利用する装置が請求項2に開示される。
【0012】
本発明の処理は、平均音場パワーとマイクロホン・カプセルのノイズ・パワーとの信号対雑音比に依存して正規化ティホノフ・パラメータを計算するために使われる。すなわち、記録されたマイクロホン・アレイ信号の信号対雑音比から最適化パラメータが計算される。最適化または正規化パラメータの計算は以下の段階を含む:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号P(Ωc,t)を、球面調和関数(または等価なアンビソニックス)表現Anm(t)に変換する段階;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号P(Ωc,t)の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階;すなわち、参照信号およびノイズ信号を別個に計算することによって平均空間的パワーを計算することを含む。ここで、参照信号は使用されるマイクロホン・アレイを用いて生成されることのできる音場の表現であり、ノイズ信号はマイクロホン・アレイのアナログ処理によって生成される空間的に無相関のノイズである。
【0013】
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数1/bn(kR)を乗算する段階;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現Anm(t)に適用し、結果として適応された方向性係数dnm(t)を与える段階。
【0014】
フィルタ設計は、記録のSNRを得るために音場の平均パワーの推定を必要とする。推定は、球面調和関数表現での前記アレイのカプセルにおける平均信号パワーのシミュレーションから導出される。この推定は、球面調和関数でのカプセル信号の空間的コヒーレンスの計算を含む。平面波の連続的な表現から空間的コヒーレンスを計算することは知られているが、剛体球上の平面波の音場は連続表現では計算できないので、本発明によれば、空間的コヒーレンスは、剛体球上の球状アレイについて計算される。すなわち、本発明によれば、SNRはカプセル信号から推定される。
【0015】
本発明は以下の利点を含む。
・アンビソニックス表現の次数が、各周波数サブバンドについて記録のSNRに最適に適合される。これは、アンビソニックス表現の再生時の可聴ノイズを軽減する。
・SNRの推定はフィルタ設計のために必要とされる。それは、ルックアップテーブルを使うことによって低計算量で実装できる。これは、扱える程度の計算努力で時間変化する適応フィルタ設計を容易にする。
・ノイズ削減により、低周波数について方向性情報が部分的に復元される。
【0016】
原理的には、本発明の方法は、剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号を処理するのに好適である。本方法は:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号P(Ωc,t)を、球面調和関数またはアンビソニックス表現Anm(t)に変換する段階と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号P(Ωc,t)の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算する段階と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現Anm(t)に適用し、結果として適応された方向性係数dnm(t)を与える段階とを含む。
【0017】
原理的には、本発明の装置は、剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号を処理するのに好適である。本装置は:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号P(Ωc,t)を、球面調和関数またはアンビソニックス表現Anm(t)に変換するよう適応されている手段と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号P(Ωc,t)の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算するよう適応されている手段と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現Anm(t)に適用し、結果として適応された方向性係数dnm(t)を与えるよう適応されている手段とを含む。
【0018】
本発明の有利な追加的実施形態はそれぞれの従属請求項において開示される。
【図面の簡単な説明】
【0019】
本発明の例示的な実施形態について、付属の図面を参照しつつ述べる。
図1】剛体球上の32個のカプセルをもつマイクロホン・アレイについての結果として得られるスピーカー重みからの参照、エイリアシングおよびノイズ成分のパワーを示す図である。
図2】SNR(k)=20dBについてのノイズ削減フィルタを示す図である。
図3】ブロック・ベースの適応アンビソニックス処理のブロック図である。
図4図2の最適化フィルタ後の重み成分の平均パワーを示す図である。
【発明を実施するための形態】
【0020】
以下のセクションでは、球状マイクロホン・アレイ処理が記述される。
【0021】
〈アンビソニックスの理論〉
アンビソニックス復号は、平面波の音場を放射しているスピーカーを仮定することによって定義される。非特許文献3参照:
【数1】
L個のスピーカーの配置はアンビソニックス係数dnm(k)に格納された三次元音場を再構成する。処理は、各波数
k=2πf/csound (2)
について別個に実行される。ここで、fは周波数、csoundは音速である。インデックスnは0から有限の次数Nまで走り、一方、インデックスmは各インデックスnについて−nからnまで走る。したがって、係数の総数はO=(N+1)2である。スピーカー位置は球面座標において方向ベクトルΩl=[Θll]Tによって定義され、[・]Tはベクトルの転置バージョンを表わす。
【0022】
式(1)は、アンビソニックス係数dnm(k)のスピーカー重みw(Ωl,k)への変換を定義する。これらの重みはスピーカーの駆動関数である。すべてのスピーカー重みの重ね合わせが音場を再構成する。
【0023】
復号係数Dnml)は一般的なアンビソニックス復号処理を記述している。これは、非特許文献4のセクション3に示されるビーム・パターンの共役複素係数(ω*nm)および前述した非特許文献3のセクション3.2で与えられているモード・マッチング復号行列の諸行を含む。非特許文献5のセクション4に記載されている別の処理方法は、任意の三次元スピーカー配置について復号行列を計算するためにベクトル・ベースの振幅パン(amplitude panning)を使う。これらの行列の行要素も係数Dnml)によって記述される。
【0024】
アンビソニックス係数dnm(k)は、非特許文献6のセクション3に記載されているように、常に平面波の重ね合わせに分解されることができる。したがって、解析は方向Ωsから入射する平面波の係数:
【数2】
に限定されることができる。
【0025】
平面波の係数dnmplane(k)は、平面波の音場を放射しているスピーカーという想定について定義される。原点における圧力は、波数kについてP0(k)によって定義される。共役複素球面調和関数Ynms)*は平面波の方向性係数を表わす。上記非特許文献3で与えられている球面調和関数Ynms)の定義を使う。
【0026】
球面調和関数はアンビソニックス表現の正規直交基底関数であり、次式を満たす。
【0027】
【数3】
球状マイクロホン・アレイは、球の表面上の圧力をサンプリングする。ここで、サンプリング点の数はアンビソニックス係数の数O=(N+1)2以上でなければならない。アンビソニックス次数Nについて。さらに、サンプリング点は球の表面上に一様に分布している必要がある。ここで、O個の点の最適な分布は次数N=1についてのみ厳密に知られている。より高い次数については、球のサンプリングのよい近似が存在する。非特許文献7、非特許文献8参照。
【0028】
最適なサンプリング点Ωcについて、式(4)からの積分は、式(6)からの離散的な和と等価である。
【0029】
【数4】
ここで、Cはカプセルの総数であり、C≧(N+1)2について、n'≦Nであり、n≦Nである。
【0030】
非最適なサンプリング点について安定した結果を達成するために、共役複素球面調和関数は、擬似逆行列
【数5】
の諸列によって置換されることができる。この擬似逆行列は、L×Oの球面調和関数行列Yから得られる。ここで、球面調和関数Ynmc)のO個の係数がYの行要素である。非特許文献1のセクション3.2.2参照:
【数6】
以下では、この擬似逆行列の列要素がYnmc)と表わされると定義され、よって、式(6)からの正規直交条件も、
【数7】
なので、満たされる。ここで、C≧(N+1)2について、n'≦Nであり、n≦Nである。
【0031】
球状マイクロホン・アレイが球の表面上にほぼ一様に分布したカプセルを有しており、カプセルの数がOより多いと仮定すると、
【数8】
が成り立つ。
【0032】
(9)を(8)に代入すると、正規直交条件
【数9】
が得られる。ここで、C≧(N+1)2について、n'≦Nであり、n≦Nである。これについて下記で考える。
【0033】
〈処理のシミュレーション〉
剛体の(硬い、固定した)球上の球状マイクロホン・アレイについての完全なHOA処理チェーンは、カプセルにおける圧力の推定、HOA係数の計算およびスピーカー重みへの復号を含む。それは、平面波についてはマイクロホン・アレイからの再構成された重みw(k)は、式(3)で与えられる平面波の係数からの再構成された参照重みwref(k)に等しくなければならないことに基づいている。
【0034】
以下のセクションは、w(k)の参照重みwref(k)、空間的エイリアシング重みwalias(k)およびノイズ重みwnoise(k)への分解を提示する。エイリアシングは、有限次数Nについての連続的な音場のサンプリングによって引き起こされ、ノイズは、各カプセルについて導入される空間的に無相関な信号部分をシミュレートする。空間的エイリアシングは所与のマイクロホン・アレイについて除去できない。
【0035】
〈カプセル信号のシミュレーション〉
剛体球の表面上のマイクロホン・アレイについての入射平面波の伝達関数は、上述した非特許文献3のセクション2.2、式(19)において定義されている:
【数10】
ここで、hn(1)(kr)は第一種ハンケル関数であり、半径rは球の半径Rに等しい。伝達関数は剛体球上の圧力を散乱させる物理的な原理から導出される。つまり、剛体球の表面上では動径方向速度が0になる。換言すれば、はいってくる音場と散乱される音場の動径微分(radial derivation)の重ね合わせが0である。書籍『Fourier Acoustics』のセクション6.10.3を参照。このように、Ωsから入射する平面波についての位置Ωにおける球の表面上の圧力は、非特許文献1のセクション3.2.1の式(21)において、次によって与えられる。
【0036】
【数11】
等方的ノイズ信号Pnoisec,k)はトランスデューサ・ノイズをシミュレートするために加えられる。ここで、「等方的」というのは、諸カプセルのノイズ信号が空間的に相関していないことを意味する。これは時間領域における相関は含まない。圧力は、マイクロホン・アレイの最大次数Nについて計算された圧力Prefc,kR)と、残りの次数からの圧力に分離することができる。非特許文献2におけるセクション7、式(24)参照。残りの次数からの圧力Paliasc,kR)は、マイクロホン・アレイの次数がこれらの信号成分を再構成するために十分でないので、空間的エイリアシング圧力と呼ばれる。よって、カプセルcにおいて記録される全圧力は次式によって定義される。
【0037】
【数12】
〈アンビソニックス・エンコード〉
アンビソニックス係数dnm(k)は、式(14a)において与えられる式(12)の逆によって、カプセルにおける圧力から得られる。非特許文献1のセクション3.2.2の式(26)参照。球面調和関数Ynmc)は、式(8)を使ってYnmc)によって反転され、伝達関数bn(kR)はその逆数によって等化される:
【数13】
アンビソニックス係数dnm(k)は、式(14a)および(13a)を使って、式(14b)および(14c)に示されるように、参照係数dnmref(k)、エイリアシング係数dnmalias(k)およびノイズ係数dnmnoise(k)に分離されることができる。
【0038】
〈アンビソニックス復号〉
最適化は、原点での結果として得られるスピーカー重みw(k)を使う。すべてのスピーカーは原点に対して同じ距離をもち、よってすべてのスピーカー重みの和がw(k)になることが想定される。式(15)は、式(1)および(14b)からw(k)を与える。ここで、Lはスピーカーの数である。
【0039】
【数14】
式(15b)は、w(k)も三つの重みwref(k)、walias(k)およびwnoise(k)に分離されることができることを示している。簡単のため、非特許文献2のセクション7、式(24)で与えられている位置決め誤差はここでは考えていない。
【0040】
復号では、参照係数は、次数nの合成的に生成される平面波が生成するであろう重みである。下記の式(16a)では、式(13b)からの参照圧力Prefc,kR)が式(15a)に代入されており、圧力信号Paliasc,kR)およびPnoisec,kR)は無視されている(すなわち0と置かれる)。
【0041】
【数15】
c、n′およびm′についての和は式(8)を使って消去でき、よって式(16a)は式(3)からのアンビソニックス表現における平面波の重みの和に単純化できる。よって、エイリアシング信号およびノイズ信号が無視されるなら、次数Nの平面波の理論上の係数は、マイクロホン・アレイ記録から完璧に再構成されることができる。
【0042】
ノイズ信号wnoise(k)の結果として得られる重みは、式(15a)から、また式(13b)からPnoisec,kR)のみを使って、次式によって与えられる。
【0043】
【数16】
式(15a)において式(13b)からのPaliasc,kR)の項を代入し、他の圧力信号を無視すると、
【数17】
となる。
【0044】
結果として得られるエイリアシング重みwalias(k)は式(8)からの正規直交条件によって単純化されることはできない。インデックスn′がNより大きいからである。
【0045】
エイリアス重みのシミュレーションは、十分な精度をもってカプセル信号を表わすアンビソニックス次数を必要とする。非特許文献1のセクション2.2.2の式(14)では、アンビソニックス音場再構成についての打ち切り誤差の解析が与えられている。
【0046】
【数18】
について、そこそこの精度の音場が得られると述べられている。ここで、
【数19】
は最も近い整数への切り上げを表わす。この精度は、シミュレーションの上限周波数fmaxについて使われる。よって、アンビソニックス次数
【数20】
が、各波数のエイリアシング圧力のシミュレーションのために使われる。これは、上記の上限周波数における受け容れられる精度を与え、低い周波数については精度は増しさえする。
【0047】
〈スピーカー重みの解析〉
図1は、剛体球上の32個のカプセルをもつマイクロホン・アレイについて、方向Ωs=[0,0]Tからの平面波についての結果的なスピーカー重みからの重み成分a)wref(k)、b)wnoise(k)およびc)walias(k)のパワーを示している(上述した非特許文献4からのアイゲンマイクがシミュレーションのために使われた)。マイクロホン・カプセルは、正規直交条件が満たされるよう、R=4.2cmをもつ球の表面上に一様に分布している。このアレイによってサポートされる最大のアンビソニックス次数Nは4である。上述した非特許文献3において記述されるモード・マッチング処理が、非特許文献9に従って25個の一様に分布したスピーカー位置について復号係数Dnml)を得るために使われる。ノード番号はhttp://www.mathematik.uni-dortmund.de/lsx/research/projects/fliege/nodes/nodes.htmlで示されている。
【0048】
参照パワーwref(k)は周波数範囲全体にわたって一定である。結果として得られるノイズ重みwnoise(k)は低周波で高いパワーを示し、より高い周波数で減少する。ノイズ信号またはパワーは、分散20dBをもつ(すなわち、上記平面波のパワーより20dB低い)、正規分布した偏りのない擬似ランダム・ノイズによってシミュレートされる。エイリアシング・ノイズwalias(k)は低周波では無視できるが、周波数の上昇とともに増大し、10kHzより上では参照パワーを超える。エイリアシング・パワー曲線の傾きは、平面波方向に依存する。しかしながら、平均傾向はすべての方向について一貫している。
【0049】
二つの誤差信号wnoise(k)およびwalias(k)は参照重みを、異なる周波数範囲において歪める。さらに、これらの誤差信号は互いに独立である。したがって、エイリアス信号を考慮に入れることなくノイズ信号を最小にすることが提案される。
【0050】
参照重みと歪められた参照重みとの間の平均二乗誤差がすべての入射平面波方向について最小化される。エイリアシング信号からの重みwalias(k)は無視される。というのも、walias(k)は、アンビソニックス表現の次数によって空間的に帯域制限された後では補正できないからである。これは、サンプリングされ帯域制限された時間信号からエイリアシングが除去できない時間領域エイリアシングと等価である。
【0051】
〈最適化――ノイズ削減〉
ノイズ削減は、ノイズ信号によって導入される平均二乗誤差を最小にする。ウィーナー・フィルタ処理が、各次数nについて補償フィルタの周波数応答を計算するために周波数領域において使われる。誤差信号は、各波数kについて、参照重みwref(k)とフィルタリングされ歪められた重みwref(k)+wnoise(k)から得られる。先述したように、エイリアシング誤差walias(k)はここでは無視される。歪められた重みは最適化伝達関数F(k)によってフィルタリングされる。ここで、処理は歪められた信号と伝達関数F(k)の乗算によって周波数領域で実行される。零位相伝達関数F(k)は、参照重みとフィルタリングされ歪められた重みとの間の二乗誤差の期待値を最小にすることによって導出される。
【0052】
【数21】
ウィーナー・フィルタとしてよく知られている解は次式によって与えられる。
【0053】
【数22】
二乗された重み絶対値の期待値Eは、重みの平均信号パワーを表わす。よって、wnoise(k)とwref(k)のパワーの分数は、各波数kについての再構成された重みの逆信号対雑音比を表わす。wnoise(k)とwref(k)のパワーの計算については次のセクションで説明する。
【0054】
参照重みwref(k)のパワーは、上述した非特許文献2の付録セクションの式(34)に基づく式(16)から得られる。
【0055】
【数23】
式(24c)は、パワーが、すべてのスピーカーについて足し合わせたHOA係数Dnml)の絶対値の二乗の和に等しいことを示している。|P0(k)|2が平均音場エネルギーに等しく、P0(k)がすべてのΩsについて一定であることが想定されている。これは、wref(k)のパワーが各次数nのパワーの和に分離できることを意味している。これがwnoise(k)の期待値についても成り立つならば、グローバルな最小を得るために、誤差信号は、各次数nについて別個に式(21)から最小化されることができる。
【0056】
wnoise(k)のパワーの導出は非特許文献2のセクション7、式(28)において与えられている。ノイズ信号は空間的に無相関なので、期待値は各カプセルについて独立に計算できる。ノイズ重みの期待されるパワーは式(17)から次式によって導出される。
【0057】
【数24】
ノイズ・パワー重みの、各次数nについてのパワーの和からの分離を達成するために、いくつかの制約がなされる。スピーカーcについての和が式(10)に単純化できるならば、かかる分離が得られる。
【0058】
したがって、式(9)の条件が満たされるよう、カプセル位置は球の表面上にほぼ等しく分離している必要がある。さらに、ノイズ圧力のパワーはすべてのカプセルについて一定である必要がある。すると、ノイズ・パワーはΩcとは独立になり、cについての和から除外することができる。このように、一定のノイズ・パワーはすべてのカプセルについて
【数25】
によって定義される。これらの制約を適用すると、式(25b)は次に帰着する。
【0059】
【数26】
カプセル位置についての上記制約は普通、球状マイクロホン・アレイについては満たされている。アレイは球状の圧力を一様にサンプリングするべきだからである。各マイクロホン信号についてのアナログ処理(センサー・ノイズまたは増幅)およびアナログ‐デジタル変換によって生成されるノイズについては、常に一定のノイズ・パワーが想定されることができる。よって、上記制約は、普通の球状マイクロホン・アレイについては有効である。
【0060】
式(21b)からの期待値は、参照パワーとノイズ・パワーの線形重ね合わせである。各重みのパワーは各次数nのパワーの和に分離できる。よって、式(21b)からの期待値も各次数nについての和に分離できる。つまり、各次数nの最小からグローバルな最小が導出されることができ、よって一つの最適化伝達関数Fn(k)が各次数nについて定義できる。
【0061】
【数27】
伝達関数Fn(k)は、式(23)、(24)、(25)を組み合わせることによって、伝達関数F(k)から得られる。N+1個の最適化伝達関数は次式によって定義される。
【0062】
【数28】
伝達関数Fn(k)はカプセルの数および波数kについての信号対雑音比に依存する:
【数29】
他方、伝達関数はアンビソニックス・デコーダからは独立である。つまり、これは三次元アンビソニックス復号にも方向性ビーム形成にも有効である。よって、伝達関数は、復号係数Dnml)についての和を考慮に入れることなく、アンビソニックス係数dnm(k)の平均二乗誤差からも導出できる。パワー|P0(k)|2は時間とともに変化するので、記録された信号の現在のSNR(k)から適応伝達関数が設計されることができる。その伝達関数設計については〈最適化されたアンビソニックス処理〉のセクションでさらに述べる。
【0063】
伝達関数Fn(k)と非特許文献1のセクション4,式(32)からのティホノフ正規化伝達関数
【数30】
を比較すると、正規化パラメータλが式(29c)から導出できることがわかる。ティホノフ正規化の対応するパラメータ
【数31】
は、所与のSNR(k)について、アンビソニックス記録の平均再構成誤差を最小化する。
【0064】
伝達関数Fn(k)はそれぞれアンビソニックス次数0ないし4についての関数「a」ないし「e」として図2に示されている。ここで、伝達関数は、各次数nについて高域通過特性をもつが、より高い次数ほどカットオフ周波数が増している。この伝達関数設計のために20dBの一定のSNR(k)が使用された。カットオフ周波数は、上述した非特許文献1の論文のセクション4.1.2に記述されているように正規化パラメータλとともに低下する。したがって、低周波数についてより高い次数のアンビソニックス係数を得るには、大きなSNR(k)が必要とされる。
【0065】
最適化された重みw'(k)は次式から計算される。
【0066】
【数32】
〈最適化されたアンビソニックス処理〉
アンビソニックス・マイクロホン・アレイ処理の実際的な実装では、最適化されたアンビソニックス係数dnmopt(k)は
【数33】
から得られる。これは、カプセルcについての和と、各次数nおよび波数kについての適応伝達関数とを含んでいる。この和は、球の表面上のサンプリングされた圧力分布をアンビソニックス表現に変換し、広帯域信号については、時間領域で実行できる。この処理段階は、時間領域の圧力信号P(Ωc,t)を第一のアンビソニックス表現Anm(t)に変換する。
【0067】
第二の処理段階では、最適化された伝達関数
【数34】
が、第一のアンビソニックス表現Anm(t)から方向情報項目を再構成する。伝達関数bn(kR)の逆数がAnm(t)を方向係数dnm(t)に変換する。ここで、サンプリングされた音場は、球の表面上で散乱された平面波の重ね合わせによって生成されると想定している。係数dnm(t)は上述した非特許文献6のセクション3、式(14)において記述される音場の平面波分解を表わしており、この表現が、基本的にはアンビソニックス信号の伝送のために使用される。SNR(k)に依存して、最適化伝達関数Fn(k)は、ノイズによって覆われるHOA係数を除去するために、高次係数の寄与を減らす。
【0068】
係数Anm(t)の処理は、フィルタの伝達関数がFn,array(k)によって決定される線形フィルタリング演算と見なすことができる。これは、周波数領域でも時間領域でも実行できる。伝達関数Fn,array(k)の逐次乗算のための係数Anm(t)の周波数領域への変換のために、FFTを使うことができる。その積の逆FFTが時間領域係数dnm(t)を与える。この伝達関数処理は、重複加算(overlap-add)または重複保存(overlap-save)法を使った高速畳み込みとしても知られる。あるいはまた、線形フィルタはFIRフィルタによって近似でき、該FIRフィルタの係数は伝達関数Fn,array(k)から、逆FFTでそれを時間領域に変換し、巡回シフトを実行し、結果として得られるフィルタ・インパルス応答に漸減する窓を適用して対応する伝達関数を平滑化することにより、計算できる。次いで線形フィルタリング・プロセスは時間領域で、nとmの各組み合わせについて伝達関数Fn,array(k)の時間領域係数と係数Anm(t)との畳み込みによって実行される。
【0069】
本発明の適応的なブロック・ベースのアンビソニックス処理は図3に描かれている。上の信号経路では、マイクロホン・カプセル信号の時間領域圧力信号P(Ωc,t)がステップまたは段階31において、式(14a)を使ってアンビソニックス表現Anm(t)に変換される。ここではマイクロホン伝達関数bn(kR)による除算は実行されず(よってdnm(k)ではなくAnm(t)が計算される)、その代わりステップ/段階32において実行される。次いでステップ/段階32は、係数dnm(t)を得るために、記載された線形フィルタリング演算を時間領域または周波数領域において実行する。第二の処理経路は、伝達関数Fn,array(k)の自動適応フィルタ設計のために使われる。ステップ/段階33は、考えられる時間期間(すなわち、諸サンプルのブロック)について信号対雑音比SNR(k)の推定を実行する。この推定は、有限個の離散的な波数kについて周波数領域において実行される。よって、考慮される圧力信号P(Ωc,t)は、たとえばFFTを使って周波数領域に変換される必要がある。SNR(k)値は二つのパワー信号|Pnoise(k)|2および|P0(k)|2によって指定される。ノイズ信号のパワー|Pnoise(k)|2は所与のアレイについては一定で、カプセルによって生成されるノイズを表わす。平面波のパワー|P0(k)|2は圧力信号P(Ωc,t)から推定される。この推定についてはさらに、セクション「SNR推定」において記述する。推定されたSNR(k)から、n≦Nとして伝達関数Fn,array(k)がステップ/段階34において設計される。フィルタ設計は、式(29c)で与えられるウィーナー・フィルタおよび逆アレイ応答または逆伝達関数1/bn(kR)を含む。有利なことに、ウィーナー・フィルタは逆アレイ応答の伝達関数の高い増幅を制限する。その結果、伝達関数Fn,array(k)の扱える程度の増幅となる。次いで、フィルタ実装は、ステップ/段階32の時間または周波数領域における対応する線形フィルタ処理に適応される。
【0070】
〈SNR推定〉
SNR(k)値は記録されたカプセル信号から推定される:それは平面波の平均パワー|P0(k)|2および|Pnoise(k)|2のノイズ・パワーに依存する。
【0071】
ノイズ・パワーは、|P0(k)|2=0と想定できる何の音源もない無音環境において式(26)から得られる。調整可能なマイクロホン増幅器については、ノイズ・パワーはいくつかの増幅器利得について測定されるべきである。すると、ノイズ・パワーは、いくつかの記録のために、使用される増幅器利得に適合されることができる。
【0072】
平均源パワー|P0(k)|2は、カプセルにおいて測定された圧力Pmicc,k)から推定される。これは、式(13)からのカプセルにおける圧力の期待値と、次式によって定義される、カプセルにおける測定された平均信号パワーとの比較によって実行される。
【0073】
【数35】
Psig(k)の期待値を得るためには、ノイズ・パワー|Pnoise(k)|2を測定されたパワーから減算する必要がある。
【0074】
期待値Psig(k)は、次式によっても、式(13)から、カプセルにおける圧力のアンビソニックス表現について推定されることができる。
【0075】
【数36】
式(36b)において、式(36c)を導くために、式(4)についての正規直交条件が絶対的な大きさの展開に適用されることができる。それにより、平均信号パワーが球面調和関数Ynmc)の相互相関から推定される。伝達関数bn(kR)との組み合わせにおいて、これはカプセル位置における圧力場のコヒーレンスを表わす。
【0076】
式(35)と(36)の等しいと置くことで、記録された圧力信号Pmicc,k)および推定されたノイズ・パワー|Pnoise(k)|2からの|P0(k)|2の推定が得られる。それは式(37)において提示される。
【0077】
【数37】
式(37)の分母は所与のマイクロホン・アレイについて各波数kについて一定である。したがって、これはアンビソニックス次数Nmaxについて一度計算されて、ルックアップテーブルまたは各波数kについてのストアに格納しておくことができる。
【0078】
最後に、SNR(k)値はカプセル信号P(Ωc,kR)から次式によって得られる。
【0079】
【数38】
所与のカプセル信号からの平均源パワーの推定は、線形マイクロホン・アレイ処理からも知られる。カプセル信号の相互相関は、音場の空間的コヒーレンスと呼ばれる。線形アレイ処理のためには、空間的コヒーレンスが、平面波の連続的表現から決定される。剛体球上の散乱された音場の記述は、アンビソニックス表現でのみ知られている。よって、SNR(k)の提示される推定は、剛体球の表面上の空間的コヒーレンスを決定する新しい処理に基づく。
【0080】
結果として、図2の最適化フィルタから得られるw'(k)の平均パワー成分は、モード・マッチング・アンビソニックス・デコーダについて図4に示される。ノイズ・パワーは1kHzの周波数までは、−35dBに低下させられている。1kHzより上では、ノイズ・パワーは−10dBまで線形に増大する。結果として得られるノイズ・パワーは、周波数約8kHzまではPnoisec,k)=−20dBより小さい。10kHzより上では全パワーは10dB上げられる。これはエイリアシング・パワーによって引き起こされる。10kHzより上では、マイクロホン・アレイのHOA次数は、Rに等しい半径をもつ球についての表面上の圧力分布を十分に記述しない。よって、得られるアンビソニックス係数によって引き起こされる平均パワーは参照パワーより大きい。
いくつかの付記を記載しておく。
〔付記1〕
剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号(P(Ωc,t))を処理する方法であって:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ωc,t))を、球面調和関数またはアンビソニックス表現Anm(t)に変換する段階(31)と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号(P(Ωc,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階(33)と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算する段階(34)と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現Anm(t)に適用し、結果として適応された方向性係数dnm(t)を与える段階(32)とを含む、
方法。
〔付記2〕
剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号(P(Ωc,t))を処理する装置であって:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ωc,t))を、球面調和関数またはアンビソニックス表現Anm(t)に変換するよう適応されている手段と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号(P(Ωc,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算するよう適応されている手段と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現Anm(t)に適用し、結果として適応された方向性係数dnm(t)を与えるよう適応されている手段とを含む、
装置。
〔付記3〕
前記ノイズ・パワー|Pnoise(k)|2が、|P0(k)|2=0であるような何の音源もない無音環境において得られる、付記1記載の方法または付記2記載の装置。
〔付記4〕
前記平均源パワー|P0(k)|2が、前記マイクロホン・カプセルにおいて測定された圧力Pmicc,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、付記1または3記載の方法または付記2または3記載の装置。
〔付記5〕
前記アレイの前記伝達関数Fn,array(k)が周波数領域において決定され:
・前記係数Anm(t)をFFTを使って周波数領域に変換し、続いて前記伝達関数Fn,array(k)を乗算し;
・その積の逆FFTを実行して時間領域係数dnm(t)を得ることを含む、
あるいは、時間領域でのFIRフィルタによって近似され、
・逆FFTを実行し;
・巡回シフトを実行し;
・結果として得られるフィルタ・インパルス応答に、対応する伝達関数を平滑化するために漸減する窓を適用し;
・nとmの各組み合わせについて、結果として得られるフィルタ係数と前記係数Anm(t)との畳み込みを実行することを含む、
付記1、3および4のうちいずれか一項記載の方法または付記2ないし4のうちいずれか一項記載の装置。

図1
図2
図3
図4