(58)【調査した分野】(Int.Cl.,DB名)
前記支配的な方向の推定は、現在のフレーム各々に対して隣接するフレームの内容が考慮されるように、長くオーバーラップするフレーム群に依存する、請求項1または3に記載の方法。
前記支配的な方向の推定は、現在のフレーム各々に対して隣接するフレームの内容が考慮されるように、長くオーバーラップするフレーム群に依存する、請求項8または10に記載の装置。
【背景技術】
【0002】
高次アンビソニックス(Higher Order Ambisonics:HOA)は、3次元空間内の特定の場所(「スイートスポット」と呼ばれる場所)の近辺における完全な
音場を取得できる利点をもたらす
。そのようなHOA表現は、具体的な
スピーカーの設定とは無関係であり、この点、ステレオ又はサラウンド等のようなチャネル方式の技術と異なる。このような柔軟性は、デコードプロセスが特定の
スピーカーの設定の場合におけるHOA表現を再生しなければならないことを代償とする。
【0003】
HOAは、所望のリスナーの位置の近辺の場所xにおける個々の角波数kに関する空気圧の複素振幅表現に基づいており、一般性を失うことなく、リスナーの位置は球面座標系の原点であると仮定してよく、HOAは打ち切られた球面調和(Spherical Harmonics:SH)展開を用いて表現される。この表現の空間分解能は、展開の最大次数Nを増やすことにより改善される。不都合なことに、展開係数の個数O(オー)は、次数Nに関して二次関数的に増え、具体的には、O=(N+1)
2である。例えば、次数N=4を利用する典型的なHOA表現は、O=25個の係数を必要とする。所望のサンプリングレートがf
sでありサンプル当たりのビット数がN
bである場合、HOA信号表現の送信のための全体的なビットレートは、O・f
s・N
bにより決定され、次数N=4であり、サンプリングレートがf
s=48kHzであり、サンプル当たりのビット数がN
b=16である場合のHOA信号表現の送信は、19.2MBit/sのビットレートにもなってしまう。従って、HOA信号表現の圧縮が極めて望まれている。
【0004】
既存の空間オーディオ圧縮方式の概要は、特許文献1
或いは非特許文献1等に記載されている。
【0005】
以下の技術は本発明の背景技術に相応しい。
【0006】
Bフォーマット信号は一次のアンビソニックス表現と等価であり、Bフォーマット信号は非特許文献2に記載されているように
方向オーディオ
符号化(Directional Audio Coding:DirAC)を用いて圧縮されることが可能である。
【0007】
テレビ会議のアプリケーションに提案されている一形態では、Bフォーマット信号が、1つの無指向性信号及びサイド情報に、1つの方向と周波数バンド毎の分散パラメータとの形式でコード化される。しかしながら、データレートの顕著な減少効果は、再生時に僅かな信号品質が取得されることを代償としている。更に、DirACは一次のアンビソニックス表現の圧縮に限られ、空間解像度が非常に低いという不利益を被る。
【0008】
N>1の場合のHOA表現を圧縮する既存の方法はほとんど知られていない。1つの方法は、
知覚アドバンストオーディオコーディング(AAC)コーデックを利用して個々のHOA係数シーケンスについての直接的なエンコーディングを実行するものであり、この点については例えば非特許文献3に記載されている。しかしながら、そのような方法に関する本質的な問題は、決して聞こえることがない信号の
知覚符号化を行うことである。再構築される再生信号は、通常、HOA係数シーケンスの重み付け加算により取得される。圧縮解除されるHOA表現が特定の
スピーカーの配置に関して表現される場合、
知覚符号化ノイズが露呈する高い確率が存在する。より正確に言えば、
知覚符号化ノイズの特定に伴う主な問題は、個々のHOA係数シーケンス同士の間の相互相関が高いことである。個々のHOA係数シーケンスにおける符号化雑音信号は、通常、互いの相関は無い又は低いので、
知覚符号化ノイズの建設的な重ね合わせが生じるのと同時に、ノイズの無いHOA係数シーケンスは重ね合わせによりキャンセルされる。別の問題は、上記の相互相関が、
知覚符号化の効率の低下を招いてしまうことである。
【0009】
そのような影響の程度を最小化するため、特許文献1においては、
知覚符号化の前に、HOA表現を空間
領域の等価な表現に変換することが提案されている。空間
領域信号は、従来の
方向性信号に対応することに加えて、(複数の)スピーカーが空間
領域変換で仮定されているのと完全に同じ方向に配置されていた場合にはスピーカー信号に対応することになる。
【0010】
空間
領域への変換は、個々の空間
領域信号同士の相互相関を減らす。しかしながら、相互相関は完全には排除されない。比較的高い相互相関をもたらす
方向性信号の具体例は、
方向性信号の方向が(複数の)空間
領域信号によりカバーされる隣接する方向の間にある場合である。特許文献1及び非特許文献3の別の欠点は、
知覚符号化信号の個数が(N+1)
2であることであり、ここでNはHOA表現の次数である。従って圧縮されるHOA表現のデータレートはアンビソニックスの次数に関して二次関数的に増える。
【0011】
後述するように本発明による圧縮処理は、HOA
音場表現を、
方向性成分(directional component)とアンビエント成分(ambient component)とに分解する処理を実行する
。特に、
方向性音場成分の計算に関し、複数の支配的なサウンド方向を推定する新たな処理が、本明細書で説明される。
【0012】
アンビソニックスに基づく既存の方向推定方法に関し、上記の非特許文献2に記載されている方法は、Bフォーマット
音場表現に基づく方向推定のためのDirAC符号化に関連する。方向は、
音場エネルギが流れる方向を指し示す平均強度ベクトルから取得される。Bフォーマットに基づく代替例については例えば非特許文献4に記載されている。方向推定は、特定の方向に仕向けられるビームフォーマ出力信号が最大
パワーをもたらす方向を探索することにより、反復的に実行される。
【0013】
しかしながら、何れの方法も方向推定のBフォーマットによる制約を受け、比較的小さな空間解像度による不利益を被ってしまう。別の欠点は、そのような推定が、単独の支配的な方向に限られてしまうことである。
【0014】
HOA表現は、改善された空間解像度をもたらし、複数の支配的な方向に関する改善された推定を可能にする。HOA
音場表現に基づいて複数の方向の推定を実行する既存の方法はほとんど知られていない。圧縮検出に基づく方法が非特許文献5及び非特許文献6において提案されている。主な考え方は、空間的にまばらな
音場を推定すること、すなわち少数の
方向性信号のみを構成することである。球面上に多数の検査方向を設定した後に最適アルゴリズムが実行され、対応する
方向性信号に関して可能な限り少ない検査信号を発見し、所与のHOA表現により検査方向が十分に記述されるようにする。この方法は、所定のHOA表現により実際に提供される空間解像度と比較して改善された空間解像度をもたらし、その理由は、所定のHOA表現の限られた次数に起因する空間分散を回避するからである。しかしながら、アルゴリズムのパフォーマンスは、まばらであるという条件(sparsity assumption)が満たされているか否かに強く依存する。特に、この方法が不都合になるのは、
音場が何らかのマイナーな追加的なアンビエント成分を含んでいる場合や、HOA表現が、マルチチャネル記録により算出される際に生じるノイズの影響を受けるような場合である。
【0015】
更に、直感的な方法は、非特許文献7に記載されているように、所与のHOA表現を空間
領域に変換し、その後に
方向性パワーの最大値を探索することである。この方法の欠点は、アンビエント成分の存在が、
方向性パワー分布を不明瞭化させること、及び、如何なるアンビエント成分も存在しない場合と比較して
方向性パワーの最大を変位させること等を招いてしまうことである。
【発明を実施するための形態】
【0027】
<実施の形態の詳細な説明>
アンビソニックス信号は、球面調和(SH)展開を利用して
音源のない領域の
音場を記述する。この理論の実現可能性は、音圧の時間及び空間的な振る舞いが本質的には波動方程式により決定されるという物理的性質に起因する。
【0028】
<波動方程式及び球面調和展開>
アンビソニックスに関する詳細な説明を行うため、以下においては球面座標系又は極座標系が仮定され、空間内の点x=(r,θ,φ)
Tは、半径r>0(すなわち、座標系の原点に至るまでの距離)と、原線又は極軸であるz軸に対してなす傾斜角θ∈[0,π]と、xy平面内でx軸から図った方位角φ∈[0,2π]とにより表現される。この球面座標系において、結合された
音源のない領域(connected source-free area)における音圧p(t,x)の波動方程式は以下のように与えられる。
【数1】
ここで、Csは音の速度(音速)を示す。上記の数式については、例えば、Earl G. Williams, “Fourier Acoustics”, vol.93 of Applied Mathematical Sciences, Academic Press,1999 に示されている。
【0029】
時間に対する音圧のフーリエ変換は次式で表される。
【数2】
ここでiは虚数単位を示す
。上記のウィリアムス(Williams)の書籍によれば、SHの級数に展開可能である。
【数3】
この展開は、結合された
音源のない領域内の全ての点xについて有効であり、すなわち級数が収束する領域に対応することに、留意すべきである。
【0030】
数式(4)において、kは次式により規定される角波数を示す。
【数4】
また、p
nm(kr)はSH級数係数を示し、krという積のみに依存する。
【0031】
更に、Y
nm(θ,φ)は次数(order)がnであり位数(degree)がmであるSH関数である。
【数5】
ここで、P
nm(cosθ)はルジャンドル陪関数であり、(・)!は階乗を示す。
【0032】
非負の位数mに関するルジャンドル倍関数は、ルジャンドル多項式P
nm(x)により規定される。
【数6】
【0033】
負の位数(すなわち、m<0)の場合には、ルジャンドル倍関数は次のように規定される。
【数7】
【0034】
また、ルジャンドル多項式P
n(x)(n≧0)はロドリゲスの公式(Rodirigues’Formula)を用いて規定されてもよい。
【数8】
当該技術分野においては、例えば、Poletti,“Unified Description of Ambisonics using Real and Complex Spherical Harmonics”, Proceedings of the Ambisonics Symposium 2009, 25-27 June 2009, Graz, Austriaに示されているように、負の位数mに関して因子が数式(6)と(-1)
mだけ異なるSH関数の定義も存在する。
【0035】
或いは、時間に関する音波のフーリエ変換は、実数のSH関数S
nm(θ,φ)を用いて表現されてもよい。実数のSH関数は、実SH関数、リアルSH関数等と言及されてもよい。
【0036】
【数9】
様々な文献において、(例えば、上記のPolettiの文献のように)実数のSH関数に関して異なる定義が存在する。本願において適用される定義の1つは、次のようなものである。
【数10】
ここで、(・)
*は複素共役を示す。数式(6)を数式(11)に代入することにより、次のような別の表現が得られる。
【数11】
【0037】
実数のSH関数はその定義から実数値をとるが、対応する展開係数q
nm(kr)について一般的に成り立つわけではない。
【0038】
複素SH関数は実数のSH関数と次のような関係を有する。
【数12】
【0039】
方向ベクトルΩ:=(θ,φ)
Tとともに複素SH関数Y
nm(θ,φ)及び実数のSH関数S
nm(θ,φ)は、3次元空間内の単位球面
S2上における自乗可積分複素数関数(squared integrable complex valued function)のための直交基底をなす。
【数13】
ここで、δはクロネッカーのデルタ関数を示す。2番目の表現は数式(11)の実球面調和関数の定義及び数式(15)から導出される。
【0040】
<
内部問題及びアンビソニックス係数>
アンビソニックスの目的は、座標系の原点付近の
音場を表現することである。一般性を失うことなく、対象の領域は、座標系の中心から半径Rの球又はボールであると仮定され、数学的には{x|0≦r≦R}という集合により指定される。この表現に関する重要な仮定は、このボールが如何なる音源も含んでいないと仮定されることである
。このボールの中の
音場の表現を見出す問題は
、「内部問題」と言及され
る(例えば、上記のウィリアムの書籍)。
【0041】
内部問題に関し、SH関数展開係数P
nm(kr)は、次式のように表現できることが理解される。
【数14】
ここで、j
n(・)は一次の球ベッセル関数を示す。数式(17)によれば、
音場に関する完全な情報は、アンビソニックス係数として言及される係数a
nm(k)に含まれている。
同様に、実数SH関数の展開係数q
nm(kr)は、次式のように因子分解できる(積の形式で表現できる)。
【数15】
ここで、b
nm(k)は、実数SH関数を用いる展開に関するアンビソニックス係数として言及される。これらはa
nm(k)と次のような関係を有する。
【数16】
【0042】
<平面波分解>
座標系の原点を中心とする音源の無いボールの中の
音場は、全ての可能な方向からボールに入射する様々な角波数kの平面波の
無限個の重ね合わせとして表現できる(この点については、例えば、上記のウィリアムスの書籍における「Plane-wave decomposition...」等を参照されたい)。Ω
0の方向からの角波数kの平面波の複素振幅は、D(k,Ω
0)により与えられると仮定すると、数式(11)及び数式(19)を用いて行った導出法と同様に、次数SH関数展開に関する対応するアンビソニックス係数は、次式のように与えられる。
【数17】
【0043】
従って、角波数kの無限個の平面波の重ね合わせにより得られる
音場に関するアンビソニックス係数は、数式(20)の全ての可能な方向Ω
0∈
S2に関する積分から得られる。
【数18】
【0044】
関数D(k,Ω)は、「振幅密度(amplitude density)」と言及され、単位球面S
2において自乗可積分可能であると仮定される。これは次式のように実数SH関数の級数に展開されることが可能である。
【数19】
ここで、展開係数c
nm(k)は数式(22)に登場する積分の部分に等しく、すなわち、次のように書ける。
【数20】
【0045】
数式(24)を数式(22)に代入することにより、アンビソニックス係数b
nm(k)は展開係数c
nm(k)のスケールを変えたバージョンであることが分かる。すなわち、次式のように書ける。
b
nm(k)=4πi
nc
nm(k) (25)
【0046】
スケール変更されたアンビソニックス係数c
nm(k)及び振幅密度関数D(k,Ω)に、時間に関する逆フーリエ変換を適用すると、対応する時間領域の表現として次式が得られる。
【数21】
そして、時間領域において、数式(24)は次のように変形できる。
【数22】
【0047】
時間領域の
方向性信号d(t,Ω)は、次式に従って実数SH関数展開により表現されてもよい。
【数23】
【0048】
SH関数S
nm(Ω)は実数値をとるという知識を利用すると、d(t,Ω)の複素共役は次のように表現できる。
【数24】
時間
領域信号d(t,Ω)が実数である
と仮定すると、すなわちd(t,Ω)=d
*(t,Ω)であると仮定すると、数式(29)及び数式(30)により、その場合の係数c~
nm*(t)は実数となり、
c~nm(t)=c~nm*(t)となる。
【0049】
以下、c~
nm(t)はスケー
リングされた時間領域アンビソニックス係数と言及される場合がある。また、以下の説明において、
音場表現はこれらの係数により記述されることが仮定され、圧縮に関する以下の項目において詳細に説明される。
【0050】
本発明による処理に使用される係数c~
nmによる時間領域は、対応する周波数領域のHOA表現c
nm(k)と等価であることに、留意を要する。従って、説明される圧縮及び圧縮解除は、数式の若干の修正により周波数領域で等価的に実現できる
。
【0051】
<有限次数の空間分解能>
実際には、座標系の原点付近の
音場は、n≦Nである次数の有限個のアンビソニックス係数c
nm(k)のみを利用して記述される。次式に従って打ち切られたSH関数の級数から振幅密度関数を計算することは、真の振幅密度関数D(k,Ω)に対して或る種の空間分散成分(spatial dispersion)を導入する(例えば、上記の文献の「Plane-wave decompression...」を参照されたい)。
【数25】
これは数式(31)を利用して方向Ω
0からの単独の平面波に関する振幅密度関数を計算することにより実現可能である。
【数26】
ここで、Θは、方向がΩを向いているベクトルと方向が
Ω0を向いているベクトルとの間のなす角度を示し、次式を満たす。
cosΘ=cosθcosθ
0+cos(φ-φ
0)sinθsinθ
0 (39)
【0052】
数式(34)において、数式(20)の平面波に関するアンビソニックス係数が使用され、数式(35)及び数式(36)においていくつかの数学的理論が使用されている(例えば、上記の文献の「Plane-wave decompression...」を参照されたい)。数式(33)の性質は数式(14)を利用して示すことが可能である。
【0053】
数式(37)と真の振幅密度関数とを比較すると、次式が得られる。
【数27】
ここで、δ(・)はディラックのデルタ関数を示し、空間分散は、分散関数ν
N(Θ)をスケー
リングされたディラックのデルタ関数で置換することから得られ、
図1には、様々なアンビソニックス次数N及び角度Θ∈[0,π]に関し、最大値で正規化された分散関数が示されている。
【0054】
ν
N(Θ)の最初のゼロ
になる点はN≧4の場合には近似的にπ/Nの位置にあり(例えば、上記の文献の「Plane-wave decompression...」を参照されたい)、アンビソニックス次数Nが増えるにつれて分散の影響は減っている(及び空間分解能も改善する)。
【0055】
N→∞とすると、分散関数ν
N(Θ)はスケー
リングされたディラックのデルタ関数に収束する。これは、数式(35)とともにルジャンドル多項式
(数式(41))の完全性関係
を利用して、N→∞の場合のν
N(Θ)の極限を表現することにより理解される。
【数28】
【数29】
【0056】
次式によりn≦Nの次数の実数SH関数のベクトルを規定すると、
【数30】
(ただし、O=(N+1)
2であり、(・)
Tは転
置を示す)、数式(37)と数式(33)との比較により、分散関数が、次式のように2つの実数SHベクトルのスカラ積により表現可能であることが示される:
ν
N(Θ)=S
T(Ω)S(Ω
0) (47)
【0057】
分散は時間領域では次のように等価的に表現可能である
【数31】
【0058】
<サンプリング>
或るアプリケーションの場合、有限数J個の離散的な方向Ω
jにおける時間
領域の振幅密度関数のサンプルから、スケーリングされた時間
領域のアンビソニックス係数C~
nm(t)を決定することが望ましい。数式(28)における積分は、次のように
B. Rafaely, "Analysis and Design of Spherical Microphone Arrays", IEEE Transactions on Speech and Audio Processing, vol.13, no.1, pp.135-143, January 2005による有限個の総和により近似される。
【数32】
ここで、g
jは近似的に選択されたサンプリング
重み係数を示す
。上記の書籍の「Analysis and Design...」とは異なり、近似式(50)は、複素SH関数を用いる周波数領域表現ではなく、実数SH関数を用いる時間領域表現に関連している。近似式(50)が正確であ
るために必要な条件は、振幅密度
が有限の調和次数N
を有することであり、すなわち、n>Nに関し、
c~
nm(t)=0 (51)
が成立することである。
【0059】
この条件を満たさない場合、数式(50)は空間的なエイリアシングエラーの影響を被ってしまう。この点については、例えば、B. Rafaely, "Spatial Aliasing in Spherical Microphone Arrays", IEEE Transactions on Signal Processing, vol.55, no.3, pp .1003-1010 , March 2007に記載されている。
【0060】
次に必要な条件は、サンプリング点Ω
j及び対応する
重み係数が、上記の書籍の「Analysis and Design...」に記載されているような条件を満たすことを要求する。
【数33】
【0061】
条件(51)及び(52)は正確なサンプリングに関して十分である。
【0062】
サンプリング条件(52)は一群の線形方程式をなし、次式のように1つの行列方程式を用いてコンパクトに表現できる。
ΨGΨH=I (53)
ここで、Ψは次式により規定されるモード行列を示す。
【数34】
また、Gは対角要素が
重み係数になっている行列を示す。
すなわち、
G:=diag(g
1,,g
J) (55)
【0063】
数式(53)によれば、数式(52)が成立するのに必要な条件は、サンプリング点の数JがJ≧
Oを満たすことであることが、分かる。J個のサンプリング点における時間領域の振幅密度の値を次のようにベクトル形式にまとめ、
【数35】
スケーリングされた時間領域アンビソニックス係数のベクトルを次式により規定すると、
【数36】
何れのベクトルもSH関数展開(29)により関連していることが分かる。この関係は次の線形方程式系をもたらす。
w(t)=Ψ
Hc(t) (58)
【0064】
導入されたベクトル表記を利用すると、時間領域の振幅密度関数サンプルの値から、スケーリングされた時間領域のアンビソニックス係数を計算することは、次のように表現できる。
c(t)≒ΨGw(t) (59)
【0065】
所定の固定されたアンビソニックス次数Nの場合、サンプリング条件の数式(52)が成り立つように、サンプリング点Ω
jの個数J≧
O及び対応する
重み係数を計算することは、しばしば可能ではない。しかしながら、サンプリング条件が十分に近似されるようにサンプリング点が選択される場合、モード行列ΨのランクはOになり、条件の数は少なくなる。その場合、モード行列Ψの擬似的な
逆行列であるΨ
+が存在し、
Ψ
+:=(ΨΨ
H)
-1ΨΨ
H (60)
時間領域の振幅密度関数サンプルのベクトルから、スケーリングされた時間領域のアンビソニックス係数ベクトルc(t)の妥当な近似は、
c(t)≒Ψ
+w(t) (61)
により与えられる。
【0066】
J=
Oでありかつモード行列のランクが
Oであった場合、擬似的な
逆行列は、次式が成立するので、その
逆行列に一致する。
Ψ+=(ΨΨ
H)
-1Ψ=Ψ
-HΨ
-1Ψ=Ψ
-H (62)
【0067】
更に、サンプリング条件の数式(52)が満たされる場合、
Ψ
-H=ΨG (63)
が成立し、近似的な数式(59)及び(61)は等価であり一致する。
【0068】
ベクトルw(t)は、空間に関する時間
領域信号のベクトルとして解釈できる。HOA
領域から空間
領域への変換は、例えば数式(58)により実行可能である。この種の変換は、本願において「球面調和変換(SHT)」と言及され、低次数化されたアンビエントHOA成分が空間
領域に変換される場合に使用される。SHTに関する空間サンプリング点Ω
jはg
j≒4π/
O(j=1,...,J)と共に数式(52)のサンプリング条件を近似的に満たしていること及びJ=
Oであることが、黙示的に仮定されている。これらの仮定の下で、SHT行列は、Ψ
H≒(4π/
O)Ψ
-1の関係を満たす。SHTに関する絶対値のスケーリングが重要でない場合、(4π/
O)は無視されてもよい。
【0069】
<圧縮>
本発明は、所与のHOA信号表現の圧縮に関連する。上述したように、HOA信号表現は、時間
領域における所定数の支配的
方向性信号とHOA
領域におけるアンビエント成分とに分解され、その後に低次数化によりアンビエント成分のHOA表現を圧縮する処理が続く。この処理は、テストを監視することを前提とし、周辺の
音場成分は、低次のHOA表現で十分に正確に表現可能であるという仮定を活用する。支配的な
方向性信号を抽出することで、圧縮及びそれに対応する圧縮解除の処理の後に、高い空間分解能を維持することを保証できる。
【0070】
圧縮解除の後、低次数化されたアンビエントHOA成分は空間
領域に変換され、特許文献1に示されているような
方向性信号と共に
知覚符号化される。
【0071】
圧縮処理は
図2に示すような2つの連続的なステップを含む。個々の信号の正確な定義は、圧縮に関する以下の説明で詳細に説明される。
【0072】
図2(a)の最初のステップ又はステージ又は段階では、支配的方向推定部22において、支配的な方向が推定され、アンビソニックス信号
C(l)を、
方向性成分及び
アンビエント成分に分解する処理が実行され、ここで「l(エル)」はフレームインデックスを示す
。方向性成分は、
方向性信号算出ステップ又はステージ23において算出され、これにより、アンビソニックス表現は、一群のD個の通常の
方向性信号X(l)と対応する方向
とにより表現される時間
領域信号に変換される。残留アンビエント成分は、アンビエントHOA成分算出ステップ又はステージ24において算出され、HOA
領域係数
CA(l)により表現される。
【0073】
図2(b)に示す第2のステップにおいて、
方向性信号X(l)及びアンビエントHOA成分に対する
知覚符号化の処理が、次のように実行される:
_通常の時間
領域方向性信号X(l)は、何らかの既知の
知覚圧縮技術を利用して、
知覚符号化器27において個別的に圧縮されることが可能である。
_アンビエントHOA
領域成分
CA(l)の圧縮は、2つのサブステップ又はステージにおいて実行される。
【0074】
第1のサブステップ又はステージ25は、元々のアンビソニックス次数NをN
REDに(例えば、N
RED=2)に低減する処理を実行し、アンビエントHOA成分
CA,RED(l)を取得する。周囲の
音場の成分は、低い次数のHOAにより十分正確に表現可能であるということが仮定されている。第2のサブステップ又はステージ26は、特許文献1に記載されているような圧縮に基づく。周囲の
音場の成分に関するO
RED:=(N
RED+1)
2個のHOA信号C
A,RED(l)は、サブステップ/ステージ25において算出されており、これらの信号は、球面調和変換を適用することによって空間領域におけるO
RED個の等価な信号W
A,RED(l)に変換され、並列的な
知覚符号化器27のバンクに入力されることが可能な通常の時間
領域信号となる。何らかの既存の
知覚符号化又は圧縮技術が適用可能である。符号化された
方向性信号
及び低次数化された
符号化された空間
領域信号
が出力され、変換又は保存されることが可能である。
【0075】
有利なことに、全ての時間
領域信号
X(l)及びW
A,RED(l)の
知覚圧縮は、
知覚符号化器27において一緒に実行可能であり、潜在的に残存するチャネル間の相関(inter- channel correlation)を利用することにより全体的な符号化効率を改善する。
【0076】
<圧縮解除>
図3には、受信又は再生される信号についての圧縮解除処理が示されている。圧縮処理の場合と同様に、2つのステップが含まれている。
【0077】
図3(a)に示される第1のステップ又はステージでは、
知覚復号化部31において、
符号化された方向性信号
及び低次数化された
符号化された空間
領域信号
についての
知覚復号化又は圧縮解除が実行され、
は
方向性成分を表現し、
はアンビエントHOA成分を表現する。
知覚復号化された又は非圧縮化された空間
領域信号
は、逆球面調和変換部32において、逆球面調和変換又は
逆SH変換により、次数がNREDであるHOA
領域表現
に変換される。その後、次数伸張ステップ又はステージ33において、次数がNである適切なHOA表現
が、次数伸張により
から推定される
。
【0078】
図3(b)に示される第2のステップ又はステージにおいて、HOA信号構築部34により、
方向性信号
及び対応する方向情報
に加えて元々の次数のアンビエントHOA成分
から、完全なHOA表現
が再構築される。
【0079】
<所要データレートの達成可能な低減効果>
本発明の実施形態により解決される課題は、HOA表現に対する既存の圧縮方法と比較してデータレートの顕著な減少を図ることである。以下、圧縮されていないHOA表現に対する達成可能な圧縮率を議論する。圧縮率は、次数がNである非圧縮HOA信号C(l)を伝送するのに必要なデータレートと、圧縮された信号表現を伝送するのに必要なデータレートとの比率から得られ、圧縮された信号表現は、D個の
知覚符号化された
方向性信号X(l)及び対応する方向情報
とアンビエントHOA成分を表現するN
RED個の
知覚符号化された空間
領域信号W
A,RED(l)とを有する。
【0080】
非圧縮HOA信号C(l)を伝送する場合には、
O・f
s・N
bのデータレートが必要になる。これに対して、D個の符号化された
方向性信号X(l)を伝送するには、D・f
b,CODのデータレートを必要とし、f
b,CODは
知覚符号化される信号のビットレートを示す。同様に、N
RED個の
知覚符号化される空間
領域信号W
A,RED(l)信号の伝送は、O
RED・f
b,CODのビットレートを必要とする。方向
は、サンプリングレートf
bよりもかなり遅いレートで算出されることが仮定されており、例えば、B個のサンプルで形成される信号フレームの持続時間に固定されていてもよく、一例としてf
s=48kHzのサンプリングレートの場合にB=1200であり、圧縮されたHOA信号の全体的なデータレートの計算の際に、対応するデータレートの分担量(share)は無視されてもよい。
【0081】
従って、圧縮された表現の伝送は、近似的に(D+O
RED)・f
b,CODのデータレートを必要とする。従って、圧縮率r
COMPRは、次式のように表現できる。
【数37】
【0082】
例えば、次数がN=4であり、サンプリングレートがf
s=48kHzであり、サンプル当たりN
b=
16ビットであり、支配的な方向の数はD=3であり、低減されたHOA次数はN
RED=2であり、ビットレートが64kbits/sである場合のHOA表現の圧縮率は、r
COMPR≒25という圧縮率になる。圧縮された表現の伝送は、近似的に768kbits/sのデータレートを必要とする。
【0083】
<
マスキングされない符号化ノイズの出現確率の低減>
背景技術で説明したように、特許文献1で説明されている空間
領域信号の
知覚圧縮は、信号同士の間の残存する相互相関の影響を被り、
知覚符号化ノイズの露呈(unmasking)を招いてしまうことが懸念される。本発明によれば、支配的な方向の信号が、先ず、
知覚符号化される前にHOA
音場表現から取り出される。これは、HOA表現を構築する場合に、
知覚復号化の後に、符号化ノイズが、その
方向性信号と厳密に一致する空間的な指向性を有することを意味する。特に、符号化ノイズだけでなく指向性信号の任意の方向に対する影響が、有限次数の空間分解能の箇所で説明したように空間分散関数により決定論的に記述される。言い換えれば、任意の時点において、符号化ノイズを表現するHOA係数ベクトルは、
方向性信号を表現するHOA係数ベクトルを正確に何倍かしたものである。このため、ノイズを含むHOA係数の任意の重み付け加算は、
知覚符号化ノイズの如何なる露呈も招かなくなる。
【0084】
更に、低次数化されたアンビエント成分が特許文献1においても記載されているが、定義により、アンビエント成分の空間
領域信号は互いに低い相関しか示さないので、
知覚ノイズが露呈してしまう蓋然性は低くなる。
【0085】
<改善された方向推定>
本発明による方向推定は、エネルギ
的に支配的なHOA成分の
方向性パワー分布に依存している。
方向性パワー分布(directional power distribution)は、HOA表現に関するランクが削減された相関行列から計算され、これはHOA表現の相関行列の固有値分解から得られる。
【0086】
上記の書籍の「Plane-wave decomposition...」で使用されている方向推定と比較すると、本実施形態は高精度である利点をもたらすが、その理由は、方向推定に関して全てのHOA表現を利用するのではなく、エネルギの観点から支配的なHOA成分に着目することにより、
方向性パワー分布の空間的な不明瞭化を減らすことができるからである。
【0087】
上記の
文献"The Application of Compressive Sampling to the Analysis and Synthesis of Spatial Sound Fields" 及び "Time Domain Reconstruction of Spatial Sound Fields Using Compressed Sensing"
で提案されている方向推定と比較すると、本発明はロバスト性に優れた利点をもたらす。なぜなら、HOA表現を
方向性成分及びアンビエント成分に分解することは、完全に達成されることは滅多になく、僅かな量のアンビエント成分が
方向性成分中に残っている(それでも適切に方向推定を継続できる)。上記の2つの文献のような圧縮サンプリング方法は、アンビエント信号の存在に非常に敏感であることに起因して、妥当な方向推定結果を提供することに失敗してしまうことが懸念される。
【0088】
有利なことに、本発明による方向推定はそのような問題による懸念を被らない。
【0089】
<HOA表現を分解する代替例>
HOA表現を、複数の
方向性信号及び関連する方向情報とHOA
領域のアンビエント成分とに分解する技術は、Pulkkiの文献の「Spatial Sound Reproduction with Directional Audio Coding」に示されている方法に従って、HOA表現の信号適応DirACライクレンダリング(signal-adaptive DirAC like rendering)に使用可能である。
【0090】
2つの成分の物理的性質は異なるので、HOA成分の各々は別々に
レンダリングされることが可能である。例えば、
方向性信号は、ベクトル振幅パニング(Vector Based Amplitude Panning:VBAP)のような信号パニング技術を用いて
スピーカーに
レンダリングされることが可能であり、VBAPについては、例えば、次の文献に記載されている:Pulkki, "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", Journal of Audio Eng. Society, vol.45, no.6, pp.456- 466, 1997。アンビエントHOA成分は、既存の標準的なHOAレンダリング技術を用いて処理されることが可能である。
【0091】
そのようなレンダリングは、次数が「1」であるアンビソニックス表現に限定されず、次数がN>1であるHOA表現に対するDirACライクレンダリングの拡張として理解できる。
【0092】
HOA信号表現に基づく複数の方向の推定は、関連する任意の
音場分析に使用可能である。
【0093】
以下、信号処理ステップを更に詳細に説明する。
【0094】
<圧縮>
<入力フォーマットの決定>
入力として、数式(26)で決定されたスケーリングされた時間領域HOA係数
が、レートf
s=1/T
sでサンプリングされると仮定する。ベクトルc(j)は、サンプリング時間tがt=jT
s、j∈Zに属する全ての係数により形成されるように定義される:
【数38】
【0095】
<フレーム化>
スケーリングされたHOA係数の到来ベクトルc(j)は、フレーム化ステップ又はステージ21において、次式のように長さがBのオーバーラップ(又は重複)しないフレーム群にフレーム化される:
【数39】
サンプリングレートがfs=48kHzであり、適切なフレーム長がB=1200サンプルであるとすると、フレームの持続時間は25msに対応する。
【0096】
<支配的な方向の推定>
支配的な方向を推定するため、次のような相関行列が算出される:
【数40】
現在のサンプルl及びL-1個の過去のフレームにわたる総和(l’=0〜L-1)は、方向分析が、L・B個のサンプルによる長いオーバーラップするフレーム群に基づくことを示し、すなわち、現在のフレーム各々に関し、隣接するフレームの内容が考慮される。これは、2つの理由から、方向分析の安定性に寄与し、それら2つは:(1)より長いフレームは、より多数の観測の結果をもたらすこと、及び(2)方向推定はオーバーラップするフレームに起因して
スムージングされることである
。
【0097】
f
s=48kHz及びB=1200であるとすると、適切なLの値は例えば4であり、これは100msのフレーム持続時間全体に対応する。
【0098】
次に、相関行列B(l)の固有値分解が、
B(l)=V(l)Λ(l)V
T(l) (68)
に従って実行され、ここで、行列V(l)は次式のように固有値ベクトルv
i(l)(1≦i≦O)により形成される:
【数41】
行列Λ(l)は次式のように対応する固有値λ
i(1≦i≦O)による対角行列である:
【数42】
固有値には、昇順ではない順序(降順)でインデックスが付与されるものとする:
λ
1(l)≧λ
2(l)≧・・・≧λ
O(l) (71)
【0099】
そして、支配的な固有値のインデックス群{1,...,I^(l)}が求められる。これを行う可能な方法の1つは、ブロードバンド
の方向性パワーとアンビエント
パワーとの比率の所望の最小値DAR
MINを計算し、次式に従ってI^(l)を決定することである:
【数43】
【0100】
適切なDAR
MINの値として15dBが選択されてもよい。高々D個の支配的な方向に集中するように、支配的な固有値の個数はDを超えないように制限される。これは、インデックス群{1,...,I^(l)}を{1,...,I(l)}で置換することにより達成され、この場合において、I(l):=max(I^(l),D)である(73)。
【0101】
次に、B(l)のI(l)ランク近似が行われる:
【数44】
この行列はB(l)に対する支配的な
方向性成分の寄与を含むはずである。
【0102】
そして、次式のようなベクトルが算出される:
【数45】
ここで、Ξは近似的に均等に分散した多数のテスト方向Ω
qに対するモード行列を示し、Ω
q:=(θ
q,φ
q)、1≦q≦Qであり、θ
q∈[0,π[は極方向軸(z軸)に対してなす傾斜角を示し、φ
q∈[-π,π]はxy平面内でx軸に対してなす方位角を示す。
【0103】
モード行列Ξは次のように定義される:
【数46】
【0104】
σ
2(l)の要素であるσ
2q(l)は、Ω
qの方向から到来する支配的な方向の信号に対応する平面波の
パワーを近似的に表現する。この点についての理論的説明については、<方向探索アルゴリズムについての説明>の箇所で説明される。
【0105】
方向性信号成分を決定するために、σ
2(l)により、
個の支配的な方向
が算出される。支配的な方向の数は、一定のデータレートを保証するために、
を満たすように制限される。しかしながら、可変のデータレートが許容される場合、支配的な方向の数を現在の音の状況に
適合させることが可能である。
【0106】
個の支配的な方向を算出する方法の1つは、第1の支配的な方向を、最大
パワーの方向に設定することであり、すなわち、Ω
CURRDOM,1(l)=Ω
q1であり、q
1:=argmax
q∈M1σ
2q(l)及びM1:={1,2,...,Q}である。最大
パワー値は支配的な方向の信号により生じると仮定し、有限次数NのHOA表現は
方向性信号の空間的な分散を招くことを考慮すると(上記書籍の「Plane-wave decomposition ...」参照)、Ω
CURRDOM,1(l)の方向の近辺において、同じ方向の信号に属する
パワー成分が生じるはずである。空間的な信号の分散は、関数v
N(Θ
q,q1)により表現されることが可能であるので(数式(38)参照)(ここで、Θ
q,q1:=∠(Ω
q,Ω
q1)はΩ
qとΩ
CURRDOM,1(l)との間の角度を示す)、
方向性信号に属する
パワーは関数v
N(Θ
q,q1)に従って減少する。従って、別の支配的な方向を探す場合には、Ω
q1(Θ
q,1≦Θ
MIN)の方向近辺の全ての方向Ω
qを排除することが合理的である。距離Θ
MINは関数v
N(x)
が最初
にゼロ
になる点として選択されることが可能であり、これはN≧4の場合にπ/Nにより近似的に与えられる。2番目に支配的な方向は、残りの方向Ω
q∈M
2(M
2:={q∈M
1|Θ
q,1>Θ
MIN})の中で最大
パワーをもたらすものに設定される。残りの支配的な方向は、同様な方法で決定される。
【0107】
個の支配的な方向は、個々の支配的な方向Ω
qd~に指定される
パワーσ
2qd~(l)を考慮し、比率σ
2q1(l)/σ
2qd~(l)が所望の
方向性パワー対
アンビエントパワー比DAR
MINの値を超えるものを探索することにより
、決定することが可能である。これは、
が次式を満たすことを意味する:
【数47】
【0108】
全ての支配的な方向に対する計算の全体的な処理は、次のような「球面上の
パワー分布により支配的な方向を探索するアルゴリズム1」により実行可能である:
【数48】
【0109】
次に、現在のフレームに関して取得された方向
が、先行する複数のフレームによる方向とともに
スムージングされ、
スムージングされた方向(
スムージング方向)
(1≦d≦D)が得られる。この処理は2つの連続する部分(a)及び(b)に分割できる:
【0110】
(a)現在の支配的な方向
は、先行するフレームにより、
スムージング方向
(1≦d≦D)に割り当てられる。割り当て関数
は、次式のように、割り当てられた方向同士の間の角度の合計が最小化されるように決定される:
【数49】
そのような割り当ての問題は、既存のハンガリアンアルゴリズム(Hungarian Algorithm)を用いて解くことが可能である、この点については例えば次の文献を参照されたい:H.W. Kuhn, "The Hungarian method for the assignment problem", Naval research logistics quarterly 2, no.1-2, pp.83-97, 1955。現在の方向
と先行するフレームからのインアクティブな方向
との間の角度が、2Θ
MINに設定される(「インアクティブな方向(inactive direction)」については後述する)。これは、先行するアクティブな方向
に対して2Θ
MINより近い現在の方向
が、
スムージング方向に割り当てられるようにするという作用をもたらす。距離が2Θ
MINを超える場合、対応する現在の方向は新たな信号に属するように仮定され、これは、先行するインアクティブな方向
に割り当てられることが好ましいことを示す。
【0111】
留意点:圧縮アルゴリズム全体について更に長い時間をかけてよい場合、一連の方向推定の割り振りは更に強いロバスト性をもたらすように実行されてもよい。例えば、突然の方向変化は、推定誤差に起因する異常値であるとして、それを考慮しないように適切に判断されてもよい。
【0112】
(b)
スムージング方向
(1≦d≦D)はステップ(a)を用いて算出される。
スムージング又はスムージングは、ユークリッド幾何学よりもむしろ球面幾何学に基づく。現在の支配的な方向
の各々に関し、
スムージングは、球面上の2点を通る大円の部分的な円弧に沿って実行され、それらは
及び
により指定される。具体的には、スムージング因子α
Ωと共に指数的に重み付けされる移動平均を計算することにより、方位角及び傾斜角は独立に
スムージングされる。傾斜角に関し、これは次のような
スムージング処理を行うことになる:
【数50】
【0113】
方位角に関し、π-εから-πへの遷移(ε>0)及び逆向きの遷移における適切な
スムージングを達成するために、
スムージングは修正される必要がある。これは次のような処理を行うことにより考慮に入れることができる。まず最初に、次式のようにモジュロ2πによる角度差が計算され(モジュロ2πは2πを法とする演算である):
【数51】
これは、次式により[-π,π[の区間に変換される:
【数52】
【0114】
スムージングされた支配的な方位角(モジュロ2π)は次のように決定され:
【数53】
また、最終的に、次式により[-π,π[の区間に変換される:
【数54】
【0115】
である場合、指定された現在の支配的な方向を向いていない方向
が先行するフレーム内に存在する。対応するインデックス群は次式のように指定される:
【数55】
次式に示すように、各々の方向は最後のフレームからコピーされる:
【数56】
所定数L
IA個のフレームに割り振られていない方向は、「インアクティブ(inactive)」又は「インアクティブ方向」等と言及される。
【0116】
以後、M
ACT(l)により示されるアクティブ方向のインデックス群が算出される。その要点は、D
ACT(l):=|M
ACT(l)|により表現される。
【0117】
全ての
スムージングされた方向は、1つの方向行列に連結される:
【数57】
【0118】
<
方向性信号の計算>
方向性信号の計算は、モードマッチング(mode matching)に基づく。特に、
方向性信号を探す探索が行われ、その
方向性信号のHOA表現は所与のHOA信号の最良の近似をもたらすものである。連続するフレームの間の方向の変化は、
方向性信号の不連続性を招く場合があるので、オーバーラップするフレームの
方向性信号の推定計算を実行した後に、適切なウィンドウ関数を利用して、連続するオーバーラップするフレームの結果を
スムージングする。しかしながら、
スムージングは、1フレームの遅延を招く。
【0119】
以下、
方向性信号の詳細な推定方法を説明する。
【0120】
先ず、
スムージングされたアクティブ方向に基づくモード行列が、次式に従って算出される:
【数58】
ここで、d
ACT,j(1≦j≦D
ACT(l))は、アクティブ方向のインデックスを示す。
【0121】
次に、(l-1)番目及び(l)番目のフレームに対する全ての
方向性信号の
スムージングされていない推定結果を含む行列X
INST(l)が算出される:
【数59】
【0122】
これは2つのステップで実行される。第1のステップでは、インアクティブ方向に対応する行に属する
方向性信号サンプルが、次式に示すように、ゼロに設定される:
【数60】
【0123】
第2のステップでは、アクティブ方向に対応する
方向性信号サンプルが、次式に従って行列を配列することにより得られる
【数61】
この行列は、次に、例えば、
Ξ
ACT(l)X
INST,ACT(l)-[C(l-1) C(l)] (97)
のような誤差のユークリッドノルムを最小化するように算出される。その解は次式により与えられる:
【数62】
【0124】
方向性信号の推定結果x
INST,d(l,j)(1≦d≦D)は、適切なウィンドウ関数w(j)により整形される:
x
INST,WIN,d(l,j):=x
INST,d(l,j)・w(j), 1≦j≦2B (99)
【0125】
ウィンドウ関数の具体例は、次式に示すような周期的なハミングウィンドウにより与えられる:
【数63】
ここで、Kwはシフトされたウィンドウの合計が「1」に等しくなるように決定されるスケーリング因子を示す。(l-1)番目のフレームに関する
スムージングされた
方向性信号は、次式に従って、ウィンドウ処理された
スムージングされてない推定結果を適切に重ね合わせることにより算出される:
x
d((l-1)B+j)=x
INST,WIN,d(l-1,B+j)+x
INST,WIN,d(l,j) (101)
【0126】
(l-1)番目のフレームに対する全ての
スムージングされた
方向性信号のサンプルは、次式のように、行列X(l-1)に配置される:
【数64】
【0127】
<アンビエントHOA成分の計算>
アンビエントHOA成分C
A(l-1)は、次式のように、全体のHOA表現C(l-1)から、全体の
方向性HOA成分C
DIR(l-1)を減算することにより得られる:
【数65】
ここで、C
DIR(l-1)は次式のようにして決定される:
【数66】
ここで、Ξ
DOM(l)は、次式のようにして決定される全ての
スムージングされた方向に基づくモード行列を示す:
【数67】
全体の
方向性HOA成分の計算は、オーバーラップする一連の瞬時的な全体の
方向性HOA成分の空間的な
スムージングに基づいているので、アンビエントHOA成分は、1フレームの遅延と共に得られる。
【0128】
<アンビエントHOA成分の低次数化>
C
A(l-1)は成分で表現すると次式のようになり、
【数68】
その低次数化は、全てのHOA係数c
mn,A(j)(n>N
RED)の次数を下げることにより達成される:
【数69】
【0129】
<アンビエントHOA成分の球面調和変換>
球面調和変換は、低次数化されたアンビエントHOA成分C
A,RED(l)にモード行列の
逆行列を乗算することで実行される:
【数70】
この場合において、O
REDは一様に分散した方向Ω
A,dであり(1≦d≦O
RED)、
W
A,RED(l)=(Ξ
A)
-1C
A,RED(l) (111)
である。
【0130】
<圧縮解除>
<逆球面調和変換>
知覚圧縮解除が施された空間
領域信号
は、次式のように、逆球面調和変換により、次数がN
REDであるHOA
領域表現
に変換される:
【数71】
【0131】
<次数拡大>
HOA表現
のアンビソニックス次数は、次式に従って0(ゼロ)を付加することにより、Nに拡大される:
【数72】
ここで、O
m×nはm行n列のゼロ行列を示す。
【0132】
<HOA係数構築>
最終的な圧縮解除されたHOA係数は、次式のように、指向性成分及びアンビエントHOA成分の加算により算出される:
【数73】
この段階において、1フレーム分の遅延が導入され、
方向性HOA成分が空間的スムージングに基づいて算出されることが許容される。これを行うことにより、連続するフレーム間の方向変化に起因する
音場の
方向性成分の望まれない不要な不連続性を、回避することができる。
【0133】
スムージングされた
方向性HOA成分を計算するために、次式に従って、個々の全ての
方向性信号の推定結果を含む2つの連続するフレームが、1つの長いフレームに連結される:
【数74】
【0134】
この長いフレームに含まれている個々の信号各々には、数式(100)のようなウィンドウ関数が乗算される。
【数75】
により、長いフレーム
の成分又は要素を表現する場合、ウィンドウ処理は、ウィンドウ信号
を次式によって計算することにより行われる:
【数76】
【0135】
なお、全体の
方向性HOA成分C
DIR(l-1)は、ウィンドウ処理された
方向性信号の全てを適切な方向にエンコードし、それらをオーバラップする形式で重ね合わせることにより得られる:
【数77】
【0136】
<方向探索アルゴリズムについての説明>
以下、<支配的な方向の推定>の説明箇所で言及した方向探索アルゴリズムに関する事項を説明する。先ず、これは幾つかの仮定に基づいている。
【0137】
<仮定>
HOA係数ベクトルc(j)は、一般に、次式のように時間領域の振幅密度関数d(j,Ω)に関連しており、
【数78】
HOA係数ベクトルc(j)は、次式のモデルに従うことが仮定される:
【数79】
【0138】
このモデルは、HOA係数ベクトルc(j)が、l番目のフレームにおいて方向Ω
xi(l)から到来するI個の支配的な指向性ソース信号x
i(j)(1≦i≦I)により形成されることを示す。特に、方向は、1つのフレームの持続時間の間、不変であるように仮定されている。支配的なソース信号の個数Iは、HOA係数の総数Oよりも明らかに小さいことが仮定されている。更に、フレーム長BはOよりも明らかに大きいことが仮定されている。また、ベクトルc(j)は、理想的な等方性の周辺
音場を表現することが可能な残留成分c
A(j)を含む。
【0139】
個々のHOA係数ベクトル成分は、以下の性質を有するように仮定されている。
・支配的なソース信号(群)は平均的にはゼロであるように仮定されている:
【数80】
また、支配的なソース信号(群)は互いに相関を有していないように仮定されている:
【数81】
ここで、
はl番目のフレームについてのi番目の信号の平均
パワーを示す。
・支配的なソース信号(群)は、HOA係数ベクトルのアンビエント成分と相関を有しないように仮定されている:
【数82】
・アンビエントHOA成分ベクトルは、平均的にはゼロであり、共分散行列(covariance matrix)を有するように仮定されている:
【数83】
【数84】
という数式により定義される各フレームの
方向性パワー対
アンビエントパワー比DAR(l)は、所定の所望値DAR
MINより大きいことが仮定されており、すなわち、
DAR(l)≧DAR
MIN (126)
である。
【0140】
<方向探索に関する補足説明>
説明の便宜上、相関行列B(l)(数式(67))が、L-1個の先行するフレームのサンプルを考慮することなく、l番目のフレームのサンプルのみに基づいて算出される状況を考察する。この処理は、Lを1に設定すること(L=1)に相当する。従って、相関行列は次式のように表現できる:
【数85】
【0141】
数式(120)で仮定したモデルを数式(128)に代入し、数式(122)、(123)及び定義(124)を利用することにより、相関行列B(l)は、次のように近似できる:
【数86】
【0142】
数式(131)によれば、近似的にB(l)は、
方向性成分に帰属する加算成分とアンビエント成分に帰属する加算成分との2つの加算成分から成ることが分かる。I(l)ランク近似B
I(l)は指向性HOA成分の近似を提供し、すなわち、次式のように書ける:
【数87】
これは、
方向性パワー対周辺
パワー比に関する数式(126)から得られる。
【0143】
しかしながら、1番目の項の
及び2番目の項のΣ
A(l)の行列の列が張る部分空間は、互いに直交していないので、Σ
A(l)のいくらかの部分は不可避的にB
I(l)に洩れ込むことに留意すべきである。数式(132)によれば、数式(77)のベクトルσ
2(l)は、支配的な方向の探索に使用され、次のように表現できる:
【数88】
【0144】
数式(135)において、数式(47)で言及した球面調和関数の性質が使用されている:
【数89】
【0145】
数式(136)は、σ
2(l)の要素σ
2q(l)が、テスト方向Ω
q(1≦q≦Q)から到来する信号の
パワーを近似していることを示す。