(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-27
(45)【発行日】2023-11-07
(54)【発明の名称】高次アンビソニックス(HOA)信号を圧縮する方法、圧縮されたHOA信号を圧縮解除する方法、HOA信号を圧縮する装置および圧縮されたHOA信号を圧縮解除する装置
(51)【国際特許分類】
G10L 19/008 20130101AFI20231030BHJP
【FI】
G10L19/008 100
【外国語出願】
(21)【出願番号】P 2021153985
(22)【出願日】2021-09-22
(62)【分割の表示】P 2019087310の分割
【原出願日】2015-03-20
【審査請求日】2021-09-22
(32)【優先日】2014-03-21
(33)【優先権主張国・地域又は機関】EP
【前置審査】
(73)【特許権者】
【識別番号】510185767
【氏名又は名称】ドルビー・インターナショナル・アーベー
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】コルドン,スヴェン
(72)【発明者】
【氏名】クルーガー,アレクサンダー
(72)【発明者】
【氏名】ヴュエボボルト,オリヴァー
【審査官】堀 洋介
(56)【参考文献】
【文献】特表2013-545391(JP,A)
【文献】米国特許出願公開第2014/0025386(US,A1)
【文献】国際公開第2013/171083(WO,A1)
【文献】特開2012-133366(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/008
H04S 1/00- 7/00
(57)【特許請求の範囲】
【請求項1】
音または音場の圧縮された高次アンビソニックス(HOA)表現をデコードする方法であって、
前記圧縮されたHOA表現を含むビットストリームを受領する段階と;
前記圧縮されたHOA表現に関係する複数の層があるかどうかを判定する段階と;
複数の層があるとの前記判定に基づいて、前記ビットストリームからの前記圧縮されたHOA表現をデコードして、デコードされたHOA表現のシーケンスを得る段階とを含み、
デコードされたHOA表現の前記シーケンスの第一の部分集合はインデックスの第一の集合に対応し、
かつ前記複数の層のうちの基本層に対応し、デコードされたHOA表現の前記シーケンスの第二の部分集合はインデックスの第二の集合に対応し、
インデックスの前記第一の集合はO
MIN個のチャネルに基づき、
インデックスの前記第一の集合の各インデックスについて、前記第一の部分集合における対応するデコードされたHOA表現は対応する周囲HOA成分のみに基づいて決定され、
インデックスの前記第二の集合は前記複数の層のうちの少なくとも一つに基づいて決定され、インデックスnおよびフレームkについて、
【数124】
であり、
【数125】
は対応する周囲音成分を表わし、
【数126】
は対応する優勢音成分を表わし、
デコードされたHOA表現の前記シーケンスのHOA係数のフェードインおよびフェードアウトが、デコードされたHOA表現の前記シーケンスのインデックスが相続くフレームの間で変わる場合に実行される、
方法。
【請求項2】
音または音場の圧縮された高次アンビソニックス(HOA)表現をデコードする装置であって、
前記圧縮されたHOA表現を含むビットストリームを受領する受領器と;
複数の層があるとの判定に基づいて、前記ビットストリームからの前記圧縮されたHOA表現をデコードして、デコードされたHOA表現のシーケンスを得るオーディオ・デコーダとを有しており、
デコードされたHOA表現の前記シーケンスの第一の部分集合はインデックスの第一の集合に対応し、
かつ前記複数の層のうちの基本層に対応し、デコードされたHOA表現の前記シーケンスの第二の部分集合はインデックスの第二の集合に対応し、
インデックスの前記第一の集合はO
MIN個のチャネルに基づき、
インデックスの前記第一の集合の各インデックスについて、前記第一の部分集合における対応するデコードされたHOA表現は対応する周囲HOA成分のみに基づいて決定され、
インデックスnおよびフレームkについて、
【数127】
であり、
【数128】
は対応する周囲音成分を表わし、
【数129】
は対応する優勢音成分を表わし、
デコードされたHOA表現の前記シーケンスのHOA係数のフェードインおよびフェードアウトが、デコードされたHOA表現の前記シーケンスのインデックスが相続くフレームの間で変わる場合に実行される、
装置。
【請求項3】
プロセッサによって実行されたときに方法を実行する命令を含んでいる非一時的なコンピュータ可読記憶媒体であって、前記方法は:
圧縮されたHOA表現を含むビットストリームを受領する段階と;
前記圧縮されたHOA表現に関係する複数の層があるかどうかを判定する段階と;
複数の層があるとの判定に基づいて、前記ビットストリームからの前記圧縮されたHOA表現をデコードして、デコードされたHOA表現のシーケンスを得る段階とを含み、
デコードされたHOA表現の前記シーケンスの第一の部分集合はインデックスの第一の集合に対応し、
かつ前記複数の層のうちの基本層に対応し、デコードされたHOA表現の前記シーケンスの第二の部分集合はインデックスの第二の集合に対応し、
インデックスの前記第一の集合はO
MIN個のチャネルに基づき、
インデックスの前記第一の集合の各インデックスについて、前記第一の部分集合における対応するデコードされたHOA表現は対応する周囲HOA成分のみに基づいて決定され、
インデックスの前記第二の集合は前記複数の層のうちの少なくとも一つに基づいて決定され、インデックスnおよびフレームkについて、
【数130】
であり、
【数131】
は対応する周囲音成分を表わし、
【数132】
は対応する優勢音成分を表わし、
デコードされたHOA表現の前記シーケンスのHOA係数のフェードインおよびフェードアウトが、デコードされたHOA表現の前記シーケンスのインデックスが相続くフレームの間で変わる場合に実行される、
記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、高次アンビソニックス(HOA)信号を圧縮する方法、圧縮されたHOA信号を圧縮解除する方法、HOA信号を圧縮する装置および圧縮されたHOA信号を圧縮解除する装置に関する。
【背景技術】
【0002】
高次アンビソニックス(HOA: Higher Order Ambisonics)は三次元サウンドを表現する可能性をもたらす。他の既知の技法は波面合成(WFS: wave field synthesis)または22.2のようなチャネル・ベースの手法である。しかしながら、チャネル・ベースの方法とは対照的に、HOA表現は特定のラウドスピーカー・セットアップとは独立であるという利点をもたらす。しかしながら、この柔軟性は、特定のラウドスピーカー・セットアップでのHOA表現の再生のために必要とされるデコード・プロセスを代償とする。必要とされるラウドスピーカーの数が通例非常に多いWFS手法に比べ、HOAはほんの若干数のラウドスピーカーからなるセットアップにレンダリングされてもよい。HOAのさらなる利点は、同じ表現がヘッドフォンへのバイノーラル・レンダリングのためにも、いかなる修正もなしに用いることができるということである。
【0003】
HOAは、打ち切られた球面調和関数(SH: Spherical Harmonics)展開による、複素調和平面波振幅(complex harmonic plane wave amplitudes)のいわゆる空間密度の表現に基づく。各展開係数は角周波数の関数であり、これは時間領域関数によって等価に表現できる。よって、一般性を失うことなく、完全なHOA音場表現は実際には、O個の時間領域関数からなると想定できる。ここで、Oは展開係数の数を表わす。これらの時間領域関数は、以下では、等価に、HOA係数シーケンスまたはHOAチャネルと称される。通例、x軸が正面位置を向き、y軸が左を向き、z軸が上方を向く球面座標系が使われる。空間内の位置x=(r,θ,φ)Tは動径r>0(すなわち、座標原点までの距離)、極軸zから測った傾斜角θ∈[0,π]およびxy平面においてx軸から反時計回りに測った方位角φ∈[0,2π[によって表現される。さらに、(・)Tは転置を表わす。
【0004】
HOA符号化のより詳細な記述を下記に与える。
【0005】
時間に対する音圧のフーリエ変換F
t(・)、すなわちωが角周波数を表わし、iが虚数単位を表わすとして、
【数1】
は、
【数2】
に従って球面調和関数の級数に展開されうる。ここで、c
sは音速を表わし、kは角波数を表わす。角波数は角周波数ωとk=ω/c
sによって関係付けられる。さらに、j
n(・)は第一種の球面ベッセル関数を表わし、S
n
m(θ,φ)は次数(order)nおよび陪数(degree)mの実数値の球面調和関数を表わす。展開係数A
n
m(k)は角波数kのみに依存する。音圧が空間的に帯域制限されていることが暗黙的に想定されていることを注意しておく。よって、級数は次数インデックスnに関して上限Nで打ち切られる。このNはHOA符号化表現の次数と呼ばれる。音場が異なる角周波数ωの無限個の調和平面波の重ね合わせによって表現され、角タプル(θ,φ)によって指定されるすべての可能な方向から到来するとすると、それぞれの平面波複素振幅関数C(ω,θ,φ)は次の球面調和関数展開によって表わせる。
【0006】
【数3】
ここで、展開係数C
n
m(k)は展開係数A
n
m(k)に、A
n
m(k)=i
nC
n
m(k)によって関係付けられる。個々の係数C
n
m(ω=kc
s)が角周波数ωの関数であるとすると、逆フーリエ変換(F
-1(・)によって表わされる)の適用は、各次数nおよび陪数mについて、時間領域関数
【数4】
を与える。これは
【数5】
によって単一のベクトルc(t)にまとめることができる。ベクトルc(t)内の時間領域関数c
n
m(t)の位置インデックスはn(n+1)+1+mによって与えられる。ベクトルc(t)内の全体的な要素数はO=(N+1)
2によって与えられる。関数c
n
m(t)の離散時間バージョンはアンビソニックス係数シーケンスと称される。フレーム・ベースのHOA表現は、これらのシーケンスのすべてを、次のように、長さBおよびフレーム・インデックスkのフレームC(k)に分割することによって得られる。
【0007】
【数6】
ここで、T
sはサンプリング期間を表わす。すると、フレームC(k)自身はその個々の行c
i(k)、i=1,…,Oの合成として
【数7】
と表現できる。ここで、c
i(k)は位置インデックスiをもつアンビソニックス係数シーケンスのフレームを表わす。
【0008】
HOA表現の空間分解能は、展開の最大次数Nの増大とともに改善される。残念ながら、展開係数の数Oは次数Nとともに二次で、具体的にはO=(N+1)2として増大する。たとえば、次数N=4を使った典型的なHOA表現はO=25個のHOA(展開)係数を必要とする。これらの考察によれば、HOA表現の伝送のための全ビットレートは、所望される単一チャネル・サンプリング・レートfsおよびサンプル当たりのビット数Nbを与えられたとき、O・fs・Nbによって決定される。結果として、サンプル当たりNb=16ビットを用いてfs=48kHzのサンプリング・レートで次数N=4のHOA表現を伝送することは、19.2MBits/sのビットレートにつながる。これは、たとえばストリーミングのような多くの実際的な用途にとって非常に高い。このように、HOA表現の圧縮がきわめて望ましい。
【0009】
これまで、HOA音場表現の圧縮は欧州特許出願EP2743922A、EP2665208AおよびEP2800401Aにおいて提案されている。これらの手法は、音場解析を実行し、与えられたHOA表現を方向性成分(directional component)と残差周囲成分(residual ambient component)に分解することで共通している。一方では、最終的な圧縮された表現は、いくつかの量子化された信号を有することが想定され、該量子化された信号は、方向性信号と周囲HOA成分(ambient HOA component)の関連する係数シーケンスとの知覚的符号化から帰結する。他方では、最終的な圧縮された表現は、量子化された信号に関係する追加的なサイド情報を含むと想定される。このサイド情報は、HOA表現の、その圧縮されたバージョンからの再構成のために必要である。
【0010】
さらに、同様の方法は非特許文献1に記載されている。ここでは、方向性成分はいわゆる優勢音成分(predominant sound component)に拡張される。方向性成分として、優勢音成分は部分的には方向性信号、すなわち、その方向から聴取者に入射すると想定される対応する方向をもつモノラル信号に、それらの方向性信号からもとのHOA表現の諸部分を予測するためのいくつかの予測パラメータを合わせたものによって表現されると想定される。
【0011】
さらに、優勢音成分は、いわゆるベクトル・ベースの信号によって表現されるとされる。つまり、ベクトル・ベースの信号の方向分布を定義する対応するベクトルをもつモノラル信号である。既知の圧縮されたHOA表現はI個の量子化されたモノラル信号および若干の追加的なサイド情報からなる。ここで、これらI個の量子化されたモノラル信号のうち固定数OMIN個は、周囲HOA成分CAMB(k-2)の最初のOMIN個の係数シーケンスの空間的に変換されたバージョンを表わす。残りのI-OMIN個の信号の型は、相続くフレームの間で変わることがあり、方向性、ベクトル・ベース、空または周囲HOA成分CAMB(k-2)の追加的な係数シーケンスを表わしているのいずれかであることができる。
【0012】
HOA符号化係数シーケンスの入力時間フレーム(C(k))をもつHOA信号表現を圧縮するためのある既知の方法は、入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードおよび源エンコードを含む。空間的HOAエンコードは、
図1a)に示されるように、方向およびベクトル推定ブロック101においてHOA信号の方向およびベクトル推定処理を実行することを含む。ここでは、方向性信号のための第一のタプル集合M
DIR(k)およびベクトル・ベースの信号についての第二のタプル集合M
VEC(k)を含むデータが得られる。各第一のタプル集合は、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、各第二のタプル集合は、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む。次のステップは、HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号X
PS(k-1)のフレームと、周囲HOA成分C
AMB(k-1)のフレームとに分解する(103)。ここで、優勢音信号X
PS(k-1)は前記方向性音信号および前記ベクトル・ベースの音信号を含む。分解はさらに、予測パラメータξ(k-1)および目標割り当てベクトル(target assignment vector)v
A,T(k-1)を提供する。予測パラメータξ(k-1)は、優勢音信号X
PS(k-1)内の方向性信号からどのようにして、優勢音HOA成分を豊かにするようHOA信号表現の諸部分を予測するかを記述する。目標割り当てベクトルv
A,T(k-1)は、所与の数I個のチャネルに優勢音信号をどのようにして割り当てるかについての情報を含む。周囲HOA成分C
AMB(k-1)は、目標割り当てベクトルv
A,T(k-1)によって与えられる情報に従って修正される(104)。ここで、周囲HOA成分のどの係数シーケンスが所与の数I個のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定される。修正された(modified)周囲HOA成分C
M,A(k-2)および時間的に予測された(predicted)修正された周囲HOA成分C
P,M,A(k-1)が得られる。また、目標割り当てベクトルv
A,T(k-1)内の情報から、最終的な割り当てベクトルv
A(k-2)も得られる。上記分解から得られた優勢音信号X
PS(k-1)と、修正された周囲HOA成分C
M,A(k-2)および時間的に予測された修正された周囲HOA成分C
P,M,A(k-1)の決定された係数シーケンスが、最終的な割り当てベクトルv
A(k-2)によって与えられる情報を使って、上記所与の数のチャネルに割り当てられる。ここで、トランスポート信号y
i(k-2)、i=1,…,Iおよび予測されたトランスポート信号y
P,i(k-2)、i=1,…,Iが得られる。次いで、トランスポート信号y
i(k-2)および予測されたトランスポート信号y
P,i(k-2)に対して利得制御(または正規化)が実行される。ここで、利得修正されたトランスポート信号z
i(k-2)、指数e
i(k-2)および例外フラグβ
i(k-2)が得られる。
【0013】
図1b)に示されるように、知覚的エンコードおよび源エンコードは、利得修正されたトランスポート信号z
i(k-2)の知覚的な符号化であって、知覚的にエンコードされたトランスポート信号
【数8】
が得られる符号化と、前記指数e
i(k-2)および例外フラグβ
i(k-2)、前記第一および第二のタプル集合M
DIR(k)、M
VEC(k)、予測パラメータξ(k-1)および最終的な割り当てベクトルv
A(k-2)を含むサイド情報のエンコードであって、エンコードされたサイド情報
【数9】
が得られるエンコードとを含む。最後に、知覚的にエンコードされたトランスポート信号
【数10】
およびエンコードされたサイド情報がビットストリーム中に多重化される。
【先行技術文献】
【特許文献】
【0014】
【文献】EP12306569.0
【文献】EP12305537.8(EP2665208Aとして公開)
【文献】EP133005558.2
【非特許文献】
【0015】
【文献】ISO/IEC JTC1/SC29/WG11, N14264, "Working Draft 1-HOA Text of MPEG-H 3D audio", January 2014, San Jose
【発明の概要】
【発明が解決しようとする課題】
【0016】
提案されるHOA圧縮方法の一つの欠点は、モノリシックな(すなわち非スケーラブルな)圧縮されたHOA表現を提供するということである。しかしながら、放送またはインターネット・ストリーミングのようなある種のアプリケーションについては、圧縮された表現を低品質基本層(BL)および高品質向上層(EL)に分割できることが望ましい。基本層は、向上層とは独立にデコードできる、HOA表現の低品質圧縮バージョンを提供するとされる。そのようなBLは典型的には、伝送誤りに対してきわめて堅牢であるべきであり、たとえ劣悪な伝送条件下でも圧縮解除されたHOA表現のある最小限の品質を保証するために低データ・レートで伝送されるべきである。ELは、圧縮解除されたHOA表現の品質を改善するための追加的な情報を含む。
【課題を解決するための手段】
【0017】
本発明は、(低品質の)基本層および(高品質の)向上層を含む圧縮された表現を提供できるよう既存のHOA圧縮方法を修正するための解決策を提供する。さらに、本発明は、本発明に従って圧縮されている少なくとも低品質の基本層を含む圧縮された表現をデコードすることができるよう既存のHOA圧縮解除方法を修正するための解決策を提供する。
【0018】
一つの改善は、自己完結の(低品質の)基本層を得ることに関する。本発明によれば、周囲HOA成分CAMB(k-2)の(一般性を失わずに)最初のOMIN個の係数シーケンスの空間的に変換されたバージョンを含むとされるOMIN個のチャネルが、基本層として使われる。基本をなすものとして最初のOMIN個のチャネルを選択することの利点は、その時間不変な型である。しかしながら、従来、それぞれの信号は、音場のために本質的である優勢音成分を全く欠いていた。このことは、周囲HOA成分CAMB(k-1)の従来の計算からも明らかである。それは、
CAMB(k-1)=C(k-1)-CPS(k-1) (1)
に従ってもとのHOA表現C(k-1)から優勢音HOA表現CPS(k-1)を減算することによって実行される。
【0019】
したがって、本発明の一つの改善は、そのような優勢音成分を加えることに関する。本発明によれば、この問題への解決策は、低い空間分解能での優勢音成分を基本層に含めることである。この目的のために、本発明に基づく空間的HOAエンコーダにおけるHOA分解処理によって出力される周囲HOA成分CAMB(k-1)は、その修正バージョンによって置換される。修正された周囲HOA成分は、空間的に変換された形において常に伝送されるとされる最初のOMIN個の係数シーケンスにおいて、もとのHOA成分の係数シーケンスを含む。HOA分解処理のこの改善は、HOA圧縮を階層化モード(たとえば二層モード)で機能させるための初期動作と見ることができる。このモードは、たとえば、二つのビットストリームまたは基本層および向上層に分割できる単一のビットストリームを提供する。このモードを使うか使わないかは、全体ビットストリームの諸アクセス単位におけるモード指示ビット(たとえば単一のビット)によって信号伝達される。
【0020】
ある実施形態では、基本層ビットストリーム
【数11】
は、知覚的にエンコードされた信号
【数12】
と、指数e
i(k-2)および例外フラグβ
i(k-2)、i=1,…,O
MINからなる対応する符号化された利得制御サイド情報とを含むだけである。残りの知覚的にエンコードされた信号
【数13】
およびエンコードされた残りのサイド情報は、向上層ビットストリームに含められる。ある実施形態では、基本層(base layer)ビットストリーム
【数14】
および向上層(enhancement layer)ビットストリーム
【数15】
は次いで、以前の全ビットストリーム
【数16】
の代わりに、合同して伝送される。
【0021】
HOA係数シーケンスの時間フレームを有する高次アンビソニックス(HOA)信号表現を圧縮する方法が請求項1に開示される。HOA係数シーケンスの時間フレームを有する高次アンビソニックス(HOA)信号表現を圧縮する装置が請求項10に開示される。
【0022】
HOA係数シーケンスの時間フレームを有する高次アンビソニックス(HOA)信号表現を圧縮解除する方法が請求項8に開示される。HOA係数シーケンスの時間フレームを有する高次アンビソニックス(HOA)信号表現を圧縮解除する装置が請求項18に開示される。
【0023】
HOA係数シーケンスの時間フレームを有する高次アンビソニックス(HOA)信号表現を圧縮する方法をコンピュータに実行させるための実行可能な命令を有する非一時的なコンピュータ可読記憶媒体が請求項20に開示される。HOA係数シーケンスの時間フレームを有する高次アンビソニックス(HOA)信号表現を圧縮解除する方法をコンピュータに実行させるための実行可能な命令を有する非一時的なコンピュータ可読記憶媒体が請求項21に開示される。
【0024】
本発明の有利な実施形態は従属請求項、以下の記述および図面において開示される。
【図面の簡単な説明】
【0025】
本発明の例示的な実施形態が付属の図面を参照して記述される。
【
図1a】HOA圧縮器の通常のアーキテクチャの構造である。
【
図1b】HOA圧縮器の通常のアーキテクチャの構造である。
【
図2】HOA圧縮解除器の通常のアーキテクチャの構造である。
【
図3】本発明のある実施形態に基づくHOA圧縮器の空間的HOAエンコードおよび知覚的エンコードの部分のアーキテクチャの構造である。
【
図4】本発明のある実施形態に基づくHOA圧縮器の源符号化器部分のアーキテクチャの構造である。
【
図5】本発明のある実施形態に基づくHOA圧縮解除器の知覚的復号および源復号のアーキテクチャの構造である。
【
図6】本発明のある実施形態に基づくHOA圧縮解除器の空間的HOAデコード部分のアーキテクチャの構造である。
【
図7】周囲HOA信号から修正された周囲HOA信号へのフレーム変換である。
【
図8】HOA信号を圧縮する方法のフローチャートである。
【
図9】圧縮されたHOA信号を圧縮解除する方法のフローチャートである。
【
図10】本発明のある実施形態に基づくHOA圧縮解除器の空間的HOAデコード部分のアーキテクチャの諸部分の詳細である。
【発明を実施するための形態】
【0026】
理解を容易にするため、
図1および
図2の従来技術の解決策について以下で確認しておく。
【0027】
図1は、HOA圧縮器の通常のアーキテクチャの構造を示している。非特許文献1に記載される方法では、方向性成分がいわゆる優勢音成分に拡張される。方向性成分として、優勢音成分は部分的には方向性信号、すなわち、その方向から聴取者に入射すると想定される対応する方向をもつモノラル信号に、それらの方向性信号からもとのHOA表現の諸部分を予測するためのいくつかの予測パラメータを合わせたものによって表現されると想定される。さらに、優勢音成分は、いわゆるベクトル・ベースの信号によって表現されるとされる。つまり、ベクトル・ベースの信号の方向分布を定義する対応するベクトルをもつモノラル信号である。非特許文献1において提案されるHOA圧縮器の全体的なアーキテクチャが
図1に示されている。これは、
図1aに描かれる空間的HOAエンコード部と、
図1bに描かれる源エンコード部に細分できる。空間的HOAエンコーダは、I個の信号に、そのHOA表現をどのようにして生成するかを記述するサイド情報を合わせたものからなる第一の圧縮されたHOA表現を提供する。知覚的およびサイド情報源符号化器では、上述したI個の信号は知覚的にエンコードされ、上記サイド情報は源エンコードにかけられ、その後、二つの符号化された表現が多重化される。
【0028】
通常、空間的エンコードは次のように機能する。
【0029】
第一段階では、もとのHOA表現のk番目のフレームC(k)が方向およびベクトル推定処理ブロックに入力される。これは、タプル集合MDIR(k)およびMVEC(k)を与える。タプル集合MDIR(k)は、第一の要素が方向性信号のインデックスを表わし、第二の要素がそれぞれの量子化された方向を表わすタプルからなる。タプル集合MVEC(k)は、第一の要素がベクトル・ベースの信号のインデックスを示し、第二の要素が信号の方向分布、すなわち該ベクトル・ベースの信号のHOA表現がどのように計算されるかを定義するベクトルを表わすタプルからなる。
【0030】
タプル集合MDIR(k)およびMVEC(k)の両方を使って、初期HOAフレームC(k)はHOA分解において、全優勢音(すなわち、方向性およびベクトル・ベース)信号のフレームXPS(k-1)のフレームと、周囲HOA成分のフレームCAMB(k-1)とに分解される。それぞれ一フレームぶんの遅延に注意されたい。これは、ブロッキング・アーチファクトを避けるための重複加算処理に起因する。さらに、HOA分解は、優勢音HOA成分を豊かにするために方向性信号からどのようにしてもとのHOA表現の諸部分を予測するかを記述するいくつかの予測パラメータξ(k-1)を出力するものと想定される。さらに、HOA分解処理ブロックにおいて決定された優勢音信号のI個の利用可能なチャネルへの割り当てについての情報を含む目標割り当てベクトル(target assignment vector)vA,T(k-1)が提供される。影響されるチャネルは占有されていると想定されることができる。つまり、それらはそれぞれの時間フレームにおいて周囲HOA成分のいかなる係数シーケンスを転送するためにも利用可能ではない。
【0031】
周囲成分修正処理ブロックでは、周囲HOA成分のフレームCAMB(k-1)は、目標割り当てベクトルvA,T(k-1)によって与えられる情報に従って修正される。特に、周囲HOA成分のどの係数シーケンスが所与のI個のチャネルにおいて伝送されるべきかが、他の側面もあるが中でも、どのチャネルが利用可能であり、優勢音信号によってすでに占有されていないかについての情報(目標割り当てベクトルvA,T(k-1)に含まれる)に依存して、決定される。さらに、選ばれた係数シーケンスのインデックスが相続くフレームの間で変わる場合には、係数シーケンスのフェードインおよびフェードアウトが実行される。
【0032】
さらに、周囲HOA成分CAMB(k-2)の最初のOMIN個の係数シーケンスは、常に、知覚的に符号化され伝送されるべく選ばれるものとする。ここで、OMIN=(NMIN+1)2であり、NMIN≦Nは典型的にはもとのHOA表現のものより小さな次数である。これらのHOA係数シーケンスを脱相関するために、これらを、いくつかのあらかじめ定義された方向ΩMIN,d、d=1,…,OMINから入射する方向性信号(すなわち、一般平面波関数)に変換することが提案される。修正された周囲HOA成分CAMB(k-1)とともに、合理的な先読みを許容するために、利得制御処理ブロックにおいてのちに使われるよう、時間的に予測された修正された周囲HOA成分CP,M,A(k-1)が計算される。
【0033】
周囲HOA成分の修正についての情報は、すべての可能な型の信号の、利用可能なチャネルへの割り当てに直接関係している。割り当てについての最終的な情報は、最終的な割り当てベクトルvA(k-2)に含まれる。このベクトルを計算するために、目標割り当てベクトルvA,T(k-1)に含まれる情報が活用される。
【0034】
チャネル割り当ては、割り当てベクトルvA(k-2)によって与えられる情報を用いて、XPS(k-2)に含まれる適切な信号およびCM,A(k-2)に含まれる適切な信号を、I個の利用可能なチャネルに割り当て、信号yi(k-2)、i=1,…,Iを与える。さらに、XPS(k-1)に含まれる適切な信号およびCP,AMB(k-1)に含まれる適切な信号も、I個の利用可能なチャネルに割り当てられて、信号yP,i(k-2)、i=1,…,Iを与える。信号yi(k-2)、i=1,…,Iのそれぞれは、最終的に利得制御によって処理される。ここでは、知覚的エンコーダに好適な値範囲を達成するよう信号利得がなめらかに修正される。予測された信号フレームyP,i(k-2)、i=1,…,Iは、相続くブロックの間の激しい利得変化を避けるために一種の先読みを許容する。利得修正は、空間的デコーダにおいては、指数ei(k-2)および例外フラグβi(k-2)、i=1,…,Iからなる利得制御サイド情報を用いて、反転されることが想定される。
【0035】
図2は、非特許文献1において提案されるHOA圧縮解除器の通常のアーキテクチャの構造を示している。通常、HOA圧縮解除はHOA圧縮器コンポーネントの対応物からなり、それらの対応物は、当然、逆順に配列される。HOA圧縮解除は、
図2a)に描かれる知覚的および源デコード部と、
図2b)に描かれる空間的HOAデコード部に細分される。
【0036】
知覚的およびサイド情報源デコーダにおいて、ビットストリームはまず、前記I個の信号の知覚的に符号化された表現と、そのHOA表現をどのようにして生成するかを記述する符号化されたサイド情報とに多重分離される。続いて、前記I個の信号の知覚的デコードおよび前記サイド情報のデコードが実行される。次いで、空間的HOAデコーダは前記I個の信号および前記サイド情報から、再構成されたHOA表現を生成する。
【0037】
通常、空間的HOAデコードは次のように機能する。
【0038】
空間的HOAデコーダでは、知覚的にデコードされた信号
【数17】
のそれぞれがまず、関連する利得補正指数e
i(k)および利得補正例外フラグβ
i(k)と一緒に逆利得制御処理ブロックに入力される。i番目の逆利得制御処理は利得補正された信号フレーム
【数18】
〔^y
i(k)〕を与える。
【0039】
I個の利得補正された信号フレーム
【数19】
のすべては割り当てベクトルv
AMB,ASSIGN(k)およびタプル集合M
DIR(k+1)およびM
VEC(k+1)と一緒にチャネル再割り当てに渡される。タプル集合M
DIR(k+1)およびM
VEC(k+1)は(空間的HOAエンコードについて)上記で定義されている。割り当てベクトルv
AMB,ASSIGN(k)はI個の成分からなり、これらの成分は各伝送チャネルについて、周囲HOA成分の係数シーケンスを含んでいるかどうかおよびどの係数シーケンスを含んでいるかを示す。チャネル再割り当てにおいて、利得補正された信号フレーム^y
i(k)は、すべての優勢音信号(すなわちすべての方向性およびベクトル・ベースの信号)のフレーム
【数20】
〔^X
PS(k)〕および周囲HOA成分の中間表現のフレームC
I,AMB(k)を再構成するために再分配される。さらに、k番目のフレームにおいてアクティブである、周囲HOA成分の係数シーケンスのインデックスの集合I
AMB,ACT(k)と、(k-1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある周囲HOA成分の係数インデックスの集合I
E(k-1)、I
D(k-1)およびI
U(k-1)とが提供される。
【0040】
優勢音合成では、優勢音成分
【数21】
〔^C
PS(k-1)〕のHOA表現が、すべての優勢音信号のフレーム^X
PS(k)から、タプル集合M
DIR(k+1)および予測パラメータの集合ζ(k+1)、タプル集合M
VEC(k+1)および集合I
E(k-1)、I
D(k-1)およびI
U(k-1)を使って計算される。
【0041】
周囲合成では、周囲HOA成分フレーム
【数22】
〔^C
AMB(k-1)〕が、周囲HOA成分の中間表現のフレームC
I,AMB(k)から、k番目のフレームにおいてアクティブである周囲HOA成分の係数シーケンスのインデックスの集合I
AMB,ACT(k)を使って生成される。一フレームぶんの遅延に注意されたい。これは優勢音HOA成分との同期に起因して導入されるものである。最後に、HOA合成において、周囲HOA成分フレーム^C
AMB(k-1)および優勢音HOA成分のフレーム^C
PS(k-1)が重畳されて、デコードされたHOAフレーム^C(k-1)を与える。
【0042】
上記のHOA圧縮および圧縮解除方法の大雑把な記述から明らかになったように、圧縮された表現はI個の量子化されたモノラル信号およびいくらかの追加的なサイド情報からなる。これらのI個の量子化されたモノラル信号のうちの固定数OMIN個は、周囲HOA成分CAMB(k-2)の最初のOMIN個の係数シーケンスの空間的に変換されたバージョンを表わす。残りのI-OMIN個の信号の型は相続くフレームの間で変わることがあり、方向性、ベクトル・ベース、空または周囲HOA成分CAMB(k-2)の追加的な係数シーケンスを表わしているのいずれかであることができる。そのままでは、圧縮されたHOA表現はモノリシックであることが意図されている。特に、一つの問題は、いかにして記載された表現を低品質の基本層と向上層とに分割するかである。
【0043】
開示される発明によれば、低品質基本層のための候補は、周囲HOA成分CAMB(k-2)の最初のOMIN個の係数シーケンスの空間的に変換されたバージョンを含むOMIN個のチャネルである。これらの(一般性を失うことなく、最初の)OMIN個のチャネルが低品質基本層をなすための良好な選択となるのは、その時間不変な型のためである。しかしながら、それぞれの信号は、音場のために本質的である優勢音成分を全く欠いている。このことは、周囲HOA成分CAMB(k-1)の計算においても見て取れる。それは、
CAMB(k-1)=C(k-1)-CPS(k-1) (1)
に従ってもとのHOA表現C(k-1)から優勢音HOA表現CPS(k-1)を減算することによって実行される。
【0044】
この問題への解決策は、低い空間分解能での優勢音成分を基本層に含めることである。
【0045】
HOA圧縮への提案される修正について、以下で述べる。
【0046】
図3は、本発明のある実施形態に基づく、HOA圧縮器の空間的HOAエンコードおよび知覚的エンコード部分のアーキテクチャの構造を示している。低い空間分解能での優勢音成分をも基本層に含めるために、空間的HOAエンコーダにおけるHOA分解処理によって出力される周囲HOA成分C
AMB(k-1)(
図1a参照)が、修正バージョン
【数23】
によって置き換えられる。その要素は次式によって与えられる。
【0047】
【数24】
換言すれば、空間的に変換された形において常に伝送されるとされる周囲HOA成分の最初のO
MIN個の係数シーケンスは、もとのHOA成分の係数シーケンスによって置き換えられる。空間的HOAエンコーダの他の処理ブロックは不変のままであることができる。
【0048】
HOA分解処理のこの変更は、HOA圧縮をいわゆる「デュアル層」または「二層」モードで機能させる初期動作として見ることができることを注意しておくことが重要である。このモードは、低品質の基本層と向上層とに分割できるビットストリームを提供する。このモードを使うか使わないかは、全体ビットストリームの諸アクセス単位における単一ビットにによって信号伝達されることができる。
【0049】
基本層および向上層のためのビットストリームを提供するためのビットストリーム多重化の可能な結果的な修正が
図3および
図4に示されており、これについて下記でさらに述べる。
【0050】
基本層ビットストリーム
【数25】
は、知覚的にエンコードされた信号
【数26】
と、指数e
i(k-2)および例外フラグβ
i(k-2)、i=1,…,O
MINからなる対応する符号化された利得制御サイド情報とを含むだけである。残りの知覚的にエンコードされた信号
【数27】
およびエンコードされた残りのサイド情報は、向上層ビットストリームに含められる。基本層(base layer)および向上層(enhancement layer)ビットストリーム
【数28】
は次いで、以前の全ビットストリーム
【数29】
の代わりに、合同して伝送される。
【0051】
図3および
図4では、HOA係数シーケンスの入力時間フレーム(C(k))をもつ入力HOA表現であるHOA信号を圧縮するための装置が示されている。当該装置は、入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードのための、
図3に示される空間的HOAエンコードおよび知覚的エンコード部と、源エンコードのための、
図4に示される源符号化器部とを有する。空間的HOAエンコードおよび知覚的エンコード部は、方向およびベクトル推定ブロック301、HOA分解ブロック303、周囲成分修正ブロック304、チャネル割り当てブロック305および複数の利得制御ブロック306を有する。
【0052】
方向およびベクトル推定ブロック301は、HOA信号の方向およびベクトル推定処理を実行するために適応されている。ここでは、方向性信号についての第一のタプル集合MDIR(k)およびベクトル・ベースの信号についての第二のタプル集合MVEC(k)を含むデータが得られる。各第一のタプル集合MDIR(k)は、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、各第二のタプル集合MVEC(k)は、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む。
【0053】
HOA分解ブロック303は、HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号X
PS(k-1)のフレームと、周囲HOA成分
【数30】
のフレームとに分解するために適応されている。ここで、優勢音信号X
PS(k-1)は前記方向性音信号および前記ベクトル・ベースの音信号を含み、周囲HOA成分
【数31】
は、入力HOA表現と優勢音信号のHOA表現との間の残差を表わすHOA係数シーケンスを含む。分解はさらに、予測パラメータξ(k-1)および目標割り当てベクトル(target assignment vector)v
A,T(k-1)を提供する。予測パラメータξ(k-1)は、優勢音信号X
PS(k-1)内の方向性信号からどのようにして、優勢音HOA成分を豊かにするようHOA信号表現の諸部分を予測するかを記述する。目標割り当てベクトルv
A,T(k-1)は、所与の数I個のチャネルに優勢音信号をどのようにして割り当てるかについての情報を含む。
【0054】
周囲成分修正ブロック304は、周囲HOA成分CAMB(k-1)を、目標割り当てベクトルvA,T(k-1)によって与えられる情報に従って修正するために適応されている。ここで、周囲HOA成分CAMB(k-1)のどの係数シーケンスが所与の数I個のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定される。修正された(modified)周囲HOA成分CM,A(k-2)および時間的に予測された(predicted)修正された周囲HOA成分CP,M,A(k-1)が得られる。また、目標割り当てベクトルvA,T(k-1)内の情報から、最終的な割り当てベクトルvA(k-2)が得られる。
【0055】
チャネル割り当てブロック305は、上記分解から得られた優勢音信号XPS(k-1)と、修正された周囲HOA成分CM,A(k-2)および時間的に予測された修正された周囲HOA成分CP,M,A(k-1)の決定された係数シーケンスとを、最終的な割り当てベクトルvA(k-2)によって与えられる情報を使って、上記所与の数I個のチャネルに割り当てるために適応されている。ここで、トランスポート信号yi(k-2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k-2)、i=1,…,Iが得られる。
【0056】
複数の利得制御ブロック306は、トランスポート信号yi(k-2)および予測されたトランスポート信号yP,i(k-2)に対して利得制御(805)を実行するために適応されている。ここで、利得修正されたトランスポート信号zi(k-2)、指数ei(k-2)および例外フラグβi(k-2)が得られる。
【0057】
図4は、本発明のある実施形態に基づくHOA圧縮器の源符号化器部分のアーキテクチャの構造を示している。
図4に示される源符号化器部分は、知覚的符号化器310と、二つの符号化器320、330すなわち基本層サイド情報源符号化器320および向上層サイド情報エンコーダ330をもつサイド情報源符号化器ブロックと、二つのマルチプレクサ340、350、すなわち基本層ビットストリーム・マルチプレクサ340および向上層ビットストリーム・マルチプレクサ350とを有する。サイド情報源符号化器は、単一のサイド情報源符号化器ブロックであってもよい。
【0058】
知覚的符号化器310は、前記利得修正されたトランスポート信号z
i(k-2)を知覚的に符号化806することを含み、知覚的にエンコードされたトランスポート信号
【数32】
が得られる。
【0059】
サイド情報源符号化器320、330は、前記指数e
i(k-2)および例外フラグβ
i(k-2)、前記第一のタプル集合M
DIR(k)および第二のタプル集合M
VEC(k)、前記予測パラメータξ(k-1)および前記最終的な割り当てベクトルv
A(k-2)を含むサイド情報をエンコードするために適応されており、エンコードされたサイド情報
【数33】
が得られる。
【0060】
マルチプレクサ340、350は、知覚的にエンコードされたトランスポート信号
【数34】
およびエンコードされたサイド情報
【数35】
を多重化データ・ストリーム
【数36】
中に多重化するために適応されている。ここで、上記分解において得られた周囲HOA成分〔チルダ付きのC
AMB(k-1)〕は、入力HOA表現c
n(k-1)の最初の諸HOA係数シーケンスをO
MIN個の最低の位置(すなわち最低の諸インデックスをもつ位置)に、第二のHOA係数シーケンスC
AMB,n(k-1)を残りのより高い位置に含む。式(4)~(6)に関して下記で説明されるように、第二のHOA係数シーケンスは、入力HOA表現と優勢音信号のHOA表現との間の残差のHOA表現の一部である。さらに、最初のO
MIN個の指数e
i(k-2)、i=1,…,O
MINおよび例外フラグβ
i(k-2)、i=1,…,O
MINは基本層サイド情報源符号化器320においてエンコードされ、エンコードされた基本層サイド情報
【数37】
が得られる。ここで、O
MIN=(N
MIN+1)
2であり、O=(N+1)
2であり、N
MIN≦NかつO
MIN≦Iであり、N
MINはあらかじめ定義された整数値である。最初のO
MIN個の知覚的にエンコードされたトランスポート信号
【数38】
およびエンコードされた基本層サイド情報
【数39】
は基本層ビットストリーム・マルチプレクサ340(これは前記マルチプレクサの一つである)において多重化され、ここで、基本層ビットストリーム
【数40】
が得られる。基本層サイド情報源符号化器320は、前記サイド情報源符号化器の一つである、あるいはサイド情報源符号化器ブロック内にある。
【0061】
残りのI-O
MIN個の指数e
i(k-2)、i=O
MIN+1,…,Iおよび例外フラグβ
i(k-2)、i=O
MIN+1,…,I、前記第一のタプル集合M
DIR(k-1)および第二のタプル集合M
VEC(k-1)、前記予測パラメータξ(k-1)および前記最終的な割り当てベクトルv
A(k-2)は、向上層サイド情報エンコーダ330においてエンコードされ、ここで、エンコードされた向上層サイド情報
【数41】
が得られる。向上層サイド情報源符号化器330は、前記サイド情報源符号化器の一つである、あるいはサイド情報源符号化器ブロック内にある。
【0062】
残りのI-O
MIN個の知覚的にエンコードされたトランスポート信号
【数42】
およびエンコードされた向上層サイド情報
【数43】
は、向上層ビットストリーム・マルチプレクサ350(これも前記マルチプレクサの一つである)において多重化され、向上層ビットストリーム
【数44】
が得られる。さらに、モード指示LMF
Eがマルチプレクサまたは指示挿入ブロックにおいて追加される。モード指示LMF
Eは階層化モードの使用を信号伝達し、それは圧縮された信号の正しい圧縮解除のために使われる。
【0063】
ある実施形態では、本エンコード装置はさらに、モードを選択するよう適応されたモード選択器を有する。モードは、モード指示LMFEによって示され、階層化モードおよび非階層化モードの一つである。非階層化モードでは、周囲HOA成分〔チルダ付きのCAMB(k-1)〕は、入力HOA表現と優勢音信号のHOA表現との間の残差を表わすHOA係数シーケンスのみを含む(すなわち、入力HOA表現の係数シーケンスを含まない)。
【0064】
HOA圧縮解除の提案される修正について以下で述べる。
【0065】
階層化モードでは、HOA圧縮における周囲HOA成分CAMB(k-1)の修正が、HOA合成を適切に修正することによって、HOA圧縮解除において考慮される。
【0066】
HOA圧縮解除器では、基本層および向上層ビットストリームの多重分離およびデコードは、
図5に従って実行される。基本層ビットストリーム
【数45】
は、基本層サイド情報の符号化された表現と、知覚的にエンコードされた信号とに多重分離される。その後、基本層サイド情報の符号化された表現および知覚的にエンコードされた信号はデコードされて、一方では指数e
i(k)および例外フラグを与え、他方では知覚的にデコードされた信号を与える。同様に、向上層ビットストリームは多重分離およびデコードされて、知覚的にデコードされた信号および残りのサイド情報を与える(
図5参照)。この階層化モードでは、空間的HOAエンコードにおける周囲HOA成分C
AMB(k-1)の修正を考慮するために、空間的HOAデコード部も修正される必要がある。修正は、HOA合成において達成される。
【0067】
具体的には、再構成されたHOA表現
【数46】
はその修正されたバージョン
【数47】
によって置き換えられる。その要素は次式で与えられる。
【0068】
【数48】
つまり、最初のO
MIN個の係数シーケンスについては、優勢音HOA成分は周囲HOA成分に加えられない。そこにすでに含まれているからである。HOA空間的デコーダの他のすべての処理ブロックは不変のままである。
【0069】
以下では、純粋に低品質基本層ビットストリーム
【数49】
が存在するときのHOA圧縮解除について簡単に考察する。
【0070】
ビットストリームはまず多重分離およびデコードされて、再構成された信号^z
i(k)と、指数e
i(k)および例外フラグβ
i(k)、i=1,…,O
MINからなる対応する利得制御サイド情報とを与える。向上層がないときは、知覚的に符号化された信号
【数50】
は利用可能ではない。この状況に対処する可能な仕方は、信号
【数51】
を0と置くことである。これは、自動的に、再構成された優勢音成分C
PS(k-1)を0にする。
【0071】
次のステップでは、空間的HOAデコーダにおいて、最初のO
MIN個の逆利得制御処理ブロックが、利得補正された信号フレーム
【数52】
を与える。これらのフレームは、チャネル再割り当てによって周囲HOA成分の中間表現のフレームC
I,AMB(k)を構築するために使われる。k番目のフレームにおいてアクティブである周囲HOA成分の係数シーケンスのインデックスの集合I
AMB,ACT(k)はインデックス1,2,…,O
MINのみを含むことを注意しておく。周囲合成において、最初のO
MIN個の係数シーケンスの空間的変換の逆が行なわれて、周囲HOA成分フレームC
AMB(k-1)が与えられる。最後に、再構成されたHOA表現が式(6)に従って計算される。
【0072】
図5および
図6は、本発明のある実施形態に基づくHOA圧縮解除器のアーキテクチャの構造を示している。本装置は、
図5に示される知覚的デコードおよび源デコード部と、
図6に示される空間的HOAデコード部と、圧縮されたHOA信号が圧縮された基本層ビットストリーム
【数53】
および圧縮された向上層ビットストリームを含むことを示す階層化モード指示LMF
Dを検出するために適応されたモード検出器とを有する。
を有する。
【0073】
図5は、本発明のある実施形態に基づくHOA圧縮解除器の知覚的デコードおよび源デコード部のアーキテクチャの構造を示している。知覚的デコードおよび源デコード部は、第一のデマルチプレクサ510、第二のデマルチプレクサ520、基本層知覚的デコーダ540および向上層知覚的デコーダ550、基本層サイド情報源デコーダ530および向上層サイド情報源デコーダ560を有する。
【0074】
第一のデマルチプレクサ510は、圧縮された基本層ビットストリーム
【数54】
を多重分離するために適応されている。ここで、第一の知覚的にエンコードされたトランスポート信号
【数55】
および第一のエンコードされたサイド情報
【数56】
が得られる。第二のデマルチプレクサ520は、圧縮された向上層ビットストリーム
【数57】
を多重分離するために適応されている。ここで、第二の知覚的にエンコードされたトランスポート信号
【数58】
および第二のエンコードされたサイド情報
【数59】
が得られる。
【0075】
基本層知覚的デコーダ540および向上層知覚的デコーダ550は、知覚的にエンコードされたトランスポート信号
【数60】
を知覚的にデコードする904ために適応されており、知覚的にデコードされたトランスポート信号
【数61】
が得られる。基本層知覚的デコーダ540では、基本層の前記第一の知覚的にエンコードされたトランスポート信号
【数62】
がデコードされて、第一の知覚的にデコードされたトランスポート信号
【数63】
が得られる。向上層知覚的デコーダ550では、向上層の前記第二の知覚的にエンコードされたトランスポート信号
【数64】
がデコードされて、第二の知覚的にデコードされたトランスポート信号
【数65】
が得られる。
【0076】
基本層サイド情報源デコーダ530は、第一のエンコードされたサイド情報
【数66】
をデコード905するよう適応されている。ここで、第一の指数e
i(i)、i=1,…,O
MINおよび第一の例外フラグβ
i(k)、i=1,…,O
MINが得られる。
【0077】
向上層サイド情報源デコーダ560は、第二のエンコードされたサイド情報
【数67】
をデコードするよう適応されている。ここで、第二の指数e
i(i)、i=O
MIN+1,…,Iおよび第二の例外フラグβ
i(k)、i=O
MIN+1,…,Iが得られ、さらなるデータが得られる。前記さらなるデータは、方向性信号についての第一のタプル集合M
DIR(k+1)およびベクトル・ベースの信号についての第二のタプル集合M
VEC(k+1)を含む。第一のタプル集合M
DIR(k+1)の各タプルは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、第二のタプル集合M
VEC(k+1)の各タプルは、ベクトル・ベースの信号のインデックスおよび該ベクトル・ベースの信号の方向分布を定義するベクトルを含む。さらに、予測パラメータξ(k+1)および周囲割り当てベクトルv
AMB,ASSIGN(k)が得られる。ここで、周囲割り当てベクトルv
AMB,ASSIGN(k)は、各伝送チャネルについて、周囲HOA成分の係数シーケンスを含んでいるかどうかおよびどの係数シーケンスを含んでいるかを示す成分を含む。
【0078】
図6は、本発明のある実施形態に基づくHOA圧縮解除器の空間的HOAデコード部のアーキテクチャの構造を示している。空間的HOAデコード部は、複数の逆利得制御ユニット604、チャネル再割り当てブロック605、優勢音合成(Predominant Sound Synthesis)ブロック606および周囲合成(Ambient Synthesis)ブロック607、HOA合成(HOA Composition)ブロック608を有する。
【0079】
複数の逆利得制御ユニット604は、逆利得制御を実行するよう適応されている。ここで、前記第一の知覚的にデコードされたトランスポート信号
【数68】
が、第一の指数e
i(k)、i=1,…,O
MINおよび第一の例外フラグβ
i(k)、i=1,…,O
MINに従って、第一の利得補正された信号フレーム^y
i(k)、i=1,…,O
MINに変換され、前記第二の知覚的にデコードされたトランスポート信号
【数69】
が、第二の指数e
i(k)、i=O
MIN+1,…,Iおよび第二の例外フラグβ
i(k)、i=O
MIN+1,…,Iに従って、第二の利得補正された信号フレーム^y
i(k)、i=O
MIN+1,…,Iに変換される。
【0080】
チャネル再割り当てブロック605は、第一および第二の利得補正された信号フレーム^y
i(k)、i=1,…,IをI個のチャネルに再分配するよう適応されている。ここで、優勢音信号のフレーム^X
PS(k)が再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分
【数70】
が得られ、割り当ては、前記周囲割り当てベクトルv
AMB,ASSIGN(k)および前記第一および第二のタプル集合M
DIR(k+1)、M
VEC(k+1)内の情報に従ってなされる。
【0081】
さらに、チャネル再割り当てブロック605は、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合IAMB,ACT(k)と、(k-1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合IE(k-1)、ID(k-1)およびIU(k-1)とを生成するよう適応されている。
【0082】
優勢音合成ブロック606は、優勢HOA音成分^CPS(k-1)のHOA表現を、前記優勢音信号^XPS(k)から合成する(912)よう適応されている。ここで、第一および第二のタプル集合MDIR(k+1)、MVEC(k+1)、予測パラメータζ(k+1)およびインデックスの第二の集合IE(k-1)、ID(k-1)、IU(k-1)が使用される。
【0083】
周囲合成ブロック607は、周囲HOA成分
【数71】
を、修正された周囲HOA成分
【数72】
から合成する(913)よう適応されている。ここで、最初のO
MIN個のチャネルについての逆空間的変換がなされ、インデックスの第一の集合I
AMB,ACT(k)が使用される。該インデックスの第一の集合は、k番目のフレームにおいてアクティブである周囲HOA成分の係数シーケンスのインデックスである。
【0084】
階層化モード指示LMFDが少なくとも二つの層をもつ階層化モードを示す場合、周囲HOA成分は、そのOMIN個の最低の位置(すなわち最低の諸インデックスをもつ位置)に、圧縮解除されたHOA信号^C(k-1)のHOA係数シーケンスを含み、残りのより高い位置に、残差のHOA表現の一部である係数シーケンスを含む。該残差は、圧縮解除されたHOA信号^C(k-1)と、914優勢HOA音成分^CPS(k-1)のHOA表現との間の残差である。
【0085】
他方、階層化モード指示LMFDが単一層モードを示す場合には、圧縮解除されたHOA信号^C(k-1)のHOA係数シーケンスは含まれておらず、周囲HOA成分は、圧縮解除されたHOA信号^C(k-1)と、優勢HOA音成分^CPS(k-1)のHOA表現との間の残差である。
【0086】
HOA合成ブロック608は、優勢音成分のHOA表現を周囲HOA成分に加えるよう適応されている。
【0087】
【数73】
ここで、優勢音信号のHOA表現の係数および周囲HOA成分の対応する係数が加算され、圧縮解除されたHOA信号^C'(k-1)が得られる。ここで、
階層化モード指示LMF
Dが少なくとも二つの層をもつ階層化モードを示す場合、最高のI-O
MIN個の係数チャネルだけが、優勢HOA音成分^C
PS(k-1)と周囲HOA成分
【数74】
の加算によって得られ、圧縮解除されたHOA信号^C'(k-1)の低いほうからのO
MIN個の係数チャネルは、周囲HOA成分
【数75】
からコピーされる。他方、階層化モード指示LMF
Dが単一層モードを示す場合には、圧縮解除されたHOA信号^C'(k-1)のすべての係数チャネルは、優勢HOA音成分^C
PS(k-1)と周囲HOA成分
【数76】
の加算によって得られる。
【0088】
図7は、周囲HOA信号から修正された周囲HOA信号へのフレームの変換を示している。
【0089】
図8は、HOA信号を圧縮する方法のフローチャートを示している。
【0090】
HOA係数シーケンスの入力時間フレームC(k)をもつ次数Nの入力HOA表現である高次アンビソニックス(HOA)信号を圧縮するための方法800は、入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードおよび源エンコードを含む。
【0091】
空間的HOAエンコードは、
方向およびベクトル推定ブロック301においてHOA信号の方向およびベクトル推定処理801を実行する段階であって、方向性信号についての第一のタプル集合M
DIR(k)およびベクトル・ベースの信号についての第二のタプル集合M
VEC(k)を含むデータが得られ、各第一のタプル集合M
DIR(k)は、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、各第二のタプル集合M
VEC(k)は、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、段階と;
HOA分解ブロック303において、HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号X
PS(k-1)のフレームと、周囲HOA成分
【数77】
のフレームとに分解802する段階であって、優勢音信号X
PS(k-1)は前記方向性音信号および前記ベクトル・ベースの音信号を含み、前記周囲HOA成分
【数78】
は、前記入力HOA表現と前記優勢音信号のHOA表現との間の残差を表わすHOA係数シーケンスを含み、前記分解702はさらに、予測パラメータξ(k-1)および目標割り当てベクトル(target assignment vector)v
A,T(k-1)を提供し、前記予測パラメータξ(k-1)は、優勢音信号X
PS(k-1)内の方向性信号からどのようにして、優勢音HOA成分を豊かにするようHOA信号表現の諸部分を予測するかを記述し、前記目標割り当てベクトルv
A,T(k-1)は、所与の数I個のチャネルに優勢音信号をどのようにして割り当てるかについての情報を含む、段階と;
周囲成分修正ブロック304において、周囲HOA成分C
AMB(k-1)を、前記目標割り当てベクトルv
A,T(k-1)によって与えられる情報に従って修正803する段階であって、周囲HOA成分C
AMB(k-1)のどの係数シーケンスが所与の数I個のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された(modified)周囲HOA成分C
M,A(k-2)および時間的に予測された(predicted)修正された周囲HOA成分C
P,M,A(k-1)が得られ、前記目標割り当てベクトルv
A,T(k-1)内の情報から、最終的な割り当てベクトルv
A(k-2)が得られる、段階と;
チャネル割り当てブロック105において、上記分解から得られた優勢音信号X
PS(k-1)と、修正された周囲HOA成分C
M,A(k-2)および時間的に予測された修正された周囲HOA成分C
P,M,A(k-1)の決定された係数シーケンスを、最終的な割り当てベクトルv
A(k-2)によって与えられる情報を使って、上記所与の数I個のチャネルに割り当てる804段階であって、トランスポート信号y
i(k-2)、i=1,…,Iおよび予測されたトランスポート信号y
P,i(k-2)、i=1,…,Iが得られる、段階と;
複数の利得制御ブロック306において、前記トランスポート信号y
i(k-2)および前記予測されたトランスポート信号y
P,i(k-2)に対して利得制御805を実行する段階であって、利得修正されたトランスポート信号z
i(k-2)、指数e
i(k-2)および例外フラグβ
i(k-2)が得られる、段階とを含む。
【0092】
前記知覚的エンコードおよび源エンコードは、
知覚的符号化器310において、前記利得修正されたトランスポート信号z
i(k-2)を知覚的に符号化する806段階であって、知覚的にエンコードされたトランスポート信号
【数79】
が得られる、段階と;
一つまたは複数のサイド情報源符号化器320、330において、前記指数e
i(k-2)および例外フラグβ
i(k-2)、前記第一のタプル集合M
DIR(k)および第二のタプル集合M
VEC(k)、前記予測パラメータξ(k-1)および前記最終的な割り当てベクトルv
A(k-2)を含むサイド情報をエンコードする段階であって、エンコードされたサイド情報
【数80】
が得られる、段階と;
知覚的にエンコードされたトランスポート信号
【数81】
およびエンコードされたサイド情報
【数82】
を多重化808する段階であって、多重化されたデータ・ストリーム
【数83】
が得られる、段階とを含む。
【0093】
上記分解する段階802において得られた周囲HOA成分〔チルダ付きのCAMB(k-1)〕は、入力HOA表現cn(k-1)の最初の諸HOA係数シーケンスをOMIN個の最低の位置(すなわち最低の諸インデックスをもつ位置)に、第二のHOA係数シーケンスCAMB,n(k-1)を残りのより高い位置に含む。第二のHOA係数シーケンスは、入力HOA表現と優勢音信号のHOA表現との間の残差のHOA表現の一部である。
【0094】
最初のO
MIN個の指数e
i(k-2)、i=1,…,O
MINおよび例外フラグβ
i(k-2)、i=1,…,O
MINは基本層サイド情報源符号化器320においてエンコードされ、エンコードされた基本層サイド情報
【数84】
が得られる。ここで、O
MIN=(N
MIN+1)
2であり、O=(N+1)
2であり、N
MIN≦NかつO
MIN≦Iであり、N
MINはあらかじめ定義された整数値である。
【0095】
最初のO
MIN個の知覚的にエンコードされたトランスポート信号
【数85】
およびエンコードされた基本層サイド情報
【数86】
は基本層ビットストリーム・マルチプレクサ340において多重化809され、ここで、基本層ビットストリーム
【数87】
が得られる。
【0096】
残りのI-O
MIN個の指数e
i(k-2)、i=O
MIN+1,…,Iおよび例外フラグβ
i(k-2)、i=O
MIN+1,…,I、前記第一のタプル集合M
DIR(k-1)および第二のタプル集合M
VEC(k-1)、前記予測パラメータξ(k-1)および前記最終的な割り当てベクトルv
A(k-2)(図面ではv
AMB,ASSIGN(k)としても示される)は、向上層サイド情報エンコーダ330においてエンコードされ、ここで、エンコードされた向上層サイド情報
【数88】
が得られる。
【0097】
残りのI-O
MIN個の知覚的にエンコードされたトランスポート信号
【数89】
およびエンコードされた向上層サイド情報
【数90】
は、向上層ビットストリーム・マルチプレクサ350において多重化810され、向上層ビットストリーム
【数91】
が得られる。
【0098】
上記のように、階層化モードの使用を信号伝達するモード指示が加えられる811。モード指示は、指示挿入ブロックまたはマルチプレクサによって加えられる。
【0099】
ある実施形態では、本方法はさらに、基本層ビットストリーム
【数92】
と、向上層ビットストリーム
【数93】
と、モード指示とを単一のビットストリームに多重化する最終段階を含む。
【0100】
ある実施形態では、前記優位方向(dominant direction)推定は、エネルギー的に優位なHOA成分の方向性パワー分布に依存する。
【0101】
ある実施形態では、選ばれるHOA係数シーケンスのHOAシーケンス・インデックスが相続くフレーム間で変わる場合には、周囲HOA成分を修正する際、係数シーケンスのフェードインおよびフェードアウトが実行される。
【0102】
ある実施形態では、周囲HOA成分を修正する際、周囲HOA成分CAMB(k-1)の部分的脱相関が実行される。
【0103】
ある実施形態では、第一のタプル集合MDIR(k)に含まれる量子化方向は優位方向である。
【0104】
図9は、圧縮されたHOA信号を圧縮解除する方法のフローチャートを示している。本発明のこの実施形態では、圧縮されたHOA信号を圧縮解除する方法900は、HOA係数シーケンスの出力時間フレーム^C(k-1)を得るために、知覚的なデコードおよび源デコードならびにその後の空間的HOAデコードを含む。本方法は、圧縮された高次アンビソニックス(HOA)信号が圧縮された基本層ビットストリーム
【数94】
および圧縮された向上層ビットストリーム
【数95】
を含むことを示す階層化モード指示LMF
Dを検出する901段階を含む。
【0105】
前記知覚的デコードおよび源デコードは、
圧縮された基本層ビットストリーム
【数96】
を多重分離902する段階であって、第一の知覚的にエンコードされたトランスポート信号
【数97】
および第一のエンコードされたサイド情報
【数98】
が得られる、段階と;
圧縮された向上層ビットストリーム
【数99】
を多重分離903する段階であって、第二の知覚的にエンコードされたトランスポート信号
【数100】
および第二のエンコードされたサイド情報
【数101】
が得られる、段階と;
知覚的にエンコードされたトランスポート信号
【数102】
を知覚的にデコード904する段階であって、知覚的にデコードされたトランスポート信号
【数103】
が得られ、基本層知覚的デコーダ540において、基本層の前記第一の知覚的にエンコードされたトランスポート信号
【数104】
がデコードされて、第一の知覚的にデコードされたトランスポート信号
【数105】
が得られ、向上層知覚的デコーダ550において、向上層の前記第二の知覚的にエンコードされたトランスポート信号
【数106】
がデコードされて、第二の知覚的にデコードされたトランスポート信号
【数107】
が得られる、段階と;
基本層サイド情報源デコーダ530において、第一のエンコードされたサイド情報
【数108】
をデコード905する段階であって、第一の指数e
i(i)、i=1,…,O
MINおよび第一の例外フラグβ
i(k)、i=1,…,O
MINが得られる、段階と;
向上層サイド情報源デコーダ560において、第二のエンコードされたサイド情報
【数109】
をデコード906する段階であって、第二の指数e
i(i)、i=O
MIN+1,…,Iおよび第二の例外フラグβ
i(k)、i=O
MIN+1,…,Iが得られ、さらなるデータが得られ、前記さらなるデータは、方向性信号についての第一のタプル集合M
DIR(k+1)およびベクトル・ベースの信号についての第二のタプル集合M
VEC(k+1)を含み、第一のタプル集合M
DIR(k+1)の各タプルは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、第二のタプル集合M
VEC(k+1)の各タプルは、ベクトル・ベースの信号のインデックスおよび該ベクトル・ベースの信号の方向分布を定義するベクトルを含み、さらに、予測パラメータξ(k+1)および周囲割り当てベクトルv
AMB,ASSIGN(k)が得られる、段階とを含む。周囲割り当てベクトルv
AMB,ASSIGN(k)は、各伝送チャネルについて、周囲HOA成分の係数シーケンスを含んでいるかどうかおよびどの係数シーケンスを含んでいるかを示す成分を含む。
【0106】
前記空間的HOAデコードは、
逆利得制御を実行910する段階であって、前記第一の知覚的にデコードされたトランスポート信号
【数110】
が、前記第一の指数e
i(k)、i=1,…,O
MINおよび前記第一の例外フラグβ
i(k)、i=1,…,O
MINに従って、第一の利得補正された信号フレーム^y
i(k)、i=1,…,O
MINに変換され、前記第二の知覚的にデコードされたトランスポート信号
【数111】
が、前記第二の指数e
i(k)、i=O
MIN+1,…,Iおよび前記第二の例外フラグβ
i(k)、i=O
MIN+1,…,Iに従って、第二の利得補正された信号フレーム^y
i(k)、i=O
MIN+1,…,Iに変換される、段階と;
チャネル再割り当てブロック605において、前記第一および第二の利得補正された信号フレーム^y
i(k)、i=1,…,IをI個のチャネルに再分配911する段階であって、優勢音信号のフレーム^X
PS(k)が再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分
【数112】
が得られ、割り当ては、前記周囲割り当てベクトルv
AMB,ASSIGN(k)および前記第一および第二のタプル集合M
DIR(k+1)、M
VEC(k+1)内の情報に従ってなされる、段階と;
チャネル再割り当てブロック605において、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合I
AMB,ACT(k)と、(k-1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合I
E(k-1)、I
D(k-1)、I
U(k-1)とを生成911bする段階と;
優勢音合成ブロック606において、優勢HOA音成分^C
PS(k-1)のHOA表現を、前記優勢音信号^X
PS(k)から合成912する段階であって、前記第一および第二のタプル集合M
DIR(k+1)、M
VEC(k+1)、予測パラメータζ(k+1)およびインデックスの第二の集合I
E(k-1)、I
D(k-1)、I
U(k-1)が使用される、段階と;
周囲合成ブロック607において、周囲HOA成分
【数113】
を、修正された周囲HOA成分
【数114】
から合成913する段階であって、最初のO
MIN個のチャネルについての逆空間的変換がなされ、インデックスの第一の集合I
AMB,ACT(k)が使用され、該インデックスの第一の集合は、k番目のフレームにおいてアクティブである周囲HOA成分の係数シーケンスのインデックスであり、周囲HOA成分は、階層化モード指示LMF
Dに依存して少なくとも二つの異なる構成のうちの一つをもつ、段階と;
HOA合成ブロック608において、優勢HOA音成分^C
PS(k-1)および周囲HOA成分
【数115】
のHOA表現を加算914する段階であって、優勢音信号のHOA表現の係数と、周囲HOA成分の対応する係数とが加算され、圧縮解除されたHOA信号^C'(k-1)が得られ、下記の条件、すなわち:
階層化モード指示LMF
Dが少なくとも二つの層をもつ階層化モードを示す場合、最高のI-O
MIN個の係数チャネルだけが、優勢HOA音成分^C
PS(k-1)と周囲HOA成分
【数116】
の加算によって得られ、圧縮解除されたHOA信号^C'(k-1)の低いほうからのO
MIN個の係数チャネルは、周囲HOA成分
【数117】
からコピーされ;他方、階層化モード指示LMF
Dが単一層モードを示す場合には、圧縮解除されたHOA信号^C'(k-1)のすべての係数チャネルは、優勢HOA音成分^C
PS(k-1)と周囲HOA成分
【数118】
の加算によって得られる、という条件が適用される、段階とを含む。
【0107】
階層化モード指示LMFDに依存しての周囲HOA成分の構成は次のようなものである。
【0108】
階層化モード指示LMFDが少なくとも二つの層をもつ階層化モードを示す場合、周囲HOA成分は、そのOMIN個の最低位の位置に、圧縮解除されたHOA信号^C(k-1)のHOA係数シーケンスを含み、残りのより高位の位置に、圧縮解除されたHOA信号^C(k-1)と、優勢HOA音成分^CPS(k-1)のHOA表現との間の残差のHOA表現の一部である係数シーケンスを含む。
【0109】
他方、階層化モード指示LMFDが単一層モードを示す場合には、周囲HOA成分は、圧縮解除されたHOA信号^C(k-1)と、優勢HOA音成分^CPS(k-1)のHOA表現との間の残差である。
【0110】
ある実施形態では、圧縮されたHOA信号表現は多重化されたビットストリーム中にあり、圧縮されたHOA信号を圧縮解除する本方法はさらに、圧縮されたHOA信号表現を多重分離する初期段階であって、前記圧縮された基本層ビットストリーム
【数119】
と、前記圧縮された向上層ビットストリーム
【数120】
と、前記階層化モード指示LMF
Dとが得られる段階を有する。
【0111】
図10は、本発明のある実施形態に基づく、HOA圧縮解除器の空間的HOAデコード部のアーキテクチャの諸部分の詳細を示している。
【0112】
有利なことに、たとえばELが受領されない場合またはBL品質が十分である場合、BLだけをデコードすることが可能である。この場合、ELの信号はデコーダにおいて0に設定されることができる。すると、優勢音信号^X
PS(k)のフレームは空なので、チャネル再割り当てブロック605において、第一および第二の利得補正された信号フレーム^y
i(k)、i=1,…,IをI個のチャネルに再分配911することは非常に単純である。(k-1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合I
E(k-1)、I
D(k-1)およびI
U(k-1)は0に設定される。したがって、優勢音合成ブロック606における優勢HOA音信号^X
PS(k)からの優勢HOA音成分^C
PS(k-1)のHOA表現の合成912はスキップでき、周囲合成ブロック607における修正された周囲HOA成分
【数121】
からの周囲HOA成分
【数122】
の合成913は、通常のHOA合成に対応する。
【0113】
HOA圧縮のためのもとの(すなわちモノリシック、非スケーラブル、非階層化)モードも、低品質の基本層が必要とされない用途、たとえばファイル・ベースの圧縮のためには相変わらず有用でありうる。もとのHOA表現と方向性HOA表現との間の差である周囲HOA成分CAMBの空間的に変換された最初のOMIN個の係数シーケンスを、もとのHOA成分Cの空間的に変換された係数シーケンスの代わりに、知覚的に符号化することの利点は、前者の場合には、知覚的に符号化されるべきすべての信号間の相互相関が低下するということである。信号zi、i=1,…,Iの間のいかなる相互相関も、空間的デコード・プロセスの間に知覚的な符号化ノイズの建設的な重畳を引き起こしうる。一方で、同時に、ノイズのないHOA係数シーケンスは重畳で打ち消される。この現象は、知覚的ノイズ・マスキング解除(perceptual noise unmasking)として知られる。
【0114】
階層化モードでは、信号z
i、i=1,…,O
MINのそれぞれの間に、また信号z
i、i=1,…,O
MINとz
i、i=O
MIN+1,…,Iの間に高い相互相関がある。というのも、周囲HOA成分
【数123】
の修正された係数シーケンスは、方向性HOA成分の信号を含むからである(式(3)参照)。逆に、これは、もとの非階層化モードでは成り立たない。したがって、階層化モードによって導入される伝送の堅牢さは、圧縮品質を代償としてもたらされることがあると結論できる。しかしながら、圧縮品質の低下は、伝送の堅牢さの増大に比べて小さい。上記で示したように、提案される階層化モードは、少なくとも上記の状況において有利である。
【0115】
本発明の基本的な新規な特徴をその好ましい実施形態に適用した場合について図示し、説明し、指摘してきたが、本発明の精神から外れることなく、記載される装置および方法においてさまざまな省略、代替および変更が、開示されるデバイスの形および詳細ならびにその動作において、当業者によってなされてもよいことは理解されるであろう。実質的に同じ仕方で実質的に同じ機能を実行し、同じ結果を達成する要素のあらゆる組み合わせが本発明の範囲内であることはっきりと意図されている。ある記載された実施形態からの要素の、他の記載された実施形態への代用も完全に意図されており、考えられている。
【0116】
本発明は、純粋に例として記述されたのであり、本発明の範囲から外れることなく詳細の修正をなすことができることは理解されるであろう。
【0117】
本記述および(適切な場合には)請求項および図面において開示されている各特徴は、独立に、あるいは任意の適切な組み合わせにおいて提供されうる。特徴は、適宜、ハードウェア、ソフトウェアまたは両者の組み合わせにおいて実装されうる。接続は、該当する場合には、無線接続または有線の、必ずしも直接接続や専用接続ではない接続として実装されてもよい。
【0118】
請求項に現われる参照符号は単に例であって、請求項の範囲に対する限定する効果はもたない。