【課題を解決するための手段】
【0008】
この目的は、符号化されたオーディオ信号を処理するための装置により達成される。符号化されたオーディオ信号は、複数の入力オーディオ・オブジェクトとオブジェクトパラメータ(E)とに関連付けられた複数のダウンミックス信号を含む。装置は、分類器およびプロセッサおよび結合器かを含む。
【0009】
【0010】
さらに、プロセッサ−分類に続いている−は、入力オーディオ・オブジェクトのそれぞれのセットのオブジェクトパラメータに対して、少なくとも1つの処理ステップを個々に実行するように構成される。ゆえに、少なくとも1つの処理ステップが、全てのオブジェクトパラメータに対して同時に実行されるのではなく、ダウンミックス信号の個々のグループに属するオブジェクトパラメータに対して個々に実行される。1つの実施の形態において、ちょうど1つのステップが個々に実行される。異なる実施の形態において、1つ以上のステップが実行される一方、代わりの実施の形態において、全体の処理がダウンミックス信号のグループについて個々に実行される。プロセッサは個々のグループのための分類結果を提供する。
【0011】
異なる実施の形態において、プロセッサ−分類に続いている−は、複数のダウンミックス信号のグループのそれぞれのグループについて少なくとも1つの処理ステップを個々に実行するように構成される。ゆえに、少なくとも1つの処理ステップが、全てのダウンミックス信号に対して同時に実行されるのではなく、ダウンミックス信号の個々のグループについて個々に実行される。
【0012】
結局、結合器は、復号化されたオーディオ信号を提供するために、分類結果または処理された分類結果を結合するように構成される。ゆえに、分類結果または分類結果に対して実行された別の処理ステップの結果が、復号化されたオーディオ信号を提供するように結合される。復号化されたオーディオ信号は、符号化されたオーディオ信号により符号化される複数の入力オーディオ・オブジェクトに対応する。
【0013】
分類器によって成された分類は、複数の入力オーディオ・オブジェクトのそれぞれの入力オーディオ・オブジェクトが、入力オーディオ・オブジェクトのちょうど又は正確に1つのセットに属するという圧縮の下で少なくとも成される。これは、個々の入力オーディオ・オブジェクトが、ダウンミックス信号のちょうど1つのグループに属することを暗示する。これは、個々のダウンミックス信号が、ダウンミックス信号のちょうど1つのグループに属することも暗示する。
【0014】
実施の形態によると、分類器は、入力オーディオ・オブジェクトのそれぞれのセットのそれぞれの入力オーディオ・オブジェクトが、符号化されたオーディオ信号の中で信号で伝えられた、他の入力オーディオ・オブジェクトと関係がない、または、符号化されたオーディオ信号の中で伝えられた、入力オーディオ・オブジェクトの同じセットに属する少なくとも1つの入力オーディオ・オブジェクトとのみ関係を持つように、複数のダウンミックス信号を、複数のダウンミックス信号グループに分類するように構成されている。これは、入力オーディオ・オブジェクトが、ダウンミックス信号の異なるグループに属する入力オーディオ・オブジェクトに、信号で伝えられた関係を持たないことを暗示する。そのような信号で伝えられた関係は、1つの実施の形態において、2つの入力オーディオ・オブジェクトが、1つの単一のソースから生じるステレオ信号であることである。
【0015】
本発明の装置は、ダウンミックス信号を含む符号化されたオーディオ信号を処理する。ダウンミックス化は、個々のオーディオ信号の与えられた数を符号化するプロセスの一部であり、入力オーディオ・オブジェクトの特定の数がダウンミックス化信号の中に結合されることを暗示する。従って、入力オーディオ・オブジェクトの数は、より小さいダウンミックス信号に減らされる。このため、ダウンミックス信号が、複数の入力オーディオ・オブジェクトと関連する。
【0016】
ダウンミックス信号は、ダウンミックス信号のグループに分類されて、−すなわち単一のグループとして−少なくとも1つの処理ステップに個々に従う。それゆえ、装置は、すべてのダウンミックス信号に対して一緒にではなく、ダウンミックス信号の個々のグループについて個々に、少なくとも1つの処理ステップを実行する。異なる実施の形態において、グループのオブジェクトパラメータは、符号化されたオーディオ信号に適用されるべきマトリクスを得るために分離して扱われる。
【0017】
1つの実施の形態において、装置は、符号化されたオーディオ信号の復号器である。装置は、代わりの実施の形態において、復号器の一部である。
【0018】
1つの実施の形態において、個々のダウンミックス信号はダウンミックス信号の1つのグループに帰され、その結果、少なくとも1つの処理ステップについて個々に処理される。この実施の形態において、ダウンミックス信号のグループの数は、ダウンミックス信号の数と等しい。これは、分類と個々の処理とが一致することを暗示している。
【0019】
1つの実施の形態において、結合は、符号化されたオーディオ信号の処理の最終的なステップの1つである。異なる実施の形態において、分類結果は、分類結果に対して、個々に又は一緒に実行される異なる処理ステップに更に従う。
【0020】
分類(または、グループの検出)およびグループの個々の取り扱いは、オーディオ品質改良をもたらすことを示す。これは、特に、例えばパラメトリック符号化技術のために維持する。
【0021】
実施の形態によると、装置の分類器は、ダウンミックス信号のそれぞれのグループ内のダウンミックス信号の数を最小化しながら、複数のダウンミックス信号グループに、複数のダウンミックス信号を分類するように構成される。この実施の形態において、装置は、個々のグループに属するダウンミックス信号の数を減らそうとする。1つのケースにおいて、ダウンミックス信号の少なくとも1つのグループに、ちょうど1つのダウンミックス信号が属する。
【0022】
実施の形態によると、分類器は、1つのダウンミックス信号グループには1つの単一のダウンミックス信号しか属さないように、前記複数のダウンミックス信号を前記複数のダウンミックス信号グループに分類するように構成されている。すなわち、分類は、ダウンミックス信号の様々なグループをもたらし、ちょうど1つのダウンミックス信号が属する少なくとも1つのダウンミックス信号のグループが与えられる。従って、ダウンミックス信号の少なくとも1つのグループは、ちょうど1つの単一のダウンミックス信号に関連する。別の実施の形態において、ちょうど1つのダウンミックス信号が属するダウンミックス信号のグループの数は、最大化される。
【0023】
1つの実施の形態において、装置の分類器は、符号化されたオーディオ信号内の情報に基づいて、複数のダウンミックス信号を、複数のダウンミックス信号グループに分類するように構成されている。別の実施の形態において、装置は、ダウンミックス信号を分類するために符号化されたオーディオ信号内の情報だけを使う。符号化されたオーディオ信号のビットストリーム内の情報を使うことは、−1つの実施の形態の中で−相互関係または共分散情報を考慮することを含む。分類器は、特に、異なる入力オーディオ・オブジェクトの間の関係についての情報を、符号化されたオーディオ信号から取り出す。
【0024】
1つの実施の形態において、分類器は、前記複数のダウンミックス信号を、前記符号化されたオーディオ信号内のbsRelatedTo値に基づいて、複数のダウンミックス信号グループに分類するように構成される。これらの値に関係することは、例えばWO 2011/039195 A1に関連する。
【0025】
実施の形態によると、分類器は、複数のダウンミックス信号を、少なくとも以下のステップを(ダウンミックス信号の個々のグループに)適用して、複数のダウンミックス信号グループに分類するように構成される。
・ダウンミックス信号が、ダウンミックス信号の既存のグループに割り当てられるか否かを検出するステップ。
・ダウンミックス信号と関連付けられた複数の入力オーディオ・オブジェクトの少なくとも1つの入力オーディオ・オブジェクトが、ダウンミックス信号の既存のグループと関連付けられた入力オーディオ・オブジェクトのセットの一部であるか否かを検出するステップ。
・ダウンミックス信号がダウンミックス信号の既存のグループに割り当てがない(ゆえに、既にダウンミックス信号はグループに割り当てられていない)場合に、および、ダウンミックス信号と関連付けられた複数の入力オーディオ・オブジェクトのすべての入力オーディオ・オブジェクトが、ダウンミックス信号の既存のグループと関連がない(ゆえに、既にダウンミックス信号の入力オーディオ・オブジェクトが、−異なるダウンミックス信号を経て−グループに割り当てられていない)場合に、ダウンミックス信号を新しいダウンミックス信号グループに割り当てるステップ。
・ダウンミックス信号が、ダウンミックス信号の既存のグループと関連する場合、または、ダウンミックス信号と関連付けられた複数の入力オーディオ・オブジェクトの少なくとも1つの入力オーディオ・オブジェクトが、ダウンミックス信号の既存のグループと関連する場合のいずれかの場合に、ダウンミックス信号をダウンミックス信号の既存のグループに結合するステップ。
【0026】
仮にまた、符号化されたオーディオ信号において信号で伝えられた関係が考慮されるならば、ダウンミックス信号を割り当てて結合するための付加要件をもたらす別の検出ステップが追加される。
【0027】
実施の形態によると、プロセッサは、分類結果として個々のマトリクスを提供するために、入力オーディオ・オブジェクトのそれぞれのセットの(または、ダウンミックス信号のそれぞれのグループの)オブジェクトパラメータ(E
k)に対して様々な処理ステップを個々に実行するように構成される。結合器は、前記復号化されたオーディオ信号を提供するために、個々のマトリクスを結合するように構成される。オブジェクトパラメータ(E
k)は、インデックスkによってダウンミックス信号の個々のグループの入力オーディオ・オブジェクトに属し、インデックスkを持つこのグループのための個々のマトリクスを得るように処理される。
【0028】
異なる実施の形態によると、プロセッサは、分類結果として出力オーディオ信号を提供するために、前記複数のダウンミックス信号のグループのそれぞれのグループについて様々な処理ステップを個々に実行するように構成される。結合器は、前記復号化されたオーディオ信号を提供するために、出力オーディオ信号を結合するように構成される。
【0029】
この実施の形態において、ダウンミックス信号のグループは、ダウンミックス信号のそれぞれのグループに属している入力オーディオ・オブジェクトに対応する出力オーディオ信号が得られるように、処理される。ゆえに、出力オーディオ信号を復号化されたオーディオ信号に結合することは、符号化されたオーディオ信号に対して実行された復号化処理の最終的なステップに近い。従って、この実施の形態では、ダウンミックス信号のそれぞれのグループは、ダウンミックス信号のグループの検出に続いている全ての処理ステップに個々に従う。
【0030】
異なる実施の形態において、プロセッサは、分類結果として処理された信号を提供するために、前記複数のダウンミックス信号のグループのそれぞれのグループについて少なくとも1つの処理ステップを個々に実行するように構成される。装置は、出力オーディオ信号を提供するために、前記処理された信号を一緒に処理するように構成されたポストプロセッサをさらに含む。結合器は、前記復号化されたオーディオ信号を提供するために、処理された分類結果として出力オーディオ信号を結合するように構成される。
【0031】
この実施の形態において、ダウンミックス信号のグループは、少なくとも1つの処理ステップに個々に従い、そして、他のグループと一緒に少なくとも1つの処理ステップに従う。個別の処理は、−実施の形態において−一緒に処理される処理された信号をもたらす。
【0032】
1つの実施の形態において、マトリクスに関連して、プロセッサは、個々のマトリクスを提供するために、入力オーディオ・オブジェクトのそれぞれのセットのオブジェクトパラメータ(E
k)に対して、少なくとも1つの処理ステップを個々に実行するように構成される。装置に含まれたポストプロセッサは、少なくとも1つのオーバーオール・マトリクスを提供するために、オブジェクトパラメータを一緒に処理するように構成される。結合器は、前記個々のマトリクスと前記少なくとも1つのオーバーオール・マトリクスとを結合するように構成される。1つの実施の形態において、ポストプロセッサは、少なくとも1つのオーバーオール・マトリクスを得るために、個々のマトリクスに対して少なくとも1つの処理ステップを一緒に実行する。
【0033】
以下の実施の形態は、プロセッサによって実行された処理ステップに関連する。また、これらのステップのいくつかは、前述の実施の形態において言及されたポストプロセッサに適している。
【0034】
1つの実施の形態において、プロセッサは、前記複数のダウンミックス信号のグループのそれぞれのグループのダウンミックス信号をミックスしないように構成された非ミキサーを含む。ダウンミックス信号をミックスしないことによって、プロセッサは、ダウンミックス信号の中にダウンミックスされたオリジナル入力オーディオ・オブジェクトの表現を得る。
【0035】
実施の形態によると、非ミキサーは、最小平均2乗エラー(MMSE)アルゴリズムに基づいて、前記複数のダウンミックス信号のグループの個々のグループのダウンミックス信号をミックスしないように構成される。そのようなアルゴリズムは以下の記載において説明される。
【0036】
異なる実施の形態において、プロセッサは、個々の非ミックスマトリクスを提供するために、それぞれの入力オーディオ・オブジェクトのセットのオブジェクトパラメータを個々に処理するように構成された非ミキサーを含む。
【0037】
1つの実施の形態において、プロセッサは、ダウンミックス信号の個々のグループと関連付けられた入力オーディオ・オブジェクトのセットの入力オーディオ・オブジェクトの数と、ダウンミックス信号の個々のグループに属しているダウンミックス信号の数との少なくとも1つにサイズが依存しているダウンミックス信号マトリクスのそれぞれのグループのために個々に計算するように構成された計算機を含む。ダウンミックス信号のグループはダウンミックス信号の全体のアンサンブルより小さく、かつ、ダウンミックス信号のグループは入力オーディオ信号のより小さい数に関連するので、ダウンミックス信号のグループの処理のために使われたマトリクスは、従来の技術において用いられたこれらより小さい。これは計算を容易にする。
【0038】
実施の形態によると、計算機は、個々の非ミックス化マトリクスに対して、ダウンミックス信号の個々のグループ内の最大エネルギー値に基づいて、個々の閾値を計算するように構成される。
【0039】
実施の形態によると、プロセッサは、ダウンミックス信号の個々のグループについて、ダウンミックス信号の個々のグループ内の最大エネルギー値に基づいて、個々の閾値を個々に計算するように構成される。
【0040】
1つの実施の形態において、計算機は、それぞれのダウンミックス信号のグループのダウンミックス信号を非ミックス化するための正規化ステップに対して、個々のダウンミックス信号のグループ内の最大エネルギー値に基づいて、個々の閾値を計算するように構成される。ダウンミックス信号のグループのための閾値は、異なる実施の形態において非ミキサー自身により計算される。
【0041】
以下の議論は、すべてのダウンミックス信号のためではなく、グループ(1つのグループごとに1つの閾値)のための閾値を計算することの興味深い効果を示す。
【0042】
実施の形態によると、プロセッサは、レンダリングされた信号を提供するために、前記復号化されたオーディオ信号の出力状況に対して、個々のグループの非ミックスされたダウンミックス信号をレンダリングするように構成されたレンダリング器を含む。レンダリング化は、聴取者から提供された入力に基づいて、または、実際の出力状況についてのデータに基づいている。
【0043】
実施の形態において、プロセッサは、少なくとも1つのレンダリングマトリクスを提供するために、オブジェクトパラメータを処理するように構成されたレンダリング器を含む。
【0044】
プロセッサは、実施の形態において、少なくとも1つの非相関マトリクスを提供するために、オブジェクトパラメータを処理するように構成されたポストミキサーを含む。
【0045】
実施の形態によると、プロセッサは、前記レンダリングされた信号に対して少なくとも1つの非相関ステップを実行するように構成され、かつ、実行された非相関ステップの結果(Y
wet)を、前記個々のレンダリングされた信号(Y
dry)と結合するように構成されたポストミキサーを含む。
【0046】
実施の形態によると、プロセッサは、それぞれのダウンミックス信号のグループについて、個々のダウンミックス化マトリクス(D
k)を決定するように構成される。kは、個々のグループのインデックスである。プロセッサは、それぞれのダウンミックス信号のグループについて、個々のグループ共分散マトリクス(E
k)を決定するように構成される。プロセッサは、それぞれのダウンミックス信号のグループについて、個々のダウンミックス化マトリクス(D
k)および個々のグループ共分散マトリクス(E
k)に基づいて、個々のグループダウンミックス共分散マトリクス(Δ
k)を決定するように構成される。プロセッサは、それぞれのダウンミックス信号のグループについて、個々の正規化された逆グループマトリクス(J
k)を決定するように構成される。
【0047】
実施の形態によると、結合器は、個々の正規化された逆グループマトリクス(J
k)を結合して、オーバーオールの正規化された逆グループマトリクス(J)を得るように構成される。
【0048】
実施の形態によると、プロセッサは、ダウンミックス信号のそれぞれのグループについて、個々のダウンミックス化マトリクス(D
k)と個々のグループ共分散マトリクス(E
k)と個々の正規化された逆グループマトリクス(J
k)に基づいて、個々のグループ・パラメトリック非ミックス化マトリクス(U
k)を決定するように構成される。結合器は、個々のグループ・パラメトリック非ミックス化マトリクス(U
k)を結合して、オーバーオールのグループ・パラメトリック非ミックス化マトリクス(U)を得るように構成される。
【0049】
実施の形態によると、プロセッサは、ダウンミックス信号のそれぞれのグループについて、個々のダウンミックス化マトリクス(D
k)と個々のグループ共分散マトリクス(E
k)と個々の正規化された逆グループマトリクス(J
k)に基づいて、個々のグループ・パラメトリック非ミックス化マトリクス(U
k)を決定するように構成される。結合器は、個々のグループ・パラメトリック非ミックス化マトリクス(U
k)を結合して、オーバーオールのグループ・パラメトリック非ミックス化マトリクス(U)を得るように構成される。
【0050】
実施の形態によると、プロセッサは、ダウンミックス信号のそれぞれのグループについて、個々のグループレンダリング化マトリクス(R
k)を決定するように構成される。
【0051】
実施の形態によると、プロセッサは、ダウンミックス信号のそれぞれのグループについて、個々のグループレンダリング化マトリクス(R
k)と個々のグループ・パラメトリック非ミックス化マトリクス(U
k)に基づいて、個々のアップミックス化マトリクス(R
kU
k)を決定するように構成される。結合器は、アップミックス化マトリクス(R
kU
k)を結合して、オーバーオールのアップミックス化マトリクス(RU)を得るように構成される。
【0052】
実施の形態によると、プロセッサは、ダウンミックス信号のそれぞれのグループについて、個々のグループレンダリング化マトリクス(R
k)と個々のグループ共分散マトリクス(E
k)に基づいて、個々のグループ共分散マトリクス(C
k)を決定するように構成される。結合器は、個々のグループ共分散マトリクス(C
k)を結合して、オーバーオールのグループ共分散マトリクス(C)を得るように構成される。
【0053】
実施の形態によると、プロセッサは、個々のグループレンダリング化マトリクス(R
k)と個々のグループ・パラメトリック非ミックス化マトリクス(U
k)と個々のダウンミックス化マトリクス(D
k)と個々のグループ共分散マトリクス(E
k)とに基づいて、パラメトリック的に推定された信号の個々のグループ共分散マトリクス(E
ydry)
kを決定するように構成される。結合器は、パラメトリック的に推定された信号の個々のグループ共分散マトリクス(E
ydry)
kを結合して、オーバーオールのパラメトリック的に推定された信号のE
ydryを得るように構成される。
【0054】
実施の形態によると、プロセッサは、ダウンミックス共分散マトリクス(E
DMX)の特異値分解に基づいて、正規化された逆マトリクス(J)を決定するように構成される。
【0055】
実施の形態によると、プロセッサは、パラメトリック非ミックス化マトリクス(U)の決定のために、ダウンミックス信号の(インデックスkをもつ)個々のグループに割り当てられたダウンミックス信号(m,n)に対応している要素(Δ(m,n))を選択することによって、サブマトリクス(Δ
k)を決定するように構成される。ダウンミックス信号のそれぞれのグループは、ダウンミックス信号の特定の数および入力オーディオ・オブジェクトの関連付けられたセットをカバーし、インデックスkによってここで示される。
【0056】
この実施の形態によると、個々のサブマトリクス(Δ
k)は、個々のグループkに属するダウンミックス共分散マトリクスΔから要素を選ぶこと、または抜き取ることによって得られる。
【0057】
1つの実施の形態において、個々のサブマトリクス(Δ
k)は個々に逆にされ、結果は正規化された逆マトリクス(J)の中で結合される。
【0058】
異なる実施の形態において、サブマトリクス(Δ
k)は、個々のダウンミックス化マトリクス(D
k)によって、Δ
k=D
kE
kD
k*としてそれらの定義を使って得られる。
【0059】
実施の形態によると、結合器は、ダウンミックス信号のそれぞれのグループについて、個々に決定されたマトリクスに基づいて、ポストミックス化マトリクス(P)を決定するように構成される。結合器は、復号化されたオーディオ信号を得るために、ポストミックス化マトリクス(P)を複数のダウンミックス信号に適用するように構成される。この実施の形態において、オブジェクトパラメータから、符号化されたオーディオ信号に適用されるポストミックス化マトリクスが、復号化されたオーディオ信号を得るために計算される。
【0060】
【0061】
この点において、kはダウンミックス信号の個々のグループのグループインデックスを示す。N
kは、入力オーディオ・オブジェクトの関連付けられたセットの入力オーディオ・オブジェクトの数を示す。M
kは、ダウンミックス信号の個々のグループに属するダウンミックス信号の数を示す。N
outは、アップミックスまたはレンダリングされた出力チャネルの数を示す。
【0062】
計算されたマトリクスは、従来技術において用いられたより小さいサイズである。従って、1つの実施の形態において、可能な限り多くの処理ステップが、ダウンミックス信号のグループについて個々に実行される。
【0063】
本発明の目的は、また、符号化されたオーディオ信号を処理するための対応する方法により達成される。符号化されたオーディオ信号は、複数の入力オーディオ・オブジェクトおよびオブジェクトパラメータに関連付けられた複数のダウンミックス信号を含む。方法は以下のステップを含む。
・ダウンミックス信号を、複数の入力オーディオ・オブジェクトの入力オーディオ・オブジェクトのセットと関連付けられた複数のダウンミックス信号グループに分類するステップ
・分類結果を提供するために、入力オーディオ・オブジェクトのそれぞれのセットのオブジェクトパラメータに対して、少なくとも1つの処理ステップを個々に実行するステップ
・復号化されたオーディオ信号を提供するために、前記分類結果を結合するステップ
【0064】
分類は、少なくとも複数の入力オーディオ・オブジェクトのそれぞれの入力オーディオ・オブジェクトが、入力オーディオ・オブジェクトのちょうど1つのセットに属する圧縮によって実行される。
【0065】
装置の上記実施の形態は、また、方法および方法の対応する実施の形態のステップによって実行される。従って、装置の実施の形態のために与えられた説明は、方法に対しても維持される。
【0066】
本発明は以下において付随図面に関して記載され、実施の形態は付随図面の中で説明される。