IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオの特許一覧

特許7156986無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム
<>
  • 特許-無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム 図1
  • 特許-無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム 図2
  • 特許-無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム 図3
  • 特許-無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム 図4
  • 特許-無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム 図5
  • 特許-無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム 図6
  • 特許-無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム 図7
  • 特許-無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-11
(45)【発行日】2022-10-19
(54)【発明の名称】無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム
(51)【国際特許分類】
   G10L 19/008 20130101AFI20221012BHJP
【FI】
G10L19/008 100
【請求項の数】 16
(21)【出願番号】P 2019056076
(22)【出願日】2019-03-25
(62)【分割の表示】P 2017163479の分割
【原出願日】2014-07-17
(65)【公開番号】P2019135547
(43)【公開日】2019-08-15
【審査請求日】2019-03-25
【審判番号】
【審判請求日】2021-05-06
(31)【優先権主張番号】13177375.6
(32)【優先日】2013-07-22
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】13189309.1
(32)【優先日】2013-10-18
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】591037214
【氏名又は名称】フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】100079577
【弁理士】
【氏名又は名称】岡田 全啓
(72)【発明者】
【氏名】ディック サッシャ
(72)【発明者】
【氏名】ヘルムリッヒ クリスティアン
(72)【発明者】
【氏名】ヒルペアト ジョーハン
(72)【発明者】
【氏名】ヘルツァー アンドレーアス
【合議体】
【審判長】千葉 輝久
【審判官】樫本 剛
【審判官】渡辺 努
(56)【参考文献】
【文献】特開2013-50540(JP,A)
【文献】特表2008-530616(JP,A)
【文献】特開2009-42734(JP,A)
【文献】特開2012-73351(JP,A)
【文献】特開平6-250696(JP,A)
【文献】米国特許出願公開第2011/0096932(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00 - 19/26
H04S 1/00 - 7/00
(57)【特許請求の範囲】
【請求項1】
マルチチャンネルオーディオ信号(110)の符号化表現(112)を提供するためのマルチチャンネルオーディオエンコーダ(100)であって、
前記マルチチャンネルオーディオエンコーダは、前記マルチチャンネルオーディオ信号に基づいてダウンミックス信号(122)を取得し、前記マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータ(124)を提供し、残差信号(126)を提供するように構成され、
前記マルチチャンネルオーディオエンコーダは、前記マルチチャンネルオーディオ信号がトーンである周波数バンドについて、前記残差信号を前記符号化表現に選択的に含めるように構成される、
マルチチャンネルオーディオエンコーダ。
【請求項2】
前記マルチチャンネルオーディオエンコーダは、前記残差信号のバンド幅を前記マルチチャンネルオーディオ信号に応じて変化させるように構成される、請求項1に記載のマルチチャンネルオーディオエンコーダ。
【請求項3】
前記マルチチャンネルオーディオエンコーダは、前記残差信号が前記符号化表現に含まれる周波数バンドを前記マルチチャンネルオーディオ信号に応じて選択するように構成される、請求項1に記載のマルチチャンネルオーディオエンコーダ。
【請求項4】
前記マルチチャンネルオーディオエンコーダは、前記ダウンミックス信号を形成した結果、前記マルチチャンネルオーディオ信号の信号成分がキャンセルされた時間部分および/または周波数バンドについて、前記残差信号を前記符号化表現に選択的に含めるように構成される、請求項1~3のいずれかに記載のマルチチャンネルオーディオエンコーダ。
【請求項5】
前記マルチチャンネルオーディオエンコーダは、前記ダウンミックス信号において前記マルチチャンネルオーディオ信号の信号成分がキャンセルされたことを検出するように構成され、前記マルチチャンネルオーディオエンコーダは、前記検出の結果に応答して、前記残差信号の提供をアクティベートするように構成される、請求項4に記載のマルチチャンネルオーディオエンコーダ。
【請求項6】
前記マルチチャンネルオーディオエンコーダは、前記マルチチャンネルオーディオ信号の少なくとも2つのチャンネル信号の線形結合を用いて、かつマルチチャンネルデコーダ側で用いられるアップミックス係数に応じて、前記残差信号を算出するように構成される、請求項1~5のいずれかに記載のマルチチャンネルオーディオエンコーダ。
【請求項7】
前記マルチチャンネルオーディオエンコーダは、前記アップミックス係数を決定し、符号化する、または、前記マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータから前記アップミックス係数を導き出す、
ように構成される、請求項6に記載のマルチチャンネルオーディオエンコーダ。
【請求項8】
前記マルチチャンネルオーディオエンコーダは、音響心理学モデルを用いて、前記符号化表現に含まれる前記残差信号の量を時間変数として決定するように構成される、請求項1~7のいずれかに記載のマルチチャンネルオーディオエンコーダ。
【請求項9】
前記マルチチャンネルオーディオエンコーダは、現在利用可能なビットレートに応じて、前記符号化表現に含まれる前記残差信号の量を時間変数として決定するように構成される、請求項1~8のいずれかに記載のマルチチャンネルオーディオエンコーダ。
【請求項10】
マルチチャンネルオーディオ信号の符号化表現を提供するための方法(400)であって、
前記マルチチャンネルオーディオ信号に基づいてダウンミックス信号を取得するステップ(410)と、
前記マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータを提供するステップ(420)と、
残差信号を提供するステップ(430)と、を含み、
前記残差信号は、前記マルチチャンネルオーディオ信号がトーンである周波数バンドについて、前記符号化表現に選択的に含まれる、
方法。
【請求項11】
コンピュータプログラムがコンピュータ上で動作するときに、請求項10に記載の方法を実行する、コンピュータプログラム。
【請求項12】
マルチチャンネルオーディオ信号(110)の符号化表現(112)を提供するためのマルチチャンネルオーディオエンコーダ(100)であって、
前記マルチチャンネルオーディオエンコーダは、前記マルチチャンネルオーディオ信号に基づいてダウンミックス信号(122)を取得し、前記マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータ(124)を提供し、残差信号(126)を提供するように構成され、
前記マルチチャンネルオーディオエンコーダは、前記ダウンミックス信号を形成した結果、前記マルチチャンネルオーディオ信号の信号成分がキャンセルされた時間部分および/または周波数バンドについて、前記残差信号を前記符号化表現に選択的に含めるように構成される、
マルチチャンネルオーディオエンコーダ。
【請求項13】
マルチチャンネルオーディオ信号(110)の符号化表現(112)を提供するためのマルチチャンネルオーディオエンコーダ(100)であって、
前記マルチチャンネルオーディオエンコーダは、前記マルチチャンネルオーディオ信号に基づいてダウンミックス信号(122)を取得し、前記マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータ(124)を提供し、残差信号(126)を提供するように構成され、
前記マルチチャンネルオーディオエンコーダは、前記符号化表現(112)に含まれる前記残差信号(126)の強度またはエネルギーを、現在利用可能なビットレートに従って、時間変数として決定するように構成される、および/または
前記マルチチャンネルオーディオエンコーダは、前記残差信号が、どの周波数バンドについておよび/またはいくつの周波数バンドについて、前記符号化表現に含まれるかを、現在利用可能なビットレートに従って、時間変数として決定するように構成される、
マルチチャンネルオーディオエンコーダ。
【請求項14】
マルチチャンネルオーディオ信号の符号化表現を提供するための方法(400)であって、
前記マルチチャンネルオーディオ信号に基づいてダウンミックス信号を取得するステップ(410)と、
前記マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータを提供するステップ(420)と、
残差信号を提供するステップ(430)と、を含み、
前記方法は、前記ダウンミックス信号を形成した結果、前記マルチチャンネルオーディオ信号の信号成分がキャンセルされた時間部分および/または周波数バンドについて、前記残差信号を前記符号化表現に選択的に含めるステップを含む、
方法。
【請求項15】
マルチチャンネルオーディオ信号の符号化表現を提供するための方法(400)であって、
前記マルチチャンネルオーディオ信号に基づいてダウンミックス信号を取得するステップ(410)と、
前記マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータを提供するステップ(420)と、
残差信号を提供するステップ(430)と、を含み、
前記符号化表現(112)に含まれる前記残差信号(126)の強度またはエネルギーについて、現在利用可能なビットレートに従って時間変数として決定される、および/または
前記残差信号が、どの周波数バンドについて、および/またはいくつの周波数バンドについて、前記符号化表現に含まれるかが、現在利用可能なビットレートに従って、時間変数として決定される、
方法。
【請求項16】
コンピュータプログラムがコンピュータ上で動作するとき、請求項14または15に記載の方法を実行する、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明に係る実施形態は、符号化表現に基づいて、少なくとも2つの出力オーディオ信号を提供するマルチチャンネルオーディオデコーダに関する。
【0002】
本発明に係る他の実施形態は、マルチチャンネルオーディオ信号の符号化表現を提供するマルチチャンネルオーディオエンコーダに関する。
【0003】
本発明に係る他の実施形態は、符号化表現に基づいて、少なくとも2つの出力オーディオ信号を提供する方法に関する。
【0004】
本発明に係る他の実施形態は、マルチチャンネルオーディオ信号の符号化表現を提供する方法に関する。
【0005】
本発明に係る他の実施形態は、上記方法の1つを実行するコンピュータプログラムに関する。
【0006】
一般に、本発明に係るいくつかの実施形態は、結合された残差符号化とパラメトリック符号化に関する。
【背景技術】
【0007】
近年、オーディオコンテンツの記憶および伝送の要求は着実に増加している。さらに、オーディオコンテンツの記憶および伝送の品質要求も着実に増加している。したがって、オーディオコンテンツの符号化および復号化に対するコンセプトは強化されている。例えば、非特許文献1において記載されている、いわゆる「アドバンストオーディオ符号化」(AAC)が開発されている。
【0008】
さらに、例えば、非特許文献2において記載されている、例えばいわゆる「MPEGサラウンド」コンセプトなどのようないくつかの空間拡張が構築されている。さらに、いわゆる空間オーディオオブジェクト符号化に関する、オーディオ信号の空間情報の符号化および復号化に対する付加的な改善が非特許文献3において記載されている。さらに、いわゆる「統合されたスピーチとオーディオの符号化」コンセプトを記載する、良好な符号化効率で一般のオーディオ信号およびスピーチ信号の両方を符号化し、マルチチャンネルオーディオ信号をハンドリングする可能性を提供する、フレキシブルな(切り替え可能な)オーディオ符号化/復号化コンセプトが非特許文献4において定義されている。
【先行技術文献】
【非特許文献】
【0009】
【文献】国際標準ISO/IEC13818-7:2003
【文献】国際標準ISO/IEC23003-1:2007
【文献】国際標準ISO/IEC23003-2:2010
【文献】国際標準ISO/IEC23003-3:2012
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、マルチチャンネルオーディオ信号の効率的な符号化および復号化に対し
てより高度なコンセプトを提供する要求がある。
【課題を解決するための手段】
【0011】
本発明に係る実施形態は、符号化表現に基づいて、少なくとも2つの出力オーディオ信号を提供するマルチチャンネルオーディオデコーダを構築する。マルチチャンネルオーディオデコーダは、出力オーディオ信号の1つを取得するために、ダウンミックス信号と無相関化信号と残差信号との重み付け結合を実行するように構成される。マルチチャンネルオーディオデコーダは、残差信号に従って、重み付け結合における無相関化信号の寄与を記述する重みを決定するように構成される。
【0012】
本発明に係るこの実施形態は、ダウンミックス信号と無相関化信号と残差信号との重み付け結合に対する無相関化信号の寄与を記述する重みが残差信号に従って調整される場合に、出力オーディオ信号を符号化表現に基づいて非常に効率的な方法で取得することができるという発見に基づいている。したがって、重み付け結合における無相関化信号の寄与を記述する重みを残差信号に従って調整することによって、付加的な制御情報を送信することなしにパラメトリック符号化(または主にパラメトリック符号化)と残差符号化(または大部分が残差符号化)との間で混合する(またはフェードする)ことが可能である。さらに、残差信号が(比較的に)弱い(または所望のエネルギーの復元に対して不十分である)場合に、無相関化信号において(比較的に)高い重みをつけ、残差信号が(比較的に)強い(または所望のエネルギーの復元に対して十分である)場合に、無相関化信号において(比較的に)小さい重みをつけることが通常は好ましいので、符号化表現に含まれる残差信号は、重み付け結合における無相関化信号の寄与を記述する重みに対して良好な指示であることが分かっている。したがって、上述のコンセプトは、パラメトリック符号化(例えば、所望のエネルギー特性および/または相関特性がパラメータによってシグナリングされ、無相関化信号を加えることによって復元される)と、残差符号化(残差信号が、ダウンミックス信号に基づいて、出力オーディオ信号を-場合によっては出力オーディオ信号の波形をも-復元するために用いられる)と間で段階的な移行を許容する。したがって、復号化信号に対して、付加的なシグナリングのオーバーヘッドを有することなしに復元に対するテクニック、およびまた復元の品質を適合させることが可能である。
【0013】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、(また)無相関化信号に従って、重み付け結合における無相関化信号の寄与を記述する重みを決定するように構成される。残差信号と無相関化信号の両方に従って、重み付け結合における無相関化信号の寄与を記述する重みを決定することによって、符号化表現に基づいて(特に、ダウンミックス信号と無相関化信号と残差信号とに基づいて)、少なくとも2つの出力オーディオ信号の良好な品質の復元を達成することができるように、信号特性に対して重みを適切に調整することができる。
【0014】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、符号化表現に基づいてアップミックスパラメータを取得し、アップミックスパラメータに従って重み付け結合における無相関化信号の寄与を記述する重みを決定するように構成される。アップミックスパラメータを考慮することによって、所望の値を取るために、(例えば出力オーディオ信号間の所望の相関および/または出力オーディオ信号の所望のエネルギー特性のような)出力オーディオ信号の所望の特性を復元することが可能である。
【0015】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、無相関化信号の重みが1つ以上の残差信号のエネルギーの増加と共に低減するように、重み付け結合における無相関化信号の寄与を記述する重みを決定するように構成される。このメカニズムは、残差信号のエネルギーに従って少なくとも2つの出力オーディオ信号の復元の精度を調整することを可能にする。残差信号のエネルギーが比較的高い場合に、無相関化信号が残
差信号を用いることによって生じる再生の高い品質に有害な影響を及ぼさないように、無相関化信号の寄与の重みは比較的小さい。対照的に、残差信号のエネルギーが比較的に低いまたはゼロである場合に、無相関化信号が所望の値に対して出力オーディオ信号の特性を効率的にもたらすことができるように、高い重みが無相関化信号に対して与えられる。
【0016】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、残差信号のエネルギーがゼロである場合に、無相関化信号アップミックスパラメータによって決定される最大重みが無相関化信号に関連し、残差信号重み係数を用いて重み付けされる残差信号のエネルギーが残差信号アップミックスパラメータによって重み付けられる無相関化信号のエネルギーより大きいまたはそれに等しい場合に、ゼロ重みが無相関化信号に関連するように、重み付け結合における無相関化信号の寄与を記述する重みを決定するように構成される。この実施形態は、ダウンミックス信号に加えられるべき所望のエネルギーが、無相関化信号アップミックスパラメータによって重み付けされる無相関化信号のエネルギーによって決定されるという発見に基づいている。したがって、残差信号重み係数によって重み付けされる残差信号のエネルギーが、無相関化信号アップミックスパラメータによって重み付けされる無相関化信号のエネルギーより大きいまたはそれに等しい場合に、無相関化信号はもはや加える必要がないことが結論付けられる。言い換えれば、残差信号が充分なエネルギー(例えば、充分なトータルエネルギーに達するために充分な)を持っていると判断される場合に、少なくとも2つの出力オーディオ信号の提供に対して、無相関化信号はもはや用いられない。
【0017】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、無相関化信号の重み付けエネルギー値と残差信号の重み付けエネルギー値とに従ってファクタを決定し、そのファクタに基づいて(少なくとも)1つのオーディオ出力信号に対する無相関化信号の寄与を記述する重みを取得するために、1つ以上の無相関化信号アップミックスパラメータに従って重み付けされた無相関化信号の重み付けエネルギー値を演算し、1つ以上の残差信号アップミックスパラメータ(それは、上述の残差信号重み係数に等しくてもよい)を用いて重み付けされた残差信号の重み付けエネルギーを演算するように構成される。この手順は、1つ以上の出力オーディオ信号に対する無相関化信号の寄与を記述する重みの効率的な演算に対して、よく適合することが分かっている。
【0018】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、(少なくとも)1つの出力オーディオ信号に対する無相関化信号の寄与を記述する重みを取得するために、前記ファクタを無相関化信号アップミックスパラメータで乗算するように構成される。このような手順を用いて、重み付け結合における無相関化信号の寄与を記述する重みを決定するために、少なくとも2つの出力オーディオ信号の所望の信号特性を記述する1つ以上のパラメータ(それは無相関化信号アップミックスパラメータによって記述される)と、無相関化信号のエネルギーと残差信号のエネルギーとの関係の両方を考慮することが可能である。従って、出力オーディオ信号の所望の特性(それは無相関化信号アップミックスパラメータによって反映される)を考慮しながら、パラメトリック符号化(または主にパラメトリック符号化)と残差符号化(または主に残差符号化)との間で混合する(またはフェーディングする)両方の可能性がある。
【0019】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、無相関化信号の重み付けエネルギー値を取得するために、複数のアップミックスチャンネルと時間スロットにわたって、無相関化信号アップミックスパラメータを用いて重み付けられた無相関化信号のエネルギーを演算するように構成される。したがって、無相関化信号の重み付けエネルギー値の強い変化を回避することが可能である。従って、マルチチャンネルオーディオデコーダの安定な調整が達成される。
【0020】
同様に、マルチチャンネルオーディオデコーダは、残差信号の重み付けエネルギー値を取得するために、複数のアップミックスチャンネルと時間スロットにわたって、残差信号アップミックスパラメータを用いて重み付けられた残差信号のエネルギーを演算するように構成される。したがって、残差信号の重み付けエネルギー値の強い変化が回避されるので、マルチチャンネルオーディオデコーダの安定な調整が達成される。しかしながら、平均化期間は、重み付けの動的な調整を可能とするために十分短く選択することができる。
【0021】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、無相関化信号の重み付けエネルギー値と残差信号の重み付けエネルギー値との差に従ってファクタを演算するように構成される。無相関化信号の重み付けエネルギー値と残差信号の重み付けエネルギー値を比較する演算は、無相関化信号(その重み付けバージョン)を用いて残差信号(または残差信号の重み付けバージョン)を補充することを可能とし、少なくとも2つのオーディオチャンネル信号の提供のニーズに対して無相関化信号の寄与を記述する重みが調整される。
【0022】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、無相関化信号の重み付けエネルギー値と残差信号の重み付けエネルギー値との差と、無相関化信号の重み付けエネルギー値との比率に従ってファクタを演算するように構成される。この比率に従ったファクタの演算は、長い特有の良好な結果をもたらすことが分かっている。さらに、この比率は、良好な聴覚印象を達成するために(または等価的に、残差信号がないケースと比較して、出力オーディオ信号に実質的に同じ信号エネルギーを持つために)、残差信号の存在において、無相関化信号(無相関化信号アップミックスパラメータを用いて重み付けられた)のトータルエネルギー値のどの部分が必要かを記述することに留意すべきである。
【0023】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、2つ以上の出力オーディオ信号に対する無相関化信号の寄与を記述する重みを決定するように構成される。この場合において、マルチチャンネルオーディオデコーダは、無相関化信号の重み付けエネルギー値と第1チャンネルの無相関化信号アップミックスパラメータに基づいて、第1の出力オーディオ信号に対する無相関化信号の寄与を決定するように構成される。さらに、マルチチャンネルオーディオデコーダは、無相関化信号の重み付けエネルギー値と第2チャンネルの無相関化信号アップミックスパラメータに基づいて、第2の出力オーディオチャンネルに対する無相関化信号の寄与を決定するように構成される。したがって、2つの出力オーディオ信号は、適度な労力と良好なオーディオ品質によって提供することができ、2つの出力オーディオ信号間の差は、第1チャンネルの無相関化信号アップミックスパラメータと第2チャンネルの無相関化信号アップミックスパラメータの使用によって考慮される。
【0024】
好ましい実施形態において、マルチチャンネルオーディオデコーダは、残差エネルギーが無相関化器のエネルギー(すなわち無相関化信号またはその重み付けバージョンのエネルギー)を超える場合に、重み付け結合に対する無相関化信号の寄与を無効にするように構成される。したがって、残差信号が充分なエネルギーを持ち、残差エネルギーが無相関化器のエネルギーを超える場合に、無相関化信号の使用なしに、純粋な残差符号化にスイッチすることが可能である。
【0025】
好ましい実施形態において、オーディオデコーダは、残差信号の重み付けエネルギー値のバンド毎の決定に従って、重み付け結合における無相関化信号の寄与を記述する重みをバンド毎に決定するように構成される。したがって、付加的なシグナリングのオーバーヘッドなしに、どの周波数バンドにおいて少なくとも2つの出力オーディオ信号の改善がパラメトリック符号化に基づくべきであるか(または主に基づくべきであるか)と、どの周
波数バンドにおいて少なくとも2つの出力オーディ信号の改善が残差符号化に基づくべきであるか(または主に基づくべきであるか)とをフレキシブルに決定することが可能である。従って、無相関化信号の重みを比較的小さく保ちながら、どの周波数バンドにおいて残差符号化を(少なくとも主に)用いて波形復元(または少なくとも部分的な波形復元)を実行すべきであるかをフレキシブルに決定することができる。従って、パラメトリック符号化(それは主に無相関化信号の供給に基づく)と、残差符号化(それは主に残差信号の供給に基づく)とを、選択的に適用することによって、良好なオーディオ品質を得ることが可能である。
【0026】
好ましい実施形態において、オーディオデコーダは、出力オーディオ信号の各フレームに対して、重み付け結合における無相関化信号の寄与を記述する重みを決定するように構成される。したがって、緻密なタイミング分解能を得ることができ、引き続くフレーム間で、パラメトリック符号化(または主にパラメトリック符号化)と残差符号化(または主に残差符号化)との間のフレキシブルなスイッチを可能とする。したがって、オーディオ信号の特性に対して、良好な時間分解能でオーディオ復号化を調整することができる。
【0027】
本発明に係る他の実施形態は、符号化表現に基づいて、少なくとも2つの出力オーディオ信号を提供するマルチチャンネルオーディオデコーダを構築する。マルチチャンネルオーディオデコーダは、ダウンミックス信号の符号化表現と複数の符号化された空間パラメータと残差信号の符号化表現とに基づいて、(少なくとも)1つの出力オーディオ信号を取得するように構成される。マルチチャンネルオーディオデコーダは、残差信号に従って、パラメトリック符号化と残差符号化との間で混合するように構成される。したがって、付加的なシグナリングなしに、最良の復号化モード(パラメトリック符号化・復号化-対-残差符号化・復号化)を選択することができる非常にフレキシブルなオーディオ復号化コンセプトが達成される。さらに、上述された考察も適用される。
【0028】
本発明に係る実施形態は、マルチチャンネルオーディオ信号の符号化表現を提供するマルチチャンネルオーディオエンコーダを構築する。マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号に基づいて、ダウンミックス信号を取得するように構成される。さらに、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータを提供し、残差信号を提供するように構成される。さらに、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号に従って、符号化表現に含まれる残差信号の量を変化させるように構成される。符号化表現に含まれる残差信号の量を変化させることによって、信号の特性に対して符号化プロセスをフレキシブルに調整することができる。例えば、復号化オーディオ信号の波形を少なくとも部分的に保存することが望ましい部分(例えば、時間的部分および/または周波数部分)に対して、符号化表現に比較的大きな量の残差信号を含むことが可能である。従って、符号化表現に含まれる残差信号の量を変化させる可能性によって、マルチチャンネルオーディオ信号のより正確な残差信号ベースの復元が可能となる。さらに、上述のマルチチャンネルオーディオデコーダは(主に)パラメトリック符号化と(主に)残差符号化との間の混合に対して、付加的なシグナリングさえ必要としないので、上述されたマルチチャンネルオーディオデコーダとの組み合わせにおいて、非常に効率的なコンセプトが構築されることに留意すべきである。したがって、ここで述べられたマルチチャンネルエンコーダは、上述されたマルチチャンネルオーディオエンコーダを用いることによって可能となる利点を利用することを可能とする。
【0029】
好ましい実施形態において、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号に従って残差信号のバンド幅を変化させるように構成される。したがって、残差信号が音響心理学的に最も重要な周波数バンドまたは周波数レンジを復元することを助けるように、残差信号を調整することが可能である。
【0030】
好ましい実施形態において、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号に従って、残差信号が符号化表現に含まれる周波数バンドを選択するように構成される。したがって、マルチチャンネルオーディオエンコーダは、どの周波数バンドに対して残差信号(残差信号が通常は少なくとも部分的波形復元に結果としてなる)を含むことが必要であるかまたは最も有益であるかを決定することができる。例えば、音響心理学的に有意な周波数バンドを考慮することができる。加えて、残差信号はオーディオデコーダにおける過渡的現象のレンダリングを改善することを通常は助けるので、過渡的なイベントの存在を考慮することもできる。さらに、どの量の残差信号が符号化表現に含まれるかを決定するために、利用可能なビットレートを考慮に入れることもできる。
【0031】
好ましい実施形態において、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号がトーンである周波数バンドに対して符号化表現に残差信号を選択的に含み、一方でマルチチャンネルオーディオ信号がトーンでない周波数バンドに対して符号化表現に残差信号の包含を除外するように構成される。この実施形態は、トーンの周波数バンドが特に高い品質で再生され、好ましくは少なくとも部分的に波形復元を用いる場合に、オーディオデコーダ側で得ることができるオーディオ品質を改善することができるという考察に基づいている。したがって、マルチチャンネルオーディオ信号がトーンである周波数バンドに対して、残差信号を符号化表現に選択的に含むことは、ビットレートとオーディオ品質との間の良好な妥協に結果としてなるので有益である。
【0032】
好ましい実施形態において、マルチチャンネルオーディオエンコーダは、ダウンミックス信号の形成がマルチチャンネルオーディオ信号の信号成分のキャンセルに結果としてなる時間部分および/または周波数バンドに対する符号化表現に残差信号を選択的に含むように構成される。マルチチャンネルオーディオ信号の成分のキャンセルがある場合に、ダウンミックス信号を形成するときに無相関化または予測でさえキャンセルされた信号成分を回復することができないので、ダウンミックス信号に基づいて複数のオーディオ信号を適切に復元することが困難であるまたは不可能でさえあることが分かっている。このようなケースにおいて、残差信号の使用は、復元されたマルチチャンネルオーディオ信号の有意の劣化を回避するために効果的な方法である。このように、このコンセプトは、(例えば、上述されたオーディオデコーダと組み合わせたとき)シグナリングの労力を回避すると共にオーディオ品質を改善することを助ける。
【0033】
好ましい実施形態において、マルチチャンネルオーディオエンコーダは、ダウンミックス信号におけるマルチチャンネルオーディオ信号の信号成分のキャンセルを検出するように構成され、マルチチャンネルオーディオデコーダは、検出の結果に応答して残差信号の提供をアクティベートするように構成される。したがって、悪いオーディオ品質を回避する効果的な方法がある。
【0034】
好ましい実施形態において、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号の少なくとも2つのチャンネル信号の線形結合とマルチチャンネルデコーダ側で用いられるアップミックス係数に関する従属性とを用いて残差信号を演算するように構成される。従って、残差信号は効率的な方法で演算され、マルチチャンネルオーディオデコーダ側でのマルチチャンネルオーディオ信号の復元に対してよく適合する。
【0035】
実施形態において、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータを用いてアップミックス係数を符号化する、またはマルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータからアップミックス係数を導き出すように構成される。したがって、残差信号の提供は、パラメトリック符号化に対しても用いられるパラメータに基づいて効率的に実
行することができる。
【0036】
好ましい実施形態において、マルチチャンネルオーディオエンコーダは、音響心理学モデルを用いて、符号化表現に含まれる残差信号の量を時間変数として決定するように構成される。したがって、比較的高い音響心理学的関連性を備えるマルチチャンネルオーディオ信号の部分(時間部分、または周波数部分、または時間-周波数部分)に対して、比較的高い量の残差信号を備えることができる一方、比較的低い音響心理学的関連性を有するマルチチャンネルオーディオ信号の時間部分または周波数部分または時間-周波数部分に対して、(比較的)より小さい量の残差信号を含むことができる。したがって、ビットレートとオーディオ品質との間の良好なトレードオフを達成することができる。
【0037】
好ましい実施形態において、マルチチャンネルオーディオエンコーダは、現在利用可能なビットレートに従って、符号化表現に含まれる残差信号の量を時間変数として決定するように構成される。したがって、オーディオ品質は、利用可能なビットレートに適合することができ、現在利用可能なビットレートに対して考えられる最良のオーディオ品質を得ることを可能とする。
【0038】
本発明に係る実施形態は、符号化表現に基づいて、少なくとも2つの出力オーディオ信号を提供する方法を構築する。その方法は、出力オーディオ信号の1つを取得するために、ダウンミックス信号と無相関化信号と残差信号との重み付け結合を実行するステップを備える。重み付け結合における無相関化信号の寄与を記述する重みは、残差信号に従って決定される。この方法は、上述のオーディオデコーダと同じ考察に基づいている。
【0039】
本発明に係る他の実施形態は、符号化表現に基づいて、少なくとも2つの出力オーディオ信号を提供する方法を構築する。その方法は、ダウンミックス信号の符号化表現と複数の符号化された空間パラメータと残差信号の符号化表現とに基づいて、(少なくとも)2つの出力オーディオ信号を取得するステップを備える。混合(またはフェーディング)は、残差信号に従って、パラメトリック符号化と残差符号化との間で実行される。この方法も、上述のオーディオデコーダと同じ考察に基づいている。
【0040】
本発明に係る他の実施形態は、マルチチャンネルオーディオ信号の符号化表現を提供する方法を構築する。その方法は、マルチチャンネルオーディオ信号に基づいてダウンミックス信号を取得するステップと、マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータを提供するステップと、残差信号を提供するステップとを備える。符号化表現に含まれる残差信号の量は、マルチチャンネルオーディオ信号に従って変化させられる。この方法は、上述のオーディオエンコーダと同じ考察に基づいている。
【0041】
本発明に係る更なる実施形態は、本願明細書に記載された方法を実行するコンピュータプログラムを構築する。
【図面の簡単な説明】
【0042】
本発明に係る実施形態は、以下の図面を参照して引き続いて記載される。
図1】本発明の一実施形態に係るマルチチャンネルオーディオエンコーダの概略ブロック図を示す。
図2】本発明の一実施形態に係るマルチチャンネルオーディオデコーダの概略ブロック図を示す。
図3】本発明の他の実施形態に係るマルチチャンネルオーディオデコーダの概略ブロック図を示す。
図4】本発明の一実施形態に係るマルチチャンネルオーディオ信号の符号化表現を提供する方法のフローチャートを示す。
図5】本発明の一実施形態に係る符号化表現を基づいて少なくとも2つの出力オーディオ信号を提供する方法のフローチャートを示す。
図6】本発明の他の実施形態に係る符号化表現に基づいて少なくとも2つの出力オーディオ信号を提供する方法のフローチャートを示す。
図7】本発明の一実施形態に係るデコーダのフロー図を示す。
図8】ハイブリッド残差デコーダの概略表現を示す。
【発明を実施するための形態】
【0043】
1. 図1に係るマルチチャンネルオーディオエンコーダ
【0044】
図1は、マルチチャンネル信号の符号化表現を提供するマルチチャンネルオーディオエンコーダ100の概略ブロック図を示す。
【0045】
マルチチャンネルオーディオエンコーダ100は、マルチチャンネルオーディオ信号110を受信し、それに基づいてマルチチャンネルオーディオ信号110の符号化表現112を提供するように構成される。マルチチャンネルオーディオエンコーダ100は、マルチチャンネルオーディオ信号を受信し、マルチチャンネルオーディオ信号110に基づいてダウンミックス信号122を取得するように構成された、プロセッサ(または処理デバイス)120を備える。プロセッサ120は、マルチチャンネルオーディオ信号110のチャンネル間の従属性を記述するパラメータ124を提供するように更に構成される。さらに、プロセッサ120は、残差信号126を提供するように構成される。さらにまた、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号110に従って、符号化表現112に含まれる残差信号の量を変化させるように構成された、残差信号処理130を備える。
【0046】
しかしながら、マルチチャンネルオーディオデコーダは、必ずしも分離したプロセッサ120と分離した残差信号処理130を備えることが必要でないことに留意すべきである。 むしろ、マルチチャンネルオーディオエンコーダがプロセッサ120と残差信号処理130の機能を実行するように何らかの方法で構成されれば充分である。
【0047】
マルチチャンネルオーディオエンコーダ100の機能に関して、マルチチャンネルオーディオ信号110のチャンネル信号は、通常はマルチチャンネル符号化を用いて符号化されることに留意する必要があり、符号化表現112は、(符号化された形で)ダウンミックス信号122と、マルチチャンネルオーディオ信号110のチャンネル(またはチャンネル信号)間の従属性を記述するパラメータ124と、残差信号126とを通常は備える。ダウンミックス信号122は、例えば、マルチチャンネルオーディオ信号のチャンネル信号の結合(例えば線形結合)に基づくことができる。しかしながら、ダウンミックス信号122は、マルチチャンネルオーディオ信号の複数のチャンネルに基づいて提供することができる。しかしながら、あるいは、2つ以上のダウンミックス信号は、マルチチャンネルオーディオ信号110のより大きな数のチャンネル信号(通常はダウンミックス信号の数より大きい)に関連することができる。パラメータ124は、マルチチャンネルオーディオ信号110のチャンネル(またはチャンネル信号)間の従属性(例えば、相関、共分散、レベル関係等)を記述することができる。したがって、パラメータ124は、オーディオデコーダ側でダウンミックス信号122に基づいてマルチチャンネルオーディオ信号110のチャンネル信号の復元されたバージョンを導き出す目的にかなう。この目的に対して、パラメータ124は、パラメトリック復号化を用いるオーディオエンコーダが1つ以上のダウンミックス信号122に基づいてチャンネル信号を復元することができるように、マルチチャンネルオーディオ信号のチャンネル信号の所望の特性(例えば、個々の特性または相対的な特性)を記述する。
【0048】
加えて、マルチチャンネルオーディオデコーダ100は、マルチチャンネルオーディオエンコーダの予想または推定によって、ダウンミックス信号122とパラメータ124に基づいてオーディオデコーダ(例えば、特定の処理ルールに従ったオーディオデコーダ)によって復元することができない信号成分を通常は表す残差信号126を提供する。したがって、残差信号126は、通常はオーディオデコーダ側での波形復元、または少なくとも部分的な波形復元を可能とする改善信号とみなすことができる。
【0049】
しかしながら、マルチチャンネルオーディオエンコーダ100は、マルチチャンネルオーディオ信号110に従って、符号化表現112に含まれる残差信号の量を変化させるように構成される。言い換えれば、マルチチャンネルオーディオエンコーダは、例えば、符号化表現112に含まれる残差信号126の強度(またはエネルギー)について決定することができる。加えてまたはあるいは、マルチチャンネルオーディオエンコーダ100は、どの周波数バンドに対しておよび/またはいくつの周波数バンドに対して残差信号が符号化表現112に含まれるかを決定することができる。マルチチャンネルオーディオ信号に従って(および/または利用可能なビットレートに従って)、符号化表現112に含まれる残差信号126の「量」を変化させることによって、マルチチャンネルオーディオエンコーダ100は、符号化表現112に基づいてオーディオデコーダ側でマルチチャンネルオーディオ信号110のチャンネル信号をどの精度で復元することができるかについてフレキシブルに決定することができる。従って、マルチチャンネルオーディオ信号110のチャンネル信号を復元することができる精度は、マルチチャンネルオーディオ信号110のチャンネル信号の異なる信号部分(例えば、時間部分、周波数部分および/または時間/周波数部分のような)の音響心理学的関連性に対して適合させることができる。従って、高い音響心理学的関連性の信号部分(例えば、トーン信号部分または過渡的イベントを備える部分)は、「大量」の残差信号126を符号化表現に含むことによって、特に高い分解能で符号化することができる。例えば、高い音響心理学的関連性の信号部分に対して、比較的高いエネルギーを有する残差信号が符号化表現112に含まれることを達成することができる。さらに、ダウンミックス信号122が「低品質」を含む場合、例えば、マルチチャンネルオーディオ信号112のチャンネル信号をダウンミックス信号122に結合するときに、信号成分の実質的なキャンセルがある場合に、高いエネルギーの残差信号が符号化表現112に含まれることを達成することができる。言い換えれば、マルチチャンネルオーディオデコーダ100は、比較的大きい量の残差信号の提供が復元チャンネル信号(オーディオデコーダ側で復元される)の有意の改善をもたらすマルチチャンネルオーディオ信号110の信号部分に対して、「より大きい量」の残差信号(例えば比較的高いエネルギーを有する残差信号)を符号化表現に選択的に埋め込むことができる。
【0050】
したがって、マルチチャンネルオーディオ信号110に従った符号化表現に含まれる残差信号の量の変化は、ビットレートの効率性と復元されるマルチチャンネルオーディオ信号(オーディオデコーダ側で復元される)のオーディオ品質との間の良好なトレードオフを達成することができるように、マルチチャンネルオーディオ信号110の符号化表現112(例えば、符号化された形で符号化表現に含まれる残差信号126)を適合させることを可能とする。
【0051】
マルチチャンネルオーディオエンコーダ100は、多くの異なる方法でオプションとして改善することができることに留意すべきである。例えば、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号110に従って、(符号化表現に含まれる)残差信号126のバンド幅を変化させるように構成することができる。したがって、符号化表現112に含まれる残差信号の量は、知覚的に最も重要な周波数バンドに適合させることができる。
【0052】
オプションとして、マルチチャンネルオーディオデコーダは、マルチチャンネルオーデ
ィオ信号110に従って、残差信号126が符号化表現112に含まれる周波数バンドを選択するように構成することができる。したがって、符号化表現120(より正確には、符号化表現112に含まれる残差信号の量)は、マルチチャンネルオーディオ信号に、例えば、マルチチャンネルオーディオ信号110の知覚的に最も重要な周波数バンドに適合させることができる。
【0053】
オプションとして、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号がトーンである周波数バンドに対して、残差信号126を符号化表現に含むように構成することができる。加えて、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号がトーンでない周波数バンドに対して(特定の周波数バンドに対して符号化表現に残差信号の包含を生じさせる他のいかなる特定の条件も満たされない限り)、残差信号126を符号化表現112に含まないように構成することができる。従って、残差信号は、知覚的に重要なトーンの周波数バンドに対して、符号化表現に選択的に含むことができる。
【0054】
オプションとして、マルチチャンネルオーディオエンコーダ100は、ダウンミックス信号の形成がマルチチャンネルオーディオ信号の信号成分のキャンセルに結果としてなる時間部分および/または周波数バンドに対して、符号化表現に残差信号を選択的に含むように構成することができる。例えば、マルチチャンネルオーディオエンコーダは、ダウンミックス信号122においてマルチチャンネルオーディオ信号110の信号成分のキャンセルを検出し、検出の結果に従って残差信号126の提供(例えば、符号化表現112への残差信号126の包含)をアクティベートするように構成することができる。したがって、マルチチャンネルオーディオ信号110のチャンネル信号のダウンミックス信号122へのダウンミックス(または他のいかなる通常の線形結合)が、マルチチャンネルオーディオ信号112の信号成分のキャンセルに結果としてなる(それは、例えば、180度位相シフトされた異なるチャンネル信号の信号成分によって生じる可能性がある)場合に、オーディオデコーダにおいてマルチチャンネルオーディオ信号110を復元するときにこのキャンセルの有害な作用を克服するのに役立つ残差信号126が、符号化表現112に含まれる。例えば、残差信号126は、このようなキャンセルがある周波数バンドに対して符号化表現112に選択的に含むことができる。
【0055】
オプションとして、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号の少なくとも2つのチャンネル信号の線形結合を用いて、マルチチャンネルオーディオデコーダ側で用いられるアップミックス係数に従って、残差信号を演算するように構成することができる。このような残差信号の演算は効率的であり、オーディオデコーダ側でのチャンネル信号の簡単な復元を可能とする。
【0056】
オプションとして、マルチチャンネルオーディオエンコーダは、マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータ124を用いてアップミックス係数を符号化する、またはマルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータからアップミックス係数を導き出すように構成することができる。したがって、パラメータ124(例えば、チャンネル間レベル差パラメータ、チャンネル間相関パラメータ等とすることができる)は、パラメトリック符号化(符号化または復号化)と残差信号アシスト符号化(符号化または復号化)の両方に対して用いることができる。従って、残差信号126の使用は、付加的なシグナリングオーバーヘッドをもたらさない。むしろ、いずれにしろパラメトリック符号化(符号化/復号化)に対して用いられるパラメータ124は、残差符号化(符号化/復号化)に対しても再利用される。
従って、高い符号化効率を達成することができる。
【0057】
オプションとして、マルチチャンネルオーディオデコーダは、音響心理学モデルを用い
て、符号化表現に含まれる残差信号の量を時間変数として決定するように構成することができる。したがって、符号化精度は、信号の音響心理学的特性に適合させることができ、それは通常は良好なビットレートの効率性に結果としてなる。
【0058】
しかしながら、マルチチャンネルオーディオエンコーダは、本願明細書(明細書および特許請求の範囲の両方)に記載されたいずれの特徴または機能によってもオプションとして補充することができることに留意すべきである。さらに、マルチチャンネルオーディオエンコーダは、オーディオデコーダと協働するために、本願明細書に記載されたオーディオデコーダと並行して適合させることもできる。
【0059】
2. 図2に係るマルチチャンネルオーディオデコーダ
【0060】
図2は、本発明の一実施形態に係るマルチチャンネルオーディオデコーダ200の概略ブロック図を示す。
【0061】
マルチチャンネルオーディオデコーダ200は、符号化表現210を受信し、それに基づいて少なくとも2つの出力オーディオ信号212,214を提供するように構成される。マルチチャンネルオーディオデコーダ200は、(少なくとも)1つの出力信号、例えば、第1の出力オーディオ信号212を取得するために、ダウンミックス信号222と無相関化信号224と残差信号226との重み付け結合を実行するように構成された、重み付け結合器220を備える。ここで、ダウンミックス信号212と無相関化信号224と残差信号226は、例えば、符号化表現210から導き出すことができ、符号化表現210は、ダウンミックス信号220の符号化表現と残差信号226の符号化表現をともなうことができることに留意すべきである。さらに、無相関化信号224は、例えば、ダウンミックス信号222から導き出すことができ、または符号化表現210に含まれる付加的情報を用いて導き出すことができる。しかしながら、無相関化信号は、符号化表現210からの専用情報なしに提供することもできる。
【0062】
マルチチャンネルオーディオデコーダ200は、また、残差信号226に従って、重み付け結合における無相関化信号224の寄与を記述する重みを決定するように構成される。例えば、マルチチャンネルオーディオデコーダ200は、残差信号226に基づいて、重み付け結合における無相関化信号224の寄与(例えば、第1の出力オーディオ信号212に対する無相関化信号224の寄与)を記述する重み232を決定するように構成された、重み決定器230を備えることができる。
【0063】
マルチチャンネルオーディオデコーダ200の機能に関して、重み付け結合に対する、そして結果的に第1の出力オーディオ信号212に対する、無相関化信号224の寄与は、付加的なシグナリングオーバーヘッドなしに、残差信号226に従ってフレキシブルな方法(例えば、時間的に可変で周波数に依存する方法)で調整されることに留意すべきである。したがって、第1の出力オーディオ信号212に含まれる無相関化信号224の量は、第1の出力オーディオ信号212の良好な品質が達成されるように、第1の出力オーディオ信号212に含まれる残差信号226の量に従って適合される。したがって、いかなる状況下でも付加的なシグナリングオーバーヘッドなしに、無相関化信号224の適当な重み付けを取得することが可能である。従って、マルチチャンネルオーディオデコーダ200を用いて、適度なビットレートで復号化出力オーディオ信号212の良好な品質を達成することができる。復元の精度は、オーディオエンコーダによってフレキシブルに調整することができ、オーディオエンコーダは、符号化表現210に含まれる残差信号226の量(例えば、符号化表現210に含まれる残差信号226のエネルギーがどれくらい大きいか、または符号化表現210に含まれる残差信号226がどれくらいの周波数バンドに関係しているか)を決定することができ、マルチチャンネルオーディオデコーダ20
0は、それに応じて反応し、無相関化信号224の重み付けを、符号化表現210に含まれる残差信号226の量にフィットするように調整することができる。結果的に、符号化表現210に含まれる大量の残差信号226がある(例えば、特定の周波数バンドに対して、または特定の時間部分に対して)場合に、重み付け結合220は、主に(または排他的に)残差信号226を考慮することができる一方、無相関化信号224に対してはほとんど(または全く)重みが与えられない。対照的に、符号化表現210に含まれる、より小さい量の残差信号226のみがある場合に、重み付け結合220は、ダウンミックス信号222に加えて、主に(または排他的に)無相関化信号224を考慮することができるが、残差信号226に対しては、比較的小さい程度の重みのみが与えられる(または重みが全く与えられない)。従って、マルチチャンネルオーディオデコーダ200は、いかなる状況下でも(より小さい量のまたはより大きい量の残差信号226が符号化表現210に含まれるかどうかに拘りなく)最高のオーディオ品質を達成するために、適切なマルチチャンネルオーディオエンコーダとフレキシブルに協働し、重み付け結合220を調整することができる。
【0064】
第2の出力オーディオ信号214は、同様の方法で生成することができることに留意すべきである。しかしながら、例えば、第2の出力オーディオ信号に関して異なる品質要求がある場合に、必ずしも同じメカニズムを第2の出力オーディオ信号214に適用する必要はない。
【0065】
オプションの改良において、マルチチャンネルオーディオデコーダは、無相関化信号224に従って、重み付け結合における無相関化信号224の寄与を記述する重み232を決定するように構成することができる。言い換えれば、重み232は、残差信号226と無相関化信号224の両方に従属することができる。したがって、重み232は、付加的なシグナリングオーバーヘッドなしに、現在の復号化オーディオ信号に対して、より良好に適合させることさえできる。
【0066】
他のオプションの改良として、マルチチャンネルオーディオデコーダは、符号化表現212に基づいてアップミックスパラメータを取得し、アップミックスパラメータに従って、重み付け結合における無相関化信号の寄与を記述する重み232を決定するように構成することができる。したがって、重み232は、重み232のさらに良好な適合を達成できるように、アップミックスパラメータに付加的に従属することができる。
【0067】
他のオプションの改良として、マルチチャンネルオーディオデコーダは、無相関化信号の重みが残差信号のエネルギーの増加と共に減少するように、重み付け結合における無相関化信号の寄与を記述する重みを決定するように構成することができる。したがって、混合またはフェーディングは、主に無相関化信号224(ダウンミックス信号222に加えて)に基づく復号化と、主に残差信号226(ダウンミックス信号222に加えて)に基づく復号化との間で実行することができる。
【0068】
他のオプションの改良として、オーディオデコーダ200は、残差信号226のエネルギーがゼロである場合に、無相関化信号アップミックスパラメータ(符号化表現210に含むことができる、またはそれから導き出すことができる)によって決定される最大重みが無相関化信号224に関連するように、また残差信号重み係数(または残差信号アップミックスパラメータ)によって重み付けされた残差信号226のエネルギーが、無相関化信号アップミックスパラメータによって重み付けされた無相関化信号224のエネルギーより大きいまたはそれに等しい場合に、ゼロ重みが無相関化信号に関連するように、重み232を決定するように構成することができる。したがって、無相関化信号224に基づく復号化と残差信号226に基づく復号化との間で完全に混合する(またはフェードする)ことが可能である。残差信号226が十分に強いと判断される場合(例えば、重み付け
された残差信号のエネルギーが重み付けされた無相関化信号224のエネルギーに等しい、またはそれより大きいとき)に、重み付け結合は、無相関化信号224を考慮に入れず、ダウンミックス信号222を改善するために、残差信号226に完全に依存させることができる。この場合において、無相関化信号224の考慮は通常は特に良好な波形復元を妨げるのに対して、残差信号226の使用は通常は良好な波形復元を可能とするので、マルチチャンネルオーディオデコーダ200側で特に良好な(少なくとも一部分の)波形復元を実行することができる。
【0069】
他のオプションの改良において、マルチチャンネルオーディオデコーダ200は、1つ以上の無相関化信号アップミックスパラメータに従って重み付けされた無相関化信号の重み付けエネルギー値を演算し、1つ以上の残差信号アップミックスパラメータを用いて重み付けられた残差信号の重み付けエネルギー値を演算するように構成することができる。この場合において、マルチチャンネルオーディオデコーダは、無相関化信号の重み付けエネルギー値と残差信号の重み付けエネルギー値に従ってファクタを決定し、そのファクタに基づいて1つの出力オーディオ信号(例えば、第1の出力オーディオ信号212)に対する無相関化信号224の寄与を記述する重みを取得するように構成することができる。従って、重みの決定230は、特によく適合された重み値232を提供することができる。
【0070】
オプションの改良において、マルチチャンネルオーディオデコーダ200(またはその重み決定器230)は、1つの出力オーディオ信号(例えば第1の出力オーディオ信号212)に対する無相関化信号224の寄与を記述する重み(または重み付け値)232を取得するために、そのファクタを、無相関化信号アップミックスパラメータ(それは、符号化表現210に含むことができる、または符号化表現210から導き出すことができる)と乗算するように構成することができる。
【0071】
オプションの改良において、マルチチャンネルオーディオデコーダ(またはその重み決定器230)は、無相関化信号224の重み付けエネルギー値を取得するために、複数のアップミックスチャンネルと時間スロットにわたって、無相関化信号アップミックスパラメータ(それは、符号化表現210に含むことができる、または符号化表現210から導き出すことができる)を用いて重み付けされた無相関化信号224のエネルギーを演算するように構成することができる。
【0072】
更なるオプションの改良として、マルチチャンネルオーディオデコーダ200は、残差信号の重み付けエネルギー値を取得するために、複数のアップミックスチャンネルおよび時間スロットにわたって、残差信号アップミックスパラメータ(それは、符号化表現210に含むことができる、または符号化表現210から導き出すことができる)を用いて重み付けられた残差信号224のエネルギーを演算するように構成することができる。
【0073】
他のオプションの改良として、マルチチャンネルオーディオデコーダ200(またはその重み決定器232)は、無相関化信号の重み付けエネルギー値と残差信号の重み付けエネルギー値との差に従って、上述のファクタを演算するように構成することができる。このような演算は、重み付け値232を決定する効率的なソリューションであることが分かっている。
【0074】
オプションの改良として、マルチチャンネルオーディオデコーダは、無相関化信号224の重み付けエネルギー値と残差信号226の重み付けエネルギー値の差と、無相関化信号224の重み付けエネルギー値との比率に従ってファクタを演算するように構成することができる。ファクタに対するこのような演算は、ダウンミックス信号222の主に無相関化信号ベースの改善とダウンミックス信号222の主に残差信号ベースの改善との間の
混合に対して、良い結果をもたらすことが分かっている。
【0075】
オプションの改良として、マルチチャンネルオーディオデコーダ200は、例えば、第1の出力オーディオ信号212と第2の出力オーディオ信号214のような、2つ以上の出力オーディオ信号に対する無相関化信号の寄与を記述する重みを決定するように構成することができる。この場合において、マルチチャンネルオーディオデコーダは、無相関化信号224の重み付けエネルギー値と第1チャンネルの無相関化信号アップミックスパラメータに基づいて、第1の出力オーディオ信号212に対する無相関化信号224の寄与を決定するように構成することができる。さらに、マルチチャンネルオーディオデコーダは、無相関化信号224の重み付けエネルギー値と第2チャンネルの無相関化信号アップミックスパラメータに基づいて、第2の出力オーディオ信号214に対する無相関化信号224の寄与を決定するように構成することができる。言い換えれば、異なる無相関化信号アップミックスパラメータは、第1の出力オーディオ信号212と第2の出力オーディオ信号214とを提供するために用いることができる。しかしながら、第1の出力オーディオ信号212に対する無相関化信号の寄与と第2の出力オーディオ信号214に対する無相関化信号の寄与との決定に対して、無相関化信号の同じ重み付けエネルギー値を用いることができる。従って、2つの出力オーディオ信号212,214の異なる特性に拘らず、異なる無相関化信号アップミックスパラメータによって考慮することができる効果的な調整が可能である。
【0076】
オプションの改良として、マルチチャンネルオーディオデコーダ200は、残差エネルギー(例えば、残差信号226のエネルギーまたは残差信号226の重み付けバージョンのエネルギー)が無相関化エネルギー(例えば、無相関化信号224のエネルギーまたは無相関化信号224の重み付けバージョンのエネルギー)を超える場合に、重み付け結合に対する無相関化信号224の寄与を無効にするように構成することができる。
【0077】
更なるオプションの改良として、オーディオデコーダは、残差信号の重み付けエネルギー値のバンド毎の決定に従って、重み付け結合における無相関化信号224の寄与を記述する重み232をバンド毎に決定するように構成することができる。したがって、復号化される信号に対するマルチチャンネルオーディオデコーダ200のきめ細かい調整を実行することができる。
【0078】
他のオプションの改良において、オーディオデコーダは、出力オーディオ信号212,214の各フレームに対して、重み付け結合における無相関化信号の寄与を記述する重みを決定するように構成することができる。したがって、良い時間分解能を達成することができる。
【0079】
更なるオプションの改良において、重み付け値232の決定は、以下で提供されるいくつかの式によって実行することができる。
【0080】
さらに、マルチチャンネルオーディオデコーダ200は、他の実施形態に関しても、本願明細書に記載されたいずれかの特徴または機能によって補充できることに留意すべきである。
【0081】
3. 図3に係るマルチチャンネルオーディオデコーダ
【0082】
図3は、本発明の一実施形態に係るマルチチャンネルオーディオデコーダ300の概略ブロック図を示す。マルチチャンネルオーディオデコーダ300は、符号化表現310を受信し、それに基づいて2つ以上の出力オーディオ信号312,314を提供するように構成される。符号化表現310は、例えば、ダウンミックス信号の符号化表現と、1つ以
上の空間パラメータの符号化表現と、残差信号の符号化表現とを備えることができる。マルチチャンネルオーディオデコーダ300は、ダウンミックス信号の符号化表現と、複数の符号化された空間パラメータと、残差信号の符号化表現とに基づいて、(少なくとも)1つの出力オーディオ信号、例えば、第1の出力オーディオ信号312および/または第2の出力オーディオ信号314を取得するように構成される。
【0083】
特に、マルチチャンネルオーディオデコーダ300は、残差信号(それは、符号化表現310において符号化された形で含まれる)に従って、パラメトリック符号化と残差符号化との間で混合するように構成される。言い換えれば、マルチチャンネルオーディオデコーダ300は、出力オーディオ信号312,314の提供が、ダウンミックス信号に基づいて、出力オーディオ信号312,314間の所望の関係を記述する空間パラメータ(例えば、出力オーディオ信号312,314の所望のチャンネル間レベル差または所望のチャンネル間相関)を用いて実行される復号化モードと、出力オーディオ信号312,314が残差信号を用いてダウンミックス信号に基づいて復元される復号化モードとの間で混合することができる。従って、符号化表現310に含まれる残差信号の強度(例えば、エネルギー)は、ダウンミックス信号から出力オーディオ信号312,314を導き出すために、復号化がもっぱら(または排他的に)空間パラメータ(ダウンミックス信号に加えて)に基づいているかどうかまたは復号化がもっぱら(または排他的に)残差信号に基づいているかどうか、または、空間パラメータと残差信号の両方がダウンミックス信号の改善に影響を及ぼす中間状態がとられるかどうかを決定することができる。
【0084】
さらに、マルチチャンネルオーディオデコーダ300は、パラメトリック符号化(通常は、出力オーディオ信号312,314を提供するときに比較的高い重みが無相関化信号に対して与えられる)と、残差信号に従った残差符号化(通常は、比較的少ない重みが無相関化信号に与えられる)との間で混合することによって、高いシグナリングオーバーヘッドなしに、現在のオーディオコンテンツによく適合する復号化を可能とする。
【0085】
さらに、マルチチャンネルオーディオデコーダ300は、マルチチャンネルオーディオデコーダ200に類似する考察に基づいており、マルチチャンネルオーディオデコーダ200に関して上述されたオプションの改良は、マルチチャンネルオーディオデコーダ300にも適用できることに留意すべきである。
【0086】
4. 図4に係るマルチチャンネルオーディオ信号の符号化表現を提供する方法
【0087】
図4は、マルチチャンネルオーディオ信号の符号化表現を提供する方法400のフローチャートを示す。
【0088】
方法400は、マルチチャンネルオーディオ信号に基づいてダウンミックス信号を取得するステップ410を備える。方法400は、マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータを提供するステップ420を備える。例えば、マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するチャンネル間レベル差パラメータおよび/またはチャンネル間相関パラメータ(または共分散パラメータ)を提供することができる。方法400は、また、残差信号を提供するステップ430を備える。さらに、方法は、マルチチャンネルオーディオ信号に従って、符号化表現に含まれる残差信号の量を変化させるステップ440を備える。
【0089】
方法400は、図1に係るオーディオエンコーダ100と同じ考察に基づいていることに留意すべきである。さらに、方法400は、発明の装置に関して本願明細書に記載されたいずれかの特徴および機能によって補充することができる。
【0090】
5. 図5に係る符号化表現に基づいて少なくとも2つの出力オーディオ信号を提供する
方法
【0091】
図5は、符号化表現に基づいて、少なくとも2つの出力オーディオ信号を提供する方法500のフローチャートを示す。方法500は、残差信号に従って、重み付け結合における無相関化信号の寄与を記述する重みを決定するステップ510を備える。方法500は、また、出力オーディオの1つを取得するために、ダウンミックス信号と無相関化信号と残差信号との重み付け結合を実行するステップ520を備える。
【0092】
方法500は、発明の装置に関して本願明細書に記載されたいずれかの特徴および機能によって補充することができることに留意すべきである。
【0093】
6. 図6に係る符号化表現に基づいて少なくとも2つの出力オーディオ信号を提供する
方法
【0094】
図6は、符号化表現に基づいて、少なくとも2つの出力オーディオ信号を提供する方法600のフローチャートを示す。方法600は、ダウンミックス信号の符号化表現と複数の符号化された空間パラメータと残差信号の符号化表現とに基づいて、出力オーディオ信号の1つを取得するステップ610を備える。出力オーディオ信号の1つを取得するステップ610は、残差信号に従って、パラメトリック符号化と残差符号化との間の混合を実行するステップ620を備える。
【0095】
方法600は、発明の装置に関して本願明細書に記載されたいずれかの特徴および機能によって補充することができることに留意すべきである。
【0096】
7. 更なる実施形態
【0097】
以下において、いくつかの一般的な考察といくつかの更なる実施形態が記載される。
【0098】
7.1 一般的な考察
【0099】
本発明に係る実施形態は、固定の残差のバンド幅を用いる代わりに、デコーダ(例えば、マルチチャンネルオーディオデコーダ)は、各フレームに対して(または、一般的に、少なくとも複数の周波数レンジに対しておよび/または複数の時間部分に対して)、バンド毎にエネルギーを測定することによって送信された残差信号の量を検出するというアイデアに基づいている。出力エネルギーと無相関化の必要な(または所望の)量を獲得するために、送信された空間パラメータに従属して、無相関化された出力が、残差エネルギーが「失われている」ところに加えられる。これは、バンドパススタイルの残差信号と同様に可変の残差バンド幅を可能とする。例えば、トーンのバンドに対して残差符号化のみを用いることが可能である。波形保存符号化(それは残差符号化とも称される)に対するのと同様に、パラメトリック符号化に対して簡略化ダウンミックスを用いることを可能とするために、簡略化ダウンミックスに対する残差信号が本願明細書において定義される。
【0100】
7.2 簡略化ダウンミックスに対する残差信号の算出
【0101】
以下において、残差信号の計算とマルチチャンネルオーディオ信号のチャンネル信号の構造に関するいくつかの考察が記載される。
【0102】
統一されたスピーチとオーディオの符号化(USAC)において、いわゆる「簡略化ダウンミックス」が用いられるときに定義された残差信号はない。従って、いかなる部分的
波形保存符号化も可能でない。しかしながら、以下において、いわゆる「簡略化ダウンミックス」に対して残差信号を計算する方法が記載される。
【0103】
パラメトリックアップミックス係数ud1,ud2がパラメータバンド毎に算出されるのに対して、「簡略化ダウンミックス」重みd1,d2は、スケールファクタバンド毎に計算される。従って、残差信号を計算する係数wr1,wr2は、空間パラメータから直接演算することはできない(古典的MPEGサラウンドに対するケースであるため)が、ダウンミックス係数とミックスプミックス係数からスケールファクタバンド毎に決定されることを必要とする可能性がある。
【0104】
ここで、L,Rを入力チャンネル、Dをダウンミックスチャンネルとすると、残差信号resは以下の特性を満たさなければならない。
【0105】
【0106】
デコーダにより用いられる残差アップミックス係数ur,1,ur,2は、好ましくはロバストな復号化を確実にする方法で選択される。簡略化ダウンミックスは、非対称の特性を持つ(固定重みによるMPEGサラウンドとは対照的に)ので、例えば以下のアップミックス係数を用いて、空間パラメータに従属するアップミックスが適用される。
【0107】
他のオプションは、以下のように、ダウンミックス信号のアップミックス係数に直交する残差アップミックス係数を定義することである。
【0108】
言い換えれば、オーディオデコーダは、左チャンネル信号L(第1のチャンネル信号)と右チャンネル信号R(第2のチャンネル信号)の線形結合を用いてダウンミックス信号Dを取得することができる。同様に、残差信号resは、左チャンネル信号Lと右チャンネル信号R(または、一般的に、マルチチャンネルオーディオ信号の第1のチャンネル信号と第2のチャンネル信号)の線形結合を用いて取得される。
【0109】
例えば、式(5)および(6)において、簡略化ダウンミックス重みd1,d2と、パラメトリックアップミックス係数ud,1,ud,2と、残差アップミックス係数ur,1,ur,2が決定されるとき、残差信号resを取得するためのダウンミックス重みwr,1,wr,2を取得することができる。さらに、ur,1,ur,2は、式(7)と(8)または式(9)を用いてud,1,ud,2から導き出すことができることが分かる。簡略化ダウンミックス重みd1
,d2は、パラメトリックアップミックス係数ud,1,ud,2と同様に、通常の方法で取得
することができる。
【0110】
7.3 符号化プロセス
【0111】
以下において、符号化プロセスに関するいくつかの詳細が記載される。符号化は、例えば、マルチチャンネルオーディオエンコーダ100によって、または他のいかなる適切な手段またはコンピュータプログラムによっても実行することができる。
【0112】
好ましくは、送信された残差の量は、オーディオ信号(例えば、マルチチャンネルオーディオ信号110のチャンネル信号)と利用可能なビットレートに従属して、エンコーダ(例えば、マルチチャンネルオーディオエンコーダ)の音響心理学モデルによって決定される。送信された残差信号は、例えば、部分的波形保存に対してまたは用いられたダウンミックス方法(例えば、上記の式(1)によって記述されるダウンミックス方法)によって生じる信号キャンセルを回避するために用いることができる。
【0113】
7.3.1 部分的波形保存
【0114】
以下において、部分的波形保存はどのようにして達成することができるかが記載される。例えば、計算された残差(例えば、式(4)による残差res)は、フルバンドで、または残差バンド幅内で部分的波形保存を提供するためにバンド制限されて送信される。音響心理学モデルによって知覚的に無関係なように検出される残差部分は、例えば、ゼロに(例えば、符号化表現112を提供するときに残差信号126に基づいて)量子化することができる。これは、ランタイムにおける送信される残差バンド幅を低減すること(符号化表現に含まれる残差信号の量を変化させることと考えることができる)を含むが、これに限定されるものではない。このシステムは、失われている信号エネルギーがデコーダ(例えば、マルチチャンネルオーディオデコーダ200またはマルチチャンネルオーディオデコーダ300)によって復元されるので、残差信号部分のバンドパススタイルの消去を可能とすることもできる。従って、バックグラウンドノイズは残差ビットレートを低減するためにパラメータ的に符号化することができるのに対して、例えば、残差符号化は、それらの位相関係を維持する信号のトーン成分にのみ適用することができる。言い換えれば、残差信号126は、マルチチャンネルオーディオ信号110(またはマルチチャンネルオーディオ信号110の少なくとも1つのチャンネル信号)がトーンであると分かった周波数バンドおよび/または時間部分に対して、符号化表現112にのみ含む(例えば、残差信号処理130によって)とすることができる。対照的に、残差信号126は、マルチチャンネルオーディオ信号110(またはマルチチャンネルオーディオ信号110の少なくとも1つ以上のチャンネル信号)がノイズのようであると識別された周波数バンドまたは時間部分に対して、符号化表現112に含まないとすることができる。従って、符号化表現に含まれる残差信号の量は、マルチチャンネルオーディオ信号に従って変化する。
【0115】
7.3.2 ダウンミックスにおける信号キャンセルの防止
【0116】
以下において、ダウンミックスにおける信号キャンセルをどのようにして防止する(または補償する)ことができるかが記載される。
【0117】
低いビットレートのアプリケーションに対して、波形保存符号化(それは、例えば、ダウンミックス信号122に加えて残差信号126に主に依存する)の代わりに、パラメトリック符号化(それは、マルチチャンネルオーディオ信号のチャンネル間の従属性を記述するパラメータ124に主にまたは排他的に依存する)が適用される。ここで、残差信号126は、残差のビット使用を最小化するために、ダウンミックス122において信号キ
ャンセルを補償するためにのみ用いられる。ダウンミックス122において信号キャンセルが検出されない限り、システムは、無相関化器を用いてパラメトリックモードで(オーディオデコーダサイドにおいて)動作する。例えば、フェージングトーン信号に対して、信号キャンセルが発生するとき、残差信号126は、障害のある信号部分(例えば、周波数バンドおよび/または時間部分)に対して送信される。従って、信号エネルギーはデコーダによって回復することができる。
【0118】
7.4 復号化プロセス
【0119】
7.4.1 概要
【0120】
デコーダ(例えば、マルチチャンネルオーディオデコーダ200またはマルチチャンネルオーディオデコーダ300)において、送信されたダウンミックスおよび残差信号(例えばダウンミックス信号222または残差信号226)は、コアデコーダによって復号化され、復号化MPEGサラウンドペイロードとともに、MPEGサラウンドデコーダに供給される。古典的なMPSダウンミックスに対する残差アップミックス係数は不変であり、簡略化ダウンミックスに対する残差アップミックス係数は式(7)および式(8) お
よび/または式(9)で定義される。加えて、無相関化器の出力とその重み付け係数は、パラメトリック復号化に関して計算される。残差信号と無相関化器の出力は重み付けられ、両方が出力信号に混合される。それ故に、重み付けファクタは、残差および無相関化器信号のエネルギーを測定することによって決定される。
【0121】
言い換えれば、残差アップミックスファクタ(または係数)は、残差および無相関化信号のエネルギーを測定することによって決定することができる。
【0122】
例えば、ダウンミックス信号222は、符号化表現210に基づいて提供され、無相関化信号224は、ダウンミックス信号222から導き出されるまたは符号化表現210(またはそれ以外)に含まれるパラメータに基づいて生成される。残差アップミックス係数は、デコーダによって、例えば式(7)と式(8)に従ってパラメータアップミックス係数ud,1,ud,2から導き出すことができ、パラメータアップミックス係数ud,1,ud,2は、符号化表現210に基づいて、例えば直接的にまたは符号化表現210に含まれる空間データから(例えば、チャンネル間相関係数とチャンネル間レベル差係数から、またはオブジェクト間相関係数とオブジェクト間レベル差から)それらを導き出すことによって取得することができる。
【0123】
無相関化器出力(または出力)に対するアップミックス係数は、従来のMPEGサラウンド復号化に関して取得することができる。しかしながら、無相関化器出力(または出力)の重み付けに対する重み付けファクタは、重み付け結合における無相関化信号の寄与を記述する重みが残差信号に従って決定されるように、残差信号のエネルギーに基づいて(そして、おそらくまた無相関化器信号または信号のエネルギーに基づいて)決定することができる。
【0124】
7.4.2 例示的な実施態様
【0125】
以下において、例示的な実施態様が図7を参照して記載される。しかしながら、本願明細書に記載されたコンセプトは、図2および図3に係るマルチチャンネルオーディオデコーダ200または300において適用することもできることに留意すべきである。
【0126】
図7は、デコーダ(例えば、マルチチャンネルオーディオデコーダ)の概略ブロック図(またはフロー図)を示す。図7に係るデコーダは、全体が700で示される。デコーダ
700は、ビットストリーム710を受信し、それに基づいて第1の出力チャンネル信号712と第2の出力チャンネル信号714とを出力するように構成される。デコーダ700は、ビットストリーム710を受信し、それに基づいてダウンミックス信号722と残差信号724と空間データ726とを提供するように構成されたコアデコーダ720を備える。例えば、コアデコーダ720は、ダウンミックス信号として、ビッストリーム710によって表現されたダウンミックス信号の時間ドメイン表現または変換ドメイン表現(例えば、周波数ドメイン表現、MDCTドメイン表現、QMFドメイン表現)を提供することができる。同様に、コアデコーダ720は、ビットストリーム710によって表現される、残差信号724の時間ドメイン表現または変換ドメイン表現を提供することができる。さらに、コアデコーダ720は、例えば、1つ以上のチャンネル間相関パラメータ、チャンネル間レベル差パラメータ等のような、1つ以上の空間パラメータ726を提供することができる。
【0127】
デコーダ700は、また、ダウンミックス信号722に基づいて無相関化信号732を提供するように構成された、無相関化器730を備える。いずれの周知の無相関化コンセプトも、無相関化器730によって用いることができる。さらに、デコーダ700は、また、空間データ726を受信し、アップミックスパラメータ(例えば、アップミックスパラメータudmx,1,udmx,2,udec,1,udec,2)を提供するように構成された、アップミックス係数計算器740を備える。さらに、デコーダ700は、空間データ726に基づいてアップミックス係数計算器740によって提供されるアップミックスパラメータ742(アップミックス係数とも称される)を適用するように構成された、アップミキサ750を備える。例えば、アップミキサ750は、ダウンミックス信号722の2つのアップミックスされたバージョン752、754を取得するために、2つのダウンミックス信号のアップミックス係数(例えばudmx,1,udmx,2)を用いて、ダウンミックス信号722をスケーリングすることができる。さらに、アップミキサ750は、また、無相関化信号732の第1のアップミックスされた(スケーリングされた)バージョン756と第2のアップミックスされた(スケーリングされた)バージョン758とを取得するために、1つ以上のアップミックスパラメータ(例えば2つのアップミックスパラメータ)を、無相関化器730によって提供される無相関化信号732に対して適用するように構成される。さらに、アップミキサ750は、残差信号724の第1のアップミックスされた(スケーリングされた)バージョン760と第2のアップミックスされた(スケーリングされた)バージョン762とを取得するために、1つ以上のアップミックス係数(例えば、2つのアップミックス係数)を残差信号724に対して適用するように構成される。
【0128】
デコーダ700は、また、無相関化信号752のアップミックスされた(スケーリングされた)バージョン756,758のエネルギーと、残差信号724のアップミックスされた(スケーリングされた)バージョン760,762のエネルギーとを測定するように構成された、重み計算機770を備える。さらに、重み計算機770は、1つ以上の重み値772を重み付け器780に対して提供するように構成される。重み付け器780は、重み計算機770によって提供される1つ以上の重み付け値772を用いて、無相関化信号732の第1のアップミックスされ(スケーリングされ)、重み付けされたバージョン782と、無相関化信号732の第2のアップミックスされ(スケーリングされ)、重み付けされたバージョン784と、残差信号724の第1のアップミックスされ(スケーリングされ)、重み付けされたバージョン786と、残差信号724の第2のアップミックスされ(スケーリングされ)、重み付けされたバージョン788とを取得するように構成される。デコーダは、また、第1の出力チャンネル信号712を取得するために、ダウンミックス信号720の第1のアップミックスされた(スケーリングされた)バージョン752と、無相関化信号732の第1のアップミックスされ(スケーリングされ)、重み付けされたバージョン782と、残差信号724の第1のアップミックスされ(スケーリングされ)、重み付けされたバージョン786とを合計するように構成された、第1の加算
器790を備える。さらに、デコーダは、第2の出力チャンネル信号714を取得するために、ダウンミックス信号720の第2のアップミックスされたバージョン754と、無相関化信号724の第2のアップミックスされ(スケーリングされ)、重み付けられたバージョン784と、残差信号724の第2のアップミックスされ(スケーリングされ)、重み付けられたバージョン788とを合計するように構成された、第2の加算器792を備える。
【0129】
しかしながら、重み付け器780は、全ての信号756,758,760,762を重み付けする必要がないことに留意すべきである。例えば、いくつかの実施形態において、信号756,758のみを重み付けし、信号760,762が影響を受けないようにする(実際上、信号760,762が加算器790,792に対して直接適用されるようにする)だけで十分とすることができる。あるいは、しかしながら、残差信号760,762の重み付けを時間にわたって変化させることができる。例えば、残差信号は、フェードインまたはフェードさせることができる。例えば、無相関化信号の重み付け(または重み付けファクタ)は、時間にわたって平滑化させることができ、残差信号は、対応してフェードインまたはフェードアウトさせることができる。
【0130】
さらに、重み付け器780によって実行される重み付けとアップミキサ750によって適用されるアップミックスとは、結合動作として実行することもでき、重み計算は、無相関化信号732と残差信号724とを用いて直接実行することができる。
【0131】
以下において、デコーダ700の機能に関するいくつかの詳細が記載される。
【0132】
結合された残差とパラメトリックの符号化モードは、例えば、準後方互換性を持つ方法で、例えば、ビットストリームにおいて1つのパラメータバンドの残差バンド幅をシグナリングすることによって、シグナリングすることができる。従って、レガシーデコーダは、第1のパラメータバンド上でパラメトリック復号化にスイッチングすることによって、ビットストリームを依然として通過し復号化する。残差バンド幅を用いたレガシービットストリームは、第1のパラメータバンド上で残差エネルギーを含まず、提案された新規なデコーダにおいてパラメトリック復号化になる。
【0133】
しかしながら、3Dオーディオコーデックシステム内で、結合された残差とパラメトリックの符号化は、クワッドチャンネルエレメントのような他のコアデコーダツールとの組み合わせにおいて用いることができ、デコーダがレガシービットストリームを明示的に検出し、通常のバンド制限された残差符号化モードにおいてそれらを復号化することを可能にする。実際の残差バンド幅は、ランタイムにデコーダによって決定されるので、好ましくは明示的にシグナリングされない。アップミックス係数の計算は、残差符号化モードの代わりにパラメトリックモードにセットされる。重み付けられた無相関化器出力のエネルギーEdecと重み付けられた残差信号Eresのエネルギーは、以下のように、すべての時間スロットtsにわたるハイブリッドバンドhbと各フレームに対するアップミックスチャンネルch毎に計算される。
【0134】
【0135】
残差信号(例えば、アップミックスされた残差信号760またはアップミックスされた残差信号762)は、出力チャンネル(例えば、出力チャンネル712,714)に1の重みで加えられる。無相関化器信号(例えばアップミックスされた無相関化器信号756またはアップミックスされた無相関化器信号758)は、次のように算出されるファクタrによって(例えば重み付け器780によって)重み付けすることができる。
ここで、Edec(hb)は周波数バンドhbに対する無相関化信号xdecの重み付けエネルギー値を表し、Eres(hb)は周波数バンドhbに対する残差信号xresの重み付けエネルギー値を表す。
【0136】
残差(例えば、残差信号724)が送信されない場合、例えば、Eres=0である場合
に、r(重み付け器780によって適用することができ、重み付け値772とみなすことができるファクタ)は1になり、それは純粋にパラメトリック復号化に等しい。残差エネルギー(例えば、アップミックスされた残差信号760および/またはアップミックスされた残差信号762のエネルギー)が無相関化器エネルギー(例えば、アップミックスされた無相関化信号756またはアップミックスされた無相関化信号758のエネルギー)を超える場合、例えば、Eres > Edecである場合に、ファクタrは、ゼロにセットする
ことができ、従って無相関化器を無効にし、部分的波形保存復号化(それは、残差符号化とみなすことができる)を有効にする。アップミックスプロセスにおいて、重み付け無相関化器出力(例えば、信号782,784)と残差信号(例えば、信号786,788または信号760,762)は、両方とも出力チャンネル(例えば、信号712,714)に加えられる。
【0137】
結論として、これは、マトリックス形式のアップミックスルールになる。
ここで、ch1は第1の出力オーディオ信号の1つ以上の時間ドメインサンプルまたは変換ドメインサンプルを表し、ch2は第2の出力オーディオ信号の1つ以上の時間ドメインサンプルまたは変換ドメインサンプルを表し、xdmxはダウンミックス信号の1つ以
上の時間ドメインサンプルまたは変換ドメインサンプルを表し、xdecは無相関化信号の
1つ以上の時間ドメインサンプルまたは変換ドメインサンプルを表し、xresは残差信号
の1つ以上の時間ドメインサンプルまたは変換ドメインサンプルを表し、udmx,1は第1
の出力オーディオ信号に対するダウンミックス信号アップミックスパラメータを表し、udmx,2は第2の出力オーディオ信号に対するダウンミックス信号アップミックスパラメー
タを表し、udec,1は第1の出力オーディオ信号に対する無相関化信号アップミックスパ
ラメータを表し、udec,2は第2の出力オーディオ信号に対する無相関化信号アップミッ
クスパラメータを表し、maxは最大オペレータを表し、rは残差信号に従った無相関化
信号の重み付けを記述するファクタを表す。
【0138】
アップミックス係数Udmx,1,Udmx,2,Udec,1,Udec,2は、MPS2-1-2パラメトリックモードに関して計算される。詳細は、上記参照されたMPEGサラウンドコンセプトの標準が参照される。
【0139】
要約すると、本発明による実施形態は、ダウンミックス信号と残差信号と空間データとに基づいて出力チャンネル信号を提供するコンセプトを構築し、いかなる有意のシグナリングオーバーヘッドもなしに無相関化信号の重み付けがフレキシブルに調整される。
【0140】
7.5 実施態様の変形例
【0141】
いくつかの態様が装置の文脈で記載されてきたが、これらの態様は対応する方法の記載をも表すことは明らかであり、ここでブロックまたはデバイスが方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈において記載された態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の記載をも表す。いくつかのまたは全ての方法ステップは、たとえば、マイクロプロセッサ、プログラム可能なコンピュータまたは電子回路のように、ハードウェア装置によって(または、を用いて)実行することができる。いくつかの実施形態において、いくつかの1つ以上最も重要な方法ステップは、このような装置によって実行することができる。
【0142】
発明の符号化されたオーディオ信号は、デジタル記憶媒体に保存されることができるかまたは伝送媒体(例えばワイヤレス伝送媒体または有線の伝送媒体(例えばインターネット))上に送信されることができる。
【0143】
特定の実施要件に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアで実施されることができる。
実施は、その上に格納される電子的に読取可能な制御信号を有し、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する(または協働することができる)、デジタル記憶媒体、たとえばフロッピー(登録商標)ディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを用いて実行することができる。それ故に、デジタル記憶媒体は、コンピュータ読取可能とすることができる。
【0144】
本発明によるいくつかの実施形態は、電子的に読取可能な制御信号有し、本願明細書に記載された方法の1つが実行されるプログラム可能なコンピュータシステムと協働することができるデータキャリアを備える。
【0145】
一般に、本発明の実施形態は、コンピュータプログラム製品がコンピュータ上で動作するとき、方法の1つを実行するように動作可能であるプログラムコードを有するコンピュータプログラム製品として実施することができる。プログラムコードは、例えば機械読取可能キャリアに格納することができる。
【0146】
他の実施形態は、機械読取可能キャリアに格納され、本願明細書に記載された方法の1つを実行するためのコンピュータプログラムを備える。
【0147】
言い換えれば、発明の方法の実施形態は、それ故に、コンピュータプログラムがコンピュータ上で動作するとき、本願明細書に記載された方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0148】
発明の方法の更なる実施形態は、それ故に、その上に記録されて本願明細書に記載された方法の1つを実行するコンピュータプログラムを備えるデータキャリア(またはデジタル記憶媒体またはコンピュータ読取可能媒体)である。データキャリア、デジタル記憶媒体または記録媒体は、一般的に有形でありおよび/または非過渡的なものである。
【0149】
発明の方法の更なる実施形態は、それ故に、本願明細書に記載された方法の1つを実行するコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続、例えばインターネットを介して転送されるように構成することができる。
【0150】
さらなる実施形態は、本願明細書に記載された方法の1つを実行するように構成されたまたは適合された処理手段、例えばコンピュータまたはプログラム可能なロジックデバイスを備える。
【0151】
更なる実施形態は、その上に本願明細書に記載された方法の1つを実行するコンピュータプログラムがインストールされたコンピュータを備える。
【0152】
本発明に係る更なる実施例は、本願明細書に記載された方法の1つを実行するコンピュータプログラムをレシーバに転送する(例えば、電子的にまたは光学的に)ように構成された装置またはシステムを備える。レシーバは、例えば、コンピュータ、モバイルデバイス、メモリデバイス等とすることができる。装置またはシステムは、例えば、コンピュータプログラムをレシーバに転送するファイルサーバを備えることができる。
【0153】
いくつかの実施形態において、プログラム可能なロジックデバイス(例えばフィールドプログラマブルゲートアレイ)を、本願明細書に記載された方法のいくつかまたはすべての機能を実行するために用いることができる。いくつかの実施形態において、フィールドプログラマブルゲートアレイは、本願明細書に記載された方法の1つを実行するためにマイクロプロセッサと協働することができる。一般に、方法は、好ましくはいかなるハードウェア装置によっても実行される。
【0154】
上述の実施形態は、単に本発明の原理に対して説明したものである。本願明細書に記載された構成および詳細の修正および変更は、他の当業者にとって明らかであると理解される。本発明は、それ故に、特許請求の範囲のスコープによってのみ限定され、本願明細書の実施形態の記載および説明によって提供される特定の詳細によって限定されないことを意図する。
【0155】
7.6 更なる実施形態
【0156】
以下において、いわゆるハイブリッド残差デコーダの概略ブロック図を示す図8を参照して、本発明に係る他の実施形態が記載される。
【0157】
図8に係るハイブリッド残差デコーダ800は、図7に係るデコーダ700と非常に類似しており、上記の説明が参照される。しかしながら、ハイブリッド残差デコーダ800においては、付加的な重み付け(アップミックスパラメータのアプリケーションに加えて)がアップミックスされた無相関化信号(それはデコーダ700における信号756,758に対応する)に対して適用されるだけであり、アップミックスされた残差信号(それはデコーダ700における信号760,762に対応する)に対しては適用されない。従って、ハイブリッド残差デコーダ800の重み付けは、デコーダ700における重み付けよりいくらか単純であるが、例えば、式(14)による重み付けによく一致する。
【0158】
以下において、図8に係る結合されたパラメトリックと残差の復号化(ハイブリッド残差符号化)がいくらか詳細に説明される。
【0159】
しかしながら、最初に概要が提供される。
【0160】
無相関化器ベースのモノラルからステレオへのアップミックスまたはISO/IEC
23003-3(7.11.1節)に記載されたような残差符号化のいずれかを用いることに加えて、ハイブリッド残差符号化は、両方のモードの信号従属結合を可能とする。図8に図示されるように、残差信号と無相関化器出力は、信号エネルギーおよび空間パラメータに応じて時間および周波数に依存する重み付けファクタを用いて混合される。
【0161】
以下において、復号化プロセスが記載される。
【0162】
ハイブリッド残差符号化モードは、Mps212Config()において、シンタックスエレメントbsResidualCoding== 1とbsResidualBa
nds == 1によって表される。言い換えれば、ハイブリッド残差符号化の使用は、符号化表現のビットストリームエレメントを用いてシグナリングすることができる。ミックスマトリックスM2の計算は、ISO/IEC 23003-3、7.11.2.3節に
おける計算に従って、あたかもbsResidualCoding== 0のように実行
される。無相関化器ベースの部分に対するマトリックスは、次のように定義される。
【0163】
アップミックスプロセスは、ダウンミックスと無相関化器出力と残差に分割される。アップミックスされたダウンミックスudmxは、次式を用いて算出される。
【0164】
アップミックスされた無相関化器出力udecは、次式を用いて計算される。
【0165】
アップミックスされた残差信号uresは、次式を用いて計算される。
【0166】
アップミックスされた残差信号のエネルギーEresとアップミックスされた無相関化器
出力のエネルギーEdecは、以下のように、ハイブリッドバンド毎に、出力チャンネルc
hと1つのフレームのすべての時間スロットtsの両方にわたる合計として計算される。
【0167】
アップミックスされた無相関化器出力は、以下のような、各ハイブリッドバンドに対してフレーム毎に計算された重み付けファクタrdecを用いて重み付けされる。
ここで、εはゼロによる割り算を防止するための小さい数(例えば、ε= 1e-9ま
たは0<ε<=1e-5)である。しかしながら、いくつかの実施形態において、εはゼロにセットする(「Eres<ε」を「Eres=0」で置き換える)ことができる。
【0168】
すべての3つのアップミックス信号は、復号化出力信号を形成するために加えられる。
【0169】
8. 結論
【0170】
結論として、本発明に係る実施形態は、結合された残差とパラメトリックの符号化を構築する。
【0171】
本発明は、USAC統合ステレオツールに基づく、合同ステレオ符号化に対するパラメトリックと残差の符号化の信号従属結合の方法を構築する。固定の残差バンド幅を用いる代わりに、送信される残差の量が、エンコーダ、時間および周波数変形によって信号従属的に決定される。デコーダ側で、出力チャンネル間の無相関化の必要量は、残差信号と無相関化器出力を混合することによって生成される。従って、対応するオーディオ符号化/復号化システムは、符号化信号に応じて、ランタイムに完全なパラメトリック符号化と波形保存残差符号化の間で混合することができる。
【0172】
本発明に係る実施形態は、従来の解法より優れている。例えば、USACにおいて、MPEGサラウンド2-1-2システムは、パラメトリックステレオ符号化、または統合ステレオに対して用いられ、部分的波形保存に対してバンド制限されたまたは完全なバンド幅の残差信号を送信する。バンド制限された残差が送信される場合に、無相関化器の使用によるパラメトリックアップミックスが残差バンド幅上に適用される。この方法の欠点は、残差バンド幅がエンコーダの初期化で固定の値にセットされることである。
【0173】
対照的に、本発明に係る実施形態は、残差バンド幅の信号従属適合またはパラメトリック符号化へのスイッチングを可能とする。さらに、パラメトリック符号化モードにおけるダウンミックスプロセスが調子の悪い位相関係に対して信号キャンセルを生じる場合に、本発明に係る実施形態は、失われた信号部分を復元すること(例えば、適当な残差信号を提供することによって)を可能とする。簡略化ダウンミックス方法は、パラメトリック符号化に対して古典的MPSダウンミックスより信号キャンセルを生じないことに留意すべきである。しかしながら、従来の簡略化ダウンミックスは、残差信号がUSACにおいて定義されていないので、部分的波形保存に対して用いられることができないが、本発明に係る実施形態は、波形復元(例えば、部分的波形復元が重要に見える信号部分に対して選択的な部分的波形復元)を可能とする。
【0174】
更なる結論として、本発明に係る実施形態は、本願明細書に記載されたようなオーディオ符号化または復号化の装置、方法またはコンピュータプログラムを構築する。
図1
図2
図3
図4
図5
図6
図7
図8