特表2023-532808 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

特表2023-532808オーディオ量子化器、オーディオ逆量子化器、および関連する方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3a
3b
4a
4b
5
6
7a
7b
8a
8b
9a
9b
10
11
12
13
14
15
16
17
18
19
20
21
22a
22b
22c
23
24
25

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2023-07-31

(54)【発明の名称】オーディオ量子化器、オーディオ逆量子化器、および関連する方法

(51)【国際特許分類】

G10L 19/038 20130101AFI20230724BHJP

G10L 19/008 20130101ALI20230724BHJP

【ＦＩ】

G10L19/038

G10L19/008 100

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2023501297

(86)(22)【出願日】2021-07-05

(85)【翻訳文提出日】2023-03-03

(86)【国際出願番号】 EP2021068527

(87)【国際公開番号】W WO2022008454

(87)【国際公開日】2022-01-13

(31)【優先権主張番号】20184555.9

(32)【優先日】2020-07-07

(33)【優先権主張国・地域又は機関】EP

(81)【指定国・地域】

(71)【出願人】

【識別番号】500341779

【氏名又は名称】フラウンホーファー－ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン

(74)【代理人】

【識別番号】100085660

【弁理士】

【氏名又は名称】鈴木均

(74)【代理人】

【識別番号】100149892

【弁理士】

【氏名又は名称】小川弥生

(74)【代理人】

【識別番号】100185672

【弁理士】

【氏名又は名称】池田雅人

(72)【発明者】

【氏名】ラヴェリ，エマニュエル

(72)【発明者】

【氏名】マルコヴィック，ゴラン

(72)【発明者】

【氏名】キーネ，ヤンフレデリック

(72)【発明者】

【氏名】ロイテルフーバー，フランツ

(72)【発明者】

【氏名】デーラ，シュテファン

(72)【発明者】

【氏名】フォトポウロウ，エレニ

(57)【要約】

複数のオーディオ情報項目を量子化するためのオーディオ量子化器であって、第１段ベクトル量子化結果と、第１段ベクトル量子化結果に対応する複数の中間量子化項目とを決定するために、複数のオーディオ情報項目を量子化するための第１段ベクトル量子化器（１４１、１４３）と、複数の中間量子化項目および複数のオーディオ情報項目から複数の残差項目を計算するための残差項目決定器（１４２）と、第２段ベクトル量子化結果を取得するために複数の残差項目を量子化するための第２段ベクトル量子化器（１４５）であって、第１段ベクトル量子化結果および第２段ベクトル量子化結果が複数のオーディオ情報項目の量子化された表現である、第２段ベクトル量子化器（１４５）と、を含む。
【選択図】図９ａ

【特許請求の範囲】

【請求項1】

複数のオーディオ情報項目を量子化するためのオーディオ量子化器であって、
第１段ベクトル量子化結果と、第１段ベクトル量子化結果に対応する複数の中間量子化項目とを決定するために、複数のオーディオ情報項目を量子化するための前記第１段ベクトル量子化器（１４１、１４３）と、
前記複数の中間量子化項目および前記複数のオーディオ情報項目から複数の残差項目を計算するための残差項目決定器（１４２）と、
第２段ベクトル量子化結果を取得するために前記複数の残差項目を量子化するための第２段ベクトル量子化器（１４５）であって、前記第１段ベクトル量子化結果および前記第２段ベクトル量子化結果が前記複数のオーディオ情報項目の量子化された表現である、前記第２段ベクトル量子化器（１４５）と
を含む、オーディオ量子化器。

【請求項2】

前記残差項目決定器（１４２）が、各残差項目について、対応するオーディオ情報項目と対応する中間量子化項目との間の差を計算するように構成される、請求項１に記載のオーディオ量子化器。

【請求項3】

前記残差項目決定器（１４２）は、各残差項目について、前記複数の残差項目が対応する差よりも大きくなるように、対応するオーディオ情報項目と対応する中間量子化項目との間の差を増幅または重み付けするか、あるいは、前記残差項目を取得するために増幅された項目間の差を計算する前に、前記複数のオーディオ情報項目および／または前記複数の中間量子化項目を増幅または重み付けするように構成される、請求項１または２に記載のオーディオ量子化器。

【請求項4】

前記残差項目決定器（１４２）が、前記複数の中間量子化項目と前記オーディオ情報項目との間の対応する差を１よりも小さい所定のファクタで除算するか、または、前記複数の中間量子化項目と前記オーディオ情報項目との間の対応する差に１よりも大きい所定のファクタを乗算するように構成される、
請求項１から３のいずれか１つに記載のオーディオ量子化器。

【請求項5】

前記第１段ベクトル量子化器（１４１、１４３）が第１の量子化精度で量子化を実行するように構成され、前記第２段ベクトル量子化器（１４５）が第２の量子化精度で量子化を実行するように構成され、前記第２の量子化精度が前記第１の量子化精度よりも低いかまたは高いか、あるいは
前記第１段ベクトル量子化器（１４１、１４３）が固定レート量子化を実行するように構成され、前記第２段ベクトル量子化器（１４５）が可変レート量子化を実行するように構成される、
請求項１から４のいずれか１つに記載のオーディオ量子化器。

【請求項6】

前記第１段ベクトル量子化器（１４１、１４３）が、第１の数のエントリを有する第１段コードブックを使用するように構成され、前記第２段ベクトル量子化器（１４５）が、第２の数のエントリを有する第２段コードブックを使用するように構成され、前記第２の数のエントリが前記第１の数のエントリよりも少ないかまたは多い、請求項１から５のいずれか１つに記載のオーディオ量子化器。

【請求項7】

前記オーディオ情報項目が、時間領域においてオーディオ信号の時間領域オーディオサンプルをスケーリングするために使用可能な、またはスペクトル領域においてオーディオ信号のスペクトル領域オーディオサンプルをスケーリングするために使用可能な、オーディオ信号のフレームのためのスケールパラメータであり、各スケールパラメータが、少なくとも２つの時間領域またはスペクトル領域オーディオサンプルをスケーリングするために使用可能であり、前記フレームが第１の数のスケールパラメータを含み、
前記第１段ベクトル量子化器（１４１、１４３）が、前記第１の数のスケールパラメータの、スケールパラメータの２つ以上のセットへのスプリットを実行するように構成され、前記第１段ベクトル量子化器（１４１、１４３）が、前記第１の量子化結果を表す複数の量子化インデックスを取得するためにスケールパラメータの各セットについて量子化インデックスを決定するように構成される、
請求項１から６のいずれか１つに記載のオーディオ量子化器。

【請求項8】

前記第１段ベクトル量子化器（１４１、１４３）が、前記第１の量子化結果として単一のインデックスを取得するために前記第１のセットについての第１の量子化インデックスと前記第２のセットについての第２の量子化インデックスとを結合するように構成される、請求項７に記載のオーディオ量子化器。

【請求項9】

前記第１段ベクトル量子化器（１４１、１４３）が、前記単一のインデックスを取得するために、前記第１のインデックスおよび前記第２のインデックスのうちの１つに前記第１のインデックスおよび前記第２のインデックスのビット数に対応する数を乗算し、乗算されたインデックスと乗算されていないインデックスとを加算するように構成される、
請求項８に記載のオーディオ量子化器。

【請求項10】

前記第２段ベクトル量子化器（１４５）が代数ベクトル量子化器であり、各インデックスがベース・コードブック・インデックスとボロノイ拡張インデックスとを含む、
請求項１から９のいずれか１つに記載のオーディオ量子化器。

【請求項11】

前記第１段ベクトル量子化器（１４１、１４３）が、前記複数のオーディオ情報項目の第１のスプリットを実行するように構成され、
前記第２段ベクトル量子化器（１４５）が、前記複数の残差項目の第２のスプリットを実行するように構成され、
前記第１のスプリットが前記オーディオ情報項目の第１の数のサブセットをもたらし、前記第２のスプリットが残差項目の第２の数のサブセットをもたらし、サブセットの前記第１の数がサブセットの前記第２の数に等しい、
請求項１から１０のいずれか１つに記載のオーディオ量子化器。

【請求項12】

前記第１のベクトル量子化器が、第１のコードブック探索から、第１のビット数を有する第１のインデックスを出力するように構成され、
前記第２のベクトル量子化器が、第２のコードブック探索のために、第２のビット数を有する第２のインデックスを出力するように構成され、前記第２のビット数が前記第１のビット数よりも少ないかまたは多い、
請求項１から１１のいずれか１つに記載のオーディオ量子化器。

【請求項13】

前記第１のビット数が４から７の間のビット数であり、前記第２のビット数が３から６の間のビット数である、
請求項１２に記載のオーディオ量子化器。

【請求項14】

前記オーディオ情報項目が、マルチチャネルオーディオ信号の第１のフレームについて、マルチチャネルオーディオ信号の第１のチャネルのための第１の複数のスケールパラメータ、およびマルチチャネルオーディオ信号の第２のチャネルのための第２の複数のスケールパラメータを含み、
前記オーディオ量子化器が、第１段ベクトル量子化器および第２段ベクトル量子化器を、第１の複数の第１のフレームおよび第２の複数の第１のフレームに適用するように構成され、
前記オーディオ情報項目が、マルチチャネルオーディオ信号の第２のフレームについて、第３の複数のミッド・スケール・パラメータおよび第４の複数のサイド・スケール・パラメータを含み、
前記オーディオ量子化器が、前記第１段ベクトル量子化器および前記第２段ベクトル量子化器を前記第３の複数のミッド・スケール・パラメータに適用し、前記第２のベクトル量子化器段を前記第４の複数のサイド・スケール・パラメータに適用し、前記第１段ベクトル量子化器（１４１、１４３）を前記第４の複数のサイド・スケール・パラメータに適用しないように構成される、
請求項１から１３のいずれか１つに記載のオーディオ量子化器。

【請求項15】

前記残差項目決定器（１４２）が、前記第２のフレームについて、前記第４の複数のサイド・スケール・パラメータを増幅または重み付けするように構成され、前記第２段ベクトル量子化器（１４５）が、前記マルチチャネルオーディオ信号の前記第２のフレームについて、増幅または重み付けされたサイド・スケール・パラメータを処理するように構成される、
請求項１４に記載のオーディオ量子化器。

【請求項16】

量子化された複数のオーディオ情報項目を逆量子化するためのオーディオ逆量子化器であって、
複数の中間量子化オーディオ情報項目を取得するために、前記量子化された複数のオーディオ情報項目に含まれる第１段ベクトル量子化結果を逆量子化するための第１段ベクトル逆量子化器（２２２０）と、
複数の残差項目を取得するために、前記量子化された複数のオーディオ情報項目に含まれる第２段ベクトル量子化結果を逆量子化するための第２段ベクトル逆量子化器（２２６０）と、
逆量子化された複数のオーディオ情報項目を取得するために、前記複数の中間量子化情報項目と前記複数の残差項目とを結合するための結合器（２２４０）と
含む、オーディオ逆量子化器。

【請求項17】

前記結合器（２２４０）が、逆量子化された各情報項目について、対応する中間量子化オーディオ情報項目と対応する残差項目との和を計算するように構成される、請求項１６に記載のオーディオ逆量子化器。

【請求項18】

前記結合器（２２４０）が、減衰された残差項目が、減衰を実行する前の対応する残差項目よりも小さくなるように、複数の残差項目を減衰または重み付けするように構成され、
前記結合器（２２４０）が、前記減衰された残差項目を前記対応する中間量子化オーディオ情報項目に加算するように構成されるか、
あるいは
前記結合器（２２４０）が、結合を実行する前に前記複数の残差項目もしくはジョイント符号化スケーリングパラメータを減衰させるために１よりも小さい減衰値もしくは重み付け値を使用するように構成され、前記結合が、減衰された残差値を使用して実行され、および／または
例示的に、前記重み付け値もしくは前記減衰値が、スケーリングパラメータに前記重み付け値もしくは前記増幅値を乗算するために使用され、前記重み付け値が、好ましくは０．１から０．９の間、もしくはより好ましくは０．２から０．６の間、もしくはさらにより好ましくは０．２５から０．４の間であり、および／または
前記複数の残差項目のすべてのスケーリングパラメータもしくは任意のジョイント符号化スケーリングパラメータのために同じ前記減衰値もしくは前記重み付け値が使用される、
請求項１６または１７に記載のオーディオ逆量子化器。

【請求項19】

前記結合器（２２４０）が、対応する残差項目に１よりも小さい重み付けファクタを乗算するか、または、対応する残差項目を１よりも大きい重み付けファクタで除算するように構成される、請求項１８に記載のオーディオ逆量子化器。

【請求項20】

前記第１段逆量子化器が、第１の精度で逆量子化を実行するように構成され、
前記第２段逆量子化器が、第２の精度で逆量子化を実行するように構成され、前記第２の精度が前記第１の精度よりも低いかまたは高い、
請求項１６から１９のいずれか１つに記載のオーディオ逆量子化器。

【請求項21】

前記第１段逆量子化器が、第１の数のエントリを有する第１段コードブックを使用するように構成され、前記第２段逆量子化器が、第２の数のエントリを有する第２段コードブックを使用するように構成され、前記第２の数のエントリが、前記第１の数のエントリよりも少ないかまたは多いか、あるいは
前記第１段逆量子化器が、前記第１のコードブック取出しのために、第１のビット数を有する第１のインデックスを受信するように構成され、
前記第２段ベクトル逆量子化器（２２６０）が、前記第２のコードブック取出しのために、第２のビット数を有する第２のインデックスを受信するように構成され、前記第２のビット数が前記第１のビット数よりも少ないかもしくは多いか、または、例示的に、前記第１のビット数が４から７の間のビット数であり、例示的に、前記第２のビット数が３から６の間のビット数である、
請求項１６から２０のいずれか１つに記載のオーディオ逆量子化器。

【請求項22】

前記逆量子化された複数のオーディオ情報項目が、時間領域においてオーディオ信号の時間領域オーディオサンプルをスケーリングするために使用可能な、またはスペクトル領域においてオーディオ信号のスペクトル領域オーディオサンプルをスケーリングするために使用可能な、オーディオ信号のフレームのためのスケールパラメータであり、各スケールパラメータが、少なくとも２つの時間領域またはスペクトル領域オーディオサンプルをスケーリングするために使用可能であり、前記フレームが第１の数のスケールパラメータを含み、
前記第１段逆量子化器が、前記第１段ベクトル量子化結果についての２つ以上の結果インデックスから、スケールパラメータの第１のセットおよび第２のセットを決定するように構成され、
前記第１段ベクトル逆量子化器（２２２０）または前記結合器（２２４０）が、前記第１の数の中間量子化スケールパラメータを取得するために、スケールパラメータの前記第１のセットおよびスケールパラメータの前記第２のセットをベクトルに統合するように構成される、
請求項１６から２１のいずれか１つに記載のオーディオ逆量子化器。

【請求項23】

前記前記第１段ベクトル逆量子化器（２２２０）が、前記第１段逆量子化結果として、単一の結合されたインデックスを取り出し、前記２つ以上の結果インデックスを取得するために前記単一の結合されたインデックスを処理するように構成される、
請求項２２に記載のオーディオ逆量子化器。

【請求項24】

前記第１段逆量子化器が、除算から余りを決定することによって前記第１の結果インデックスを取り出し、前記除算から整数結果を決定することによって前記第２の結果インデックスを取り出すように構成される、
請求項２３に記載のオーディオ逆量子化器。

【請求項25】

前記第２段ベクトル逆量子化器（２２６０）が代数ベクトル逆量子化器であり、各インデックスがベース・コードブック・インデックスとボロノイ拡張インデックスとを含む、請求項１６から２４のいずれか１つに記載のオーディオ逆量子化器。

【請求項26】

前記第１段ベクトル逆量子化器（２２２０）または前記結合器（２２４０）が、オーディオ信号のフレームにおける量子化スプリットからのスケールパラメータの第１のセットおよびスケールパラメータの第２のセットを統合するように構成され、
前記第２段ベクトル逆量子化器（２２６０）が、残差パラメータのスプリットからの残差パラメータの第１のセットおよび残差パラメータの第２のセットを統合するように構成され、
前記第１のベクトル逆量子化器によって対処されるスプリットの数と、前記第２段ベクトル逆量子化器（２２６０）によって対処されるスプリットの別の数とが同じである、
請求項１６から２５のいずれか１つに記載のオーディオ逆量子化器。

【請求項27】

前記第１段ベクトル逆量子化器（２２２０）が、前記複数の中間量子化オーディオ情報項目を生成するために、第１のビット数を有する第１のインデックスを使用するように構成され、
前記第２段ベクトル逆量子化器（２２６０）が、前記複数の残差項目を取得するために、第２のビット数を有する第２のインデックスをインデックスとして使用するように構成され、前記第２のビット数が前記第１のビット数よりも少ないかまたは多い、
請求項１６から２６のいずれか１つに記載のオーディオ逆量子化器。

【請求項28】

前記第１のビット数が４から７の間であり、前記第２のビット数が３から６の間である、請求項２７に記載のオーディオ逆量子化器。

【請求項29】

前記量子化された複数のオーディオ情報項目が、マルチチャネルオーディオ信号の第１のフレームについて、前記マルチチャネルオーディオ信号の第１のチャネルのための第１の複数のスケールパラメータ、および前記マルチチャネルオーディオ信号の第２のチャネルのための第２の複数のスケールパラメータを含み、
前記オーディオ逆量子化器が、前記第１段ベクトル逆量子化器（２２２０）および前記第２段ベクトル逆量子化器（２２６０）を、前記第１の複数の前記第１のフレームおよび前記第２の複数の前記第１のフレームに適用するように構成され、
量子化された複数のオーディオ情報項目が、マルチチャネルオーディオ信号の第２のフレームについて、第３の複数のミッド・スケール・パラメータおよび第４の複数のサイド・スケール・パラメータを含み、
前記オーディオ逆量子化器が、前記第１段ベクトル逆量子化器（２２２０）および前記第２段ベクトル逆量子化器（２２６０）を前記第３の複数のミッド・スケール・パラメータに適用し、前記第２段ベクトル逆量子化器（２２６０）を前記第４の複数のサイド・スケール・パラメータに適用し、前記第１段ベクトル逆量子化器（２２２０）を前記第４の複数のサイド・スケール・パラメータに適用しないように構成される、
請求項１６から２８のいずれか１つに記載のオーディオ逆量子化器。

【請求項30】

結合器（２２４０）が、第４の複数のサイド・スケール・パラメータをさらに使用するかまたはさらに処理する前に、第２のフレームについて、第４の複数のサイド・スケール・パラメータを減衰させるように構成される、
請求項２９に記載のオーディオ逆量子化器。

【請求項31】

複数のオーディオ情報項目を量子化する方法であって、
第１段ベクトル量子化結果と、第１段ベクトル量子化結果に対応する複数の中間量子化項目とを決定するために、前記複数のオーディオ情報項目を第１段ベクトル量子化することと、
前記複数の中間量子化項目および前記複数のオーディオ情報項目から複数の残差項目を計算することと、
第２段ベクトル量子化結果を取得するために前記複数の残差項目を第２段ベクトル量子化することであって、前記第１段ベクトル量子化結果および前記第２段ベクトル量子化結果が前記複数のオーディオ情報項目の量子化された表現である、第２段ベクトル量子化することと
を含む、方法。

【請求項32】

量子化された複数のオーディオ情報項目を逆量子化する方法であって、
複数の中間量子化オーディオ情報項目を取得するために、前記量子化された複数のオーディオ情報項目に含まれる第１段ベクトル量子化結果を第１段ベクトル逆量子化することと、
複数の残差項目を取得するために、前記量子化された複数のオーディオ情報項目に含まれる第２段ベクトル量子化結果を第２段ベクトル逆量子化することと、
前記逆量子化された複数のオーディオ情報項目を取得するために、複数の中間量子化情報項目と複数の残差項目とを結合することと
を含む、方法。

【請求項33】

コンピュータまたはプロセッサ上で動作しているとき、請求項３１に記載の方法または請求項３２に記載の方法を実行するためのコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

仕様および好ましい実施形態
本発明は、オーディオ信号処理に関し、例えば、例えばＩＶＡＳのＭＤＣＴステレオ処理において適用され得る。
さらに、本発明は、ステレオスペクトル雑音整形パラメータのジョイントコーディングにおいて適用され得る。
スペクトル雑音整形は、量子化雑音が人間の耳によって最小限に知覚され、したがって、復号出力信号の知覚品質が最大化され得るように、周波数領域において量子化雑音を整形する。
スペクトル雑音整形は、ほとんどの最先端の変換ベース・オーディオ・コーデックにおいて使用される技法である。

【背景技術】

【0002】

アドバンスト・オーディオ・コーディング（ＡＡＣ）
この手法［１］［２］では、ＭＤＣＴスペクトルは、いくつかの不均一なスケールファクタ帯域に区分される。例えば、４８ｋＨｚでは、ＭＤＣＴは、１０２４個の係数を有し、４９個のスケールファクタ帯域に区分される。各帯域において、その帯域のＭＤＣＴ係数をスケーリングするためにスケールファクタが使用される。次いで、スケーリングされたＭＤＣＴ係数を量子化するために、一定のステップサイズを有するスカラ量子化器が用いられる。デコーダ側で、各帯域において逆スケーリングが実行され、これは、スカラ量子化器によってもたらされる量子化雑音を整形する。
４９個のスケールファクタは、サイド情報としてビットストリームに符号化される。スケールファクタの数が比較的多く、高精度が必要とされることにより、これらのスケールファクタを符号化するためには、通常、著しく多数のビットが必要である。これは、低ビットレートおよび／または低遅延において問題になり得る。

【0003】

ＭＤＣＴベースＴＣＸ
ＭＰＥＧ－ＤＵＳＡＣ［３］および３ＧＰＰ（登録商標）ＥＶＳ［４］規格において使用される変換ベース・オーディオ・コーデック、ＭＤＣＴベースＴＣＸでは、スペクトル雑音整形は、最近のＡＣＥＬＰベース音声コーデック（例えばＡＭＲ－ＷＢ）において使用されるものと同様の知覚フィルタ、ＬＰＣベース知覚フィルタの助けを借りて実行される。
この手法では、最初に、１６個の線形予測係数（ＬＰＣ）のセットが、事前強調された入力信号に関して推定される。ＬＰＣは、次いで、重み付けおよび量子化される。次いで、重み付けおよび量子化されたＬＰＣの周波数応答が、６４個の均一に離間した帯域において算出される。次いで、ＭＤＣＴ係数が、算出された周波数応答を使用して各帯域においてスケーリングされる。スケーリングされたＭＤＣＴ係数は、次いで、グローバル利得によって制御されるステップサイズを有するスカラ量子化器を使用して量子化される。デコーダにおいて、６４個の帯域すべてにおいて逆スケーリングが実行され、これは、スカラ量子化器によってもたらされる量子化雑音を整形する。
この手法は、ＡＡＣ手法に勝る明確な利点を有し、すなわち、これは、（ＡＡＣにおける４９個のパラメータとは対照的に）サイド情報として１６個の（ＬＰＣ）＋１（グローバル利得）パラメータのみの符号化を必要とする。その上、１６個のＬＰＣは、ＬＳＦ表現およびベクトル量子化器を用いることによって少ないビット数で効率的に符号化され得る。結果として、ＭＤＣＴベースＴＣＸの手法はＡＡＣの手法ほどサイド情報ビットを必要とせず、これは、低ビットレートおよび／または低遅延において著しい差をもたらし得る。

【0004】

改善されたＭＤＣＴベースＴＣＸ（心理音響ＬＰＣ）
改善されたＭＤＣＴベースＴＣＸシステムは、［５］において公開されている。この新しい手法では、（ＬＰＣを推定するための）自己相関は、もはや時間領域において実行されず、代わりに、ＭＤＣＴ係数エネルギーの逆変換を使用してＭＤＣＴ領域において算出される。これは、ＭＤＣＴ係数を６４個の不均一な帯域に単にグループ化し、各帯域のエネルギーを算出することによって、不均一な周波数スケールを使用することを可能にする。これはまた、自己相関を算出するために必要な複雑度を低減する。

【0005】

新しいスペクトル雑音整形（ＳＮＳ）
［６］に記載され、低複雑度通信コーデック（ＬＣ３／ＬＣ３ｐｌｕｓ）において実装されるスペクトル雑音整形のための改善された技法では、品質を実質的に損なわない低ビットレートが、エンコーダ側でより多数のスケールファクタを用いてスケーリングすることによって、およびエンコーダ側でスケールパラメータを１６個のスケールパラメータ（ＳＮＳパラメータ）の第２のセットにダウンサンプリングすることによって、取得され得る。したがって、一方では低ビットレートサイド情報が取得されるにもかかわらず、他方では、細かいスケーリングにより、オーディオ信号スペクトルの高品質スペクトル処理が取得される。

【0006】

ステレオ線形予測（ＳＬＰ）
［７］に記載されている論文では、線形予測係数のセットが、フレーム間予測を考慮するだけでなく、チャネルごとの予測をも考慮することによって算出される。計算された係数の２次元セットは、次いで、単一チャネルＬＰの場合と同様の技法を使用して、ただし論文の文脈における残差の量子化を考慮せずに、量子化および符号化される。しかしながら、説明された実装形態は、高遅延および著しい複雑度を伴い、したがって、低遅延を必要とするリアルタイム適用例、例えば通信システムにはやや適していない。
［８］に記載されているＭＤＣＴベースシステムのようなステレオシステムでは、周波数領域雑音整形を使用するスペクトルを「白色化領域」にスケーリングするために、離散ＬＲチャネル信号の前処理が実行される。次いで、最適な方法で白色化スペクトルを量子化およびコーディングするために、ジョイントステレオ処理が実行される。
前述したスペクトル雑音整形技法のためのスケーリングパラメータは、各チャネルについて独立して量子化符号化される。これは、ビットストリームを介してデコーダに送られる必要があるサイド情報のダブルビットレートをもたらす。

【発明の概要】

【発明が解決しようとする課題】

【0007】

本発明の目的は、改善されたまたはより効率的なコーディング／復号概念を提供することである。

【課題を解決するための手段】

【0008】

この目的は、請求項１に記載のオーディオ量子化器、請求項３１に記載の量子化方法、請求項３２に記載の逆量子化方法、または請求項３３に記載のコンピュータプログラムによって達成される。
本発明は、Ｌ、Ｒ信号、または、概して、マルチチャネル信号の２つ以上のチャネルが相関する場合に、ビットレート節約が取得され得るという発見に基づく。そのような場合、両方のチャネルのための抽出されたパラメータは、かなり類似している。したがって、パラメータのジョイント量子化符号化が適用され、これは、ビットレートの大幅な節約をもたらす。このビットレートの節約は、いくつかの異なる方向性において使用され得る。１つの方向性は、ステレオまたはマルチチャネル信号の全体的な知覚品質が改善されるように、節約されたビットレートをコア信号のコーディングに費やすことであり得る。別の方向性は、コア信号のコーディング、したがって全体的な知覚品質が改善されず、同じ品質のままである場合に、より低い全体的なビットレートに到達することである。

【0009】

好ましい実施形態では、第１の態様によれば、オーディオエンコーダが、マルチチャネルオーディオ信号の第１のチャネルのためのスケールパラメータの第１のセットおよびマルチチャネルオーディオ信号の第２のチャネルのためのスケールパラメータの第２のセットについて、ジョイント符号化スケールパラメータの第１のグループおよびジョイント符号化スケールパラメータの第２のグループを計算するためのスケールパラメータ計算器を含む。オーディオエンコーダは、さらに、スケールパラメータの第１のセットを第１のチャネルに適用し、スケールパラメータの第２のセットをマルチチャネルオーディオ信号の第２のチャネルに適用するための信号プロセッサを含む。信号プロセッサは、さらに、それぞれスケールパラメータの第１および第２のセットの適用によって取得された第１および第２のチャネルデータからマルチチャネル・オーディオ・データを導出する。オーディオエンコーダは、さらに、符号化マルチチャネルオーディオ信号を取得するために、マルチチャネル・オーディオ・データと、ジョイント符号化スケールパラメータの第１のグループに関する情報と、ジョイント符号化スケールパラメータの第２のグループに関する情報とを使用するための符号化信号形成器を有する。

【0010】

好ましくは、スケールパラメータ計算器は、マルチチャネルオーディオ信号の各フレームまたはサブフレームについて、スケールパラメータのジョイント符号化が実行されるべきであるのかスケールパラメータのセパレート符号化が実行されるべきであるのかの決定が行われるように、適応的であるように構成される。さらなる実施形態では、この決定は、考慮中のマルチチャネルオーディオ信号のチャネル間の類似性分析に基づく。詳細には、類似性分析は、ジョイント符号化パラメータのエネルギー、および詳細には、ジョイント符号化スケールパラメータの第１のグループおよび第２のグループからのスケールパラメータの１つのセットのエネルギーを計算することによって行われる。詳細には、スケールパラメータ計算器は、第１のグループを、対応する第１のスケールパラメータと第２のスケールパラメータとの和として計算し、第２のグループを、対応する第１のスケールパラメータと第２のスケールパラメータとの間の差として計算する。詳細には、第２のグループ、および好ましくは、差を表すスケールパラメータは、スケールパラメータのジョイント符号化が実行されるべきであるのかスケールパラメータのセパレート符号化が実行されるべきであるのかを判定するための類似度の決定のために使用される。この状況は、ステレオまたはマルチチャネルフラグを介してシグナリングされ得る。

【0011】

さらに、具体的には、２段量子化プロセスでスケールパラメータを量子化することが好ましい。第１段ベクトル量子化器は、第１段ベクトル量子化結果を決定し、第１段ベクトル量子化結果に対応する複数の中間量子化器項目を決定するために、複数のスケールパラメータ、または、概して、オーディオ情報項目を量子化する。さらに、量子化器は、複数の中間量子化項目および複数のオーディオ情報項目から複数の残差項目を計算するための残差項目決定器を含む。さらに、第２段ベクトル量子化結果を取得するために複数の残差項目を量子化するための第２段ベクトル量子化器が提供され、ここにおいて、第１段ベクトル量子化結果および第２段ベクトル量子化結果は、共に、一実施形態ではスケールパラメータである複数のオーディオ情報項目の量子化された表現を表す。詳細には、オーディオ情報項目は、ジョイント符号化スケールパラメータまたはセパレート符号化スケールパラメータのいずれかであり得る。さらに、他のオーディオ情報項目は、ベクトル量子化に有用である任意のオーディオ情報項目であり得る。詳細には、特定のオーディオ情報項目としてのスケールパラメータまたはスケールファクタとは別に、ベクトル量子化に有用な他のオーディオ情報項目は、ＭＤＣＴまたはＦＦＴラインなどのスペクトル値である。ベクトル量子化され得る、またさらなるオーディオ情報項目は、オーディオサンプリング値、または時間領域オーディオサンプルのグループ、またはスペクトル領域周波数ラインのグループ、またはＬＰＣデータ、あるいは、それがスペクトルエンベロープデータ表現であれ時間エンベロープデータ表現であれ、他のエンベロープデータなど、時間領域オーディオ値である。

【0012】

好ましい実装形態では、残差項目決定器は、各残差項目について、スケールパラメータなどの対応するオーディオ情報項目と、量子化されたスケールパラメータまたはスケールファクタなどの対応する中間量子化項目との間の差を計算する。さらに、残差項目決定器は、各残差項目について、複数の残差項目が対応する差よりも大きくなるように、対応するオーディオ情報項目と対応する中間量子化項目との間の差を増幅または重み付けするか、あるいは、残差項目を取得するために増幅された項目間の差を計算する前に、複数のオーディオ情報項目および／または複数の中間量子化項目を増幅または重み付けするように構成される。この手順によって、量子化誤差の有用な制御が行われ得る。詳細には、異なるスケールパラメータなどのオーディオ情報項目の第２のグループが非常に小さいとき、残差項目は、典型的には非常に小さく、これは、典型的には、ジョイント量子化が決定されたように第１のチャネルと第２のチャネルとが互いに相関するとき、当てはまる。したがって、残差項目が増幅されたとき、量子化の結果は、この増幅が実行されなかった場合と比較してより多くの０に量子化されない値を含むことになる。したがって、エンコーダまたは量子化側での増幅が有用であり得る。

【0013】

これは、別の好ましい実施形態の場合のように、差スケールパラメータなどのスケールパラメータのジョイント符号化された第２のグループの量子化が実行されるとき、特に当てはまる。これらのサイド・スケール・パラメータがいずれにしても小さいという事実により、増幅なしで、異なるスケールパラメータのほとんどがいずれにしても０に量子化される状況が生じ得る。したがって、ステレオ印象の損失、したがって心理音響品質の損失をもたらし得るこの状況を回避するために、ごく少量のサイド・スケール・パラメータが０に量子化されるか、またはサイド・スケール・パラメータのほとんどが０に量子化されないように増幅が実行される。これは、当然ながら、ビットレートの節約を低減する。しかしながら、この事実により、量子化された残差データ項目は、いずれにしてもごく小さく、すなわち、小さい値を表す量子化インデックスをもたらし、小さい値についての量子化インデックスがより高い値についての量子化インデックスよりも効率的に符号化されるので、ビットレートの増加は高すぎない。これは、より高い量子化インデックスよりもビットレートに対して小さい量子化インデックスをなお一層優先するエントロピーコーディング演算をさらに実行することによって、一層強化され得る。

【0014】

別の好ましい実施形態では、第１段ベクトル量子化器は、特定のコードブックを有するベクトル量子化器であり、第２段ベクトル量子化器は、量子化インデックスとして、コードブック番号と、ベースコードブック中のベクトルインデックスと、ボロノイインデックスとをもたらす代数ベクトル量子化器である。好ましくは、ベクトル量子化器と代数ベクトル量子化器の両方が、両方の量子化器が同じスプリットレベル手順を有するスプリット・レベル・ベクトル量子化を実行するように構成される。さらに、第１および第２段ベクトル量子化器は、第１段ベクトル量子化器結果のビット数、したがって精度が、第２段ベクトル量子化器結果のビット数または精度よりも大きいか、あるいは、第１段ベクトル量子化器結果のビット数、したがって精度が、第２段ベクトル量子化器結果のビット数または精度と異なるように構成される。他の実施形態では、第１段ベクトル量子化器は固定ビットレートを有し、第２段ベクトル量子化器は可変ビットレートを有する。したがって、概して、第１段ベクトル量子化器の特性と第２段ベクトル量子化器の特性は、互いに異なる。
第１の態様による、符号化オーディオ信号を復号するためのオーディオデコーダの好ましい実施形態では、オーディオデコーダは、ジョイント符号化スケールパラメータに関する情報を復号するためのスケール・パラメータ・デコーダを含む。さらに、オーディオデコーダは信号プロセッサを有し、ここで、スケール・パラメータ・デコーダは、信号プロセッサによってその後使用されるスケールパラメータの第１のセットのためのスケールパラメータおよびスケールパラメータの第２のセットのためのスケールパラメータを取得するために、異なる結合規則を使用して第１のグループのうちのジョイント符号化スケールパラメータと第２のグループのうちのジョイント符号化スケールパラメータとを結合するように構成される。

【0015】

本発明のさらなる態様によれば、第１段ベクトル逆量子化器と、第２段ベクトル逆量子化器と、逆量子化された複数のオーディオ情報項目を取得するために第１段ベクトル逆量子化器によって取得された複数の中間量子化器情報項目と第２段ベクトル逆量子化器から取得された複数の残差項目とを結合するための結合器とを含むオーディオ逆量子化器が提供される。
ジョイント・スケール・パラメータ・コーディングの第１の態様は、２段ベクトル量子化に関する第２の態様と組み合わせられ得る。一方、２段ベクトル量子化の態様は、左チャネルのためのスケールパラメータおよび右チャネルのためのスケールパラメータなど、セパレート符号化スケールパラメータに適用され得るか、または、別の種類のオーディオ情報項目としてミッド・スケール・パラメータに適用され得る。したがって、２段ベクトル量子化の第２の態様は、第１の態様から独立して、または第１の態様と共に適用され得る。

【0016】

続いて、本発明の好ましい実施形態が要約される。
変換ベース（ＭＤＣＴ）コーディングが使用されるステレオシステムでは、エンコーダ側で周波数領域雑音整形を実行するための導入部分において説明された技法のいずれかから抽出されたスケーリングパラメータは、ビットストリームにサイド情報として含まれるように量子化およびコーディングされる必要がある。次いで、デコーダ側で、スケーリングパラメータが復号され、量子化雑音を最小限に知覚されるように整形するように各チャネルのスペクトルをスケーリングするために使用される。
２つのチャネル、すなわち左チャネルおよび右チャネルのスペクトル雑音整形パラメータの独立したコーディングが適用され得る。
スペクトル雑音整形スケーリングパラメータは、２つのチャネル間の相関度に応じて、適応的に、独立してコーディングされるかまたはジョイントコーディングされる。要約すると、
・スケーリングパラメータのミッド／サイド表現が算出される
・サイドパラメータのエネルギーが計算される。
・２つの信号間の相関度を示すエネルギーに応じて、パラメータが、以下のようにコーディングされる。
・独立して－現在の手法のように、各チャネルについて、例えば２段ベクトル量子化（ＶＱ）を使用して
・ジョイント－
ｏミッドベクトルは、例えば２段ベクトル量子化を使用して符号化される。サイドベクトルは、より粗い量子化方式を使用して、例えば、第１段ＶＱ出力がゼロの量子化された値を含むと仮定し、第２段量子化、例えば代数ベクトル量子化器（ＡＶＱ）のみを適用することによって、符号化される
ｏ量子化されたサイドベクトルがゼロであるか否かをシグナリングするために１つの追加ビットが使用される
・２つのチャネルがジョイントコーディングされるのか独立してコーディングされるのかをシグナリングするための追加の１ビットがデコーダに送られる

【0017】

図２４では、［８］に詳細に記載されているように、ＭＤＣＴステレオ・ベース・エンコーダの実装形態が示されている。［８］に記載されているステレオシステムの不可欠な部分は、「白色化」スペクトルに対してステレオ処理が実行されることである。したがって、各チャネルは前処理を受け、ここで、各フレームについて、ウィンドウ処理の後に、時間領域ブロックはＭＤＣＴ領域に変換され、次いで、時間雑音整形（ＴＮＳ）が、信号特性に応じてスペクトル雑音整形（ＳＮＳ）の前または後のいずれかに、適応的に適用される。スペクトル雑音整形の後に、効率的に白色化スペクトル係数を量子化およびコーディングするために、ジョイントステレオ処理、すなわち、適応的な帯域ごとのＭ－Ｓ、Ｌ／Ｒ判定が実行される。次のステップとして、ステレオ・インテリジェント・ギャップ充填（ＩＧＦ）分析が行われ、それぞれの情報ビットがビットストリームに書き込まれる。最後に、処理された係数が量子化およびコーディングされる。図１と同様の参照番号が付されている。スケーリングファクタの計算および処理は、図２４中の２つのＴＮＳブロック間のブロックＳＮＳにおいて行われる。ブロックウィンドウは、ウィンドウ処理演算を示す。ブロックＭＣＬＴは、修正複素重複変換を表す。ブロックＭＤＣＴは、修正離散コサイン変換を表す。ブロックパワースペクトルは、パワースペクトルの計算を表す。ブロック、ブロック切替え判定は、ウィンドウ処理のために使用されるブロック長を決定するための入力信号の分析を表す。ブロックＴＮＳは、時間雑音整形を表し、この特徴は、ブロックＳＮＳにおけるスペクトルのスケーリングの前または後のいずれかに実行される。

【0018】

［７］に記載されているＭＤＣＴステレオコーデック実装形態では、周波数領域雑音整形を使用するスペクトルを「白色化領域」にスケーリングするために、エンコーダ側で離散Ｌ－Ｒチャネルの前処理が実行される。次いで、最適な方法で白色化スペクトルを量子化およびコーディングするために、ジョイントステレオ処理が実行される。
デコーダ側で、図２５に示され、［８］に記載されているように、符号化信号が復号され、逆量子化および逆ステレオ処理が実行される。次いで、各チャネルのスペクトルが、ビットストリームから取り出されたスペクトル雑音整形パラメータによって「脱白色化」される。図１と同様の参照番号が付されている。スケールファクタの復号および処理は、図２５中のブロック２２０において行われる。図に示されたブロックは、図２４中のエンコーダ中のブロックに関連し、典型的には、対応する逆演算を実行する。ブロック「ウィンドウおよびＯＬＡ」は、時間領域出力信号ＬおよびＲを取得するために合成ウィンドウ処理演算ならびに後続の重複および加算演算を実行する。

【0019】

ここで、［８］におけるシステムにおいて適用される周波数領域雑音整形（ＦＤＮＳ）は、［６］に記載されているようにＳＮＳと置き換えられる。ＳＮＳの処理経路のブロック図は、それぞれエンコーダおよびデコーダについての図１および図２のブロック図に示されている。
好ましくは、品質を実質的に損なわない低ビットレートが、エンコーダ側でより多数のスケールファクタを用いてスケーリングすることによって、およびエンコーダ側でスケールパラメータをスケールパラメータまたはスケールファクタの第２のセットにダウンサンプリングすることによって、取得され得、ここで、その後出力インターフェースを介して符号化および送信または記憶される第２のセット中のスケールパラメータは、第１の数のスケールパラメータよりも少ない。したがって、エンコーダ側で、一方で細かいスケーリングが取得され、他方で低ビットレートが取得される。
デコーダ側で、送信された少数のスケールファクタが、スケールファクタの第１のセットを取得するためにスケール・ファクタ・デコーダによって復号され、ここで、第１のセット中のスケールファクタまたはスケールパラメータの数は、第２のセットのうちのスケールファクタまたはスケールパラメータの数よりも大きく、次いで、再び、細かくスケーリングされたスペクトル表現を取得するために、より多数のスケールパラメータを使用する細かいスケーリングがスペクトルプロセッサ内のデコーダ側で実行される。
したがって、一方では低ビットレートが取得されるにもかかわらず、他方では、オーディオ信号スペクトルの高品質スペクトル処理が取得される。

【0020】

好ましい実施形態において行われるようなスペクトル雑音整形は、極めて低いビットレートのみを使用して実施される。したがって、このスペクトル雑音整形は、低ビットレート変換ベース・オーディオ・コーデックにおいても不可欠なツールであり得る。スペクトル雑音整形は、量子化雑音が人間の耳によって最小限に知覚され、したがって、復号出力信号の知覚品質が最大化され得るように、周波数領域において量子化雑音を整形する。
好ましい実施形態は、スペクトル表現のエネルギーなど、振幅関連測度から計算されたスペクトルパラメータに依拠する。詳細には、帯域ごとのエネルギー、または、概して、帯域ごとの振幅関連測度が、スケールパラメータのための基礎として計算され、ここで、帯域ごとの振幅関連測度を計算する際に使用される帯域幅は、人間の聴覚の特性に可能な限り近づくために、より低い帯域からより高い帯域に増加する。好ましくは、スペクトル表現の帯域への分割は、よく知られているバークスケールに従って行われる。

【0021】

さらなる実施形態では、線形領域スケールパラメータが計算され、詳細には、多数のスケールパラメータを有するスケールパラメータの第１のセットについて計算され、この多数のスケールパラメータは、対数状領域に変換される。対数状領域は、概して、小さい値が拡大され、高い値が圧縮される領域である。次いで、スケールパラメータのダウンサンプリングまたはデシメーション演算が、１０を底とする対数領域または２を底とする対数領域であり得る対数状領域において行われ、ここで、実装目的では後者が好ましい。次いで、スケールファクタの第２のセットが対数状領域において計算され、好ましくは、スケールファクタの第２のセットのベクトル量子化が実行され、ここで、スケールファクタは対数状領域中にある。したがって、ベクトル量子化の結果は、対数状領域スケールパラメータを示す。スケールファクタまたはスケールパラメータの第２のセットは、例えば、第１のセットのうちのスケールファクタの数の１／２、さらには１／３、またさらにより好ましくは１／４の数のスケールファクタを有する。次いで、スケールパラメータの第２のセット中の量子化された少数のスケールパラメータがビットストリーム中に取り込まれ、次いで、エンコーダ側からデコーダ側に送信されるか、または、同じくこれらのパラメータを使用して処理された量子化されたスペクトルと共に符号化オーディオ信号として記憶され、ここで、この処理は、グローバル利得を使用した量子化をさらに含む。しかしながら、好ましくは、エンコーダは、再び、これらの量子化された対数状領域の第２のスケールファクタから、スケールファクタの第３のセットである線形領域スケールファクタのセットを導出し、スケールファクタの第３のセット中のスケールファクタの数は、第２の数よりも大きく、好ましくは、第１のスケールファクタの第１のセット中のスケールファクタの第１の数にさえ等しい。次いで、エンコーダ側で、これらの補間されたスケールファクタはスペクトル表現を処理するために使用され、ここで、処理されたスペクトル表現は最終的に量子化され、ハフマン符号化、算術符号化、またはベクトル量子化ベース符号化など、何らかの方法でエントロピー符号化される。

【0022】

スペクトル表現の符号化表現と共に少数のスペクトルパラメータを有する符号化信号を受信するデコーダにおいて、少数のスケールパラメータは多数のスケールパラメータに補間され、すなわち、スケールパラメータの第１のセットを取得するために補間され、ここで、スケールファクタまたはスケールパラメータの第２のセットのうちのスケールファクタのスケールパラメータの数が、第１のセットのうちのスケールパラメータの数、すなわち、スケール・ファクタ／パラメータ・デコーダによって計算されたセットよりも小さい。次いで、符号化オーディオ信号を復号するための装置内に位置するスペクトルプロセッサが、スケーリングされたスペクトル表現を取得するためにスケールパラメータのこの第１のセットを使用して復号スペクトル表現を処理する。次いで、スケーリングされたスペクトル表現を変換するための変換器が、好ましくは時間領域中にある復号オーディオ信号を最終的に取得するように動作する。

【0023】

さらなる実施形態は、以下に記載される追加の利点をもたらす。好ましい実施形態では、スペクトル雑音整形は、［６］または［８］または［１］において使用されるスケールファクタと同様の１６個のスケーリングパラメータの助けを借りて実行される。これらのパラメータは、（従来技術３の６４個の不均一な帯域と同様の）６４個の不均一な帯域におけるＭＤＣＴスペクトルのエネルギーを最初に算出し、次いで、６４個のエネルギーに何らかの処理（平滑化、プリエンファシス、雑音フロア、対数変換）を適用し、次いで、６４個の処理されたエネルギーを４倍でダウンサンプリングして１６個のパラメータを取得することによって、エンコーダにおいて取得され、これらのパラメータは、最終的に正規化およびスケーリングされる。これらの１６個のパラメータは、次いで、ベクトル量子化を使用して（従来技術２／３において使用されるものと同様のベクトル量子化を使用して）量子化される。量子化されたパラメータは、次いで、６４個の補間されたスケーリングパラメータを取得するために補間される。これらの６４個のスケーリングパラメータは、次いで、６４個の不均一な帯域においてＭＤＣＴスペクトルを直接整形するために使用される。従来技術２および３と同様に、スケーリングされたＭＤＣＴ係数は、次いで、グローバル利得によって制御されるステップサイズを有するスカラ量子化器を使用して量子化される。

【0024】

さらなる実施形態では、好ましくはサイド・スケール・パラメータに関連する第２のグループなど、２つのグループのうちの１つのためのジョイント符号化スケールパラメータに関する情報は、量子化インデックスまたは他の量子化ビットを含まないが、第２のグループのためのスケールパラメータがオーディオ信号の一部分またはフレームについてすべてゼロであることを示すフラグまたは単一ビットなどの情報のみを含む。この情報は、分析または他の手段によってエンコーダによって決定され、オーディオ信号の時間部分またはフレームについてゼロ・スケール・パラメータを生成することなどによって、この情報に基づいてスケールパラメータの第２のグループを合成するためにデコーダによって使用されるか、あるいは、ジョイント符号化スケールパラメータの第１のグループのみを使用してスケールパラメータの第１のセットおよび第２のセットを計算するためにデコーダによって使用される。
さらなる実施形態では、ジョイント符号化スケールパラメータの第２のグループは、好ましくは可変レート量子化器段である、２段量子化器のうちの第２の量子化段のみを使用して量子化される。この場合、第１段はすべてゼロの量子化された値をもたらすと仮定され、したがって、第２段のみが有効である。またさらなる実施形態では、好ましくは固定レート量子化段である２段量子化器のうちの第１の量子化段のみが適用され、第２段は、オーディオ信号の時間部分またはフレームについてまったく使用されない。このケースは、すべての残差項目がゼロ、あるいは第２の量子化段の最小または第１の量子化ステップサイズよりも小さいと仮定される状況に対応する。
続いて、本発明の好ましい実施形態が添付の図面に関して説明される。

【図面の簡単な説明】

【0025】

【図1】第１の態様によるデコーダを示す図である。

【図2】第１の態様によるエンコーダを示す図である。

【図3a】第１の態様による別のエンコーダを示す図である。

【図3b】第１の態様によるエンコーダの別の実装形態を示す図である。

【図4a】第１の態様によるデコーダのさらなる実施形態を示す図である。

【図4b】デコーダの別の実施形態を示す図である。

【図5】エンコーダのさらなる実施形態を示す図である。

【図6】エンコーダのさらなる実施形態を示す図である。

【図7a】第１または第２の態様によるベクトル量子化器の好ましい実装形態を示す図である。

【図7b】第１または第２の態様によるさらなる量子化器を示す図である。

【図8a】本発明の第１の態様によるデコーダを示す図である。

【図8b】本発明の第１の態様によるエンコーダを示す図である。

【図9a】本発明の第２の態様によるエンコーダを示す図である。

【図9b】本発明の第２の態様によるデコーダを示す図である。

【図10】第１または第２の態様によるデコーダの好ましい実装形態を示す図である。

【図11】オーディオ信号を符号化するための装置のブロック図である。

【図12】図１のスケールファクタ計算器の好ましい実装形態の概略表現である。

【図13】図１のダウンサンプラの好ましい実装形態の概略表現である。

【図14】図４のスケール・ファクタ・エンコーダの概略表現である。

【図15】図１のスペクトルプロセッサの概略図である。

【図16】スペクトル雑音整形（ＳＮＳ）を実施する、一方のエンコーダおよび他方のデコーダの概略的な表現である。

【図17】スペクトル雑音整形（ＳＮＳ）と共に時間雑音整形（ＴＮＳ）が実施される、一方のエンコーダ側および他方のデコーダ側のより詳細な表現である。

【図18】符号化オーディオ信号を復号するための装置のブロック図である。

【図19】図８のスケール・ファクタ・デコーダ、スペクトルプロセッサおよびスペクトルデコーダの詳細を示す概略図である。

【図20】６４個の帯域へのスペクトルの再分割を示す図である。

【図21】一方でのダウンサンプリング演算および他方での補間演算の概略図である。

【図22a】重複するフレームを有する時間領域オーディオ信号を示す図である。

【図22b】図１の変換器の一実装形態を示す図である。

【図22c】図８の変換器の概略図である。

【図23】異なる本発明の手順を比較するヒストグラムである。

【図24】エンコーダの一実施形態を示す図である。

【図25】デコーダの一実施形態を示す図である。

【発明を実施するための形態】

【0026】

図８は、２つ以上のオーディオチャネルについてのデータを含むマルチチャネル・オーディオ・データと、ジョイント符号化スケールパラメータに関する情報とを含む符号化オーディオ信号を復号するためのオーディオデコーダを示す。デコーダは、スケール・パラメータ・デコーダ２２０と、図８ａでは単一のアイテムとして示されている信号プロセッサ２１０、２１２、２１３とを含む。スケール・パラメータ・デコーダ２２０は、スケールパラメータのジョイント符号化された第１のグループおよび第２のグループに関する情報を受信し、ここで、好ましくは、スケールパラメータの第１のグループはミッド・スケール・パラメータであり、スケールパラメータの第２のグループはサイド・スケール・パラメータである。好ましくは、信号プロセッサは、マルチチャネル・オーディオ・データの第１のチャネル表現およびマルチチャネル・オーディオ・データの第２のチャネル表現を受信し、マルチチャネル・オーディオ・データから導出された第１のチャネル表現にスケールパラメータの第１のセットを適用し、マルチチャネル・オーディオ・データから導出された第２のチャネル表現にスケールパラメータの第２のセットを適用して、図８ａのブロック２１０、２１２、２１３の出力において復号オーディオ信号の第１のチャネルおよび第２のチャネルを取得する。好ましくは、ジョイント符号化スケールパラメータは、ミッド・スケール・パラメータなどのジョイント符号化スケールパラメータの第１のグループに関する情報と、サイド・スケール・パラメータなどのジョイント符号化スケールパラメータの第２のグループに関する情報とを含む。さらに、スケール・パラメータ・デコーダ２２０は、スケールパラメータの第１のセットのうちのスケールパラメータを取得するために第１の結合規則を使用して、第１のグループのうちのジョイント符号化スケールパラメータと第２のグループのうちのジョイント符号化スケールパラメータとを結合し、スケールパラメータの第２のセットのうちのスケールパラメータを取得するために第１の結合規則とは異なる第２の結合規則を使用して、第１のグループおよび第２のグループのうちの同じ両方のジョイント符号化スケールパラメータを結合するように構成される。したがって、スケール・パラメータ・デコーダ２２０は、２つの異なる結合規則を適用する。

【0027】

好ましい実施形態では、２つの異なる結合規則は、一方ではプラスまたは加算結合規則であり、他方では減算または差結合規則である。しかしながら、他の実施形態では、第１の結合規則は乗算結合規則であり得、第２の結合規則は商または除算結合規則であり得る。したがって、結合規則のすべての他のペアも、スケールパラメータの第１のグループおよび第２のグループまたは第１のセットおよび第２のセットのうちの対応するスケールパラメータの表現に応じて有用である。

【0028】

図８ｂは、２つ以上のチャネルを含むマルチチャネルオーディオ信号を符号化するための対応するオーディオエンコーダを示す。オーディオエンコーダは、スケールパラメータ計算器１４０と、信号プロセッサ１２０と、符号化信号形成器１４８０、１５００とを含む。スケールパラメータ計算器１４０は、マルチチャネルオーディオ信号の第１のチャネルのためのスケールパラメータの第１のセットおよびマルチチャネルオーディオ信号の第２のチャネルのためのスケールパラメータの第２のセットから、ジョイント符号化スケールパラメータの第１のグループおよびジョイント符号化スケールパラメータの第２のグループを計算するために構成される。さらに、信号プロセッサは、スケールパラメータの第１のセットをマルチチャネルオーディオ信号の第１のチャネルに適用し、スケールパラメータの第２のセットをマルチチャネルオーディオ信号の第２のチャネルに適用し、符号化マルチチャネル・オーディオ・データを導出するために構成される。マルチチャネル・オーディオ・データは、スケーリングされた第１および第２のチャネルから導出され、マルチチャネル・オーディオ・データは、図８ｂ中のブロック１５００の出力において符号化マルチチャネルオーディオ信号を取得するために、ジョイント符号化スケールパラメータの第１のグループおよび第２のグループに関する情報と共に、符号化信号形成器１４８０、１５００によって使用される。

【0029】

図１は、図８ａのデコーダのさらなる実装形態を示す。詳細には、ビットストリームは信号プロセッサ２１０に入力され、信号プロセッサ２１０は、典型的には、スケーリングまたは白色化されたチャネルのインテリジェントギャップ充填手順（ＩＧＦ手順）および逆ステレオ処理と共にエントロピー復号および逆量子化を実行する。ブロック２１０の出力は、マルチチャネル信号のスケーリングまたは白色化復号された左および右、または、概して、いくつかの復号チャネルである。ビットストリームは、セパレート符号化の場合の左および右のスケールパラメータのためのサイド情報ビットと、図１においてＭ、Ｓスケールパラメータとして示されているスケーリングされたジョイント符号化スケールパラメータのためのサイド情報ビットとを含む。このデータは、スケール・パラメータまたはスケール・ファクタ・デコーダ２２０に導入され、スケール・パラメータまたはスケール・ファクタ・デコーダ２２０は、その出力において、復号された左スケールファクタおよび復号された右スケールファクタを生成し、復号された左スケールファクタおよび復号された右スケールファクタは、次いで、スペクトル整形ブロック２１２、２３０において適用されて、最終的に、左および右の好ましくはＭＤＣＴスペクトルが取得され、このＭＤＣＴスペクトルは、次いで、特定の逆ＭＤＣＴ演算を使用して時間領域に変換され得る。

【0030】

対応するエンコーダ側実装形態が図２において与えられる。図２は、スペクトル整形器１２０ａに入力される左および右チャネルを有するＭＤＣＴスペクトルから始まり、スペクトル整形器１２０ａの出力は、例えば、ステレオ処理、エンコーダ側でのインテリジェントギャップ充填演算、ならびに対応する量子化および（エントロピー）コーディング演算を実行するプロセッサ１２０ｂに入力される。したがって、ブロック１２０ａ、１２０ｂは、共に、図８ｂの信号プロセッサ１２０を表す。さらに、ＳＮＳ（スペクトル雑音整形）スケールファクタ算出ブロック１２０ｂにおいて実行されるスケールファクタの計算の目的で、ＭＤＳＴスペクトルも提供され、ＭＤＳＴスペクトルは、ＭＤＣＴスペクトルと共に、パワースペクトル計算器１１０ａに転送される。代替的に、パワースペクトル計算器１１０ａは、ＭＤＣＴまたはＭＤＳＴスペクトル手順なしで入力信号に対して直接動作することができる。別の方法は、例えば、ＭＤＣＴおよびＭＤＳＴ演算ではなく、ＤＦＴ演算からパワースペクトルを計算することである。さらに、スケールファクタは、スケールファクタの量子化符号化ブロックとして図２に示されている、スケールパラメータ計算器１４０によって計算される。詳細には、ブロック１４０は、第１のチャネルと第２のチャネルとの間の類似性に応じて、左および右のセパレート符号化スケールファクタ、または、ＭおよびＳのジョイント符号化スケールファクタのいずれかを出力する。これは、図２においてブロック１４０の右側に示されている。したがって、この実装形態では、ブロック１１０ｂは、左および右のスケールファクタを計算し、次いで、ブロック１４０は、セパレート符号化、すなわち、左および右スケールファクタについての符号化が、ジョイント符号化スケールファクタ、すなわち、一方での加算および他方での減算など、２つの異なる結合規則によってセパレート・スケール・ファクタから導出されたＭおよびＳスケールファクタの符号化よりも良いのか悪いのかを決定する。
ブロック１４０の結果は、Ｌ、ＲまたはＭ、Ｓのサイド情報ビットであり、これらは、ブロック１２０ｂの結果と共に、図２に示されている出力ビットストリームに導入される。

【0031】

図３ａは、図２または図８ｂのエンコーダの好ましい実装形態を示す。第１のチャネルは、第１のチャネル、すなわちチャネルＬのためのセパレート・スケール・パラメータを決定するブロック１１００ａに入力される。さらに、第２のチャネルは、第２のチャネル、すなわちＲのためのセパレート・スケール・パラメータを決定するブロック１１００ｂに入力される。次いで、左チャネルのためのスケールパラメータおよび右チャネルのためのスケールパラメータは、対応して、第１のチャネルのためのダウンサンプラ１３０ａおよび第２のチャネルのためのダウンサンプラ１３０ｂによってダウンサンプリングされる。結果は、左チャネルのためのダウンサンプリングされたパラメータ（ＤＬ）および右チャネルのためのダウンサンプリングされたパラメータ（ＤＲ）である。
次いで、これらのデータＤＬおよびＤＲの両方が、ジョイント・スケール・パラメータ決定器１２００に入力される。ジョイント・スケール・パラメータ決定器１２００は、ミッドまたはＭスケールパラメータなどのジョイント符号化スケールパラメータの第１のグループ、およびサイドまたはＳスケールパラメータなどのジョイント符号化スケールパラメータの第２のグループを生成する。両方のグループが、対応するベクトル量子化器１４０ａ、１４０ｂにおいて入力されて、量子化された値が取得され、量子化された値は、次いで、最終エントロピーエンコーダ１４０ｃにあり、ジョイント符号化スケールパラメータに関する情報を取得するために符号化されることになる。
エントロピーエンコーダ１４０ｃは、算術エントロピー符号化アルゴリズム、あるいは、一次元の、または一次元以上のハフマン・コード・テーブルを用いたエントロピー符号化アルゴリズムを実行するように実装され得る。

【0032】

エンコーダの別の実装形態が図３ｂに示されており、ここで、ダウンサンプリングは、図３ａ中の１３０ａ、１３０ｂに示されているような左および右でなど、セパレート・スケール・パラメータで実行されない。代わりに、ジョイント・スケール・パラメータ決定および対応するダウンサンプラ１３０ａ、１３０ｂによる後続のダウンサンプリングの演算の順序が変更されている。図３ａの実装形態が使用されるのか図３ｂの実装形態が使用されるのかは特定の実装形態に依存し、ここで、図３ａの実装形態が選好されるが、それは、ジョイント・スケール・パラメータ決定１２００が、ダウンサンプリングされたスケールパラメータに対してすでに実行されている、すなわち、スケールパラメータ計算器１４０によって実行される２つの異なる結合規則が、典型的には、図３ｂの場合と比較してより少数の入力に対して実行されるからである。

【0033】

図４ａは、２つ以上のオーディオチャネルについてのデータを含むマルチチャネル・オーディオ・データと、ジョイント符号化スケールパラメータに関する情報とを有する符号化オーディオ信号を復号するためのデコーダの実装形態を示す。ただし、信号プロセッサの一部、詳細には、対応するチャネルスケーラ２１２ａ、２１２ｂのみが図４ａに示されているので、図４ａ中のデコーダは図８ａのデコーダ全体の一部にすぎない。スケール・パラメータ・デコーダ２２０に関して、この要素は、図３ａ中の対応するブロック１４０ｃによって実行される手順を逆にするエントロピーデコーダ２２００を含む。さらに、エントロピーデコーダは、量子化されたＭスケールパラメータおよび量子化されたＳスケールパラメータなど、量子化されたジョイント符号化スケールパラメータを出力する。スケールパラメータの対応するグループは、ＭおよびＳの逆量子化された値を取得するために逆量子化器２２０２および２２０４に入力される。これらの逆量子化された値は、次いで、左および右のスケールパラメータ、すなわちセパレート・スケール・パラメータを出力するセパレート・スケール・パラメータ決定器２２０６に入力される。これらの対応するスケールパラメータは補間器２２２ａ、２２２ｂに入力されて、左の補間されたスケールパラメータ（ＩＬ）および右の補間されたスケールパラメータ（ＩＲ）が取得される。これらのデータの両方が、それぞれチャネルスケーラ２１２ａ、２１２ｂに入力される。さらに、チャネルスケーラは、例えば、図１中のブロック２１０によって行われた手順全体の後に、対応して第１のチャネル表現を受信する。対応して、チャネルスケーラ２１２ｂはまた、図１中のブロック２１０によって出力されたその対応する第２のチャネル表現を取得する。次いで、図１において「ＭＤＣＴスペクトル」として示されている左および右の整形スペクトルチャネルを取得するために、最終チャネルスケーリングまたは図１において称するように「スペクトル整形」が行われる。次いで、時間領域表現においてマルチチャネルオーディオ信号の復号された第１のチャネルおよび復号された第２のチャネルを最終的に取得するために、２４０ａ、２４０ｂに示されている各チャネルについての最終周波数領域－時間領域変換が実行され得る。

【0034】

詳細には、図４ａの左部分に示されているスケール・パラメータ・デコーダ２２０は、図１に示されているようにまたは図４ａにまとめて示されているように、オーディオデコーダ内に含まれ得るが、スケール・パラメータ・エンコーダ１４０の出力においてローカル・スケール・パラメータ・デコーダ２２０を明示的に示す図５に関して示されるように、エンコーダ内のローカルデコーダとしても含まれ得る。
図４ｂは、図４ａに関して、補間とセパレート・スケール・パラメータを決定するためのスケールパラメータ決定との順序が交換されるさらなる実装形態を示す。詳細には、補間は、図４ｂの補間器２２２ａ、２２２ｂを使用してジョイント符号化スケールパラメータＭおよびＳで行われ、ＩＭおよびＩＳなど、補間されたジョイント符号化スケールパラメータが、セパレート・スケール・パラメータ決定器２２０６に入力される。次いで、ブロック２２０６の出力は、アップサンプリングされたスケールパラメータ、すなわち、例えば図２１に示されている６４個の帯域の各々についてのスケールパラメータである。

【0035】

図５は、図８ｂ、図２または図３ａ、図３ｂのエンコーダのさらなる好ましい実装形態を示す。第１のチャネルおよび第２のチャネルは、両方とも、図５の１００ａ、１００ｂなど、任意選択の時間領域－周波数領域変換器に導入される。ブロック１００ａ、１００ｂによって出力されたスペクトル表現は、左および右チャネルについてのスペクトル表現を個別にスケーリングするチャネルスケーラ１２０ａに入力される。したがって、チャネルスケーラ１２０ａは、図２の１２０ａに示されているスペクトル整形演算を実行する。チャネルスケーラの出力は、図５のチャネルプロセッサ１２０ｂに入力され、ブロック１２０ｂの処理されたチャネル出力は、符号化信号形成器１４８０、１５００に入力されて、符号化オーディオ信号が取得される。
さらに、セパレートまたはジョイント符号化スケールパラメータの決定の目的で、時間領域において直接第１のチャネルおよび第２のチャネルを入力として受信する類似性計算器１４００が提供される。代替的に、類似性計算器は、時間領域－周波数領域変換器１００ａ、１００ｂの出力、すなわちスペクトル表現において第１のチャネルおよび第２のチャネルを受信することができる。

【0036】

図６に関して、２つのチャネル間の類似性が、ジョイント符号化スケールパラメータの第２のグループに基づいて、すなわち、サイド・スケール・パラメータに基づいて計算されることが概説されるが、この類似性はまた、ジョイント符号化スケールパラメータの明示的な計算なしに直接、時間領域またはスペクトル領域チャネルに基づいて計算され得ることに留意されたい。代替的に、類似性はまた、ジョイント符号化スケールパラメータの第１のグループに基づいて、すなわち、ミッド・スケール・パラメータに基づいて決定され得る。詳細には、サイド・スケール・パラメータのエネルギーが閾値よりも低いとき、ジョイント符号化が実行され得ると決定される。同様に、フレーム中のミッド・スケール・パラメータのエネルギーも測定され得、例えば、ミッド・スケール・パラメータのエネルギーが別の閾値よりも大きいとき、ジョイント符号化の決定が行われ得る。したがって、スケールパラメータのジョイントコーディングまたはスケールパラメータのセパレートコーディングを判定するために第１のチャネルと第２のチャネルとの間の類似性を決定するための多くの異なる方法が実施され得る。それにもかかわらず、スケールパラメータのジョイントまたはセパレートコーディングの決定は、必ずしもチャネルについてのジョイント・ステレオ・コーディングの決定、すなわち、２つのチャネルがミッド／サイド表現を使用してジョイントコーディングされるのかＬ、Ｒ表現においてセパレートコーディングされるのかの決定と同一である必要はないことに留意されたい。スケールパラメータのジョイント符号化の決定は、実際のチャネルについてのステレオ処理の決定とは無関係に行われるが、それは、図２中のブロック１２０ｂにおいて実行される任意の種類のステレオ処理の決定が、ミッドおよびサイドのスケールファクタを使用するスペクトルのスケーリングまたは整形の後に、およびそれに続いて行われるからである。詳細には、図２に示されているように、ブロック１４０はジョイントコーディングを決定することができる。したがって、ブロック１４０を指す図２中の矢印によって示されているように、ＭおよびＳのスケールファクタが、このブロック内で生じ得る。図５のエンコーダ内のローカル・スケール・パラメータ・デコーダ２２０の適用の場合、スペクトルを整形するために実際に使用されるスケールパラメータは、左のスケールパラメータおよび右のスケールパラメータであるが、それにもかかわらず、ミッドおよびサイドの符号化および復号スケールパラメータから導出される。

【0037】

図５に関して、モード判定器１４０２が提供される。モード判定器１４０２は、類似性計算器１４００の出力を受信し、チャネルが十分に類似していないとき、スケールパラメータのセパレートコーディングを判定する。しかしながら、チャネルが類似していると決定されたとき、スケールパラメータのジョイントコーディングがブロック１４０２によって決定され、情報、スケールパラメータのセパレートコーディングが適用されるのか変更ジョイントコーディングが適用されるのかは、図５に示されている対応するサイド情報またはフラグ１４０３によってシグナリングされ、これは、ブロック１４０２から符号化信号形成器１４８０、１５００に提供される。さらに、エンコーダは、第１のチャネルのためのスケールパラメータおよび第２のチャネルのためのスケールパラメータを受信し、モード判定器１４０２によって制御されるようにスケールパラメータをセパレート符号化またはジョイント符号化するスケール・パラメータ・エンコーダ１４０を含む。スケール・パラメータ・エンコーダ１４０は、一実施形態では、チャネルスケーラ１２０ａが対応する第１および第２のチャネル・スケール・パラメータを用いたスケーリングを実行するように、破線で示されるように第１および第２のチャネルのためのスケールパラメータを出力し得る。しかしながら、エンコーダ内でローカル・スケール・パラメータ・デコーダ２２０を適用することが好ましく、それにより、逆量子化されたスケールパラメータがエンコーダにおいてチャネルスケーリングのために適用されるように、ローカルに符号化および復号されたスケールパラメータを用いてチャネルスケーリングが行われる。これは、少なくともチャネルスケーリングまたはスペクトル整形のための使用されるスケールパラメータに関して、エンコーダおよびデコーダ中のチャネルスケーラ内でまったく同じ状況が発生するという利点を有する。

【0038】

図６は、オーディオエンコーダに関する本発明のさらなる好ましい実施形態を示す。例えば、ＭＤＣＴアルゴリズムを適用する時間領域－周波数領域変換器であり得るＭＤＣＴスペクトル計算器１００が提供される。さらに、図２に示されているように、パワースペクトル計算器１１０ａが提供される。セパレート・スケール・パラメータは、対応する計算器１１００、ならびにジョイント符号化スケールパラメータを計算する目的で、加算ブロック１２００ａおよび減算ブロック１２００ｂによって、計算される。次いで、類似性を決定する目的で、サイドパラメータ、すなわち、ジョイント符号化スケールパラメータの第２のグループを用いたフレームごとのエネルギー計算が実行される。ブロック１４０６において、閾値との比較が実行され、図５のフレームのためのモード判定器１４０２と同様であるこのブロックは、対応するフレームについてのモードフラグまたはステレオフラグを出力する。さらに、情報は、現在のフレームにおいてセパレートまたはジョイントコーディングを実行する制御可能エンコーダに与えられる。この目的で、制御可能エンコーダ１４０は、ブロック１１００によって計算されたスケールパラメータ、すなわち、セパレート・スケール・パラメータを受信し、さらに、ジョイント符号化スケールパラメータ、すなわち、ブロック１２００ａおよび１２００ｂによって決定されたスケールパラメータを受信する。

【0039】

ブロック１４０は、好ましくは、フレームのすべてのサイドパラメータが０に量子化されるとブロック１４０が決定したとき、フレームについてゼロフラグを生成する。この結果は、第１のチャネルと第２のチャネルが互いに極めて近く、チャネル間の差、したがってスケールファクタ間の差が、これらの差がブロック１４０に含まれる量子化器によって適用される最低量子化閾値よりも小さくなるようなものであるときに生じる。ブロック１４０は、対応するフレームについてジョイント符号化またはセパレート符号化スケールパラメータに関する情報を出力する。
図９ａは、複数のオーディオ情報項目を量子化するためのオーディオ量子化器を示す。オーディオ量子化器は、第１段ベクトル量子化結果１４６を決定するために、スケールファクタまたはスケールパラメータまたはスペクトル値など、複数のオーディオ情報項目を量子化するための第１段ベクトル量子化器１４１、１４３を含む。さらに、ブロック１４１、１４３は、第１段ベクトル量子化結果に対応する複数の中間量子化項目を生成する。中間量子化項目は、例えば、第１段結果に関連する値である。第１段結果が、例えば１６個の特定の（量子化された）値を有する特定のコードブックを識別したとき、中間量子化項目は、第１段結果１４６であるコードブック・ベクトル・インデックスに関連する１６個の値である。第１段ベクトル量子化器１４１、１４３への入力における中間量子化項目およびオーディオ情報項目は、複数の中間量子化項目および複数のオーディオ情報項目から複数の残差項目を計算するための残差項目決定器に入力されるこれは、例えば、元の項目と量子化された項目との間の各項目についての差を計算することによって行われる。残差項目は、第２段ベクトル量子化結果を取得するために複数の残差項目を量子化するための第２段ベクトル量子化器１４５に入力される。次いで、ブロック１４１、１４３の出力における第１段ベクトル量子化結果およびブロック１４５の出力における第２段結果は、共に、複数のオーディオ情報項目の量子化された表現を表し、量子化された表現は任意選択の符号化信号形成器１４８０、１５００によって符号化され、符号化信号形成器１４８０、１５００は量子化されたオーディオ情報項目を出力し、量子化されたオーディオ情報項目は、好ましい実施形態では、量子化されるだけでなく、さらにエントロピー符号化される。

【0040】

対応するオーディオ逆量子化器が図９ｂに示されている。オーディオ逆量子化器は、複数の中間量子化オーディオ情報項目を取得するために、量子化された複数のオーディオ情報項目に含まれる第１段量子化結果を逆量子化するための第１段ベクトル逆量子化器２２２０を含む。さらに、第２段ベクトル逆量子化器２２６０が提供され、複数の残差項目を取得するために、量子化された複数のオーディオ情報項目に含まれる第２段ベクトル量子化結果を逆量子化するために構成される。ブロック２２２０からの中間項目とブロック２２６０からの残差項目の両方が、逆量子化された複数のオーディオ情報項目を取得するために複数の中間量子化オーディオ項目と複数の残差項目とを結合するための結合器２２４０によって結合される。詳細には、ブロック２２２０の出力における中間量子化項目は、ＬおよびＲなど、セパレート符号化スケールパラメータ、または、例えばＭのジョイント符号化スケールパラメータの第１のグループであり、残差項目は、ジョイント符号化サイド・スケール・パラメータ、例えば、すなわち、ジョイント符号化スケールパラメータの第２のグループを表し得る。

【0041】

図７ａは、図９ａの第１段ベクトル量子化器１４１、１４３の好ましい実装形態を示す。ステップ７０１において、第１の量子化インデックスを取得するために、スケールパラメータの第１のサブセットのベクトル量子化が実行される。ステップ７０２において、第２の量子化インデックスを取得するために、スケールパラメータの第２のサブセットのベクトル量子化が実行される。さらに、実装形態に応じて、任意選択のインデックスである第３の量子化インデックスを取得するために、ブロック７０３に示されているように、スケールパラメータの第３のサブセットのベクトル量子化が実行される。図７ａの手順は、スプリットレベル量子化があるときに適用される。例示的に、オーディオ入力信号は、図２１に示されている６４個の帯域に分離される。これらの６４個の帯域は、１６個の帯域／スケールファクタにダウンサンプリングされ、それにより、帯域全体が１６個のスケールファクタによってカバーされる。これらの１６個のスケールファクタは、図７ａに示されているスプリットレベルモードで第１段ベクトル量子化器１４１、１４３によって量子化される。元の６４個のスケールファクタをダウンサンプリングすることによって取得された図２１の１６個のスケールファクタのうちの最初の８つのスケールファクタは、ステップ７０１によってベクトル量子化され、したがって、スケールパラメータの第１のサブセットを表す。８つの上側帯域のための残りの８つのスケールパラメータは、ステップ７０２においてベクトル量子化されるスケールパラメータの第２のサブセットを表す。実装形態に応じて、スケールパラメータまたはオーディオ情報項目のセット全体の分離は、必ずしも正確に２つのサブセットで行われる必要がなく、３つのサブセットまたはさらに多くのサブセットでも行われ得る。

【0042】

いくつのスプリットが実行されるかとは無関係に、各レベルについてのインデックスは、共に、第１段結果を表す。図１４に関して説明されるように、これらのインデックスは、単一の第１段インデックスを有するように図１４中のインデックス結合器を介して結合され得る。代替的に、第１段結果は、第１のインデックス、第２のインデックス、および潜在的な第３のインデックス、ならびに、おそらく、さらに多くのインデックスから構成され得、これらのインデックスは、結合されないがそのままエントロピー符号化される。

【0043】

第１段結果を形成する対応するインデックスに加えて、ステップ７０１、７０２、７０３は、フレームのための残差スケールパラメータを計算する目的でブロック７０４において使用される中間スケールパラメータをも提供する。したがって、例えば図９ａのブロック１４２によって実行されるステップ７０５は、残差スケールパラメータをもたらし、残差スケールパラメータは、次いで、第２段結果を生成するためにステップ７０５によって実行される（代数）ベクトル量子化によって処理される。したがって、第１段結果および第２段結果は、セパレート・スケール・パラメータＬ、セパレート・スケール・パラメータＲ、およびジョイント・スケール・パラメータＭの第１のグループについて生成される。しかしながら、図７ｂに示されているように、ジョイントコーディングされたスケールパラメータまたはサイド・スケール・パラメータの第２のグループの（代数）ベクトル量子化は、好ましい実装形態ではステップ７０５と同一であるステップ７０６によってのみ実行され、図９ａのブロック１４２によって再び実行される。

【0044】

さらなる実施形態では、好ましくはサイド・スケール・パラメータに関連する第２のグループなど、２つのグループのうちの１つのためのジョイント符号化スケールパラメータに関する情報は、量子化インデックスも他の量子化ビットも含まないが、第２のグループのためのスケールパラメータがオーディオ信号の一部分またはフレームについてすべてゼロであるか、あるいは、すべて、小さい値などの特定の値にあることを示すフラグまたは単一ビットなどの情報のみを含む。この情報は、分析または他の手段によってエンコーダによって決定され、オーディオ信号の時間部分もしくはフレームについてゼロ・スケール・パラメータを生成すること、または、特定の値のスケールパラメータを生成すること、または、例えばすべてが最小もしくは第１の量子化段よりも小さい、小さいランダム・スケール・パラメータを生成することなどによって、この情報に基づいてスケールパラメータの第２のグループを合成するためにデコーダによって使用されるか、あるいは、ジョイント符号化スケールパラメータの第１のグループのみを使用してスケールパラメータの第１のセットおよび第２のセットを計算するためにデコーダによって使用される。したがって、図７ａ中の段７０５を実行する代わりに、ジョイント符号化スケールパラメータの第２のグループについてのすべてゼロのフラグのみが第２段結果として書き込まれる。ブロック７０４中の計算は、この場合も省略され得、すべてゼロのフラグがアクティブ化され、送信されることになるか否かを判定するための判定器に置き換えられ得る。この判定器は、Ｓパラメータ全体のコーディングのスキップを示すユーザ入力またはビットレート情報によって制御され得るか、あるいは、残差項目の分析を実際に実行することができる。したがって、すべてゼロのビットを有するフレームについて、スケール・パラメータ・デコーダは、いかなる結合も実行せず、第１のグループのうちの符号化スケールパラメータを２で除算することによって、または別の所定の値を使用して重み付けすることによってなど、ジョイント符号化スケールパラメータの第１のグループのみを使用してスケールパラメータの第２のセットを計算する。

【0045】

さらなる実施形態では、ジョイント符号化スケールパラメータの第２のグループは、好ましくは可変レート量子化器段である、２段量子化器のうちの第２の量子化段のみを使用して量子化される。この場合、第１段はすべてゼロの量子化された値をもたらすと仮定され、したがって、第２段のみが有効である。このケースは図７ｂに示されている。
またさらなる実施形態では、好ましくは固定レート量子化段である、図７ａ中の２段量子化器のうちの７０１、７０２、７０３などの第１の量子化段のみが適用され、第２段７０５は、オーディオ信号の時間部分またはフレームについてまったく使用されない。このケースは、すべての残差項目がゼロ、あるいは第２の量子化段の最小または第１の量子化ステップサイズよりも小さいと仮定される状況に対応する。次いで、図７ｂ、項目７０６は、図７ａの項目７０１、７０２、７０３に対応し、項目７０４も同様に省略され得、第１段量子化のみが使用されることまたは使用されないことを判定するための判定器に置き換えられ得る。この判定器は、ユーザ入力またはビットレート情報によって制御され得るか、あるいは、残差項目の分析を実際に実行して、残差項目が非常に小さく、単一段のみによって量子化されたジョイント符号化スケールパラメータの第２のグループの精度が十分であると決定することができる。

【0046】

図１４にさらに示されている本発明の好ましい実装形態では、代数ベクトル量子化器１４５は、スプリットレベル計算をさらに実行し、好ましくは、ベクトル量子化器によって実行されるのと同じスプリットレベル演算を実行する。したがって、残差値のサブセットは、帯域番号に関して、スケールパラメータのサブセットに対応する。２つのスプリットレベルを有する場合、すなわち、図２１の最初の８つのダウンサンプリングされた帯域について、代数ベクトル量子化器１４５は第１レベル結果を生成する。さらに、代数ベクトル量子化器１４５は、上位８つのダウンサンプリングされたスケールファクタまたはスケールパラメータ、あるいは、概して、オーディオ情報項目について、第２レベル結果を生成する。
好ましくは、代数ベクトル量子化器１４５は、参照（４）として言及されるＥＴＳＩＴＳ１２６４４５Ｖ１３．２．０（２０１６－０８）のセクション５．２．３．１．６．９において定義される代数ベクトル量子化器として実装され、ここで、対応するスプリットマルチレート格子ベクトル量子化の結果は、各８つの項目についてのコードブック番号、ベースコードブック中のベクトルインデックス、および８次元ボロノイインデックスである。しかしながら、単一のコードブックのみを有する場合、コードブック番号は回避され得、ベースコードブック中のベクトルインデックスおよび対応するｎ次元ボロノイインデックスのみで十分である。したがって、代数ベクトル量子化結果のための各レベルについて、項目ａ、項目ｂおよび項目ｃ、または項目ｂおよび項目ｃのみであるこれらの項目は、第２段量子化結果を表す。

【0047】

続いて、本発明の第１または第２の態様による、あるいは両方の態様による、図７ａ、図７ｂの符号化または図１４の符号化と一致する対応する復号演算を示す図１０を参照する。
図１０のステップ２２２１において、量子化されたミッド・スケール・ファクタ、すなわち、ジョイント符号化スケールファクタの第２のグループが取り出される。これは、図５のステレオ・モード・フラグまたは項目１４０３が真の値を示すときに行われる。次いで、図１４のエンコーダによって、詳細には、図１４に関して説明されたかまたは図７ａに関して説明された代数ベクトル量子化器１４５によって行われた手順を再実行するために、第１段復号２２２３および第２段復号２２６１が実行される。ステップ２２２５において、サイド・スケール・ファクタはすべて０であると仮定される。ステップ２２６１において、０フラグ値によって、フレームについて非ゼロ量子化スケールファクタが実際にもたらされるかどうかがチェックされる。０フラグ値が、フレームについて非ゼロ・サイド・スケール・ファクタがあることを示す場合、量子化されたサイド・スケール・ファクタは、第２段復号２２６１を使用して、または図７ｂのブロック７０６のみを実行して取り出され、復号される。ブロック２２０７において、ジョイント符号化スケールパラメータは、量子化された左および右スケールパラメータをその後出力するためにセパレート符号化スケールパラメータに変換され、量子化された左および右スケールパラメータは、次いで、デコーダにおけるスペクトルの逆スケーリングのために使用され得る。
ステレオ・モード・フラグ値がゼロの値を示すとき、またはセパレートコーディングがフレーム内で使用されたと決定されたとき、左および右スケールファクタについて第１段復号２２２３および第２段復号２２６１のみが実行され、左および右スケールファクタはすでにセパレート符号化表現中にあるので、ブロック２２０７などの変換は必要とされない。エンコーダ側でのステレオ処理の前およびデコーダ側での逆ステレオ処理の後にスペクトルをスケーリングするために必要とされるＳＮＳスケールファクタを効率的にコーディングおよび復号するプロセスは、コメント付きの例示的な擬似コードとして本発明の好ましい実装形態を示すために、以下で説明される。

【0048】

スケールファクタのジョイント量子化およびコーディング

【0049】

パラメータを表すために、任意の種類の量子化、例えば、均一または非均一なスカラ量子化およびエントロピーまたは算術コーディングが使用され得る。説明された実装形態では、アルゴリズム説明から分かるように、２段ベクトル量子化方式が実施される。
・第１段－各々５ビットを用いる２つのスプリット（各々８次元）、したがって、１０ビットを用いてコーディングされる
・第２段－代数ベクトル量子化（ＡＶＱ）、同じく２スプリットで、残差のスケーリングを伴い、ここで、コードブックインデックスがエントロピーコーディングされ、したがって、可変ビットレートを使用する。
高度に相関するチャネルのためのサイド信号は小さいと見なされ得るので、対応するＳＮＳパラメータを表すには、例えば縮小スケールの第２段ＡＶＱのみを使用することで十分である。これらの信号について第１段ＶＱをスキップすることによって、ＳＮＳパラメータのコーディングについての著しい複雑度およびビット節約が達成され得る。

【0050】

実施される量子化の各段の擬似コード記述が以下で与えられる。各スプリットについて５ビットを使用する２スプリットベクトル量子化を伴う第１段。

【0051】

第２段代数ベクトル量子化。

【0052】

コーディングプロセスから出力されたインデックスは、最終的に、ビットストリームにパックされ、デコーダに送られる。
第２段について上記で開示されたＡＶＱ手順は、ＭＤＣＴベースＴＣＸの章において高レートＬＰＣ（サブクローズ５．３．３．２．１．３）に関してＥＶＳにおいて概説されるように実施されるのが好ましい。具体的には、５．３．３．２．１．３．４代数ベクトル量子化器と記載されている、使用される第２段代数ベクトル量子化器、および量子化のために使用される代数ＶＱについて、改良点がサブクローズ５．２．３．１．６．９に記載されている。一実施形態では、各インデックスについて、ベース・コードブック・インデックスのためのコードワードのセットと、ボロノイインデックスのためのコードワードのセットとを有し、これはすべてエントロピーコーディングされ、したがって可変ビットレートのものである。したがって、各サブバンドｊにおけるＡＶＱのパラメータは、コードブック番号、ベースコードブック中のベクトルインデックス、およびｎ次元（８次元など）ボロノイインデックスから構成される。

【0053】

スケールファクタの復号
デコーダ側において、インデックスがビットストリームから抽出され、スケールファクタの量子化された値を復号し、導出するために使用される。手順の擬似コード例が以下で与えられる。

【0054】

２段復号の手順は、以下の擬似コードにおいて詳細に説明される。

【0055】

２段復号の手順は、以下の擬似コードにおいて詳細に説明される

【0056】

第１段から取り出された量子化されたＳＮＳスケールファクタは、第２段において残差を復号することによって改良される。手順は、以下の擬似コードにおいて与えられる。

【0057】

エンコーダ側での残差のスケーリングまたは増幅／重み付けと、デコーダ側でのスケーリングまたは減衰／重み付けとに関して、重み付けファクタは、各値について別々に計算されないか、またはスプリットされず、（複雑度を回避するための近似として）単一の重みまたは少数の異なる重みが、すべてのパラメータをスケーリングするために使用される。このスケーリングは、例えば、粗い量子化（ゼロへのさらなる量子化）のビットレート節約と量子化精度（それぞれのスペクトル歪みを伴う）とのトレードオフを決定する要因であり、この所定の値がデコーダに送信される必要がなく、送信ビットを節約するためにデコーダにおいて固定的に設定または初期化され得るように、エンコーダにおいて予め決定され得る。したがって、残差のより高いスケーリングは、より多くのビットを必要とするが、最小のスペクトル歪みを有し、スケールを縮小すると、追加ビットが節約され、スペクトル歪みが許容可能な範囲に保たれる場合、それは、追加のビットレート節約の手段として機能し得る。

【0058】

好ましい実施形態の利点
・２つのチャネルが相関し、ＳＮＳパラメータがジョイントコーディングされるときの大幅なビット節約。
前のセクションにおいて説明されたシステムにおいて達成されるビット毎フレーム節約の一例が以下に示される。
ｏ独立－平均８８．１ビット
ｏ新規の独立－平均７２．０ビット
ｏ新規のジョイント－平均５２．１ビット
ここで、
ｏ「独立」は、２つのチャネルを２段ＶＱで独立してのみコーディングする、ＦＤＮＳのためにＳＮＳ［６］を使用する［８］に記載されているＭＤＣＴステレオ実装形態である
・第１段－８ビットトレーニング済みコードブック（１６次元）
・第２段－４倍でスケーリングされた残差のＡＶＱ（可変ビットレート）
ｏ「新規の独立」は、本発明の前に説明された実施形態を指し、ここで、２つのチャネルの相関が十分に高くなく、それらが、上記で説明されたように新規のＶＱ２段手法を使用してセパレートコーディングされ、残差が２．５の低減されたファクタでスケーリングされる。
ｏ「新規のジョイント」は、（同じく上記で説明された）ジョイントコーディングされたケースを指し、この場合も、第２段において、残差は２．５の低減されたファクタでスケーリングされる。
・提案された方法の別の利点は、計算複雑度の節約である。［６］に示されているように、新しいＳＮＳは、ＬＰＣを推定するために必要とされる自己相関計算のために、［５］に記載されているＬＰＣベースＦＤＮＳからの計算複雑度に関して、より最適である。したがって、改善されたＬＰＣベースＦＤＮＳ［５］が使用される［８］からのＭＤＣＴベース・ステレオ・システムの計算複雑度を、新しいＳＮＳ［６］がＬＰＣベース手法を置き換える実装形態と比較すると、３２ｋＨｚのサンプリングレートで約６ＷＭＯＰＳの節約がある。
さらに、第１段についてＶＱを用い、第２段について縮小スケールを有するＡＶＱを用いる新しい２段量子化は、計算複雑度のいくらかのさらなる低減を達成する。前のセクションにおいて説明された実施形態では、計算複雑度は、３２ｋＨｚのサンプリングレートで約１ＷＭＯＰＳだけさらに低減され、許容可能なスペクトル歪みのトレードオフを伴う。

【0059】

好ましい実施形態または態様の概要
１．スペクトル雑音整形パラメータのジョイントコーディング、ここで、パラメータのミッド／サイド表現が計算され、ミッドは量子化およびエントロピーコーディングを使用してコーディングされ、サイドはより粗い量子化方式を使用してコーディングされる。
２．チャネル相関またはコヒーレンスに基づいて、雑音整形パラメータが独立してコーディングされるべきかジョイントコーディングされるべきかを適応的に決定する。
３．パラメータが独立してコーディングされるのかジョイントコーディングされるのかを決定するために送られるシグナリングビット。
４．ＭＤＣＴステレオ実装形態に基づく適用例。
・サイド係数がゼロである、ビットを用いたシグナリング
・ＳＮＳが使用される
・パワースペクトルがＳＮＳを計算するために使用される
・第１段において、５ビットを用いた２つのスプリットが使用される。
・第２段ＡＶＱの残差のスケーリングを調整することにより、第２段量子化のためのビット数をさらに低減し得る。
図２３は、（上記で「独立」として説明された）現在の従来技術の実装形態と、本発明の第２の態様による新規の独立実装形態と、本発明の第１の態様による新規のジョイント実装形態とに従って、両方のチャネルについてのビット数の比較を示す。図２３は、縦軸が発生頻度を表し、横軸が両方のチャネルのためのパラメータをコーディングするための全ビット数のビンを示すヒストグラムを示す。
続いて、各オーディオチャネルについてのスケールファクタの計算に特定の強調が与えられ、さらに、図３ａ、図３ｂに関して示されたようにジョイント符号化スケールパラメータの計算の前または後のいずれかに適用されるスケールパラメータのダウンサンプリングおよびアップサンプリングの特定の適用に特定の強調が与えられる、さらなる好ましい実施形態が示される。

【0060】

図１１は、オーディオ信号１６０を符号化するための装置を示す。オーディオ信号１６０は、好ましくは時間領域において利用可能であるが、予測領域または任意の他の領域など、オーディオ信号の他の表現も主に有用である。装置は、変換器１００と、スケールファクタ計算器１１０と、スペクトルプロセッサ１２０と、ダウンサンプラ１３０と、スケール・ファクタ・エンコーダ１４０と、出力インターフェース１５０とを含む。変換器１００は、オーディオ信号１６０をスペクトル表現に変換するために構成される。スケールファクタ計算器１１０は、スペクトル表現からスケールパラメータまたはスケールファクタの第１のセットを計算するために構成される。他のチャネルはブロック１２０において受信され、他のチャネルからのスケールパラメータはブロック１４０によって受信される。
本明細書を通して、「スケールファクタ」または「スケールパラメータ」という用語は、同じパラメータまたは値、すなわち、何らかの処理の後に、何らかのスペクトル値を重み付けするために使用される値またはパラメータを指すために使用される。この重み付けは、線形領域において実行されるとき、実際には、スケーリングファクタを用いた乗算演算である。しかしながら、重み付けが対数領域において実行されるとき、スケールファクタを用いた重み付け演算は、実際の加算または減算演算によって行われる。したがって、本出願の観点では、スケーリングは、乗算または除算を意味するだけでなく、特定の領域に応じて、加算または減算をも意味するか、あるいは、概して、スペクトル値が、例えば、スケールファクタまたはスケールパラメータを使用して重み付けまたは修正される各演算を意味する。

【0061】

ダウンサンプラ１３０は、スケールパラメータの第２のセットを取得するためにスケールパラメータの第１のセットをダウンサンプリングするために構成され、ここにおいて、スケールパラメータの第２のセット中のスケールパラメータの第２の数は、スケールパラメータの第１のセット中のスケールパラメータの第１の数よりも少ない。これはまた、第２の数が第１の数よりも少ないことを述べる図１１中のボックスにおいて概説されている。図１１に示されているように、スケール・ファクタ・エンコーダは、スケールファクタの第２のセットの符号化表現を生成するために構成され、この符号化表現は、出力インターフェース１５０に転送される。スケールファクタの第２のセットがスケールファクタの第１のセットよりも少ない数のスケールファクタを有するという事実により、スケールファクタの第２のセットの符号化表現を送信または記憶するためのビットレートは、ダウンサンプラ１３０において実行されるスケールファクタのダウンサンプリングが実行されなかったであろう状況と比較して低い。

【0062】

さらに、スペクトルプロセッサ１２０は、スケールパラメータの第３のセットを使用して図１１中の変換器１００によって出力されたスペクトル表現を処理するために構成され、スケールパラメータまたはスケールファクタの第３のセットは、スケールファクタの第２の数よりも大きいスケールファクタの第３の数を有し、ここにおいて、スペクトルプロセッサ１２０は、スペクトル処理の目的で、ライン１７１を介してブロック１１０からすでに利用可能なものとしてスケールファクタの第１のセットを使用するように構成される。代替的に、スペクトルプロセッサ１２０は、ライン１７２によって示されているように、スケールファクタの第３のセットの計算のために、ダウンサンプラ１３０によって出力されたスケールファクタの第２のセットを使用するように構成される。さらなる実装形態では、スペクトルプロセッサ１２０は、図１１中のライン１７３によって示されているように、スケールファクタの第３のセットを計算する目的で、スケール・ファクタ／パラメータ・エンコーダ１４０によって出力された符号化表現を使用する。好ましくは、スペクトルプロセッサ１２０は、スケールファクタの第１のセットを使用せず、ダウンサンプラによって計算されたスケールファクタの第２のセットを使用するか、またはさらにより好ましくは符号化表現を使用するか、あるいは、概して、スケールファクタの量子化された第２のセットを使用し、次いで、スペクトルパラメータの量子化された第２のセットを補間するための補間演算を実行して、補間演算のためにより多数のスケールパラメータを有するスケールパラメータの第３のセットを取得する。

【0063】

したがって、ブロック１４０によって出力されるスケールファクタの第２のセットの符号化表現は、好ましくは使用されるスケール・パラメータ・コードブックのためのコードブックインデックスまたは対応するコードブックインデックスのセットのいずれかを含む。他の実施形態では、符号化表現は、コードブックインデックスまたはコードブックインデックスのセット、あるいは概して符号化表現が、デコーダ側ベクトルデコーダまたは任意の他のデコーダに入力されたときに取得される、量子化されたスケールファクタの量子化されたスケールパラメータを含む。
好ましくは、スペクトルプロセッサ１２０は、デコーダ側でも利用可能であるスケールファクタの同じセットを使用し、すなわち、補間演算と共にスケールパラメータの量子化された第２のセットを使用して、最終的にスケールファクタの第３のセットを取得する。

【0064】

好ましい実施形態では、スケールファクタの第３のセット中のスケールファクタの第３の数は、スケールファクタの第１の数に等しい。しかしながら、より少数のスケールファクタも有用である。例示的に、例えば、ブロック１１０において６４個のスケールファクタを導出することができ、次いで、送信のために６４個のスケールファクタを１６個のスケールファクタにダウンサンプリングすることができる。次いで、スペクトルプロセッサ１２０において、必ずしも６４個のスケールファクタへの補間ではなく、３２個のスケールファクタへの補間を実行することができる。代替的に、符号化出力信号１７０において送信されるスケールファクタの数が、ブロック１１０において計算されたかまたは図１１のブロック１２０において計算および使用されたスケールファクタの数よりも小さい限り、場合によっては６４個超など、さらに多数のスケールファクタへの補間を実行することができる。
好ましくは、スケールファクタ計算器１１０は、図１２に示されているいくつかの演算を実行するように構成される。これらの演算は、帯域ごとの振幅関連測度の計算１１１を指す。ここで、１つのチャネルのためのスペクトル表現がブロック１１１に入力される。他のチャネルについての計算も同様に行われる。帯域ごとの好ましい振幅関連測度は帯域ごとのエネルギーであるが、他の振幅関連測度、例えば、帯域ごとの振幅の大きさの合計、またはエネルギーに対応する二乗振幅の合計も同様に使用され得る。しかしながら、帯域ごとのエネルギーを計算するために使用される２のべき乗とは別に、信号のラウドネスを反映する３のべき乗など、他のべき乗も使用され得、帯域ごとの振幅関連測度を計算するために、１．５または２．５のべき乗など、整数とは異なるべき乗も同様に使用され得る。１．０未満のべき乗も、そのようなべき乗によって処理される値が正の値であることが保証される限り、使用され得る。

【0065】

スケールファクタ計算器によって実行されるさらなる演算は、帯域間平滑化１１２であり得る。この帯域間平滑化は、好ましくは、ステップ１１１によって取得された振幅関連測度のベクトルにおいて現れ得る、考えられる不安定性を平滑化するために使用される。この平滑化を実行しない場合、これらの不安定性は、特にエネルギーが０に近いスペクトル値において、１１５において示されているように後で対数領域に変換されるとき、増幅される。しかしながら、他の実施形態では、帯域間平滑化は実行されない。
スケールファクタ計算器１１０によって実行されるさらなる好ましい演算は、プリエンファシス演算１１３である。このプリエンファシス演算は、従来技術に関して前に説明されたように、ＭＤＣＴベースＴＣＸ処理のＬＰＣベース知覚フィルタにおいて使用されるプリエンファシス演算と同様の目的を有する。この手順は、低周波において整形スペクトルの振幅を増加させ、これは、低周波における量子化雑音の低減をもたらす。
ただし、実装形態に応じて、他の特定の演算としてプリエンファシス演算が必ずしも実行される必要はない。

【0066】

さらなる任意選択の処理演算は、雑音フロア加算処理１１４である。この手順は、谷部における整形スペクトルの振幅増幅を制限することによって、例えばグロッケンシュピールなど、極めて高いスペクトルダイナミクスを含む信号の品質を改善し、このことは、谷部における量子化雑音の増加を犠牲にしてピークにおいて量子化雑音を低減する間接的な効果を有する。ここで、量子化雑音は、いずれにしても、絶対聴取閾値、プリマスキング、ポストマスキング、または一般的なマスキング閾値など、人間の耳のマスキング特性のために知覚できず、これは、典型的には、高ボリュームトーンに周波数が比較的近い非常に低いボリュームトーンはまったく知覚できず、すなわち、完全にマスクされているかまたは人間の聴覚機構によって大まかにしか知覚されないため、このスペクトル寄与が非常に粗く量子化され得ることを示す。
ただし、雑音フロア加算演算１１４は、必ずしも実行される必要はない。
さらに、ブロック１１５は、対数状領域変換を示す。好ましくは、図１２中のブロック１１１、１１２、１１３、１１４のうちの１つの出力の変換が、対数状領域において実行される。対数状領域は、０に近い値が拡大され、高い値が圧縮される領域である。好ましくは、対数領域は、２を底とする領域であるが、他の対数領域も同様に使用され得る。ただし、２を底とする対数領域は、固定小数点信号プロセッサ上の実装のためにより優れている。
スケールファクタ計算器１１０の出力は、スケールファクタの第１のセットである。

【0067】

図１２に示されているように、ブロック１１２から１１５の各々はブリッジされ得、すなわち、例えば、ブロック１１１の出力は、すでにスケールファクタの第１のセットであり得る。ただし、すべての処理演算、詳細には、対数状領域変換が選好される。したがって、例えば、ステップ１１２から１１４中の手順なしで、ステップ１１１および１１５を実行することのみによって、スケールファクタ計算器を実装することさえできる。ブロック１１５の出力において、チャネル（Ｌなど）のためのスケールパラメータのセットが取得され、他のチャネル（Ｒなど）のためのスケールパラメータのセットも、同様の計算によって取得され得る。
したがって、スケールファクタ計算器は、いくつかのブロックを接続する入出力ラインによって示されているように、図１２に示されている手順のうちの１つまたは２つ以上を実行するために構成される。

【0068】

図１３は、単一チャネルについて、図１１のダウンサンプラ１３０の好ましい実装形態を再び示す。他のチャネルについてのデータも同様に計算される。好ましくは、ローパスフィルタリング、または、概して、特定のウィンドウｗ（ｋ）を用いたフィルタリングがステップ１３１において実行され、次いで、フィルタリングの結果のダウンサンプリング／デシメーション演算が実行される。ローパスフィルタリング１３１、および好ましい実施形態ではダウンサンプリング／デシメーション演算１３２が、両方とも算術演算であるという事実により、フィルタリング１３１およびダウンサンプリング１３２は、後で概説されるように単一の演算内で実行され得る。好ましくは、ダウンサンプリング／デシメーション演算は、スケールパラメータの第１のセットのうちのスケールパラメータの個々のグループの間の重複が実行されるように実行される。好ましくは、２つのデシメート計算されたパラメータ間のフィルタリング演算における１つのスケールファクタの重複が実行される。したがって、ステップ１３１は、デシメーションの前にスケールパラメータのベクトルに対してローパスフィルタを実行する。このローパスフィルタは、心理音響モデルにおいて使用される広がり関数と同様の効果を有する。それは、ピーク付近の量子化雑音の増加を犠牲にしてピークにおける量子化雑音を低減し、ここで、それは、いずれにしても、少なくともピークにおける量子化雑音に対してより高度に知覚的にマスクされる。

【0069】

さらに、ダウンサンプラは、平均値除去１３３および追加のスケーリングステップ１３４をさらに実行する。ただし、ローパスフィルタリング演算１３１、平均値除去ステップ１３３、およびスケーリングステップ１３４は、任意選択のステップにすぎない。したがって、図１３に示されているまたは図１１に示されているダウンサンプラは、ステップ１３２のみを実行するように、または、ステップ１３２ならびにステップ１３１、１３３および１３４のうちの１つなど、図１３に示されている２つのステップを実行するように、実装され得る。代替的に、ダウンサンプラは、ダウンサンプリング／デシメーション演算１３２が実行される限り、図１３に示されている４つのステップすべてを実行するか、または４つのステップのうち３つのステップのみを実行することができる。
図１３に概説されるように、ダウンサンプラによって実行される図１３中のオーディオ演算は、より良い結果を取得するために対数状領域において実行される。

【0070】

図１５は、スペクトルプロセッサの好ましい実装形態を示す。図１１のエンコーダ内に含まれるスペクトルプロセッサ１２０は、各チャネルについて、または代替的にジョイント符号化スケールパラメータのグループについて、スケールパラメータの量子化された第２のセットを受信し、ジョイント符号化スケールパラメータのグループについて、チャネルのためのスケールパラメータの第３のセットを出力する、補間器１２１を含み、ここで、第３の数は、第２の数よりも大きく、好ましくは、第１の数に等しい。さらに、スペクトルプロセッサは、線形領域変換器１２０を含む。次いで、ブロック１２３において、一方では線形スケールパラメータを使用し、他方では変換器１００によって取得されたスペクトル表現を使用して、スペクトル整形が実行される。好ましくは、ブロック１２４の出力においてスペクトル残差値を取得するために、後続の時間雑音整形演算、すなわち周波数にわたる予測が実行され、ＴＮＳサイド情報は、矢印１２９によって示されているように出力インターフェースに転送される。

【0071】

最後に、スペクトルプロセッサ１２５、１２０ｂは、スペクトル表現全体、すなわちフレーム全体についての単一のグローバル利得を受信するために構成されたスカラ量子化器／エンコーダ、ステレオ処理機能、およびＩＧＦ処理機能などのうちの少なくとも１つを有する。好ましくは、グローバル利得は、特定のビットレート考慮事項に応じて導出される。したがって、グローバル利得は、ブロック１２５、１２０ｂによって生成されたスペクトル表現の符号化表現が、ビットレート要件、品質要件、またはその両方など、特定の要件を満たすように設定される。グローバル利得は、反復的に計算され得るか、または、場合によってはフィードフォワード測度において計算され得る。概して、グローバル利得は量子化器と共に使用され、高いグローバル利得は、典型的には、より粗い量子化をもたらし、ここで、低いグローバル利得は、より細かい量子化をもたらす。したがって、言い換えれば、固定量子化器が取得されるとき、高いグローバル利得はより高い量子化ステップサイズをもたらし、低いグローバル利得はより小さい量子化ステップサイズをもたらす。ただし、例えば、より高い値がより低い値よりも圧縮されるように、高い値についての何らかの圧縮機能、すなわち、何らかの非線形圧縮機能を有する量子化器など、他の量子化器も、グローバル利得機能と共に使用され得る。グローバル利得と量子化の粗さとの間の上記の依存性は、グローバル利得が、対数領域における加算に対応して線形領域において量子化の前の値まで乗算されるとき、有効である。ただし、グローバル利得が線形領域における除算によって、または対数領域における減算によって適用される場合、依存性は逆になる。「グローバル利得」が逆の値を表すときも同様である。

【0072】

続いて、図１１～図１５に関して説明された個々の手順の好ましい実装形態が与えられる。
好ましい実施形態の詳細な段階的説明
エンコーダ。
・ステップ１－帯域ごとのエネルギー（１１１）
帯域ごとのエネルギーＥ_Ｂ（ｎ）は、以下のように算出される。

上式で、Ｘ（ｋ）はＭＤＣＴ係数であり、Ｎ_Ｂ＝６４は帯域の数であり、Ｉｎｄ（ｎ）は帯域インデックスである。帯域は不均一であり、知覚的に関連するバークスケール（低周波ではより小さく、高周波ではより大きい）に従う。
・ステップ２－平滑化（１１２）
帯域ごとのエネルギーＥ_Ｂ（ｎ）は、以下を使用して平滑化される。

注－このステップは、主に、ベクトルＥ_Ｂ（ｂ）において現れ得る、考えられる不安定性を平滑化するために使用される。平滑化されない場合、これらの不安定性は、特にエネルギーが０に近い谷部において、対数領域に変換されるとき、増幅される（ステップ５参照）。

【0073】

・ステップ３－プリエンファシス（１１３）
次いで、帯域ごとの平滑化されたエネルギーＥ_Ｓ（ｂ）は、以下を使用して事前強調される。

上式で、ｇ_ｔｉｌｔは、プリエンファシスの傾きを制御し、サンプリング周波数に依存する。それは、例えば、１６ｋＨｚでは１８、４８ｋＨｚでは３０である。このステップにおいて使用されるプリエンファシスは、従来技術２のＬＰＣベース知覚フィルタにおいて使用されるプリエンファシスと同じ目的を有し、それは、低周波において整形スペクトルの振幅を増加させ、低周波において量子化雑音の低減をもたらす。
・ステップ４－雑音フロア（１１４）
－４０ｄＢにおける雑音フロアが、以下を使用してＥ_ｐ（ｂ）に加算される。

上式で、雑音フロアは、以下によって計算される。

このステップは、谷部における整形スペクトルの振幅増幅を制限することによって、例えばグロッケンシュピールなど、極めて高いスペクトルダイナミクスを含む信号の品質を改善し、これは、谷部における量子化雑音の増加を犠牲にしてピークにおける量子化雑音を低減する間接的な効果を有し、ここで、量子化雑音はいずれにしても知覚できない。

【0074】

・ステップ５－対数（１１５）
次いで、対数領域への変換が、以下を使用して実行される。

・ステップ６－ダウンサンプリング（１３１、１３２）
次いで、ベクトルＥ_Ｌ（ｂ）は、以下を使用して４倍でダウンサンプリングされる。

上式で、

デシメーションの前のベクトルＥ_Ｌ（ｂ）に対してローパスフィルタ（ｗ（ｋ））を適用する。このローパスフィルタは、心理音響モデルにおいて使用される広がり関数と同様の効果を有し、すなわち、それは、ピーク付近の量子化雑音の増加を犠牲にしてピークにおける量子化雑音を低減し、ここで、量子化雑音はいずれにしても知覚的にマスクされる。

【0075】

・ステップ７－平均除去およびスケーリング（１３３、１３４）
最終的なスケールファクタは、平均除去および０．８５倍でのスケーリングの後に取得される。

コーデックは追加のグローバル利得を有するので、情報を失うことなく平均が除去され得る。平均の除去は、より効率的なベクトル量子化をも可能にする。
０．８５のスケーリングは、雑音整形曲線の振幅をわずかに圧縮する。これは、ステップ６において述べた広がり関数と同様の知覚効果を有し、すなわち、ピークにおける量子化雑音が低減し、谷部における量子化雑音が増加する。
・ステップ８－量子化（１４１、１４２）
スケールファクタは、ベクトル量子化を使用して量子化され、これは、その後ビットストリームにパックされてデコーダに送られるインデックスと、量子化されたスケールファクタｓｃｆＱ（ｎ）とを生成する。

【0076】

・ステップ９－補間（１２１、１２２）
量子化されたスケールファクタｓｃｆＱ（ｎ）は、

を使用して補間され、以下を使用して線形領域に変換される。

補間は、滑らかな雑音整形曲線を得るために、したがって、隣接する帯域間の大きな振幅ジャンプを回避するために使用される。

【0077】

・ステップ１０－スペクトル整形（１２３）
ＳＮＳスケールファクタｇ_ＳＮＳ（ｂ）は、整形スペクトルＸ_ｓ（ｋ）を生成するために各帯域について別々にＭＤＣＴ周波数ラインに対して適用される。

【0078】

図１８は、符号化スペクトル表現に関する情報と、（セパレートまたはジョイント符号化された）スケールパラメータの第２のセットの符号化表現に関する情報とを含む符号化オーディオ信号２５０（Ｌ、ＲまたはＭ、Ｓとして符号化されたステレオ信号）を復号するための装置の好ましい実装形態を示す。デコーダは、入力インターフェース２００と、（例えば、ＩＧＦ処理または逆ステレオ処理または逆量子化処理を実行する）スペクトルデコーダ２１０と、スケール・ファクタ／パラメータ・デコーダ２２０と、（例えば、Ｒ、Ｌについての）スペクトルプロセッサ２３０と、（例えば、Ｒ、Ｌについての）変換器２４０とを含む。入力インターフェース２００は、符号化オーディオ信号２５０を受信し、スペクトルデコーダ２１０に転送される符号化スペクトル表現を抽出し、スケール・ファクタ・デコーダ２２０に転送されるスケールファクタの第２のセットの符号化表現を抽出するために構成される。さらに、スペクトルデコーダ２１０は、スペクトルプロセッサ２３０に転送される復号スペクトル表現を取得するために符号化スペクトル表現を復号するように構成される。スケール・ファクタ・デコーダ２２０は、スペクトルプロセッサ２３０に転送されるスケールパラメータの第１のセットを取得するためにスケールパラメータの符号化された第２のセットを復号するように構成される。スケールファクタの第１のセットは、第２のセット中のスケールファクタまたはスケールパラメータの数よりも大きい数のスケールファクタまたはスケールパラメータを有する。スペクトルプロセッサ２３０は、スケーリングされたスペクトル表現を取得するためにスケールパラメータの第１のセットを使用して復号スペクトル表現を処理するように構成される。スケーリングされたスペクトル表現は、次いで、変換器２４０によって変換され、最終的に、ステレオ信号または２よりも多いチャネルを有するマルチチャネル信号である復号オーディオ信号２６０が取得される。

【0079】

好ましくは、スケール・ファクタ・デコーダ２２０は、ブロック１４１または１４２に関連して、詳細には図１５のブロック１２１、１２２に関して説明された、スケールファクタまたはスケールパラメータの第３のセットの計算に関連する図１１のスペクトルプロセッサ１２０に関して説明されたものと実質的に同じ様式で動作するように構成される。詳細には、スケール・ファクタ・デコーダは、補間および線形領域への変換のために、ステップ９に関して前に説明されたものと実質的に同じ手順を実行するように構成される。したがって、図１９に示されているように、スケール・ファクタ・デコーダ２２０は、符号化スケールパラメータ表現を表すフレームごとの１つ以上のインデックスにデコーダコードブック２２１を適用するために構成される。次いで、図１５中のブロック１２１に関して説明されたものと実質的に同じ補間である補間が、ブロック２２２において実行される。次いで、図１５に関して説明されたものと実質的に同じ線形領域変換器１２２である線形領域変換器２２３が使用される。ただし、他の実装形態では、ブロック２２１、２２２、２２３は、エンコーダ側の対応するブロックに関して説明されたものとは異なって動作することができる。

【0080】

さらに、図１８または図１９に示されているスペクトルデコーダ２１０は、逆量子化器／デコーダブロックを含み、逆量子化器／デコーダブロックは、符号化スペクトルを入力として受信し、好ましくは、符号化形式で符号化オーディオ信号内でエンコーダ側からデコーダ側にさらに送信されたグローバル利得を使用して逆量子化された逆量子化スペクトルを出力する。ブロック２１０はまた、ＩＧＦ処理、またはＭＳ復号などの逆ステレオ処理を実行し得る。逆量子化器／デコーダ２１０は、例えば、何らかのコードを入力として受信し、スペクトル値を表す量子化インデックスを出力する算術またはハフマンデコーダ機能を含むことができる。次いで、これらの量子化インデックスは、グローバル利得と共に逆量子化器に入力され、出力は、逆量子化されたスペクトル値であり、逆量子化されたスペクトル値は、次いで、ＴＮＳデコーダ処理ブロック２１１において周波数にわたる逆予測などのＴＮＳ処理を受けることができるが、これは任意選択である。詳細には、ＴＮＳデコーダ処理ブロックは、さらに、ライン１２９によって示されているように、図１５のブロック１２４によって生成されたＴＮＳサイド情報を受信する。ＴＮＳデコーダ処理ステップ２１１の出力は、別々のスケールファクタを使用して各チャネルについて別々に動作するスペクトル整形ブロック２１２に入力され、ここで、スケール・ファクタ・デコーダによって計算されたスケールファクタの第１のセットは、場合によってはＴＮＳ処理されることもされないこともある復号スペクトル表現に適用され、出力は、その後図１８の変換器２４０に入力される、各チャネルについてのスケーリングされたスペクトル表現である。

【0081】

続いて、デコーダの好ましい実施形態のさらなる手順が説明される。
デコーダ。
・ステップ１－量子化（２２１）
エンコーダステップ８において生成されたベクトル量子化器インデックスは、ビットストリームから読み出され、量子化されたスケールファクタｓｃｆＱ（ｎ）を復号するために使用される。
・ステップ２－補間（２２２、２２３）
エンコーダステップ９と同じ。
・ステップ３－スペクトル整形（２１２）
ＳＮＳスケールファクタｇ_ＳＮＳ（ｂ）は、以下のコードによって概説されるように復号スペクトル

を生成するために、各帯域について別々に、量子化されたＭＤＣＴ周波数ラインに対して適用される。

【0082】

図１６および図１７は、一般的なエンコーダ／デコーダ設定を示し、ここで、図１６はＴＮＳ処理のない実装形態を表し、図１７はＴＮＳ処理を含む実装形態を示す。図１６および図１７に示されている同様の機能は、同一の参照番号が示されている場合、他の図における同様の機能に対応する。詳細には、図１６に示されているように、入力信号１６０、例えばステレオ信号またはマルチチャネル信号は、変換段１１０に入力され、その後、スペクトル処理１２０が実行される。詳細には、スペクトル処理は、参照番号１２３、１１０、１３０、１４０によって示されているＳＮＳエンコーダによって反映され、これは、ブロックＳＮＳエンコーダがこれらの参照番号によって示されている機能を実装することを示す。ＳＮＳエンコーダブロックに続いて、量子化符号化演算１２０ｂ、１２５が実行され、図１６中の１８０に示されているように、符号化信号がビットストリームに入力される。ビットストリーム１８０は、次いで、デコーダ側で生じ、参照番号２１０によって示されている逆量子化および復号に続いて、図１８のブロック２１０、２２０、２３０によって示されているＳＮＳデコーダ演算が実行され、それにより、最終的に、逆変換２４０に続いて、復号出力信号２６０が取得される。

【0083】

図１７は、図１６の場合と同様の表現を示すが、好ましくは、エンコーダ側でのＳＮＳ処理に続いてＴＮＳ処理が実行され、対応して、デコーダ側での処理シーケンスに関してＳＮＳ処理２１２の前にＴＮＳ処理２１１が実行されることが示されている。
好ましくは、スペクトル雑音整形（ＳＮＳ）と量子化／コーディング（以下のブロック図参照）との間の追加ツールＴＮＳが使用される。ＴＮＳ（時間雑音整形）も量子化雑音を整形するが、（ＳＮＳの周波数領域整形とは対照的に）時間領域整形も行う。ＴＮＳは、シャープアタックを含む信号および音声信号に有用である。
ＴＮＳは、通常、変換とＳＮＳとの間で（例えばＡＡＣにおいて）適用される。しかしながら、好ましくは、整形スペクトルに対してＴＮＳを適用することが好ましい。これは、コーデックを低ビットレートで動作させるときにＴＮＳデコーダによって生成されたいくつかのアーティファクトを回避する。

【0084】

図２０は、エンコーダ側のブロック１００によって取得されたスペクトル係数またはスペクトル線の帯域への好ましい再分割を示す。詳細には、低い帯域は高い帯域よりも少ない数のスペクトル線を有することが示されている。
詳細には、図２０中のｘ軸は、帯域のインデックスに対応し、６４個の帯域の好ましい実施形態を示し、ｙ軸は、１つのフレーム中の３２０個のスペクトル係数を示すスペクトル線のインデックスに対応する。詳細には、図２０は、３２ｋＨｚのサンプリング周波数がある超広帯域（ＳＷＢ）の場合の状況を例示的に示す。
広帯域の場合、個々の帯域に関する状況は、１つのフレームが１６０個のスペクトル線をもたらし、サンプリング周波数が１６ｋＨｚであり、したがって、どちらの場合も、１つのフレームが１０ミリ秒の時間の長さを有するような状況である。

【0085】

図２１は、図１１のダウンサンプラ１３０において実行される好ましいダウンサンプリング、あるいは、図１８のスケール・ファクタ・デコーダ２２０において実行されるかまたは図１９のブロック２２２に示されている対応するアップサンプリングまたは補間に関するさらなる詳細を示す。
ｘ軸に沿って、帯域０～６３についてのインデックスが与えられる。詳細には、０から６３までの６４個の帯域がある。
ｓｃｆＱ（ｉ）に対応する１６個のダウンサンプル点は、垂直線１１００として示されている。詳細には、図２１は、ダウンサンプリング点１１００を最終的に取得するためにスケールパラメータの特定のグループ化がどのように実行されるかを示す。例示的に、４つの帯域の第１のブロックは（０，１，２，３）からなり、この第１のブロックの中間点は１．５にあり、これは、ｘ軸に沿ったインデックス１．５において項目１１００によって示されている。
対応して、４つの帯域の第２のブロックは（４，５，６，７）であり、第２のブロックの中間点は５．５である。
ウィンドウ１１１０は、前述したステップ６ダウンサンプリングに関して説明されたウィンドウｗ（ｋ）に対応する。これらのウィンドウは、ダウンサンプリング点を中心とし、前に説明されたように各側に１つのブロックの重複があることが分かる。

【0086】

図１９の補間ステップ２２２は、１６個のダウンサンプリング点から６４個の帯域を復元する。これは、特定の線１１２０の周りに１１００で示されている２つのダウンサンプリング点の関数として線１１２０のいずれかの位置を算出することによって、図２１において分かる。以下の例がそれを例示する。
第２の帯域の位置は、その周りの２つの垂直線の関数として計算される（１．５および５．５）：２＝１．５＋１／８×（５．５－１．５）。
対応して、第３の帯域の位置は、その周りの２つの垂直線１１００の関数として計算される（１．５および５．５）：３＝１．５＋３／８×（５．５－１．５）。
第１の２つの帯域および最後の２つの帯域について特定の手順が実行される。これらの帯域では、垂直線が存在しないかまたは垂直線１１００に対応する値が０から６３までの範囲外であるため、補間を実行することができない。したがって、この問題に対処するために、一方では２つの帯域０、１について、他方では６２および６３について、前に概説したステップ９－補間に関して説明されたように、外挿が実行される。

【0087】

続いて、一方では図１１の変換器１００、他方では図１８の変換器２４０の好ましい実装形態が説明される。
詳細には、図２２ａは、変換器１００内のエンコーダ側で実行されるフレーミングを示すためのスケジュールを示す。図２２ｂは、エンコーダ側の図１１の変換器１００の好ましい実装形態を示し、図２２ｃは、デコーダ側の変換器２４０の好ましい実装形態を示す。
エンコーダ側の変換器１００は、フレーム２がフレーム１と重複し、フレーム３がフレーム２およびフレーム４と重複するように、５０％重複など、重複するフレームでフレーミングを実行するように実装されることが好ましい。ただし、他の重複または非重複処理も実行され得るが、ＭＤＣＴアルゴリズムと共に５０％重複を実行することが好ましい。この目的で、変換器１００は、分析ウィンドウ１０１と、変換器１００に続くブロックへの図１１中の入力としてのスペクトル表現のシーケンスに対応するフレームのシーケンスを取得するためにＦＦＴ処理、ＭＤＣＴ処理、または任意の他の種類の時間－スペクトル変換処理を実行するための後で接続されるスペクトル変換器１０２とを含む。
対応して、スケーリングされたスペクトル表現が図１８の変換器２４０に入力される。詳細には、変換器は、逆ＦＦＴ演算、逆ＭＤＣＴ演算、または対応するスペクトル－時間変換演算を実施する時間変換器２４１を含む。出力は合成ウィンドウ２４２に挿入され、合成ウィンドウ２４２の出力は、重複加算演算を実行するための重複加算プロセッサ２４３に入力されて、最終的に復号オーディオ信号が取得される。詳細には、ブロック２４３中の重複加算処理は、例えば、図２２ａ中の項目１２００によって示されているようなフレーム３とフレーム４との間の重複についてのオーディオサンプリング値が取得されるように、例えばフレーム３の後半およびフレーム４の前半の対応するサンプル間で、サンプルごとの加算を実行する。復号オーディオ出力信号の残りのオーディオサンプリング値を取得するために、サンプルごとに同様の重複加算演算が実行される。

【0088】

本明細書では、前に説明されたすべての代替形態または態様、および以下の特許請求の範囲における独立請求項によって定義されるすべての態様は、個別に、すなわち、企図される代替形態、目的または独立請求項以外の代替形態または目的なしに使用され得ることに留意されたい。しかしながら、他の実施形態では、代替形態または態様または独立請求項のうちの２つ以上が互いに組み合わせられ得、他の実施形態では、すべての態様または代替形態およびすべての独立請求項が互いに組み合わせられ得る。
さらなる態様が上記で説明されたが、添付の特許請求の範囲は、２つの異なる態様、すなわち、マルチチャネルオーディオ信号のチャネルのためのスケールパラメータのジョイントコーディングを使用するオーディオデコーダ、オーディオエンコーダ、および関連する方法、あるいは、オーディオ量子化器、オーディオ逆量子化器、または関連する方法を示す。これら２つの態様は、場合によっては、組み合わせられるかまたは別々に使用され得、これらの態様による発明は、上記で説明された特定の適用例とは異なるオーディオ処理の他の適用例に適用可能である。

【0089】

さらに、第１の態様を示す追加の図３ａ、図３ｂ、図４ａ、図４ｂ、図５、図６、図８ａ、図８ｂ、および第２の態様を示す図９ａ、図９ｂ、ならびに第１の態様内で適用される第２の態様を示す図７ａ、図７ｂを参照する。
本発明の符号化信号は、デジタル記憶媒体または非一時的記憶媒体に記憶され得るか、あるいは、無線伝送媒体またはインターネットなどの有線伝送媒体など、伝送媒体上で送信され得る。
いくつかの態様は装置の文脈で説明されたが、これらの態様が対応する方法の説明をも表すことは明らかであり、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明された態様は、対応する装置の対応するブロックまたは項目または特徴の説明をも表す。
特定の実装要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装され得る。実装は、電子的に読取り可能な制御信号を記憶したデジタル記憶媒体、例えばフロッピーディスク、ＤＶＤ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはフラッシュメモリを使用して実行され得、これらは、それぞれの方法が実行されるようにプログラマブル・コンピュータ・システムと協働する（または協働することができる）。

【0090】

本発明によるいくつかの実施形態は、本明細書で説明された方法のうちの１つが実行されるように、プログラマブル・コンピュータ・システムと協働することができる、電子的に読取り可能な制御信号を有するデータキャリアを含む。
概して、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装され得、プログラムコードは、コンピュータプログラム製品がコンピュータ上で動作すると方法のうちの１つを実行するように動作可能である。プログラムコードは、例えば、機械可読キャリアに記憶され得る。
他の実施形態は、機械可読キャリアまたは非一時的記憶媒体に記憶された、本明細書で説明された方法のうちの１つを実行するためのコンピュータプログラムを含む。
言い換えれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムがコンピュータ上で動作すると本明細書で説明された方法のうちの１つを実行するためのプログラムコードを有するコンピュータプログラムである。
本発明の方法のさらなる実施形態は、したがって、本明細書で説明された方法のうちの１つを実行するためのコンピュータプログラムを記録して含むデータキャリア（あるいは、デジタル記憶媒体またはコンピュータ可読媒体）である。

【0091】

本発明の方法のさらなる実施形態は、したがって、本明細書で説明された方法のうちの１つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続を介して、例えばインターネットを介して、転送されるように構成され得る。
さらなる実施形態は、本明細書で説明された方法のうちの１つを実行するように構成または適合された処理手段、例えばコンピュータ、またはプログラマブル論理デバイスを含む。
さらなる実施形態は、本明細書で説明された方法のうちの１つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
いくつかの実施形態では、本明細書で説明された方法の機能の一部または全部を実行するために、プログラマブル論理デバイス（例えば、フィールド・プログラマブル・ゲート・アレイ）が使用され得る。いくつかの実施形態では、フィールド・プログラマブル・ゲート・アレイは、本明細書で説明された方法のうちの１つを実行するためにマイクロプロセッサと協働し得る。概して、方法は、任意のハードウェア装置によって実行されることが好ましい。
上記で説明された実施形態は、本発明の原理の例示にすぎない。本明細書で説明された構成および詳細の修正および変形が、当業者には明らかであることを理解されたい。したがって、本明細書の実施形態の記述および説明として提示された特定の詳細によってではなく、すぐ後の特許請求の範囲によってのみ限定されることが意図される。

【0092】

続いて、さらなる実施形態／実施例が要約される。
１．２つ以上のオーディオチャネルについてのデータを含むマルチチャネル・オーディオ・データと、ジョイント符号化スケールパラメータに関する情報とを含む符号化オーディオ信号を復号するためのオーディオデコーダであって、
復号オーディオ信号の第１のチャネルのためのスケールパラメータの第１のセットと、前記復号オーディオ信号の第２のチャネルのためのスケールパラメータの第２のセットとを取得するために、前記ジョイント符号化スケールパラメータに関する前記情報を復号するためのスケール・パラメータ・デコーダ（２２０）と、
前記復号オーディオ信号の前記第１のチャネルおよび前記第２のチャネルを取得するために、前記マルチチャネル・オーディオ・データから導出された第１のチャネル表現にスケールパラメータの前記第１のセットを適用し、前記マルチチャネル・オーディオ・データから導出された第２のチャネル表現にスケールパラメータの前記第２のセットを適用するための信号プロセッサ（２１０、２１２、２３０）とを含み、
前記ジョイント符号化スケールパラメータが、ジョイント符号化スケールパラメータの第１のグループに関する情報およびジョイント符号化スケールパラメータの第２のグループに関する情報を含み、
前記スケール・パラメータ・デコーダ（２２０）が、スケールパラメータの前記第１のセットのうちのスケールパラメータを取得するために第１の結合規則を使用して、およびスケールパラメータの前記第２のセットのうちのスケールパラメータを取得するために前記第１の結合規則とは異なる第２の結合規則を使用して、前記第１のグループのうちのジョイント符号化スケールパラメータと前記第２のグループのうちのジョイント符号化スケールパラメータとを結合するように構成される、オーディオデコーダ。

【0093】

２．ジョイント符号化スケールパラメータの前記第１のグループがミッド・スケール・パラメータを含み、ジョイント符号化スケールパラメータの前記第２のグループがサイド・スケール・パラメータを含み、前記スケール・パラメータ・デコーダ（２２０）が、前記第１の結合規則において加算を使用し、前記第２の結合規則において減算を使用するように構成される、実施例１に記載のオーディオデコーダ。
３．前記符号化オーディオ信号がフレームのシーケンスに編成され、第１のフレームが、前記マルチチャネル・オーディオ・データと、前記ジョイント符号化スケールパラメータに関する前記情報とを含み、第２のフレームがセパレート符号化スケールパラメータ情報を含み、
前記スケール・パラメータ・デコーダ（２２０）は、前記第２のフレームが前記セパレート符号化スケールパラメータ情報を含むことを検出し、スケールパラメータの前記第１のセットおよびスケールパラメータの前記第２のセットを計算するように構成される、実施例１または２に記載のオーディオデコーダ。
４．前記第１のフレームおよび前記第２のフレームは、各々、第１の状態において、前記第１のフレームが前記ジョイント符号化スケールパラメータに関する前記情報を含むこと、および第２の状態において、前記第２のフレームが前記セパレート符号化スケールパラメータ情報を含むことを示す状態サイド情報を含み、
前記スケール・パラメータ・デコーダ（２２０）は、前記第２のフレームの前記状態サイド情報を読み出し、読出した前記状態サイド情報に基づいて前記第２のフレームが前記セパレート符号化スケールパラメータ情報を含むことを検出するか、または、前記第１のフレームの前記状態サイド情報を読み出し、読出した前記状態サイド情報を使用して、前記第１のフレームが前記ジョイント符号化スケールパラメータに関する前記情報を含むことを検出するように構成される、実施例３に記載のオーディオデコーダ。

【0094】

５．前記信号プロセッサ（２１０、２１２、２３０）が、前記第１のチャネル表現および前記第２のチャネル表現を導出するために前記マルチチャネル・オーディオ・データを復号するように構成され、前記第１のチャネル表現および前記第２のチャネル表現が、スペクトルサンプリング値を有するスペクトル領域表現であり、
前記信号プロセッサ（２１０、２１２、２３０）が、前記第１のチャネルの整形スペクトル表現および前記第２のチャネルの整形スペクトル表現を取得するために、前記第１のセットおよび前記第２のセットのうちの各スケールパラメータを、対応する複数の前記スペクトルサンプリング値に適用するように構成される、
実施例１から４のいずれか１つに記載のオーディオデコーダ。
６．前記信号プロセッサ（２１０、２１２、２３０）が、前記復号オーディオ信号の、前記第１のチャネルの時間領域表現および前記第２のチャネルの時間領域表現を取得するために、前記第１のチャネルの前記整形スペクトル表現および前記第２のチャネルの前記整形スペクトル表現を時間領域に変換するように構成される、実施例５に記載のオーディオデコーダ。

【0095】

７．前記第１のチャネル表現が第１の数の帯域を含み、スケールパラメータの前記第１のセットが第２の数のスケールパラメータを含み、前記第２の数が前記第１の数よりも少なく、
前記信号プロセッサ（２１０、２１２、２３０）が、帯域の前記第１の数以上であるいくつかの補間されたスケールパラメータを取得するために前記第２の数のスケールパラメータを補間するように構成され、前記信号プロセッサ（２１０、２１２、２３０）が、前記補間されたスケールパラメータを使用して前記第１のチャネル表現をスケーリングするように構成されるか、
または
前記第１のチャネル表現が第１の数の帯域を含み、ジョイント符号化スケールパラメータの前記第１のグループに関する前記情報が、第２の数のジョイント符号化スケールパラメータを含み、前記第２の数が前記第１の数よりも少なく、
前記スケール・パラメータ・デコーダ（２２０）が、帯域の前記第１の数以上であるいくつかの補間されたジョイント符号化スケールパラメータを取得するために前記第２の数のジョイント符号化スケールパラメータを補間するように構成され、
前記スケール・パラメータ・デコーダ（２２０）が、スケールパラメータの前記第１のセットおよびスケールパラメータの前記第２のセットを決定するために、前記補間されたジョイント符号化スケールパラメータを処理するように構成される、実施例１から６のいずれか１つに記載のオーディオデコーダ。

【0096】

８．前記符号化オーディオ信号がフレームのシーケンスに編成され、ジョイント符号化スケールパラメータの前記第２のグループに関する前記情報が、特定のフレームにおいて、ゼロサイド情報を含み、前記スケール・パラメータ・デコーダ（２２０）が、ジョイント符号化スケールパラメータの前記第２のグループが前記特定のフレームについてすべてゼロであると決定するために前記ゼロサイド情報を検出するように構成され、
前記スケール・パラメータ・デコーダ（２２０）が、スケールパラメータの前記第１のセットおよびスケールパラメータの前記第２のセットのうちの前記スケールパラメータを、ジョイント符号化スケールパラメータの前記第１のグループからのみ導出するか、あるいは、前記第１のグループのうちの前記ジョイント符号化スケールパラメータと前記第２のグループのうちの前記ジョイント符号化スケールパラメータとの前記結合において、ゼロ値または雑音閾値よりも小さい値に設定するように構成される、実施例１から７のいずれか１つに記載のオーディオデコーダ。
９．前記スケール・パラメータ・デコーダ（２２０）が、
第１の逆量子化モードを使用してジョイント符号化スケールパラメータの前記第１のグループに関する前記情報を逆量子化することと、
第２の逆量子化モードを使用してジョイント符号化スケールパラメータの前記第２のグループに関する前記情報を逆量子化することであって、前記第２の逆量子化モードが前記第１の逆量子化モードとは異なる、逆量子化することと
を行うように構成される、
実施例１から８のいずれか１つに記載のオーディオデコーダ。

【0097】

１０．前記スケール・パラメータ・デコーダ（２２０）が、前記第１の逆量子化モードよりも低いまたは高い量子化精度に関連付けられた前記第２の逆量子化モードを使用するように構成される、実施例９に記載のオーディオデコーダ。
１１．前記スケール・パラメータ・デコーダ（２２０）が、前記第１の逆量子化モードとして、第１の逆量子化段（２２２０）および第２の逆量子化段（２２６０）および結合器（２２４０）を使用することであって、前記結合器（２２４０）が、前記第１の逆量子化段（２２２０）の結果および前記第２の逆量子化段（２２６０）の結果を入力として受信する、使用することと、
ジョイント符号化スケールパラメータの前記第２のグループに関する前記情報を入力として受信する、前記第１の逆量子化モードの前記第２の逆量子化段（２２２０）を、前記第２の逆量子化モードとして使用することと、を行うように構成される、実施例９または１０に記載のオーディオデコーダ。
１２．前記第１の逆量子化段（２２２０）がベクトル逆量子化段であり、前記第２の逆量子化段（２２６０）が代数ベクトル逆量子化段であるか、または、前記第１の逆量子化段（２２２０）が固定レート逆量子化段であり、前記第２の逆量子化段（２２６０）が可変レート逆量子化段である、実施例１１に記載のオーディオデコーダ。

【0098】

１３．ジョイント符号化スケールパラメータの前記第１のグループに関する前記情報が、前記符号化オーディオ信号のフレームについて、２つ以上のインデックスを含み、ジョイント符号化スケールパラメータの前記第２のグループに関する前記情報が、単一のインデックスまたは前記第１のグループ中のものと比べて少数のインデックスもしくは同じ数のインデックスを含み、
前記スケール・パラメータ・デコーダ（２２０）が、前記第１の逆量子化段（２２２０）において、例えば前記２つ以上のインデックスの各インデックスについて、前記第１のグループの中間ジョイント符号化スケールパラメータを決定するように構成され、前記スケール・パラメータ・デコーダ（２２０）が、前記第２の逆量子化段（２２６０）において、例えばジョイント符号化スケールパラメータの前記第１のグループに関する前記情報の前記単一のまたはより少数もしくは同じ数のインデックスから、前記第１のグループの残差ジョイント符号化スケールパラメータを計算し、前記結合器（２２４０）によって、前記第１のグループの前記中間ジョイント符号化スケールパラメータおよび前記第１のグループの前記残差ジョイント符号化スケールパラメータからジョイント符号化スケールパラメータの前記第１のグループを計算するように構成される、実施例１１または１２に記載のオーディオデコーダ。

【0099】

１４．前記第１の逆量子化段（２２２０）が、第１の数のエントリを有する第１のコードブックのためのインデックスを使用すること、または、第１の精度を表すインデックスを使用することを含み、前記第２の逆量子化段（２２６０）が、第２の数のエントリを有する第２のコードブックのためのインデックスを使用すること、または、第２の精度を表すインデックスを使用することを含み、前記第２の数が前記第１の数よりも少ないかまたは多い、あるいは、前記第２の精度が前記第１の精度よりも低いかまたは高い、実施例１１から１３のいずれか１つに記載のオーディオデコーダ。
１５．ジョイント符号化スケールパラメータの前記第２のグループに関する前記情報は、ジョイント符号化スケールパラメータの前記第２のグループが、前記符号化オーディオ信号のフレームについてすべてゼロまたは特定の値であることを示し、前記スケール・パラメータ・デコーダ（２２０）が、前記第１の規則または前記第２の規則を使用した前記結合において、ゼロであるかまたは前記特定の値であるかまたは合成されたジョイント符号化スケールパラメータであるジョイント符号化スケールパラメータを使用するように構成され、あるいは
前記すべてゼロまたは特定の値の情報を含む前記フレームについて、前記スケール・パラメータ・デコーダ（２２０）が、結合演算を用いずにジョイント符号化スケールパラメータの前記第１のグループのみを使用してスケールパラメータの前記第２のセットを決定するように構成される、実施例１から１４のいずれか１つに記載のオーディオデコーダ。

【0100】

１６．前記スケール・パラメータ・デコーダ（２２０）が、前記第１の逆量子化モードとして、前記第１の逆量子化段（２２２０）および前記第２の逆量子化段（２２６０）および前記結合器（２２４０）を使用することであって、前記結合器（２２４０）が、前記第１の逆量子化段（２２２０）の結果および前記第２の逆量子化段（２２６０）の結果を入力として受信する、使用することと、前記第１の逆量子化モードの前記第１の逆量子化段（２２２０）を、前記第２の逆量子化煙として使用することと、を行うように構成される、実施例９または１０に記載のオーディオデコーダ。

【0101】

１７．２つ以上のチャネルを含むマルチチャネルオーディオ信号を符号化するためのオーディオエンコーダであって、
前記マルチチャネルオーディオ信号の第１のチャネルのためのスケールパラメータの第１のセットと、前記マルチチャネルオーディオ信号の第２のチャネルのためのスケールパラメータの第２のセットとから、ジョイント符号化スケールパラメータの第１のグループおよびジョイント符号化スケールパラメータの第２のグループを計算するためのスケールパラメータ計算器（１４０）と、
スケールパラメータの前記第１のセットを前記マルチチャネルオーディオ信号の前記第１のチャネルに適用し、スケールパラメータの前記第２のセットを前記マルチチャネルオーディオ信号の前記第２のチャネルに適用し、マルチチャネル・オーディオ・データを導出するための信号プロセッサ（１２０）と、
符号化マルチチャネルオーディオ信号を取得するために、前記マルチチャネル・オーディオ・データと、ジョイント符号化スケールパラメータの前記第１のグループに関する情報と、ジョイント符号化スケールパラメータの前記第２のグループに関する情報とを使用するための符号化信号形成器（１４８０、１５００）と
を含む、オーディオエンコーダ。

【0102】

１８．前記信号プロセッサ（１２０）が、前記適用において、
ジョイント符号化スケールパラメータの前記第１のグループに関する前記情報およびジョイント符号化スケールパラメータの前記第２のグループに関する前記情報を取得するために、ジョイント符号化スケールパラメータの前記第１のグループおよびジョイント符号化スケールパラメータの前記第２のグループを符号化することと、
スケールパラメータのローカルに復号された第１のセットおよびスケールパラメータのローカルに復号された第２のセットを取得するために、ジョイント符号化スケールパラメータの前記第１のグループおよび前記第２のグループに関する前記情報をローカルに復号することと、
スケールパラメータの前記ローカルに復号された第１のセットを使用して前記第１のチャネルをスケーリングし、スケールパラメータの前記ローカルに復号された第２のセットを使用して前記第２のチャネルをスケーリングすることと
を行うように構成されるか、または
前記信号プロセッサ（１２０）が、前記適用において、
ジョイント符号化スケールパラメータの量子化された第１のグループおよびジョイント符号化スケールパラメータの量子化された第２のグループを取得するために、ジョイント符号化スケールパラメータの前記第１のグループおよびジョイント符号化スケールパラメータの前記第２のグループを量子化することと、
スケールパラメータのローカルに復号された第１のセットおよびスケールパラメータのローカルに復号された第２のセットを取得するために、ジョイント符号化スケールパラメータの前記量子化された第１のグループおよび前記第２のグループをローカルに復号することと、
スケールパラメータの前記ローカルに復号された第１のセットを使用して前記第１のチャネルをスケーリングし、スケールパラメータの前記ローカルに復号された第２のセットを使用して前記第２のチャネルをスケーリングすることと
を行うように構成される、実施例１７に記載のオーディオエンコーダ。

【0103】

１９．前記スケールパラメータ計算器（１４０）が、ジョイント符号化スケールパラメータの前記第１のグループのうちのジョイント符号化スケールパラメータを取得するために第１の結合規則を使用して、およびジョイント符号化スケールパラメータの前記第２のグループのうちのジョイント符号化スケールパラメータを取得するために前記第１の結合規則とは異なる第２の結合規則を使用して、スケールパラメータの前記第１のセットのうちのスケールパラメータとスケールパラメータの前記第２のセットのうちのスケールパラメータとを結合するように構成される、
実施例１７または１８に記載のオーディオエンコーダ。
２０．ジョイント符号化スケールパラメータの前記第１のグループがミッド・スケール・パラメータを含み、ジョイント符号化スケールパラメータの前記第２のグループがサイド・スケール・パラメータを含み、前記スケールパラメータ計算器（１４０）が、前記第１の結合規則において加算を使用し、前記第２の結合規則において減算を使用するように構成される、実施例１９に記載のオーディオエンコーダ。

【0104】

２１．前記スケールパラメータ計算器が、前記マルチチャネルオーディオ信号のフレームのシーケンスを処理するように構成され、
前記スケールパラメータ計算器（１４０）が、
前記フレームのシーケンスのうちの第１のフレームについてジョイント符号化スケールパラメータの第１のグループおよび第２のグループを計算することと、
第２のフレームのためのセパレート・コーディング・モードを決定するために前記フレームのシーケンスのうちの前記第２のフレームを分析することと、を行うように構成され、
前記符号化信号形成器（１４８０、１５００）が、前記符号化オーディオ信号に、前記第２のフレームのためのセパレート符号化モードまたは前記第１のフレームのためのジョイント符号化モードを示す状態サイド情報と、前記第２のフレームのためのセパレート符号化スケールパラメータの前記第１のセットおよび前記第２のセットに関する情報とを導入するように構成される、実施例１７から２０のいずれか１つに記載のオーディオエンコーダ。

【0105】

２２．前記スケールパラメータ計算器（１４０）が、
前記第１のチャネルのためのスケールパラメータの前記第１のセットおよび前記第２のチャネルのためのスケールパラメータの前記第２のセットを計算することと、
ダウンサンプリングされた第１のセットおよびダウンサンプリングされた第２のセットを取得するために、スケールパラメータの前記第１のセットおよび前記第２のセットをダウンサンプリングすることと、
前記第１のグループのうちのジョイント符号化スケールパラメータおよび前記第２のグループのうちのジョイント符号化スケールパラメータを取得するために異なる結合規則を使用して、前記ダウンサンプリングされた第１のセットからのスケールパラメータと前記ダウンサンプリングされた第２のセットとを結合することとを行うように構成されるか、
または
前記スケールパラメータ計算器（１４０）が、
前記第１のチャネルのための販売パラメータの前記第１のセットおよび前記第２のチャネルのためのスケールパラメータの前記第２のセットを計算することと、
前記第１のグループのうちのジョイント符号化スケールパラメータおよび前記第２のグループのうちのジョイント符号化スケールパラメータを取得するために異なる結合規則を使用して、前記第１のセットからのスケールパラメータと前記第２のセットからのスケールパラメータとを結合することと、
ジョイント符号化スケールパラメータのダウンサンプリングされた第１のグループを取得するためにジョイント符号化スケールパラメータの前記第１のグループをダウンサンプリングし、ジョイント符号化スケールパラメータのダウンサンプリングされた第２のグループを取得するためにジョイント符号化スケールパラメータの前記第２のグループをダウンサンプリングすることと、を行うように構成され、
前記ダウンサンプリングされた第１のグループおよび前記ダウンサンプリングされた第２のグループが、ジョイント符号化スケールパラメータの前記第１のグループに関する前記情報およびジョイント符号化スケールパラメータの前記第２のグループに関する前記情報を表す、実施例１７から２１のいずれか１つに記載のオーディオエンコーダ。

【0106】

２３．前記スケールパラメータ計算器（１４０）は、前記第２のフレームにおける前記第１のチャネルと前記第２のチャネルとの類似性を計算し、計算された類似性が閾値との第１の関係にある場合に前記セパレート符号化モードを決定するか、または、前記計算された類似性が前記閾値との異なる第２の関係にある場合に前記ジョイント符号化モードを決定するように構成される、
実施例２１または２２に記載のオーディオエンコーダ。
２４．前記スケールパラメータ計算器（１４０）は、
前記第２のフレームについて、各帯域について前記第１のセットのうちの前記スケールパラメータと前記第２のセットのうちの前記スケールパラメータとの間の差を計算することと、
前記第２のフレームの処理された差を取得するために、負号が外れるように前記第２のフレームの各差を処理することと、
類似度を取得するために、前記処理された差を結合することと、
前記類似度を前記閾値と比較することと、
前記類似度が前記閾値よりも大きいときは、前記セパレート・コーディング・モードを優先して判定し、または、前記類似度が前記閾値よりも小さいときは、前記ジョイント・コーディング・モードを優先して判定することと
を行うように構成される、実施例２３に記載のオーディオエンコーダ。

【0107】

２５．前記信号プロセッサ（１２０）が、
第１段結果として１つ以上の第１の量子化インデックスを取得し、ジョイント符号化スケールパラメータの中間の第１のグループを取得するために、第１段量子化関数（１４１、１４３）を使用してジョイント符号化スケールパラメータの前記第１のグループを量子化することと、
ジョイント符号化スケールパラメータの前記第１のグループおよびジョイント符号化スケールパラメータの前記中間の第１のグループからジョイント符号化スケールパラメータの残差の第１のグループを計算すること（１４２）と、
第２段結果として１つ以上の量子化インデックスを取得するために、第２段量子化関数（１４５）を使用してジョイント符号化スケールパラメータの前記残差の第１のグループを量子化することと
を行うように構成される、実施例１７から２４のいずれか１つに記載のオーディオエンコーダ。

【0108】

２６．前記信号プロセッサ（１２０）が、単一段結果として１つ以上の量子化インデックスを取得するために、単一段量子化関数を使用してジョイント符号化スケールパラメータの前記第２のグループを量子化するように構成されるか、または
前記信号プロセッサ（１２０）が、少なくとも第１段量子化関数および第２段量子化関数を使用してジョイント符号化スケールパラメータの前記第１のグループを量子化するために構成され、前記信号プロセッサ（１２０）が、単一段量子化関数を使用してジョイント符号化スケールパラメータの前記第２のグループを量子化するために構成され、前記単一段量子化関数が、前記第１段量子化関数および前記第２段量子化関数から選択される、
実施例１７から２５のいずれか１つに記載のオーディオエンコーダ。

【0109】

２７．前記スケールパラメータ計算器（１４０）が、
第１段結果として１つ以上の第１の量子化インデックスを取得し、スケールパラメータの中間の第１のセットを取得するために、第１段量子化関数（１４１、１４３）を使用してスケールパラメータの前記第１のセットを量子化することと、
スケールパラメータの前記第１のセットおよびスケールパラメータの前記中間の第１のセットからスケールパラメータの残差の第１のセットを計算すること（１４２）と、
第２段結果として１つ以上の量子化インデックスを取得するために、第２段量子化関数（１４５）を使用してスケールパラメータの前記残差の第１のセットを量子化することと
を行うように構成されるか、または
前記スケールパラメータ計算器（１４０）が、
第１段結果として１つ以上の第１の量子化インデックスを取得し、スケールパラメータの中間の第２のセットを取得するために、第１段量子化関数（１４１、１４３）を使用してスケールパラメータの前記第２のセットを量子化することと、
スケールパラメータの前記第２のセットおよびスケールパラメータの前記中間の第２のセットからスケールパラメータの残差の第２のセットを計算すること（１４２）と、
第２段結果として１つ以上の量子化インデックスを取得するために、第２段量子化関数（１４５）を使用してスケールパラメータの前記残差の第２のセットを量子化することと
を行うように構成される、実施例２１から２６のいずれか１つに記載のオーディオエンコーダ。

【0110】

２８．前記第２段量子化関数（１４５）が、ベクトル量子化を実行する前にジョイント符号化スケーリングパラメータの前記残差の第１のグループまたはスケールパラメータの前記残差の第１のセットもしくは第２のセットを増加させるために、１よりも小さい増幅または重み付け値を使用し、前記ベクトル量子化が、増加した残差値を使用して実行され、および／あるいは
例示的に、前記重み付けまたは増幅値が、スケーリングパラメータを前記重み付けまたは増幅値で除算するために使用され、前記重み付け値が、好ましくは０．１から０．９の間、またはより好ましくは０．２から０．６の間、またはさらにより好ましくは０．２５から０．４の間であり、および／あるいは
ジョイント符号化スケーリングパラメータの前記残差の第１のグループまたはスケールパラメータの前記残差の第１のセットもしくは第２のセットのすべてのスケーリングパラメータについて同じ増幅値が使用される、
実施例２５または２７に記載のオーディオエンコーダ。

【0111】

２９．前記第１段量子化関数（１４１、１４３）が、前記１つ以上の量子化インデックスの第１のサイズに対応する第１の数のエントリを有する少なくとも１つのコードブックを含み、
前記第２段量子化関数（１４５）または前記単一段量子化関数が、前記１つ以上の量子化インデックスの第２のサイズに対応する第２の数のエントリを有する少なくとも１つのコードブックを含み、
前記第１の数が前記第２の数よりも大きいもしくは小さい、または、前記第１のサイズが前記第２のサイズよりも大きいもしくは小さい、あるいは
前記第１段量子化関数（１４１、１４３）が固定レート量子化関数であり、前記第２段量子化関数（１４５）が可変レート量子化関数である、
実施例２５から２８のいずれか１つに記載のオーディオエンコーダ。

【0112】

３０．前記スケールパラメータ計算器（１４０）が、
前記第１のチャネルのための第１のＭＤＣＴ表現および前記第２のチャネルのための第２のＭＤＣＴ表現を受信することと、
前記第１のチャネルのための第１のＭＤＳＴ表現および前記第２のチャネルのための第２のＭＤＳＴ表現を受信することと、
前記第１のＭＤＣＴ表現および前記第１のＭＤＳＴ表現から前記第１のチャネルについての第１のパワースペクトルを計算し、前記第２のＭＤＣＴ表現および前記第２のＭＤＳＴ表現から前記第２のチャネルについての第２のパワースペクトルを計算することと、
前記第１のパワースペクトルから前記第１のチャネルのためのスケールパラメータの前記第１のセットを計算し、前記第２のパワースペクトルから前記第２のチャネルのためのスケールパラメータの前記第２のセットを計算することと
を行うように構成される、実施例１５から２９のいずれか１つに記載のオーディオエンコーダ。

【0113】

３１．前記信号プロセッサ（１２０）が、スケールパラメータの前記第１のセットから導出された情報を使用して前記第１のＭＤＣＴ表現をスケーリングし、スケールパラメータの前記第２のセットから導出された情報を使用して前記第２のＭＤＣＴ表現をスケーリングするように構成される、
実施例３０に記載のオーディオエンコーダ。
３２．前記信号プロセッサ（１２０）が、前記マルチチャネルオーディオ信号のマルチチャネル処理された表現を導出するために、ジョイントマルチチャネル処理を使用して、スケーリングされた第１のチャネル表現およびスケーリングされた第２のチャネル表現をさらに処理し、任意選択的に、スペクトル帯域複製処理またはインテリジェントギャップ充填処理または帯域幅拡張処理を使用してさらに処理し、前記マルチチャネル・オーディオ・データを取得するために前記マルチチャネルオーディオ信号の前記チャネルの表現を量子化および符号化するように構成される、
実施例１７から３１のいずれか１つに記載のオーディオエンコーダ。

【0114】

３３．前記マルチチャネルオーディオ信号のフレームについて、ジョイント符号化スケールパラメータの前記第２のグループに関する前記情報を、前記フレームのすべてのジョイント符号化スケールパラメータについて同じ値またはゼロ値を示す、すべてゼロまたはすべて特定の値の情報として決定するように構成され、前記符号化信号形成器（１４８０、１５００）が、前記符号化マルチチャネルオーディオ信号を取得するために前記すべてゼロまたはすべて特定の値の情報を使用するように構成される、実施例１７から３４のいずれか１つに記載のオーディオエンコーダ。
３４．前記スケールパラメータ計算器（１４０）が、
第１のフレームについてジョイント符号化スケールパラメータの前記第１のグループおよびジョイント符号化スケールパラメータの前記第２のグループを計算することと、
第２のフレームについてジョイント符号化スケールパラメータの前記第１のグループを計算することとを行うように構成され、
前記第２のフレームにおいて、前記ジョイント符号化スケールパラメータが計算または符号化されず、
前記符号化信号形成器（１４８０、１５００）は、前記第２のフレームにおいて、前記第２のグループのどのジョイント符号化スケールパラメータも前記符号化マルチチャネルオーディオ信号に含まれないことを指示する、ジョイント符号化スケールパラメータの前記第２のグループに関する前記情報としてフラグを使用するように構成される、実施例１７から３４のいずれか１つに記載のオーディオエンコーダ。

【0115】

３５．２つ以上のオーディオチャネルについてのデータを含むマルチチャネル・オーディオ・データと、ジョイント符号化スケールパラメータに関する情報とを含む符号化オーディオ信号を復号する方法であって、
復号オーディオ信号の第１のチャネルのためのスケールパラメータの第１のセットと、前記復号オーディオ信号の第２のチャネルのためのスケールパラメータの第２のセットとを取得するために、前記ジョイント符号化スケールパラメータに関する前記情報を復号することと、
前記復号オーディオ信号の前記第１のチャネルおよび前記第２のチャネルを取得するために、前記マルチチャネル・オーディオ・データから導出された第１のチャネル表現にスケールパラメータの前記第１のセットを適用し、前記マルチチャネル・オーディオ・データから導出された第２のチャネル表現にスケールパラメータの前記第２のセットを適用することとを含み、
前記ジョイント符号化スケールパラメータが、ジョイント符号化スケールパラメータの第１のグループに関する情報およびジョイント符号化スケールパラメータの第２のグループに関する情報を含み、
前記復号することが、スケールパラメータの前記第１のセットのうちのスケールパラメータを取得するために第１の結合規則を使用して、およびスケールパラメータの前記第２のセットのうちのスケールパラメータを取得するために前記第１の結合規則とは異なる第２の結合規則を使用して、前記第１のグループのうちのジョイント符号化スケールパラメータと前記第２のグループのうちのジョイント符号化スケールパラメータとを結合することを含む、方法。

【0116】

３６．２つ以上のチャネルを含むマルチチャネルオーディオ信号を符号化する方法であって、
前記マルチチャネルオーディオ信号の第１のチャネルのためのスケールパラメータの第１のセットと、前記マルチチャネルオーディオ信号の第２のチャネルのためのスケールパラメータの第２のセットとから、ジョイント符号化スケールパラメータの第１のグループおよびジョイント符号化スケールパラメータの第２のグループを計算することと、
スケールパラメータの前記第１のセットを前記マルチチャネルオーディオ信号の前記第１のチャネルに適用し、スケールパラメータの前記第２のセットを前記マルチチャネルオーディオ信号の前記第２のチャネルに適用し、マルチチャネル・オーディオ・データを導出することと、
符号化マルチチャネルオーディオ信号を取得するために、前記マルチチャネル・オーディオ・データと、ジョイント符号化スケールパラメータの前記第１のグループに関する情報と、ジョイント符号化スケールパラメータの前記第２のグループに関する情報とを使用することと
を含む、方法。
３７．コンピュータまたはプロセッサ上で動作しているとき、実施例３１または実施例３２に記載の方法を実行するためのコンピュータプログラム。
マルチチャネルオーディオ信号のチャネルのためのスケールパラメータのジョイントコーディングを使用するオーディオデコーダ、オーディオエンコーダ、および関連する方法。

【0117】

参考文献
［１］ＩＳＯ／ＩＥＣ１１１７２－３、Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－Ｃｏｄｉｎｇｏｆｍｏｖｉｎｇｐｉｃｔｕｒｅｓａｎｄａｓｓｏｃｉａｔｅｄａｕｄｉｏｆｏｒｄｉｇｉｔａｌｓｔｏｒａｇｅｍｅｄｉａａｔｕｐｔｏａｂｏｕｔ１，５Ｍｂｉｔ／ｓ－Ｐａｒｔ３：Ａｕｄｉｏ、１９９３
［２］ＩＳＯ／ＩＥＣ１３８１８－７、Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－Ｇｅｎｅｒｉｃｃｏｄｉｎｇｏｆｍｏｖｉｎｇｐｉｃｔｕｒｅｓａｎｄａｓｓｏｃｉａｔｅｄａｕｄｉｏｉｎｆｏｒｍａｔｉｏｎ－Ｐａｒｔ７：ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（ＡＡＣ）、２００３
［３］ＩＳＯ／ＩＥＣ２３００３－３、Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－ＭＰＥＧａｕｄｉｏｔｅｃｈｎｏｌｏｇｉｅｓ－Ｐａｒｔ３：Ｕｎｉｆｉｅｄｓｐｅｅｃｈａｎｄａｕｄｉｏｃｏｄｉｎｇ
［４］３ＧＰＰＴＳ２６．４４５、ＣｏｄｅｃｆｏｒＥｎｈａｎｃｅｄＶｏｉｃｅＳｅｒｖｉｃｅｓ（ＥＶＳ）；Ｄｅｔａｉｌｅｄａｌｇｏｒｉｔｈｍｉｃｄｅｓｃｒｉｐｔｉｏｎ
［５］Ｇ．Ｍａｒｋｏｖｉｃ、Ｇ．Ｆｕｃｈｓ、Ｎ．Ｒｅｔｔｅｌｂａｃｈ、Ｃ．ＨｅｌｍｒｉｃｈおよびＢ．Ｓｃｈｕｂｅｒｔ、「ＬＩＮＥＡＲＰＲＥＤＩＣＴＩＯＮＢＡＳＥＤＣＯＤＩＮＧＳＣＨＥＭＥＵＳＩＮＧＳＰＥＣＴＲＡＬＤＯＭＡＩＮＮＯＩＳＥＳＨＡＰＮＧ」米国特許第９，５９５，２６２（Ｂ２）号、２０１７年３月１４日
［６］Ｅ．Ｒａｖｅｌｌｉ、Ｍ．Ｓｃｈｎｅｌｌ、Ｃ．Ｂｅｎｎｄｏｒｆ、Ｍ．ＬｕｔｚｋｙおよびＭ．Ｄｉｅｔｚ、「Ａｐｐａｒａｔｕｓａｎｄｍｅｔｈｏｄｆｏｒｅｎｃｏｄｉｎｇａｎｄｄｅｃｏｄｉｎｇａｎａｕｄｉｏｓｉｇｎａｌｕｓｉｎｇｄｏｗｎｓａｍｐｌｉｎｇｏｒｉｎｔｅｒｐｏｌａｔｉｏｎｏｆｓｃａｌｅｐａｒａｍｅｔｅｒｓ」国際公開第２０１９０９１９０４（Ａ１）号、２０１８年１１月５日
［７］Ａ．Ｂｉｓｗａｓ、ＡｄｖａｎｃｅｓＡｄｖａｎｃｅｓｉｎＰｅｒｃｅｐｔｕａｌＳｔｅｒｅｏＡｕｄｉｏＣｏｄｉｎｇＵｓｉｎｇＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎＴｅｃｈｎｉｑｕｅｓ、Ｅｉｎｄｈｏｖｅｎ：ＴｅｃｈｎｉｃａｌＵｎｉｖｅｒｓｉｔｙｏｆＥｉｎｄｈｏｖｅｎ、２０１７
［８］Ｇ．Ｍａｒｋｏｖｉｃ、Ｅ．Ｒａｖｅｌｌｉ、Ｍ．Ｓｃｈｎｅｌｌ、Ｓ．Ｄｏｈｌａ、Ｗ．Ｊａｅｇａｒｓ、Ｍ．Ｄｉｅｔｚ、Ｃ．Ｈｅｉｍｒｉｃｈ、Ｅ．Ｆｏｔｏｐｏｕｌｏｕ、Ｍ．Ｍｕｌｔｒｕｓ、Ｓ．Ｂａｙｅｒ，Ｇ．ＦｕｃｈｓおよびＪ．Ｈｅｒｒｅ、「ＡＰＰＡＲＡＴＵＳＡＮＤＭＥＴＨＯＤＦＯＲＭＤＣＴＭ／ＳＳＴＥＲＥＯＷＩＴＨＧＬＯＢＡＬＩＬＤＷＩＴＨＩＭＰＲＯＶＥＤＭＩＤ／ＳＩＤＥＤＥＣＩＳＩＯＮ」国際公開第２０１７ＥＰ５１１７号

【図1】