特許7073491 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

特許7073491スケールパラメータのダウンサンプリングまたは補間を使用してオーディオ信号をエンコードおよびデコードするための装置および方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12a
12b
12c

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-05-13

(45)【発行日】2022-05-23

(54)【発明の名称】スケールパラメータのダウンサンプリングまたは補間を使用してオーディオ信号をエンコードおよびデコードするための装置および方法

(51)【国際特許分類】

G10L 19/035 20130101AFI20220516BHJP

G10L 19/02 20130101ALI20220516BHJP

G10L 19/00 20130101ALI20220516BHJP

【ＦＩ】

G10L19/035 A

G10L19/02 150

G10L19/00 330B

【請求項の数】 39

(21)【出願番号】P 2020524593

(86)(22)【出願日】2018-11-05

(65)【公表番号】

(43)【公表日】2021-01-28

(86)【国際出願番号】 EP2018080137

(87)【国際公開番号】W WO2019091904

(87)【国際公開日】2019-05-16

【審査請求日】2020-06-13

(31)【優先権主張番号】PCT/EP2017/078921

(32)【優先日】2017-11-10

(33)【優先権主張国・地域又は機関】EP

(73)【特許権者】

【識別番号】500341779

【氏名又は名称】フラウンホーファー－ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン

(74)【代理人】

【識別番号】100134119

【弁理士】

【氏名又は名称】奥町哲行

(72)【発明者】

【氏名】ラヴェッリ・エマニュエル

(72)【発明者】

【氏名】シュネル・マーカス

(72)【発明者】

【氏名】ベンドルフ・コンラッド

(72)【発明者】

【氏名】ルツキー・マンフレッド

(72)【発明者】

【氏名】ディーツ・マーティン

(72)【発明者】

【氏名】コーセ・スリカンス

【審査官】大野弘

(56)【参考文献】

【文献】特表平０１－５０１４３５（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１９／０３５

Ｇ１０Ｌ１９／０２

Ｇ１０Ｌ１９／００

(57)【特許請求の範囲】

【請求項1】

オーディオ信号（１６０）をエンコードするための装置であって、
前記オーディオ信号（１６０）をスペクトル表現に変換するための変換器（１００）と、
前記スペクトル表現から第１セットのスケールパラメータを計算するためのスケールパラメータ計算機（１１０）と、
第２セットのスケールパラメータを取得するために前記第１セットのスケールパラメータをダウンサンプリングするためのダウンサンプラ（１３０）であって、前記第２セットのスケールパラメータ内の第２の数のスケールパラメータは前記第１セットのスケールパラメータ内の第１の数のスケールパラメータよりも少ない、ダウンサンプラ（１３０）と、
前記第２セットのスケールパラメータのエンコード表現を生成するためのスケールパラメータエンコーダ（１４０）と、
前記第１セットのスケールパラメータを使用するかまたは第３セットのスケールパラメータを使用して前記スペクトル表現を処理するためのスペクトルプロセッサ（１２０）であって、前記第３セットのスケールパラメータは、前記第２の数のスケールパラメータよりも多い第３の数のスケールパラメータを有し、前記スペクトルプロセッサ（１２０）は、第３セットのスケールパラメータを使用するときに、補間演算を使用して、前記第２セットのスケールパラメータから、または前記第２セットのスケールパラメータの前記エンコード表現から前記第３セットのスケールパラメータを導出するように構成されている、スペクトルプロセッサ（１２０）と、
前記スペクトル表現のエンコード表現に関する情報および前記第２セットのスケールパラメータの前記エンコード表現に関する情報を備えるエンコード済み出力信号（１７０）を生成するための出力インターフェース（１５０）と、
を備え、
前記スケールパラメータ計算機（１１０）は、前記スペクトル表現の複数の帯域の各帯域について、第１セットの線形領域量を取得するために線形領域内の振幅関連量を計算し、かつ前記第１セットのスケールパラメータとして第１セットの対数状領域量を取得するために、前記第１セットの線形領域量を対数状領域に変換するように構成されており、
前記ダウンサンプラ（１３０）は、前記対数状領域内の前記第２セットのスケールパラメータを取得するために、前記第１セットのスケールパラメータを前記対数状領域内にダウンサンプリングするように構成されている、装置。

【請求項2】

前記スペクトルプロセッサ（１２０）は、前記スペクトル表現を処理するために前記線形領域内で前記第１セットのスケールパラメータを使用し、または補間された対数状領域スケールパラメータを取得するために前記対数状領域内の前記第２セットのスケールパラメータを補間し、前記第３セットのスケールパラメータを取得するために前記対数状領域スケールパラメータを前記線形領域に変換するように構成されている、
請求項１に記載の装置。

【請求項3】

前記スケールパラメータ計算機（１１０）は、不均一な帯域について前記第１セットのスケールパラメータを計算するように構成されており、
前記ダウンサンプラ（１３０）は、前記第１セットの第１の所定数の周波数隣接スケールパラメータを有する第１のグループを組み合わせることによって前記第２セットの第１のスケールパラメータを取得するために、前記第１セットのスケールパラメータをダウンサンプリングするように構成されており、前記ダウンサンプラ（１３０）は、前記第１セットの第２の所定数の周波数隣接スケールパラメータを有する第２のグループを組み合わせることによって前記第２セットの第２のスケールパラメータを取得するために、前記第１セットのスケールパラメータをダウンサンプリングするように構成されており、前記第２の所定数は前記第１の所定数に等しく、前記第２のグループは、前記第１のグループの要素とは異なる要素を有する、
請求項１または２に記載の装置。

【請求項4】

前記第１セットの前記第１のグループの周波数隣接スケールパラメータおよび前記第１セットの前記第２のグループの周波数隣接スケールパラメータは、前記第１のグループおよび前記第２のグループが互いに重複するように、前記第１セットの少なくとも１つのスケールパラメータを共通して有する、請求項３に記載の装置。

【請求項5】

前記ダウンサンプラ（１３０）は、前記第１セットのスケールパラメータのあるグループの最初のスケールパラメータの間で平均演算を使用するように構成されており、前記グループは２つ以上の要素を有する、請求項１から４のいずれか一項に記載の装置。

【請求項6】

前記平均演算は、前記グループの端のスケールパラメータよりも強い前記グループの中央のスケールパラメータを重み付けするように構成されている、
請求項５に記載の装置。

【請求項7】

前記ダウンサンプラ（１３０）は、前記第２セットのスケールパラメータの平均がなくなるように、平均値除去（１３３）を実行するように構成されている、
請求項１から６のいずれか一項に記載の装置。

【請求項8】

前記ダウンサンプラ（１３０）は、前記対数状領域内の１．０より小さく０．０より大きいスケーリング係数を使用してスケーリング演算（１３４）を実行するように構成されている、
請求項１から７のいずれか一項に記載の装置。

【請求項9】

前記スケールパラメータエンコーダ（１４０）は、ベクトル量子化器（１４１）を使用して前記第２セットを量子化およびエンコードするように構成されており、前記エンコード表現は、１つ以上のベクトル量子化器コードブックについて１つ以上のインデックス（１４６）を備える、
請求項１から８のいずれか一項に記載の装置。

【請求項10】

前記スケールパラメータエンコーダ（１４０）は、前記エンコード表現に関連付けられた第２セットの量子化済みスケールパラメータを提供するように構成されており、
前記スペクトルプロセッサ（１２０）は、前記第２セットの量子化済みスケールパラメータ（１４５）から前記第３セットのスケールパラメータを導出するように構成されている、
請求項１から９のいずれか一項に記載の装置。

【請求項11】

前記スペクトルプロセッサ（１２０）は、前記第３の数が前記第１の数に等しくなるようにこの前記第３セットのスケールパラメータを決定するように構成されている、
請求項１から１０のいずれか一項に記載の装置。

【請求項12】

前記スペクトルプロセッサ（１２０）は、量子化済みスケールパラメータ、および周波数に関して昇順の一連の量子化済みスケールパラメータにおける前記量子化済みスケールパラメータと次の量子化済みスケールパラメータとの差に基づいて、補間されたスケールパラメータ（１２１）を決定するように構成されている、
請求項１から１１のいずれか一項に記載の装置。

【請求項13】

前記スペクトルプロセッサ（１２０）は、前記量子化済みスケールパラメータおよび前記差から、少なくとも２つの補間されたスケールパラメータを決定するように構成されており、前記２つの補間されたスケールパラメータの各々について、異なる重み係数が使用される、
請求項１２に記載の装置。

【請求項14】

前記重み係数は、前記補間されたスケールパラメータに関連する周波数の増加とともに増加する、
請求項１３に記載の装置。

【請求項15】

前記スペクトルプロセッサ（１２０）は、前記対数状領域で補間演算（１２１）を実行し、
前記第３セットのスケールパラメータを取得するために、補間されたスケールパラメータを前記線形領域に変換（１２２）するように構成されている、
請求項１から１４のいずれか一項に記載の装置。

【請求項16】

前記スケールパラメータ計算機（１１０）は、１セットの振幅関連量（１１１）を取得するために各帯域の振幅関連量を計算し、
前記第１セットのスケールパラメータとして１セットの平滑化された振幅関連量を取得するために、前記振幅関連量を平滑化（１１２）するように構成されている、
請求項１から１５のいずれか一項に記載の装置。

【請求項17】

前記スケールパラメータ計算機（１１０）は、１セットの振幅関連量を取得するために、各帯域の振幅関連量を計算し、
前記１セットの振幅関連量に対してプリエンファシス演算を実行（１１３）するように構成されており、前記プリエンファシス演算は、低周波数振幅が高周波数振幅に対して強調されるようになっている、
請求項１から１６のいずれか一項に記載の装置。

【請求項18】

前記スケールパラメータ計算機（１１０）は、１セットの振幅関連量を取得するために、各帯域の振幅関連量を計算し、
ノイズフロア加算演算（１１４）を実行するように構成されており、ノイズフロアは、前記スペクトル表現の２つ以上の周波数帯域からの平均値として導出された振幅関連量から計算される、
請求項１から１７のいずれか一項に記載の装置。

【請求項19】

前記スケールパラメータ計算機（１１０）は、演算のグループのうちの少なくとも１つを実行するように構成されており、前記演算のグループは、複数の帯域の振幅関連量を計算すること（１１１）と、平滑化演算を実行すること（１１２）と、プリエンファシス演算を実行すること（１１３）と、ノイズフロア加算演算を実行すること（１１４）と、前記第１セットのスケールパラメータを取得するために対数状領域変換演算（１１５）を実行することを備える、請求項１から１８のいずれか一項に記載の装置。

【請求項20】

前記スペクトルプロセッサ（１２０）は、重み付けされたスペクトル表現を取得するために前記第３セットのスケールパラメータを使用して、前記スペクトル表現におけるスペクトル値を重み付け（１２３）し、前記重み付けされたスペクトル表現に対して時間的ノイズ成形（ＴＮＳ）演算（１２４）を適用するように構成されており、前記スペクトルプロセッサ（１２０）は、前記スペクトル表現の前記エンコード表現を取得するために、前記時間的ノイズ成形演算（１２４）の結果を量子化（１２５）およびエンコードするように構成されている、
請求項１から１９のいずれか一項に記載の装置。

【請求項21】

前記変換器（１００）は、ウィンドウ化オーディオサンプルの一連のブロックを生成するための分析ｗｉｎｄｏｗｅｒ（１０１）と、ウィンドウ化オーディオサンプルの前記ブロックを一連のスペクトル表現に変換するための時間スペクトル変換器（１０２）とを備え、スペクトル表現はスペクトルフレームである、
請求項１から２０のいずれか一項に記載の装置。

【請求項22】

前記変換器（１００）は、時間領域サンプルのブロックからＭＤＣＴスペクトルを取得するために、ＭＤＣＴ（修正離散コサイン変換）演算を適用するように構成されており、または
前記スケールパラメータ計算機（１１０）は、各帯域について、前記帯域のエネルギーを計算するように構成されており、前記計算は、スペクトル線を２乗すること、２乗したスペクトル線を加算すること、および前記２乗したスペクトル線を前記帯域の線の本数で除算することを含み、または
前記スペクトルプロセッサ（１２０）は、前記スペクトル表現のスペクトル値を重み付け（１２３）し、帯域スキームにしたがって前記スペクトル表現から導出されたスペクトル値を重み付け（１２３）するように構成されており、前記帯域スキームは、前記スケールパラメータ計算機（１１０）によって前記第１セットのスケールパラメータを計算する際に使用された前記帯域スキームと同一であり、または
帯域の数は６４であり、第１の数は６４であり、第２の数は１６であり、第３の数は６４であり、または
前記スペクトルプロセッサ（１２０）は、すべての帯域のグローバルゲインを計算し、スカラー量子化器を使用する前記第３の数のスケールパラメータを伴うスケーリング（１２３）に続いて、前記スペクトル値を量子化（１２５）するように構成されており、前記スペクトルプロセッサ（１２０）は、前記グローバルゲインに応じて前記スカラー量子化器（１２５）のステップサイズを制御するように構成されている、
請求項１から２１のいずれか一項に記載の装置。

【請求項23】

オーディオ信号（１６０）をエンコードする方法であって、
前記オーディオ信号（１６０）をスペクトル表現に変換するステップ（１００）と、
前記スペクトル表現から第１セットのスケールパラメータを計算するステップ（１１０）と、
第２セットのスケールパラメータを取得するために前記第１セットのスケールパラメータをダウンサンプリングするステップ（１３０）であって、前記第２セットのスケールパラメータ内の第２の数のスケールパラメータは前記第１セットのスケールパラメータ内の第１の数のスケールパラメータよりも少ない、ステップと、
前記第２セットのスケールパラメータのエンコード表現を生成するステップ（１４０）と、
前記第１セットのスケールパラメータを使用するかまたは第３セットのスケールパラメータを使用して前記スペクトル表現を処理するステップ（１２０）であって、前記第３セットのスケールパラメータは、前記第２の数のスケールパラメータよりも多い第３の数のスケールパラメータを有し、前記処理ステップ（１２０）は、第３セットのスケールパラメータを使用するときに、補間演算を使用して、前記第２セットのスケールパラメータから、または前記第２セットのスケールパラメータの前記エンコード表現から前記第３セットのスケールパラメータを導出する、ステップと、
前記スペクトル表現のエンコード表現に関する情報および前記第２セットのスケールパラメータの前記エンコード表現に関する情報を備えるエンコード済み出力信号（１７０）を生成するステップ（１５０）と、
を備え、
第１セットのスケールパラメータを計算するステップ（１１０）は、前記スペクトル表現の複数の帯域の各帯域について、第１セットの線形領域量を取得するために線形領域内の振幅関連量を計算すること、および前記第１セットのスケールパラメータとして第１セットの対数状領域量を取得するために、前記第１セットの線形領域量を対数状領域に変換することを含み、
前記ダウンサンプリングするステップ（１３０）は、前記対数状領域内の前記第２セットのスケールパラメータを取得するために、前記第１セットのスケールパラメータを前記対数状領域内にダウンサンプリングすることを含む、方法。

【請求項24】

エンコード済みスペクトル表現に関する情報および第２セットのスケールパラメータのエンコード表現に関する情報を備えるエンコード済みオーディオ信号をデコードするための装置であって、
前記エンコード済みオーディオ信号を受信し、前記エンコード済みスペクトル表現および前記第２セットのスケールパラメータの前記エンコード表現を抽出するための入力インターフェース（２００）と、
デコード済みスペクトル表現を取得するために前記エンコード済みスペクトル表現をデコードするためのスペクトルデコーダ（２１０）と、
第１セットのスケールパラメータを取得するために、前記エンコードされた第２セットのスケールパラメータをデコードするためのスケールパラメータデコーダ（２２０）であって、前記第２セットのスケールパラメータの数は、前記第１セットのスケールパラメータの数よりも少ない、スケールパラメータデコーダ（２２０）と、
スケーリングされたスペクトル表現を取得するために、前記第１セットのスケールパラメータを使用して前記デコード済みスペクトル表現を処理するためのスペクトルプロセッサ（２３０）と、
デコード済みオーディオ信号を取得するために、前記スケーリングされたスペクトル表現を変換するための変換器（２４０）と、
を備え、
前記スケールパラメータデコーダ（２２０）は、補間された対数状領域スケールパラメータを取得するために、対数状領域内の前記第２セットのスケールパラメータを補間（２２２）するように構成されている、装置。

【請求項25】

前記スケールパラメータデコーダ（２２０）は、１つ以上の量子化インデックスについて、前記第２セットのデコード済みスケールパラメータを提供するベクトル逆量子化器（２１０）を使用して、前記エンコード済みスペクトル表現をデコードするように構成されており、
前記スケールパラメータデコーダ（２２０）は、前記第１セットのスケールパラメータを取得するために、前記第２セットのデコード済みスケールパラメータを補間（２２２）するように構成されている、
請求項２４に記載の装置。

【請求項26】

前記スケールパラメータデコーダ（２２２）は、量子化済みスケールパラメータ、および周波数に関して昇順の一連の量子化済みスケールパラメータにおける前記量子化済みスケールパラメータと次の量子化済みスケールパラメータとの差に基づいて、補間されたスケールパラメータを決定するように構成されている、
請求項２４または２５に記載の装置。

【請求項27】

前記スケールパラメータデコーダ（２２２）は、前記量子化済みスケールパラメータおよび前記差から、少なくとも２つの補間されたスケールパラメータを決定するように構成されており、前記２つの補間されたスケールパラメータの各々の生成のため、異なる重み係数が使用される、
請求項２６に記載の装置。

【請求項28】

前記スケールパラメータデコーダ（２２０）は、前記重み係数を使用するように構成されており、前記重み係数は、前記補間されたスケールパラメータに関連する周波数の増加とともに増加する、
請求項２７に記載の装置。

【請求項29】

前記スケールパラメータデコーダは、前記対数状領域で補間演算（２２２）を実行し、
前記第１セットのスケールパラメータを取得するために、補間されたスケールパラメータを前記線形領域に変換（２２３）するように構成されており、前記対数状領域は、１０の基数または２の基数を有する対数領域である、請求項２４から２８のいずれか一項に記載の装置。

【請求項30】

前記スペクトルプロセッサ（２３０）は、
ＴＮＳデコード済みスペクトル表現を取得するために、前記デコード済みスペクトル表現に時間的ノイズ成形（ＴＮＳ）デコーダ演算を適用（２１１）し、
前記第１セットのスケールパラメータを使用して、前記ＴＮＳデコード済みスペクトル表現を重み付け（２１２）する
ように構成されている、請求項２４から２９のいずれか一項に記載の装置。

【請求項31】

前記スケールパラメータデコーダ（２２０）は、補間された量子化済みスケールパラメータが以下の式を使用して取得された値の±２０％の範囲内の値を有するように量子化済みスケールパラメータを補間するように構成されており、

ここで、ｓｃｆＱ（ｎ）はインデックスｎの前記量子化済みスケールパラメータであり、ｓｃｆＱｉｎｔ（ｋ）はインデックスｋの前記補間されたスケールパラメータである、
請求項２４から３０のいずれか一項に記載の装置。

【請求項32】

前記スケールパラメータデコーダ（２２０）は、周波数に関して、前記第１セットのスケールパラメータ内のスケールパラメータを取得するために補間（２２２）を実行し、周波数に関して、前記第１セットのスケールパラメータの端でスケールパラメータを取得するために外挿演算を実行するように構成されている、
請求項２４から３１のいずれか一項に記載の装置。

【請求項33】

前記スケールパラメータデコーダ（２２０）は、外挿演算によって、昇順の周波数帯域に関して前記第１セットのスケールパラメータの少なくとも最初のスケールパラメータおよび最後のスケールパラメータを決定するように構成されている、
請求項３２に記載の装置。

【請求項34】

前記スケールパラメータデコーダ（２２０）は、補間（２２２）および前記対数状領域から前記線形領域へのその後の変換を実行するように構成されており、前記対数状領域はｌｏｇ２領域であり、前記線形領域における線形領域値は２の基数を有するべき乗を使用して計算される、
請求項２４から３３のいずれか一項に記載の装置。

【請求項35】

前記エンコード済みオーディオ信号は、前記エンコード済みスペクトル表現のグローバルゲインに関する情報を備え、
前記スペクトルデコーダ（２１０）は、前記グローバルゲインを使用して前記エンコード済みスペクトル表現を逆量子化（２１０）するように構成されており、
前記スペクトルプロセッサ（２３０）は、帯域の前記第１セットのスケールパラメータの同じスケールパラメータを使用して、各逆量子化スペクトル値または前記帯域の前記逆量子化スペクトル表現から導出された各値を重み付けすることによって、前記逆量子化スペクトル表現または前記逆量子化スペクトル表現から導出された値を処理するように構成されている、
請求項２４から３４のいずれか一項に記載の装置。

【請求項36】

前記変換器（２４０）は、
時間的に後のスケーリングされたスペクトル表現を変換（２４１）し、
変換された時間的に後のスケーリングされたスペクトル表現を合成ウィンドウ化（２４２）し、
デコード済みオーディオ信号を取得するために、ウィンドウ化および変換された表現を重複および加算（２４３）する
ように構成されている、請求項２４から３５のいずれか一項に記載の装置。

【請求項37】

前記変換器（２４０）は逆修正離散コサイン変換（ＭＤＣＴ）変換器を備え、または
前記スペクトルプロセッサ（２３０）は、スペクトル値に前記第１セットのスケールパラメータの対応するスケールパラメータを乗算するように構成されており、または
前記第２セットのスケールパラメータ内のスケールパラメータの第２の数は１６であって前記第１の数は６４であり、または
前記第１セットの各スケールパラメータは帯域に関連付けられており、より高い周波数に対応する帯域はより低い周波数に関連付けられた帯域よりも広く、高周波数帯域に関連付けられた前記第１セットのスケールパラメータのあるスケールパラメータは、低周波数帯域に関連付けられたスケールパラメータと比較してより多くのスペクトル値を重み付けするために使用され前記低周波数帯域に関連付けられた前記スケールパラメータは、前記低周波数帯域の少数のスペクトル値を重み付けするために使用される、
請求項２４から３６のいずれか一項に記載の装置。

【請求項38】

エンコード済みスペクトル表現に関する情報および第２セットのスケールパラメータのエンコード表現に関する情報を備えるエンコード済みオーディオ信号をデコードする方法であって、
前記エンコード済みオーディオ信号を受信し、前記エンコード済みスペクトル表現および前記第２セットのスケールパラメータの前記エンコード表現を抽出するステップ（２００）と、
デコード済みスペクトル表現を取得するために前記エンコード済みスペクトル表現をデコードするステップ（２１０）と、
第１セットのスケールパラメータを取得するために、前記エンコードされた第２セットのスケールパラメータをデコードするステップ（２２０）であって、前記第２セットのスケールパラメータの数は、前記第１セットのスケールパラメータの数よりも少ない、ステップと、
スケーリングされたスペクトル表現を取得するために、前記第１セットのスケールパラメータを使用して前記デコード済みスペクトル表現を処理するステップ（２３０）と、
デコード済みオーディオ信号を取得するために、前記スケーリングされたスペクトル表現を変換するステップ（２４０）と、
を備える方法。

【請求項39】

コンピュータまたはプロセッサ上で実行されたときに、請求項２３の方法または請求項３８の方法を実行するための、コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明はオーディオ処理に関し、特に、スペクトル帯域のスケールパラメータを使用してスペクトル領域で動作するオーディオ処理に関する。

【背景技術】

【0002】

従来技術１：アドバンストオーディオコーディング（ＡＡＣ）
最も広く使用されている最先端の知覚オーディオコーデックの１つであるアドバンストオーディオコーディング（ＡＡＣ）［１－２］では、いわゆるスケール係数の助けを借りてスペクトルノイズ成形が実行される。

【0003】

このアプローチでは、ＭＤＣＴスペクトルは多数の不均一なスケール係数帯域に分割される。たとえば４８ｋＨｚで、ＭＤＣＴは１０２４個の係数を有し、これが４９個のスケール係数帯域に分割される。各帯域では、その帯域のＭＤＣＴ係数をスケーリングするためにスケール係数が使用される。次に、スケーリングされたＭＤＣＴ係数を量子化するために、一定のステップサイズのスカラー量子化器が採用される。デコーダ側では、各帯域で逆スケーリングが実行され、スカラー量子化器によって導入された量子化ノイズを成形する。

【0004】

４９個のスケール係数は、サイド情報としてビットストリームにエンコードされる。比較的多数のスケール係数および必要な高精度のため、通常、スケール係数をエンコードするにはかなり大量のビットを必要とする。これは、低ビットレートおよび／または低遅延において問題となる可能性がある。

【0005】

従来技術２：ＭＤＣＴベースのＴＣＸ
ＭＤＣＴベースのＴＣＸ、すなわちＭＰＥＧ－ＤＵＳＡＣ［３］および３ＧＰＰＥＶＳ［４］規格で使用される変換ベースのオーディオコーデックでは、最近のＡＣＥＬＰベースの音声コーデック（たとえば、ＡＭＲ－ＷＢ）で使用されるのと同じ知覚フィルタである、ＬＰＣベースの知覚ファイラの助けを借りて、スペクトルノイズ成形が実行される。

【0006】

このアプローチでは、プリエンファシスされた入力信号に基づいて１６個のＬＰＣのセットが最初に推定される。次に、ＬＰＣが重み付けおよび量子化される。次に、重み付けおよび量子化されたＬＰＣの周波数応答が、６４個の等間隔の帯域で計算される。次に、計算された周波数応答を使用して、ＭＤＣＴ係数が各帯域内でスケーリングされる。次に、スケーリングされたＭＤＣＴ係数は、ステップサイズがグローバルゲインによって制御されたスカラー量子化器を使用して量子化される。デコーダでは、６４帯域ごとに逆スケーリングが実行され、スカラー量子化器によって導入された量子化ノイズを成形する。

【0007】

このアプローチは、ＡＡＣアプローチに対する明らかな利点を有する。これは、サイド情報（ＡＡＣにおける４９個のパラメータとは対照的に）１６（ＬＰＣ）＋１（グローバルゲイン）個のみのパラメータのエンコードを必要とする。また、１６個のＬＰＣは、ＬＳＦ表現およびベクトル量子化器を採用することによって、少ないビット数で効率的にエンコードされ得る。その結果、従来技術２のアプローチは従来技術１のアプローチよりも少ないサイド情報ビットを必要とし、これにより、低ビットレートおよび／または低遅延において著しい違いをもたらすことができる。

【0008】

しかしながら、このアプローチは、いくつかの欠点も有する。第１の欠点は、ＬＰＣは時間領域内で推定されるため、ノイズ成形の周波数スケールが線形（すなわち等間隔の帯域を使用する）に制限されることである。人間の耳は高周波数よりも低周波数の方が敏感なので、これは不利である。第２の欠点は、このアプローチに必要とされる高度な複雑さである。ＬＰＣ推定（自己相関、レビンソン・ダービン）、ＬＰＣ量子化（ＬＰＣ＜－＞ＬＳＦ変換、ベクトル量子化）、およびＬＰＣ周波数応答計算はすべて、コストのかかる演算である。第３の欠点は、ＬＰＣベースの知覚フィルタは容易に修正できず、これにより重要なオーディオアイテムに必要とされるであろういくつかの特定のチューニングを妨げるので、このアプローチはあまり柔軟性がないことである。

【0009】

従来技術３：改良されたＭＤＣＴベースのＴＣＸ
最近のいくつかの研究は、従来技術２の第１の欠点および部分的に第２の欠点に対処してきた。これは、米国特許第９５９５２６２Ｂ２号明細書、欧州特許第２６７６２６６Ｂ１号明細書で公開された。この新しいアプローチでは、自己相関（ＬＰＣを確立するため）はもはや時間領域内では実行されないが、代わりにＭＤＣＴ係数エネルギーの逆変換を使用してＭＤＣＴ領域内で計算される。これにより、単にＭＤＣＴ係数を６４個の不均一な帯域にグループ化して各帯域のエネルギーを計算することで、不均一な周波数スケールを使用できるようになる。これは、自己相関を計算するために必要とされる複雑さも低減する。

【0010】

しかしながら、新しいアプローチを使用しても、第２の欠点および第３の欠点のほとんどが残る。

【先行技術文献】

【特許文献】

【0011】

【文献】米国特許第９５９５２６２Ｂ２号明細書

【文献】欧州特許第２６７６２６６Ｂ１号明細書

【発明の概要】

【発明が解決しようとする課題】

【0012】

本発明の目的は、オーディオ信号を処理するための改善された概念を提供することである。

【課題を解決するための手段】

【0013】

この目的は、請求項１のオーディオ信号をエンコードするための装置、請求項２４のオーディオ信号をエンコードする方法、請求項２５のエンコード済みオーディオ信号をデコードするための装置、請求項４０のエンコード済みオーディオ信号をデコードする方法、および請求項４１のコンピュータプログラムによって達成される。

【0014】

オーディオ信号をエンコードするための装置は、オーディオ信号をスペクトル表現に変換するための変換器を備える。さらに、スペクトル表現から第１セットのスケールパラメータを計算するためのスケールパラメータ計算機が提供される。加えて、ビットレートを可能な限り低く保つために、第２セットのスケールパラメータを取得するために第１セットのスケールパラメータがダウンサンプリングされ、第２セットのスケールパラメータ内の第２の数のスケールパラメータは、第１セットのスケールパラメータ内の第１の数のスケールパラメータよりも少ない。さらに、第３セットのスケールパラメータを使用してスペクトル表現を処理するためのスペクトルプロセッサに加えて、第２セットのスケールパラメータのエンコード表現を生成するためのスケールパラメータエンコーダが提供され、第３セットのスケールパラメータは、第２の数のスケールパラメータよりも多い第３の数のスケールパラメータを有する。特に、スペクトルプロセッサは、第１セットのスケールパラメータを使用するように、または第３セットのスケールパラメータを第２セットのスケールパラメータから、またはスペクトル表現のエンコード表現を取得するために補間演算を使用して第２セットのスケールパラメータのエンコード表現から導出するように、構成されている。さらに、スペクトル表現のエンコード表現に関する情報を備え、第２セットのスケールパラメータのエンコード表現に関する情報も備えるエンコード済み出力信号を生成するために、出力インターフェースが提供される。

【0015】

本発明は、エンコーダ側で、より多くのスケール係数でスケーリングし、エンコーダ側のスケールパラメータを第２セットのスケールパラメータまたはスケール係数にダウンサンプリングすることによって、実質的な品質の損失を伴わずに低ビットレートを得ることができるという発見に基づいており、後に出力インターフェースを介してエンコードおよび送信または記憶される第２セット内のスケールパラメータは、第１の数のスケールパラメータよりも少ない。したがって、一方では細かいスケーリングが、他方では低ビットレートが、エンコーダ側で得られる。

【0016】

デコーダ側では、第１セットのスケール係数を取得するために、送信された少数のスケール係数がスケール係数デコーダによってデコードされ、第１セット内のスケール係数またはスケールパラメータの数は、第２セット内のスケール係数またはスケールパラメータの数よりも多く、するとやはり、細かくスケーリングされたスペクトル表現を取得するために、スペクトルプロセッサ内のデコーダ側で、より多くのスケールパラメータを使用する細かいスケーリングが実行される。

【0017】

このようにして、一方では低ビットレートが、他方ではそれにもかかわらずオーディオ信号スペクトルの高品質スペクトル処理が、得られる。

【0018】

好適な実施形態で行われるようなスペクトルノイズ成形は、非常に低いビットレートのみを使用して実施される。したがって、このスペクトルノイズ成形は、低ビットレート変換ベースのオーディオコーデックであっても不可欠のツールであり得る。スペクトルノイズ成形は、量子化ノイズが人間の耳によって最小限に知覚されるように、したがってデコード済み出力信号の知覚品質が最大化され得るように、周波数領域内の量子化ノイズを成形する。

【0019】

好適な実施形態は、スペクトル表現のエネルギーなど、振幅関連量から計算されたスペクトルパラメータに依存する。特に、帯域単位のエネルギー、または一般に、帯域単位の振幅関連量は、スケールパラメータの基底として計算され、帯域単位の振幅関連量を計算する際に使用される帯域幅は、人間の聴覚の特性に可能な限り近づけるために、低帯域から高帯域まで増加する。好ましくは、スペクトル表現の帯域への分割は、公知のバークスケールにしたがって行われる。

【0020】

さらなる実施形態では、線形領域スケールパラメータが計算され、特に多数のスケールパラメータを用いて第１セットのスケールパラメータ向けに計算され、この多数のスケールパラメータは対数状領域に変換される。対数状領域は一般に、小さい値が拡張されて高い値が圧縮される領域である。次に、基数１０を有する対数領域、または基数２を有する対数領域であり得る対数状領域内で、スケールパラメータのダウンサンプリングまたは間引き演算が行われるが、実施目的では後者が好ましい。次に、第２セットのスケール係数が対数状領域内で計算され、好ましくは、第２セットのスケール係数のベクトル量子化が実行され、スケール係数は対数状領域内にある。したがって、ベクトル量子化の結果は、対数状領域スケールパラメータを示す。第２セットのスケール係数またはスケールパラメータは、たとえば、第１セットの数の半分、または三分の一、またはより好ましくは四分の一の数のスケール係数を有する。次に、第２セットのスケールパラメータ内の量子化された少数のスケールパラメータがビットストリーム内にもたらされ、次にエンコーダ側からデコーダ側に送信されるか、またはやはりこれらのパラメータを使用して処理された量子化スペクトルとともにエンコード済みオーディオ信号として記憶され、この処理は追加で、グローバルゲインを使用する量子化を伴う。しかしながら、好ましくは、エンコーダは、これらの量子化された対数状領域の第２のスケール係数から、もう一度第３セットのスケール係数である線形領域スケール係数のセットを導出し、第３セットのスケール係数内のスケール係数の数は、第２の数よりも多く、好ましくは第１セットの第１のスケール係数内の第１の数のスケール係数にさえ等しい。次に、エンコーダ側では、これらの補間されたスケール係数は、スペクトル表現を処理するために使用され、処理されたスペクトル表現は、最終的に量子化され、ハフマン符号化、算術符号化、またはベクトル量子化ベースの符号化などによって、いずれかの方法でエントロピーエンコードされる。

【0021】

スペクトル表現のエンコード表現とともに少数のスペクトルパラメータを有するエンコード済み信号を受信するデコーダでは、少数のスケールパラメータが多数のスケールパラメータに補間され、すなわち第２セットのスケール係数またはスケールパラメータのスケール係数のスケールパラメータの数が、第１セット、すなわちスケール係数／パラメータデコーダによって計算されたセットのスケールパラメータの数よりも少ない、第１セットのスケールパラメータを取得する。次に、エンコード済みオーディオ信号をデコードするための装置内に配置されたスペクトルプロセッサは、スケーリングされたスペクトル表現を取得するために、この第１セットのスケールパラメータを使用して、デコード済みスペクトル表現を処理する。次に、スケーリングされたスペクトル表現を変換するための変換器は、好ましくは時間領域内にあるデコード済みオーディオ信号を最終的に取得するように動作する。

【0022】

さらなる実施形態は、以下に明記される追加の利点をもたらす。好適な実施形態では、スペクトルノイズ成形は、従来技術１で使用されるスケール係数と類似の１６個のスケーリングパラメータの助けを借りて実行される。これらのパラメータは、最初に（従来技術３の６４個の不均一な帯域と類似の）６４個の不均一帯域内のＭＤＣＴスペクトルのエネルギーを計算し、次に６４個のエネルギーに何らかの処理を適用し（平滑化、プリエンファシス、ノイズフロア、対数変換）、次に、最終的に正規化およびスケーリングされる１６個のパラメータを取得するために、４の係数で６４個の処理されたエネルギーをダウンサンプリングすることによって、エンコーダ内で取得される。次に、これら１６個のパラメータは、ベクトル量子化を使用して（従来技術２／３で使用されるのと類似のベクトル量子化を使用して）量子化される。次に、量子化されたパラメータは、６４個の補間されたスケーリングパラメータを取得するために補間される。次に、これら６４個のスケーリングパラメータは、６４個の不均一な帯域内でＭＤＣＴスペクトルを直接成形するために使用される。従来技術２および３と同様に、スケーリングされたＭＤＣＴ係数はその後、ステップサイズがグローバルゲインによって制御されたスカラー量子化器を使用して量子化される。デコーダでは、６４帯域ごとに逆スケーリングが実行され、スカラー量子化器によって導入された量子化ノイズを成形する。

【0023】

従来技術２／３と同様に、好適な実施形態は、１６＋１個のパラメータのみをサイド情報として使用し、パラメータは、ベクトル量子化を使用して低ビット数で効率的にエンコードされ得る。その結果、好適な実施形態は、従来の２／３と同じ利点を有する。これは従来技術１のアプローチよりも少ないサイド情報ビットを必要とし、これにより、低ビットレートおよび／または低遅延において著しい違いをもたらすことができる。

【0024】

従来技術３と同様に、好適な実施形態は、非線形周波数スケーリングを使用し、したがって従来技術２の第１の欠点を有していない。

【0025】

従来技術２／３とは対照的に、好適な実施形態は、高度な複雑さを有するＬＰＣ関連機能のいずれも使用しない。必要な処理機能（平滑化、プリエンファシス、ノイズフロア、対数変換、正規化、スケーリング、補間）は、比較すると非常に小さな複雑さを必要とする。ベクトル量子化のみが、依然として比較的高度な複雑さを有する。しかし、いくつかのあまり複雑ではないベクトル量子化技術は、少ない性能損失で使用され得る（多分割／多段アプローチ）。したがって、好適な実施形態は、複雑さに関して従来技術２／３の第２の欠点を有していない。

【0026】

従来技術２／３とは対照的に、好適な実施形態は、ＬＰＣベースの知覚フィルタに依存していない。これは、多くの自由度で計算され得る１６個のスケーリングパラメータを使用する。好適な実施形態は、従来技術２／３よりも柔軟であり、したがって従来技術２／３の第３の欠点を有していない。

【0027】

結論として、好適な実施形態は、いずれの欠点もなく、従来技術２／３のすべての利点を有する。

【0028】

本発明の好適な実施形態は、以下の添付図面を参照して、引き続きより詳細に説明される。

【図面の簡単な説明】

【0029】

【図1】オーディオ信号をエンコードするための装置のブロック図である。

【図2】図１のスケール係数計算機の好適な実施の概略図である。

【図3】図１のダウンサンプラの好適な実施の概略図である。

【図4】図４のスケール係数エンコーダの概略図である。

【図5】図１のスペクトルプロセッサの概略説明図である。

【図6】スペクトルノイズ成形（ＳＮＳ）を実施する、一方ではエンコーダおよび他方ではデコーダの一般的な図である。

【図7】時間的ノイズ成形（ＴＮＳ）がスペクトルノイズ成形（ＳＮＳ）とともに実施される、一方ではエンコーダおよび他方ではデコーダのより詳細な図である。

【図8】エンコード済みオーディオ信号をデコードするための装置のブロック図である。

【図9】図８のスケール係数デコーダ、スペクトルプロセッサ、およびスペクトルデコーダの詳細を示す概略説明図である。

【図10】６４帯域へのスペクトルの細分化を示す図である。

【図11】一方ではダウンサンプリング演算および他方では補間演算の概略説明図である。

【図12a】フレームが重複している時間領域オーディオ信号を示す図である。

【図12b】図１の変換器の実施を示す図である。

【図12c】図８の変換器の概略説明図である。

【発明を実施するための形態】

【0030】

図１は、オーディオ信号１６０をエンコードするための装置を示す。オーディオ信号１６０は好ましくは時間領域において利用可能であるが、予測領域またはその他いずれかの領域など、オーディオ信号のほかの表現も主として有用であろう。装置は、変換器１００、スケール係数計算機１１０、スペクトルプロセッサ１２０、ダウンサンプラ１３０、スケール係数エンコーダ１４０、および出力インターフェース１５０を備える。変換器１００は、オーディオ信号１６０をスペクトル表現に変換するように構成されている。スケール係数計算機１１０は、スペクトル表現から第１セットのスケールパラメータまたはスケール係数を計算するように構成されている。

【0031】

本明細書全体を通じて、用語「スケール係数」または「スケールパラメータ」は、同じパラメータまたは値、すなわち何らかの処理に続いて、ある種のスペクトル値の重み付けに使用される値またはパラメータ値を指すために使用される。この重み付けは、線形領域内で実行されるとき、実際にスケーリング係数を用いた乗算演算である。しかしながら、対数領域内で重み付けが実行されるときには、スケール係数を用いた重み付け演算が、実際の加算または減算演算によって行われる。したがって、本出願の条件において、スケーリングは、乗算または除算のみを意味するのではなく、特定の領域に応じて、加算または減算も示し、または一般に、たとえばスペクトル値がスケール係数またはスケールパラメータを使用して重み付けまたは修正される、各演算を示す。

【0032】

ダウンサンプラ１３０は、第２セットのスケールパラメータを取得するために第１セットのスケールパラメータをダウンサンプリングするように構成されており、第２セットのスケールパラメータ内の第２の数のスケールパラメータは、第１セットのスケールパラメータ内の第１の数のスケールパラメータよりも少ない。これは、第２の数が第１の数よりも小さいと述べている図１のボックスでも概説されている。図１に示されるように、スケール係数エンコーダは、第２セットのスケール係数のエンコード表現を生成するように構成されており、このエンコード表現は、出力インターフェース１５０に転送される。第２セットのスケール係数は第１セットのスケール係数よりも少数のスケール係数を有するという事実のため、第２セットのスケール係数のエンコード表現を送信または記憶するためのビットレートは、ダウンサンプラ１３０内で実行されるスケール係数のダウンサンプリングが実行されなかった場合の状況と比較して、低い。

【0033】

さらに、スペクトルプロセッサ１２０は、第３セットのスケールパラメータを使用して、図１の変換器１００によって出力されたスペクトル表現を処理するように構成されており、第３セットのスケールパラメータまたはスケール係数は、第２の数のスケール係数よりも多い第３の数のスケール係数を有し、スペクトルプロセッサ１２０は、スペクトル処理の目的のため、線１７１を介してブロック１１０からすでに利用可能なものとして第１セットのスケール係数を使用するように構成されている。あるいは、スペクトルプロセッサ１２０は、線１７２によって示されるように、第３セットのスケール係数の計算のためにダウンサンプラ１３０によって出力されたものとして第２セットのスケール係数を使用するように構成されている。さらなる実施では、スペクトルプロセッサ１２０は、図１の線１７３によって示されるように、第３セットのスケール係数を計算する目的のため、スケール係数／パラメータエンコーダ１４０によって出力されたエンコード表現を使用する。好ましくは、スペクトルプロセッサ１２０は、第１セットのスケール係数を使用しないが、ダウンサンプラによって計算された通りの第２セットのスケール係数を使用するか、またはより好ましくはエンコード表現、または一般的には量子化された第２セットのスケール係数を使用し、その後、補間演算によってより多くのスケールパラメータを有する第３セットのスケールパラメータを取得するために、量子化された第２セットのスペクトルパラメータを補間するための補間演算を実行する。

【0034】

したがって、ブロック１４０によって出力される第２セットのスケール係数のエンコード表現は、好ましくは使用されたスケールパラメータコードブック用のコードブックインデックス、または対応するコードブックインデックスのセットのいずれかを備える。別の実施形態では、エンコード表現は、コードブックインデックスまたはコードブックインデックスのセット、または一般にはエンコード表現がデコーダ側ベクトルデコーダまたはその他いずれかのデコーダに入力されるときに、取得された量子化済みスケール係数の量子化済みスケールパラメータを備える。

【0035】

好ましくは、スペクトルプロセッサ１２０は、デコーダ側でも利用可能な同じセットのスケール係数を使用し、すなわち最終的に第３セットのスケール係数を取得するために、補間演算とともに量子化された第２セットのスケールパラメータを使用する。

【0036】

好適な実施形態では、第３セットのスケール係数内の第３の数のスケール係数は、第１の数のスケール係数に等しい。しかしながら、より少数のスケール係数もまた有用である。例示的には、たとえば、ブロック１１０において６４個のスケール係数を導出することができ、次いで送信のために６４個のスケール係数を１６個のスケール係数にダウンサンプリングすることができる。次に、スペクトルプロセッサ１２０内で、必ずしも６４個のスケール係数ではなく、３２個のスケール係数への補間を実行することができる。あるいは、エンコード済み出力信号１７０で送信されたスケール係数の数が、図１のブロック１１０で計算された、またはブロック１２０で計算および使用されたスケール係数の数よりも少ない限り、場合によっては、６４超など、さらに多くのスケール係数への補間を実行することができる。

【0037】

好ましくは、スケール係数計算機１１０は、図２に示されるいくつかの演算を実行するように構成されている。これらの演算は、帯域あたりの振幅関連量の計算１１１を指す。帯域あたりの好適な振幅関連量は帯域あたりのエネルギーであるが、たとえば、帯域あたりの振幅の規模の総和、またはエネルギーに対応する振幅の２乗の総和など、ほかの振幅関連量もまた使用され得る。しかしながら、帯域あたりのエネルギーを計算するために使用される２の累乗は別として、信号のラウドネスを反映する３の累乗などの別の累乗もまた使用可能であり、１．５または２．５の累乗など、整数とは異なる累乗さえも、帯域あたりの振幅関連量を計算するために使用され得る。このような累乗によって処理された値が正の値であることが確認される限り、１．０未満の累乗でさえも使用され得る。

【0038】

スケール係数計算機によって実行されるさらなる演算は、帯域間平滑化１１２であり得る。この帯域間平滑化は、好ましくは、ステップ１１１によって取得されたような振幅関連量のベクトルに現れる可能性のある、あり得る不安定性を平滑化するために使用される。この平滑化を実行しない場合、これらの不安定性は、特にエネルギーが０に近いスペクトル値で、１１５で示されるように後に対数領域に変換されたときに、増幅されるだろう。しかしながら、別の実施形態では、帯域間平滑化は実行されない。

【0039】

スケール係数計算機１１０によって実行されるさらなる好適な演算は、プリエンファシス演算１１３である。プリエンファシス演算は、従来技術に関して先に論じられたようなＭＤＣＴベースのＴＣＸ処理のＬＰＣベースの知覚フィルタで使用されるプリエンファシス演算と類似の目的を有する。この手順は、低周波数の量子化ノイズを減少させることになる低周波数の成形スペクトルの振幅を増加させる。

【0040】

しかしながら、実施に応じて、（ほかの特定の演算のように）プリエンファシス演算は必ずしも実行される必要はない。

【0041】

さらなる任意選択的な処理演算は、ノイズフロア加算処理１１４である。この手順は、谷における成形スペクトルの振幅増幅を制限することによって、たとえばグロッケンシュピールなど、非常に高いスペクトルダイナミクスを含む信号の品質を改善し、これは谷における量子化ノイズの増加を犠牲にして、ピークにおける量子化ノイズを低減する間接的効果を有し、ここで量子化ノイズは、絶対聴覚閾値、マスキング前、マスキング後、または一般的なマスキング閾値などの人間の耳のマスキング特性のためどうしても知覚できず、これは通常、周波数が大音量のトーンに比較的近い低音量のトーンが全く知覚できない、すなわち人間の聴覚メカニズムによって完全にマスクされるかまたは大まかにしか知覚されないことを示し、このスペクトル貢献は非常に大まかにしか量子化され得ない。

【0042】

しかしながら、ノイズフロア加算演算１１４は、必ずしも実行される必要はない。

【0043】

さらに、ブロック１１５は、対数状領域変換を示す。好ましくは、図２のブロック１１１、１１２、１１３、１１４のうちの１つの出力の変換は、対数状領域内で実行される。対数状領域は、０に近い値が拡張されて高い値が圧縮される領域である。好ましくは、対数領域は２の基底を有する領域であるが、別の対数領域もまた使用され得る。しかしながら、２の基底を有する対数領域の方が、定点信号プロセッサでの実施には適している。

【0044】

スケール係数計算機１１０の出力は、第１セットのスケール係数である。

【0045】

図２に示されるように、ブロック１１２から１１５の各々はブリッジされることが可能であり、すなわち、たとえばブロック１１１の出力は、すでに第１セットのスケール係数であり得る。しかしながら、すべての処理演算および、特に対数状領域変換が好ましい。したがって、たとえばステップ１１２から１１４の手順なしにステップ１１１および１１５を実行するだけで、スケール係数計算機を実装することさえできる。

【0046】

したがって、スケール係数計算機は、いくつかのブロックを接続する入力／出力線で示されるように、図２に示される手順の１つまたは２つまたはそれ以上を実行するように構成されている。

【0047】

図３は、図１のダウンサンプラ１３０の好適な実施を示す。好ましくは、ローパスフィルタリング、または一般には特定のウィンドウｗ（ｋ）を用いるフィルタリングがステップ１３１で実行され、次に、フィルタリングの結果のダウンサンプリング／間引き演算が実行される。ローパスフィルタリング１３１および好適な実施形態ではダウンサンプリング／間引き演算１３２が両方とも算術演算であるという事実のため、フィルタリング１３１およびダウンサンプリング１３２は、後で概説されるように、単一の演算において実行され得る。好ましくは、ダウンサンプリング／間引き演算は、第１セットのスケールパラメータにおける個々のグループのスケールパラメータの間の重複が実行されるように実行される。好ましくは、間引かれて計算された２つのパラメータ間のフィルタリング演算における１つのスケール係数の重複が実行される。したがって、ステップ１３１は、間引きの前にスケールパラメータのベクトルに対してローパスフィルタを実行する。このローパスフィルタは、心理音響モデルで使用される広がり関数と類似の効果を有する。これは、ピークにおける量子化ノイズに対して少なくともさらに、いずれにせよ知覚的にマスクされるピークの周りの量子化ノイズの増加を犠牲にして、ピークでの量子化ノイズを減少させる。

【0048】

さらに、ダウンサンプラは、平均値除去１３３および追加のスケーリングステップ１３４を追加で実行する。しかしながら、ローパスフィルタリング演算１３１、平均値除去ステップ１３３、およびスケーリングステップ１３４は、任意選択的なステップに過ぎない。したがって、図３に示される、または図１に示されるダウンサンプラは、ステップ１３２を実行するだけのために、またはステップ１３２とステップ１３１、１３３、および１３４のうちの１つなど、図３に示される２つのステップを実行するために、実装され得る。あるいは、ダウンサンプラは、ダウンサンプリング／間引き演算１３２が実行される限り、図３に示される４つすべてのステップまたは４つのステップのうちの３つのステップを実行することができる。

【0049】

図３で概説されたように、ダウンサンプラによって実行される図３のオーディオ演算は、よりよい結果を得るために、対数状領域内で実行される。

【0050】

図４は、スケール係数エンコーダ１４０の好適な実施を示す。スケール係数エンコーダ１４０は、好ましくは対数状領域の第２セットのスケール係数を受信し、最終的にフレームごとに１つ以上のインデックスを出力するために、ブロック１４１に示されるようなベクトル量子化を実行する。これらフレームごとに１つ以上のインデックスは、出力インターフェースに転送されてビットストリームに書き込まれ、すなわちいずれか利用可能な出力インターフェース手順によって、出力されたエンコード済みオーディオ信号１７０に導入される。好ましくは、ベクトル量子化器１４１は、量子化された対数状領域の第２セットのスケール係数を追加で出力する。したがって、このデータは、矢印１４４によって示されるように、ブロック１４１によって直接出力されることが可能である。しかしながら、代わりに、デコーダコードブック１４２もまた、エンコーダ内で別個に利用可能である。このデコーダコードブックは、フレームごとに１つ以上のインデックスを受信し、線１４５によって示されるように、これらのフレームごとに１つ以上のインデックスから、量子化された好ましく対数状の領域の第２セットのスケール係数を導出する。典型的な実施では、デコーダコードブック１４２は、ベクトル量子化器１４１内に組み込まれる。好ましくは、ベクトル量子化器１４１は、たとえば、示された従来技術の手順のいずれかで使用されるような、多段または分割レベル、または複合多段／分割レベルのベクトル量子化器である。

【0051】

したがって、デコーダ側、すなわち、線１４６を介してブロック１４１によって出力されたフレームごとに１つ以上のインデックスを有するエンコード済みオーディオ信号のみを受信するデコーダ内でも利用可能な、同じ量子化された第２セットのスケール係数であることが確実となる。

【0052】

図５は、スペクトルプロセッサの好適な実施を示す。図１のエンコーダに含まれるスペクトルプロセッサ１２０は、量子化された第２セットのスケールパラメータを受信し、第３セットのスケールパラメータを出力する、補間器１２１を備え、第３の数が第２の数よりも大きく、好ましくは第１の数に等しい。さらに、スペクトルプロセッサは、線形領域変換器１２０を備える。次に、一方では線形スケールパラメータ、および他方では変換器１００によって取得されたスペクトル表現を使用して、ブロック１２３においてスペクトル成形が実行される。好ましくは、ブロック１２４の出力でスペクトル残差値を取得するために、後続の時間的ノイズ成形、すなわち周波数にわたる予測が実行され、同時にＴＮＳサイド情報は、矢印１２９によって示されるように、出力インターフェースに転送される。

【0053】

最後に、スペクトルプロセッサ１２５は、スペクトル表現、すなわちフレーム全体の単一のグローバルゲインを受信するように構成された、スカラー量子化器／エンコーダを有する。好ましくは、グローバルゲインは、特定のビットレート考慮事項に応じて導出される。したがって、グローバルゲインは、ブロック１２５によって生成されたスペクトル表現のエンコード表現が、ビットレート要件、品質要件、またはその両方などの特定の要件を満たすように設定される。グローバルゲインは、繰り返し計算されることが可能であり、または場合により、フィードフォワード量で計算されることが可能である。一般に、グローバルゲインは量子化器とともに使用され、高グローバルゲインは通常、より粗い量子化をもたらし、低グローバルゲインはより細かい量子化をもたらす。したがって、言い換えると、固定量子化器が得られると、高グローバルゲインはより高い量子化ステップサイズをもたらし、その一方で低グローバルゲインはより小さい量子化ステップサイズをもたらす。しかしながら、高い値である種の圧縮機能を有する、すなわち、たとえば高い値の方が低い値よりも圧縮されるようなある種の非線形圧縮機能を有する量子化器など、グローバルゲイン機能とともに別の量子化器もまた使用されることが可能である。対数領域での加算に対応する線形領域での量子化の前の値にグローバルゲインが乗じられると、グローバルゲインと量子化粗度との間の上記の依存性が有効になる。しかしながら、線形領域での除算によって、または対数領域での減算によってグローバルゲインが適用される場合、依存性は逆になる。「グローバルゲイン」が逆の値を表すときも、同様である。

【0054】

続いて、図１から図５に関連して説明された個々の手順の好適な実施が与えられる。

【0055】

好適な実施形態の詳細なステップごとの説明
エンコーダ：
・ステップ１：帯域あたりのエネルギー（１１１）
帯域あたりのエネルギー

は、以下のように計算される。

はＭＤＣＴ係数、

は帯域の数、

は帯域インデックスである。帯域は不均一であり、知覚的に関連するバークスケールに従う（低周波数では小さく、高周波数では大きい）。

【0056】

・ステップ２：平滑化（１１２）
帯域あたりのエネルギー

は、以下を用いて平滑化される。

備考：このステップは主に、ベクトル

に現れる可能性のある、あり得る不安定性を平滑化するために使用される。平滑化されない場合には、これらの不安定性は、特にエネルギーが０に近い谷において、対数領域に変換されたとき（ステップ５参照）、増幅される。

【0057】

・ステップ３：プリエンファシス（１１３）
帯域あたりの平滑化されたエネルギー

はその後、以下を使用してプリエンファシスされる。

ここで、

は、プリエンファシスの傾斜を制御し、サンプリング周波数に依存する。これはたとえば、１６ｋＨｚで１８、および４８ｋＨｚで３０である。このステップで使用されるプリエンファシスは、従来技術２のＬＰＣベースの知覚フィルタで使用されるプリエンファシスと同じ目的を有し、これは低周波数での成形スペクトルの振幅を増加させ、結果として低周波数における量子化ノイズを低減する。

【0058】

・ステップ４：ノイズフロア（１１４）
－４０ｄＢでのノイズフロアは、

を使用して

に追加され、ノイズフロアは以下によって計算される。

このステップは、谷における成形スペクトルの振幅増幅を制限することによって、たとえばグロッケンシュピールなど、非常に高いスペクトルダイナミクスを含む信号の品質を改善し、これはどうしても知覚できない谷における量子化ノイズの増加を犠牲にして、ピークにおける量子化ノイズを低減する間接的効果を有する。

【0059】

・ステップ５：対数（１１５）
次に、対数領域への変換は、以下を使用して実行される。

【0060】

・ステップ６：ダウンサンプリング（１３１、１３２）
次に、ベクトル

は、

を使用して４の係数によってダウンサンプリングされ、ここで

である。

【0061】

このステップは、間引きの前のベクトル

に対してローパスフィルタ（ｗ（ｋ））を適用する。このローパスフィルタは、心理音響モデルで使用される広がり関数と類似の効果を有する。これは、いずれにせよ知覚的にマスクされるピークの周りの量子化ノイズの増加を犠牲にして、ピークでの量子化ノイズを減少させる。

【0062】

・ステップ７：平均除去およびスケーリング（１３３、１３４）
最終的なスケール係数は、０．８５の係数による平均除去およびスケーリングの後に取得される。

コーデックは追加のグローバルゲインを有するので、情報を全く失わずに平均を除去することができる。平均を除去することで、より効率的なベクトル量子化を可能にする。

【0063】

０．８５の係数は、ノイズ成形曲線の振幅をわずかに圧縮する。これは、ステップ６で言及した広がり関数と類似の知覚効果を有する。ピークで量子化ノイズを低減し、谷で量子化ノイズを増加させる。

【0064】

・ステップ８：量子化（１４１、１４２）
スケール係数は、ベクトル量子化を使用して量子化され、後にビットストリームにパックされてデコーダに送信されるインデックス、および量子化済みスケール係数

を生成する。

【0065】

・ステップ９：補間（１２１、１２２）
量子化済みスケール係数

は、

を使用して補間され、

を使用して線形領域に変換し直される。

【0066】

補間は、平滑なノイズ成形曲線を取得し、ひいては隣り合う帯域間のいかなる大きな振幅ジャンプも回避するために、使用される。

【0067】

・ステップ１０：スペクトル成形（１２３）
成形スペクトル

を生成するために、ＳＮＳスケール係数

は、各帯域のＭＤＣＴ周波数線路に対して別個に適用される。

【0068】

図８は、エンコード済みスペクトル表現に関する情報および第２セットのスケールパラメータのエンコード表現に関する情報を備えるエンコード済みオーディオ信号２５０をデコードするための装置の好適な実施を示す。デコーダは、入力インターフェース２００、スペクトルデコーダ２１０、スケール係数／パラメータデコーダ２２０、スペクトルプロセッサ２３０、および変換器２４０を備える。入力インターフェース２００は、エンコード済みオーディオ信号２５０を受信し、スペクトルデコーダ２１０に転送されるエンコード済みスペクトル表現を抽出し、スケール係数デコーダ２２０に転送される第２セットのスケール係数のエンコード表現を抽出するように構成されている。さらに、スペクトルデコーダ２１０は、スペクトルプロセッサ２３０に転送されるデコード済みスペクトル表現を取得するために、エンコード済みスペクトル表現をデコードするように構成されている。スケール係数デコーダ２２０は、スペクトルプロセッサ２３０に転送される第１セットのスケールパラメータを取得するためにエンコードされた第２セットのスケールパラメータをデコードするように構成されている。第１セットのスケール係数は、第２セットにおけるスケール係数またはスケールパラメータの数よりも多い数のスケール係数またはスケールパラメータを有する。スペクトルプロセッサ２３０は、スケーリングされたスペクトル表現を取得するために、第１セットのスケールパラメータを使用して、デコード済みスペクトル表現を処理するように構成されている。次に、スケーリングされたスペクトル表現は、最終的にデコード済みオーディオ信号２６０を取得するために、変換器２４０によって変換される。

【0069】

好ましくは、スケール係数デコーダ２２０は、ブロック１４１または１４２に関して、特に図５のブロック１２１、１２２に関連して論じられたような第３セットのスケール係数またはスケールパラメータの計算に関して図１のスペクトルプロセッサ１２０に関連して論じられたのと実質的に同じ方法で動作するように構成されている。特に、線形領域に戻る補間および変換について、スケール係数デコーダは、ステップ９に関連して以前に論じられたのと実質的に同じ手順を実行するように構成されている。したがって、図９に示されるように、スケール係数デコーダ２２０は、エンコードされたスケールパラメータ表現を表すフレームごとに１つ以上のインデックスにデコーダコードブック２２１を適用するように構成されている。次に、ブロック２２２において、図５のブロック１２１に関連して論じられたのと実質的に同じ補間である補間が実行される。次に、図５に関連して論じられたのと実質的に同じ線形領域変換器１２２である、線形領域変換器２２３が使用される。しかしながら、別の実施では、ブロック２２１、２２２、２２３は、エンコーダ側の対応するブロックに関連して論じられたのとは異なるように動作することができる。

【0070】

さらに、図８に示されるスペクトルデコーダ２１０は、入力として、エンコードされたスペクトルを受信し、エンコードされた形式のエンコード済みオーディオ信号内でエンコーダ側からデコーダ側へ付加的に送信されるグローバルゲインを使用して好ましく逆量子化される逆量子化スペクトルを出力する、逆量子化器／デコーダブロックを備える。逆量子化器／デコーダ２１０は、たとえば、入力としてある種のコードを受信し、スペクトル値を表す量子化インデックスを出力する、算術またはハフマンデコーダ機能を備えることができる。次に、これらの量子化インデックスは、グローバルゲインとともに逆量子化器に入力され、出力は、そうはいっても任意選択的であるＴＮＳデコーダ処理ブロック２１１における周波数に対する逆予測などのＴＮＳ処理を後に受けることができる、逆量子化されたスペクトル値である。特に、ＴＮＳデコーダ処理ブロックは、線１２９によって示されるように、図５のブロック１２４によって生成されたＴＮＳサイド情報を追加で受信する。ＴＮＳデコーダ処理ステップ２１１の出力は、スペクトル成形ブロック２１２に入力され、スケール係数デコーダによって計算された通りの第１セットのスケール係数は、場合により、ＴＮＳ処理され得るまたはされ得ないデコード済みスペクトル表現に適用され、出力は、後に図８の変換器２４０に入力される、スケーリングされたスペクトル表現である。

【0071】

デコーダの好適な実施形態のさらなる手順は、引き続き論じられる。

【0072】

デコーダ：
・ステップ１：量子化（２２１）
エンコーダステップ８で生成されたベクトル量子化器インデックスは、ビットストリームから読み取られ、量子化済みスケール係数

をデコードするために使用される。

【0073】

・ステップ２：補間（２２２、２２３）
エンコーダステップ９と同じ。

【0074】

・ステップ３：スペクトル成形（２１２）
以下のコードによって概説されるように、デコードされたスペクトル

を生成するために、ＳＮＳスケール係数

は、各帯域の量子化されたＭＤＣＴ周波数線路に対して別個に適用される。

図６および図７は一般的なエンコーダ／デコーダ設定を示しており、図６はＴＮＳ処理のない実施を表し、図７はＴＮＳ処理を含む実施を示す。図６および図７に示される類似の機能は、同一の参照番号が示されるとき、別の図における類似の機能に対応する。特に、図６に示されるように、入力信号１６０は変換段１１０に入力され、その後、スペクトル処理１２０が実行される。特に、スペクトル処理は、参照番号１２３、１１０、１３０、１４０によって示されるＳＮＳエンコーダによって反映され、ブロックＳＮＳエンコーダがこれらの参照番号によって示される機能を実施することを示す。ＳＮＳエンコーダブロックに続いて、量子化エンコード演算１２５が実行され、エンコード済み信号は、図６の１８０で示されるように、ビットストリームに入力される。次に、ビットストリーム１８０はデコーダ側で行われ、参照番号２１０によって示される逆量子化およびデコードに続いて、最終的に、逆変換２４０に続いてデコード済み出力信号２６０が得られるように、図８のブロック２１０、２２０、２３０によって示されるＳＮＳデコーダ演算が実行される。

【0075】

図７は、図６と類似の図を示すが、好ましくは、ＴＮＳ処理はエンコーダ側でのＳＮＳ処理に続いて実行され、したがって、ＴＮＳ処理２１１はデコーダ側の処理シーケンスに関連するＳＮＳ処理２１２の前に実行されることが、示されている。

【0076】

好ましくは、スペクトルノイズ成形（ＳＮＳ）と量子化／符号化との間の追加のツールＴＮＳ（下のブロック図参照）が使用される。ＴＮＳ（時間的ノイズ成形）は、量子化ノイズも成形するが、（ＳＮＳの周波数領域成形とは対照的に）時間領域成形も行う。ＴＮＳは、シャープアタックを含む信号、および音声信号にとって有用である。

【0077】

ＴＮＳは通常、変換とＳＮＳとの間に（たとえばＡＡＣで）適用される。しかしながら、好ましくは、成形スペクトルにＴＮＳを適用することが好ましい。これにより、低ビットレートでコーデックを操作するときにＴＮＳデコーダによって生成されたいくつかのアーチファクトを回避する。

【0078】

図１０は、エンコーダ側のブロック１００によって取得されたスペクトル係数またはスペクトル線の帯域への好適な細分化を示す。特に、低い帯域の方が、高い帯域よりも少数のスペクトル線を有することが示されている。

【0079】

特に、図１０のｘ軸は、帯域のインデックスに対応し、６４帯域の好適な実施形態を示しており、ｙ軸は、１つのフレーム内で３２０個のスペクトル係数を示すスペクトル線のインデックスに対応する。特に、図１０は、３２ｋＨｚのサンプリング周波数がある超広帯域（ＳＷＢ）の場合の状況を例示的に示す。

【0080】

広帯域の場合、個々の帯域に関する状況は、１つのフレームで１６０個のスペクトル線が得られるようになっており、サンプリング周波は、いずれの場合も、１つのフレームが１０ミリ秒の時間的長さを有するように、１６ｋＨｚである。

【0081】

図１１は、図１のダウンサンプラ１３０において実行された好適なダウンサンプリング、または図８のスケール係数デコーダ２２０において実行された、または図９のブロック２２２に示されるような、対応するアップサンプリングまたは補間のさらなる詳細を示す。

【0082】

ｘ軸に沿って、帯域０から６３のインデックスが与えられる。特に、０から６３までの６４帯域がある。

【0083】

ｓｃｆＱ（ｉ）に対応する１６個のダウンサンプルポイントが、垂直線１１００として示されている。特に、図１１は、最終的にダウンサンプルポイント１１００を取得するために、スケールパラメータの特定のグループ化がどのように実行されるかを示している。例として、４つの帯域の最初のブロックは（０，１，２，３）からなり、この最初のブロックの中間点は、ｘ軸に沿ったインデックス１．５のアイテム１１００によって示される１．５にある。

【0084】

相応に、４つの帯域の第２のブロックは（４，５，６，７）であり、第２のブロックの中間点は５．５である。

【0085】

ウィンドウ１１１０は、前述のステップ６のダウンサンプリングに関連して論じられたウィンドウｗ（ｋ）に対応する。前述のように、これらのウィンドウはダウンサンプルポイントにあり、各側に１つのブロックの重複があることがわかる。

【0086】

図９の補間ステップ２２２は、１６個のダウンサンプルポイントから６４帯域を回収する。これは、特定の線１１２０の周りに１１００で示される２つのダウンサンプルポイントの関数として、線１１２０のいずれかの位置を計算することによって、図１１に見られる。以下の例は、これを例示している。

【0087】

第２の帯域の位置は、その周りの２つの垂直線（１．５および５．５）の関数として計算される：２＝１．５＋１／８ｘ（５．５－１．５）。

【0088】

相応に、第３の帯域の位置は、その周りの２つの垂直線（１．５および５．５）１１００の関数として計算される：３＝１．５＋３／８ｘ（５．５－１．５）。

【0089】

最初の２つの帯域および最後の２つの帯域について、特定の手順が実行される。これらの帯域では、垂直線または０から６３までの範囲外の垂直線１１００に対応する値が存在しないので、補間を実行することができない。したがって、この問題に対処するために、ステップ９に関連して説明されたように外挿が実行され、補間は、一方では２つの帯域０，１および他方では６２および６３について先に概説した通りである。

【0090】

続いて、一方では図１の変換器１００および他方では図８の変換器２４０の好適な実施形態が論じられる。

【0091】

特に、図１２ａは、変換器１００内のエンコーダ側で実行されるフレーミングを示すためのスケジュールを示す。図１２ｂは、エンコーダ側での図１の変換器１００の好適な実施を示し、図１２ｃは、デコーダ側の変換器２４０の好適な実施を示す。

【0092】

エンコーダ側の変換器１００は、好ましくは、フレーム２がフレーム１と重複してフレーム３がフレーム２およびフレーム４と重複するように、５０％重複など、重複するフレームを用いてフレーミングを実行するために実装される。しかしながら、ほかの重複または非重複処理もまた実行できるが、ＭＤＣＴアルゴリズムとともに５０％重複を実行することが好ましい。この目的のために、変換器１００は、変換器１００に続くブロックへの図１の入力としての一連のスペクトル表現に対応する一連のフレームを取得するために、ＦＦＴ処理、ＭＤＣＴ処理、またはその他いずれかの種類の時間－スペクトル変換処理を実行するための、分析ウィンドウ１０１および後に接続されるスペクトル変換器１０２を備える。

【0093】

相応に、スケーリングされたスペクトル表現は、図８の変換器２４０に入力される。特に、変換器は、逆ＦＦＴ演算、逆ＭＤＣＴ演算、または対応するスペクトル－時間変換演算を実施する時間変換器２４１を備える。出力は合成ウィンドウ２４２に挿入され、合成ウィンドウ２４２の出力は、最終的にデコード済みオーディオ信号を取得するために重複加算演算を実行するための重複加算プロセッサ２４３に入力される。特に、たとえば、ブロック２４３の重複加算処理は、図１２ａのアイテム１２００によって示されるようなフレーム３とフレーム４との間の重複のオーディオサンプリング値が得られるように、たとえば、フレーム３の後半およびフレーム４の前端の対応するサンプル間でサンプルごとの加算を実行する。デコードされたオーディオ出力信号の残りのオーディオサンプリング値を取得するために、類似の重複加算演算がサンプルごとに実行される。

【0094】

必然的にエンコード済みのオーディオ信号は、デジタル記憶媒体または非一時的記憶媒体に記憶することができ、もしくはインターネットなど、無線伝送媒体または有線伝送媒体などの伝送媒体上で伝送され得る。

【0095】

いくつかの態様は装置の文脈で説明されてきたが、これらの態様が、対応する方法の説明も表すことは明らかであり、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明された態様もまた、対応する装置の対応するブロックまたはアイテムまたは特徴の説明を表す。

【0096】

特定の実施要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装され得る。実装は、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する（または協働することが可能な）、電子的可読制御信号が記憶されたデジタル記憶媒体、たとえばフロッピーディスク、ＤＶＤ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、またはフラッシュメモリを使用して実行できる。

【0097】

本発明によるいくつかの実施形態は、本明細書に記載された方法の１つが実行されるように、プログラム可能なコンピュータシステムと協働することが可能な電子的可読制御信号を有するデータキャリアを備える。

【0098】

一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装されることが可能であり、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されると方法の１つを実行するように動作する。プログラムコードは、たとえば機械可読キャリアに記憶されてもよい。

【0099】

別の実施形態は、機械可読キャリアまたは非一時的記憶媒体に記憶された、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを備える。

【0100】

したがって、言い換えると、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で実行されると、本明細書に記載された方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

【0101】

したがって、本発明の方法のさらなる実施形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを備え、該コンピュータプログラムが記録されたデータキャリア（またはデジタル記憶媒体またはコンピュータ可読媒体）である。

【0102】

したがって、本発明の方法のさらなる実施形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。データストリームまたは一連の信号はたとえば、データ通信接続を介して、たとえばインターネットを介して転送されるように構成されてもよい。

【0103】

さらなる実施形態は、本明細書に記載された方法の１つを実行するように構成または適合された処理手段、たとえばコンピュータまたはプログラマブルロジックデバイスを備える。

【0104】

さらなる実施形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムがインストールされたコンピュータを備える。

【0105】

いくつかの実施形態では、本明細書に記載された方法の機能の一部またはすべてを実行するために、プログラマブルロジックデバイス（たとえばフィールドプログラマブルゲートアレイ）が使用されてもよい。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載された方法の１つを実行するために、マイクロプロセッサと協働し得る。一般に、方法は、好ましくはいずれかのハードウェア装置によって実行される。

【0106】

上記の実施形態は、本発明の原理を単に例示するものである。本明細書に記載される配置および詳細の修正および変形が当業者にとって明らかであろうことは、理解される。したがって、喫緊の請求項の範囲によってのみ限定され、本明細書の実施形態の記載および説明によって提示される具体的詳細によっては限定されないことが意図される。

【0107】

参考文
［１］ＩＳＯ／ＩＥＣ１４４９６－３：２００１；Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－Ｃｏｄｉｎｇｏｆａｕｄｉｏ－ｖｉｓｕａｌｏｂｊｅｃｔｓ－Ｐａｒｔ３：Ａｕｄｉｏ

【0108】

［２］３ＧＰＰＴＳ２６．４０３；Ｇｅｎｅｒａｌａｕｄｉｏｃｏｄｅｃａｕｄｉｏｐｒｏｃｅｓｓｉｎｇｆｕｎｃｔｉｏｎｓ；ＥｎｈａｎｃｅｄａａｃＰｌｕｓｇｅｎｅｒａｌａｕｄｉｏｃｏｄｅｃ；Ｅｎｃｏｄｅｒｓｐｅｃｉｆｉｃａｔｉｏｎ；ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（ＡＡＣ）ｐａｒｔ

【0109】

［３］ＩＳＯ／ＩＥＣ２３００３－３；Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－ＭＰＥＧａｕｄｉｏｔｅｃｈｎｏｌｏｇｉｅｓ－Ｐａｒｔ３：Ｕｎｉｆｉｅｄｓｐｅｅｃｈａｎｄａｕｄｉｏｃｏｄｉｎｇ

【0110】

［４］３ＧＰＰＴＳ２６．４４５；ＣｏｄｅｃｆｏｒＥｎｈａｎｃｅｄＶｏｉｃｅＳｅｒｖｉｃｅｓ（ＥＶＳ）；Ｄｅｔａｉｌｅｄａｌｇｏｒｉｔｈｍｉｃｄｅｓｃｒｉｐｔｉｏｎ．

【図1】