(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-26
(45)【発行日】2024-03-05
(54)【発明の名称】サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
(51)【国際特許分類】
G10L 19/008 20130101AFI20240227BHJP
【FI】
G10L19/008 100
【外国語出願】
(21)【出願番号】P 2021155666
(22)【出願日】2021-09-24
(62)【分割の表示】P 2019545852の分割
【原出願日】2017-10-30
【審査請求日】2021-10-22
(32)【優先日】2016-11-08
(33)【優先権主張国・地域又は機関】EP
【前置審査】
(73)【特許権者】
【識別番号】500242786
【氏名又は名称】フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ.
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ヤン・ビューテ
(72)【発明者】
【氏名】ギヨーム・フックス
(72)【発明者】
【氏名】ヴォルフガング・イェーガーズ
(72)【発明者】
【氏名】フランツ・ロイテルフーバー
(72)【発明者】
【氏名】ユルゲン・ヘレ
(72)【発明者】
【氏名】エレニ・フォトポウロウ
(72)【発明者】
【氏名】マルクス・ムルトゥルス
(72)【発明者】
【氏名】スリカンス・コルセ
【審査官】菊池 智紀
(56)【参考文献】
【文献】特表2016-531327(JP,A)
【文献】特表2011-522472(JP,A)
【文献】特表2014-535182(JP,A)
【文献】特開2008-020931(JP,A)
【文献】特表2013-528824(JP,A)
【文献】特表2008-530616(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00-19/26
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
少なくとも2つのチャネル(101、102)を含むマルチチャネル信号(100)を符号化するための装置であって、
前記マルチチャネル信号(100)からダウンミックス信号(122)を計算するためダウンミキサ(120)と、
前記少なくとも2つのチャネル(101、102)のうちの第1のチャネル(101)および前記少なくとも2つのチャネル(101、102)のうちの第2のチャネル(102)からサイドゲイン(141)を計算し、前記第1のチャネル(101)および前記第2のチャネル(102)から残余ゲイン(142)を計算するためのパラメータ計算器(140)
であって、前記サイドゲイン(141)が、前記第1のチャネル(101)及び前記第2のチャネル(102)のサイド信号を予測するために前記第1のチャネル(101)及び前記第2のチャネル(102)のミッド信号に適用可能なサイド予測ゲインを示し、前記残余ゲイン(142)が、前記サイドゲイン(141)を使用して前記ミッド信号による前記サイド信号の予測の残余信号の振幅関連特性を示す残余予測ゲインを示す、パラメータ計算器(140)と、
出力信号を生成するための出力インターフェース(160)であって、前記出力信号が、前記ダウンミックス信号(122)に関する情報と、前記サイドゲイン(141)
に関する情報と、前記残余ゲイン(142)に関する情報とを含む、出力インターフェース(160)と
を備え
、
前記パラメータ計算器(140)が、
前記第1のチャネル(101)および前記第2のチャネル(102)のサブバンドごとの表現を生成し(21)、
サブバンド内の前記第1のチャネル(101)の第1の振幅関連特性を計算し(21、22、23、24)、前記サブバンド内の前記第2のチャネル(102)の第2の振幅関連特性を計算し、
前記サブバンド内の前記第1のチャネル(101)と前記第2のチャネル(102)の内積を計算し(25)、
前記第1の振幅関連特性と、前記第2の振幅関連特性と、前記内積とを含む第1の関係を使用して前記サブバンド内の前記サイドゲイン(141)を計算し(26)、
前記第1の振幅関連特性と、前記第2の振幅関連特性と、前記内積とを含む第2の関係を使用して前記サブバンド内の前記残余ゲイン(142)を計算する(27)
ように構成され、前記第2の関係が前記第1の関係とは異なり、
前記第1の振幅関連特性および前記第2の振幅関連特性が、対応する振幅から、対応する電力から、対応するエネルギーから、または1よりも大きい指数を有する振幅の任意の対応するべき乗から決定される、装置。
【請求項2】
前記パラメータ計算器(140)が、前記第1のチャネル(101)および前記第2のチャネル(102)の複数のサブバンドの各サブバンドについて、前記サイドゲイン(141)と前記残余ゲイン(142)とを計算するように構成される、請求項1に記載の装置。
【請求項3】
前記パラメータ計算器(140)が、第1の分子と第1の分母とを有する第1の分数を使用して前記サイドゲイン(141)を計算する(26)ように構成され、前記第1の分子が前記第1のチャネル(101)の振幅関連特性と前記第2のチャネル(102)の振幅関連特性とを含み、前記第1の分母が前記第1のチャネル(101)の前記振幅関連特性と、前記第2のチャネル(102)の前記振幅関連特性と、前記内積とを含
む、
請求項1に記載の装置。
【請求項4】
前記パラメータ計算器(140)が、第2の分子と第2の分母とを有する第2の分数を使用して前記残余ゲイン(142)を計算する(27)ように構成され、前記第2の分子が前記内積を含み、前記第2の分母が前記内積を含む、
請求項1に記載の装置。
【請求項5】
前記パラメータ計算器(140)が
、第1の分数を使用して前記サイドゲイン(141)を計算する(26)ように構成され
、第1の分子が、前記第1のチャネル(101)の第1の振幅関連特性と前記第2のチャネル(102)の第2の振幅関連特性との差を含み
、第1の分母が前記第1のチャネル(101)の前記第1の振幅関連特性と、前記第2のチャネル(102)の前記第2の振幅関連特性と、前記内積から導出された値との合計を含むか、または、
前記パラメータ計算器(140)が
、第2の分子
と第2の分母とを有す
る第2の分数を使用して前記残余ゲイン(142)を計算する(27)ように構成され、前記第2の分子が、前記第1のチャネル(101)の前記第1の振幅関連特性と前記第2のチャネル(102)の前記第2の振幅関連特性との加重和と、前記内積との間の差を含み、前記第2の分母が、前記第1のチャネル(101)の前記振幅関連特性と、前記第2のチャネル(102)の前記振幅関連特性と、前記内積から導出された値との前記合計を含む、
請求項
3または4に記載の装置。
【請求項6】
前記パラメータ計算器(140)が、サブバンドに関する前記サイドゲイン(141)を計算し、前記サブバンドの前記サイドゲイン(141)を使用して(28)前記サブバンドに関する前記残余ゲイン(142)を計算するように構成される、請求項1に記載の装置。
【請求項7】
前記パラメータ計算器(140)が、前記サイドゲイン(141)に関する値が、以下の式、
【数1】
に基づいて決定される値の±20%の範囲内にあるように前記サイドゲイン(141)を計算するように構成されるか、または、
前記パラメータ計算器(140)が、前記残余ゲイン(142)に関する値が、以下の式、
【数2】
に基づいて決定された値の±20%の範囲内にあるように前記残余ゲイン(142)を計算するように構成され、
tがフレームインデックスであり、bがサブバンドインデックスであり、E
L
が前記サブバンドb内の
前記第1のチャネル(101)の前記第1の振幅関連特性に対応するフレームt内の前記第1のチャネル(101)のエネルギーであり、E
R
が前記サブバンドb内の
前記第2のチャネル(102)の前記第2の振幅関連特性に対応する前記フレームt内の前記第2のチャネル(102)のエネルギーであり、Xが前記フレームtおよび前記サブバンドb内の前記第1のチャネル(101)と前記第2のチャネル(102)との間の前記内積の絶対値である、
請求項1に記載の装置。
【請求項8】
前記パラメータ計算器(140)が、前記第1のチャネル(101)および前記第2のチャネル(102)のサブバンドごとの表現を複素数値スペクトルのシーケンスとして計算するように構成され、
前記複素数値スペクトルのシーケンスの各スペクトルが前記第1のチャネル(101)もしくは前記第2のチャネル(102)の時間フレームに関連し、前記複素数値スペクトルのシーケンスに関連する前記時間フレームが前記複素数値スペクトルのシーケンス内で隣接し、互いに重なり合うか、または、
前記パラメータ計算器(140)が、サブバンド内の複素スペクトル値の大きさを二乗し、前記サブバンド内の二乗された大きさを合計することによって第1の振幅関連特性と第2の振幅関連特性とを計算するように構成されるか、または、
前記パラメータ計算器(140)が、前記サブバンド内で積を合計することであって、各積が、前記第1のチャネル(101)の周波数ビン内のスペクトル値と、前記周波数ビンに関する前記第2のチャネル(102)の共役複素スペクトル値とを含む、合計することと、前記合計の結果の大きさを形成することと、によって
前記内積を計算するように構成される、
請求項1に記載の装置。
【請求項9】
前記ダウンミキサ(120)が、前記ダウンミックス信号(122)を計算する際に、より低いエネルギーを有するチャネルのみが回転されるか、またはより大きいエネルギーを有するチャネルよりも強く回転されるように、位相補償を使用して前記ダウンミックス信号(122)を計算するように構成される、請求項1に記載の装置。
【請求項10】
前記ダウンミキサ(120)がチャネル間位相差を計算する(30)ように構成され、
前記ダウンミキサ(120)が位相回転パラメータを計算する(32)ように構成され、
前記ダウンミキサ(120)が、前記ダウンミックス信号(122)を計算する際に、前記チャネル間位相差と前記位相回転パラメータとを使用して前記第1のチャネル(101)と前記第2のチャネル(102)とに重み付けする(34)ように構成される、
請求項
9に記載の装置。
【請求項11】
前記ダウンミキサ(120)が、前記パラメータ計算器(140)によって決定された前記サイドゲイン(141)に基づいて前記位相回転パラメータを計算する(32)ように構成される、請求項1
0に記載の装置。
【請求項12】
前記ダウンミキサ(120)が、フレームの各サブバンドについて前記チャネル間位相差を計算する(30)ように構成され、前記ダウンミキサ(120)が、前記フレームの各サブバンドについて前記位相回転パラメータを計算する(32)ように構成される、請求項1
0に記載の装置。
【請求項13】
前記ダウンミキサ(120)が
、位相回転パラメータが、以下の式、
【数3】
によって決定される値の±20%以内にあるように前記位相回転パラメータを計算するように構成され、atan2がatan2関数であり、βが前記位相回転パラメータであり、IPD
がチャネル間位相差であり、tがフレームインデックスであり、bがサブバンドインデックスであり、g
t,b
がフレームtおよび前記サブバンドbに関する前記サイドゲイン(141)であり、Aが0.1と100との間の値、または-0.1と-100との間の値である、請求項
9に記載の装置。
【請求項14】
前記ダウンミキサ(120)が、前記ダウンミックス信号(122)が、以下の式、
【数4】
によって決定される値の±20%以内にある値を有するように前記ダウンミックス信号(122)を計算する(34)ように構成され、M
t,kがフレームtおよび周波数ビンkに関する前記ダウンミックス信号(122)であり、L
t,kが前記フレームtおよび前記周波数ビンkに関する前記第1のチャネル(101)であり、R
t,kが前記フレームtおよび前記周波数ビンkに関する前記第2のチャネル(102)であり、IPD
t,bが、前記周波数ビンkを含む前記フレームtおよび前記サブバンドbに関するチャネル間位相差であり、β
が位相回転パラメータである、請求項
9に記載の装置。
【請求項15】
前記出力インターフェース(160)が、前記ダウンミックス信号(122)に関する前記情報を取得するために前記ダウンミックス信号(122)を波形符号化するように構成された波形エンコーダを備える、請求項1に記載の装置。
【請求項16】
前記パラメータ計算器(140)が、前記残余ゲイン(142)が前記サイドゲイン(141)に依存するように前記サイドゲイン(141)と前記残余ゲイン(142)とを計算するように構成され、
前記出力インターフェース(160)が、前記サイドゲイン(141)を量子化し、次いで前記残余ゲイン(142)を量子化するように構成され、前記残余ゲイン(142)のための量子化ステップが前記サイドゲイン(141)の値に依存する、
請求項1に記載の装置。
【請求項17】
前記パラメータ計算器(140)が、前記残余ゲイン(142)が前記サイドゲイン(141)に依存するように前記サイドゲイン(141)と前記残余ゲイン(142)とを計算するように構成され、
前記出力インターフェースが、量子化点のグループを使用して結合量子化を実行するように構成され、前記量子化点の各グループが、前記第1のチャネル(101)と前記第2のチャネル(102)との間の固定された振幅関連比によって定義される、
請求項1に記載の装置。
【請求項18】
前記パラメータ計算器(140)が、前記サイドゲイン(141)が-1と+1との間の値の範囲を有するように前記サイドゲイン(141)を計算するように構成され、
前記出力インターフェース(160)が、符号ビットを有しており、正のみまたは負のみであるサイドゲイン値を有しているコードを使用するように構成される、
請求項1
7に記載の装置。
【請求項19】
前記出力インターフェース(160)が、
前記第1のチャネル(101)と前記第2のチャネル(102)との間のチャネル間レベル差を計算し(50)、
前記チャネル間レベル差と一致する前記量子化点のグループを識別し(52)、
前記識別されたグループ内でのみ検索し(54)、
量子化されたサイドゲインと量子化された残余ゲインとを表すコードワードを取得するために、符号ビットと、前記グループの識別と、前記識別されたグループ内の前記点の識別とを組み合わせる(56)
ように構成される、請求項1
7に記載の装置。
【請求項20】
前記出力インターフェース(160)によって使用されるコードブックが、多数のエントリを有するコードテーブルを備え、各エントリがバイナリコードワードによって識別され、各バイナリコードワードが、符号ビットと、前記量子化点のグループを識別するビットの第1のグループと、前記量子化点のグループ内の量子化点を識別するビットの第2のグループとを有する、請求項1
7に記載の装置。
【請求項21】
前記出力インターフェース(160)によって使用されるコードブックが、グループあたり8つの量子化点の量子化点の16のグループを含み、前記コードブックのコードワードが、単一の符号ビット(57a)と、前記16のグループのうちのグループを識別する4ビットのグループ(57b)と、量子化点の識別されたグループ内の量子化点を識別する3ビットのグループ(57c)とを有する8ビットコードワードである、請求項1
7に記載の装置。
【請求項22】
符号化マルチチャネル信号(200)を復号するための装置であって、
前記符号化マルチチャネル信号(200)を受信し、前記符号化マルチチャネル信号(200)から、ダウンミックス信号(207)と、サイドゲイン(206)と、残余ゲイン(205)とを取得するための入力インターフェース(204)
であって、前記サイドゲイン(206)が、第1のチャネル(101)及び第2のチャネル(102)のサイド信号を予測するために前記第1のチャネル(101)及び前記第2のチャネル(102)のミッド信号に適用可能なサイド予測ゲインを示し、前記残余ゲイン(205)が、前記サイドゲイン(141)を使用して前記ミッド信号による前記サイド信号の予測の残余信号の振幅関連特性を示す残余予測ゲインを示す、入力インターフェース(204)と、
前記残余ゲイン(205)を使用して残余信号(209)を合成するための残余信号合成器(208)と、
再構成された第1のチャネル(213)と再構成された第2のチャネル(214)とを取得するために、前記サイドゲイン(206)と前記残余信号(209)とを使用して前記ダウンミックス信号(207)をアップミックスするためのアップミキサ(212)と
を備え
、
前記アップミキサ(212)が、第1の重み付きダウンミックス信号(76)を取得するために前記サイドゲイン(206)を使用して前記ダウンミックス信号(207)の第1の重み付け演算(70)を実行し、
第2の重み付きダウンミックス信号(77)を取得するために前記サイドゲイン(206)と前記ダウンミックス信号(207)とを使用して第2の重み付け演算(71)を実行するように構成され、
前記第1の重み付きダウンミックス信号(76)が前記第2の重み付きダウンミックス信号(77)とは異なるように、前記第1の重み付け演算(70)が前記第2の重み付け演算(71)とは異なり、
前記アップミキサ(212)が、前記第1の重み付きダウンミックス信号(76)と前記残余信号(209)との第1の組合せ(72)を使用して前記再構成された第1のチャネル(213)を計算し、前記第2の重み付きダウンミックス信号(77)と前記残余信号(209)との第2の組合せ(73)を使用して、前記再構成された第2のチャネル(214)を計算するように構成され、前記第1の組合せ(72)および前記第2の組合せ(73)が互いに異なる、装置。
【請求項23】
前記第1および第2の組合せ(72、73)のうちの一方が加算演算であり、前記第1および第2の組合せのうちの他方が減算演算である、請求項2
2に記載の装置。
【請求項24】
前記アップミキサ(212)が、前記サイドゲイン(206)と第1の所定の数との合計から導出される
第1の重み付け係数を含む前記第1の重み付け演算(70)を実行するように構成され、
前記アップミキサ(212)が、第2の所定の数と前記サイドゲイン(206)との間の差から導出される
第2の重み付け係数を含む前記第2の重み付け演算(71)を実行するように構成され、前記第1の所定の数および前記第2の所定の数が互いに等しいかまたは互いに異なる、
請求項2
2に記載の装置。
【請求項25】
前記残余信号合成器(208)が、現在のフレームに関する前記残余信号(209)を取得するために前記現在のフレームに関する前記残余ゲイン(205)を使用して先行フレームの前記ダウンミックス信号(207)に重み付けするように構成されるか、または、
前記現在のフレームに関する前記残余信号(209)を取得するために前記現在のフレームに関する前記残余ゲイン(205)を使用して前記現在のフレームからまたは1つもしくは複数の先行フレームから導出される(80)無相関信号に重み付けする(88)ように構成される、
請求項2
2に記載の装置。
【請求項26】
前記残余信号
合成器(208)が、前記残余信号(209)のエネルギーが前記残余ゲイン(205)によって示される信号エネルギーと等しくなるように前記残余信号(209)を計算するように構成される、請求項2
2に記載の装置。
【請求項27】
前記残余信号
合成器(208)が、前記残余信号(209)の値が、次の式、
【数5】
に基づいて決定される値の±20%の範囲内にあるように前記残余信号(209)を計算するように構成され、res
t,kがフレームtおよび周波数ビンkに関する前記残余信号(209)であり、
【数6】
が前記フレームt、および前記周波数ビンkを含むサブバンドbに関する前記残余ゲイン(205)であり、
【数7】
が前記残余信号(209)に関する生の信号であり、g
normが存在してもしなくてもよいエネルギー調整係数である、請求項2
2に記載の装置。
【請求項28】
g
normが、以下の式、
【数8】
によって決定される値の±20%の範囲内の値を有するエネルギー調整係数であり、
【数9】
がフレームtおよ
びサブバンドbに関する前記ダウンミックス信号(207)のエネルギーであり、
【数10】
が前記サブ
バンドbおよび前記フレームtに関する前記残余信号(209)のエネルギーであるか、または、
前記残余信号(209)に関する生の信号が、以下の式、
【数11】
に基づいて決定され、
【数12】
が前記残余信号(209)に関する前記生の信号であり、
【数13】
がフレームt-t
bおよ
び周波数ビンkに関する前記ダウンミックス信号(207)であり、d
bが0よりも大きいフレーム遅延であるか、または、
前記アップミキサ(212)が、前記再構成された第1のチャネル(213)および前記再構成された第2のチャネル(214)が、以下の式、
【数14】
【数15】
によって決定される値に対して±20%の範囲内にある値を有するように前記再構成された第1のチャネル(213)および前記再構成された第2のチャネル(214)を計算するように構成され、
【数16】
が前記フレームtおよび前記周波数ビンkに関する前記ダウンミックス信号(207)であり、
【数17】
が前記フレームtおよび前記周波数ビンkに関する前記再構成された第1のチャネル(213)であり、
【数18】
が前記フレームtおよび前記周波数ビンkに関する前記再構成された第2のチャネル(214)であり、
【数19】
が前記フレームtおよび前記サブバンドbに関する前記サイドゲイン(216)であり、
【数20】
が前記フレームtおよび前記サブバンドbに関する前記残余ゲイン(205)であり、g
normが存在してもしなくてもよいエネルギー調整係数であり、
【数21】
が前記フレームtおよび前記周波数ビンkに関する前記残余信号(209)に関する生の信号である、
請求項2
2に記載の装置。
【請求項29】
前記入力インターフェース(204)が、前記符号化マルチチャネル信号(200)からチャネル間位相差値を取得するように構成され、
前記残余信号合成器(208)または前記アップミキサ(212)が、前記残余信号または前記再構成された第1のチャネル(213)および前記再構成された第2のチャネル(214)を計算するときに、前記チャネル間位相差値を適用するように構成される、
請求項2
2に記載の装置。
【請求項30】
前記アップミキサ(212)が
、チャネル間位相差値から位相回転パラメータを計算し、
第1の様式において前記再構成された第1のチャネル(213)を計算するときに前記位相回転パラメータを適用し、第2の様式において前記再構成された第2のチャネル(214)を計算するとき前記チャネル間位相差値および/または前記位相回転パラメータを適用する
ように構成され、前記第1の様式が前記第2の様式とは異なる、
請求項
29に記載の装置。
【請求項31】
前記アップミキサ(212)が、前記位相回転パラメータが、次の式、
【数22】
によって決定される値の±20%以内にあるように前記位相回転パラメータを計算するように構成され、atan2がatan2関数であり、βが前記位相回転パラメータであり、IPDが前記チャネル間位相差
値であり、tがフレームインデックスであり、bがサブバンドインデックスであり、g
t,b
がフレームtおよ
びサブバンドbに関する前記サイドゲイン(206)であり、Aが0.1と100との間の値または-0.1と-100との間の値である、請求項3
0に記載の装置。
【請求項32】
前記入力インターフェース(204)がコードワードを抽出するように構成され、コードワードが量子化されたサイドゲイ
ンと量子化された残余ゲイ
ンとを結合して含み、前記入力インターフェース(204)が、前記残余信号合成器(208)と前記アップミキサ(212)とによって使用される前記サイドゲイン(206)と前記残余ゲイン(205)とを取得するために、定義済みのコードブックを使用して前記結合したコードワードを逆量子化するように構成される、請求項2
2に記載の装置。
【請求項33】
前記入力インターフェース(204)によって使用されるコードブックが、グループあたり8つの量子化点の量子化点の16のグループを含み、前記コードブックのコードワードが、単一の符号ビット(57a)と、前記16のグループのうちのグループを識別する4ビットのグループ(57b)と、量子化点の識別されたグループ内の量子化点を識別する3ビットのグループ(57c)とを有する8ビットコードワードである、請求項3
2に記載の装置。
【請求項34】
前記アップミキサ(212)が、スペクトル領域において前記再構成された第1のチャネル(213)と前記再構成された第2のチャネル(214)とを計算するように構成され、
前記装置が、前記再構成された第1のチャネル(213)と前記再構成された第2のチャネル(214)とを時間領域に変換するためのスペクトル-時間変換器(216)をさらに備える、
請求項2
2に記載の装置。
【請求項35】
前記スペクトル-時間変換器(216)が、前
記再構成された
第1のチャネル(213)および前
記再構成された
第2のチャネル(214)の各々について、後続のフレームを
時間フレームの時間シーケンスに変換し(
1310)、
後続のウィンドウ化された時間フレームを取得するために合成ウィンドウを使用して
前記時間シーケンスの各時間フレームに重み付けし(1312)、
前記再構成された第1のチャネル(213)の
第1の時間ブロックと前記再構成された第2のチャネル(214)の
第2の時間ブロックとを取得するために
前記後続のウィンドウ化された時間フレームを重ね合わせて加算する(1314)
ように構成された、請求項3
4に記載の装置。
【請求項36】
少なくとも2つのチャネル(101、102)を含むマルチチャネル信号(100)を符号化する方法であって、
前記マルチチャネル信号(100)からダウンミックス信号(122)を計算するステップ(120)と、
前記少なくとも2つのチャネル(101、102)のうちの第1のチャネル(101)および前記少なくとも2つのチャネル(101、102)のうちの第2のチャネル(102)からサイドゲイン(141)を計算し、前記第1のチャネル(101)および前記第2のチャネル(102)から残余ゲイン(142)を計算するステップ(140)
であって、前記サイドゲイン(141)が、前記第1のチャネル(101)及び前記第2のチャネル(102)のサイド信号を予測するために前記第1のチャネル(101)及び前記第2のチャネル(102)のミッド信号に適用可能なサイド予測ゲインを示し、前記残余ゲイン(142)が、前記サイドゲイン(141)を使用して前記ミッド信号による前記サイド信号の予測の残余信号の振幅関連特性を示す残余予測ゲインを示す、ステップと、
出力信号を生成するステップ(160)であって、前記出力信号が、前記ダウンミックス信号(122)に関する情報と、前記サイドゲイン(141)
に関する情報と、前記残余ゲイン(142)に関する情報とを含む、ステップと
を含
み、
前記サイドゲイン(141)および前記残余ゲイン(142)を計算する(140)ことが、
前記第1のチャネル(101)および前記第2のチャネル(102)のサブバンドごとの表現を生成し(21)、
サブバンド内の前記第1のチャネル(101)の第1の振幅関連特性を計算し(21、22、23、24)、前記サブバンド内の前記第2のチャネル(102)の第2の振幅関連特性を計算し、
前記サブバンド内の前記第1のチャネル(101)と前記第2のチャネル(102)の内積を計算し(25)、
前記第1の振幅関連特性と、前記第2の振幅関連特性と、前記内積とを含む第1の関係を使用して前記サブバンド内の前記サイドゲイン(141)を計算し(26)、
前記第1の振幅関連特性と、前記第2の振幅関連特性と、前記内積とを含む第2の関係を使用して前記サブバンド内の前記残余ゲイン(142)を計算する(27)
ことを含み、前記第2の関係が前記第1の関係とは異なり、
前記第1の振幅関連特性および前記第2の振幅関連特性が、対応する振幅から、対応する電力から、対応するエネルギーから、または1よりも大きい指数を有する振幅の任意の対応するべき乗から決定される、方法。
【請求項37】
符号化マルチチャネル信号(200)を復号する方法であって、
前記符号化マルチチャネル信号(200)を受信し(204)、前記符号化マルチチャネル信号(200)から、ダウンミックス信号(207)と、サイドゲイン(206)と、残余ゲイン(205)とを取得するステップ
であって、前記サイドゲイン(206)が、第1のチャネル(101)及び第2のチャネル(102)のサイド信号を予測するために前記第1のチャネル(101)及び前記第2のチャネル(102)のミッド信号に適用可能なサイド予測ゲインを示し、前記残余ゲイン(205)が、前記サイドゲイン(141)を使用して前記ミッド信号による前記サイド信号の予測の残余信号の振幅関連特性を示す残余予測ゲインを示す、ステップと、
前記残余ゲイン(205)を使用して残余信号(209)を合成するステップ(208)と、
再構成された第1のチャネル(213)と再構成された第2のチャネル(214)とを取得するために、前記サイドゲイン(206)と前記残余信号(209)とを使用して前記ダウンミックス信号(207)をアップミックスするステップ(212)と
を含
み、
前記アップミックスするステップ(212)が、第1の重み付きダウンミックス信号(76)を取得するために前記サイドゲイン(206)を使用して前記ダウンミックス信号(207)の第1の重み付け演算(70)を実行するステップと、
第2の重み付きダウンミックス信号(77)を取得するために前記サイドゲイン(206)と前記ダウンミックス信号(207)とを使用して第2の重み付け演算(71)を実行するステップであって、前記第1の重み付きダウンミックス信号(76)が前記第2の重み付きダウンミックス信号(77)とは異なるように、前記第1の重み付け演算(70)が前記第2の重み付け演算(71)とは異なる、ステップと、
前記第1の重み付きダウンミックス信号(76)と前記残余信号(209)との第1の組合せ(72)を使用して前記再構成された第1のチャネル(213)を計算し、前記第2の重み付きダウンミックス信号(77)と前記残余信号(209)との第2の組合せ(73)を使用して、前記再構成された第2のチャネル(214)を計算するステップであって、前記第1の組合せ(72)および前記第2の組合せ(73)が互いに異なる、ステップと
を含む方法。
【請求項38】
コンピュータまたはプロセッサ上で実行されているとき、請求項
36に記載の方法または請求項
37に記載の方法を実行するためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ符号化の分野に関し、詳細には、ステレオまたはマルチチャネル符号化/復号の分野に関する。
【背景技術】
【0002】
低ビットレートにおけるステレオ信号の非可逆パラメトリック符号化のための最新技術の方法は、MPEG-4 Part-3において標準化されているようにパラメトリックステレオに基づく。一般的な考え方は、サイド情報としてデコーダに送信されるステレオパラメータを抽出した後、2つの入力チャネルからダウンミックス信号を計算することによってチャネル数を減らすことである。これらのステレオパラメータは、通常、チャネル間レベル差ILD、チャネル間位相差IPD、およびチャネル間コヒーレンスICCであり、それらは、サブバンドにおいて計算され、ある程度、空間像を取り込む。
【0003】
デコーダは、モノ入力のアップミックスを実行し、ILD、IPD、およびICCの関係を満たす2つのチャネルを作成する。これは、入力信号を、デコーダにおいて生成されるその信号の非相関化バージョンと共にマトリックス化することによって行われる。
【0004】
例えば、そのようなパラメータの使用は、これらのパラメータを計算および処理するためのかなりの複雑さを招くことがわかった。具体的には、ILDパラメータは、それが非常に小さいまたは非常に大きい値を有する可能性があり、このほとんど制限のない値の範囲が効率的な計算、量子化などに関して問題を引き起こすので、問題となる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の目的は、マルチチャネルデータを処理するための改善された概念を提供することである。
【課題を解決するための手段】
【0006】
この目的は、請求項1によるマルチチャネル信号を符号化するための装置、請求項25による符号化マルチチャネル信号を復号するための装置、請求項41のマルチチャネル信号を符号化する方法、請求項42の符号化マルチチャネル信号を復号する方法、請求項43のコンピュータプログラム、または請求項44の符号化マルチチャネル信号によって達成される。
【0007】
第1の態様の本発明は、従来技術とは対照的に、2つのゲインパラメータ、すなわち、サイドゲインパラメータおよび残余ゲインパラメータに依存する異なるパラメトリック符号化手順が採用されることを見出すことに基づく。両方のゲインパラメータは、マルチチャネル信号の少なくとも2つのチャネルのうちの第1のチャネルと、マルチチャネル信号の少なくとも2つのチャネルのうちの第2のチャネルとから計算される。これらのゲインパラメータの両方、すなわち、サイドゲインおよび残余ゲインは、ダウンミキサによってマルチチャネル信号から計算されたダウンミックス信号と共に送信もしくは記憶されるか、または一般的には出力される。
【0008】
第1の態様の本発明の実施形態は、パラメータの新しいセットをもたらす新しいミッド/サイド手法に基づき、エンコーダにおいて、2つの入力チャネルの全情報を一緒に取り込むミッド/サイド変換が入力チャネルに適用される。ミッド信号は、左および右のチャネルの加重平均値であり、重みは、複雑であり、位相差を補償するために選択される。したがって、サイド信号は、入力チャネルの対応する重み付けされた差である。ミッド信号のみが波形コード化され、サイド信号は、パラメトリックにモデル化される。エンコーダはサブバンドにおいて動作し、そこで、IPDと2つのゲインパラメータとをステレオパラメータとして抽出する。サイドゲインと呼ばれる第1のゲインは、ミッド信号によるサイド信号の予測から得られ、残余ゲインと呼ばれる第2のゲインは、ミッド信号のエネルギーに対する残りのエネルギーを取り込む。ミッド信号は次いで、ステレオパラメータと共にデコーダに送信されるダウンミックス信号として機能する。
【0009】
デコーダは、サイドゲインと残余ゲインとに基づいて失われたサイドチャネルを推定し、残りに代用物を使用することによって、2つのチャネルを合成する。
【0010】
第1の態様の本発明は、一方でサイドゲインおよび他方で残余ゲインが特定の小さい範囲の数に制限されるゲインであるという点で有利である。具体的には、サイドゲインは、好ましい実施形態では、-1から+1の範囲に制限され、残余ゲインは、0および1の範囲にさらに制限される。また、好ましい実施形態においてさらにより有用なことは、残余ゲインが有することができる値の範囲が、サイドゲインがより大きくなるにつれてより小さくなるように、残余ゲインがサイドゲインに依存することである。
【0011】
具体的には、サイドゲインは、第1および第2のチャネルのサイド信号を予測するために第1および第2のチャネルのミッド信号に適用可能なサイド予測ゲインとして計算され得る。そして、パラメータ計算器はまた、ミッド信号およびサイドゲインによるサイド信号のそのような予測の残余信号のエネルギーまたは振幅を示す残余予測ゲインとして残余ゲインを計算するように構成される。
【0012】
しかしながら、重要なことに、エンコーダ側において実際に予測を実行すること、またはエンコーダ側においてサイド信号を実際に符号化することは、必要ではない。代わりに、サイドゲインおよび残余ゲインは、左および右のチャネルの振幅に関連するエネルギー、パワー、または他の特性のような振幅関連尺度のみを使用することによって計算され得る。加えて、サイドゲインおよび残余ゲインの計算は、両方のチャネル間の内積のみに関連し、すなわち、ダウンミックスチャネル自体またはサイドチャネル自体のような左チャネルおよび右チャネル以外のどのような他のチャネルも、実施形態において計算される必要がない。しかしながら、他の実施形態では、サイド信号は、計算され得、予測のための様々な試行が計算され得、サイドゲインおよび残余ゲインのようなゲインパラメータが、特定のサイドゲイン予測に関連付けられた残余信号から計算され得、結果として残余信号または剰余信号の最小エネルギーのような様々な試行における定義済み基準をもたらす。したがって、高い柔軟性と、それにもかかわらず、一方でサイドゲイン、他方で残余ゲインを計算するための低い複雑性とが存在する。
【0013】
ILDおよびICCを上回るゲインパラメータの例示的な2つの利点が存在する。第1に、それらは、任意の大きいまたは小さい値を取り得るILDパラメータとは対照的に有限区間([-1,1]におけるサイドゲインおよび[0,1]における残余ゲイン)内に自然に存在する。そして第2に、ILDおよびICCの計算が2つを含むのに対し、1つの特別な関数評価のみを含むので、計算は、より単純である。
【0014】
第1の態様の好ましい実施形態は、スペクトル領域におけるパラメータの計算に依存し、すなわち、パラメータは、様々な周波数ビンに対して、またはより好ましくは各サブバンドが特定の数の周波数ビンを含む様々なサブバンドに対して計算される。好ましい実施形態では、サブバンド内に含まれる周波数ビンの数は、人間の聴取知覚の特性を模倣するために、より低いサブバンドからより高いサブバンドまで増加し、すなわち、より高い帯域がより高い周波数範囲または帯域幅をカバーし、より低い帯域がより低い周波数範囲または帯域幅をカバーする。
【0015】
好ましい実施形態では、ダウンミキサは、絶対位相補償されたダウンミックス信号を計算し、ここで、IPDパラメータに基づいて、左および右のチャネルに位相回転が適用されるが、位相補償は、より多くのエネルギーを有するチャネルがより少ないエネルギーを有するチャネルよりも少なく回転されるように実行される。位相補償を制御するために、好ましくはサイドゲインが使用されるが、他の実施形態では、任意の他のダウンミックスが使用され得、これはまた、サイド信号のパラメトリック表現、すなわち、一方でサイドゲイン、および他方で残余ゲインが、元の第1および第2のチャネルのみに基づいて計算され、送信されたダウンミックスに関するどのような情報も必要とされないという本発明の特別な利点である。したがって、サイドゲインと残余ゲインとからなる新しいパラメトリック表現と一緒に任意のダウンミックスが使用され得るが、本発明はまた、サイドゲインに基づく絶対位相補償と一緒に適用されるのに特に有用である。
【0016】
絶対位相補償のさらなる実施形態では、位相補償パラメータは、位相補償パラメータを計算する際に生じる逆正接関数(atanまたはtan-1)の特異点が中心から特定の横位置に移動されるように、特定の所定の数に基づいて特に計算される。特異点のこのシフトは、+/-180°の位相シフトおよび0に近いゲインパラメータに対して、すなわち、まったく同様のエネルギーを有する左および右のチャネルに対して、特異点によるいかなる問題も生じないことを確実にする。そのような信号は、かなり頻繁に生じることがわかっているが、互いに位相がずれているが、例えば、3dBと12dBとの間または約6dBの差を有する信号は、自然の状況では発生しない。したがって、特異点はシフトされるだけであるが、それにもかかわらず、このシフトは、通常の状況では、単純な逆正接関数がその特異点を有する場合よりもはるかに少なく発生する信号配置状況において特異点が発生することを確実にするので、ダウンミキサの全体的な性能を改善することがわかった。
【0017】
さらなる実施形態は、効率的な量子化手順を実施するためにサイドゲインおよび残余ゲインの依存性を利用する。この目的のため、第1の実施形態では、サイドゲインが最初に量子化され、次いでサイドゲインの値に基づく量子化ステップを使用して残余ゲインが量子化されるように実行される結合量子化(joint quantization)を実行することが好ましい。しかしながら、他の実施形態は、両方のパラメータが単一のコードに量子化される結合量子化に依存し、このコードの特定の部分は、エンコーダによって符号化される2つのチャネルの特定のレベル差特性に属する量子化点の特定のグループに依存する。
【0018】
第2の態様は、少なくとも2つのチャネルを含むマルチチャネル信号をダウンミックスするための装置に関し、装置は、マルチチャネル信号からダウンミックス信号を計算するためのダウンミキサであって、ダウンミキサが、ダウンミックス信号を計算する際に、少なくとも2つのチャネルのうちのより低いエネルギーを有するチャネルのみが回転されるか、またはより大きいエネルギーを有するチャネルよりも強く回転されるように、絶対位相補償を使用してダウンミックスを計算するように構成される、ダウンミキサと、出力信号を生成するための出力インターフェースであって、出力信号がダウンミックス信号に関する情報を含む、出力インターフェースとを備える。
【0019】
好ましくは、回転は、好ましくはマイナーチャネル上で実行されるが、その場合は、マイナーチャネルが常にメジャーチャネルよりも回転されるわけではない小さいエネルギー差の状況で可能である。しかし、エネルギー比が十分に大きいかまたは十分に小さい場合、好ましい実施形態は、マイナーチャネルをメジャーチャネルよりも回転させる。したがって、好ましくは、エネルギー差が有意であるとき、または1dB以上のような定義済み閾値を超えるときにのみ、マイナーチャネルは、メジャーチャネルよりも回転される。これは、ダウンミキサだけでなくアップミキサにも当てはまる。
【0020】
本発明の好ましい実施形態は、添付図面に関して後に論じられる。
【図面の簡単な説明】
【0021】
【
図1】一実施形態のマルチチャネル信号を符号化するための装置のブロック図である。
【
図2】パラメータ計算器の一実施形態のブロック図である。
【
図3】パラメータ計算器のさらなる実施形態の図である。
【
図4】絶対位相補償を実行するダウンミキサの一実施形態の図である。
【
図5a】特定の量子化を実行する出力インターフェースの一実施形態のブロック図である。
【
図6】符号化マルチチャネル信号を復号するための装置の一実施形態の図である。
【
図9】入力インターフェースの一実施形態の図である。
【
図10b】時間-スペクトル変換器の一実施形態を示す図である。
【
図10c】左チャネルまたは右チャネルのスペクトルと、様々なサブバンドの構成とを示す図である。
【
図10d】スペクトル-時間変換器の一実施形態を示す図である。
【
図11】第1の実施形態における条件付き量子化に関する線を示す図である。
【
図12】さらなる実施形態による結合量子化に関する線を示す図である。
【
図13】サイドゲインおよび残余ゲインに関する結合量子化点を示す図である。
【発明を実施するための形態】
【0022】
図1は、少なくとも2つのチャネルを含むマルチチャネル信号を符号化するための装置を示す。具体的には、マルチチャネル信号は、
図1中の100に示されており、第1のチャネル101と第2のチャネル102とを有し、追加のチャネルがないかまたは任意の選択された数の追加のチャネルを有し、さらなる追加のチャネルが103に示されている。
【0023】
マルチチャネル信号100は、マルチチャネル信号100からダウンミックス信号122を計算するためのダウンミキサ120に入力される。ダウンミキサは、マルチチャネル信号を計算するために、特定の実装形態に応じて、第1のチャネル101、第2のチャネル102、および第3のチャネル103、または第1および第2のチャネルのみ、またはマルチチャネル信号のすべてのチャネルを使用することができる。
【0024】
さらに、符号化するための装置は、少なくとも2つのチャネルの第1のチャネル101および第2のチャネル102からサイドゲイン141を計算するためのパラメータ計算器140を備え、加えて、パラメータ計算器140は、第1のチャネルおよび第2のチャネルから残余ゲイン142を計算する。他の実施形態では、143に示すようにオプションのチャネル間位相差(IPD)も計算される。ダウンミックス信号122、サイドゲイン141、および残余ゲイン142は、ダウンミックス信号122、サイドゲイン141、および残余ゲイン142に関する情報を含む符号化マルチチャネル信号162を生成する出力インターフェース160に転送される。
【0025】
サイドゲインおよび残余ゲインは、典型的には、各フレームについて単一のサイドゲインおよび単一の残余ゲインが計算されるように、フレームについて計算されることが留意されるべきである。しかしながら、他の実施形態では、単一のサイドゲインおよび単一の残余ゲインのみが各フレームについて計算されるだけでなく、サイドゲインのグループおよび残余ゲインのグループがフレームについて計算され、ここで、各サイドゲインおよび各残余ゲインは、第1のチャネルおよび第2のチャネルの特定のサブバンドに関連する。したがって、好ましい実施形態では、パラメータ計算器は、第1および第2のチャネルの各フレームについて、サイドゲインのグループと残余ゲインのグループとを計算し、ここで、フレームに対するサイドゲインおよび残余ゲインの数は、典型的にはサブバンドの数に等しい。DFTのような高分解能の時間-スペクトル変換が適用されるとき、特定のサブバンドに対するサイドゲインおよび残余ゲインは、第1のチャネルおよび第2のチャネルの周波数ビンのグループから計算される。しかしながら、サブバンド信号をもたらす低分解能の時間-周波数変換が適用されるとき、パラメータ計算器140は、各サブバンドに対して、またはサブバンドのグループに対してさえ、サイドゲインおよび残余ゲインを計算する。
【0026】
サイドゲインおよび残余ゲインがサブバンド信号のグループに対して計算されるとき、パラメータ分解能は、低減され、より低いビットレートをもたらすが、サイド信号のパラメトリック表現のより低い品質の表現をもたらす。他の実施形態では、サイドゲインおよび残余ゲインが各フレームについて計算されるのではなく、フレームのグループについて計算されるように、時間分解能が修正もされ得、ここで、フレームのグループは、2つ以上のフレームを有する。したがって、そのような実施形態では、サブバンド関連のサイド/残余ゲインを計算することが好ましく、ここで、サイド/残余ゲインは、特定のサブバンドに関連するが、2つ以上のフレームを含むフレームのグループに関連する。したがって、本発明によれば、ブロック140によって実行されるパラメータ計算の時間および周波数分解能は、高い柔軟性で修正され得る。
【0027】
パラメータ計算器140は、好ましくは、第1の実施形態に関して
図2に概説されているように、または第2の実施形態に関して
図3に概説されているように実施される。
図2の実施形態において、パラメータ計算器は、第1の時間-スペクトル変換器21と第2の時間-スペクトル変換器22とを備える。さらに、
図1のパラメータ計算器140は、第1の振幅関連特性を計算するための計算器23と、第2の振幅関連特性を計算するための計算器24と、ブロック21および22の出力の内積、すなわち、第1および第2のチャネルのスペクトル表現の内積を計算するための計算器25とを備える。
【0028】
ブロック23、24、25の出力は、サイドゲイン計算器26に転送され、残余ゲイン計算器27にも転送される。サイドゲイン計算器26および残余ゲイン計算器27は、第1の振幅関連特性と、第2の振幅関連特性と、内積との間に特定の関係を適用し、両方の入力を組み合わせるために残余ゲイン計算器によって適用される関係は、サイドゲイン計算器26によって適用される関係とは異なる。
【0029】
好ましい実施形態では、第1および第2の振幅関連特性は、サブバンド内のエネルギーである。しかしながら、他の振幅関連特性は、サブバンド自体における振幅に関係するか、サブバンド内の信号電力に関係するか、または1よりも大きい指数を有する振幅の任意の他のべき乗に関係し、ここで、指数は、1よりも大きい実数、または、信号電力およびエネルギーに関する2の整数、もしくはラウドネスに関連する3の整数に関するなどのような、1よりも大きい整数であり得る。したがって、各振幅関連特性は、サイドゲインおよび残余ゲインを計算するために使用され得る。
【0030】
好ましい実施形態では、サイドゲイン計算器および残余ゲイン計算器27は、第1および第2のチャネルのサイド信号を予測するために、第1および第2のチャネルのミッド信号に適用可能なサイド予測ゲインとしてサイドゲインを計算するように構成されるか、または、パラメータ計算器、特に残余ゲイン計算器27は、サイドゲインを使用するミッド信号によるサイド信号の予測の残余信号の振幅関連尺度を示す残余予測ゲインとして残余ゲインを計算するように構成される。
【0031】
具体的には、
図2のパラメータ計算器140およびサイドゲイン計算器26は、分子と分母とを有する分数を使用してサイド信号を計算するように構成され、ここで、分子は、第1および第2のチャネルの振幅特性を含み、分母は、第1および第2のチャネルの振幅特性と、内積から導出される値とを含む。内積から導出される値は、好ましくは内積の絶対値であるが、代替的には、1よりも大きいべき乗のような絶対値の任意のべき乗であり得、または、共役複素項もしくは内積自体のような絶対値とは異なる特性でさえあり得る。
【0032】
さらなる実施形態では、
図2のパラメータ計算器、残余ゲイン計算器27は、内積から導出される値と、加えて他のパラメータの両方を使用する分子と分母とを有する分数も使用する。再び、内積から導出される値は、好ましくは内積の絶対値であるが、代替的には、1よりも大きいべき乗のような絶対値の任意のべき乗であり得、または、共役複素項もしくは内積自体のような絶対値とは異なる特性でさえあり得る。
【0033】
具体的には、
図2のサイドゲイン計算器26は、サイドゲインを計算するために、第1のチャネルのエネルギーの差を使用するように構成され、分母は、両方のチャネルのエネルギーまたは振幅特性の合計を使用し、加えて、内積、好ましくは内積の2倍を使用するが、内積に対する他の乗数も使用され得る。
【0034】
残余ゲイン計算器27は、分子において、第1および第2のチャネルの振幅特性の加重和と、内積とを使用するように構成され、ここで、内積は、第1および第2のチャネルの振幅特性の加重和から減算される。残余ゲイン計算器を計算するための分母は、第1および第2のチャネルの振幅特性の和と、内積とを含み、ここで、内積は、好ましくは、2が乗算されるが、同様の他の係数が乗算され得る。
【0035】
さらに、接続線28によって示されるように、残余ゲイン計算器27は、サイドゲイン計算器によって計算されるサイドゲインを使用して残余ゲインを計算するように構成される。
【0036】
好ましい実施形態では、残余ゲインおよびサイドゲインは、以下のように作用する。具体的には、後に説明する帯域ごとのチャネル間位相差が計算され得る。しかしながら、式(9)において後に示すようなサイドゲインの計算と式(10)において後に示すようなサイドゲインの具体的な好ましい計算とを具体的に概説する前に、ゲインパラメータの計算に加えてIPDおよびダウンミキシングの計算も参照するエンコーダのさらなる説明が与えられる。
【0037】
ステレオパラメータの符号化、およびダウンミックス信号の計算は、周波数領域において行われる。この目的のため、左および右チャネルの時間周波数ベクトルLtおよびRtが、分析ウィンドウを同時に適用し、離散フーリエ変換(DFT)を続けることによって生成される。DFTビンは、次いで、それぞれ、サブバンド(Lt,k)K∈Ib、(Rt,k)K∈Ibにグループ化され、ここで、Ibは、サブバンドインデックスのセットを示す。
【0038】
IPDの計算およびダウンミキシング
【0039】
ダウンミックスについて、帯域ごとのチャネル間位相差(IPD)が、
【0040】
【0041】
のように計算され、ここで、z*は、zの複素共役を表す。これは、k∈Ibについて、帯域ごとのミッドおよびサイド信号
【0042】
【0043】
および
【0044】
【0045】
を生成するために使用される。絶対位相回転パラメータβは、
【0046】
【0047】
によって与えられ、ここで、gt,bは、以下で指定されるサイドゲインを表す。ここで、atan2(y,x)は、その値が点(x,y)と正のx軸との間の角度である引数2つの逆正接関数である。それは、むしろより少ないエネルギーを有するチャネル上でIPD補償を実行することを意図している。係数2は、IPDt,b=±πおよびgt,b=0における特異点をIPDt,b=±πおよびgt,b=-1/3に移動させる。このようにして、左および右チャネルにおいてほぼ等しいエネルギー分布を有する位相がずれた状況において、βのトグリングが回避される。ダウンミックス信号は、逆DFTをMtに適用し、合成ウィンドウおよび重複加算を続けることによって生成される。
【0048】
他の実施形態では、単純な正接関数のような、atan2関数とは異なる他の逆正接関数が同様に使用され得るが、atan2関数は、提起された問題に対するその安全な適用のために好ましい。
【0049】
ゲインパラメータの計算
【0050】
帯域ごとのIPDに加えて、2つの他のステレオパラメータが抽出される。Mt,bによってSt,bを予測するための最適なゲイン、すなわち、残りのエネルギー
pt,k=St,k-gt,bMt,k (5)
が最小になるような数gt,b、および、ミッド信号Mtに適用された場合、各帯域におけるptおよびMtのエネルギーを等しくするゲイン係数rt,b、すなわち、
【0051】
【0052】
。最適予測ゲインは、サブバンドにおけるエネルギー
【0053】
【0054】
、ならびに、LtおよびRtの内積の絶対値
【0055】
【0056】
から、
【0057】
【0058】
として計算され得る。これから、gt,bが[-1,1]内にあるということになる。残余ゲインは、エネルギーおよび内積から、
【0059】
【0060】
として同様に計算され得、これは、
【0061】
【0062】
を意味する。具体的には、これは、rt,b∈[0,1]を示す。このように、ステレオパラメータは、対応するエネルギーおよび内積を計算することによってダウンミックスから独立して計算され得る。具体的には、そのエネルギーを計算するために残余pt,kを計算する必要はない。ゲインの計算が1つの特別な関数評価のみを含むのに対して、EL,t,b、ER,t,b、およびXL/R,t,bからのILDおよびICCの計算が2つ、すなわち、平方根および対数、
【0063】
【0064】
および
【0065】
【0066】
を含むことは、注目すべきである。
【0067】
低下するパラメータ分解能
【0068】
ウィンドウ長によって与えられるようなより低いパラメータ分解能が望まれる場合、(9)および(10)において、XL/R,t,bを
【0069】
【0070】
によって置き換え、EL,t,b、ER,t,bを、それぞれ、
【0071】
【0072】
によって置き換えることによって、hの連続するウィンドウにわたるゲインパラメータを計算してもよい。このとき、サイドゲインは、個々のウィンドウに関するサイドゲインの加重平均であり、ここで、重みは、Mt+i,kのエネルギーに依存するか、または帯域ごとのエネルギーEM,s,bに依存し、ここで、sは、式14および15における合計インデックスである。
【0073】
同様に、IPD値は次いで、いくつかのウィンドウにわたって、
【0074】
【0075】
のように計算される。好ましくは、
図1に示すパラメータ計算器140は、複素数値スペクトルのシーケンスとしてサブバンドごとの表現を計算するように構成され、ここで、各スペクトルは、第1のチャネルまたは第2のチャネルの時間フレームに関係し、ここで、シーケンスの時間フレームは、互いに隣接し、ここで、隣接する時間フレームは、互いに重なり合う。
【0076】
さらに、パラメータ計算器140は、例えば、式(7)においても前に示したように、サブバンド内の複素スペクトル値の大きさを二乗すること、および、サブバンド内の二乗した大きさを合計することによって、第1および第2の振幅関連尺度を計算するように構成され、ここで、インデックスbは、サブバンドを表す。
【0077】
さらに、式8においても概説されているように、パラメータ計算器140、特に
図2の内積計算器25は、サブバンド内で積を合計することによって内積を計算するように構成され、ここで、各積は、第1のチャネルの周波数ビンにおけるスペクトル値と、周波数ビンに関する第2のチャネルの共有複素スペクトル値とを含む。その後、合計の結果の大きさが形成される。
【0078】
式1から4においても概説されているように、絶対位相補償を使用することが好ましい。したがって、この実施形態では、ダウンミキサ120は、ダウンミックス信号を計算するとき、2つのチャネルのうちでより低いエネルギーを有するチャネルのみが回転されるか、または、2つのチャネルのうちでより低いエネルギーを有するチャネルが、より大きいエネルギーを有する他のチャネルよりも強く回転されるように、絶対位相補償を使用してダウンミックス122を計算するように構成される。そのようなダウンミキサ120が
図4に示されている。具体的には、ダウンミキサは、チャネル間位相差(IPD)計算器30と、絶対位相回転計算器32と、ダウンミックス計算器34と、エネルギー差またはサイドゲイン計算器36とを備える。エネルギー差またはサイドゲイン計算器36が
図2中のサイドゲイン計算器26として実装され得ることは、強調されるべきである。しかしながら、代替的には、位相回転の目的のために、エネルギー差、または一般に、エネルギー、電力、または振幅自体、もしくはべき乗が1つと2つ以上との間のべき乗のような2以外である場合に加算される振幅のべき乗であり得る振幅関連特性の差のみを計算する、ブロック36における異なる実装形態も存在し得る。
【0079】
具体的には、指数または3のべき乗は、例えば、エネルギーではなくラウドネスに対応する。
【0080】
具体的には、
図4のIPD計算器30は、典型的には、ブロック30に入力される第1および第2のチャネル101、102の各々の複数のサブバンドの各々のサブバンドについてチャネル間位相差を計算するように構成される。さらに、ダウンミキサは、第1のチャネルと第2のチャネルとの間のブロック36によって提供されるエネルギー差に基づくか、または、一般的には、両方のチャネル101、102間の振幅関連特性の差に基づいて作用する、再び典型的には複数のサブバンドの各々のサブバンドに関する絶対位相回転パラメータを有する。加えて、ダウンミックス計算器34は、ダウンミックス信号を計算するとき、IPDパラメータと、βとして示される絶対位相回転パラメータとを使用して、第1および第2のチャネルに重み付けするように構成される。
【0081】
好ましくは、ブロック36は、絶対位相回転計算器がサイドゲインに基づいて動作するようにサイドゲイン計算器として実装される。
【0082】
したがって、好ましい実施形態では、
図4のブロック30は、式(1)を実施するように構成され、ブロック32は、式(4)を実施するように構成され、ブロック34は、式(2)を実施するように構成される。
【0083】
具体的には、サイドゲインgt,bを含む項の前の式(4)中の係数2は、2とは異なって設定され得、例えば、好ましくは0.1と100との間の値であり得る。当然、-0.1および-100も使用され得る。この値は、ほぼ等しい左および右チャネルに対して+-180°のIPDにおいて存在する特異点が異なる場所、すなわち、例えば、係数2について-1/3の異なるサイドゲインに移動されることを確実にする。しかしながら、2とは異なる他の係数が使用され得る。これらの他の係数は、特異点を-1/3とは異なるサイドゲインパラメータに移動させる。すべてのこれらの異なる係数は、これらの係数が、典型的には位相がずれて等しいかほぼ等しいエネルギーを有する信号よりも少ない頻度で発生する関連する左および右チャネル信号を有するサウンドステージ内の「場所」に問題の特異点があることを達成するので、有用であることがわかった。
【0084】
好ましい実施形態では、
図1の出力インターフェース160は、パラメトリック情報の量子化、すなわち、パラメータ計算器140によって線141上に提供されるようなサイドゲイン、および
図1のパラメータ計算器140から線142上に提供されるような残余ゲインの量子化を実行するように構成される。
【0085】
具体的には、残余ゲインがサイドゲインに依存する実施形態では、サイドゲインを量子化し、次いで残余ゲインを量子化することが好ましい場合、この実施形態では、残余ゲインのための量子化ステップは、サイドゲインの値に依存する。
【0086】
具体的には、これは、
図11に示されており、同様に
図12および
図13においても類似的に示されている。
【0087】
図1は、条件付き量子化に関する線を示す。具体的には、残余ゲインは、常に(1-g
2)
1/2によって決定される範囲内にあることが示されている。したがって、g=0のとき、rは、0と1との間の範囲内にあり得る。しかしながら、gが0.5に等しいとき、rは、0.866と0の範囲内にあり得る。さらに、例えば、g=0.75のとき、範囲rは、0と0.66との間に制限される。g=0.9の極端な実施形態では、rは、0と0.43との間の範囲のみであり得る。さらに、g=0.99のとき、rは、例えば、0と0.14との間の範囲内にのみあり得る。
【0088】
したがって、この依存性は、より高いサイドゲインに対して残余ゲインの量子化の量子化ステップサイズを低減することによって使用され得る。したがって、
図11を考慮すると、rの値範囲を示す垂直線は、各線が8の量子化ステップを有するように8のような特定の整数で常に除算され得る。したがって、より高いサイドゲインを反映する線について、より低いサイドゲインを有する線についてよりも量子化ステップが小さいことは明らかである。したがって、より高いサイドゲインは、いかなるビットレートの増加もなしでより細かく量子化され得る。
【0089】
さらなる実施形態では、量子化器は、量子化点のグループを使用して結合量子化を実行するように構成され、ここで、量子化点の各グループは、第1のチャネルと第2のチャネルとの間の固定された振幅関連比によって定義される。振幅関連比の一例は、左と右との間のエネルギーであり、すなわち、これは、
図12に示すように第1のチャネルと第2のチャネルとの間の同じILDに関する線を意味する。この実施形態では、出力インターフェースは、
図5aに示すように構成され、入力として第1のチャネルおよび第2のチャネル、または、代替的にはサイドゲインgおよび残余ゲインrを受信するサブバンドごとのILD計算器を備える。参照番号50によって示されるサブバンドごとのILD計算器は、量子化されるべきパラメータ値g、rに関する特定のILDを出力する。ILD、または一般に、振幅関連比は、グループ整合器52に転送される。グループ整合器52は、最も一致するグループを決定し、この情報を点整合器54に転送する。グループ整合器52と点整合器54の両方は、コードブックからのコードワードのようなコードを最終的に出力するコードビルダ56に供給する。
【0090】
具体的には、コードビルダは、サイドゲインgの符号を受信し、サブバンドに関するg、rに関するコードを示す
図5bに示す符号ビット57aを決定する。さらに、決定されたILDと一致する量子化点の特定のグループを決定したグループ整合器は、57bに示すビット2から5をグループIDとして出力する。最後に、点整合器は、57cに示す
図5bの実施形態においてビット6から8を出力し、ここで、これらのビットは、点ID、すなわち、ビット57bによって示されるグループ内の量子化点のIDを示す。
図5bは、単一の符号ビットと、4つのグループビットと、3つの点ビットとを有する8ビットコードを示しているが、符号ビットと、より多いまたはより少ないグループビットと、より多いまたはより少ない点ビットとを有する他のコードが使用され得る。サイドゲインが正および負の値を有するという事実のために、グループビットおよび点ビット、すなわち、ビットのセット57bおよびビットのセット57cは、純粋に負の値か、または好ましくは純粋に正の値のいずれかのみを有し、符号ビットが負の符号を示す場合、残余ゲインは、常に正の値として復号されるが、サイドゲインは、負の値として復号され、これは、式9に示すような規則がサイドゲインを計算するために適用されるとき、左チャネルのエネルギーが右チャネルのエネルギーよりも低いことを意味する。
【0091】
続いて、量子化に関するさらなる実施形態が概説される。
【0092】
サイドゲインおよび残余ゲインの量子化
【0093】
(11)における不等式は、サイドゲインが残余ゲインの範囲を決定するので、サイドゲインに対する残余ゲインの強い依存性を明らかにする。したがって、gが±1に向かう傾向があるとき、rのための可能な量子化点の数が減少するので、[-1,1]および[0,1]内の量子化点を選択することによってサイドゲインgおよび残余ゲインrを独立して量子化することは、非効率的である。
【0094】
条件付き量子化
【0095】
この問題を処理する様々な方法が存在する。最も簡単な方法は、最初にgを量子化し、次いで、量子化点が区間
【0096】
【0097】
内に入ることになる量子化された値
【0098】
【0099】
を条件としてrを量子化することである。量子化点は、次いで、例えば、これらの量子化線上で一様に選択され得、そのうちのいくつかを
図11に示す。
【0100】
結合量子化
【0101】
量子化点を選択するためのより洗練された方法は、LとRとの間の固定されたエネルギー比に対応する(g,r)平面内の線を調べることである。C2≧1がそのようなエネルギー比を示す場合、対応する線は、c=1の場合0≦s≦1に対して(0,s)か、または
【0102】
【0103】
のいずれかによって与えられる。これは、LtとRtとを交換することがgt,bの符号のみを変更し、rt,bを変更させないので、c2<1の場合もカバーする。
【0104】
この手法は、
図12からわかるように、同じ数の量子化点を有するより大きい領域をカバーする。再び、線上の量子化点は、例えば、個々の線の長さに従って一様に選択され得る。他の可能性は、予め選択されたICC値と一致させるためにそれらを選択すること、または、音響的な方法でそれらを最適化することを含む。
【0105】
うまく機能することがわかった量子化方式は、ILD値
±{0,2,4,6,8,10,13,16,19,22,25,30,35,40,45,50} (23)
に対応するエネルギー線に基づき、その各々において8つの量子化点が選択される。これは、gの非負値に対応する値と符号ビットとを保持する量子化点の8×16テーブルとして編成される256のエントリを有するコードブックを生じる。これは、量子化点(g,r)の8ビット整数表現を生じ、ここで、例えば、最初のビットは、gの符号を指定し、次の4ビットは、8×16テーブルにおける列インデックスを保持し、最後の3ビットは、行インデックスを保持する。
【0106】
(gt,b,rt,b)の量子化は、徹底的なコードブック検索によって行われ得るが、最初にサブバンドILDを計算し、検索を最も一致するエネルギー線に制限することがより効率的である。このように、8つの点のみが考慮される必要がある。
【0107】
逆量子化は、単純なテーブルルックアップによって行われる。
【0108】
gの非負値をカバーするこの方式に関する128の量子化点が
図12に示されている。
【0109】
サイド信号、すなわち、式(9)および式(10)に示すように左信号と右信号との間の信号差の実際の計算なしにサイドゲインと残余ゲインとを計算するための手順が開示されているが、さらなる実施形態は、サイドゲインと残余ゲインとを、異なって、すなわち、サイド信号の実際の計算を用いて計算するように動作する。この手順は、
図3に示されている。
【0110】
この実施形態では、
図1に示すパラメータ計算器140は、サイド信号計算器60を備え、サイド信号計算器60は、入力として第1のチャネル101と第2のチャネル102とを受信し、時間領域内であり得るが、好ましくは、例えば、式3によって示されているように周波数領域において計算される実際のサイド信号を出力する。しかしながら、式3は、帯域およびフレームごとに絶対位相回転パラメータβおよびIPDパラメータを用いるサイド信号の計算の状況を示しているが、サイド信号は、位相補償なしでも計算され得る。式3は、L
t,kおよびR
t,kのみが生じる式になる。したがって、サイド信号は、左チャネルと右チャネルとの間または第1のチャネルと第2のチャネルとの間の単純な差としても計算され得、2の平方根を用いる正規化は、使用されてもされなくてもよい。
【0111】
サイド信号計算器60によって計算されたサイド信号は、残余信号計算器61に転送される。残余信号計算器61は、例えば、式5に示す手順を実行する。残余信号計算器61は、異なるテストサイドゲイン、すなわち、サイドゲインgd,bに対する異なる値、すなわち、同一の帯域およびフレームに対する異なるテストサイドゲインを使用するように構成され、その結果、ブロック61の複数の出力によって示されるように、異なる残余信号が取得される。
【0112】
図3中のサイドゲイン選択器62は、すべての異なる残余信号を受信し、異なる残余信号のうちの1つ、または、定義済みの条件を満たす異なる残余信号のうちの1つに関連するテストサイドゲインを選択する。この定義済みの条件は、例えば、すべての異なる残余信号の中で最小のエネルギーを有する残余信号をもたらすサイドゲインが選択されることであり得る。しかしながら、ラウドネスのようなエネルギーとは異なる最小の振幅関連条件のような他の所定の条件が使用され得る。しかしながら、最も小さいエネルギーではなく、5つの最も小さいエネルギーのうちの1つであるエネルギーを有する残余信号が使用されるなど、他の手順も適用され得る。実際には、定義済みの条件はまた、特定の周波数範囲内の特定の特徴のような特定の他のオーディオ特性を示している残余信号を選択することであり得る。
【0113】
選択された特定のテストサイドゲインは、サイドゲイン選択器62によって、特定のフレームまたは特定の帯域および特定のフレームに対するサイドゲインパラメータとして決定される。選択された残余信号は、残余ゲイン計算器63に転送され、残余ゲイン計算器は、一実施形態では、選択された残余信号の振幅関連特性を単に計算することができ、または、好ましくは、残余信号の振幅関連特性とダウンミックス信号もしくはミッド信号の振幅関連特性との間の関係として残余ゲインを計算することができる。位相補償されたダウンミックスとは異なる、または左および右の合計からなるダウンミックスとは異なるダウンミックスが使用される場合であっても、それにもかかわらず、残余ゲインは、場合によっては、左および右の位相補償なしの加算に関連し得る。
【0114】
したがって、
図3は、サイド信号の実際の計算を用いてサイドゲインおよび残余ゲインを計算する方法を示しているが、式9および式10を概ね反映する
図2の実施形態では、サイドゲインおよび残余ゲインは、サイド信号の明示的な計算なしに、そして異なるテストサイドゲインを用いる残余信号計算を実行せずに計算される。したがって、両方の実施形態が予測から残余信号をパラメータ化するサイドゲインおよび残余ゲインをもたらし、
図2および
図3に示したものまたは対応する式5から10によるもの以外のサイドゲインおよび残余ゲインを計算するための他の手順も可能であることが明らかになる。
【0115】
さらに、与えられたすべての式は常に、対応する式によって決定された値に対する好ましい実施形態であることが留意されるべきである。しかしながら、式によって決定される値からの偏差がより小さくなると、利点はより大きくなるが、対応する式によって決定される値と好ましくは±20%の範囲内で異なる値も有用であり、すでに従来技術を上回る利点を提供することがわかった。したがって、他の実施形態では、対応する式によって決定される値と±10%だけ異なる値を使用することが好ましく、最も好ましい実施形態では、式によって決定される値は、いくつかのデータ項目の計算のために使用される値である。
【0116】
図6は、符号化マルチチャネル信号200を復号するための装置を示す。復号するための装置は、入力インターフェース204と、入力インターフェース204に接続された残余信号合成器208と、一方で入力インターフェース204に接続され他方で残余信号合成器208に接続されたアップミキサ212とを備える。好ましい実施形態では、デコーダは、217および218において示すように時間領域の第1および第2のチャネルを最終的に出力するためにスペクトル-時間変換器216を加えて備える。
【0117】
具体的には、入力インターフェース204は、符号化マルチチャネル信号200を受信し、符号化マルチチャネル信号200からダウンミックス信号207と、サイドゲインg206と、残余ゲインr205とを取得するように構成される。残余信号合成器208は、残余ゲイン205を使用して残余信号を合成し、アップミキサ212は、再構成された第1のチャネル213と再構成された第2のチャネル214とを取得するために、サイドゲイン206と残余信号合成器208によって決定される残余信号209とを使用してダウンミックス信号207をアップミックスするように構成される。残余信号合成器208およびアップミキサ212がスペクトル領域において動作するか、または少なくともアップミキサ212がスペクトル領域において動作する実施形態では、再構成された第1および第2のチャネル213、214は、スペクトル領域表現において与えられ、各チャネルに関するスペクトル領域表現は、時間領域の第1および第2の再構成されたチャネルを最終的に出力するために、スペクトル-時間変換器216によって時間領域に変換され得る。
【0118】
具体的には、アップミキサ212は、第1の重み付きダウンミックスチャネルを取得するために、
図7に示す第1の重み付け器70を使用して第1の重み付け演算を実行するように構成される。さらに、アップミキサは、第2の重み付きダウンミックス信号を取得するために、一方でサイドゲイン206と他方でダウンミックス信号207とを使用して、再び第2の重み付け器を使用して第2の重み付け演算を実行する。好ましくは、ブロック70によって実行される第1の重み付け演算は、第1の重み付きダウンミックス76が第2の重み付きダウンミックス77と異なるように、ブロック71によって実行される演算の第2の重み付けとは異なる。さらに、アップミキサ212は、第1の重み付きダウンミックス信号76と残余信号209との第1のコンバイナ72によって実行される組合せを使用して、再構成された第1のチャネルを計算するように構成される。さらに、アップミキサは、加えて、第2の重み付きダウンミックス信号77と残余信号209との第2の組合せを実行するための第2のコンバイナ73を備える。
【0119】
好ましくは、ブロック72、73における異なる組合せ規則のため、ならびにブロック70およびブロック71によって実行される異なる重み付け規則のために、一方でブロック72の出力および他方でブロック73の出力が互いに実質的に異なるように、第1のコンバイナ72および第2のコンバイナ73によって実行される組合せ規則は、互いに異なる。
【0120】
好ましくは、一方の組合せ規則が加算演算であり、他方の組合せ規則が減算演算であるという事実により、第1および第2の組合せ規則は、互いに異なる。しかしながら、第1および第2の組合せ規則の他の対も同様に使用され得る。
【0121】
さらに、一方の重み付け規則が、所定の数とサイドゲインとの間の差によって決定される重み付け係数を用いる重み付けを使用し、他方の重み付け規則が、所定の数とサイドゲインとの間の合計によって決定される重み付け係数を使用するので、ブロック70およびブロック71において使用される重み付け規則は、互いに異なる。所定の数は、両方の重み付け器において互いに等しくてもよく、または互いに異なってもよく、所定の数は、ゼロとは異なり、整数または非整数であってもよく、好ましくは1に等しい。
【0122】
図8は、残余信号合成器208の好ましい実装形態を示す。残余信号合成器208は、一種の生の残余信号選択器、または一般に、無相関信号計算器80を備える。さらに、ブロック80によって出力された信号は、参照番号205を用いて示された
図6の入力インターフェース204によって出力された残余ゲインを入力として受信する重み付け器82に入力される。さらに、残余信号合成器は、好ましくは、正規化器84を備え、正規化器84は、現在のフレームのミッド信号85を入力として受信し、ブロック80によって出力された信号、すなわち、生の信号または無相関信号86をさらなる入力として受信する。これら2つの信号に基づいて、正規化係数g
norm87が計算され、ここで、正規化係数87は、好ましくは、合成された残余信号209を最終的に取得するために残余ゲインrと共に重み付け器82によって使用される。
【0123】
好ましい実施形態では、生の残余信号選択器80は、直前のフレームまたはさらにより以前のフレームのような先行フレームのダウンミックス信号を選択するように構成される。しかしながら、実装形態に応じて、生の残余信号選択器80は、先行フレームに対して計算される左もしくは右信号もしくは第1のもしくは第2のチャネル信号を選択するように構成され、または、生の残余信号選択器80は、例えば、直前のフレームもしくはさらに以前の先行フレームのいずれかに対して決定された左および右信号の和、差、などのような組合せに基づいて残余信号を決定することもできる。他の実施形態では、無相関信号計算器80は、無相関信号を実際に生成するようにも構成され得る。しかしながら、生の残余信号選択器80は、残響フィルタのような無相関フィルタのような特定の無相関器なしで動作するが、低い複雑性の理由のため、ミッド信号、再構成された左信号、再構成された右信号、または、特定の残響もしくは無相関フィルタに依存しない重み付き組合せ、すなわち、(重み付き)加算、(重み付き)減算などのような単純な演算によってより以前の再構成された左および右信号から導出された信号のような、過去からすでに存在する信号のみを選択することが好ましい。
【0124】
一般に、重み付け器82は、残余信号のエネルギーが残余ゲインrによって示される信号エネルギーと等しくなるように残余信号を計算するように構成され、ここで、このエネルギーは、絶対項において示され得るが、好ましくは、現在のフレームのミッド信号85に対する相対項において示される。
【0125】
エンコーダ側およびデコーダ側に関する好ましい実施形態では、サイドゲインの値、および適切であれば残余ゲインからの値は、ゼロとは異なる。
【0126】
続いて、デコーダに関する追加の好ましい実施形態が方程式の形で与えられる。
【0127】
アップミックスは、再び周波数領域において行われる。この目的のため、エンコーダからの時間-周波数変換が復号されたダウンミックスに適用され、時間-周波数ベクトル
【0128】
【0129】
をもたらす。逆量子化された値
【0130】
【0131】
、
【0132】
【0133】
、および
【0134】
【0135】
を使用し、左および右チャネルは、k∈Ibに対して、
【0136】
【0137】
および
【0138】
【0139】
として計算され、ここで、
【0140】
【0141】
は、エンコーダからの欠けている残余ρt,kの代用であり、gnormは、エネルギー調節係数
【0142】
【0143】
であり、このエネルギー調節係数は、相対的ゲイン係数
【0144】
【0145】
を絶対的なものに変える。例えば、
【0146】
【0147】
を取ることができ、ここで、db>0は、帯域ごとのフレーム遅延を表す。位相回転係数
【0148】
【0149】
は、
【0150】
【0151】
として再び計算される。左チャネルおよび右チャネルは、次いで、逆DFTを
【0152】
【0153】
および
【0154】
【0155】
に適用し、合成ウィンドウおよび重複加算を続けることによって生成される。
【0156】
図9は、入力インターフェース204のさらなる実施形態を示す。この実施形態は、
図5aおよび
図5bに関してエンコーダ側について前述したように、逆量子化演算を反映する。具体的には、入力インターフェース204は、符号化マルチチャネル信号から結合コードを抽出する抽出器90を備える。この結合コード91は、結合コードブック92に転送され、結合コードブック92は、コードごとに、符号情報、グループ情報、もしくは点情報を出力するように構成され、または、コードごとに、最終逆量子化値gおよび最終逆量子化値r、すなわち、逆量子化サイドゲインおよび逆量子化残余ゲインを出力するように構成される。
【0157】
図10aは、時間領域の第1および第2のチャネルまたは左および右チャネルl(t)およびr(t)の概略表現を示す。
【0158】
サイドゲインおよび残余ゲインがスペクトル領域において計算される実施形態では、左および右チャネルまたは第1および第2のチャネルは、好ましくは重なり合うフレームF(1)、F(2)、F(3)、およびF(4)などに分離される。
図10aに示す実施形態では、フレームは、50%重なり合っているが、他の重なりも同様に有用である。さらに、2フレームの重複のみが示されており、すなわち、常に2つの後続のフレームのみが互いに重なり合っていることが示されている。しかしながら、3、4、または5重複フレームのような複数重複フレームも同様に使用され得る。このとき、アドバンス値、すなわち、次のフレームが現在のフレームとどれくらい異なるかは、
図10aに示す実施形態のように50%ではなく、10%、20%、または30%などのようにより小さいだけである。
【0159】
図10bは、
図2に示すブロック21またはブロック22のような時間-スペクトル変換器の好ましい実装形態を示す。そのような時間-周波数変換器は、入力としてフレームのシーケンスl(t)またはr(t)を受信する。分析ウィンドウ化器(windower)1300は、次いで、好ましくは同じ分析ウィンドウを用いてすべてウィンドウ化されたウィンドウ化フレームのシーケンスを出力する。分析ウィンドウは、正弦ウィンドウまたは任意の他のウィンドウであり得、第1のチャネルに対して別個のシーケンスが計算され、第2のチャネルに対してさらに別個のシーケンスが計算される。
【0160】
次いで、ウィンドウ化フレームのシーケンスは、変換ブロック1302に入力される。好ましくは、変換ブロック1302は、DFT、具体的にはFFTのような複素スペクトル値をもたらす変換アルゴリズムを実行する。しかしながら、他の実施形態では、DCTまたはMDCT(修正離散コサイン変換)のような純粋な実変換アルゴリズムも同様に使用され得、その後、虚数部は、当該技術分野で知られているように、例えばUSAC(統合スピーチおよびオーディオコーディング)規格において実施されているように、純粋な実数部から推定され得る。他の変換アルゴリズムは、複素数値のサブバンド信号をもたらすQMFフィルタバンクのようなサブバンドフィルタバンクであり得る。典型的には、サブバンド信号フィルタ帯域は、FFTアルゴリズムよりも低い周波数分解能を有し、特定の数のDFTビンを有するFFTまたはDFTスペクトルは、特定のビンを収集することによってサブバンドごとの表現に変換され得る。これは、
図10cに示されている。
【0161】
具体的には、
図10cは、特定のフレームtに関する第1または第2のチャネルL
k、R
kの周波数領域表現の複素スペクトルを示す。スペクトル値は、大きさ/位相表現において、または実数部/虚数部表現において与えられる。典型的には、DFTは、同じ周波数分解能または帯域幅を有する周波数ビンをもたらす。しかしながら、好ましくは、サイドゲインおよび残余ゲインは、残余ゲインとサイドゲインとを送信するためのビット数を減らすために、サブバンドごとに計算される。好ましくは、サブバンド表現は、より低い周波数からより高い周波数へと増加するサブバンドを使用して生成される。したがって、一例では、サブバンド1は、2つのビンのような第1の数の周波数ビンを有することができ、サブバンド2、サブバンド3、または任意の他のサブバンドのような第2のより高いサブバンドは、例えば、サブバンド3によって示されるように8つの周波数ビンのような、より多数の周波数ビンを有することができる。したがって、個々のサブバンドの周波数帯域幅は、好ましくは、バーク尺度に関して当該技術分野で知られているように、人間の耳の特性に対して調整され得る。
【0162】
したがって、
図10cは、前に開示した式中のパラメータkによって示される異なる周波数ビンを示し、
図10cに示す個々のサブバンドは、サブバンドインデックスbによって示される。
【0163】
図10dは、例えば、
図6中のブロック216によって実装されるような、スペクトル-時間変換器の実装形態を示す。スペクトル-時間変換器は、最終的に時間領域チャネルを取得するために、逆変換器(backward transformer)1310と、その後に接続される合成ウィンドウ化器1312と、その後に接続される重複/加算器1314とを必要とする。したがって、1310への入力において、
図6に示す再構成されたスペクトル領域チャネル213、214があり、重複/加算器1340の出力において、時間領域の再構成された第1および第2のチャネル217、218が存在する。
【0164】
逆変換器1310は、逆変換をもたらすアルゴリズム、具体的には、好ましくは、エンコーダ側において
図10bのブロック1302において適用されるアルゴリズムの逆のアルゴリズムを実行するように構成される。さらに、合成ウィンドウ化器1312は、対応する分析ウィンドウと一致する合成ウィンドウを適用するように構成され、好ましくは、同じ分析および合成ウィンドウが使用されるが、これは、必ずしもそうではない。重複加算器1314は、
図10aに示すように重複を実行するように構成される。したがって、重複/加算器1314は、例えば、
図10aのF(3)に対応する合成ウィンドウ化フレームを取り、加えて
図10aの合成ウィンドウ化フレームF(4)を取り、次いで、最終的に実際の時間領域出力チャネルのサンプルを取得するために、サンプルごとに、F(3)の第2の半分の対応するサンプルをF(4)の第1の半分の対応するサンプルに加算する。
【0165】
続いて、本発明の異なる特定の態様が簡潔に与えられる。
【0166】
・IPD補償および式(4)による絶対位相補償によるステレオM/S。
・IPD補償および(10)によるMによるSの予測によるステレオM/S
・IPD補償、(9)によるMによるSの予測、およびゲイン係数(10)による残余予測によるステレオM/S
・結合量子化によるサイドゲイン係数および残余ゲイン係数の効率的な量子化
・(g,r)平面内のLtおよびRtの固定されたエネルギー比に対応する線上のサイドゲイン係数および残余ゲイン係数の結合量子化。
【0167】
好ましくは、上述の5つの異なる態様のすべてが、同一のエンコーダ/デコーダフレームワークにおいて実施されることに留意すべきである。しかしながら、前に与えた個々の態様がまた、互いに別々に実施され得ることにさらに留意すべきである。したがって、IPD補償および絶対位相補償を用いる第1の態様は、いかなるサイドゲイン/残余ゲイン計算にもかかわらず、任意のダウンミキサにおいて実行され得る。さらに、例えば、サイドゲイン計算および残余ゲイン計算の態様は、任意のダウンミックスを用いて、すなわち、特定の位相補償によって計算されないダウンミックスを用いても実行され得る。
【0168】
さらに、一方でサイドゲインの計算、および他方で残余ゲインの計算は、互いに独立して実行され得、ここで、単独の、または残余ゲインとは異なる任意の他のパラメータと一緒のサイドゲインの計算はまた、特にICCまたはILD計算に関して、当該技術分野に対して有利であり、さらに、単独の、またはサイドゲインとは別の任意の他のパラメータと一緒の残余ゲインの計算もすでに有用である。
【0169】
さらに、サイドゲインおよび残余ゲインまたはゲイン係数の効率的な結合量子化または条件付き量子化は、任意の特定のダウンミックスに有用である。したがって、効率的な量子化はまた、いかなるダウンミックスもまったくなしに使用され得る。そして、非常に効率的で低い複雑性の量子化が、もちろん同様にサイドゲインおよび残余ゲインとは異なるパラメータであり得るそのような依存パラメータに対して実行され得るように、この効率的な量子化は、第2のパラメータがその値範囲に関して第1のパラメータに依存する任意の他のパラメータにも適応され得る。
【0170】
したがって、上述した5つの態様のすべては、特定のエンコーダ/デコーダ実装形態において、互いに独立してまたは一緒に実行および実施され得、また、態様のサブグループのみが一緒に実施され得、すなわち、場合によって、3つの態様が他の2つの態様なしで一緒に実施され、または5つの態様のうちの2つのみが他の3つの態様なしで一緒に実施される。
【0171】
いくつかの態様について装置の文脈において説明したが、これらの態様が対応する方法の説明も表すことは明らかであり、ここで、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。類似して、方法ステップの文脈において説明した態様は、対応する装置の対応するブロックまたは項目または特徴の説明も表す。
【0172】
特定の実装要件に応じて、本発明の実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実装され得る。実装は、それぞれの方法が実行されるようにプログラム可能コンピュータシステムと協働する(または協働することができる)電子的に読み取り可能な制御信号が記憶されているデジタル記憶媒体、例えば、フロッピーディスク、DVD、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して実行され得る。
【0173】
本発明によるいくつかの実施形態は、本明細書で説明した方法のうちの1つが実行されるようにプログラム可能コンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。
【0174】
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装され得、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されると、方法のうちの1つを実行するように動作可能である。プログラムコードは、例えば、機械可読キャリア上に記憶され得る。
【0175】
他の実施形態は、機械可読キャリアまたは非一時的記憶媒体上に記憶された、本明細書で説明した方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0176】
言い換えれば、したがって、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されると本明細書で説明した方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0177】
したがって、本発明の方法のさらなる実施形態は、本明細書で説明した方法のうちの1つを実行するためのコンピュータプログラムが記録されているデータキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。
【0178】
したがって、本発明の方法のさらなる実施形態は、本明細書で説明した方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続を介して、例えば、インターネットを介して転送されるように構成され得る。
【0179】
さらなる実施形態は、本明細書で説明した方法のうちの1つを実行するように構成または適合された処理手段、例えば、コンピュータ、またはプログラム可能論理デバイスを備える。
【0180】
さらなる実施形態は、本明細書で説明した方法のうちの1つを実行するためのコンピュータプログラムがインストールされているコンピュータを備える。
【0181】
いくつかの実施形態では、本明細書で説明した方法の機能の一部またはすべてを実行するために、プログラム可能論理デバイス(例えば、フィールドプログラマブルゲートアレイ)が使用され得る。いくつかの実施形態では、本明細書で説明した方法のうちの1つを実行するために、フィールドプログラマブルゲートアレイがマイクロプロセッサと協働し得る。一般に、方法は、好ましくは任意のハードウェア装置によって実行される。
【0182】
上記で説明した実施形態は、本発明の原理に関する単なる実例である。本明細書で説明した構成および詳細の修正および変形が当業者に明らかであるものと理解される。したがって、差し迫った特許請求の範囲によってのみ限定され、本明細書の実施形態の記述および説明によって提示された具体的な詳細によっては限定されないことが意図である。
【0183】
参考文献
MPEG-4 High Efficiency Advanced Audio Coding (HE-AAC) v2
FROM JOINT STEREO TO SPATIAL AUDIO CODING-RECENT PROGRESS AND STANDARDIZATION, Proc. of the 7th Int. Conference on digital Audio Effects (DAFX-04)、ナポリ、イタリア、2004年10月5~8日
【符号の説明】
【0184】
21 第1の時間-スペクトル変換器、ブロック
22 第2の時間-スペクトル変換器、ブロック
23 計算器、ブロック
24 計算器、ブロック
25 計算器、内積計算器、ブロック
26 サイドゲイン計算器
27 残余ゲイン計算器
28 接続線
30 チャネル間位相差(IPD)計算器、IPD計算器、ブロック
32 絶対位相回転計算器、ブロック
34 ダウンミックス計算器、ブロック
36 エネルギー差またはサイドゲイン計算器、ブロック
50 サブバンドごとのILD計算器
52 グループ整合器
54 点整合器
56 コードビルダ
57a 符号ビット
57b ビット2から5、ビットのセット
57c ビット6から8、ビットのセット
60 サイド信号計算器
61 残余信号計算器、ブロック
62 サイドゲイン選択器
63 残余ゲイン計算器
70 第1の重み付け器、ブロック
71 ブロック
72 第1のコンバイナ、ブロック
73 第2のコンバイナ、ブロック
76 第1の重み付きダウンミックス、第1の重み付きダウンミックス信号
77 第2の重み付きダウンミックス、第2の重み付きダウンミックス信号
80 無相関信号計算器、ブロック、無相関信号計算器
82 重み付け器
84 正規化器
85 現在のフレームのミッド信号
86 生の信号または無相関信号
87 正規化係数gnorm、正規化係数
90 抽出器
91 結合コード
92 結合コードブック
100 マルチチャネル信号
101 第1のチャネル
102 第2のチャネル
103 追加のチャネル、第3のチャネル
120 ダウンミキサ
122 ダウンミックス信号、ダウンミックス
140 パラメータ計算器
141 サイドゲイン
142 残余ゲイン
143 チャネル間位相差(IPD)
160 出力インターフェース
162 符号化マルチチャネル信号
200 符号化マルチチャネル信号
204 入力インターフェース
205 残余ゲインr、残余ゲイン
206 サイドゲインg、サイドゲイン
207 ダウンミックス信号
208 残余信号合成器
209 残余信号
212 アップミキサ
213 第1のチャネル、スペクトル領域チャネル
214 第2のチャネル、スペクトル領域チャネル
216 スペクトル-時間変換器
217 第1のチャネル
218 第2のチャネル
1300 分析ウィンドウ化器
1302 変換ブロック、ブロック
1310 逆変換器
1312 合成ウィンドウ化器
1314 重複/加算器、重複加算器