【0060】
一つまたはそれ以上の実施例が、例示として、および、特定の実施例に関して説明されてきたが、一つまたはそれ以上の実施は、開示された実施例に限定されるものではないことが理解されるべきである。反対に、当業者にとって明らかであるような種々の変形および類似の構成をカバーするように意図されている。従って、添付の特許請求の範囲は、全てのそうした変形および類似の構成を包含するように、最も広い解釈に調和されるべきである。
上記の実施形態につき以下の付記を残しておく。
(付記1)
オーディオ信号を拡張する方法であって、
オーディオ信号を受信するステップと、
拡張プロセスによって前記オーディオ信号を拡張されたダイナミックレンジまで拡張するステップと、を含み、
前記拡張プロセスは、
定められたウィンドウ形状を使用して前記受信したオーディオ信号を複数の時間セグメントへと分割するステップと、
前記オーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において各時間セグメントに対する広帯域ゲインを計算するステップと、
前記拡張されたダイナミックレンジを得るために、各時間セグメントに対して個別のゲイン値を適用するステップと、を含み、
前記個別のゲイン値の適用は、比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱める、
方法。
(付記2)
前記セグメントは、オーバーラップしている、
付記1に記載の方法。
(付記3)
前記オーディオ信号を分析するために第1フィルターバンクが使用されて、周波数領域表現を獲得し、かつ、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応している、
付記2に記載の方法。
(付記4)
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つである、
付記3に記載の方法。
(付記5)
各時間セグメントに対する前記広帯域ゲインは、前記各時間セグメントにおけるサブバンドのサブセットの中の前記サブバンドサンプルを使用して計算される、
付記3に記載の方法。
(付記6)
サブバンドの前記サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応する、
付記5に記載の方法。
(付記7)
各時間セグメントそれぞれに対する前記ゲインは、各時間セグメントにおける前記サブバンドサンプルのp−ノルムから引き出され、
ここで、pは、2に等しくない正の実数である、
付記5に記載の方法。
(付記8)
前記広帯域ゲインは、前記第1フィルターバンクの領域において適用される、
付記5に記載の方法。
(付記9)
各広帯域ゲイン値は、前記第1フィルターバンクのサブバンドの第1サブセットから計算されて、前記第1フィルターバンクのサブバンドの第2サブセットに適用され、
ここで、サブバンドの第2セットは、サブバンドの前記第1サブセットを含む、
付記8に記載の方法。
(付記10)
サブバンドの前記第1サブセットおよび前記第2サブセットは、同一であり、かつ、前記オーディオ信号の低周波数領域に対応している、
付記9に記載の方法。
(付記11)
サブバンドの前記第1サブセットは、前記オーディオ信号の低周波数領域に対応し、かつ、
サブバンドの前記第2サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応する、
付記9に記載の方法。
(付記12)
前記受信したオーディオ信号は、プロセスによって以前に圧縮されているものであり、
前記プロセスは、
最初のオーディオ信号を受信するステップと、
圧縮プロセスによって、前記最初のオーディオ信号のオリジナルのダイナミックレンジを実質的に低減するように圧縮するステップと、を含み、
前記圧縮プロセスは、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割するステップと、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、各セグメントに対する広帯域ゲインを計算するステップと、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるために、前記複数のセグメントの各セグメントに対して前記最初のオーディオ信号から計算されたゲイン値を適用するステップと、
を含む、付記3に記載の方法。
(付記13)
拡張プロセスによって計算された前記広帯域ゲインは、対応する時間セグメントについて前記圧縮プロセスによって計算された前記広帯域ゲインの実質的な反転である、
付記12に記載の方法。
(付記14)
前記最初のオーディオ信号を分析するために前記圧縮プロセスにおいて前記広帯域ゲインが計算されて、周波数領域表現を獲得し、かつ、
分割のための前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
付記12に記載の方法。
(付記15)
前記拡張プロセスのために受信された信号は、ビットストリームを生成するオーディオエンコーダおよび前記ビットストリームを復号化するデコーダによる前記圧縮された信号の修正の後で獲得される、
付記12に記載の方法。
(付記16)
前記オーディオエンコーダと前記デコーダは、両方ともに変換ベースのものであり、かつ、
前記圧縮プロセスと前記拡張プロセスにおける前記オーディオ信号の時間セグメントは、前記オーディオエンコーダとデコーダにおける変換に係る一つのウィンドウ長よりも実質的に短い、
付記15に記載の方法。
(付記17)
前記方法は、さらに、
前記拡張プロセスの動作状態を決定するコントロール情報を生成するステップと、
前記エンコーダから前記デコーダへ送信されるビットストリームにおいて、前記コントロール情報を送信するステップと、
を含む、付記15に記載の方法。
(付記18)
前記ビットストリームにおけるオーディオ信号は、前記拡張プロセスの複数の時間セグメントに応じたそれぞれのフレームを伴うフレームへと分割され、
前記動作状態がグループから選択され、
前記グループは、
前記拡張プロセスをフレームにおける各時間セグメントに適用すること、
前記拡張プロセスをフレームにおけるあらゆる時間セグメントに適用しないこと
修正されたゲイン計算を用いて前記拡張プロセスをフレームにおける各時間セグメントに適用することであって、前記各時間セグメントにおいて適用される前記ゲインは、前記フレームにおける全ての時間セグメントの平均ゲインであること、
修正されたゲイン計算を用いて前記拡張プロセスをフレームにおける各時間セグメントに適用することであって、計算は前記拡張プロセスを全く適用しないときに対して中間のゲイン値を結果として生じること、
ストップフレームを使用して、前記拡張プロセスが適用されているフレームからフェードアウトして、前記拡張プロセスが適用されていないフレームへフェードインすること、
スタートフレームを使用して、前記拡張プロセスが適用されていないフレームからフェードアウトして、前記拡張プロセスが適用されているフレームへフェードインすること、および、
前記拡張プロセスを完全に適用すること、
からなる、付記17に記載の方法。
(付記19)
前記拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく前記圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
付記18に記載の方法。
(付記20)
前記コントロール情報は、動作状態間のスイッチングが信号の不連続性の発生を最小化するように決定される、
付記19に記載の方法。
(付記21)
前記コントロール情報は、前記圧縮プロセスもコントロールし、かつ、
前記拡張プロセスがスイッチオフされる場合に前記圧縮プロセスをターンオフし、前記拡張プロセスがスイッチオンされる場合に前記圧縮プロセスをターンオンする、効果を有し、
拡張に対する修正されたゲイン計算がなされる場合に、拡張に対する修正されたゲイン計算ができるようにし、
前記拡張器においてストップフレームが使用される場合にストップフレームを使用し、前記拡張器においてスタートフレームが使用される場合にスタートフレームを使用する、
付記20に記載の方法。
(付記22)
前記圧縮されたオーディオ信号と前記拡張器によって受信された前記オーディオ信号は、数量、N、チャンネルを有し、ここでNは1より大きく、
前記チャンネルは、一つまたはそれ以上の分離したサブセットへとグループ化され、
前記圧縮器および前記拡張器でのグループ化は、同一のものであり、
各グループにおける前記チャンネルは、前記圧縮器において同一のゲインを共有して圧縮され、かつ、前記拡張器において同一のゲインを共有して拡張される、
付記15に記載の方法。
(付記23)
前記グループ化は、既定のものであり、前記圧縮器と前記拡張器において既知である、
付記22に記載の方法。
(付記24)
各グループは、まさに一つのチャンネルを含み、N個のグループが存在する、
付記23に記載の方法。
(付記25)
チャンネルの前記グループ化は、
前記圧縮器においてチャンネル間の類似性メトリックを計算すること、
前記類似性メトリックに基づいて、類似のチャンネルを一緒にグループ化すること、
前記ビットストリームを通じて前記グループ化の情報を送信すること、
を含む、付記22に記載の方法。
(付記26)
ステレオ出力を再構成するために、少なくとも2つのチャンネルを前記第1フィルターバンク領域において適用された追加的なパラメトリック空間情報を伴うモノダウンミックスとして符号化し、
前記追加的なパラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
付記22に記載の方法。
(付記27)
オーディオ信号を圧縮する方法であって、
最初のオーディオ信号を受信するステップと、
圧縮プロセスによって前記最初のオーディオ信号のダイナミックレンジを実質的に低減するステップと、を含み、
前記圧縮プロセスは、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割するステップと、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算するステップと、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用するステップと、を含む、
方法。
(付記28)
前記セグメントは、オーバーラップしており、
前記オーディオ信号を分析するために第1フィルターバンクが使用されて、周波数領域表現を獲得し、かつ、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応している、
付記27に記載の方法。
(付記29)
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つである、
付記28に記載の方法。
(付記30)
各個別のゲイン値は、各時間セグメントにおけるサブバンドのサブセットの中のサブバンドサンプルを使用して計算される、
付記28に記載の方法。
(付記31)
サブバンドの前記サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応し、かつ、
前記ゲインは、前記第1フィルターバンクの領域において適用される、
付記30に記載の方法。
(付記32)
各時間セグメントに対する前記ゲインは、各時間セグメントにおける前記サブバンドサンプルのp−ノルムから引き出され、
ここで、pは、2に等しくない正の実数である、
付記30に記載の方法。
(付記33)
前記ゲインは、前記第1フィルターバンクのサブバンドの第1サブセットから計算されて、前記第1フィルターバンクのサブバンドの第2サブセットに適用され、
ここで、サブバンドの第2セットは、サブバンドの前記第1サブセットを含む、
付記30に記載の方法。
(付記34)
サブバンドの前記第1サブセットおよび前記第2サブセットは、同一であり、かつ、前記オーディオ信号の低周波数領域に対応している、
付記33に記載の方法。
(付記35)
サブバンドの前記第1サブセットは、前記オーディオ信号の低周波数領域に対応し、かつ、
サブバンドの前記第2サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応する、
付記33に記載の方法。
(付記36)
前記方法は、さらに、
前記最初のオーディオ信号の圧縮されたバージョンを拡張プロセスを実行する拡張コンポーネントに対して送信するステップを含み、
前記拡張プロセスは、
オーディオ信号の前記圧縮されたバージョンを受信するステップと、
前記オーディオ信号の前記圧縮されたバージョンを、プロセスによって、前記オーディオ信号のオリジナルのダイナミックレンジまで実質的に回復するように拡張するステップ、を含み、
前記プロセスは、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割するステップと、
前記最初のオーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算するステップと、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、各時間セグメントに対して前記広帯域ゲインの個別のゲイン値を適用するステップと、
を含む、
付記27に記載の方法。
(付記37)
圧縮ステップによって計算された前記ゲインは、同一の時間セグメントについて前記拡張プロセスによって計算された前記ゲインの実質的な反転である、
付記36に記載の方法。
(付記38)
前記最初のオーディオ信号を分析するために前記拡張プロセスにおいて第2フィルターバンクが使用されて、周波数領域表現を獲得し、かつ、
分割のための前記定められたウィンドウ形状は、フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
付記36に記載の方法。
(付記39)
前記拡張ステップのために受信された信号は、ビットストリームを生成するオーディオエンコーダおよび前記ビットストリームを復号化するデコーダによる前記圧縮された信号の修正の後で獲得される、
付記36に記載の方法。
(付記40)
前記オーディオエンコーダと前記デコーダは、両方ともに変換ベースのものであり、かつ、
前記圧縮ステップと前記拡張ステップにおける前記オーディオ信号の時間セグメントは、前記オーディオエンコーダとデコーダにおける変換に係る一つのウィンドウ長よりも実質的に短い、
付記39に記載の方法。
(付記41)
前記方法は、さらに、
前記拡張ステップの動作状態を決定するコントロール情報を生成するステップと、
前記エンコーダから前記デコーダへ送信されるビットストリームにおいて、前記コントロール情報を送信するステップと、
を含む、付記39に記載の方法。
(付記42)
前記ビットストリームにおけるオーディオ信号は、前記拡張プロセスの複数の時間セグメントに応じたそれぞれのフレームを伴うフレームへと分割され、
前記動作状態がグループから選択され、
前記グループは、
前記拡張プロセスをフレームにおける各時間セグメントに適用すること、
前記拡張プロセスをフレームにおけるあらゆる時間セグメントに適用しないこと
修正されたゲイン計算を用いて前記拡張プロセスをフレームにおける各時間セグメントに適用することであって、前記各時間セグメントにおいて適用される前記ゲインは、前記フレームにおける全ての時間セグメントの平均ゲインであること、
修正されたゲイン計算を用いて前記拡張プロセスをフレームにおける各時間セグメントに適用することであって、計算は前記拡張プロセスを全く適用しないときに対して中間のゲイン値を結果として生じること、
ストップフレームを使用して、前記拡張プロセスが適用されているフレームからフェードアウトして、前記拡張プロセスが適用されていないフレームへフェードインすること、
スタートフレームを使用して、前記拡張プロセスが適用されていないフレームからフェードアウトして、前記拡張プロセスが適用されているフレームへフェードインすること、および、
前記拡張プロセスを完全に適用すること、
からなる、付記41に記載の方法。
(付記43)
前記拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく前記圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
付記42に記載の方法。
(付記44)
前記コントロール情報は、動作状態間のスイッチングが信号の不連続性の発生を最小化するように決定される、
付記43に記載の方法。
(付記45)
前記コントロール情報は、前記圧縮プロセスもコントロールし、かつ、
前記拡張プロセスがスイッチオフされる場合に前記圧縮プロセスをターンオフし、前記拡張プロセスがスイッチオンされる場合に前記圧縮プロセスをターンオンする、効果を有し、
拡張に対する修正されたゲイン計算がなされる場合に、拡張に対する修正されたゲイン計算ができるようにし、
前記拡張器においてストップフレームが使用される場合にストップフレームを使用し、前記拡張器においてスタートフレームが使用される場合にスタートフレームを使用する、
付記44に記載の方法。
(付記46)
前記圧縮されたオーディオ信号と前記拡張器によって受信された前記オーディオ信号は、数量、N、チャンネルを有し、ここでNは1より大きく、
前記チャンネルは、一つまたはそれ以上の分離したサブセットへとグループ化され、
前記圧縮器および前記拡張器でのグループ化は、同一のものであり、
各グループにおける前記チャンネルは、前記圧縮器において同一のゲインを共有して圧縮され、かつ、前記拡張器において同一のゲインを共有して拡張される、
付記39に記載の方法。
(付記47)
前記グループ化は、既定のものであり、前記圧縮器と前記拡張器において既知である、
付記46に記載の方法。
(付記48)
各グループは、まさに一つのチャンネルを含み、N個のグループが存在する、
付記47に記載の方法。
(付記49)
チャンネルの前記グループ化は、
前記圧縮器においてチャンネル間の類似性メトリックを計算すること、
前記類似性メトリックに基づいて、類似のチャンネルを一緒にグループ化すること、
前記ビットストリームを通じて前記グループ化の情報を送信すること、
を含む、付記46に記載の方法。
(付記50)
ステレオ出力を再構成するために、少なくとも2つのチャンネルを前記第1フィルターバンク領域において適用された追加的なパラメトリック空間情報を伴うモノダウンミックスとして符号化し、
前記追加的なパラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
付記49に記載の方法。
(付記51)
オーディオ信号を圧縮するための装置であって、
最初のオーディオ信号を受信する第1インターフェイスと、
前記最初のオーディオ信号のオリジナルのダイナミックレンジを実質的に低減するように前記最初のオーディオ信号を圧縮する圧縮器と、を含み、
前記圧縮器は、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへ分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算し、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用する、
ことにより圧縮を行う、装置。
(付記52)
前記装置は、さらに、
前記オーディオ信号を分析して、周波数領域表現を獲得する第1フィルターバンクを含み、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応しており、さらに、
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つである、
付記51に記載の装置。
(付記53)
個別のゲイン値は、各時間セグメントそれぞれにおけるサブバンドのサブセットの中のサブバンドサンプルを使用して計算される、
付記52に記載の装置。
(付記54)
サブバンドの前記サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応し、かつ、
前記ゲインは、前記第1フィルターバンクの領域において適用される、
付記53に記載の装置。
(付記55)
前記装置は、さらに、
前記最初のオーディオ信号の圧縮されたバージョンを拡張器へ送信する第2インターフェイスを含み、
前記拡張器は、
オーディオ信号の前記圧縮されたバージョンを受信し、
前記オーディオ信号の前記圧縮されたバージョンを、前記オーディオ信号のオリジナルのダイナミックレンジまで実質的に回復するために、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割し、
前記最初のオーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算し、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、各時間セグメントに対して前記広帯域ゲインの個別のゲイン値を適用する、
ことによって拡張する、
付記52に記載の装置。
(付記56)
前記圧縮器によって計算された前記ゲインは、同一の時間セグメントについて前記拡張器によって計算された前記ゲインの実質的な反転である、
付記55に記載の装置。
(付記57)
前記装置は、さらに、
前記最初のオーディオ信号を分析して周波数領域表現を獲得する第2フィルターバンク、を含み、
分割のための前記定められたウィンドウ形状は、フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
付記55に記載の装置。
(付記58)
前記装置は、さらに、
前記オーディオ信号の圧縮されたバージョンを圧縮器から拡張器へ送信するように構成されているオーディオコーデックのエンコードステージとデコードステージを含み、
前記エンコーダと前記デコーダは、両方ともに変換ベースのものである、
付記55に記載の装置。
(付記59)
前記装置は、さらに、
前記拡張器の動作状態を決定するコントロール情報を生成し、かつ、前記ビットストリームにおいて前記コントロール情報を送信するコントロールコンポーネントを含み、
前記拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく前記圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
付記58に記載の装置。
(付記60)
前記装置は、さらに、
ステレオ出力を再構成するために、前記第1フィルターバンク領域においてパラメトリック空間情報を適用するパラメトリック空間情報コンポーネント、を含み、
前記パラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
付記55に記載の装置。
(付記61)
オーディオ信号を拡張するための装置であって、
圧縮されたオーディオ信号を受信する第1インターフェイスと、
前記圧縮されたオーディオ信号をオリジナルの圧縮されていないダイナミックレンジに実質的に回復するための拡張器と、を含み、
前記拡張器は、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへ分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算し、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用する、
ことにより拡張を行う、装置。
(付記62)
前記装置は、さらに、
前記オーディオ信号を分析して、周波数領域表現を獲得する第1フィルターバンクを含み、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応しており、さらに、
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つである、
付記61に記載の装置。
(付記63)
前記広帯域ゲインは、各時間セグメントに対する個々のゲイン値を含み、かつ、
個別のゲイン値それぞれは、各時間セグメントそれぞれにおけるサブバンドのサブセットの中のサブバンドサンプルを使用して計算される、
付記62に記載の装置。
(付記64)
サブバンドの前記サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応し、かつ、
前記ゲインは、前記第1フィルターバンクの領域において適用される、
付記63に記載の装置。
(付記65)
前記装置は、さらに、
最初のオーディオ信号を受信する圧縮器から前記圧縮されたオーディオ信号を受信する第2インターフェイスを含み、
前記圧縮器は、
前記最初のオーディオ信号の前記オリジナルのダイナミックレンジを実質的に低減するために、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算し、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各時間セグメントに対して各ゲイン値を適用する、
ことによって前記最初のオーディオ信号を圧縮する、
付記62に記載の装置。
(付記66)
前記圧縮器によって計算された前記ゲインは、同一の時間セグメントについて前記拡張器によって計算された前記ゲインの実質的な反転である、
付記65に記載の装置。
(付記67)
前記装置は、さらに、
前記最初のオーディオ信号を分析して周波数領域表現を獲得するする第2フィルターバンク、を含み、
分割のための前記定められたウィンドウ形状は、フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
付記65に記載の装置。
(付記68)
前記装置は、さらに、
前記オーディオ信号の圧縮されたバージョンのビットストリームを圧縮器から拡張器へ送信するように構成されているオーディオコーデックのエンコードステージとデコードステージを含み、
前記エンコーダと前記デコーダは、両方ともに変換ベースのものである、
付記65に記載の装置。
(付記69)
前記装置は、さらに、
前記拡張器の動作状態を決定するコントロール情報を生成し、かつ、前記ビットストリームにおいて前記コントロール情報を送信するコントロールコンポーネントを含み、
前記拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく前記圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
付記68に記載の装置。
(付記70)
前記装置は、さらに、
ステレオ出力を再構成するために、前記第1フィルターバンク領域においてパラメトリック空間情報を適用するパラメトリック空間情報コンポーネント、を含み、
前記パラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
付記65に記載の装置。