【文献】
藤原洋 林伸二 杉山昭彦 及川芳明 守谷健弘,3.3 AC-3からAACへ 3.3..1 .変換符号化方式とMDCT,インターネット時代の数学シリーズ 5 マルチメディア情報圧縮,日本,共立出版,2000年 3月 1日,初版,p.118-123
(58)【調査した分野】(Int.Cl.,DB名)
前記窓シーケンス制御部(808)は、前記第2窓関数(1502)又は前記1つ又は複数の第3窓関数(1503)が前記第1窓関数(1500)のサイズ又は継続時間よりも小さいサイズ又は継続時間を有するように、前記窓シーケンス情報(809)を生成するよう構成されている、請求項1乃至3のいずれか一項に記載の装置。
前記前処理部(802)は、前記補助窓関数として、前記第2フレームを得るために前記窓掛け済みサンプルの第2ブロックを変換することによって導出されたスペクトル値の数が前記第1フレームのスペクトル値の数に等しくなるような、スタート窓関数(1100)を使用するよう構成されている、請求項1乃至4のいずれか一項に記載の装置。
前記スペクトル変換部(804)は、前記第1窓関数を使用し前記サンプルの第1ブロックを窓掛けして窓掛け済みサンプルの第1ブロックを取得し、前記窓掛け済みサンプルの第1ブロックに前記エイリアシング導入変換を適用するよう構成されている、請求項1乃至5のいずれか一項に記載の装置。
前記スペクトル変換部(804)は、前記第2窓関数の第2部分を使用して前記前処理済み第2ブロックの前記第1部分を窓掛けするよう構成され、ここで前記第2窓関数の第1部分は窓掛けには使用されず、更に前記スペクトル変換部(804)は、前記前処理済み第2ブロックの窓掛けされた第1部分に前記エイリアシング導入変換を適用するよう構成されている、請求項1乃至6のいずれか一項に記載の装置。
前記スペクトル変換部(804)は、前記第3窓関数の1つの第2部分、又は、時間的若しくは空間的に最終の第3窓関数の第2部分を除く、前記1つ又は複数の第3窓関数を使用して、前記前処理済み第2ブロックの前記第2部分を窓掛けするよう構成されている、請求項1乃至7のいずれか一項に記載の装置。
前記前処理部(802)は、前記畳み込みにおいて、前記第1ブロックとオーバーラップしている前記第2ブロックの一部分の時間的又は空間的反転と、前記第2ブロックの前記部分が畳み込まれた部分への時間的又は空間的に反転された部分の重み付き加算と、を実施するよう構成されている、請求項1乃至8のいずれか一項に記載の装置。
前記前処理部(802)は、前記1つ又は複数の第3窓関数に時間的又は空間的に後続する第4窓関数とオーバーラップしている前記第2ブロックの一部分の更なる畳み込み演算を追加的に使用して、前記窓掛け済みサンプルの前処理済み第2ブロックを得るよう構成されている、請求項1乃至9のいずれか一項に記載の装置。
前記スペクトル変換部(804)は、修正離散コサイン変換(MDCT)演算又は修正離散サイン変換(MDST)演算を実施するよう構成されている、請求項1乃至10のいずれか一項に記載の装置。
前記スペクトル変換部(804)は、サンプルの数を低減するための畳み込み演算と、それに続く前記低減された数のサンプルに対する離散コサイン変換又は離散サイン変換演算と、を適用することによって、前記MDCT又はMDST演算を実施するよう構成されている、請求項1乃至11のいずれか一項に記載の装置。
前記窓シーケンス制御部(808)は、前記第1フレームの先読み領域内で過渡位置を検出する過渡検出部(106)を備え、前記窓シーケンス制御部(808)は、前記先読み領域内又は前記先読み領域の特定部分内の過渡位置の検出に応じて前記窓シーケンス情報(809)を生成するよう構成されており、
前記窓シーケンス制御部(808)は、前記過渡が、前記先読み領域内で検出されないか、又は、前記先読み領域の前記特定部分以外の部分において検出されたとき、オーバーラップしている第1窓のシーケンスを示す更なるシーケンス情報を生成するよう構成されている、請求項1乃至12のいずれか一項に記載の装置。
前記マルチオーバーラップ部分は、前記第1フレーム内で、前記先読み領域の開始点又は前記先読み領域のある部分よりも時間的又は空間的に前に位置する、請求項13又は14に記載の装置。
前記窓シーケンス制御部(808)は、過渡位置(107)に応じて少なくとも3つの窓から成るグループから特定の窓を選択するよう構成されており、前記少なくとも3つの窓から成るグループは、第1オーバーラップ長(203)を有する第1窓(201)と、第2オーバーラップ長(218)を有する第2窓(225)と、第3オーバーラップ長(229)を有するか又はオーバーラップを有しない第3窓(222)とを含み、前記第1オーバーラップ長は前記第2オーバーラップ長よりも大きく、前記第2オーバーラップ長は前記第3オーバーラップ長よりも大きいか又はゼロオーバーラップよりも大きく、2つの連続するオーバーラップしている窓の一方が前記過渡位置において第1の窓係数を有し、前記2つの連続するオーバーラップしている窓の他方が前記過渡位置において第2の窓係数を有するように、前記特定の窓は前記過渡位置に基づいて選択され、前記第2の窓係数は前記第1の窓係数よりも少なくとも9倍大きい、請求項13又は14に記載の装置。
前記変換を適用することは、前記サンプルの第2ブロックの第1部分と前記サンプルの第2ブロックの第2部分とのオーバーラップ加算(1172)を実施して、前記サンプルの第2ブロックを得ることを含む、請求項17に記載の装置。
前記時間変換部(826)は正確に1つの第3窓関数(1503)を使用し、その第3窓関数の長さは、前記第1フレームのスペクトル値の数の50%に等しい数のスペクトル値が変換され、その結果が前記第3窓関数によって窓掛けされるような長さであるか、又は、前記時間変換部は正確に2つの第3窓関数を使用し、その第3窓関数の長さは、前記第1フレームのスペクトル値の数の1/8に等しい数のスペクトル値が変換されるような長さであるか、又は、前記時間変換部は正確に1つの第3窓関数を使用し、その第3窓関数の長さは、前記第1フレームのスペクトル値の数の1/4に等しい数のスペクトル値が変換されるような長さであるか、又は、正確に4つの第3窓関数を使用し、その第3窓関数の長さは、前記第1フレームのスペクトル値の数の1/8に等しい数のスペクトル値が変換されるような長さである、請求項17又は19に記載の装置。
前記第2窓関数(1502)は前記第1窓関数(1500)とオーバーラップしている第1部分を有し、前記1つ又は複数の第3窓関数は、前記1つ又は複数の第3窓関数(1503)に続く第4窓関数とオーバーラップしている第2部分(1111)を有し、前記後処理部は前記補助窓関数(1100)を適用するよう構成されており、前記補助窓関数は、前記第2窓関数の前記第1部分に類似する第1部分(1100a)と、前記1つ又は複数の第3窓関数の前記第2部分に類似する第3部分(1100c)とを有し、前記補助窓関数の第2部分が前記第1部分と前記第3部分との間に伸びている、請求項17乃至21のいずれか一項に記載の装置。
前記補助窓関数は、前記1つ又は複数の第3窓関数(1503)の第2部分に対応する第2部分(1100b)を有し、又は、前記第2部分(1100b)は0、9よりも大きいか若しくは1である窓係数を有し、又は、前記第2部分の長さは前記窓掛け済みサンプルの前処理済み第2ブロックが前記第1フレーム内のスペクトル値の数と同一のスペクトル値の数をもたらすような長さである、請求項17乃至22のいずれか一項に記載の装置。
前記窓シーケンス情報(809)は、前記第2窓関数(1502)又は前記1つ又は複数の第3窓関数(1503)が前記第1窓関数(1500)のサイズ又は継続時間よりも小さいサイズ又は継続時間を有するような、情報である、請求項17乃至23のいずれか一項に記載の装置。
前記後処理部は、前記補助窓関数として、前記第2フレームを得るために前記窓掛け済みサンプルの第2ブロックを変換することによって導出されるスペクトル値の数が前記第1フレームのスペクトル値の数に等しくなるような、スタート窓関数(1100)を使用するよう構成されている、請求項17乃至23のいずれか一項に記載の装置。
前記時間変換部は、前記第2窓関数の第2部分を使用して、前記サンプルの第2ブロックの第1部分と前記サンプルの第2ブロックの第2部分とのオーバーラップ加算を実施するよう構成されており、前記第2窓関数の第1部分は使用されない、請求項17乃至24のいずれか一項に記載の装置。
前記時間変換部は、前記第3窓関数の1つの第2部分、又は、時間的若しくは空間的に最終の第3窓関数の第2部分を除く、前記1つ又は複数の第3窓関数を使用して、前記サンプルの第2ブロックの第1部分のオーバーラップ加算を実施するよう構成されている、請求項17乃至26のいずれか一項に記載の装置。
前記後処理部は、時間的又は空間的に前記1つ又は複数の第3窓関数に続く第4窓関数とオーバーラップしている、前記第2ブロックの一部分の更なる畳み込み演算を追加的に使用するよう構成されている、請求項17乃至27のいずれか一項に記載の装置。
前記時間変換部は、逆DCT又は逆DST演算及び後続する逆畳み込み演算を使用して前記変換を適用するよう構成されている、請求項17乃至28のいずれか一項に記載の装置。
前記時間変換部は、前記復号化済みのオーディオ信号の過渡が、時間的又は空間的に前記マルチオーバーラップ領域に後続して位置するか、又は、前記第2窓関数によってカバーされない時間部分又は空間部分に位置するように、前記変換を適用するよう構成されている、請求項17乃至29のいずれか一項に記載の装置。
前記第2フレームの前記第1部分はn/2個のスペクトル値を含み、前記第2フレームの前記第2部分は、n/8個のスペクトル値を有する4つのブロック、又はn/2個のスペクトル値を有する単一のブロック、又はn/4個のスペクトル値を有する2つのブロックを含む、請求項17乃至30のいずれか一項に記載の装置。
【発明を実施するための形態】
【0039】
図1aは、オーディオ信号100を符号化する装置を示す。オーディオ信号を符号化する装置は、オーディオ信号100を窓掛けして、103で示す窓掛け済みサンプルのブロックのシーケンスを提供するための制御可能な窓掛け部102を備える。復号器は、窓掛け済みサンプルのブロックのシーケンス103を、105で示すスペクトル値のフレームのシーケンスを含むスペクトル表現に変換するための変換部104を更に備える。更に、過渡位置検出部106が設けられる。検出部は、フレームの過渡先読み領域内の過渡の位置を識別するように構成されている。更に、制御可能な窓掛け部を制御するための制御部108が、107で示す過渡の識別された位置に応じて、特定のオーバーラップ長を有する特定の窓をオーディオ信号100に適用するよう構成されている。更に、制御部108は、一実施形態において、窓情報112を、制御可能な窓掛け部102にだけでなく、その出力において符号化済みオーディオ信号115を提供する出力インターフェース114にも提供するよう構成されている。スペクトル値のフレームのシーケンス105を含むスペクトル表現は符号化処理部110に入力され、その符号化処理部110は、予測操作、時間的雑音整形操作、好ましくは聴覚心理音響モデル若しくは少なくとも聴覚心理音響原理に関連する量子化操作のような、任意の種類の符号化操作を実施することができ、又は、ハフマン符号化操作若しくは算術符号化操作のような冗長性を低減する符号化操作を含んでもよい。符号化処理部110の出力はその後、出力インターフェース114に伝送され、その後、出力インターフェース114は最終的に、特定の窓情報112が符号化済み各フレームに関連付けられた、符号化済みオーディオ信号を提供する。
【0040】
制御部108は、少なくとも3つの窓から成るグループから特定の窓を選択するよう構成されている。グループは、第1オーバーラップ長を有する第1窓、第2オーバーラップ長を有する第2窓、及び第3オーバーラップ長を有するか又はオーバーラップを有しない第3窓を含む。第1オーバーラップ長は、第2オーバーラップ長よりも大きく、第2オーバーラップ長はゼロオーバーラップよりも大きい。特定の窓は、時間的に隣接する2つのオーバーラップ窓のうちの1つが過渡の位置において第1の窓係数を有し、時間的に隣接する2つのオーバーラップ窓のうちの他方が過渡の位置において第2の窓係数を有し、第2の窓係数が第1の係数よりも少なくとも9倍大きくなるように、過渡位置に基づいて制御可能な窓掛け部102によって選択される。これによって、過渡が第1の(小さい)係数を有する第1窓によって大幅に抑制され、その過渡が第2の窓係数を有する第2窓によっては殆ど影響を受けないことが確実になる。
第2の窓係数は、好ましくは0.95〜1.05のように±5%の許容範囲内で1に等しく、
第1の窓係数は、好ましくは0に等しいか又は少なくとも0.05よりも小さい。窓係数は負になる可能性もあり、この場合、窓係数の関係及び量は絶対値の大きさに関係付けられる。
【0041】
図2aは、第1窓のみを有する窓シーケンスを示し、第1窓は第1オーバーラップ長を有する。特に、前フレームに第1窓200が関連付けられており、現フレームには窓202が関連付けられており、第3又は次フレームには窓204が関連付けられている。この実施形態において、隣接する窓は50%、即ち全長がオーバーラップしている。更に、オーディオ信号のいずれの部分がフレーム単位で処理されるかを識別できるように、フレームが窓に対して配置されている。この配置を、現フレームを参照して説明する。現フレームは、左部分205a及び右部分205bを有する。同様に、前フレームは、右部分204b及び左部分204aを有する。同様に、次フレームは、左部分206a及び右部分206bを有する。左/右は、
図2aに示すように時間における先行及び時間における後続を指す。スペクトル値の現フレームが生成されるとき、窓202による窓掛けによって得られるオーディオサンプルが使用される。そのオーディオサンプルは、部分204b〜206aを埋める。
【0042】
MDCT処理、概してエイリアシング導入変換を使用した処理の技術分野において公知であるように、このエイリアシング導入変換は、畳み込みステップ、及び特定の非エイリアシング導入変換を使用した後続の変換ステップに分離され得る。
図2aの例において、区分204bは区分205aに畳み込まれ、区分206aは区分205bに畳み込まれる。畳み込み演算の結果、即ち、205aと204bを一方とし、206aと205bを他方とする重み付き組合せが、その後、DCT変換のような変換を使用してスペクトルドメインへと変換される。MDCTの場合、DCT IVが適用される。
【0043】
その後、ここではMDCTに言及しながら例示するが、他のエイリアシング導入変換が同様で類似の方法で処理され得る。重複変換として、MDCTは、入力の半数(同数ではなく)の出力を有するという点において、他のフーリエ関連変換と比較して多少異なっている。特に、MDCTは、線形関数F:
である(ここで、Rは実数の集合を示す)。2N個の実数x
0,...,x
2N-1が以下の式に従ってN個の実数X
0,...,X
N-1に変換される。
【数1】
(この変換の前の正規化係数、ここでは1は任意選択の慣例であり、処理間で異なる。以下では、MDCT及びIMDCTの正規化の積だけが制約される。)
【0044】
逆変換
逆MDCTは、IMDCTとして知られている。入力と出力の数が異なるため、一見すると、MDCTは可逆的であるはずがないと考えられるかもしれない。しかしながら、時間的に隣接したオーバーラップしているブロックのオーバーラップされたIMDCTを追加することによって、完璧な可逆性が達成され、これによってエラーが消去され、元のデータが回復(retrieve)される。この技法は、時間ドメイン・エイリアシング消去(TDAC)として知られている。
【0045】
IMDCTは、以下の式に従って、N個の実数X
0,...,X
N-1を2N個の実数y
0,...,y
2N-1に変換する。
【数2】
(直交変換であるDCT−IVの場合のように、逆変換は順変換と同じ形式を有する。)
【0046】
通常の窓正規化(下記参照)を用いる窓掛けされたMDCTの場合、IMDCTの前の正規化係数は、2を乗算されるべきである(即ち、2/Nになる)。
【0047】
典型的な信号圧縮アプリケーションにおいて、n=0及び2Nの境界における不連続性を、これらの点において関数をゼロに円滑に収束させることによって回避するために、上述したMDCT及びIMDCTの式におけるx
n及びy
nと乗算される窓関数w
n(n=0,...,2N−1)を使用することによって、変換特性は更に改善される(即ち、本発明ではMDCTの前とIMDCTの後でデータを窓掛けする)。原則として、x及びyは異なる窓関数を有することができ、窓関数はブロック毎に変化し得る(特に、サイズの異なるデータブロックが組み合わされている場合)が、簡潔にするために、本発明では等しいサイズのブロックについて同一の窓関数である一般的な場合を考察する。
【0048】
wが次のプリンセン−ブラッドリー(Princen-Bradley)条件を満たす限り、対称窓w
n=w
2N-1-nについて、変換は可逆的なままである(即ち、TDACが機能する)。
【数3】
様々な窓関数が使用される。修正重複変換(非特許文献3,4)として知られている形式を生成する窓が以下の式によって与えられ、
【数4】
その窓がMP3及びMPEG−2 AACに使用され、
【数5】
がVorbisに使用される。AC−3はカイザー・ベッセル派生(KBD)窓を使用し、MPEG−4 AACもKBD窓を使用することができる。
【0049】
MDCTに適用される窓は、プリンセン−ブラッドリー条件を満たさなければならないため、信号分析のいくつかの他のタイプに使用される窓とは異なることに留意されたい。この違いの理由の1つは、MDCT窓が、MDCT(分析)及びIMDCT(合成)の両方のために、2回適用されることである。
【0050】
定義を調べれば分かるように、偶数Nについて、MDCTは基本的にDCT−IVと等価であり、入力はN/2だけシフトされ、2N個のデータブロックが一度に変換される。この等価性をより慎重に研究することによって、TDACのような重要な特性を容易に導き出すことができる。
【0051】
DCT−IVに対する正確な関係を定義するためには、DCT−IVは、偶数/奇数の交互の境界条件に対応することを認識しなければならない。即ち、(DFTの場合のような周期的な境界ではなく)左の境界(n=−1/2周辺)では偶数であり、右の境界(n=N−1/2周辺)では奇数である、等である。この関係は、以下の恒等式から得られる。
【数6】
及び
【数7】
【0052】
従って、その入力が長さNのアレ−xである場合、このアレ−を(x,−xR,−x,xR,...)等に拡張することを考えることができ、ここで、xRは逆順になったxを示す。
【0053】
2N個の入力とN個の出力とを有するMDCTを考察する。ここで、この入力をサイズが各々N/2である4つのブロック(a,b,c,d)に分割する。もし、これらのブロックを(MDCTの定義における+N/2項から)N/2だけ右にシフトすると、(b,c,d)は、N個のDCT−IV入力の端部を過ぎて拡張し、そのため、上述した境界条件に従って、これらのブロックを「畳み」戻さなければならない。
【0054】
従って、2N個の入力(a,b,c,d)のMDCTは、N個の入力(−cR−d,a−bR)のDCT−IVと正しく等価であり、ここで、Rは上記のような反転を示す。
【0055】
この等価性は
図2aにおいて窓関数202について例示されており、aは部分204bであり、bは部分205aであり、cは部分205bであり、dは部分206aである。
(このように、DCT−IVを計算するための任意のアルゴリズムは、MDCTに自明に適用することができる。)
【0056】
同様に、上記IMDCT式はDCT−IV(上記IMDCT式自体の逆変換である)の正確に1/2であり、その出力は(境界条件を介して)長さ2Nに拡張され、N/2だけ左にシフトし戻される。この逆DCT−IVは単純に、上記から入力(−cR−d,a−bR)を戻す。このIMDCTが境界条件を介して拡張されシフトされると、以下が得られる。
[数8]
IMDCT(MDCT(a,b,c,d))=(a−bR,b−aR,c+dR,d+cR)/2
【0057】
b−aR=−(a−bR)Rであり、最後の2項についても同様であるため、IMDCT出力の半分は冗長である。この入力をサイズNのより大きいブロックA、B、ここでA=(a,b)及びB=(c,d)、にグループ化すると、この結果は以下のように単純に書くことができる。
[数9]
IMDCT(MDCT(A,B))=(A−AR,B+BR)/2
【0058】
ここで、TDACがどのように機能するかを理解することができる。時間的に隣接した50%オーバーラップしている2N個のブロック(B,C)のMDCTを計算すると仮定する。このとき、IMDCTは上記と同様に次式をもたらす。
(B−BR,C+CR)/2
このIMDCTが、オーバーラップしている半部における先行するIMDCT結果と加算されると、反転した項が打ち消し合って単純にBが得られ、元のデータが回復される。
【0059】
ここで、用語「時間ドメイン・エイリアシング消去」の起源が明らかになる。論理的DCT−IVの境界を超えて拡張する入力データを使用することによって、ナイキスト周波数を超える周波数がより低い周波数にエイリアシングされるのと同じように、データがエイリアシングされるが、このエイリアシングは、周波数ドメインではなく時間ドメインにおいて行われるという点が異なっている。a及びbRの(a,b,c,d)のMDCTに対する寄与分、又は同等に、
[数10]
IMDCT(MDCT(a,b,c,d))=(a−bR,b−aR,c+dR,d+cR)/2
の結果に対する寄与分を区別することはできない。組合せc−dR等は、それらが加算されるときに、それら組合せを打ち消すための正確に適切な正負符号を有する。
【0060】
奇数N(実際に使用されるのは稀である)について、N/2は整数ではなく、そのためMDCTは単純にDCT−IVのシフト置換ではない。この場合、半サンプルだけ更にシフトすることは、MDCT/IMDCTがDCT−III/IIと等価になり、分析が上記と類似していることを意味する。
【0061】
2N個の入力(a,b,c,d)のMDCTがN個の入力(−cR−d,a−bR)のDCT−IVと正しく等価であることは、上段で見てきた。DCT−IVは、右境界における関数が奇関数である事例のために設計されており、それ故、右境界に近い値は0に近い。入力信号が平滑である場合、これが当てはまる。a及びbRの最右端の成分は入力シーケンス(a,b,c,d)内で連続しており、それ故、それらの差は小さい。その間隔の中央に注目すると、上記式を
(−cR−d,a−bR)=(−d,a)−(b,c)R
と書き直す場合、第2の項(b,c)Rが中央において平滑な遷移を与える。しかしながら、第1の項(−d,a)には、−dの右端がaの左端と交わるような潜在的な不連続性がある。これが入力シーケンス(a,b,c,d)の境界付近の成分を0に向けて低減する窓関数を使用する理由である。
【0062】
上記において、通常のMDCTについてのTDAC特性が証明された。TDAC特性は、時間的に隣接するブロックのIMDCTをそれらのオーバーラップしている半分において加算することによって、元のデータが復元されることを示している。窓掛けされたMDCTについてこの反転特性を導出することは、ほんの僅かながら更に複雑である。
【0063】
サイズNのブロックA、B、Cについて、オーバーラップしている連続した2N個の入力から成る集合(A,B)及び(B,C)を考察する。上述の説明から、(A,B)及び(B,C)がMDCT変換され、IMDCT変換され、それらのオーバーラップしている半分において加算された場合、元のデータである
(B+B
R)/2+(B−B
R)/2=B
が得られることを想起されたい。ここで、MDCT入力及びIMDCT出力の両方に長さ2Nの窓関数を乗算すると仮定する。上述のように対称窓関数を想定し、それ故、その関数の形式は(W,W
R)であり、Wは長さNのベクトルであり、Rは前出のように反転を示す。このとき、プリンセン−ブラッドリー条件は
W+W
R2=(1,1,...)
と書くことができ、2乗及び加算が要素毎に実施される。
【0064】
従って、(A,B)をMDCT変換する代わりに、ここでは(WA,W
RB)をMDCT変換し、全ての乗算が要素毎に実施される。この結果はIMDCT変換され、窓関数によって再び(要素毎に)乗算されると、最後のNの半部は以下のようになる。
[数11]
W
R・(W
RB+(W
RB)
R)=W
R・(W
RB+WB
R)=W
R2B+WW
RB
R
【0065】
(窓掛けされた事例においてIMDCT正規化は2の倍数分だけ異なるため、もはや1/2を乗算しないことに留意されたい。)
【0066】
同様に、(B,C)の窓掛けされたMDCT及びIMDCTによって、その最初のNの半部において以下がもたらされる。
[数12]
W・(WB−W
RB
R)=W
2B−WW
RB
R
【0067】
これら2つの半部を共に加算すると、元のデータが復元される。
【0068】
同様の処理において、
図2aにおける部分205b、206a、206b及び次フレームの次のフレームの第1部分を使用することによって、次フレームが計算される。したがって、窓200、202、204は、
図1aの制御可能な窓掛け部102によって使用される異なるオーバーラップ長を有する3つの窓の中の第1オーバーラップ長を有する窓関数に対応する。上述したように、
図2aは、前フレーム、現フレーム及び次フレーム、具体的には、前フレームについては項目207、現フレームについては208、及び次フレームについては209によって示されている各フレームの先読み領域において、過渡が検出されない状況を示している。
図2bは、過渡位置210、211、212、213において過渡が検出された状況を示している。過渡位置が例えば210において検出されるという事実に起因して、及び210が前フレームの207において開始する先読み領域内にあるという事実に起因して、制御部108は、第1窓201から更なる窓215への切替えが実施されるべきであると判定する。更なる過渡211、特に次の先読み領域内にある212/213に起因して、現フレームはさらに第2オーバーラップ長を有する第2窓216を使用して処理される。従って、窓215は、201において示されている第1オーバーラップ長を有する窓から第2オーバーラップ長を有する第2窓へと変化するある種のスタート窓である。図示されているように、第2オーバーラップ長は8スロットにわたってしか伸びておらず、それ故、第1オーバーラップ長の半分の長さしかない。209において開始する先読み領域において、もはや過渡は検出されないという事実に起因して、ある種の「ストップ窓217」によって、長い窓201へと戻る切替えが実施される。ここでも、一方では現フレーム内で218において示されており、他方では現フレームと次フレームとの間で218において示されているオーバーラップ長は、
図2a内の16スロットで図示されている第1窓のオーバーラップ長の半分の長さであることに留意すべきである。
【0069】
従って、半オーバーラップの窓が検出領域1及び6において検出される過渡に使用される。219において示すように、そのような検出領域は2スロットを含む。従って、先読み範囲は好ましくは8スロットに分離される。しかしながら、他方では、より粗い又はより細かいサブ分割が実施されてもよい。しかしながら、好適な実施形態において、先読み領域は少なくとも4スロットにサブ分割され、好ましくは
図2b及び
図2c並びに他の図面に示すように、8スロットにサブ分割される。
【0070】
図示するように、第2窓216は両側に半オーバーラップを有し、一方で窓215は右側に半オーバーラップを有し、左側に全オーバーラップを有し、窓217は左側に半オーバーラップ及び右側に全オーバーラップを有する。
【0071】
図2cを参照されたい。
図2cは、過渡検出部が、前フレームの中央において開始する先読み領域において、第2の過渡検出領域222内に過渡があることを検出する状況を示す。従って、過渡223が窓224内でのみ「スミアリング」され、窓201によって画定される領域内又は窓225によって画定される領域内には含まれないことを確実にするために、1/4オーバーラップへの切替えが実施される。更に、前フレーム及び現フレーム内の1/4オーバーラップから現フレームと次フレームとの間の半オーバーラップへの切替え、並びに、次フレームとそれの次のフレームとの間の全オーバーラップに戻る切替えが実施される窓シーケンスが示されている。この切替えは、検出される過渡に起因する。208において開始する先読み領域において、過渡は部分1及び部分6において検出され、他方、前フレーム207と現フレーム208との間において、過渡は部分2及び部分5において検出される。
【0072】
また、
図2cは、全長の又は第1オーバーラップ長を有する第1窓201を示し、218で示されている第2オーバーラップ長を有する第2窓が使用され、第2窓が例えば窓225又は窓226であり得、第3オーバーラップ長を有する第3窓が窓224又はその左側に小さいオーバーラップ長229を有する窓225として示されている、窓シーケンスを示す。つまり、全オーバーラップから1/4オーバーラップへ、及び、その後の半オーバーラップ、またその後の全オーバーラップへの窓シーケンス切替えが示されている。従って、第1オーバーラップ長を有する第1窓は、一方で第1のオーバーラップからの異なるオーバーラップを有し、他方では第1オーバーラップ長を有する非対称窓であり得る。しかしながら、代替的に、第1窓はまた、
図2b内の216において示されているように、両側で第1オーバーラップ長を有する窓であってもよい。更に、第2オーバーラップ長を有する第2窓は、両側で第2オーバーラップ長を有する対称窓であってもよく、或いは、一方の側で第2オーバーラップ長を有し、他方の側で第1オーバーラップ長若しくは第3オーバーラップ長又は任意の他のオーバーラップ長を有する非対称窓であってもよい。最後に、第3オーバーラップ長を有する第3窓は、両側で第3オーバーラップ長を有する対称窓であってもよく、又は、一方の側に第3オーバーラップ長を有し、他方の側に異なるオーバーラップ長を有する窓であってもよい。
【0073】
続いて、後続する図面に関連して更なる実施形態を示す。一般的に、過渡及びその位置の検出は、例えば特許文献8に記載されている過渡検出部と同様の方法又は処理を使用して行われてもよいが、任意の他の過渡検出部も使用されてもよい。
【0074】
過渡検出ユニットが、所与のフレームの新たな信号部分内、即ち、現フレームと先行するフレームとの間のオーバーラップ領域を除く部分内における最強の過渡の存在と、もし適用可能な場合にはその過渡の始まりの位置とを識別する。過渡位置を記述するインデックスの分解能は、後続する図面においてフレーム長の1/8であり、そのためインデックス範囲は0〜7である。後続の図面において、インデックス0,...,7を有するサブブロックは、現フレームにおけるコーディングに使用される時間ドメイン信号の最新の20msを表す。
【0075】
図3a〜
図3cは、例示的なms変換長、即ちTCX20変換長に関する変換オーバーラップ幅の選択を示す。
【0076】
図3aにおいて、現フレームに過渡は存在しない。それ故、全オーバーラップ300が検出される。
【0077】
それとは反対に、
図3bは、第7のサブブロックにおいて過渡が検出され、それによって
図1aの制御部108によって半オーバーラップ302が選択される状況を示す。更に
図3cは、第6のサブブロックにおいて過渡が検出され、それ故、最小のオーバーラップ304が制御部によって設定される状況を示す。従って、過渡位置検出部106は過渡があるか否かを検出し、検出しない場合、オーバーラップ幅即ち第1のオーバーラップ幅300が選択される。一方、
図1aの過渡位置検出部106によって判定されるものとして第7のサブブロックに過渡があるとき、好ましくは第1オーバーラップ長300の半分である第2オーバーラップ長302が制御部によって設定され、過渡がサブブロック6にあるとき、最小オーバーラップが設定される。
図3cは加えて、位置6又は7において過渡が検出されたという事実にもかかわらず、変換長が維持される状況を示す。したがって、窓の変換長301a、301b又は303a若しくは303bは、
図3a内で301a及び301bにおいて示されている最長のオーバーラップ長を有する第1窓と同一であり、等しい。後に図示するように、オーバーラップ長を制御するだけでなく、それに加え、特に過渡が他のサブブロック内で検出される状況においては、変換長をも制御することが好適である。従って、現在の変換窓と後続する変換窓との間のオーバーラップ幅は過渡の位置に依存する。一方、現在の変換窓と先行する変換窓との間のオーバーラップは、先行するフレームを処理するときに決定されていた。
【0078】
続いて、10ms変換長、即ちTCX10に関する変換オーバーラップ長の選択を示すために、
図4a〜
図4gを参照する。例えばコーデックが10ms変換長に制限される場合、2つのTCX10窓の間のオーバーラップは、コーディングエラーの時間エイリアシングされたTNX整形に起因する疑似過渡が強く抑制されるように選択される。また、6つ以上の先行するサブブロック及び6つ以上の後続するサブブロックへの過渡のスミアリングが最小化される。即ち、プリエコー及びポストエコーが12.5msに制限される。オーバーラップの選択は過渡位置に基づく。
【0079】
図4aは0番目又は第1のサブブロックにおいて過渡が検出される状況を示す。このとき、最大又は第1オーバーラップ長403を有する「第1窓」401、402が選択される。更に、例示を目的として、先行する窓及び次の窓とのTCX20全オーバーラップが404において参照として示されている。つまり、「全オーバーラップ」は、例えば窓401、402の50%に対応し、又はTCX20窓301a、301bの33%に対応する。従って、
図3aにおけるオーバーラップ長300及び
図4aにおける403は同一である。
【0080】
図4bは、第2のサブブロックにおいて過渡が検出され、従って制御部が、
図2cの229において示されている「第3オーバーラップ長」に対応する最小オーバーラップ404が選択されるように窓シーケンスを制御する状況を示す。つまり、この実施形態においては非対称窓である窓406、407が選択され、これらの窓は、
図1a及び
図1bの文言では「第2窓」に対応する短いオーバーラップ長を有する。更に、第3のサブブロックにある過渡が検出されるとき、第2オーバーラップ長405が選択される。従って、窓408、409は、第3オーバーラップ長405を有する第3窓に対応するが、非対称窓である。
【0081】
更に、
図4dに示すように、過渡が過渡部分4にあるとき、全オーバーラップ長が決定され、それ故、この状況において選択される窓は、
図4aに示す窓401、402である。図示されているようにオーバーラップしている変換の内の1つが過渡を含むようにオーバーラップを選択するとき、過渡が
第1のサブブロック又は第4のサブブロック内にある事例は、それぞれ
図4f又は
図4gに示すようなものである。過渡が0番目又は第1のサブブロックにある事例は別個に処理され、過渡が第4のサブブロック又は第5のサブブロックにある事例も同様である。それ故、
図4eを参照されたい。ここでは、過渡が0番目のサブブロックにある状況が示されており、
図4eに示すような窓シーケンスが得られるが、そこでは、半オーバーラップ405があり、このオーバーラップがその後、全オーバーラップ403に切り替え戻される。この状況は、スタート窓408、及びストップ窓409及び更なる通常長の窓402によって形成される窓シーケンスによって得られる。
【0082】
他方、
図4fは、過渡が第1のサブブロックにあり、それによって短い又は第3オーバーラップ長404が選択される状況を示し、この状況は、スタート窓406及びストップ窓407、並びに、その後に続く全オーバーラップ窓402によって可能になる。従って、
図4eにおける窓408又は409は第2オーバーラップ長405を有する第2窓を示し、窓406及び407は第3オーバーラップ長404''を有する第3窓に対応する。
【0083】
図4gは過渡が第4のサブブロックにあるように検出される状況を示す。この状況は、全オーバーラップ長403を有する第1窓401と、半オーバーラップ長405を有する第2窓409と、第2オーバーラップ長405を有する更なる第2窓414に反映される。しかしながら、窓414の右側は、次フレームについて、即ち、参照符号415によって示されている時点に開始する次の先読み領域において決定されるオーバーラップ長に依存する。
【0084】
したがって、
図4a〜
図4gは、過渡が1つの窓のみの中に位置するように、オーバーラップ長が決定される状況を示しており、この状況は、過渡の位置、例えばサブブロック4内において、窓414の窓係数が0に等しく、窓409の窓係数が1に等しいという事実によって確実となる。
【0085】
続いて、変換長がオーバーラップ幅から導き出される好適な実施形態を参照する。
図5a、
図5b、
図5cは3つの異なるオーバーラップ長403、405、404を示し、全オーバーラップ長は501及び502において示されている2つの第1窓によって決定される。更に、503及び504において示されている第2オーバーラップ長を有する2つの第2窓によって半オーバーラップ長が得られ、第3オーバーラップ長404を有する2つの第3窓505及び506によって第3オーバーラップ長404が得られる。全オーバーラップは好ましくは「0」ビットを使用して符号化され、半オーバーラップは「11」のビット組合せを使用して符号化され、最小オーバーラップは「10」のビット組合せを使用して符号化される。
【0086】
従って、このコーディングは、TCX−20と、TCX−5及びTCX−10のフレームの組合せとを使用することができる場合に、オーバーラップ幅及び変換長選択を決定するときに有用である。
【0087】
一対のフレームの変換長の所与の選択から瞬間的な変換間のオーバーラップを導出する、即ち、オーバーラップ幅が変換長決定の出力に従うコーディング方式とは異なり、本発明の好適な実施形態は、特定のフレームに使用されるべき変換長(単数又は複数)を、そのフレームに起因するオーバーラップ幅、及び、任意選択的に先行するフレームのオーバーラップ幅を使用して、制御又は導出することができる、コーディングシステムに関する。即ち、変換長は、オーバーラップ幅決定ユニットのデータ、又は、
図1aに関連した過渡位置検出部106及び制御部108の協働によるデータに従う。
図6aは符号化表を示し、
図6bは対応する決定表を示す。
図5a、
図5b及び
図5cにおいて、実線は現フレームにおける最後の変換の窓の右半分を表し、破線は次のフレームにおける最初の変換の窓の左半分を表す。
【0088】
図6aは、過渡位置に基づくオーバーラップ及び変換長のコーディングを示す。特に、短/長の変換決定が縦欄600において示すように1ビットを使用して符号化され、次のフレームの第1窓とのオーバーラップが縦欄602において示されているような1ビット又は2ビットを有する可変長符号を使用して符号化される。短/長の変換決定600のための符号と、縦欄602のオーバーラップ幅のための2値符号とが連結されて、縦欄603内の所謂オーバーラップ符号が得られる。更に、次のフレームの最初の窓とのオーバーラップが、過渡検出部106によって決定される縦欄604の過渡位置インデックスに応じて、制御部108によって決定される。上述した例とは対照的に、過渡位置インデックスは、この状況については−1及び−2によって示される2つの先行するスロットにおいて開始する増大した先読み範囲を有し、加えて、全オーバーラップがこの実施形態において信号伝達される。
【0089】
従って、全オーバーラップが「過渡なし」又は−2〜1の過渡位置について信号伝達される。更に、過渡位置2及び3及び7について半オーバーラップが縦欄605によって信号伝達され、過渡位置4、5、6については最小オーバーラップが信号伝達される。
【0090】
従って、
図6aのインデックス「−2」は、位置6において前のフレームに過渡があったことを意味し、「−1」は、位置7において前のフレームに過渡があったことを意味する。上述したように、「なし」は過渡先読み領域において過渡が検出されなかったことを意味する。
【0091】
上述したように、短/長の変換決定及びオーバーラップ幅はオーバーラップ符号を使用して一緒に符号化される。オーバーラップ符号は、短/長の変換決定のための1ビット、及び、1ビット又は2ビットで符号化されるオーバーラップ幅のための2値符号から構成される。その符号は、1つの符号語が開始する場所とその前の符号語が停止する場所が自動的に検出される、可変長符号である。短/長の変換決定及びオーバーラップ幅のための符号が
図6aに定義されている。例えば、短/長の変換決定が1を与え、最小オーバーラップが選択されるとき、即ち2値符号が10に等しいとき、オーバーラップ符号は110である。
【0092】
更に、
図6aは、−2〜5の全ての過渡位置について短変換決定が行われ、過渡なし又は位置6若しくは7における過渡については長変換が選択される状況を示す。従って、
図6aは、過渡位置検出部が特定の位置において特定の過渡を検出することができ、互いから独立して又は並列に、短/長の変換決定及び次のフレームの最初の窓とのオーバーラップが決定され得る状況、即ち全オーバーラップ符号603が導き出され得る状況を示す。種々の短/長変換及び種々のオーバーラップを符号化するための任意の他の符号が使用され得ることを当業者は理解できる点を強調しておく。更に、2つよりも多い、即ち、3つ又は更にはそれ以上の変換長を決定及び信号伝達することができ、同時に、4つ又は5つの異なるオーバーラップ長のような3つよりも多いオーバーラップも決定及び符号化することができる。これらの変換長及びオーバーラップ長の決定は全て、例えば、過渡位置検出部が各フレーム当たり少なくとも4つの異なる区分に対して操作すること、本実施形態におけるように各フレーム当たり8つの区分に対して操作すること、又は、より精細な決定のために、各フレームの16個の区分のような更により多くの区分において操作することに対応する。
【0093】
現フレームと前フレームとのオーバーラップ符号に基づいて、
図6bに示すように、使用すべき変換長の組合せについて決定が行われる。従って、
図6bは前のオーバーラップ符号と現在のオーバーラップ符号とに基づいた変換長の決定を示す。例えば前のオーバーラップ符号と現在のオーバーラップ符号との両方が「00」である場合、401のような窓が使用される。前のオーバーラップ符号が10であり、現在のオーバーラップ符号が00である場合、同じ窓が選択される。しかし、前の符号が半オーバーラップ符号を意味する111であり、かつ現在のオーバーラップ符号が00である場合、例えば
図4cの窓409が選択される。前のオーバーラップ符号110と現在のオーバーラップ符号00とについては、ここでも長変換が選択されるが、窓は窓407と同様であり、同じ状況は前のオーバーラップ符号010と現在のオーバーラップ符号00とについても見られる、即ち、
図4fの窓407が選択される。最後に、前のオーバーラップ符号011と現在のオーバーラップ符号00について、
図4eにおける409のような窓が選択される。
【0094】
他の組合せについては他の窓が選択され、この選択は
図7に関連して具体的に示されている。従って、
図7は、現フレームにおける過渡位置並びに現フレーム及び前のフレームのオーバーラップ符号と共に、変換長組合せの幾つかを示す。
図7における110/010−111は、前のオーバーラップ符号が110又は010であり、現在のオーバーラップ符号が111であることを意味する。それ故、
図7は複数の異なる組合せを示す。例えば、
図7の左上のグラフは、2つのTCX−5変換のシーケンスの始まりにある最小オーバーラップと、全オーバーラップを有する次のTCX−10変換とを示す。それとは逆に、このグラフの下にあるグラフは、最小オーバーラップ及び後続する4つのTCX−5窓を示し、TCX−5窓の第4の窓は半オーバーラップを有する、等である。このように、参照符号700、701は2つのTCX−5又は2つの短い窓と次の中間長の窓とのシーケンスを示す。同様に、参照符号702、703、704、705、706、707は、4つの短い変換長又は「TCX−5」変換を有する状況を示し、一方で、参照符号708、709、710、711は、最初に、即ちシーケンスの始まりにおいて、TXC10窓のような中間の変換長窓があり、次に2つのTCX−5又は短変換長窓がある状況を示している。
図7におけるシーケンス700〜711は、他のそのようなシーケンスによって、つまり、例えば700、702における短いオーバーラップ、704における中間長のオーバーラップ、又は例えば708若しくは710における長いオーバーラップのような、種々のオーバーラップを有するTCX−20又は長い変換長窓によって導入され得る。同時に、そのシーケンスには更なるそのようなシーケンスが後続してもよく、又は、TCX−20、即ち長い変換窓が後続し得るが、オーバーラップ長は異なる。従って、例えば、シーケンス700は長いオーバーラップで終了し、例えばシーケンス702は中間長のオーバーラップで終了し、又は例えばシーケンス706は小さいオーバーラップ長で終了する。
【0095】
図1aに示すように、窓情報、即ち
図1a内で112において示されている
図6aのオーバーラップ符号603は、出力インターフェース114によって各符号化済みフレームに関連付けられ得る。
【0096】
更に、変換部104において適用される変換は、MDCT若しくはMDST、又は異なるエイリアシング導入変換であって、スペクトル値の1ブロック内のスペクトル値の数がその変換に入力される窓掛け済みサンプルの1ブロック内の窓掛け済みサンプルの数よりも少ないか、又は、復号器側に関して、時間ドメイン出力サンプルの数がそのようなエイリアシングを低減する戻り又は逆変換に入力されるスペクトル値の数よりも多いことを特徴とするような、異なるエイリアシング導入変換であってもよい。
【0097】
図2〜
図7の全てに示されているように、一定のフレームラスタが維持される。従って、制御部108は、たとえ、例えば
図7に示すようなより短い変換長への切替えが実施される場合であっても、常に同じ一定のフレームラスタが維持されることが確実になる。これは、正確なオーバーラップサイズの文脈において、各クラスの窓について常に同様の変換長をもたらすような特定の窓を使用することによって確実になる。従って、各TCX−5変換長は、そのようなオーバーラップ領域、及び、変換がN/4個のスペクトル値をもたらす2つのオーバーラップ領域間の一定の領域を有するように定義され、ここでNは1つのフレーム内のスペクトル値の数である。TCX20変換窓の形式及びサイズ並びに特にオーバーラップ長は、加えて、この窓が変換の後にN個のスペクトルサンプルをもたらすように設計される。
【0098】
図1cは、制御可能な変換部158の復号器側の好適な実施形態を示す。特に制御可能な変換部158は、周波数−時間変換部170と、続いて接続されている合成窓掛け部172と、最後のオーバーラップ加算部174とを備える。特に周波数−時間変換部は、DCT−IV変換のような変換及び後続の逆畳み込み演算を実施し、それによって、周波数−時間変換部への入力が例示的にN個のスペクトル値であったのに対して、周波数−時間変換部170の出力は第1の又は長い窓について2N個のサンプルを有するようになる。他方、周波数−時間変換部への入力がN/8個のスペクトル値であるとき、出力は例示的にMDCT操作についてN/4個の時間ドメイン値となる。
【0099】
その後、周波数−時間変換部170の出力は合成窓掛け部に入力され、合成窓掛け部は好ましくは符号器側の窓と正確に同じである合成窓を適用する。従って各サンプルは、オーバーラップ加算が実施される前に、2つの窓によって窓掛けされ、結果として得られる「合計の窓掛け」は、前述したようなプリンセン−ブラッドリー条件が満たされるように、対応する窓係数の2乗である。
【0100】
最後に、オーバーラップ加算部174が、最終的に出力175において復号化済みオーディオ信号を得るために、対応する正確なオーバーラップ加算を実施する。特に、周波数−時間変換部170、合成窓掛け部172及びオーバーラップ加算器174は、例えば
図6aの文脈において説明したオーバーラップ符号603、又は
図6bの文脈において説明した状況を参照する任意の他の情報によって制御可能であり、制御される。しかしながら、好ましくは周波数−時間変換部の対応する変換長は、変換長決定表を使用して前のオーバーラップ符号及び現在のオーバーラップ符号に基づいて決定される。更に、窓サイズ/形状も前のオーバーラップ符号及び現在のオーバーラップ符号に基づいて決定され、同じことがオーバーラップ加算部にも当てはまり、それによって、オーバーラップ加算部は信号伝達された通りに最大オーバーラップ、中間オーバーラップ又は最小オーバーラップを適用する。
【0101】
このように、
図1cの復号器内の制御部180は、オーバーラップ符号、即ち前のオーバーラップ符号606と現在のオーバーラップ符号607とを受信し、この情報からそのスペクトル値のブロックについてオーバーラップ及び窓を決定することが好適である。
【0102】
このように、各窓とその窓に関連付けられる対応する変換サイズとが決定される。変換としてMDCTが使用され、逆変換として逆MDCTが使用される好適な実施形態において、窓サイズは変換長の2倍であり、又は変換長は窓サイズの半分である。
【0103】
図1dは、モバイル機器と共に実装されている本発明の更なる実施形態を示す。このモバイル機器は、一方では符号器195を備え、他方では復号器196を備える。更に、本発明の好適な実施形態によれば、符号器195に使用される窓と復号器196に使用される窓とは互いに同一であるため、符号器105及び復号器106の両方が単一のメモリ197のみから同じ窓情報を取り出す。従って、復号器は、単一セットの窓シーケンス又は窓のみが符号器及び復号の両方に使用するために記憶されている、読み出し専用メモリ197若しくはランダムアクセスメモリ又は一般的に任意のメモリ197を有する。単一セットしか必要としないことは、種々の窓のための種々の窓係数を符号器のために1セット及び復号器のために1セットとして2回記憶する必要がない、という事実に起因して、有利である。本発明によれば、同一の窓及び窓シーケンスが符号器及び復号器に使用されるという事実に起因して、単一セットの窓係数のみが記憶されればよい。従って、
図1dに示す本発明のモバイル機器のメモリ使用量は、符号器及び復号器が異なる窓を有するか、又は窓掛け操作以外の処理による特定の後処理が実施される他の概念と比較して、大幅に低減されている。
【0104】
続いて、変換/変換長切替えの実施形態に関して更なる好適な実施形態について言及する。
【0105】
上段で概説した変換及びオーバーラップ長適応的コーディング方式は、20msのフレーム長を有するxHE−AAC(非特許文献5)の低遅延の変異形態であるLD−USAC符号器の変換符号化励起(TCX)経路において実装され、48kbit/s monoで試験された。この構成点において、LD−USACは、(疑似)定常入力条件下で、512サンプルのコアフレーム長と、256サンプルの即ち33%の長い変換オーバーラップで、TCXのみのモードにおいて作動する。符号器は過渡検出ユニットを含み、過渡検出ユニットの出力は変換長決定ユニット及び本発明のオーバーラップ幅決定ユニットに入力される。512個のMDCT係数を有するTCX−20長、256個のMDCT係数を有するTCX−10長、及び128個のMDCT係数を有する特別なTCX−5長、の3つの変換長が、コーディングのために利用可能である。つまり、256コアサンプルの最大オーバーラップ(10ms)、128コアサンプルの半オーバーラップ(5ms)、及び16サンプルの最小オーバーラップ(0.6ms)の3つのオーバーラップ幅のうちの1つが使用可能であり、フレーム毎に送信され得る。各フレームについて、変換長は、そのフレーム内の全ての変換の長さの合計がコアフレーム長、即ち512サンプルと等しくなるように選択されなければならない。
【0106】
本発明のコーディングシステムの好適な実施形態において、符号器は以下のように作動する。
【0107】
1.過渡検出ユニットが、所与のフレームの新たな信号部分内、即ち、現フレームと先行するフレームとの間のオーバーラップ領域を除く部分内における最強の過渡の存在と、もし適用可能な場合にはその過渡の始まりの位置と、を識別する。過渡位置を記述するインデックスの分解能はフレーム長の1/8であり、そのためインデックス範囲は0,...,7である。
【0108】
2.過渡が検出されなかった場合、又は過渡位置インデックスが6若しくは7である場合、変換長決定ユニットの決定によってTCX−20変換を使用して、影響を受けたフレームが符号化される。そうでない場合、TCX−10変換及び/又はTCX−5変換の組合せ、即ち2×TCX−10、又は4×TCX−5、又はTCX−10及び後続する2×TCX−5、又は2×TCX−5及び後続するTCX−10が使用される。
【0109】
3.ここで、オーバーラップ幅決定ユニットが、上段で列挙した目的に従って、上記目的に違反しない可能性のある最も長いオーバーラップが選択されるように、(前フレームにより既に選択されたオーバーラップを除外しながら)現フレーム内に使用される変換のオーバーラップ形状を制御する。特に、フレームがTCX−20であり、かつ過渡位置インデックスが6又は7である場合、オーバーラップユニットはそれぞれ最小又は半オーバーラップを返す。フレーム内に信号の非定常性が存在しない場合、最大オーバーラップが使用される。
【0110】
4.更に、その(非定常)フレームについてTCX−10/−5の組合せが変換長決定ユニットによって返された場合、オーバーラップ幅決定ユニットはそのフレーム内の変換長の正確な組成を制御する。特に、前フレーム及び現フレームにおいて最大オーバーラップが使用される場合、2×TCX−5及び後続するTCX−10が現フレーム内で適用され、それらTCX−5変換の内の最初のものは二重オーバーラップを有する本発明の遷移変換である。前フレームのオーバーラップ幅又は現フレームのオーバーラップ幅が最大未満である場合、TCX−10/−5を混合した構成の1つも使用される。前フレーム及び現フレームの両方が最大未満のオーバーラップを有する場合、4×TCX−5が使用される。
【0111】
5.ここで、符号器は、信号の窓掛け及びそのフレームの実際のMDCTに進む。復号化の後に完璧な再構築を達成するために、本発明の二重オーバーラップ遷移窓の存在下では、窓掛け操作の順序に関して特別な注意を払わなければならない。符号化プロセスの残りの部分はxHE−AACのものと同様である。任意選択的に、個々の変換にTNSが適用され、2つのTCX−5 MDCT係数セットの(インターリーブされた)係数の1つのTCX−10状のセットへのグループ化が、サイド情報を保存するために実施されてもよい。各フレームについて、1つのオーバーラップ幅値、及び、TCX−20又は非TCX−20コーディングを示す1ビットフラグが復号器に送信される。
【0112】
符号器と同様に、好適な実施形態に係る適切な復号器は、逆MDCTの長さ及び窓掛けを制御するために、送信されたオーバーラップ幅値を解釈するオーバーラップ幅決定ユニットを特徴とし、それによって、符号器及び復号器は、使用される変換に関して完全に同期される。符号器内と同様に、個々のMDCT後の窓掛け及び畳み込み演算の順序は、完璧な信号再構築を得るために重要である。
【0113】
続いて、本発明の更なる実施形態を
図8〜
図15fの文脈において説明及び例示する。「マルチオーバーラップ態様」とも名付けられるこの態様は、
図1〜
図7に関連して説明したオーバーラップ幅及び変換長切替えの実施形態と組み合わされてもよく、又は別個に実装されてもよい。
【0114】
本発明の符号器側を
図8aに示し、復号器側を
図8bに示す。特に、
図8aに示す符号化済み信号を生成するための装置又は符号器は、例えば
図8aに示すように、前処理部802、スペクトル変換部804又は出力インターフェース810に伝送される窓シーケンス情報809を生成するための窓シーケンス制御部
808を備える。窓シーケンス情報は、スペクトル値の第1フレームを生成するための第1窓関数、スペクトル値の第2フレームを生成するための第2窓関数及び1つ又は複数の第3窓関数を示す。第1窓関数、第2窓関数、及び1つ又は複数の第3窓関数は、マルチオーバーラップ領域内でオーバーラップする。
【0115】
このマルチオーバーラップ領域は、例えば、
図13又は
図14b又は
図15e又は
図15fにおいて1300により示されている。従って、このマルチオーバーラップ領域1300において、少なくとも3つの窓関数、即ち、
図15fに関して1500において示されている第1窓関数、第2窓関数1502及び第3窓関数1503は、マルチオーバーラップ領域1300内で互いにオーバーラップしている。4個、5個、又は更により多数の窓のオーバーラップのような、より高度なオーバーラップもあり得る。代替的に、
図15eは、ここでも第1窓関数1500、第2窓関数1502があるが、
図15fの単一の第3窓関数1503とは対照的に、ここでは4個の第3窓関数1503がある状況を示す。
【0116】
過渡先読み領域に必要となる遅延の大幅な低減をもたらすこのマルチオーバーラップ領域を正確に処理するために、前処理部102が設けられる。前処理部は、補助窓関数を使用して、第2窓及び1つ又は複数の第3窓関数に対応するサンプルの第2ブロックを窓掛けして、窓掛け済みサンプルの第2ブロックを得るよう構成されている。更に、前処理部は、第1ブロックとオーバーラップしている第2ブロックの一部分のマルチオーバーラップ部分への畳み込み演算を使用して、窓掛け済みサンプルの第2ブロックを前処理して、修正済みマルチオーバーラップ部分を有する窓掛け済みサンプルの前処理済み第2ブロックを得るよう構成されている。更に、スペクトル変換部804は、第1窓を使用してサンプルの第1ブロックにエイリアシング導入変換を適用して、スペクトル値の第1フレームを得るよう構成されている。更に、スペクトル変換部は、第2窓関数を使用して、窓掛け済みサンプルの前処理済み第2ブロックの第1部分にエイリアシング導入変換を適用して、第2フレームのスペクトルサンプルの第1部分を得るよう構成され、また、1つ又は複数の第3窓関数を使用して、窓掛け済みサンプルの前処理済みの第2ブロックの第2部分にエイリアシング導入変換を適用して、第2フレームのスペクトルサンプルの第2部分を得るよう構成されている。更に、スペクトル値の第1フレームと第2フレームとを処理して、ブロック806の出力807においてオーディオ信号の符号化済みフレームを得るために、「符号化処理部」として示されている処理部806が、
図8aの符号器の中に設けられる。このように、符号化処理部は、
図1aの符号化処理部110と同一であってもよく、又は異なってもよく、かつ、周知のMPEG若しくはAMR又は当該技術分野における任意の他の符号化機能のいずれを実施してもよい。
【0117】
続いて、
図13を参照する。
図13にも、第1窓関数1500の第2の半部と、第2窓関数1502と、
図13の第2のグラフ内に、2つの第3窓関数1503とを示す。これとは対照的に、
図13内の上側のグラフは、第1窓関数1500と、第2窓関数1502と、例えば
図15fとは対照的にかつ
図15eに僅かに類似して、4個の第3窓関数1503を示している。代替的に、第3窓関数の数はまた、3個、5個又はそれ以外の個数等であってもよい。
【0118】
更に、
図13は、異なる第1窓関数1500'、異なる第2窓関数1502'及び同じ第3窓関数1503を有する状況を追加的に示す。1500と1500'との間の違いは、関数1500'と関数1502'とのオーバーラップ長が窓1500、1502と比較して半分であることである。従って、窓関数1500'及び1502'は、オーバーラップ長が例えば図
2b内の218で示される半オーバーラップである状況であり、この場合、全オーバーラップ長は、例えば
図2a又は
図13内の203で示されるように1つの完全なフレームに対応する。従って、
図13に示す窓関数1500'及び1502'は、マルチオーバーラップの態様とオーバーラップ幅決定の態様との組合せを表す。
【0119】
符号器側の前処理部802の処理をより良く説明するために、一方において
図11aの図解、及び、他方において
図9a、
図9bのフローチャートを参照する。復号器に関しては、
図8b、
図10a、
図10bにおける対応する図解及び
図11bにおける図解を参照する。更に、符号器は
図12aにも示されており、復号器は12bにも示されている。
【0120】
具体的には、
図11aにも、第1窓関数1500と、第2窓関数1502の少なくとも一部分と、4個の第3窓関数1503又は単一の第3窓関数1503と、を示す。特に、
図11aはさらに補助窓関数1100を示す。補助窓関数1100は、第1窓関数1500の第1の上昇部分1500aと一致する第1部分1100aを有する。更に、補助窓関数1100は、好ましくは1に等しい窓係数を有する第2の非オーバーラップ部分1100bと、1つ又は複数の第3窓関数の下降部分若しくは降下部分又は右部分に対応する第3部分1100cとを有する。従って、補助窓関数1100は、1102で示す先のフレームの第2の半部と、1103で示す現フレームiの第1の半部と、1104で示す現フレームiの第2の半部と、補助窓関数部分1100cによってカバーされる第1の小部分1105とをカバーする。
図11aから明らかになるように、フレームi+1において短い窓のシーケンスが導入されなければならないかのように、補助窓関数は、「スタート窓シーケンス」として処理され、又は、そのような「スタート窓シーケンス」に対応する。しかしながら、重要なことに、短い窓のシーケンスは、入来するフレームi+1内ではなく、現フレーム内に既に導入されている。
【0121】
前処理部の機能も、次に
図11aに示す。前処理部は、「スタート 畳み込み エイリアス、フレームi(start fold−in alias,frame i)」として示される、投票演算(voting in operation)を使用する補助窓関数を使用した窓掛けによって得られる窓サンプルの第2ブロックを前処理する。これにより、1110によって示される窓掛け済みサンプルの第2ブロックの最左端部分は内向きに畳み込まれる。この部分1110は、窓掛け済みサンプルの第2ブロックが前の第1窓関数1500とオーバーラップしている部分、即ち、期間1102に対応しかつ前フレームi−1内にある、窓掛け済みサンプルの第2ブロックの部分である。ここで、部分1110のこの畳み込み演算がオーバーラップ領域1300に影響を与えるという事実に起因して、前処理部によって実施される畳み込み演算は、結果的に修正済みマルチオーバーラップ部分をもたらす。ここで、スペクトル変換部が、「内側 畳み込み エイリアス(inner fold−in aliases)」として
図11aに示される演算を適用する。特に、スペクトル変換部は、フレームi−1に関して示される第1窓関数を使用して、サンプルの第1ブロックにエイリアス導入変換を適用する。エイリアス導入変換は、1120で示す畳み込み演算と、後続の、例えば1122で示すDCT−IV変換とを含む。この目的のために、フレームi−1に対する畳み込み演算1120の前の形状を得るために、第1窓関数1500が必要となる。更に、スペクトル変換部は、
図11aの項目1131によって示される第1部分にエイリアシング導入変換を適用する。これは、第2窓関数1502、特に、第2窓関数1502の右部分を使用して行われる。この演算の結果として、変換1132によって得られる第2フレームのスペクトルサンプルの第1部分がもたらされ、変換1132はここでもDCT−IV演算を表すが、DCT−IV演算は、対応する畳み込み演算と共に、とはいえここではブロック1131の右オーバーラップ部分のみにおいて、エイリアシング導入変換を構成する。
【0122】
更に、スペクトル変換部は、1つ又は複数の第3窓関数1503を使用して、前処理済みの第2ブロック1130の第2部分1133にエイリアシング導入変換を適用して、第2フレームのスペクトルサンプルの第2部分1135を得るよう構成されている。従って、スペクトルサンプルの第2部分1135を得るために、4つのN/8DCT−IV変換又は単一のN/2 DCT−IV変換が適用され得る。変換の数及び長さは、第3窓関数の数に応じて決まる。一般的に、第2部分1135内のスペクトルサンプルの長さ、変換又は数は、1つのフレーム内のスペクトルサンプルの数から変換1132の長さを減算した数に等しく、その後、その結果が、使用される第3窓関数の数で除算される。
【0123】
従って、前処理部802は一般的に、補助窓関数1100を使用してオーディオ信号を窓掛け902(
図9a)し、窓掛け済みサンプルの第2ブロックを得るように操作可能である。その後、処理部904が好ましくは、
図11a内の1110で示される畳み込み演算を適用して、修正済みマルチオーバーラップ部分1300を有する窓掛け済みサンプルの前処理済みの第2ブロックを得る。その後、変換部906が、第1窓関数、第2窓関数及び第3窓関数を使用した変換を適用して、スペクトル値の第1フレーム1122、第2フレームの第1部分1132、及び、第2フレーム又は
図11aの表記におけるフレームiの第2部分1135を得る。
【0124】
図9bに関連して示す好適な実施形態において、第1窓関数を参照することによって、及び、例示的に、第1窓関数の第1部分1500aを補助窓関数1100の第1部分1100aとして選択することによって、補助窓関数が決定(910)される。更に、非オーバーラップ部分1100bが決定され(1の窓関数が、対応する長さに対してとられる)、その後、ここでも例示的に短い窓関数の第2部分をとることによって、第3部分1100cが決定される。
【0125】
その後、
図11aに示されている前の又は第1フレームi−1に対する正確な関係にあるこの補助窓関数を用いて、オーディオ信号が窓掛け(912)される。その後、
図9bの914において示すように、左部分1110及び好ましくは右部分1111が畳み込まれる。ステップ916において、内側領域内の項目e)又はf)内の斜線において示されるオーバーラップ部分の畳み込みが実施される。更に、918において示すように、
図11aの部分図e)にあるように更に第3窓関数がある場合、第3窓関数のオーバーラップ部分の畳み込みも実施される。しかしながら、
図11aの部分図f)において示すように単一の第3窓関数しかない場合、制御はステップ918を経ることなくステップ916から920へと直接的に進む。ステップ920において、第1フレームのDCTカーネルよりも短いDCTカーネルを使用してDCT演算が実施される。部分図e)のDCTカーネルは、第2窓関数に対してN/2であり、第3窓関数に対してはN/8である。それとは反対に、単一の第3窓関数しかないとき、変換カーネルは、第2窓関数に対してN/2に等しく、単一の第3窓関数に対してはN/2に等しい。
【0126】
従って、マルチオーバーラップ領域1300は2回窓掛けされることが明らかになる。
図11aの部分図e)又はf)において示されているように、第1の窓掛けは補助窓の第1部分1100aによって行われ、第2の窓掛けは最初の第3窓関数1503の第2の半部によって実施される。
【0127】
図13を再び参照する。
図1aの文脈又は
図8aの文脈において説明したように、窓シーケンス制御部が特定の窓形状を生成する。一実施形態において、窓シーケンス制御部は過渡位置検出部106を備えるように構成される。過渡検出部分0又は1において過渡が検出されたとき、符号器は、1305において示すこれらの過渡が単一の第3窓内又は2つの隣接する第3窓内にのみ閉じ込められるように、マルチオーバーラップ部分モードへと移行するよう制御される。具体的には、左の過渡1305が第1の短い窓関数内にのみあるように閉じ込められ、過渡1305の右の過渡は第1窓関数〜第3窓関数内にある。しかしながら、領域1、2、3等の中のような、過渡が0とは異なる領域内に位置すると判定されると、例えば
図6a、
図6b、
図7等の文脈において説明したのと同様に、マルチオーバーラップ領域を用いない処理が実行され得る。
【0128】
一方、それとは反対に、窓切替えのアプリケーションの文脈においてはマルチオーバーラップ領域処理も実行されることができ、過渡が検出された場合、短い窓の更により大きいセットが現フレームについて切り替えられることができ、その結果、好ましくは1つかつ同一のブロック又はフレームラスタ内で、1つの長い窓又は特定数の短い窓が窓掛けに使用される。例えば
図13において、第1窓は窓1500に対応し、第2窓は窓1502に対応し、現フレーム内の正確にはどこに過渡が位置するかが分からずに、現フレームのどこかで過渡が検出される場合にのみ、所定の過渡位置を参照することなく、いくつかの第3窓関数への切り替えが実施される。
【0129】
しかしながら、第3窓関数の数を可能な限り小さく維持するために、マルチオーバーラップ部分モードへの切替えと、変換オーバーラップの追加的な切替えと、変換長の選択とは、フレーム内の過渡の特定の位置に応じて実行されることが好ましく、特定の位置とは即ち、1つのフレーム又は1つのフレームに対応する1つの時間部分の、好ましくは4つ、又は更には8つの異なる部分のうちの1つの中であり、このとき、この時間部分は、
図13の長い窓1500のような長い窓のサイズの半分に等しい。好ましくは、マルチオーバーラップ部分は、
図13に見てとれるように、先読み領域の開始208(
図2及び
図13に示す)の前に位置する。
【0130】
復号器側では、類似の処理が実施される。符号化済み第1フレームと符号化済み第2フレームとを含む符号化済みオーディオ信号821を復号化するための装置の一実施形態において、
図8bの復号化処理部824は、第1の符号化済みフレームと第2の符号化済みフレームとを処理して、スペクトル値の第1フレームとスペクトル値の第2フレームを得るために必要とされ、第1フレームと第2フレームとは、エイリアシング部分を含む。時間変換部826が復号化処理部824に接続されており、時間変換部826は、第1窓関数を使用してこの第1フレームに変換を適用して、サンプルの第1ブロックを得るよう構成されている。更に、時間変換部826は、第2窓関数を使用して第2フレームの第1部分に変換を適用し、1つ又は複数の第3窓関数を使用して第2フレームの第2部分に変換を適用して、サンプルの第2ブロックを得るよう構成されている。
図1aの文脈において説明したように、第1窓関数1500、第2窓関数1502及び1つ又は複数の第3窓関数1503は共に、マルチオーバーラップ領域1300を有する。
【0131】
更に、復号器は、逆畳み込み演算を使用してサンプルの第2ブロックを後処理して、後処理済みのサンプルの第2ブロックを得るための、後処理部828を備えており、その後処理済みのサンプルの第2ブロックの一部は、マルチオーバーラップ領域内で、サンプルの第1ブロックとオーバーラップしている。更に、後処理部828は、
図8a及び
図11aの文脈において説明された補助窓関数を使用して、後処理済みのサンプルの第2ブロックを窓掛けするよう構成されている。後処理部828は、窓掛けされた後処理済みのサンプルの第2ブロックと、サンプルの第1ブロックと、のオーバーラップ加算を実行して、
図8bの829又は
図1cのブロック175において示される復号化済みオーディオ信号を得る。従って、基本的に、
図8bの後処理部828は、補助窓関数に関連する合成窓掛け部172の機能及びオーバーラップ加算部174の機能を有することができる。
【0132】
続いて、時間変換部と協働した後処理部の機能を、
図11bの図解と関連して説明するが、この
図11bは、
図11aの符号器の図解に対する逆処理を示す。スペクトル値の第1フレーム1142がNサイズの逆変換部1161に入力され、第2フレームの第1部分1152がN/2の逆変換1162に入力され、第3窓関数の数に応じて、第2フレームの第2部分1155が、4つのN/8の短変換1163に入力されるか、又は、第2フレームの第1部分1152と同様に、単一のN/2変換1162に入力される。
【0133】
この処理は、時間変換部によって実施される。時間変換部は第1窓関数を更に使用して、
図11bの1170において示される、以前に実施された逆畳み込み演算と共に、窓掛けを実施する。更に、1172において示される第1部分1152に対する処理を適用するとき、第2窓関数が使用される。具体的には、第2窓関数の特に最右端部分1173の逆畳み込みと、第2の後続の窓掛けとが実施され、一方で、フレームの左手側では、いかなる内側逆畳み込みも実施されない。更に、その変換は、特定の逆畳み込みと後続の窓掛けと、更には、
図11bの1172において示されるように、第2フレームの第1部分1152とだけでなく、第2フレームの第2部分1155との追加的なオーバーラップ加算をも実施する。
図11bの部分図f)に示すように単一の第3窓関数のみがある場合、両側からの単一の逆畳み込み演算と、第2窓関数の右手部分及び第3窓関数の左手部分を使用した窓掛けと、オーバーラップ範囲1174内の後続のオーバーラップ加算とが実施される。
【0134】
その後、後処理部は、1172における処理の結果の第1部分対して、1175において示される逆畳み込み演算を使用した後処理を適用して、前フレーム内に伸びる部分1176a、及び、好ましくは次フレーム内に伸びる部分1176bを得る。その後、補助窓関数を使用した、逆畳み込みされた部分1176a、1176b、及び無論、現フレームiの中の部分に対して窓掛けが実施されて、1175において示される状態が得られる。その後、補助窓機能を用いて窓掛けされた、後処理済みのサンプルの第2ブロックとサンプルの第1ブロックとの最終的なオーバーラップ加算が、オーバーラップ範囲1180及びその中で実施されて、このオーバーラップ範囲1180に対応する最終的な復号化済みオーディオ信号が得られる。更に、この処理は、オーバーラップがないという事実に起因して、復号化済みオーディオ信号サンプルの後続部分1181をもたらし、また、フレームiに時間的に後続するフレームi+1のための窓関数の対応する部分とオーバーラップすることによって、次の区画1182が得られる。
【0135】
従って、
図10aに示されているように、復号器側の方法は、第1窓関数を使用して第1フレームに変換を適用するステップ1000と、第2窓関数を使用して第2フレームの第1部分に変換を適用するステップ1010と、第3窓関数(単数又は複数)を使用して第2フレームの第2部分に変換を適用するステップ1020とを含む。その後、ステップ1030において、逆畳み込み演算が実施され、ステップ1040において、補助窓関数を使用した窓掛けが実施され、最後に、ステップ1050において、窓掛けされた後処理済みの第2ブロックと第1ブロックとのオーバーラップ加算が実施されて、処理の終わりには、例えば、
図11bに示されている復号化済みオーディオ信号が得られる。
【0136】
図10bに示されるように、好適な実施形態は、第2フレームの各部分に対して逆DCT演算を実施するステップ、即ち、長い窓1500が使用された前フレームi−1と比較してより短い長さを用いる複数のDCT演算を実施するステップを含む。ステップ1070において、1172において示される演算として内側エイリアシング部分の逆畳み込みが実施され、その逆畳み込みは好ましくは、
図11bにおいて1172によって示されるライン内の垂直線と示されている対応する境界におけるミラーリングである。その後、ステップ1080において、ブロック1184内での第2窓関数及び第3窓関数を使用した窓掛けが実施され、そのブロック内での窓掛け結果の後続のオーバーラップ加算が、1090において示されように実施される。その後、192において示されるように、左/右の、又は、言い換えれば、オーバーラップ加算の結果の前/後のエイリアシング部分の逆畳み込みが実行されて、前フレーム内に伸びる部分1176a及び次フレーム内に伸びる部分1176bが得られる。しかしながら、1175における表現は、1094において示される補助窓関数を使用した窓掛けに後続するのみである。その後、ステップ1906において、サンプルの第1ブロックとのオーバーラップ加算が、補助窓関数を使用した窓掛けの後に実施される。
【0137】
続いて、
図12a及び
図12bを参照されたい。
図12a内の項目(a)は、
図11aの第1の行内の処理に対応する。サブグラフ(b)内の処理は、
図11aの第2の行及び第3の行内で実施される処理と対応し、
図12a内の項目(c)内に示される処理は、
図11aの最後の2行内の処理に対応する。同様に、復号器側の表現は、
図12bに対応する。特に、
図11bの最初の2行は、
図12b内のサブグラフ(f)に対応する。第3の行及び第4の行は、
図12b内の項目(e)に対応し、
図12b内の最後の行は、
図11b内の最後の行に対応する。
【0138】
図14aは、符号器側の窓シーケンス制御部、又は復号器側の構成要素824、826、828が、
図14aのような非マルチオーバーラップ状況と、
図14bに示されるマルチオーバーラップ状況と、の間を切替えるよう構成されている状況を示す。ここで、過渡部分0において過渡が検出されるとき、1つの処理は、マルチオーバーラップ部分を適用せずに、TCX−20窓から、単一オーバーラップの短い窓TCX−10に切り替えることである。しかし好ましくは、マルチオーバーラップ部分への切替えは、第1窓1400と、第2窓1402と、1つ又は
図14bの実施形態においては2つの第3窓1403と、を含む窓シーケンスを適用することによって実施される。
【0139】
図14bの窓のオーバーラップ及びサイズは、
図13の図解と幾らか異なるが、
図11aにおける符号器側又は
図11bにおける復号器側に関する一般的な処理は、同じ方法で行われることが明らかである。
【0140】
続いて、
図15を説明する。具体的には、
図15は、ブラックボックスとして、過渡検出先読み1590と、結果としてもたらされるプリエコーの継続時間1595を示す。
図15aは、長いスタート窓と、8個の短い窓と、長いストップ窓などと、を含む従来の高効率AACタイプのシーケンスを示す。必要となる先読みは長く、N+N/2+N/16にも及ぶが、プリエコー1595は小さい。同様に、
図15bは、長いシーケンスと、長いスタート窓と、低オーバーラップ窓と、長いストップ窓と、を含む窓シーケンスをもたらす従来のAAC低遅延タイプの過渡検出処理を示す。過渡検出先読みは
図15aと同じであるが、プリエコーの継続時間は
図15aにおける時間よりも長い。しかし他方、より多数の短い窓が使用されるほどビットレート効率がより低くなるという事実に起因して、効率はより高い。
【0141】
図15c及び
図15dは、N/16個のサンプルの低減された過渡検出先読みを有する高効率AAC又はAAC低遅延処理を示しており、N/16個のサンプルの低減された過渡検出先読みで可能な長いシーケンスしか示されていない。
図15dにおいて示すように、シーケンスが長い窓と長い窓と長いスタート窓と長いストップ窓等とから構成される場合、
図15cと比較してポストエコーのみが低減されるが、プリエコー1595は同じである。このように、
図15c、
図15dは、本発明の
図15e及び
図15fと同様の短い先読みを示す。ここで、
図15c及び
図15eにあるようなマルチオーバーラップ部分を実装する場合、それらの図面にあるようなシーケンスしか使用することができず、短い窓へのいかなる切替えも可能でない。従って、マルチオーバーラップ部分は、プリエコー/ポストエコーを低減するために短い窓へ切り替えること、又は、遅延を低減しかつプリエコー/ポストエコーを低減するために、より短い先読み遅延を使用するか若しくは両方の特徴を使用すること、を可能にする。
【0142】
図15eは、N/16個のサンプルからなる低減された過渡検出の先読みと、好適なマルチオーバーラップ領域1300と、を有する高効率AACシーケンスを示す。このシーケンスは、長い窓と、次の長い窓1500と、次のスタート
窓1502と、4つの短い
窓1503と、長いストップ窓1504とを含む。明らかになるように、先読みは小さく、プリエコーも小さい。
図15eの構成と同様の構成を示す
図15fに関しても同様の状況が得られるが、4つの短い
窓の代わりに、単一の第3窓関数のみが使用されている。
【0143】
本発明を実際の又は論理的ハードウエア要素を表すブロック図の文脈で説明してきたが、本発明はコンピュータ実装された方法によって構成することもできる。後者の場合には、ブロックは対応する方法ステップを表し、そこでは各ステップが対応する論理的又は物理的ハードウエアブロックによって実行される機能を表している。
【0144】
これまで装置の文脈で幾つかの態様を示してきたが、これらの態様は対応する方法の説明でもあることは明らかであり、そのブロック又は装置が方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップを説明する文脈で示した態様もまた、対応する装置の対応するブロックもしくは項目又は特徴を表している。方法ステップの幾つか又は全てが、例えばマイクロプロセッサ、プログラム可能なコンピュータ、又は電子回路のようなハードウエア装置によって(又は使用して)実行されてもよい。幾つかの実施形態では、最も重要なステップの幾つか又はそれ以上がそれら装置によって実行されてもよい。
【0145】
本発明の伝送又は符号化される信号は、デジタル記憶媒体に記憶されることができ、又はインターネットのような無線伝送媒体もしくは有線伝送媒体などの伝送媒体を通じて伝送されることができる。
【0146】
所定の構成要件にも依るが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働可能な)、デジタル記憶媒体、例えばフレキシブルディスク,DVD,ブルーレイ,CD,ROM,PROM,EPROM,EEPROM,フラッシュメモリなどのデジタル記憶媒体を使用して実行することができる。したがって、デジタル記憶媒体はコンピュータ読み取り可能であってもよい。
【0147】
本発明に従う幾つかの実施形態は、上述した方法の1つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有するデータキャリアを含む。
【0148】
一般的に、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として構成することができ、そのプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の一つを実行するよう作動可能である。そのプログラムコードは例えば機械読み取り可能なキャリアに記憶されていても良い。
【0149】
本発明の他の実施形態は、上述した方法の1つを実行するための、機械読み取り可能なキャリアに記憶されたコンピュータプログラムを含む。
【0150】
換言すれば、本発明の方法のある実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0151】
本発明の他の実施形態は、上述した方法の1つを実行するために記録されたコンピュータプログラムを含む、データキャリア(又はデジタル記憶媒体又はコンピュータ読み取り可能な媒体などの非一時的記憶媒体)である。そのデータキャリア、デジタル記憶媒体、又は記録された媒体は、典型的に有形及び/又は非一時的である。
【0152】
本発明の他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号列である。そのデータストリーム又は信号列は、例えばインターネットを介するデータ通信接続を介して伝送されるよう構成されても良い。
【0153】
他の実施形態は、上述した方法の1つを実行するように構成又は適応された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。
【0154】
他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
【0155】
本発明に従う他の実施形態は、ここで説明した方法の1つを実行するためのコンピュータプログラムを、受信器へ(例えば電子的に又は光学的に)伝送するよう構成された装置又はシステムを含む。受信器は、例えばコンピュータ、携帯機器、メモリーデバイス又はそれらの類似物であってもよい。装置又はシステムは、例えばコンピュータプログラムを受信器へと転送するファイルサーバを含んでもよい。
【0156】
幾つかの実施形態においては、(例えば書換え可能ゲートアレイのような)プログラム可能な論理デバイスが、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態では、書換え可能ゲートアレイは、上述した方法の1つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には任意のハードウエア装置によって実行される。
【0157】
上述した実施形態は、本発明の原理を単に例示的に示したに過ぎない。本明細書に記載した構成及び詳細について修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではなく、添付した特許請求の範囲によってのみ限定されるべきである。