(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0015】
以下では、本発明の実施形態における添付図を参照して、本発明の実施形態における技術的な解決策を明確かつ完全に説明する。明らかに、説明する実施形態は、本発明の実施形態の全てというよりむしろ、その一部である。本発明の実施形態に基づいて、創造的な努力をすることなく当業者により得られる他の全ての実施形態は、本発明の保護範囲内に属さなければならない。
【0016】
コーディング及びデコーディングによる技術的な解決策は、様々な電子機器に、例えば、モバイルフォン、ワイヤレス装置、パーソナルデータアシスタント(PDA)、ハンドヘルドコンピュータ又はポータブルコンピュータ、GPSレシーバ/ナビゲータ、カメラ、オーディオ/ビデオプレーヤー、カムコーダ、ビデオレコーダならびにモニタリングデバイスに、広く適用される。通常、このタイプの電子デバイスは、オーディオコーダ又はオーディオデコーダを含み、ここで、オーディオコーダ又はオーディオデコーダは、デジタル回路又はチップにより、例えばデジタル信号プロセッサ(DSP)により、直接実現されてもよく、或いはソフトウェアコードでプロセスを実行するためにプロセッサを駆動するソフトウェアコードにより、実現されてもよい。
【0017】
例として、オーディオコーディングによる技術的な解決策では、オーディオ時間ドメイン信号は、周波数ドメイン信号に最初に変換され、その後、符号化のために、コーディングビットがオーディオ周波数ドメイン信号に割り当てられる。符号化された信号は、通信システムによりデコーダに送信され、デコーダは符号化された信号を復号化して回復する。
【0018】
本発明では、ビット割り当ては、グループ化の理論及び信号特性に従って実行される。バンドは最初にグループ化され、グループのエネルギーは各グループの特性に従って重み付けされ、ビット割り当ては、重み付けされたエネルギーに従って各グループごとに実行され、ビットは、各グループ内の信号特性に従って各バンドに割り当てられる。ビットは最初にグループ全体に割り当てられるため、不連続な割り当ての現象が回避され、それにより、異なる信号のコーディング品質が改善される。加えて、ビットがグループ内で割り当てられるときに信号特性が考慮され、それにより、限られた数のビットが、知覚に影響する重要なオーディオバンドに割り当てられ得る。
【0019】
図1は、本発明の実施形態に係る、オーディオ信号中でビットを割り当てる方法のフローチャートである。
【0020】
101.オーディオ信号の周波数バンドを複数のサブバンドに分割し、そして各サブバンドのサブバンド正規化ファクターを量子化する。
【0021】
例として、以下の説明では、MDCT変換が使用される。MDCT変換は、周波数ドメイン係数を得るために入力オーディオ信号上で最初に実行される。ここでのMDCT変換は、ウィンドウ加算、時間ドメインエイリアシング及び離散DCT変換のようなプロセスを含んでもよい。
【0022】
例えば、サインウィンドウが入力時間ドメイン信号x(n)に追加される:
【数1】
ここで、n=0,...,2L−1であり、Lは信号のフレーム長を表し、(1)
そして得られたウィンドウ加算された信号は以下の通りになる:
【数2】
【0023】
その後、時間ドメインエイリアシング演算が実行される:
【数3】
【0024】
I
L/2及びJ
L/2は、それぞれL/2の次数による対角行列を表し、それぞれ以下の通りである:
【数4】
【0025】
時間ドメインエイリアシング信号上で離散DCT変換が実行され、そして最終的に周波数ドメインMDCT係数が得られる:
【数5】
【0026】
その後、周波数ドメイン包絡線がMDCT係数から抽出され、且つ量子化される。バンド全体は、異なる周波数ドメイン分解能を持ついくつかのサブバンドに分割され、且つ各サブバンドの正規化ファクターが抽出され、且つサブバンド正規化ファクターは量子化される。
【0027】
例えば、32kHzでサンプリングされたオーディオ信号にとって、その対応する周波数バンドは16kHzの帯域幅であり、そしてフレーム長が20ms(640サンプリングポイント)である場合に、バンドは、以下の44のサブバンドに分割されてもよい:
8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,
16,16,16,16,16,16,16,16,
24,24,24,24,24,24,24,24,24,24,24,24,
32,32,32,32,32,32,32,32。
【0028】
複数のサブバンドは、最初に複数のグループにグループ化され、そしてその後、複数のサブバンドはさらに各グループ内でグループ化され、そして各サブバンドの正規化ファクターは以下のように規定されてもよい:
【数6】
ここで、L
Pは、サブバンド中の係数の数を表し、s
Pは、サブバンドの開始点を表し、e
Pは、サブバンドの終了点を表し、Pは、サブバンドの合計数を表す。
【0029】
正規化ファクターが得られた後に、正規化ファクターは対数ドメインで量子化され、量子化されたサブバンド正規化ファクターwnormが得られてもよい。
【0030】
102.全サブバンドを複数のグループにグループ化し、そして各グループのグループパラメータを取得し、ここで、グループパラメータは対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すのに使用され、そして複数のグループのうちの1つのグループは1以上のサブバンドを含む。
【0031】
加えて、類似する特徴及びエネルギーを持つサブバンドは、1つのグループにグループ化されてもよい。例えば、同じ帯域幅を持つ複数のサブバンドは、1つのグループにグループ化されてもよい。好ましくは、同じ帯域幅を持つ隣接するサブバンドは、1つのグループにグループ化される。例えば、全サブバンドが4つのグループにグループ化されてもよい。その後、低ビットレートのケースでは、最初の2つのグループのみ又は最初の3つのグループのみが使用され、そして残りのグループに対してビット割り当ては実行されない。
【0032】
代替的に、サブバンドは、サブバンドの正規化エネルギーノルム間の関係に従ってグループ化されてもよい。すなわち、近似する複数のサブバンド正規化ファクターwnormを持つ複数のサブバンドは1つのグループにグループ化される。例えば、以下の方法を使用して、サブバンドのサブバンド正規化ファクターが近似するか否かを判断してもよい:サブバンドのサブバンド正規化ファクターwnorm[i](i=1,...,P−1、ここで、Pはサブバンドの総数である)と予め定められた閾値Kとを比較する。wnorm[i]が予め定められた閾値Kより大きい場合に、サブバンド数iが記録され、そして最終的に、予め定められた閾値Kより大きいサブバンド正規化ファクターwnorm[i]を持つ複数のサブバンドが1つのグループにグループ化され、そして残りの複数のサブバンドは別のグループにグループ化される。より多くのグループを得るために、異なる要件に従って、予め定められた複数の閾値が設定されてもよい、ということを理解すべきである。
【0033】
選択的に、近似する複数のサブバンド正規化ファクターを持つ隣接する複数のサブバンドもまた1つのグループにグループ化されてもよい。例えば、以下の方法を使用して、隣接する複数のサブバンドの複数のサブバンド正規化ファクターが近似するか否かを判断してもよい:隣接する複数のサブバンドの複数のサブバンド正規化ファクター間の差であるwnorm_diff[i]が最初に計算され、ここで、wnorm_diff[i]=abs(wnorm[i]−wnorm[i−1])かつi=1,...,P−1である。Pはサブバンドの総数である。wnorm_diff[i]が予め定められた閾値K’より小さい場合に、wnorm_diff[i]は、隣接するサブバンドのサブバンド正規化ファクターが近似していることを示し、これにより1つのグループにグループ化され得る隣接するサブバンド数を決定する。
【0034】
サブバンドのグループ化が完了すると、各グループのエネルギー属性を表すために、各グループのグループパラメータが取得されてもよい。一般に、グループパラメータは、以下のうちの1以上を含んでもよい:グループ内の複数のサブバンド正規化ファクターの合計group_wnorm、及びグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharp。
【0035】
特に、グループ内の複数のサブバンド正規化ファクターの合計であるgroup_sharpは、グループ内の全てのバンドのサブバンド正規化ファクターの合計であり、すなわち、
【数7】
である。ここで、S
iは、グループi中の開始サブバンドを表し、そしてE
iは、グループi中の終了サブバンドを表す。
【0036】
代替的に、グループ内の複数のサブバンド正規化ファクターのピーク対平均比であるgroup_sharpは、グループ内の複数のサブバンド正規化ファクターのピーク値の、グループ内の複数のサブバンド正規化ファクターの平均値に対する比である。
すなわち、
【数8】
であり、ここで、group_peak[i]は、グループi中のグループ内サブバンド正規化ファクターのピーク値を表し、そしてgroup_avg[i]は、グループi中のグループ内サブバンド正規化ファクターの平均値を表す。
【0037】
代替的に、グループ内の複数のサブバンド正規化ファクターのピーク値であるgroup_peakは、グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、すなわち、group_peak[i]=Max(wnorm[S
i],....,wnorm[E
i])であり、ここで、wnorm[S
i]は、グループi中の開始サブバンドのサブバンド正規化ファクターを表し、そしてwnorm[E
i]は、グループi中の終了サブバンドのサブバンド正規化ファクターを表す。
【0038】
代替的に、グループ内の複数のサブバンド正規化ファクターの平均値であるgroup_avgは、グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、すなわち、
【数9】
であり、ここで、wnorm[i]は、グループiのグループ内サブバンド正規化ファクターの合計を表し、S
iは、グループi中の開始サブバンドを表し、そしてE
iは、グループi中の終了サブバンドを表す。
【0039】
103.各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当て、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号中のコーディングビットの数である。
【0040】
先述のグループパラメータは、各グループのエネルギー属性を表すことから、グループパラメータに従って、オーディオ信号のビットを各グループに割り当てることができる。このように、不十分なビットレートのケースでは、グループ化の原則が使用され、且つ各グループのエネルギー属性が考慮され、それにより、オーディオ信号についてのビット割り当ては、さらに集中的になり、そしてフレーム間のビット割り当てはさらに連続的になる。グループパラメータは、先に列挙したものに限定されず、そしてグループのエネルギー属性を表し得る別のパラメータであってもよいことを理解すべきである。1つの実施形態では、不十分なビットレートのケースでは、ビットは、いくつかのグループにのみ割り当てられる。例えば、グループ内の複数のサブバンド正規化ファクターの合計が0であるグループに関して、ビットは何ら割り当てられない。別の例として、ビットの数が非常に少ないときに、何らビットを割り当てられないグループもある。すなわち、先述のグループパラメータが得られることに基づき、コーディングビットは、各グループのグループ内の複数のサブバンド正規化ファクターの合計に従って、少なくとも1つのグループに割り当てられてもよく、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号のコーディングビットの数である。
【0041】
さらに、複数のグループパラメータはまた、オーディオ信号のビットの各グループに対する割り当ての結果を最適化するように調整されてもよい。例えば、異なる複数の割り当て要件に従って、異なる複数のグループに関する複数のグループパラメータに異なる複数の重みが割り振られ、それにより、限られた数のビットが適切なグループに割り当てられる。その後、ビットはさらにこのグループ内で割り当てられ、それにより、ビット割り当てはもはや離散的ではなくなり、これは、オーディオ信号の符号化を円滑にする。
【0042】
以下で、実現方法の例を説明する。例えば、各グループのグループ内の複数のサブバンド正規化ファクターの合計group_wnorm及び各グループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharpが取得された後で、グループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharpに従って、グループ内の複数のサブバンド正規化ファクターの合計group_wnormが重み付けされて、グループ内の複数のサブバンド正規化ファクターの重み付けされた合計group_wnorm_wが得られてもよい。
【0043】
具体的には、第1のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharp[i]は、第2のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharp[i−1]と比較される。第1のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比と、第2のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1のグループのグループ内の複数のサブバンド正規化ファクターの合計は、第1の重み付けファクターに従って調整され、第2のグループのグループ内の複数のサブバンド正規化ファクターの合計は、第2の重み付けファクターに従って調整され、逆もまた同様である。すなわち、第2のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比と、第1のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比との間の比較が、第2の閾値より大きい場合に、第2のグループのグループ内の複数のサブバンド正規化ファクターの合計は、第1の重み付けファクターに従って調整され、そして第1のグループのグループ内の複数のサブバンド正規化ファクターの合計は、第2の重み付けファクターに従って調整される。
【0044】
例えば、group_sharp[i]−group_sharp[i−1]>aである場合に、group_wnorm_w[i]=b x group_wnorm[i]であり、又はgroup_sharp[i−1]−group_sharp[i]>cである場合に、group_wnorm[i−1]=b x group_wnorm[iー1]であり、ここで、グループ数i=1,...,P−1であり、Pはサブバンドの総数であり、bは重みであり、aは第1の閾値であり、そしてcは第2の閾値である。a、b及びcは、ビット割り当て要件に従って選択されてもよいことを理解すべきである。
【0045】
ここでは、簡潔な重み付け方法のみを例示的に説明している。当業者は、異なる重み付けファクターを使用することによりサブバンドの重みを調整するための、別の重み付け方法を容易に使用できるであろう。例えば、より多くの信号ビットを割り当てる必要があるサブバンドの重みは増やされてもよく、そして信号ビットを割り当てる必要のない、又はわずかな信号ビットのみを割り当てる必要があるサブバンドの重みは減らされてもよい。
【0046】
その後、オーディオ信号のビットは、グループ内サブバンド正規化ファクターの重み付けされた合計に従って、各グループに割り当てられる。例えば、グループに対するビットの数は、グループ内サブバンド正規化ファクターの合計group_wnorm[i]の、全サブバンドのサブバンド正規化ファクターの合計sum_wnormに対する比に従って決定され、オーディオ信号のビットは、グループに対する決定されたビット数に従って、グループに割り当てられる。各グループのビットの総数group_bitsは、以下の式を使用することにより決定される:group_bits[i]=sum_bits x group_wnorm[i]/sum_wnorm。ここで、sum_bitsは、割り当てられる必要のあるオーディオ信号のビットの総数を表し、sum_wnormは、全サブバンドのサブバンド正規化ファクターの合計を表す。
【0047】
ビットがグループに割り当てられた後に、各グループに割り当てられた複数のコーディングビットは、グループ中の複数のサブバンドにさらに割り当てられてもよい。
【0048】
104.少なくとも1つのグループに割り当てられた複数のコーディングビットを、少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、少なくとも1つのグループの各グループ中の各サブバンドに割り当てる。
【0049】
既存の反復及びサイクリック割り当て方法は、各グループ中のサブバンドにビットを割り当てるのに使用されてもよいことを理解すべきである。しかし、反復及びサイクリック割り当て方法は、各グループ中のビット割り当て結果が非常にランダムであり、且つ以前のフレーム及び後続するフレームが不連続であることを依然として引き起こす。そのため、オーディオ信号のビットであり、且つグループに割り当てられるビットは、異なるオーディオ信号の信号特性、すなわち、異なる信号タイプを参照して、且つグループ中の複数のサブバンド正規化ファクターに従って、グループ中の複数のサブバンドに割り当てられてもよい。
【0050】
加えて、本発明の本実施形態において、不十分なビットレートのケースでは、限られた数のビットがグループ中の全サブバンドに割り当てられる場合に、ビット割り当て効果が影響を受ける。そのため、グループ中でビットが割り当てられることがあるサブバンドの数band_numが最初に決定されてもよい。その後、オーディオ信号のビットであり、且つグループに割り当てられるビットが、オーディオ信号のタイプ及びグループ中のサブバンド正規化ファクターに従って、グループ中でビットが割り当てられるサブバンドに割り当てられ、ここで、グループ中でビットが割り当てられるサブバンドの数は、サブバンドの数band_numに等しい。
【0051】
各グループ中でビットが最初に割り当てられるサブバンドの数は、グループに対するビットの数及び第3の閾値に従って決定されてもよく、ここで、第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表す。例えば、13ビットがグループに割り当てられ、かつ第3の閾値が7ビットである場合に、グループ中でビットが最初に割り当てられるサブバンドの数は2である。その後、グループ中でビットが割り当てられるサブバンドの数band_numは、グループ中でビットが最初に割り当てられるサブバンドの数及びグループ中のサブバンドの総数に従って決定される。
【0052】
例えば、グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、band_numの値は、グループ中のサブバンドの総数であることが決定され、グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数と、スケールファクターkとの積より小さい場合に、band_numの値は、グループ中でビットが最初に割り当てられるサブバンドの数である。ここでのスケールファクターkは、実験的ファクターであり、0.75又は別の数値であってもよい。グループ中でビットが割り当てられるサブバンドの数band_numを、グループ中でビットが割り当てられるサブバンドの数及びグループ中のサブバンドの総数のうちの少ない方のサブバンド数とすることで、プロセスが簡潔にされてもよい。
【0053】
その後、ビットは、グループ中のオーディオ信号のタイプに従って、且つグループ中のサブバンド正規化ファクターを参照して、band_num個のサブバンドに割り当てられ、ここで、band_numは、グループ中でビットが割り当てられるサブバンドの数である。グループ中のオーディオ信号のタイプは、グループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharpに従って決定されてもよい。グループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharpに従って、オーディオ信号が正規(normal)信号であることが決定された場合に、既存の反復及びサイクリック割り当て方法を使用して、グループに対するビット割り当てが実行されてもよい。そしてグループのオーディオ信号が高調波(harmonic)信号であると決定された場合に、既存の反復及びサイクリック割り当て方法を使用して、グループに対するビット割り当てが実行されてもよく、或いは以下の方法a又は方法bを使用してビット割り当てが実行されてもよい。
【0055】
ステップ1:グループ中の全サブバンドの複数のサブバンド正規化ファクターを降順で配列し、そして最初のN個のサブバンドを選択する。ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numである。
【0056】
ステップ2:N個のサブバンドのビット数を1に初期化し、そして周期動作の数jを0に初期化する。
【0057】
ステップ3:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドのサブバンド正規化ファクターの総数band_wnormを決定する。
【0058】
ステップ4:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドに対して、ビット数を割り当てる。
【0059】
ステップ5:N個のサブバンドの最後のサブバンドに割り当てられるビットの数が固定の閾値facより小さいか否かを決定し、そしてN個のサブバンドの最後のサブバンドに割り当てられるビットの数が固定の閾値facより小さい場合に、サブバンドに割り当てられるビットの数を0に設定する。
【0060】
ステップ6:周期動作の数jに1を加える。
【0061】
ステップ3〜ステップ6は、周期動作の数jがNに等しくなるまで繰り返される。
【0062】
ステップ7:グループ中の全サブバンドのオリジナルの配列順を回復する、すなわち、各サブバンドのサブバンド正規化ファクターが量子化される前の全サブバンドの配列順を回復する。
【0064】
ステップ1:グループ中の全サブバンドのサブバンド正規化ファクターを降順で配列し、そして最初のN個のサブバンドを選択する。ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numである。
【0065】
ステップ2:N個のサブバンドのビットの数を1に初期化し、周期動作の数jを0に初期化し、且つ割り当てられるビットの数bit_sumを0に初期化する。
【0066】
ステップ3:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドのサブバンド正規化ファクターの総数band_wnormを決定する。
【0067】
ステップ4:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドに対して、ビット数を割り当てる。
【0068】
ステップ5:N個のサブバンドに割り当てられるビットの数が固定の閾値facより小さいか否かを決定し、そしてN個のサブバンドに割り当てられるビットの数が固定の閾値facより小さい場合に、N個のサブバンドに割り当てられるビットの数を0に設定する。
【0069】
ステップ6:全N個のサブバンドに割り当てられるビットの総数temp_sumを計算する。
【0070】
ステップ7:反復の数jに1を加える。
【0071】
ステップ8:temp_sumがbit_sumに等しいか否かを決定する。temp_sumがbit_sumに等しい場合に、ステップ10を実行する。グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数と、スケールファクターkとの積より大きい場合には、続けてステップ9を実行する。
【0072】
ステップ9:bit_sumを更新し、且つtemp_sumの値をbit_sumに割り振る。
【0073】
ステップ3〜ステップ9は、周期動作の数jがNに等しくなるまで繰り返される。
【0074】
ステップ10:グループ中の全サブバンドのオリジナルの配列順を回復する。
【0075】
グループ中でビット割り当てを実行するために、先の方法a又は方法bの他に、別の方法も使用されてもよいことを理解すべきである。加えて、方法a及び方法bはまた、band_numを決定する方法、すなわち、異なるオーディオ信号特性を参照して、グループ中で割り当てを実行することと組み合わされてもよい。例えば、グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、方法aが使用され、グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数と、スケールファクターkとの積より小さい又は等しい場合に、方法bが使用される。
【0076】
結論として、グループ中のサブバンドにビットを割り当てるプロセスは、以下の通りである:最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドが、グループ中の全サブバンドから選択され、且つ割り当てに対するターゲットサブバンドとして使用され、ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numであり、その後、ビットの数は、N個のサブバンドのサブバンド正規化ファクターに従って、N個のサブバンドに順番に割り当てられ、そして最後に、グループ中の全サブバンドがオリジナルの配列順に回復される。
【0077】
異なるオーディオ信号の信号特性に従って、信号が聞こえ得る又は知覚され得るバンドにビットを効果的に割り当てることができる。例えば、強い高調波を持つバンドに対して、ビットは高調波を持つ全バンドに割り当てられる必要があり、そして比較的均等なスペクトルエネルギーを持つ信号に対して、ビットは均等に割り当てられる必要がある。
【0078】
先のグループ化の方法を参照して、グループはさらにセグメント化されてもよく、すなわち、グループ中のサブバンドは複数のサブグループにさらにグループ化されてもよく、そして各サブグループのサブグループパラメータが取得され、そしてその後、グループに割り当てられたビットは、各サブグループのサブグループパラメータに従って各サブグループに割り当てられる。最後に、オーディオ信号のビットであり、且つ各サブグループに割り当てられたビットは、サブバンド正規化ファクターに従って、各サブグループ中の各サブバンドに割り当てられる。1つの可能性として、各グループ中に1つのバンドのみになるまで、サブバンドは連続的にグループ化される。
【0079】
本発明の本実施形態におけるグループ化の方法を使用することにより、以前のフレーム及び後続するフレームの比較的安定した割り当てが確保され、異なる重点を持つビット割り当ては、信号特性に従ってグループ内で実行され、それにより、割り当てられるビットは全て、重要なスペクトル情報の量子化に使用され、これにより、オーディオ信号のコーディング品質が改善される。
【0080】
上述のことから、本発明の本実施形態に従うオーディオ信号中でビットを割り当てる方法は、グループ化手段により、以前のフレーム及び後続するフレームの比較的安定した割り当てを確保し、且つ全体的な割り当てにより引き起こされる部分的な不連続の影響を減少させる、ということを知ることができる。加えて、異なる閾値パラメータが、各グループ中のビット割り当てに対して設定されてもよく、それにより、ビットはさらに適切に割り当てられる。スペクトル信号特性に従って、グループ内で、異なる重点を持つビット割り当てが実行される。例えば、比較的集中したスペクトルを持つ擬似高調波信号に対して、ビットは、高エネルギーを持つサブバンドに主に割り当てられ、さらに多くのビットが高調波間サブバンドに割り当てられる必要はなくなる。そして比較的平坦なスペクトルを持つ信号に対して、サブバンド間の平坦さは、ビット割り当ての間、可能な限り保証される。これは、割り当てられるビットが全て、重要なスペクトル情報を量子化するために使用されることを保証する。
【0081】
図2を参照して、以下で、本発明の実施形態に係る、オーディオ信号中でビットを割り当てる装置の概略的な構造を説明する。
【0082】
図2では、オーディオ信号中でビットを割り当てる装置20は、サブバンド量子化ユニット21、グループ化ユニット22、第1の割り当てユニット23及び第2の割り当てユニット24を備える。
【0083】
サブバンド量子化ユニット21は、オーディオ信号の周波数バンドを複数のサブバンドに分割し、且つ各サブバンドのサブバンド正規化ファクターを量子化するように構成される。
【0084】
グループ化ユニット22は、複数のサブバンドを複数のグループにグループ化し、各グループのグループパラメータを取得するように構成され、ここで、複数のグループのうちの1つのグループは、1以上のサブバンドを含み、そしてグループパラメータは対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すのに使用される。
【0085】
第1の割り当てユニット23は、各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるように構成され、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号中のコーディングビットの数である。
【0086】
選択的に、グループ化ユニット22は、同じ帯域幅を持つサブバンドを1つのグループにグループ化するように構成されてもよく、それにより、複数のサブバンドが複数のグループにグループ化される。代替的に、グループ化ユニット22は、近似する複数のサブバンド正規化ファクターを持つ複数のサブバンドを1つのグループにグループ化するように構成されてもよく、それにより、複数のサブバンドが複数のグループにグループ化される。一般に、各グループ中のサブバンドは隣接していてもよい。
【0087】
選択的に、グループ化ユニット22は、各グループのグループ内の複数のサブバンド正規化ファクターの合計及び各グループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比を取得するように構成され、ここで、グループ内サブバンド正規化ファクターの合計は、グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、そしてグループ内サブバンド正規化ファクターのピーク対平均比は、グループ内サブバンド正規化ファクターの平均値に対するグループ内サブバンド正規化ファクターのピーク値の比であり、ここで、グループ内サブバンド正規化ファクターのピーク値は、グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、そしてグループ内サブバンド正規化ファクターの平均値は、グループ中の全サブバンドのサブバンド正規化ファクターの平均値である。
【0088】
さらに、グループ化ユニット22は、各グループのグループ内の複数のサブバンド正規化ファクターの重み付けされた合計を得るために、各グループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比に従って、各グループのグループ内の複数のサブバンド正規化ファクターの合計を重み付けするようにさらに構成される。
【0089】
選択的に、グループ化ユニット22は、第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比とを比較するように構成され、そして第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と、第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1のグループのグループ内サブバンド正規化ファクターの合計は、第1の重み付けファクターに従って調整され、第2のグループのグループ内サブバンド正規化ファクターの合計は、第2の重み付けファクターに従って調整される。
【0090】
選択的に、第1の割り当てユニット23は、各グループのグループ内の複数のサブバンド正規化ファクターの合計に従って、少なくとも1つのグループにコーディングビットを割り当てるように構成され、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号のコーディングビットの数である。代替的に、第1の割り当てユニット23は、グループ内サブバンド正規化ファクターの重み付けされた合計に従って、少なくとも1つのグループにコーディングビットを割り当てるように構成され、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号のコーディングビットの数である。代替的に、第1の割り当てユニット23は、グループのグループ内サブバンド正規化ファクターの重み付けされた合計の、グループ中の全サブバンドのサブバンド正規化ファクターの合計に対する比に従って、グループに対するビットの数を決定し、且つグループのビット数に従って、オーディオ信号のコーディングビットをグループに割り当てるように、構成されてもよい。
【0091】
第2の割り当てユニット24は、少なくとも1つのグループに割り当てられたコーディングビットを、少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、少なくとも1つのグループの各グループ中の各サブバンドに割り当てるように構成される。
【0092】
さらに、第2の割り当てモジュール24は、決定モジュール241及び割り当てモジュール242を含んでもよい。決定モジュール241は、グループ中でビットが割り当てられるサブバンドの数band_numを決定するように構成され、割り当てモジュール242は、グループ中のサブバンド正規化ファクターに従って、オーディオ信号のビットであり、且つグループ中でビットが割り当てられるサブバンドに割り当てられるビット、を割り当てるように構成され、ここで、グループ中でビットが割り当てられるサブバンドの数は、グループ中でビットが割り当てられるサブバンドの数band_numに等しい。
【0093】
選択的に、決定モジュール241は、グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定し、ここで、第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、且つグループ中でビットが最初に割り当てられるサブバンドの数とグループ中のサブバンドの総数との間のより小さい値が、グループ中でビットが割り当てられるサブバンドの数band_numであることを決定するように構成されてもよい。
【0094】
代替的に、決定モジュール241は、グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定し、ここで、第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、スケールファクターkは、グループ中のサブバンドの総数を調整するために使用され;グループ中でビットが割り当てられるサブバンドの数を、グループ中のサブバンドの総数とスケールファクターkとの積と比較し;グループ中でビットが割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より小さい場合に、グループ中でビットが割り当てられるサブバンドの数が、最初にビットが割り当てられるサブバンドの数であることを決定し;グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、グループ中でビットが割り当てられるサブバンドの数が、グループ中のサブバンドの総数であることを決定するように構成されてもよい。
【0095】
選択的に、割り当てモジュール242は、グループ中の全サブバンドから、割り当てに対するターゲットサブバンドとして最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドを選択し、ここで、Nはグループ中でビットが割り当てられるサブバンドの数であり;N個のサブバンドのサブバンド正規化ファクターに従って、N個のサブバンドに順番にビットの数を割り当て;且つグループ中の全サブバンドのオリジナルの配列順を回復するように構成されてもよい。
【0096】
例えば、割り当てモジュール242は、具体的には、以下のステップを実行する:
【0097】
ステップ1:グループ中の全サブバンドのサブバンド正規化ファクターを降順で配列し、そして最初のN個のサブバンドを選択する。ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numである。
【0098】
ステップ2:N個のサブバンドのビットの数を1に初期化し、周期動作の数jを0に初期化する。
【0099】
ステップ3:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドのサブバンド正規化ファクターの総数band_wnormを決定する。
【0100】
ステップ4:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドにビットの数を割り当てる。
【0101】
ステップ5:N個のサブバンドの最後のサブバンドに割り当てられるビットの数が固定の閾値facより小さいか否かを決定し、N個のサブバンドの最後のサブバンドに割り当てられるビットの数が固定の閾値facより小さい場合に、サブバンドに割り当てられるビットの数を0に設定する。
【0102】
ステップ6:周期動作の数jに1を加える。
【0103】
ステップ3〜ステップ6は、周期動作の数jがNに等しくなるまで繰り返される。
【0104】
ステップ7:グループ中の全サブバンドのオリジナルの配列順を回復する。
【0105】
選択的に、割り当てモジュール242は、以下の具体的な複数のステップを実行するように構成されてもよい:
【0106】
ステップ1:グループ中の全サブバンドのサブバンド正規化ファクターを降順で配列し、そして最初のN個のサブバンドを選択する。ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numである。
【0107】
ステップ2:N個のサブバンドのビットの数を1に初期化し、周期動作の数jを0に初期化し、そして割り当てられるビットの数bit_sumを0に初期化する。
【0108】
ステップ3:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つ複数のサブバンドの複数のサブバンド正規化ファクターの総数band_wnormを決定する。
【0109】
ステップ4:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドにビット数を割り当てる。
【0110】
ステップ5:N個のサブバンドに割り当てられるビットの数が固定の閾値facより小さいか否かを決定し、N個のサブバンドに割り当てられるビットの数が固定の閾値facより小さい場合に、N個のサブバンドに割り当てられるビットの数を0に設定する。
【0111】
ステップ6:全N個のサブバンドに割り当てられるビットの総数temp_sumを計算する。
【0112】
ステップ7:周期動作の数jに1を加える。
【0113】
ステップ8:temp_sumがbit_sumに等しいか否かを決定する。temp_sumがbit_sumに等しい場合に、ステップ10を実行する。グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数と、スケールファクターkとの積より大きい場合に、続けてステップ9を実行する。
【0114】
ステップ9:bit_sumを更新し、temp_sumの値をbit_sumに割り振る。
【0115】
ステップ3〜ステップ9は、周期動作の数jがNに等しくなるまで繰り返される。
【0116】
ステップ10:グループ中の全サブバンドのオリジナルの配列順を回復する。
【0117】
加えて、
図2に示す本発明の本実施形態に従ってオーディオ信号中でビットを割り当てる装置において、第1の割り当てユニット23は、グループ中のサブバンドを複数のサブグループにさらにグループ化し、且つ各サブグループのサブグループパラメータを取得し;そしてその後、第1の割り当てユニット23は、各サブグループのサブグループパラメータに従って、グループに割り当てられたビットを各サブグループに割り当てる。その後、第2の割り当てユニット24は、オーディオ信号のビットであり、且つ各サブグループに割り当てられたビットを、サブバンド正規化ファクターに従って、各サブグループ中の各サブバンドに割り当てるように構成される。
【0118】
上記のことから、本発明の本実施形態に従ってオーディオ信号中でビットを割り当てる装置が、グループ化手段により、以前のフレーム及び後続するフレームの比較的安定した割り当てを保証し、全体的な割り当てにより引き起こされる部分的な不連続の影響を減少させることを知ることができる。加えて、異なる閾値パラメータが、各グループ中のビット割り当てに対して設定されてもよく、それにより、ビットはさらに適切に割り当てられる。スペクトル信号特性に従って、グループ内で、異なる重点を持つビット割り当てが実行される。例えば、比較的集中したスペクトルを持つ擬似高調波信号に対して、ビットは、高エネルギーを持つサブバンドに主に割り当てられ、さらに多くのビットが高調波間サブバンドに割り当てられる必要はなくなる。そして比較的平坦なスペクトルを持つ信号に対して、サブバンド間の平坦さは、ビット割り当ての間、可能な限り保証される。これは、割り当てられるビットが全て、重要なスペクトル情報を量子化するために使用されることを保証する。
【0119】
当業者は、本明細書中で開示する実施形態で説明した例と組み合わせて、ユニット及びアルゴリズムステップが、電子ハードウェアにより、又はコンピュータソフトウェア及び電子ハードウェアの組み合わせにより、実施されてもよいことに気付くかもしれない。ハードウェア又はソフトウェアにより機能が実施されるか否かは、技術的な解決策の特定の適用及び設計の制約条件に依存する。当業者は、各特定の適用に対して説明した機能を実施するために異なる方法を使用してもよいが、当該実施が本発明の範囲を超えると見なすべきではない。
【0120】
便宜上、及び簡単な説明のために、上述のシステム、装置及びユニットの詳細な作動プロセスに関して、上述の方法の実施形態における対応するプロセスが参照されてもよく、そして詳細はここで再度説明されないことが当業者により明確に理解されてもよい。
【0121】
本適用で提供される複数の実施形態では、開示したシステム、装置及び方法が他の方法で実現されてもよいことを理解すべきである。例えば、説明した装置の実施形態は単に例である。例えば、ユニットの分割は、単に機能の分割であり、実際の実装においては他の分割であってもよい。例えば、複数のユニット又はコンポーネントは、組み合わされてもよく、又は別のシステムに一体化されてもよく、或いはいくつかの特徴は無視されてもよく、又は実行されなくてもよい。加えて、表示した又は議論した相互結合或いは離散結合又は通信接続は、いくつかのインターフェースを通して実現されてもよい。装置又はユニット間の間接的な結合又は通信接続は、電子的、機械的又は他の形態で実現されてもよい。
【0122】
別個のパーツとして説明したユニットは、物理的に分離されていてもよく、又は分離されていなくてもよく、ユニットとして表示されるパーツは、物理的なユニットであってもよく、又はそうでなくてもよく、1つのポジションに配置されてもよく、又は複数のネットワークユニットに分散されてもよい。ユニットの一部又は全ては、本発明の解決策の目的を達成するために実際の必要性に従って選択されてもよい。
【0123】
加えて、本発明の実施形態における機能ユニットは、1つの処理ユニットに一体化されてもよく、又はユニットのそれぞれが物理的に単独で存在してもよく、又は2以上のユニットが1つのユニットに一体化される。
【0124】
ソフトウェア機能ユニットの形態で機能が実現され、個別の製品として販売又は使用される場合に、機能はコンピュータ読取可能記憶媒体に記憶されてもよい。このような理解に基づいて、本質的に、本発明の技術的な解決策は、又は先行技術に寄与する部分は、又は技術的な解決策の一部は、ソフトウェア製品の形態で実現されてもよい。ソフトウェア製品は記憶媒体に記憶され、コンピュータデバイス(パーソナルコンピュータ、サーバ又はネットワークデバイスであってもよい)に、本発明の実施形態で説明した方法のステップの全て又は一部を実行するように命令するための複数の命令を含む。先述の記憶媒体は、以下を含む:USBフラッシュドライブ、リムーバブルハードディスク、リードオンリーメモリ(ROM、Read−Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、磁気ディスク又は光ディスクのような、プログラムコードを記憶できる任意の媒体。
【0125】
図3は、本発明の実施形態に係る、オーディオ信号中でビットを割り当てる装置30の別の実施形態の概略的なブロック図である。装置30は、プロセッサ31、メモリ32、入力デバイス33、出力デバイス34、及びこれらに類するものを含み、これらは、バスの手段により互いに通信する。プロセッサ31は、メモリ32中に記憶されたプログラムを呼び出し、オーディオ信号中でビットを割り当てる方法の先述の実施形態の全ステップを実行できる。
【0126】
プロセッサ31は、メモリ32中に記憶された本発明の実施形態のプログラムを実行し、バスの手段により、別の装置との双方向通信を実現するように構成されている。
【0127】
メモリ32は、RAM及びROM、或いは任意の固定記憶媒体又は移動可能な記憶媒体を含んでもよく、本発明の実施形態を実行し得るプログラム又は本発明の実施形態において処理されることがあるデータを記憶するように構成されている。
【0128】
メモリ32及びプロセッサ31は、本発明の実施形態が適用される物理モジュールに一体化されてもよく、ここで、本発明の実施形態を実現するプログラムは、物理モジュールに記憶され、物理モジュール上で実行される。
【0129】
入力デバイス33は、キーボード及びマウスのような、任意の適切なデバイスを含んでもよく、ユーザからの入力又は別のデバイスからの入力を受信し、そして受信した入力をプロセッサ31に送るように構成されている。
【0130】
出力デバイス34は、オーディオ信号に関するビットの割り当ての結果を出力するように構成されており、これは、ディスプレイ、プリンタ又はこれらに類するものであってもよい。
【0131】
先述の説明は、単に、本発明の特定の実現方法であり、本発明の保護範囲を制限するように意図されていない。本発明に開示した技術的な範囲内にある、当業者により容易に考案されるいかなる変更又は置換も、本発明の保護範囲内に属さなければならない。従って、本発明の保護範囲は、複数の特許請求項の保護範囲に従わなければならない。 以下の付記をする。
(付記1) オーディオ信号中でビットを割り当てる方法であって、
オーディオ信号の周波数バンドを複数のサブバンドに分割し、且つ各サブバンドのサブバンド正規化ファクターを量子化するステップと、
前記複数のサブバンドを複数のグループにグループ化し、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含み、且つ各グループのグループパラメータを取得するステップであって、前記グループパラメータは、前記対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すために使用される、ステップと、
前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップであって、前記少なくとも1つのグループに割り当てられるコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、ステップと、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるステップと
を含む、方法。
(付記2) 前記各グループのグループパラメータを取得するステップは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するステップを含み、
前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、且つ前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、且つ前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、且つ
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記各グループのグループ内サブバンド正規化ファクターの合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるステップを含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記1に記載の方法。
(付記3) 前記各グループのグループパラメータを取得するステップは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するステップであって、前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、且つ前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、且つ前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値である、ステップと、
各グループのグループ内サブバンド正規化ファクターの重み付けされた合計を得るために、前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするステップと
を含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるステップを含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記1に記載の方法。
(付記4) 前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするステップは、
第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比とを比較するステップと、
前記第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と、前記第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1の重み付けファクターに従って前記第1のグループのグループ内サブバンド正規化ファクターの合計を調整するステップと、第2の重み付けファクターに従って第2のグループのグループ内サブバンド正規化ファクターの合計を調整するステップと
を含む、付記3に記載の方法。
(付記5) 前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記グループ中の全サブバンドのサブバンド正規化ファクターの合計に対する、前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計の比に従って、前記グループに対するビットの数を決定するステップと、前記グループに対するビットの数に従って、前記グループに前記オーディオ信号のビットを割り当てるステップとを含む、付記3又は4のいずれか一項に記載の方法。
(付記6) 前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに前記少なくとも1つのグループに割り当てられたコーディングビットを割り当てるステップは、
前記グループ中でビットが割り当てられるサブバンドの数を決定するステップと、
前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号のコーディングビットであり、且つ前記グループに割り当てられたコーディングビットを、前記グループ中でビットが割り当てられるサブバンドに割り当てるステップと
を含み、
前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中でビットが割り当てられるサブバンドの数に等しい、付記1から5のいずれか一項に記載の方法。
(付記7) 前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループに対するビットの数及び第3の閾値に従って、前記グループ中でビットが最初に割り当てられるサブバンドの数を決定するステップであって、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表す、ステップと、
前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップと
を含む、付記6に記載の方法。
(付記8) 前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数との間のより小さい値が、前記グループ中でビットが割り当てられるサブバンドの数であることを決定するステップを含む、付記7に記載の方法。
(付記9) 前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループ中でビットが最初に割り当てられるサブバンドの数を、前記グループ中のサブバンドの総数とスケールファクターkとの積と比較するステップであって、前記スケールファクターkは、前記グループ中のサブバンドの総数を調整するために使用される、ステップと、
前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数と前記スケールファクターkとの積より小さい場合に、前記グループ中でビットが割り当てられるサブバンドの数は、グループ中でビットが最初に割り当てられるサブバンドの数であることを決定し、前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数と前記スケールファクターkとの積より大きい場合に、前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中のサブバンドの総数であることを決定するステップと
を含む、付記7に記載の方法。
(付記10) 前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号であり、及び前記グループに割り当てられたコーディングビットを、前記グループ中でビットが割り当てられるサブバンドに割り当てるステップは、
最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドを、割り当てに対するターゲットサブバンドとして、前記グループ中の全サブバンドから選択するステップであって、前記Nはグループ中でビットが割り当てられるサブバンドの数である、ステップと、
前記N個のサブバンドのサブバンド正規化ファクターに従って、前記N個のサブバンドにビットの数を順番に割り当てるステップと
を含む、付記6から9のいずれか一項に記載の方法。
(付記11) 前記少なくとも1つのグループに割り当てられるコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングを割り当てるステップは、
前記グループ中のサブバンドを複数のサブグループに分割し、且つ各サブグループのサブグループパラメータを取得するステップと、
前記各サブグループのサブグループパラメータに従って、前記グループに割り当てられたビットを各サブグループに割り当てるステップと
を含み、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるステップは、
前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、且つ前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるステップを含む、付記1に記載の方法。
(付記12) 前記複数のサブバンドを複数のグループにグループ化するステップは、
同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ、又は
近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ
を含む、付記1から11のいずれか一項に記載の方法。
(付記13) 前記複数のグループの各グループ中のサブバンドは隣接している、付記12に記載の方法。
(付記14) オーディオ信号中でビットを割り当てる装置であって、
オーディオ信号の周波数バンドを複数のサブバンドに分割し、各サブバンドのサブバンド正規化ファクターを量子化するように構成されているサブバンド量子化ユニットと、
前記複数のサブバンドを複数のグループにグループ化し、各グループのグループパラメータを取得するように構成されているグループ化ユニットであって、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含み、前記グループパラメータは、前記対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すために使用される、グループ化ユニットと、
前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるように構成されている第1の割り当てユニットであって、前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、第1の割り当てユニットと、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるように構成されている第2の割り当てユニットと
を備える、装置。
(付記15) 前記グループ化ユニットは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するように構成され、
前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、
前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるように構成され、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記14に記載の装置。
(付記16) 前記グループ化ユニットは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するように構成され、前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、
各グループのグループ内サブバンド正規化ファクターの重み付けされた合計を得るために、前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするように構成され、
前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるように構成され、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である付記14に記載の装置。
(付記17) 前記グループ化ユニットは、
第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比とを比較するように特に構成されるとともに、
前記第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と、前記第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1の重み付けファクターに従って、前記第1のグループのグループ内サブバンド正規化ファクターの合計を調整し、第2の重み付けファクターに従って、前記第2のグループのグループ内サブバンド正規化ファクターの合計を調整するように特に構成されている付記16に記載の装置。
(付記18) 前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計の、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計に対する比に従って、前記各グループに対するビットの数を決定するように特に構成されるとともに、前記グループのビット数に従って、オーディオ信号のビットをグループに割り当てるように、特に構成されている付記17に記載の装置。
(付記19) 前記第2の割り当てユニットは、
前記グループ中でビットが割り当てられるサブバンドの数を決定するように構成されている決定モジュールと、
前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号であり、及びグループ中でビットが割り当てられるサブバンドに割り当てられるコーディングビットを割り当てるように構成されている割り当てモジュールと
を含み、
前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中でビットが割り当てられるサブバンドの数に等しい付記14から18のいずれか一項に記載の装置。
(付記20) 前記決定モジュールは、
前記グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定するように特に構成され、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、
グループ中でビットが最初に割り当てられるサブバンドの数とグループ中のサブバンドの総数との間のより小さい値が、グループ中でビットが割り当てられるサブバンドの数であることを決定するように特に構成される、
付記19に記載の装置。
(付記21) 前記決定モジュールは、
前記グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定するように構成され、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、
前記グループ中でビットが割り当てられるサブバンドの数を、前記グループ中のサブバンドの総数とスケールファクターkとの積と比較するように特に構成され、前記スケールファクターkは、グループ中のサブバンドの総数を調整するために使用され、
前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数とスケールファクターkとの積より小さい場合に、前記グループ中でビットが割り当てられるサブバンドの数が、前記ビットが最初に割り当てられるサブバンドの数であることを決定し、前記グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、前記グループ中でビットが割り当てられるサブバンドの数が、グループ中のサブバンドの総数であることを決定するように特に構成される、
付記19に記載の装置。
(付記22) 前記割り当てモジュールは、グループ中の全サブバンドから、割り当てに対するターゲットサブバンドとして最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドを選択するように特に構成され、Nはグループ中でビットが割り当てられるサブバンドの数であり、
N個のサブバンドのサブバンド正規化ファクターに従って、N個のサブバンドに順番にビットの数を割り当てるように特に構成される、
付記19から21のいずれか一項に記載の装置。
(付記23) 前記第1の割り当てユニットは、
前記グループ中のサブバンドを複数のサブグループにグループ化するように特に構成され、
各サブグループのサブグループパラメータを取得するように特に構成されるとともに、
前記各サブグループのサブグループパラメータに従って、前記グループに割り当てられたビットを各サブグループに割り当てるように特に構成され、
前記第2の割り当てユニットは、
前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、及び前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるように特に構成されている、付記14に記載の装置。
(付記24) 前記グループ化ユニットは、
同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように特に構成され、又は
近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように特に構成されている、付記14から23のいずれか一項に記載の方法。
(付記25) 前記複数のグループの各グループ中のサブバンドは隣接している、付記24に記載の装置。