【文献】
          A. C. den Brinker, et al.,An Overview of the Coding Standard MPEG-4 Audio Amendments 1 and 2: HE-AAC, SSC, and HE-AAC v2,EURASIP Journal on Audio, Speech, and Music Processing,ドイツ,SpringerOpen,2009年  6月  3日,Vol.2009,pp.1-21
        
        【文献】
          Miikka Vilermo, et al.,Perceptual Optimization of the Frequency Selective Switch in Scalable Audio Coding,Proc. 114th Convention of AES,NL,AES,2003年  3月22日,5851,pp.1-12
        
        【文献】
          Martin Dietz, et al.,Spectral Band Replication, a Novel Approach in Audio Coding,Proc. 112th Convention of AES,ドイツ,AES,2002年  5月10日,5553,pp.1-8
        
      
    (58)【調査した分野】(Int.Cl.,DB名)
  前記第3レイヤ符号化手段は、前記理想ゲインに加え、前記調整ゲインに対応して統計的に算出される予め定められた予測ゲインに基づき前記第2レイヤ差分スペクトルを符号化する、
  請求項1記載の符号化装置。
  前記第3レイヤ復号手段は、前記理想ゲインに加え、前記調整ゲインに対応して統計的に算出される予め定められた予測ゲインに基づき前記第3レイヤ復号スペクトルを生成するする、
  請求項3記載の復号装置。
【発明を実施するための形態】
【0014】
  以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置および復号装置として、音声符号化装置および音声復号装置を例にとって説明する。
 
【0015】
  (実施の形態)
  
図1は、本発明の実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。
図1において、通信システムは、符号化装置101と復号装置103とを備え、それぞれ伝送路102を介して通信可能な状態となっている。なお、符号化装置および復号装置はいずれも、通常、基地局装置あるいは通信端末装置等に搭載されて用いられる。
 
【0016】
  符号化装置101は、入力信号をNサンプルずつ区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に符号化を行う。ここで、符号化の対象となる入力信号をx
n(n=0、…、N−1)と表すこととする。nは、Nサンプルずつ区切られた入力信号のうち、信号要素のn+1番目を示す。符号化装置101は、符号化された入力情報(以下「符号化情報」という)を、伝送路102を介して復号装置103に送信する。
 
【0017】
  復号装置103は、伝送路102を介して符号化装置101から送信された符号化情報を受信し、これを復号し出力信号を得る。
 
【0018】
  図2は、
図1に示した符号化装置101の内部の主要な構成を示すブロック図である。符号化装置101は、ダウンサンプリング処理部201、第1レイヤ符号化部202、第1レイヤ復号部203、アップサンプリング処理部204、直交変換処理部205、第2レイヤ符号化部206、第2レイヤ復号部207、加算部208、加算部209、第3レイヤ符号化部210、および符号化情報統合部211から主に構成される。各部は以下の動作を行う。
 
【0019】
  入力信号x
nのサンプリング周波数をSR
inputとすると、ダウンサンプリング処理部201は、入力信号x
nのサンプリング周波数をSR
inputからSR
baseまでダウンサンプリングし(SR
base<SR
input)する。ダウンサンプリング処理部201は、ダウンサンプリングした入力信号をダウンサンプリング後入力信号として、第1レイヤ符号化部202に出力する。
 
【0020】
  第1レイヤ符号化部202は、ダウンサンプリング処理部201から入力されるダウンサンプリング後入力信号に対して、例えばCELP(Code Excited Linear Prediction)方式の音声符号化方法を用いて符号化を行って第1レイヤ符号化情報を生成する。第1レイヤ符号化部202は、生成した第1レイヤ符号化情報を第1レイヤ復号部203および符号化情報統合部211に出力する。
 
【0021】
  第1レイヤ復号部203は、第1レイヤ符号化部202から入力される第1レイヤ符号化情報に対して、例えばCELP方式の音声復号方法を用いて復号を行って第1レイヤ復号信号を生成する。そして、第1レイヤ復号部203は、生成した第1レイヤ復号信号をアップサンプリング処理部204に出力する。
 
【0022】
  アップサンプリング処理部204は、第1レイヤ復号部203から入力される第1レイヤ復号信号のサンプリング周波数をSR
baseからSR
inputまでアップサンプリングする。アップサンプリング処理部204は、アップサンプリングした第1レイヤ復号信号をアップサンプリング後第1レイヤ復号信号x1
nとして、直交変換処理部205に出力する。
 
【0023】
  直交変換処理部205は、バッファbuf1
nおよびbuf2
n(n=0、…、N−1)を内部に有する。直交変換処理部205は、入力信号x
nおよびアップサンプリング処理部204から入力されるアップサンプリング後第1レイヤ復号信号x1
nを修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)する。
 
【0024】
  次に、直交変換処理部205における直交変換処理について、その計算手順と内部バッファへのデータ出力に関して説明する。
 
【0025】
  まず、直交変換処理部205は、下記の式(1)および式(2)によりバッファbuf1
nおよびbuf2
nそれぞれを、「0」を初期値として初期化する。
【数1】
【数2】
 
【0026】
  次いで、直交変換処理部205は、下記の式(3)および式(4)に従って、入力信号x
n、アップサンプリング後第1レイヤ復号信号x1
nに対し修正離散コサイン変換(MDCT)を行う。これにより、直交変換処理部205は、入力信号のMDCT係数(以下、入力スペクトルと呼ぶ)X(k)およびアップサンプリング後第1レイヤ復号信号x1
nのMDCT係数(以下、第1レイヤ復号スペクトルと呼ぶ)X1(k)を求める。
【数3】
【数4】
 
【0027】
  ここで、kは1フレームにおける各サンプルのインデックスを示す。直交変換処理部205は、入力信号x
nとバッファbuf1
nとを結合させたベクトルであるx
n’を下記の式(5)により求める。また、直交変換処理部205は、アップサンプリング後第1レイヤ復号信号x1
nとバッファbuf2
nとを結合させたベクトルであるx1
n’を下記の式(6)により求める。
【数5】
【数6】
 
【0028】
  次に、直交変換処理部205は、式(7)および式(8)によりバッファbuf1
nおよびbuf2
nを更新する。
【数7】
【数8】
 
【0029】
  そして、直交変換処理部205は、入力スペクトルX(k)を第2レイヤ符号化部206および加算部209に出力する。また、直交変換処理部205は、第1レイヤ復号スペクトルX1(k)を第2レイヤ符号化部206、第2レイヤ復号部207、および加算部208に出力する。
 
【0030】
  第2レイヤ符号化部206は、直交変換処理部205から入力される入力スペクトルX(k)および第1レイヤ復号スペクトルX1(k)を用いて第2レイヤ符号化情報を生成する。第2レイヤ符号化部206は、生成した第2レイヤ符号化情報を第2レイヤ復号部207、第3レイヤ符号化部210、および符号化情報統合部211に出力する。なお、第2レイヤ符号化部206の詳細については後述する。
 
【0031】
  第2レイヤ復号部207は、第2レイヤ符号化部206から入力される第2レイヤ符号化情報を復号して第2レイヤ復号スペクトルを生成する。第2レイヤ復号部207は、生成した第2レイヤ復号スペクトルを加算部208に出力する。なお、第2レイヤ復号部207の詳細については後述する。
 
【0032】
  加算部208は、直交変換処理部205から入力される第1レイヤ復号スペクトルと、第2レイヤ復号部207から入力される第2レイヤ復号スペクトルとを、周波数領域上で加算し、加算スペクトルを算出する。ここで、第1レイヤ復号スペクトルはサンプリング周波数SR
baseに対応する低域部分(0(kHz)〜F
base(kHz))に値をもつスペクトルである。また、第2レイヤ復号スペクトルはサンプリング周波数SR
inputに対応する高域部分(F
base(kHz)〜F
input(kHz))に値をもつスペクトルである。すなわち、これらのスペクトルを加算して得られる加算スペクトルの低域部分(0(kHz)〜F
base(kHz))の値は、第1レイヤ復号スペクトルであり、高域部分(F
base(kHz)〜F
input(kHz))の値は第2レイヤ復号スペクトルとなる。
 
【0033】
  加算部209は、直交変換処理部205から入力される入力スペクトルX(k)に対して、加算部208から入力される加算スペクトルの極性を反転して加算し、第2レイヤ差分スペクトルを算出する。加算部209は、算出した第2レイヤ差分スペクトルを第3レイヤ符号化部210に出力する。
 
【0034】
  第3レイヤ符号化部210は、加算部209から入力される第2レイヤ差分スペクトルおよび第2レイヤ符号化部206から入力される第2レイヤ符号化情報を符号化して第3レイヤ符号化情報を生成する。第3レイヤ符号化部210は、生成した第3レイヤ符号化情報を符号化情報統合部211に出力する。なお、第3レイヤ符号化部210の詳細については後述する。
 
【0035】
  符号化情報統合部211は、第1レイヤ符号化部202から入力される第1レイヤ符号化情報と、第2レイヤ符号化部206から入力される第2レイヤ符号化情報と、第3レイヤ符号化部210から入力される第3レイヤ符号化情報とを統合する。符号化情報統合部211は、統合した情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路102に出力する。
 
【0036】
  次に、第2レイヤ符号化部206における処理を説明する。第2レイヤ符号化部206における処理は、特許文献1の
図7に示す「High frequency Coding」における処理と同様である。つまり、第2レイヤ符号化部206は、第1レイヤ復号スペクトル(特許文献1の
図7中のX^
L(k))と、入力スペクトル(特許文献1の
図7中のX
H(k))とから、復号装置側で高域スペクトルを生成するためのパラメータ(特許文献1では、スペクトルインデックスi、第1ゲインパラメータα
1、第2ゲインパラメータα
2)を算出する。上述したように、第1レイヤ復号スペクトルは、低域部分(0(kHz)〜F
base(kHz))のスペクトルであり、入力スペクトルは、高域部分(F
base(kHz)〜F
input(kHz))のスペクトルである。なお、以下の説明で用いる、上記3つのパラメータは、特許文献1に開示されている方法で算出されたパラメータとする。
 
【0037】
  ここで、特許文献1および非特許文献1に開示されている上記3つのパラメータの算出方法について説明する。
 
【0038】
  まず、第1レイヤ復号スペクトルX1(k)に対して、入力スペクトルX(k)の高域部分(F
base(kHz)〜F
input(kHz))のスペクトルに類似する部分を探索する。具体的には、以下の式(9)の値(S(d))が最大となるスペクトルインデックスを探索し、このスペクトルインデックスをiとする。ここで、式(9)において、jはサブバンドインデックスであり、dは探索時のスペクトルインデックスであり、n
jはサブバンドjに対する探索範囲(探索エントリ数)を示す。
【数9】
 
【0039】
  次に、式(9)を最大とスペクトルインデックスiを用いて、式(10)に従って、第1ゲインパラメータα
1を算出する。
【数10】
 
【0040】
  次に、式(9)および式(10)で算出されたスペクトルインデックスiとゲインパラメータα
1を用いて、式(11)に従って、第2ゲインパラメータα
2を算出する。
【数11】
 
【0041】
  ここで、式(11)において、Mjは以下の式(12)を満たす値とする。
【数12】
 
【0042】
  つまり、まず第2符号化レイヤでは、第1復号スペクトルに対して、入力スペクトルの高域部分に最も近似する部分を探索する。この探索により、近似するスペクトル部分を表すスペクトルインデックスiとともに、その時の理想ゲインを第1ゲインパラメータα
1として算出する。その後、スペクトルインデックスiとその時の理想ゲインである第1ゲインパラメータα
1とから算出される高域スペクトルと、入力スペクトルの高域部分とに対して、対数領域上でエネルギを調整するゲインパラメータである第2ゲインパラメータα
2を算出する。
 
【0043】
  次に、第2レイヤ復号部207における処理を説明する。なお、第2レイヤ復号部207における処理は、特許文献1の
図7に示す「High frequency generation」における処理と、一部に関して同一である。
 
【0044】
  まず、第2レイヤ復号部207は、式(13)のようにして、高域部分(F
base(kHz)〜F
input(kHz))の高域スペクトルX1’
jH(k)を生成する。すなわち、第2レイヤ復号部207は、第2レイヤ符号化情報に含まれるパラメータ(スペクトルインデックスi、第1ゲインパラメータα
1、第2ゲインパラメータα
2)のうち、スペクトルインデックスiと、第1レイヤ復号スペクトルX1(k)とから、高域スペクトルX1’
jH(k)を生成する。ここで、式(13)において、jはサブバンドインデックスであり、スペクトルインデックスiは各サブバンドに対して設定されているものとする。また、ここで、スペクトルインデックスi、第1ゲインパラメータα
1、および第2ゲインパラメータα
2は、特許文献1に開示されている方法(上述)で算出されるパラメータである。
 
【0045】
  つまり、式(13)は、第1復号スペクトルのスペクトルインデックスi
jが示すインデックス以降のサブバンドインデックスjのサブバンド幅分のスペクトルを高域部分のスペクトルとして近似する処理を示している。
【数13】
 
【0046】
  次に、第2レイヤ復号部207は、式(13)により算出された高域スペクトルX1’
jH(k)に対して、以下の式(14)のようにして、第1ゲインパラメータα
1を乗じて、第2レイヤ復号スペクトルX2
jH(k)を算出する。
【数14】
 
【0047】
  次に、第2レイヤ復号部207は、式(14)により算出された第2レイヤ復号スペクトルX2
jH(k)を加算部208に出力する。
 
【0048】
  つまり、本実施の形態の第2レイヤ復号部207は、特許文献1の
図7に示す「High frequency generation」とは異なり、第2ゲインパラメータα
2を利用せずに、高域スペクトル(第2レイヤ復号スペクトル)を生成する。これは、上位レイヤで量子化対象となる第2レイヤ差分スペクトルのエネルギを小さくするためであり、この処理によって、上位レイヤでは符号化効率を向上させることができる。
 
【0049】
  次に、第3レイヤ符号化部210における処理を説明する。
図3は、第3レイヤ符号化部210の内部構成を示すブロック図である。
図3に示すように、第3レイヤ符号化部210は、形状符号化部301、利得符号化部302、多重化部303から主に構成される。各部は以下の動作を行う。
 
【0050】
  形状符号化部301は、加算部209から入力される第2レイヤ差分スペクトルに対して、サブバンド毎に形状量子化を行う。具体的には、まず、形状符号化部301は、第2レイヤ差分スペクトルをL個のサブバンドに分割する。なお、ここで、サブバンド数Lは、第2レイヤ符号化部206におけるサブバンド数と同じとする。次に、形状符号化部301は、L個の各サブバンドに対して、SQ個の形状コードベクトルからなる内蔵の形状コードブックを探索して下記の式(15)の評価尺度Shape_q(i)が最大となる形状コードベクトルのインデックスを求める。
【数15】
 
【0051】
  この式において、SC
ikは形状コードブックを構成する形状コードベクトルを示し、iは形状コードベクトルのインデックスを示し、kは形状コードベクトルの要素のインデックスを示す。また、W(j)はバンドインデックスがjであるバンドのバンド幅を表す。また、X2’
jH(k)はバンドインデックスがjである第2レイヤ差分スペクトルの値を表すものとする。
 
【0052】
  形状符号化部301は、上記の式(15)の評価尺度Shape_q(i)が最大となる形状コードベクトルのインデックスS_maxを形状符号化情報として多重化部303に出力する。また、形状符号化部301は、下記の式(16)に従い、理想利得Gain_i(j)を算出し、算出した理想利得Gain_i(j)を利得符号化部302に出力する。
【数16】
 
【0053】
  利得符号化部302には、形状符号化部301から理想利得Gain_i(j)が入力される。また、利得符号化部302には、第2レイヤ符号化部206から第2レイヤ符号化情報が入力される。
 
【0054】
  利得符号化部302は、下記の式(17)に従い、形状符号化部301から入力される理想利得Gain_i(j)を量子化する。ここでも、利得符号化部302は、理想利得をL次元ベクトルとして扱い、ベクトル量子化を行う。また、式(17)において、β(j)は予め設定された定数であり、以下では予測利得と呼ぶ。予測利得β(j)についての説明は後述する。
【数17】
 
【0055】
  この式において、GC
ijは利得コードブックを構成する利得コードベクトルを示し、iは利得コードベクトルのインデックスを示し、jは利得コードベクトルの要素のインデックスを示す。
 
【0056】
  利得符号化部302は、GQ個の利得コードベクトルからなる内蔵の利得コードブックを探索して、上記の式(17)を最小にする利得コードブックのインデックスG_minを、利得符号化情報として多重化部303に出力する。
 
【0057】
  次に、式(17)における予測利得β(j)の設定方法について説明する。予測利得β(j)は、第2レイヤ符号化部206における第2ゲインパラメータα
2に対応して、サブバンド毎(jはサブバンドインデックス)に予め設定された定数であり、第2ゲインパラメータα
2の量子化時に利用するコードブックに併記して格納される。つまり、第2ゲインパラメータα
2の量子化時の各コードベクトルに対して、それぞれ予測利得β(j)が設定される。これにより、追加の情報量を使わずに、復号装置103(符号化装置101内のローカルデコード処理も含む)において、第2ゲインパラメータα
2に対応した予測利得β(j)を得ることが出来る。なお、予測利得β(j)の値は、第2ゲインパラメータα
2の値に対して、その時の形状符号化部301にて算出される理想利得Gain_i(j)がどのような値であったかを、統計的に分析し、決定された数値である。
 
【0058】
  具体的には、第2ゲインパラメータα
2の値が大きかった場合(1.0に近い場合)には、第2差分スペクトルのエネルギは比較的小さい傾向がある。したがって、その場合には、予測利得β(j)の値は、小さくなる。また、第2ゲインパラメータα
2の値が小さかった場合(0.0に近い場合)には、第2差分スペクトルのエネルギは比較的大きい傾向がある。したがって、その場合には、予測利得β(j)の値は、大きくなる。
 
【0059】
  利得符号化部302は、このような特性を用いて、非常に長いサンプルデータを入力として、第2ゲインパラメータα
2の値に対応する理想利得Gain_i(j)の値を統計的に分析する。そして、利得符号化部302は、第2ゲインパラメータα
2のコードブックに格納される第2ゲインパラメータα
2の各値に対応して、予測利得β(j)の値を決定する。以上が、式(17)における予測利得β(j)の設定方法である。
 
【0060】
  多重化部303は、形状符号化部301から入力される形状符号化情報S_max、および利得符号化部302から入力される利得符号化情報G_minを多重化し、第3レイヤ符号化情報として符号化情報統合部211に出力する。
 
【0061】
  以上が、第3レイヤ符号化部210の構成についての説明である。
 
【0062】
  以上が、符号化装置101の構成についての説明である。
 
【0063】
  次いで、
図1に示した復号装置103について説明する。
 
【0064】
  図4は、復号装置103の内部の主要な構成を示すブロック図である。復号装置103は、符号化情報分離部401、第1レイヤ復号部402、アップサンプリング処理部403、直交変換処理部404、第2レイヤ復号部405、第3レイヤ復号部406、加算部407、および直交変換処理部408から主に構成される。各部は以下の動作を行う。
 
【0065】
  符号化情報分離部401には、伝送路102を介して符号化装置101から伝送される符号化情報が入力される。符号化情報分離部401は、符号化情報を、第1レイヤ符号化情報、第2レイヤ符号化情報、および第3レイヤ符号化情報に分離する。次に、符号化情報分離部401は、第1レイヤ符号化情報を第1レイヤ復号部402に出力し、第2レイヤ符号化情報を第2レイヤ復号部405に出力し、第3レイヤ符号化情報を第3レイヤ復号部406に出力する。
 
【0066】
  また、符号化情報分離部401は、符号化情報中に第3レイヤ符号化情報が含まれるか否かを検知し、検知結果に応じて、第2レイヤ復号部405の動作を制御する。具体的には、符号化情報分離部401は、符号化情報中に第3レイヤ符号化情報が含まれる場合には、第2レイヤ制御情報CIの値を0に設定し、そうでない場合には第2レイヤ制御情報CIの値を1に設定する。次に、符号化情報分離部401は、第2レイヤ制御情報CIを第2レイヤ復号部405に出力する。
 
【0067】
  第1レイヤ復号部402は、符号化情報分離部401から入力される第1レイヤ符号化情報に対して、例えばCELP方式の音声復号方法を用いて復号を行って第1レイヤ復号信号を生成する。第1レイヤ復号部402は、生成した第1レイヤ復号信号をアップサンプリング処理部403に出力する。
 
【0068】
  アップサンプリング処理部403は、第1レイヤ復号部402から入力される第1レイヤ復号信号のサンプリング周波数をSR
baseからSR
inputまでアップサンプリングする。アップサンプリング処理部403は、アップサンプリングした第1レイヤ復号信号をアップサンプリング後第1レイヤ復号信号として、直交変換処理部404に出力する。
 
【0069】
  直交変換処理部404は、バッファbuf3
n(n=0、…、N−1)を内部に有し、アップサンプリング処理部403から入力されるアップサンプリング後第1レイヤ復号信号x1
nを修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)する。直交変換処理部404は、アップサンプリング後第1レイヤ復号信号x1
nを直交変換処理して、第1レイヤ復号スペクトルX1(k)を算出する。直交変換処理部404の処理は、直交変換処理部205の処理と同様であるため、ここでは説明を省略する。直交変換処理部404は、得られた第1レイヤ復号スペクトルX1(k)を第2レイヤ復号部405に出力する。
 
【0070】
  第2レイヤ復号部405には、符号化情報分離部401から第2レイヤ符号化情報および第2レイヤ制御情報が入力される。また、第2レイヤ復号部405には、直交変換処理部404から第1レイヤ復号スペクトルX1(k)が入力される。第2レイヤ復号部405は、第2レイヤ制御情報の値に応じて、復号方法を切り替えて、第1レイヤ復号スペクトルX1(k)と第2レイヤ符号化情報とから、第2レイヤ復号スペクトルを算出する。次に、第2レイヤ復号部405は、第2レイヤ復号スペクトルおよび第1レイヤ復号スペクトルから第1加算スペクトルを算出し、これを加算部407に出力する。なお、第2レイヤ復号部405の詳細については後述する。
 
【0071】
  第3レイヤ復号部406には、符号化情報分離部401から第3レイヤ符号化情報が入力される。第3レイヤ復号部406は、第3レイヤ符号化情報を復号し、第3レイヤ復号スペクトルを算出する。次に、第3レイヤ復号部406は算出した第3レイヤ復号スペクトルを加算部407に出力する。なお、第3レイヤ復号部406の詳細については後述する。
 
【0072】
  加算部407には、第2レイヤ復号部405から第1加算スペクトルが入力される。また、加算部407には、第3レイヤ復号部406から第3レイヤ復号スペクトルが入力される。加算部407は、第1加算スペクトルと第3レイヤ復号スペクトルとを周波数軸上で加算し、第2加算スペクトルを算出する。次に、加算部407は、算出した第2加算スペクトルを直交変換処理部408に出力する。
 
【0073】
  直交変換処理部408は、加算部407から入力される第2加算スペクトルに対して直交変換を施し、時間領域の信号に変換する。直交変換処理部408は、得られた信号を出力信号として出力する。直交変換処理部408の処理の詳細は後述する。
 
【0074】
  次に、第2レイヤ復号部405における処理を説明する。なお、第2レイヤ復号部405における処理は、符号化装置101内の第2レイヤ復号部207と、一部に関して同一である。
 
【0075】
  まず、第2レイヤ復号部405は、先に示した式(13)のようにして、高域部分(F
base(kHz)〜F
input(kHz))の高域スペクトルX1’
jH(k)を生成する。すなわち、第2レイヤ復号部405は、第2レイヤ符号化情報に含まれるパラメータ(スペクトルインデックスi、第1ゲインパラメータα
1、第2ゲインパラメータα
2)のうち、スペクトルインデックスiと、第1レイヤ復号スペクトルX1(k)とから、高域スペクトルX1’
jH(k)を生成する。ここで、式(13)において、jはサブバンドインデックスであり、スペクトルインデックスiは各サブバンドに対して設定されているものとする。また、ここで、スペクトルインデックスi、第1ゲインパラメータα
1、および第2ゲインパラメータα
2は、特許文献1に開示されている方法(上述)で算出されるパラメータである。
 
【0076】
  つまり、式(13)は、第1復号スペクトルのスペクトルインデックスi
jが示すインデックス以降のサブバンドインデックスiのサブバンド幅分のスペクトルを高域部分のスペクトルとして近似する処理を示している。
 
【0077】
  次に、第2レイヤ復号部405は、式(13)により算出された高域スペクトルX1’
jH(k)に対して、式(18)のようにして、第1ゲインパラメータα
1を乗じて、高域スペクトルX1”
jH(k)を算出する。
【数18】
 
【0078】
  次に、第2レイヤ復号部405は、入力される第2レイヤ制御情報CIの値に応じて、以下の式(19)に従って、第2レイヤ復号スペクトルX2
jH(k)を算出する。ここで、式(19)において、ζ(k)は、高域スペクトルX1”
jH(k)の値が負の場合には−1となり、そうでない場合は+1となる変数である。また、M
jは以下の式(20)を満たす値である。
【数19】
【数20】
 
【0079】
  第2レイヤ復号部405は、第2レイヤ制御情報CIの値が0の場合、すなわち、符号化情報中に第3レイヤ符号化情報が含まれる場合には、符号化装置101内の第2レイヤ復号部207で算出した方法と同様の方法で、第2レイヤ復号スペクトルを算出する。また、第2レイヤ復号部405は、第2レイヤ制御情報CIの値が1の場合、すなわち、符号化情報中に第3レイヤ符号化情報が含まれない場合には、上記第2レイヤ復号部207で算出した方法とは異なる方法で、第2レイヤ復号スペクトルを算出する。具体的には、第2レイヤ復号部405は、第2レイヤ制御情報CIの値が1の場合、特許文献1および非特許文献1に開示されているような、対数領域でのゲインパラメータ(第2ゲインパラメータα
2)を利用して、第2レイヤ復号スペクトルを算出する。
 
【0080】
  上記で説明したように、加算部407では、第2レイヤ復号部405において復号された第1加算スペクトルと、第2レイヤ復号部405の上位レイヤの第3レイヤ復号部406において復号された第3レイヤ復号スペクトルとが加算される。そのため、上位レイヤの第3復号スペクトルが存在する場合には、第2レイヤ復号部405は、符号化装置101内の第2レイヤ復号部207に対応するような復号方法を採るようにした。これにより、加算部407において加算された状態で最も精度の高いスペクトルが算出されるようにした。
 
【0081】
  一方、上位レイヤの第3復号スペクトルが存在しない場合には、第1加算スペクトルは、第3レイヤ復号スペクトルに加算されない。そのため、第2レイヤ復号部405は、信号レベル(SNR)では低くなるものの、聴感的には入力信号により近くするような復号方法を採るようにした。
 
【0082】
  次に、第2レイヤ復号部405は、式(19)により算出された第2レイヤ復号スペクトルX2
jH(k)と第1レイヤ復号スペクトルX1(k)とを、周波数領域上で加算し、第1加算スペクトルを算出する。ここで、第1レイヤ復号スペクトルX1(k)はサンプリング周波数SR
baseに対応する低域部分(0(kHz)〜F
base(kHz))に値をもつスペクトルである。また、第2レイヤ復号スペクトルX2
jH(k)はサンプリング周波数SR
inputに対応する高域部分(F
base(kHz)〜F
input(kHz))に値をもつスペクトルである。すなわち、これらのスペクトルを加算して得られる第1加算スペクトルの低域部分(0(kHz)〜F
base(kHz))の値は、第1レイヤ復号スペクトルとなる。また、高域部分(F
base(kHz)〜F
input(kHz))の値は第2レイヤ復号スペクトルとなる。この加算処理については、符号化装置101内の加算部208の処理と同様である。
 
【0083】
  次に、第2レイヤ復号部405は、算出した第1加算スペクトルを加算部407に出力する。
 
【0084】
  図5は、第3レイヤ復号部406の主要な構成を示すブロック図である。
 
【0085】
  この図において、第3レイヤ復号部406は、分離部501、形状復号部502、および利得復号部503を備える。
 
【0086】
  分離部501は、符号化情報分離部401から出力される第3レイヤ符号化情報を形状符号化情報、および利得符号化情報に分離し、得られる形状符号化情報を形状復号部502に出力し、利得符号化情報を利得復号部503に出力する。
 
【0087】
  形状復号部502は、分離部501から入力される形状符号化情報を復号し、求められた形状の値を利得復号部503に出力する。形状復号部502は、第3レイヤ符号化部210の形状符号化部301が備える形状コードブックと同様な形状コードブックを内蔵する。形状復号部502は、分離部501から入力される形状符号化情報S_maxをインデックスとする形状コードベクトルを探索する。形状復号部502は、探索された形状コードベクトルを、利得復号部503に出力する。ここでは、形状の値として探索された形状コードベクトルをShape_q(k)(k=0,…,B(j)−1)と記す。
 
【0088】
  利得復号部503には、分離部501から利得符号化情報が入力される。利得復号部503は、第3レイヤ符号化部210の利得符号化部302が備える利得コードブックと同様な利得コードブックを内蔵し、この利得コードブックを用いて、下記の式(21)に従い、利得の値を逆量子化する。ここでも、利得復号部503は、利得値をL次元ベクトルとして扱い、ベクトル逆量子化を行う。ここで、予測利得β(j)は、利得符号化情報が示すインデックスを用いて、上記利得コードブックから参照される値である。
【数21】
 
【0089】
  なお、式(21)の処理は、符号化装置101内の第3レイヤ符号化部210にて利得コードベクトルの探索に用いた式(17)の逆処理に相当する。すなわち、利得符号化情報G_minに対応する利得コードベクトルGC
jG_minをそのまま利得値とするのではなく、利得コードベクトルGC
jG_minに対して、予測利得β(j)を加算した値を利得値とする。もちろん、ここで参照する予測利得β(j)の値は、利得情報の符号化時に参照した予測利得β(j)と同値である。
 
【0090】
  次いで、利得復号部503は、現フレームの逆量子化で得られる利得値、および形状復号部502から入力される形状の値を用いて、下記の式(22)に従い、第3レイヤ復号スペクトルX3(k)として復号MDCT係数を算出する。ここでは、算出された復号MDCT係数をX3(k)と記す。
【数22】
 
【0091】
  利得復号部503は、上記の式(22)に従い算出された第3レイヤ復号スペクトルX3(k)を加算部407に出力する。
 
【0092】
  以上が、第3レイヤ復号部406の処理説明である。
 
【0093】
  以下、直交変換処理部408における具体的な処理について説明する。
 
【0094】
  直交変換処理部408は、バッファbuf4(k)を内部に有しており、下記の式(23)に示すようにバッファbuf4(k)を初期化する。
【数23】
 
【0095】
  また、直交変換処理部408は、加算部407から入力される第2加算スペクトルX_add(k)を用いて下記の式(24)に従い、復号信号y
nを求めて出力する。
【数24】
 
【0096】
  式(24)において、Z2(k)は、下記の式(25)に示すように、第2加算スペクトルX_add(k)とバッファbuf4(k)とを結合させたベクトルである。
【数25】
 
【0097】
  次に、直交変換処理部408は、下記の式(26)に従いバッファbuf4(k)を更新する。
【数26】
 
【0098】
  次に、直交変換処理部408は、復号信号y
nを出力信号として出力する。
 
【0099】
  以上が、復号装置103の内部構成の説明である。
 
【0100】
  このように、本実施の形態によれば、符号化装置/復号装置が、階層符号化/復号方式を用い、かつ、下位レイヤに低域部のスペクトルデータに基づいて高域部のスペクトルデータを符号化する帯域拡張技術を適用する場合に、上位レイヤにおいても効率的に差分スペクトル(差分信号)を符号化し、復号信号の品質を改善することができる。具体的には、帯域拡張処理を行う第2レイヤ復号部207は、上位レイヤの第3レイヤ符号化部210において符号化対象となるスペクトル(差分スペクトル)を、低域部のスペクトルを用いて生成した高域部のスペクトルのエネルギを調整する利得情報(第2ゲインパラメータα
2)を用いずに、差分スペクトルのエネルギを最小にするような利得情報(第1ゲインパラメータα
1)を用いて算出する。これにより、上位レイヤの第3レイヤ符号化部210では、エネルギが小さい差分スペクトルが符号化されるようになるので、符号化効率を向上させることができる。
 
【0101】
  また、第3レイヤ符号化部210は、帯域拡張処理時に算出された利得情報(上述の第2ゲインパラメータα
2が該当)から統計的に算出される利得値(予測利得β(j)が該当)を利得情報から減算した誤差成分を、差分スペクトルの利得情報として量子化する。これにより、さらに符号化効率を向上させることができる。
 
【0102】
  なお、本実施の形態では、式(19)のように、下位レイヤにおける差分スペクトル(第2レイヤ差分スペクトル)の算出方法を、フレーム単位で切り替える構成について説明した。しかし、本発明はこれに限らず、フレーム内のサブバンド単位で、算出方法を切り替える構成についても同様に適用できる。例えば、非特許文献2に開示されているように、上位レイヤが、フレーム毎に量子化対象とする帯域を選択するような場合(非特許文献2におけるBS−SGC(Band Selective Shape Gain Coding)が該当)に対しても、本発明を適用できる。この場合、例えば、上位レイヤにおいて量子化対象として選択されたサブバンドに対しては、下位レイヤは、式(19)においてCI=0の場合の処理をして差分スペクトルを算出する。また、量子化対象として選択されないサブバンドに対しては、下位レイヤは、式(15)においてCI=1の場合の処理をして、差分スペクトルを算出する。このようにして、サブバンド毎に差分スペクトルの算出方法を切り替えることによって、上位レイヤの符号化効率を向上させることができる。
 
【0103】
  なお、本実施の形態では、帯域拡張処理を行うレイヤよりも上位レイヤにおいて、誤差成分を、差分スペクトルの利得情報として量子化する構成を例に挙げて説明した。ここで、誤差成分とは、利得情報から、帯域拡張処理時に算出した利得情報(上述の第2ゲインパラメータα
2が該当)から統計的に算出される利得値(予測利得β(j)が該当)を減算した成分である。しかし、本発明はこれに限られず、例えば、上位レイヤにおいて、予測利得β(j)を用いずに、利得情報を量子化する構成に対しても本発明を同様に適用できる。この場合、利得情報の量子化精度は若干劣化するものの、コードブック内に予測利得β(j)を格納しなくてもよくなるため、メモリの削減に繋がる。また、例えば、上位レイヤにおいて、利得情報から統計的に算出される利得値(予測利得β(j)が該当)で利得情報を除算し、誤差成分として除算結果を量子化する構成についても同様に本発明を適用できる。また、この場合、除算の処理演算量が大きくなるため、予めコードブック内には予測利得β(j)の逆数を記憶しておき、実際の除算結果の算出時には、除算ではなく、乗算するという構成でももちろん構わない。また、この場合には、復号装置における復号時には、符号化装置における処理と対応させるために、復号利得に対して予測利得β(j)を加算するのではなく、乗算(あるいは除算)することにより、最終的な復号利得値を算出する。
 
【0104】
  なお、本実施の形態では、第1レイヤ符号化部/復号部において、CELPタイプの符号化/復号方法を採る構成を例に挙げて説明したが、本発明はこれに限らない。例えば、CELPタイプ以外の符号化方法、または周波数軸上での符号化方法を採る場合についても同様に本発明を適用できる。なお、第1レイヤ符号化部において、周波数軸上での符号化方法を採る場合には、入力信号をまず直交変換処理してから低域部分を符号化し、得られる復号スペクトルをそのまま第2レイヤ符号化部に入力すればよい。そのため、この場合には、ダウンサンプリング処理部、アップサンプリング処理部などの処理が不要となる。
 
【0105】
  また、本実施の形態に係る復号装置は、上記符号化装置から伝送された符号化情報を用いて処理を行うとした。しかし、本発明はこれに限定されず、必要なパラメータやデータを含む符号化情報であれば、必ずしも上記符号化装置からの符号化情報でなくても、復号装置は処理を行うことが可能である。
 
【0106】
  また、信号処理プログラムを、メモリ、ディスク、テープ、CD、DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。
 
【0107】
  また、本実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
 
【0108】
  また、本実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
 
【0109】
  また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
 
【0110】
  さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
 
【0111】
  2009年11月12日出願の特願2009−258841に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。