特許5774490 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニック　インテレクチュアル　プロパティ　コーポレーション　オブ　アメリカの特許一覧

特許5774490符号化装置、復号装置およびこれらの方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5774490

(24)【登録日】2015年7月10日

(45)【発行日】2015年9月9日

(54)【発明の名称】符号化装置、復号装置およびこれらの方法

(51)【国際特許分類】

G10L 19/02 20130101AFI20150820BHJP

G10L 19/00 20130101ALI20150820BHJP

G10L 21/0388 20130101ALI20150820BHJP

【ＦＩ】

G10L19/02 150

G10L19/00 250

G10L21/0388 100

【請求項の数】10

【全頁数】22

(21)【出願番号】特願2011-540415(P2011-540415)

(86)(22)【出願日】2010年11月11日

(86)【国際出願番号】JP2010006630

(87)【国際公開番号】WO2011058752

(87)【国際公開日】20110519

【審査請求日】2013年5月21日

(31)【優先権主張番号】特願2009-258841(P2009-258841)

(32)【優先日】2009年11月12日

(33)【優先権主張国】JP

(73)【特許権者】

【識別番号】514136668

【氏名又は名称】パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ

【氏名又は名称原語表記】ＰａｎａｓｏｎｉｃＩｎｔｅｌｌｅｃｔｕａｌＰｒｏｐｅｒｔｙＣｏｒｐｏｒａｔｉｏｎｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】100105050

【弁理士】

【氏名又は名称】鷲田公一

(72)【発明者】

【氏名】山梨智史

(72)【発明者】

【氏名】森井利幸

(72)【発明者】

【氏名】江原宏幸

【審査官】間宮嘉誉

(56)【参考文献】

【文献】特開２００９−４２７４０（ＪＰ，Ａ）

【文献】特表２００８−５２７４３９（ＪＰ，Ａ）

【文献】国際公開第２００８／０８４６８８（ＷＯ，Ａ１）

【文献】 A. C. den Brinker, et al.，An Overview of the Coding Standard MPEG-4 Audio Amendments 1 and 2: HE-AAC, SSC, and HE-AAC v2，EURASIP Journal on Audio, Speech, and Music Processing，ドイツ，SpringerOpen，２００９年６月３日，Vol.2009，pp.1-21

【文献】 Miikka Vilermo, et al.，Perceptual Optimization of the Frequency Selective Switch in Scalable Audio Coding，Proc. 114th Convention of AES，NL，AES，２００３年３月２２日，5851，pp.1-12

【文献】 Martin Dietz, et al.，Spectral Band Replication, a Novel Approach in Audio Coding，Proc. 112th Convention of AES，ドイツ，AES，２００２年５月１０日，5553，pp.1-8

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１９／００−２１／１８

ＳｃｉｅｎｃｅＤｉｒｅｃｔ

ＩＥＥＥＸｐｌｏｒｅ

ＣｉＮｉｉ

Ｓｃｏｐｕｓ

ＪＳＴＰｌｕｓ（ＪＤｒｅａｍＩＩＩ）

ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

(57)【特許請求の範囲】

【請求項1】

入力信号の低域部分を符号化して第１レイヤ符号化情報を生成する第１レイヤ符号化手段と、
前記第１レイヤ符号化情報を復号して第１レイヤ復号信号を生成する第１レイヤ復号手段と、
前記第１レイヤ復号信号および前記入力信号を周波数領域の信号に変換して第１レイヤ復号スペクトルおよび入力スペクトルを生成する直交変換処理手段と、
前記第１レイヤ復号スペクトルと前記入力スペクトルを用いて前記入力信号の高域部分を符号化して第２レイヤ符号化情報を生成する第２レイヤ符号化手段と、
前記第２レイヤ符号化情報を復号して第２レイヤ復号スペクトルを生成する第２レイヤ復号手段と、
前記第１レイヤ復号スペクトルと前記第２レイヤ復号スペクトルを加算して加算スペクトルを生成する加算部と、
前記入力スペクトルから前記加算スペクトルを減算して第２レイヤ差分スペクトルを生成する減算部と、
前記第２レイヤ符号化情報を用いて前記第２レイヤ差分スペクトルを符号化して第３レイヤ符号化情報を生成する第３レイヤ符号化手段と、
前記第１レイヤ符号化情報、前記第２レイヤ符号化情報、および前記第３レイヤ符号化情報を多重化して出力する符号化情報統合手段と、を有し、
前記第２レイヤ符号化手段は、前記第１レイヤ復号スペクトルに対して前記入力スペクトルの高域部分に最も近似する位置およびゲインを表すスペクトルインデックスおよび理想ゲイン、および前記スペクトルインデックスおよび前記理想ゲインから算出されるスペクトルと前記入力スペクトルの高域部分とに対して対数領域上でエネルギを調整するゲインパラメータである調整ゲインを、前記第２レイヤ符号化情報として生成し、
前記第２レイヤ復号手段は、前記調整ゲインを用いず、前記スペクトルインデックス及び前記理想ゲインから前記第２レイヤ復号スペクトルを生成する、
符号化装置。

【請求項2】

前記第３レイヤ符号化手段は、前記理想ゲインに加え、前記調整ゲインに対応して統計的に算出される予め定められた予測ゲインに基づき前記第２レイヤ差分スペクトルを符号化する、
請求項１記載の符号化装置。

【請求項3】

符号化装置から送信された符号化情報を、第１レイヤ符号化情報、第２レイヤ符号化情報、および第３レイヤ符号化情報に分離する符号化情報分離手段と、
前記第１レイヤ符号化情報を復号して第１レイヤ復号信号を生成する第１レイヤ復号手段と、
前記第１レイヤ復号信号を周波数領域の信号に変換して低域部分を表す第１レイヤ復号スペクトルを生成する直交変換処理手段と、
前記第２レイヤ符号化情報および前記第１レイヤ復号スペクトルから高域部分を表す第２レイヤ復号スペクトルを生成するとともに、前記第１レイヤ復号スペクトルと前記第２レイヤ復号スペクトルを加算して加算スペクトルを生成する第２レイヤ復号手段と、
前記第３レイヤ符号化情報を復号して第３レイヤ復号スペクトルを生成する第３レイヤ復号手段と、
前記加算スペクトルと前記第３レイヤ復号スペクトルを加算して出力する加算部と、を有し、
前記第２レイヤ符号化情報は、前記符号化装置の符号化において、前記第１レイヤ復号スペクトルに対して入力スペクトルの高域部分に最も近似する位置およびゲインを表すスペクトルインデックスおよび理想ゲイン、および前記スペクトルインデックスおよび前記理想ゲインから算出されるスペクトルと前記入力スペクトルの高域部分とに対して対数領域上でエネルギを調整するゲインパラメータである調整ゲインとから成るよう生成されたものであり、
前記第２レイヤ復号手段は、
前記符号化情報中に前記第３レイヤ符号化情報が含まれる場合には、前記調整ゲインを用いず、前記スペクトルインデックス及び前記理想ゲインから前記第２レイヤ復号スペクトルを生成し、
前記符号化情報中に前記第３レイヤ符号化情報が含まれない場合には、前記調整ゲイン、前記スペクトルインデックス及び前記理想ゲインから前記第２レイヤ復号スペクトルを生成する、
復号装置。

【請求項4】

前記第３レイヤ復号手段は、前記理想ゲインに加え、前記調整ゲインに対応して統計的に算出される予め定められた予測ゲインに基づき前記第３レイヤ復号スペクトルを生成するする、
請求項３記載の復号装置。

【請求項5】

請求項１に記載の符号化装置を具備する通信端末装置。

【請求項6】

請求項１に記載の符号化装置を具備する基地局装置。

【請求項7】

請求項３に記載の復号装置を具備する通信端末装置。

【請求項8】

請求項３に記載の復号装置を具備する基地局装置。

【請求項9】

入力信号の低域部分を符号化して第１レイヤ符号化情報を生成する第１レイヤ符号化ステップと、
前記第１レイヤ符号化情報を復号して第１レイヤ復号信号を生成する第１レイヤ復号ステップと、
前記第１レイヤ復号信号および前記入力信号を周波数領域の信号に変換して第１レイヤ復号スペクトルおよび入力スペクトルを生成する直交変換処理ステップと、
前記第１レイヤ復号スペクトルと前記入力スペクトルを用いて前記入力信号の高域部分を符号化して第２レイヤ符号化情報を生成する第２レイヤ符号化ステップと、
前記第２レイヤ符号化情報を復号して第２レイヤ復号スペクトルを生成する第２レイヤ復号ステップと、
前記第１レイヤ復号スペクトルと前記第２レイヤ復号スペクトルを加算して加算スペクトルを生成する加算ステップと、
前記入力スペクトルから前記加算スペクトルを減算して第２レイヤ差分スペクトルを生成する減算ステップと、
前記第２レイヤ符号化情報を用いて前記第２レイヤ差分スペクトルを符号化して第３レイヤ符号化情報を生成する第３レイヤ符号化ステップと、
前記第１レイヤ符号化情報、前記第２レイヤ符号化情報、および前記第３レイヤ符号化情報を多重化して出力する符号化情報統合ステップと、を有し、
前記第２レイヤ符号化ステップは、前記第１レイヤ復号スペクトルに対して前記入力スペクトルの高域部分に最も近似する位置およびゲインを表すスペクトルインデックスおよび理想ゲイン、および前記スペクトルインデックスおよび前記理想ゲインから算出されるスペクトルと前記入力スペクトルの高域部分とに対して対数領域上でエネルギを調整するゲインパラメータである調整ゲインを、前記第２レイヤ符号化情報として生成し、
前記第２レイヤ復号ステップは、前記調整ゲインを用いず、前記スペクトルインデックス及び前記理想ゲインから前記第２レイヤ復号スペクトルを生成する、
符号化方法。

【請求項10】

符号化装置から送信された符号化情報を、第１レイヤ符号化情報、第２レイヤ符号化情報、および第３レイヤ符号化情報に分離する符号化情報分離ステップと、
前記第１レイヤ符号化情報を復号して第１レイヤ復号信号を生成する第１レイヤ復号ステップと、
前記第１レイヤ復号信号を周波数領域の信号に変換して低域部分を表す第１レイヤ復号スペクトルを生成する直交変換処理ステップと、
前記第２レイヤ符号化情報および前記第１レイヤ復号スペクトルから高域部分を表す第２レイヤ復号スペクトルを生成するとともに、前記第１レイヤ復号スペクトルと前記第２レイヤ復号スペクトルを加算して加算スペクトルを生成する第２レイヤ復号ステップと、
前記第３レイヤ符号化情報を復号して第３レイヤ復号スペクトルを生成する第３レイヤ復号ステップと、
前記加算スペクトルと前記第３レイヤ復号スペクトルを加算して出力する加算ステップと、を有し、
前記第２レイヤ符号化情報は、前記符号化装置の符号化において、前記第１レイヤ復号スペクトルに対して入力スペクトルの高域部分に最も近似する位置およびゲインを表すスペクトルインデックスおよび理想ゲイン、および前記スペクトルインデックスおよび前記理想ゲインから算出されるスペクトルと前記入力スペクトルの高域部分とに対して対数領域上でエネルギを調整するゲインパラメータである調整ゲインとから成るよう生成されたものであり、
前記第２レイヤ復号ステップは、
前記符号化情報中に前記第３レイヤ符号化情報が含まれる場合には、前記調整ゲインを用いず、前記スペクトルインデックス及び前記理想ゲインから前記第２レイヤ復号スペクトルを生成し、
前記符号化情報中に前記第３レイヤ符号化情報が含まれない場合には、前記調整ゲイン、前記スペクトルインデックス及び前記理想ゲインから前記第２レイヤ復号スペクトルを生成する、
復号方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置、復号装置およびこれらの方法に関する。

【背景技術】

【0002】

インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声・楽音信号を伝送する場合、音声・楽音信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。また、近年では、単に低ビットレートで音声・楽音信号を符号化するという一方で、より広帯域の音声・楽音信号を符号化する技術に対するニーズが高まっている。

【0003】

このようなニーズに対して、符号化後の情報量を大幅に増加させることなく広帯域の音声・楽音信号を符号化する様々な帯域拡張技術が開発されてきている。例えば、一定時間分の入力音響信号を変換して得られるスペクトルデータのうち、低域部のスペクトルデータに対して、線形領域でのゲイン情報及び対数領域でのゲイン情報を適用し、高域部のスペクトルデータを生成する技術が開示されている（特許文献１および非特許文献１参照）。また、広帯域信号を階層的に符号化する階層符号化方式もこれまでに開発されてきている。例えば、非特許文献２では、５つの階層（レイヤ）からなる階層符号化方式を用いて、広帯域信号を符号化する技術が開示されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】国際公開第２００７／０５２０８８号

【非特許文献】

【0005】

【非特許文献1】Mikko Tammi, Lasse Laaksonen, Anssi Ramo, and Henri Toukomaa, “Scalable Superwideband Extension for Wideband Coding”, ICASSP 2009

【非特許文献2】ITU-T:G.718; Frame error robust narrowband and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s. ITU-T Recommendation G.718(2008)

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、上記特許文献１、および非特許文献１に開示された帯域拡張技術を、非特許文献２で開示されているような階層符号化／復号方式（スケーラブルコーデック）に適用する場合には、符号化効率が不十分であるという問題点がある。例えば、ここで、上記の帯域拡張技術により生成される高域スペクトルと入力スペクトルとの差分スペクトルを、上位レイヤにて符号化する場合を考える。この場合、上述の帯域拡張技術によって生成される高域スペクトルは、入力スペクトルに対して信号レベルが近くない。そのため（つまり生成される高域スペクトルのＳ／Ｎ（Signal/Noise）比が低い）、上位レイヤにおける符号化対象である差分スペクトルのエネルギが大きくなってしまう。したがって、特に上位レイヤのビットレートが低い場合には符号化性能が不十分となり、復号信号の品質が著しく劣化する可能性がある。

【0007】

本発明の目的は、階層符号化／復号方式において、低域部のスペクトルデータに基づいて高域部のスペクトルデータを符号化する帯域拡張技術を下位レイヤに適用した場合に、上位レイヤにおいても効率的に符号化し、復号信号の品質を改善することができる符号化装置、復号装置およびこれらの方法を提供することである。

【課題を解決するための手段】

【0008】

本発明の符号化装置は、入力信号を符号化して得られた低域符号化情報を用いて生成された周波数領域の低域復号信号と、前記周波数領域の前記入力信号と、を入力し、前記低域復号信号と前記入力信号とを用いた符号化により得られた高域符号化情報を用いて前記周波数領域の高域復号信号を生成し、前記低域復号信号と前記高域復号信号とを用いて帯域拡張信号を生成し、前記入力信号と前記帯域拡張信号との差分信号を生成する第１符号化手段と、前記差分信号を符号化して差分符号化情報を生成する第２符号化手段と、を具備し、第１符号化手段は、前記低域復号信号と前記入力信号とを用いた符号化において、前記低域復号信号から前記入力信号の高域部分との近似部分を探索することにより前記差分信号のエネルギを最小化する理想利得を求め、前記エネルギが最小となる前記差分信号を生成し、前記理想利得を含む前記高域符号化情報を生成する、構成を採る。

【0009】

本発明の復号装置は、符号化装置において生成された、入力信号を符号化して得られた低域符号化情報と、前記低域符号化情報を用いて生成された低域信号と前記入力信号とを用いた符号化により得られた高域符号化情報と、前記高域符号化情報を用いて生成された高域信号と前記低域信号とを用いて生成された帯域拡張信号と前記入力信号との差分信号を用いた符号化により生成された差分符号化情報と、を含む符号化情報であって、前記差分信号のエネルギを最小化する理想利得を前記高域符号化情報が含む前記符号化情報を受信する受信手段と、前記低域符号化情報を復号して低域復号信号を生成する第１復号手段と、前記低域復号信号と前記高域符号化情報とを用いて復号することにより高域復号信号を生成する第２復号手段と、前記差分符号化情報を復号する第３復号手段と、を具備し、前記受信手段は、前記符号化情報に前記差分符号化情報を含むか否かを示す制御情報を生成し、前記第２復号手段は、前記制御情報に基づいて、前記高域符号化情報に含まれる全ての情報を用いた第１の復号方法と、前記高域符号化情報に含まれる情報のうち特定の情報を除いた情報を用いた第２の復号方法と、を切り替えて復号を行う、構成を採る。

【0010】

本発明の符号化方法は、入力信号を符号化して得られた低域符号化情報を用いて生成された周波数領域の低域復号信号と、前記周波数領域の前記入力信号と、を入力し、前記低域復号信号と前記入力信号とを用いた符号化により得られた高域符号化情報を用いて前記周波数領域の高域復号信号を生成し、前記低域復号信号と前記高域復号信号とを用いて帯域拡張信号を生成し、前記入力信号と前記帯域拡張信号との差分信号を生成する第１符号化ステップと、前記差分信号を符号化して差分符号化情報を生成する第２符号化ステップと、を具備し、第１符号化ステップでは、前記低域復号信号と前記入力信号とを用いた符号化において、前記低域復号信号から前記入力信号の高域部分との近似部分を探索することにより前記差分信号のエネルギを最小化する理想利得を求め、前記エネルギが最小となる前記差分信号を生成し、前記理想利得を含む前記高域符号化情報を生成するようにした。

【0011】

本発明の復号方法は、符号化装置において生成された、入力信号を符号化して得られた低域符号化情報と、前記低域符号化情報を用いて生成された低域信号と前記入力信号とを用いた符号化により得られた高域符号化情報と、前記高域符号化情報を用いて生成された高域信号と前記低域信号とを用いて生成された帯域拡張信号と前記入力信号との差分信号を用いた符号化により生成された差分符号化情報と、を含む符号化情報であって、前記差分信号のエネルギを最小化する理想利得を前記高域符号化情報が含む前記符号化情報を受信する受信ステップと、前記低域符号化情報を復号して低域復号信号を生成する第１復号ステップと、前記低域復号信号と前記高域符号化情報とを用いて復号することにより高域復号信号を生成する第２復号ステップと、前記差分符号化情報を復号する第３復号ステップと、を具備し、前記受信ステップでは、前記符号化情報に前記差分符号化情報を含むか否かを示す制御情報を生成し、前記第２復号ステップでは、前記制御情報に基づいて、前記高域符号化情報に含まれる全ての情報を用いた第１の復号方法と、前記高域符号化情報に含まれる情報のうち特定の情報を除いた情報を用いた第２の復号方法と、を切り替えて復号を行うようにした。

【発明の効果】

【0012】

本発明によれば、階層符号化／復号方式において、低域部のスペクトルデータに基づいて高域部のスペクトルデータを符号化する帯域拡張技術を下位レイヤに適用した場合に、上位レイヤにおいても効率的に符号化し、復号信号の品質を改善することができる。

【図面の簡単な説明】

【0013】

【図1】本発明の実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図

【図2】図１に示した符号化装置の内部の主要な構成を示すブロック図

【図3】図２に示した第３レイヤ符号化部の内部の主要な構成を示すブロック図

【図4】図１に示した復号装置の内部の主要な構成を示すブロック図

【図5】図４に示した第３レイヤ復号部の内部の主要な構成を示すブロック図

【発明を実施するための形態】

【0014】

以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置および復号装置として、音声符号化装置および音声復号装置を例にとって説明する。

【0015】

（実施の形態）
図１は、本発明の実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。図１において、通信システムは、符号化装置１０１と復号装置１０３とを備え、それぞれ伝送路１０２を介して通信可能な状態となっている。なお、符号化装置および復号装置はいずれも、通常、基地局装置あるいは通信端末装置等に搭載されて用いられる。

【0016】

符号化装置１０１は、入力信号をＮサンプルずつ区切り（Ｎは自然数）、Ｎサンプルを１フレームとしてフレーム毎に符号化を行う。ここで、符号化の対象となる入力信号をｘ_ｎ（ｎ＝０、…、Ｎ−１）と表すこととする。ｎは、Ｎサンプルずつ区切られた入力信号のうち、信号要素のｎ＋１番目を示す。符号化装置１０１は、符号化された入力情報（以下「符号化情報」という）を、伝送路１０２を介して復号装置１０３に送信する。

【0017】

復号装置１０３は、伝送路１０２を介して符号化装置１０１から送信された符号化情報を受信し、これを復号し出力信号を得る。

【0018】

図２は、図１に示した符号化装置１０１の内部の主要な構成を示すブロック図である。符号化装置１０１は、ダウンサンプリング処理部２０１、第１レイヤ符号化部２０２、第１レイヤ復号部２０３、アップサンプリング処理部２０４、直交変換処理部２０５、第２レイヤ符号化部２０６、第２レイヤ復号部２０７、加算部２０８、加算部２０９、第３レイヤ符号化部２１０、および符号化情報統合部２１１から主に構成される。各部は以下の動作を行う。

【0019】

入力信号ｘ_ｎのサンプリング周波数をＳＲ_{ｉｎｐｕｔ}とすると、ダウンサンプリング処理部２０１は、入力信号ｘ_ｎのサンプリング周波数をＳＲ_{ｉｎｐｕｔ}からＳＲ_ｂａｓｅまでダウンサンプリングし（ＳＲ_ｂａｓｅ＜ＳＲ_{ｉｎｐｕｔ}）する。ダウンサンプリング処理部２０１は、ダウンサンプリングした入力信号をダウンサンプリング後入力信号として、第１レイヤ符号化部２０２に出力する。

【0020】

第１レイヤ符号化部２０２は、ダウンサンプリング処理部２０１から入力されるダウンサンプリング後入力信号に対して、例えばＣＥＬＰ（Code Excited Linear Prediction）方式の音声符号化方法を用いて符号化を行って第１レイヤ符号化情報を生成する。第１レイヤ符号化部２０２は、生成した第１レイヤ符号化情報を第１レイヤ復号部２０３および符号化情報統合部２１１に出力する。

【0021】

第１レイヤ復号部２０３は、第１レイヤ符号化部２０２から入力される第１レイヤ符号化情報に対して、例えばＣＥＬＰ方式の音声復号方法を用いて復号を行って第１レイヤ復号信号を生成する。そして、第１レイヤ復号部２０３は、生成した第１レイヤ復号信号をアップサンプリング処理部２０４に出力する。

【0022】

アップサンプリング処理部２０４は、第１レイヤ復号部２０３から入力される第１レイヤ復号信号のサンプリング周波数をＳＲ_ｂａｓｅからＳＲ_{ｉｎｐｕｔ}までアップサンプリングする。アップサンプリング処理部２０４は、アップサンプリングした第１レイヤ復号信号をアップサンプリング後第１レイヤ復号信号ｘ１_ｎとして、直交変換処理部２０５に出力する。

【0023】

直交変換処理部２０５は、バッファｂｕｆ１_ｎおよびｂｕｆ２_ｎ（ｎ＝０、…、Ｎ−１）を内部に有する。直交変換処理部２０５は、入力信号ｘ_ｎおよびアップサンプリング処理部２０４から入力されるアップサンプリング後第１レイヤ復号信号ｘ１_ｎを修正離散コサイン変換（ＭＤＣＴ：Modified Discrete Cosine Transform）する。

【0024】

次に、直交変換処理部２０５における直交変換処理について、その計算手順と内部バッファへのデータ出力に関して説明する。

【0025】

まず、直交変換処理部２０５は、下記の式（１）および式（２）によりバッファｂｕｆ１_ｎおよびｂｕｆ２_ｎそれぞれを、「０」を初期値として初期化する。

【数1】

【数2】

【0026】

次いで、直交変換処理部２０５は、下記の式（３）および式（４）に従って、入力信号ｘ_ｎ、アップサンプリング後第１レイヤ復号信号ｘ１_ｎに対し修正離散コサイン変換（ＭＤＣＴ）を行う。これにより、直交変換処理部２０５は、入力信号のＭＤＣＴ係数（以下、入力スペクトルと呼ぶ）Ｘ（ｋ）およびアップサンプリング後第１レイヤ復号信号ｘ１_ｎのＭＤＣＴ係数（以下、第１レイヤ復号スペクトルと呼ぶ）Ｘ１（ｋ）を求める。

【数3】

【数4】

【0027】

ここで、ｋは１フレームにおける各サンプルのインデックスを示す。直交変換処理部２０５は、入力信号ｘ_ｎとバッファｂｕｆ１_ｎとを結合させたベクトルであるｘ_ｎ’を下記の式（５）により求める。また、直交変換処理部２０５は、アップサンプリング後第１レイヤ復号信号ｘ１_ｎとバッファｂｕｆ２_ｎとを結合させたベクトルであるｘ１_ｎ’を下記の式（６）により求める。

【数5】

【数6】

【0028】

次に、直交変換処理部２０５は、式（７）および式（８）によりバッファｂｕｆ１_ｎおよびｂｕｆ２_ｎを更新する。

【数7】

【数8】

【0029】

そして、直交変換処理部２０５は、入力スペクトルＸ（ｋ）を第２レイヤ符号化部２０６および加算部２０９に出力する。また、直交変換処理部２０５は、第１レイヤ復号スペクトルＸ１（ｋ）を第２レイヤ符号化部２０６、第２レイヤ復号部２０７、および加算部２０８に出力する。

【0030】

第２レイヤ符号化部２０６は、直交変換処理部２０５から入力される入力スペクトルＸ（ｋ）および第１レイヤ復号スペクトルＸ１（ｋ）を用いて第２レイヤ符号化情報を生成する。第２レイヤ符号化部２０６は、生成した第２レイヤ符号化情報を第２レイヤ復号部２０７、第３レイヤ符号化部２１０、および符号化情報統合部２１１に出力する。なお、第２レイヤ符号化部２０６の詳細については後述する。

【0031】

第２レイヤ復号部２０７は、第２レイヤ符号化部２０６から入力される第２レイヤ符号化情報を復号して第２レイヤ復号スペクトルを生成する。第２レイヤ復号部２０７は、生成した第２レイヤ復号スペクトルを加算部２０８に出力する。なお、第２レイヤ復号部２０７の詳細については後述する。

【0032】

加算部２０８は、直交変換処理部２０５から入力される第１レイヤ復号スペクトルと、第２レイヤ復号部２０７から入力される第２レイヤ復号スペクトルとを、周波数領域上で加算し、加算スペクトルを算出する。ここで、第１レイヤ復号スペクトルはサンプリング周波数ＳＲ_ｂａｓｅに対応する低域部分（０（ｋＨｚ）〜Ｆ_ｂａｓｅ（ｋＨｚ））に値をもつスペクトルである。また、第２レイヤ復号スペクトルはサンプリング周波数ＳＲ_{ｉｎｐｕｔ}に対応する高域部分（Ｆ_ｂａｓｅ（ｋＨｚ）〜Ｆ_{ｉｎｐｕｔ}（ｋＨｚ））に値をもつスペクトルである。すなわち、これらのスペクトルを加算して得られる加算スペクトルの低域部分（０（ｋＨｚ）〜Ｆ_ｂａｓｅ（ｋＨｚ））の値は、第１レイヤ復号スペクトルであり、高域部分（Ｆ_ｂａｓｅ（ｋＨｚ）〜Ｆ_{ｉｎｐｕｔ}（ｋＨｚ））の値は第２レイヤ復号スペクトルとなる。

【0033】

加算部２０９は、直交変換処理部２０５から入力される入力スペクトルＸ（ｋ）に対して、加算部２０８から入力される加算スペクトルの極性を反転して加算し、第２レイヤ差分スペクトルを算出する。加算部２０９は、算出した第２レイヤ差分スペクトルを第３レイヤ符号化部２１０に出力する。

【0034】

第３レイヤ符号化部２１０は、加算部２０９から入力される第２レイヤ差分スペクトルおよび第２レイヤ符号化部２０６から入力される第２レイヤ符号化情報を符号化して第３レイヤ符号化情報を生成する。第３レイヤ符号化部２１０は、生成した第３レイヤ符号化情報を符号化情報統合部２１１に出力する。なお、第３レイヤ符号化部２１０の詳細については後述する。

【0035】

符号化情報統合部２１１は、第１レイヤ符号化部２０２から入力される第１レイヤ符号化情報と、第２レイヤ符号化部２０６から入力される第２レイヤ符号化情報と、第３レイヤ符号化部２１０から入力される第３レイヤ符号化情報とを統合する。符号化情報統合部２１１は、統合した情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路１０２に出力する。

【0036】

次に、第２レイヤ符号化部２０６における処理を説明する。第２レイヤ符号化部２０６における処理は、特許文献１の図７に示す「High frequency Coding」における処理と同様である。つまり、第２レイヤ符号化部２０６は、第１レイヤ復号スペクトル（特許文献１の図７中のＸ＾_Ｌ（ｋ））と、入力スペクトル（特許文献１の図７中のＸ_Ｈ（ｋ））とから、復号装置側で高域スペクトルを生成するためのパラメータ（特許文献１では、スペクトルインデックスｉ、第１ゲインパラメータα_１、第２ゲインパラメータα_２）を算出する。上述したように、第１レイヤ復号スペクトルは、低域部分（０（ｋＨｚ）〜Ｆ_ｂａｓｅ（ｋＨｚ））のスペクトルであり、入力スペクトルは、高域部分（Ｆ_ｂａｓｅ（ｋＨｚ）〜Ｆ_{ｉｎｐｕｔ}（ｋＨｚ））のスペクトルである。なお、以下の説明で用いる、上記３つのパラメータは、特許文献１に開示されている方法で算出されたパラメータとする。

【0037】

ここで、特許文献１および非特許文献１に開示されている上記３つのパラメータの算出方法について説明する。

【0038】

まず、第１レイヤ復号スペクトルＸ１（ｋ）に対して、入力スペクトルＸ（ｋ）の高域部分（Ｆ_ｂａｓｅ（ｋＨｚ）〜Ｆ_{ｉｎｐｕｔ}（ｋＨｚ））のスペクトルに類似する部分を探索する。具体的には、以下の式（９）の値（Ｓ（ｄ））が最大となるスペクトルインデックスを探索し、このスペクトルインデックスをｉとする。ここで、式（９）において、ｊはサブバンドインデックスであり、ｄは探索時のスペクトルインデックスであり、ｎ_ｊはサブバンドｊに対する探索範囲（探索エントリ数）を示す。

【数9】

【0039】

次に、式（９）を最大とスペクトルインデックスｉを用いて、式（１０）に従って、第１ゲインパラメータα_１を算出する。

【数10】

【0040】

次に、式（９）および式（１０）で算出されたスペクトルインデックスｉとゲインパラメータα_１を用いて、式（１１）に従って、第２ゲインパラメータα_２を算出する。

【数11】

【0041】

ここで、式（１１）において、Ｍｊは以下の式（１２）を満たす値とする。

【数12】

【0042】

つまり、まず第２符号化レイヤでは、第１復号スペクトルに対して、入力スペクトルの高域部分に最も近似する部分を探索する。この探索により、近似するスペクトル部分を表すスペクトルインデックスｉとともに、その時の理想ゲインを第１ゲインパラメータα_１として算出する。その後、スペクトルインデックスｉとその時の理想ゲインである第１ゲインパラメータα_１とから算出される高域スペクトルと、入力スペクトルの高域部分とに対して、対数領域上でエネルギを調整するゲインパラメータである第２ゲインパラメータα_２を算出する。

【0043】

次に、第２レイヤ復号部２０７における処理を説明する。なお、第２レイヤ復号部２０７における処理は、特許文献１の図７に示す「High frequency generation」における処理と、一部に関して同一である。

【0044】

まず、第２レイヤ復号部２０７は、式（１３）のようにして、高域部分（Ｆ_ｂａｓｅ（ｋＨｚ）〜Ｆ_{ｉｎｐｕｔ}（ｋＨｚ））の高域スペクトルＸ１’^ｊ_Ｈ（ｋ）を生成する。すなわち、第２レイヤ復号部２０７は、第２レイヤ符号化情報に含まれるパラメータ（スペクトルインデックスｉ、第１ゲインパラメータα_１、第２ゲインパラメータα_２）のうち、スペクトルインデックスｉと、第１レイヤ復号スペクトルＸ１（ｋ）とから、高域スペクトルＸ１’^ｊ_Ｈ（ｋ）を生成する。ここで、式（１３）において、ｊはサブバンドインデックスであり、スペクトルインデックスｉは各サブバンドに対して設定されているものとする。また、ここで、スペクトルインデックスｉ、第１ゲインパラメータα_１、および第２ゲインパラメータα_２は、特許文献１に開示されている方法（上述）で算出されるパラメータである。

【0045】

つまり、式（１３）は、第１復号スペクトルのスペクトルインデックスｉ_ｊが示すインデックス以降のサブバンドインデックスｊのサブバンド幅分のスペクトルを高域部分のスペクトルとして近似する処理を示している。

【数13】

【0046】

次に、第２レイヤ復号部２０７は、式（１３）により算出された高域スペクトルＸ１’^ｊ_Ｈ（ｋ）に対して、以下の式（１４）のようにして、第１ゲインパラメータα_１を乗じて、第２レイヤ復号スペクトルＸ２^ｊ_Ｈ（ｋ）を算出する。

【数14】

【0047】

次に、第２レイヤ復号部２０７は、式（１４）により算出された第２レイヤ復号スペクトルＸ２^ｊ_Ｈ（ｋ）を加算部２０８に出力する。

【0048】

つまり、本実施の形態の第２レイヤ復号部２０７は、特許文献１の図７に示す「High frequency generation」とは異なり、第２ゲインパラメータα_２を利用せずに、高域スペクトル（第２レイヤ復号スペクトル）を生成する。これは、上位レイヤで量子化対象となる第２レイヤ差分スペクトルのエネルギを小さくするためであり、この処理によって、上位レイヤでは符号化効率を向上させることができる。

【0049】

次に、第３レイヤ符号化部２１０における処理を説明する。図３は、第３レイヤ符号化部２１０の内部構成を示すブロック図である。図３に示すように、第３レイヤ符号化部２１０は、形状符号化部３０１、利得符号化部３０２、多重化部３０３から主に構成される。各部は以下の動作を行う。

【0050】

形状符号化部３０１は、加算部２０９から入力される第２レイヤ差分スペクトルに対して、サブバンド毎に形状量子化を行う。具体的には、まず、形状符号化部３０１は、第２レイヤ差分スペクトルをＬ個のサブバンドに分割する。なお、ここで、サブバンド数Ｌは、第２レイヤ符号化部２０６におけるサブバンド数と同じとする。次に、形状符号化部３０１は、Ｌ個の各サブバンドに対して、ＳＱ個の形状コードベクトルからなる内蔵の形状コードブックを探索して下記の式（１５）の評価尺度Ｓｈａｐｅ＿ｑ（ｉ）が最大となる形状コードベクトルのインデックスを求める。

【数15】

【0051】

この式において、ＳＣ^ｉ_ｋは形状コードブックを構成する形状コードベクトルを示し、ｉは形状コードベクトルのインデックスを示し、ｋは形状コードベクトルの要素のインデックスを示す。また、Ｗ（ｊ）はバンドインデックスがｊであるバンドのバンド幅を表す。また、Ｘ２’^ｊ_Ｈ（ｋ）はバンドインデックスがｊである第２レイヤ差分スペクトルの値を表すものとする。

【0052】

形状符号化部３０１は、上記の式（１５）の評価尺度Ｓｈａｐｅ＿ｑ（ｉ）が最大となる形状コードベクトルのインデックスＳ＿ｍａｘを形状符号化情報として多重化部３０３に出力する。また、形状符号化部３０１は、下記の式（１６）に従い、理想利得Ｇａｉｎ＿ｉ（ｊ）を算出し、算出した理想利得Ｇａｉｎ＿ｉ（ｊ）を利得符号化部３０２に出力する。

【数16】

【0053】

利得符号化部３０２には、形状符号化部３０１から理想利得Ｇａｉｎ＿ｉ（ｊ）が入力される。また、利得符号化部３０２には、第２レイヤ符号化部２０６から第２レイヤ符号化情報が入力される。

【0054】

利得符号化部３０２は、下記の式（１７）に従い、形状符号化部３０１から入力される理想利得Ｇａｉｎ＿ｉ（ｊ）を量子化する。ここでも、利得符号化部３０２は、理想利得をＬ次元ベクトルとして扱い、ベクトル量子化を行う。また、式（１７）において、β（ｊ）は予め設定された定数であり、以下では予測利得と呼ぶ。予測利得β（ｊ）についての説明は後述する。

【数17】

【0055】

この式において、ＧＣ^ｉ_ｊは利得コードブックを構成する利得コードベクトルを示し、ｉは利得コードベクトルのインデックスを示し、ｊは利得コードベクトルの要素のインデックスを示す。

【0056】

利得符号化部３０２は、ＧＱ個の利得コードベクトルからなる内蔵の利得コードブックを探索して、上記の式（１７）を最小にする利得コードブックのインデックスＧ＿ｍｉｎを、利得符号化情報として多重化部３０３に出力する。

【0057】

次に、式（１７）における予測利得β（ｊ）の設定方法について説明する。予測利得β（ｊ）は、第２レイヤ符号化部２０６における第２ゲインパラメータα_２に対応して、サブバンド毎（ｊはサブバンドインデックス）に予め設定された定数であり、第２ゲインパラメータα_２の量子化時に利用するコードブックに併記して格納される。つまり、第２ゲインパラメータα_２の量子化時の各コードベクトルに対して、それぞれ予測利得β（ｊ）が設定される。これにより、追加の情報量を使わずに、復号装置１０３（符号化装置１０１内のローカルデコード処理も含む）において、第２ゲインパラメータα_２に対応した予測利得β（ｊ）を得ることが出来る。なお、予測利得β（ｊ）の値は、第２ゲインパラメータα_２の値に対して、その時の形状符号化部３０１にて算出される理想利得Ｇａｉｎ＿ｉ（ｊ）がどのような値であったかを、統計的に分析し、決定された数値である。

【0058】

具体的には、第２ゲインパラメータα_２の値が大きかった場合（１．０に近い場合）には、第２差分スペクトルのエネルギは比較的小さい傾向がある。したがって、その場合には、予測利得β（ｊ）の値は、小さくなる。また、第２ゲインパラメータα_２の値が小さかった場合（０．０に近い場合）には、第２差分スペクトルのエネルギは比較的大きい傾向がある。したがって、その場合には、予測利得β（ｊ）の値は、大きくなる。

【0059】

利得符号化部３０２は、このような特性を用いて、非常に長いサンプルデータを入力として、第２ゲインパラメータα_２の値に対応する理想利得Ｇａｉｎ＿ｉ（ｊ）の値を統計的に分析する。そして、利得符号化部３０２は、第２ゲインパラメータα_２のコードブックに格納される第２ゲインパラメータα_２の各値に対応して、予測利得β（ｊ）の値を決定する。以上が、式（１７）における予測利得β（ｊ）の設定方法である。

【0060】

多重化部３０３は、形状符号化部３０１から入力される形状符号化情報Ｓ＿ｍａｘ、および利得符号化部３０２から入力される利得符号化情報Ｇ＿ｍｉｎを多重化し、第３レイヤ符号化情報として符号化情報統合部２１１に出力する。

【0061】

以上が、第３レイヤ符号化部２１０の構成についての説明である。

【0062】

以上が、符号化装置１０１の構成についての説明である。

【0063】

次いで、図１に示した復号装置１０３について説明する。

【0064】

図４は、復号装置１０３の内部の主要な構成を示すブロック図である。復号装置１０３は、符号化情報分離部４０１、第１レイヤ復号部４０２、アップサンプリング処理部４０３、直交変換処理部４０４、第２レイヤ復号部４０５、第３レイヤ復号部４０６、加算部４０７、および直交変換処理部４０８から主に構成される。各部は以下の動作を行う。

【0065】

符号化情報分離部４０１には、伝送路１０２を介して符号化装置１０１から伝送される符号化情報が入力される。符号化情報分離部４０１は、符号化情報を、第１レイヤ符号化情報、第２レイヤ符号化情報、および第３レイヤ符号化情報に分離する。次に、符号化情報分離部４０１は、第１レイヤ符号化情報を第１レイヤ復号部４０２に出力し、第２レイヤ符号化情報を第２レイヤ復号部４０５に出力し、第３レイヤ符号化情報を第３レイヤ復号部４０６に出力する。

【0066】

また、符号化情報分離部４０１は、符号化情報中に第３レイヤ符号化情報が含まれるか否かを検知し、検知結果に応じて、第２レイヤ復号部４０５の動作を制御する。具体的には、符号化情報分離部４０１は、符号化情報中に第３レイヤ符号化情報が含まれる場合には、第２レイヤ制御情報ＣＩの値を０に設定し、そうでない場合には第２レイヤ制御情報ＣＩの値を１に設定する。次に、符号化情報分離部４０１は、第２レイヤ制御情報ＣＩを第２レイヤ復号部４０５に出力する。

【0067】

第１レイヤ復号部４０２は、符号化情報分離部４０１から入力される第１レイヤ符号化情報に対して、例えばＣＥＬＰ方式の音声復号方法を用いて復号を行って第１レイヤ復号信号を生成する。第１レイヤ復号部４０２は、生成した第１レイヤ復号信号をアップサンプリング処理部４０３に出力する。

【0068】

アップサンプリング処理部４０３は、第１レイヤ復号部４０２から入力される第１レイヤ復号信号のサンプリング周波数をＳＲ_ｂａｓｅからＳＲ_{ｉｎｐｕｔ}までアップサンプリングする。アップサンプリング処理部４０３は、アップサンプリングした第１レイヤ復号信号をアップサンプリング後第１レイヤ復号信号として、直交変換処理部４０４に出力する。

【0069】

直交変換処理部４０４は、バッファｂｕｆ３_ｎ（ｎ＝０、…、Ｎ−１）を内部に有し、アップサンプリング処理部４０３から入力されるアップサンプリング後第１レイヤ復号信号ｘ１_ｎを修正離散コサイン変換（ＭＤＣＴ：Modified Discrete Cosine Transform）する。直交変換処理部４０４は、アップサンプリング後第１レイヤ復号信号ｘ１_ｎを直交変換処理して、第１レイヤ復号スペクトルＸ１（ｋ）を算出する。直交変換処理部４０４の処理は、直交変換処理部２０５の処理と同様であるため、ここでは説明を省略する。直交変換処理部４０４は、得られた第１レイヤ復号スペクトルＸ１（ｋ）を第２レイヤ復号部４０５に出力する。

【0070】

第２レイヤ復号部４０５には、符号化情報分離部４０１から第２レイヤ符号化情報および第２レイヤ制御情報が入力される。また、第２レイヤ復号部４０５には、直交変換処理部４０４から第１レイヤ復号スペクトルＸ１（ｋ）が入力される。第２レイヤ復号部４０５は、第２レイヤ制御情報の値に応じて、復号方法を切り替えて、第１レイヤ復号スペクトルＸ１（ｋ）と第２レイヤ符号化情報とから、第２レイヤ復号スペクトルを算出する。次に、第２レイヤ復号部４０５は、第２レイヤ復号スペクトルおよび第１レイヤ復号スペクトルから第１加算スペクトルを算出し、これを加算部４０７に出力する。なお、第２レイヤ復号部４０５の詳細については後述する。

【0071】

第３レイヤ復号部４０６には、符号化情報分離部４０１から第３レイヤ符号化情報が入力される。第３レイヤ復号部４０６は、第３レイヤ符号化情報を復号し、第３レイヤ復号スペクトルを算出する。次に、第３レイヤ復号部４０６は算出した第３レイヤ復号スペクトルを加算部４０７に出力する。なお、第３レイヤ復号部４０６の詳細については後述する。

【0072】

加算部４０７には、第２レイヤ復号部４０５から第１加算スペクトルが入力される。また、加算部４０７には、第３レイヤ復号部４０６から第３レイヤ復号スペクトルが入力される。加算部４０７は、第１加算スペクトルと第３レイヤ復号スペクトルとを周波数軸上で加算し、第２加算スペクトルを算出する。次に、加算部４０７は、算出した第２加算スペクトルを直交変換処理部４０８に出力する。

【0073】

直交変換処理部４０８は、加算部４０７から入力される第２加算スペクトルに対して直交変換を施し、時間領域の信号に変換する。直交変換処理部４０８は、得られた信号を出力信号として出力する。直交変換処理部４０８の処理の詳細は後述する。

【0074】

次に、第２レイヤ復号部４０５における処理を説明する。なお、第２レイヤ復号部４０５における処理は、符号化装置１０１内の第２レイヤ復号部２０７と、一部に関して同一である。

【0075】

まず、第２レイヤ復号部４０５は、先に示した式（１３）のようにして、高域部分（Ｆ_ｂａｓｅ（ｋＨｚ）〜Ｆ_{ｉｎｐｕｔ}（ｋＨｚ））の高域スペクトルＸ１’^ｊ_Ｈ（ｋ）を生成する。すなわち、第２レイヤ復号部４０５は、第２レイヤ符号化情報に含まれるパラメータ（スペクトルインデックスｉ、第１ゲインパラメータα_１、第２ゲインパラメータα_２）のうち、スペクトルインデックスｉと、第１レイヤ復号スペクトルＸ１（ｋ）とから、高域スペクトルＸ１’^ｊ_Ｈ（ｋ）を生成する。ここで、式（１３）において、ｊはサブバンドインデックスであり、スペクトルインデックスｉは各サブバンドに対して設定されているものとする。また、ここで、スペクトルインデックスｉ、第１ゲインパラメータα_１、および第２ゲインパラメータα_２は、特許文献１に開示されている方法（上述）で算出されるパラメータである。

【0076】

つまり、式（１３）は、第１復号スペクトルのスペクトルインデックスｉ_ｊが示すインデックス以降のサブバンドインデックスｉのサブバンド幅分のスペクトルを高域部分のスペクトルとして近似する処理を示している。

【0077】

次に、第２レイヤ復号部４０５は、式（１３）により算出された高域スペクトルＸ１’
^ｊ_Ｈ（ｋ）に対して、式（１８）のようにして、第１ゲインパラメータα_１を乗じて、高域スペクトルＸ１”^ｊ_Ｈ（ｋ）を算出する。

【数18】

【0078】

次に、第２レイヤ復号部４０５は、入力される第２レイヤ制御情報ＣＩの値に応じて、以下の式（１９）に従って、第２レイヤ復号スペクトルＸ２^ｊ_Ｈ（ｋ）を算出する。ここで、式（１９）において、ζ（ｋ）は、高域スペクトルＸ１”^ｊ_Ｈ（ｋ）の値が負の場合には−１となり、そうでない場合は＋１となる変数である。また、Ｍ_ｊは以下の式（２０）を満たす値である。

【数19】

【数20】

【0079】

第２レイヤ復号部４０５は、第２レイヤ制御情報ＣＩの値が０の場合、すなわち、符号化情報中に第３レイヤ符号化情報が含まれる場合には、符号化装置１０１内の第２レイヤ復号部２０７で算出した方法と同様の方法で、第２レイヤ復号スペクトルを算出する。また、第２レイヤ復号部４０５は、第２レイヤ制御情報ＣＩの値が１の場合、すなわち、符号化情報中に第３レイヤ符号化情報が含まれない場合には、上記第２レイヤ復号部２０７で算出した方法とは異なる方法で、第２レイヤ復号スペクトルを算出する。具体的には、第２レイヤ復号部４０５は、第２レイヤ制御情報ＣＩの値が１の場合、特許文献１および非特許文献１に開示されているような、対数領域でのゲインパラメータ（第２ゲインパラメータα_２）を利用して、第２レイヤ復号スペクトルを算出する。

【0080】

上記で説明したように、加算部４０７では、第２レイヤ復号部４０５において復号された第１加算スペクトルと、第２レイヤ復号部４０５の上位レイヤの第３レイヤ復号部４０６において復号された第３レイヤ復号スペクトルとが加算される。そのため、上位レイヤの第３復号スペクトルが存在する場合には、第２レイヤ復号部４０５は、符号化装置１０１内の第２レイヤ復号部２０７に対応するような復号方法を採るようにした。これにより、加算部４０７において加算された状態で最も精度の高いスペクトルが算出されるようにした。

【0081】

一方、上位レイヤの第３復号スペクトルが存在しない場合には、第１加算スペクトルは、第３レイヤ復号スペクトルに加算されない。そのため、第２レイヤ復号部４０５は、信号レベル（ＳＮＲ）では低くなるものの、聴感的には入力信号により近くするような復号方法を採るようにした。

【0082】

次に、第２レイヤ復号部４０５は、式（１９）により算出された第２レイヤ復号スペクトルＸ２^ｊ_Ｈ（ｋ）と第１レイヤ復号スペクトルＸ１（ｋ）とを、周波数領域上で加算し、第１加算スペクトルを算出する。ここで、第１レイヤ復号スペクトルＸ１（ｋ）はサンプリング周波数ＳＲ_ｂａｓｅに対応する低域部分（０（ｋＨｚ）〜Ｆ_ｂａｓｅ（ｋＨｚ））に値をもつスペクトルである。また、第２レイヤ復号スペクトルＸ２^ｊ_Ｈ（ｋ）はサンプリング周波数ＳＲ_{ｉｎｐｕｔ}に対応する高域部分（Ｆ_ｂａｓｅ（ｋＨｚ）〜Ｆ_{ｉｎｐｕｔ}（ｋＨｚ））に値をもつスペクトルである。すなわち、これらのスペクトルを加算して得られる第１加算スペクトルの低域部分（０（ｋＨｚ）〜Ｆ_ｂａｓｅ（ｋＨｚ））の値は、第１レイヤ復号スペクトルとなる。また、高域部分（Ｆ_ｂａｓｅ（ｋＨｚ）〜Ｆ_{ｉｎｐｕｔ}（ｋＨｚ））の値は第２レイヤ復号スペクトルとなる。この加算処理については、符号化装置１０１内の加算部２０８の処理と同様である。

【0083】

次に、第２レイヤ復号部４０５は、算出した第１加算スペクトルを加算部４０７に出力する。

【0084】

図５は、第３レイヤ復号部４０６の主要な構成を示すブロック図である。

【0085】

この図において、第３レイヤ復号部４０６は、分離部５０１、形状復号部５０２、および利得復号部５０３を備える。

【0086】

分離部５０１は、符号化情報分離部４０１から出力される第３レイヤ符号化情報を形状符号化情報、および利得符号化情報に分離し、得られる形状符号化情報を形状復号部５０２に出力し、利得符号化情報を利得復号部５０３に出力する。

【0087】

形状復号部５０２は、分離部５０１から入力される形状符号化情報を復号し、求められた形状の値を利得復号部５０３に出力する。形状復号部５０２は、第３レイヤ符号化部２１０の形状符号化部３０１が備える形状コードブックと同様な形状コードブックを内蔵する。形状復号部５０２は、分離部５０１から入力される形状符号化情報Ｓ＿ｍａｘをインデックスとする形状コードベクトルを探索する。形状復号部５０２は、探索された形状コードベクトルを、利得復号部５０３に出力する。ここでは、形状の値として探索された形状コードベクトルをＳｈａｐｅ＿ｑ（ｋ）（ｋ＝０，…，Ｂ（ｊ）−１）と記す。

【0088】

利得復号部５０３には、分離部５０１から利得符号化情報が入力される。利得復号部５０３は、第３レイヤ符号化部２１０の利得符号化部３０２が備える利得コードブックと同様な利得コードブックを内蔵し、この利得コードブックを用いて、下記の式（２１）に従い、利得の値を逆量子化する。ここでも、利得復号部５０３は、利得値をＬ次元ベクトルとして扱い、ベクトル逆量子化を行う。ここで、予測利得β（ｊ）は、利得符号化情報が示すインデックスを用いて、上記利得コードブックから参照される値である。

【数21】

【0089】

なお、式（２１）の処理は、符号化装置１０１内の第３レイヤ符号化部２１０にて利得コードベクトルの探索に用いた式（１７）の逆処理に相当する。すなわち、利得符号化情報Ｇ＿ｍｉｎに対応する利得コードベクトルＧＣ_ｊ^{Ｇ＿ｍｉｎ}をそのまま利得値とするのではなく、利得コードベクトルＧＣ_ｊ^{Ｇ＿ｍｉｎ}に対して、予測利得β（ｊ）を加算した値を利得値とする。もちろん、ここで参照する予測利得β（ｊ）の値は、利得情報の符号化時に参照した予測利得β（ｊ）と同値である。

【0090】

次いで、利得復号部５０３は、現フレームの逆量子化で得られる利得値、および形状復号部５０２から入力される形状の値を用いて、下記の式（２２）に従い、第３レイヤ復号スペクトルＸ３（ｋ）として復号ＭＤＣＴ係数を算出する。ここでは、算出された復号ＭＤＣＴ係数をＸ３（ｋ）と記す。

【数22】

【0091】

利得復号部５０３は、上記の式（２２）に従い算出された第３レイヤ復号スペクトルＸ３（ｋ）を加算部４０７に出力する。

【0092】

以上が、第３レイヤ復号部４０６の処理説明である。

【0093】

以下、直交変換処理部４０８における具体的な処理について説明する。

【0094】

直交変換処理部４０８は、バッファｂｕｆ４（ｋ）を内部に有しており、下記の式（２３）に示すようにバッファｂｕｆ４（ｋ）を初期化する。

【数23】

【0095】

また、直交変換処理部４０８は、加算部４０７から入力される第２加算スペクトルＸ＿ａｄｄ（ｋ）を用いて下記の式（２４）に従い、復号信号ｙ_ｎを求めて出力する。

【数24】

【0096】

式（２４）において、Ｚ２（ｋ）は、下記の式（２５）に示すように、第２加算スペクトルＸ＿ａｄｄ（ｋ）とバッファｂｕｆ４（ｋ）とを結合させたベクトルである。

【数25】

【0097】

次に、直交変換処理部４０８は、下記の式（２６）に従いバッファｂｕｆ４（ｋ）を更新する。

【数26】

【0098】

次に、直交変換処理部４０８は、復号信号ｙ_ｎを出力信号として出力する。

【0099】

以上が、復号装置１０３の内部構成の説明である。

【0100】

このように、本実施の形態によれば、符号化装置／復号装置が、階層符号化／復号方式を用い、かつ、下位レイヤに低域部のスペクトルデータに基づいて高域部のスペクトルデータを符号化する帯域拡張技術を適用する場合に、上位レイヤにおいても効率的に差分スペクトル（差分信号）を符号化し、復号信号の品質を改善することができる。具体的には、帯域拡張処理を行う第２レイヤ復号部２０７は、上位レイヤの第３レイヤ符号化部２１０において符号化対象となるスペクトル（差分スペクトル）を、低域部のスペクトルを用いて生成した高域部のスペクトルのエネルギを調整する利得情報（第２ゲインパラメータα_２）を用いずに、差分スペクトルのエネルギを最小にするような利得情報（第１ゲインパラメータα_１）を用いて算出する。これにより、上位レイヤの第３レイヤ符号化部２１０では、エネルギが小さい差分スペクトルが符号化されるようになるので、符号化効率を向上させることができる。

【0101】

また、第３レイヤ符号化部２１０は、帯域拡張処理時に算出された利得情報（上述の第２ゲインパラメータα_２が該当）から統計的に算出される利得値（予測利得β（ｊ）が該当）を利得情報から減算した誤差成分を、差分スペクトルの利得情報として量子化する。これにより、さらに符号化効率を向上させることができる。

【0102】

なお、本実施の形態では、式（１９）のように、下位レイヤにおける差分スペクトル（第２レイヤ差分スペクトル）の算出方法を、フレーム単位で切り替える構成について説明した。しかし、本発明はこれに限らず、フレーム内のサブバンド単位で、算出方法を切り替える構成についても同様に適用できる。例えば、非特許文献２に開示されているように、上位レイヤが、フレーム毎に量子化対象とする帯域を選択するような場合（非特許文献２におけるＢＳ−ＳＧＣ（Band Selective Shape Gain Coding）が該当）に対しても、本発明を適用できる。この場合、例えば、上位レイヤにおいて量子化対象として選択されたサブバンドに対しては、下位レイヤは、式（１９）においてＣＩ＝０の場合の処理をして差分スペクトルを算出する。また、量子化対象として選択されないサブバンドに対しては、下位レイヤは、式（１５）においてＣＩ＝１の場合の処理をして、差分スペクトルを算出する。このようにして、サブバンド毎に差分スペクトルの算出方法を切り替えることによって、上位レイヤの符号化効率を向上させることができる。

【0103】

なお、本実施の形態では、帯域拡張処理を行うレイヤよりも上位レイヤにおいて、誤差成分を、差分スペクトルの利得情報として量子化する構成を例に挙げて説明した。ここで、誤差成分とは、利得情報から、帯域拡張処理時に算出した利得情報（上述の第２ゲインパラメータα_２が該当）から統計的に算出される利得値（予測利得β（ｊ）が該当）を減算した成分である。しかし、本発明はこれに限られず、例えば、上位レイヤにおいて、予測利得β（ｊ）を用いずに、利得情報を量子化する構成に対しても本発明を同様に適用できる。この場合、利得情報の量子化精度は若干劣化するものの、コードブック内に予測利得β（ｊ）を格納しなくてもよくなるため、メモリの削減に繋がる。また、例えば、上位レイヤにおいて、利得情報から統計的に算出される利得値（予測利得β（ｊ）が該当）で利得情報を除算し、誤差成分として除算結果を量子化する構成についても同様に本発明を適用できる。また、この場合、除算の処理演算量が大きくなるため、予めコードブック内には予測利得β（ｊ）の逆数を記憶しておき、実際の除算結果の算出時には、除算ではなく、乗算するという構成でももちろん構わない。また、この場合には、復号装置における復号時には、符号化装置における処理と対応させるために、復号利得に対して予測利得β（ｊ）を加算するのではなく、乗算（あるいは除算）することにより、最終的な復号利得値を算出する。

【0104】

なお、本実施の形態では、第１レイヤ符号化部／復号部において、ＣＥＬＰタイプの符号化／復号方法を採る構成を例に挙げて説明したが、本発明はこれに限らない。例えば、ＣＥＬＰタイプ以外の符号化方法、または周波数軸上での符号化方法を採る場合についても同様に本発明を適用できる。なお、第１レイヤ符号化部において、周波数軸上での符号化方法を採る場合には、入力信号をまず直交変換処理してから低域部分を符号化し、得られる復号スペクトルをそのまま第２レイヤ符号化部に入力すればよい。そのため、この場合には、ダウンサンプリング処理部、アップサンプリング処理部などの処理が不要となる。

【0105】

また、本実施の形態に係る復号装置は、上記符号化装置から伝送された符号化情報を用いて処理を行うとした。しかし、本発明はこれに限定されず、必要なパラメータやデータを含む符号化情報であれば、必ずしも上記符号化装置からの符号化情報でなくても、復号装置は処理を行うことが可能である。

【0106】

また、信号処理プログラムを、メモリ、ディスク、テープ、ＣＤ、ＤＶＤ等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。

【0107】

また、本実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

【0108】

また、本実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されてもよいし、一部または全てを含むように１チップ化されてもよい。ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

【0109】

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル／プロセッサを利用してもよい。

【0110】

さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

【0111】

２００９年１１月１２日出願の特願２００９−２５８８４１に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。

【産業上の利用可能性】

【0112】

本発明に係る符号化装置、復号装置およびこれらの方法は、低域部のスペクトルを用いて帯域拡張を行い高域部のスペクトルを推定する技術（帯域拡張技術）を、階層符号化／復号方式に適用した場合に、上位レイヤにおいても効率的に符号化し、復号信号の品質を改善することができ、例えば、パケット通信システム、移動通信システムなどに好適である。

【符号の説明】

【0113】

１０１符号化装置
１０２伝送路
１０３復号装置
２０１ダウンサンプリング処理部
２０２第１レイヤ符号化部
２０３、４０２第１レイヤ復号部
２０４、４０３アップサンプリング処理部
２０５、４０４、４０８直交変換処理部
２０６第２レイヤ符号化部
２０７、４０５第２レイヤ復号部
２０８、２０９、４０７加算部
２１０第３レイヤ符号化部
２１１符号化情報統合部
３０１形状符号化部
３０２利得符号化部
３０３多重化部
４０１符号化情報分離部
４０６第３レイヤ復号部
５０１分離部
５０２形状復号部
５０３利得復号部

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第5774490号(P5774490)IP Force 特許公報掲載プロジェクト 2022.1.31 β版