特許5730303 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニック　インテレクチュアル　プロパティ　コーポレーション　オブ　アメリカの特許一覧

特許5730303復号装置、符号化装置およびこれらの方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5730303

(24)【登録日】2015年4月17日

(45)【発行日】2015年6月10日

(54)【発明の名称】復号装置、符号化装置およびこれらの方法

(51)【国際特許分類】

G10L 21/0388 20130101AFI20150521BHJP

【ＦＩ】

G10L21/0388 100

【請求項の数】15

【全頁数】36

(21)【出願番号】特願2012-521284(P2012-521284)

(86)(22)【出願日】2011年6月7日

(86)【国際出願番号】JP2011003196

(87)【国際公開番号】WO2011161886

(87)【国際公開日】20111229

【審査請求日】2014年1月31日

(31)【優先権主張番号】特願2011-47597(P2011-47597)

(32)【優先日】2011年3月4日

(33)【優先権主張国】JP

(31)【優先権主張番号】特願2010-141021(P2010-141021)

(32)【優先日】2010年6月21日

(33)【優先権主張国】JP

(73)【特許権者】

【識別番号】514136668

【氏名又は名称】パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ

【氏名又は名称原語表記】ＰａｎａｓｏｎｉｃＩｎｔｅｌｌｅｃｔｕａｌＰｒｏｐｅｒｔｙＣｏｒｐｏｒａｔｉｏｎｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】100105050

【弁理士】

【氏名又は名称】鷲田公一

(72)【発明者】

【氏名】山梨智史

(72)【発明者】

【氏名】押切正浩

【審査官】井上健一

(56)【参考文献】

【文献】国際公開第２０１０／０９８１１２（ＷＯ，Ａ１）

【文献】国際公開第２００５／１１１５６８（ＷＯ，Ａ１）

【文献】特開２００７−０１７９０８（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ２１／０３８８

(57)【特許請求の範囲】

【請求項1】

音声信号又は音楽信号の所定周波数以下の低域部分を示す第１符号化情報と、前記音声信号又は音楽信号の前記所定周波数より高い高域部分を分割した複数のサブバンドにおいて、前記音声信号又は音楽信号の高域部分のスペクトルを推定するための帯域情報、および、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整する第１振幅調整パラメータ、を含む第２符号化情報と、を受信する受信手段と、
前記第１符号化情報を復号して第１復号信号を生成する第１復号手段と、
前記第２符号化情報を用いて、前記第１復号信号から前記音声信号又は音楽信号の高域部分を推定し、スペクトル成分の振幅を調整することにより第２復号信号を生成する第２復号手段と、を具備する復号装置であって、
前記第２復号手段は、
推定した前記音声信号又は音楽信号の高域部分のスペクトルに対して、スペクトル成分を部分的に選択するスペクトル成分選択手段と、
前記部分的に選択されたスペクトル成分に対して第２振幅調整パラメータを適用する第１振幅調整パラメータ適用手段と、
前記部分的に選択されなかったスペクトル成分に対して前記第２振幅調整パラメータの値に応じて適応的に設定される第３振幅調整パラメータを適用する第２振幅調整パラメータ適用手段と、を具備する、
復号装置。

【請求項2】

前記第２復号手段は、
推定した前記音声信号又は音楽信号の高域部分のスペクトルに対して、振幅値が最大又は最小であるスペクトル成分を前記サブバンド毎に探索する振幅値探索手段、
をさらに具備し、
前記スペクトル成分選択手段は、前記振幅値が最大または最小であるスペクトル成分に近接するスペクトル成分ほど選択されやすい重みにより、スペクトル成分を部分的に選択する、
請求項１の復号装置。

【請求項3】

前記第２復号手段は、
前記第１復号信号のスペクトルに対して、前記第２符号化情報に含まれる前記音声信号又は音楽信号の高域部分のスペクトルの各サブバンドに最も近似する前記第１復号信号のスペクトルの帯域を示す前記帯域情報を用いて、前記音声信号又は音楽信号の高域部分のスペクトルを推定し、前記第２符号化情報に含まれる前記第１振幅調整パラメータを用いて、前記推定した音声信号又は音楽信号の高域部分のスペクトル成分の振幅を調整する、
請求項１に記載の復号装置。

【請求項4】

前記第１振幅調整パラメータ適用手段は、対数領域での振幅の調整を行い、
前記第２振幅調整パラメータ適用手段は、線形領域での振幅の調整を行う、
請求項１に記載の復号装置。

【請求項5】

前記第２振幅調整パラメータ適用手段は、前記第２振幅調整パラメータの値が予め設定された閾値より小さい場合には、前記第３振幅調整パラメータを小さく設定し、前記第２振幅調整パラメータの値が前記閾値以上の場合には、前記第３振幅調整パラメータを大きく設定する、
請求項１に記載の復号装置。

【請求項6】

請求項１に記載の復号装置を具備する通信端末装置。

【請求項7】

請求項１に記載の復号装置を具備する基地局装置。

【請求項8】

音声信号、楽音信号、及び、これらが混在した信号（以下、入力信号という）の所定周波数以下の低域部分を符号化して第１符号化情報を生成する第１符号化手段と、
前記第１符号化情報を復号して第１復号信号を生成する復号手段と、
前記入力信号の前記所定周波数より高い高域部分を分割した複数のサブバンドにおいて、前記入力信号の高域部分のスペクトルを推定するための帯域情報、および、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整する第１振幅調整パラメータ、を含む第２符号化情報を生成する第２符号化手段と、
前記第２符号化情報を用いて、前記第１復号信号から前記入力信号の高域部分を推定し、スペクトル成分の振幅を調整することにより第２復号信号を生成する第２復号手段と、
前記第１復号信号および前記第２復号信号と、前記入力信号との差分信号を符号化し、第３符号化情報を生成する第３符号化手段と、を具備する符号化装置であって、
前記第２復号手段は、
推定した前記入力信号の高域部分のスペクトルに対して、スペクトル成分を部分的に選択するスペクトル成分選択手段と、
前記部分的に選択されたスペクトル成分に対して第２振幅調整パラメータを適用する第１振幅調整パラメータ適用手段と、
前記部分的に選択されなかったスペクトル成分に対して前記第２振幅調整パラメータの値に応じて適応的に設定される第３振幅調整パラメータを適用する第２振幅調整パラメータ適用手段と、を具備する、
符号化装置。

【請求項9】

前記第２復号手段は、
推定した前記入力信号の高域部分のスペクトルに対して、振幅値が最大または最小であるスペクトル成分を前記サブバンド毎に探索する振幅値探索手段、
をさらに具備し、
前記スペクトル成分選択手段は、前記振幅値が最大または最小であるスペクトル成分に近接するスペクトル成分ほど選択されやすい重みにより、スペクトル成分を部分的に選択する、
請求項８に記載の符号化装置。

【請求項10】

前記第１振幅調整パラメータ適用手段は、対数領域での振幅の調整を行い、
前記第２振幅調整パラメータ適用手段は、線形領域での振幅の調整を行う、
請求項８に記載の符号化装置。

【請求項11】

前記第２振幅調整パラメータ適用手段は、前記第２振幅調整パラメータの値が予め設定された閾値より小さい場合には、前記第３振幅調整パラメータを小さく設定し、前記第２振幅調整パラメータの値が前記閾値以上の場合には、前記第３振幅調整パラメータを大きく設定する、
請求項８に記載の符号化装置。

【請求項12】

請求項８に記載の符号化装置を具備する通信端末装置。

【請求項13】

請求項８に記載の符号化装置を具備する基地局装置。

【請求項14】

音声信号又は音楽信号の所定周波数以下の低域部分を示す第１符号化情報と、前記音声信号又は音楽信号の前記所定周波数より高い高域部分を分割した複数のサブバンドにおいて、前記音声信号又は音楽信号の高域部分のスペクトルを推定するための帯域情報、および、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整する第１振幅調整パラメータ、を含む第２符号化情報と、を受信する受信ステップと、
前記第１符号化情報を復号して第１復号信号を生成する第１復号ステップと、
前記第２符号化情報を用いて、前記第１復号信号から前記音声信号又は音楽信号の高域部分を推定し、スペクトル成分の振幅を調整することにより第２復号信号を生成する第２復ステップと、を具備する復号方法であって、
前記第２復号ステップは、
推定した前記音声信号又は音楽信号の高域部分のスペクトルに対して、スペクトル成分を部分的に選択するスペクトル成分選択ステップと、
前記部分的に選択されたスペクトル成分に対して第２振幅調整パラメータを適用する第１振幅調整パラメータ適用ステップと、
前記部分的に選択されなかったスペクトル成分に対して前記第２振幅調整パラメータの値に応じて適応的に設定される第３振幅調整パラメータを適用する第２振幅調整パラメータ適用ステップと、を具備する、
復号方法。

【請求項15】

音声信号、楽音信号、及び、これらが混在した信号（以下、入力信号という）の所定周波数以下の低域部分を符号化して第１符号化情報を生成する第１符号化ステップと、
前記第１符号化情報を復号して第１復号信号を生成する復号ステップと、
前記入力信号の前記所定周波数より高い高域部分を分割した複数のサブバンドにおいて、前記入力信号の高域部分のスペクトルを推定するための帯域情報、および、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整する第１振幅調整パラメータ、を含む第２符号化情報を生成する第２符号化ステップと、
前記第２符号化情報を用いて、前記第１復号信号から前記入力信号の高域部分を推定し、スペクトル成分の振幅を調整することにより第２復号信号を生成する第２復号ステップと、
前記第１復号信号および前記第２復号信号と、前記入力信号との差分信号を符号化し、第３符号化情報を生成する第３符号化ステップと、を具備する符号化方法であって、
前記第２復号ステップは、
推定した前記入力信号の高域部分のスペクトルに対して、スペクトル成分を部分的に選択するスペクトル成分選択ステップと、
前記部分的に選択されたスペクトル成分に対して第２振幅調整パラメータを適用する第１振幅調整パラメータ適用ステップと、
前記部分的に選択されなかったスペクトル成分に対して前記第２振幅調整パラメータの値に応じて適応的に設定される第３振幅調整パラメータを適用する第２振幅調整パラメータ適用ステップと、を具備する、
符号化方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、信号を符号化して伝送する通信システムに用いられる復号装置、符号化装置およびこれらの方法に関する。

【背景技術】

【0002】

インターネット通信に代表されるパケット通信システム、または、移動通信システム等で音声・楽音信号を伝送する場合、音声・楽音信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。また、近年では、単に低ビットレートで音声・楽音信号を符号化するという一方で、より広帯域の音声・楽音信号を符号化する技術に対するニーズが高まっている。

【0003】

このようなニーズに対して、符号化後の情報量を大幅に増加させることなく広帯域の音声・楽音信号を符号化する様々な技術が開発されてきている。例えば特許文献１で開示されている技術では、符号化装置は、一定時間分の入力音響信号を変換して得られるスペクトルデータのうち、周波数の高域部のスペクトルを生成するためのパラメータを算出し、これを低域部の符号化情報と合わせて出力している。具体的には、符号化装置は、周波数の高域部のスペクトルデータを複数のサブバンドに分割し、各サブバンドにおいて、当該サブバンドのスペクトルと最も近似する低域部のスペクトルを特定するパラメータを算出する。次いで、符号化装置は、最も近似する低域部のスペクトルに対して、二種類のスケーリングファクタを用いて、生成する高域スペクトル中のピーク振幅、またはサブバンドのエネルギ（以下、サブバンドエネルギという）及び形状が、ターゲットである入力信号の高域部のスペクトルのピーク振幅、サブバンドエネルギ、形状に近くなるように調整する。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】国際公開第２００７／０５２０８８号

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、上記特許文献１では、符号化装置は、高域スペクトルを合成する際に、入力信号のスペクトルデータ及び合成している高域スペクトルデータの、すべてのサンプル（ＭＤＣＴ（Modified Discrete Cosine Transform）係数）に対して対数変換を行う。そして、符号化装置は、それぞれのサブバンドエネルギ及び形状がターゲットである入力信号の高域部のスペクトルのピーク振幅、サブバンドエネルギ、形状に近くなるようなパラメータを算出している。このため、符号化装置における演算量が非常に大きいという問題点がある。また、復号装置は、算出したパラメータをサブバンド内の全てのサンプルに適用しており、個々のサンプルの振幅の大きさは考慮していない。このため、上記算出したパラメータを用いて高域スペクトルを生成する際の復号装置における演算量も非常に大きくなり、かつ、生成される復号音声の品質が不十分であり、場合によっては異音が発生する可能性もある。

【0006】

本発明の目的は、広帯域信号の低域部のスペクトルデータに基づいて高域部のスペクトルデータを効率的に符号化し、復号信号の品質を改善することができる復号装置、符号化装置およびこれらの方法を提供することである。

【課題を解決するための手段】

【0007】

本発明の第１の態様に係る復号装置は、音声信号又は音楽信号の所定周波数以下の低域部分を示す第１符号化情報と、前記音声信号又は音楽信号の前記所定周波数より高い高域部分を分割した複数のサブバンドにおいて、前記音声信号又は音楽信号の高域部分のスペクトルを推定するための帯域情報、および、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整する第１振幅調整パラメータ、を含む第２符号化情報と、を受信する受信手段と、前記第１符号化情報を復号して第１復号信号を生成する第１復号手段と、前記第２符号化情報を用いて、前記第１復号信号から前記音声信号又は音楽信号の高域部分を推定し、スペクトル成分の振幅を調整することにより第２復号信号を生成する第２復号手段と、を具備する復号装置であって、前記第２復号手段は、推定した前記音声信号又は音楽信号の高域部分のスペクトルに対して、スペクトル成分を部分的に選択するスペクトル成分選択手段と、前記部分的に選択されたスペクトル成分に対して第２振幅調整パラメータを適用する第１振幅調整パラメータ適用手段と、前記部分的に選択されなかったスペクトル成分に対して前記第２振幅調整パラメータの値に応じて適応的に設定される第３振幅調整パラメータを適用する第２振幅調整パラメータ適用手段と、を具備する構成を採る。

【0008】

本発明の第２の態様に係る符号化装置は、入力信号の所定周波数以下の低域部分を符号化して第１符号化情報を生成する第１符号化手段と、前記第１符号化情報を復号して第１復号信号を生成する復号手段と、前記入力信号の前記所定周波数より高い高域部分を分割した複数のサブバンドにおいて、前記入力信号の高域部分のスペクトルを推定するための帯域情報、および、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整する第１振幅調整パラメータ、を含む第２符号化情報を生成する第２符号化手段と、前記第２符号化情報を用いて、前記第１復号信号から前記入力信号の高域部分を推定し、スペクトル成分の振幅を調整することにより第２復号信号を生成する第２復号手段と、前記第１復号信号および前記第２復号信号と、前記入力信号との差分信号を符号化し、第３符号化情報を生成する第３符号化手段と、を具備する符号化装置であって、前記第２復号手段は、推定した前記入力信号の高域部分のスペクトルに対して、スペクトル成分を部分的に選択するスペクトル成分選択手段と、前記部分的に選択されたスペクトル成分に対して第２振幅調整パラメータを適用する第１振幅調整パラメータ適用手段と、前記部分的に選択されなかったスペクトル成分に対して前記第２振幅調整パラメータの値に応じて適応的に設定される第３振幅調整パラメータを適用する第２振幅調整パラメータ適用手段と、を具備する構成を採る。

【0009】

本発明の第３の態様に係る復号方法は、音声信号又は音楽信号の所定周波数以下の低域部分を示す第１符号化情報と、前記音声信号又は音楽信号の前記所定周波数より高い高域部分を分割した複数のサブバンドにおいて、前記音声信号又は音楽信号の高域部分のスペクトルを推定するための帯域情報、および、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整する第１振幅調整パラメータ、を含む第２符号化情報と、を受信する受信ステップと、前記第１符号化情報を復号して第１復号信号を生成する第１復号ステップと、前記第２符号化情報を用いて、前記第１復号信号から前記音声信号又は音楽信号の高域部分を推定し、スペクトル成分の振幅を調整することにより第２復号信号を生成する第２復ステップと、を具備する復号方法であって、前記第２復号ステップは、推定した前記音声信号又は音楽信号の高域部分のスペクトルに対して、スペクトル成分を部分的に選択するスペクトル成分選択ステップと、前記部分的に選択されたスペクトル成分に対して第２振幅調整パラメータを適用する第１振幅調整パラメータ適用ステップと、前記部分的に選択されなかったスペクトル成分に対して前記第２振幅調整パラメータの値に応じて適応的に設定される第３振幅調整パラメータを適用する第２振幅調整パラメータ適用ステップと、を具備する構成を採る。

【0010】

本発明の第４の態様に係る符号化方法は、入力信号の所定周波数以下の低域部分を符号化して第１符号化情報を生成する第１符号化ステップと、前記第１符号化情報を復号して第１復号信号を生成する復号ステップと、前記入力信号の前記所定周波数より高い高域部分を分割した複数のサブバンドにおいて、前記入力信号の高域部分のスペクトルを推定するための帯域情報、および、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整する第１振幅調整パラメータ、を含む第２符号化情報を生成する第２符号化ステップと、前記第２符号化情報を用いて、前記第１復号信号から前記入力信号の高域部分を推定し、スペクトル成分の振幅を調整することにより第２復号信号を生成する第２復号ステップと、前記第１復号信号および前記第２復号信号と、前記入力信号との差分信号を符号化し、第３符号化情報を生成する第３符号化ステップと、を具備する符号化方法であって、前記第２復号ステップは、推定した前記入力信号の高域部分のスペクトルに対して、スペクトル成分を部分的に選択するスペクトル成分選択ステップと、前記部分的に選択されたスペクトル成分に対して第２振幅調整パラメータを適用する第１振幅調整パラメータ適用ステップと、前記部分的に選択されなかったスペクトル成分に対して前記第２振幅調整パラメータの値に応じて適応的に設定される第３振幅調整パラメータを適用する第２振幅調整パラメータ適用ステップと、を具備する構成を採る。

【発明の効果】

【0011】

本発明によれば、広帯域信号の高域部のスペクトルデータを効率的に符号化／復号することができ、処理演算量の大幅な削減を実現するとともに、復号信号の品質も改善することができる。

【図面の簡単な説明】

【0012】

【図1】本発明の実施の形態１に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図

【図2】本発明の実施の形態１に係る図１に示した符号化装置の内部の主要な構成を示すブロック図

【図3】本発明の実施の形態１に係る図２に示した第２レイヤ符号化部の内部の主要な構成を示すブロック図

【図4】本発明の実施の形態１に係る図３に示したゲイン符号化部の主要な構成を示すブロック図

【図5】本発明の実施の形態１に係る図４に示した対数ゲイン符号化部の主要な構成を示すブロック図

【図6】本発明の実施の形態１に係るフィルタリング部におけるフィルタリング処理の詳細について説明するための図

【図7】本発明の実施の形態１に係る探索部においてサブバンドＳＢ_ｐに対して最適ピッチ係数Ｔ_ｐ’を探索する処理の手順を示すフロー図

【図8】本発明の実施の形態１に係る図１に示した復号装置の内部の主要な構成を示すブロック図

【図9】本発明の実施の形態１に係る図８に示した第２レイヤ復号部の内部の主要な構成を示すブロック図

【図10】本発明の実施の形態１に係る図９に示したスペクトル調整部の内部の主要な構成を示すブロック図

【図11】本発明の実施の形態１に係る図１０に示した対数ゲイン復号部の内部の主要な構成を示すブロック図

【図12】本発明の実施の形態１に係る対数ゲイン復号部における対数ゲイン適用部及び補間処理部それぞれの適用対象となるサンプルについて説明するための図

【図13】本発明の実施の形態１に係るその他の符号化装置の内部の主要な構成を示すブロック図

【図14】本発明の実施の形態２に係る図１に示した符号化装置の内部の主要な構成を示すブロック図

【図15】本発明の実施の形態２に係る図１４に示した第２レイヤ符号化部の内部の主要な構成を示すブロック図

【図16】本発明の実施の形態２に係る図１５に示した第１符号化部の主要な構成を示すブロック図

【図17】本発明の実施の形態２に係る図１に示した復号装置の内部の主要な構成を示すブロック図

【図18】本発明の実施の形態２に係る図１７に示した第２レイヤ復号部の内部の主要な構成を示すブロック図

【発明を実施するための形態】

【0013】

本発明においては、符号化装置が、符号化対象となる信号の高域部のスペクトルデータを低域部のスペクトルデータに基づいて生成する際、サブバンド内で振幅が最大であるサンプルの位置に基づき抽出されたサンプル群に対してサブバンドエネルギ及び形状の調整パラメータを算出する。また、復号装置が、前記パラメータを、サブバンド内で振幅が最大であるサンプルの位置に基づき抽出されたサンプル群に対して適用する。これにより、広帯域信号の高域部のスペクトルデータを効率的に符号化／復号することができ、処理演算量の大幅な削減を実現するとともに、復号信号の品質も改善することができるものである。

【0014】

以下、本発明の各実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置および復号装置は、入力信号／出力信号として、音声信号、楽音信号、及び、これらが混在した信号、のいずれについても対象とするものとする。本発明の各実施の形態においては、音声符号化装置および音声復号装置を例にとって説明する。

【0015】

（実施の形態１）
図１は、本実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。図１において、通信システムは、符号化装置１０１と復号装置１０３とを備え、それぞれ伝送路１０２を介して通信可能な状態となっている。なお、符号化装置１０１および復号装置１０３はいずれも、通常、基地局装置あるいは通信端末装置等に搭載されて用いられる。

【0016】

符号化装置１０１は、入力信号をＮサンプルずつ区切り（Ｎは自然数）、Ｎサンプルを１フレームとしてフレーム毎に符号化を行う。ここで、符号化の対象となる入力信号をｘ_ｎ（ｎ＝０、…、Ｎ−１）と表すこととする。ｎは、Ｎサンプルずつ区切られた入力信号のうち、信号要素のｎ＋１番目を示す。符号化装置１０１は、符号化した入力情報（符号化情報）を、伝送路１０２を介して復号装置１０３に送信する。

【0017】

復号装置１０３は、伝送路１０２を介して符号化装置１０１から送信された符号化情報を受信し、これを復号し出力信号を得る。

【0018】

図２は、図１に示した符号化装置１０１の内部の主要な構成を示すブロック図である。入力信号のサンプリング周波数をＳＲ_１とすると、ダウンサンプリング処理部２０１は、入力信号のサンプリング周波数をＳＲ_１からＳＲ_２までダウンサンプリングし（ＳＲ_２＜ＳＲ_１）、ダウンサンプリングした入力信号をダウンサンプリング後入力信号として、第１レイヤ符号化部２０２に出力する。なお、以下では、一例として、ＳＲ_２はＳＲ_１の１／２のサンプリング周波数である場合について説明する。

【0019】

第１レイヤ符号化部２０２は、ダウンサンプリング処理部２０１から入力されるダウンサンプリング後入力信号に対して、例えばＣＥＬＰ（Code Excited Linear Prediction）方式の音声符号化方法を用いて符号化を行って第１レイヤ符号化情報を生成する。具体的には、第１レイヤ符号化部２０２は、入力信号の所定周波数以下の低域部分を符号化して第１レイヤ符号化情報を生成する。そして、第１レイヤ符号化部２０２は、生成した第１レイヤ符号化情報を第１レイヤ復号部２０３および符号化情報統合部２０７に出力する。

【0020】

第１レイヤ復号部２０３は、第１レイヤ符号化部２０２から入力される第１レイヤ符号化情報に対して、例えばＣＥＬＰ方式の音声復号方法を用いて復号を行って第１レイヤ復号信号を生成する。そして、第１レイヤ復号部２０３は、生成した第１レイヤ復号信号をアップサンプリング処理部２０４に出力する。

【0021】

アップサンプリング処理部２０４は、第１レイヤ復号部２０３から入力される第１レイヤ復号信号のサンプリング周波数をＳＲ_２からＳＲ_１までアップサンプリングし、アップサンプリングした第１レイヤ復号信号をアップサンプリング後第１レイヤ復号信号として、直交変換処理部２０５に出力する。

【0022】

直交変換処理部２０５は、バッファｂｕｆ１_ｎおよびｂｕｆ２_ｎ（ｎ＝０、…、Ｎ−１）を内部に有し、入力信号ｘ_ｎおよびアップサンプリング処理部２０４から入力されるアップサンプリング後第１レイヤ復号信号ｙ_ｎを修正離散コサイン変換（ＭＤＣＴ：Modified Discrete Cosine Transform）する。

【0023】

以下、直交変換処理部２０５における直交変換処理について、その計算手順と内部バッファへのデータ出力に関して説明する。

【0024】

まず、直交変換処理部２０５は、下記の式（１）および式（２）によりバッファｂｕｆ１_ｎおよびｂｕｆ２_ｎそれぞれを、「０」を初期値として初期化する。

【数1】

【数2】

【0025】

次いで、直交変換処理部２０５は、入力信号ｘ_ｎおよびアップサンプリング後第１レイヤ復号信号ｙ_ｎに対し下記の式（３）および式（４）に従ってＭＤＣＴし、入力信号のＭＤＣＴ係数（以下、入力スペクトルと呼ぶ）Ｓ２（ｋ）およびアップサンプリング後第１レイヤ復号信号ｙ_nのＭＤＣＴ係数（以下、第１レイヤ復号スペクトルと呼ぶ）Ｓ１（ｋ）を求める。

【数3】

【数4】

【0026】

ここで、ｋは１フレームにおける各サンプルのインデックスを示す。直交変換処理部２０５は、入力信号ｘ_ｎとバッファｂｕｆ１_ｎとを結合させたベクトルであるｘ_ｎ’を下記の式（５）により求める。また、直交変換処理部２０５は、アップサンプリング後第１レイヤ復号信号ｙ_ｎとバッファｂｕｆ２_ｎとを結合させたベクトルであるｙ_ｎ’を下記の式（６）により求める。

【数5】

【数6】

【0027】

次いで、直交変換処理部２０５は、式（７）および式（８）によりバッファｂｕｆ１_ｎおよびｂｕｆ２_ｎを更新する。

【数7】

【数8】

【0028】

そして、直交変換処理部２０５は、入力スペクトルＳ２（ｋ）および第１レイヤ復号スペクトルＳ１（ｋ）を第２レイヤ符号化部２０６に出力する。

【0029】

以上、直交変換処理部２０５における直交変換処理について説明した。

【0030】

第２レイヤ符号化部２０６は、直交変換処理部２０５から入力される入力スペクトルＳ２（ｋ）および第１レイヤ復号スペクトルＳ１（ｋ）を用いて第２レイヤ符号化情報を生成し、生成した第２レイヤ符号化情報を符号化情報統合部２０７に出力する。なお、第２レイヤ符号化部２０６の詳細については後述する。

【0031】

符号化情報統合部２０７は、第１レイヤ符号化部２０２から入力される第１レイヤ符号化情報と、第２レイヤ符号化部２０６から入力される第２レイヤ符号化情報とを統合し、統合された情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路１０２に出力する。

【0032】

次に、図２に示した第２レイヤ符号化部２０６の内部の主要な構成について図３を用いて説明する。

【0033】

第２レイヤ符号化部２０６は、帯域分割部２６０、フィルタ状態設定部２６１、フィルタリング部２６２、探索部２６３、ピッチ係数設定部２６４、ゲイン符号化部２６５および多重化部２６６を備え、各部は以下の動作を行う。

【0034】

帯域分割部２６０は、直交変換処理部２０５から入力される入力スペクトルＳ２（ｋ）の所定周波数より高い高域部（ＦＬ≦ｋ＜ＦＨ）をＰ個（ただし、Ｐは１より大きい整数）のサブバンドＳＢ_ｐ（ｐ＝０，１，…，Ｐ−１）に分割する。そして、帯域分割部２６０は、分割した各サブバンドのバンド幅ＢＷ_ｐ（ｐ＝０，１，…，Ｐ−１）および先頭インデックス（つまり、サブバンドの開始位置）ＢＳ_ｐ（ｐ＝０，１，…，Ｐ−１）（ＦＬ≦ＢＳ_ｐ＜ＦＨ）を帯域分割情報（入力信号の所定周波数より高い高域部分を分割した複数のサブバンドにおいて、入力信号の高域部分のスペクトルを推定するための情報）としてフィルタリング部２６２、探索部２６３および多重化部２６６に出力する。以下、入力スペクトルＳ２（ｋ）のうち、サブバンドＳＢ_ｐに対応する部分をサブバンドスペクトルＳ２_ｐ（ｋ）（ＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐ）と記す。

【0035】

フィルタ状態設定部２６１は、直交変換処理部２０５から入力される第１レイヤ復号スペクトルＳ１(ｋ)（０≦ｋ＜ＦＬ）を、フィルタリング部２６２で用いるフィルタ状態として設定する。つまり、フィルタリング部２６２における全周波数帯域０≦ｋ＜ＦＨのスペクトルＳ(ｋ)の０≦ｋ＜ＦＬの帯域に、第１レイヤ復号スペクトルＳ１(ｋ)がフィルタの内部状態（フィルタ状態）として格納される。

【0036】

フィルタリング部２６２は、マルチタップのピッチフィルタを備え、フィルタ状態設定部２６１により設定されたフィルタ状態と、ピッチ係数設定部２６４から入力されるピッチ係数と、帯域分割部２６０から入力される帯域分割情報とに基づいて、第１レイヤ復号スペクトルをフィルタリングし、各サブバンドＳＢ_ｐ（ｐ＝０，１，…，Ｐ−１）の推定値Ｓ２_ｐ’(ｋ)（ＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐ）（ｐ＝０，１，…，Ｐ−１）（以下、「サブバンドＳＢ_ｐの推定スペクトル」と称す）を算出する。フィルタリング部２６２は、サブバンドＳＢ_ｐの推定スペクトルＳ２_ｐ’(ｋ)を探索部２６３に出力する。なお、フィルタリング部２６２におけるフィルタリング処理の詳細については後述する。なお、マルチタップのタップ数は１以上の任意の値（整数）をとることができるものとする。

【0037】

探索部２６３は、帯域分割部２６０から入力される帯域分割情報に基づき、フィルタリング部２６２から入力されるサブバンドＳＢ_ｐの推定スペクトルＳ２_ｐ’(ｋ)と、直交変換処理部２０５から入力される入力スペクトルＳ２(ｋ)の高域部（ＦＬ≦ｋ＜ＦＨ）における各サブバンドスペクトルＳ２_ｐ（ｋ）との類似度を算出する。この類似度の算出は、例えば相関演算等により行われる。また、フィルタリング部２６２、探索部２６３およびピッチ係数設定部２６４の処理は、サブバンド毎に閉ループの探索処理を構成し、各閉ループにおいて、探索部２６３は、ピッチ係数設定部２６４からフィルタリング部２６２に入力されるピッチ係数Ｔを種々に変化させることにより、各ピッチ係数に対応する類似度を算出する。探索部２６３は、サブバンド毎の閉ループにおいて、例えば、サブバンドＳＢ_ｐに対応する閉ループにおいて類似度が最大となる最適ピッチ係数Ｔ_ｐ’（ただしＴｍｉｎ〜Ｔｍａｘの範囲）を求め、Ｐ個の最適ピッチ係数を多重化部２６６に出力する。探索部２６３における類似度の算出方法の詳細については後述する。

【0038】

探索部２６３は、各最適ピッチ係数Ｔ_ｐ’を用いて、各サブバンドＳＢ_ｐに類似する、第１レイヤ復号スペクトルの一部帯域（すなわち、各サブバンドのそれぞれのスペクトルに最も近似する帯域）を算出する。また、探索部２６３は、各最適ピッチ係数Ｔ_ｐ’（ｐ＝０，１，…，Ｐ−１）に対応する推定スペクトルＳ２_ｐ’（ｋ）、及び、式（９）に従って算出される、最適ピッチ係数Ｔ_ｐ’（ｐ＝０，１，…，Ｐ−１）を算出した際の振幅調整パラメータである理想ゲインα１_ｐを、ゲイン符号化部２６５に出力する。なお、式（９）において、Ｍ’は、類似度Ｄを算出する際のサンプル数を示し、各サブバンドのバンド幅以下の任意の値でよい。なお、探索部２６３における最適ピッチ係数Ｔ_ｐ’（ｐ＝０，１，…，Ｐ−１）の探索処理の詳細については後述する。

【数9】

【0039】

ピッチ係数設定部２６４は、探索部２６３の制御の下、フィルタリング部２６２及び探索部２６３とともに、ピッチ係数Ｔを、予め定められた探索範囲Ｔｍｉｎ〜Ｔｍａｘの中で少しずつ変化させながら、フィルタリング部２６２に順次出力する。なお、ピッチ係数設定部２６４は、例えば、第１サブバンドに対応する閉ループの探索処理を行う場合には、ピッチ係数Ｔを、予め定められた探索範囲Ｔｍｉｎ〜Ｔｍａｘの中で少しずつ変化させながら設定し、第２サブバンド以降の第ｍ（ｍ＝２，３，…，Ｐ）サブバンドに対応する閉ループの探索処理を行う場合には、第ｍ−１サブバンドに対応する閉ループの探索処理において求められた最適ピッチ係数に基づき、ピッチ係数Ｔを、少しずつ変化させながら設定してもよい。

【0040】

ゲイン符号化部２６５は、入力スペクトルＳ２（ｋ）、および、探索部２６３から入力される各サブバンドの推定スペクトルＳ２_ｐ’（ｋ）（ｐ＝０，１，…，Ｐ−１）、理想ゲインα１_ｐに基づいて、非線形領域でのエネルギ比調整を行うパラメータである対数ゲインを、各サブバンドに対して算出する。次いで、ゲイン符号化部２６５は、理想ゲイン及び対数ゲインを量子化し、量子化した理想ゲイン及び対数ゲインを多重化部２６６に出力する。

【0041】

図４は、ゲイン符号化部２６５の内部構成を示す図である。ゲイン符号化部２６５は、理想ゲイン符号化部２７１および対数ゲイン符号化部２７２から主に構成される。

【0042】

理想ゲイン符号化部２７１は、探索部２６３から入力される各サブバンドの推定スペクトルＳ２_ｐ’（ｋ）（ｐ＝０，１，…，Ｐ−１）を周波数領域で連続させて入力スペクトルの高域部の推定スペクトルＳ２’（ｋ）を構成する。次いで、理想ゲイン符号化部２７１は、式（１０）に従って、探索部２６３から入力される各サブバンドに対する理想ゲインα１_ｐを推定スペクトルＳ２’（ｋ）に乗じ、推定スペクトルＳ３’（ｋ）を算出する。なお、式（１０）において、ＢＬ_ｐは各サブバンドの先頭インデックスを示し、ＢＨ_ｐは各サブバンドの終端インデックスを示す。そして、理想ゲイン符号化部２７１は、算出した推定スペクトルＳ３’（ｋ）を対数ゲイン符号化部２７２に出力する。また、理想ゲイン符号化部２７１は、理想ゲインα１_ｐを量子化し、量子化した理想ゲインα１Ｑ_ｐを理想ゲイン符号化情報として多重化部２６６に出力する。

【数10】

【0043】

対数ゲイン符号化部２７２は、直交変換処理部２０５から入力される入力スペクトルＳ２(ｋ)の高域部（ＦＬ≦ｋ＜ＦＨ）と、理想ゲイン符号化部２７１から入力される推定スペクトルＳ３’（ｋ）とのサブバンド毎の非線形領域でのエネルギ比調整を行うパラメータ（つまり、振幅調整パラメータ）である対数ゲインを算出し、算出した対数ゲインを対数ゲイン符号化情報として多重化部２６６に出力する。

【0044】

図５に、対数ゲイン符号化部２７２の内部構成を示す。対数ゲイン符号化部２７２は、最大振幅値探索部２８１、サンプル群抽出部２８２および対数ゲイン算出部２８３から主に構成される。

【0045】

最大振幅値探索部２８１は、式（１１）のようにして、理想ゲイン符号化部２７１から入力される推定スペクトルＳ３’（ｋ）に対して、対数領域での最大振幅値ＭａｘＶａｌｕｅ_ｐ、および、振幅が最大であるサンプル（スペクトル成分）のインデックス、最大振幅インデックスＭａｘＩｎｄｅｘ_ｐをサブバンド毎に探索する。

【数11】

【0046】

つまり、最大振幅値探索部２８１は、インデックスが偶数であるサンプルのみに対して対数領域での最大振幅値の探索を行う。これにより、最大振幅値の探索に対する演算量を効率的に削減することができる。

【0047】

そして、最大振幅値探索部２８１は、推定スペクトルＳ３’（ｋ）、最大振幅値ＭａｘＶａｌｕｅ_ｐおよび最大振幅インデックスＭａｘＩｎｄｅｘ_ｐをサンプル群抽出部２８２に出力する。

【0048】

サンプル群抽出部２８２は、最大振幅値探索部２８１から入力される推定スペクトルＳ３’（ｋ）に対して、以下の式（１２）に従って、各サンプル（スペクトル成分）に対する抽出フラグＳｅｌｅｃｔＦｌａｇ（ｋ）の値を決定する。

【数12】

【0049】

つまり、サンプル群抽出部２８２は、式（１２）に示すように、インデックスが奇数であるサンプルに対しては、抽出フラグＳｅｌｅｃｔＦｌａｇ（ｋ）の値を０に設定し、インデックスが偶数であるサンプルに対しては、抽出フラグＳｅｌｅｃｔＦｌａｇ（ｋ）の値を１に設定する。すなわち、サンプル群抽出部２８２は、推定スペクトルＳ３’（ｋ）に対して、サンプル（スペクトル成分）を部分的に（ここでは、偶数のインデックスのサンプルのみ）選択する。そして、サンプル群抽出部２８２は、抽出フラグＳｅｌｅｃｔＦｌａｇ（ｋ）、推定スペクトルＳ３’（ｋ）、および、最大振幅値ＭａｘＶａｌｕｅ_ｐを対数ゲイン算出部２８３に出力する。

【0050】

対数ゲイン算出部２８３は、サンプル群抽出部２８２から入力される抽出フラグＳｅｌｅｃｔＦｌａｇ（ｋ）の値が１であるサンプルに対して、式（１３）に従って、推定スペクトルＳ３’（ｋ）と入力スペクトルＳ２（ｋ）との高域部（ＦＬ≦ｋ＜ＦＨ）の対数領域でのエネルギ比（対数ゲイン）α２_ｐを算出する。すなわち、対数ゲイン算出部２８３は、サンプル群抽出部２８２で部分的に選択されたサンプルに対してのみ、対数ゲインα２_ｐを算出する。

【数13】

【0051】

そして、対数ゲイン算出部２８３は、対数ゲインα２_ｐを量子化し、量子化した対数ゲインα２Ｑ_ｐを対数ゲイン符号化情報として多重化部２６６に出力する。

【0052】

以上、ゲイン符号化部２６５の処理について説明した。

【0053】

多重化部２６６は、帯域分割部２６０から入力される帯域分割情報と、探索部２６３から入力される各サブバンドＳＢ_ｐ（ｐ＝０，１，…，Ｐ−１）に対する最適ピッチ係数Ｔ_ｐ’と、ゲイン符号化部２６５から入力される理想ゲインα１Ｑ_ｐ及び対数ゲインα２Ｑ_ｐにそれぞれ対応するインデックス（理想ゲイン符号化情報および対数ゲイン符号化情報。つまり、各サブバンド内の一部又は全部のスペクトル成分に対する振幅を調整するパラメータ）と、を第２レイヤ符号化情報として多重化し、符号化情報統合部２０７に出力する。なお、Ｔ_ｐ’と、α１Ｑ_ｐおよびα２Ｑ_ｐのインデックスとを直接、符号化情報統合部２０７に入力して、符号化情報統合部２０７にて第１レイヤ符号化情報と多重化してもよい。

【0054】

次いで、図３に示したフィルタリング部２６２におけるフィルタリング処理の詳細について、図６を用いて説明する。

【0055】

フィルタリング部２６２は、フィルタ状態設定部２６１から入力されるフィルタ状態と、ピッチ係数設定部２６４から入力されるピッチ係数Ｔと、帯域分割部２６０から入力される帯域分割情報とを用いて、サブバンドＳＢ_ｐ（ｐ＝０，１，…，Ｐ−１）に対して、帯域ＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐ（ｐ＝０，１，…，Ｐ−１）における推定スペクトルを生成する。フィルタリング部２６２において用いるフィルタの伝達関数Ｆ（ｚ）は下記の式（１４）で表される。

【0056】

以下、サブバンドＳＢ_ｐを例にとり、サブバンドスペクトルＳ２_ｐ（ｋ）の推定スペクトルＳ２_ｐ’（ｋ）を生成する処理を説明する。

【数14】

【0057】

式（１４）において、Ｔはピッチ係数設定部２６４から与えられるピッチ係数、β_ｉは予め内部に記憶されているフィルタ係数を表している。例えば、タップ数が３の場合、フィルタ係数の候補は（β_−１、β_０、β_１）＝（０．１、０．８、０．１）が一例として挙げられる。この他に、フィルタ係数の候補として、（β_−１、β_０、β_１）＝（０．２、０．６、０．２）、（０．３、０．４、０．３）などの値も適当である。また、フィルタ係数の候補として、（β_−１、β_０、β_１）＝（０．０、１．０、０．０）の値でもよく、この場合には帯域０≦ｋ＜ＦＬの第１レイヤ復号スペクトルの一部帯域をその形状を変化させずにそのままＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐの帯域にコピーすることを意味する。以下の説明では、（β_−１、β_０、β_１）＝（０．０、１．０、０．０）である場合を例にとって説明する。また、式（１４）においてＭ＝１とする。Ｍはタップ数に関する指標である。

【0058】

フィルタリング部２６２における全周波数帯域のスペクトルＳ(ｋ)の０≦ｋ＜ＦＬの帯域には、第１レイヤ復号スペクトルＳ１(ｋ)がフィルタの内部状態（フィルタ状態）として格納される。

【0059】

Ｓ（ｋ）のＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐの帯域には、以下の手順のフィルタリング処理によりサブバンドＳＢ_ｐの推定スペクトルＳ２_ｐ’(ｋ)が格納される。すなわち、図６に示すように、Ｓ２_ｐ’(ｋ)には、基本的に、このｋよりＴだけ低い周波数のスペクトルＳ(ｋ−Ｔ)が代入される。ただし、スペクトルの円滑性を増すために、実際には、スペクトルＳ(ｋ−Ｔ)からｉだけ離れた近傍のスペクトルＳ(ｋ−Ｔ＋ｉ)に所定のフィルタ係数β_ｉを乗じたスペクトルβ_ｉ・Ｓ(ｋ−Ｔ＋ｉ)を、全てのｉについて加算したスペクトルをＳ２_ｐ’(ｋ)に代入する。この処理は下記の式（１５）で表される。

【数15】

【0060】

上記演算を、周波数の低いｋ＝ＢＳ_ｐから順に、ｋをＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐの範囲で変化させて行うことにより、ＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐにおける推定スペクトルＳ２_ｐ’(ｋ)を算出する。

【0061】

以上のフィルタリング処理は、ピッチ係数設定部２６４からピッチ係数Ｔが与えられる度に、ＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐの範囲において、その都度Ｓ(ｋ)をゼロクリアして行われる。すなわち、ピッチ係数Ｔが変化するたびにＳ(ｋ)は算出され、探索部２６３に出力される。

【0062】

図７は、図３に示した探索部２６３においてサブバンドＳＢ_ｐに対して最適ピッチ係数Ｔ_ｐ’を探索する処理の手順を示すフロー図である。なお、探索部２６３は、図７に示した手順を繰り返すことにより、各サブバンドＳＢ_ｐ（ｐ＝０，１，…，Ｐ−１）に対応する最適ピッチ係数Ｔ_ｐ’（ｐ＝０，１，…，Ｐ−１）を探索する。

【0063】

まず、探索部２６３は、類似度の最小値を保存するための変数である最小類似度Ｄ_ｍｉｎを「＋∞」に初期化する（ＳＴ２０１０）。次いで、探索部２６３は、下記の式（１６）に従い、あるピッチ係数における入力スペクトルＳ２(ｋ)の高域部（ＦＬ≦ｋ＜ＦＨ）と、推定スペクトルＳ２_ｐ’(ｋ)との類似度Ｄを算出する（ＳＴ２０２０）。

【数16】

【0064】

式（１６）において、Ｍ’は、類似度Ｄを算出する際のサンプル数を示し、各サブバンドのバンド幅以下の任意の値でよい。なお、式（１６）中にはＳ２_ｐ’(ｋ)が存在しないが、これはＢＳ_ｐとＳ２’(ｋ)を用いてＳ２_ｐ’(ｋ)を表しているためである。

【0065】

次いで、探索部２６３は算出した類似度Ｄが最小類似度Ｄ_ｍｉｎより小さいか否かを判定する（ＳＴ２０３０）。ＳＴ２０２０において算出された類似度が最小類似度Ｄ_ｍｉｎより小さい場合（ＳＴ２０３０：「ＹＥＳ」）には、探索部２６３は、類似度Ｄを最小類似度Ｄ_ｍｉｎに代入する（ＳＴ２０４０）。一方、ＳＴ２０２０において算出された類似度が最小類似度Ｄ_ｍｉｎ以上である場合（ＳＴ２０３０：「ＮＯ」）には、探索部２６３は、探索範囲にわたる処理が終了した否かを判定する。すなわち、探索部２６３は、探索範囲内のすべてのピッチ係数それぞれに対し、ＳＴ２０２０において上記の式（１６）に従って類似度を算出したか否かを判定する（ＳＴ２０５０）。探索範囲にわたって処理が終了していなかった場合（ＳＴ２０５０：「ＮＯ」）には、探索部２６３は処理を再びＳＴ２０２０に戻す。そして、探索部２６３は、前回のＳＴ２０２０の手順において式（１６）に従って類似度を算出した場合とは異なるピッチ係数に対して、式（１６）に従い類似度を算出する。一方、探索範囲にわたる処理が終了した場合（ＳＴ２０５０：「ＹＥＳ」）には、探索部２６３は、最小類似度Ｄ_ｍｉｎに対応するピッチ係数Ｔを最適ピッチ係数Ｔ_ｐ’として多重化部２６６に出力する（ＳＴ２０６０）。

【0066】

次に、図１に示した復号装置１０３について説明する。

【0067】

図８は、復号装置１０３の内部の主要な構成を示すブロック図である。

【0068】

図８において、符号化情報分離部１３１は、入力された符号化情報（すなわち、符号化装置１０１から受信した符号化情報）の中から第１レイヤ符号化情報と第２レイヤ符号化情報とを分離し、第１レイヤ符号化情報を第１レイヤ復号部１３２に出力し、第２レイヤ符号化情報を第２レイヤ復号部１３５に出力する。

【0069】

第１レイヤ復号部１３２は、符号化情報分離部１３１から入力される第１レイヤ符号化情報に対して復号を行い、生成された第１レイヤ復号信号をアップサンプリング処理部１３３に出力する。ここで、第１レイヤ復号部１３２の動作は、図２に示した第１レイヤ復号部２０３と同様であるため、詳細な説明は省略する。

【0070】

アップサンプリング処理部１３３は、第１レイヤ復号部１３２から入力される第１レイヤ復号信号に対してサンプリング周波数をＳＲ_２からＳＲ_１までアップサンプリングする処理を行い、得られるアップサンプリング後第１レイヤ復号信号を直交変換処理部１３４に出力する。

【0071】

直交変換処理部１３４は、アップサンプリング処理部１３３から入力されるアップサンプリング後第１レイヤ復号信号に対して直交変換処理（ＭＤＣＴ）を施し、得られるアップサンプリング後第１レイヤ復号信号のＭＤＣＴ係数（以下、第１レイヤ復号スペクトルと呼ぶ）Ｓ１(ｋ)を第２レイヤ復号部１３５に出力する。ここで、直交変換処理部１３４の動作は、図２に示した直交変換処理部２０５のアップサンプリング後第１レイヤ復号信号に対する処理と同様であるため、詳細な説明は省略する。

【0072】

第２レイヤ復号部１３５は、直交変換処理部１３４から入力される第１レイヤ復号スペクトルＳ１(ｋ)、および、符号化情報分離部１３１から入力される第２レイヤ符号化情報を用いて、第１レイヤ復号スペクトルＳ１(ｋ)から、音声信号の高域部分を推定し、スペクトル成分の振幅を調整することにより、高域成分を含む第２レイヤ復号信号を生成し出力信号として出力する。

【0073】

図９は、図８に示した第２レイヤ復号部１３５の内部の主要な構成を示すブロック図である。

【0074】

分離部３５１は、符号化情報分離部１３１から入力される第２レイヤ符号化情報を、各サブバンドのバンド幅ＢＷ_ｐ（ｐ＝０，１，…，Ｐ−１）、先頭インデックスＢＳ_ｐ（ｐ＝０，１，…，Ｐ−１）（ＦＬ≦ＢＳ_ｐ＜ＦＨ）を含む帯域分割情報と、フィルタリングに関する情報である最適ピッチ係数Ｔ_ｐ’（ｐ＝０，１，…，Ｐ−１）と、ゲインに関する情報である理想ゲイン符号化情報（ｊ＝０，１，…，Ｊ−１）及び対数ゲイン符号化情報（ｊ＝０，１，…，Ｊ−１）のインデックスと、に分離する。そして、分離部３５１は、帯域分割情報および最適ピッチ係数Ｔ_ｐ’（ｐ＝０，１，…，Ｐ−１）をフィルタリング部３５３に出力し、理想ゲイン符号化情報及び対数ゲイン符号化情報のインデックスをゲイン復号部３５４に出力する。なお、符号化情報分離部１３１において、帯域分割情報と、最適ピッチ係数Ｔ_ｐ’（ｐ＝０，１，…，Ｐ−１）と、理想ゲイン符号化情報及び対数ゲイン符号化情報のインデックスとを分離済みの場合は、分離部３５１を配置しなくてもよい。

【0075】

フィルタ状態設定部３５２は、直交変換処理部１３４から入力される第１レイヤ復号スペクトルＳ１(ｋ)（０≦ｋ＜ＦＬ）を、フィルタリング部３５３で用いるフィルタ状態として設定する。ここで、フィルタリング部３５３における全周波数帯域０≦ｋ＜ＦＨのスペクトルを便宜的にＳ(ｋ)と呼ぶ場合、Ｓ(ｋ)の０≦ｋ＜ＦＬの帯域に、第１レイヤ復号スペクトルＳ１(ｋ)がフィルタの内部状態（フィルタ状態）として格納される。ここで、フィルタ状態設定部３５２の構成および動作は、図３に示したフィルタ状態設定部２６１と同様であるため、詳細な説明は省略する。

【0076】

フィルタリング部３５３は、マルチタップ（タップ数が１より多い）のピッチフィルタを備える。フィルタリング部３５３は、分離部３５１から入力される帯域分割情報と、フィルタ状態設定部３５２により設定されたフィルタ状態と、分離部３５１から入力されるピッチ係数Ｔ_ｐ’（ｐ＝０，１，…，Ｐ−１）と、予め内部に格納しているフィルタ係数とに基づき、第１レイヤ復号スペクトルＳ１(ｋ)をフィルタリングし、上記の式（１５）に示す、各サブバンドＳＢ_ｐ（ｐ＝０，１，…，Ｐ−１）の推定値Ｓ２_ｐ’(ｋ)（ＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐ）（ｐ＝０，１，…，Ｐ−１）を算出する。フィルタリング部３５３でも、上記の式（１４）に示したフィルタ関数が用いられる。ただし、この場合のフィルタリング処理およびフィルタ関数は、式（１４）、式（１５）におけるＴをＴ_ｐ’に置き換えたものとする。すなわち、フィルタリング部３５３は、第１レイヤ復号スペクトルから、符号化装置１０１における入力スペクトルの高域部を推定する。

【0077】

ゲイン復号部３５４は、分離部３５１から入力される、理想ゲイン符号化情報及び対数ゲイン符号化情報のインデックスを復号し、理想ゲインα１_ｐ及び対数ゲインα２_ｐの量子化値である量子化理想ゲインα１Ｑ_ｐ及び量子化対数ゲインα２Ｑ_ｐを求める。

【0078】

スペクトル調整部３５５は、フィルタリング部３５３から入力される各サブバンドＳＢ_ｐ（ｐ＝０，１，…，Ｐ−１）の推定値Ｓ２_ｐ’(ｋ)（ＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐ）（ｐ＝０，１，…，Ｐ−１）、及びゲイン復号部３５４から入力されるサブバンド毎の理想ゲインα１Ｑ_ｐとから復号スペクトルを算出し、算出した復号スペクトルを直交変換処理部３５６に出力する。

【0079】

図１０は、スペクトル調整部３５５の内部構成を示す図である。スペクトル調整部３５５は、理想ゲイン復号部３６１および対数ゲイン復号部３６２から主に構成される。

【0080】

理想ゲイン復号部３６１は、フィルタリング部３５３から入力される各サブバンドの推定値Ｓ２_ｐ’(ｋ)（ＢＳ_ｐ≦ｋ＜ＢＳ_ｐ＋ＢＷ_ｐ）（ｐ＝０，１，…，Ｐ−１）を周波数領域で連続させて、入力スペクトルに対する推定スペクトルＳ２’（ｋ）を求める。次いで、理想ゲイン復号部３６１は、下記の式（１７）に従い、推定スペクトルＳ２’(ｋ)にゲイン復号部３５４から入力されるサブバンド毎の量子化理想ゲインα１Ｑ_ｐを乗じ、推定スペクトルＳ３’（ｋ）を算出する。そして、理想ゲイン復号部３６１は、推定スペクトルＳ３’(ｋ)を対数ゲイン復号部３６２に出力する。

【数17】

【0081】

対数ゲイン復号部３６２は、理想ゲイン復号部３６１から入力される推定スペクトルＳ３’(ｋ)に対して、ゲイン復号部３５４から入力されるサブバンド毎の量子化対数ゲインα２Ｑ_ｐを用いて、対数領域でのエネルギ調整を行い、得られるスペクトルを復号スペクトルとして直交変換処理部３５６に出力する。

【0082】

図１１は、対数ゲイン復号部３６２の内部構成を示す図である。対数ゲイン復号部３６２は、最大振幅値探索部３７１、サンプル群抽出部３７２、対数ゲイン適用部３７３、および補間処理部３７４とから主に構成される。

【0083】

最大振幅値探索部３７１は、式（１８）のようにして、理想ゲイン復号部３６１から入力される推定スペクトルＳ３’(ｋ)に対して、対数領域での最大振幅値ＭａｘＶａｌｕｅ_ｐ、および、振幅が最大であるサンプル（スペクトル成分）のインデックス、最大振幅インデックスＭａｘＩｎｄｅｘ_ｐをサブバンド毎に探索する。そして、最大振幅値探索部３７１は、推定スペクトルＳ３’（ｋ）、対数領域での最大振幅値ＭａｘＶａｌｕｅ_ｐおよび最大振幅インデックスＭａｘＩｎｄｅｘ_ｐをサンプル群抽出部３７２に出力する。

【数18】

【0084】

サンプル群抽出部３７２は、式（１９）に示すように、算出された各サブバンドに対する最大振幅インデックスＭａｘＩｎｄｅｘ_ｐに応じて、各サンプルに対する抽出フラグＳｅｌｅｃｔＦｌａｇ(ｋ)を決定する。すなわち、サンプル群抽出部３７２は、各サブバンドにおける最大振幅値ＭａｘＶａｌｕｅ_ｐを有するサンプルに近接するサンプル（スペクトル成分）ほど選択されやすい重みにより、サンプルを部分的に選択する。そして、サンプル群抽出部３７２は、推定スペクトルＳ３’（ｋ）、サブバンド毎の最大振幅値ＭａｘＶａｌｕｅ_ｐおよび抽出フラグＳｅｌｅｃｔＦｌａｇ(ｋ)を対数ゲイン適用部３７３に出力する。また、サンプル群抽出部３７２は、抽出フラグＳｅｌｅｃｔＦｌａｇ(ｋ)を補間処理部３７４に出力する。

【数19】

【0085】

対数ゲイン適用部３７３は、サンプル群抽出部３７２から入力される推定スペクトルＳ３’（ｋ）、および、抽出フラグＳｅｌｅｃｔＦｌａｇ（ｋ）から、抽出されたサンプル群の符号（＋、−）を表すＳｉｇｎ_ｐ（ｋ）を、式（２０）のようにして算出する。すなわち、式（２０）に示すように、対数ゲイン適用部３７３は、抽出されたサンプルの符号が‘＋’の場合（Ｓ３’（ｋ）≧０の場合）、Ｓｉｇｎ_ｐ（ｋ）＝１とし、それ以外の場合（抽出されたサンプルの符号が‘−’の場合）、Ｓｉｇｎ_ｐ（ｋ）＝−１とする。

【数20】

【0086】

対数ゲイン適用部３７３は、サンプル群抽出部３７２から入力される推定スペクトルＳ３’（ｋ）、最大振幅値ＭａｘＶａｌｕｅ_ｐおよび抽出フラグＳｅｌｅｃｔＦｌａｇ(ｋ)と、ゲイン復号部３５４から入力される量子化対数ゲインα２Ｑ_ｐ、および式（２０）に従って算出した符号Ｓｉｇｎ_ｐ（ｋ）に基づいて、抽出フラグＳｅｌｅｃｔＦｌａｇ（ｋ）の値が１であるサンプルに対して、式（２１）、式（２２）に従って、推定スペクトルＳ５’(ｋ)を算出する。

【数21】

【数22】

【0087】

すなわち、対数ゲイン適用部３７３は、サンプル群抽出部３７２で部分的に選択されたサンプル（抽出フラグＳｅｌｅｃｔＦｌａｇ(ｋ)＝１のサンプル）に対してのみ、対数ゲインα２_ｐを適用する。そして、対数ゲイン適用部３７３は、推定スペクトルＳ５’（ｋ）を補間処理部３７４に出力する。

【0088】

補間処理部３７４には、サンプル群抽出部３７２から抽出フラグＳｅｌｅｃｔＦｌａｇ(ｋ)が入力される。また、補間処理部３７４には、対数ゲイン適用部３７３から推定スペクトルＳ５’（ｋ）が入力される。また、補間処理部３７４には、ゲイン復号部３５４から、対数ゲインα２_ｐが入力される。補間処理部３７４は、まず、式（２３）に従って、対数ゲインα２_ｐに応じた、線形領域での線形補間パラメータα３_ｐを算出する。

【数23】

【0089】

式（２３）に示すように、線形補間パラメータα３_ｐは、対数ゲインα２_ｐの値に応じて予め定められた値（ここでは、ＡＬＰＨＡ３＿ＬＯＷ及びＡＬＰＨＡ３＿ＨＩＧＨ）の中から適応的に設定される。なお、式（２３）において、ＴＨは予め定められた閾値である。

【0090】

次いで、補間処理部３７４は、式（２４）に従って、抽出フラグＳｅｌｅｃｔＦｌａｇ(ｋ)の値が０であるサンプル群に対して、線形領域での線形補間を行い、復号スペクトルＳ６’（ｋ）を算出する。すなわち、補間処理部３７４は、サンプル群抽出部３７２で部分的に選択されなかったサンプル（抽出フラグＳｅｌｅｃｔＦｌａｇ(ｋ)＝０のサンプル（スペクトル成分））に対して、対数ゲインα２_ｐの値に応じて適応的に設定される線形補間パラメータα３_ｐを適用する。

【数24】

【0091】

ここで、線形補間パラメータα３_ｐの具体例としては、式（２３）において、例えばＴＨ＝０．４５、ＡＬＰＨＡ３＿ＬＯＷ＝０．７５、ＡＬＰＨＡ３＿ＨＩＧＨ＝０．９５が挙げられる。つまり、補間処理部３７４は、対数ゲインα２_ｐの値が予め設定された閾値ＴＨより小さい場合には、線形補間パラメータα３_ｐを小さく設定し、対数ゲインα２_ｐの値が予め設定された閾値ＴＨ以上の場合には、線形補間パラメータα３_ｐを大きく設定する。この条件において本発明が特に有効であることを実験により確認している。

【0092】

なお、式（２４）では、最大振幅値探索部３７１で算出した対数領域での最大振幅値ＭａｘＶａｌｕｅ_ｐを用いた線形領域での線形補間処理を用いるが、対数領域での最大振幅値の代わりに、線形領域での最大振幅値を用いることも可能である。この場合、最大振幅値探索部３７１では、式（１８）の代わりに、式（２５）に示すようにして線形領域での最大振幅値ＭａｘＶａｌｕｅ_ｐを算出する。また、この場合、補間処理部３７４は、式（２４）の代わりに、式（２６）に従って、線形領域での線形補間処理を行う。この構成により、式（１８）および式（２４）に示すような対数変換処理および指数変換処理の回数を削減することができ、さらなる演算量の削減を実現できる。

【数25】

【数26】

【0093】

次いで、補間処理部３７４は、算出した復号スペクトルＳ６’（ｋ）を直交変換処理部３５６へ出力する。ここで、復号スペクトルＳ６’（ｋ）の低域部（０≦ｋ＜ＦＬ）は第１レイヤ復号スペクトルＳ１（ｋ）からなる。また、復号スペクトルＳ６’（ｋ）の高域部（ＦＬ≦ｋ＜ＦＨ）は推定スペクトルＳ３’（ｋ）に対して対数領域でのエネルギ調整（対数ゲイン適用部３７３における処理）、及び、線形領域でのエネルギ調整（補間処理部３７４における線形補間処理）を行ったスペクトルからなる。

【0094】

ここで、補間処理部３７４における線形領域での線形補間処理（線形領域での振幅の調整処理）の効果について説明する。

【0095】

特許文献１に開示されている、対数領域でのエネルギ調整処理は、人間の聴感特性を利用した処理であり、非常に有効な手段である。しかし、特許文献１に開示されている対数領域でのエネルギ調整処理は、全サンプル（ＭＤＣＴ係数）を対象として対数変換を行う必要があり、処理演算量が非常に大きくなってしまう問題がある。これに対して、本発明では、対数領域でのエネルギ調整処理を施すサンプルをサンプル群抽出部３７２で選択されたサンプルのみに限定し、選択されなかったサンプルに対しては、線形領域での線形補間処理を行う方式を採った。このとき、本方式では、式（２３）に示したように、対数領域でのエネルギ調整処理に利用する対数ゲインα２_ｐの値に応じて、線形補間係数α３_ｐを適応的に切り替えることで、対数領域での対数ゲインによるエネルギ調整処理と同様の処理を、線形領域での線形補間処理により近似的に実現している。このような本方式により、人間の聴感特性に適したエネルギ調整処理を、特許文献１に開示されている従来技術と比較して大幅に低い処理演算量で行うことが可能となっている。

【0096】

ここで、対数ゲイン復号部３６２における対数ゲインの適用処理、及び、線形領域での線形補間処理の対象となるサンプル群の一例を図１２に示す。

【0097】

図１２において、黒色で示すブロックは各サブバンド（図１２では第ｐサブバンド）における最大振幅値を有するサンプルを示し、斜線で示すブロックはサンプルインデックスが偶数であるサンプルを示し、縦線で示すブロックは最大振幅値を有するサンプル（黒色で示すブロック）の周辺に存在するサンプルを示し、白色のブロックは上記の３種以外のサンプルを示す。

【0098】

図１２に示す一例では、白色のブロックで示すサンプル以外のサンプル群に対しては、対数ゲイン適用部３７３において対数ゲインが適用され、白色のブロックで示すサンプル群に対して、補間処理部３７４において線形領域での補間処理部が適用される。なお、図１２は一例であり、本発明は、例えば、最大振幅値を有するサンプルの周辺に存在するサンプル数は図中に示した数以外の構成についても同様に適用できる。

【0099】

直交変換処理部３５６は、スペクトル調整部３５５から入力される復号スペクトルＳ６’（ｋ）を時間領域の信号に直交変換し、得られる第２レイヤ復号信号を出力信号として出力する。ここでは、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。

【0100】

以下、直交変換処理部３５６における具体的な処理について説明する。

【0101】

直交変換処理部３５６は、バッファｂｕｆ’（ｋ）を内部に有しており、下記の式（２７）に示すようにバッファｂｕｆ’（ｋ）を初期化する。

【数27】

【0102】

また、直交変換処理部３５６は、スペクトル調整部３５５から入力される第２レイヤ復号スペクトルＳ６’（ｋ）を用いて下記の式（２８）に従い、第２レイヤ復号信号ｙ_ｎ”を求める。

【数28】

【0103】

式（２８）において、Ｚ４（ｋ）は、下記の式（２９）に示すように、復号スペクトルＳ６’（ｋ）とバッファｂｕｆ’（ｋ）とを結合させたベクトルである。

【数29】

【0104】

次いで、直交変換処理部３５６は、下記の式（３０）に従いバッファｂｕｆ’（ｋ）を更新する。

【数30】

【0105】

そして、直交変換処理部３５６は、復号信号ｙ_ｎ”を出力信号として出力する。

【0106】

このように、本実施の形態によれば、符号化装置は、低域部のスペクトルを用いて帯域拡張を行い高域部のスペクトルを推定する符号化／復号において、復号した低域スペクトルを用いて高域部のスペクトルを推定した後、推定スペクトルの各サブバンドに対してサンプル群の選択（間引き）を行い、選択したサンプルに対してのみ対数領域でのゲイン調整を行うゲイン調整パラメータを算出する。また、復号装置（符号化装置側のローカルデコード部を含む）は、推定スペクトルの各サブバンドにおける最大振幅値のサンプルの周辺のサンプルを重視して選択されたサンプル群にのみ前記ゲイン調整パラメータを適用し、それ以外のサンプル群に対しては、前記ゲイン調整パラメータに応じて適応的に切り替えられる線形補間係数を用いて、線形領域での補間処理を行う。この構成により、符号化装置では、対数領域でのゲイン調整に必要なゲイン調整パラメータの算出に必要な処理演算量を大幅に削減することができる。また、復号装置では、人間の聴覚に適したエネルギ調整処理に必要な処理演算量を大幅に削減することができる。

【0107】

なお、本実施の形態では、抽出フラグの設定において、サブバンド内の最大振幅値を有するサンプルを探索した後、そのサンプルからの距離に応じて抽出フラグを設定する構成を例に挙げて説明した。しかし、本発明はこれに限らず、復号装置が、例えば最小振幅値を有するサンプルを探索し、最小振幅値を有するサンプルからの距離に応じて各サンプルの抽出フラグを設定し、抽出されたサンプル（抽出フラグの値が１に設定されたサンプル）に対してのみ対数ゲイン等の振幅調整パラメータを算出し、適用する場合にも同様に適用できる。このような構成は、例えば、振幅調整パラメータが、推定した高域スペクトルを減衰させる効果を有する場合に有効と言える。振幅の大きいサンプルに対して減衰させることによって、異音が発生する場合も考えられるが、最小振幅値を有するサンプル周辺に対してのみ減衰処理を適用することで音質を向上させられる可能性がある。また、上記構成においては、最小振幅値を探索するのではなく、最大振幅値を探索し、最大振幅値を有するサンプルからの距離が離れたサンプルほど抽出されやすいという重み（尺度）で、サンプルを抽出する構成も考えられ、本発明はこのような構成に対しても同様に適用できる。

【0108】

また、本実施の形態では、復号装置内の抽出フラグの設定において、サブバンド内の最大振幅値を有するサンプルを探索した後、そのサンプルからの距離に応じて抽出フラグを設定する構成を例に挙げて説明した。しかし、本発明はこれに限らず、符号化装置は、各サブバンドに対して、振幅の大きい方から複数のサンプルを選択し、それぞれのサンプルからの距離に応じて抽出フラグを設定する構成についても同様に適用できる。上記構成にすることで、サブバンド内に振幅の大きさの近い複数のサンプルが存在した場合に、効率的にサンプルを抽出することができる。

【0109】

また、本実施の形態では、復号装置において、各サブバンド内のサンプルが、最大振幅値を有するサンプルに近接するか否かを閾値（式（１９）に示すＮｅａｒ_ｐ）に基づいて判断することにより、サンプルを部分的に選択する場合について説明した。本発明では、例えば、復号装置は、高域のサブバンドほど、より広い範囲のサンプルを、最大振幅値を有するサンプルに近接するサンプルとして選択してもよい。つまり、本発明では、複数のサブバンドのうち高域のサブバンドほど、式（１９）に示すＮｅａｒ_ｐの値をより大きくしてもよい。これにより、帯域分割時に、例えばバークスケールのように高域ほどサブバンド幅が大きくなるように設定された場合に対しても、サブバンド間で偏りなく部分的にサンプルを選択することができ、復号信号の音質劣化を防ぐことができる。なお、式（１９）に示すＮｅａｒ_ｐの値としては、例えば、１フレームのサンプル（ＭＤＣＴ係数）の数が６４０程度の場合には、５〜２１程度の値（例えば最低域のサブバンドのＮｅａｒ_ｐの値を５、最高域のサブバンドのＮｅａｒ_ｐの値を２１）にすると良い結果が得られることを実験により確認している。

【0110】

また、本実施の形態に示したように、符号化装置が、偶数のインデックスのサンプルのみからゲイン調整パラメータを算出し、復号装置が、サブバンド内の最大振幅値を有するサンプルからの距離を考慮し、抽出したサンプルにゲイン調整パラメータを適用する場合でも、音質劣化が無いことを実験により確認している。つまり、ゲイン調整パラメータを算出するときの対象となるサンプル集合（サンプル群）と、ゲイン調整パラメータを適用するときの対象となるサンプル集合（サンプル群）とが必ずしも一致していなくても問題無いということが言える。これは、例えば、本実施の形態に示したように、符号化装置および復号装置は、サブバンド全体にわたって均等にサンプルを抽出すれば、全サンプルを抽出しなくても、効率良くゲイン調整パラメータを算出できることを示している。ただし、本発明はこれに限らず、符号化装置においても、復号装置と同様に、各サブバンド内の最大振幅値からの距離に応じたサンプル群抽出方法によって、対数ゲインを算出する対象となるサンプル群を選択する構成に対しても同様に適用される。

【0111】

また、本実施の形態では、入力信号の低域成分の符号化／復号処理と、高域成分の符号化／復号処理をそれぞれ別に行う構成の場合、つまり、２段階の階層構造で符号化／復号する場合について説明した。しかし、本発明はこれに限らず、３段階以上の階層構造で符号化／復号する場合についても同様に適用できる。なお、３段階以上の階層符号化部を考慮した場合、第２レイヤ符号化部のローカルデコード信号を生成するための第２レイヤ復号部において、ゲイン調整パラメータ（対数ゲイン）を適用するサンプル集合（サンプル群）は、本実施の形態の符号化装置内で算出した最大振幅値を有するサンプルからの距離を考慮しないサンプル集合であってもよく、また本実施の形態の復号装置内で算出した最大振幅値を有するサンプルからの距離を考慮するサンプル集合であってもよい。

【0112】

また、本実施の形態では、符号化装置および復号装置での抽出フラグの設定において、サンプルのインデックスが偶数である場合には、抽出フラグの値を強制的に１に設定している。しかし、本発明はこれに限らず、例えば、インデックスの３に対する剰余が０の場合に抽出フラグの値を１に設定する場合等に対しても同様に適用できる。つまり、本実施の形態では、最大振幅値を有するサンプルからの距離に応じたサンプル以外で抽出されるサンプルについては、特に制約はなく、様々な選択方法に対しても同様に適用される。

【0113】

また、本実施の形態では、ゲイン符号化部２６５（図３）において入力スペクトルＳ２（ｋ）の高域部を分割して得られるサブバンドの数Ｊが、探索部２６３において入力スペクトルＳ２（ｋ）の高域部を分割して得られるサブバンドの数Ｐと異なる場合を例にとって説明した。しかし、本発明はこれに限定されず、ゲイン符号化部２６５において入力スペクトルＳ２（ｋ）の高域部を分割して得られるサブバンドの数をＰ個にしてもよい。

【0114】

また、本実施の形態では、第１レイヤ復号部から得られる第１レイヤ復号スペクトルの低域成分を利用して、入力スペクトルの高域部を推定する構成について説明した。しかし、本発明はこれに限らず、第１レイヤ復号スペクトルの代わりに入力スペクトルの低域成分を利用して、入力スペクトルの高域部を推定する構成についても同様に適用できる。なお、この構成においては、符号化装置は入力スペクトルの低域成分から入力スペクトルの高域成分を生成するための符号化情報（第２レイヤ符号化情報）を算出し、復号装置はこの符号化情報を第１レイヤ復号スペクトルに適用し、復号スペクトルの高域成分を生成する。

【0115】

また、本実施の形態では、特許文献１における処理に基づき、対数領域でのエネルギ比を調整するパラメータを算出・適用する構成において演算量の削減、および音質を向上させる処理を例に挙げて説明した。しかし、本発明はこれに限らず、対数変換以外の非線形変換領域でエネルギ比などを調整する構成に対しても同様に適用できる。また、非線形変換領域だけでなく、線形変換領域に対しても同様に適用できる。

【0116】

また、本実施の形態では、特許文献１における処理に基づき、帯域拡張処理において、対数領域でのエネルギ比を調整するパラメータを算出・適用する構成において演算量の削減、および音質を向上させる処理を例に挙げて説明した。しかし、本発明はこれに限らず、帯域拡張処理以外の処理に対しても同様に適用できる。

【0117】

また、本実施の形態では、補間処理部において、入力信号の種類（例えば音声信号および楽音信号等）、スペクトル特性などによらず、常に同一の方式で線形補間処理を行う場合について説明した。しかし、本発明はこれに限らず、入力信号の種類、スペクトル特性に応じて、補間処理部における処理を適応的に切り替える場合についても同様に適用できる。例えば、入力信号のピーク性が強い場合、つまり入力信号のスペクトルの雑音性が低い場合には、補間処理部における線形補間パラメータを固定させ（例えば０．９５に固定する）、入力信号のピーク性が弱い場合、つまり入力信号のスペクトルの雑音性が高い場合には、補間処理部における線形補間パラメータを、上記実施の形態で説明したように２種類のいずれかに切り替えてもよい。このような構成により、入力信号のピーク性が強い場合には、補間処理部におけるエネルギ調整処理の効果を弱める（補間処理をする前後でサンプルの振幅が大きく変わらなくする）ことが出来るため、本実施の形態で説明した方式に比べて、異音の抑制を抑えられる可能性がある。これは、急峻なスペクトルに対する聴覚マスキング値は低くなる、という聴感特性に基づく処理であり、スペクトルのピーク部分では線形補間処理の対象となるサンプルの振幅の増幅を抑制することを意味している。ただし、上記の構成は、本実施の形態で説明した方式に比べて、入力信号の特性（例えばピーク性の強弱等）を判定する処理部を新たに追加する必要があるため、処理演算量は増加することになる。また、上記のような切替方法の他に、本実施の形態で説明した線形補間パラメータと閾値の組み合わせ（ＴＨ、ＡＬＰＨＡ３＿ＬＯＷ，ＡＬＰＨＡ３＿ＨＩＧＨ）と、上記組み合わせとは別の組み合わせ（例えばＴＨ２、ＡＬＰＨＡ３＿ＬＯＷ２，ＡＬＰＨＡ３＿ＨＩＧＨ２）とを、入力信号の種類（例えば音声信号および楽音信号等）、スペクトル特性に応じて適応的に切り替えてもよい。

【0118】

また、本実施の形態では、復号装置における復号処理方法について説明した。しかし、本発明は、復号装置に限定されず、上記復号処理方法を含む符号化装置にも同様に適用される。例えば、図１３に示すように、図２に示す符号化装置１０１の構成に加え、第２符号化情報を用いて第２レイヤ復号スペクトルを生成する第２レイヤ復号部４０１を更に具備し、第２レイヤ復号スペクトルと、入力信号のスペクトル（入力スペクトル）と、の残差成分を符号化する第３レイヤ符号化部４０２を更に具備する符号化装置４００に対しても、本発明は同様に適用できる。ここで、第２レイヤ復号部４０１は、図９に示す第２レイヤ復号部１３５に相当する復号処理部である。但し、第２レイヤ復号部１３５とは、内部に直交変換処理部３５６を備えず、時間領域の信号ではなく、周波数領域の信号（スペクトル）を出力する点が異なる。また、出力する成分の名称も異なる。それ以外の点については、第２レイヤ復号部１３５と同様の処理をする。また、本発明は第３レイヤ符号化部４０２の符号化方法には限定されず、第３レイヤ符号化部４０２では、残差成分をベクトル量子化する他、様々な量子化方法を採ることができる。なお、図１３に示す符号化装置４００では符号化部の数が３個であるが、符号化部の数が４以上である場合にも、本発明は同様に適用できる。

【0119】

（実施の形態２）
実施の形態１では、追加パラメータ（実施の形態１では第２レイヤ符号化情報）を用いて、低域スペクトルから高域スペクトルを生成する帯域拡張符号化方式を用いる符号化装置及び対応する復号装置について説明した。

【0120】

ここで、同様の「帯域拡張符号化方式」を採用している方式としては、ＩＴＵ−Ｔで規格化されているＧ．７２２−ＳＷＢ（Ｇ．７２２ＡｎｎｅｘＢ）が例に挙げられる。Ｇ．７２２−ＳＷＢでは、入力信号の特性（例えば入力スペクトル）に応じて４つのモードの符号化／復号方式により当該入力信号が符号化される。ここで４つのモードとは、ＴＲＡＮＳＩＥＮＴ、ＮＯＲＭＡＬ、ＨＡＲＭＯＮＩＣ、及びＮＯＩＳＥであり、入力スペクトルから適切なモードが決定される。

【0121】

本実施の形態では、Ｇ．７２２−ＳＷＢのような、入力信号の特性に応じて符号化／復号方式が切り替わるマルチモード符号化／復号方式において、実施の形態１で説明した帯域拡張符号化／復号方式（実施の形態１では、第２レイヤ符号化部／第２レイヤ復号部が対応する）を適用する構成について説明する。また、本実施の形態では、このような構成において、符号化／復号モードが切り替わる際に発生し得る音質劣化（異音）を抑制する方法について説明する。

【0122】

なお、Ｇ．７２２−ＳＷＢは４つのモードの符号化／復号方式を有するマルチモード符号化／復号方式であるが、以下では説明の簡略化のため、２つのモードの符号化／復号方式を有するマルチモード符号化／復号方式を例に挙げて説明する。

【0123】

本実施の形態に係る符号化装置及び復号装置を有する通信システムの構成は、実施の形態１（図１）における構成と同様である。但し、符号化装置及び復号装置の内部構成が異なるため、符号のみ符号化装置１１１及び復号装置１１３と置き換えることとする。符号化装置１１１及び復号装置１１３の処理は、それぞれ符号化装置１０１及び復号装置１０３と同一であるため、ここでは説明を省略する。

【0124】

図１４は、符号化装置１１１の内部の主要な構成を示すブロック図である。図１４に示す符号化装置１１１において、モード判定部５０１及び第２レイヤ符号化部５０２以外の構成要素については、実施の形態１の符号化装置１０１（図２）内の各構成要素と同一であるため、同一の符号を付し、ここでは説明を省略する。

【0125】

モード判定部５０１には、直交変換処理部２０５から入力スペクトルが入力される。モード判定部５０１は、入力された入力スペクトルのスペクトル特性（つまり入力信号の特性）を分析し、分析結果に基づいて、モード情報を決定する。モード判定部５０１は、決定したモード情報を第２レイヤ符号化部５０２に出力する。ここで、モード情報は、後述する２種類の符号化方式のうち、いずれの符号化方式を用いて符号化を行うかを示す情報である。具体的には、モード判定部５０１は、モード情報として、「モード１」又は「モード２」のいずれかを決定する。例えば、モード判定部５０１は、入力スペクトルがＴＲＡＮＳＩＥＮＴであるか、ＮＯＮ−ＴＲＡＮＳＩＥＮＴであるかを分析し、分析結果に基づいて、モード情報を判定するという方法が一例として挙げられる。モード情報の判定方法の詳細（例えば、Ｇ．７２２−ＳＷＢ規格書参照）については、本発明とは直接関係ないため、ここでは説明を省略する。

【0126】

第２レイヤ符号化部５０２には、直交変換処理部２０５から入力スペクトル及び第１レイヤ復号スペクトルが入力される。また、第２レイヤ符号化部５０２には、モード判定部５０１からモード情報が入力される。第２レイヤ符号化部５０２は、第１レイヤ復号スペクトルを用いて、入力されるモード情報に基づき、２種類の符号化方式（モード１又はモード２）のいずれかにより入力スペクトルの符号化を行い、第２レイヤ符号化情報を生成する。第２レイヤ符号化部５０２は、生成した第２レイヤ符号化情報を、符号化情報統合部２０７を介して伝送路１０２（図１）に出力する。第２レイヤ符号化部５０２の処理の詳細については後述する。

【0127】

次に、図１４に示した第２レイヤ符号化部５０２の内部の主要な構成について図１５を用いて説明する。

【0128】

第２レイヤ符号化部５０２は、スイッチ５２１、スイッチ５２２、第１符号化部５２３、及び第２符号化部５２４を備える。

【0129】

スイッチ５２１及びスイッチ５２２は、モード判定部５０１から入力されるモード情報に従って制御され、入力スペクトル及び第１レイヤ復号スペクトルを、第１符号化部５２３及び第２符号化部５２４のいずれかに出力する。図１５において、破線で示されている矢印は、データフローではなく、制御するという意味である。例えば、スイッチ５２１及びスイッチ５２２は、モード情報が「モード１」である場合には入力スペクトル及び第１レイヤ復号スペクトルを第１符号化部５２３に出力し、モード情報が「モード２」である場合には入力スペクトル及び第１レイヤ復号スペクトルを第２符号化部５２４に出力する。このように、スイッチ５２１及びスイッチ５２２は、符号化方法のモードに応じて、入力スペクトル及び第１レイヤ復号スペクトルの出力先の切替制御を行う。

【0130】

第１符号化部５２３は、モード情報が「モード１」である場合、入力される、モード情報、入力スペクトル及び第１レイヤ復号スペクトルを用いて、第２レイヤ符号化情報を生成する。第１符号化部５２３は、生成した第２レイヤ符号化情報を符号化情報統合部２０７に出力する。本実施の形態では、第１符号化部５２３は、実施の形態１で説明した第２レイヤ符号化部２０６と同様の処理を行う。第１符号化部５２３の処理の詳細については後述する。

【0131】

第２符号化部５２４は、モード情報が「モード２」である場合、入力される、モード情報、入力スペクトル及び第１レイヤ復号スペクトルを用いて、第２レイヤ符号化情報を生成する。第２符号化部５２４は、生成した第２レイヤ符号化情報を符号化情報統合部２０７に出力する。第２符号化部５２４は、第１符号化部５２３での符号化方式とは異なる符号化方式により処理を行う。本実施の形態では、第２符号化部５２４において利用する符号化方式を特に限定する必要はないため、説明を省略するが、例えばＧ．７２２−ＳＷＢにおける「ＴＲＡＮＳＩＥＮＴ」モードの符号化方式を採る構成が一例として挙げられる。

【0132】

このように、第２レイヤ符号化部５０２は、複数の符号化方法を切り替える複数の符号化部（第１符号化部５２３及び第２符号化部５２４）を有する。

【0133】

次に、図１５に示した第１符号化部５２３の内部の主要な構成について図１６を用いて説明する。

【0134】

第１符号化部５２３は、帯域分割部２６０、フィルタ状態設定部２６１、フィルタリング部２６２、探索部２６３、ピッチ係数設定部２６４、ゲイン符号化部５３１及び多重化部２６６を備える。ここで、ゲイン符号化部５３１以外の各構成要素は、第２レイヤ符号化部２０６（図３）内の各構成要素と同一であるため、同一の符号を付し、説明を省略する。

【0135】

ゲイン符号化部５３１には、モード判定部５０１からモード情報が入力される。ゲイン符号化部５３１は、入力スペクトルＳ２（ｋ）、および、探索部２６３から入力される各サブバンドの推定スペクトルＳ２_ｐ’（ｋ）（ｐ＝０，１，…，Ｐ−１）、理想ゲインα１_ｐに基づいて、非線形領域でのエネルギ比調整を行うパラメータである対数ゲインを、各サブバンドに対して算出する。

【0136】

次いで、ゲイン符号化部５３１は、モード情報を利用して、理想ゲイン及び対数ゲインを量子化し、量子化した理想ゲイン及び対数ゲインを多重化部２６６に出力する。具体的には、ゲイン符号化部５３１は、内部にモード情報を記憶できるメモリを保持する。ゲイン符号化部５３１の内部構成は、上記メモリを保持する以外は、ゲイン符号化部２６５（図３）と同一である。

【0137】

ゲイン符号化部５３１は、メモリに記憶している前フレーム処理時のモード情報と現フレームにおいて入力されたモード情報とが異なった場合、つまり、現フレームと前フレームとで符号化方法が切り替わる場合（ここでは前フレームでは第２符号化部５２４が動作し、現フレームでは第１符号化部５２３が動作する場合）、次式（３１）に従って、量子化対象である理想ゲインα１_ｐに対して減衰処理を施す。ここで、γは、０＜γ＜１を満たす減衰係数であり、予め設定された値を持つ。次いで、ゲイン符号化部５３１は、γが乗じられた理想ゲインα１´_ｐを量子化する。

【数31】

【0138】

一方、ゲイン符号化部５３１は、メモリに記憶している前フレーム処理時のモード情報と現フレームにおいて入力されたモード情報とが同一である場合、つまり、現フレームと前フレームとで符号化方法が切り替わる場合（ここでは前フレーム及び現フレームの双方で第１符号化部５２３が動作する場合）、量子化対象である理想ゲインに対して減衰処理を施さず、ゲイン符号化部２６５（図３）と同様の処理を行い、ゲイン情報を量子化する。次いで、ゲイン符号化部５３１は、算出した理想ゲイン符号化情報と対数ゲイン符号化情報を多重化部２６６に出力する。

【0139】

このように、第１符号化部５２３は、前フレームと現フレームとで符号化方法が切り替わる場合、現フレームでの符号化方法で用いる理想ゲインを調整する。具体的には、第１符号化部５２３は、前フレームと現フレームとで符号化方法が切り替わる際、現フレームで用いる理想ゲインを減衰させる。

【0140】

以上が、第１符号化部５２３の処理の説明である。

【0141】

以上が、本実施の形態に係る符号化装置１１１の処理の説明である。

【0142】

次に、本実施の形態に係る復号装置１１３の処理について説明する。

【0143】

図１７は、復号装置１１３の内部の主要な構成を示すブロック図である。

【0144】

図１７に示す復号装置１１３において、符号化情報分離部６０１及び第２レイヤ復号部６０２以外の構成要素については、実施の形態１で説明した復号装置１０３（図８）内の構成要素と同一であるため、同一の符号を付し、説明を省略する。

【0145】

符号化情報分離部６０１は、入力された符号化情報（すなわち、符号化装置１１１（図１４）から受信した符号化情報）の中から第１レイヤ符号化情報と、第２レイヤ符号化情報と、モード情報とを分離し、第１レイヤ符号化情報を第１レイヤ復号部１３２に出力し、第２レイヤ符号化情報及びモード情報を第２レイヤ復号部６０２に出力する。

【0146】

第２レイヤ復号部６０２は、直交変換処理部１３４から入力される第１レイヤ復号スペクトルＳ１(ｋ)、及び、符号化情報分離部６０１から入力される第２レイヤ符号化情報、モード情報を用いて、第１レイヤ復号スペクトルＳ１（ｋ）から、音声信号の高域部分を推定し、スペクトル成分の振幅を調整することにより、高域成分を含む第２レイヤ復号信号を生成し出力信号として出力する。

【0147】

図１８は、図１７に示した第２レイヤ復号部６０２の内部の主要な構成を示すブロック図である。

【0148】

第２レイヤ復号部６０２は、スイッチ６２１、スイッチ６２２、第１復号部６２３及び第２復号部６２４を備える。

【0149】

スイッチ６２１及びスイッチ６２２は、符号化分離部６０１から入力されるモード情報に従って制御され、第１レイヤ復号スペクトル及び第２レイヤ符号化情報を、第１復号部６２３、第２復号部６２４のいずれかに出力する。例えば、スイッチ６２１及びスイッチ６２２は、モード情報が「モード１」である場合には第１レイヤ復号スペクトル及び第２レイヤ符号化情報を第１復号部６２３に出力し、モード情報が「モード２」である場合には第１レイヤ復号スペクトル及び第２レイヤ符号化情報を第２復号部６２４に出力する。このように、スイッチ６２１及びスイッチ６２２は、復号方法のモードに応じて、第１レイヤ復号スペクトル及び第２レイヤ符号化情報の出力先の切替制御を行う。

【0150】

第１復号部６２３は、モード情報が「モード１」である場合、入力される、モード情報、第１レイヤ復号スペクトル及び第２レイヤ符号化情報を用いて、出力信号を生成する。第１復号部６２３は、生成した出力信号を出力する。本実施の形態では、第１復号部６２３は、実施の形態１で説明した第２レイヤ復号部１３５と同様の処理を行うため、説明は省略する。但し、第１復号部６２３において、復号する理想ゲイン符号化情報が、α１_ｐではなく、α１´_ｐである点が実施の形態１の第２レイヤ復号部１３５とは異なるものとする。

【0151】

第２復号部６２４は、モード情報が「モード２」である場合、入力される、モード情報、第１レイヤ復号スペクトル及び第２レイヤ符号化情報を用いて、出力信号を生成する。第２復号部６２４は、生成した出力信号を出力する。第２復号部６２４は、第１復号部６２３での復号方式とは異なる復号方式（第２符号化部５２４での符号化方式に対応する復号方式）により処理を行う。本実施の形態では、第２復号部６２４において利用する復号方式を特に限定する必要はないため、説明を省略するが、例えばＧ．７２２−ＳＷＢにおける「ＴＲＡＮＳＩＥＮＴ」モードの復号方式を採る構成が一例として挙げられる。

【0152】

このように、本実施の形態によれば、符号化装置は、モード情報を保持し、前フレームのモード情報と現フレームのモード情報とが異なる場合には、高域部のスペクトルを推定する符号化部において、量子化するゲインを減衰させる。これにより、符号化方式（符号化モード）が切り替わった際に、異音の原因に成り得るゲインの急激な変化（特に、聴覚的な影響が大きいゲインの急激な増加）を抑制することができるため、上記音質劣化の抑制処理を実現できる。すなわち、符号化装置では、低域部のスペクトルを用いて帯域拡張を行い高域部のスペクトルを推定する符号化／復号方式が複数種類存在する場合、つまりマルチモード符号化／復号方式である場合でも、モードが切り替わった際に発生し得る音質劣化（異音）を抑制することで、処理量の大幅な削減を実現しつつ、かつ高品質な復号信号を提供することができる。

【0153】

なお、本実施の形態では、符号化装置のゲイン符号化部において、各フレーム処理時のモード情報を保持し、モード情報が切り替わった際に、量子化する理想ゲインを減衰させる処理を例に挙げて説明した。しかし、本発明はこれに限らず、モード情報以外の情報を用いて量子化するゲインを減衰させる構成に対しても本実施の形態を同様に適用できる。例えば、符号化装置が各フレーム処理時のモード情報に加え、各フレームのフレームエネルギを記憶し、これらを用いて、量子化するゲインを減衰させる構成が例に挙げられる。この構成では、前フレームのモード情報と現フレームのモード情報とが異なる場合、つまりモード情報が切り替わる場合、符号化装置は、まず、前フレームのフレームエネルギと現フレームのフレームエネルギの平均値を算出する。次に、符号化装置は、算出されたフレームエネルギの平均値と現フレームのフレームエネルギとの比に応じて、量子化するゲインを減衰又は増幅させる。例えば、前フレームのフレームエネルギが１００００であり、現フレームのフレームエネルギが５０００であった場合、符号化装置は、フレームエネルギの平均値７５００と、現フレームエネルギとの比である１．５（＝７５００／５０００）を量子化するゲインに乗じる。この場合、フレームエネルギ比（１．５）は１以上であるため、減衰処理ではなく増幅処理となる。なお、ここでは、式（３１）における減衰係数γ（０＜γ＜１）を、１以上の値も許容する「減衰・増幅係数」に置き換えることで、前述と同様の処理により、増幅処理も可能になる。通常、符号化モードが切り替わった際には、聴覚的にはゲインの急激な増加による異音の影響が大きい。このため、本実施の形態では、ゲインの急激な増加に対して、比較的簡易な処理（低演算量の処理）で音質劣化を抑制する構成を説明した。しかし、上記のフレームエネルギを用いることにより、前述の構成に比べて、処理演算量は増えるものの、符号化モードが切り替わった際にフレームエネルギ（あるいはゲイン）が急激に増加する場合だけではなく、急激に減少する際に対しても、フレームエネルギ（あるいはゲイン）の変化を滑らかにすることができる。これにより、音質劣化（異音）をさらに抑制することができる。

【0154】

また、本実施の形態では、モード情報が切り替わる場合、減衰させるゲイン情報として、理想ゲインを対象とした場合を例に挙げて説明した。しかし、本発明はこれに限らず、理想ゲイン以外の他のゲイン情報を減衰（又は増幅）する構成に対しても本実施の形態を同様に適用できる。例えば、本実施の形態で説明したゲイン符号化部が対数ゲイン情報に対して減衰又は増幅させる構成が例として挙げられる。また、ゲイン符号化部は、量子化ターゲットとなる入力スペクトルそのものを減衰又は増幅させてもよい。また、上述したような前フレームのフレームエネルギと現フレームのフレームエネルギとの比（フレームエネルギ比）を用いる構成に対しても、ゲイン符号化部は、理想ゲイン、対数ゲイン又は入力スペクトル等のいずれに対して減衰（又は増幅）処理を適用してもよい。

【0155】

また、本実施の形態では、モード情報が切り替わる場合、符号化装置内でゲイン情報を減衰又は増幅させる構成を例に挙げて説明した。しかし、本発明はこれに限らず、復号装置内でゲイン情報を減衰又は増幅させる構成に対しても本実施の形態を同様に適用できる。すなわち、復号装置（例えば第２レイヤ復号部）は、モード情報に応じて複数の復号方法を切り替える複数の復号部を更に有し、前フレームと現フレームとで復号方法が切り替わる場合、現フレームの復号時に用いるゲイン情報を調整してもよい。例えば、復号装置は、モード情報の切り替わりを検出した際、復号したゲイン情報（理想ゲイン又は対数ゲイン）に対して減衰、増幅処理を行ってもよい。また、復号装置は、復号したゲイン情報（理想ゲイン及び対数ゲイン）を用いて生成した復号スペクトルに対して、減衰、増幅処理を行ってもよい。

【0156】

また、本実施の形態では、モード情報が切り替わる場合、予め定められた減衰係数を用いて、ゲイン情報が減衰される構成を例に挙げて説明した。しかし、本発明はこれに限らず、フレーム処理毎に適応的にゲイン情報を減衰させる減衰係数を算出する構成に対しても本実施の形態を同様に適用できる。例えば、上述したように、符号化装置（又は復号装置）は、前フレームのフレームエネルギと現フレームのフレームエネルギとの平均値を算出し、現フレームのフレームエネルギが算出された平均値に近づくような係数を用いてゲイン情報又はスペクトルを減衰、増幅させてもよい。すなわち、符号化装置（又は復号装置）は、前フレームのフレームエネルギを用いて、現フレームで用いるゲイン情報又はスペクトルを減衰、増幅させてもよい。

【0157】

又は、符号化装置（又は復号装置）は、モード情報が切り替わる場合、つまり、前フレームと現フレームとで符号化方法（復号方法）が切り替わる場合、前フレームで用いるゲイン情報を用いて、現フレームで用いるゲイン情報を調整してもよい。例えば、符号化装置（又は復号装置）は、前フレームと現フレームとで符号化方法（復号方法）が切り替わる場合、現フレームで用いるゲイン情報を前フレームで用いるゲイン情報に近づけるように、現フレームで用いるゲイン情報を調整してもよい。このような構成により、符号化方法（復号方法）が切り替わった際にも、符号化装置（復号装置）は、現フレームにおいて、前フレームを考慮したゲイン情報を用いることができ、符号化方法（復号方法）が切り替わる際に発生し得る音質劣化（異音）を更に抑制することができる。

【0158】

また、本実施の形態では、符号化装置の第２レイヤ符号化部内に２種類の符号化方式を備える構成を例に挙げて説明した。しかし、本発明はこれに限らず、３種類以上の符号化方式を備える構成、つまり３種類以上のマルチモード符号化／復号方式を採る構成に対しても本実施の形態を同様に適用できる。

【0159】

また、本実施の形態では、符号化装置の第２レイヤ符号化部内の第１符号化部においてのみ、ゲイン情報を減衰（又は増幅）させる構成を例に挙げて説明した。しかし、本発明はこれに限らず、第１符号化部以外の符号化部（例えば第２符号化部）についても同様にして減衰（又は増幅）処理を行う構成に対しても本実施の形態を同様に適用できる。つまり、マルチモード符号化／復号方式において、本実施の形態と同様の処理を、一部のモードの符号化／復号方式に適用してもよく、全てのモードの符号化／復号方式に適用してもよい。

【0160】

また、上記実施の形態における復号装置は、上記各実施の形態における符号化装置から伝送された符号化情報を用いて処理を行うとしたが、本発明はこれに限定されず、必要なパラメータまたはデータを含む符号化情報であれば、必ずしも上記各実施の形態における符号化装置からの符号化情報でなくても処理は可能である。

【0161】

また、信号処理プログラムを、メモリ、ディスク、テープ、ＣＤ、ＤＶＤ等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。

【0162】

また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はハードウェアとの連携においてソフトウェアでも実現することも可能である。

【0163】

また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されてもよいし、一部または全てを含むように１チップ化されてもよい。ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

【0164】

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル／プロセッサを利用してもよい。

【0165】

さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

【0166】

２０１０年６月２１日出願の特願２０１０−１４１０２１および２０１１年３月４日出願の特願２０１１−０４７５９７の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。

【産業上の利用可能性】

【0167】

本発明にかかる復号装置、符号化装置およびこれらの方法は、低域部のスペクトルを用いて帯域拡張を行い高域部のスペクトルを推定する際に、復号信号の品質を向上することができ、例えば、パケット通信システム、移動通信システムなどに適用できる。

【符号の説明】

【0168】

１０１，１１１，４００符号化装置
１０２伝送路
１０３，１１３復号装置
２０１ダウンサンプリング処理部
２０２第１レイヤ符号化部
１３２，２０３第１レイヤ復号部
１３３，２０４アップサンプリング処理部
１３４，２０５，３５６直交変換処理部
２０６，２２６，５０２第２レイヤ符号化部
２０７符号化情報統合部
２６０帯域分割部
２６１，３５２フィルタ状態設定部
２６２，３５３フィルタリング部
２６３探索部
２６４ピッチ係数設定部
２６５，５３１ゲイン符号化部
２６６多重化部
２７１理想ゲイン符号化部
２７２対数ゲイン符号化部
２８１，３７１最大振幅値探索部
２８２，３７２サンプル群抽出部
２８３対数ゲイン算出部
１３１，６０１符号化情報分離部
１３５，４０１，６０２第２レイヤ復号部
３５１分離部
３５４ゲイン復号部
３５５スペクトル調整部
３６１理想ゲイン復号部
３６２対数ゲイン復号部
３７３対数ゲイン適用部
３７４補間処理部
４０２第３レイヤ符号化部
５０１モード判定部
５２１，５２２，６２１，６２２スイッチ
５２３第１符号化部
５２４第２符号化部
６２３第１復号部
６２４第２復号部

【図1】