特許5986565 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニック　インテレクチュアル　プロパティ　コーポレーション　オブ　アメリカの特許一覧

特許5986565音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5986565

(24)【登録日】2016年8月12日

(45)【発行日】2016年9月6日

(54)【発明の名称】音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法

(51)【国際特許分類】

G10L 19/02 20130101AFI20160823BHJP

G10L 21/034 20130101ALI20160823BHJP

G10L 21/0388 20130101ALI20160823BHJP

【ＦＩ】

G10L19/02 150

G10L21/034

G10L21/0388 100

【請求項の数】8

【全頁数】23

(21)【出願番号】特願2013-519367(P2013-519367)

(86)(22)【出願日】2012年5月25日

(86)【国際出願番号】JP2012003409

(87)【国際公開番号】WO2012169133

(87)【国際公開日】20121213

【審査請求日】2015年2月20日

(31)【優先権主張番号】特願2011-129428(P2011-129428)

(32)【優先日】2011年6月9日

(33)【優先権主張国】JP

(31)【優先権主張番号】特願2011-172393(P2011-172393)

(32)【優先日】2011年8月5日

(33)【優先権主張国】JP

(73)【特許権者】

【識別番号】514136668

【氏名又は名称】パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ

【氏名又は名称原語表記】ＰａｎａｓｏｎｉｃＩｎｔｅｌｌｅｃｔｕａｌＰｒｏｐｅｒｔｙＣｏｒｐｏｒａｔｉｏｎｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】100105050

【弁理士】

【氏名又は名称】鷲田公一

(72)【発明者】

【氏名】大毛勝統

(72)【発明者】

【氏名】押切正浩

(72)【発明者】

【氏名】江原宏幸

【審査官】間宮嘉誉

(56)【参考文献】

【文献】特開２００８−１０７４１５（ＪＰ，Ａ）

【文献】特表２００４−５２２１９８（ＪＰ，Ａ）

【文献】特開２００２−１６９５９９（ＪＰ，Ａ）

【文献】特開２０１０−１５６９９０（ＪＰ，Ａ）

【文献】特開平７−３２７０１４（ＪＰ，Ａ）

【文献】特開平９−１２７９８７（ＪＰ，Ａ）

【文献】特開２０１０−２２４１８０（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１９／００−２５／９３

(57)【特許請求の範囲】

【請求項1】

広帯域の信号を第１レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化装置であって、
前記拡張帯域において符号化の際に制限を加える帯域を選択する帯域選択手段と、
入力信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、
を具備し、
前記帯域選択手段は、
前記拡張帯域において符号化対象から前記制限を加える帯域として、前記入力信号のピッチ周波数が高いほど除外する帯域を広く選択し、
前記帯域制限手段は、
前記選択された帯域を符号化対象から除外することにより前記制限を加える、
音声符号化装置。

【請求項2】

広帯域の信号を第１レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化装置であって、
前記拡張帯域において符号化の際に制限を加える帯域を選択する帯域選択手段と、
入力信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、
を具備し、
前記帯域選択手段は、
前記拡張帯域において前記制限を加える帯域として、前記入力信号のピッチ周波数が高いほどエネルギーを減衰させる帯域を広く選択し、
前記帯域制限手段は、
前記選択された帯域のエネルギーを減衰させることにより前記制限を加える、
音声符号化装置。

【請求項3】

符号化装置において生成された、広帯域の信号を符号化することによって得られた第１レイヤ符号化情報を第１レイヤにおいて復号し、前記広帯域よりも高域である拡張帯域の信号を符号化することによって得られた帯域拡張レイヤ符号化情報を帯域拡張レイヤにおいて復号する音声復号装置であって、
前記拡張帯域において出力の際に制限を加える帯域を選択する帯域選択手段と、
復号信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、
を具備し、
前記帯域選択手段は、
前記拡張帯域において出力対象から前記制限を加える帯域として、前記復号信号のピッチ周波数が高いほど除外する帯域を広く選択し、
前記帯域制限手段は、
前記選択された帯域を出力対象から除外することにより前記制限を加える、
音声復号装置。

【請求項4】

符号化装置において生成された、広帯域の信号を符号化することによって得られた第１レイヤ符号化情報を第１レイヤにおいて復号し、前記広帯域よりも高域である拡張帯域の信号を符号化することによって得られた帯域拡張レイヤ符号化情報を帯域拡張レイヤにおいて復号する音声復号装置であって、
前記拡張帯域において出力の際に制限を加える帯域を選択する帯域選択手段と、
復号信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、
を具備し、
前記帯域選択手段は、
前記拡張帯域において前記制限を加える帯域として、前記復号信号のピッチ周波数が高いほどエネルギーを減衰させる帯域を広く選択し、
前記帯域制限手段は、
前記選択された帯域のエネルギーを減衰させることにより前記制限を加える、
音声復号装置。

【請求項5】

広帯域の信号を第１レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化方法であって、
前記拡張帯域において符号化の際に制限を加える帯域を選択するステップと、
入力信号の帯域のうち前記選択された帯域に制限を加えるステップと、
を具備し、
前記帯域を選択するステップは、
前記拡張帯域において符号化対象から前記制限を加える帯域として、前記入力信号のピッチ周波数が高いほど除外する帯域を広く選択し、
前記選択された帯域に制限を加えるステップは、
前記選択された帯域を符号化対象から除外することにより前記制限を加える、
音声符号化方法。

【請求項6】

広帯域の信号を第１レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化方法であって、
前記拡張帯域において符号化の際に制限を加える帯域を選択するステップと、
入力信号の帯域のうち前記選択された帯域に制限を加えるステップと、
を具備し、
前記帯域を選択するステップは、
前記拡張帯域において前記制限を加える帯域として、前記入力信号のピッチ周波数が高いほどエネルギーを減衰させる帯域を広く選択し、
前記選択された帯域に制限を加えるステップは、
前記選択された帯域のエネルギーを減衰させることにより前記制限を加える、
音声符号化方法。

【請求項7】

広帯域の信号を第１レイヤにおいて復号するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて復号する音声復号方法であって、
前記拡張帯域において出力の際に制限を加える帯域を選択するステップと、
復号信号の帯域のうち前記選択された帯域に前記制限を加えるステップと、
を具備し、
前記帯域を選択するステップは、
前記拡張帯域において出力対象から前記制限を加える帯域として、前記復号信号のピッチ周波数が高いほど除外する帯域を広く選択し、
前記選択された帯域に前記制限を加えるステップは、
前記選択された帯域を出力対象から除外することにより前記制限を加える、
音声復号方法。

【請求項8】

広帯域の信号を第１レイヤにおいて復号するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて復号する音声復号方法であって、
前記拡張帯域において出力の際に制限を加える帯域を選択するステップと、
復号信号の帯域のうち前記選択された帯域に前記制限を加えるステップと、
を具備し、
前記帯域を選択するステップは、
前記拡張帯域において前記制限を加える帯域として、前記復号信号のピッチ周波数が高いほどエネルギーを減衰させる帯域を広く選択し、
前記選択された帯域に前記制限を加えるステップは、
前記選択された帯域のエネルギーを減衰させることにより前記制限を加える、
音声復号方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、例えばスケーラブル構成を有する音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法に関する。

【背景技術】

【0002】

移動体通信システムでは、電波資源等の有効利用のために、音声信号を低ビットレートに圧縮して伝送することが要求されている。その一方で、通話音声の品質向上及び臨場感の高い通話サービスの実現も望まれており、その実現には、より帯域の広い音声信号または音楽信号等を高品質に符号化することが望ましい。

【0003】

このように相反する２つの要求に対し、複数の符号化技術を階層的に統合する技術が有望視されている。この技術は、入力信号を広帯域（０ｋＨｚ〜７ｋＨｚ）まで符号化する第１レイヤと、入力信号と第１レイヤの復号信号とを用いて超広帯域（７ｋＨｚ〜１６ｋＨｚ）まで符号化を行う帯域拡張レイヤとを階層的に組み合わせるものである。以後、第１レイヤで符号化される信号帯域（０ｋＨｚ〜７ｋＨｚ）を広帯域部、帯域拡張レイヤで符号化される信号帯域（７ｋＨｚ〜１６ｋＨｚ）を拡張帯域部と呼ぶ。図１は、入力信号スペクトルにおける広帯域部と拡張帯域部とを示す図である。

【0004】

このように階層的に符号化を行う技術は、符号化装置から得られるビットストリームにスケーラビリティ性、すなわち、ビットストリームの一部の情報からでも復号信号を得ることができる性質を有するため、一般的にスケーラブル符号化（階層符号化）と呼ばれている。

【0005】

スケーラブル符号化方式は、その性質から、ビットレートの異なるネットワーク間の通信に柔軟に対応することができるので、ＩＰプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものと言える。

【0006】

ＩＴＵ−Ｔ（International Telecommunication Union Telecommunication Standardization Sector）で規格化された技術を用いてスケーラブル符号化を実現する例として、例えば、非特許文献１に開示されている技術がある。この技術は、第１レイヤにおいて、広帯域の信号を符号化し、帯域拡張レイヤにおいて、広帯域部の信号を用いて拡張帯域部の信号を拡張することで符号化を行う。このようなスケーラブル構成を用いることにより、音声信号及び、音声信号よりも帯域の広い音楽信号等の符号化における高品質化を図ることが可能となる。

【0007】

超広帯域までの信号を符号化して高音質を実現する符号化方式の場合、信号帯域が広く、情報量が多いため、ビットレートが高くなる。一方、無線通信において、音声通話に使用できるビットレートは限られているため、なるべくビットレートを低くして音声通話を行いたいという需要がある。一般に、無線通信では、周波数資源に限りがあるため、個々の回線の通信容量を抑える必要があり、音声コーデックが用いるトータルビットレートは１６ｋｂｐｓ程度に抑えなければならない。

【先行技術文献】

【非特許文献】

【0008】

【非特許文献1】Recommendation ITU-T G.718 AnnexB,2010年3月

【発明の概要】

【発明が解決しようとする課題】

【0009】

しかしながら、従来の装置においては、広帯域部の音声を高品質に符号化するためには相対的に高いビットレートが必要なため、拡張帯域部の音声の符号化には非常に低いビットレートしかビットを割り振ることができない。この結果、拡張帯域部において量子化ノイズが発生しやすくなり、全体としての品質を落としてしまうという問題がある。これに対して、広帯域部の音声の符号化に用いるビットレートを抑え、拡張帯域部の符号化に割り振るビットレートを増やした場合、広帯域音声の符号化品質が劣化するために、全体としての品質も劣化してしまうという問題がある。つまり、低ビットレートにおいて超広帯域の信号を含む音声を符号化する場合、広帯域部の品質と拡張帯域部の品質とはトレードオフの関係にある。

【0010】

本発明の目的は、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法を提供することである。

【課題を解決するための手段】

【0011】

本発明の音声符号化装置は、広帯域の信号を第１レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化装置であって、前記拡張帯域において符号化の際に制限を加える帯域を選択する帯域選択手段と、入力信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、を具備する構成を採る。

【0012】

本発明の音声復号装置は、符号化装置において生成された、広帯域の信号を符号化することによって得られた第１レイヤ符号化情報を第１レイヤにおいて復号し、前記広帯域よりも高域である拡張帯域の信号を符号化することによって得られた帯域拡張レイヤ符号化情報を帯域拡張レイヤにおいて復号する音声復号化装置であって、前記拡張帯域において出力の際に制限を加える帯域を選択する帯域選択手段と、復号信号の帯域のうち前記選択された帯域に前記制限を加える帯域制限手段と、を具備する構成を採る。

【0013】

本発明の音声符号化方法は、広帯域の信号を第１レイヤにおいて符号化するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて符号化する音声符号化方法であって、前記拡張帯域において符号化の際に制限を加える帯域を選択するステップと、入力信号の帯域のうち前記選択された帯域に制限を加えるステップと、を具備するようにした。

【0014】

本発明の音声復号方法は、広帯域の信号を第１レイヤにおいて復号するとともに、前記広帯域よりも高域である拡張帯域の信号を帯域拡張レイヤにおいて復号する音声復号方法であって、前記拡張帯域において出力の際に制限を加える帯域を選択するステップと、復号信号の帯域のうち前記選択された帯域に前記制限を加えるステップと、を具備するようにした。

【発明の効果】

【0015】

本発明によれば、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。

【図面の簡単な説明】

【0016】

【図1】入力信号スペクトルにおける広帯域部と拡張帯域部とを示す図

【図2】本発明の実施の形態１に係る音声符号化装置の構成を示すブロック図

【図3】本発明の実施の形態１における適応帯域制限部の構成を示すブロック図

【図4】本発明の実施の形態１における適応帯域選択部の構成を示すブロック図

【図5】本発明の実施の形態１における音声復号装置の構成を示すブロック図

【図6】本発明の実施の形態２における適応帯域選択部の構成を示すブロック図

【図7】本発明の実施の形態２における帯域制限周波数の決定方法を示す図

【図8】本発明の実施の形態２における帯域制限周波数決定部の動作を示すフロー図

【図9】本発明の実施の形態２に係る音声符号化装置の変形例を示すブロック図

【図10】本発明の実施の形態２の変形例における適応帯域制限部の構成を示すブロック図

【図11】本発明の実施の形態２の変形例における適応帯域選択部の構成を示すブロック図

【図12】本発明の実施の形態３における適応帯域選択部の構成を示すブロック図

【図13】本発明の実施の形態３における帯域制限周波数の決定方法を示す図

【図14】スケーラブル構成ではない音声符号化装置の構成を示すブロック図

【図15】本発明の実施の形態４に係る音声復号装置の構成を示すブロック図

【図16】本発明の実施の形態４の変形例に係る音声復号装置の構成を示すブロック図

【図17】本発明の実施の形態４の変形例における適応帯域制限部の構成を示すブロック図

【発明を実施するための形態】

【0017】

以下、本発明の実施の形態について、図面を参照して詳細に説明する。

【0018】

（実施の形態１）
＜音声符号化装置の構成＞
図２は、本発明の実施の形態１に係る音声符号化装置１００の構成を示すブロック図である。

【0019】

音声符号化装置１００は、所定の時間間隔（フレーム）単位で入力信号の符号化処理を行ってビットストリームを生成し、生成したビットストリームを図示しない通信路（transmission channel）へ伝送する。

【0020】

第１レイヤ符号化部１０１は、入力信号の第１レイヤにおける符号化処理を行い、第１レイヤ符号化データを生成する。第１レイヤ符号化部１０１は、生成した第１レイヤ符号化データを帯域拡張レイヤ符号化部１０３及び多重化部１０４に出力する。

【0021】

適応帯域制限部１０２は、入力信号のピッチ周期に基づいて制限を加える帯域を選択し、帯域拡張レイヤの入力信号の帯域のうち、選択した帯域に制限を加える。そして、適応帯域制限部１０２は、選択した帯域に制限を加えた帯域制限信号を、帯域拡張レイヤ符号化部１０３に出力する。ここで、制限を加える帯域とは、帯域拡張レイヤにおいて符号化対象から除外する帯域、または帯域拡張レイヤにおいてエネルギーを減衰させる帯域である。なお、適応帯域制限部１０２の構成の詳細については後述する。

【0022】

帯域拡張レイヤ符号化部１０３は、第１レイヤ符号化部１０１から入力した第１レイヤ符号化データと、適応帯域制限部１０２から入力した帯域制限信号とを用いて、拡張帯域部の帯域拡張レイヤにおける符号化処理を行い、帯域拡張レイヤ符号化データを生成する。帯域拡張レイヤ符号化部１０３は、生成した帯域拡張レイヤ符号化データを多重化部１０４に出力する。

【0023】

多重化部１０４は、第１レイヤ符号化部１０１から入力した第１レイヤ符号化データと、帯域拡張レイヤ符号化部１０３から入力した帯域拡張レイヤ符号化データとを多重化してビットストリームを生成し、生成したビットストリームを図示しない通信路（transmission channel）に出力する。

【0024】

＜適応帯域制限部の構成＞
図３は、本実施の形態における適応帯域制限部１０２の構成を示すブロック図である。

【0025】

適応帯域選択部３０１は、入力信号の特徴を分析し、分析結果に基づいて、入力信号において制限を加える帯域を選択する。適応帯域選択部３０１は、選択した制限を加える帯域の情報を帯域制限周波数として帯域制限信号生成部３０２に出力する。なお、適応帯域選択部３０１の構成の詳細については後述する。

【0026】

帯域制限信号生成部３０２は、入力信号と適応帯域選択部３０１から入力した帯域制限周波数とに基づいて帯域制限信号を生成し、生成した帯域制限信号を帯域拡張レイヤ符号化部１０３に出力する。

【0027】

具体的には、帯域制限信号生成部３０２は、適応帯域選択部３０１から入力した帯域制限周波数より低域の周波数を通過域とし、入力信号の帯域を制限する。即ち、帯域制限信号生成部３０２は、適応帯域選択部３０１により選択した帯域制限周波数より低域の入力信号を、帯域制限信号として帯域拡張レイヤ符号化部１０３に出力する。この場合には、帯域制限信号生成部３０２は、例えば低域通過フィルターにより構成される。

【0028】

または、帯域制限信号生成部３０２は、入力信号のうち、適応帯域選択部３０１から入力した帯域制限周波数よりも高域のエネルギーを減衰させた信号を、帯域制限信号として帯域拡張レイヤ符号化部１０３に出力する。

【0029】

＜適応帯域選択部の構成＞
図４は、本実施の形態における適応帯域選択部３０１の構成を示すブロック図である。

【0030】

ピッチ周期算出部４０１は、入力信号のピッチ周期を算出し、算出したピッチ周期を帯域制限周波数決定部４０２に出力する。

【0031】

帯域制限周波数決定部４０２は、ピッチ周期算出部４０１から入力したピッチ周期を用いて、ピッチ周期の逆数で表されるピッチ周波数Ｆ０を求め、求めたピッチ周波数Ｆ０を用いて帯域制限周波数Ｆｃｕｔを決定する。帯域制限周波数Ｆｃｕｔは、ピッチ周波数Ｆ０が低ければ高くなるように設定し、ピッチ周波数Ｆ０が高ければ低くなるように設定する。具体的には、帯域制限周波数Ｆｃｕｔは、以下の（１）式で表される。

【数1】

【0032】

ピッチ周期が高い音声（高音）は、比較的超広帯域部にエネルギーを多く含んでいる傾向にあるため、低ビットレートにおいて帯域拡張レイヤで符号化した際にノイズ感が出やすい。従って、ピッチ周期が高い音声の場合には、ピッチ周期が低い音声（低音）の場合よりも帯域制限周波数Ｆｃｕｔを低く設定する。一方、ピッチ周期が低い音声は、ピッチ周期が高い音声に比べて超広帯域部に含まれるエネルギーが少ない傾向にあるため、低ビットレートにおいて帯域拡張レイヤで符号化した際でもノイズ感が知覚されにくい。従って、ピッチ周期が低い音声の場合には、ピッチ周期が高い音声（高音）の場合よりも帯域制限周波数Ｆｃｕｔを高く設定する。このように、帯域制限周波数Ｆｃｕｔをピッチ周期に応じて適応的に設定することによって、超広帯域部で発生する量子化ノイズの発生を抑え、音質改善を図ることができる。

【0033】

帯域制限周波数決定部４０２は、決定した帯域制限周波数Ｆｃｕｔを帯域制限信号生成部３０２に出力する。これにより、帯域制限信号生成部３０２は、帯域制限周波数Ｆｃｕｔよりも高域を通過させないようにして帯域に制限を加える。または、帯域制限信号生成部３０２は、帯域制限周波数Ｆｃｕｔよりも高域のエネルギーを減衰させて帯域に制限を加える。

【0034】

上記で説明したように、本実施の形態では、低ビットレートで超広帯域の信号を含む音声を符号化する際に、拡張帯域部で発生する量子化ノイズを低減させるために、帯域拡張レイヤに入力する信号の帯域を入力信号の特徴に合わせて適応的に制限する。一般に、音声の品質は低域の信号ほど聴感的に重要であり、例えば７ｋＨｚ以上の周波数帯域では、信号の帯域幅の差による主観的な品質の違いは感じにくくなる。この原理を利用し、入力信号の特徴から拡張帯域部で量子化ノイズが発生しやすいと判断された場合には、入力信号の帯域幅を制限することで、出力信号のノイズ感を低減させる。このとき、帯域を制限したことによって帯域感の損失は生じるが、帯域幅の差による主観的な品質の違いは感じにくいことから、全体としての品質は向上する。

【0035】

＜音声復号装置の構成＞
図５は、本発明の実施の形態１における音声復号装置５００の構成を示すブロック図である。

【0036】

分離部５０１は、図示しない通信路（transmission channel）を介して入力されるビットストリームを第１レイヤ符号化データと帯域拡張レイヤ符号化データとに分離して、第１レイヤ符号化データを第１レイヤ復号部５０２へ出力し、帯域拡張レイヤ符号化データを帯域拡張レイヤ復号部５０３へ出力する。ただし、輻輳の発生等の通信路の状況によっては、符号化データの一部（例えば、帯域拡張レイヤ符号化データ）、または符号化データの全てが廃棄されてしまう場合がある。この際、分離部５０１は、受信した符号化データに第１レイヤ符号化データのみが含まれる場合であるのか、または第１レイヤ符号化データと帯域拡張レイヤ符号化データとの双方が含まれる場合であるのかを判定し、その判定結果をレイヤ情報として切替部５０５に出力する。レイヤ情報は、例えば、前者の場合を「１」、後者の場合を「２」とする。なお、音声復号装置５００は、全ての符号化データを廃棄した場合、所定の補償処理を行って出力信号を生成する。

【0037】

第１レイヤ復号部５０２は、分離部５０１から入力した第１レイヤ符号化データの復号処理を行って第１レイヤ復号信号を生成し、生成した第１レイヤ復号信号を加算部５０４及び切替部５０５に出力する。

【0038】

帯域拡張レイヤ復号部５０３は、分離部５０１から入力した帯域拡張レイヤ符号化データの復号処理を行って帯域拡張レイヤ復号信号を生成し、生成した帯域拡張レイヤ復号信号を加算部５０４に出力する。

【0039】

加算部５０４は、第１レイヤ復号部５０２から入力した第１レイヤ復号信号と、帯域拡張レイヤ復号部５０３から入力した帯域拡張レイヤ復号信号とを加算して加算復号信号を生成し、生成した加算復号信号を切替部５０５に出力する。

【0040】

切替部５０５は、分離部５０１から入力したレイヤ情報を参照し、第１レイヤ符号化データのみが含まれる場合（例えば、レイヤ情報が「１」の場合）には、第１レイヤ復号信号を復号信号として後処理部５０６に出力する。また、切替部５０５は、分離部５０１から入力したレイヤ情報を参照し、第１レイヤ符号化データと帯域拡張レイヤ符号化データとの双方が含まれる場合（例えば、レイヤ情報が「２」の場合）には、加算部５０４から入力した、第１レイヤ復号信号と帯域拡張レイヤ復号信号とを加算した加算復号信号を、復号信号として後処理部５０６に出力する。

【0041】

後処理部５０６は、切替部５０５から入力した復号信号にポストフィルタ等の後処理を行い、出力信号として出力する。

【0042】

＜本実施の形態の効果＞
本実施の形態によれば、ピッチ周期に応じて帯域制限周波数を適応的に調整し、帯域制限周波数以上の帯域は、帯域拡張レイヤにおける符号化対象から除外するか、または帯域拡張レイヤにおいてエネルギーを減衰させて聴感的な重要度を下げることにより、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。

【0043】

＜本実施の形態の変形例＞
本実施の形態において、第１レイヤ符号化部１０１において入力信号を単に符号化したが、本発明はこれに限らず、入力信号が音声であるのか音楽であるのかをモード判定し、そのモード判定情報を適応帯域制限部１０２に出力し、適応帯域制限部１０２において入力信号が音声の場合と音楽の場合とによって帯域制限を行うか否かを切り替えてもよい。具体的には、入力信号が音声であった場合には帯域制限を行い、入力信号が音楽であった場合には帯域制限を行わないように切り替えてもよい。

【0044】

また、本実施の形態において、適応帯域選択部３０１においてピッチ周波数Ｆ０から帯域制限周波数Ｆｃｕｔを決定する際に数式を用いたが、本発明はこれに限らず、テーブルを参照することにより、ピッチ周波数Ｆ０から帯域制限周波数Ｆｃｕｔを決定してもよい。この際、テーブルは、入力信号のピッチ周波数Ｆ０が低いほどＦｃｕｔが高くなるように、または入力信号のピッチ周波数Ｆ０が高いほどＦｃｕｔが低くなるように設計される。

【0045】

また、本実施の形態において、拡張帯域部における帯域制限周波数Ｆｃｕｔより高域を帯域制限したが、本発明はこれに限らず、拡張帯域部における品質に影響を与える所定帯域幅を帯域制限してもよい。

【0046】

また、本実施の形態において、ピッチ周期算出部４０１において入力信号のピッチ周期を算出したが、本発明はこれに限らず、第１レイヤ符号化部１０１で入力信号のピッチ周期を算出して帯域制限周波数決定部４０２に出力してもよい。この場合には、ピッチ周期算出部４０１を不要にすることができる。

【0047】

（実施の形態２）
本実施の形態は、入力信号をＦＦＴ（Fast Fourier Transform）分析することによりスペクトルを求め、求めたスペクトルと、ピッチ周波数及びビットレートによって決まる閾値とを用いて帯域制限周波数を決定する点に特徴を有する。ここでビットレートは、音声符号化装置の外部から入力される。

【0048】

＜適応帯域選択部の構成＞
図６は、本発明の実施の形態２における適応帯域選択部６００の構成を示すブロック図である。なお、本実施の形態における音声符号化装置は、図２と同一構成であるので、その説明を省略する。本実施の形態における適応帯域制限部は、適応帯域選択部３０１の代わりに適応帯域選択部６００を有する以外は図３と同一構成であるので、その説明を省略する。また、本実施の形態における音声復号装置は、図５と同一構成であるので、その説明を省略する。

【0049】

スペクトル算出部６０１は、入力信号に対してＦＦＴ分析を行ってスペクトルを算出し、算出したスペクトルのスペクトル情報を帯域制限周波数決定部６０４に出力する。

【0050】

ピッチ周期算出部６０２は、入力信号のピッチ周期を算出し、算出したピッチ周期を閾値算出部６０３に出力する。

【0051】

閾値算出部６０３は、ピッチ周期算出部６０２から入力したピッチ周期と、入力したビットレートとから閾値を算出し、算出した閾値Ｉｔｈを帯域制限周波数決定部６０４に出力する。ビットレートは、予め設定した値である。閾値Ｉｔｈは、以下の（２）式より求められる。

【数2】

【0052】

ここで、ピッチ周波数は、ピッチ周期算出部６０２から入力したピッチ周期の逆数で表される。（２）式より、閾値Ｉｔｈは、ビットレートが高くなるほど大きくなり、ピッチ周波数が高くなるほど小さくなる。また、ビットレートは、コーデック全体に割り当てられるビットレートでもよいし、帯域拡張レイヤだけに割り当てられるビットレートでもよい。

【0053】

帯域制限周波数決定部６０４は、スペクトル算出部６０１から入力したスペクトル情報と、閾値算出部６０３から入力した閾値とを用いて帯域制限周波数を決定し、決定した帯域制限周波数を帯域制限信号生成部３０２に出力する。

【0054】

＜帯域制限周波数の決定方法＞
図７は、帯域制限周波数の決定方法を示す図である。図７は、超広帯域音声スペクトルを、Ｅ［０］〜Ｅ［８］の９つのサブバンドに分割した場合を示す。なお、超広帯域音声スペクトルは、９つのサブバンドに分割する場合に限らず、任意の数のサブバンドに分割することができる。また、各サブバンドの帯域幅は、等幅である場合に限らず、異なる幅であってもよい。

【0055】

帯域制限周波数決定部６０４は、全サブバンドのエネルギーの総和Ｅａｌｌに対する、低域からの各サブバンドエネルギーＥ［ｋ］の累積和Ｅｆ［ｋ］のサブバンドエネルギーの比（Ｅｆ［ｋ］／Ｅａｌｌ）を求める。ここでｋは０から８までの整数で表されるサブバンドインデックスである。そして、帯域制限周波数決定部６０４は、サブバンドエネルギー比が、閾値算出部６０３から入力した閾値Ｉｔｈより大きな値になったときのサブバンドインデックスｋ（図７の場合はｋ＝５）を帯域制限信号生成部３０２に出力する。

【0056】

＜帯域制限周波数決定部の動作＞
図８は、帯域制限周波数決定部６０４の動作を示すフロー図である。

【0057】

帯域制限周波数決定部６０４は、まず全サブバンドエネルギーの総和Ｅａｌｌを「０」にして初期化する（ステップＳＴ８０１）。

【0058】

次に、帯域制限周波数決定部６０４は、全サブバンドエネルギーの総和Ｅａｌｌを求める（ステップＳＴ８０２）。

【0059】

次に、帯域制限周波数決定部６０４は、サブバンドエネルギーの累積和Ｅｆ［ｋ］を求めるために、サブバンドインデックスｋとサブバンドエネルギーの累積和Ｅｆ［０］とを０にして初期化する（ステップＳＴ８０３）。

【0060】

次に、帯域制限周波数決定部６０４は、サブバンドインデックスｋに対応するサブバンドエネルギーの累積和Ｅｆ［ｋ］を求め（ステップＳＴ８０４）、それを用いて得られるサブバンドエネルギー比（Ｅｆ［ｋ］／Ｅａｌｌ）と閾値算出部６０３から出力された閾値Ｉｔｈとを比較する（ステップＳＴ８０５）。

【0061】

サブバンドエネルギー比が閾値Ｉｔｈ以下の場合（ステップＳＴ８０５：ＮＯ）には、帯域制限周波数決定部６０４は、サブバンドインデックスｋの値をインクリメントし（ステップＳＴ８０６）、所定の範囲の探索が終了したか否かを判定する（ステップＳＴ８０７）。

【0062】

探索が終了していない場合（ステップＳＴ８０７：ＮＯ）には、帯域制限周波数決定部６０４は、サブバンドエネルギー比が閾値Ｉｔｈより大きくなるまでステップＳＴ８０４〜ステップＳＴ８０７の処理を繰り返す。

【0063】

一方、サブバンドエネルギー比が閾値Ｉｔｈを超えた場合（ステップＳＴ８０５：ＹＥＳ）、または所定の範囲の探索が終了した場合（ステップＳＴ８０７：ＹＥＳ）には、帯域制限周波数決定部６０４は、そのときのサブバンドインデックスｋを帯域制限信号生成部３０２に出力する（ステップＳＴ８０８）。サブバンドインデックスｋの各々は、各サブバンドの上端周波数と一対一で各々対応しており、この上端周波数を帯域制限周波数と見なす。

【0064】

このように、本実施の形態では、サブバンドエネルギー比を用いて帯域制限周波数を設定することで、全帯域の中でエネルギーが比較的大きい帯域と小さい帯域とに分割し、エネルギーが小さい帯域を符号化対象から除外するか、またはエネルギーが小さい帯域のエネルギーを減衰させることによって聴感的な重要度を下げる。

【0065】

＜本実施の形態の効果＞
本実施の形態によれば、サブバンドエネルギー比に応じて帯域制限周波数を適応的に調整することにより、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。

【0066】

＜本実施の形態の変形例＞
本実施の形態において、スペクトル算出部６０１は、入力信号に対してＦＦＴ分析を行うことによりスペクトルを算出したが、本発明はこれに限らず、第１レイヤ符号化部で生成されるＬＰＣ（Linear Prediction coding）係数を用いてスペクトル包絡を求めてもよい。

【0067】

図９は、本実施の形態に係る音声符号化装置の変形例（音声符号化装置９００）を示すブロック図である。なお、図９に示す音声符号化装置９００は、図２に示す実施の形態１に係る音声符号化装置１００に対して、適応帯域制限部１０２の代わりに適応帯域制限部９０１を有する。なお、図９において、図２と同一構成である部分には同一の符号を付してその説明を省略する。

【0068】

第１レイヤ符号化部１０１は、入力信号の符号化処理を行い、第１レイヤ符号化データを生成する。第１レイヤ符号化部１０１は、生成した第１レイヤ符号化データを帯域拡張レイヤ符号化部１０３及び多重化部１０４に出力するとともに、第１レイヤ符号化部１０１で生成されるＬＰＣ係数を適応帯域制限部９０１に出力する。ＬＰＣ係数は、例えば、自己相関法により算出する。

【0069】

適応帯域制限部９０１は、入力信号と、第１レイヤ符号化部１０１から入力したＬＰＣ係数とに基づいて、帯域拡張レイヤにおいて制限を加える帯域を選択する。そして、適応帯域制限部９０１は、入力信号の帯域のうち、選択した帯域に制限を加えた帯域制限信号を、帯域拡張レイヤ符号化部１０３に出力する。なお、適応帯域制限部９０１の構成の詳細については後述する。

【0070】

帯域拡張レイヤ符号化部１０３は、第１レイヤ符号化部１０１から入力した第１レイヤ符号化データと、適応帯域制限部９０１から入力した帯域制限信号とを用いて拡張帯域部の符号化処理を行い、帯域拡張レイヤ符号化データを生成する。帯域拡張レイヤ符号化部１０３は、生成した帯域拡張レイヤ符号化データを多重化部１０４に出力する。

【0071】

図１０は、適応帯域制限部９０１の構成を示すブロック図である。なお、図１０に示す適応帯域制限部９０１は、図３に示す実施の形態１における適応帯域制限部１０２に対して、適応帯域選択部３０１の代わりに、適応帯域選択部１００１を有する。なお、図１０において、図３と同一構成である部分には同一の符号を付してその説明を省略する。なお、適応帯域選択部１００１の構成の詳細については後述する。

【0072】

適応帯域選択部１００１は、入力信号の特徴を分析し、分析結果と第１レイヤ符号化部１０１から入力したＬＰＣ係数とに基づいて、入力信号において制限を加える帯域を選択する。適応帯域選択部１００１は、選択した制限を加える帯域の情報を帯域制限周波数として帯域制限信号生成部３０２に出力する。なお、適応帯域選択部１００１の構成の詳細については後述する。

【0073】

帯域制限信号生成部３０２は、入力信号と適応帯域選択部１００１から入力した帯域制限周波数とに基づいて帯域制限信号を生成し、生成した帯域制限信号を帯域拡張レイヤ符号化部１０３に出力する。なお、本実施の形態における帯域制限信号生成部３０２の構成及び動作は、上記の実施の形態１の帯域制限信号生成部３０２と同一であるので、その詳細な説明を省略する。

【0074】

図１１は、本実施の形態における適応帯域選択部１００１の構成を示すブロック図である。なお、図１１に示す適応帯域選択部１００１は、図６に示す本実施の形態における適応帯域選択部６００に対して、スペクトル算出部６０１を除き、スペクトル包絡算出部１１０１を追加する。なお、図１１において、図６と同一構成である部分には同一の符号を付してその説明を省略する。

【0075】

スペクトル包絡算出部１１０１は、第１レイヤ符号化部１０１から入力したＬＰＣ係数を用いて、スペクトル包絡を推定し、推定したスペクトル包絡をスペクトル情報として帯域制限周波数決定部６０４に出力する。このスペクトル情報を基に、帯域制限周波数決定部６０４では、ＦＦＴ分析でスペクトルを求めた場合と同様にして、前記サブバンドエネルギー比を求めることができる。

【0076】

上記の構成により、本実施の形態の効果と同様の効果を得ることができる。

【0077】

なお、本実施の形態の変形例において、スペクトル包絡算出部１１０１は、ＬＰＣ係数を用いてスペクトル包絡を求めたが、本発明はこれに限らず、ＬＰＣ係数以外のＬＳＰ（Linear Spectral Pairs）、ＬＳＦ（Linear Spectral Frequencies）、ＩＳＰ（Immitance Spectral Pairs）ＩＳＦ（Immitance Spectral Frequencies）またはＰＡＲＣＯＲ（Partial Auto Correlation）係数などを用いてスペクトル包絡を求めることができる。

【0078】

＜本実施の形態におけるその他の変形例＞
本実施の形態において、スペクトル算出部は、入力信号に対してＦＦＴ分析を行ってスペクトルを算出したが、本発明はこれに限らず、ＦＦＴ以外のＤＦＴ（Discrete Fourier Transform）、ＤＣＴ（Discrete Cosine Transform）、ＭＤＣＴ（Modified Discrete Cosine Transform）またはフィルタバンクなどを使用することができる。

【0079】

また、本実施の形態において、ピッチ周期算出部６０２において入力信号のピッチ周期を算出したが、本発明はこれに限らず、第１レイヤ符号化部１０１で入力信号のピッチ周期を算出して閾値算出部６０３に出力してもよい。この場合には、ピッチ周期算出部６０２を不要にすることができる。

【0080】

（実施の形態３）
本実施の形態は、無声区間における背景雑音スペクトルと、有声区間における音声スペクトルとの比較に基づく帯域制限を行うことで、制限帯域を符号化対象から除外する点に特徴を有する。すなわち、無声区間においては背景雑音スペクトルを求め、有声区間では音声スペクトルを求める。有声区間においては、背景雑音のレベルを下回る帯域の音声スペクトルに関しては背景雑音にマスキングされ、聴感上重要ではないとみなすことができるので、この背景雑音のレベルを下回る帯域を制限する。

【0081】

＜適応帯域選択部の構成＞
図１２は、本発明の実施の形態３における適応帯域選択部１２００の構成を示すブロック図である。なお、本実施の形態における音声符号化装置は、図２と同一構成であるので、その説明を省略する。また、本実施の形態における適応帯域制限部１０２は、適応帯域選択部３０１の代わりに適応帯域選択部１２００を有する以外は図４と同一構成であるので、その説明を省略する。また、本実施の形態における音声復号装置は、図５と同一構成であるので、その説明を省略する。

【0082】

スペクトル算出部１２０１は、入力信号に対してＦＦＴ分析を行うことにより、入力信号のスペクトルを求め、求めたスペクトルのスペクトル情報をスイッチ部１２０３及び帯域制限周波数決定部１２０５に出力する。

【0083】

音声検出部１２０２は、入力信号を用いて無声区間か有声区間かを検出し、検出情報をスイッチ部１２０３に出力する。音声検出部１２０２は、例えば無声区間なら「０」、有声区間なら「１」を検出情報としてスイッチ部１２０３に出力する。

【0084】

スイッチ部１２０３は、音声検出部１２０２から入力した検出情報を用いてスイッチングを行う。具体的には、スイッチ部１２０３は、検出情報が無声区間の場合（例えば、検出情報「０」の場合）のみ、スペクトル算出部１２０１から入力したスペクトル情報を背景雑音スペクトル算出部１２０４に出力する。一方、スイッチ部１２０３は、検出情報が有声区間の場合（例えば、検出情報「１」の場合）は、スイッチをオフにして何も出力しない。

【0085】

背景雑音スペクトル算出部１２０４は、無声区間のフレームの間、スイッチ部１２０３から入力したスペクトル情報におけるサブバンドエネルギーの平均化をサブバンド毎に行い、サブバンド毎に平均化された背景雑音スペクトルを帯域制限周波数決定部１２０５に出力する。背景雑音スペクトルの平均化は、例えば次の（３）式のように行われる。

【数3】

【0086】

（３）式において、次の無声区間のフレームにおけるＮｅを求める際には、Ｎｐｒｅｖに前フレームにおけるＮｅを代入することでＮｐｒｅｖを更新する。

【0087】

帯域制限周波数決定部１２０５は、サブバンドごとにスペクトル算出部１２０１から入力したスペクトル情報のスペクトルＳから、背景雑音スペクトル算出部１２０４から入力した平均化された背景雑音スペクトルＮｅを対数領域において引き算する。そして、帯域制限周波数決定部１２０５は、引き算した値が負になったときの周波数の値を、帯域制限周波数Ｆｃｕｔとして帯域制限信号生成部３０２に出力する。一方、帯域制限周波数決定部１２０５は、引き算した値が負にならなかった場合には、帯域制限周波数Ｆｃｕｔの値を１６ｋＨｚに設定して、帯域制限信号生成部３０２に出力する。すなわち、帯域制限を行わない。

【0088】

＜帯域制限周波数の決定方法＞
図１３は、本実施の形態における帯域制限周波数の決定方法を示す図である。

【0089】

帯域制限周波数決定部１２０５は、図１３（Ａ）に示す入力信号から無声区間と有声区間とを検出し、無声区間において入力信号のＦＦＴ分析を行うことにより、図１３（Ｂ）に示す背景雑音スペクトルを得る。

【0090】

また、帯域制限周波数決定部１２０５は、有声区間においても入力信号のＦＦＴ分析を行うことにより、図１３（Ｃ）に示す音声スペクトルを得る。

【0091】

帯域制限周波数決定部１２０５は、図１３（Ｄ）に示すように、図１３（Ｂ）のスペクトルと図１３（Ｃ）のスペクトルとを比較する。そして、帯域制限信号生成部３０２は、音声スペクトルが背景雑音スペクトルのレベルを下回る帯域（図１３（Ｄ）においてはＦｃｕｔ以上の帯域）を、符号化対象から除外するか、または音声スペクトルが背景雑音スペクトルのレベルを下回る帯域（図１３（Ｄ）においてはＦｃｕｔ以上の帯域）のエネルギーを減衰させることにより帯域に制限を加える。

【0092】

＜本実施の形態の効果＞
本実施の形態によれば、音声スペクトルのレベルと背景雑音スペクトルのレベルとの関係に応じて帯域制限周波数を適応的に調整することにより、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。

【0093】

＜本実施の形態の変形例＞
本実施の形態において、スペクトル算出部は、入力信号に対してＦＦＴ分析を行ってスペクトルを算出したが、本発明はこれに限らず、ＦＦＴ以外のＤＦＴ、ＤＣＴ、ＭＤＣＴまたはフィルタバンクなどを使用することができる。

【0094】

＜実施の形態１〜実施の形態３に共通の変形例＞
上記の実施の形態１〜実施の形態３において、音声符号化装置をスケーラブル構成として説明したが、本発明はこれに限らず、スケーラブル構成ではない符号化方式にも適用可能である。図１４は、スケーラブル構成ではない音声符号化装置１４００の構成を示すブロック図である。本発明は、図１４に示すような音声符号化装置１４００にも適用することができる。

【0095】

図１４より、適応帯域制限部１４０１は、帯域拡張レイヤにおいて制限する帯域を選択し、入力信号の帯域のうち選択した帯域を制限した帯域制限信号を符号化部１４０２に出力する。なお、適応帯域制限部１４０１は、上記の実施の形態１〜実施の形態３に示した何れか１つの方法を採用して帯域制限周波数を決定することができる。この際、例えば符号化部１４０２が符号化対象とする帯域が狭帯域（０Ｈｚ〜３．５ｋＨｚ）の場合には、適応帯域制限部１４０１で決定される帯域制限周波数の下限は、３．５ｋＨｚまでの値をとり得る。

【0096】

符号化部１４０２は、適応帯域制限部１４０１から入力した帯域制限信号を符号化してビットストリームを生成し、生成したビットストリームを図示しない通信路に出力する。

【0097】

（実施の形態４）
本実施の形態は、音声復号装置において帯域に制限を加える点に特徴を有する。

【0098】

図１５は、本実施の形態に係る音声復号装置１５００の構成を示すブロック図である。

【0099】

復号部１５０１は、図示しない通信路（transmission channel）を介して入力されるビットストリームを復号して復号信号を生成し、生成した復号信号を適応帯域制限部１５０２に出力する。なお、本実施の形態における復号部１５０１は、一例として、図５の音声復号装置５００と同一構成としてもよく、ここではその詳細な説明を省略する。

【0100】

適応帯域制限部１５０２は、制限を加える帯域を選択し、復号部１５０１から入力した復号信号の帯域のうち、選択した帯域に制限を加えた帯域制限信号を出力信号として出力する。この際、適応帯域制限部１５０２は、上記の実施の形態１〜実施の形態３に示した何れか１つの方法を採用して帯域制限周波数を決定する。

【0101】

即ち、適応帯域制限部１５０２は、復号部１５０１から入力した復号信号のピッチ周期に基づいて制限を加える帯域を選択する。または、適応帯域制限部１５０２は、復号部１５０１から入力した復号信号に対してＦＦＴ分析を行ってスペクトルを算出し、算出したスペクトルと（２）式により求めた閾値とを用いて制限を加える帯域を選択する。または、適応帯域制限部１５０２は、復号部１５０１から入力した復号信号に対してＦＦＴ分析を行ってスペクトルを算出し、サブバンドごとに算出したスペクトルから、平均化された背景雑音スペクトルを対数領域において引き算し、引き算した値が負になったときの周波数以上の周波数を制限を加える帯域として選択する。

【0102】

すなわち、前述の実施の形態の符号化装置のように、適応帯域制限部１５０２は、ピッチ周波数が高いほど広い、除外する帯域を選択する構成を有するようにしたり、あるいは、符号化装置がスケーラブル構成の場合は、ピッチ周波数が高いほど広い、拡張帯域のエネルギーを減衰させる帯域を選択する構成を有するようにしてもよい。

【0103】

なお、適応帯域制限部１５０２は、例えば復号部１５０１が復号対象とする帯域が狭帯域（０Ｈｚ〜３．５ｋＨｚ）の場合には、帯域制限周波数の下限として３．５ｋＨｚまでの値をとり得る。

【0104】

＜本実施の形態の効果＞
本実施の形態による音声復号装置は、帯域制限周波数を適応的に調整し、帯域制限周波数以上の帯域を、帯域拡張レイヤにおける符号化対象から除外するか、または帯域拡張レイヤにおいてエネルギーを減衰させて聴感的な重要度を下げることにより、ビットレートを低くしても符号化に伴う全体的な品質の劣化を防ぐことができる。

【0105】

＜本実施の形態の変形例＞
図１６は、本実施の形態の変形例に係る音声復号装置１６００を示すブロック図である。

【0106】

本実施の形態の変形例における音声復号装置１６００は、適応帯域制限部１６０２において、上記実施の形態２の方法を用いて帯域制限周波数を決定する。この場合、復号部１６０１で生成されるＬＰＣ係数を用いる。

【0107】

復号部１６０１は、図示しない通信路（transmission channel）を介して入力されるビットストリームを復号して復号信号を生成し、生成した復号信号を適応帯域制限部１６０２に出力する。この際、復号部１６０１は、ＬＰＣ係数を生成し、生成したＬＰＣ係数を適応帯域制限部１６０２に出力する。ＬＰＣ係数は、例えば、自己相関法により算出する。なお、復号部１６０１におけるその他の構成及び動作は、図５の音声復号装置５００と同一であるので、その説明を省略する。

【0108】

適応帯域制限部１６０２は、復号部１６０１から入力した復号信号及びＬＰＣ係数に基づいて、制限を加える帯域を選択し、復号部１６０１から入力した帯域拡張レイヤの復号信号の帯域のうち、選択した帯域に制限を加える。そして、適応帯域制限部１６０２は、選択した帯域に制限を加えた帯域制限信号を出力信号として出力する。

【0109】

図１７は、本実施の形態の変形例における適応帯域制限部１６０２の構成を示すブロック図である。

【0110】

適応帯域選択部１７０１は、復号部１６０１から入力した復号信号の特徴を分析し、分析結果と復号部１６０１から入力したＬＰＣ係数とに基づいて、復号信号において制限を加える帯域を選択する。適応帯域選択部１７０１は、選択した制限を加える帯域の情報を帯域制限周波数として帯域制限信号生成部１７０２に出力する。

【0111】

帯域制限信号生成部１７０２は、復号部１６０１から入力した復号信号と適応帯域選択部１７０１から入力した帯域制限周波数とに基づいて帯域制限信号を生成し、生成した帯域制限信号を出力信号として出力する。

【0112】

具体的には、帯域制限信号生成部１７０２は、適応帯域選択部１７０１から入力した帯域制限周波数より低域の周波数を通過域とし、復号部１６０１から入力した復号信号において帯域に制限を加える。即ち、帯域制限信号生成部１７０２は、適応帯域選択部１７０１により選択した帯域制限周波数より低域の入力信号を出力信号（帯域制限信号）として出力する。この場合には、帯域制限信号生成部１７０２は、例えば低域通過フィルターにより構成される。

【0113】

または、帯域制限信号生成部１７０２は、入力信号のうち、適応帯域選択部１７０１から入力した帯域制限周波数よりも高域のエネルギーを減衰させた信号を、出力信号（帯域制限信号）として出力する。

【0114】

この変形例によれば、上記実施の形態２と同様の効果を得ることができる。

【0115】

なお、本実施の形態の変形例は、復号部１６０１がスケーラブル構成である場合に限らず、スケーラブル構成以外の構成にも適用可能である。

【0116】

＜全ての実施の形態に共通の変形例＞
上記の実施の形態１〜実施の形態４において、階層数が２のスケーラブル構成にしたが、本発明はこれに限らず、階層数が３以上のスケーラブル構成にも適用可能である。

【0117】

また、上記の実施の形態１〜実施の形態４において、入力信号は音声信号、音楽信号、あるいは音声と音楽とが混在する信号の何れであってもよい。

【0118】

また、上記の実施の形態１〜実施の形態４において、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はハードウェアとの連携においてソフトウェアでも実現することも可能である。

【0119】

また、上記の実施の形態１〜実施の形態４の説明に用いた各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されてもよいし、一部または全てを含むように１チップ化されてもよい。ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

【0120】

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）、または、ＬＳＩ内部の回路セルの接続または設定を再構成可能なリコンフィギュラブルプロセッサを利用してもよい。

【0121】

さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

【0122】

２０１１年６月９日出願の特願２０１１−１２９４２８の日本出願及び２０１１年８月５日出願の特願２０１１−１７２３９３の日本出願に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。

【産業上の利用可能性】

【0123】

本発明は、例えばスケーラブル構成を有する音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法に好適である。

【符号の説明】

【0124】

１０１第１レイヤ符号化部
１０２、９０１、１４０１、１５０２、１６０２適応帯域制限部
１０３帯域拡張レイヤ符号化部
１０４多重化部
３０１、６００、１００１、１７０１適応帯域選択部
３０２、１７０２帯域制限信号生成部
４０１、６０２ピッチ周期算出部
４０２、６０４、１２０５帯域制限周波数決定部
６０１、１２０１スペクトル算出部
６０３閾値算出部
１１０１スペクトル包絡算出部
１２０２音声検出部
１２０３スイッチ部
１２０４背景雑音スペクトル算出部
１４０２符号化部
１５０１、１６０１復号部

【図1】