特許5863868 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エレクトロニクス　アンド　テレコミュニケーションズ　リサーチ　インスチチュートの特許一覧

特許5863868適応的正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5863868

(24)【登録日】2016年1月8日

(45)【発行日】2016年2月17日

(54)【発明の名称】適応的正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置

(51)【国際特許分類】

G10L 19/093 20130101AFI20160204BHJP

G10L 19/032 20130101ALI20160204BHJP

【ＦＩ】

G10L19/093

G10L19/032

【請求項の数】12

【全頁数】19

(21)【出願番号】特願2014-77807(P2014-77807)

(22)【出願日】2014年4月4日

(62)【分割の表示】特願2011-550065(P2011-550065)の分割

【原出願日】2010年2月16日

(65)【公開番号】特開2014-170232(P2014-170232A)

(43)【公開日】2014年9月18日

【審査請求日】2014年4月9日

(31)【優先権主張番号】10-2009-0012356

(32)【優先日】2009年2月16日

(33)【優先権主張国】KR

(31)【優先権主張番号】10-2009-0092717

(32)【優先日】2009年9月29日

(33)【優先権主張国】KR

(73)【特許権者】

【識別番号】596099882

【氏名又は名称】エレクトロニクスアンドテレコミュニケーションズリサーチインスチチュート

【氏名又は名称原語表記】ＥＬＥＣＴＲＯＮＩＣＳＡＮＤＴＥＬＥＣＯＭＭＵＮＩＣＡＴＩＯＮＳＲＥＳＥＡＲＣＨＩＮＳＴＩＴＵＴＥ

(74)【代理人】

【識別番号】100117787

【弁理士】

【氏名又は名称】勝沼宏仁

(74)【代理人】

【識別番号】100152205

【弁理士】

【氏名又は名称】吉田昌司

(72)【発明者】

【氏名】リー、ミ‐スク

(72)【発明者】

【氏名】ベ、ヒュン‐ジュー

(72)【発明者】

【氏名】リー、ビュン‐スン

【審査官】山下剛史

(56)【参考文献】

【文献】特開２００７−１８７９０５（ＪＰ，Ａ）

【文献】特開２００８−８９９９９（ＪＰ，Ａ）

【文献】特開平１−２２１８００（ＪＰ，Ａ）

【文献】国際公開第２００８／１０８０７６（ＷＯ，Ａ１）

【文献】江原宏幸他，"高能率符号励振線形予測符号化と帯域選択型変形離散余弦変換符号化を用いた32kbit/sスケーラブル広帯域音声・オーディオ符号化方式の開発"，日本音響学会誌，２００８年４月，64巻，4号，pp.196-207

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１９／００−１９／２６

(57)【特許請求の範囲】

【請求項1】

オーディオ信号を符号化する方法であって、
変換されたオーディオ信号を受信するステップと、
前記変換されたオーディオ信号を複数のサブ帯域に分割するステップと、
前記サブ帯域のエネルギを各々演算するステップと、
前記サブ帯域のエネルギサイズが大きい順に、予め決定された個数のサブ帯域を選択するステップと、
前記選択されたサブ帯域に対して正弦波コーディング（ＳｉｎｕｓｏｉｄａｌＣｏｄｉｎｇ）を行うステップと、
を含み、
前記選択されたサブ帯域に対して正弦波コーディングを行うステップが、
前記サブ帯域のエネルギサイズに基づいて、前記正弦波コーディングの探索トラックとして前記選択されたサブ帯域を選択するステップと、
前記探索トラックに対して前記正弦波コーディングを行うステップと、
を有することを特徴とする符号化方法。

【請求項2】

前記選択されたサブ帯域に対して正弦波コーディングを行うステップにおいて、
前記選択されたサブ帯域のうち、隣接したサブ帯域が一つの探索トラックとして選択されることを特徴とする請求項１に記載の符号化方法。

【請求項3】

オーディオ信号を符号化する方法であって、
変換されたオーディオ信号を受信するステップと、
前記変換されたオーディオ信号を複数のサブ帯域に分割するステップと、
前記サブ帯域のエネルギを各々演算するステップと、
前記サブ帯域のエネルギサイズが大きい順に、予め決定された個数のサブ帯域を選択するステップと、
前記選択されたサブ帯域に対して正弦波コーディング（ＳｉｎｕｓｏｉｄａｌＣｏｄｉｎｇ）を行うステップと、
を含み、
前記選択されたサブ帯域に対して正弦波コーディングを行うステップが、
前記選択されたサブ帯域のうち、隣接したサブ帯域を１つのサブ帯域に併合するステップと、
前記併合されたサブ帯域に対して前記正弦波コーディングを行うステップと、
を有することを特徴とする符号化方法。

【請求項4】

オーディオ信号を符号化する装置であって、
変換されたオーディオ信号を受信する入力部と、
前記変換されたオーディオ信号を複数のサブ帯域に分割し、前記サブ帯域のエネルギを各々演算し、前記サブ帯域のエネルギサイズが大きい順に、予め決定された個数のサブ帯域を選択する演算部と、
前記選択されたサブ帯域に対して正弦波コーディング（ＳｉｎｕｓｏｉｄａｌＣｏｄｉｎｇ）を行うコーディング部と、
を備え、
前記コーディング部が、前記サブ帯域のエネルギサイズに基づいて、前記正弦波コーディングの探索トラックとして前記選択されたサブ帯域を選択し、前記探索トラックに対して前記正弦波コーディングを行うことを特徴とする符号化装置。

【請求項5】

前記コーディング部が、前記選択されたサブ帯域のうち、隣接したサブ帯域を一つの探索トラックとして選択することを特徴とする請求項４に記載の符号化装置。

【請求項6】

オーディオ信号を符号化する装置であって、
変換されたオーディオ信号を受信する入力部と、
前記変換されたオーディオ信号を複数のサブ帯域に分割し、前記サブ帯域のエネルギを各々演算し、前記サブ帯域のエネルギサイズが大きい順に、予め決定された個数のサブ帯域を選択する演算部と、
前記選択されたサブ帯域に対して正弦波コーディング（ＳｉｎｕｓｏｉｄａｌＣｏｄｉｎｇ）を行うコーディング部と、
を備え、
前記コーディング部が、前記選択されたサブ帯域のうち、隣接したサブ帯域を１つのサブ帯域に併合し、前記併合されたサブ帯域に対して前記正弦波コーディングを行うことを特徴とする符号化装置。

【請求項7】

オーディオ信号を復号化する方法であって、
変換されたオーディオ信号を受信するステップと、
前記変換されたオーディオ信号を複数のサブ帯域に分割するステップと、
前記サブ帯域のエネルギを各々演算するステップと、
前記サブ帯域のエネルギサイズが大きい順に、予め決定された個数のサブ帯域を選択するステップと、
前記選択されたサブ帯域に対して正弦波デコーディング（ＳｉｎｕｓｏｉｄａｌＤｅｃｏｄｉｎｇ）を行うステップと、
を含み、
前記選択されたサブ帯域に対して正弦波デコーディングを行うステップが、
前記サブ帯域のエネルギサイズに基づいて、前記正弦波デコーディングの探索トラックとして前記選択されたサブ帯域を選択するステップと、
前記探索トラックに対して前記正弦波デコーディングを行うステップと、
を有することを特徴とする復号化方法。

【請求項8】

前記選択されたサブ帯域に対して正弦波デコーディングを行うステップにおいて、
前記選択されたサブ帯域のうち、隣接したサブ帯域が一つの探索トラックとして選択されることを特徴とする請求項７に記載の復号化方法。

【請求項9】

オーディオ信号を復号化する方法であって、
変換されたオーディオ信号を受信するステップと、
前記変換されたオーディオ信号を複数のサブ帯域に分割するステップと、
前記サブ帯域のエネルギを各々演算するステップと、
前記サブ帯域のエネルギサイズが大きい順に、予め決定された個数のサブ帯域を選択するステップと、
前記選択されたサブ帯域に対して正弦波デコーディング（ＳｉｎｕｓｏｉｄａｌＤｅｃｏｄｉｎｇ）を行うステップと、
を含み、
前記選択されたサブ帯域に対して正弦波デコーディングを行うステップが、
前記選択されたサブ帯域のうち、隣接したサブ帯域を１つのサブ帯域に併合するステップと、
前記併合されたサブ帯域に対して前記正弦波デコーディングを行うステップと、
を有することを特徴とする復号化方法。

【請求項10】

オーディオ信号を復号化する装置であって、
変換されたオーディオ信号を受信する入力部と、
前記変換されたオーディオ信号を複数のサブ帯域に分割し、前記サブ帯域のエネルギを各々演算し、前記サブ帯域のエネルギサイズが大きい順に、予め決定された個数のサブ帯域を選択する演算部と、
前記選択されたサブ帯域に対して正弦波デコーディング（ＳｉｎｕｓｏｉｄａｌＤｅｃｏｄｉｎｇ）を行うデコーディング部と、
を備え、
前記デコーディング部が、前記サブ帯域のエネルギサイズに基づいて、前記正弦波デコーディングの探索トラックとして前記選択されたサブ帯域を選択し、前記探索トラックに対して前記正弦波デコーディングを行うことを特徴とする復号化装置。

【請求項11】

前記デコーディング部が、前記選択されたサブ帯域のうち、隣接したサブ帯域を一つの探索トラックとして選択することを特徴とする請求項１０に記載の復号化装置。

【請求項12】

オーディオ信号を復号化する装置であって、
変換されたオーディオ信号を受信する入力部と、
前記変換されたオーディオ信号を複数のサブ帯域に分割し、前記サブ帯域のエネルギを各々演算し、前記サブ帯域のエネルギサイズが大きい順に、予め決定された個数のサブ帯域を選択する演算部と、
前記選択されたサブ帯域に対して正弦波デコーディング（ＳｉｎｕｓｏｉｄａｌＤｅｃｏｄｉｎｇ）を行うデコーディング部と、
を備え、
前記デコーディング部が、前記選択されたサブ帯域のうち、隣接したサブ帯域を１つのサブ帯域に併合し、前記併合されたサブ帯域に対して前記正弦波デコーディングを行うことを特徴とする復号化装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、オーディオ信号の符号化及び復号化方法及び装置に関し、より詳細には、適応的正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置に関する。

【0002】

本発明は、知識経済部のＩＴ成長動力技術開発事業の一環として行った研究から導き出されたものである［課題管理番号：２００８−Ｓ−０１１−０１、課題名：ＦＭＣアコースティック融合コーデック及び制御技術研究（標準化連係）］。

【背景技術】

【0003】

通信技術の発達とともにデータ伝送のための帯域幅が増加しつつ、多チャネル音声及びオーディオを用いる高品質サービスに対するユーザの要求が次第に増加している。高品質の音声及びオーディオサービス提供のためには、何よりもステレオ音声及びオーディオ信号を効果的に圧縮し復元できるコーディング技術が必要である。

【0004】

これにより、狭帯域（ＮａｒｒｏｗＢａｎｄ：ＮＢ、３００〜３，４００Ｈｚ）、広帯域（ＷｉｄｅＢａｎｄ：ＷＢ、５０〜７，０００Ｈｚ）及び超広帯域（ＳｕｐｅｒＷｉｄｅＢａｎｄ：ＳＷＢ、５０〜１４，０００Ｈｚ）信号をコーディングするコーデックに関する研究が活発に進まれている。例えば、ＩＴＵ−ＴＧ．７２９．１は代表的な拡張コーデックであって、狭帯域コーデックであるＧ．７２９を基盤とする広帯域拡張コーデックである。このコーデックは、８ｋｂｉｔ／ｓでＧ．７２９とビットストリームレベルとの互換性を提供し、１２ｋｂｉｔ／ｓでは、より向上した品質の狭帯域信号を提供する。そして、１４ｋｂｉｔ／ｓから３２ｋｂｉｔ／ｓまででは、２ｋｂｉｔ／ｓのビット率の拡張性を有して広帯域信号をコーディングすることができ、ビット率の増加に応じて出力信号の品質も良くなる特性を有する。

【0005】

近年、Ｇ．７２９．１を基盤として超広帯域信号を提供できる拡張コーデックが開発中である。この拡張コーデックは、狭帯域、広帯域、そして、超広帯域信号を符号化及び復号化することができる。

【0006】

このような拡張コーデックでは、合成された信号の品質向上のために、正弦波パルスコーディングを用いることもある。ところが、このような正弦波パルスコーディングを用いるとき、コーディングの効率を高めるために、入力信号のエネルギを考慮する必要がある。特に、正弦波パルスコーディングに用いることができるビット数が十分でない場合、合成された信号の品質により多い影響を及ぼす帯域、すなわち、相対的にエネルギの大きい帯域を先にコーディングすることが効果的である。

【発明の概要】

【発明が解決しようとする課題】

【0007】

本発明は、合成信号の品質を正弦波パルスコーディングを用いて高めることができるオーディオ信号の符号化及び復号化方法及び装置を提供することを１つの目的とする。

【0008】

また、本発明は、合成信号の各サブ帯域のエネルギの大きさを考慮して、正弦波パルスコーディングを適用することにより、さらに効率的に合成信号の品質を向上させることができるオーディオ信号の符号化及び復号化方法及び装置を提供することを他の目的とする。

【0009】

本発明の目的は、以上で言及した目的に制限されず、言及されていない本発明の他の目的及び長所は、下記の説明によって理解され得るし、本発明の実施形態によって一層明らかに理解され得るであろう。また、本発明の目的及び長所は、特許請求の範囲に表した手段及びその組み合わせによって実現され得ることが容易に分かるであろう。

【課題を解決するための手段】

【0010】

このような目的を達成するための本発明は、オーディオ信号の符号化方法であって、変換されたオーディオ信号を複数個のサブ帯域に分けるステップと、サブ帯域のエネルギを各々演算するステップと、サブ帯域のうち、相対的に大きいエネルギを有するサブ帯域を予め定められた数の分だけ選択するステップと、選択されたサブ帯域に対して正弦波パルスコーディングを行うステップとを含むことを１つの特徴とする。

【0011】

また、本発明は、オーディオ信号の符号化装置であって、変換されたオーディオ信号を受信する入力部と、合成されたオーディオ信号を複数個のサブ帯域に分けて、サブ帯域のエネルギを各々演算し、サブ帯域のうち、相対的に大きいエネルギを有するサブ帯域を予め定められた数の分だけ選択する演算部と、選択されたサブ帯域に対して正弦波パルスコーディングを行うコーディング部とを備えることを他の特徴とする。

【0012】

また、本発明は、オーディオ信号の復号化方法であって、変換されたオーディオ信号を受信するステップと、符号化されたオーディオ信号を複数個のサブ帯域に分けるステップと、サブ帯域のエネルギを各々演算するステップと、サブ帯域のうち、相対的に大きいエネルギを有するサブ帯域を予め定められた数の分だけ選択するステップと、選択されたサブ帯域に対して正弦波パルス復号化を行うステップとを含むことをさらに１つの特徴とする。

【0013】

また、本発明は、オーディオ信号の復号化装置であって、変換されたオーディオ信号を受信する入力部と、符号化されたオーディオ信号を複数個のサブ帯域に分けて、サブ帯域のエネルギを各々演算し、サブ帯域のうち、相対的に大きいエネルギを有するサブ帯域を予め定められた数の分だけ選択する演算部と、選択されたサブ帯域に対して正弦波パルス復号化を行う復号化部とを備えることをさらに１つの特徴とする。

【0014】

また、本発明は、オーディオ信号の符号化方法であって、オーディオ信号を受信するステップと、オーディオ信号に対してＭＤＣＴ（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）を行ってＭＤＣＴ係数を出力するステップと、ＭＤＣＴ係数を用いて高周波数オーディオ信号を合成するステップと、高周波数オーディオ信号に対して正弦波パルスコーディングを行うステップとを含むことをさらに１つの特徴とする。

【0015】

また、本発明は、オーディオ信号の符号化装置であって、オーディオ信号を受信する入力部と、オーディオ信号に対してＭＤＣＴを行ってＭＤＣＴ係数を出力するＭＤＣＴ部と、ＭＤＣＴ係数を用いて高周波数オーディオ信号を合成する合成部と、高周波数オーディオ信号に対して正弦波パルスコーディングを行う正弦波パルスコーディング部とを備えることをさらに１つの特徴とする。

【0016】

また、本発明は、オーディオ信号の復号化方法であって、オーディオ信号を受信するステップと、オーディオ信号に対してＭＤＣＴを行ってＭＤＣＴ係数を出力するステップと、ＭＤＣＴ係数を用いて高周波数オーディオ信号を合成するステップと、高周波数オーディオ信号に対して正弦波パルス復号化を行うステップとを含むことをさらに１つの特徴とする。

【0017】

また、本発明は、オーディオ信号の復号化装置であって、オーディオ信号を受信する入力部と、オーディオ信号に対してＭＤＣＴを行ってＭＤＣＴ係数を出力するＭＤＣＴ部と、ＭＤＣＴ係数を用いて高周波数オーディオ信号を合成する合成部と、高周波数オーディオ信号に対して正弦波パルス復号化を行う正弦波パルス復号化部とを含むことをさらに１つの特徴とする。

【発明の効果】

【0018】

前述したような本発明によれば、正弦波パルスコーディングを用いて合成信号の品質を高めることができるという長所がある。

【0019】

また、合成信号の各サブ帯域のエネルギの大きさを考慮して、正弦波パルスコーディングを適用することにより、さらに効率的に合成信号の品質を向上させることができるという長所がある。

【図面の簡単な説明】

【0020】

【図1】狭帯域コーデックとの互換性を提供する超広帯域拡張コーデックの構造である。

【図2】本発明の一実施形態に係るオーディオ信号符号化装置の構成図である。

【図3】本発明の一実施形態に係るオーディオ信号復号化装置の構成図である。

【図4】本発明の一実施形態に係るオーディオ信号符号化方法のフローチャートである。

【図5】本発明の一実施形態に係る正弦波パルスコーディング実行ステップ（図４のＳ４１０）を示したフローチャートである。

【図6】本発明の一実施形態に係るオーディオ信号復号化方法のフローチャートである。

【図7】既存正弦波パルスコーディング及び本発明による適応型正弦波パルスコーディングの結果を比較するための図である。

【図8】本発明の他の実施形態に係るオーディオ信号符号化装置の構成図である。

【図9】本発明の他の実施形態に係るオーディオ信号復号化装置の構成図である。

【発明を実施するための形態】

【0021】

上述の目的、特徴、及び長所は、添付した図面を参照して詳しく後述され、これにより、本発明の属する技術分野における通常の知識を有した者が本発明の技術的思想を容易に実施できるであろう。本発明を説明するにおいて本発明と関連した公知技術に対する具体的な説明が本発明の要旨を不明にすると判断される場合には、その詳細な説明を省略する。以下、添付された図面を参照して、本発明に係る好ましい実施形態を詳細に説明する。図面において、同じ参照符号は、同一または類似した構成要素を示すものとして使用される。

【0022】

図１は、狭帯域コーデックとの互換性を提供する超広帯域拡張コーデックの構造を示す。

【0023】

一般的に、拡張コーデックは、入力信号を複数個の周波数帯域に分けた後、各周波数帯域の信号を符号化または復号化する構造を有する。図１に示すように、入力された信号は、１次低帯域通過フィルタ１０２及び１次高帯域通過フィルタ１０４に入力される。１次低帯域通過フィルタ１０２は、フィルタリング及びダウンサンプリングを行って入力信号のうち、低帯域信号Ａ（０−８ｋＨｚ）を出力する。そして、１次高帯域通過フィルタ１０４は、フィルタリング及びダウンサンプリングを行って入力信号のうち、高帯域信号Ｂ（８−１６ｋＨｚ）を出力する。

【0024】

１次低帯域通過フィルタ１０２から出力された低帯域信号Ａは、２次低帯域通過フィルタ１０６及び２次高帯域通過フィルタ１０８に入力される。２次低帯域通過フィルタ１０６は、フィルタリング及びダウンサンプリングを行って低−低帯域信号Ａ１（０−４ｋＨｚ）を出力し、２次高帯域通過フィルタ１０８は、フィルタリング及びダウンサンプリングを行って低−高帯域信号Ａ２（４−８ｋＨｚ）を出力する。

【0025】

つまり、低−低帯域信号Ａ１は狭帯域コーディングモジュール１１０に、低−高帯域信号Ａ２は広帯域拡張コーディングモジュール１１２に、高帯域信号Ｂは超広帯域拡張コーディングモジュール１１４に各々入力される。もし、狭帯域コーディングモジュール１１０のみ動作する場合には、狭帯域信号のみが再生され、狭帯域コーディングモジュール１１０と広帯域拡張コーディングモジュール１１２とが動作する場合には、広帯域信号が再生される。そして、狭帯域コーディングモジュール１１０、広帯域拡張コーディングモジュール１１２、及び超広帯域拡張コーディングモジュール１１４が動作すれば、超広帯域信号が再生される。

【0026】

図１に示された拡張コーデックの代表的な例としてＩＴＵ−ＴＧ．７２９．１を挙げることができる。ＩＴＵ−ＴＧ．７２９．１は、狭帯域コーデックであるＧ．７２９を基盤とする広帯域拡張コーデックである。このコーデックは、８ｋｂｉｔ／ｓでＧ．７２９とビットストリームレベルとの互換性を提供し、１２ｋｂｉｔ／ｓでは、より向上した品質の狭帯域信号を提供する。そして、１４ｋｂｉｔ／ｓから３２ｋｂｉｔ／ｓまででは、２ｋｂｉｔ／ｓのビット率拡張性を有して広帯域信号を再生するが、ビット率の増加に応じて出力信号の品質も良くなる。

【0027】

最近では、Ｇ．７２９．１を基盤として超広帯域品質を提供できる拡張コーデックが開発中である。この拡張コーデックは、狭帯域、広帯域、そして、超広帯域信号を符号化及び復号化することができる。

【0028】

このような拡張コーデックでは、図１のように、周波数帯域別に異なるコーディング方式を適用することができる。例えば、Ｇ．７２９．１とＧ．７１１．１コーデックは、狭帯域信号を既存の狭帯域コーデックであるＧ．７２９とＧ．７１１でコーディングし、残りの信号に対しては、ＭＤＣＴ（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）を行って、出力されたＭＤＣＴ係数をコーディングする方式を使用する。

【0029】

ＭＤＣＴ領域コーディングでは、ＭＤＣＴ係数を複数個のサブ帯域に分けて、各サブ帯域のゲイン（ｇａｉｎ）とシェープ（ｓｈａｐｅ）をコーディングし、ＡＣＥＬＰ（ＡｌｇｅｂｒａｉｃＣｏｄｅ−ＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）または正弦波（ｓｉｎｕｓｏｉｄａｌ）パルスを用いてＭＤＣＴ係数をコーディングする。拡張コーデックは、一般的に帯域幅拡張のための情報を先にコーディングした後、品質向上のための情報をコーディングする構造を有する。例えば、各サブ帯域のゲインとシェープを用いて７−１４ｋＨｚ帯域の信号を合成した後、ＡＣＥＬＰまたは正弦波パルスコーディングを用いて合成された信号の品質を向上させる構造がそれである。

【0030】

すなわち、超広帯域品質を提供する１番目の階層では、ゲインとシェープなどの情報を利用して７−１４ｋＨｚ帯域に該当する信号を合成する。そして、追加的なビットを用いて合成された信号の品質向上のための正弦波パルスコーディングなどを適用する。このような構造により、ビット率の増加に応じて合成された信号の品質を改善させることができる。

【0031】

一般的に、正弦波パルスコーディングでは、定められた区間で大きさが一番大きいパルス、すなわち、品質に一番大きい影響を及ぼすことができるパルスの位置、大きさ、そして、符号情報がコーディングされる。このようなパルスを検索する区間が広いほど計算量は増加する。したがって、全体フレーム（時間領域の場合）または全体周波数帯域に対して正弦波パルスコーディングを適用するよりは、サブフレームまたはサブ帯域別に正弦波パルスコーディングを適用することが好ましい。正弦波パルスコーディングは、１つのパルスを伝送するのに相対的に多いビットが必要であるが、信号の品質に影響を与える信号を正確に表現できるという長所を有する。

【0032】

コーデックの入力信号は、周波数によってエネルギ分布が様々に現れる。特に、音楽信号の場合には、周波数によるエネルギの変化が音声信号に比べて大きい方である。エネルギが大きいサブ帯域の信号は、合成信号の品質に一層大きい影響を及ぼす。もし、全体サブ帯域をコーディングする程度にビットが十分であれば問題ないが、そうでない場合には、合成信号の品質に多くの影響を与える、すなわち、エネルギが大きいサブ帯域の信号を先にコーディングすることが効果的である。

【0033】

本発明は、図１とような拡張コーデックで限定されたビット数を考慮して、より効率的な正弦波パルスコーディングを行うことにより、合成された信号の品質を向上させることができるオーディオ信号の符号化及び復号化に関するものである。以下では、音声及びオーディオ信号をオーディオ信号と称し、本発明を説明する。

【0034】

図２は、本発明の一実施形態に係るオーディオ信号符号化装置の構成図である。

【0035】

図２に示すように、オーディオ信号符号化装置２０２は、入力部２０４、演算部２０６、及びコーディング部２０８を備える。入力部２０４は、変換されたオーディオ信号、例えば、オーディオ信号がＭＤＣＴによって変換された結果物であるＭＤＣＴ係数を受信する。

【0036】

演算部２０６は、入力部２０４を介して入力された変換されたオーディオ信号を複数個のサブ帯域に分けて、このサブ帯域のエネルギを各々演算する。そして、演算部２０６は、サブ帯域のうち、相対的に大きいエネルギを有するサブ帯域を予め定められた数の分だけ選択する。このとき、１つのサブ帯域でコーディングする正弦波パルス数及び１つの正弦波パルスをコーディングするのに必要なビット数によって予め定められた数が決定される。

【0037】

コーディング部２０８は、演算部２０６によって選択されたサブ帯域に対して正弦波パルスコーディングを行う。コーディング部２０８は、予め定められた数の相対的に大きいエネルギを有するサブ帯域に対して、エネルギが大きい順に正弦波パルスコーディングを行うことができる。本発明の他の実施形態において、コーディング部２０８は、予め定められた数の相対的に大きいエネルギを有するサブ帯域に対して、エネルギが大きい順序ではない他の順序、例えば、帯域幅またはインデックス順序に正弦波パルスコーディングを行うことができる。

【0038】

一方、演算部２０６は、選択されたサブ帯域のうち、互いに隣接したサブ帯域があるか否かを確認し、隣接したサブ帯域を１つのサブ帯域に併合することができる。そして、コーディング部２０８は、このように併合されたサブ帯域に対して正弦波パルスコーディングを行うことができる。

【0039】

図３は、本発明の一実施形態に係るオーディオ信号復号化装置の構成図である。

【0040】

図３に示すように、オーディオ信号復号化装置３０２は、入力部３０４、演算部３０６、及び復号化部３０８を備える。入力部２０４は、変換されたオーディオ信号、例えば、ＭＤＣＴ係数を受信する。

【0041】

演算部３０６は、入力部３０４を介して入力された変換されたオーディオ信号を複数個のサブ帯域に分けて、このサブ帯域のエネルギを各々演算する。そして、演算部３０６は、サブ帯域のうち、相対的に大きいエネルギを有するサブ帯域を予め定められた数の分だけ選択する。このとき、１つのサブ帯域でコーディングする正弦波パルス数及び１つの正弦波パルスをコーディングするのに必要なビット数によって予め定められた数が決定される。

【0042】

復号化部３０８は、演算部３０６によって選択されたサブ帯域に対して正弦波パルス復号化を行う。復号化部３０８は、予め定められた数の相対的に大きいエネルギを有するサブ帯域に対して、エネルギが大きい順に正弦波パルスコーディングを行うことができる。本発明の他の実施形態において、復号化部３０８は、予め定められた数の相対的に大きいエネルギを有するサブ帯域に対して、エネルギが大きい順序ではない他の順序、例えば、帯域幅またはインデックス順序に正弦波パルスコーディングを行うことができる。

【0043】

図２及び図３に示されたオーディオ信号符号化装置２０２及びオーディオ信号復号化装置３０２は、図１の狭帯域コーディングモジュール１１０、広帯域拡張コーディングモジュール１１２、または超広帯域拡張コーディングモジュール１１４に含まれることができる。

【0044】

以下では、図４〜図６及び図１の超広帯域拡張コーディングモジュール１１４でオーディオ信号を符号化または復号化する実施形態によって本発明によるオーディオ信号符号化及び復号化方法を説明する。

【0045】

超広帯域拡張コーディングモジュール１１４は、７−１４ｋＨｚに該当するＭＤＣＴ係数を複数個のサブ帯域に分けて、各サブ帯域のゲインとシェープをコーディングまたは復号化して誤差信号を求める。その後、超広帯域拡張コーディングモジュール１１４は、誤差信号に対して正弦波パルスコーディングまたは復号化を行う。もし、正弦波パルスコーディングに用いられるビット数が十分であれば、全てのサブ帯域に正弦波パルスコーディングが適用され得るが、実際にそのようなビット数が十分でないため、一部のサブ帯域に対してのみ正弦波パルスコーディングが適用される。したがって、合成信号の品質により多くの影響を及ぼすサブ帯域に正弦波パルスコーディングを適用することにより、同じビット率が与えられたとき、よりよい信号品質を得ることができる。

【0046】

図４は、本発明の一実施形態に係るオーディオ信号符号化方法のフローチャートである。

【0047】

図４に示すように、超広帯域拡張コーディングモジュール１１４に含まれたオーディオ信号符号化装置は、変換されたオーディオ信号、例えば、７−１４ｋＨｚに該当するＭＤＣＴ係数を受信する（Ｓ４０２）。そして、受信された変換されたオーディオ信号を複数個のサブ帯域に分け（Ｓ４０４）、分けられた複数個のサブ帯域のエネルギを各々演算する（Ｓ４０６）。図７は、９個のサブ帯域に分けられたＭＤＣＴ係数と、各サブ帯域の相対的エネルギの大きさを示す。図７に示すように、サブ帯域１、４、５、６、７のエネルギが他のサブ帯域のエネルギに比べて相対的に大きいことが分かる。

【0048】

表１は、８個のサブ帯域に分けられたＭＤＣＴ係数のインデックス及びエネルギを表す。

【表1】

【0049】

オーディオ信号符号化装置は、サブ帯域のうち、大きいエネルギを有するサブ帯域を予め定められた数の分だけ選択する（Ｓ４０８）。例えば、表１のＭＤＣＴ係数は、表２のようにエネルギ順に整列され、そのうち、エネルギが一番大きい５個のサブ帯域（陰影表示）が選択される。

【表2】

【0050】

本発明では、表２のように予め定められた数、例えば、５個のサブ帯域を選択するようになる。この予め定められた数は、１つのサブ帯域でコーディングする正弦波パルス数及び１つの正弦波パルスをコーディングするのに必要なビット数によって決定される。

【0051】

１つの正弦波パルスをコーディングするのに必要なビット数は次のとおりである。まず、１つの正弦波パルスの符号（＋、−）をコーディングするのに１ビットが必要である。そして、正弦波パルスの位置をコーディングするのに必要なビット数は、正弦波パルス検索区間の大きさ、例えば、１つのサブ帯域の大きさによって決定される。もし、サブ帯域の大きさが３２であれば、正弦波パルスの位置をコーディングするのには５ビットが必要である（２^５＝３２）。そして、正弦波パルスの大きさ（利得）をコーディングするのに必要なビット数は、量子化器の構造及びコードブックの大きさによって決定される。つまり、１つの正弦波パルスをコーディングするのに必要なビット数は、正弦波パルスの符号、位置、大きさをコーディングするのに必要なビットの合計である。

【0052】

正弦波パルスコーディングのために与えられたビット及び１つの正弦波パルスをコーディングするのに必要なビット数によって１０個の正弦波パルスを伝送できる場合、１つのサブ帯域当り２個の正弦波パルスをコーディングするとしたら、総５個のサブ帯域に正弦波パルスコーディングを適用することができる。したがって、オーディオ信号コーディング装置は、表２のように、エネルギが一番大きい５個のサブ帯域を選択し、選択されたサブ帯域（５、６、３、１、２）に対して正弦波パルスコーディングを行う（Ｓ４１０）。

【0053】

図５は、本発明の一実施形態に係る正弦波パルスコーディング実行ステップ（図４のＳ４１０）を示したフローチャートである。

【0054】

本発明の他の実施形態では、図４のステップＳ４０８で選択されたサブ帯域のうち、互いに隣接したサブ帯域があるか否かを確認し（Ｓ５０２）、隣接したサブ帯域を１つのサブ帯域に併合し（Ｓ５０４）、併合されたサブ帯域に対して正弦波パルスコーディングを行う（Ｓ５０６）。

【0055】

例えば、表２において選択された５個のサブ帯域（５、６、３、１、２）のうち、サブ帯域５と隣接したサブ帯域、すなわち４または６があるか否かを確認する。５個のサブ帯域のうち、サブ帯域５と隣接したサブ帯域６が存在するので、オーディオ信号符号化装置は、サブ帯域５とサブ帯域６の各々に２個の正弦波パルスをコーディングする代わりに、２つのサブ帯域を１つのサブ帯域に併合し、この１つのサブ帯域に対して４個の正弦波パルスをコーディングする。例えば、サブ帯域５がサブ帯域６より大きいエネルギを有しているとしたら、併合されたサブ帯域では、４個の正弦波パルスが全てサブ帯域５にのみ位置することができる。このように、隣接したサブ帯域を併合し、併合されたサブ帯域に正弦波パルスコーディングを適用することにより、さらに効率的な正弦波パルスコーディングがなされる。

【0056】

一方、コーデックの特性によって符号器と復号器とで合成された７−１４ｋＨｚ帯域の信号が互いに一致しないことがある。符号器と復号器とで各々演算されたサブ帯域のエネルギの差による誤差を減らすために、オーディオ信号符号化装置は、表３のようにサブ帯域を再整列して正弦波パルスコーディングを行うこともできる。

【表3】

【0057】

すなわち、オーディオ信号符号化装置は、５個のサブ帯域に対してエネルギの大きさ順に正弦波パルスコーディングを行わず、帯域幅の順序またはインデックスの順序によって正弦波パルスコーディングを行うことができる。このように選択されたサブ帯域のエネルギの大きさ順序を考慮しないことにより、符号器と復号器とで発生し得る上位帯域合成信号の差による誤差を減らすことができる。

【0058】

図６は、本発明の一実施形態に係るオーディオ信号復号化方法のフローチャートである。

【0059】

まず、変換されたオーディオ信号を受信する（Ｓ６０２）。そして、変換されたオーディオ信号を複数個のサブ帯域に分け（Ｓ６０４）、サブ帯域のエネルギを各々演算する（Ｓ６０６）。

【0060】

次に、サブ帯域のうち、大きいエネルギを有するサブ帯域を予め定められた数の分だけ選択し（Ｓ６０８）、選択されたサブ帯域に対して正弦波パルス復号化を行う（Ｓ６１０）。図６のステップＳ６０２〜ステップＳ６１０は、前述した本発明の一実施形態に係るオーディオ信号符号化方法の各ステップと類似しているので、詳細な説明を省略する。

【0061】

図７は、既存正弦波パルスコーディング及び本発明に係る適応型正弦波パルスコーディングの結果を比較するための図である。

【0062】

図７（ａ）は、既存正弦波パルスコーディングによる結果を示す。図７に示された各サブ帯域の相対的エネルギの大きさをみると、サブ帯域１、４、５、６、７のエネルギが他のサブ帯域に比べて相対的に大きい。しかし、既存の正弦波パルスコーディングは、サブ帯域のエネルギの大きさとは関係なく、帯域順またはインデックス順にパルスコーディングを適用するので、（ａ）のように、サブ帯域１、２、３、４、５に正弦波パルスがコーディングされる。

【0063】

図７（ｂ）は、本発明に係る適応的正弦波パルスコーディングによる結果を示す。本発明によれば、（ｂ）のように、相対的にエネルギが大きいサブ帯域、すなわち、サブ帯域１、４、５、６、７に正弦波パルスコーディングが適用される。

【0064】

前述したように、本発明は、音声を含むオーディオ信号に適用される。音声信号のエネルギ分布をみると、有声音のエネルギは、ほとんど低い周波数帯域に位置し、無声音と破裂音のエネルギは、相対的に高い周波数帯域に位置する。それに対し、音楽信号は、周波数によってエネルギの変化が多様に現れる。したがって、音楽信号は、音声信号のように周波数帯域によるエネルギ分布の特徴を定義するのが難しい。合成された信号の品質は、エネルギが大きい周波数帯域の信号によってさらに多くの影響を受ける。したがって、正弦波パルスコーディングを適用するサブ帯域を固定させるよりは、本発明のように、入力信号の特性によってサブ帯域を選択して正弦波パルスコーディングを適用することにより、同じビット率で合成された信号の品質をより向上させることができる。

【0065】

以下では、図８及び図９によって本発明の他の実施形態に係るオーディオ信号符号化及び復号化方法及び装置について説明する。

【0066】

図８は、本発明の他の実施形態に係るオーディオ信号符号化装置の構成図である。

【0067】

図８に示されたオーディオ信号符号化装置は、３２ｋＨｚの入力信号を受信し、広帯域信号及び超広帯域信号を合成して出力する。このオーディオ信号符号化装置は、広帯域拡張コーディングモジュール８０２、８０８、８２２と超広帯域拡張コーディングモジュール８０４、８０６、８１０、８１２とで構成される。広帯域拡張コーディングモジュール、すなわち、Ｇ．７２９．１コアコーデック（ｃｏｒｅｃｏｄｅｃ）は、１６ｋＨｚ信号を用いて動作することに対し、超広帯域拡張コーディングモジュールは、３２ｋＨｚ信号を用いる。超広帯域拡張コーディングは、ＭＤＣＴドメインで行われる。２つのモード、すなわち、ジェネリックモード８１４と正弦波モード８１６とが超広帯域拡張コーディングモジュールの１番目の階層をコーディングするために用いられる。ジェネリックモード８１４または正弦波モード８１６のうち、いずれかを用いるかの可否は、入力信号の測定されたトーナリティ（Ｔｏｎａｌｉｔｙ）に基づいて決定される。より上位の超広帯域階層は、高周波数コンテンツ（ｃｏｎｔｅｎｔ）の品質を改善する正弦波コーディング部８１８、８２０または広帯域コンテンツの認知品質（ｐｅｒｃｅｐｔｕａｌｑｕａｌｉｔｙ）を改善するのに用いられる広帯域信号改善部８２２によってコーディングされる。

【0068】

３２ｋＨｚの入力信号は、まず、ダウンサンプリング部８０２に入力され、１６ｋＨｚでダウンサンプリングされる。そして、ダウンサンプリングされた１６ｋＨｚ信号は、Ｇ．７２９．１コーデック８０８に入力される。Ｇ．７２９．１コーデック８０８は、入力された１６ｋＨｚ信号に対して広帯域コーディングを行う。Ｇ．７２９．１コーデック８０８から出力された合成された３２ｋｂｉｔ／ｓ信号は、広帯域信号改善部８２２に入力され、広帯域信号改善部８２２は、入力された信号の品質を改善する。

【0069】

一方、３２ｋＨｚ入力信号は、ＭＤＣＴ部８０６に入力され、ＭＤＣＴドメインに変換される。ＭＤＣＴドメインに変換された入力信号は、トーナリティ測定部８０４に入力され、入力信号のトーナル（ｔｏｎａｌ）可否が決定される（８１０）。言い替えれば、１番目の超広帯域階層のコーディングモードは、ＭＤＣＴドメインで入力信号の現在フレーム及び以前フレームのログドメインエネルギ（ｌｏｇａｒｉｔｈｍｉｃｄｏｍａｉｎｅｎｅｒｇｉｅｓ）を比較することにより行われるトーナリティ測定に基づいて定義される。トーナリティ測定は、入力信号の現在フレームと過去フレームのスペックトラルピーク（ｓｐｅｃｔｒａｌｐｅａｋｓ）間の相関関係分析（ｃｏｒｒｅｌａｔｉｏｎａｎａｌｙｓｉｓ）に基づく。

【0070】

次に、トーナリティ測定部８０４によって出力されたトーナリティ情報により、入力信号がトーナルであるか否かが決定される（８１０）。例えば、トーナリティ情報が特定しきい値（ｔｈｒｅｓｈｏｌｄ）より大きければ、入力信号はトーナルであるものと、それとも、入力信号はトーナルでないものと判断される。トーナリティ情報は、さらに、復号器に伝達されるビットストリームにも含まれる。もし、入力信号がトーナルであれば正弦波モード８１６が、それとも、ジェネリックモード８１４が用いられる。

【0071】

ジェネリックモード８１４は、入力信号のフレームがトーナルでないとき（ｔｏｎａｌ＝０）に用いられる。ジェネリックモード８１４は、高周波数をコーディングするために、Ｇ．７２９．１広帯域コーデック８０８のコーディングされたＭＤＣＴドメイン表現を活用する。高周波数帯域（７−１４ｋＨｚ）は、４個のサブ帯域に分けられ、コーディングされエンベロープ標準化された（ｅｎｖｅｌｏｐｅｎｏｒｍａｌｉｚｅｄ）広帯域コンテンツからそれぞれのサブバンドに対する選択された類似性基準（ｓｉｍｉｌａｒｉｔｙｃｒｉｔｅｒｉａ）が探索される。最も類似したマッチ（ｍａｔｃｈ）は、合成された高周波数コンテンツを取得するために、２つのスケーリング要素、すなわち、リニア（ｌｉｎｅａｒ）ドメインの１番目のスケーリング要素及びログドメインの２番目のスケーリング要素によってスケーリングされる。このコンテンツは、さらに、ジェネリックモード８１４及び正弦波コーディング部８１８内の追加的な正弦波によって改善される。

【0072】

ジェネリックモード８１４では、本発明に係るオーディオ符号化方法によって、コーディングされた信号の品質改善がなされ得る。例えば、ビットバジェット（ｂｉｔｂｕｄｇｅｔ）は、初めの４ｋｂｉｔ／ｓの超広帯域階層に２つの正弦波を追加するように許容する。追加する正弦波の位置を探索するトラックの開始位置は、合成された高周波数信号のサブ帯域エネルギに基づいて選択される。合成されたサブ帯域のエネルギは、次の数式１のように演算されることができる。

【数1】

ここで、ｋはサブ帯域インデックスを表し、

【数2】

はｋ番目のサブ帯域のエネルギを表す。また、

【数3】

は合成された高周波数信号を表す。それぞれのサブ帯域は３２個のＭＤＣＴ係数からなる。相対的に大きいエネルギを有するサブ帯域が正弦波コーディングの探索トラックとして選択される。例えば、探索トラックは、１の単位の大きさを有する３２個の位置を含むことができる。このような場合、探索トラックはサブ帯域と一致する。

【0073】

２つの正弦波の大きさ（ａｍｐｌｉｔｕｄｅ）は、それぞれ４−ｂｉｔ、１次元コードブックによって量子化される。

【0074】

正弦波モード８１６は、入力信号がトーナルであるときに用いられる。正弦波モード８１６で、高周波数信号は、高周波数スペクトルに有限個の正弦波コンポーネントセットを追加することにより生成される。例えば、追加される正弦波の総個数は１０個であるが、４個は７０００−８６００Ｈｚ周波数範囲に、４個は８６００−１０２００Ｈｚ周波数範囲に、１個は１０２００−１１８００Ｈｚ周波数範囲に、１個は１１８００−１２６００Ｈｚ周波数範囲に位置することができる。

【0075】

正弦波コーディング部８１８、８２０は、ジェネリックモード８１４または正弦波モード８１６によって出力された信号の品質を改善する。正弦波コーディング部８１８、８２０によって追加される正弦波の数（Ｎｓｉｎ）はビットバジェットによって変わる。正弦波コーディング部８１８、８２０の正弦波コーディングのためのトラックは、合成された高周波数コンテンツのサブ帯域エネルギに基づいて選択される。

【0076】

例えば、７０００−１３４００Ｈｚ周波数範囲の合成された高周波数コンテンツは、８個のサブ帯域に分けられる。それぞれのサブ帯域は、３２個のＭＤＣＴ係数で構成され、サブ帯域エネルギは、各々数式１のように演算されることができる。

【0077】

正弦波コーディングのためのトラックは、相対的に大きいエネルギを有するＮｓｉｎ／Ｎｓｉｎ＿ｔｒａｃｋ個のサブ帯域を探すことにより選択される。ここで、Ｎｓｉｎ＿ｔｒａｃｋは、トラック当り正弦波の個数であり、２に設定される。選択されたＮｓｉｎ／Ｎｓｉｎ＿ｔｒａｃｋ個のサブ帯域は、各々正弦波コーディングに用いられるトラックに対応する。例えば、Ｎｓｉｎが４であれば、初めの２個の正弦波が一番大きいサブ帯域エネルギを有するサブ帯域に位置し、残りの２個の正弦波は、２番目に大きいエネルギを有するサブ帯域に位置する。正弦波コーディングのためのトラック位置は、利用可能なビットバジェット及び高周波数信号エネルギ特性によってフレーム毎に（ｆｒａｍｅｂｙｆｒａｍｅ）変わる。

【0078】

図９は、本発明の他の実施形態に係るオーディオ信号復号化装置の構成図である。

【0079】

図９に示されたオーディオ信号復号化装置は、符号化装置によって符号化された広帯域信号及び超広帯域信号を受信し、これを３２ｋＨｚ信号で出力する。このオーディオ信号復号化装置は、広帯域拡張復号化モジュール９０２、９１４、９１６、９１８と超広帯域拡張復号化モジュール９０４、９２０、９２２とで構成される。広帯域拡張復号化モジュールは、入力された１６ｋＨｚ信号を復号化し、超広帯域拡張復号化モジュールは、３２ｋＨｚ出力を提供するために、高周波数を復号化する。超広帯域拡張復号化は、ほとんどＭＤＣＴドメインで行われる。２つのモード、すなわち、ジェネリックモード９０６及び正弦波モード９０８が拡張の１番目の階層を復号化するために用いられるが、これは、初めて復号化されるトーナリティ指示子（ｉｎｄｉｃａｔｏｒ）に依存する。２番目の階層は、広帯域信号改善及び追加的な正弦波間にビットを分散させるために、符号器と同様のビット割当を利用する。３番目の超広帯域階層は正弦波復号化部９１０、９１２で構成されるが、これは、高周波数コンテンツの品質を改善する。４番目及び５番目の拡張階層は広帯域信号改善を提供する。合成された超広帯域コンテンツを改善するために、時間ドメインで前処理（ｐｒｅ−ｐｒｏｃｅｓｓｉｎｇ）が利用される。

【0080】

符号化装置によって符号化された信号はＧ．７２９．１コーデック９０２に入力される。Ｇ／７２９。１コーデック９０２は１６ｋＨｚの合成信号を出力し、これは、広帯域信号改善部９１４に入力される。広帯域信号改善部９１４は、入力された信号の品質を改善する。広帯域信号改善部９１４から出力された信号は、前処理部９１６による前処理、アップサンプリング部９１８によるアップサンプリングを経る。

【0081】

一方、高周波数復号化を始める前に、広帯域信号が合成される必要がある。このような合成は、Ｇ．７２９．１コーデック９０２によって行われる。高周波数信号復号化では、一般的な前処理関数を適用する前に、３２ｋｂｉｔ／ｓ広帯域合成が利用される。

【0082】

高周波数信号の復号化は、Ｇ．７２９．１広帯域復号化から合成されたＭＤＣＴドメイン表現を取得することにより始まる。ＭＤＣＴドメイン広帯域コンテンツは、ジェネリックコーディングフレームの高周波数信号を復号化するために要求されるが、ここで、高周波数信号は、広帯域周波数範囲からのコーディングされたサブ帯域の適応的応答（ａｄａｐｔｉｖｅｒｅｐｌｉｃａｔｉｏｎ）によって構成される。

【0083】

ジェネリックモード９０６は、適応的サブ帯域応答によって高周波数信号を構成する。また、２個の正弦波コンポーネントが１番目の４ｋｂｉｔ／ｓ超広帯域拡張階層のスペクトルに追加される。ジェネリックモード９０６と正弦波モード８０８とは、正弦波モード復号化技術に基づいた類似した向上階層（ｅｎｈａｎｃｅｍｅｎｔｌａｙｅｒｓ）を活用する。

【0084】

ジェネリックモード９０６では、本発明に係るオーディオ復号化方法によって、復号化された信号の品質改善がなされ得る。ジェネリックモード９０６は、２個の正弦波コンポーネントを再構成された全体高周波数スペクトルに追加する。この正弦波は、位置、符号、及び大きさで表現される。このとき、正弦波を追加するためのトラックの開始位置は、上述したように、相対的に大きいエネルギを有するサブ帯域のインデックスから取得される。

【0085】

正弦波モード９０８において、高周波数信号は、有限個の正弦波コンポーネントセットによって生成される。例えば、追加される正弦波の総個数は１０個であるが、４個は７０００−８６００Ｈｚ周波数範囲に、４個は８６００−１０２００Ｈｚ周波数範囲に、１個は１０２００−１１８００Ｈｚ周波数範囲に、１個は１１８００−１２６００Ｈｚ周波数範囲に位置することができる。

【0086】

正弦波復号化部９１０、９１２は、ジェネリックモード９０６または正弦波モード９０８によって出力された信号の品質を改善する。１番目の超広帯域向上階層は、１０個の正弦波コンポーネントを正弦波モードフレームの高周波数信号スペクトルにさらに追加する。ジェネリックモードフレームで、追加される正弦波コンポーネントの数は、低周波数及び高波数改善間の適応的ビット割当によって設定される。

【0087】

正弦波復号化部９１０、９１２の復号化過程は次のとおりである。まず、ビットストリームから正弦波の位置が取得される。その後、ビットストリームは、伝送されたコーディングインデックス及び大きさコードブックインデックスを求めるために復号化される。

【0088】

正弦波復号化のためのトラックは、相対的に大きいエネルギを有するＮｓｉｎ／Ｎｓｉｎ＿ｔｒａｃｋ個のサブ帯域を探すことにより選択される。ここで、Ｎｓｉｎ＿ｔｒａｃｋは、トラック当り正弦波の個数であり、２に設定される。選択されたＮｓｉｎ／Ｎｓｉｎ＿ｔｒａｃｋ個のサブ帯域は、それぞれ正弦波復号化に用いられるトラックに対応する。

【0089】

それぞれの対応するトラックと関係のある１０個の正弦波の位置インデックスは、ビットストリームから初めて求められる。その後、１０個の正弦波の符号が復号化される。最後に、正弦波の大きさ（３個の８ビットコードブックインデックス）が復号化される。

【0090】

このように、正弦波復号化部９１０、９１２によって品質が改善された信号は、ＩＭＤＣＴ９２０による逆ＭＤＣＴ、前処理部９２２による前処理を経る。アップサンプリング部９１８の出力信号及び前処理部９２２の出力信号は加えられて３２ｋＨｚ出力信号で出力される。

【0091】

前述した本発明は、本発明の属する技術分野における通常の知識を有した者にとって、本発明の技術的思想を逸脱しない範囲内で様々な置換、変形及び変更が可能であるため、前述の実施形態及び添付した図面によって限定されるものではない。

【図1】