特許第6404410号(P6404410)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ▲ホア▼▲ウェイ▼技術有限公司の特許一覧

<>
  • 特許6404410-信号を復号するための方法および装置 図000008
  • 特許6404410-信号を復号するための方法および装置 図000009
  • 特許6404410-信号を復号するための方法および装置 図000010
  • 特許6404410-信号を復号するための方法および装置 図000011
  • 特許6404410-信号を復号するための方法および装置 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6404410
(24)【登録日】2018年9月21日
(45)【発行日】2018年10月10日
(54)【発明の名称】信号を復号するための方法および装置
(51)【国際特許分類】
   G10L 19/028 20130101AFI20181001BHJP
   G10L 19/035 20130101ALI20181001BHJP
【FI】
   G10L19/028
   G10L19/035 B
【請求項の数】20
【外国語出願】
【全頁数】28
(21)【出願番号】特願2017-127145(P2017-127145)
(22)【出願日】2017年6月29日
(62)【分割の表示】特願2015-545641(P2015-545641)の分割
【原出願日】2013年7月25日
(65)【公開番号】特開2017-194705(P2017-194705A)
(43)【公開日】2017年10月26日
【審査請求日】2017年6月30日
(31)【優先権主張番号】201210518020.9
(32)【優先日】2012年12月6日
(33)【優先権主張国】CN
(31)【優先権主張番号】201310297982.0
(32)【優先日】2013年7月16日
(33)【優先権主張国】CN
【早期審査対象出願】
(73)【特許権者】
【識別番号】504277388
【氏名又は名称】▲ホア▼▲ウェイ▼技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100140534
【弁理士】
【氏名又は名称】木内 敬二
(72)【発明者】
【氏名】▲劉▼ ▲澤▼新
(72)【発明者】
【氏名】▲斉▼ 峰岩
(72)【発明者】
【氏名】苗 磊
【審査官】 上田 雄
(56)【参考文献】
【文献】 特開2010−156990(JP,A)
【文献】 特表2004−522198(JP,A)
【文献】 特表2011−527455(JP,A)
【文献】 特表2010−538317(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
(57)【特許請求の範囲】
【請求項1】
音声信号を復号するための方法であって、
受信されたビット・ストリームを復号して前記音声信号の現在フレームのスペクトル係数のうち少なくとも一部を取得するステップと、
前記現在フレームのサブバンドを、前記サブバンドのスペクトル係数ごとに割り当てられたビットの平均量に従って、ビット割当てが飽和していないサブバンドとして分類するステップであって、前記ビット割当てが飽和していないサブバンドの少なくとも1つのスペクトル係数は前記受信したビット・ストリームを復号することにより取得されていない、ステップと、
前記ビット・ストリームを復号することにより取得されていない前記ビット割当てが飽和していないサブバンドの前記少なくとも1つのスペクトル係数を雑音充填により再構築するステップと、
前記音声信号の前記現在フレームの前記取得されたスペクトル係数の少なくとも一部および前記ビット割当てが飽和していないサブバンドの前記再構築された少なくとも1つのスペクトル係数に従って周波数領域信号を取得するステップと、
を含む、方法。
【請求項2】
前記現在フレームの前記サブバンドを前記ビット割当てが飽和していないサブバンドとして分類するステップは、
前記サブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量を分類閾値と比較するステップと、
前記サブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量が前記分類閾値より小さいとき、前記ビット割当てが飽和していないサブバンドとして前記サブバンドを分類するステップと、
を含む、請求項1に記載の方法。
【請求項3】
前記サブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量は前記サブバンドに対して割り当てられたビットの量と前記サブバンドの帯域幅との比である、請求項2に記載の方法。
【請求項4】
前記サブバンドの前記帯域幅は前記サブバンド内のスペクトル係数の量により表される、請求項3に記載の方法。
【請求項5】
前記現在フレームの別のサブバンドをビット割当てが飽和したサブバンドとして分類するステップであって、前記ビット割当てが飽和したサブバンド内に再構築すべきスペクトル係数がない、ステップをさらに含む、請求項2乃至4の何れか1項に記載の方法。
【請求項6】
前記現在フレームの別のサブバンドを前記ビット割当てが飽和したサブバンドとして分類するステップは、
前記別のサブバンドのスペクトル係数ごとに割り当てられたビットの平均量を計算するステップと、
前記別のサブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量を前記分類閾値と比較するステップと、
前記別のサブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量が前記分類閾値より小さくないとき、前記別のサブバンドを前記ビット割当てが飽和したサブバンドとして分類するステップと、
を含む、請求項5に記載の方法。
【請求項7】
前記別のサブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量は、前記別のサブバンドに割り当てられたビットの量と前記別のサブバンドの帯域幅との比である、請求項6に記載の方法。
【請求項8】
前記別のサブバンドの前記帯域幅は前記別のサブバンド内のスペクトル係数の量により表される、請求項7に記載の方法。
【請求項9】
前記分類閾値は0より大きい、請求項2乃至8の何れか1項に記載の方法。
【請求項10】
前記現在フレームの別のサブバンドをビット割当てが飽和していないサブバンドとして分類するステップであって、前記別のサブバンドの各スペクトル係数は前記受信したビット・ストリームを復号することにより取得されていない、ステップをさらに含む、請求項2乃至9の何れか1項に記載の方法。
【請求項11】
音声信号を復号するための復号器であって、
コンピュータ実行可能命令を格納するための非一時的メモリと、
前記非一時的メモリに動作可能に接続されたプロセッサであって、前記プロセッサは、前記コンピュータ実行可能命令を実行して、
受信されたビット・ストリームを復号して前記音声信号の現在フレームのスペクトル係数のうち少なくとも一部を取得し、
前記現在フレームのサブバンドを、前記サブバンドのスペクトル係数ごとに割り当てられたビットの平均量に従って、ビット割当てが飽和していないサブバンドとして分類し、
前記ビット・ストリームを復号することにより取得されていない前記ビット割当てが飽和していないサブバンドの前記少なくとも1つのスペクトル係数を雑音充填により再構築し、
前記音声信号の前記現在フレームの前記取得されたスペクトル係数の少なくとも一部および前記ビット割当てが飽和していないサブバンドの前記再構築された少なくとも1つのスペクトル係数に従って周波数領域信号を取得する
ように構成され、前記ビット割当てが飽和していないサブバンドの少なくとも1つのスペクトル係数は前記受信したビット・ストリームを復号することにより取得されていない、プロセッサと、
を備える、復号器。
【請求項12】
前記現在フレームの前記サブバンドをビット割当てが飽和していない前記サブバンドとして分類するとき、前記プロセッサは、前記コンピュータ実行可能命令を実行して、
前記サブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量を分類閾値と比較し、
前記サブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量が前記分類閾値より小さいとき、前記サブバンドを前記ビット割当てが飽和していないサブバンドとして分類する
ように構成される、請求項11に記載の復号器。
【請求項13】
前記サブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量は前記サブバンドに対して割り当てられたビットの量と前記サブバンドの帯域幅との比である、請求項12に記載の復号器。
【請求項14】
前記サブバンドの前記帯域幅は前記サブバンド内のスペクトル係数の量により表される、請求項13に記載の復号器。
【請求項15】
前記プロセッサはさらに、前記コンピュータ実行可能命令を実行して、前記現在フレームの別のサブバンドをビット割当てが飽和したサブバンドとして分類するように構成され、前記ビット割当てが飽和したサブバンド内に再構築すべきスペクトル係数がない、請求項12乃至14の何れか1項に記載の復号器。
【請求項16】
前記現在フレームの別のサブバンドを前記ビット割当てが飽和したサブバンドとして分類するとき、前記プロセッサは、前記コンピュータ実行可能命令を実行して、
前記別のサブバンドのスペクトル係数ごとに割り当てられたビットの平均量を計算し、
前記別のサブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量を前記分類閾値と比較し、
前記別のサブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量が前記分類閾値より小さくないとき、前記別のサブバンドを前記ビット割当てが飽和したサブバンドとして分類する
ように構成される、請求項15に記載の復号器。
【請求項17】
前記別のサブバンドのスペクトル係数ごとに割り当てられたビットの前記平均量は、前記別のサブバンドに割り当てられたビットの量と前記別のサブバンドの帯域幅との比である、請求項16に記載の復号器。
【請求項18】
前記別のサブバンドの前記帯域幅は前記別のサブバンド内のスペクトル係数の量により表される、請求項17に記載の復号器。
【請求項19】
前記分類閾値は0より大きい、請求項12乃至18の何れか1項に記載の復号器。
【請求項20】
前記プロセッサはさらに、前記コンピュータ実行可能命令を実行して、前記現在フレームの別のサブバンドをビット割当てが飽和していないサブバンドとして分類するように構成され、前記別のサブバンドの各スペクトル係数は前記受信したビット・ストリームを復号することにより取得されていない、請求項12乃至19の何れか1項に記載の復号器。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、発明の名称を「信号を復号するための方法および装置」とした2012年12月6日に中国国家知識産権局に出願された中国特許出願第201210518020.9号および発明の名称を「信号を復号するための方法および装置」とした2013年7月16日に中国国家知識産権局に出願された中国特許出願第201310297982.0号に対する優先権を主張し、その両方とも全体を引用により本明細書に組み込む。
【0002】
本発明の諸実施形態は、電子装置の分野に関し、より具体的には、信号を復号するための方法および装置に関する。
【背景技術】
【0003】
既存の周波数領域コーデック・アルゴリズムでは、ビットレートが低いとき、割り当てることができるビットの量は不十分である。この場合、ビットは相対的に重要なスペクトル係数にのみ割り当てられ、割り当てられたビットが符号化中に相対的に重要なスペクトル係数を符号化するために使用される。しかし、相対的に重要なスペクトル係数以外のスペクトル係数(即ち、あまり重要でないスペクトル係数)にはビットは割り当てられず、このあまり重要でないスペクトル係数は符号化されない。ビットが割り当てられるスペクトル係数に対して、割り当てることができるビットの量は不十分であるので、割り当てられたビットが不十分なスペクトル係数の一部が存在する。符号化の間、割り当てられたビットが不十分なスペクトル係数を符号化するのに十分なビットが存在せず、例えば、サブバンド内の少数のスペクトル係数しか符号化されない。
【0004】
符号器に対応して、相対的に重要なスペクトル係数のみが復号器で復号され、復号により取得されていないあまり重要でないスペクトル係数には0の値で埋められる。復号により取得されていないスペクトル係数に対して処理が実施されない場合、復号効果に及ぼす影響は大きい。例えば、音声信号の復号に関して、最終的に出力される音声信号は「虚無感」または「水の音」等に聞こえ、聴覚品質に大きく影響する。したがって、復号により取得されなかったスペクトル係数を雑音充填方法により復元して、良好な品質の信号を出力する必要がある。復号により取得されなかったスペクトル係数を復元する1例(即ち、雑音充填の例)では、復号により取得されたスペクトル係数を行列に保存でき、当該行列内のスペクトル係数をビットが割り当てられていないサブバンド内のスペクトル係数の位置に複製する。換言すれば、復号により取得されなかったスペクトル係数は、復号により取得されなかったスペクトル係数を、保存された復号により取得されたスペクトル係数で置き換えることで復元される。
【0005】
復号により取得されていないスペクトル係数を復元する上述の解決策では、復号により取得されておらずビットが割り当てられていないサブバンドのスペクトル係数のみが復元され、復号された信号の品質は十分に良好ではない。
【発明の概要】
【課題を解決するための手段】
【0006】
本発明の諸実施形態では、信号の復号品質を高めることができる、信号を復号するための方法と装置を提供する。
【0007】
第1の態様によれば、復号により、受信したビット・ストリームからサブバンドのスペクトル係数を取得するステップと、当該スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するステップと、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施し、復号により取得されていないスペクトル係数を復元するステップと、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って周波数領域信号を取得するステップとを含む、信号を復号するための方法を提供する。
【0008】
第1の態様を参照して、第1の態様の第1の実装方式では、スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するステップは、スペクトル係数ごとに割り当てられたビットの平均量を第1の閾値と比較するステップであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であるステップと、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値以上であるサブバンドをビット割当てが飽和しているサブバンドとして使用し、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値より小さいサブバンドをビット割当てが飽和していないサブバンドとして使用するステップとを含んでもよい
【0009】
第1の態様または第1の態様の第1の実装方式を参照して、第1の態様の第2の実装方式では、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施するステップが、スペクトル係数ごとに割り当てられたビットの平均量を第2の閾値と比較するステップであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であるステップと、スペクトル係数ごとに割り当てられたビットの平均量が当該第2の閾値以上であるサブバンドの倍音パラメータを計算するステップであって、当該倍音パラメータは周波数領域信号の倍音の強さまたは弱さを表すステップと、当該倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップとを含んでもよい。
【0010】
第1の態様の第2の実装方式を参照して、第1の態様の第3の実装方式では、スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドの倍音パラメータを計算するステップは、スペクトル係数ごとに割り当てられたビットの平均量が当該第2の閾値以上であるサブバンドの、ピーク対平均値比、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、フレーム全体のビット割当ての分散、平均値エンベロープ比、平均値対ピーク比、エンベロープ・ピーク比、およびエンベロープ平均値比のうち少なくとも1つのパラメータを計算するステップと、当該計算された少なくとも1つのパラメータのうち1つを使用するか、または、組合せ方式で、当該計算されたパラメータを当該倍音パラメータとして使用するステップを含んでもよい。
【0011】
第1の態様の第2の実装方式または第3の実装方式を参照して、第1の態様の第4の実装方式では、倍音パラメータに基づいて、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップは、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数に従って、ビット割当てが飽和していないサブバンドの雑音充填利得を計算するステップと、スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドのピーク対平均値比を計算し、グローバル雑音因子を当該ピーク対平均値比に基づいて取得するステップと、当該倍音パラメータと当該グローバル雑音因子に基づいて当該雑音充填利得を補正してターゲット利得を取得するステップと、当該ターゲット利得と重み付き雑音値を用いて、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数を復元するステップとを含んでもよい。
【0012】
第1の態様の第4の実装方式を参照して、第1の態様の第5の実装方式では、倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施するステップが、ビット割当てが飽和していないサブバンドのピーク対平均値比を計算し、当該ピーク対平均値比を第3の閾値と比較するステップと、ピーク対平均値比が当該第3の閾値より大きくビット割当てが飽和していないサブバンドに対して、ターゲット利得を取得した後、ビット割当てが飽和していないサブバンドにおいて、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数の最大振幅との比を使用して当該ターゲット利得を補正するステップとをさらに含んでもよい。
【0013】
第1の態様の第4の実装方式を参照して、第1の態様の第6の実装方式では、倍音パラメータとグローバル雑音因子に基づいて雑音充填利得を補正してターゲット利得を取得するステップは、当該倍音パラメータを第4の閾値と比較するステップと、当該倍音パラメータが当該第4の閾値以上であるとき、gain=fac*gain*norm/peakを用いることで当該ターゲット利得を取得するステップと、当該倍音パラメータが当該第4の閾値より小さいとき、gain=fac’*gainおよびfac’=fac+stepを用いることで当該ターゲット利得を取得するステップであって、gainはターゲット利得であり、facはグローバル雑音因子であり、normは、ビット割当てが飽和していないサブバンドのエンベロープであり、peakは、ビット割当てが飽和していないサブバンドにおける、復号により得られた当該スペクトル係数の最大振幅であり、stepは周波数に従ってグローバル雑音因子が変化する間隔であるステップとを含んでもよい。
【0014】
第1の態様の第4の実装方式または第6の実装方式を参照して、第1の態様の第7の実装方式では、倍音パラメータに基づいて、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップは、復号により取得されなかったスペクトル係数を復元した後に、復元されたスペクトル係数にフレーム間平滑化処理を実施するステップをさらに含んでもよい。
【0015】
第1の態様または第1の態様の第1の実装方式を参照して、第1の態様の第8の実装方式では、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップは、スペクトル係数ごとに割り当てられたビットの平均量を0と比較するステップであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であるステップと、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの倍音パラメータを計算するステップであって、当該倍音パラメータは周波数領域信号の倍音の強さまたは弱さを表すステップと、当該倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップとを含む。
【0016】
第1の態様の第8の実装方式を参照して、第1の態様の第9の実装方式では、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの倍音パラメータを計算するステップは、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの、ピーク対平均値比、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、フレーム全体のビット割当ての分散、平均値エンベロープ比、平均値対ピーク比、エンベロープ・ピーク比、およびエンベロープ平均値比のうち少なくとも1つのパラメータを計算するステップと、計算された少なくとも1つのパラメータのうち1つを使用し、または、組合せ方式で、当該計算されたパラメータを当該倍音パラメータとして使用するステップとを含む。
【0017】
第1の態様の第9の実装方式を参照して、第1の態様の第10の実装方式では、倍音パラメータに基づいて、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップは、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数に従って、ビット割当てが飽和していないサブバンドの雑音充填利得を計算するステップと、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドのピーク対平均値比を計算して、グローバル雑音因子を当該ピーク対平均値比に基づいて取得するステップと、当該倍音パラメータと当該グローバル雑音因子に基づいて当該雑音充填利得を補正してターゲット利得を取得するステップと、当該ターゲット利得と重み付き雑音値を用いて、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数を復元するステップとを含む。
【0018】
第1の態様の第10の実装方式を参照して、第1の態様の第11の実装方式では、倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施するステップは、ビット割当てが飽和していないサブバンドのピーク対平均値比を計算し、当該ピーク対平均値比を第3の閾値と比較するステップと、ピーク対平均値比が当該第3の閾値より大きくビット割当てが飽和していないサブバンドに対して、ターゲット利得を取得した後、ビット割当てが飽和していないサブバンドにおいて、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数の最大振幅との比を使用して当該ターゲット利得を補正するステップとをさらに含む。
【0019】
第1の態様の第10の実装方式を参照して、第1の態様の第12の実装方式では、倍音パラメータとグローバル雑音因子に基づいて雑音充填利得を補正してターゲット利得を取得するステップは、当該倍音パラメータを第4の閾値と比較するステップと、当該倍音パラメータが当該第4の閾値以上であるとき、gain=fac*gain*norm/peakを用いることで当該ターゲット利得を取得するステップと、当該倍音パラメータが当該第4の閾値より小さいとき、gain=fac’*gainおよびfac’=fac+stepを用いることで当該ターゲット利得を取得するステップであって、gainはターゲット利得であり、facはグローバル雑音因子であり、normはビット割当てが飽和していないサブバンドのエンベロープであり、peakは、ビット割当てが飽和していないサブバンドにおける、復号により取得されたスペクトル係数の最大振幅であり、stepは周波数に従ってグローバル雑音因子が変化する間隔であるステップとを含む。
【0020】
第1の態様の第10の実装方式または第12の実装方式を参照して、第1の態様の第13の実装方式では、倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップは、復号により取得されなかったスペクトル係数を復元した後に、復元されたスペクトル係数にフレーム間平滑化処理を実施するステップをさらに含む。
【0021】
第2の態様によれば、復号により、受信したビット・ストリームからサブバンドのスペクトル係数を取得するように構成された復号ユニットと、当該スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するように構成された分類ユニットであって、ビット割当てが飽和しているサブバンドとは、割り当てられたビットを当該サブバンド内の全てのスペクトル係数を符号化するために使用できるサブバンドのことをいい、ビット割当てが飽和していないサブバンドとは、割り当てられたビットを当該サブバンド内のスペクトル係数の一部のみを符号化するために使用できるサブバンド、および、ビットが割り当てられていないサブバンドのことをいう、分類ユニットと、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施して、復号により取得されていないスペクトル係数を復元するように構成された復元ユニットと、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って周波数領域信号を取得するように構成された出力ユニットとを備えた、信号を復号するための装置を提供する。
【0022】
第2の態様を参照して、第2の態様の第1の実装方式では、当該分類ユニットは、スペクトル係数ごとに割り当てられたビットの平均量を第1の閾値と比較するように構成された比較コンポーネントであって、スペクトル係数ごとに割り当てられたビットの平均量は、サブバンドごとに割り当てられたビットの量と各サブバンド内のスペクトル係数の量の比である比較コンポーネントと、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値以上であるサブバンドをビット割当てが飽和しているサブバンドとして分類し、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値より小さいサブバンドをビット割当てが飽和していないサブバンドとして分類するように構成された分類コンポーネントとを備えてもよい。
【0023】
第2の態様または第2の態様の第1の実装方式を参照して、第2の態様の第2の実装方式では、当該復元ユニットは、スペクトル係数ごとに割り当てられたビットの平均量を第2の閾値と比較して、スペクトル係数ごとに割り当てられたビットの平均量が当該第2の閾値以上であるサブバンドの倍音パラメータを計算するように構成された計算コンポーネントであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であり、当該倍音パラメータは周波数領域信号の倍音の強さまたは弱さを表す計算コンポーネントと、当該倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施し、復号により取得されていないスペクトル係数を復元するように構成された充填コンポーネントとを備えてもよい。
【0024】
第2の態様の第2の実装方式を参照して、第2の態様の第3の実装方式では、当該計算コンポーネントは、スペクトル係数ごとに割り当てられたビットの平均量が当該第2の閾値以上であるサブバンドのピーク対平均値比、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、およびフレーム全体のビット割当ての分散のうち少なくとも1つのパラメータを計算するステップと、当該計算された少なくとも1つのパラメータのうち1つを使用するか、または、組合せ方式で、当該計算されたパラメータを倍音パラメータとして使用するステップとを用いることによって当該倍音パラメータを計算してもよい。
【0025】
第2の態様の第2の実装方式または第3の実装方式を参照して、第2の態様の第4の実装方式では、当該充填コンポーネントが、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数に従って、ビット割当てが飽和していないサブバンドの雑音充填利得を計算し、スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドのピーク対平均値比を計算し、ビット割当てが飽和しているサブバンドのピーク対平均値比に基づいてグローバル雑音因子を取得し、倍音パラメータと当該グローバル雑音因子に基づいて当該雑音充填利得を補正してターゲット利得を取得するように構成された利得計算モジュールと、当該ターゲット利得と重み付き雑音値を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数を復元するように構成された充填モジュールとを備えてもよい。
【0026】
第2の態様の第4の実装方式を参照して、第2の態様の第5の実装方式では、当該充填コンポーネントは、ビット割当てが飽和していないサブバンドのピーク対平均値比を計算し、当該ピーク対平均値比を第3の閾値と比較し、ピーク対平均値比が当該第3の閾値より大きくビット割当てが飽和していないサブバンドに対して、ターゲット利得を取得した後、ビット割当てが飽和していないサブバンドにおいて、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数の最大振幅との比を用いて当該ターゲット利得を補正し、補正されたターゲット利得を取得するように構成された補正モジュールであって、当該充填モジュールは、補正されたターゲット利得と重み付き雑音値を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数を復元する補正モジュールをさらに備える。
【0027】
第2の態様の第4の実装方式または第5の実装方式を参照して、第2の態様の第6の実装方式では、当該利得計算モジュールは、倍音パラメータを第4の閾値と比較するステップと、当該倍音パラメータが当該第4の閾値以上であるとき、gain=fac*gain*norm/peakを用いることでターゲット利得を取得するステップと、当該倍音パラメータが当該第4の閾値より小さいとき、gain=fac’*gainおよびfac’=fac+stepを用いることで当該ターゲット利得を取得するステップとを用いることによって、当該倍音パラメータとグローバル雑音因子に基づいて雑音充填利得を補正してもよい。gainはターゲット利得であり、facはグローバル雑音因子であり、normは、ビット割当てが飽和していないサブバンドのエンベロープであり、peakは、ビット割当てが飽和していないサブバンドにおける、復号により得られたスペクトル係数の最大振幅であり、stepは周波数に従ってグローバル雑音因子が変化する間隔である。
【0028】
第2の態様の第4の実装方式または第5の実装方式または第6の実装方式を参照して、第2の態様の第7の実装方式では、当該充填コンポーネントは、復号により取得されなかったスペクトル係数を復元した後に、復元されたスペクトル係数にフレーム間平滑化処理を実施して平滑化処理が実施されているスペクトル係数を取得するように構成されたフレーム間平滑化モジュールであって、当該出力ユニットは、復号により取得されたスペクトル係数と平滑化処理が実施されたスペクトル係数に従って周波数領域信号を取得するように構成されたフレーム間平滑化モジュールをさらに備える。
【0029】
第2の態様または第2の態様の第1の実装方式を参照して、第2の態様の第8の実装方式では、当該復元ユニットは、スペクトル係数ごとに割り当てられたビットの平均量を0と比較し、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの倍音パラメータを計算するように構成された計算コンポーネントであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であり、当該倍音パラメータは周波数領域信号の倍音の強さまたは弱さを表す計算コンポーネントと、当該倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施して、復号により取得されていないスペクトル係数を復元するように構成された充填コンポーネントとを備える。
【0030】
第2の態様の第8の実装方式を参照して、第2の態様の第9の実装方式では、当該計算コンポーネントは、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの、ピーク対平均値比、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、フレーム全体のビット割当ての分散、平均値エンベロープ比、平均値対ピーク比、エンベロープ・ピーク比、およびエンベロープ平均値比のうち少なくとも1つのパラメータを計算するステップと、当該計算された少なくとも1つのパラメータのうち1つを使用するか、または、組合せ方式で、当該計算されたパラメータを倍音パラメータとして使用するステップとを用いることによって、当該倍音パラメータを計算する。
【0031】
第2の態様の第9の実装方式を参照して、第2の態様の第10の実装方式では、当該充填コンポーネントは、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数に従って、ビット割当てが飽和していないサブバンドの雑音充填利得を計算し、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドのピーク対平均値比を計算し、グローバル雑音因子を当該ピーク対平均値比に基づいて取得し、倍音パラメータと当該グローバル雑音因子に基づいて当該雑音充填利得を補正してターゲット利得を取得するように構成された利得計算モジュールと、当該ターゲット利得と重み付き雑音値を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数を復元するように構成された充填モジュールとを備える。
【0032】
第2の態様の第10の実装方式を参照して、第2の態様の第11の実装方式では、当該充填コンポーネントは、ビット割当てが飽和していないサブバンドのピーク対平均値比を計算し、当該ピーク対平均値比を第3の閾値と比較し、ピーク対平均値比が当該第3の閾値より大きくビット割当てが飽和していないサブバンドに対して、ターゲット利得を取得した後、ビット割当てが飽和していないサブバンドにおいて、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数の最大振幅との比を用いて当該ターゲット利得を補正し、補正されたターゲット利得を取得するように構成された補正モジュールであって、当該充填モジュールは、補正されたターゲット利得と重み付き雑音値を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数を復元する補正モジュールをさらに備える。
【0033】
第2の態様の第10の実装方式を参照して、第2の態様の第12の実装方式では、当該利得計算モジュールは、倍音パラメータを第4の閾値と比較するステップと、当該倍音パラメータが当該第4の閾値以上であるとき、gain=fac*gain*norm/peakを用いることでターゲット利得を取得するステップと、当該倍音パラメータが当該第4の閾値より小さいとき、gain=fac’*gainおよびfac’=fac+stepを用いることで当該ターゲット利得を取得するステップとを用いることによって、当該倍音パラメータとグローバル雑音因子に基づいて雑音充填利得を補正する。gainはターゲット利得であり、facはグローバル雑音因子であり、normはビット割当てが飽和していないサブバンドのエンベロープであり、peakは、ビット割当てが飽和していないサブバンドにおける、復号により取得されたスペクトル係数の最大振幅であり、stepは周波数に従ってグローバル雑音因子が変化する間隔である。
【0034】
第2の態様の第10の実装方式または第12の実装方式を参照して、第2の態様の第13の実装方式では、当該充填コンポーネントは、復号により取得されなかったスペクトル係数を復元した後に、復元されたスペクトル係数にフレーム間平滑化処理を実施して平滑化処理が実施されているスペクトル係数を取得するように構成されたフレーム間平滑化モジュールであって、当該出力ユニットは、復号により取得されたスペクトル係数と平滑化処理が実施されたスペクトル係数に従って周波数領域信号を取得するように構成された、フレーム間平滑化モジュールをさらに備える。
【0035】
本発明の諸実施形態によれば、スペクトル係数内のビット割当てが飽和していないサブバンドを分類により取得でき、復号により取得されておらずビットが割り当てられていないサブバンド内のスペクトル係数を単に復元するのではなく、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数が復元され、それにより、信号の復号品質が高まる。
【0036】
本発明の諸実施形態における技術的解決策をより明確に説明するために、以下では当該諸実施形態または先行技術を説明するのに必要な添付図面を簡単に説明する。明らかに、以下の説明における添付図面は本発明の幾つかの諸実施形態を示すにすぎず、当業者は創造的作業なしにこれらの添付図面から他の図面を導出することができる。
【図面の簡単な説明】
【0037】
図1】本発明の1実施形態に従う、信号を復号するための方法の流れ図である。
図2】本発明の1実施形態に従う、信号を復号するための方法における雑音充填処理の流れ図である。
図3】本発明の1実施形態に従う、信号を復号するための装置のブロック図である。
図4】本発明の1実施形態に従う、信号を復号するための装置の復元ユニットのブロック図である。
図5】本発明の別の実施形態に従う機器のブロック図である。
【発明を実施するための形態】
【0038】
以下で、本発明の諸実施形態における添付図面を参照して、本発明の諸実施形態の技術的解決策を明確かつ十分に説明する。明らかに、説明する諸実施形態は本発明の諸実施形態の全部ではなく一部である。当業者が創造的作業なしに本発明の諸実施形態に基づいて取得する他の全ての諸実施形態は本発明の保護範囲内に入るものとする。
【0039】
本発明では周波数領域の復号方法を提供する。符号器がスペクトル係数をサブバンドにグループ化し、サブバンドごとに符号化ビットを割り当てる。当該サブバンド内のスペクトル係数をサブバンドごとに割り当てられたビットに従って量子化して、符号化ビット・ストリームを取得する。ビットレートが低く、割り当てることができるビットの量が不十分であるとき、符号器は相対的に重要なスペクトル係数にのみビットを割り当てる。当該サブバンドに対して、割り当てられたビットは異なるケースを有する。即ち、割り当てられたビットを使用してサブバンド内の全てのスペクトル係数を符号化してもよく、割り当てられたビットを使用して、サブバンド内のスペクトル係数の一部のみを符号化してもよく、または、サブバンドに対してビットが割り当てられない。割り当てられたビットを使用してサブバンド内の全てのスペクトル係数を符号化できるとき、復号器は当該サブバンド内の全てのスペクトル係数を復号により直接取得することができる。当該サブバンドにビットが割り当てられないとき、復号器は当該サブバンドのスペクトル係数を復号により取得できず、雑音充填方法を使用することにより、復号により取得されていないスペクトル係数を復元する。割り当てられたビットを使用してサブバンド内のスペクトル係数の一部のみを符号化できるとき、復号器は当該サブバンド内のスペクトル係数の一部のみを復元してもよく、復号により取得されていないスペクトル係数(即ち、スペクトル係数は符号器により符号化されない)は雑音充填を用いて復元される。
【0040】
本発明の諸実施形態における信号を復号するための技術的解決策を、様々な通信システム、例えば、GSM(登録商標)、符号分割多重アクセス(CDMA、Code Division Multiple Access)システム、広帯域符号分割多重アクセス(WCDMA(登録商標)、Wideband Code Division Multiple Access Wireless)、汎用パケット無線サービス(GPRS、General Packet Radio Service)、およびロング・ターム・エボリューション(LTE、Long Term Evolution)に適用してもよい。本発明の諸実施形態における信号を復号するための技術的解決策が適用される通信システムまたは装置は本発明に対する限定を構成しない。
【0041】
図1は、本発明の1実施形態に従う信号を復号するための方法100の流れ図である。
【0042】
信号を復号するための方法100は、復号により、受信したビット・ストリームからサブバンドのスペクトル係数を取得するステップ(110)と、当該スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するステップであって、ビット割当てが飽和しているサブバンドとは割り当てられたビットを使用して当該サブバンド内の全てのスペクトル係数を符号化できるサブバンドのことをいい、ビット割当てが飽和していないサブバンドとは割り当てられたビットを使用して当該サブバンド内のスペクトル係数の一部のみを符号化できるサブバンド、および、ビットが割り当てられていないサブバンドのことをいうステップと(120)、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施して、復号により取得されていないスペクトル係数を復元するステップ(130)と、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って周波数領域信号を取得するステップ(140)とを含む。
【0043】
110で、復号により、受信したビット・ストリームからサブバンドのスペクトル係数を取得するステップが特に、復号により、受信したビット・ストリームから当該スペクトル係数を取得するステップと、当該スペクトル係数を当該サブバンドにグループ化するステップとを含んでもよい。当該スペクトル係数が、画像信号、データ信号、音声信号、ビデオ信号、およびテキスト信号のようなクラスの信号のスペクトル係数であってもよい。当該スペクトル係数を様々な復号方法を用いて取得してもよい。具体的な信号の分類と復号の方法は本発明に対する限定を構成しない。
【0044】
符号器はスペクトル係数をサブバンドにグループ化し、サブバンドごとに符号化ビットを割り当てる。符号器のものと同じサブバンド分類方法を用いて、復号により当該スペクトル係数を取得した後、復号器は、スペクトル係数の周波数に従って、復号により取得されたスペクトル係数を当該サブバンドにグループ化する。
【0045】
1例では、スペクトル係数が配置された周波数帯を均等に複数のサブバンドにグループ化してもよく、次いで当該スペクトル係数を、各スペクトル係数の周波数に従って、当該周波数が配置されたサブバンドにグループ化する。さらに、当該スペクトル係数を様々な既存のまたは将来の分類方法に従って周波数領域のサブバンドにグループ化してもよく、次いで様々な処理が実施される。
【0046】
120で、スペクトル係数が配置されたサブバンドをビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類する。ビット割当てが飽和しているサブバンドとは、割り当てられたビットを当該サブバンド内の全てのスペクトル係数を符号化するために使用できるサブバンドのことをいい、ビット割当てが飽和していないサブバンドとは、割り当てられたビットを当該サブバンド内のスペクトル係数の一部のみを符号化するために使用できるサブバンド、および、ビットが割り当てられていないサブバンドのことをいう。スペクトル係数のビット割当てが飽和しているとき、より多くのビットが当該スペクトル係数に割り当てられる場合でも、復号により得られた信号の品質は際立って改善されるわけではない。
【0047】
1例では、サブバンド内のスペクトル係数ごとに割り当てられたビットの平均量に従って、当該サブバンドのビット割当てが飽和しているかどうかを学習してもよい。特に、スペクトル係数ごとに割り当てられたビットの平均量を第1の閾値と比較する。スペクトル係数ごとに割り当てられたビットの平均量は、サブバンドごとに割り当てられたビットの量と各サブバンド内のスペクトル係数の量の比であり、即ち、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比である。スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値以上であるサブバンドをビット割当てが飽和しているサブバンドとして使用し、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値より小さいサブバンドをビット割当てが飽和していないサブバンドとして使用する。1例では、サブバンド内のスペクトル係数ごとに割り当てられたビットの平均量を、当該サブバンドに割り当てられたビットの量を当該サブバンド内のスペクトル係数の量で除すことによって得てもよい。当該第1の閾値を事前に設定してもよく、または、例えば、実験により容易に取得することができる。音声信号に対して、当該第1の閾値が1.5ビット/スペクトル係数であってもよい。
【0048】
130で、復号により取得されずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施し、復号により取得されていないスペクトル係数を復元する。ビット割当てが飽和していないサブバンドには、スペクトル係数にビットが割り当てられていないサブバンドと、ビットは割り当てられているが、割り当てられたビットが不十分であるサブバンドが含まれる。様々な雑音充填方法を使用して、復号により取得されていないスペクトル係数を復元してもよい。
【0049】
先行技術では、復号により取得されておらずビットが割り当てられていないサブバンド内のスペクトル係数のみが復元され、復号により取得されておらず、ビットが割り当てられたサブバンド内のビット割当てが不十分なために存在するスペクトル係数は復元されない。さらに、復号により取得されたスペクトル係数は一般に、復号により取得されなかったスペクトル係数にあまり関連せず、複製を行うことで直接的に良好な復号効果を得ることは難しい。本発明の当該実施形態では新たな雑音充填方法を提案する。即ち、雑音充填を、ビットの量が第2の閾値以上であるサブバンドの倍音パラメータharmに基づいて実施する。具体的には、スペクトル係数ごとに割り当てられたビットの平均量を第1の閾値と比較する。スペクトル係数ごとに割り当てられたビットの平均量は、サブバンドごとに割り当てられたビットの量と各サブバンド内のスペクトル係数の量との比であり、即ち、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比である。スペクトル係数ごとに割り当てられたビットの平均量が当該第2の閾値以上であるサブバンドの倍音パラメータを計算する。当該倍音パラメータは周波数領域信号の倍音の強さまたは弱さを表す。当該倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施する。当該第2の閾値を事前に設定してもよく、当該第2の閾値が上述の第1の閾値以下であり、1.3ビット/スペクトル係数のような別の閾値であってもよい。当該倍音パラメータharmを使用して当該周波数領域信号の倍音の強さまたは弱さを表す。周波数領域信号の倍音が強いケースでは、復号により取得されたスペクトル係数において0の値を有するスペクトル係数の量が相対的に多く、0の値を有するこれらのスペクトル係数に雑音充填を実施する必要はない。したがって、当該倍音パラメータに基づいて、復号により取得されていないスペクトル係数(即ち、0の値を有するスペクトル係数)に雑音充填を別々に実施する場合には、復号により取得された、0の値を有するスペクトル係数の一部に実施された雑音充填の誤りを回避でき、それにより、信号の復号品質が高まる。
【0050】
スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドの倍音パラメータharmを、当該サブバンドの、ピーク対平均値比(即ち、ピーク値と平均振幅の比)、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、フレーム全体のビット割当ての分散、平均値エンベロープ比、平均値対ピーク比(即ち、平均振幅とピーク値の比)、エンベロープ・ピーク比、およびエンベロープ平均値比のうち1つまたは複数によって表してもよい。本発明をより完全に開示するために、倍音パラメータを計算する方式をここで簡単に説明する。
【0051】
サブバンドのピーク対平均値比sharpを以下の式(1)を用いて計算してもよい。
【0052】
【数1】
【0053】
peakは、復号により取得されインデックスがsfmであるサブバンド内のスペクトル係数の最大振幅であり、size_sfmは、サブバンドsfm内のスペクトル係数の量または復号により取得されサブバンドsfm内のスペクトル係数の量であり、meanは全てのスペクトル係数の振幅の和である。サブバンドのピーク・エンベロープ比PERを、以下の式(2)を用いて計算してもよい。
【0054】
【数2】
【0055】
peakは、復号により取得されサブバンドsfm内にあるスペクトル係数の最大振幅であり、norm[sfm]は、復号により取得されサブバンドsfm内にあるスペクトル係数のエンベロープである。サブバンドの疎性sparを使用して、当該サブバンド内のスペクトル係数が幾つかの周波数ビンで中心的に分布しているかどうか、または、サブバンド全体に疎に分布しているかどうかを表し、当該疎性を、以下の式(3)を用いて計算してもよい。
【0056】
【数3】
【0057】
num_de_coefは復号により取得されたサブバンド内のスペクトル係数の量であり、pos_maxは復号により取得されたサブバンド内のスペクトル係数の最大周波数位置であり、pos_minは復号により取得されたサブバンド内のスペクトル係数の最小周波数位置である。フレーム全体のビット割当て分散varを以下の式(4)を用いて計算してもよい。
【0058】
【数4】
【0059】
last_sfmはフレーム全体においてビットが割り当てられた最大周波数のサブバンドを表し、bit[sfm]はサブバンドsfmに割り当てられたビットの量を表し、bit[sfm−1]はサブバンドsfm−1に割り当てられたビットの量を表し、total_bitは全てのサブバンドに割り当てられたビットの総量を表す。ピーク対平均値比sharp、ピーク・エンベロープ比PER、疎性spar、およびビット割当て分散varの値が大きいことは周波数領域信号の倍音が強いことを示し、逆に、ピーク対平均値比sharp、ピーク・エンベロープ比PER、疎性spar、およびビット割当て分散varの値が小さいことは、当該周波数領域信号の倍音が弱いことを示す。さらに、当該4つの倍音パラメータを組み合せ方式で使用して倍音の強さまたは弱さを表してもよい。実際には、適切な組合せ方式を要件に従って選択してもよい。一般に、加重和を当該4つのパラメータのうち2つ以上に実施して、得られた和を倍音パラメータとして使用する。したがって、当該倍音パラメータを、スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドの、ピーク対平均値比、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、およびフレーム全体のビット割当て分散のうち少なくとも1つのパラメータを計算するステップと、当該計算された少なくとも1つのパラメータのうち1つを使用するか、または、組合せ方式で、当該計算されたパラメータを当該倍音パラメータとして使用するステップとを用いることによって計算してもよい。別の定義形のパラメータが周波数領域信号の倍音を表し得るならば、当該別の定義形式のパラメータを当該4つのパラメータに加えてさらに使用してもよいことに留意されたい。
【0060】
上述のように、倍音パラメータを取得した後、当該倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施する。その詳細を、図2を参照して以下で説明する。
【0061】
140で、周波数領域信号を、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って取得する。復号により取得されたスペクトル係数を復号により取得し、復号により取得されなかったスペクトル係数を復元した後、周波数帯全体における周波数領域信号が取得され、時間領域の出力信号が、周波数領域逆変換、例えば逆高速フーリエ変換(IFFT、Inverse Fast Fourier Transform)、のような処理を実施することで得られる。実際には、どのように時間領域の出力信号がスペクトル係数に従って得られるかに関する解決策は当業者には理解され、詳細についてはここでは繰返し説明することはしない。
【0062】
本発明の当該実施形態における信号を復号するための上述の方法では、周波数領域信号のサブバンドにおけるビット割当てが飽和していないサブバンドは分類により取得され、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数が復元され、それにより信号の復号品質が高まる。さらに、復号により取得されていないスペクトル係数が倍音パラメータに基づいて復元されるケースでは、復号により得られた、0の値を有するスペクトル係数に実施された雑音充填の誤りを回避でき、それにより、さらに信号の復号品質が高まる。
【0063】
図2は、本発明の1実施形態に従う信号を復号するための方法における雑音充填処理200の流れ図である。
【0064】
雑音充填処理200は、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数に従って、ビット割当てが飽和していないサブバンドの雑音充填利得を計算するステップ(210)と、スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドのピーク対平均値比を計算し、ビット割当てが飽和しているサブバンドのピーク対平均値比に基づいてグローバル雑音因子を取得するステップ(220)と、倍音パラメータと当該グローバル雑音因子に基づいて当該雑音充填利得を補正してターゲット利得を取得するステップ(230)と、当該ターゲット利得と重み付き雑音値を用いて、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数を復元するステップ(240)とを含む。
【0065】
210で、ビット割当てが飽和していないサブバンドsfmに対して、当該ビット割当てが飽和していないサブバンドsfmの雑音充填利得gainを以下の式(5)または(6)に従って計算してもよい。
【0066】
【数5】
【0067】
norm[sfm]は、復号により取得された、ビット割当てが飽和していない(インデックスがsfmである)サブバンド内のスペクトル係数のエンベロープであり、coef[i]は、復号により取得されたビット割当てが飽和していないサブバンド内のi番目のスペクトル係数であり、size_sfmは、ビット割当てが飽和していないサブバンドsfm内のスペクトル係数の量、または、復号により取得された、サブバンドsfm内のスペクトル係数の量である。
【0068】
220で、グローバル雑音因子を、ビット割当てが飽和しているサブバンドのピーク対平均値比sharpに基づいて計算してもよい(式(1)に関する上述の説明を参照)。特に、ピーク対平均値比sharpの平均値を計算してもよく、当該平均値の逆数の倍数をグローバル雑音因子facとして用いる。
【0069】
230で、雑音充填利得を倍音パラメータとグローバル雑音因子に基づいて補正して、ターゲット利得gainを取得する。1例では、ターゲット利得gainを以下の式(7)に従って取得してもよい。
【0070】
【数6】
【0071】
facはグローバル雑音因子であり、harmは倍音パラメータであり、gainは雑音充填利得である。別の例では、倍音の強さまたは弱さを最初に決定し、次いでターゲット利得gainを異なる方式で当該倍音の強さまたは弱さに従って取得してもよい。例えば、当該倍音パラメータを第4の閾値と比較する。
【0072】
当該倍音パラメータが当該第4の閾値以上であるとき、ターゲット利得gainは以下の式(8)を用いて得られる。
gain=fac*gain*norm[sfm]/peak 式(8)
【0073】
当該倍音パラメータが当該第4の閾値より小さいとき、ターゲット利得gainは以下の式(9)を用いて得られる。
gain=fac’*gain、fac’=fac+step 式(9)
【0074】
facはグローバル雑音因子であり、norm[sfm]は、ビット割当てが飽和していないサブバンドsfmのエンベロープであり、peakは、ビット割当てが飽和していないサブバンドにおける、復号により取得されたスペクトル係数の最大振幅であり、stepは当該グローバル雑音因子が変化する間隔である。当該グローバル雑音因子は、間隔stepに従って低周波数から高周波数に増大し、間隔stepを、ビットが割り当てられた最大サブバンドまたは当該グローバル雑音因子に従って決定してもよい。当該第4の閾値を事前に設定してもよく、または、実際には異なる信号特徴に従って変更可能に設定してもよい。
【0075】
240で、ターゲット利得と重み付き雑音値を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数を復元する。1例では、当該ターゲット利得と当該重み付き雑音値を使用して充填雑音を取得してもよく、当該充填雑音を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施し、復号により取得されていない周波数領域信号を復元する。当該雑音が、ランダム雑音のような任意のタイプの雑音であってもよい。ここでは、最初に当該雑音をさらに使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数を充填してもよく、次いでターゲット利得を当該充填雑音に及ぼして、復号により取得されていないスペクトル係数を復元することに留意されたい。さらに、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施した(即ち、復号により取得されなかったスペクトル係数が復元された)後、復元されたスペクトル係数にフレーム間平滑化処理をさらに実施して、良好な復号効果を実現してもよい。
【0076】
図2の上述のステップで、幾つかのステップの実行順序を要件に従って調節してもよい。例えば、220を最初に実行し210を次に実行してもよく、または、210と220を同時に実行してもよい。
【0077】
さらに、ピーク対平均値比が大きい異常なサブバンドが、ビット割当てが飽和していないサブバンドに存在することがあり、当該異常なサブバンドに対して、当該異常なサブバンドのターゲット利得をさらに補正して、当該異常なサブバンドに対してより適切なターゲット利得を取得してもよい。特に、スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドのスペクトル係数のピーク対平均値比を計算してもよく、当該ピーク対平均値比を第3の閾値と比較する。ピーク対平均値比が当該第3の閾値より大きいサブバンドに対しては、ターゲット利得を240で取得した後、ビット割当てが飽和していないサブバンドのエンベロープとビット割当てが飽和していないサブバンドの最大信号振幅との比(norm[sfm]/peak)を使用して、ピーク対平均値比が当該第3の閾値より大きいサブバンドのターゲット利得を補正してもよい。当該第3の閾値を、要件に従って事前に設定してもよい。
【0078】
本発明の1実施形態で提供する信号を復号するための方法の流れは、復号により、受信したビット・ストリームからサブバンドのスペクトル係数を取得するステップと、当該スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するステップと、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施して、復号により取得されていないスペクトル係数を復元するステップと、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って周波数領域信号を取得するステップとを含む。
【0079】
本発明の別の実施形態では、スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するステップは、スペクトル係数ごとに割り当てられたビットの平均量を第1の閾値と比較するステップであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であるステップと、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値以上であるサブバンドをビット割当てが飽和しているサブバンドとして使用し、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値より小さいサブバンドをビット割当てが飽和していないサブバンドとして使用するステップとを含んでもよい。
【0080】
本発明の別の実施形態では、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施するステップは、スペクトル係数ごとに割り当てられたビットの平均量を0と比較するステップであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であるステップと、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの倍音パラメータを計算するステップであって、当該倍音パラメータは周波数領域信号の倍音の強さまたは弱さを表すステップと、当該倍音パラメータに基づいて、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップとを含んでもよい。
【0081】
本発明の別の実施形態では、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの倍音パラメータを計算するステップは、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの、ピーク対平均値比、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、フレーム全体のビット割当ての分散、平均値エンベロープ比、平均値対ピーク比、エンベロープ・ピーク比、およびエンベロープ平均値比のうち少なくとも1つのパラメータを計算するステップと、当該計算された少なくとも1つのパラメータのうち1つを使用するか、または、組合せ方式で、当該計算されたパラメータを当該倍音パラメータとして使用するステップとを含んでもよい。
【0082】
本発明の別の実施形態では、倍音パラメータに基づいて、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップは、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数に従って、ビット割当てが飽和していないサブバンドの雑音充填利得を計算するステップと、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドのピーク対平均値比を計算し、グローバル雑音因子を当該ピーク対平均値比に基づいて取得するステップと、当該倍音パラメータと当該グローバル雑音因子に基づいて当該雑音充填利得を補正してターゲット利得を取得するステップと、当該ターゲット利得と重み付き雑音値を用いて、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数を復元するステップとを含んでもよい。
【0083】
本発明の別の実施形態では、倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施するステップが、ビット割当てが飽和していないサブバンドのピーク対平均値比を計算し、当該ピーク対平均値比を第3の閾値と比較するステップと、ピーク対平均値比が当該第3の閾値より大きくビット割当てが飽和していないサブバンドに対して、ターゲット利得を取得した後、ビット割当てが飽和していないサブバンドにおいて、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数の最大振幅との比を使用して当該ターゲット利得を補正するステップとをさらに含んでもよい。
【0084】
本発明の別の実施形態では、倍音パラメータとグローバル雑音因子に基づいて雑音充填利得を補正してターゲット利得を取得するステップは、当該倍音パラメータを第4の閾値と比較するステップと、当該倍音パラメータが当該第4の閾値以上であるとき、gain=fac*gain*norm/peakを用いることで当該ターゲット利得を取得するステップと、当該倍音パラメータが当該第4の閾値より小さいとき、gain=fac’*gainおよびfac’=fac+stepを用いることで当該ターゲット利得を取得するステップとを含んでもよい。gainはターゲット利得であり、facはグローバル雑音因子であり、normはビット割当てが飽和していないサブバンドのエンベロープであり、peakは、ビット割当てが飽和していないサブバンドにおける、復号により取得されたスペクトル係数の最大振幅であり、stepは周波数に従ってグローバル雑音因子が変化する間隔である。
【0085】
本発明の別の実施形態では、倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施するステップが、復号により取得されなかったスペクトル係数を復元した後に、復元されたスペクトル係数にフレーム間平滑化処理を実施するステップをさらに含んでもよい。
【0086】
図3は、本発明の1実施形態に従う信号を復号するための装置300のブロック図である。図4は、本発明の1実施形態に従う、信号を復号するための装置の復元ユニット330のブロック図である。以下では、図3および図4を参照して、信号を復号するための装置を説明する。
【0087】
図3に示すように、信号を復号するための装置300は、復号により、受信したビット・ストリームからサブバンドのスペクトル係数を取得するように構成された復号ユニット310であって、復号ユニット330は特に、復号により当該スペクトル係数を受信したビット・ストリームから取得し、当該スペクトル係数を当該サブバンドに分類してもよい復号ユニット310と、当該スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するように構成された分類ユニット320であって、ビット割当てが飽和しているサブバンドとは、割り当てられたビットを当該サブバンド内の全てのスペクトル係数を符号化するために使用できるサブバンドのことをいい、ビット割当てが飽和していないサブバンドとは、割り当てられたビットを当該サブバンド内のスペクトル係数の一部のみを符号化するために使用できるサブバンド、および、ビットが割り当てられていないサブバンドのことをいう分類ユニット320と、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施して、復号により取得されていないスペクトル係数を復元するように構成された復元ユニット330と、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って周波数領域信号を取得するように構成された出力ユニット340とを備える。
【0088】
復号ユニット310が、様々な分類の信号のビット・ストリームを受信し、様々な復号方法を使用して復号を実施し、復号により取得されたスペクトル係数を取得してもよい。信号の分類および復号の方法は本発明に対する限定を構成しない。サブバンドをグループ化する1例では、復号ユニット310が、スペクトル係数が配置された周波数帯を均等に複数のサブバンドにグループ化してもよく、次いで、当該スペクトル係数が、各スペクトル係数の周波数に従って、当該周波数が配置されたサブバンドにグループ化される。
【0089】
分類ユニット320が、スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類してもよい。1例では、分類ユニット320は、サブバンド内のスペクトル係数ごとに割り当てられたビットの平均量に従って分類を実施してもよい。特に、分類ユニット320が、スペクトル係数ごとに割り当てられたビットの平均量を第1の閾値と比較するように構成された比較コンポーネントであって、スペクトル係数ごとに割り当てられたビットの平均量は、サブバンドごとに割り当てられたビットの量と各サブバンド内のスペクトル係数の量の比であり、即ち、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比である比較コンポーネントと、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値以上であるサブバンドをビット割当てが飽和しているサブバンドとして分類し、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値より小さいサブバンドをビット割当てが飽和していないサブバンドとして使用するように構成された分類コンポーネントとを備えてもよい。前述のように、サブバンド内のスペクトル係数ごとに割り当てられたビットの平均量を、当該サブバンド内のスペクトル係数の量により当該サブバンドに割り当てられたビットの量をグループ化することによって取得してもよい。当該第1の閾値を事前に設定してもよく、または、実験により容易に取得することができる。
【0090】
復元ユニット330が、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施して、復号により取得されていないスペクトル係数を復元してもよい。ビット割当てが飽和していないサブバンドに、ビットが割り当てられていないサブバンドと、ビットは割り当てられているがビット割当てが飽和していないサブバンドを含めてもよい。様々な雑音充填方法を使用して、復号により取得されていないスペクトル係数を復元してもよい。本発明の当該実施形態では、復元ユニット330が、ビット量が第2の閾値以上であるサブバンドの倍音パラメータharmに基づいて雑音充填を実施してもよい。特に、図4に示すように、復元ユニット330が、スペクトル係数ごとに割り当てられたビットの平均量を第1の閾値と比較し、スペクトル係数ごとに割り当てられたビットの平均量が当該第2の閾値以上であるサブバンドの当該倍音パラメータを計算するように構成された計算コンポーネント410であって、スペクトル係数ごとに割り当てられたビットの平均量は、サブバンドごとに割り当てられたビットの量と各サブバンド内のスペクトル係数の量との比である、即ち、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であり、当該倍音パラメータは周波数領域信号の倍音の強さまたは弱さを表す計算コンポーネント410と、当該倍音パラメータに基づいて、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施し、復号により取得されていないスペクトル係数を復元するように構成された充填コンポーネント420とを備えてもよい。前述のように、当該第2の閾値は当該第1の閾値以下である。したがって、当該第1の閾値を当該第2の閾値として使用してもよい。当該第1の閾値未満の別の閾値を当該第2の閾値として設定してもよい。周波数領域信号の倍音パラメータharmを使用して、当該周波数領域信号の倍音の強さまたは弱さを表す。倍音が強い場合は、復号により取得されたスペクトル係数において0の値を有するスペクトル係数の量が相対的に大きく、0の値を有するこれらのスペクトル係数に雑音充填を実施する必要はない。したがって、当該周波数領域信号の倍音パラメータに基づいて、復号により取得されていないスペクトル係数(即ち、0の値を有するスペクトル係数)に雑音充填を別々に実施する場合には、復号により取得された、0の値を有するスペクトル係数の一部に実施された雑音充填の誤りを回避でき、それにより信号の復号品質が高まる。
【0091】
前述のように、特に、計算コンポーネント410が、スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドの、ピーク対平均値比、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、フレーム全体のビット割当ての分散、平均値エンベロープ比、平均値対ピーク比、エンベロープ・ピーク比、およびエンベロープ平均値比のうち少なくとも1つのパラメータを計算するステップと、当該計算された少なくとも1つのパラメータのうち1つを使用するか、または、組合せ方式で、当該計算されたパラメータを倍音パラメータとして使用するステップとを用いることによって当該倍音パラメータを計算してもよい。倍音パラメータを計算するための具体的な方法については、式(1)乃至式(4)を参照した上述の説明を参照することができ、詳細についてはここでは繰返し説明することはしない。
【0092】
前述のように、計算コンポーネント410が倍音パラメータを取得した後、充填コンポーネント420は、当該倍音パラメータに基づいて、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数に雑音充填を実施する。その詳細を以下で説明する。
【0093】
出力ユニット340が、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って、周波数領域信号を取得してもよい。復号により取得されたスペクトル係数を復号により取得し、復号により取得されなかったスペクトル係数を復元ユニット330が復元した後、周波数帯全体におけるスペクトル係数を取得し、時間領域の出力信号を、例えば逆高速フーリエ変換(IFFT)といった変換のような処理を実施することで取得する。実際には、どのように時間領域の出力信号が周波数領域信号に従って得られるかに関する解決策は当業者には理解され、詳細についてはここでは繰返し説明することはしない。
【0094】
本発明の当該実施形態における信号を復号するための上述の装置では、分類ユニット320が、ビット割当てが飽和していないサブバンドを分類により周波数領域信号のサブバンドから取得し、復元ユニット330が、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数を復元し、それにより、信号の復号品質が高まる。さらに、復号により取得されなかったスペクトル係数が計算により計算コンポーネント410が取得した倍音パラメータに基づいて復元されるケースでは、復号により取得された、0の値を有するスペクトル係数に実施された雑音充填の誤りが回避され、それにより、さらに信号の復号品質が高まる。
【0095】
以下では、図4の充填コンポーネント420により実施される動作をさらに説明する。充填コンポーネント420が、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数に従って、ビット割当てが飽和していないサブバンドの雑音充填利得を計算し、スペクトル係数ごとに割り当てられたビットの平均量が第2の閾値以上であるサブバンドのピーク対平均値比を計算し、グローバル雑音因子を当該ピーク対平均値比に基づいて取得し、倍音パラメータと当該グローバル雑音因子に基づいて当該雑音充填利得を補正してターゲット利得を取得するように構成された利得計算モジュール421と、当該ターゲット利得と重み付き雑音値を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数を復元するように構成された充填モジュール422とを備えてもよい。別の実施形態では、充填コンポーネント420は、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施した後、復元されたスペクトル係数にフレーム間平滑化処理を実施して平滑化処理が実施されているスペクトル係数を取得するように構成されたフレーム間平滑化モジュール424を備える。当該出力ユニットは、復号により取得されたスペクトル係数と平滑化処理が実施されたスペクトル係数に従って周波数領域信号を取得するように構成される。フレーム間平滑化処理を用いることによって良好な復号効果を達成することができる。
【0096】
利得計算モジュール421が、上述の式(5)または(6)の何れかを使用して、ビット割当てが飽和していないサブバンドの雑音充填利得を計算し、ビット割当てが飽和しているサブバンドのピーク対平均値比sharpの平均値の逆数の倍数(上述の式1を用いた説明を参照)をグローバル雑音因子facとして使用し、倍音パラメータと当該グローバル雑音因子に基づいて雑音充填利得gainを補正してターゲット利得gainを取得してもよい。ターゲット利得gainを取得する1例では、利得計算モジュール421が、当該倍音パラメータを第4の閾値と比較するステップと、当該倍音パラメータが当該第4の閾値以上であるとき、上述の式(8)を用いることで当該ターゲット利得を取得するステップと、当該倍音パラメータが当該第4の閾値より小さいとき、上述の式(9)
を用いることで当該ターゲット利得を取得するステップとを実施してもよい。さらに、利得計算モジュール421が上述の式(7)を直接使用して当該ターゲット利得を取得してもよい。
【0097】
別の実施形態では、充填コンポーネント420は、ビット割当てが飽和していないサブバンドのピーク対平均値比を計算し、当該ピーク対平均値比を第3の閾値と比較し、ピーク対平均値比が当該第3の閾値より大きくビット割当てが飽和していないサブバンドに対して、ターゲット利得を取得した後、ビット割当てが飽和していないサブバンドにおいて、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数の最大振幅との比を用いて当該ターゲット利得を補正し、補正されたターゲット利得を取得するように構成された補正モジュール423をさらに備える。当該充填モジュールは、当該補正されたターゲット利得を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数を復元する。目的は、ビット割当てが飽和していないサブバンドにおいてピーク対平均値比が大きい異常なサブバンドを補正して、より適切なターゲット利得を得ることである。
【0098】
上述のように雑音充填を実施することに加えて、充填モジュール422はさらに最初に雑音を用いて、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数を充填し、充填された雑音に当該ターゲット利得を及ぼし、復号により取得されていないスペクトル係数を復元してもよい。
【0099】
図4の構造的分類は例示的なものにすぎず、実際には別の分類方式で柔軟に実装してもよいことに留意されたい。例えば、計算コンポーネント410を使用して利得計算モジュール421の動作を実装してもよい。
【0100】
図5は、本発明の別の実施形態に従う機器500のブロック図である。図5の機器500を、上述の方法の諸実施形態におけるステップと方法を実装するように構成してもよい。機器500を様々な通信システムにおける基地局または端末に適用してもよい。図5の実施形態では、機器500は、受信回路502、復号プロセッサ503、処理ユニット504、メモリ505、およびアンテナ501を備える。処理ユニット504は機器500の動作を制御し、処理ユニット504をCPU(Central Processing Unit、中央演算装置)と称してもよい。メモリ505が、読取専用メモリおよびランダム・アクセス・メモリを備えてもよく、命令とデータを処理ユニット504に提供してもよい。メモリ505の一部が不揮発性ランダム・アクセス・メモリ(NVRAM)をさらに備えてもよい。具体的な適用では、機器500を携帯電話のような無線通信装置に組み込んでもよくまたは機器500が当該無線通信装置であってもよく、機器500がさらに、機器500が遠隔位置からデータを受信できるようにするための受信回路501を扱うキャリアをさらに備えてもよい。受信回路501をアンテナ501に接続してもよい。機器500のコンポーネントはバスシステム506を用いて接続される。バスシステム506は、データバスに加えて電力バス、制御バス、状態信号バスをさらに含む。しかし、説明を明確にするため、様々なバスを、図5ではバスシステム「506」としてある。機器500が、信号を処理するように構成された処理ユニット504をさらに備えてもよく、さらに、復号プロセッサ503を備える。
【0101】
上述の本発明の諸実施形態で開示した方法を復号プロセッサ503に適用してもよく、または、復号プロセッサ503により実装してもよい。復号プロセッサ503が、信号処理機能を有する集積回路チップであってもよい。1実装プロセスでは、上述の方法の諸ステップを、復号プロセッサ503内のハードウェアの集積論理回路を用いて、または、ソフトウェアの形の命令を用いて実装してもよい。これらの命令を、処理ユニット504と協働して実装し制御してもよい。上述の復号プロセッサが、汎用目的プロセッサ、デジタル信号プロセッサ(DSP)、特殊用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲートアレイ(FPGA)または別のプログラム可能論理装置、離散ゲートもしくはトランジスタ論理装置、または離散ハードウェアコンポーネントであってもよい。上述の復号プロセッサが、本発明の諸実施形態で開示した方法、ステップ、および論理ブロック図を実装または実行してもよい。当該汎用目的プロセッサがマイクロプロセッサであってもよく、または、当該プロセッサが任意の従来型のプロセッサ、変換器等であってもよい。本発明の諸実施形態を参照して開示した方法の諸ステップを、ハードウェアとして具現化された復号プロセッサにより直接実行し実現してもよく、または、当該復号プロセッサ内のハードウェアおよびソフトウェア・モジュールの組合せにより実行し実現してもよい。当該ソフトウェア・モジュールを、ランダム・アクセス・メモリ、フラッシュ・メモリ、読取専用メモリ、プログラム可能読取専用メモリ、電気的消去可能プログラム可能メモリ、またはレジスタのような当業界の成熟した記憶媒体に配置してもよい。当該記憶媒体はメモリ505内に配置される。復号プロセッサ503は情報をメモリ505から読み出し、上述の方法の諸ステップをハードウェアと関連して完了する。
【0102】
例えば、図3における信号を復号するための装置300を復号プロセッサ503により実装してもよい。さらに、図3の分類ユニット320、復元ユニット330、および出力ユニット340を、処理ユニット504により実装してもよく、または、復号プロセッサ503により実装してもよい。しかし、上述の例は例示的なものにすぎず、本発明の諸実施形態をこの具体的な実装方式に限定しようとするものではない。
【0103】
特に、メモリ505は、プロセッサ504または復号プロセッサ503が、復号により、受信したビット・ストリームからサブバンドのスペクトル係数を取得するステップと、当該スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するステップであって、ビット割当てが飽和しているサブバンドとは、割り当てられたビットを当該サブバンド内の全てのスペクトル係数を符号化するために使用できるサブバンドのことをいい、ビット割当てが飽和していないサブバンドとは、割り当てられたビットを当該サブバンド内のスペクトル係数の一部のみを符号化するために使用できるサブバンド、および、ビットが割り当てられていないサブバンドのことをいうステップと、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施し、復号により取得されていないスペクトル係数を復元するステップと、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って周波数領域信号を取得するステップとを実行できるようにする命令を格納する。
【0104】
本発明の当該実施形態の上述の機器500では、ビット割当てが飽和していないサブバンドが周波数領域信号内のサブバンドから分類により取得され、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数が復元され、それにより信号の復号品質が高まる。
【0105】
本発明の1実施形態で提供する信号を復号するための装置は、復号により、受信したビット・ストリームからサブバンドのスペクトル係数を取得するように構成された復号ユニットと、当該スペクトル係数が配置されたサブバンドを、ビット割当てが飽和しているサブバンドとビット割当てが飽和していないサブバンドに分類するように構成された分類ユニットと、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施して、復号により取得されていないスペクトル係数を復元するように構成された復元ユニットと、復号により取得されたスペクトル係数と復元されたスペクトル係数に従って周波数領域信号を取得するように構成された出力ユニットとを備えてもよい。
【0106】
本発明の1実施形態では、当該分類ユニットは、スペクトル係数ごとに割り当てられたビットの平均量を第1の閾値と比較するように構成された比較コンポーネントであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比である比較コンポーネントと、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値以上であるサブバンドをビット割当てが飽和しているサブバンドとして分類し、スペクトル係数ごとに割り当てられたビットの平均量が当該第1の閾値より小さいサブバンドをビット割当てが飽和していないサブバンドとして分類するように構成された分類コンポーネントとを備えてもよい。
【0107】
本発明の1実施形態では、当該復元ユニットは、スペクトル係数ごとに割り当てられたビットの平均量を0と比較し、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの倍音パラメータを計算するように構成された計算コンポーネントであって、1つのサブバンドのスペクトル係数ごとに割り当てられたビットの平均量は、当該1つのサブバンドに割り当てられたビットの量と当該1つのサブバンド内のスペクトル係数の量との比であり、当該倍音パラメータは周波数領域信号の倍音の強さまたは弱さを表す計算コンポーネントと、当該倍音パラメータに基づいて、復号により取得されずビット割当てが飽和していないサブバンド内のスペクトル係数に雑音充填を実施して、復号により取得されていないスペクトル係数を復元するように構成された充填コンポーネントとを備えてもよい。
【0108】
本発明の1実施形態では、当該計算コンポーネントが、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドの、ピーク対平均値比、ピーク・エンベロープ比、復号により取得されたスペクトル係数の疎性、フレーム全体のビット割当ての分散、平均値エンベロープ比、平均値対ピーク比、エンベロープ・ピーク比、およびエンベロープ平均値比のうち少なくとも1つのパラメータを計算するステップと、当該計算された少なくとも1つのパラメータのうち1つを使用するか、または、組合せ方式で、当該計算されたパラメータを倍音パラメータとして使用するステップとを用いることによって当該倍音パラメータを計算してもよい。
【0109】
本発明の1実施形態では、当該充填コンポーネントが、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数に従って、ビット割当てが飽和していないサブバンドの雑音充填利得を計算し、スペクトル係数ごとに割り当てられたビットの平均量が0に等しくないサブバンドのピーク対平均値比を計算し、グローバル雑音因子を当該ピーク対平均値比に基づいて取得し、倍音パラメータと当該グローバル雑音因子に基づいて当該雑音充填利得を補正してターゲット利得を取得するように構成された利得計算モジュールと、当該ターゲット利得と重み付き雑音値を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内にあるスペクトル係数を復元するように構成された充填モジュールとを備えてもよい。
【0110】
本発明の1実施形態では、当該充填コンポーネントが、ビット割当てが飽和していないサブバンドのピーク対平均値比を計算し、当該ピーク対平均値比を第3の閾値と比較し、ピーク対平均値比が当該第3の閾値より大きくビット割当てが飽和していないサブバンドに対して、ターゲット利得を取得した後、ビット割当てが飽和していないサブバンドにおいて、ビット割当てが飽和していないサブバンドのエンベロープと復号により取得されたスペクトル係数の最大振幅との比を用いて当該ターゲット利得を補正し、補正されたターゲット利得を取得するように構成された補正モジュールであって、当該充填モジュールは、当該補正されたターゲット利得と当該重み付き雑音値を使用して、復号により取得されておらずビット割当てが飽和していないサブバンド内のスペクトル係数を復元する、補正モジュールをさらに備えてもよい。
【0111】
本発明の1実施形態では、当該利得計算モジュールが、倍音パラメータを第4の閾値と比較するステップと、当該倍音パラメータが当該第4の閾値以上であるとき、gain=fac*gain*norm/peakを用いることで当該ターゲット利得を取得するステップと、当該倍音パラメータが当該第4の閾値より小さいとき、gain=fac’*gainおよびfac’=fac+stepを用いることで当該ターゲット利得を取得するステップとを用いることによって、倍音パラメータとグローバル雑音因子に基づいて当該雑音充填利得を補正してもよい。gainはターゲット利得であり、facはグローバル雑音因子であり、normは、ビット割当てが飽和していないサブバンドのエンベロープであり、peakは、ビット割当てが飽和していないサブバンドにおける、復号により取得されたスペクトル係数の最大振幅であり、stepは周波数に従ってグローバル雑音因子が変化する間隔である。
【0112】
本発明の1実施形態では、当該充填コンポーネントが、復号により取得されなかったスペクトル係数を復元した後に、復元されたスペクトル係数にフレーム間平滑化処理を実施して平滑化処理が実施されているスペクトル係数を取得するように構成されたフレーム間平滑化モジュールであって、当該出力ユニットは、復号により取得されたスペクトル係数と平滑化処理が実施されたスペクトル係数に従って周波数領域信号を取得するように構成されたフレーム間平滑化モジュールをさらに備えてもよい。
【0113】
本明細書で開示した諸実施形態で説明した例と組み合わせて、ユニットおよびアルゴリズムのステップを電子ハードウェアまたはコンピュータ・ソフトウェアと電子ハードウェアの組合せにより実装してもよいことは当業者には理解される。機能をハードウェアで実施するかまたはソフトウェアで実施するかは技術的解決策の具体的な適用事例と設計制約条件に依存する。当業者は、説明した機能を特定の適用事例ごとに様々な方法を用いて実装してもよいが、当該実装が本発明の範囲を越えるとは考えるべきではない。
【0114】
説明の便宜および簡単さのため、上述の装置、ユニット、部分、およびモジュールの詳細な動作プロセスについては、上述の方法の諸実施形態における対応するプロセスを参照できることは当業者には明確に理解される。詳細についてはここでは繰返し説明することはしない。
【0115】
本願で提供する幾つかの諸実施形態では、開示したシステム、機器、および方法を他の方式で実装してもよいことは理解される。例えば、説明した機器の実施形態は例示的なものにすぎない。例えば、当該ユニット分割は論理的な機能分割にすぎず、実際の実装では他の分割であってもよい。例えば、複数のユニットまたはコンポーネントを組み合わせるかもしくは別のシステムに統合してもよく、または、幾つかの機能を無視するかもしくは実施しなくともよい。
【0116】
さらに、本発明の諸実施形態における機能ユニットを1つの処理ユニットに統合してもよく、または、当該ユニットの各々が物理的に単体で存在してもよく、または、2つ以上のユニットが1つのユニットに統合される。
【0117】
機能をソフトウェア機能ユニットの形で実装し独立な製品として販売または使用するとき、当該機能をコンピュータ可読記憶媒体に格納してもよい。かかる理解に基づき、本発明の技術的解決策を本質的に、または、先行技術に寄与する部分、または、当該技術的解決策の一部をソフトウェア製品の形で実装してもよい。当該ソフトウェア製品は記憶媒体に格納され、本発明の諸実施形態で説明した方法のステップの全部または一部を実施するようにコンピュータ装置(パーソナル・コンピュータ、サーバ、またはネットワーク装置であってもよい)に指示するための幾つかの命令を含む。上述の記憶媒体には、USBフラッシュ・ドライブ、取外し可能ハードディスク、読取専用メモリ(ROM、Read Only Memory)、ランダム・アクセス・メモリ(RAM、Random Access Memory)、磁気ディスク、または光ディスクのような、プログラム・コードを格納できる任意の媒体が含まれる。
【0118】
上述の説明は本発明の具体的な実装方式にすぎず、本発明の保護範囲を限定しようとするものではない。本発明で開示した技術的範囲において当業者が容易に想到する任意の変形または置換は全て本発明の保護範囲に入るものとする。したがって、本発明の保護範囲は特許請求の範囲の保護範囲により支配される。
【符号の説明】
【0119】
300 装置
310 復号化ユニット
320 分類ユニット
330 復元ユニット
340 出力ユニット
410 計算コンポーネント
420 充填コンポーネント
421 利得計算モジュール
422 充填モジュール
423 補正モジュール
424 フレーム間平滑化モジュール
501 アンテナ
502 受信回路
503 復号化プロセッサ
504 処理ユニット
505 メモリ
図1
図2
図3
図4
図5