特許第6332707号(P6332707)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオの特許一覧

<>
  • 特許6332707-符号化装置および符号化方法 図000007
  • 特許6332707-符号化装置および符号化方法 図000008
  • 特許6332707-符号化装置および符号化方法 図000009
  • 特許6332707-符号化装置および符号化方法 図000010
  • 特許6332707-符号化装置および符号化方法 図000011
  • 特許6332707-符号化装置および符号化方法 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6332707
(24)【登録日】2018年5月11日
(45)【発行日】2018年5月30日
(54)【発明の名称】符号化装置および符号化方法
(51)【国際特許分類】
   G10L 19/02 20130101AFI20180521BHJP
【FI】
   G10L19/02 160A
   G10L19/02 150
【請求項の数】14
【全頁数】17
(21)【出願番号】特願2016-242683(P2016-242683)
(22)【出願日】2016年12月14日
(62)【分割の表示】特願2013-540628(P2013-540628)の分割
【原出願日】2012年10月12日
(65)【公開番号】特開2017-49620(P2017-49620A)
(43)【公開日】2017年3月9日
【審査請求日】2016年12月14日
(31)【優先権主張番号】特願2011-237818(P2011-237818)
(32)【優先日】2011年10月28日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】591037214
【氏名又は名称】フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
(74)【代理人】
【識別番号】100079577
【弁理士】
【氏名又は名称】岡田 全啓
(74)【代理人】
【識別番号】100167966
【弁理士】
【氏名又は名称】扇谷 一
(72)【発明者】
【氏名】河嶋 拓也
(72)【発明者】
【氏名】押切 正浩
【審査官】 冨澤 直樹
(56)【参考文献】
【文献】 特開2006−163396(JP,A)
【文献】 特表2009−515212(JP,A)
【文献】 国際公開第2011/000408(WO,A1)
【文献】 国際公開第2012/016110(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
(57)【特許請求の範囲】
【請求項1】
入力信号を時間領域から周波数領域に変換して得られた入力信号変換係数の内、第1周波数帯域の第1変換係数を符号化する第1符号化部と、
第2周波数帯域を周波数領域で分割した前記第2周波数帯域の複数のサブバンドについて、各サブバンドに含まれる第2変換係数の統計量に基づいて閾値を算出する閾値算出部と、
前記各サブバンドに含まれる第2変換係数の振幅と前記閾値とを比較し、前記振幅が前記閾値以上となる第2変換係数を代表変換係数として抽出する代表変換係数抽出部と、
前記各サブバンドの前記代表変換係数と符号化および正規化された第1変換係数との間の相関値を算出し、前記各サブバンドに対して、最も相関値の高い第1変換係数のバンドをベストバンドとして選択するマッチング部と、
選択された前記ベストバンドを示す情報を用いて前記第2周波数帯域の変換係数を符号化する第2符号化部と、
を具備し、
前記閾値算出部は、前記代表変換係数抽出部において抽出された前記代表変換係数の数が規定数に達しない場合、前記規定数に対する前記代表変換係数の不足数に応じて前記閾値を修正し、
前記代表変換係数抽出部は、前記修正された閾値を用いて再び第2変換係数を抽出する処理を行う、
符号化装置。
【請求項2】
前記閾値算出部は、前記規定数に対する前記代表変換係数の不足数が大きいほど、前記閾値を大きく下げる修正を行う、
請求項1に記載の符号化装置。
【請求項3】
前記閾値算出部は、
前記代表変換係数抽出部において、前記閾値の初期値は、前記規定数の代表変換係数が抽出されると予測される統計値に対応する閾値よりも高い値に前記閾値を設定する、
請求項1に記載の符号化装置。
【請求項4】
前記閾値算出部は、前記閾値の修正を一定回数に制限し、
前記代表変換係数抽出部は、前記閾値の修正が前記一定回数に達した場合に前記第2変換係数を抽出する処理を中止する、
請求項1に記載の符号化装置。
【請求項5】
前記閾値の修正は、閾値に抑圧係数を乗じることによって行われ、前記抑圧係数と前記不足数とが負の線形関係を有する、
請求項1に記載の符号化装置。
【請求項6】
前記マッチング部は、選択した前記ベストバンドを示す情報をラグ情報として出力し、
前記第2符号化部は、前記ラグ情報を用いて前記第2周波数帯域の第2変換係数を符号化する、
請求項1に記載の符号化装置。
【請求項7】
前記第2周波数帯域は、所定の周波数よりも高い周波数帯域である、
請求項1に記載の符号化装置。
【請求項8】
入力信号を時間領域から周波数領域に変換して得られた入力信号変換係数の内、第1周波数帯域の第1変換係数を符号化し、
第2周波数帯域を周波数領域で分割した第2周波数帯域の複数のサブバンドについて、各サブバンドに含まれる第2変換係数の統計量に基づいて閾値を算出し、
前記各サブバンドに含まれる第2変換係数の振幅と前記閾値とを比較し、前記振幅が前記閾値以上となる第2変換係数を代表変換係数として抽出し、
抽出された前記代表変換係数の数が規定数に達しない場合、前記規定数に対する前記代表変換係数の不足数に応じて前記閾値を修正し、前記修正された閾値を用いて再び第2変換係数を抽出する処理を行い、
前記各サブバンドと、前記代表変換係数と符号化および正規化された第1変換係数との間の相関値を算出し、前記各サブバンドに対して、最も相関値の高い第1変換係数のバンドをベストバンドとして選択し、
選択した前記ベストバンドを示す情報を用いて前記第2周波数帯域の変換係数を符号化する、
符号化方法。
【請求項9】
前記規定数に対する前記代表変換係数の不足数が大きいほど、前記閾値を大きく下げる修正を行う、
請求項8に記載の符号化方法。
【請求項10】
前記閾値の初期値は、前記規定数の代表変換係数が抽出されると予測される統計値に対応する閾値よりも高い値に前記閾値を設定する、
請求項8に記載の符号化方法。
【請求項11】
前記閾値の修正を一定回数に制限し、
前記閾値の修正が前記一定回数に達した場合に前記第2変換係数を抽出する処理を中止する、
請求項8に記載の符号化方法。
【請求項12】
前記閾値の修正は、閾値に抑圧係数を乗じることによって行われ、前記抑圧係数と前記不足数とが負の線形関係を有する、
請求項8に記載の符号化方法。
【請求項13】
選択した前記ベストバンドを示す情報をラグ情報として出力し、
前記ラグ情報を用いて前記第2周波数帯域の第2変換係数を符号化する、
請求項8に記載の符号化方法。
【請求項14】
前記第2周波数帯域は、所定の周波数よりも高い周波数帯域である、
請求項8に記載の符号化方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、符号化装置および符号化方法に関する。
【背景技術】
【0002】
超広帯域(Super-Wide-Band(SWB),0.05-14kHz帯域が一般的)の、音声データ等の音に関するデータを効率的に符号化することができる方式として、ITU-Tで規格化された非特許文献1や非特許文献2に開示されている方式が知られている。これらの方式は、7kHz以下の帯域(以下、「低域」という)をコア符号化部で符号化し、7kHz以上の帯域(以下、「拡張帯域」という)を拡張符号化部で符号化している。
【0003】
コア符号化部の符号化処理には、CELP(Code Excited Linear Prediction:符号励振線形予測)が用いられる。拡張符号化部は、コア符号化部で符号化された低域信号を復号し、MDCT(Modified Discrete Cosine Transform:修正離散コサイン変換)にて周波数領域に変換したうえで、そのスペクトル(または変換係数、以下、「変換係数」という)を拡張帯域の符号化に利用する。
【0004】
まず、拡張符号化部は、コア符号化部で生成されたコア符号化低域変換係数を、スペクトルパワーの包絡(またはエンベロープ、以下、「エンベロープ」という)を用いて正規化する。具体的には、拡張符号化部は、サブバンド毎にエネルギーを算出し、周波数軸方向にエネルギーの変動を滑らかにするためサブバンドエネルギーの平滑化を行い、平滑化したエネルギーで各サブバンドに含まれる変換係数の正規化を行う。以下、このように得られた正規化変換係数を「正規化低域変換係数」と呼ぶ。
【0005】
拡張符号化部は、正規化低域変換係数と、入力信号の拡張帯域の変換係数(以下、「拡張帯域変換係数」という)との相関値が高いサブバンドを探索し、そのサブバンドを示す情報をラグ情報として符号化する。拡張符号化部は、相関値の高かったサブバンドの正規化低域変換係数を拡張帯域のスペクトル微細構造として用いるために拡張帯域にコピーする。その後、拡張符号化部は、拡張帯域変換係数のエネルギーを調整するためのゲインを算出し、符号化する。従来の符号化装置では、以上のような処理を行うことにより、低域の変換係数を用いて拡張帯域の変換係数を生成している。
【0006】
ここで、非特許文献1および非特許文献2では、正規化低域変換係数と拡張帯域変換係数との相関値を以下の方法で算出している。
【0007】
まず、拡張帯域を複数のサブバンド(以下、「拡張帯域サブバンド」という)に分割する。次に、拡張帯域サブバンド毎に、正規化低域変換係数と当該拡張帯域サブバンドに含まれる変換係数との相関値を算出する。次に、拡張帯域サブバンドとの相関値が最も高い正規化低域変換係数の位置を探索する。ただし、この方法では、正規化低域変換係数と、拡張帯域サブバンド内の全変換係数とを用いて相関値を算出するので、演算量が多くなるという課題がある。
【0008】
この課題を解決するため、特許文献1では、拡張帯域変換係数のうち、振幅が大きい上位の変換係数のみを用いて相関値を算出する技術を開示している。このように、相関値算出時に用いる変換係数を限定することにより、相関値算出時の演算量を削減することができる。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】国際公開第2011/000408号
【非特許文献】
【0010】
【非特許文献1】ITU-T Standard G.718 AnnexB,2008年
【非特許文献2】ITU-T Standard G.729.1 AnnexE,2008年
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかしながら、特許文献1の方法では、変換係数の抽出に多くの演算量が必要となるため、変換係数の限定による演算量の削減効果が薄れる。例えば、拡張帯域サブバンドはM個の変換係数で構成されており、そのうち振幅の大きい上位N個を抽出する処理の場合には、M×N回の分岐処理が最低限必要となり、演算量が大きくなってしまう。
【0012】
また、特許文献1では、振幅の大きい変換係数を抽出する他の方法として、拡張帯域変換係数の平均値と標準偏差を算出し、これらパラメータに基づき閾値を設定し、閾値を越えた変換係数を抽出する方法を例示している。
【0013】
しかしながら、音声や音楽では高域の特徴が多様であるため、高音質を得るためにはサブバンドの幅を狭く設定せざるを得ない。これにより、拡張帯域サブバンドに含まれる変換係数の数は自ずと少なくなり、統計的に安定した閾値を設定するのは難しくなる。そのため、意図した変換係数の数を抽出できる閾値を求めるのは困難である。例えば、閾値が高すぎると、抽出される変換係数の数は少なくなるため、算出される相関値の精度が落ち、適切な位置を特定することができなくなってしまう。一方、閾値が低すぎると、抽出する変換係数の数が多くなるため、相関値算出時の演算量をあまり削減できなくなる。さらに、抽出ループの途中で規定数Nに達してしまい、残りの部分にある大きな振幅の変換係数を抽出できないおそれがある。
【0014】
本発明の目的は、適切な数の変換係数を抽出するための、変換係数抽出時の演算量を大きく削減することができる符号化装置および符号化方法を提供することである。
【課題を解決するための手段】
【0015】
本発明の主たる一態様は、入力信号を時間領域から周波数領域に変換して得られた入力信号変換係数の内、第1周波数帯域の第1変換係数を符号化する第1符号化部と、第2周波数帯域を周波数領域で分割した前記第2周波数帯域の複数のサブバンドについて、各サブバンドに含まれる第2変換係数の統計量に基づいて閾値を算出する閾値算出部と、前記各サブバンドに含まれる第2変換係数の振幅と前記閾値とを比較し、前記振幅が前記閾値以上となる第2変換係数を代表変換係数として抽出する代表変換係数抽出部と、前記各サブバンドの前記代表変換係数と符号化および正規化された第1変換係数との間の相関値を算出し、前記各サブバンドに対して、最も相関値の高い第1変換係数のバンドをベストバンドとして選択するマッチング部と、選択された前記ベストバンドを示す情報を用いて前記第2周波数帯域の変換係数を符号化する第2符号化部と、を具備し、前記閾値算出部は、前記代表変換係数抽出部において抽出された前記代表変換係数の数が規定数に達しない場合、前記規定数に対する前記代表変換係数の不足数に応じて前記閾値を修正し、前記代表変換係数抽出部は、前記修正された閾値を用いて再び第2変換係数を抽出する処理を行う、符号化装置である。
【0016】
本発明の一態様に係る符号化装置は、入力信号を時間領域から周波数領域に変換して得られた入力信号変換係数の内、基準周波数よりも低い帯域の変換係数を符号化するコア符号化部と、前記コア符号化部が符号化したデータを復号して得られるコア符号化低域変換係数を用いて前記基準周波数よりも高い帯域である拡張帯域の変換係数を符号化する拡張帯域符号化部と、を具備する符号化装置であって、前記拡張帯域符号化部は、前記拡張帯域を分割した拡張帯域サブバンド毎に、サブバンドに含まれる変換係数の統計量に基づいて閾値を算出する閾値算出部と、前記拡張帯域サブバンド毎に、前記変換係数の振幅と前記閾値とを比較し、前記振幅が前記閾値以上となる変換係数を代表変換係数として抽出する代表変換係数抽出部と、前記拡張帯域サブバンド毎に、前記代表変換係数と正規化された前記コア符号化低域変換係数との相関値を算出し、最も相関値の高いサブバンドを選択するマッチング部と、を具備し、前記閾値算出部は、前記代表変換係数抽出部において抽出された前記代表変換係数の数が規定数に達しない場合、前記規定数に対する前記代表変換係数の不足数に応じて前記閾値を修正し、前記代表変換係数抽出部は、前記修正された閾値を用いて再び変換係数を抽出する処理を行う、構成を採る。
【0017】
本発明の一態様に係る符号化方法は、入力信号を時間領域から周波数領域に変換して得られた入力信号変換係数の内、基準周波数よりも低い帯域の変換係数を符号化するコア符号化ステップと、前記コア符号化ステップで符号化したデータを復号して得られるコア符号化低域変換係数を用いて前記基準周波数よりも高い帯域である拡張帯域の変換係数を符号化する拡張帯域符号化ステップと、を具備する符号化方法であって、前記拡張帯域符号化ステップは、前記拡張帯域を分割した拡張帯域サブバンド毎に、サブバンドに含まれる変換係数の統計量に基づいて閾値を算出するステップと、前記拡張帯域サブバンド毎に、前記変換係数の振幅と前記閾値とを比較し、前記振幅が前記閾値以上となる変換係数を代表変換係数として抽出するステップと、前記抽出された代表変換係数の数が規定数に達しない場合、前記規定数に対する前記代表変換係数の不足数に応じて前記閾値を修正するステップと、前記修正された閾値を用いて再び変換係数を抽出する処理を行うステップと、前記抽出された代表変換係数が規定数に達した場合、前記拡張帯域サブバンド毎に、前記代表変換係数と正規化された前記コア符号化低域変換係数との相関値を算出し、最も相関値の高いサブバンドを選択するステップと、を有する。
【発明の効果】
【0018】
本発明によれば、規定数Nの変換係数を抽出するために必要なループ回数を削減することができるので、変換係数抽出時の演算量を大きく削減することができる。
【図面の簡単な説明】
【0019】
図1】本発明の実施の形態における符号化装置の構成を示すブロック図
図2】本発明の実施の形態に係る拡張帯域符号化部の構成を示すブロック図
図3】従来例による変換係数の抽出処理の動作を説明する図
図4】本発明の実施の形態における変換係数の抽出処理の動作を説明する図
図5】本発明の実施の形態における復号装置の構成を示すブロック図
図6】本発明の実施の形態に係る拡張帯域復号部の構成を示すブロック図
【発明を実施するための形態】
【0020】
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
【0021】
本実施の形態に係る符号化装置は、拡張帯域の変換係数から、振幅の大きいN個の変換係数を抽出する際に、最初は抽出される変換係数の数がN個に達しないように高めの閾値を統計的に算出し、算出した閾値を使って振幅の大きい変換係数を抽出する。次に、符号化装置は、不足する変換係数の数に応じて閾値を下げ、新たに算出した閾値を使って振幅の大きい変換係数を抽出する。そして、符号化装置は、閾値の算出と変換係数の抽出を、N個の変換係数を抽出するまで繰り返す。これにより、N個の変換係数を抽出するのに必要なループ回数を削減することができるため、変換係数抽出時の演算量を大きく削減することができる。また、不足する変換係数の数に応じて閾値の下げ幅を決定することにより、統計処理だけでは大きくばらついてしまう変換係数の数を安定化させることができ、符号化品質を損なわずに符号化することができる。
【0022】
以下、本実施の形態に係る符号化装置の各構成について説明する。図1は、本実施の形態に係る符号化装置の構成を示すブロック図である。
【0023】
図1に示すように、符号化装置10は、時間周波数変換部1と、コア符号化部2と、拡張帯域符号化部3と、多重化部4と、から主に構成されている。
【0024】
時間周波数変換部1は、入力した入力信号を時間領域から周波数領域に変換し、得られた入力信号変換係数をコア符号化部2および拡張帯域符号化部3に出力する。なお、本実施の形態ではMDCT変換を用いる場合について説明するが、本発明はこれに限られず、時間領域から周波数領域へ変換するFFT(Fast Fourier Transform)やDCT(Discrete Cosine Transform)等の直交変換を用いても良い。
【0025】
コア符号化部2は、入力信号変換係数の内、低域(基準周波数(例えば、7kHz)よりも低い帯域)の変換係数を変換符号化により符号化し、その符号化データをコア符号化データとして多重化部4へ出力する。また、コア符号化部2は、コア符号化データを復号して得られるコア符号化低域変換係数を拡張帯域符号化部3へ出力する。
【0026】
拡張帯域符号化部3は、コア符号化低域変換係数を用いて、入力信号変換係数の内、拡張帯域(基準周波数よりも高い帯域)の変換係数(以下、「拡張帯域変換係数」という)に対して符号化処理を行い、得られた拡張帯域符号化データを多重化部4に出力する。なお、拡張帯域符号化部3の内部構成の詳細は後述する。
【0027】
多重化部4は、コア符号化データと拡張帯域符号化データとを多重化した符号化データを出力する。
【0028】
以上の構成により、符号化装置10は、入力信号を符号化し、符号化データを出力する。
【0029】
次に、拡張帯域符号化部3の内部構成について説明する。図2に示すように、拡張帯域符号化部3は、正規化部30と、拡張帯域分析部31と、閾値算出部32と、代表変換係数抽出部33と、マッチング部34と、拡張帯域生成・符号化部35と、から主に構成されている。
【0030】
正規化部30は、コア符号化低域変換係数を正規化し、得られた正規化低域変換係数をマッチング部34および拡張帯域生成・符号化部35に出力する。一般的には、正規化部30は、コア符号化低域変換係数のエンベロープを算出し、エンベロープで除算することにより正規化低域変換係数を得る。なお、例えば、コア符号化低域変換係数をサブバンドに分割し、サブバンドエネルギーを算出し、サブバンドの各変換係数をサブバンドエネルギーで除算することによっても、正規化低域変換係数を得ることができる。
【0031】
一般に、変換係数の低域部はエネルギーの偏りが非常に大きく、変換係数の高域部はエネルギーの偏りが小さい。そのため、コア符号化低域変換係数のエネルギーの偏りを平坦化する正規化処理を行ってから、拡張帯域変換係数との相関値を算出するほうが高効率に符号化することができる。
【0032】
拡張帯域分析部31は、拡張帯域変換係数について分析を行い、分析して得られた統計量を拡張帯域統計パラメータとして閾値算出部32に出力する。拡張帯域変換係数を正規分布と仮定する場合、拡張帯域分析部31は、統計パラメータとして、振幅の絶対値である絶対値振幅の平均値(以下、「絶対値平均」という)および標準偏差値を算出する。なお、拡張帯域分析部31の動作の詳細は後述する。
【0033】
閾値算出部32は、拡張帯域統計パラメータに基づいて変換係数抽出閾値を算出し、代表変換係数抽出部33に出力する。また、閾値算出部32は、変換係数不足数に応じて変換係数抽出閾値を修正し、修正後の変換係数抽出閾値を代表変換係数抽出部33に出力する。なお、閾値算出部32の動作の詳細は後述する。
【0034】
代表変換係数抽出部33は、拡張帯域サブバンド単位で、振幅が変換係数抽出閾値以上となる拡張帯域変換係数を抽出し、代表変換係数としてマッチング部34に出力する。また、代表変換係数抽出部33は、代表変換係数の個数が規定数のN個に達しない場合、変換係数不足数を閾値算出部32に出力する。なお、代表変換係数抽出部33の動作の詳細は後述する。
【0035】
マッチング部34は、拡張帯域サブバンド毎に、代表変換係数と正規化低域変換係数との相関値を算出し、最も相関値の高いサブバンドを選択し、選択したサブバンドを示す情報をラグ情報として拡張帯域生成・符号化部35に出力する。
【0036】
拡張帯域生成・符号化部35は、拡張帯域変換係数、ラグ情報および正規化低域変換係数を用いて拡張帯域符号化データを生成し、出力する。具体的には、拡張帯域生成・符号化部35は、ラグ情報が示すサブバンドの正規化低域変換係数を、拡張帯域にコピーし、拡張帯域の周波数微細構造として利用する。拡張帯域生成・符号化部35は、このときに使用したラグ情報を符号化し、拡張帯域符号化データの一部とする。また、拡張帯域生成・符号化部35は、正規化低域変換係数からコピーして得られた拡張帯域変換係数と、入力信号変換係数の内の拡張帯域の変換係数である拡張帯域変換係数との振幅比(エネルギー比の平方根)であるゲインを算出し、ゲインも符号化し、拡張帯域符号化データの一部とする。拡張帯域生成・符号化部35は、算出したゲインを正規化低域変換係数からコピーして得られた拡張帯域変換係数に乗じることにより拡張帯域変換係数を得る。
【0037】
次に、拡張帯域分析部31、閾値算出部32および代表変換係数抽出部33の動作について詳細に説明する。なお、本実施の形態では、拡張帯域変換係数が正規分布に従うと仮定し、段階的に変換係数抽出閾値(以下、適宜、単に「閾値」という)を設定する方法について説明する。
【0038】
拡張帯域分析部31は、拡張帯域変換係数が正規分布に従うと仮定した場合には、拡張帯域サブバンド毎に、変換係数の振幅の絶対値平均と標準偏差を拡張帯域統計パラメータとして出力する。
【0039】
拡張帯域分析部31は、絶対値平均を次式(1)により算出する。ここで、jはサブバンドの番号であり、各拡張帯域サブバンドに含まれる変換係数の総数をM個とし、i(i=1〜M)は各サブバンドに含まれる変換係数の番号である。また、Fhavg(j)はサブバンドjに含まれる変換係数の絶対値平均、Fhは拡張帯域変換係数の振幅を表す。つまり、Fh(j,i)は、サブバンドjに含まれるi番目の拡張帯域変換係数の振幅を表す。なお、説明を簡単にするため、拡張帯域変換係数のサブバンドに含まれる変換係数の数を全てMとする。
【数1】
【0040】
次に、拡張帯域分析部31は、各サブバンドの標準偏差を求める。標準偏差は次式(2)により算出する。ここで、σ(j)はサブバンドjの標準偏差を表すものとする。
【数2】
【0041】
拡張帯域分析部31は、求めた絶対値平均と標準偏差を、拡張帯域統計パラメータとして閾値算出部32に出力する。
【0042】
閾値算出部32において、最初の閾値を算出する場合と、閾値を下げる場合とで閾値の算出方法が異なる。ここでは、最初の閾値を算出する場合について説明する。
【0043】
閾値算出部32は、最初の閾値を、拡張帯域統計パラメータにより決定する。閾値算出部32は、拡張帯域変換係数が正規分布すると仮定した場合には、以下の式(3)で閾値を算出する。ここで、Fhthr(j)はサブバンドjにおける閾値、βは閾値を制御する定数とする。βは、例えば、振幅の大きい上位10%の拡張帯域変換係数を選ぶようにしたいときはβを約1.6に、上位5%の拡張帯域変換係数を選ぶようにしたいときはβを約2.0に設定する。なお、βの設定値は、正規分布表より求めることができる。ただし、閾値が低くなりすぎて規定数以上の拡張帯域変換係数が抽出されることを防ぐため、閾値算出部32は、最初の閾値が高めとなるようにβの値を大きめに選ぶ。例えば、M個の拡張帯域変換係数の中からN個の拡張帯域変換係数を抽出したい場合には、実際の抽出処理によりN個を超える拡張帯域変換係数が抽出されないと見込める程度のβ、つまりN個よりは少ないP個の拡張帯域変換係数を抽出するようなβを定める。
【数3】
【0044】
なお、閾値を下げる場合の閾値算出部32の動作については後述する。
【0045】
代表変換係数抽出部33は、拡張帯域サブバンド毎に、閾値算出部32により設定された閾値と拡張帯域変換係数の振幅を比較し、振幅が閾値以上となる拡張帯域変換係数を抽出する。代表変換係数抽出部33は、抽出した拡張帯域変換係数を代表変換係数として記憶すると同時に、規定数に不足する代表変換係数の数を変換係数不足数として閾値算出部32に出力する。
【0046】
代表変換係数が規定数に達した場合、代表変換係数抽出部33は、規定数に達した時点で抽出処理を中断し、抽出した代表変換係数をマッチング部34へ出力する。一方、抽出した代表変換係数が規定数に達していない場合、代表変換係数抽出部33は、抽出した拡張帯域変換係数を代表変換係数として記憶する。このとき、代表変換係数抽出部33は、サブバンドに含まれる全ての拡張帯域変換係数を、既に抽出した代表変換係数の振幅を零(ゼロ)とした上で、抽出候補変換係数群として記憶する。このようにすることで、既に抽出した拡張帯域変換係数が次の抽出処理において再び抽出されることを防ぐことができる。
【0047】
代表変換係数抽出部33は、抽出した代表変換係数が規定数に達しなかった場合には、追加で変換係数の抽出を行う。この場合には、代表変換係数抽出部33は、サブバンドに含まれる全ての拡張帯域変換係数に対してではなく、抽出候補変換係数群に対して抽出処理を行う。このとき抽出した拡張帯域変換係数は、記憶している代表変換係数に追加され、追加された代表変換係数の数だけ変換係数不足数は減ぜられる。
【0048】
このような段階的な処理により、代表変換係数を追加で抽出する際に、代表変換係数の数が規定数に達した時点で抽出処理を中止した場合に、当該抽出処理において探索外となった帯域に追加で抽出した拡張帯域変換係数よりも大きな振幅の拡張帯域変換係数が存在する可能性がある。しかし、探索外となった帯域の拡張帯域変換係数よりも振幅が大きい拡張帯域変換係数を初期段階(つまり、追加で変換係数の抽出を行う前に、最初に行った抽出処理)で抽出しているため、探索外となった帯域に存在する拡張帯域変換係数を抽出できなかったことによる影響は少ない。
【0049】
なお、規定数は、一定の個数とは限らず、ある程度の幅を持たせるようにしても良い。例えば、基準の規定数をN個と設定し、算出された閾値を用いて抽出処理を行った結果、抽出した拡張帯域変換係数の個数がN-δ個からN+δまでの範囲に収まった時点で新たな閾値の算出を行わずに変換係数の抽出処理を終了するようにしても良い。
【0050】
次に、代表変換係数抽出部33において規定数の拡張帯域変換係数が抽出されなかったときの動作について具体的に説明する。
【0051】
閾値算出部32は、代表変換係数抽出部33より出力される変換係数不足数を用いて、より多くの拡張帯域変換係数が抽出されるように閾値を適応的に制御する。具体的には、変換係数不足数が大きいときは閾値を大きく下げ、変換係数不足数が小さいときには閾値を小さく下げるようにする。
【0052】
ここでは、変換係数不足数に応じて算出される抑圧係数を閾値に乗じることで修正する方法を、変換係数不足数の適応方法の一例として説明する。なお、次式(4)において、Sc(j)はサブバンドjにおける抑圧係数、Nlp(j)はサブバンドjにおける変換係数不足数、aは最低抑圧量、bは最大抑圧量を表す。a、bは、1.0≧a>b>0.0の関係である。
【数4】
【数5】
【0053】
このように変換係数不足数に応じて閾値を適応的に下げるようにする。例えば、a=0.9、b=0.5であれば、上記式(5)におけるFhthr(j)は、0.9倍から0.5倍の範囲で抑圧されることになる。
【0054】
このように得られた閾値は、代表変換係数抽出部33に出力される。以上説明した閾値算出部32の動作は、代表変換係数抽出部33で抽出される代表変換係数の数が規定数に達するまで行われる。
【0055】
以上説明した手法により抽出処理を行った場合に、例えば、2回の閾値の修正(最初の閾値を含めて、3つの閾値で抽出処理を行った場合)で規定数Nの代表変換係数が抽出されたとすると、抽出処理は、サブバンドに含まれる変換係数の数がMの時には、M×3の分岐処理に必要な演算量で済む。
【0056】
次に、上記で説明した変換係数抽出閾値の修正とそれに伴う抽出処理に関する動作を図3図4を用いて説明する。図3は、従来の方法による抽出処理を表す図、図4は本実施の形態における抽出処理を表す図である。
【0057】
図3図4の横軸は周波数、縦軸は拡張帯域変換係数の絶対値振幅を表し、サブバンドjにおける拡張帯域変換係数を表す。サブバンドに含まれる変換係数の数M=25、規定数N=10の例で説明する。拡張帯域変換係数は低域側からf1、f2、f3と表し、最高周波数の拡張帯域変換係数をf25と表す。
【0058】
図3を用いて従来方法における抽出処理の動作の例を説明する。従来方法では、絶対値振幅の大きい順に拡張帯域変換係数を抽出するので、図3に示すように、f15,f22,f9,f3,f17,f21,f6,f14,f12,f7の順に10個の拡張帯域変換係数が抽出される。この抽出処理には、M×10の分岐処理が必要になる。
【0059】
次に、図4を用いて本実施の形態における抽出処理の動作を説明する。拡張帯域分析部31において、f1からf25の絶対値平均と標準偏差が算出され、閾値算出部32により、変換係数抽出閾値が算出される。この変換係数抽出閾値は図中の閾値1で表す。
【0060】
このときに、抽出される拡張帯域変換係数は、f15,f22,f9の3個であり、変換係数不足数は10−3=7となる。a=0.9、b=0.5とすると、上記式(4)により抑圧係数はSc(j)=0.62となる。よって、変換係数抽出閾値は、0.62×閾値1と修正される。このときの変換係数抽出閾値を閾値2と表す。
【0061】
閾値2を用いた抽出の結果、追加で抽出される拡張帯域変換係数は、f3,f17,f21の3個であり、変換係数不足数は7−3=4となる。この結果、抑圧係数Sc(j)は、0.78となり、変換係数抽出閾値は0.78×閾値2となる。このときの変換係数抽出閾値を閾値3と表す。
【0062】
閾値3を用いた抽出の結果、追加抽出される拡張帯域変換係数は、f6,f14,f12の3個であり、変換係数不足数は4−3=1となる。抽出した拡張帯域変換係数は9個となり10個に満たないが、許容範囲にあるとしてここで抽出処理を中断するものとする。
【0063】
上記例では、1回の変換係数抽出閾値の設定と2回の変換係数抽出閾値の修正を行うことで、3回の抽出処理(M×3の分岐処理)で変換係数を抽出することができる。なお、この説明例の場合、従来方式では抽出していたf7が本実施の形態では抽出することができない。しかしながら、f7は、抽出した9個の変換係数よりも絶対値振幅が小さいため、f7を算出できないことによる相関値の算出の精度への影響は少ない。
【0064】
以上の構成および動作により、拡張帯域符号化部3において、拡張帯域変換係数と正規化低域変換係数の間で相関値を算出する際に、少ない演算量で、拡張帯域変換係数から適切な数の代表変換係数を抽出することができる。これにより性能を劣化させることなく、演算量を削減した符号化装置を実現できる。
【0065】
以上説明したように、本実施の形態に係る符号化装置は、まず、拡張帯域変換係数の統計量から閾値を算出し、前記閾値を用いて振幅の大きい拡張帯域変換係数を抽出する。抽出された拡張帯域変換係数の数が規定の数に達しない場合に、符号化装置は、変換係数不足数に応じて閾値の下げ幅を決定し、閾値を修正する。そして、符号化装置は、この閾値の修正および拡張帯域変換係数の抽出を、抽出された拡張帯域変換係数の数が規定の数に達するまで繰り返す。従って、符号化装置によれば、少ない演算量で、拡張帯域の特徴を代表する変換係数を必要数だけ抽出することができる。言い換えれば、規定数Nの拡張帯域変換係数を抽出するのに必要なループ回数を削減することで、変換係数抽出時の演算量を大きく削減することができる。
【0066】
また、本実施の形態に係る符号化装置は、最初に抽出される拡張帯域変換係数の数が規定数を下回るように閾値を設定する。符号化装置は、規定数に不足する拡張帯域変換係数の数に応じて閾値を修正し、修正後の閾値を用いて抽出した拡張帯域変換係数を、修正前の閾値を用いて抽出した拡張帯域変換係数群に追加する。符号化装置は、抽出処理中に抽出した拡張帯域変換係数が規定数に達した時点で抽出処理を中止する。このような拡張帯域変換係数の抽出処理を行うことにより、確実に振幅が大きい拡張帯域変換係数を抽出することができる。
【0067】
また、本実施の形態に係る符号化装置は、閾値の修正を一定回数に制限し、閾値の修正の回数が制限値(一定回数)に達した場合に抽出処理を中止するようにしても良い。これにより、演算量の最悪値をさらに低減することができる。
【0068】
次に、本実施の形態に係る復号装置について説明する。図5は、本実施の形態に係る復号装置の構成を示すブロック図である。
【0069】
復号装置20は、分離部5と、コア復号部6と、拡張帯域復号部7と、周波数時間変換部8と、から主に構成されている。
【0070】
分離部5は、符号化装置10から出力された符号化データを受け取り、コア符号化データと拡張帯域符号化データとに分離し、コア符号化データをコア復号部6に出力し、拡張帯域符号化データを拡張帯域復号部7に出力する。
【0071】
コア復号部6は、コア符号化データを復号し、得られたコア符号化低域変換係数を拡張帯域復号部7および周波数時間変換部8に出力する。
【0072】
拡張帯域復号部7は、拡張帯域符号化データを復号し、得られた符号化データとコア符号化低域変換係数を用いて拡張帯域変換係数を算出し、周波数時間変換部8に出力する。なお、拡張帯域復号部7の内部構成の詳細は後述する。
【0073】
周波数時間変換部8は、コア符号化低域変換係数と拡張帯域変換係数とを結合して復号変換係数を生成し、復号変換係数を、例えば直交変換することにより、時間領域に変換して出力信号を生成し、出力する。
【0074】
次に、拡張帯域復号部7の内部構成の詳細について説明する。図6に示すように、拡張帯域復号部7は、正規化部70と、拡張帯域復号・生成部71と、から主に構成されている。
【0075】
正規化部70は、コア符号化低域変換係数を正規化し、正規化低域変換係数を出力する。正規化部70は、図2に示した正規化部30と同一の処理を行うので、その詳細な説明については省略する。
【0076】
拡張帯域復号・生成部71は、正規化低域変換係数と拡張帯域符号化データから拡張帯域変換係数を生成する。具体的には、まず、拡張帯域復号・生成部71は、拡張帯域符号化データよりラグ情報とゲインを復号する。次に、拡張帯域復号・生成部71は、正規化低域変換係数からラグ情報に基づき拡張帯域に周波数微細構造としてコピーする。次に、拡張帯域復号・生成部71は、正規化低域変換係数からコピーした拡張帯域変換係数に対して、復号したゲインを乗じることにより、拡張帯域変換係数を生成する。
【0077】
以上の構成および動作により、本実施の形態に係る復号装置20は、符号化装置10によって生成された符号化データを復号することができる。
【0078】
以上、本実施の形態に係る符号化装置および復号装置について説明した。なお、上記本実施の形態の説明は本発明を実現するための一例であり、本発明はこれに限定されない。
【0079】
例えば、上記本実施の形態では、抽出した変換係数の数が必要な数に達するまで、閾値算出部32と代表変換係数抽出部33が繰り返し動作する例について説明したが、本発明はこれに限定されない。例えば、代表変換係数抽出部33が一定回数繰り返すとそれ以上の変換係数を抽出する必要性は無いと判断し、これまでに抽出した代表変換係数を出力して、抽出処理を完了するようにしても良い。
【0080】
また、上記本実施の形態では、拡張帯域変換係数の算出の説明において、サブバンドに依らず、変換係数抽出閾値を修正する際の修正方式を同一とする例で説明したが、本発明では、サブバンド毎に修正の程度を異なるように設定しても良い。例えば、高域になるほど、上記式(4)のa、bの少なくとも一方を大きくすることにより、高域になるほど変換係数が抽出される確率が少なくなるようにしても良い。この手法は、高域になるほど変換係数の微細構造の影響は少ないという特徴を活かしており、演算量をさらに削減することができる。
【0081】
また、本発明では、上記で説明した閾値の修正のためのループ回数が増えるに従って、閾値を設定する方法を変更するようにしても良い。例えば、ループ回数が増えるに従って、上記式(4)のa、bの少なくとも一方を小さくして、より閾値を小さくして規定数に不足する変換係数を抽出しやすくするようにしても良い。
【0082】
また、上記本実施の形態では、拡張帯域変換係数が正規分布すると仮定し、図2に示す閾値算出部32が、絶対値平均と標準偏差から閾値を算出する場合について説明したが、本発明では、正規分布以外の分布を仮定してその分布に応じて閾値を設定しても良い。また、本発明では、サブバンドに含まれる変換係数の絶対値の最大振幅値に1.0未満の一定比を乗じたものを閾値とするようにしても良い。
【0083】
また、上記本実施の形態では、図2に示す閾値算出部32における閾値の修正方法として、変換係数不足数に応じて算出される抑圧係数を閾値に乗じることにより修正する方法について説明したが、本発明では別の方法で閾値を修正するようにしても良い。例えば、変換係数不足数が多いときは閾値から0.2を減算し、少ない時は0.1を減算するといった方法や、変換係数不足数が多いときはβを0.5減らし、少ないときは0.1減らすといった方法でも実現することができる。
【0084】
また、本発明では、図2に示す代表変換係数抽出部33において、拡張帯域分析部31の拡張帯域統計パラメータを用いて算出された閾値を使って変換係数の抽出を行ったときに、規定数を超えた場合には、変換係数抽出を行わず、逆に閾値を上げるように閾値算出部32に指示するようにしても良い。この場合、閾値算出部32が閾値を上げるように修正する処理を行い、代表変換係数抽出部33が修正後の閾値で再度抽出処理を行うことにより、規定数以下の変換係数を抽出することができる。
【0085】
また、上記本実施の形態では、図2に示す閾値算出部32が、最初に抽出される変換係数が規定数以下になるように、閾値を大きめに設定する例について説明したが、本発明では、閾値算出部32が、最初に抽出される変換係数の数が規定数となるように、閾値を設定しても良い。この場合には、最初に抽出された変換係数の数が規定数を超えるケースが多々発生する。このように抽出した変換係数の数が規定数を超える場合には、代表変換係数抽出部33が、閾値を上げるように閾値算出部32に指示し、修正後の閾値を用いて再度抽出処理を行う。この処理を、抽出する変換係数の数が規定数以下になるまで繰り返すようにする。
【0086】
また、上記本実施の形態では、拡張帯域変換係数の代表変換係数と、正規化低域変換係数との間で相関値を算出する例について説明したが、本発明では、拡張帯域変換係数を加工したものを使っても良い。例えば聴覚マスキング等の影響を考慮しフィルタリングしたものを使うようにしても良い。
【0087】
また、上記本実施の形態において、信号処理プログラムを、メモリ、ディスク、テープ、CDまたはDVD等の機械読み取り可能な記録媒体に記録または書き込みをし、動作を行う場合についても、本発明は適用することができ、各実施の形態と同様の作用および効果を得ることができる。
【0088】
また、上記本実施の形態において、ハードウェアにより構成する場合を例に説明したが、本発明はソフトウェアで実現することも可能である。
【0089】
また、上記本実施の形態において、各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。また、この場合、LSIは、集積度の違いにより、IC、システムLSI、スーパーLSIまたはウルトラLSIと呼称されることもある。
【0090】
また、上記本実施の形態において、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)、またはLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
【0091】
また、上記本実施の形態において、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
【0092】
2011年10月28日出願の特願2011−237818の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
【産業上の利用可能性】
【0093】
本発明にかかる符号化装置は、音声データ、音楽データ、音響データ等、音に関するデータの符号化を行うのに好適である。
【符号の説明】
【0094】
1 時間周波数変換部
2 コア符号化部
3 拡張帯域符号化部
4 多重化部
5 分離部
6 コア復号部
7 拡張帯域復号部
8 周波数時間変換部
10 符号化装置
20 復号装置
30 正規化部
31 拡張帯域分析部
32 閾値算出部
33 代表変換係数抽出部
34 マッチング部
35 拡張帯域生成・符号化部
70 正規化部
71 拡張帯域復号・生成部
図1
図2
図3
図4
図5
図6