【文献】
森田義則,船田哲男,スペクトル包絡特性を考慮したLSPパラメータのニューロベクトル量子化,電子情報通信学会技術研究報告,日本,社団法人 電子情報通信学会,1998年 7月17日,Vol. 98, No. 178,pp. 23-28
(58)【調査した分野】(Int.Cl.,DB名)
前記プロセッサは、前記正規化されたLSF係数または正規化されたISF係数の周波数に対応するスペクトルビンのサイズと少なくとも一つの隣接するスペクトルビンのサイズに基づいて、前記サブフレームの第1の加重値関数を決定する請求項1に記載の装置。
サブフレームの線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数を前記サブフレームのスペクトルビンの数に基づいて正規化するステップと、
前記正規化されたLSF係数または正規化されたISF係数の周波数に対応するスペクトルビンのサイズに基づいて、前記サブフレームの第1の加重値関数を決定するステップと、
前記正規化されたLSF係数または正規化されたISF係数の周波数情報に基づいて、前記サブフレームの第2の加重値関数を決定するステップと、
前記第1の加重値関数と前記第2の加重値関数を組み合わせて前記サブフレームの加重値関数を生成するステップと、
前記サブフレームの加重値関数に基づいて、前記サブフレームを量子化するステップと、を含む方法。
前記正規化されたLSF係数または正規化されたISF係数の周波数に対応するスペクトルビンのサイズと少なくとも一つの隣接するスペクトルビンのサイズに基づいて、前記サブフレームの第1の加重値関数を決定する請求項5に記載の方法。
【発明を実施するための形態】
【0010】
本発明の一実施形態による装置は、入力信号の中間サブフレーム(mid-subframe)の線形予測符号化(LPC:linear predictive coding)係数を線スペクトル周波数(LSF:line spectral frequency)係数またはイミッタンススペクトル周波数(ISF:immittance spectral frequency:ISF)係数のうちいずれか一つに変換する第1係数変換部と、前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、前記量子化されたLPC係数は、前記装置のエンコーダに出力されもする。
【0011】
本発明の一実施形態による装置の加重値関数決定部は、前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズ(interpolated spectrum magnitude)を利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。
【0012】
本発明の一実施形態による装置の加重値関数決定部は、前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。
【0013】
本発明の一実施形態による方法は、入力信号の中間サブフレームの線形予測符号化(LPC)係数を、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか一つに変換する段階と、前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、前記量子化されたLPC係数は、エンコーダに出力されもする。
【0014】
本発明の一実施形態による方法で、加重値関数を決定する段階は、前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。
【0015】
本発明の一実施形態による方法で加重値関数を決定する段階は、前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。
【0016】
本発明の一実施形態によれば、LPC係数をISF係数またはLSF係数に変換して量子化することにより、LPC係数の量子化効率を向上させることができる。本発明の一実施形態によれば、LPC係数の重要度と係わる加重値関数を決定することにより、LPC係数の重要度による合成信号の品質を向上させることができる。
【0017】
本発明の一実施形態によれば、中間サブフレームのLPC係数を量子化するために、現在フレームのLPC係数を量子化するための加重値関数と、以前フレームのLPC係数を量子化するための加重値関数とを補間することにより、入力信号の品質を向上させることができる。
【0018】
本発明の一実施形態によれば、ISFまたはLSFが、実際に入力信号のスペクトル包絡線に影響を及ぼすことを示すサイズ別加重値関数だけではなく、周波数ドメインでの知覚的な特性と、フォルマント(formant)の分布とを考慮した周波数別加重値関数を組み合わせることにより、LPC係数の量子化効率を向上させることができ、LPC係数に係わる加重値が正確に導き出される。
【0019】
本発明の一実施形態による装置は、線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、前記量子化されたLPC係数は、前記装置のエンコーダに出力されてもよい。
【0020】
本発明の一実施形態による方法は、線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、前記量子化されたLPC係数は、エンコーダに出力されてもよい。
【0021】
本発明の一実施形態によれば、実施形態の方法を遂行するためのプログラムが記録されていることを特徴とするコンピュータで読み取り可能な記録媒体を提供することができる。
【0022】
以下、添付された図面に記載した内容を参照して、本発明による実施形態について詳細に説明する。ただし、本発明が実施形態によって制限されたり、あるいは限定されるものではない。各図面に提示された同一の参照符号は、同一の部材を示す。
【0023】
図1は、本発明の一実施形態によるオーディオ信号符号化装置の全体構成を図示した図面である。
図1を参照すれば、本発明の一実施形態によるオーディオ信号符号化装置100は、前処理部101、スペクトル分析部102、LPC係数抽出部及びオープンループピッチ分析部103、符号化モード選択部104、LPC係数量子化部105、符号化部106、エラー復元部107及びビットストリーム生成部108を含む。このとき、オーディオ信号符号化装置100は、スピーチ(speech)信号に適用されてもよい。
【0024】
前処理部101は、入力信号を前処理(pre-processing)することができる。これを介して、入力信号は、符号化のための準備が完了する。具体的には、前処理部101は、ハイパスフィルタ(high pass filtering)、プリエンファシス(pre-emphasis)及びサンプリング(sampling)変換の過程を介して、入力信号を前処理することができる。
【0025】
スペクトル分析部102は、時間−周波数マッピング(time-to-frequency mapping)過程を介して、入力信号に係わる周波数ドメインの特性を分析することができる。そして、スペクトル分析部102は、音声活動度探索(voice activity detection)過程を介して、入力信号が、活性信号(active signal)であるか、あるいは黙音(mute)であるかを決定することができる。また、スペクトル分析部102は、入力信号で背景ノイズを除去することができる。
【0026】
LPC係数抽出部及びオープンループピッチ分析部103は、入力信号の線形予測(LP)分析を介して、線形予測符号化係数(LPC係数)を抽出することができる。一般的に、フレーム当たり1回の線形予測分析が実行されるが、追加的な音質向上のために、2回以上の線形予測分析が実行されてもよい。この場合、1回は、既存の線形予測分析であるフレームエンド(frame-end)のための線形予測であり、残りは、音質向上のための中間サブフレーム(mid-subframe)のための線形予測が追加される。このとき、現在フレームのフレームエンドは、現在フレームを構成するサブフレームのうち最後のサブフレームを意味し、以前フレームのフレームエンドは、以前フレームを構成するサブフレームのうち最後のサブフレームを意味する。
【0027】
ここで、中間サブフレームは、以前フレームのフレームエンドである最後のサブフレームと、現在フレームのフレームエンドである最後のサブフレームとの間に存在するサブフレームのうち一つ以上のサブフレームを意味する。それにより、LPC係数抽出部及びオープンループピッチ分析部103は、全2セット以上のLPC係数を抽出することができる。
【0028】
そして、LPC係数抽出部及びオープンループピッチ分析部103は、オープンループ(open-loop)を介して、入力信号のピッチ(pitch)を分析することができる。このとき、分析されたピッチ情報は、適応的なコードブック(adaptive codebook)探索に使用される。
【0029】
符号化モード選択部104は、ピッチ情報、周波数ドメインの分析情報などを利用して、入力信号の符号化モード(coding mode)を選択することができる。一例として、入力信号は、generic mode、voiced mode、unvoiced modeまたはtransition modeに分類された符号化モードによって符号化される。
【0030】
LPC係数量子化部105は、LPC係数抽出部及びオープンループピッチ分析部103で抽出されたLPC係数を量子化することができる。LPC係数量子化部105については、
図2ないし
図9を介して具体的に説明する。
【0031】
符号化部106は、選択された符号化モードによって、LPC係数の励起(excitation)信号を符号化する。LPC係数の励起信号を符号化するための代表的なパラメータは、adaptive codebook index、adaptive codebook gain、fixed codebook index、fixed codebook gainなどがある。このとき、符号化部106は、LPC係数の励起信号をサブフレームの単位で符号化することができる。
【0032】
エラー復元部107は、入力信号のフレームでエラーが発生したとき、フレームを復元したり、あるいは隠匿して、全体的な音質向上のための付加情報(side information)を抽出することができる。
【0033】
ビットストリーム生成部108は、符号化された信号をビットストリームに生成することができる。このとき、ビットストリームは、保存や伝送の目的に使用される。
【0034】
図2は、本発明の一実施形態による
図1のLPC係数量子化部の詳細構成を図示した図面である。
図2を参照すれば、2段階の量子化過程が遂行される。最初の段階は、LPC係数量子化部200が、現在フレームまたは以前フレームのフレームエンドのための線形予測に係わり、第2の段階は、音質向上のために、中間サブフレームのための線形予測を行うのである。
【0035】
現在フレームまたは以前フレームのフレームエンドに係わるLPC係数量子化部200は、第1係数変換部202、加重値関数決定部203、量子化部204及び第2係数変換部205を含むことができる。
【0036】
第1係数変換部202は、入力信号の現在フレームまたは以前フレームのフレームエンドを線形予測分析して抽出された線形予測符号化(LPC)係数を変換することができる。一例として、第1係数変換部202は、現在フレームまたは以前フレームのフレームエンドに係わるLPC係数を、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか1つのフォーマットに変換することができる。このとき、ISF係数やLSF係数は、LPC係数をより容易に量子化することができるフォーマットを示す。
【0037】
加重値関数決定部203は、LPC係数から変換されたISF係数またはLSF係数を利用して、前記現在フレームのフレームエンド及び以前フレームのフレームエンドに係わるLPC係数の重要度と係わる加重値関数(weighting function)を決定することができる。一例として、加重値関数決定部203は、サイズ別加重値関数と周波数別加重値関数とを決定することができる。そして、加重値関数決定部203は、周波数帯域、符号化モード及びスペクトル分析情報のうち少なくとも一つを考慮して、加重値関数を決定することができる。
【0038】
一例として、加重値関数決定部203は、符号化モード別に最適の加重値関数を導き出すことができる。そして、加重値関数決定部203は、入力信号の周波数帯域によって、最適の加重値関数を導き出すことができる。また、加重値関数決定部203は、入力信号の周波数分析情報によって、最適の加重値関数を導き出すことができる。このとき、周波数分析情報は、スペクトルチルト情報を含んでもよい。
【0039】
さて、加重値関数決定部203を介して導き出された現在フレームのフレームエンドのLPC係数を量子化するための加重値関数、及び以前フレームのフレームエンドのLPC係数を量子化するための加重値関数は、中間サブフレームのLPC係数を量子化するための加重値関数を決定するために、加重値関数決定部207に伝達される。
【0040】
加重値関数決定部203の動作については、
図4及び
図8でさらに具体的に説明する。
【0041】
量子化部204は、現在フレームのフレームエンド、または以前フレームのフレームエンドのLPC係数が変換されたISF係数またはLSF係数に係わる加重値関数を利用して、変換されたISF係数またはLSF係数を量子化することができる。量子化の結果、現在フレームまたは以前フレームのフレームエンドに係わる量子化されたISF係数またはLSF係数のインデックスが導き出される。
【0042】
そして、第2係数変換部205は、量子化されたISF係数(QISF)または量子化されたLSF係数(QLSF)を、量子化されたLPC係数(QLPC)に変換することができる。第2係数変換部205を介して導き出された量子化されたLPC係数は、単純なスペクトル情報を示すのではなく、反映係数(reflection coefficient)を示すので、固定された加重値が使用される。
【0043】
図2を参照すれば、中間サブフレームに係わるLPC係数量子化部201は、第1係数変換部206、加重値関数決定部207、量子化部208及び第2係数変換部209を含んでもよい。
【0044】
第1係数変換部206は、中間サブフレームのLPC係数を、ISF係数またはLSF係数のうちいずれか一つに変換することができる。
【0045】
加重値関数決定部207は、変換されたISF係数またはLSF係数を利用して、中間サブフレームのLPC係数の重要度と係わる加重値関数を決定することができる。
【0046】
一例として、加重値関数決定部207は、現在フレームのパラメータと、以前フレームのパラメータとを補間(interpolation)し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することができる。具体的には、加重値関数決定部207は、以前フレームのフレームエンドのLPC係数を量子化するための第1加重値関数と、現在フレームのフレームエンドのLPC係数を量子化するための第2加重値関数とを補間し、中間サブフレームのLPC係数を量子化するための加重値関数を決定することができる。
【0047】
このとき、加重値関数決定部207は、線形補間(linear-interpolation)及び非線形補間(non-linear interpolation)のうち少なくとも一つを利用して補間を行うことができる。具体的には、加重値関数決定部207は、(1)線形補間及び非線形補間を全ての寸法のベクトルに適用する方式、(2)サブベクトルごとに、線形補間と非線形補間とを異ならせて適用する方式、(3)それぞれのLPC係数によって、線形補間と非線形補間を異ならせて適用する方式のうちいずれか一つを遂行することができる。
【0048】
そして、加重値関数決定部207は、現在フレームのフレームエンドに係わる第1加重値関数と、以前フレームのフレームエンドに係わる第2加重値関数との全体を利用して補間することもできるが、加重値関数を導き出す数式を分析し、一部の構成要素(component)を利用して補間することもできる。例えば、加重値関数決定部207は、サイズ別加重値関数を決定するのに使用されるスペクトル情報を、補間を介して求めることができる。
【0049】
一例として、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。このとき、補間されたスペクトルサイズは、現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを意味する。具体的には、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数に対応するスペクトルサイズとを利用して、中間サブフレームのISF係数またはLSF係数に係わる加重値関数を決定することができる。このとき、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して加重値関数を決定することができる。
【0050】
補間されたスペクトルサイズを利用して、加重値関数を決定する過程については、
図5で具体的に説明する。
【0051】
他の一例として、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、ISF係数またはLSF係数に係わる加重値関数を決定することができる。このとき、LPCスペクトルサイズは、中間サブフレームのLPC係数を周波数変換したLPCスペクトルに基づいて決定される。具体的には、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズを利用して、ISF係数またはLSF係数に係わる加重値関数を決定することができる。このとき、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することができる。
【0052】
LPCスペクトルサイズを利用して、中間サブフレームに係わる加重値関数を決定する過程は、
図8で具体的に説明する。
【0053】
そして、加重値関数決定部207は、中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することができる。このとき、周波数分析情報は、スペクトルチルト情報を含んでもよい。
【0054】
また、加重値関数決定部207は、LPCスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することができる。このとき、周波数別加重値関数は、中間サブフレームのLPC係数から変換されたISF係数またはLSF係数の周波数に対応する加重値関数であり、バークスケール(bark scale)で表現されてもよい。
【0055】
量子化部208は、中間サブフレームのLPC係数が変換されたISF係数またはLSF係数に係わる加重値関数を利用して、変換されたISF係数またはLSF係数を量子化することができる。量子化の結果、中間サブフレームに係わる量子化されたISF係数またはLSF係数のインデックスが導き出される。
【0056】
そして、第2係数変換部209は、量子化されたISF係数(QISF)または量子化されたLSF係数(QLSF)を、量子化されたLPC係数(QLPC)に変換することができる。第2係数変換部205を介して導き出された量子化されたLPC係数は、単純なスペクトル情報を示すものではなく、反映係数を示すので、固定された加重値が使用される。
【0057】
以下では、LPC係数と加重値関数との関係について具体的に説明する。
【0058】
音声(speech)信号及びオーディオ信号を時間ドメインで符号化するとき、使用可能な技術のうち一つとして、線形予測(LPC)がある。線形予測技術は、短区間予測(short-term prediction)を意味する。このとき、線形予測の結果は、時間ドメインでは、隣接したサンプル間の相関度(correlation)で示し、周波数ドメインでは、スペクトル包絡線で示す。
【0059】
線形予測技術を応用した符号化技術として、CELP(code excited linear prediction)技術がある。CELP技術を使用する音声符号化技術は、G.729、AMR(adaptive multi-rate)、AMR−WB(wideband)、EVRC(enhanced variable rate codec)などがある。CELP技術を利用して、音声及びオーディオ信号を符号化するために、LPC係数と励起信号とが必要である。
【0060】
LPC係数は、隣接したサンプル間の相関度を示し、スペクトルピークで表現される。もしLPC係数の次数が16次である場合、最大16個のサンプル間の相関度が導き出される。LPC係数の次数は、入力信号の帯域幅によって決定され、一般的に、音声信号の特性によって決定される。このとき、音声信号の主な発声は、フォルマント(formant)の大きさ及び位置によって決定される。入力信号のフォルマントを表現するために、狭帯域(NB:narrow band:NB)である300〜3,400Hz区間の入力信号については、10次のLPC係数が使用される。そして、広帯域(WB:wide band)である50〜7,000Hz区間の入力信号については、16〜20次のLPC係数が使用される。
【0061】
下記数式(1)は、合成フィルタH(z)を示すものであり、a
jは、LPC係数を意味し、pは、LPC係数の次数を意味する。
【0062】
【数1】
下記数式(2)は、復号化器で合成された合成信号を意味する。
【0065】
【数4】
は、励起信号を意味する。そして、Nは、同一の係数を利用する符号化フレームの大きさを意味する。このとき、励起信号は、adaptive codebookとfixed codebookとの和として決定される。復号化装置では、復号化された励起信号と量子化されたLPC係数とを利用して、合成信号を作る。
【0066】
LPC係数は、スペクトルピーク(spectrum peak)として現れるスペクトルのフォルマント情報を表現し、全体スペクトルの包絡線(envelope)を符号化することに使用される。このとき、符号化装置は、LPC係数の量子化効率を高めるために、LPC係数を、ISFまたはLSFに変換することができる。
【0067】
ISFは、簡単な安定度確認を介して、量子化による発散を防止することができる。もし安定度に問題が発生する場合、量子化されたISFの間隔を調節することにより、安定度の問題が解決されてもよい。そして、LSFは、ISFと違い最後の係数が反映係数である点で違いがあるのみ、残りの特性は同一である。ここで、ISFまたはLSFは、LPC係数から変換された係数であるので、LPC係数のスペクトルのフォルマント情報を同一に維持している。
【0068】
具体的には、LPC係数の量子化は、LPC係数を、ダイナミックレンジ(dynamic range)が狭く、安定度(stability)確認が容易であり、補間に有利なISPやLSPに変換した後で遂行されてもよい。ISP(immittance spectral pair)やLSP(line spectral pair)は、ISFやLSFで表現されてもよい。下記数式(3)は、ISFとISPとの関係、またはLSFとLSPとの関係を意味する。
【0069】
【数5】
ここで、q
iは、LSPまたはISPであり、ω
iは、LSFまたはISFを意味する。LSFは、量子化効率のために、ベクトル量子化されてもよい。効率を向上させるために、LSFは、予測ベクトル量子化されてもよい。ベクトル量子化を行う場合、dimensionが高くなれば、ビット効率が向上するが、コードブック・サイズが大きくなり、処理速度が落ちることがある。そのために、マルチステージ・ベクトル量子化(multi-stage vector quantization)を行ったり、スプリットベクトル量子化(split vector quantization)を介して、コードブックのサイズが小さくなる。
【0070】
ベクトル量子化は、ベクトル内のエントリ(entry)いずれも同一の重要度であると見なし、squared error distance measureを利用して、最も少ないエラーを有するコードブック・インデックスを選択する過程を意味する。しかし、LPC係数において、全ての係数の重要度が異なるので、重要な係数のエラーを減少させ、最終合成された信号の知覚的な品質(perceptual quality)が向上するのである。従って、LSF係数を量子化するとき、復号化装置は、各LPC係数の重要度を表現する加重値関数(weighting function)をsquared error distance measureに適用し、最適のコードブック・インデックスを選択することにより、合成信号の性能を向上させることができる。
【0071】
本発明の一実施形態によれば、ISFやLSFの周波数情報と、実際のスペクトルサイズとを利用して、各ISFまたは各LSFが、実際にスペクトル包絡線にいかなる影響を与えるかに係わるサイズ別加重値関数を決定することができる。そして、本発明の一実施形態によれば、周波数ドメインの知覚的な特性及びフォルマントの分布を考慮した周波数別加重値関数を、サイズ別加重値関数と組み合わせ、追加的な量子化効率を得ることができる。また、本発明の一実施形態によれば、実際周波数ドメインの大きさを使用するので、全体周波数の包絡線情報が好ましく反映され、各ISF係数または各LSF係数の加重値を正確に導き出すことができる。
【0072】
結局、本発明の一実施形態によれば、LPC係数を変換したISFまたはLSFをベクトル量子化するとき、各係数の重要度が異なる場合、ベクトル内で、いかなるエントリが相対的にさらに重要であるかを示す加重値関数を決定することができる。そして、符号化しようとするフレームのスペクトルを分析し、エネルギーが大きい部分にさらに大きい加重値を与えることができる加重値関数を決定することにより、符号化の正確度を向上させることができる。スペクトルのエネルギーが大きいということは、時間ドメインで、相関度が高いということを意味する。
【0073】
図3A、
図3B、
図3Cは、本発明の一実施形態によるLPC係数を量子化する過程を図示した図面である。
【0074】
図3A、
図3B、
図3Cを参照すれば、2種形態のLPC係数を量子化する過程が図示されている。
図3Aは、入力信号の変動性が大きい場合に適用され、
図3Bは、入力信号の変動性が小さい場合に適用される。入力信号の特性によって、
図3Aと
図3Bは、スイッチングされて適用されてもよい。そして、
図3A、
図3B、
図3Cは、中間サブフレームのLPC係数を量子化する過程を示す。
【0075】
LPC係数量子化部301は、SQ(scalar quantization)、VQ(vector quantization)、SVQ(split-vector quantization)、MSVQ(multi-stage vector quantization)を介して、ISFを量子化することができる。LSFも同一に適用されてもよい。
【0076】
予測部302は、AR(auto regressive)予測やMA(moving average)予測を行うことができる。このとき、予測次数は、1以上の定数を意味する。
【0077】
下記数式(4)は、
図3Aを介して量子化されたISFを介して、コードブック・インデックスを探索するためのエラー関数を意味する。そして、下記数式(5)は、
図3Bを介して量子化されたISFを介して、コードブック・インデックスを探索するためのエラー関数を意味する。コードブック・インデックスは、エラー関数を最小化する値を意味する。
【0078】
また、下記数式(6)は、
図3Cで、ITU−T(International Telecommunication Union-Telecommunication sector) G.718で使用される中間サブフレームの量子化を介して導き出されたエラー関数を意味する。数式(6)を参考にすれば、現在フレームのフレームエンドについて量子化されたISF値
【0079】
【数6】
と、以前フレームのフレームエンドについて量子化されたISF値
【0080】
【数7】
を利用し、中間サブフレームの量子化の結果に係わるエラーを最小化するinterpolation weight setのインデックスが導き出される。
【0081】
【数8】
ここで、w(n)は、加重値関数を意味し、z(n)は、
図3で、ISF(n)からmean値を除外したベクトルである。c(n)は、コードブックを示す。pは、ISF係数の次数を意味し、NB(narrow band)では、通常10、WB(wide band)では、通常16〜20を使用する。
【0082】
本発明の一実施形態によれば、符号化装置は、LPC係数から変換されたISF係数またはLSF係数の周波数にあたるスペクトルサイズ(spectrum magnitude)を利用したサイズ別加重値関数と、入力信号の知覚的な特性及びフォルマント分布を考慮した周波数別加重値関数とを組み合わせ、最適の加重値関数を決定することができる。
【0083】
図4は、本発明の一実施形態によって、
図2の加重値関数決定部が加重値関数を決定する過程を図示した図面である。
図4を参照すれば、スペクトル分析部102の詳細構成が図示されている。スペクトル分析部102は、補間部401及びサイズ計算部402を含んでもよい。
【0084】
補間部401は、スペクトル分析部102の遂行結果である現在フレームのフレームエンドに係わるスペクトルサイズと、以前フレームのフレームエンドに係わるスペクトルサイズとを補間し、中間サブフレームの補間されたスペクトルサイズを導き出すことができる。このとき、中間サブフレームの補間されたスペクトルサイズは、線形補間または非線形補間を介して導き出される。
【0085】
サイズ計算部402は、中間サブフレームの補間されたスペクトルサイズを利用して、周波数スペクトルビン(bin)のサイズを計算することができる。周波数スペクトルビンの個数は、加重値関数決定部207が、ISF係数またはLSF係数を正規化するために設定した範囲に対応する周波数スペクトルビンの個数と同一に決定される。
【0086】
それにより、サイズ計算部402を介して導き出されたスペクトル分析情報である周波数スペクトルビンのサイズは、加重値関数決定部207がサイズ別加重値関数を決定するときに活用されてもよい。
【0087】
この後、加重値関数決定部207は、中間サブフレームのLPC係数が、変換されたISFまたはLSFを正規化することができる。本過程で、ISF係数の最後の係数は、反映係数であるので、同一のweightが適用されてもよい。LSFは、かような方式が適用されない。p次数のISFのうち、実際に本過程が適用される範囲は、0〜(p−2)までである。通常0〜(p−2)までのISFは、0〜πに存在する。加重値関数決定部207は、スペクトル分析情報を利用するために、サイズ計算部402を介して導き出された周波数スペクトルビンの個数と同一の個数Kで正規化を行うことができる。
【0088】
その後、加重値関数決定部207は、サイズ計算部402を介して伝達したスペクトル分析情報を利用して、中間サブフレームについて、ISF係数またはLSF係数がスペクトル包絡線に影響を及ぼすサイズ別加重値関数W
1(n)を決定することができる。一例として、加重値関数決定部207は、ISF係数またはLSF係数の周波数情報と、入力信号の実際スペクトルサイズとを利用して、サイズ別加重値関数を決定することができる。このとき、サイズ別加重値関数は、LPC係数から変換されたISF係数またはLSF係数のために決定される。
【0089】
そして、加重値関数決定部207は、ISF係数またはLSF係数の周波数それぞれに対応する周波数スペクトルビンのサイズを利用して、サイズ別加重値関数を決定することができる。
【0090】
または、加重値関数決定部207は、ISF係数またはLSF係数の周波数それぞれに対応するスペクトルビン、及びスペクトルビンの周辺に位置した少なくとも1つの周辺スペクトルビンのサイズを利用して、サイズ別加重値関数を決定することができる。このとき、加重値関数決定部207は、スペクトルビン、及び少なくとも1つの周辺スペクトルビンの代表値を抽出し、スペクトル包絡線と係わるサイズ別加重値関数を決定することができる。このとき、代表値の例は、ISF係数またはLSF係数の周波数それぞれに対応するスペクトルビン、及び前記スペクトルビンに係わる少なくとも1つの周辺スペクトルビンの最大値、平均値または中間値であってもよい。
【0091】
一例として、加重値関数決定部207は、ISF係数またはLSF係数の周波数情報を利用して、周波数別加重値関数W
2(n)を決定することができる。具体的には、加重値関数決定部207は、入力信号の知覚的な特性及びフォルマント分布を利用して、周波数別加重値関数を決定することができる。このとき、加重値関数決定部207は、バークスケールによって、入力信号の知覚的な特性を抽出することができる。そして、加重値関数決定部207は、フォルマントの分布のうち、最初のフォルマントに基づいて、周波数別加重値関数を決定することができる。
【0092】
一例として、周波数別加重値関数の場合、低周波及び高周波で、相対的に低い加重値を示し、低周波で、一定周波数区間内(first formantに該当する区間)で、同一サイズの加重値を示すことができる。
【0093】
その後、加重値関数決定部207は、サイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することができる。このとき、加重値関数決定部207は、サイズ別加重値関数と、周波数別加重値関数とを乗じたり加え、最終的な加重値関数を決定することができる。
【0094】
他の一例として、加重値関数決定部207は、入力信号の符号化モード及び周波数帯域情報を考慮し、サイズ別加重値関数と、周波数別加重値関数とを決定することができる。これについては、
図5で具体的に説明する。
【0095】
図5は、本発明の一実施形態による符号化モード、入力信号の帯域幅情報を利用して、加重値関数を決定する過程を図示した図面である。
【0096】
加重値関数決定部207は、入力信号の帯域幅を確認することができる(S501)。それにより、加重値関数決定部207は、入力信号の帯域幅が広帯域(WB)に属するか否かを判断することができる(S502)。このとき、入力信号の帯域幅が広帯域ではない場合、加重値関数決定部270は、入力信号の帯域幅が狭帯域(NB)に属するか否かを判断することができる。もし入力信号の帯域幅が狭帯域に属さない場合、加重値関数決定部207は、加重値関数を決定しない。そして、入力信号の帯域幅が狭帯域に属する場合、加重値関数決定部207は、段階S503から段階S510までの過程を介して、帯域幅に基づいて、当該サブブロック(中間サブフレーム)を処理することができる。
【0097】
そして、入力信号の帯域幅が広帯域である場合、加重値関数決定部207は、入力信号の符号化モードを確認することができる(S503)。その後、加重値関数決定部207は、入力信号の符号化モードが無声音モード(unvoiced)であるか否かを判断することができる(S504)。入力信号の符号化モードが無声音モードである場合、加重値関数決定部207は、無声音モードについて、サイズ別加重値関数を決定し(S505)、無声音モードについて、周波数別加重値関数を決定し(S506)、サイズ別加重値関数と、周波数別加重値関数とを組み合わせることができる(S507)。
【0098】
一方、入力信号の符号化モードが無声音モードではない場合、加重値関数決定部207は、有声音モードについて、サイズ別加重値関数を決定し(S508)、有声音モードについて、周波数別加重値関数を決定し(S509)、サイズ別加重値関数と、周波数別加重値関数とを組み合わせることができる(S510)。もし入力信号の符号化モードがgeneric modeまたはtransition modeである場合、加重値関数決定部207は、有声音モードと同一の過程を介して、加重値関数を決定することができる。
【0099】
一例として、入力信号をFFT(fast Fourier transform)方式によって周波数変換したとき、FFT係数のスペクトルサイズを利用したサイズ別加重値関数は、数式(7)によって決定される。
【0100】
【数9】
図6は、本発明の一実施形態によって、LPC係数を変換したISFを図示した図面である。
【0101】
具体的には、
図6は、入力信号を、FFTを介して周波数ドメインに変換したときのスペクトル結果、スペクトルで導き出されたLPC係数、及びLPC係数を変換したISFを図示している。入力信号にFFTを適用した結果が256個のサンプルである場合、16次線形予測を行えb、16個のLPC係数が導き出され、16個のLPC係数は、16個のISF係数に変換されてもよい。
【0102】
図7A及び
図7Bは、本発明の一実施形態によって、符号化モードによる加重値関数を図示した図面である。
【0103】
具体的には、
図7A及び
図7Bは、
図5で、符号化モードによって決定された周波数別加重値関数を示している。グラフ701は、有声音モードでの周波数別加重値関数を示す。そして、グラフ702は、無声音モードでの周波数別加重値関数を示す。
【0104】
一例として、グラフ701は、下記数式(8)によって決定され、グラフ702は、下記数式(9)によって決定される。数式(8)及び数式(9)での定数は、入力信号の特性によって変更されてもよい。
【0105】
【数10】
サイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的に導き出される加重値関数は、下記数式(10)によって決定される。
【0106】
【数11】
図8は、本発明の他の一実施形態によって、
図2の加重値関数決定部が加重値関数を決定する過程を図示した図面である。
図8を参照すれば、スペクトル分析部102の詳細構成が図示される。スペクトル分析部102は、周波数マッピング部801及びサイズ計算部802を含んでもよい。
【0107】
周波数マッピング部801は、中間サブフレームのLPC係数を、周波数ドメイン信号にマッピングさせることができる。一例として、周波数マッピング部801は、中間サブフレームのLPC係数をFFT、またはMDCT(modified discrete cosine transform)などを介して周波数変換し、中間サブフレームに係わるLPCスペクトル情報を決定することができる。このとき、周波数マッピング部801が256pointの代わりに、64pointのFFTを利用すれば、非常に低い複雑度で周波数変換される。周波数マッピング部801は、LPCスペクトル情報を利用して、中間サブフレームに係わる周波数スペクトルサイズを決定することができる。
【0108】
サイズ計算部802は、中間サブフレームの周波数スペクトルサイズを利用して、周波数スペクトルビンのサイズを計算することができる。周波数スペクトルビンの個数は、加重値関数決定部207が、ISF係数またはLSF係数を正規化するために設定した範囲に対応する周波数スペクトルビンの個数と同一に決定される。
【0109】
それにより、サイズ計算部802を介して導き出されたスペクトル分析情報である周波数スペクトルビンのサイズは、加重値関数決定部207がサイズ別加重値関数を決定するときに活用される。
【0110】
その後、加重値関数決定部207が加重値関数を決定する過程は、
図5ですでに具体的に説明したが、
図8ではそれに係わる説明を省略する。
【0111】
図9は、本発明の一実施形態によって、中間サブフレームのLPC符号化方式について説明するための図面である。
【0112】
CELP符号化技術は、入力信号に係わるLPC係数と励起信号とを必要とする。入力信号を符号化するとき、LPC係数が量子化されてもよい。しかし、LPC係数をそれ自体で量子化することは、ダイナミックレンジが広く、安定度確認が困難であるという問題点があるから、ダイナミックレンジが狭く、安定度確認が容易であるLSF(またはLSP)やISF(ISP)に変換されて符号化されてもよい。
【0113】
このとき、ISF係数やLSF係数に変換されたLPC係数は、一般的に量子化の効率のためにベクトル量子化される。この過程で、全てのLPC係数を同一の重要度にして量子化する場合、最終合成された入力信号の品質の劣化が発生することがある。すなわち、全てのLPC係数は、重要度が異なるので、重要なLPC係数のエラーが少なくてこそ、最終合成された入力信号の品質が向上する。LPC係数の重要度を考慮せずに、同一に重要度を適用して量子化する場合、入力信号の品質は落ちてしまう。かような重要度を決定するための加重値関数が要求される。
【0114】
一般的に、通信用音声符号化器は、5msのサブフレームと、20msのフレームとから構成される。GSM((登録商標)global system for mobile communication)及び3GPP(third generation partnership project)の音声符号化器であるAMRとAMR−WBは、5msのサブフレームが4個含まれた20msのフレームで構成される。
【0115】
図9から分かるように、LPC係数の量子化は、以前フレームと現在フレームとを構成するサブフレームのうち、最後のフレームである第4のサブフレーム(フレームエンド)を中心に1回ずつ遂行される。現在フレームの最初、第2及び第3のサブフレームのためのLPC係数は、以前フレームのフレームエンドと、現在フレームのフレームエンドとに係わる量子化されたLPC係数を補間することによって決定される。
【0116】
本発明の一実施形態によれば、音質向上のために、第2のサブフレームで線形予測分析を行って導き出されたLPC係数を符号化することができる。このとき、加重値関数決定部207は、以前フレームのフレームエンドに係わるLPC係数と、現在フレームのフレームエンドに係わるLPC係数とを利用して、中間サブフレームである現在フレームの第2のサブフレームについて、最適のinterpolation weightをclosed-loopで探索することができる。その後、16次LPC係数について、最もweighted distortionを最小化させるコードブック・インデックスが導き出されて伝送される。
【0117】
Weighted distortionを求めるためには、16次LPC係数に係わる加重値関数が必要である。このとき、使用される加重値関数は、数式(11)の通りである。数式(11)によれば、ISF係数の間隔を分析し、ISF係数の間隔が狭いところにさらに多くの加重値が適用される。
【0118】
【数12】
そして、数式(12)のように、追加的に低周波数強調(low frequency emphasis)が適用される。このとき、low frequency emphasisは、一次関数からなる数式である。
【0119】
【数13】
本発明によれば、ISF係数やLSF係数の間隔のみを利用して、加重値関数が導き出されるので、非常に単純な方式によって複雑度が低い。一般的には、ISF係数の間隔が狭いところで、スペクトルエネルギーが高くて重要な成分である可能性が高いが、実際にスペクトル分析が行われれば、かような結果が正確にマッチングされない場合が頻繁に発生する。
【0120】
従って、本発明の一実施形態によれば、類似した複雑度で、優秀な性能を有する量子化技術が提案される。提案した最初の方式は、以前フレームと現在フレームとの情報を補間して量子化する技術である。そして、第2の方式はLPC係数の周波数マッピングを介してスペクトル情報を決定し、スペクトル情報を介して、LPC係数の量子化のための最適の加重値関数を決定する技術である。
【0121】
また本発明の一実施形態による方法は、多様なコンピュータで具現される動作を遂行するためのプログラム命令を含むコンピュータで読み取り可能な媒体を含む。前記コンピュータで読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独で、または組み合わせて含んでもよい。前記媒体は、プログラム命令が、本発明のために特別に設計されて構成されたものや、コンピュータソフトウェア当業者に公知されて使用可能なものであってもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media);CD(compact disc)−ROM(read-only memory)、DVD(digital versatile disc)のような光記録媒体(optical media);フロプティカルディスク(floptical disk)のような磁気−光媒体(magneto-optical media);及びROM(read-only memory)、RAM(random-access memory)、フラッシュメモリなどのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置;が含まれる。前記媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でってもよい。プログラム命令の例としては、コンパイラによって作われるような機械語コードだけではなく、インタープリタなどを使用してコンピュータによって実行される高級言語コードを含む。
【0122】
以上のように、本発明の一実施形態は、たとえ限定された実施形態と図面とによって説明されたにしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、本発明が属する分野で当業者であるならば、かような記載から多様な修正及び変形が可能である。従って、本発明の一実施形態は、特許請求の範囲によってのみ把握されるものであり、それと均等であったり、等価である変形は、いずれも本発明思想の範疇に属するものである。
なお、次の付記を記す。
(付記1) 入力信号の中間サブフレームの線形予測符号化(LPC)係数を、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか一つに変換する第1係数変換部と、
前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、
前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、
少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、
前記量子化されたLPC係数は、装置のエンコーダに出力される装置。
(付記2) 前記加重値関数決定部は、
現在フレームのパラメータと、以前フレームのパラメータとを補間し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することを特徴とする付記1に記載の装置。
(付記3) 前記加重値関数決定部は、
前記以前フレームのフレームエンドのLPC係数を量子化するための第1加重値関数と、前記現在フレームのフレームエンドのLPC係数を量子化するための第2加重値関数とを補間し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することを特徴とする付記2に記載の装置。
(付記4) 前記加重値関数決定部は、
線形補間及び非線形補間のうち少なくとも一つを利用して補間を行い、(1)線形補間及び非線形補間を、全ての次数のベクトルに適用する方式、(2)サブベクトルごとに線形補間と非線形補間とを異ならせて適用する方式、(3)それぞれのLPC係数によって、線形補間と非線形補間とを異ならせて適用する方式のうちいずれか一つを遂行することを特徴とする付記2に記載の装置。
(付記5) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記1に記載の装置。
(付記6) 前記補間されたスペクトルサイズは、
現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを特徴とする付記5に記載の装置。
(付記7) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記5に記載の装置。
(付記8) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記7に記載の装置。
(付記9) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記1に記載の装置。
(付記10) 前記LPCスペクトルサイズは、
中間サブフレームのLPC係数を周波数変換したLPCスペクトルに基づいて決定されることを特徴とする付記9に記載の装置。
(付記11) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記9に記載の装置。
(付記12) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記11に記載の装置。
(付記13) 前記加重値関数決定部は、
前記中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することを特徴とする付記1に記載の装置。
(付記14) 前記加重値関数決定部は、
LPCスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することを特徴とする付記1に記載の装置。
(付記15) 前記周波数別加重値関数は、
前記中間サブフレームのLPC係数から変換されたISF係数またはLSF係数の周波数に対応する加重値関数であることを特徴とする付記14に記載の装置。
(付記16) 前記周波数別加重値関数は、
バークスケールで表現されることを特徴とする付記14に記載の装置。
(付記17) 入力信号の中間サブフレームの線形予測符号化(LPC)係数を、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか一つに変換する段階と、
前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、
前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、
少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、
前記量子化されたLPC係数は、エンコーダに出力される方法。
(付記18) 前記加重値関数を決定する段階は、
現在フレームのパラメータと、以前フレームのパラメータとを補間し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することを特徴とする付記17に記載の方法。
(付記19) 前記加重値関数を決定する段階は、
前記以前フレームのフレームエンドのLPC係数を量子化するための第1加重値関数と、前記現在フレームのフレームエンドのLPC係数を量子化するための第2加重値関数とを補間し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することを特徴とする付記18に記載の方法。
(付記20) 前記加重値関数を決定する段階は、
線形補間及び非線形補間のうち少なくとも一つを利用して補間を行い、(1)線形補間及び非線形補間を、全ての次数のベクトルに適用する方式、(2)サブベクトルごとに線形補間と非線形補間とを異ならせて適用する方式、(3)それぞれのLPC係数によって、線形補間と非線形補間とを異ならせて適用する方式のうちいずれか一つを遂行することを特徴とする付記18に記載の方法。
(付記21) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記17に記載の方法。
(付記22) 前記補間されたスペクトルサイズは、
現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを特徴とする付記21に記載の方法。
(付記23) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記21に記載の方法。
(付記24) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記23に記載の方法。
(付記25) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記17に記載の方法。
(付記26) 前記LPCスペクトルサイズは、
中間サブフレームのLPC係数を周波数変換したLPCスペクトルに基づいて決定されることを特徴とする付記25に記載の方法。
(付記27) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記25に記載の方法。
(付記28) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記27に記載の方法。
(付記29) 前記加重値関数を決定する段階は、
前記中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することを特徴とする付記17に記載の方法。
(付記30) 前記加重値関数を決定する段階は、
LPCスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することを特徴とする付記17に記載の方法。
(付記31) 前記周波数別加重値関数は、
前記中間サブフレームのLPC係数から変換されたISF係数またはLSF係数の周波数に対応する加重値関数であることを特徴とする付記30に記載の方法。
(付記32) 前記周波数別加重値関数は、
バークスケールで表現されることを特徴とする付記30に記載の方法。
(付記33) 付記17に記載の方法を遂行するために、少なくとも1つのプロセッサを制御するためのコンピュータで読み取り可能な命令語が記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。
(付記34) 線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数、またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、
前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、
少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、前記量子化されたLPC係数は、装置のエンコーダに出力される装置。
(付記35) 線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数、またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、
前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、
少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、前記量子化されたLPC係数は、エンコーダに出力される方法。
(付記36) 付記35に記載の方法を遂行するために、少なくとも1つのプロセッサを制御するためのコンピュータで読み取り可能な命令語が記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。