(58)【調査した分野】(Int.Cl.,DB名)
所定時間区間の入力音響信号から求めた線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、前記入力音響信号から求めた周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成部と、
前記周期性統合包絡系列から振幅値に依存する可変長符号化パラメータを計算する可変長符号化パラメータ計算部と、
前記スペクトル包絡系列から振幅値に依存する可変長符号化パラメータを計算する第2可変長符号化パラメータ計算部と、
可変長符号化パラメータを用いて、振幅値に依存する可変長符号化により、前記入力音響信号に由来する周波数領域の系列を符号化する可変長符号化部、
を備え、
前記可変長符号化部は、
前記入力音響信号の周期性の程度を示す指標があらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、前記可変長符号化パラメータ計算部が計算した可変長符号化パラメータを用いて符号化し、
前記周期性の程度を示す指標が前記の周期性の程度が大きいことを示す範囲ではない場合は、前記第2可変長符号化パラメータ計算部が計算した可変長符号化パラメータを用いて符号化する
符号化装置。
所定時間区間の入力音響信号から求めた線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、前記入力音響信号から求めた周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成部と、
前記周期性統合包絡系列の値が大きい周波数ほど、前記入力音響信号の振幅が大きいことを前提に、前記入力音響信号に由来する周波数領域の系列を符号化する可変長符号化部、
を備え
前記可変長符号化部は、
前記入力音響信号の周期性の程度を示す指標があらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、前記周期性統合包絡系列の値が大きい周波数ほど、前記入力音響信号の振幅が大きいことを前提に、前記入力音響信号に由来する周波数領域の系列を符号化し、
前記指標が前記の周期性の程度が大きいことを示す範囲ではない場合は、前記スペクトル包絡系列の値が大きい周波数ほど、前記入力音響信号の振幅が大きいことを前提に、前記入力音響信号に由来する周波数領域の系列を符号化する
符号化装置。
線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成部と、
入力された指標符号を復号して周期性の程度を示す指標を得る指標復号部と、
前記周期性統合包絡系列から振幅値に依存する可変長符号化パラメータを計算する可変長符号化パラメータ計算部と、
前記スペクトル包絡系列から振幅値に依存する可変長符号化パラメータを計算する第2可変長符号化パラメータ計算部と、
可変長符号化パラメータを用いて復号する可変長復号部、
を備え、
前記可変長復号部は、
前記指標があらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、前記可変長符号化パラメータ計算部が計算した可変長符号化パラメータを用いて復号し、
前記指標が前記の周期性の程度が大きいことを示す範囲ではない場合は、前記第2可変長符号化パラメータ計算部が計算した可変長符号化パラメータを用いて復号する
復号装置。
線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成部と、
可変長符号を復号して周波数領域の系列を得る可変長復号部、
を備え、
前記可変長復号部は、
入力された周期性の程度を示す指標があらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、前記周期性統合包絡系列の値が大きい周波数ほど、音響信号の振幅が大きいことを前提に、前記可変長符号を復号して周波数領域の系列を得て、
前記指標があらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、前記スペクトル包絡系列の値が大きい周波数ほど、音響信号の振幅が大きいことを前提に、前記可変長符号を復号して周波数領域の系列を得る
復号装置。
所定時間区間の入力音響信号から求めた線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、前記入力音響信号から求めた周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成ステップと、
前記周期性統合包絡系列から振幅値に依存する可変長符号化パラメータを計算する可変長符号化パラメータ計算ステップと、
前記スペクトル包絡系列から振幅値に依存する可変長符号化パラメータを計算する第2可変長符号化パラメータ計算ステップと、
可変長符号化パラメータを用いて、振幅値に依存する可変長符号化により、前記入力音響信号に由来する周波数領域の系列を符号化する可変長符号化ステップ、
を有し、
前記可変長符号化ステップは、
前記入力音響信号の周期性の程度を示す指標があらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、前記可変長符号化パラメータ計算ステップで計算した可変長符号化パラメータを用いて符号化し、
前記周期性の程度を示す指標が前記の周期性の程度が大きいことを示す範囲ではない場合は、前記第2可変長符号化パラメータ計算ステップで計算した可変長符号化パラメータを用いて符号化する
符号化方法。
所定時間区間の入力音響信号から求めた線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、前記入力音響信号から求めた周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成ステップと、
前記入力音響信号に由来する周波数領域の系列を符号化する可変長符号化ステップ、
を有し、
前記可変長符号化ステップは、
前記入力音響信号の周期性の程度を示す指標があらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、前記周期性統合包絡系列の値が大きい周波数ほど、前記入力音響信号の振幅が大きいことを前提に、前記入力音響信号に由来する周波数領域の系列を符号化し、
前記指標が前記の周期性の程度が大きいことを示す範囲ではない場合は、前記スペクトル包絡系列の値が大きい周波数ほど、前記入力音響信号の振幅が大きいことを前提に、前記入力音響信号に由来する周波数領域の系列を符号化する
符号化方法。
線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成ステップと、
入力された指標符号を復号して周期性の程度を示す指標を得る指標復号ステップと、
前記周期性統合包絡系列から振幅値に依存する可変長符号化パラメータを計算する可変長符号化パラメータ計算ステップと、
前記スペクトル包絡系列から振幅値に依存する可変長符号化パラメータを計算する第2可変長符号化パラメータ計算ステップと、
可変長符号化パラメータを用いて復号する可変長復号ステップ、
を有し、
前記可変長復号ステップは、
前記指標があらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、前記可変長符号化パラメータ計算ステップで計算した可変長符号化パラメータを用いて復号し、
前記指標が前記の周期性の程度が大きいことを示す範囲ではない場合は、前記第2可変長符号化パラメータ計算ステップで計算した可変長符号化パラメータを用いて復号する
復号方法。
線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成ステップと、
可変長符号を復号して周波数領域の系列を得る可変長復号ステップ、
を有し、
前記可変長復号ステップは、
入力された周期性の程度を示す指標があらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、前記周期性統合包絡系列の値が大きい周波数ほど、音響信号の振幅が大きいことを前提に、前記可変長符号を復号して周波数領域の系列を得て、
前記指標があらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、前記スペクトル包絡系列の値が大きい周波数ほど、音響信号の振幅が大きいことを前提に、前記可変長符号を復号して周波数領域の系列を得る
復号方法。
【発明を実施するための形態】
【0012】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【実施例1】
【0013】
図1に本発明の周期性統合包絡系列生成装置の機能構成例を、
図2に本発明の周期性統合包絡系列生成装置の処理フローを示す。周期性統合包絡系列生成装置100は、スペクトル包絡系列計算部120、周波数領域変換部110、周期性分析部130、周期性包絡系列生成部140、周期性統合包絡生成部150を備え、入力された時間領域の音響ディジタル信号を入力音響信号x(t)とし、係数列の周波数成分に基づいて振幅スペクトル包絡系列を変形した周期性統合包絡系列を生成する。
【0014】
<スペクトル包絡系列計算部120>
スペクトル包絡系列計算部120は、入力音響信号x(t)の時間領域の線形予測に基づき、入力音響信号の振幅スペクトル包絡系列W[1],…,W[N]を計算する(S120)。ただし、Nは正整数である。スペクトル包絡系列計算部120は、従来技術と同じであり、以下の手順で計算すればよい。
【0015】
(step1)所定の時間区間であるフレーム単位で、入力音響信号に対する線形予測分析を行って線形予測係数α
1,…,α
Pを求める。ただし、Pは予測次数を示す正整数である。例えば、全極型モデルであるP次自己回帰過程により、時刻tでの入力音響信号x(t)は、P時点まで遡った過去の自分自身の値x(t-1),…,x(t-P)と予測残差e(t)と線形予測係数α
1,…,α
pによって式(1)で表される。
【0016】
(step2)線形予測係数α
1,…,α
Pを用いてN点の入力音響信号の振幅スペクトル包絡系列W[1],…,W[N]を求める。例えば、振幅スペクトル包絡系列の各値W[n]は、線形予測係数α
1,…,α
Pに対応する量子化済線形予測係数^α
1,…,^α
Pを用いて式(2)で求めることができる。または、振幅スペクトル包絡系列の各値W[n]は、線形予測係数α
1,…,α
Pを用いて、式(2)の^α
pをα
pに置き換えた式で求めることができる。
【0017】
<周波数領域変換部110>
周波数領域変換部110は、所定の時間区間であるフレーム単位で、入力された時間領域の入力音響信号を周波数領域のN点の係数列X[1],…,X[N]に変換して出力する(S110)。周波数領域への変換は、MDCT(変形離散コサイン変換)やDFT(離散フーリエ変換)などの方法で行えばよい。
【0018】
<周期性分析部130>
周期性分析部130は、係数列X[1],…,X[N]を入力とし、当該係数列X[1],…,X[N]の周期Tを求め、周期Tを出力する(S130)。
【0019】
周期Tは、入力音響信号に由来する周波数領域の係数列、例えば、係数列X[1],…,X[N]、の周期性を有する成分の間隔(係数列が周期的に大きな値となる間隔)に対応する情報である。以下では周期Tを間隔Tと表現する場合もあるが、表現上の違いだけであり、同じものである。Tは正値であり、整数であってもよいし、小数(例えば、5.0、5.25、5.5、5.75)であってもよい。
【0020】
また、周期性分析部130は、必要に応じて、係数列X[1],…,X[N]を入力とし、周期性の程度を示す指標Sも求めて出力してもよい。この場合、例えば、係数列X[1],…,X[N]の周期性を有する成分の部分のエネルギーとそれ以外の部分のエネルギーとの比など基づいて周期性の程度を示す指標Sを求める。この場合は、指標Sは周波数領域のサンプル列の周期性の程度を示す指標となる。なお、周期性を有する成分の大きさが大きいほど、すなわち、周期Tの整数倍のサンプルやその近傍にあるサンプルの振幅(サンプル値の絶対値)が大きいほど、周波数領域のサンプル列の「周期性の程度」は大きい。
【0021】
なお、周期性分析部130は、時間領域の入力音響信号から時間領域の周期を求め、求めた時間領域の周期を周波数領域の周期に変換することで、周期Tを求めてもよい。また、時間領域の周期を周波数領域の周期に変換したものの定数倍やその近傍の値を周期Tとして求めてもよい。同様に、周期性分析部130は、時間領域の入力音響信号から、例えば、時間領域の周期分だけ時間がずれた信号列間の相関の大きさ等に基づいて、周期性の程度を示す指標Sを求めてもよい。
【0022】
要は、時間領域の入力音響信号やそれに由来する周波数領域係数列から周期Tや指標Sを求める方法は、従来より様々な方法が存在するので、その何れの方法を選択して利用してもよい。
【0023】
<周期性包絡系列生成部140>
周期性包絡系列生成部140は、間隔Tを入力とし、周期性包絡系列P[1],…,P[N]を出力する(S140)。周期性包絡系列P[1],…,P[N]は、ピッチ周期に起因する周期でピークを持つ周波数領域の離散系列、すなわち調波モデルに対応する離散系列である。
図3に周期性包絡系列P[1],…,P[N]の例を示す。周期性包絡系列P[1],…,P[N]は、
図3に示された波形のように、間隔Tの整数倍の近傍の整数値であるインデックスと、その前後所定数のインデックスに対応する周期性包絡の値のみ正の値を持ち、それ以外は0であるような系列である。間隔Tの整数倍の近傍の整数値であるインデックスが周期的に最大値(ピーク)をとり、その前後所定数のインデックスに対応するP[n]の値は、そのインデックスnがピークに対応するインデックスから離れるにつれて単調減少する関係にある。
図3の横軸の1,2,…,は離散化サンプル点のインデックス(以下、「周波数インデックス」)を表す。
【0024】
例えば、nを周波数インデックスを表す変数とし、τを極大値(ピーク)に対応する周波数インデックスとして、ピークの形状は以下の関数Q(n)で表せる。ただし、間隔Tの小数点以下の桁数がL桁であり、間隔T’をT’=T×2
Lとする。
【数2】
hはピークの高さを表し、間隔Tが大きいほどピークの高さが高くなる。また、PDはピーク部分の幅を表し、間隔Tが大きいほど幅が広くなる。
【0025】
Uを1からピークの数までを示す正整数(例えば、
図3の場合は1〜10)とし、vを1以上の整数(例えば、1から3程度)とし、floor(・)を小数点以下を切り捨てて整数値を返す関数とすると、周期性包絡系列P[n]は、例えば、
【数3】
のように計算すればよい。ただし、(U×T’)/2
L−v≦n≦(U×T’)/2
L+vである。例えば、L=2の場合、T=20.00であればT’=80、T=20.25であればT’=81、T=20.50であればT’=82、T=20.75であればT’=83である。なお、周期性包絡系列P[n]は、小数点第一位を四捨五入して整数値を返す関数Round(・)を用いて、
【数4】
のように求めてもよい。
【0026】
<周期性統合包絡生成部150>
周期性統合包絡生成部150は、少なくとも、周期性包絡系列P[1],…,P[N]、振幅スペクトル包絡系列W[1],…,W[N]を入力とし、周期性統合包絡系列W
M[1],…,W
M[N]を求める(S150)。具体的には、周期性統合包絡W
M[n]を次式のように求める。
【数5】
なお、δは、周期性統合包絡W
M[n]と係数X[n]の絶対値系列の形状が近くなるように決定される値または予め定めた値である。
【0027】
周期性統合包絡生成部150において周期性統合包絡W
M[n]と係数X[n]の絶対値系列の形状が近くなるようにδを決定する場合には、周期性統合包絡生成部150は、係数列X[1], …, X[N]も入力とし、決定されたδとそのときの周期性統合包絡系列W
M[1],…,W
M[N]を出力すればよい。例えば、δは、いくつかのδの候補、例えば、0.4と0.8の2つをδの候補、の中から以下の式により定義されるEが最小となるδに決めればよい。言い換えると、周期性統合包絡W
M[n]と係数X[n]の絶対値系列の形状が近くなるδに決めればよい。
【数6】
【0028】
δは、周期性統合包絡W
M[n]において周期性包絡P[n]をどの程度考慮するかを決める値である。言い換えれば、δは周期性統合包絡W
M[n]における振幅スペクトル包絡W[n]と周期性包絡P[n]の混合比率を決める値といえる。また、式(9)のGは係数列X[1],…,X[N]の各係数X[n]の絶対値の系列と周期性統合包絡系列の逆数の系列との内積である。式(8)の~W
M[n]は、周期性統合包絡の各値W
M[n]をGで正規化した正規化周期性統合包絡である。式(7)において、係数列X[1],…,X[N]と正規化周期性統合包絡系列~W
M[1],…,~W
M[N]の内積の4乗を計算しているのは、特に絶対値の大きい係数X[n]を強調して内積をとった値(距離)を小さくすることを意図している。つまり、係数列X[1],…,X[N]の中で特に絶対値の大きい係数X[n]と周期性統合包絡W
M[n]が近くなるようにδを決定することを意味している。
【0029】
また、周期性統合包絡生成部150において周期性の程度に応じてδの候補数を決定する場合には、周期性統合包絡生成部150は、周期性の程度を示す指標Sも入力とし、指標Sが、周期性が高いことに対応するフレームであることを示している場合には多くの候補数のδの候補の中から式(7)で定義されるEが最小となるδを選び、指標Sが、周期性が低いことに対応するフレームであることを示している場合にはδを予め定めた値としてもよい。すなわち、周期性統合包絡生成部150において周期性の程度に応じてδの候補数を決定する場合には、周期性が高いほどδの候補の数を多くすればよい。
【0030】
<実施例1の発明の効果>
図4A〜4Dに同じ音響信号に対して生成された系列の違いを説明するための例を示す。
図4Aに係数列X[1],…,X[N]を補間した曲線の形状を、
図4Bに周期性包絡系列P[1],…,P[N]を補間した曲線の形状を、
図4Cに平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を補間した曲線の形状を、
図4Dに周期性統合包絡系列W
M[1],…,W
M[N]を補間した曲線の形状を示す。
図4A〜4Dに示すとおり、周期性統合包絡系列W
M[1],…,W
M[N]は、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]に比べて、係数列X[1],…,X[N]に現れる周期的なピークを含んだ形状となっている。また、周期性統合包絡系列W
M[1],…,W
M[N]は、スペクトル包絡を表す情報である線形予測係数または量子化済線形予測係数の他に、間隔T、または、間隔Tと値δの情報があれば生成できる。したがって、入力音響信号のスペクトル包絡を表す情報に少ない情報量を追加するだけで、入力音響信号のピッチ周期に起因する振幅のピークを、線形予測係数により求まるスペクトル包絡より高精度に表現することができる。すなわち、線形予測係数または量子化済線形予測係数と、間隔T、または、間隔Tと値δと、の少ない情報量で入力音響信号の振幅を高精度に推定することができることになる。なお、平滑化振幅スペクトル包絡~W[n]は次式で表現される包絡であり、γは振幅スペクトル係数を鈍らせる(平滑化する)ための1以下の正の定数である。
【数7】
【0031】
また、本発明の周期性統合包絡系列生成装置を符号化装置と復号装置で用いる場合には、符号化装置に含まれる周期性統合包絡系列生成装置以外の処理部で得られた量子化済線形予測係数^α
pを特定する符号(線形予測係数符号C
L)と周期Tや時間領域の周期を特定する符号(周期符号C
T)が復号装置に入力されるので、本発明の周期性統合包絡系列生成装置からはδの情報を示す符号を出力すれば、復号側の周期性統合包絡系列生成装置でも符号化側の周期性統合包絡系列生成装置で生成した周期性統合包絡系列と同じ周期性統合包絡系列を生成できる。したがって、符号化装置から復号装置に符号を送る際に増加する符号量は少ない。
【0032】
<実施例1の発明のポイント>
実施例1の周期性統合包絡系列生成装置100では、周期性統合包絡生成部150が係数列X[1],…,X[N]の周期性成分に基づいて、振幅スペクトル包絡系列W[1],…,W[N]を変形し、周期性統合包絡系列W
M[1],…,W
M[N]としている点が最も重要なポイントである。特に、係数列X[1],…,X[N]の周期性の程度が大きいほど、すなわち、周期性を有する成分の大きさが大きいほど、振幅スペクトル包絡系列W[1],…,W[N]のうち間隔T(周期)の整数倍およびそれらの近傍のサンプルの値を大きく変更すれば、上記の効果を得やすい。「近傍のサンプル」とは、間隔Tの整数倍の近傍の整数値であるインデックスで示されるサンプルである。また、「近傍」とは、例えば、式(3)〜(5)などのあらかじめ定めた方法で決まる範囲とすればよい。
【0033】
また、係数列X[1],…,X[N]の周期性を有する成分の間隔Tが広いほど、式(4)と式(5)に示された周期性包絡系列P[1],…,P[N]は、大きい値を持ち、広い幅で、すなわち、間隔T(周期)の整数倍およびそれらの近傍の多くのサンプルで、0以外の値を持つ。つまり、周期性統合包絡生成部150は、係数列の周期性を有する成分の間隔Tが広いほど、振幅スペクトル包絡系列のうち間隔T(周期)の整数倍およびそれらの近傍のサンプルの値を大きく変更する。また、周期性統合包絡生成部150は、係数列の周期性を有する成分の間隔Tが広いほど、振幅スペクトル包絡系列を広い幅で、すなわち、間隔T(周期)の整数倍およびそれらの近傍の多くのサンプルで、サンプル値を変更する。「近傍の多くのサンプルで」とは、「近傍」に該当する範囲(あらかじめ定めた方法で決まる範囲)に存在するサンプルを多くすることを意味している。つまり、周期性統合包絡生成部150は、このように振幅スペクトル包絡系列を変形すれば、上記の効果を得やすい。
【0034】
なお、周期性統合包絡系列が持つ「入力音響信号のピッチ周期に起因する振幅のピークをより高精度に表現することができる。」という特徴を効果的に利用する例としては、符号化装置と復号装置があり、この例を実施例2,3に示している。ただし、周期性統合包絡系列の特徴の利用例は、符号化装置と復号装置以外にも、雑音除去装置やポストフィルタなどがあり得る。したがって、実施例1では周期性統合包絡系列生成装置を説明している。
【0035】
[変形例1](正規化係数列で周期性分析する例)
変形例1の周期性統合包絡系列生成装置も
図1に示す。また、変形例1の周期性統合包絡系列生成装置の処理フローも
図2に示す。周期性統合包絡系列生成装置101は、周波数領域系列正規化部111も備える点と、スペクトル包絡系列計算部121、周期性分析部131が周期性統合包絡系列生成装置100と異なり、その他の構成は同じである。以下では相違点についてのみ説明する。
【0036】
<スペクトル包絡系列計算部121>
スペクトル包絡系列計算部121は、振幅スペクトル包絡系列W[1],…,W[N]だけではなく、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]も求める。
【0037】
具体的には、スペクトル包絡系列計算部121は、スペクトル包絡系列計算部120で示した(step1),(step2)に加えて、以下の手順の処理を行う。
【0038】
(step3)量子化済線形予測係数^α
pのそれぞれにγ
pを乗算し、量子化済平滑化線形予測係数^α
1γ,^α
2γ
2,…,^α
Pγ
Pを求める。γは平滑化するための1以下の正の定数である。そして、式(10)によって、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を求める(S121)。もちろん、スペクトル包絡系列計算部120と同様に、量子化済線形予測係数^α
pに代えて線形予測係数α
pを用いてもよい。
【0039】
<周波数領域系列正規化部111>
周波数領域系列正規化部111は、係数列X[1],…,X[N]の各係数を平滑化振幅スペクトル包絡系列~W[1],…,~W[N]の各係数で除算して正規化係数列X
N[1],…,X
N[N]を得る。すなわち、n=1,…,Nに対して
X
N[n]=X[n]/~W[n] (11)
の計算を行い、正規化係数列X
N[1],…,X
N[N]を求める(S111)。
【0040】
<周期性分析部131>
周期性分析部131は、正規化係数列X
N[1],…,X
N[N]を入力とし、当該正規化係数列X
N[1],…,X
N[N]の周期Tを求め、周期Tを出力する(S131)。すなわち、本変形例では、入力音響信号に由来する周波数領域の係数列である正規化係数列X
N[1],…,X
N[N]の周期性を有する成分の間隔を周期Tとして求める。また、周期性分析部131は、必要に応じて、係数列X[1],…,X[N]を入力とし、周期性の程度を示す指標Sも求めて出力してもよい。
【0041】
その他の処理は周期性統合包絡系列生成装置100と同じである。したがって、実施例1と同様の効果が得られる。なお、周期性統合包絡系列生成装置101の場合は、周期性統合包絡生成部150は、振幅スペクトル包絡系列W[1],…,W[N]の代わりに平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を用いてもよい。この場合は、式(6)の代わりに次式の計算となる。
【数8】
【0042】
[変形例2](外部から情報が入力される例)
本発明の周期性統合包絡系列生成装置を符号化装置や復号装置が内部に備えている場合には、符号化装置や復号装置に含まれる周期性統合包絡系列生成装置以外の処理部で、係数列X[1],…,X[N]、正規化係数列X
N[1],…,X
N[N]、量子化済線形予測係数^α
p、量子化済平滑化線形予測係数^α
pγ
p、振幅スペクトル包絡W[1],…,W[N]、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]、周期T、指標Sなどが求められていることがある。このような場合は、周期性統合包絡系列生成装置に、周波数領域変換部、周波数領域正規化部、スペクトル包絡系列計算部、周期性分析部の少なくとも何れかを備えない構成としてもよい。この場合には、符号化装置内の周期性統合包絡系列生成装置以外の処理部から、量子化済線形予測係数^α
pを特定する符号(線形予測係数符号C
L)、周期Tや時間領域の周期を特定する符号(周期符号C
T)、指標Sを特定する符号、などが出力され、復号装置に入力される。したがって、この場合には、符号化装置内の周期性統合包絡系列生成装置からは、量子化済線形予測係数^α
pを特定する符号(線形予測係数符号C
L)、周期Tや時間領域の周期を特定する符号(周期符号C
T)、指標Sを特定する符号、などを出力する必要がない。
【0043】
また、本発明の周期性統合包絡系列生成装置を符号化装置や復号装置で用いる場合には、符号化装置と復号装置とで同一の周期性統合包絡系列を得られるようにする必要がある。したがって、符号化装置が出力し復号装置に入力される符号から特定可能な情報を用いて周期性統合包絡系列を得る必要がある。たとえば、符号化装置で用いる周期性統合包絡系列生成装置のスペクトル包絡系列計算部では、線形予測係数符号C
Lに対応する量子化済線形予測係数を用いて振幅スペクトル包絡系列を求め、復号装置で用いる周期性統合包絡系列生成装置のスペクトル包絡系列計算部では、符号化装置から出力されて復号装置に入力される線形予測係数符号C
Lに対応する復号線形予測係数を用いて振幅スペクトル包絡系列を求める必要がある。
【0044】
なお、符号化装置や復号装置で周期性統合包絡系列を用いる場合には、上述のように周期性統合包絡系列生成装置を内部に備えるのではなく、周期性統合包絡系列生成装置内の必要な処理部を符号化装置と復号装置に備えるようにすればよい。このような符号化装置や復号装置は実施例2で説明する。
【実施例2】
【0045】
≪符号化装置≫
図5に実施例2の符号化装置の機能構成例を、
図6に実施例2の符号化装置の処理フローを示す。符号化装置200は、スペクトル包絡系列計算部221、周波数領域変換部110、周波数領域系列正規化部111、周期性分析部230、周期性包絡系列生成部140、周期性統合包絡生成部250、可変長符号化パラメータ計算部260、可変長符号化部270を備える。符号化装置200は、入力された時間領域の音響ディジタル信号を入力音響信号x(t)とし、少なくとも量子化済線形予測係数^α
1,…,^α
Pを示す符号C
L、正規化係数列X
N[1],…,X
N[N]の周期を表す間隔Tの符号C
T、正規化係数列X
N[1],…,X
N[N]を可変長符号化した可変長符号C
Xを出力する。周波数領域系列正規化部111は実施例1変形例1と同じである。周波数領域変換部110と周期性包絡系列生成部140は実施例1と同じである。以下では異なる構成部について説明する。
【0046】
<スペクトル包絡系列計算部221>
スペクトル包絡系列計算部221は、入力音響信号x(t)の時間領域の線形予測に基づき、入力音響信号の振幅スペクトル包絡系列W[1],…,W[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を計算し、計算の過程で得た量子化済線形予測係数^α
1,…,^α
Pを示す符号C
Lも求める(S221)。ただし、Nは正整数である。スペクトル包絡系列計算部221は、以下の手順で処理すればよい。
【0047】
(step1)所定の時間区間であるフレーム単位で、入力音響信号に対する線形予測分析を行って線形予測係数α
1,…,α
Pを求める。ただし、Pは予測次数を示す正整数である。例えば、全極型モデルであるP次自己回帰過程により、時刻tでの入力音響信号x(t)は、P時点まで遡った過去の自分自身の値x(t-1),…,x(t-P)と予測残差e(t)と線形予測係数α
1,…,α
pによって式(1)で表される。
【0048】
(step2)線形予測係数α
1,…,α
Pを符号化して符号C
Lを得て出力するとともに、符号C
Lに対応する量子化済線形予測係数^α
1,…,^α
Pを求める。また、量子化済線形予測係数^α
1,…,^α
Pを用いてN点の入力音響信号の振幅スペクトル包絡系列W[1],…,W[N]を求める。例えば、振幅スペクトル包絡系列の各値W[n]は、式(2)で求めることができる。なお、線形予測係数α
1,…,α
Pを符号化して符号C
Lを得る方法は、線形予測係数をLSPパラメータに変換して、LSPパラメータを符号化して符号C
Lを得るなど、線形予測係数に変換可能な係数の何れを符号化して符号C
Lを得る何れの方法を用いてもよい。
【0049】
(step3)量子化済線形予測係数^α
pのそれぞれにγ
pを乗算し、量子化済平滑化線形予測係数^α
1γ,^α
2γ
2,…,^α
Pγ
Pを求める。γはあらかじめ定めた平滑化するための1以下の正の定数である。そして、式(10)によって、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を求める。
【0050】
<周期性分析部230>
周期性分析部230は、正規化係数列X
N[1],…,X
N[N]を入力とし、当該正規化係数列X
N[1],…,X
N[N]の間隔T(周期的に大きな値となる間隔)を求め、間隔Tと間隔Tを示す符号C
Tを出力する(S230)。また、周期性分析部230は、必要に応じて、周期性の程度を示す指標S(すなわち、周波数領域のサンプル列の周期性の程度を示す指標)、も求めて出力する。また、周期性分析部230は、必要に応じて、指標Sを示す符号C
Sも得て出力する。なお、指標Sと間隔T自体は実施例1変形例1の周期性分析部131と同じである。
【0051】
<周期性統合包絡生成部250>
周期性統合包絡生成部250は、少なくとも、周期性包絡系列P[1],…,P[N]、振幅スペクトル包絡系列W[1],…,W[N]を入力とし、周期性統合包絡系列W
M[1],…,W
M[N]を求めて周期性統合包絡W
M[n]を出力する。また、周期性統合包絡生成部250は、値δとして、予め定めた1つの値ではなく、予め定めた複数の候補値のうちの何れかを選択する場合には、係数列X[1], …, X[N]も入力とし、予め定めた複数の候補値のうち周期性統合包絡W
M[n]と係数X[n]の絶対値系列の形状が近くなる候補値を値δとして求め、値δを示す符号C
δも出力する(S250)。
【0052】
周期性統合包絡W
M[n]と値δは実施例1と同じであり、周期性統合包絡W
M[n]は式(6),…,(9)のように求めればよい。周期性統合包絡生成部250において周期性の程度に応じてδの候補数を決定する場合には、周期性統合包絡生成部250は、周期性の程度を示す指標Sも入力とし、指標Sが周期性が高いことに対応するフレームの場合には多くの候補数のδの候補の中から式(7)で定義されるEが最小となるδを選び、指標Sが周期性が低いことに対応するフレームである場合にはδを1つの予め定めた値としてもよい。なお、δを予め定めた値にする場合は、値δを示す符号C
δを出力する必要はない。
【0053】
<可変長符号化パラメータ計算部260>
可変長符号化パラメータ計算部260は、周期性統合包絡系列W
M[1],…,W
M[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と正規化係数列X
N[1],…,X
N[N]を入力とし、可変長符号化パラメータr
nを求める(S260)。可変長符号化パラメータ計算部260は、周期性統合包絡系列W
M[1],…,W
M[N]から求めた振幅値に依存して可変長符号化パラメータr
nを計算することを特徴としている。
【0054】
可変長符号化パラメータは、符号化対象の信号、すなわち、正規化係数列X
N[1],…,X
N[N]の各係数の振幅の取り得る範囲を特定するパラメータである。例えば、ライス符号化の場合にはライスパラメータが可変長符号化パラメータに相当し、算術符号化の場合は符号化対象の信号の振幅の取り得る範囲が可変長符号化パラメータに相当する。
【0055】
1サンプルごとに可変長符号化を行う場合には、正規化係数列の各係数X
N[n]について可変長符号化パラメータが計算される。複数のサンプルからなるサンプル群ごとに(例えば2サンプルずつ)まとめて可変長符号化を行う場合には、サンプル群ごとに可変長符号化パラメータが計算される。つまり、可変長符号化パラメータ計算部260は、正規化係数列の一部である正規化部分係数列ごとに、可変長符号化パラメータr
nを計算する。ここで、正規化部分係数列は複数個あり、複数個の正規化部分係数列には正規化係数列の係数が重複されずに含まれるものとする。以下に、1サンプルごとにライス符号化を行う場合を例に、可変長符号化パラメータの計算方法を説明する。
【0056】
(step1)正規化係数列X
N[1],…,X
N[N]の各係数の振幅の平均の対数を、基準となるライスパラメータsb(基準となる可変長符号化パラメータ)として次式のように算出する。
【数9】
sbはフレームごとに1度だけ符号化されて、基準となるライスパラメータ(基準となる可変長符号化パラメータ)に対応する符号C
sbとして復号装置400に伝送される。あるいは復号装置400に伝送される別の情報から正規化係数列X
N[1],…,X
N[N]の振幅の平均値を推定できる場合は、符号化装置200と復号装置400で共通に振幅の平均値の推定値からsbを近似的に決定する方法を決めておいてもよい。例えば、包絡の傾きを表すパラメータ、区分帯域ごとの平均包絡の大きさを表すパラメータを別途使う符号化の場合には、復号装置400に伝送される別の情報から振幅の平均値を推定できる。この場合は、sbを符号化し、基準となるライスパラメータに対応する符号C
sbを復号装置400へ出力しなくてもよい。
【0057】
(step2)下記式により閾値θを算出する。
【数10】
θは、周期性統合包絡系列の各値W
M[n]を平滑化振幅スペクトル包絡系列の各値~W[n]で除算した値の振幅の平均の対数である。
【0058】
(step3) |W
M[n]/~W[n]|がθより大きいほど、正規化係数X
N[n]をライス符号化するためのライスパラメータr
nをsbよりも大きな値として決定する。|W
M[n]/~W[n]|がθより小さいほど、正規化係数X
N[n]をライス符号化するためのライスパラメータr
nをsbよりも小さな値として決定する。
【0059】
(step4)step3の処理を全てのn=1,2,…,Nについて繰り返して、各X
N[n]についてのライスパラメータr
nを求める。
【0060】
<可変長符号化部270>
可変長符号化部270は、可変長符号化パラメータ計算部260で求めた可変長符号化パラメータr
nを用いて正規化係数列X
N[1],…,X
N[N]を可変長符号化し、可変長符号C
Xを出力する(S270)。例えば、可変長符号化部270は、可変長符号化パラメータ計算部260で求めたライスパラメータr
nを用いて正規化係数列X
N[1],…,X
N[N]をライス符号化し、得られた符号を可変長符号C
Xとして出力する。可変長符号化パラメータ計算部260で求めたライスパラメータr
nは、周期性統合包絡系列の振幅値に依存する可変長符号化パラメータであり、周期性統合包絡系列の値が大きい周波数ほど大きな値となっている。ライス符号化は、振幅値に依存する可変長符号化の公知技術のうちの1つであり、ライスパラメータr
nを用いて振幅値に依存する可変長符号化を行うものである。また、周期性統合包絡生成部250で生成した周期性統合包絡系列は、入力音響信号のスペクトル包絡を高精度に表現するものである。すなわち、可変長符号化部270は、周期性統合包絡系列の値が大きい周波数ほど、前記入力音響信号の周波数領域の係数列であるX[1],…,X[N]の振幅が大きいとことを前提に、正規化係数列X
N[1],…,X
N[N]を可変長符号化していることになり、言い換えれば、可変長符号化パラメータを用いて、振幅値に依存する可変長符号化により、正規化係数列X
N[1],…,X
N[N]を符号化していることになる。ここでいう振幅値とは、符号化対象の係数列の平均振幅値、係数列に含まれる各係数の振幅の推定値、係数列の振幅の包絡の推定値などである。
【0061】
符号化装置200は、このような処理によって得られた量子化済線形予測係数^α
1,…,^α
Pを示す符号C
L、間隔Tを示す符号C
T、正規化係数列X
N[1],…,X
N[N]を可変長符号化した可変長符号C
Xを出力する。また、必要に応じて値δを示す符号C
δと基準となる可変長符号化パラメータsbを示す符号C
sbも出力する。符号化装置200から出力された符号は、復号装置400に入力される。
【0062】
[符号化装置の変形例1](外部から情報が入力される例)
なお、符号化装置としては、周期性包絡系列生成部140と周期性統合包絡生成部250と可変長符号化パラメータ計算部260と可変長符号化部270だけを備え、符号化装置の外部で生成された平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と、正規化係数列X
N[1],…,X
N[N]、間隔Tと、必要に応じて振幅スペクトル包絡系列W[1],…, W[N]と、必要に応じて指標Sとを入力とし、可変長符号C
Xを出力してもよい。
【0063】
[符号化装置の変形例2](係数列X[n]から間隔Tを求める例)
上述の周期性分析部230では正規化係数列X
N[1],…,X
N[N]を入力として間隔Tを求めているが、周期性分析部230では周波数領域変換部110が出力した係数列X[1],…,X[N]を入力として間隔Tを求めてもよい。この場合は、実施例1の周期性分析部130と同じ方法で間隔Tを求める。
【0064】
≪復号装置≫
図7に実施例2の復号装置の機能構成例を、
図8に実施例2の復号装置の処理フローを示す。復号装置400は、スペクトル包絡系列計算部421、周期性包絡系列生成部440、周期性統合包絡生成部450、可変長符号化パラメータ計算部460、可変長復号部470、周波数領域系列逆正規化部411、周波数領域逆変換部410を備える。復号装置400は、量子化済線形予測係数^α
1,…,^α
Pを示す符号C
L、間隔Tを示す符号C
T、正規化係数列X
N[1],…,X
N[N]を可変長符号化した可変長符号C
Xを受け取り、音響信号を出力する。なお、必要に応じて値δを示す符号C
δと基準となる可変長符号化パラメータsbを示す符号C
sbと指標Sを示す符号C
Sも受け取る。以下に、各構成部の詳細を示す。
【0065】
<スペクトル包絡系列計算部421>
スペクトル包絡系列計算部421は、符号C
Lを入力とし、振幅スペクトル包絡系列W[1],…,W[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を計算する(S421)。より具体的には、以下の手順で処理すればよい。
【0066】
(step1)符号C
Lを復号し、復号線形予測係数^α
1,…,^α
Pを得る。
【0067】
(step2)復号線形予測係数^α
1,…,^α
Pを用いてN点の振幅スペクトル包絡系列W[1],…,W[N]を求める。例えば、振幅スペクトル包絡系列の各値W[n]は、式(2)で求めることができる。
【0068】
(step3)復号線形予測係数^α
pのそれぞれにγ
pを乗算し、復号平滑化線形予測係数^α
1γ,^α
2γ
2,…,^α
Pγ
Pを求める。γはあらかじめ定めた平滑化するための1以下の正の定数である。そして、式(10)によって、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を求める。
【0069】
<周期性包絡系列生成部440>
周期性包絡系列生成部440は、間隔Tを示す符号C
Tを入力とし、符号C
Tを復号し、間隔Tを得る。そして、符号化装置200の周期性包絡系列生成部140と同じ方法で周期性包絡系列P[1],…,P[N]を求め、出力する(S440)。
【0070】
<周期性統合包絡生成部450>
周期性統合包絡生成部450には、周期性包絡系列P[1],…,P[N]、振幅スペクトル包絡系列W[1],…,W[N]、符号C
δ、符号C
Sが入力される。ただし、符号C
δ、符号C
Sは入力されない場合もある。周期性統合包絡生成部450は、符号C
δを復号し、値δを取得する。ただし、符号C
δが入力されない場合は、符号C
δの復号は行わず、周期性統合包絡生成部450に予め記憶された値δを取得する。なお、周期性統合包絡生成部450は、符号C
Sが入力された場合には、符号C
Sを復号して指標Sを取得し、取得した指標Sが、周期性が高いことに対応するフレームの場合には符号C
δを復号して値δを取得し、取得した指標Sが、周期性が低いことに対応するフレームである場合には符号C
δの復号は行わず、周期性統合包絡生成部450に予め記憶された値δを取得する。そして、周期性統合包絡生成部450は、式(6)によって、周期性統合包絡系列W
M[1],…,W
M[N]を求める。(S450)
【0071】
<可変長符号化パラメータ計算部460>
可変長符号化パラメータ計算部460は、周期性統合包絡系列W
M[1],…,W
M[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と符号C
sbを入力とし、可変長符号化パラメータr
nを得る(S460)。ただし、復号装置400に伝送される別の情報から振幅の平均値を推定できる場合は、別の情報から推定した振幅の平均値の推定値からsbを近似的に決定する方法を決めておいてもよい。この場合は、符号C
sbは入力されない。以下に、1サンプルごとにライス復号を行う場合を例に、可変長符号化パラメータの計算方法を説明する。
【0072】
(step1)符号C
sbを復号して、基準となるライスパラメータsb(基準となる可変長符号化パラメータ)を得る。なお、符号化装置200と復号装置400で共通に振幅の平均値の推定値からsbを近似的に決定する方法を決めている場合は、その方法で求める。
【0073】
(step2)閾値θを式(14)で算出する。
【0074】
(step3) |W
M[n]/~W[n]|がθより大きいほど、ライスパラメータr
nをsbよりも大きな値として、符号化装置200の可変長符号化パラメータ計算部260と同じ方法で決定する。|W
M[n]/~W[n]|がθより小さいほど、ライスパラメータr
nをsbよりも小さな値として、符号化装置200の可変長符号化パラメータ計算部260と同じ方法で決定する。
【0075】
(step4)step3の処理を全てのn=1,2,…,Nについて繰り返して、各X
N[n]についてのライスパラメータr
nを求める。
【0076】
<可変長復号部470>
可変長復号部470は、可変長符号化パラメータ計算部460で求めた可変長符号化パラメータr
nを用いて可変長符号C
Xを復号して復号正規化係数列^X
N[1],…,^X
N[N]を得る(S470)。例えば、可変長復号部470は、可変長符号化パラメータ計算部460で求めたライスパラメータr
nを用いて可変長符号C
Xを復号して復号正規化係数列^X
N[1],…,^X
N[N]を得る。可変長復号部470の復号方法は、可変長符号化部270の符号化方法に対応するものである。
【0077】
<周波数領域系列逆正規化部411>
周波数領域系列逆正規化部411は、復号正規化係数列^X
N[1],…,^X
N[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を入力とし、
^X[n]=^X
N[n]・~W[n] (15)
のように、復号係数列^X[1],…,^X[N]を求めて出力する(S411)。
【0078】
<周波数領域逆変換部410>
周波数領域逆変換部410は、復号係数列^X[1],…,^X[N]を入力とし、復号係数列^X[1],…,^X[N]を所定の時間区間であるフレーム単位の音響信号(時間領域)に変換する(S410)。
【0079】
[復号装置の変形例1](外部から情報が入力される例)
なお、復号装置としては、周期性包絡系列生成部440と周期性統合包絡生成部450と可変長符号化パラメータ計算部460と可変長復号部470だけを備え、復号装置に必要に応じて入力される符号C
δと符号C
sbに加えて、復号装置の外部で得られた平滑化振幅スペクトル包絡系列~W[1],…,~W[N]、振幅スペクトル包絡系列W[1],…,W[N]、間隔T、必要に応じて指標Sも入力とし、正規化係数列X
N[1],…,X
N[N]を出力し、外部で平滑化振幅スペクトル包絡系列を乗算して時間領域の音響信号に変換してもよい。
【0080】
<実施例2の発明の効果>
可変長符号化は、符号化対象の入力値の振幅の取りうる範囲に合わせて適応的に符号を決定することで符号化効率を向上させる符号化方法である。実施例2では周波数領域の係数列である正規化係数列X
N[1],…,X
N[N]を符号化対象としているが、符号化対象の係数列に含まれる各係数の振幅の情報をより正確に用いて求めた可変長符号化パラメータを用いて可変長符号化をすれば符号化装置が行う可変長符号化自体の符号化効率は高くなる。しかし、復号装置が可変長符号化パラメータを求めるために、符号化装置から復号装置に対して符号化対象の係数列に含まれる各係数の振幅の情報をより正確に送る必要があり、その分だけ符号化装置から復号装置に送る符号量が増大してしまう。
【0081】
符号量の増大を抑えるためには、少ない符号量の符号から符号化対象の係数列に含まれる各係数の振幅の推定値を得る方法が必要である。実施例2の周期性統合包絡系列W
M[1],…,W
M[N]は係数列X[1],…,X[N]を高精度に近似するので、|W
M[1]/~W[1]|,…,|W
M[N]/~W[N]|は可変長符号化対象の係数であるX
N[1], X
N[2],…, X
N[N]の振幅包絡を高精度に近似できる。つまり、|W
M[1]/~W[1]|,…,|W
M[N]/~W[N]|は、符号化対象の各係数の振幅と正の相関を持つ系列となっている。
【0082】
また、|W
M[1]/~W[1]|, |W
M[2]/~W[2]|,…,|W
M[N]/~W[N]|を復号装置側で復元するために必要な情報は、
・量子化済線形予測係数^α
1,…,^α
Pの情報(符号C
L)
・間隔Tを示す情報(符号C
T)
・値δを示す情報(符号C
δ)
である。すなわち、実施例2の符号化装置と復号装置によれば、符号化装置に入力された入力音響信号のピッチ周期に起因する振幅のピークを含む包絡を、符号C
L、符号C
T、符号C
δのみの少ない情報量で、復号装置で再現することが可能となる。
【0083】
なお、実施例2の符号化装置と復号装置は、線形予測やピッチ予測を伴う符号化及び復号を行う符号化装置及び復号装置と併用して用いられることが多い。この場合は、符号C
Lと符号C
Tは、符号化装置200外にある線形予測やピッチ予測を伴う符号化を行う符号化装置から、復号装置400外にある線形予測やピッチ予測を伴う復号を行う復号装置に送られている符号である。したがって、符号化装置側に入力された入力音響信号のピッチ周期に起因する振幅のピークを含む包絡を復号装置側で復元するために符号化装置200から復号装置400に送る必要があるのは符号C
δである。符号C
δの符号量は小さく(それぞれ、せいぜい3ビット程度であり、1ビットでも効果が得られる)、符号化対象の正規化係数列に含まれる部分系列ごとの可変長符号化パラメータに対応する符号の総符号量よりも少ない。
【0084】
よって、実施例2の符号化装置、復号装置によれば、少ない符号量の増加で、符号化効率を向上させることができる。
【0085】
<実施例2の発明のポイント>
上述の効果を得るというポイントで実施例2の符号化装置、復号装置を考えると、符号化装置200が、
・所定時間区間の入力音響信号から求めた線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、入力音響信号から求めた周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成部250
・周期性統合包絡系列の値が大きい周波数ほど、入力音響信号の振幅が大きいことを前提に、入力音響信号に由来する周波数領域の系列を符号化する可変長符号化部270
を有し、復号装置400が、
・線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成部450
・周期性統合包絡系列の値が大きい周波数ほど、音響信号の振幅が大きいことを前提に、可変長符号を復号して周波数領域の系列を得る可変長復号部470、
を有することを特徴とすればよい。なお、「周期性統合包絡系列の値が大きい周波数ほど、入力音響信号の振幅が大きいことを前提に」と「周期性統合包絡系列の値が大きい周波数ほど、音響信号の振幅が大きいことを前提に」とは、周期性統合包絡系列が、入力音響信号または音響信号の振幅の大きい周波数において大きい値になることを特徴としていることを示している。また、「入力音響信号に由来する」とは、入力音響信号から求められることや入力音響信号に対応していることを意味している。例えば、係数列X[1],…,X[N]や正規化係数列X
N[1],…,X
N[N]は、入力音響信号に由来する周波数領域の系列である。
【実施例3】
【0086】
≪符号化装置≫
図9に実施例3の符号化装置の機能構成例を、
図10に実施例3の符号化装置の処理フローを示す。符号化装置300は、スペクトル包絡系列計算部221、周波数領域変換部110、周波数領域系列正規化部111、周期性分析部330、周期性包絡系列生成部140、周期性統合包絡生成部250、可変長符号化パラメータ計算部260、第2可変長符号化パラメータ計算部380、可変長符号化部370を備える。符号化装置300は、入力された時間領域の音響ディジタル信号を入力音響信号x(t)とし、少なくとも量子化済線形予測係数^α
1,…,^α
Pを示す符号C
L、正規化係数列X
N[1],…,X
N[N]の周期を表す間隔Tの符号C
T、係数列X[1],…,X[N]または正規化係数列X
N[1],…,X
N[N]の周期性の程度を示す所定の指標Sと指標Sを示す符号C
S、正規化係数列X
N[1],…,X
N[N]を可変長符号化した可変長符号C
Xを出力する。周波数領域系列正規化部111は実施例1変形例1と同じである。周波数領域変換部110と周期性包絡系列生成部140は実施例1と同じである。振幅スペクトル包絡系列計算部221、周期性統合包絡生成部250、可変長符号化パラメータ計算部260は、実施例2と同じである。以下では異なる構成部について説明する。
【0087】
<周期性分析部330>
周期性分析部330は、正規化係数列X
N[1],…,X
N[N]を入力とし、
当該正規化係数列X
N[1],…,X
N[N]の周期性の程度を示す指標Sと間隔T(周期的に大きな値となる間隔)とを求め、指標Sと指標Sを示す符号C
Sと間隔Tと間隔Tを示す符号C
Tを出力する(S330)。なお、指標Sと間隔T自体は実施例1変形例1の周期性分析部131と同じである。
【0088】
そして、符号化装置300では、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、可変長符号化パラメータ計算部260が可変長符号化パラメータr
nを計算し、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、第2可変長符号化パラメータ計算部380が可変長符号化パラメータr
nを計算する(S390)。「あらかじめ定めた周期性の程度が大きいことを示す範囲」は、例えば、指標Sが所定の閾値以上のときとすればよい。
【0089】
<第2可変長符号化パラメータ計算部380>
第2可変長符号化パラメータ計算部380は、振幅スペクトル包絡系列W[1],…,W[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と正規化係数列X
N[1],…,X
N[N]を入力とし、可変長符号化パラメータr
nを求める(S380)。可変長符号化パラメータ計算部260は、周期性統合包絡系列W
M[1],…,W
M[N]から求めた振幅値に依存して可変長符号化パラメータr
nを計算することを特徴としているのに対して、第2可変長符号化パラメータ計算部380は、振幅スペクトル包絡系列から求めた振幅値に依存して可変長符号化パラメータを計算することを特徴としている。以下に、1サンプルごとにライス符号化を行う場合を例に、可変長符号化パラメータの計算方法を説明する。
【0090】
(step1)正規化係数列X
N[1],…,X
N[N]の各係数の振幅の平均の対数を、基準となるライスパラメータsb(基準となる可変長符号化パラメータ)として式(13)のように算出する。この処理は、可変長符号化パラメータ計算部260と同じである。
【0091】
(step2)下記式により閾値θを算出する。
【数11】
θは、振幅スペクトル包絡系列の各値W[n]を平滑化振幅スペクトル包絡系列の各値~W[n]で除算した値の振幅の平均の対数である。
【0092】
(step3) |W[n]/~W[n]|がθより大きいほど、正規化係数X
N[n]をライス符号化するためのライスパラメータr
nをsbよりも大きな値として決定する。|W[n]/~W[n]|がθより小さいほど、正規化係数X
N[n]をライス符号化するためのライスパラメータr
nをsbよりも小さな値として決定する。
【0093】
(step4)step3の処理を全てのn=1,2,…,Nについて繰り返して、各X
N[n]についてのライスパラメータr
nを求める。
【0094】
<可変長符号化部370>
可変長符号化部370は、可変長符号化パラメータr
nを用いて正規化係数列X
N[1],…,X
N[N]を可変長符号化し、可変長符号C
Xを出力する(S370)。ただし、可変長符号化パラメータr
nは、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、可変長符号化パラメータ計算部260が計算した可変長符号化パラメータr
nであり、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、第2可変長符号化パラメータ計算部380が計算した可変長符号化パラメータr
nである。
【0095】
符号化装置300は、このような処理によって得られた量子化済線形予測係数^α
1,…,^α
Pを示す符号C
L、周期性の程度を示す指標Sを示す符号C
S、間隔Tを示す符号C
T、正規化係数列X
N[1],…,X
N[N]を可変長符号化した可変長符号C
Xを出力し、復号側に送信する。また、必要に応じて値δを示す符号C
δと基準となる可変長符号化パラメータsbを示す符号C
sbも出力し、復号側に送信する。
【0096】
[符号化装置の変形例1](外部から情報が入力される例)
なお、符号化装置としては、周期性包絡系列生成部140と周期性統合包絡生成部250と可変長符号化パラメータ計算部260と第2可変長符号化パラメータ計算部380と可変長符号化部370だけを備え、符号化装置の外部で生成された平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と正規化係数列X
N[1],…,X
N[N]、間隔Tと、必要に応じて振幅スペクトル包絡系列W[1],…, W[N]と、必要に応じて指標Sとを入力とし、可変長符号C
Xを出力してもよい。
【0097】
[符号化装置の変形例2](係数列X[n]から間隔Tを求める例)
上述の周期性分析部330では正規化係数列X
N[1],…,X
N[N]を入力として間隔Tを求めているが、周期性分析部330では周波数領域変換部110が出力した係数列X [1],…,X [N]を入力として間隔Tを求めてもよい。この場合は、実施例1の周期性分析部130と同じ方法で間隔Tを求める。
【0098】
≪復号装置≫
図11に実施例3の復号装置の機能構成例を、
図12に実施例3の復号装置の処理フローを示す。復号装置500は、スペクトル包絡系列計算部421、指標復号部530、周期性包絡系列生成部440、周期性統合包絡生成部450、可変長符号化パラメータ計算部460、第2可変長符号化パラメータ計算部580、可変長復号部570、周波数領域系列逆正規化部411、周波数領域逆変換部410を備える。復号装置500は、量子化済線形予測係数^α
1,…,^α
Pを示す符号C
L、指標Sを示す符号C
S、間隔Tを示す符号C
T、正規化係数列X
N[1],…,X
N[N]を可変長符号化した可変長符号C
Xを受け取り、音響信号を出力する。なお、必要に応じて値δを示す符号C
δと基準となる可変長符号化パラメータsbを示す符号C
sbも受け取る。スペクトル包絡系列計算部421、周期性包絡系列生成部440、周期性統合包絡生成部450、可変長符号化パラメータ計算部460、周波数領域系列逆正規化部411、周波数領域逆変換部410は実施例2と同じである。以下では異なる構成部について説明する。
【0099】
<指標復号部530>
指標復号部530は、符号C
Sを復号し、指標Sを得る。復号装置500では、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、可変長符号化パラメータ計算部460が可変長符号化パラメータr
nを計算し、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、第2可変長符号化パラメータ計算部580が可変長符号化パラメータr
nを計算する(S590)。なお、「あらかじめ定めた周期性の程度が大きいことを示す範囲」は、符号化装置300と同じ範囲である。
【0100】
<第2可変長符号化パラメータ計算部580>
第2可変長符号化パラメータ計算部580は、振幅スペクトル包絡系列W[1],…,W[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と符号C
sbを入力とし、可変長符号化パラメータr
nを求める(S580)。ただし、復号装置500に伝送される別の情報から振幅の平均値を推定できる場合は、別の情報から推定した振幅の平均値の推定値からsbを近似的に決定する方法を決めておいてもよい。この場合は、符号C
sbは入力されない。以下に、1サンプルごとにライス復号を行う場合を例に、可変長符号化パラメータの計算方法を説明する。
【0101】
(step1)符号C
sbを復号して、基準となるライスパラメータsb(基準となる可変長符号化パラメータ)を得る。なお、符号化装置300と復号装置500で共通に振幅の推定値からsbを近似的に決定する方法を決めている場合は、その方法で求める。
【0102】
(step2)閾値θを式(16)で算出する。
【0103】
(step3) |W[n]/~W[n]|がθより大きいほど、ライスパラメータr
nをsbよりも大きな値として、符号化装置300の第2可変長符号化パラメータ計算部380と同じ方法で決定する。|W[n]/~W[n]|がθより小さいほど、ライスパラメータr
nをsbよりも小さな値として、符号化装置300の第2可変長符号化パラメータ計算部380と同じ方法で決定する。
【0104】
(step4)step3の処理を全てのn=1,2,…,Nについて繰り返して、各X
N[n]についてのライスパラメータr
nを求める。
【0105】
<可変長復号部570>
可変長復号部570は、可変長符号化パラメータr
nを用いて可変長符号C
Xを復号して復号正規化係数列^X
N[1],…,^X
N[N]を求める(S570)。ただし、可変長符号化パラメータr
nは、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、可変長符号化パラメータ計算部460が計算した可変長符号化パラメータr
nであり、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、第2可変長符号化パラメータ計算部580が計算した可変長符号化パラメータr
nである。
【0106】
[復号装置の変形例1](外部から情報が入力される例)
なお、復号装置としては、周期性包絡系列生成部440と周期性統合包絡生成部450と可変長符号化パラメータ計算部460と第2可変長符号化パラメータ計算部580と可変長復号部570だけを備え、復号装置に必要に応じて入力される符号C
δと符号C
sbに加えて、復号装置の外部で得られた平滑化振幅スペクトル包絡系列~W[1],…,~W[N]、振幅スペクトル包絡系列W[1],…,W[N]、間隔T、指標Sも入力とし、正規化係数列X
N[1],…,X
N[N]を出力し、外部で平滑化振幅スペクトル包絡系列を乗算して時間領域の音響信号に変換してもよい。
【0107】
<実施例3の発明の効果>
入力音響信号の周期性の程度が小さい場合には、入力音響信号のピッチ周期に起因する振幅のピークは小さい。そこで、実施例3の符号化装置、復号装置は、符号化の対象となる音響信号の周期性の程度が大きい場合には周期性統合包絡系列を用いて可変長符号化パラメータを求め、符号化の対象となる音響信号の周期性の程度が大きくない場合には振幅スペクトル包絡系列を用いて可変長符号化パラメータを求めるため、より適した可変長符号化パラメータを用いて可変長符号化でき、符号化精度を上げることができるという効果がある。
【0108】
上述の実施例1〜3では、振幅スペクトル包絡系列、平滑化振幅スペクトル包絡系列、周期性統合包絡系列等について振幅の系列を用いる例を説明したが、振幅の系列に代えてパワーの系列、すなわち、W[n]、~W[n]、W
M[n]としてパワースペクトル包絡系列、平滑化パワースペクトル包絡系列、パワーの系列である周期性統合包絡系列を用いてもよい。
【0109】
[プログラム、記録媒体]
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0110】
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0111】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
【0112】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0113】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0114】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。