(58)【調査した分野】(Int.Cl.,DB名)
所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
各時間区間について、前記周期化処理部で求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索部と、
を有することを特徴とする符号化装置。
前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項1記載の符号化装置。
前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項1記載の符号化装置。
所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列求める周期化処理部と、
各時間区間について、前記周期化処理部で求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索部と、
を有することを特徴とする符号化装置。
前記ピッチシャープニング係数決定部は、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項6記載の復号装置。
前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項6記載の復号装置。
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
を有することを特徴とする復号装置。
前記ピッチシャープニング係数決定部は、処理対象の時間区間の線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項9記載の復号装置。
所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
各時間区間について、前記周期化処理ステップで求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索ステップと、
を有することを特徴とする符号化方法。
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項11記載の符号化方法。
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項11記載の符号化方法。
所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
各時間区間について、前記周期化処理ステップで求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索ステップと、
を有することを特徴とする符号化方法。
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項16記載の復号方法。
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項16記載の復号方法。
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列求める周期化処理ステップと、
を有することを特徴とする復号方法。
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間の線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項19記載の復号方法。
【発明を実施するための形態】
【0011】
以下、この発明の実施形態について、詳細に説明する。
[第一実施形態]
<構成>
図1に例示するように、第一実施形態の符号化装置11は、線形予測分析部111、適応符号帳112、固定符号帳113、周期化処理部114、周期化済み固定符号帳記憶部115、探索制御部116、合成フィルタ117、ピッチシャープニング係数決定部118、およびパラメータ符号化部119を有する。探索制御部116は、ピッチ分析部1161、探索部1162、聴覚重み付けフィルタ1163、および利得量子化部1164を含む。
【0012】
図2に例示するように、第一実施形態の復号装置12は、適応符号帳122、固定符号帳123、選択部125、合成フィルタ127、パラメータ復号部129、周期化処理部124、およびピッチシャープニング係数決定部128を有する。
【0013】
本形態の符号化装置11および復号装置12は、例えば、CPU(central processing unit)、RAM(random-access memory)、ROM(read-only memory)等を備えた公知のコンピュータまたは専用のコンピュータにプログラムやデータが読み込まれることで構成された特別な装置である。また、符号化装置11および復号装置12の処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。
【0014】
<符号化>
符号化装置11には、デジタル化され、所定時間区間であるフレームの単位で区分された時系列信号である入力音響信号x(n)(n=0,...,L−1、Lは2以上の整数、各nを「サンプル点」と呼ぶ)が入力される。入力音響信号の例は、音声信号、音楽信号、雑音信号などである。符号化装置11は、入力音響信号x(n)(n=0,...,L−1)を以下のようにフレームごとに符号化する。
【0015】
≪線形予測分析部111≫
線形予測分析部111は、処理対象のフレーム(「現フレーム」と呼ぶ)に属する各サンプル点n=0,...,L−1での入力音響信号x(n)(n=0,...,L−1)の線形予測分析を行い、当該現フレームでの全極型の合成フィルタ117を特定するための係数の量子化値に対応する符号である線形予測情報LPC info(「予測パラメータ」に含まれる)を出力する。すなわち、線形予測分析部111は、フレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報LPC infoを得て出力する。例えば、線形予測分析部111は、現フレームの入力音響信号x(n)(n=0,...,L−1)に対応する線形予測係数a(m)(m=1,...,P、Pは正の整数である線形予測次数)を算出し、線形予測係数a(m)(m=1,...,P)を線スペクトル対係数LSPに変換し、量子化した線スペクトル対係数LSPに対応する符号を線形予測情報LPC infoとして出力する。
【0016】
≪固定符号帳113≫
固定符号帳113には、零でない単位パルスとその極性との組み合わせからなる値を持つ1個以上の信号と零値を持つ1個以上の信号とから構成される複数個のパルス系列(「サンプル列」に相当)を特定するための情報が格納される。ここでは1フレームが4個のサブフレームに等区分される例を示す。すなわち、L個のサンプル点0,...,L−1からなるフレームは、サンプル点L
f(0),...,L
f(1)−1からなる1番目のサブフレーム(第1サブフレーム)、サンプル点L
f(1),...,L
f(2)−1からなる2番目のサブフレーム(第2サブフレーム)、サンプル点L
f(2),...,L
f(3)−1からなる3番目のサブフレーム(第3サブフレーム)、およびサンプル点L
f(3),...,L
f(4)−1からなる4番目のサブフレーム(第4サブフレーム)に区分される。L
f(0),L
f(1),L
f(2),L
f(3),L
f(4)は、L
f(0)=0,L
f(4)=L,L
f(0)<L
f(1)<L
f(2)<L
f(3)<L
f(4)を満たす正整数である。第1−4サブフレームに対応するパルス系列c
f1,c
f2,c
f3,c
f4はそれぞれ以下のように表現される。
c
f1=(c
f1(L
f(0)),...,c
f1(L
f(1)-1))
c
f2=(c
f2(L
f(1)),...,c
f2(L
f(2)-1))
c
f3=(c
f3(L
f(2)),...,c
f3(L
f(3)-1))
c
f4=(c
f4(L
f(3)),...,c
f4(L
f(4)-1))
【0017】
≪適応符号帳112≫
適応符号帳112には、過去の各時点で生成された励振信号が記憶されている。適応符号帳112は、第1−4サブフレームの各サブフレームで得られるピッチ周期T
1,T
2,T
3,T
4に応じて励振信号を遅延させて得られる適応信号成分v(n)(n=0,...,L−1)を出力する。小数精度のピッチ周期を用いて適応信号成分v(n)を表現する場合には、ピッチ周期に応じて遅延させた複数の励振信号に重み付き平均操作を行う補間フィルタが用いられる。
【0018】
≪ピッチ分析部1161≫
ピッチ分析部1161は、サブフレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応するピッチ周期T
1,T
2,T
3,T
4を得て、当該ピッチ周期T
1,T
2,T
3,T
4と、当該ピッチ周期T
1,T
2,T
3,T
4を特定するピッチ符号(周期性成分符号)CT
1,CT
2,CT
3,CT
4と、を出力する。各サブフレームのピッチ符号CT
1,CT
2,CT
3,CT
4はそれぞれ均一長である。CT
1,CT
2,CT
3,CT
4それぞれのビット数は、互いに同一であってもよいし、互いに異なっていてもよい。なお、ピッチ周期はピッチ符号を復号することにより得られるのでピッチ分析部1161が出力することは必須ではない。ピッチ周期は、サンプル点の間隔の整数倍のみで表現される場合(整数精度)のみならず、サンプル点の間隔の整数倍と小数値(分数値)とを用いて表現される場合(小数精度)もある。また、ピッチ分析部1161は、探索部1162で用いるために、サブフレームごとに、ピッチ利得g
p1,g
p2,g
p3,g
p4を求めて出力してもよい。
【0019】
入力音響信号x(n)(n=0,...,L−1)に対応するピッチ周期T
1,T
2,T
3,T
4、当該ピッチ周期T
1,T
2,T
3,T
4を特定するピッチ符号CT
1,CT
2,CT
3,CT
4の探索は、例えば、サブフレームごとに、適応符号帳112に記憶されている過去の各時点で生成された励振信号をピッチ周期の候補で遅延させて得られる信号に線形予測情報LPC infoによって特定される全極型の合成フィルタ117を適用して得られる合成信号と、入力された入力音響信号との差分に、聴覚重み付けフィルタ1164を適用した値が最小となるように行われる。
【0020】
ピッチ利得g
p1,g
p2,g
p3,g
p4は、例えば、サブフレームごとに、探索された当該ピッチ周期T
1,T
2,T
3,T
4に対応する合成信号と入力された入力音響信号との相互相関値を合成信号の自己相関値で除算した値として求められる。
【0021】
≪ピッチシャープニング係数決定部118≫
ピッチシャープニング係数決定部118は、ピッチ周期が安定している度合いの高いサブフレームのピッチシャープニング係数が、ピッチ周期が安定している度合いの低いサブフレームのピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。ピッチ周期が安定している度合いが高い場合は周期性が高いことが想定されるので、ピッチシャープニング係数を大きくし周期化の程度を大きくすることで、品質の向上が期待できる。例えば、処理対象のサブフレーム(現在のサブフレーム)のピッチ周期と処理対象よりも前のサブフレーム(過去のサブフレーム)のピッチ周期との差が小さいほど、ピッチ周期が安定している度合いが高いと言える。
【0022】
そこで、ピッチシャープニング係数決定部118は、処理対象のサブフレームをi番目のサブフレームとしたとき、ピッチシャープニング係数の値が、i番目のサブフレームのピッチ周期T
iと過去のサブフレームのピッチ周期T
i-τ(τは1以上の正整数)との差(T
i−T
i-τ)の絶対値|T
i−T
i-τ|に対して単調非増加の関係となるように、ピッチシャープニング係数を決定する。すなわち、|T
i−T
i−τ|<|T
j−T
j−τ|(i≠j)であれば、i番目のサブフレームに対するピッチシャープニング係数が、j番目のサブフレームに対するピッチシャープニング係数よりも大きいか同じ値になる。
【0023】
ピッチシャープニング係数の決定は、上記の関係を維持するように、予め取りうるピッチ周期の差に対応する値(もしくはその範囲)とピッチシャープニング係数との値を対応付けた対応表を用いて決定することができる。このような対応表を例示する。この例では、サブフレーム間のピッチ周期の差の絶対値とシャープニング係数とが対応付けられている。
【0025】
あるいは、ピッチシャープニング係数決定部118は、予め定めたピッチ周期の差に対応する値を引数とする単調非増加関数を用いてピッチシャープニング係数を決定してもよい。ここで、ピッチ周期の差に対応する値としては、例えば、上述のピッチ周期の差の絶対値(|T
i−T
i-τ|あるいは|T
i-τ−T
i|)や、絶対値|T
i-τ−T
i|あるいは|T
i-τ−T
i|に対して単調非減少の関係にある値などが例示できる。ピッチ周期の差の絶対値|T
i−T
i-τ|あるいは|T
i-τ−T
i|が小さい場合は、過去のサブフレームと現在のサブフレームとのピッチ周期が近く、つまり、ピッチ周期の差の絶対値|T
i−T
i-τ|あるいは|T
i-τ−T
i|が小さいほどピッチ周期が安定していることを示す。また、ピッチシャープニング係数決定部118が、現在のサブフレーム及び過去のサブフレームのピッチ周期の代わりに、現在のフレーム及び過去のフレームのピッチ周期を用いてピッチシャープニング係数を決定しても良い。
【0026】
なお、フレームの先頭のサブフレームについては、過去のフレームの最終サブフレームのピッチ周期を利用して差を計算することもできるし、フレームの先頭のサブフレームだけはピッチ周期の差に無関係に固定のシャープニング係数を設定することもできる。一般には、前のフレーム情報が復号装置12では入手できない場合に対応できるよう、過去のフレームに依存しない方法が好ましい。例えば、符号化装置11で符号化した情報をネットワーク等を介して復号装置12に送信し、復号する状況を考える。このとき、符号化装置11からは、フレーム毎に符号化された信号が逐次出力され、ネットワーク等を通して復号装置12に伝送される。復号装置12では、受け取ったフレームの信号を逐次復号するが、途中で通信が切断されたりすると、前のフレームと連続しているかどうかが分からない状況で、途中のフレームから復号処理を再開する状況も想定される。前のフレームの情報を用いずにフレームごとに独立して復号処理ができるようにすることで、このような状況でも復号装置12が入力された信号を正しく復号できる。
【0027】
なお、本発明については、符号化装置11ではフレームの先頭のサブフレームについては過去のフレームの最終サブフレームのピッチ周期を利用して差を計算する構成を採用し、復号装置12側ではフレームの先頭のサブフレームについては過去のフレームの情報を利用せず独立して復号する構成にすることも、原理的には可能である。この場合、符号化装置11が意図した係数(符号化装置で用いたピッチシャープニング係数)とは異なる値が復号装置12で用いられることになるが、これにより出力される最終的な合成波形と正しいピッチシャープニング係数を用いて復号したときの最終的な合成波形との歪みは非常に小さく、この構成でも従来技術よりも高い品質を実現することができる。
【0028】
≪周期化処理部114≫
周期化処理部114は、ピッチシャープニング係数決定部118で決定されたピッチシャープニング係数を用いて、固定符号帳113からのパルス系列c
f1,c
f2,c
f3,c
f4を適応プリフィルタP(z)に通すことによりピッチの高調波成分が強調されるように補正し、補正後のパルス系列を周期化済みパルス系列として出力する。つまり、固定符号帳113からのパルス系列c
fjは以下に従って補正される。
【数2】
ここで、D
j+1はパルス系列c
fjの次元数である。ここで、F
jはj番目(j=1,2,3,4)のサブフレームの基本周期の長さであり、γはピッチシャープニング係数決定部118で決定されたピッチシャープニング係数である。なお、固定符号帳113からのパルス系列c
fjが以下に従って補正されてもよい。ただし、以下の例ではピッチシャープニング係数γが0≦γ≦1となる。
【数3】
【0029】
すなわち、周期化処理部114は、固定符号帳113からのパルス系列c
f1,c
f2,c
f3,c
f4に対し、ピッチシャープニング係数決定部118で決定されたピッチシャープニング係数に対応する周期化を行って(ピッチシャープニング係数に対応する度合いの周期化を行って)周期化済みパルス系列を求めて出力する。具体的には、この例の周期化処理部114は、D
j+1次元のパルス系列(c
fj(0),・・・,c
fj(D
j))と、当該パルス系列(c
fj(0),・・・,c
fj(D
j))をF
j(処理対象の時間区間の基本周期F
jに対応する長さ分)遅延させて得られるD
j+1次元の遅延系列(0,・・・,0,c
fj(0),・・・,c
fj(D
j−F
j))とを、ピッチシャープニング係数γに対応する重み係数で重み付け加算して得られる周期化済みパルス系列
〜c
fjを求めて出力する。なお、遅延系列の先頭の要素からF
j番目の要素まではすべて0である。
【0030】
このように、周期化処理部114は、固定符号帳113の1つのパルス系列c
fjから、適応符号帳112において得られるサブフレームの基本周期の長さF
jを切り出し、切り出し分をサブフレーム長に達するまで繰り返し配列して得られる周期化済みパルス系列
〜c
fjを求めて出力する。これを固定符号帳113から出力されるパルス系列の少なくとも一部のパルス系列について行い、周期化済みパルス系列の候補を出力する。なお、周期化しないパルス系列については、γ=0として得られる~c
fj(周期化していないパルス系列そのもの)を周期化済みパルス系列の候補として用いてもよい。また、「c」の上付き添え字の「~」は本来「c」の真上に配置されるものであるが、表記上の制約から「~c」と表記する。
【0031】
なお、上述の説明では、適応符号帳112において得られる現サブフレームの基本周期の長さF
jを基準として周期化処理を行う例を示したが、過去のサブフレームの基本周期F
k(j≠k)や基本周期の定数倍(F
j/2,F
k/2,2F
j,2F
k等)のように、基本周期と対応した値を基準として周期化処理を行っても良い。なお、基本周期としては、例えば、ピッチ周期の整数部分を用いることができる。
【0032】
≪周期化済み固定符号帳記憶部115≫
周期化済み固定符号帳記憶部115には、周期化処理部114から出力された周期化済みパルス系列(サンプル列)の候補と、当該周期化済みパルス系列の候補に対応する周期化前の固定符号帳中のパルス系列の候補を特定するための情報(コードインデックス)が格納される。
【0033】
≪探索部1162≫
探索部1162は、サブフレームごとに、周期化済み固定符号帳記憶部115を探索し、入力音響信号x(n)(n=0,...,L−1)に対応する周期化済みパルス系列~c
f1,~c
f2,~c
f3,~c
f4(周期化済み固定符号帳記憶部115からのサンプル列)と、当該周期化済みパルス系列~c
f1,~c
f2,~c
f3,~c
f4に対応するコードインデックスC
f1,C
f2,C
f3,C
f4(周期化済みパルス系列~c
f1,~c
f2,~c
f3,~c
f4に対応する周期化前の固定符号帳中のパルス系列を特定するためのコードインデックス)と、を得て出力する。
【0034】
言い換えると、第jサブフレーム(j=1,2,3,4)では、探索部1162は、周期化済み固定符号帳記憶部115から得られる複数のサンプル列のうち入力音響信号x(n)(n=L
f(j-1),...,L
f(j)−1)に対応する周期化済みパルス系列~c
fjと当該周期化済みパルス系列~c
fjに対応するコードインデックスC
fjと、を得て出力する。
【0035】
入力音響信号x(n)(n=0,...,L−1)に対応する周期化済みパルス系列~c
f1,~c
f2,~c
f3,~c
f4、および当該周期化済みパルス系列~c
f1,~c
f2,~c
f3,~c
f4に対応するコードインデックスC
f1,C
f2,C
f3,C
f4の探索は、例えば、サブフレームごとに、適応信号成分の各サンプルにピッチ利得を乗算して得られるサンプル列と周期化済み固定符号帳記憶部115から得られる周期化済みパルス系列の候補とにより得られる励振信号の仮信号に線形予測情報LPC infoによって特定される全極型の合成フィルタ117を適用して得られる合成信号と、入力された入力音響信号との差に、聴覚重み付けフィルタ1164を適用した値が最小となるように行われる。
【0036】
≪利得量子化部1164≫
利得量子化部1164には、ピッチ符号CT
1,CT
2,CT
3,CT
4、およびコードインデックスC
f1,C
f2,C
f3,C
f4が入力される。利得量子化部1164は、これらを用いてベクトル量子化を行い、サブフレームごとに、量子化されたピッチ利得と量子化された固定符号帳利得との組に対応する符号を得て出力する。以下では、量子化されたピッチ利得を「量子化済ピッチ利得」と表現し、量子化された固定符号帳利得を「量子化済固定符号帳利得」と表現する。また量子化済ピッチ利得g
p1^と量子化済固定符号帳利得g
c1^の組に対応する符号、量子化済ピッチ利得g
p2^と量子化済固定符号帳利得g
c2^の組に対応する符号、量子化済ピッチ利得g
p3^と量子化済固定符号帳利得g
c3^の組に対応する符号、量子化済ピッチ利得g
p4^と量子化済固定符号帳利得g
c4^の組に対応する符号を「利得符号GA
f1,GA
f2,GA
f3,GA
f4」と表現する。すなわち、利得量子化部1164は、第1から第4のサブフレームのそれぞれ(第jサブフレーム)について、ピッチ利得g
pjと固定符号帳利得g
cjの組をベクトル量子化し、量子化済ピッチ利得g
pj^と量子化済固定符号帳利得g
cj^の組を特定する利得符号GA
fjを得て出力する。
【0037】
このようなベクトル量子化には、例えば、量子化済ピッチ利得と量子化済固定符号帳利得との組に対応する利得符号を特定するためのテーブルである利得符号帳が用いられる。利得符号帳の例は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組が複数個格納されたテーブルである。なお、量子化済ピッチ利得に代えて量子化済ピッチ利得の関数値をベクトル量子化の対象としてもよいし、量子化済固定符号帳利得に代えて量子化済固定符号帳利得の関数値をベクトル量子化の対象としてもよいが、以下では量子化済ピッチ利得そのものと量子化済固定符号帳利得そのものをベクトル量子化の対象とする例について説明する。
【0038】
量子化済固定符号帳利得の関数値の一例は、過去または現在のサブフレーム(又はフレーム)での周期化済み固定符号帳記憶部115からの信号成分のエネルギーを基に予測された現在のサブフレーム(又はフレーム)での固定符号帳利得の推定値と、現在のサブフレーム(又はフレーム)での固定符号帳利得との比を表す補正係数(correction factor)などである。補正係数の例は、非特許文献1の「5.8.2 Quantization of codebook gains」の欄に記載されたγ
gcである。例えば、j(j=1,...,4)番目のサブフレームでの量子化済固定符号帳利得g
cj^、補正係数γ
gcの量子化値γ
gc^、j(j=1,...,4)番目のサブフレームでの固定符号帳利得の推定値の量子化値pg
cj^の間には、以下の関係が成り立つ。
g
cj^=γ
gc^×pg
cj^
【0039】
<利得量子化部1164が行うベクトル量子化>
本発明の利得量子化部1164が行うベクトル量子化では、利得符号帳のインデックスとして可変長符号が割り当てられる。インデックスの選択は、例えば、従来技術と同じく符号化歪み(以下「歪み」という)を最小とする基準に基づいてなされる。つまり、利得量子化部1164は、入力されたピッチ周期T
jまたはピッチ符号CT
jと、周期化済みパルス系列~c
fjまたはコードインデックスC
fjと、に対して、利得符号帳に格納された複数個の符号帳インデックスのうちの何れか1つを選択し、それを利得符号とする。
【0040】
利得符号帳から符号帳インデックスを探す方法は、従来技術と同じでよい。例えば、利得量子化部1164は、N個(Nは所定の正整数)のサンプル点からなるサブフレーム(時間区間)ごとに、周期化済み固定符号帳記憶部115からの周期化済みパルス系列(周期化済みサンプル列)を合成フィルタ117に通して得られるサンプル列Zのそれぞれのサンプルに、量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を合成フィルタ117に通して得られるサンプル列Yのそれぞれのサンプルに、量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みを指標値Dとし、指標値Dが最も小さくなるインデックスを、利得符号として得て出力する。なお、合成フィルタ117に通してサンプル列Zを得るための「周期化済み固定符号帳記憶部からの周期化済みパルス系列」は、利得量子化部1164に入力されたコードインデックスに対応し、合成フィルタ117に通してサンプル列Yを得るための「過去の励振信号」は、利得量子化部1164に入力されたピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号である。各指標値Dに対応する量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と符号帳インデックスとの組は、それぞれ、選択された利得符号帳に格納された量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と符号帳インデックスとの組の何れかである。サンプル列Zに含まれるサンプルの個数、サンプル列Yに含まれるサンプルの個数、および合成信号サンプル列αY+βZに含まれるサンプルの個数は、すべてN個である。合成フィルタ117は、あるサンプル点nのサンプルυ(n)を、そのサンプル点nよりも過去のP個のサンプル点n−1,n−2,...,n−Pのサンプルχ(n−1),χ(n−2),...,χ(n−P)に線形予測係数a(n−1),a(n−2),...,a(n−P)を乗算した値a(n−1)×χ(n−1),a(n−2)×χ(n−2),...,a(n−P)×χ(n−P)の和で表す線形FIR(Finite Impulse Response)フィルタである。なお、Pは正の整数である予測次数である。以下に合成フィルタ117を表す。
υ(n)=a(1)×χ(n-1)+a(2)×χ(n-2)+...+a(P)×χ(n-P)
【0041】
例えば、サンプル列Aを合成フィルタ117に通してサンプル列Cが得られる場合、サンプル列Aに含まれるサンプルがχ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部となり、υ(n)がサンプル列Cのサンプル点nでのサンプルとなる。χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部がサンプル列Aよりも過去のサンプル点に対応する場合、例えば、当該χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部はサンプル列Aより過去のサンプル列に含まれるサンプルとされる。あるいは、サンプル列Aよりも過去のサンプル列が存在しない場合、当該当該χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部は0などの定数とされる。
【0042】
以下に指標値Dの具体例を示す。
サブフレームがN個のサンプル点S,...,S+N−1(Sは0以上の整数)からなり、サブフレームに属する入力音響信号XをベクトルX=(x(S),...,x(S+N−1))と表現し、サンプル列ZをベクトルZ=(z(S),...,z(S+N−1))と表現し、サンプル列YをベクトルY=(y(S),...,y(S+N−1))と表現し、サンプル列αY+βZと入力音響信号Xとの二乗誤差を指標値D(歪み)と定義すると、指標値Dは以下のように表される。ただし、σ
Tはσの転置を表す。
【数4】
【0043】
例えば、前述した1フレームが4個のサブフレームに等区分される例の場合、第jサブフレーム(j=1,...,4)は、N=L
f(j)−L
f(j−1)個のサンプル点L
f(j−1),...,L
f(j)−1からなる。ここで、第jサブフレームでの入力音響信号XをベクトルX
j=(x(L
f(j−1)),...,x(L
f(j)−1))と表現する。また、第jサブフレームでの周期化済み固定符号帳記憶部115からの周期化済みパルス系列~c
fj=(~c
fj(L
f(j−1)),...,~c
fj(L
f(j)−1))を合成フィルタ117に通して得られるサンプル列ZをZ
j=(z(L
f(j−1)),...,z(L
f(j)−1))と表現する。さらに、第jサブフレームでの適応信号成分(過去の励振信号)v(L
f(j−1)),...,v(L
f(j)−1)を合成フィルタ117に通して得られるサンプル列YをベクトルY=(y(L
f(j−1)),...,y(L
f(j)−1))と表現する。すると、第jサブフレームでの指標値Dは以下のように表される。
【数5】
ここでは、上述の指標値Dが最小となる量子化済ピッチ利得と量子化済固定符号帳利得を選択する例を示したが、他の尺度による歪みや別の方法を用いて量子化済ピッチ利得と量子化済固定符号帳利得を決定する構成としてもよい(<利得量子化部1164が行うベクトル量子化>の説明終わり)。
【0044】
≪適応符号帳112の記憶内容の更新≫
適応符号帳112は、利得量子化部1164で各サブフレームでの利得符号GA
f1,GA
f2,GA
f3,GA
f4が得られると、コードインデックスC
f1,C
f2,C
f3,C
f4に対応する周期化済みパルス系列~c
f1,~c
f2,~c
f3,~c
f4(周期化済み固定符号帳記憶部115からのサンプル列)の各サンプルに量子化済固定符号帳利得g
c1^,g
c2^,g
c3^,g
c4^を乗算して得られるサンプル列と、サブフレームごとにピッチ周期T
1,T
2,T
3,T
4に対応するサンプル数だけ過去の励振信号である適応信号成分v(n)(n=0,...,L−1)の各サンプルに量子化済ピッチ利得g
p1^,g
p2^,g
p3^,g
p4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u'(n)(n=0,...,L−1)を得て、適応符号帳112内に記憶する。
u'(n)=g
p1^×v(n)+g
c1^×~c
f1(n)(n=L
f(0),...,L
f(1)-1)
u'(n)=g
p2^×v(n)+g
c2^×~c
f2(n)(n=L
f(1),...,L
f(2)-1)
u'(n)=g
p3^×v(n)+g
c3^×~c
f3(n)(n=L
f(2),...,L
f(3)-1)
u'(n)=g
p4^×v(n)+g
c4^×~c
f4(n)(n=L
f(3),...,L
f(4)-1)
【0045】
≪パラメータ符号化部119≫
また、線形予測情報LPC info、ピッチ周期符号CT
1,CT
2,CT
3,CT
4、コードインデックスC
f1,C
f2,C
f3,C
f4、および利得符号GA
f1,GA
f2,GA
f3,GA
f4を含む「励振パラメータ」がパラメータ符号化部119に入力される。パラメータ符号化部119は、励振パラメータに対応する符号であるビットストリームBS(符号)を生成して出力する。
【0046】
<復号装置12>
符号化装置11(
図1)のパラメータ符号化部119から出力されたビットストリームBSは、入力符号として復号装置12(
図2)のパラメータ復号部129に入力される。
【0047】
≪パラメータ復号部129≫
パラメータ復号部129は、
図2に示すように、例えば、パラメータ復号部129a、ピッチ符号復号部129b、および利得符号復号部129cを含む。
【0048】
≪パラメータ復号部129a≫
パラメータ復号部129aは、ビットストリームBSを入力とし、ビットストリームBSに含まれる線形予測情報LPC info、ピッチ符号CT
1,CT
2,CT
3,CT
4、コードインデックスC
f1,C
f2,C
f3,C
f4、および利得符号GA
f1,GA
f2,GA
f3,GA
f4を得る。得られたLPC infoは合成フィルタ127に入力される。また、ピッチ符号CT
1,CT
2,CT
3,CT
4はピッチ符号復号部129bに入力される。コードインデックスC
f1,C
f2,C
f3,C
f4は選択部125に入力される。利得符号GA
f1,GA
f2,GA
f3,GA
f4は、利得符号復号部129cに入力される。
【0049】
≪ピッチ符号復号部129b≫
ピッチ符号復号部129bは、得られたピッチ符号(周期性成分符号)CT
1,CT
2,CT
3,CT
4を復号し、復号ピッチ周期T
1’,T
2’,T
3’,T
4’を出力する。復号ピッチ周期T
1’,T
2’,T
3’,T
4’は、適応符号帳122およびピッチシャープニング係数決定部128に入力される。
【0050】
≪利得符号復号部129c≫
利得符号復号部129cは、入力された利得符号GA
f1,GA
f2,GA
f3,GA
f4を復号し、復号ピッチ利得g
p1^,g
p2^,g
p3^,g
p4^および復号固定符号帳利得g
c1^,g
c2^,g
c3^,g
c4^を得て出力する。具体的には、利得符号復号部129cは、例えば、符号化装置11の利得量子化部1164が備えるのと同一の利得符号帳を備える。利得符号復号部129cは、利得符号帳を参照し、入力された利得符号(現在のサブフレームに対応する利得符号)に対応する量子化済ピッチ利得と量子化済固定符号帳利得を復号ピッチ利得g
pj^および復号固定符号帳利得g
cj^として出力する。
【0051】
≪選択部125≫
選択部125には、コードインデックスC
f1,C
f2,C
f3,C
f4が入力される。選択部125は、入力されたコードインデックスC
f1,C
f2,C
f3,C
f4を用い、固定符号帳123に基づき、サブフレームごとに、コードインデックスC
f1,C
f2,C
f3,C
f4を復号してパルス系列c
f1,c
f2,c
f3,c
f4を得て出力する。固定符号帳123は、符号化装置11が備える固定符号帳113と同一である。
【0052】
≪ピッチシャープニング係数決定部128≫
ピッチシャープニング係数決定部128は、符号化装置11のピッチシャープニング係数決定部118と同様の処理により、ピッチシャープニング係数の値を決定する。つまり、ピッチシャープニング係数決定部128は、符号化装置11で用いたものと同じ対応表、もしくは関数を用いてピッチシャープニング係数の値を決定する。ただし、ピッチ周期としては、復号装置12で得た復号ピッチ周期を用いる。その他は、ピッチシャープニング係数決定部118と同じである。
【0053】
≪周期化処理部124≫
周期化処理部124は、符号化装置11の周期化処理部114と同様の処理により、固定符号帳123からのパルス系列c
f1,c
f2,c
f3,c
f4を周期化した周期化済みパルス系列~c’
f1,~c’
f2,~c’
f3,~c’
f4を出力する。ただし、ピッチシャープニング係数としては、ピッチシャープニング係数決定部128で決定されたピッチシャープニング係数を用いる。なお、周期化の基準としては、符号化装置11で用いたものと同じ基準を用いるものとする。つまり、符号化装置11において現サブフレームのパルス周期T
jの2倍の周期(2T
j)で周期化処理をした場合(2F
j=2T
jで周期化処理をした場合)は、復号化装置12においても、ピッチ符号復号部129bで得られた復号ピッチ周期T
j’の2倍の周期(2T
j’)で周期化処理を行うものとする。
【0054】
≪適応符号帳122≫
適応符号帳122は、入力された復号ピッチ周期T
1’,T
2’,T
3’,T
4’で特定される適応信号成分v’(n)(n=0,...,L−1)を出力する。
【0055】
周期化処理部124から出力された周期化済みパルス系列~c’
f1,~c’
f2,~c’
f3,~c’
f4に復号固定符号帳利得g
c1^,g
c2^,g
c3^,g
c4^を乗算して得られるサンプル列と、適応信号成分v’(n)(n=0,...,L−1)に復号ピッチ利得g
p1^,g
p2^,g
p3^,g
p4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u’(n)(n=0,...,L−1)が、適応符号帳122に追加される。
u'(n)=g
p1^×v'(n)+g
c1^×~c’
f1(n)(n=L
f(0),...,L
f(1)-1)
u'(n)=g
p2^×v'(n)+g
c2^×~c’
f2(n)(n=L
f(1),...,L
f(2)-1)
u'(n)=g
p3^×v'(n)+g
c3^×~c’
f3(n)(n=L
f(2),...,L
f(3)-1)
u'(n)=g
p4^×v'(n)+g
c4^×~c’
f4(n)(n=L
f(3),...,L
f(4)-1)
【0056】
≪合成フィルタ127≫
励振信号u’(n)(n=0,...,L−1)に、線形予測情報LPC infoによって特定される全極型の合成フィルタ127が適用され、それによって生成された合成信号x’(n)(n=0,...,L−1)が出力される。
【0057】
[第二実施形態]
<構成>
図1に例示するように、第二実施形態の符号化装置21は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部218を備え、ピッチシャープニング係数決定部218において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
【0058】
図2に例示するように、第二実施形態の復号装置22は、ピッチシャープニング係数決定部128に代えてピッチシャープニング係数決定部228を備え、ピッチシャープニング係数決定部228において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置12と同じである。
【0059】
<符号化>
ピッチシャープニング係数決定部218の処理以外は、第一実施形態の符号化装置11と同じである。
【0060】
≪ピッチシャープニング係数決定部218≫
ピッチシャープニング係数決定部218は、現在のサブフレームの音声波形の振幅が大きい時のピッチシャープニング係数が、振幅が小さい時のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数の値を決定する。音声波形の振幅が大きい時は、入力音響信号の周期性が高く、周期化処理による品質向上効果が高くなることが期待される。音声波形の振幅が大きいか否かは、例えば、現在のサブフレームのピッチ周期と過去のサブフレームのピッチ周期との差の符号、すなわち、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも大きいか否かを用いて判断することができる。差の極性(正負の符号)が負(T
i−T
i−τ<0)の場合は、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも小さい、すなわち、ピッチ周期が次第に短くなることを示す。差の正負符号が正の場合(T
i−T
i−τ>0)は、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも大きい、すなわち、ピッチ周期が次第に長くなることを示す。ピッチ周期が次第に短くなるときは音声が高くなる時であり、音声波形の振幅もやや大きくなる傾向にある。反対に次第に長くなるときは音声が低くなる時であるので、音声波形の振幅も小さくなる場合が多い。この現象を反映して、ピッチシャープニング係数決定部は218、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期より短い場合のピッチシャープニング係数が、長い場合のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数の値を決定する。これにより、歪が小さくなり、品質の向上が期待できる。このようなピッチシャープニング係数の決定は、上記の関係を維持するように、予め取りうるピッチ周期の差に対応する値(もしくはその範囲)と、或るサブフレーム(例えば現在のサブフレーム)のピッチ周期の長さとそれよりも過去のサブフレームのピッチ周期の長さとの差に対応するピッチシャープニング係数との値を対応付けた対応表を用いて決定することができる。対応表の例を以下に示す。
【表2】
あるいは、ピッチシャープニング係数決定部218は、予め定めたピッチ周期の差に対応する値、および、或るサブフレームのピッチ周期の長さとそれよりも過去のサブフレームのピッチ周期の長さとの差に対応する値を引数としてピッチシャープニング係数を得る関数を用い、上記の関係を維持するピッチシャープニング係数を決定してもよい。
【0061】
<復号>
第二実施形態の復号装置22におけるピッチシャープニング係数決定部228は、第二実施形態の符号化装置21のピッチシャープニング係数決定部218と同じ基準(関数値、もしくは、対応表)を用いて、ピッチシャープニング係数を決定する。ただし、ピッチ周期としては、復号装置22で得た復号ピッチ周期を用いる。その他は、第一実施形態と同じである。
【0062】
[第三実施形態]
<構成>
図1に例示するように、第三実施形態の符号化装置31は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部318を備え、ピッチシャープニング係数決定部318において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
【0063】
図2に例示するように、第三実施形態の復号装置32は、ピッチシャープニング係数決定部128に代えてピッチシャープニング係数決定部328を備え、ピッチシャープニング係数決定部328において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置12と同じである。
【0064】
<符号化>
第三実施形態の符号化装置31の処理は、ピッチシャープニング係数決定部318の処理以外、第一実施形態と同じである。
【0065】
≪ピッチシャープニング係数決定部318≫
ピッチシャープニング係数決定部318は、有声音サブフレームである可能性の高いサブフレームのピッチシャープニング係数が、そうでないサブフレームのピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。人の声は周期性が高いので、有声サブフレームの方がそうでないサブフレームと比較して周期性成分が多く含まれる可能性が高い。そのため、人の声を符号化する場合には、周期化処理による品質向上効果が高いことが期待できる。有声サブフレームである可能性の高さは、例えば、線形予測分析部111で得た現在のフレームに対する線形予測係数から算出される予測利得により判断できる。入力音響信号が有声音の場合、波形の予測利得が大きくなる傾向が強い。予測利得gは、k
iを予測次数iでのPARCOR係数とし、pを最高予測次数として
【数6】
で与えられる。ACELPではp次の線形予測係数はパルス位置を探索する前にフレームごとに計算され、LSPパラメータなどによって量子化される。符号化装置31および復号装置32は、合成フィルタ117,127を構成するために用いる量子化後の線形予測係数から同じPARCOR係数を算出することができる。
【0066】
なお、予測利得gそのものではなく、予測利得の単調非減少関数値(例えばlog(g)や(g/(g+1))のように、予測利得に対応する値を用いても良い。また、予測利得に対応する値として、或る次数のPARCOR係数の大きさ(例えば、1次のPARCOR係数の絶対値|k
1|)やそれに対応する値(例えば|k
1|
2やk
12)を用いてもよい。
【0067】
ピッチシャープニング係数決定部318は、予測利得に対応する値が大きい場合のピッチシャープニング係数が、予測利得に対応する値が小さい場合のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。例えば、予測利得に対応する値に対して単調非減少の関係となるようにピッチシャープニング係数を決定すればよい。あるいは、上記の関係を維持するように、予め取りうる予測利得に対応する値(またはその範囲)とピッチシャープニング係数との値を対応付けた対応表を用いて決定しても良い。
【0068】
<復号>
第三実施形態の復号装置32におけるピッチシャープニング係数決定部328は、第三実施形態の符号化装置31のピッチシャープニング係数決定部318と同じ基準(関数値、もしくは、対応表)を用いて、ピッチシャープニング係数を決定する。ただし、ピッチ周期としては、復号装置32で得た復号ピッチ周期を用いる。その他は、第一実施形態と同じである。
【0069】
[第四実施形態]
<構成>
図1に例示するように、第四実施形態の符号化装置41は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部418を備え、ピッチシャープニング係数決定部418において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
【0070】
図2に例示するように、第四実施形態の復号装置42は、ピッチシャープニング係数決定部128に代えてピッチシャープニング係数決定部428を備え、ピッチシャープニング係数決定部428において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置12と同じである。
【0071】
<符号化>
第四実施形態の符号化装置41のピッチシャープニング係数決定部418の処理は、第一実施形態から第三実施形態のピッチシャープニング係数決定部118〜318で用いた処理を組み合わせたものである。その他の処理は、第一実施形態と同じである。
【0072】
≪ピッチシャープニング係数決定部418≫
ピッチシャープニング係数決定部418は、第1実施形態から第3実施形態を組み合わせた方法で、ピッチシャープニング係数を決定する。例えば、ピッチシャープニング係数決定部418は、現在のサブフレームのピッチ周期の安定している度合いが高いときのピッチシャープニング係数が、ピッチ周期の安定している度合いが低いときのピッチシャープニング係数より小さくならないように、かつ、有声音サブフレームである可能性が高いときのピッチシャープニング係数がそうでないサブフレームのピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数の値を決定する。例えば、ピッチシャープニング係数決定部418は、現在のサブフレームと過去のサブフレームとのピッチ周期の差の絶対値が小さく、かつ、線形予測分析部で得た予測利得の値に対して単調非減少の関係となる値をピッチシャープニング係数として決定する。対応表の例を表3に示す。予測利得は1以上で現実的には1000程度までの値を取りうる。(g/(g+1))は0.5から約1の値をとる。
【表3】
【0073】
あるいは、予測利得の取りうる範囲毎に別の対応表を用意し、シャープニング係数決定部418が、予測利得の値に応じて対応表を選択し、選択した対応表に基づいてピッチシャープニング係数を決定しても良い。なお、各対応表は、或るサブフレーム(例えば現在のサブフレーム)と過去のサブフレームのピッチ周期の差に対応する値(もしくはその範囲)とピッチシャープニング係数とが対応付けられているものとする。対応表の例を示す。この例では、サブフレーム間のピッチ周期の差の絶対値と、典型的有声フレームでのシャープニング係数と、通常フレームでのシャープニング係数とが対応付けられている。
【表4】
【0074】
なお、上記の例では、典型的有声フレームと通常フレームの場合のピッチ周期の差の粒度(対応表の粒度)を同じにしているが、各対応表で粒度が異なっていても良い。また、或るサブフレーム(例えば現在のサブフレーム)と過去のサブフレームのピッチ周期の差の絶対値の取りうる範囲毎に別の対応表を用意し、ピッチ周期の差の絶対値に応じて対応表を選択し、選択した対応表に基づいてピッチシャープニング係数を決定しても良い。この場合、各対応表は、予測利得の取りうる値(またはその範囲)とピッチシャープニング係数とが対応付け有れているものとする。この場合も、各対応表で予測利得の分類の粒度を変えても良い。また、ピッチ周期の差の粒度に応じて、予測利得の分類の粒度を変えてもよい。たとえば差が0の場合のみ、予測利得の分類をさらに細かくして係数を変化させ、その他の差については予測利得と無関係に係数を設定することも可能である。
【0075】
また、上記の実施形態では、サブフレーム単位でピッチシャープニング係数を決定する構成としたが、フレーム単位でピッチシャープニング係数を決定してもよい。つまり、フレーム単位で、周期性に応じて決定されたピッチシャープニング係数を用いて、周期化済みパルス系列を得る構成としてもよい。すなわち、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定してもよい。また、有声音フレームである可能性の高いフレームのピッチシャープニング係数が、そうでないフレームのピッチシャープニング係数よりも小さくならないように、フレーム単位でピッチシャープニング係数を決定してもよい。すなわち、有声音時間区間である可能性の高いフレームのピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、時間区間単位でピッチシャープニング係数を決定してもよい。
【0076】
また、入力音響信号の周期性が高い場合にはその定常性も高いため、上述の各実施形態における「周期性」を「定常性」に置き換えてもよい。
【0077】
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0078】
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0079】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
【0080】
このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0081】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。
【0082】
上記実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部がハードウェアで実現されてもよい。