(58)【調査した分野】(Int.Cl.,DB名)
前記第1のSIDが前記雑音フレームの低帯域パラメータを備え、前記第2のSIDが前記雑音フレームの低帯域パラメータ又は高帯域パラメータを備える、請求項1に記載の方法。
前記雑音フレームの前の前記雑音高帯域信号の前記平均スペクトル構造が、前記雑音フレームの前の前記雑音高帯域信号のスペクトルの加重平均を備える、請求項6に記載の方法。
前記第2の非連続送信機構の前記第2のSIDを送出するための前記ポリシーにおける前記送出条件が、前記第1の非連続送信機構が前記第1のSIDを送出するための条件を満たすことを更に備える、請求項6又は7に記載された方法。
前記SIDが前記低帯域パラメータを備える場合、前記SIDを復号化処理して雑音低帯域パラメータを取得すること、雑音高帯域パラメータをローカルに発生すること、並びに前記復号化処理によって取得した前記雑音低帯域パラメータ及び前記ローカルに発生した雑音高帯域パラメータに従って第1の快適雑音CNフレームを取得することの前に、前記方法が、
前記デコーダが第1の快適雑音生成CNG状態にある場合、前記デコーダによって第2のCNG状態に入ることを更に備える、請求項9に記載の方法。
前記SIDが前記高帯域パラメータ及び前記低帯域パラメータを備える場合、前記SIDを復号化処理して雑音高帯域パラメータ及び前記雑音低帯域パラメータを取得すること、並びに前記復号化処理によって取得した前記雑音高帯域パラメータ及び前記雑音低帯域パラメータに従って第3のCNフレームを取得することの前に、前記方法が、
前記デコーダが前記第2のCNG状態にある場合、前記デコーダによって第1のCNG状態に入ることを更に備える、請求項9に記載の方法。
前記高帯域パラメータを備えるSIDを前記SIDの前に受信した時点での雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第1の比率を前記取得する動作が、
前記高帯域パラメータを備える前記SIDを前記SIDの前に受信した前記時点での前記雑音低帯域信号の瞬時エネルギに対する前記雑音高帯域信号の瞬時エネルギの比率を計算して前記第1の比率を取得する動作、又は、
前記高帯域パラメータを備える前記SIDを前記SIDの前に受信した前記時点での前記雑音低帯域信号の加重平均エネルギに対する前記雑音高帯域信号の加重平均エネルギの比率を計算して前記第1の比率を取得する動作、
を備える、請求項13に記載の方法。
前記SIDに対応する前記時点での前記雑音高帯域信号の前記エネルギが、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギよりも大きい場合には、ローカルにバッファリングされた前記以前のCNフレームの前記高帯域信号の前記エネルギを第1の更新頻度で更新し、その他の場合には、ローカルにバッファリングされた前記以前のCNフレームの前記高帯域信号の前記エネルギを第2の更新頻度で更新し、前記第1の更新頻度が前記第2の更新頻度よりも大きい、請求項13又は請求項14に記載の方法。
前記復号化処理によって取得した前記雑音低帯域パラメータ及び前記ローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得するのに先立って、前記方法が、
前記SIDに隣接した履歴フレームが符号化音声フレームである場合、前記符号化音声フレームから復号化処理された高帯域信号又は高帯域信号の一部の平均エネルギが、ローカルに発生した前記雑音高帯域信号又は前記雑音高帯域信号の一部の平均エネルギよりも小さいならば、前記SIDから開始して以降のL個のフレームの雑音高帯域信号を1よりも小さい平滑化係数で乗算して、前記ローカルに発生した雑音高帯域信号の新しい加重平均エネルギを取得するステップを備え、
前記復号化処理によって取得した前記雑音低帯域パラメータ及び前記ローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得する動作が、
前記復号化処理によって取得した前記雑音低帯域パラメータ、前記SIDに対応する前記時点での前記雑音高帯域信号の前記合成フィルタ係数、及び前記ローカルに発生した雑音高帯域信号の前記新しい加重平均エネルギに従って、第4のCNフレームを取得する動作を備える、請求項12乃至請求項18の中のいずれか1項に記載された方法。
前記第1のSIDが前記雑音フレームの低帯域パラメータを備え、前記第2のSIDが前記雑音フレームの低帯域パラメータ又は高帯域パラメータを備える、請求項20に記載の装置。
前記雑音フレームの前の前記雑音高帯域信号の前記平均スペクトル構造が、前記雑音フレームの前の前記雑音高帯域信号のスペクトルの加重平均を備える、請求項25に記載の装置。
前記第2の非連続送信機構の前記第2のSIDを送出するための前記ポリシーにおける前記送出条件が、前記第1の非連続送信機構が前記第1のSIDを送出するための条件を満たすことを更に備える、請求項25又は26に記載された装置。
前記第1の復号化モジュールが、前記SIDを復号化処理して雑音低帯域パラメータを取得する動作、雑音高帯域パラメータをローカルに発生する動作、並びに前記復号化処理によって取得した前記雑音低帯域パラメータ及び前記ローカルに発生した雑音高帯域パラメータに従って第1の快適雑音CNフレームを取得する動作に先立って、当該装置が第1の快適雑音生成(CNG)状態にある場合、第2のCNG状態に入るように更に構成されている、請求項28に記載の装置。
前記第3の復号化モジュールが、前記SIDを復号化処理して雑音高帯域パラメータ及び前記雑音低帯域パラメータを取得する動作、並びに前記復号化処理によって取得した前記雑音高帯域パラメータ及び前記雑音低帯域パラメータに従って第3のCNフレームを取得する動作を実行するのに先立って、当該装置が前記第2のCNG状態にある場合、第1のCNG状態に入るように更に構成されている、請求項28に記載の装置。
前記SIDに対応する前記時点での前記雑音高帯域信号の前記エネルギが、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギよりも大きい場合には、ローカルにバッファリングされた前記以前のCNフレームの前記高帯域信号の前記エネルギを第1の更新頻度で更新し、その他の場合は、ローカルにバッファリングされた前記以前のCNフレームの前記高帯域信号の前記エネルギを第2の更新頻度で更新し、前記第1の更新頻度が前記第2の更新頻度よりも大きい、請求項32又は請求項33に記載の装置。
【発明を実施するための形態】
【0015】
本発明の目的、技術的解決策、及び利点を更に明らかにするため、以下で添付図面を参照して本発明の実施形態を更に詳細に記載する。
【0016】
図1を参照すると、この実施形態はオーディオ・データを処理するための方法を提供する。この方法は以下を含む。
【0017】
101.オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する。
【0018】
102.第1の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信することであって、第1の非連続送信機構の第1の無音挿入記述子フレーム(SID)を送出するためのポリシーが、第2の非連続送信機構の第2のSIDを送出するためのポリシーとは異なり、又は、第1の非連続送信機構の第1のSIDを符号化するためのポリシーが、第2の非連続送信機構の第2のSIDを符号化するためのポリシーとは異なる。
【0019】
この実施形態において、第1のSIDは雑音フレームの低帯域パラメータを含み、第2のSIDは雑音フレームの低帯域パラメータ又は高帯域パラメータを含む。
【0020】
任意選択的な構成として、この実施形態では、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信することが、
雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定し、これを有すると共に第2のSIDを送出するためのポリシーの送出条件を満たす場合は、第2のSIDを符号化するためのポリシーを用いることで雑音高帯域信号のSIDを符号化し、SIDを送出し、これを有しない場合は、雑音高帯域信号の符号化及び送信を行う必要がないと判定することを含む。
【0021】
雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定する処理動作が、
雑音高帯域信号のスペクトルを取得し、当該スペクトルを少なくとも2つのサブバンド(subband)に分割し、当該サブバンド内のいずれの第1のサブバンドの平均エネルギであっても当該サブバンド内の第2のサブバンドの平均エネルギより低くない場合には、雑音高帯域信号が予め設定されたスペクトル構造を有しないことを確定し、その他の場合においては、雑音高帯域信号が予め設定されたスペクトル構造を有することを確定する動作を含み、第2のサブバンドが位置する周波数帯域が第1のサブバンドが位置する周波数帯域よりも高いことを特徴とする。
【0022】
任意選択的な構成として、この実施形態では、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する処理動作が、
第1の比率及び第2の比率に従って偏差程度値(deviation extent value)を発生する処理動作であって、第1の比率が、雑音フレームの雑音低帯域信号のエネルギに対する
雑音フレームの雑音高帯域信号のエネルギの比率であり、第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率である、処理動作と、
偏差程度値が予め設定された閾値に達したか否かを判定し、これに達した場合は第2のSIDを符号化するためのポリシーを用いることによって雑音高帯域信号のSIDを符号化し、SIDを送出し、達しない場合は雑音高帯域信号の符号化及び送信を行う必要がないと判定する処理動作と、
を含む。
【0023】
任意選択的な構成として、第1の比率を、雑音フレームの雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率とすることは、
第1の比率を、雑音フレームの雑音低帯域信号の瞬時エネルギに対する
雑音フレームの雑音高帯域信号の瞬時エネルギの比率とすることを含み、更に、
これに対応して、第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることは、
第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号の瞬時エネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号の瞬時エネルギの比率とすることを含む。
【0024】
あるいは、第1の比率を、雑音フレームの雑音低帯域信号のエネルギに対する
雑音フレームの雑音高帯域信号のエネルギの比率とすることが、
第1の比率を、雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音低帯域信号の加重平均エネルギに対する雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音高帯域信号の加重平均エネルギの比率とすることを含み、更に、
これに対応して、第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることが、
第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した
前記時点での雑音フレーム及び
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での前記雑音フレームの前の雑音フレームの低帯域信号の加重平均エネルギに対する
、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での前記雑音フレーム及び雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での前記雑音フレームの前の雑音フレームの高帯域信号の加重平均エネルギの比率とすることを含む。
【0025】
この実施形態において、第1の比率及び第2の比率に従って偏差程度値を発生する処理動作が、
第1の比率の対数値及び第2の比率の対数値を別個に計算する処理動作と、
第1の比率の対数値と第2の比率の対数値との間の差の絶対値を計算して偏差程度値を取得する処理動作と、
を含む。
【0026】
任意選択的な構成として、この実施形態では、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する処理動作が、
雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合には、第2の
SIDを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のSIDを符号化し、SIDを送出し、これを満たさない場合には、雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定する処理動作を含む。
【0027】
雑音フレームの前の雑音高帯域信号の平均スペクトル構造が、雑音フレームの前の雑音高帯域信号のスペクトルの加重平均を含む。
【0028】
この実施形態において、第2の非連続送信機構の第2のSIDを送出するためのポリシーにおける送出条件が、第1の非連続送信機構が第1のSIDを送出するための条件を満たす必要があることを更に含む。
【0029】
本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、オーディオ信号の雑音フレームを取得し、現在処理中の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第1の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化し及び送信する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。
【0030】
実施形態2
図2を参照すると、この実施形態はオーディオ・データを処理するための方法を提供する。この方法は以下を含む。
【0031】
201.デコーダは、無音挿入記述子フレーム(SID)を取得し、このSIDが低帯域パラメータを含むか又は高帯域パラメータを含むかを判定する。
【0032】
202.当該SIDが低帯域パラメータを含む場合、当該SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第1の快適雑音(CN)フレームを取得する。
【0033】
203.当該SIDが高帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及び当該ローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する。
【0034】
204.当該SIDが高帯域パラメータ及び低帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する。
【0035】
任意選択的な構成として、この実施形態では、当該SIDが低帯域パラメータを含む場合、当該SIDを復号化処理して雑音低帯域パラメータを取得すること、雑音高帯域パラメータをローカルに発生すること、並びに当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第1の快適雑音
(CN
)フレームを取得する動作に先立って、この方法が、
当該デコーダが第1の快適雑音生成(CNG)状態にある場合、当該デコーダによって第2のCNG状態に入ることを更に含む。
【0036】
任意選択的な構成として、この実施形態では、当該SIDが高帯域パラメータ及び低帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得すること、並びに当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する動作に先立って、この方法が、
当該デコーダが第2のCNG状態にある場合、デコーダによって第1のCNG状態に入ることを更に含む。
【0037】
任意選択的な構成として、この実施形態では、当該SIDが低帯域パラメータ及び/又は高帯域パラメータを含むことを判定する処理動作が、以下の動作を実行することを含む。
すなわち、上記判定する処理動作は、当該SIDのビット数が予め設定された第1の閾値よりも小さい場合、当該SIDが高帯域パラメータを含むことを確定し、当該SIDのビット数が予め設定された第1の閾値よりも大きく予め設定された第2の閾値よりも小さい場合、当該SIDが低帯域パラメータを含むことを確定し、当該SIDのビット数が予め設定された第2の閾値よりも大きく予め設定された第3の閾値よりも小さい場合、当該SIDが高帯域パラメータ及び低帯域パラメータを含むことを確定する動作、又は、
当該SIDが第1の識別子を含む場合、当該SIDが高帯域パラメータを含むことを確定し、当該SIDが第2の識別子を含む場合、当該SIDが低帯域パラメータを含むことを確定し、当該SIDが第3の識別子を含む場合、当該SIDが低帯域パラメータ及び高帯域パラメータを含むことを確定する動作、を含む。
【0038】
この実施形態では、雑音高帯域パラメータをローカルに発生する処理動作が、
SIDに対応する時点での雑音高帯域信号の加重平均エネルギ及び雑音高帯域信号の合成フィルタ係数を別個に取得する動作と、
SIDに対応する時点での雑音高帯域信号の取得した加重平均エネルギ及び雑音高帯域信号の取得した合成フィルタ係数に従って雑音高帯域信号を取得する動作と、
を含む。
【0039】
任意選択的な構成として、この実施形態では、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する処理動作が、
当該復号化処理によって取得した雑音低帯域パラメータに従って第1のCNフレームの低帯域信号のエネルギを取得する動作と、
高帯域パラメータを含むSIDを先行するSIDの前に受信した時点における雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第1の比率を取得する動作と、
当該第1のCNフレームの低帯域信号のエネルギ及び当該第1の比率に従って、SIDに対応する時点での雑音高帯域信号のエネルギを取得することと、
当該SIDに対応する時点での雑音高帯域信号のエネルギ及びローカルにバッファリングされたCNフレームの高帯域信号のエネルギに対して加重平均を実行して、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作であって、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを当該第1のCNフレームの高帯域信号エネルギとする、動作と、
を含む。
【0040】
任意選択的な構成として、この実施形態では、高帯域パラメータを含むSIDを先行するSIDの前に受信した時点における雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第1の比率を取得する処理動作が、
当該高帯域パラメータを含むSIDを当該先行するSIDの前に受信した時点における雑音低帯域信号の瞬時エネルギに対する雑音高帯域信号の瞬時エネルギの比率を計算して第1の比率を取得する動作、又は、
当該高帯域パラメータを含むSIDを当該先行するSIDの前に受信した時点における雑音低帯域信号の加重平均エネルギに対する雑音高帯域信号の加重平均エネルギの比率を計算して第1の比率を取得する動作、
を含む。
【0041】
この実施形態においては、当該SIDに対応する時点での雑音高帯域信号のエネルギが、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギよりも大きい場合には、当該ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギは第1の更新頻度で更新され、その他の場合には、当該ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギは第2の更新頻度で更新され、当該第1の更新頻度が第2の更新頻度よりも大きい。
【0042】
任意選択的な構成として、この実施形態では、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する処理動作が、
当該SIDよりも先行する予め設定された時間期間内の音声フレームから、最小の高帯域信号エネルギを有する音声フレームの高帯域信号を選択する動作と、
当該音声フレーム中で当該最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに従って、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得することであって、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを第1のCNフレームの高帯域信号エネルギとする、動作と、を含み、又は、
当該SIDよりも先行する予め設定された時間期間内の音声フレームから、当該予め設定された閾値よりも小さい高帯域信号エネルギを有するN個の音声フレームの高帯域信号を選択する動作と、
当該N個の音声フレームの高帯域信号の加重平均エネルギに従って、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得することであって、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを第1のCNフレームの高帯域信号エネルギとする、動作と、
を含む。
【0043】
任意選択的な構成として、この実施形態では、当該SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、
イミタンス・スペクトル周波数(ISF:Immittance Spectral Frequency)係数又はISP係数又は線スペクトル周波数(LSF:Line Spectral Frequency)係数又は線スペクトル対(LSP:Line Spectral pair)係数の何れかであるM個の係数を、高帯域信号に対応する周波数範囲にわたって分散させることと、
上述したM個の係数に対してランダム化処理を実行する動作であって、当該ランダム化処理の特性が、当該M個の係数中に含まれる各係数を、当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値は当該係数の値に近接した予め設定された範囲内の値であり、当該M個の係数中に含まれる各係数の目標値がN個のフレームの各々毎に変化し、M及びNの双方が自然数である、動作と、
当該ランダム化処理によって取得したフィルタ係数に従って、当該SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得することと、
を含む。
【0044】
任意選択的な構成として、この実施形態では、当該SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、
ローカルにバッファリングされた雑音高帯域信号のM個のISF係数又はISP係数又はLSF係数又はLSP係数を取得する動作と、
当該M個の係数に対してランダム化処理を実行することであって、当該ランダム化処理の特性が、当該M個の係数中に含まれる各係数を、当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値は当該係数の値に近接した予め設定された範囲内の値であり、当該M個の係数中に含まれる各係数の目標値がN個のフレームの各々毎に変化する、動作と、
当該ランダム化処理によって取得したフィルタ係数に従って、当該SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作と、
を含む。
【0045】
任意選択的な構成として、この実施形態では、上述した復号化処理によって取得した雑音低帯域パラメータ及び上記のとおりローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得する動作に先立って、この方法が、 当該SIDに隣接した履歴フレームが符号化音声フレームである場合には、符号化音声フレームから復号化処理された高帯域信号又は高帯域信号の一部の平均エネルギが、当該ローカルに発生した雑音高帯域信号又は雑音高帯域信号の一部の平均エネルギよりも小さいならば、当該SIDから開始して以降のL個のフレームの雑音高帯域信号を1よりも小さい平滑化係数で乗算して、当該ローカルに発生した雑音高帯域信号の新しい加重平均エネルギを取得する動作をさらに含み、
これに対応して、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得する動作が、
当該復号化処理によって取得した雑音低帯域パラメータ、当該SIDに対応する時点での雑音高帯域信号の合成フィルタ係数、及び当該ローカルに発生した雑音高帯域信号の新しい加重平均エネルギに従って、第4のCNフレームを取得する動作を含む。
【0046】
本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、デコーダが、無音挿入記述子フレーム(SID)を取得し、このSIDが低帯域パラメータ及び/又は高帯域パラメータを含むか否かを判定する。当該SIDが低帯域パラメータを含む場合、SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第1の快適雑音(CN)フレームを取得する。当該SIDが高帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及び当該ローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する。当該SIDが高帯域パラメータ及び低帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する。このように、高帯域信号及び低帯域信号のそれぞれに関して互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成することに役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。
【0047】
実施形態3
この実施形態は、オーディオ・データを処理するための方法を提供する。符号化端においては、低帯域CNG雑音スペクトル又は高帯域CNG雑音スペクトルに関わらず、一般的に高調波構造が失われ、従ってCNG高帯域信号において、聴取に対して知覚的に有効であるのは主にCNG高帯域信号のエネルギであり、CNG高帯域信号のスペクトル構造ではない。従って、超広帯域信号のDTX送信では、多くの場合、SIDにおいて高帯域信号スペクトルを送信する必要はなく、適切な方法を用いて復号化端でローカルに高帯域スペクトルを構築すれば良い。ローカルに構築した高帯域スペクトルは、明らかな知覚的な歪みを生じない。このようにして、符号化端において高帯域スペクトルを計算及び符号化するための計算負荷及びビットが節約される。一方、他の雑音信号では、その高帯域信号に高調波構造が存在する場合があり、復号化端のみでローカルに高帯域スペクトルを構築することによってCNGセグメントと音声セグメントとの間の切り換えにおいて知覚的な品質低下の問題が生じる恐れがある。従って、かかる雑音では、SIDにおいてスペクトル・パラメータを送信する必要がある。効率及び品質の双方を考慮するDTX/CNGシステムは、背景雑音の高帯域特性に従って符号化端でSID内に高帯域スペクトル・パラメータを符号化すること、又は符号化しないこと、及び異なるタイプのSIDに応じて異なる復号化処理方法を用いることによって復号化端でCNGフレームを再構築する手段を適応的に選択可能でなければならないことがわかる。この実施形態では、オーディオ・データを処理するための方法が提供され、この方法は以下を含む。すなわち、雑音高帯域スペクトルを分析し分類する。デコーダは高帯域信号スペクトルを盲目的に構築する。SIDが高帯域エネルギ・パラメータを含まない場合、当該デコーダは高帯域信号エネルギを推定する。当該デコーダは異なるCNGモジュール間で切り換わる等である。特に
図3を参照すると、この実施形態に従って符号化端(エンコーダ)においてオーディオ・データを処理するための方法は以下を含む。
【0048】
301.エンコーダはオーディオ信号の雑音フレームを取得し、この雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する。
【0049】
この実施形態では、エンコーダはオーディオ信号の雑音フレームを取得し、エンコーダのそれぞれ異なる符号化ルールに応じて、雑音フレームは、現在処理中の雑音フレーム又は
符号化端(エンコーダ)でバッファリングされた雑音フレームとすることができ、これはこの実施形態において特に限定されない。この実施形態では、一例として32kHzでサンプリングされた超広帯域入力オーディオ信号を用いる。エンコーダはまず、入力オーディオ信号にフレーミング処理を実行し、例えば1フレームとして20ms(又は640サンプリング・ポイント)を用いる。現在のフレーム(この実施形態においては現在のフレームとは符号化対象となっている現在のフレームを指す)について、エンコーダはまず高域フィルタリグを実行する。概して通過帯域は50Hzを超える周波数である。高域フィルタリングされた現在のフレームを、直交ミラー・フィルタQMF(Quadrature Mirror Filter)分析フィルタによって、低帯域信号s
0及び高帯域信号s
1に分解する。低帯域信号s
0は16kHzでサンプリングされ、現在のフレームの0〜8kHzスペクトルを表す。高帯域信号s
1も16kHzでサンプリングされ、現在のフレームの8〜16kHzスペクトルを表す。VAD(Voice Activity Detector、音声活動検出器)が、現在のフレームが前景信号フレームすなわち音声信号フレームであることを示した場合、エンコーダは現在のフレームに音声符号化を実行する。この実施形態では、エンコーダが符号化音声フレームを符号化することは従来技術の分野に関連するので、この実施形態では詳細を繰り返して説明しない。現在のフレームが雑音フレームである場合、VADは、エンコーダがDTX動作状態に入ることを示す。この実施形態では、雑音フレームは背景雑音フレーム又は無音フレームのいずれかを指す。
【0050】
この実施形態では、DTX動作状態において、DTXコントローラは、SID送出ポリシーに従って、現在のフレームの低帯域信号のSIDを符号化した上で送出するか否かを決定する。この実施形態では、低帯域信号のSIDを送出するためのポリシーは以下の通りである。(1)符号化音声フレーム後の第1の雑音フレームにおいてSIDを送出し、SID送出フラグflag
SIDを1にセットする。(2)雑音期間において、各SIDフレーム後のN番目のフレームにおいてSIDフレームを送出し、フレーム内のflag
SIDを1にセットする。ここでNは1よりも大きい整数であり、外部からエンコーダに入力される。(3)雑音期間において、他のフレームではSIDを送出せず、flag
SIDを0にセットする。この実施形態では、低帯域信号のSIDを送出するためのポリシーは従来技術のものと同様であり、本発明では詳細な説明は行わない。
【0051】
302.現在の雑音フレームの高帯域信号が予め設定された符号化及び送信に関する条件を満たすか否かを判定し、満たす場合はステップ304を実行し、満たさない場合はステップ303を実行する。
【0052】
この実施形態において、現在の雑音フレームの高帯域信号が予め設定された符号化及び送信に関する条件を満たすか否かの判定動作は、雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定し、これを有すると共に第2のSIDを送出するためのポリシーの送出条件を満たす場合は、第2のSIDを符号化するためのポリシーを用いることによって雑音高帯域信号のSIDを符号化し、SIDを送出し、これを有しない場合は、雑音高帯域信号の符号化及び送信を行う必要がないと判定する動作を含む。雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定する動作が、雑音高帯域信号のスペクトルを取得し、スペクトルを少なくとも2つのサブバンドに分割し、サブバンド内のいずれの第1のサブバンドの平均エネルギであってもサブバンド内の第2のサブバンドの平均エネルギより低くない場合には雑音高帯域信号が予め設定されたスペクトル構造を有しないことを確定し、その他の場合には雑音高帯域信号が予め設定されたスペクトル構造を有することを確定する動作を含み、第2のサブバンドが位置する周波数帯域が第1のサブバンドが位置する周波数帯域よりも高いことを特徴とする。
【0053】
この実施形態では、DTX動作状態において、エンコーダは現在のフレームの高帯域信号s
1にスペクトル分析を実行して、s
1が明らかなスペクトル構造すなわち予め設定されたスペクトル構造を有するか否かを判定する。この実施形態における具体的な方法は以下の通りである。すなわち、s
1に対して12.8kHzへのダウン・サンプリングを実行し、ダウン・サンプリングした信号に256ポイントのFETを実行してスペクトルC(i)を取得する。ここでi=0、...127である。C(i)を等しい幅の4個のサブバンドに分割し、各サブバンドのエネルギE(i)を計算する。各サブバンドは上述のいずれかの第1のサブバンドである。
【数1】
であり、ここで、i=0、...3であり、l(i)及びh(i)はそれぞれi番目のサブバンドの上方の境界及び下方の境界を表し、l(i)={0、32、64、96}であり、h(i)={31、63、95、127}である。以下の条件を満たすか否かを調べる。
【数2】
ここで、E(i)は上述の第2のサブバンドである。前述の式(1)を満たした場合、すなわちサブバンド内のいずれの第1のサブバンドのエネルギがサブバンド内の第2のサブバンドのエネルギよりも低くない場合、高帯域信号は明らかなスペクトル構造を有しないと見なされる。他の場合、高帯域信号は明らかなスペクトル構造を有する。高帯域信号が明らかなスペクトル構造を有する場合、DTXポリシーは高帯域パラメータを送出している。この実施形態では、高帯域パラメータ送出フラグflag
hbが1でない場合、次にflag
SID=1となったときにflag
hb=1をセットする。他の場合、flag
hb=0とする。
【0054】
この実施形態において、SID送出条件を満たした場合は、現在の雑音フレームの高帯域信号のスペクトル構造、雑音高帯域信号が予め設定されたスペクトル構造を有するか否かの判定、及びSID送出条件を満たす雑音低帯域信号が第1の判定条件として用いられるか否かの判定を用いることによって、現在の雑音フレームの高帯域信号を符号化及び送信する必要があるか否かを判定することができる。任意選択的な構成として、この実施形態では、現在の雑音フレームの高帯域信号が予め設定された符号化及び送信条件を満たすか否かの判定動作は、第1の比率及び第2の比率に従って偏差程度値を発生する動作であって、当該第1の比率を、雑音フレームの雑音低帯域信号のエネルギに対する
雑音フレームの雑音高帯域信号のエネルギの比率とし、当該第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とする、動作と、偏差程度値が予め設定された閾値に達したか否かを判定し、これに達した場合は第2のSIDを符号化するためのポリシーを用いることによって雑音高帯域信号のSIDを符号化し、SIDを送出し、達しない場合は雑音高帯域信号の符号化及び送信を行う必要がないと判定する動作と、を含む。任意選択的な構成として、当該第1の比率を、雑音フレームの雑音低帯域信号のエネルギに対する
雑音フレームの雑音高帯域信号のエネルギの比率とすることが、当該第1の比率を、雑音フレームの雑音低帯域信号の瞬時エネルギに対する
雑音フレームの雑音高帯域信号の瞬時エネルギの比率とすることを含み、これに応じて、当該第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることが、当該第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号の瞬時エネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号の瞬時エネルギの比率とすることを含む。あるいは、第1の比率を、雑音フレームの雑音低帯域信号のエネルギに対する
雑音フレームの雑音高帯域信号のエネルギの比率とすることが、当該第1の比率を、雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音低帯域信号の加重平均エネルギに対する雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音高帯域信号の加重平均エネルギの比率とすることを含み、これに応じて、当該第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることが、当該第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音フレーム及び
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの低帯域信号の加重平均エネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの高帯域信号の加重平均エネルギの比率とすることを含む。この実施形態では、好ましくは、当該第1の比率及び当該第2の比率に従って偏差程度値を発生することが、当該第1の比率の対数値及び当該第2の比率の対数値を別個に計算することと、当該第1の比率の対数値と当該第2の比率の対数値との間の差の絶対値を計算して偏差程度値を取得することと、を含む。
【0055】
具体的には、この実施形態において、偏差程度値が予め設定された閾値に達したか否かの判定は以下のように実施することができる。
【0056】
DTX動作状態において、エンコーダは現在処理中のフレームの高帯域信号s
1及び低帯域信号s
0の対数エネルギe
1及びe
0を別個に計算する。
【数3】
符号化端においてe
1及びe
0の長期移動平均e
1a及びe
0aを更新する。
【数4】
sign[.]は符号関数を表し、MIN[.]は最小関数を表し、|.|は絶対値関数を表し、形式x
(−1)は以前のフレームxの値を表し、α=0.1は更新速度が高いか又は低いかを決定する忘却係数である。以前のフレームは、現在処理中の雑音フレームの前に最後に送出されたSIDであり、雑音高帯域パラメータを含む。この実施形態では、e
1a及びe
0aの更新の大きさが限定される。現在処理中の雑音フレームのe
xと以前のフレームのe
xaとの間のエネルギ変動が3dBよりも大きい場合、現在処理中のフレームのe
xaを3dBで更新する。エンコーダが最初にDTX動作状態に入った場合、現在処理中のフレームのe
xとしてe
xaを初期化する。エンコーダは、現在の雑音フレームの低帯域信号のエネルギに対する高帯域信号のエネルギの比率(すなわち第1の比率)と、高帯域パラメータを含むSIDが最後に送出された時点での低帯域のエネルギに対する高帯域のエネルギの比率(第2の比率)との間の偏差が、ある程度に達するか否かを調べる、すなわち、以下の条件を満たすか否かを調べる。
【数5】
ここで、
【数6】
はそれぞれ、高帯域パラメータを含むSIDフレームが最後に送出された時点での高帯域対数エネルギ及び低帯域対数エネルギを表す。前述の式(4)を満たす場合、雑音高帯域信号は符号化及び送信を行う必要がある。高帯域パラメータ送出フラグflag
hb=0である場合、フラグflag
hb=1をセットする。
【0057】
この実施形態では、長期移動平均は重み付け平均計算の1つのタイプであり、この実施形態では特に限定されない。
【0058】
この実施形態において、偏差程度値が予め設定された閾値に達したか否かの判定を第2の判定条件として用いることができる。特定の実施プロセスでは、雑音高帯域信号を符号化及び送信する必要があると判定するために、第1の判定条件又は第2の判定条件のどちらかのみを判定すれば良く、これはこの実施形態では特に限定されない。
【0059】
この実施形態では、当該第2の判定条件は任意選択である。このステップを実行する目的は、復号化端が、雑音低帯域のエネルギ及び高帯域パラメータを含むSIDが最後に送出された時点での雑音低帯域のエネルギに対する雑音高帯域のエネルギの比率に応じて、高帯域雑音のエネルギをローカルに推定するのを支援することである。具体的には、符号化端で偏差程度値が計算されない場合は、復号化端において、現在処理中の雑音フレームの前のある時間期間内の音声フレームから最小の高帯域信号エネルギを有する音声フレームを取得することができ、現在処理中の雑音フレームの前のその時間期間内の音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに応じて、現在の高帯域雑音のエネルギをローカルに推定する。例えば、現在の雑音フレームの前のその時間期間内の音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギを、現在の高帯域雑音のエネルギとして選択する。あるいは、SIDの前のある時間期間内の音声フレームから、予め設定された閾値よりも小さい高帯域信号エネルギを有するN個の音声フレームの高帯域信号を選択し、N個の音声フレームの高帯域信号の加重平均エネルギに従って、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する。具体的には、この実施形態において制約は設定されない。
【0060】
303.第1の非連続送信機構を用いることによって雑音低帯域信号を送信する。
【0061】
この実施形態では、好ましくは、第1の非連続送信機構を用いることによって雑音低帯域信号を送信することは以下を含む。すなわち、DTX動作状態において、エンコーダは現在の雑音フレームの低帯域信号s
0に16次線形予測分析を実行し、16の線形予測係数lpc(i)を取得する。ここでi=0、1、...、15である。LPC係数をISP係数に変換して16のISP係数isp(i)を取得する。ここでi=0、1、...、15である。これらのISP係数をバッファリングする。現在のフレームでSIDが符号化されている、すなわちflag
SID=1である場合、現在のフレームを含むN個の履歴フレームのバッファリングされたISP係数において中央値のISP係数を検索する。方法は以下の通りである。まず、各フレームのISP係数から別のフレームのISP係数への距離δを計算する。
【数7】
次いで、符号化対象のISP係数isp
SID(i)として、最小のδを有するフレームのISP係数を選択する。ここでi=0、...、15である。isp
SID(i)をISF係数isf
SID(i)に変換し、isf
SID(i)を量子化し、量子化インデクス群idx
ISFを取得してSID内にカプセル化する。idx
ISFをローカルに復号化処理する。復号化処理したISF係数isf’(i)を取得する。ここでi=0、...、15である。isf’(i)をISP係数isp’(i)に変換する。ここでi=0、...、15である。isp’(i)をバッファリングする。各雑音フレームについて、バッファリングしたisp’(i)を用いることによって符号化端の復号ISP係数の長期移動平均を更新する。
【数8】
ここで、好ましくは、α=0.9であり、isp
a(i)を第1のSIDのisp’(i)として初期化する。isp
a(i)をLPC係数lpc
a(i)に変換し、分析フィルタA(Z)を取得する。各雑音フレームの低帯域信号s
0をA(Z)でフィルタリングして残留信号r(i)を取得する。ここでi=0、1、...319である。対数残留エネルギe
rを計算する。
【数9】
【0062】
この実施形態では、e
rをバッファリングする。現在の雑音フレームのflag
SIDが1である場合、現在の雑音フレームを含むM個の履歴フレームのバッファリングしたe
rに応じて、重み付け平均対数エネルギe
SIDを計算する。
【数10】
であり、ここでw
1(k)はM次元の正の係数群であり、その和は1より小さい。e
SIDを量子化し、量子化インデクスidx
eを取得する。
【0063】
この実施形態では、DTX動作状態において、flag
SID=1である場合、flag
hb=0ならば、SIDフレームにおいて低帯域パラメータのみを符号化して送出する。この場合、SIDフレームはidx
ISF及びidx
eから成り、便宜上これを小さいSIDフレームと称する。
【0064】
この実施形態では、雑音低帯域信号を符号化及び送信するためのポリシーは、従来技術において雑音広帯域信号を符号化及び送信するためのポリシーと同様である。この実施形態では簡潔な紹介のみを行う。具体的な実施プロセスはこの実施形態では詳細に説明しない。この実施形態では、現在処理中の雑音フレームの雑音高帯域信号を符号化する必要はなく、雑音低帯域信号のみを符号化する。従って、符号化端において計算負荷が低減し、送信ビットが節約される。
【0065】
304.第1の非連続送信機構を用いることによって雑音低帯域信号を送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を送信する。
【0066】
この実施形態では、flag
hb=1である場合、低帯域パラメータを符号化する必要があることに加えて、SIDにおいて高帯域パラメータも符号化する必要がある。低帯域雑音の低帯域パラメータの符号化は、ステップ303における符号化モードと同一であり、この実施形態では詳細は繰り返し説明しない。この実施形態では、好ましくは、高帯域パラメータを符号化するための方法は以下の通りである。すなわち、エンコーダがDTX動作状態にあってflag
SID=1である場合にのみ、エンコーダは現在のフレームの高帯域信号s
1に10次の線形予測分析を実行し、10の線形予測係数lpc(i)を取得する。ここでi=0、1、...、9である。lpc(i)を重み付けする。
【数11】
更に、重み付けLPC係数lpc
W(i)を取得する。ここで、w
2(i)は1以下の9次元重み付け係数群を表す。lpc
W(i)をLSP係数に変換して10のLSP係数lsp
W(i)を取得する。ここでi=0、1、...、9である。lsp
W(i)に従って符号化端のlsp
W(i)の長期移動平均を更新する。
【数12】
ここで、好ましくは、α=0.9であり、lsp
a(i)は、flag
hbが0から1に変化するたびに現在のフレームのlsp
W(i)として初期化される。SIDが高帯域パラメータを含む必要がある場合、lsp
a(i)を量子化し、量子化インデクス群idx
LSPを取得する。符号化端における高帯域信号の対数エネルギの長期移動平均e
1aを量子化し、量子化インデクスidx
Fを取得する。この場合、SIDは、idx
ISF、idx
e、idx
LSP、及びidx
Fから成る。この実施形態では、idx
ISF、idx
e、idx
LSP、及びidx
Fから成るSIDを大きいSIDと称する。
【0067】
任意選択的な構成として、lsp
a(i)はDTX動作状態において連続的に更新することも可能である。すなわち、flag
hbの値が1であるか0であるかに関わらず、lsp
a(i)を更新する。具体的には、flag
hb=0である場合にlsp
a(i)を更新するための方法は、flag
hb=1である場合の前述の方法と同一であり、この実施形態では詳細は繰り返し説明しない。
【0068】
この実施形態では、雑音高帯域信号を符号化するためのポリシーの原理は、雑音低帯域信号を符号化するためのポリシーのものと同様である。この実施形態では簡潔な紹介のみを行う。具体的な実施プロセスはこの実施形態では詳細には説明しない。
【0069】
この実施形態では、雑音高帯域信号を符号化及び送信するための条件が満される場合には、雑音低帯域信号の符号化及び送信と同時に雑音高帯域信号の符号化及び送信を常に実行する。しかしながら任意選択的な構成として、雑音高帯域信号の符号化及び送信は、雑音低帯域信号の符号化及び送信と同時に行わない場合がある。すなわち、SIDを送出した場合、3つの考えられるケースがあり得る。すなわち(1)現在処理中の雑音フレームの低帯域信号のみを符号化及び送信する。(2)現在処理中の雑音フレームの高帯域信号のみを符号化及び送信する。(3)現在処理中の雑音フレームの低帯域信号及び高帯域信号を同時に符号化及び送信する。この場合、第2の非連続送信機構の第2のSIDを送出するためのポリシーにおける送出条件は、第1の非連続送信機構が第1のSID送出条件を満たすことを更に含む。SIDを送出するこれら3つのケースは、この実施形態では特に限定されない。
【0070】
この実施形態では、ステップ302及び304は具体的には、第1の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信するステップであり、第1の非連続送信機構の第1の無音挿入記述子フレームSIDを送出するためのポリシーが、第2の非連続送信機構の第2のSIDを送出するためのポリシーとは異なり、又は、第1の非連続送信機構の第1のSIDを符号化するためのポリシーが、第2の非連続送信機構の第2のSIDを符号化するためのポリシーとは異なる。
【0071】
本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、オーディオ信号の現在の雑音フレームを取得し、現在の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第1の非連続送信機構を用いることによって雑音低帯域信号を符号化し及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。
【0072】
実施形態4
この実施形態は、オーディオ・データを処理するための方法を提供する。
符号化端(エンコーダ)での雑音信号の処理に比較すると、
復号化端(デコーダ)は、受信したビット・ストリームに応じて、現在のフレームが符号化音声フレーム、又はSID、又はNO_DATAフレームのどれであるかを判定することができる。NO_DATAフレームは、符号化端が雑音期間においてSIDの符号化及び送出を行わないことを示すフレームである。現在のフレームがSIDである場合、デコーダは更に、SIDのビット数に応じて、SIDが低帯域及び/又は高帯域パラメータを含むことを判定することができる。任意選択的な構成としてデコーダは、SIDに挿入された特定の識別子に応じて、SIDが低帯域及び/又は高帯域パラメータを含むことを判定することができる。このためには、SIDを符号化した場合に追加の識別子ビットを加える必要がある。例えばSIDに第1の識別子が挿入された場合、これはSIDが高帯域パラメータのみを含むことを識別する。第2の識別子が挿入された場合、これはSIDが低帯域パラメータのみを含むことを識別する。第3の識別子が挿入された場合、これはSIDが高帯域パラメータ及び低帯域パラメータを含むことを識別する。現在のフレームが符号化音声フレームである場合、デコーダは音声フレームを復号化処理する。具体的な処理プロセスは従来技術のものと同様であり、この実施形態では詳細には説明しない。現在のフレームがSID又はNO_DATAフレームである場合、デコーダは、CNGの特定の動作状態に従って、CNフレームを再構築するための対応する方法を選択する。この実施形態では、CNGは2つの動作状態を有する。すなわち、小さいSIDフレームに対応する半復号化CNG状態すなわち第1のCNG状態と、大きいSIDフレームに対応する全復号CNG状態すなわち第2のCNG状態と、である。全復号化CNG状態において、デコーダは、大きいSIDフレームを復号化処理することによって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従ってCNフレームを再構築する。半復号化CNG状態において、デコーダは、小さいSIDフレームを復号化処理することによって取得した雑音低帯域パラメータ及びローカルに推定した雑音高帯域パラメータに従ってCNフレームを再構築する。復号化端における現在のフレームが大きいSIDフレームである場合、CNG動作状態フラグflag
CNGが0である(半復号CNG状態を示す)ならば、CNG動作状態フラグflag
CNGを1にセットする(全復号化CNG状態を示す)。他の場合、元の状態を不変のまま維持する。同様に、復号端における現在のフレームが小さいSIDフレームである場合、CNG作業状態フラグflag
CNGが1であるならば、CNG動作状態フラグflag
CNGを0にセットする。その他の場合、元の状態を不変のまま維持する。
図4を参照すると、特にこの実施形態は、
復号化端(デコーダ)においてオーディオ・データを処理するための方法を提供する。この方法は以下を含む。
【0073】
401.デコーダはSIDを取得し、このSIDが高帯域パラメータ及び低帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、復号によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する。
【0074】
この実施形態では、符号化端(エンコーダ)が送信した符号化
された音声フレームを受信した後、
復号化端(デコーダ)はまず音声フレームのタイプを判定するので、音声フレームの異なるタイプに応じて異なる復号化方法が用いられる。具体的には、SIDのビット数が予め設定された第1の閾値よりも小さい場合には、SIDが高帯域パラメータを含むことを確定する。SIDのビット数が予め設定された第1の閾値よりも大きく予め設定された第2の閾値よりも小さい場合には、SIDが低帯域パラメータを含むことを確定する。SIDのビット数が予め設定された第2の閾値よりも大きく予め設定された第3の閾値よりも小さい場合には、SIDが高帯域パラメータ及び低帯域パラメータを含むことを確定する。あるいは、SIDが第1の識別子を含む場合には、SIDが高帯域パラメータを含むことを確定し、SIDが第2の識別子を含む場合には、SIDが低帯域パラメータを含むことを確定し、又は、SIDが第3の識別子を含む場合には、SIDが低帯域パラメータ及び高帯域パラメータを含むことを確定する。
【0075】
この実施形態では、SIDが高帯域パラメータ及び低帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、復号によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する。具体的には、デコーダはSIDを復号化処理して、復号低帯域励起対数エネルギe
D、低帯域ISF係数isf
d(i)、高帯域対数エネルギE
D、及び高帯域LSP係数lsp
d(i)を取得する。isf
d(i)はISP係数isp
d(i)に変換され、e
D及びE
Dはエネルギe
d及びE
dに変換される。ここで、
【数13】
であり、
【数14】
である。
次いでisp
d(i)、e
d、lsp
d(i)、及びE
dをバッファリングする。
【0076】
この実施形態では、デコーダがCNG動作状態にあってflag
CNG=1である場合は、現在のフレームがSIDであるかNO_DATAフレームであるかには関わらず、バッファリングしたisp
d(i)、e
d、lsp
d(i)、及びE
dを用いて、復号端においてバッファリングしたisp
d(i)、e
d、lsp
d(i)、及びE
dの長期移動平均を更新する。
【数15】
ここで、α=0.9及びβ=0.7である。E
CNは高帯域エネルギ・バッファE
1oldにバッファリングする。e
CNに基づいてランダムな小さいエネルギを加え、低帯域雑音信号を再構築するために用いられる最終励起エネルギe’
CNを取得する。
e’
CN=(1+0.000011・RND・e
CN)・e
CNである。ここで、RNDは〔−32767、32767〕の範囲内の乱数を表す。この実施形態では、320ポイント白色雑音シーケンスexc
0(i)を生成する。ここでi=0、1、...319である。e’
CNを用いてexc
0(i)に利得調整を行ってexc’
0(i)を取得する。すなわち、exc
0(i)に利得係数G
0を乗算するので、exc’
0(i)のエネルギはe’
CNに等しい。ここで
【数16】
である。isp
CN(i)をLPC係数に変換して合成フィルタ1/A
0(Z)を取得し、利得調整した励起exc’
0(i)を用いてフィルタ1/A(Z)を励起して低帯域CN信号s’
0を取得する。これは復号端で再構築され16kHzでサンプリングされる。s’
0のエネルギを計算して低帯域エネルギ・バッファE
0oldにバッファリングする。
【0077】
この実施形態では、復号端における雑音高帯域信号の処理は雑音低帯域信号の処理と同様である。別の320ポイント白色雑音シーケンスexc
1(i)を生成する。ここでi=0、1、...319である。lsp
CN(i)をLPC係数に変換して合成フィルタ1/A
1(Z)を取得し、exc
1(i)を用いてフィルタ1/A
1(Z)を励起して利得調整した高帯域CN信号s
〜1(i)を取得する。s
〜1(i)に利得係数
G1及びG2を乗算し、このときG2=0.8であり、復号化端で再構築され16kHzでサンプリングされる高帯域CN信号s’
1を取得する。ここで、
【数17】
である。この実施形態では、G
2の目的は、再構築した雑音信号に対してある程度のエネルギ抑制を実行することである。
【0078】
この実施形態では、
復号化端(デコーダ)において、s’
0及びs’
1をQMF合成フィルタに通し、最後に、デコーダにより再構築され32kHzでサンプリングされる第1のCNフレームを取得する。
【0079】
402.SIDが低帯域パラメータを含む場合、SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得する。
【0080】
この実施形態では、デコーダがCNG動作状態にあってflag
CNG=0である場合は、現在のフレームがSIDであるかNO_DATAフレームであるかには関わらず、復号化端において再構築され16kHzでサンプリングされる低帯域CN信号s’
0を、flag
CNG=1である場合に用いたものと同一の方法すなわちステップ402の方法に従って取得する。これについては本実施形態ではこれ以上は説明しない。
【0081】
この実施形態では、第1のCNフレームの高帯域信号は、白色雑音を用いて合成フィルタを励起する方法を用いることによって取得する。ただし、第1のCNフレームの高帯域信号のエネルギ及び合成フィルタ係数は、ローカルに推定を実行することによって取得する。この実施形態では、雑音高帯域パラメータをローカルに発生することは、SIDに対応する時点での雑音高帯域信号の加重平均エネルギ及び雑音高帯域信号の合成フィルタ係数を別個に取得することと、SIDに対応する時点での雑音高帯域信号の取得した加重平均エネルギ及び雑音高帯域信号の取得した合成フィルタ係数に従って雑音高帯域信号を取得することと、を含む。
【0082】
この実施形態では、好ましくは、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する処理動作が、復号化処理によって取得した雑音低帯域パラメータに従って第1のCNフレームの低帯域信号のエネルギを取得する動作と、高帯域パラメータを含むSIDを先のSIDの前に受信した時点での雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第1の比率を取得する動作と、第1のCNフレームの低帯域信号のエネルギ及び第1の比率に従って、SIDに対応する時点での雑音高帯域信号のエネルギを取得する動作と、SIDに対応する時点での雑音高帯域信号のエネルギ及びローカルにバッファリングされたCNフレームの高帯域信号のエネルギに対して加重平均を実行して、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作であって、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを第1のCNフレームの高帯域信号エネルギとする、動作と、を含む。任意選択的な構成として、高帯域パラメータを含むSIDを先のSIDの前に受信した時点での雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第1の比率を取得することが、高帯域パラメータを含むSIDを先のSIDの前に受信した時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域信号の瞬時エネルギの比率を計算して第1の比率を取得すること、又は、高帯域パラメータを含むSIDを先のSIDの前に受信した時点での雑音低帯域信号の加重平均エネルギに対する雑音高帯域信号の加重平均エネルギの比率を計算して第1の比率を取得すること、を含む。瞬時エネルギは復号によって取得されるエネルギである。SIDに対応する時点での雑音高帯域信号のエネルギが、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギよりも大きい場合は、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギを第1の更新頻度で更新し、その他の場合は、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギを第2の更新頻度で更新し、第1の更新頻度が第2の更新頻度よりも大きい。
【0083】
具体的には、この実施形態では、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得することは、以下の方法を用いて実施することができる。
復号化処理によって取得した雑音低帯域パラメータに従って第1のCNフレームs’
0の低帯域信号のエネルギE
0を取得し、全復号化CNG状態における以前のCNフレームの高帯域信号のエネルギE
1old及び低帯域信号のE
0old及びE
0に従って、SIDに対応する時点での雑音高帯域信号のエネルギE
〜1を推定する。ここで
【数18】
である。更に、E
〜1を用いることによって復号端における高帯域CN信号エネルギの長期移動平均E
CNを更新する。
【数19】
である。ここで係数λは変数であり、E
〜1>E
CNである場合はλ=0.98であり、他の場合はλ=0.9である。ここでλ=0.98は第1のレートであり、λ=0.9は第2のレートである。
【0084】
この実施形態では、符号化端で偏差程度値が計算されない場合は、任意選択的な構成として、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する処理動作が、SIDの前の予め設定された時間期間内の音声フレームから、最小の高帯域信号エネルギを有する音声フレームの高帯域信号を選択する動作と、音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに従って、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作と、を含み、又は、SIDの前の予め設定された時間期間内の音声フレームから、予め設定された閾値よりも小さい高帯域信号エネルギを有するN個の音声フレームの高帯域信号を選択する動作と、N個の音声フレームの高帯域信号の加重平均エネルギに従って、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作であって、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを第1のCNフレームの高帯域信号エネルギとする、動作と、を含む。
【0085】
この実施形態では、好ましくは、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、イミタンス・スペクトル周波数ISF係数又はイミタンス・スペクトル対ISP係数又は線スペクトル周波数LSF係数又は線スペクトル対LSP係数のいずれかを含むM個の係数を、高帯域信号に対応する周波数範囲にわたって分散させる動作と、当該M個の係数にランダム化処理を実行する動作であって、当該ランダム化処理の特性が、M個の係数中に含まれる各係数を当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値が当該係数の値に近接した予め設定された範囲内の値であり、当該M個の係数中に含まれる各係数の目標値がN個のフレームの各々毎に変化し、Nは変数とすることができる、動作と、当該ランダム化処理によって取得したフィルタ係数に従って、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作と、を含む。
【0086】
具体的には、この実施形態では、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得することは、以下の方法を用いて実施することができる。
【0087】
9個のISF係数isf
ext(i)を、低帯域ISF係数isf
d(14)に対応する16kHzまでの周波数帯域に均等に分散させる。ここでi=0、1、...8である。
【数20】
isf
ext(i)を0〜8kHzの周波数帯域に変換し、isf’
ext(i)を取得する。
【数21】
isf’
ext(i)を、9次元のランダム化係数群R(i)を用いることによってランダム化する。ここでi=0、1、...8である。ランダム化ISF係数isf
1(i)を取得する。
【数22】
ここで、R(i)は以下の式(14)に従って取得する。
【数23】
ここで、α=0.8であり、R
t(i)は目標ランダム化係数と称し、以下の式に従って取得する。
【数24】
【0088】
前述の式(15)において、RNDは9次元乱数シーケンス群を表し、各次元における乱数は相互に異なり、全てが〔−1、1〕の範囲内に収まる。cntはフレーム・カウンタである。CNG動作状態において、flag
CNG=0である場合、各SIDフレーム又はNO_DATAフレームについて、カウンタに1を加える。mod(cnt.10)は10を法とするcntを表す。別の実施形態では、R
t(i)を計算する場合、例えばmod(cnt.10)の10も変数であることがある。
【数25】
ここで、RNDは〔−1、1〕の範囲内の乱数を表し、この実施形態では特に限定されない。
【0089】
この実施形態では、低帯域ISF係数isf
d(15)をisf
1(9)として用い、ランダム化ISF係数isf
1(i)によって合成し(ここでi=0、1、...8である)、10次フィルタISF係数を形成し、これをLPC係数lpc
1(i)に変換する。ここでi=0、1、...9である。lpc(i)に、10次重み付け係数群W(i)={0.6699、0.5862、0.5129、0.4488、0.3927、0.3436、0.3007、0.2631、0.2302、0.2014}を乗算する。重み付けしたLPC係数lpc
〜1(i)を取得する。すなわち、合成フィルタ1/A
〜1(Z)を推定する。
【0090】
この実施形態では、320ポイント白色雑音シーケンスexc
2(i)を発生し(ここでi=0、1、...319である)、exc
2(i)を用いてフィルタ1/A
〜1(Z)を励起して、利得未調整の高帯域CN信号s
〜1(i)を取得する。s
〜1に、利得係数
G3及びG4を乗算し、このときG4=0.6であり、復号化端で再構築され16kHzでサンプリングされる高帯域CN信号s’
1を取得する。ここで
【数26】
である。
【0091】
現在のフレームがSIDである場合、lpc
〜1(i)をLSP係数lsp
〜1(i)に変換し、lsp
〜1(i)を用いて、復号端でバッファリングされたCNフレームの高帯域信号のLSP係数の長期移動平均を更新する必要がある。
【数27】
ここで、β=0.7である。
【0092】
この実施形態では、任意選択的な構成として、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、ローカルにバッファリングされた雑音高帯域信号のM個のISF係数又はISP係数又はLSF係数又はLSP係数を取得する動作と、M個の係数にランダム化処理を実行する動作であって、当該ランダム化処理の特性が、当該M個の係数中に含まれる各係数を当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値が当該係数の値に近接した予め設定された範囲内の値であり、当該M個の係数中に含まれる各係数の目標値がN個のフレームの各々毎に変化する、動作と、当該ランダム化処理によって取得したフィルタ係数に従って、SIDに対応する時点での雑音高帯域信号の前記フィルタ係数を取得する動作と、を含む。具体的には、この実施形態において制約は設定されない。
【0093】
この実施形態では、低帯域パラメータ及び高帯域パラメータを取得した後、s’
0及びs’
1をQMF合成フィルタに通し、最後に、デコーダにより再構築され32kHzでサンプリングされる第1のCNフレームを取得する。
【0094】
更にこの実施形態では、任意選択的な構成として、復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得する前に、ローカルに発生した高帯域パラメータを更に最適化して、より良い効果の快適雑音を得ることができる。具体的な最適化ステップは、SIDに隣接した履歴フレームが符号化音声フレームである場合には、符号化音声フレームから復号化処理された高帯域信号又は高帯域信号の一部の平均エネルギが、ローカルに発生した雑音高帯域信号又は雑音高帯域信号の一部の平均エネルギよりも小さいならば、SIDから開始して以降のL個のフレームの雑音高帯域信号を1よりも小さい平滑化係数で乗算して、ローカルに発生した雑音高帯域信号の新しい加重平均エネルギを取得する動作を含み、これに対応して、復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得する動作が、復号化処理によって取得した雑音低帯域パラメータ、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数、及びローカルに発生した雑音高帯域信号の新しい加重平均エネルギに従って、第4のCNフレームを取得する動作を含む。
【0095】
この実施形態では、現在のSIDの前のフレームが符号化音声フレームであって、更に、符号化音声フレームの高帯域信号のエネルギE
SPがs’
1のエネルギE
S’1よりも低い場合、現在のSID及び以降のいくつかのSID(この実施形態では50フレーム)の高帯域信号のエネルギを平滑化する必要がある。具体的な平滑化方法は、現在のフレームのs’
1に利得G
Sを乗算することで平滑化s’
1Sを取得する。
【数28】
である。ここで、cntはフレーム・カウンタであり、符号化音声フレーム後の第1のCNフレームから開始して各フレームについてカウンタに1を加える。
【数29】
は、以前のフレームの平滑化高帯域信号のエネルギであり、cnt=1である場合にE
SPとして初期化される。平滑化プロセスは最大で50フレームまでに対してのみ実行される。この期間において、
【数30】
がE
S’1よりも大きい場合、平滑化プロセスは終了する。任意選択的な構成として、
【数31】
及びE
S’1はフレームの一部のみのエネルギを表す場合があり、この実施形態では特に限定されない。この実施形態では、s’
0及びs’
1(又はs’
1S)をQMF合成フィルタに通し、最後に、デコーダにより再構築され32kHzでサンプリングされるCNフレームを取得する。
【0096】
403.SIDが高帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、復号によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する。
【0097】
この実施形態では、SIDが高帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、復号によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する。高帯域パラメータを復号化処理するための方法は、ステップ401における方法と同一であり、この実施形態では詳細は繰り返し説明しない。低帯域パラメータをローカルに発生するための方法は、広帯域パタメータをローカルに発生するための方法と同一であり、この実施形態では詳細は繰り返し説明しない。
【0098】
本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、デコーダが、無音挿入記述子フレーム(SID)を取得し、SIDが低帯域パラメータ及び/又は高帯域パラメータを含むことを判定する。SIDが低帯域パラメータを含む場合、SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1の快適雑音CNフレームを取得する。SIDが高帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する。SIDが高帯域パラメータ及び低帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成することに役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。また、復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第2のCNフレームを取得するのに先立って、当該ローカルに発生した雑音高帯域パラメータを更に最適化して、より良い効果の快適雑音を得ることができる。これによってデコーダの性能をいっそう最適化する。
【0099】
実施形態5
この実施形態は、オーディオ・データを処理するための方法を提供する。実施形態2におけるオーディオ・データを処理するための方法と同じように、符号化端(エンコーダ)は、オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する。しかしながら任意選択的な構成として、雑音フレームの高帯域信号が予め設定された符号化及び送信条件を満たすか否かを判定する処理動作が、雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合には第2の
SIDを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のSIDを符号化し、SIDを送出し、これを満たさない場合には雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定する動作を含む。この実施形態では、雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定することを、雑音高帯域信号の符号化及び送信を行うか否かを判定するための第3の条件として用いる。
【0100】
この実施形態では、任意選択的な構成として、雑音高帯域信号を符号化及び送信するか否かを、第2の判定条件を用いることによって判定することができる。これについてはこの実施形態では特に限定しない。
【0101】
この実施形態では、DTXは、高帯域パラメータを符号化及び送信するか否かを決定する。すなわち、以下の条件を用いることでflag
hbの設定を決定することができる。(1)第3の判定条件を満たすか否か。満たす場合はflag
hbを0にセットし、他の場合はflag
hbを1にセットする。(2)第2の判定条件を満たすか否か。満たさない場合はflag
hbを0にセットし、満たす場合はflag
hbを1にセットする。
【0102】
この実施形態では、第3の判定条件を実施するための具体的な方法は以下の通りとすることができる。すなわち、エンコーダは現在の雑音フレームの雑音高帯域信号s
1の10次LSP係数lsp(i)を取得する。ここでi=0、...9である。任意選択的な構成として、この係数はLSF又はISF又はISP係数とすることも可能であり、これはこの実施形態では特に限定されない。LSP又はLSF又はISF又はISP係数は、単に異なるドメインにおける異なる表現方法に過ぎないが、全て合成フィルタ係数を表し、これはこの実施形態では特に限定されない。lsp(i)を用いてその移動平均を更新する。
【数32】
ここで、lsp
a(i)はlsp(i)の長期移動平均である。現在のlsp
a(i)と、高帯域パラメータを含むSIDフレームが最後に送出された時点でのlsp
a(i)との間のスペクトル歪みを計算する。
【数33】
ここで、D
lspはスペクトル歪みを表し、
【数34】
は、高帯域パラメータを含むSIDフレームが最後に送出された時点でのlsp
a(i)を表す。D
lspがある閾値よりも小さい場合はflag
hb=0にセットする。他の場合はflag
hb=1にセットする。
【0103】
この実施形態では、必要な場合にエンコーダによって低帯域パラメータ及び/又は高帯域パラメータを符号化するための動作方法は、基本的に実施形態3における動作方法と同一であり、この実施形態では詳細は繰り返し説明しない。
【0104】
この実施形態では、デコーダがCNG動作状態でありflag
CNG=0である場合、雑音高帯域信号をローカルに発生する必要がある。SIDに対応する時点で雑音高帯域信号の重み付け平均エネルギを取得するための方法は、実施形態4における方法と同一であり、この実施形態では詳細は繰り返し説明しない。しかしながらこの実施形態では、好ましくは、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、ローカルにバッファリングされた雑音高帯域信号のM個のISF係数又はISP係数又はLSF係数又はLSP係数を取得する動作と、M個の係数にランダム化処理を実行する動作であって、当該ランダム化処理の特性が、当該M個の係数中に含まれる各係数を当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値が当該係数の値に近接した予め設定された範囲内の値であり、当該M個の係数中に含まれる各係数の目標値がN個のフレームの各々毎に変化する、動作と、当該ランダム化処理によって取得したフィルタ係数に従って、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作と、を含む。具体的には、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作とは、以下のように実施することができる。
【0105】
lsp’(i)=lsp
CN(i)と想定する(ここでi=0、...9である)と、lsp
CN(i)は、復号端でローカルにバッファリングされたCNフレームの高帯域信号のLSP係数の長期移動平均である。ランダム化処理は、実施形態4におけるものと同一の方法を用いてlsp’(i)に対して実行し、lsp
1(i)を取得する。
【数35】
lsp
1(i)をLPC係数lpc
1(i)に変換し、実施形態4におけるものと同一の方法を用いることで、w(i)で重み付けした後に合成フィルタ1/A
〜1(Z)を取得する。この実施形態では、320ポイント白色雑音シーケンスexc
2(i)を発生する。ここでi=0、1、...319である。exc
2(i)を用いてフィルタ1/A
〜1(Z)を励起して利得未調整の高帯域CN信号s
〜1(i)を取得する。s
〜1(i)に利得係数G3を乗算し、復号端で再構築され16kHzでサンプリングされるCNフレームの高帯域信号s’
1を取得する。この実施形態では、現在のフレームがSIDである場合、この方法を用いて取得したlsp
1(i)は、復号端でバッファリングされたCNフレームの高帯域信号のLSP係数の長期移動平均を更新するために用いられない。
【0106】
この実施形態では、エンコーダが大きいSIDフレームを符号化した場合、符号化端で高帯域信号の対数エネルギの長期移動平均e
1aを量子化する場合、e
1aを減衰させた後に(すなわち値を減算した後に)量子化を実行する。従ってこの場合、復号において、実施形態4におけるようにs
〜1をG2又はG4で乗算する必要はない。この実施形態における復号端の他のステップは、前述の実施形態におけるステップと同様であり、この実施形態では詳細は繰り返し説明しない。
【0107】
本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、オーディオ信号の現在の雑音フレームを取得し、現在の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第1の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する。デコーダが、無音挿入記述子フレームSIDを取得し、このSIDが低帯域パラメータ及び/又は高帯域パラメータを含むことを判定する。SIDが低帯域パラメータを含む場合、SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1の快適雑音CNフレームを取得する。SIDが高帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する。SIDが高帯域パラメータ及び低帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。
【0108】
実施形態6
図5を参照すると、この実施形態は、オーディオ・データを符号化するための装置を提供する。この装置は取得モジュール501及び送信モジュール502を含む。
【0109】
取得モジュール501は、オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解するように構成されている。
【0110】
送信モジュール502は、第1の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信するように構成され、第1の非連続送信機構の第1の無音挿入記述子フレームSIDを送出するためのポリシーが、第2の非連続送信機構の第2のSIDを送出するためのポリシーとは異なり、又は、第1の非連続送信機構の第1のSIDを符号化するためのポリシーが、第2の非連続送信機構の第2のSIDを符号化するためのポリシーとは異なる。
【0111】
この実施形態では、第1のSIDが雑音フレームの低帯域パラメータを含み、第2のSIDが雑音フレームの低帯域パラメータ及び/又は高帯域パラメータを含む。
【0112】
任意選択的な構成として、
図6を参照すると、送信モジュール502は、
雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定し、これを有すると共に第2のSIDを送出するためのポリシーの送出条件を満たす場合は、第2のSIDを符号化するためのポリシーを用いることによって雑音高帯域信号のIDを符号化し、SIDを送出し、これを有しない場合は、雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第1の送信ユニット502aを含む。
【0113】
この実施形態では、第1の送信ユニット502aは、
雑音高帯域信号のスペクトルを取得し、スペクトルを少なくとも2つのサブバンドに分割し、サブバンド内のいずれの第1のサブバンドの平均エネルギがサブバンド内の第2のサブバンドの平均エネルギよりも低くない場合は雑音高帯域信号が予め設定されたスペクトル構造を有しないことを確定し、他の場合は雑音高帯域信号が予め設定されたスペクトル構造を有することを確定するように構成され、第2のサブバンドが位置する周波数帯域が第1のサブバンドが位置する周波数帯域よりも高い、第1の判定サブユニットを含む。
【0114】
図6を参照すると、任意選択的な構成として、送信モジュール502は、
第1の比率及び第2の比率に従って偏差程度値を発生し、第1の比率が、雑音フレームの雑音低帯域信号のエネルギに対する
雑音フレームの雑音高帯域信号のエネルギの比率であり、第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音高帯域信号のエネルギの比率であり、更に、偏差程度値が予め設定された閾値に達したか否かを判定し、これに達した場合は第2のSIDを符号化するためのポリシーを用いることによって雑音高帯域信号のSIDを符号化し、SIDを送出し、達しない場合は雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第2の送信ユニット502bを含む。
【0115】
任意選択的な構成として、第1の比率が、雑音フレームの雑音低帯域信号のエネルギに対する
雑音フレームの雑音高帯域信号のエネルギの比率であることは、
第1の比率が、雑音フレームの雑音低帯域信号の瞬時エネルギに対する
雑音フレームの雑音高帯域信号の瞬時エネルギの比率であることを含み、更に、
これに対応して、第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率であることが、
第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した
前記時点での雑音低帯域信号の瞬時エネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号の瞬時エネルギの比率であることを含む。
【0116】
あるいは、第1の比率が、雑音フレームの雑音低帯域信号のエネルギに対する
雑音フレームの雑音高帯域信号のエネルギの比率であることは、
第1の比率が、雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音低帯域信号の加重平均エネルギに対する雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音高帯域信号の加重平均エネルギの比率であることを含み、更に、
これに対応して、第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率であることが、
第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した
前記時点での雑音フレーム及び
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの低帯域信号の加重平均エネルギに対する
雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの高帯域信号の加重平均エネルギの比率であることを含む。
【0117】
任意選択的な構成として、この実施形態では、第2の送信ユニット502bは、
第1の比率の対数値及び第2の比率の対数値を別個に計算し、第1の比率の対数値と第2の比率の対数値との間の差の絶対値を計算して偏差程度値を取得するように構成された計算サブユニットを含む。
【0118】
図6を参照すると、任意選択的な構成として、この実施形態では、送信モジュール502は、
雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合は第2の
SIDを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のSIDを符号化し、SIDを送出し、これを満たさない場合は雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第3の送信ユニット502cを含む。
【0119】
この実施形態では、任意選択的な構成として、雑音フレームの前の雑音高帯域信号の平均スペクトル構造が、雑音フレームの前の雑音高帯域信号のスペクトルの加重平均を含む。
【0120】
任意選択的な構成として、この実施形態では、第2の非連続送信機構の第2のSIDを送出するためのポリシーにおける送出条件が、第1の非連続送信機構が第1のSIDを送出するための条件を満たすことを更に含む。
【0121】
本発明が提供する装置の実施形態は、以下の有利な効果を与える。すなわち、オーディオ信号の現在の雑音フレームを取得し、現在の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第1の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化し及び送信する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。
【0122】
実施形態7
図7を参照すると、この実施形態は、オーディオ・データを復号化するための装置を提供する。この装置は、取得モジュール601、第1の復号化モジュール602、第2の復号化モジュール603、及び第3の復号化モジュール604を含む。
【0123】
取得モジュール601は、受信した現在の無音挿入記述子フレームSIDが低帯域パラメータを含むか又は高帯域パラメータを含むかを判定するように構成されている。
【0124】
第1の復号化モジュール602は、取得モジュール601によって取得されたSIDが低帯域パラメータを含む場合、SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1の快適雑音CNフレームを取得するように構成されている。
【0125】
第2の復号化モジュール603は、取得モジュール601によって取得されたSIDが高帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得するように構成されている。
【0126】
第3の復号化モジュール604は、取得モジュール601によって取得されたSIDが高帯域パラメータ及び低帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得するように構成されている。
【0127】
任意選択的な構成として、この実施形態では、第1の復号化モジュール602が、SIDを復号化処理して雑音低帯域パラメータを取得すること、雑音高帯域パラメータをローカルに発生すること、並びに当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1の快適雑音CNフレームを取得することの前に、デコーダが第1の快適雑音生成CNG状態にある場合、第2のCNG状態に入るように更に構成されている。
【0128】
任意選択的な構成として、この実施形態では、第3の復号化モジュール604が、SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得すること、並びに当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得することの前に、デコーダが第2のCNG状態にある場合、第1のCNG状態に入るように更に構成されている。
【0129】
任意選択的な構成として、この実施形態では、取得モジュール601は、
SIDのビット数が予め設定された第1の閾値よりも小さい場合、SIDが高帯域パラメータを含むことを確定し、SIDのビット数が予め設定された第1の閾値よりも大きく予め設定された第2の閾値よりも小さい場合、SIDが低帯域パラメータを含むことを確定し、SIDのビット数が予め設定された第2の閾値よりも大きく予め設定された第3の閾値よりも小さい場合、SIDが高帯域パラメータ及び低帯域パラメータを含むことを確定するように構成された第1の確定ユニット、又は、
SIDが第1の識別子を含む場合、SIDが高帯域パラメータを含むことを確定し、SIDが第2の識別子を含む場合、SIDが低帯域パラメータを含むことを確定し、SIDが第3の識別子を含む場合、SIDが低帯域パラメータ及び高帯域パラメータを含むことを確定するように構成された第2の確定ユニット、
を含む。
【0130】
この実施形態では、第1の復号化モジュール602は、
SIDに対応する時点での雑音高帯域信号の加重平均エネルギ及び雑音高帯域信号の合成フィルタ係数を別個に取得するように構成された第1の取得ユニットと、
SIDに対応する時点での雑音高帯域信号の取得した加重平均エネルギ及び雑音高帯域信号の取得した合成フィルタ係数に従って雑音高帯域信号を取得するように構成された第2の取得ユニットと、
を含む。
【0131】
任意選択的な構成として、第1の取得ユニットは、
復号によって取得した雑音低帯域パラメータに従って第1のCNフレームの低帯域信号のエネルギを取得するように構成された第1の取得サブユニットと、
高帯域パラメータを含むSIDをSIDの前に受信した時点での雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第1の比率を取得するように構成された計算サブユニットと、
第1のCNフレームの低帯域信号のエネルギ及び第1の比率に従って、SIDに対応する時点での雑音高帯域信号のエネルギを取得するように構成された第2の取得サブユニットと、
SIDに対応する時点での雑音高帯域信号のエネルギ及びローカルにバッファリングされたCNフレームの高帯域信号のエネルギに対して加重平均を実行して、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第3の取得サブユニットであって、SIDに対応する時点での雑音高帯域信号の加重平均エネルギが第1のCNフレームの高帯域信号エネルギである、第3の取得サブユニットと、
を含む。
【0132】
計算サブユニットは、具体的には、
高帯域パラメータを含むSIDをSIDの前に受信した時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域信号の瞬時エネルギの比率を計算して第1の比率を取得する、又は、
高帯域パラメータを含むSIDをSIDの前に受信した時点での雑音低帯域信号の加重平均エネルギに対する雑音高帯域信号の加重平均エネルギの比率を計算して第1の比率を取得する、
ように構成されている。
【0133】
SIDに対応する時点での雑音高帯域信号のエネルギが、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギよりも大きい場合は、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギを第1のレートで更新し、その他の場合は、ローカルにバッファリングされた以前のCNフレームの高帯域信号のエネルギを第2のレートで更新し、第1のレートは第2のレートよりも大きい。
【0134】
任意選択的な構成として、第1の取得ユニットは、
SIDの前の予め設定された時間期間内の音声フレームから、最小の高帯域信号エネルギを有する音声フレームの高帯域信号を選択し、音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに従って、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第1の選択サブユニットであって、SIDに対応する時点での雑音高帯域信号の加重平均エネルギが第1のCNフレームの高帯域信号エネルギである、第1の選択サブユニット、又は、
SIDの前の予め設定された時間期間内の音声フレームから、予め設定された閾値よりも小さい高帯域信号エネルギを有するN個の音声フレームの高帯域信号を選択し、N個の音声フレームの高帯域信号の加重平均エネルギに従って、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第2の選択ユニットであって、SIDに対応する時点での雑音高帯域信号の加重平均エネルギが第1のCNフレームの高帯域信号エネルギである、第2の選択ユニット、
を含む。
【0135】
任意選択的な構成として、第1の取得ユニットは、
高帯域信号に対応する周波数範囲に、M個のイミタンス・スペクトル周波数ISF係数又はイミタンス・スペクトル対ISP係数又は線スペクトル周波数LSF係数又は線スペクトル対LSP係数を分散させるように構成された分散サブユニットと、
M個の係数にランダム化処理を実行するように構成された第1のランダム化処理サブユニットであって、ランダム化の特性が、M個の係数中の各係数を各係数に対応する目標値に徐々に近付かせるものであり、目標値が係数値に隣接した予め設定された範囲内の値であり、M個の係数中の各係数の目標値がN個のフレームごとに変化し、M及びNの双方が自然数である、第1のランダム化処理サブユニットと、
ランダム化処理によって取得したフィルタ係数に従って、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得するように構成された第4の取得サブユニットと、
を含む。
【0136】
任意選択的な構成として、第1の取得ユニットは、
ローカルにバッファリングされた雑音高帯域信号のM個のISF係数又はISP係数又はLSF係数又はLSP係数を取得するように構成された第5の取得サブユニットと、
M個の係数にランダム化処理を実行するように構成された第2のランダム化処理サブユニットであって、ランダム化の特性が、M個の係数中の各係数を各係数に対応する目標値に徐々に近付かせるものであり、目標値が係数値に隣接した予め設定された範囲内の値であり、M個の係数中の各係数の目標値がN個のフレームごとに変化する、第2のランダム化処理サブユニットと、
ランダム化処理によって取得したフィルタ係数に従って、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得するように構成された第6の取得サブユニットと、
を含む。
【0137】
図8を参照すると、任意選択的な構成として、この装置は、
第1の復号化モジュール602が第1のCNフレームを取得することの前に、SIDに隣接した履歴フレームが符号化音声フレームである場合、符号化音声フレームから復号された高帯域信号又は高帯域信号の一部の平均エネルギが、ローカルに発生した雑音高帯域信号又は雑音高帯域信号の一部の平均エネルギよりも小さいならば、SIDから開始して以降のL個のフレームの雑音高帯域信号を1よりも小さい平滑化係数で乗算して、ローカルに発生した雑音高帯域信号の新しい加重平均エネルギを取得するように構成された最適化モジュール605を更に含む。
【0138】
これに対応して、第1の復号化モジュール602は、具体的には、復号によって取得した雑音低帯域パラメータ、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数、及びローカルに発生した雑音高帯域信号の新しい加重平均エネルギに従って、第4のCNフレームを取得するように構成されている。
【0139】
本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、デコーダが、無音挿入記述子フレームSIDを取得し、このSIDが低帯域パラメータ又は高帯域パラメータを含むことを判定する。SIDが低帯域パラメータを含む場合、SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1の快適雑音CNフレームを取得する。SIDが高帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する。SIDが高帯域パラメータ及び低帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する。このように、高帯域信号及び低帯域信号に異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的の達成に役立ち、これによって超広帯域符号化及び送信の問題を解決する。
【0140】
実施形態8
図9を参照すると、この実施形態は、オーディオ・データを処理するための方法を提供する。このシステムは、オーディオ・データを符号化するための前述の装置500及びオーディオ・データを復号化するための前述の装置600を含む。
【0141】
本発明の実施形態が提供する技術的解決策は、以下の有利な効果を与える。すなわち、オーディオ信号の雑音フレームを取得し、現在の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第1の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する。デコーダが、無音挿入記述子フレームSIDを取得し、このSIDが低帯域パラメータ及び/又は高帯域パラメータを含むことを判定する。SIDが低帯域パラメータを含む場合、SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第1の快適雑音CNフレームを取得する。SIDが高帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する。SIDが高帯域パラメータ及び低帯域パラメータを含む場合、SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び送信の問題を解決する。
【0142】
実施形態が提供する装置及びシステムは、特に、方法の実施形態と同一の思想に属することができる。方法及び装置の具体的な実施プロセスは方法の実施形態において詳しく説明したので、ここでは詳細は繰り返し記載しない。
【0143】
前述の実施形態におけるオーディオ・データを処理するための方法及び装置は、オーディオ・エンコーダ及びオーディオ・デコーダに適用することができる。オーディオ・コーデックは、移動電話、無線装置、携帯情報端末(PDA)、手持ち型又は携帯型コンピュータ、GPS受信器又はナビゲーション・デバイス、カメラ、オーディオ/ビデオ・プレーヤ、カムコーダ、ビデオ・レコーダ、及び監視デバイス等、様々な電子デバイスに広く適用可能である。一般に、かかる電子デバイスはオーディオ・エンコーダ又はオーディオ・デコーダを含む。オーディオ・エンコーダ又はデコーダは、例えばDSP(デジタル信号プロセッサ)のようなデジタル回路又はチップを用いることで直接に実施することができ、又はソフトウェア・コードを用いてこのソフトウェア・コード内の手順をプロセッサに実行させることによって実施することができる。
【0144】
実施形態のステップの全て又は一部を、ハードウェア又は関連するハードウェアに命令するプログラムによって実施可能であることは、当業者には理解されよう。プログラムはコンピュータ読み取り可能記憶媒体に記憶することができる。記憶媒体は、読み取り専用メモリ、磁気ディスク、又は光ディスクを含むことができる。
【0145】
前述の記載は本発明の例示的な実施形態に過ぎず、本発明を限定することは意図していない。本発明の精神及び範囲から逸脱することなく行われるいかなる変更、均等な置換、及び改良も、本発明の保護範囲内に包含されるものである。