(58)【調査した分野】(Int.Cl.,DB名)
前記周波数領域信号の所定の周波数帯域範囲内の励振信号および前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンに従って前記帯域幅拡張周波数帯域の励振信号を予測する前記ステップは、
前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号のn個のコピーを前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nは0よりも大きい整数または非整数であり、nは、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、前記周波数領域信号の前記所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい、ステップ
を含む、請求項1に記載の方法。
前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号のn個のコピーを前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用する前記ステップは、
前記予測が、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンから開始されるとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、前記励振信号の2つの部分を、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ、または
前記予測が、前記帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、前記励振信号の2つの部分を、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ
を含む、請求項2に記載の方法。
前記帯域幅拡張周波数帯域の前記予測された励振信号および前記帯域幅拡張周波数帯域の周波数エンベロープに従って前記帯域幅拡張周波数帯域信号を予測する前記ステップの前に、前記方法は、
前記ビットストリームを復号して信号タイプを取得するステップと、
前記信号タイプに従って前記帯域幅拡張周波数帯域の周波数エンベロープを獲得するステップと
をさらに含む、請求項1から5のいずれか一項に記載の方法。
前記第1の処理モジュールは、具体的には、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号のn個のコピーを前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nは0よりも大きい整数または非整数であり、nは、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、前記周波数領域信号の前記所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい、請求項9に記載のデバイス。
前記第1の処理モジュールは、具体的には、前記予測が、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンから開始されるとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、前記励振信号の2つの部分を、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、または
前記第1の処理モジュールは、具体的には、前記予測が、前記帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、前記励振信号の2つの部分を、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、請求項10に記載のデバイス。
前記復号モジュールは、前記予測モジュールが前記帯域幅拡張周波数帯域の予測された励振信号および前記帯域幅拡張周波数帯域の周波数エンベロープに従って前記帯域幅拡張周波数帯域信号を予測する前に、前記ビットストリームを復号して前記帯域幅拡張周波数帯域の周波数エンベロープを取得するようにさらに構成された、請求項9から13のいずれか一項に記載のデバイス。
前記獲得モジュールは、具体的には、前記信号タイプが非高調波信号であるとき、前記受信されたビットストリームを逆多重化し、前記逆多重化されたビットストリームを復号して前記帯域幅拡張周波数帯域の周波数エンベロープを取得するように構成され、または
前記獲得モジュールは、具体的には、前記信号タイプが高調波信号であるとき、前記受信されたビットストリームを逆多重化し、前記逆多重化されたビットストリームを復号して前記帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、前記初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を前記帯域幅拡張周波数帯域の周波数エンベロープとして使用するように構成され、Nは1よりも大きいまたはこれに等しい、請求項15に記載のデバイス。
【発明の概要】
【課題を解決するための手段】
【0010】
本発明の実施形態は、予測された帯域幅拡張周波数帯域信号の品質を改善し、それによって、オーディオ信号の聴覚品質を向上させるように、帯域幅拡張周波数帯域信号を予測する方法および復号デバイスを提供する。
【0011】
第1の態様によれば、本発明の一実施形態は、帯域幅拡張周波数帯域信号を予測する方法であって、
受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して、周波数領域信号を取得するステップと、
周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定するステップと、
ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいとき、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するステップと、
ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいとき、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するステップと、
帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測するステップと
を含む方法を提供する。
【0012】
第1の態様を参照して、第1の態様の第1の実現形態では、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って帯域幅拡張周波数帯域の励振信号を予測するステップは、
周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nは0よりも大きい整数または非整数であり、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、周波数領域信号の所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい、ステップ
を含む。
【0013】
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第2の実現形態では、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップは、
予測が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ、または
予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ
を含む。
【0014】
第1の態様を参照して、第1の態様の第3の実現形態では、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、および周波数領域信号の、ビットが割り当てられた最高周波数ビンに従って帯域幅拡張周波数帯域の励振信号を予測するステップは、
周波数領域信号の所定の周波数帯域範囲の開始周波数ビンf
exc_startより上のm番目の周波数ビンf
exc_start+から周波数領域信号の所定の周波数帯域範囲の終了周波数ビンf
exc_endまでの励振信号のコピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nは0または0よりも大きい整数もしくは非整数であり、mはビットが割り当てられた最高周波数ビンと拡張周波数帯域のあらかじめ設定された開始周波数ビンとの間の周波数ビンの数量の値に等しい、ステップ
を含む。
【0015】
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第4の実現形態では、周波数領域信号の周波数帯域範囲内のf
exc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からf
exc_endまでの励振信号のコピーおよび周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップは、
予測が、ビットが割り当てられた最高周波数ビンから開始されるとき、周波数領域信号の周波数帯域範囲内のf
exc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からf
exc_endまでの励振信号のコピー、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ、または
予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピー、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号の周波数帯域範囲内のf
exc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からf
exc_endまでの励振信号のコピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の高周波数励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ
を含む。
【0016】
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第5の実現形態では、帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測するステップの前に、方法は、ビットストリームを復号して、帯域幅拡張周波数帯域の周波数エンベロープを取得するステップをさらに含む。
【0017】
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第6の実現形態では、帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測するステップの前に、方法は、
ビットストリームを復号して、信号タイプを取得するステップと、
信号タイプに従って帯域幅拡張周波数帯域の周波数エンベロープを獲得するステップと
をさらに含む。
【0018】
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第7の実現形態では、信号タイプに従って帯域幅拡張周波数帯域の周波数エンベロープを獲得するステップは、
信号タイプが非高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の周波数エンベロープを取得するステップ、または
信号タイプが高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を帯域幅拡張周波数帯域の周波数エンベロープとして使用するステップであって、Nは1よりも大きいまたはこれに等しい、ステップ
を含む。
【0019】
第2の態様によれば、本発明の一実施形態は、
受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して、周波数領域信号を取得するように構成された復号モジュールと、
周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定するように構成された判定モジュールと、
判定モジュールが、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいと判定したとき、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するように構成された第1の処理モジュールと、
判定モジュールが、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいと判定したとき、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するように構成された第2の処理モジュールと、
帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測するように構成された予測モジュールと
を含む復号デバイスを提供する。
【0020】
第2の態様を参照して、第2の態様の第1の実現形態では、第1の処理モジュールは、具体的には、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nは0よりも大きい整数または非整数であり、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、周波数領域信号の所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい。
【0021】
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第2の実現形態では、第1の処理モジュールは、具体的には、予測が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、または
第1の処理モジュールは、具体的には、予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい。
【0022】
第2の態様を参照して、第2の態様の第3の実現形態では、第2の処理モジュールは、具体的には、周波数領域信号の所定の周波数帯域範囲の開始周波数ビンf
exc_startより上のm番目の周波数ビンから周波数領域信号の所定の周波数帯域範囲の終了周波数ビンf
exc_endまでの励振信号のコピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nは0または0よりも大きい整数もしくは非整数であり、mはビットが割り当てられた最高周波数ビンと拡張周波数帯域のあらかじめ設定された開始周波数ビンとの間の周波数ビンの数量の値である。
【0023】
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第4の実現形態では、第2の処理モジュールは、具体的には、予測が、ビットが割り当てられた最高周波数ビンから開始されるとき、周波数領域信号の周波数帯域範囲内のf
exc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からf
exc_endまでの励振信号のコピー、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、または
第2の処理モジュールは、具体的には、予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピー、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号の周波数帯域範囲内のf
exc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からf
exc_endまでの励振信号のコピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の高周波数励振信号として使用するように構成され、nの非整数部分は1よりも小さい。
【0024】
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第5の実現形態では、復号モジュールは、予測モジュールが帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測する前に、ビットストリームを復号して、帯域幅拡張周波数帯域の周波数エンベロープを取得するようにさらに構成される。
【0025】
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第6の実現形態では、デバイスは獲得モジュールをさらに含み、
復号モジュールは、予測モジュールが帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測する前に、ビットストリームを復号して、信号タイプを取得するようにさらに構成され、
獲得モジュールは、信号タイプに従って帯域幅拡張周波数帯域の周波数エンベロープを獲得するように構成される。
【0026】
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第7の実現形態では、獲得モジュールは、具体的には、信号タイプが非高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して、帯域幅拡張周波数帯域の周波数エンベロープを取得するように構成され、または
獲得モジュールは、具体的には、信号タイプが高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を帯域幅拡張周波数帯域の周波数エンベロープとして使用するように構成され、Nは1よりも大きいまたはこれに等しい。
【0027】
本発明の実施形態における帯域幅拡張周波数帯域信号を予測する方法および復号デバイスにより、帯域幅拡張の開始周波数ビンが設定され、周波数領域信号が復号される最高周波数ビンと開始周波数ビンが比較され、帯域幅拡張周波数帯域の励振復元を実行し、それによって、拡張された励振信号はフレーム間で連続しており、復号された励振信号の周波数ビンが維持され、それによって、復元された帯域幅拡張周波数帯域信号の聴覚品質を確保し、出力オーディオ信号の聴覚品質を向上させる。
【0028】
本発明の実施形態における、または先行技術における技術的解決策をより明確に説明するために、以下は、実施形態または先行技術を説明するために必要とされる添付の図面を簡単に紹介する。明らかに、以下の説明における添付の図面は本発明のいくつかの実施形態を示し、この技術分野の当業者は、創作的な労力なしで、これらの添付の図面から他の図面を依然として導き出し得る。
【発明を実施するための形態】
【0030】
本発明の実施形態の目的、技術的解決策、および利点をより明確にするために、以下は、本発明の実施形態における添付の図面を参照して、本発明の実施形態における技術的解決策を明確かつ十分に説明する。明らかに、説明される実施形態は本発明の実施形態のうちのいくつかであり、全てではない。創作的な労力なしで本発明の実施形態に基づいてこの技術分野の当業者によって取得される他の全ての実施形態は、本発明の保護範囲に含まれるものとする。
【0031】
デジタル信号処理の分野では、オーディオコーデックおよびビデオコーデックが、携帯電話、ワイヤレス装置、携帯情報端末(PDA)、ハンドヘルドまたはポータブルコンピュータ、GPS受信機/ナビゲータ、カメラ、オーディオ/ビデオプレーヤ、カムコーダ、ビデオレコーダ、およびモニタリングデバイスのようなさまざまな電子デバイスに広く適用されている。一般に、このタイプの電子デバイスはオーディオ符号化器またはオーディオ復号器を含み、ここで、オーディオ符号化器または復号器は、DSP(digital signal processor)のようなデジタル回路またはチップによって直接実現されてもよいし、ソフトウェアコードによってプロセッサを駆動してソフトウェアコード内のプロセスを実行することによって実現されてもよい。
【0032】
たとえば、オーディオ符号化器は、最初に、入力信号についてフレーミング処理を実行して、1フレームが20ミリ秒である時間領域データを取得し、次いで、時間領域データについてウィンドーイング(windowing)処理を実行してウィンドーイング後の信号を取得し、ウィンドーイング後の時間領域信号について周波数領域変換を実行して信号を時間領域から周波数領域に変換し、周波数領域信号を符号化し、符号化された周波数領域信号を復号器側に送信する。符号化器側によって送信された圧縮ビットストリームを受信した後、復号器側は、信号について対応する復号動作を実行し、復号することによって取得された周波数領域信号について符号化側によって使用された変換に対応する逆変換を実行して信号を周波数領域から時間領域に変換し、時間領域信号について後処理を実行して合成信号すなわち復号器側によって出力された信号を取得する。
【0033】
図1は、先行技術における符号化デバイスの概略構造図である。
図1に示されるように、先行技術の符号化デバイスは、時間-周波数変換モジュール10と、エンベロープ抽出モジュール11と、エンベロープ量子化および符号化モジュール12と、ビット割り当てモジュール13と、励振生成モジュール14と、励振量子化および符号化モジュール15と、多重化モジュール16とを含む。
【0034】
図1に示されるように、時間-周波数変換モジュール10は、入力オーディオ信号を受信し、次いで、オーディオ信号を時間領域信号から周波数領域信号に変換するように構成される。次いで、エンベロープ抽出モジュール11が、時間-周波数変換モジュール10による変換によって取得された周波数領域信号から周波数エンベロープを抽出し、ここで、周波数エンベロープは、サブバンド正規化因子と呼ばれ得る。ここでは、周波数エンベロープは、周波数領域信号中の低周波数帯域信号の周波数エンベロープおよび高周波数帯域信号の周波数エンベロープを含む。エンベロープ量子化および符号化モジュール12は、エンベロープ抽出モジュール11によって取得された周波数エンベロープについて量子化および符号化処理を実行し、量子化および符号化された周波数エンベロープを取得する。ビット割り当てモジュール13は、量子化された周波数エンベロープに従って、各サブバンドのビット割り当てを決定する。励振生成モジュール14は、エンベロープ量子化および符号化モジュール12によって取得された量子化および符号化されたエンベロープに関する情報を使用することによって、時間-周波数変換モジュール10によって取得された周波数領域信号について正規化処理を実行して励振信号すなわち正規化された周波数領域信号を取得する。励振信号も、高周波数帯域信号の励振信号および低周波数帯域信号の励振信号を含む。励振量子化および符号化モジュール15は、ビット割り当てモジュール13によって割り当てられた各サブバンドのビット割り当てに従って、励振生成モジュール14によって生成された励振信号について量子化および符号化処理を実行して量子化された励振信号を取得する。多重化モジュール16は、エンベロープ量子化および符号化モジュール12によって量子化された、量子化された周波数エンベロープと励振量子化、および符号化モジュール15によって量子化された、量子化された励振信号をビットストリームに個別に多重化し、ビットストリームを復号デバイスに出力する。
【0035】
図2は、先行技術における復号デバイスの概略構造図である。
図2に示されるように、既存の復号デバイスは、逆多重化モジュール20と、周波数エンベロープ復号モジュール21と、ビット割り当て獲得モジュール22と、励振信号復号モジュール23と、帯域幅拡張モジュール24と、周波数領域信号復元モジュール25と、周波数-時間変換モジュール26とを含む。
【0036】
図2に示されるように、逆多重化モジュール20は、符号化デバイス側によって送られたビットストリームを受信し、ビットストリームを逆多重化して(復号を含む)量子化された周波数エンベロープおよび量子化された励振信号を個別に取得する。周波数エンベロープ復号モジュール21は、逆多重化モジュール20による逆多重化によって取得された信号から、量子化された周波数エンベロープを獲得し、量子化および復号を実行して周波数エンベロープを取得する。ビット割り当て獲得モジュール22は、周波数エンベロープ復号モジュール21によって取得された周波数エンベロープに従って各サブバンドのビット割り当てを決定する。励振信号復号モジュール23は、逆多重化モジュール20による逆多重化によって取得された信号から、量子化された励振信号を獲得し、各サブバンドの、ビット割り当て獲得モジュール22によって取得されたビット割り当てに従って、量子化および復号を実行して励振信号を取得する。帯域幅拡張モジュール24は、励振信号復号モジュール23によって取得された励振信号に従って帯域幅全体について拡張を実行する。具体的には、高周波数帯域信号の励振信号は、低周波数帯域信号の励振信号を使用することによって拡張される。励振信号およびエンベロープ信号を量子化および符号化するとき、励振量子化および符号化モジュール15およびエンベロープ量子化および符号化モジュール12は、ほとんどのビットを使用して比較的重要な低周波数帯域信号の信号を量子化し、少しのビットを使用して高周波数帯域信号の信号を量子化し、高周波数帯域信号の励振信号は除外すらされ得る。したがって、帯域幅拡張モジュール24は、低周波数帯域信号の励振信号を使用して高周波数帯域信号の励振信号を拡張する必要があり、それによって、周波数帯域全体の励振信号を取得する。周波数領域信号復元モジュール25は周波数エンベロープ復号モジュール21および帯域幅拡張モジュール24に個別に接続され、周波数領域信号復元モジュール25は、周波数エンベロープ復号モジュール21によって取得された周波数エンベロープ、および周波数帯域全体の、帯域幅拡張モジュール24によって取得された励振信号に従って、周波数領域信号を復元させる。周波数-時間変換モジュール26は、周波数領域信号復元モジュール25によって復元された周波数領域信号を時間領域信号に変換し、それによって、最初に入力されたオーディオ信号を取得する。
【0037】
図1および
図2は、先行技術における符号化デバイスおよび対応する復号デバイスの構造図である。
図1および
図2に示される先行技術における符号化デバイスおよび復号デバイスの処理プロセスによれば、先行技術では、低周波数帯域信号の、復号デバイスが低周波数帯域信号の周波数領域信号を復元するときに使用される、励振信号およびエンベロープ情報が符号化デバイス側によって送られることが知られ得る。したがって、低周波数帯域信号の周波数領域信号の復元は比較的正確である。高周波数帯域信号の周波数領域信号では、まず、低周波数帯域信号の励振信号を使用して高周波数帯域信号の励振信号を予測し、次いで、高周波数帯域信号の、符号化デバイス側によって送られるエンベロープ情報を使用して、高周波数帯域信号の予測された励振信号を修正する必要があり、それによって、高周波数帯域信号の周波数領域信号を取得する。高周波数帯域信号の周波数領域信号を予測するとき、符号化デバイスは、信号タイプを考慮せず、同じ周波数エンベロープを使用する。たとえば、信号タイプが高調波であるとき、使用される周波数エンベロープによってカバーされるサブバンド範囲は、比較的狭い(1つの高調波の頂から谷までカバーされるサブバンド範囲よりも小さい)。周波数エンベロープが、高周波数帯域信号の予測される励振を修正するために使用されるとき、より多くのノイズがもたらされ、したがって、修正によって取得された高周波数帯域信号と実際の高周波数帯域信号との間に比較的大きな誤差が存在し、高周波数帯域信号を予測する精度に著しく影響し、予測される高周波数帯域信号の品質を低下させ、オーディオ信号の聴覚品質を低下させる。さらに、低周波数帯域信号の励振信号に従って高周波数帯域信号の励振信号が予測される前述の先行技術を使用することによって、異なる低周波数帯域信号の励振信号が異なるフレームの同じ高周波数帯域信号にコピーされ得、励振の不連続性を引き起こし、予測された高周波数帯域信号の品質を低下させ、それによって、オーディオ信号の聴覚品質を低下させる。したがって、本発明の実施形態の以下の技術的解決策は、前述の技術的問題を解決するために使用され得る。
【0038】
図3は、本発明の一実施形態による、帯域幅拡張周波数帯域信号を予測する方法のフローチャートである。この実施形態では、帯域幅拡張周波数帯域信号を予測する方法は、復号デバイスによって実行され得る。
図3に示されるように、この実施形態では、帯域幅拡張周波数帯域信号を予測する方法は、具体的には、以下のステップを含み得る。
【0039】
100。復号デバイスは、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して周波数領域信号を取得する。
【0040】
101。復号デバイスは、周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定する。ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいとき、ステップ102を実行する。そうでない場合、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいとき、ステップ103を実行する。
【0041】
102。復号デバイスは、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測し、ステップ104を実行する。
【0042】
103。復号デバイスは、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測し、ステップ104を実行する。
【0043】
104。復号デバイスは、帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測する。
【0044】
この実施形態における帯域幅拡張周波数帯域信号を予測する方法により、帯域幅拡張の開始周波数ビンが設定され、周波数領域信号が復号される最高周波数ビンと開始周波数ビンが比較されて帯域幅拡張周波数帯域の励振復元を実行し、それによって、拡張された励振信号はフレーム間で連続しており、復号された励振信号の周波数ビンが維持され、それによって、復元された帯域幅拡張周波数帯域信号の聴覚品質を確保し、出力オーディオ信号の聴覚品質を向上させる。
【0045】
任意選択で、前述の実施形態の技術的解決策に基づいて、
図3に示される実施形態の拡張実施形態を形成するために、以下の拡張技術的解決策も含まれ得る。この拡張実施形態では、ステップ100の前に、具体的には、方法は、以下をさらに含み得る。
(a)復号デバイスは、符号化デバイスによって送られたビットストリームを受信し、ここで、ビットストリームは、低周波数帯域信号の量子化パラメータおよび帯域幅拡張周波数帯域信号の周波数エンベロープを搬送する。この実施形態では、低周波数帯域信号の量子化パラメータは、低周波数帯域信号を一意に識別するために使用される。
(b)復号デバイスは、低周波数帯域信号の量子化パラメータに従って低周波数帯域信号の励振信号を獲得する。
【0046】
具体的には、低周波数帯域信号の量子化パラメータに従って復号デバイスによって低周波数帯域信号の励振信号を獲得する具体的なプロセスについては、先行技術を参照されたい。たとえば、低周波数帯域信号の量子化パラメータが低周波数帯域信号の励振信号および低周波数帯域信号の周波数エンベロープであるとき、復号デバイスが低周波数帯域信号の量子化パラメータに従って低周波数帯域信号の励振信号を獲得することは、具体的には、以下であり得る。復号デバイスは、まず、低周波数帯域信号の励振信号および低周波数帯域信号の周波数エンベロープに従って低周波数帯域信号(ここでは、低周波数帯域信号は周波数領域信号である)を復元し、次いで、低周波数帯域信号について自己適応型正規化処理を実行して低周波数帯域信号の励振信号を取得する。低周波数帯域信号の、量子化パラメータ内にある励振信号を使用して、帯域幅拡張周波数帯域信号の励振信号が高周波数帯域信号のエネルギー要件を満たすことができることを予測するとき、低周波数帯域信号の、量子化パラメータ内にある励振信号は、帯域幅拡張周波数帯域の励振信号を予測するために直接使用され得る。
【0047】
自己適応型正規化処理の前述の形態は、以下のいくつかの形態を使用し得る。
(1)復号デバイスは、(低周波数帯域信号の励振信号および低周波数帯域信号の周波数エンベロープのような)低周波数帯域信号の復号された量子化パラメータを使用することによって低周波数帯域信号を復元し、移動ウィンドウが周波数領域係数内に設定され、各移動ウィンドウ内の周波数領域係数振幅の平均値が計算され、ここで、計算された平均値の数量は低周波数帯域信号の周波数領域係数の数量と同じであり、低周波数帯域信号(周波数領域信号)は、周波数領域係数振幅の対応する平均値で除算されて、低周波数帯域信号の励振信号を取得する。たとえば、低周波数帯域信号は、N1個の周波数領域係数を有する。第1の周波数領域係数から第10の周波数領域係数の平均値が計算され、第2の周波数領域係数から第11の周波数領域係数の平均値が計算され、第3の周波数領域係数から第12の周波数領域係数の平均値が計算される。アナロジーによって、N1個の平均値が計算される。次いで、N1個の低周波数帯域信号(周波数領域信号)が、対応する平均値で除算されて、低周波数帯域信号(周波数領域信号)の励振信号を取得する。
(2)復号デバイスが、(低周波数帯域信号の励振信号および低周波数帯域信号の周波数エンベロープのような)低周波数帯域信号の量子化パラメータを復号することによって、低周波数帯域信号(周波数領域信号)を復元する。高調波信号について、低周波数帯域信号のN(N>1)個の隣接する周波数エンベロープの平均値が計算され、N個の隣接するサブバンドの周波数エンベロープとして使用され、N個の隣接するサブバンドの全ての周波数領域信号は平均値で除算されて、N個の隣接するサブバンドの低周波数帯域信号の励振信号を取得する。アナロジーによって、低周波数帯域信号全体の励振信号が計算される。非高調波信号について、低周波数帯域信号の各サブバンドは、M(M>1)個の小さいサブバンドにさらに分割され、周波数エンベロープが、各々の小さいサブバンドについてさらに計算され、小さいサブバンドの周波数領域信号が、小さいサブバンドの計算された周波数エンベロープによって分割されて、小さいサブバンドの励振信号を取得する。アナロジーによって、低周波数帯域信号全体の励振信号が取得される。自己適応型正規化処理の詳細なプロセスについては、先行技術の記載を参照されたい。ここでは、詳細は再度説明しない。
【0048】
任意選択で、この拡張実施形態では、ステップ104の前に、具体的には、方法は、以下をさらに含み得る。復号デバイスは、ビットストリームを復号して、帯域幅拡張周波数帯域の周波数エンベロープを取得し、それによって、ステップ104が実行できる。
【0049】
あるいは、任意選択で、ステップ104の前に、具体的には、方法は、以下をさらに含み得る。復号デバイスは、ビットストリームを復号して信号タイプを取得し、信号タイプに従って帯域幅拡張周波数帯域の周波数エンベロープを獲得する。
【0050】
たとえば、信号タイプが非高調波信号であるとき、復号デバイスは、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の周波数エンベロープを取得する。信号タイプが高調波信号であるとき、復号デバイスは、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を帯域幅拡張周波数帯域の周波数エンベロープとして使用し、ここで、Nは1よりも大きいまたはこれに等しい。
【0051】
前述の実施形態における帯域幅拡張周波数帯域信号を予測する方法を使用することによって、帯域幅拡張周波数帯域信号の、前のフレームと後のフレームとの間にある予測された励振信号の連続性が効果的に確保でき、それによって、復元される帯域幅拡張周波数帯域信号の聴覚品質を確保し、オーディオ信号の聴覚品質を向上させる。
【0052】
図4は、本発明のもう1つの実施形態による、帯域幅拡張周波数帯域信号を予測する方法のフローチャートである。
図3に示される実施形態に基づいて、この実施形態では、本発明の技術的解決策は、帯域幅拡張周波数帯域信号を予測する方法において、より詳細に紹介される。この実施形態では、帯域幅拡張周波数帯域信号を予測する方法は、具体的には、以下の内容を含み得る。
【0053】
200。復号デバイスは、符号化デバイスによって送られたビットストリームを受信し、受信されたビットストリームを復号して周波数領域信号を取得する。
【0054】
ビットストリームは、低周波数帯域信号の量子化パラメータおよび帯域幅拡張周波数帯域信号の周波数エンベロープを搬送する。
【0055】
201。復号デバイスは、低周波数帯域信号の量子化パラメータに従って低周波数帯域信号の励振信号を獲得する。
【0056】
202。復号デバイスは、低周波数帯域信号の量子化パラメータに従って、周波数領域信号の、ビットが割り当てられた最高周波数f
last_sfmを決定する。
【0057】
この実施形態では、f
last_sfmは、周波数領域信号の、ビットが割り当てられた最高周波数ビンを表すために使用される。
【0058】
203。復号デバイスは、f
last_sfmが、周波数領域信号の帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startよりも小さいかどうか判定する。f
last_sfmがf
bwe_startよりも小さいとき、ステップ204を実行する。そうでない場合、f
last_sfmがf
bwe_startよりも大きいまたはこれに等しいとき、ステップ205を実行する。
【0059】
図5aおよび
図5bの周波数帯域内の周波数ビンの概略図を参照すると、ビットが割り当てられた周波数領域信号は、復号することによって直接取得され得る。しかしながら、帯域幅拡張周波数帯域は、復号された周波数領域信号に従った予測によって取得される必要があり、すなわち、周波数領域信号の所定の周波数帯域範囲内の励振信号は、帯域幅拡張周波数帯域の励振信号を予測するように選択される。f
last_sfmとf
bwe_startの間の大きさの関係が異なるとき、拡張の開始周波数および信号拡張範囲が異なる。図に示される影付きの部分は、帯域幅拡張周波数帯域の、励振信号が低周波数帯域からコピーされる必要がある周波数帯域範囲を表し、
図5aの影付きの部分は、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンから帯域幅拡張周波数帯域の最高周波数ビンまでであり、
図5bの影付きの部分は、ビットが割り当てられた最高周波数ビンから帯域幅拡張周波数帯域の最高周波数ビンまでである。
図5aの場合、コピーされた励振信号は、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを含む。
図5bの場合、コピーされた励振信号は、所定の周波数帯域範囲のf
exc_start+から所定の周波数帯域範囲の終了周波数f
exc_endまでの励振信号と、所定の周波数帯域範囲内の励振信号のn個のコピーを含み、ここで、nは0よりも大きい整数または非整数である。
【0060】
この実施形態では、f
bwe_startは、周波数領域信号の帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンを表すために使用される。f
bwe_startの選択は、符号化レート(すなわち、ビットの総量)に関連する。高い符号化レートは、帯域幅拡張周波数帯域の、選択可能な、より高いあらかじめ設定された開始周波数f
bwe_startを示す。たとえば、超広帯域信号について、符号化レートが24kbpsであるとき、周波数領域信号の帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startは6.4kHzに等しい。符号化レートが32kbpsであるとき、帯域幅拡張周波数帯域の、周波数領域信号のあらかじめ設定された開始周波数f
bwe_startは8kHzに等しい。
【0061】
204。復号デバイスは、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startに従って、帯域幅拡張周波数帯域の励振信号を予測し、ステップ206を実行する。
【0062】
この実施形態では、周波数領域信号の所定の周波数帯域範囲は、f
exc_startからf
exc_endまでであり低周波数帯域信号内にある所定の周波数帯域範囲であり、f
exc_startは、周波数領域信号の、低周波数帯域信号内にある帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンであり、f
exc_endは、周波数領域信号の、低周波数帯域信号内にある帯域幅拡張周波数帯域のあらかじめ設定された終了周波数ビンであり、ここで、f
exc_endはf
exc_startよりも大きい。
【0063】
たとえば、復号デバイスは、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の励振信号として使用し得る。ここで、nは0よりも大きい整数または非整数であり、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の周波数ビンの数量の、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい。
【0064】
たとえば、具体的な実現では、予測が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startから開始されるとき、復号デバイスは、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、この励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域信号として使用し得る。この実施形態では、nは正の整数または小数であり得るとともに、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の周波数ビンの数量の、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい。周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲の選択は、信号タイプおよび符号化レートに関連する。たとえば、比較的低いレートの場合、高調波信号については、低周波数帯域信号における比較的良い符号化を有する比較的低い周波数帯域信号が選択され、非高調波信号については、低周波数帯域信号における比較的劣った符号化を有する比較的高い周波数帯域信号が選択される。比較的高いレートの場合、高調波信号について、低周波数帯域信号における比較的高い周波数帯域が選択され得る。
【0065】
帯域幅拡張周波数帯域の最高周波数ビンは、周波数帯域の、信号が出力される必要がある最高周波数、または指定された周波数を指す。たとえば、広帯域信号は7kHzまたは8kHzであってよく、超広帯域信号は14kHzまたは16kHz、または他のあらかじめ設定された特定の周波数であってもよい。
【0066】
この実施形態では、予測が帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startから開始されるとき、復号デバイスは、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域信号として使用することは、具体的には、以下の形態で実現され得る。予測が帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startから開始されるとき、復号デバイスは、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し、ここで、nの非整数部分は1よりも小さい。
【0067】
この実施形態では、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーは順次に作製されてよく、すなわち、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーが作製されるまで、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号の1個のコピーが毎回作製される。または、ミラーコピー(または、折り返しコピー(fold copy)と呼ばれる)も作製され得る。すなわち、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーが作製されるとき、n個のコピーが完了するまで、前方コピー(すなわちf
exc_startからf
exc_endまで)と後方コピー(すなわちf
exc_endからf
exc_startまで)が交互に順次に作製される。
【0068】
あるいは、予測が帯域幅拡張周波数帯域のあらかじめ設定された最高周波数f
top_sfmから開始されるとき、復号デバイスは、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の高周波数励振信号として使用し得る。これは、具体的には、以下の形態で実現され得る。予測が帯域幅拡張周波数帯域の最高周波数f
top_sfmから開始されるとき、復号デバイスは、f
exc_startからf
exc_endまでの周波数帯域範囲内の低周波数励振信号のn個のコピーにおける非整数コピーおよび周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し、ここで、nの非整数部分は1よりも小さい。
【0069】
具体的には、予測が帯域幅拡張周波数帯域の最高周波数f
top_sfmから開始されるとき、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製することは、ブロック単位でコピーすることに属する。たとえば、帯域幅拡張周波数帯域の最高周波数ビンは14kHzであり、f
exc_startからf
exc_endまでは1.6kHzから4kHzまでである。f
exc_startからf
exc_endまでの低周波数励振信号の0.5個のコピー、すなわち1.6kHzから2.8kHzまでが作製されるとき、このステップの解決策を使用することによって、1.6kHzから2.8kHzまでの低周波数帯域内の励振信号は、(14-1.2)kHzと14kHzとの間の帯域幅拡張周波数帯域にコピーされ、この帯域幅拡張周波数帯域の励振信号として使用され得る。この場合、したがって、1.6kHzが(14-1.2)kHzにコピーされ、したがって、2.8kHzが14kHzにコピーされる。
【0070】
前述の2つの形態では、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startから始まるまたは帯域幅拡張周波数帯域の最高周波数f
top_sfmから始まる、帯域幅拡張周波数帯域の開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号を予測するかどうかに関係なく、予測によって最終的に取得された、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号の結果は同じである。
【0071】
前述の解決策の実現プロセスでは、商および剰余がまず計算され、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと周波数帯域信号の最高周波数f
top_sfmとの間の周波数帯域幅をf
exc_startとf
exc_endとの間の周波数帯域幅で除算することによって獲得され得る。ここでは、商はnの整数部分であり、剰余/(f
exc_end-f
exc_start)はnの非整数部分である。このようにして、nの整数部分およびnの非整数部分がまず計算され得る。次いで、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号が前述の形態で予測される。
【0072】
205。復号デバイスは、f
exc_startからf
exc_endまでの範囲内の励振信号、f
bwe_start、およびf
last_sfmに従って、帯域幅拡張周波数帯域の励振信号を予測し、ステップ206を実行する。
【0073】
たとえば、復号デバイスは、周波数領域信号の所定の周波数帯域範囲の開始周波数ビンf
exc_startより上のm番目の周波数ビンから周波数領域信号の所定の周波数帯域範囲の終了周波数ビンf
exc_endまでの励振信号のコピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の励振信号として使用し得る。ここで、nは0または0よりも大きい整数もしくは非整数であり、mはビットが割り当てられた最高周波数f
last_sfmと拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startとの間の周波数ビンの数量の値である。
【0074】
たとえば、予測が、ビットが割り当てられた最高周波数f
last_sfmから開始されるとき、復号デバイスは、周波数領域信号の所定の周波数帯域範囲内の(f
exc_start+(f
last_sfm-f
bwe_start))からf
exc_endまでの励振信号のコピーおよびf
exc_startからf
exc_endまでの励振周波数帯域範囲内の励振信号のn個のコピーを順次作製し、励振信号の2つの部分を、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し得る。ここで、nは0または0よりも大きい整数もしくは非整数である。
【0075】
具体的な実現では、予測が、ビットが割り当てられた最高周波数f
last_sfmから開始されるとき、復号デバイスは、周波数領域信号の所定の周波数帯域範囲内の(f
exc_start+(f
last_sfm-f
bwe_start))からf
exc_endまでの励振信号のコピー、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号、および周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し得る。ここで、nの非整数部分は1よりも小さい。
【0076】
あるいは、予測が帯域幅拡張周波数帯域の最高周波数f
top_sfmから開始されるとき、復号デバイスは、周波数領域のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーおよび周波数領域信号の所定の周波数帯域範囲内の(f
exc_start+(f
last_sfm-f
bwe_start))からf
exc_endまでの励振信号のコピーを順次作製し、励振信号の2つの部分を、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し得る。ここで、同様に、nは0または0よりも大きい整数もしくは非整数である。
【0077】
具体的な実現では、予測が帯域幅拡張周波数帯域の最高周波数f
top_sfmから開始されるとき、復号デバイスは、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピー、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号の所定の周波数帯域範囲内の(f
exc_start+(f
last_sfm-f
bwe_start))からf
exc_endまでの励振信号のコピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅拡張周波数帯域の励振信号として使用し得る。ここで、nの非整数部分は1よりも小さい。
【0078】
復号デバイスが、帯域幅拡張周波数帯域の最高周波数f
top_sfmから始まる予測を実行するとき、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製することも、ブロック単位でコピーすることに属する。周波数領域信号の所定の周波数帯域範囲内の低周波数に対応する励振信号は、帯域幅拡張周波数帯域内の対応する低周波数に配置され、周波数領域信号の所定の周波数帯域範囲内の高周波数に対応する励振信号は、帯域幅拡張周波数帯域内の対応する高周波数に配置される。詳細については、前述の関連する記載を参照されたい。同様に、周波数領域信号のf
exc_startからf
exc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーも、順次コピーまたはミラーコピーであり得る。詳細については、前述の関連する記載を参照されたい。ここでは、詳細は再度説明しない。
【0079】
前述の2つの形態では、ビットが割り当てられた最高周波数f
last_sfmから始まるまたは帯域幅拡張周波数帯域の最高周波数f
top_sfmから始まる、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅拡張周波数帯域の励振信号を予測するかどうかに関係なく、予測によって最終的に取得された、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅拡張周波数帯域の励振信号の結果は同じである。
【0080】
さらに、前述の解決策では、(f
exc_start+(f
last_sfm-f
bwe_start))からf
exc_endまでの帯域幅が、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅よりも大きいまたはこれに等しいとき、(f
exc_start+(f
last_sfm-f
bwe_start))からf
exc_endまでの(f
exc_start+(f
last_sfm-f
bwe_start))から始まる帯域幅において、低周波数帯域信号の、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅と同じ帯域幅を有する励振信号を獲得し、励振信号を、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅拡張周波数帯域の励振信号として使用する必要があるだけである。
【0081】
前述の解決策の実現プロセスでは、商および剰余がまず計算され、(f
exc_start+(f
last_sfm-f
bwe_start))と、ビットが割り当てられた最高周波数f
last_sfmと周波数帯域信号の最高周波数f
top_sfmとの間の周波数帯域幅との差を、f
exc_startとf
exc_endとの間の周波数帯域幅で除算することによって獲得され得る。ここでは、商はnの整数部分であり、剰余/(f
exc_end-f
exc_start)はnの非整数部分である。このようにして、nの整数部分およびnの非整数部分がまず計算され得る。次いで、ビットが割り当てられた最高周波数f
last_sfmと帯域幅拡張周波数帯域の最高周波数f
top_sfmとの間の帯域幅拡張周波数帯域の励振信号が前述の形態で予測される。
【0082】
たとえば、符号化レートが24kbpsであるとき、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startは6.4kHzに等しく、f
top_sfmは14kHzである。帯域幅拡張周波数帯域の励振信号は、以下の形態で予測される。低周波数帯域信号のあらかじめ選択された拡張範囲が0kHz〜4kHzであり、N番目のフレームにおける、ビットが割り当てられた最高周波数f
last_sfmは8kHzに等しいと仮定する。この場合、f
last_sfmはf
bwe_startよりも大きい。まず、自己適応型正規化処理が、低周波数帯域信号の、0kHz〜4kHzの周波数帯域範囲内にある選択された励振信号について実行され(自己適応型正規化処理の具体的なプロセスについては、前述の実施形態における記載を参照されたい。ここでは、詳細は再度説明しない)、次いで、低周波数帯域信号の正規化された励振信号から、8kHzよりも大きい帯域幅拡張周波数帯域の励振信号が予測される。前述の実施形態における形態によれば、低周波数帯域信号の選択された正規化された励振信号をコピーするための順序は次の通りである。まず、周波数領域信号の所定の周波数帯域範囲内の(8kHz-6.4kHz)から4kHzまでの励振信号がコピーされ、次いで、周波数領域信号のf
exc_startからf
exc_endまで(0kHz〜4kHz)の所定の周波数帯域範囲内の励振信号の0.9個のコピーが作製され、すなわち、周波数領域信号の所定の周波数帯域範囲内の0kHzから3.6kHzまでの励振信号がコピーされ、励振信号の2つの部分が、ビットが割り当てられた最高周波数(f
last_sfm=8kHz)と帯域幅拡張周波数帯域の最高周波数f
top_sfm(f
top_sfm=14kHz)との間の帯域幅拡張周波数帯域の励振信号として使用される。(N+1)番目のフレームにおける、ビットが割り当てられた最高周波数f
last_sfmが6.4kHzよりも小さいまたはこれに等しい(帯域幅拡張周波数帯域のあらかじめ設定された開始周波数f
bwe_startが6.4kHzに等しい)ならば、自己適応型正規化処理が、低周波数帯域信号の、0kHz〜4kHzの周波数帯域範囲内である選択された励振信号について実行され、次いで、6.4kHzよりも大きい帯域幅拡張周波数帯域の励振信号が、低周波数帯域信号の正規化された励振信号から予測される。前述の実施形態における形態によれば、低周波数帯域信号の選択された正規化された励振信号をコピーするための順序は次の通りである。まず、周波数領域信号のf
exc_startからf
exc_endまで(0kHz〜4kHz)の所定の周波数帯域範囲内の励振信号の1つのコピーが作製され、次いで、周波数領域信号のf
exc_startからf
exc_endまで(0kHz〜4kHz)の所定の周波数帯域範囲内の励振信号の0.9個のコピーが作製され、励振信号の2つの部分が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数(f
bwe_start=6.4kHz)と帯域幅拡張周波数帯域の最高周波数f
top_sfm(f
top_sfm=14kHz)との間の帯域幅拡張周波数帯域の励振信号として使用される。
【0083】
帯域幅拡張周波数帯域の最高周波数ビンは、周波数領域信号のタイプに従って決定される。たとえば、周波数領域信号のタイプが超広帯域信号であるとき、帯域幅拡張周波数帯域の最高周波数f
top_sfmは14
kH
zである。互いと通信する前に、一般に、符号化デバイスおよび復号デバイスは、送信されるべき周波数領域信号のタイプを決定している。したがって、周波数領域信号の最高周波数ビンは決定されていると考え得る。
【0084】
206。復号デバイスは、帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測する。
【0085】
帯域幅拡張周波数帯域信号の励振信号の前述の予測から、N番目のフレームと(N+1)番目のフレームにおける帯域幅拡張の開始周波数ビンは異なるが、8kHzよりも大きい同じ周波数帯域の励振信号が、低周波数帯域信号の同じ周波数帯域の励振信号から予測されることがわかり得る。したがって、フレーム間の連続性が確保できる。次いで、ステップ206が使用され、それによって、帯域幅拡張周波数帯域の正確な予測を実現する。
【0086】
前述の実施形態の技術的解決策を使用することによって、帯域幅拡張周波数帯域信号の、前のフレームと後のフレームとの間にある予測された励振信号の連続性が効果的に確保でき、それによって、復元される帯域幅拡張周波数帯域信号の聴覚品質を確保し、オーディオ信号の聴覚品質を向上させる。
【0087】
前述の方法の実施形態のステップの全てまたは一部は、関連するハードウェアに命令するプログラムによって実現され得ることを、この技術分野の当業者は理解し得る。プログラムは、コンピュータ可読記憶媒体に保存され得る。プログラムが実行されるとき、前述の方法の実施形態のステップが実行される。前述の記憶媒体は、ROM、RAM、磁気ディスク、または光ディスクのような、プログラムコードを保存できる任意の媒体を含む。
【0088】
図6は、本発明の一実施形態による復号デバイスの概略構造図である。
図6に示されるように、この実施形態における復号デバイスは、復号モジュール30と、判定モジュール31と、第1の処理モジュール32と、第2の処理モジュール33と、予測モジュール34とを含む。
【0089】
復号モジュール30は、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して周波数領域信号を取得するように構成される。判定モジュール31は復号モジュール30に接続され、判定モジュール31は、復号モジュール30による復号によって取得された周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定するように構成される。第1の処理モジュール32は判定モジュール31に接続され、第1の処理モジュール32は、判定モジュール31が、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいと判定したとき、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するように構成される。第2の処理モジュール33も判定モジュール31に接続され、第2の処理モジュール33は、判定モジュール31が、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいと判定したとき、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するように構成される。予測モジュール34は、第1の処理モジュール32または第2の処理モジュール33に接続される。判定モジュール31が、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいと判定したとき、予測モジュール34は第1の処理モジュール32に接続される。判定モジュール31が、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいと判定したとき、予測モジュール
34は第2の処理モジュール33に接続される。予測モジュール34は、帯域幅拡張周波数帯域の、第1の処理モジュール32または第2の処理モジュール33によって予測される励振信号、および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周
波数帯域信号を予測するように構成される。
【0090】
この実施形態における復号デバイスにより、前述のモジュールを使用して帯域幅拡張周波数帯域信号の予測を実現する実現プロセスは、前述の関連する方法の実施形態における実現プロセスと同じである。詳細については、前述の関連する方法の実施形態の記載を参照されたい。ここでは、詳細は再度説明しない。
【0091】
この実施形態における復号デバイスにより、前述のモジュールを使用することによって、帯域幅拡張の開始周波数ビンが設定され、周波数領域信号が復号された最高周波数ビンと開始周波数ビンが比較され、帯域幅拡張周波数帯域の励振復元を実行し、それによって、拡張された励振信号はフレーム間で連続しており、復号された励振信号の周波数ビンは維持され、それによって、復元された帯域幅拡張周波数帯域信号の聴覚品質を確保し、出力オーディオ信号の聴覚品質を向上させる。
【0092】
図7は、本発明のもう1つの実施形態による復号デバイスの概略構造図である。
図7に示されるように、
図6に示される前述の実施形態に基づいて、この実施形態における復号デバイスにより、本発明の技術的解決策が、より詳細にさらに紹介される。
【0093】
図7に示されるように、第1の処理モジュール32は、具体的には、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nは0よりも大きい整数または非整数であり、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、周波数領域信号の所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい。
【0094】
さらに任意選択で、この実施形態では、復号デバイス内の第1の処理モジュール32は、具体的には、予測が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nの非整数部分は1よりも小さい、または、第1の処理モジュール32は、具体的には、予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nの非整数部分は1よりも小さい。
【0095】
任意選択で、この実施形態では、復号デバイス内の第2の処理モジュール33は、具体的には、周波数領域信号の所定の周波数帯域範囲の開始周波数ビンf
exc_startより上のm番目の周波数ビンから周波数領域信号の所定の周波数帯域範囲の終了周波数ビンf
exc_endまでの励振信号のコピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nは0または0よりも大きい整数もしくは非整数であり、mはビットが割り当てられた最高周波数ビンと拡張周波数帯域のあらかじめ設定された開始周波数ビンとの間の周波数ビンの数量の値である。
【0096】
さらに任意選択で、この実施形態では、復号デバイス内の第2の処理モジュール33は、具体的には、予測が、ビットが割り当てられた最高周波数ビンから開始されるとき、周波数領域信号の、f
exc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からf
exc_endまでの周波数帯域範囲内の励振信号のコピー、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nの非整数部分は1よりも小さい、または第2の処理モジュール
33は、具体的には、予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピー、周波数領域信号のf
exc_startからf
exc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号のf
exc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からf
exc_endまでの周波数帯域範囲内の励振信号のコピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の高周波数励振信号として使用するように構成され、ここで、nの非整数部分は1よりも小さい。
【0097】
任意選択で、この実施形態では、復号モジュール30は、予測モジュール34が帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測する前に、ビットストリームを復号して帯域幅拡張周波数帯域の周波数エンベロープを取得するようにさらに構成される。この場合、対応する予測モジュール34は復号モジュール30にさらに接続され、予測モジュール34は、帯域幅拡張周波数帯域の、第1の処理モジュール32または第2の処理モジュール33によって予測された励振信号、および帯域幅拡張周波数帯域の、復号モジュール30による復号によって取得された周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測するように構成される。
【0098】
さらに任意選択で、この実施形態では、復号デバイスは獲得モジュール35をさらに含む。
【0099】
復号モジュール30は、予測モジュール34が帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測する前に、ビットストリームを復号して信号タイプを取得するようにさらに構成される。獲得モジュール35は復号モジュール30に接続され、獲得モジュール35は、復号モジュール30による復号によって取得された信号タイプに従って、帯域幅拡張周波数帯域の周波数エンベロープを獲得するように構成される。この場合、対応する予測モジュール34は獲得モジュール35に接続され、予測モジュール34は、帯域幅拡張周波数帯域の、第1の処理モジュール32または第2の処理モジュール33によって予測された励振信号、および帯域幅拡張周波数帯域の、獲得モジュール35によって取得された周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測するように構成される。
【0100】
さらに任意選択で、獲得モジュール35は、具体的には、復号モジュール30による復号によって取得された信号タイプが非高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の周波数エンベロープを取得するように構成される、または、獲得モジュール35は、具体的には、復号モジュール30による復号によって取得された信号タイプが高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を帯域幅拡張周波数帯域の周波数エンベロープとして使用するように構成され、ここで、Nは1よりも大きいまたはこれに等しい。
【0101】
前述の実施形態における復号デバイスにより、本発明は、前述の任意選択の技術的解決策の全てを例として使用することによって紹介される。実際の適用では、前述の任意選択の技術的解決策の全ては、ランダムな組み合わせの形態で本発明の任意選択の実施形態を形成するようにランダムに組み合わされ得る。ここでは、詳細は再度説明しない。
【0102】
前述の実施形態における復号デバイスにより、前述のモジュールを使用して帯域幅拡張周波数帯域信号の予測を実現する実現プロセスは、前述の関連する方法の実施形態における実現プロセスと同じである。詳細については、前述の関連する方法の実施形態の記載を参照されたい。ここでは、詳細は再度説明しない。
【0103】
前述の実施形態における復号デバイスにより、前述のモジュールを使用することによって、帯域幅拡張の開始周波数ビンが設定され、周波数領域信号が復号された最高周波数ビンと開始周波数ビンが比較されて帯域幅拡張周波数帯域の励振復元を実行し、それによって、拡張された励振信号はフレーム間で連続しており、復号された励振信号の周波数ビンは維持され、それによって、復元された帯域幅拡張周波数帯域信号の聴覚品質を確保し、出力オーディオ信号の聴覚品質を向上させる。
【0104】
図2に示される復号デバイスの機能は、前述の機能モジュールに従って調整されて本発明のこの実施形態における復号デバイスの例示の図を取得し得る。ここでは、詳細は再度説明しない。
【0105】
本発明のこの実施形態における復号デバイスは、
図1に示される符号化デバイスとともに使用されて帯域幅拡張周波数帯域信号を予測するシステムを形成し得る。ここでは、詳細は再度説明しない。
【0106】
図8は、本発明のもう1つの実施形態による復号デバイス80のブロック図である。
図8における復号デバイス80は、前述の方法の実施形態におけるステップおよび方法を実現するように構成され得る。復号デバイス80は、さまざまな通信システムにおいて基地局または端末に適用され得る。
図8のこの実施形態では、復号デバイス80は、受信回路802と、復号プロセッサ803と、処理ユニット804と、メモリ805と、アンテナ801とを含む。処理ユニット804は復号デバイス80の動作を制御し、処理ユニット804は、CPU(Central Processing Unit、中央処理ユニット)とも呼ばれ得る。メモリ805は、リードオンリメモリおよびランダムアクセスメモリを含み得るとともに、処理ユニット804に命令およびデータを提供する。メモリ805の一部は、不揮発性ランダムアクセスメモリ(NVRAM)をさらに含み得る。具体的な適用では、携帯電話のようなワイヤレス通信デバイスは復号デバイス80に内蔵されてもよいし、復号デバイスそれ自体がワイヤレス通信デバイスであってもよく、復号デバイス80は、復号デバイス80が遠隔地からデータを受信することを可能にするように、受信回路80
2を収容する担体をさらに含んでよい。受信回路80
2は、アンテナ801に結合され得る。復号デバイス80の構成要素はバスシステム806を使用することによって、互いに結合され、ここで、バスシステム806は、データバスに加えて、電力バス、制御バス、および状態信号バスをさらに含む。しかしながら、説明の明確性のために、さまざまなバスが
図8におけるバスシステム806として示される。復号デバイス80は、信号を処理するように構成された処理ユニット804をさらに含み、加えて、復号プロセッサ803をさらに含み得る。
【0107】
本発明の前述の実施形態に開示されている方法は、復号プロセッサ803に適用されてもよいし、復号プロセッサ803によって実現されてもよい。復号プロセッサ803は集積回路チップであってよく、信号処理能力を有する。実現プロセスでは、前述の方法の実施形態におけるステップは、復号プロセッサ803内のハードウェアの集積論理回路を使用することによって、またはソフトウェアの形式では命令を使用することによって、達成され得る。これらの命令は、処理ユニット804と協働することによって実現および制御され得る。前述の復号プロセッサは、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは他のプログラム可能論理構成要素、個別ゲートもしくはトランジスタ論理構成要素、または個別ハードウェア構成要素であり得る。本発明の実施形態に開示されている方法、ステップ、および論理ブロック図は、実現または実行され得る。汎用プロセッサはマイクロプロセッサであってもよいし、プロセッサは任意の従来のプロセッサ、トランスレータなどであってもよい。本発明の実施形態を参照して開示される方法のステップは、ハードウェアとして実現された復号プロセッサによって直接実行および達成されてもよいし、復号プロセッサにおいてハードウェアおよびソフトウェアモジュールの組み合わせを使用することによって実行および達成されてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、リードオンリメモリ、プログラマブルリードオンリメモリ、電気的消去可能プログラマブルメモリ、またはレジスタのような、この技術分野で成熟した記憶媒体内に配置され得る。記憶媒体は、メモリ805内に配置される。復号プロセッサ803はメモリ805から情報を読み出し、ハードウェアと組み合わせて前述の方法のステップを達成する。
【0108】
たとえば、
図6または
図7における信号復号デバイスは、復号プロセッサ803によって実現されてよい。さらに、
図6における復号モジュール30、判定モジュール31、第1の処理モジュール32、第2の処理モジュール33、および予測モジュール34は、処理ユニット804によって実現されてもよいし、復号プロセッサ803によって実現されてもよい。同様に、
図7における各モジュールは、処理ユニット804によって実現されてもよいし、復号プロセッサ803によって実現されてもよい。しかしながら、前述の例は例示にすぎず、本発明の実施形態をこの具体的な実現形態に限定することを意図するものではない。
【0109】
具体的には、メモリ805は、
処理ユニット804または復号プロセッサ803が以下の動作を実現することを可能にするために、命令を記憶する。受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して周波数領域信号を取得すること、周波数領域信号の、ビットが割り当てられた最高周波数ビンが、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定すること、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいとき、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測すること、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいとき、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測すること、および帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測すること。
【0110】
説明された装置の実施形態は例示にすぎない。別個の部分として説明されたユニットは物理的に別個であってもなくてもよく、ユニットとして表示された部分は物理的ユニットであってもなくてもよく、1つの位置にあってもよいし、少なくとも2つのネットワークユニット上に分散されてもよい。モジュールのうちのいくつかまたは全ては、実施形態の解決策の目的を達成するために、実際の必要性に従って選択されてよい。この技術分野の当業者は、創作的な労力なしで本発明の実施形態を理解および実現し得る。
【0111】
最後に、前述の実施形態は本発明の技術的解決策を説明するために意図されたにすぎず、本発明を限定するためのものではないことに留意されたい。本発明は、前述の実施形態を参照して詳細に説明されているが、この技術分野の当業者は、依然として、本発明の実施形態の技術的解決策の思想および範囲から逸脱することなく、前述の実施形態において説明された技術的解決策に修正を加えてもよいし、そのいくつかの技術的特徴に対する等価な置き換えを行ってもよいことを理解するべきである。