(58)【調査した分野】(Int.Cl.,DB名)
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記現在のフレームの前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0であることである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整する前記ステップは、
前記現在のフレームの前記サブバンドのチャネル間位相差の絶対値の平滑化された平均値を、前記現在のフレームの前記G_IPDパラメータの値の絶対値として用い、前記現在のフレームの前のフレームのG_IPDパラメータのシンボルを、前記現在のフレームの前記G_IPDパラメータのシンボルとして用いるステップ、
を含む、請求項4に係るステレオ位相パラメータを符号化する方法。
前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値にフレーム間平滑化処理を実行し、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の平滑化された平均値を取得する前記ステップは、
以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するステップを含み、
ITD_sm(k)は前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、ITD_sm(k-1)は前記現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である、
請求項1乃至7のいずれか一項に記載のステレオ位相パラメータを符号化する方法。
前記取得ユニットによって取得される前記大域ステレオ位相パラメータは、前記グループ遅延(G_ITD)パラメータ及びグループ位相(G_IPD)パラメータを含み、
前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であることである場合、前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整するように構成される、
請求項10乃至12のいずれか一項に記載の、ステレオ位相パラメータを符号化する装置。
【発明の概要】
【0005】
本発明の実施形態は、ステレオオーディオ情報の効果を改善することのできる、ステレオ位相パラメータを符号化する方法及び装置を提供する。
【0006】
本発明の実施形態において採用される技術的解決策は以下のとおりである。
【0007】
第1の態様によれば、本発明の実施形態は、ステレオ位相パラメータを符号化する方法を提供する。本方法は、
現在のフレームの大域ステレオ位相パラメータを取得するステップと、
現在のフレームの大域ステレオ位相パラメータの値を決定するステップと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップと、
現在のフレームの大域ステレオ位相パラメータの調整された値を符号化するステップと、
を含む。
【0008】
第1の態様の第1の実施方式では、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、具体的には、
現在のフレームのサブバンドのチャネル間時間差を取得するステップと、
現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するステップと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップと、
を含む。
【0009】
第1の態様又は第1の態様の第1の実施方式に関して、第1の態様の第2の実施方式では、現在のフレームがデータストリームの第1のデータフレームでない場合、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップの前に、本方法は更に、
現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得するステップ、
を含み、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、具体的には、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップ、
を含む。
【0010】
第1の態様、第1の態様の第1の実施方式又は第1の態様の第2の実施方式に関して、第1の態様の第3の実施方式では、大域ステレオ位相パラメータはグループ遅延G_ITDパラメータを含み、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値の調製するステップ、
を含む。
【0011】
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式又は第1の態様の第3の実施方式に関して、第1の態様の第4の実施方式では、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値の調製するステップは、具体的には、
以下の式
【数1】
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するステップであり、
【数2】
はG_ITDパラメータの値の調整された絶対値、
【数3】
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
【0012】
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式又は第1の態様の第4の実施方式に関して、第1の態様の第5の実施方式では、fac1=0.5である。
【0013】
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式又は第1の態様の第5の実施方式に関して、第1の態様の第6の実施方式では、大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含み、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するステップ、
を含む。
【0014】
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式又は第1の態様の第6の実施方式に関して、第1の態様の第7の実施方式では、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するステップは、具体的には、
以下の式
【数4】
に従って、G_IPDパラメータの値の絶対値を調整するステップを含み、
【数5】
はG_IPDパラメータの値の調整された絶対値、
【数6】
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
【数7】
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
【0015】
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式、第1の態様の第6の実施方式又は第1の態様の第7の実施方式に関して、第1の態様の第8の実施方式では、fac3=0.75である。
【0016】
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式、第1の態様の第6の実施方式、第1の態様の第7の実施方式又は第1の態様の第8の実施方式に関して、第1の態様の第9の実施方式では、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0である場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するステップは、具体的には、
現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるステップ、
を含む。
【0017】
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式、第1の態様の第6の実施方式、第1の態様の第7の実施方式、第1の態様の第8の実施方式又は第1の態様の第9の実施方式に関して、第1の態様の第10の実施方式では、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得するステップは、
以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するステップを含み、
ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
【0018】
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式、第1の態様の第6の実施方式、第1の態様の第7の実施方式、第1の態様の第8の実施方式、第1の態様の第9の実施方式又は第1の態様の第10の実施方式に関して、第1の態様の第11の実施方式では、fac5=0.9844である。
【0019】
第
2の態様によれば、本発明の実施形態は、ステレオ位相パラメータを符号化する装置を提供する。本装置は、
現在のフレームの大域ステレオ位相パラメータを取得するように構成される取得ユニットと、
取得ユニットによって取得された現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される決定ユニットと、
決定ユニットによって決定された現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される調整ユニットと、
調整ユニットによって調整された現在のフレームの大域ステレオ位相パラメータの値を符号化するように構成される符号化ユニットと、
を備える。
【0020】
第2の態様の第1の実施方式では、調整ユニットは、
現在のフレームのサブバンドのチャネル間時間差を取得するように構成される取得モジュールと、
取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するように構成される計算モジュールと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、計算モジュールによって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される調整モジュールと、
を有する。
【0021】
第2の態様又は第2の態様の第1の実施方式に関して、第2の態様の第2の実施方式では、調整ユニットは更に、
計算モジュールによって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値に、フレーム間平滑化処理を実行するように構成される処理モジュール、
を有し、
取得モジュールは更に、処理モジュールによって平滑化された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を取得するように構成され、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0022】
第2の態様、第2の態様の第1の実施方式又は第2の態様の第2の実施方式に関して、第2の態様の第3の実施方式では、
取得ユニットによって取得される大域ステレオ位相パラメータはグループ遅延G_ITDパラメータを含み、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整するように構成される。
【0023】
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式又は第2の態様の第3の実施方式に関して、第2の態様の第4の実施方式では、
調整モジュールは更に、以下の式
【数8】
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するように構成され、
【数9】
はG_ITDパラメータの値の調整された絶対値、
【数10】
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
【0024】
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式又は第2の態様の第4の実施方式に関して、第2の態様の第5の実施方式では、
調整モジュールによる調整時の平滑化因子は、fac1=0.5を満たす。
【0025】
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式又は第2の態様の第5の実施方式に関して、第2の態様の第6の実施方式では、
取得ユニットによって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含み、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するように構成される。
【0026】
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式又は第2の態様の第6の実施方式に関して、第2の態様の第7の実施方式では、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、現在のフレームのG_IPDパラメータの値が0でないことである場合、以下の式
【数11】
に従って、G_IPDパラメータの値の絶対値を調整するように構成され、
【数12】
はG_IPDパラメータの値の調整された絶対値、
【数13】
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
【数14】
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
【0027】
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式、第2の態様の第6の実施方式又は第2の態様の第7の実施方式に関して、第2の態様の第8の実施方式では、
調整モジュールによる調整時の平滑化因子は、fac3=0.75を満たす。
【0028】
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式、第2の態様の第6の実施方式、第2の態様の第7の実施方式又は第2の態様の第8の実施方式に関して、第2の態様の第9の実施方式では、調整ユニットは更に、
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0である場合、処理モジュールによって平滑化された現在のフレームのサブバンドのチャネル間位相差の絶対値の平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるように構成される構成モジュール、
を有する。
【0029】
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式、第2の態様の第6の実施方式、第2の態様の第7の実施方式、第2の態様の第8の実施方式又は第2の態様の第9の実施方式に関して、第2の態様の第10の実施方式では、
処理モジュールは更に、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成され、
ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
【0030】
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式、第2の態様の第6の実施方式、第2の態様の第7の実施方式、第2の態様の第8の実施方式、第2の態様の第9の実施方式又は第2の態様の第10の実施方式に関して、第2の態様の第11の実施方式では、
処理モジュールによる平滑化処理時の平滑化因子は、fac5=0.9844を満たす。
【0031】
本発明の実施形態において提供されるステレオ位相パラメータを符号化する方法及び装置によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
【発明を実施するための形態】
【0033】
以下、本発明の実施形態において添付の図面を参照して、本発明の実施形態の技術的解決策を明確且つ完全に説明する。当然ながら、説明される実施形態は本発明の実施形態の一部に過ぎず、全部ではない。当業者が本発明の実施形態に基づいて創意工夫なく得た他の実施形態は全て、本発明の保護範囲に包含されるものとする。
【0034】
本発明の技術的解決策をより明確にするために、以下、添付の図面及び実施形態を参照して本発明を詳述する。
【0035】
本発明の実施形態は、ステレオ位相パラメータを符号化する方法を提供する。
図1に示されるように、本方法は以下の要素を含む。
【0036】
101.サーバーが、現在のフレームの大域ステレオ位相パラメータを取得する。
【0037】
大域ステレオ位相パラメータは、グループ遅延G_ITD及びグループ位相G_IPDを含む。本発明の本実施形態では、グループ遅延G_ITDは、サンプルの測定単位において、ステレオの左右のオーディオチャネル間の時間遅延を表す。グループ位相G_IPDは、値が(−π、π]の範囲をとるラジアンの測定単位において、ステレオの左右のオーディオチャネル間の時間整合後の波形類似性を表す。
【0038】
102.サーバーが、現在のフレームの大域ステレオ位相パラメータの値を決定する。
【0039】
現在のフレームの大域ステレオ位相パラメータの値の決定結果は、現在のフレームのG_ITDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることと、を含む。
【0040】
103.サーバーが、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整する。
【0041】
本発明の本実施形態では、現在のフレームの抽出された大域ステレオ位相パラメータG_ITD及びG_IPDの精度が低い場合、サーバーは、ステレオ位相パラメータに従って元のステレオ位相情報を回復することができず、したがって、ステレオオーディオ信号を回復することができない。本発明の本実施形態では、サーバーがG_ITD又はG_IPDを調整するので、元のステレオ位相パラメータと大きく異なるG_ITD及びG_IPDに従ってステレオ位相情報が回復されることを回避することができる。したがって、ステレオオーディオ情報の効果を改善することができる。
【0042】
104.サーバーが、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化する。
【0043】
サーバーは、5bit(ビット)量子化・符号化の方式で、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化してよい。第1のビットはステレオ位相パラメータのフラグビットflagであり、第2のビット〜第5のビットは、現在のフレームの大域ステレオ位相パラメータの調整された値に符号化処理が実行された後に得られる値である。具体的には、flag=1のとき、サーバーは現在のフレームのG_ITDの量子化値を送信し、flag=0のとき、サーバーは現在のフレームのG_IPDの量子化値を送信する。
【0044】
本発明の本実施形態において提供されるステレオ位相パラメータを符号化する方法によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の本実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
【0045】
本発明の実施形態は、別のステレオ位相パラメータを符号化する方法を提供する。
図2に示されるように、本方法は以下の要素を含む。
【0046】
201.サーバーが、現在のフレームの大域ステレオ位相パラメータを取得する。
【0047】
大域ステレオ位相パラメータは、グループ遅延G_ITD及びグループ位相G_IPDを含む。本発明の本実施形態では、グループ遅延G_ITDは、サンプルの測定単位において、ステレオの左右のオーディオチャネル間の時間遅延を表す。グループ位相G_IPDは、値が(−π、π]の範囲をとるラジアンの測定単位において、ステレオの左右のオーディオチャネル間の時間整合後の波形類似性を表す。
【0048】
202.サーバーが、現在のフレームの大域ステレオ位相パラメータの値を決定する。
【0049】
現在のフレームの大域ステレオ位相パラメータの値の決定結果は、現在のフレームのG_ITDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることと、を含む。
【0050】
203.サーバーが、現在のフレームのサブバンドのチャネル間時間差を取得する。
【0051】
現在のフレームのサブバンドは、サーバーにより事前に分割されてよい。例えば、サーバーは周波数バンドを12個のサブバンドに分割してよく、各サブバンドは対応するチャネル間時間差を有する。
【0052】
本発明の本実施形態では、チャネル間時間差は、音がそれぞれ左右の耳に到達する時間の差を表すのに用いられる。ITDが0より大きい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より早い。ITDが0より小さい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より遅い。ITDが0に等しいとき、音が左耳に到達する時間は音が右耳に到達する時間と同じである。本発明の本実施形態では、ITDはサンプルを用いて表されてよい。例えば、ms(millisecond、ミリ秒)の測定単位において、ITDの時間間隔は(−5ms、5ms)である。サーバーが16kHzバンド幅でサンプリングを実行した後、サンプルの測定単位において、対応するサンプル間隔は(−80、80)である。
【0053】
204.サーバーが、現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算する。
【0054】
本発明の本実施形態では、サーバーは、以下の式
【数15】
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算してよい。ITDはサブバンドの絶対値の平均値、ITD(b)はb番目のサブバンドのチャネル間時間差であり、bは1以上L以下の整数、Lはサブバンドの総数である。
【0055】
205.サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得する。
【0056】
具体的には、ステップ205では、サーバーは、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
【0057】
本発明の本実施形態では、平滑化因子fac5の値はfac5=0.9844であってよく、対応する平滑化因子fac6はfac6=1−0.9844=0.0156であってよい。
【0058】
本発明の本実施形態では、サーバーは、現在のフレームの隣接するデータフレーム間で平滑化処理を実行してよい。よって、現在のフレームの隣接するデータフレームに対応するステレオ位相情報が急変した場合にステレオオーディオ信号が急変するという状況を回避することができ、ステレオオーディオの効果を更に改善することができる。
【0059】
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0でないことである場合、ステップ206aが実行される。すなわち、サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整する。
【0060】
具体的には、ステップ206aでは、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0でないことである場合、サーバーは、以下の式
【数16】
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整してよい。ここで、
【数17】
はG_ITDパラメータの値の調整された絶対値、
【数18】
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
【0061】
本発明の本実施形態では、平滑化因子fac1の値はfac1=0.5であってよく、対応する平滑化因子fac2はfac2=1−0.5=0.5であってよい。
【0062】
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でない場合、ステップ206bが実行される。すなわち、サーバーが、以下の式
【数19】
に従って、G_IPDパラメータの値の絶対値を調整する。ここで、
【数20】
はG_IPDパラメータの値の調整された絶対値、
【数21】
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
【数22】
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
【0063】
本発明の本実施形態では、平滑化因子fac3の値はfac3=0.75であってよく、対応する平滑化因子fac4はfac4=1−0.75=0.25であってよい。
【0064】
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることである場合、ステップ206cが実行される。すなわち、サーバーが、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いる。
【0065】
本発明の本実施形態では、サーバーは、以下の式
【数23】
に従って、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を計算してよい。FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
【0066】
207.サーバーが、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化する。
【0067】
サーバーは、5bit(ビット)量子化・符号化の方式で、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化してよい。第1のビットはステレオ位相パラメータのフラグビットflagであり、第2のビット〜第5のビットは、現在のフレームの大域ステレオ位相パラメータの調整された値に符号化処理が実行された後に得られる値である。具体的には、flag=1のとき、サーバーは現在のフレームのG_ITDの量子化値を送信し、flag=0のとき、サーバーは現在のフレームのG_IPDの量子化値を送信する。
【0068】
本発明の本実施形態において提供されるステレオ位相パラメータを符号化する方法によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の本実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
【0069】
本発明の実施形態は、更に別のステレオ位相パラメータを符号化する方法を提供する。現在のフレームのG_ITDパラメータ及びG_IPDパラメータの値が両方とも0である場合の調整に適用可能である。
図3に示されるように、本方法は以下の要素を含む。
【0070】
301.サーバーが、現在のフレームの大域ステレオ位相パラメータを取得する。
【0071】
大域ステレオ位相パラメータは、グループ遅延G_ITD及びグループ位相G_IPDを含む。本発明の本実施形態では、グループ遅延G_ITDは、サンプルの測定単位において、ステレオの左右のオーディオチャネル間の時間遅延を表す。グループ位相G_IPDは、値が(−π、π]の範囲をとるラジアンの測定単位において、ステレオの左右のオーディオチャネル間の時間整合後の波形類似性を表す。
【0072】
302.サーバーが、現在のフレームの大域ステレオ位相パラメータの値を決定する。
【0073】
現在のフレームの大域ステレオ位相パラメータの値の決定結果は、現在のフレームのG_ITDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることと、を含む。
【0074】
303.サーバーが、現在のフレームのサブバンドのチャネル間時間差を取得する。
【0075】
現在のフレームのサブバンドは、サーバーにより事前に分割されてよい。例えば、サーバーは周波数バンドを12個のサブバンドに分割してよく、各サブバンドは対応するチャネル間時間差を有する。
【0076】
本発明の本実施形態では、チャネル間時間差は、音がそれぞれ左右の耳に到達する時間の差を表すのに用いられる。ITDが0より大きい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より早い。ITDが0より小さい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より遅い。ITDが0に等しいとき、音が左耳に到達する時間は音が右耳に到達する時間と同じである。本発明の本実施形態では、ITDはサンプルを用いて表されてよい。例えば、ms(millisecond、ミリ秒)の測定単位において、ITDの時間間隔は(−5ms、5ms)である。サーバーが16kHzバンド幅でサンプリングを実行した後、サンプルの測定単位において、対応するサンプル間隔は(−80、80)である。
【0077】
304.サーバーが、現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算する。
【0078】
本発明の本実施形態では、サーバーは、以下の式
【数24】
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算してよい。ITDはサブバンドの絶対値の平均値、ITD(b)はb番目のサブバンドのチャネル間時間差であり、bは1以上L以下の整数、Lはサブバンドの総数である。
【0079】
305.サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得する。
【0080】
具体的には、ステップ305では、サーバーが、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
【0081】
本発明の本実施形態では、平滑化因子fac5の値はfac5=0.9844であってよく、対応する平滑化因子fac6はfac6=1−0.9844=0.0156であってよい。
【0082】
本発明の本実施形態では、サーバーは、現在のフレームの隣接するデータフレーム間で平滑化処理を実行してよい。よって、現在のフレームの隣接するデータフレームに対応するステレオ位相情報が急変した場合にステレオオーディオ信号が急変するという状況を回避することができ、ステレオオーディオの効果を更に改善することができる。
【0083】
306.現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることである場合、サーバーが、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いる。
【0084】
本発明の本実施形態では、サーバーは、以下の式
【数25】
に従って、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を計算してよい。FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
【0085】
307.サーバーが、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化する。
【0086】
サーバーは、5bit(ビット)量子化・符号化の方式で、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化してよい。第1のビットはステレオ位相パラメータのフラグビットflagであり、第2のビット〜第5のビットは、現在のフレームの大域ステレオ位相パラメータの調整された値に符号化処理が実行された後に得られる値である。具体的には、flag=1のとき、サーバーは現在のフレームのG_ITDの量子化値を送信し、flag=0のとき、サーバーは現在のフレームのG_IPDの量子化値を送信する。
【0087】
本発明の本実施形態において提供されるステレオ位相パラメータを符号化する方法によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の本実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
【0088】
本発明の実施形態は、更に別のステレオ位相パラメータを符号化する方法を提供する。本方法は、現在のフレームのG_ITDパラメータの値と現在のフレームのG_IPDパラメータの値のいずれかが0である場合の調整に適用可能である。
図4に示されるように、本方法は以下の要素を含む。
【0089】
401.サーバーが、現在のフレームの大域ステレオ位相パラメータを取得する。
【0090】
大域ステレオ位相パラメータは、グループ遅延G_ITD及びグループ位相G_IPDを含む。本発明の本実施形態では、グループ遅延G_ITDは、サンプルの測定単位において、ステレオの左右のオーディオチャネル間の時間遅延を表す。グループ位相G_IPDは、値が(−π、π]の範囲をとるラジアンの測定単位において、ステレオの左右のオーディオチャネル間の時間整合後の波形類似性を表す。
【0091】
402.サーバーが、現在のフレームの大域ステレオ位相パラメータの値を決定する。
【0092】
現在のフレームの大域ステレオ位相パラメータの値の決定結果は、現在のフレームのG_ITDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることと、を含む。
【0093】
403.サーバーが、現在のフレームのサブバンドのチャネル間時間差を取得する。
【0094】
現在のフレームのサブバンドは、サーバーにより事前に分割されてよい。例えば、サーバーは周波数バンドを12個のサブバンドに分割してよく、各サブバンドは対応するチャネル間時間差を有する。
【0095】
本発明の本実施形態では、チャネル間時間差は、音がそれぞれ左右の耳に到達する時間の差を表すのに用いられる。ITDが0より大きい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より早い。ITDが0より小さい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より遅い。ITDが0に等しいとき、音が左耳に到達する時間は音が右耳に到達する時間と同じである。本発明の本実施形態では、ITDはサンプルを用いて表されてよい。例えば、ms(millisecond、ミリ秒)の測定単位において、ITDの時間間隔は(−5ms、5ms)である。サーバーが16kHzバンド幅でサンプリングを実行した後、サンプルの測定単位において、対応するサンプル間隔は(−80、80)である。
【0096】
404.サーバーが、現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算する。
【0097】
本発明の本実施形態では、サーバーは、以下の式
【数26】
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算してよい。ITDはサブバンドの絶対値の平均値、ITD(b)はb番目のサブバンドのチャネル間時間差であり、bは1以上L以下の整数、Lはサブバンドの総数である。
【0098】
405.サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得する。
【0099】
具体的には、ステップ405では、サーバーが、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
【0100】
本発明の本実施形態では、平滑化因子fac5の値はfac5=0.9844であってよく、対応する平滑化因子fac6はfac6=1−0.9844=0.0156であってよい。
【0101】
本発明の本実施形態では、サーバーは、現在のフレームの隣接するデータフレーム間で平滑化処理を実行してよい、現在のフレームの隣接するデータフレームに対応するステレオ位相情報が急変した場合にステレオオーディオ信号が急変するという状況を回避することができ、ステレオオーディオの効果を更に改善することができる。
【0102】
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0でないことである場合、ステップ406aが実行される。すなわち、サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整する。
【0103】
具体的には、ステップ406aでは、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0でないことであった場合、サーバーが、以下の式
【数27】
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整してよい。ここで、
【数28】
はG_ITDパラメータの値の調整された絶対値、
【数29】
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
【0104】
本発明の本実施形態では、平滑化因子fac1の値はfac1=0.5であってよく、対応する平滑化因子fac2はfac2=1−0.5=0.5であってよい。
【0105】
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことである場合、ステップ406bが実行される。すなわち、サーバーが、以下の式
【数30】
に従って、G_IPDパラメータの値の絶対値を調整する。ここで、
【数31】
はG_IPDパラメータの値の調整された絶対値、
【数32】
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
【数33】
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
【0106】
本発明の本実施形態では、平滑化因子の値fac3はfac3=0.75であってよく、対応する平滑化因子fac4はfac4=1−0.75=0.25であってよい。
【0107】
407.サーバーが、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化する。
【0108】
サーバーは、5bit(ビット)量子化・符号化の方式で、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化してよい。第1のビットはステレオ位相パラメータのフラグビットflagであり、第2のビット〜第5のビットは、現在のフレームの大域ステレオ位相パラメータの調整された値に符号化処理が実行された後に得られる値である。具体的には、flag=1のとき、サーバーは現在のフレームのG_ITDの量子化値を送信し、flag=0のとき、サーバーは現在のフレームのG_IPDの量子化値を送信する。
【0109】
本発明の本実施形態において提供されるステレオ位相パラメータを符号化する方法によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の本実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
【0110】
本発明の実施形態は、ステレオ位相パラメータを符号化する装置を提供する。
図5に示されるように、装置の実体はサーバーであってよい。装置は、取得ユニット51、決定ユニット52、調整ユニット53及び符号化ユニット54を備える。
【0111】
取得ユニット51は、現在のフレームの大域ステレオ位相パラメータを取得するように構成される。
【0112】
決定ユニット52は、取得ユニット51によって取得された現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される。
【0113】
調整ユニット53は、決定ユニット52によって決定された現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0114】
符号化ユニット54は、調整ユニット53によって調整された現在のフレームの大域ステレオ位相パラメータの値を符号化するように構成される。
【0115】
更に、ステレオ位相パラメータを符号化する装置の実体はサーバーであってよい。
図6に示されるように、サーバーは、プロセッサ61、入力装置62、出力装置63及びメモリ64を備えてよい。入力装置62、出力装置63及びメモリ64は、プロセッサ61に接続される。
【0116】
プロセッサ61は、現在のフレームの大域ステレオ位相パラメータを取得するように構成される。
【0117】
プロセッサ61は更に、現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される。
【0118】
プロセッサ61は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0119】
プロセッサ61は更に、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化するように構成される。
【0120】
なお、本発明の本実施形態において提供されるステレオ位相パラメータを調整する装置の機能ユニットの対応するその他の説明については、
図1の対応する説明を参照することができ、ここでは詳細の説明を省略する。
【0121】
本発明の実施形態は、別のステレオ位相パラメータを符号化する装置を提供する。
図7に示されるように、装置の実体はサーバーであってよい。装置は、取得ユニット71、決定ユニット72、調整ユニット73及び符号化ユニット74を備える。
【0122】
取得ユニット71は、現在のフレームの大域ステレオ位相パラメータを取得するように構成される。
【0123】
決定ユニット72は、取得ユニット71によって取得された現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される。
【0124】
調整ユニット73は、決定ユニット72によって決定された現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0125】
符号化ユニット74は、調整ユニット73による調整によって得られた現在のフレームの大域ステレオ位相パラメータの値を符号化するように構成される。
【0126】
調整ユニット73は、取得モジュール7301、計算ユニット7302及び調整モジュール7303を有する。
【0127】
取得モジュール7301は、現在のフレームのサブバンドのチャネル間時間差を取得するように構成される。
【0128】
計算モジュール7302は、取得モジュール7301によって取得された現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するように構成される。
【0129】
調整モジュール7303は、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、計算モジュール7302によって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0130】
調整ユニット73は更に処理モジュール7304を有する。
【0131】
処理モジュール7304は、計算モジュール7302によって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値に、フレーム間平滑化処理を実行するように構成される。
【0132】
取得モジュール7301は更に、処理モジュール7304によって平滑化された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を取得するように構成される。
【0133】
調整モジュール7303は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、取得モジュール7301によって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0134】
取得ユニット71によって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータを含む。
【0135】
調整モジュール7303は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、取得モジュール7301によって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整するように構成される。
【0136】
調整モジュール7303は更に、以下の式
【数34】
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するように構成される。ここで、
【数35】
はG_ITDパラメータの値の調整された絶対値、
【数36】
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
【0137】
調整モジュール7303による調整時の平滑化因子は、fac1=0.5を満たす。
【0138】
取得ユニット71によって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含む。
【0139】
調整モジュール7303は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、取得モジュール7301によって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するように構成される。
【0140】
調整モジュール7303は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことである場合、以下の式
【数37】
に従って、G_IPDパラメータの値の絶対値を調整するように構成される。ここで、
【数38】
はG_IPDパラメータの値の調整された絶対値、
【数39】
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
【数40】
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
【0141】
調整モジュール7303による調整時の平滑化因子は、fac3=0.75を満たす。
【0142】
調整ユニット73は更に構成モジュール7305を有する。
【0143】
構成モジュール7305は、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることである場合、処理モジュール7304によって平滑化された現在のフレームのサブバンドのチャネル間位相差の絶対値の平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるように構成される。
【0144】
処理モジュール7304は更に、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成される。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
【0145】
処理モジュール7304による平滑化処理時の平滑化因子は、fac5=0.9844を満たす。
【0146】
更に、ステレオ位相パラメータを符号化する装置の実体はサーバーであってよい。
図8に示されるように、サーバーは、プロセッサ81、入力装置82、出力装置83及びメモリ84を備えてよい。入力装置82、出力装置83及びメモリ84は、プロセッサ81に接続される。
【0147】
プロセッサ81は、現在のフレームの大域ステレオ位相パラメータを取得するように構成される。
【0148】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される。
【0149】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0150】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化するように構成される。
【0151】
プロセッサ81は更に、現在のフレームのサブバンドのチャネル間時間差を取得するように構成される。
【0152】
プロセッサ81は更に、現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するように構成される。
【0153】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0154】
プロセッサ81は更に、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行するように構成される。
【0155】
プロセッサ81は更に、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得するように構成される。
【0156】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
【0157】
プロセッサ81によって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータを含む。
【0158】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整するように構成される。
【0159】
プロセッサ81は更に、以下の式
【数41】
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するように構成される。ここで、
【数42】
はG_ITDパラメータの値の調整された絶対値、
【数43】
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
【0160】
プロセッサ81による調整時の平滑化因子は、fac1=0.5を満たす。
【0161】
プロセッサ81によって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含む。
【0162】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するように構成される。
【0163】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことである場合、以下の式
【数44】
に従って、G_IPDパラメータの値の絶対値を調整するように構成される。ここで、
【数45】
はG_IPDパラメータの値の調整された絶対値、
【数46】
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
【数47】
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
【0164】
プロセッサ81による調整時の平滑化因子は、fac3=0.75を満たす。
【0165】
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることである場合、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるように構成される。
【0166】
プロセッサ81は更に、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成される。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
【0167】
プロセッサ81による平滑化処理時の平滑化因子は、fac5=0.9844を満たす。なお、本発明の本実施形態において提供されるステレオ位相パラメータを調整する装置の機能ユニットの対応するその他の説明については、
図2の対応する説明を参照することができ、ここでは詳細の説明を省略する。
【0168】
本発明の実施形態において提供されるステレオ位相パラメータを符号化する装置は、上記に提供される方法実施形態を実現することができる。機能実現の詳細については方法実施形態の説明を参照することができ、ここでは詳細の説明を省略する。本発明の実施形態において提供されるステレオ位相パラメータを符号化する方法及び装置は、ステレオ位相情報の回復に適用可能であるが、それに限定されない。
【0169】
当業者であれば、実施形態における方法のプロセスの全部又は一部が、関連ハードウェアに命令を与えるコンピュータープログラムによって実現されてよいことが理解できるであろう。プログラムはコンピューター可読記憶媒体に格納されてよい。プログラムが実行されると、実施形態における方法のプロセスが実行される。上述の記憶媒体は、磁気ディスク、光学ディスク、リードオンリーメモリ(Read-Only Memory、ROM)又はランダムアクセスメモリ(Random Access Memory、RAM)を含んでよい。
【0170】
上述の説明は本発明の具体的な実施方式に過ぎず、本発明の保護範囲を限定する意図はない。当業者が本発明に開示の技術的範囲内で容易に想到し得る変形又は置換は、いかなるものであっても本発明の保護範囲に包含されるものとする。したがって、本発明の保護範囲は、特許請求の範囲の保護範囲に従うものとする。