【課題を解決するための手段】
【0016】
3.発明の概要
本発明の実施形態によれば、符号化されたオーディオ情報におけるオーディオフレームの損失を隠蔽するための誤り隠蔽オーディオ情報を提供する誤り隠蔽ユニットが提供される。誤り隠蔽ユニットは、失われた音声フレームに先行する適切に復号化された音声フレームに基づく周波数領域隠蔽を使用して誤り隠蔽音声情報を提供するように構成される。誤り隠蔽ユニットは、異なる周波数帯域について異なる減衰係数に従って隠蔽されたオーディオフレームをフェードアウトするように構成される。
【0017】
本発明の実施形態によれば、符号化されたオーディオ情報におけるオーディオフレームの損失を隠蔽するための誤り隠蔽オーディオ情報を提供するための誤り隠蔽ユニットも提供される。誤り隠蔽ユニットは、失われた音声フレームに先行して適切に復号化された音声フレームに基づいて、失われた音声フレームについての誤り隠蔽音声情報を提供するように構成される。誤り隠蔽ユニットは、失われた音声フレームに先行する適切に復号された音声フレームの復号された表現の特性に基づいて、1つ以上の減衰係数を導出するように構成されてもよい。誤り隠蔽ユニットは、減衰係数を使用してフェードアウトを実行するように構成される。
【0018】
従って、ポストエコーアーチファクトによって引起こされる問題は、失われたオーディオフレームに先行して適切に復号されたオーディオフレームの復号された表現の特性の分析に基づく技法を使用することによって克服することができることが観察されている。信号の特性は、オーディオ情報を分類し、そのような分類に従って隠れたオーディオフレームを減衰させるために使用できる、信号のエネルギーに関する正確な情報を提供する。
【0019】
本発明の一態様によれば、誤り隠蔽ユニットは、失われた音声フレームに先行する適切に復号された音声フレームの復号された時間領域表現の特性に基づいて減衰係数を導出するように構成することができる。
【0020】
例えば、単にこのような時間領域表現の態様に基づいて、以前の適切に復号されたオーディオフレームが単語または音声の終わり(または、一般に、時間の経過によるエネルギーの減少)を含むことを認識することが可能である。また、復号されたオーディオフレームの異なる特徴(時間変調、一時的な特性など)は、復号された表現から良好な精度で導き出すことができる。
【0021】
本発明の一態様によれば、誤り隠蔽ユニットは、復号された時間領域表現の分析を実行し、分析に基づいて減衰係数を導出するように構成することができる。
【0022】
従って、復号された時間領域表現を解析することによって減衰係数を直接導出することが可能である。復号された表現を分析することは、典型的には、復号の入力パラメータを使用して信号の特性を推定することよりもはるかに正確である。この場合、分析はエンコーダでは行われない。
【0023】
代替的には、いくつかの信号特性がエンコーダで計算され、デコーダが減衰係数を決定するビットストリームに送られる。
【0024】
本発明の一態様によれば、誤り隠蔽ユニットは、失われた音声フレームに先行する適切に復号された音声フレームの復号された表現の時間的エネルギー傾向に基づいて減衰係数を導出するように構成することができる。
【0025】
事実、適切に復号化されたオーディオフレーム(誤って受信されたフレームを「置換」する)の性質を、そのエネルギー傾向を分析することによって決定することが可能であることが指摘されている。音声(および音楽のような他の意図された音声情報)は一般に雑音より多くのエネルギーをもたらすので、フレーム内のエネルギーの減衰は単語の終りの発生の指標として使用することができる。従って、以前に適切に復号化されたオーディオフレームの決定された性質に基づいて、オーディオ情報を異なる方法でフェードインすることが可能である。異なる性質のフレームに異なるフェージングを適用することにより、ポストエコーアーチファクトの発生を低減することが可能である。
【0026】
復号された表現(時間領域表現の形式を取ることができる)は、符号化された表現よりもオーディオ信号の時間的進展をより明示し、したがって、復号された表現(例えば、復号された表現の特性は、復号された表現の解析によって導出されてもよい)の特性に基づいて減衰係数を導出することが有利であることが認識されている。
【0027】
本発明の一態様によれば、誤り隠蔽ユニットは、失われた音声フレームに先行して適切に復号された音声フレームの復号化された表現の第1の部分のエネルギー、またはその加重バージョンのエネルギーを計算するように、かつ失われたオーディオフレームに先行して適切に復号されたオーディオフレームの復号された表現の第2の部分のエネルギー、またはその加重バージョンのエネルギーを計算するように構成することができる。復号された表現の第1の部分の開始は、復号された表現の第2の部分の開始に時間的に先行するか、または第1の部分の時間値の平均が時間的に第2の部分の平均時間値に先行する。誤差隠蔽ユニットは、第1の部分のエネルギーに依存しかつ第2の部分のエネルギーに依存して減衰係数を計算するように構成することができる。
【0028】
従って、エネルギー傾向(例えば、エネルギー傾向値によって具体化される)を計算することが可能である:フレームの時間的に前の部分が、フレームの次の部分より多くのエネルギーを有する場合、スピーチの終わり(または、一般に、時間の経過とともにエネルギーの減少)は、十分な程度の確実性で決定することができる。特に、フレームの第1の部分は第2の部分を含むことができる(またはその逆)。第1の部分の平均時間は、第2の部分の平均時間に先行する(例えば、第1の部分の中心が第2の部分の中心に時間的に先行する)。
【0029】
特に、復号された表現の第2の部分は、失われたオーディオフレームに先行する適切に復号されたオーディオフレームの復号された表現のサンプルの最後の区間を含むことができる。復号された表現の第1の部分は、失われたオーディオフレームに先行する適切に復号されたオーディオフレームのすべてのサンプル、または第2の部分と重なる失われたオーディオフレームに先行する適切に復号されたオーディオフレームのサンプルの
区間を含むことができ、第1の部分のサンプルの少なくともいくつかは、第2の部分のすべてのサンプルに先行する。
【0030】
従って、本発明の実施形態の根底にある理論的根拠の1つは、迷惑な繰返しアーチファクトは、失われたフレームが音声の終わりに続くときに主として生じるという知見に基づいている。無音またはノイズを再生する代わりに、単語の断片が無用に反復される。これは、本発明の実施形態が、失われたフレーム(または連続する失われたフレームのシーケンスの最初のフレーム)が、ワード(または音声)の終わりに続くフレームであること、例えば、最後に適切に復号化されたオーディオフレームは、単語(または音声)の終わりに続くフレーム、またはより一般的には、エネルギーレベルが突然低下したフレームであることを認識することに基づいている理由の1つである。(場合によっては、フレームが80msのようにかなり長いところで、たとえフレームロスがエネルギー減衰の途中で現れるとしても、何らかのポストエコーが生じることがある。)
【0031】
次の間の商を計算することは可能である:
−失われたオーディオフレームに先行する適切に復号されたオーディオフレームの復号された表現の端部におけるエネルギー、または損失されたオーディオフレームに先行する適切に復号されたオーディオフレームの復号された表現のスケーリングされたバージョンの端部におけるエネルギー、および
−減衰されたオーディオフレームに先行する適切に復号されたオーディオフレームの復号された表現における全エネルギー、または減衰係数を得るために損失されたオーディオフレームに先行する適切に復号されたオーディオフレームの復号された表現のスケーリングされたバージョンにおける全エネルギー。
【0032】
第1の部分はフレームのすべてのサンプルを含むことができるが、第2の部分は同じフレームの後半(または請求項の後半の一部)のサンプルのみを含むことができる。第2の部分に関連するエネルギーに関連する値を、第1の部分(例えば、フレーム全体)に関連するエネルギーに関連する値で割ることによって、値を得ることができる(第1の部分がフレーム全体を含むとき、値は0〜1の間となることができ、パーセンテージで表すことができる)。
【0033】
いくつかの実施形態では、ゼロに等しい商は、エネルギーが第2部分のサンプルに存在しないことを暗示することができ、第2部分のサンプルが固有情報として「無音」を伝えることを示す。
【0034】
【0035】
【0036】
【0037】
【0038】
本発明の一態様によれば、誤り隠蔽ユニットは、前に隠蔽されたオーディオフレームに関して減衰係数を減少させ、低減された減衰係数を使用して以前に隠蔽されたオーディオフレームに続いて、少なくとも1つの後続の隠蔽されたオーディオフレームをフェードアウトするように構成することができる。
【0039】
この解決策は、複数の連続したフレームが誤って復号される場合に特に有利である。このようにして、オーディオ信号は適切に減衰される。
【0040】
本発明の一態様によれば、誤り隠蔽ユニットは、少なくとも3つの連続した隠蔽された音声フレームにわたる指数関数的な時間減衰よりも大きくなるように、フェードアウトを実行するように構成することができる。
【0041】
フェードアウトに関連する減衰係数の指数関数的な時間減衰よりも大きいことが好ましく、フェージングの優雅さとオーディオ情報の強度を減少させる必要性との間の良好なトレードオフを得ることができることがわかっている。具体的には、特に適切な減衰は、第2の連続した損失フレームで以前の減衰係数を0.9倍、第3の連続する失われたフレームで0.75、第3の連続する失われたフレームで0.5、4番目とそれ以降の連続する失われたフレームで0.2倍繰り返し乗算することで得られることがわかっている。
【0042】
本発明の一態様によれば、誤り隠蔽ユニットは、失われた音声フレームに先行する適切に復号された音声フレームの復号された表現の時間的エネルギー傾向を定量的に記述するエネルギー傾向値を決定するように構成することができる。
【0043】
本発明の一態様によれば、誤差隠蔽ユニットは、現在のエネルギー傾向値が時間の経過とともに比較的小さいエネルギーを示す所定の範囲内にある場合には、現在のエネルギー傾向値よりも低い所定の値に減衰係数を設定するように構成することができる。
【0044】
従って、時間的エネルギー傾向が1に近い(または、少なくとも、(1/2)
1/2になり得る閾値よりも大きい)場合、適切に復号されたオーディオフレームが会話の終端部を含まない(または、とにかくエネルギーが急激に減少するオーディオフレームではない)という十分な程度の確信度で判定することができる。
【0045】
本発明の一態様によれば、誤差隠蔽は、現在のエネルギー傾向値が所定の範囲外にあり、時間の経過とともに比較的大きなエネルギー減少を示す場合、減衰係数は現在のエネルギー傾向値に等しく、または変化するエネルギー傾向値に対して線形に変化するように、減衰係数を決定するように構成できる。
【0046】
従って、時間的エネルギー傾向が閾値(例えば、1/2
1/2とすることができる)未満である場合、適切に復号された音声フレームが単語(または会話)の終わりを含むという十分な程度の確信度で判定することができる。従って、フェードアウトを加速するために低減された制動値を使用することが可能であり、従って本発明によるポストエコーを回避することができる。
【0047】
【0048】
適切に復号化されたオーディオフレームを分類することにより(例えば、雑音/フレーム内の音声終了/音声継続として)、3つの異なるフェージングを実行することができる。
−小さなフェージングまたはノイズのために全くフェージングなし(ノイズにとって好ましい)
−スピーチが適切に復号されたオーディオフレームで終わらないときの中程度のフェージング(迷惑なエコーのリスクがない場合)。
−スピーチが適切に復号されたオーディオフレームで終了するときのハードフェーディング(したがって、迷惑なエコーの影響を減少させる)
誤り隠蔽は、異なる周波数帯域について異なる減衰係数を決定するように構成される。
【0049】
本発明の一態様によれば、誤り隠蔽ユニットは、減衰係数が、失われたオーディオフレームに先行する最後の適切に復号されたオーディオフレームの端部のエネルギーレベルの時間的進展の失われたオーディオフレームに向けての外挿を反映するように、減衰係数を導出するように構成される。
【0050】
本発明の一態様によれば、誤り隠蔽ユニットは、失われたオーディオフレームの隠蔽されたスペクトル表現を導出するために、減衰係数を使用して、失われたオーディオフレームに先行するオーディオフレームのスペクトル表現をスケーリングするように構成される。
【0051】
本発明の一態様によれば、誤り隠蔽ユニットは、失われたオーディオフレームの隠蔽されたスペクトル表現を導出するために、減衰係数を使用して、失われたオーディオフレームに先行するオーディオフレームのスペクトル表現をスケーリングするように構成される。
【0052】
本発明の一態様によれば、誤り隠蔽ユニットは、失われた音声フレームに先行する適切に復号された音声フレームの復号された表現を得るために、スペクトル領域から時間領域への変換を実行するように構成される。
【0053】
本発明の実施形態によれば、符号化オーディオ情報内のオーディオフレームの損失を隠蔽するための誤り隠蔽オーディオ情報方法が提供され、以下のステップを含む:
−前記損失されたオーディオフレームに先行して適切に復号されたオーディオフレームの復号された表現の特性に基づいて減衰係数を導出するステップ、および
−減衰係数を使用してフェードアウトを実行するステップ。
【0054】
この方法は、上記の本発明の態様のいずれかと組合せて使用することができる。
【0055】
本発明の実施形態によれば、コンピュータプログラムがコンピュータ上で実行されるときに、本発明の方法を実施するための、および/または上述の本発明の製品実施形態を制御するためのコンピュータプログラムが提供される。
【0056】
本発明の実施形態によれば、符号化されたオーディオ情報に基づいて復号されたオーディオ情報を提供するためのオーディオデコーダが提供され、オーディオデコーダは上述の誤り隠蔽ユニットを備えるか、または上述のような方法を実施する。
【0057】
本発明の実施形態によれば、符号化オーディオ情報内のオーディオフレームの損失を隠蔽するための誤り隠蔽オーディオ情報を提供する誤り隠蔽ユニットが提供され、前記誤り隠蔽ユニットは、失われたオーディオフレームに先行する適切に復号されたオーディオフレームに基づく誤り隠蔽オーディオ情報を提供するように構成することができる。誤り隠蔽ユニットは、異なる周波数帯域に対して異なる減衰係数を使用してフェードアウトを実行するように構成される。
【0058】
オーディオフレームの同じスペクトル表現の異なる帯域に対して異なる減衰係数を使用することが可能であることに留意されたい。従って、例えば、スピーチ状(またはほとんどがスピーチを含む)である周波数帯域(またはスペクトルビン)よりもノイズ状の周波数帯域(またはスペクトルビン)に異なる減衰係数を適用することが可能であるため、スペクトルホールによる厄介なアーチファクトの発生を回避することが可能である
【0059】
従って、減衰係数は、異なる周波数帯域または異なるスペクトルビンの信号特性、または異なる周波数帯域またはスペクトルビンにおけるエネルギーの時間的進展に適合させることができる。
【0060】
本発明の一態様によれば、誤り隠蔽ユニットは、失われた音声フレームに先行する適切に復号された音声フレームのスペクトル領域表現の特性に基づいて減衰係数を導出するように構成することができる。
【0061】
本発明の一態様によれば、誤り隠蔽ユニットは、例えば、失われたオーディオフレームに先行する適切に復号されたオーディオフレームの有声周波数帯域を、失われたオーディオフレームに先行する適切に復号されたオーディオフレームの非音声あるいは雑音状の周波数帯域より速くフェードアウトさせるように、1つ以上の減衰係数を適合させるように構成することができる。
【0062】
フェードアウトを各周波数帯域(またはスペクトルビン)に適合させることにより、最適なフェージング挙動を得ることが可能である。特に、音声に関連するスペクトル帯域は、ノイズに関連するスペクトル帯域よりも速く減衰され、したがって、オーディオ復号化された情報を聞いている人の煩わしさが軽減される。
【0063】
本発明の一態様によれば、誤り隠蔽ユニットは、失われたオーディオフレームに先行しかつ失われたオーディオフレームに先行して適切に復号化されたオーディオフレームの1つ以上の周波数帯域よりも速く、スペクトルビン当たり比較的高いエネルギーを有しかつスペクトルビン当たり比較的低いエネルギーを有する適切に復号されたオーディオフレームの1つ以上の周波数帯域をフェードアウトさせるように、1つ以上の減衰係数を適応させるように構成できる。
【0064】
本発明の原理によれば、スペクトルビン当たり比較的高いエネルギーを有する帯域は雑音よりも多くの音声情報を含むことが予想される。従って、低エネルギー(雑音状の)周波数帯域を徐々にフェードアウトのみさせる一方でこれらの音声関連帯域の減衰を増加させることが提案される。
【0065】
本発明の一態様によれば、誤り隠蔽ユニットは、少なくとも1つの周波数帯域について、失われたオーディオフレームに先行する適切に復号されたオーディオフレームにおける少なくとも1つの周波数帯域に関連付けられたエネルギー値と、閾値との間の比較に基づいて減衰係数を設定するように構成される。
【0066】
閾値との比較は、結果がとりわけ、スピーチまたはノイズに関する情報を運ぶことが期待されるバンドの決定である単純な(しかし重要な)テストを実行することを可能にする。
【0067】
本発明の一態様によれば、誤り隠蔽ユニットは、少なくとも1つの周波数帯域に関連するエネルギー値が閾値よりも低い場合、少なくとも1つの周波数帯域に対して所定の減衰係数を使用するように構成することができる。誤り隠蔽ユニットは、少なくとも1つの周波数帯域に関連するエネルギー値が閾値よりも高い場合、少なくとも1つの周波数帯域について所定の減衰係数よりも小さい減衰係数を使用するように構成することができる。
【0068】
従って、より高いエネルギーの帯域バンドは、より低いエネルギーの帯域よりも速く減衰され、したがって聴取者にとっての煩わしさを低減する。
【0069】
本発明の一態様によれば、誤り隠蔽ユニットは、少なくとも1つの周波数帯域に関連するエネルギー値が、しきい値より低い場合、少なくとも1つの周波数帯域について比較的遅いフェードアウトを表す減衰係数を使用するように構成することができる。誤り隠蔽ユニットは、少なくとも1つの周波数帯域に関連するエネルギー値が閾値よりも高い場合、少なくとも1つの周波数帯域について比較的速いフェードアウトを表す減衰係数を使用するように構成することができる。
【0070】
本発明の一態様によれば、誤り隠蔽ユニットは、少なくとも1つの周波数帯域に関連するエネルギー値が閾値よりも低い場合、減衰係数を所定の値として定義するように構成することができる。誤り隠蔽ユニットは、少なくとも1つの周波数帯域に関連するエネルギー値が閾値よりも高い場合に、前記少なくとも1つの周波数帯域に関連するエネルギー値が前記閾値よりも低い場合よりも前記少なくとも1つの周波数帯域を速くフェードアウトさせるように、失われたオーディオフレームに先行する適切に復号されたオーディオフレームの復号された表現の時間的エネルギー傾向値に基づいて少なくとも1つの周波数帯域についての減衰係数を導出するように構成することができる。
【0071】
低エネルギー帯域よりも速く(音声に関係すると予想される)高エネルギー帯域を減衰させることが可能であるだけでなく、適切に復号された音声フレームの進化に従って帯域をフェードアウトすることも可能である。例えば、適切に復号されたオーディオフレームのエネルギー展開が、後者が単語(または音声)が終了したフレームであることを示す場合、スピーチに関連すると予想されるより高いエネルギー帯域の減衰を増加させることが好ましい。従って、適切に復号化された音声フレームが単語の終わりを含むとき、迷惑なエコーアーチファクトを回避することができる。
【0072】
本願発明の一態様によれば、誤り隠蔽ユニットは、異なる周波数帯域について異なる閾値を定義するように構成することができる。
【0073】
例えば、ビンは多いが輝度は低い帯域は、ノイズに関連すると予想される。これとは逆に、エネルギーの高い帯域が音声と関連することが期待できる。従って、これらの帯域の間の区別は、異なる帯域について異なる閾値との異なる比較を操作することによって得ることができる。
【0074】
本願発明の一態様によれば、誤り隠蔽ユニットは、少なくとも1つの周波数帯域のエネルギー値、平均エネルギー値、または予想されるエネルギー値に基づいて閾値を設定するように構成することができる。
【0075】
例えば、低エネルギーの帯域はノイズに関連すると予想される。これとは逆に、エネルギーの高い帯域が音声と関連することが期待できる。従って、各帯域について、エネルギー値、平均エネルギー値、または帯域の予想されるエネルギー値に依存する閾値を選択することによって、これらの帯域の間の区別を得ることができる。
【0076】
本願発明の一態様によれば、誤り隠蔽ユニットは、失われたオーディオフレームに先行する適切に復号されたオーディオフレームのエネルギー値と失われたオーディオフレームに先行して適切に復号されたオーディオフレームの全体のスペクトルのスペクトルラインの数との間の比に基づいて閾値を設定するように構成することができる。
【0077】
本願発明の一態様によれば、誤り隠蔽ユニットは、失われたオーディオフレームに先行する適切に復号されたオーディオフレームの復号された表現の時間的エネルギー傾向に基づいて閾値を設定するように構成することができる。
【0078】
時間的エネルギー傾向は、ワードの終わりがフレーム内にあるか否かにかかわらず、適切に復号されたオーディオフレームが情報を含むかどうかの情報を含むことができる。耳障りなエコーアーチファクトを避けるために、単語の終わりを含むオーディオフレームに続くより速いフレームを減衰させることが好ましい。従って、時間的エネルギー傾向に基づいて閾値を選択することが好ましいことがある。適切に復号されたフレーム(エネルギー傾向が0に近い)で終了する単語の確率が高いほど、閾値が低くなるほど、帯域の減衰が速くなる。
【0079】
【0080】
【0081】
値facは、失われたオーディオフレームに先行する適切に復号されたオーディオフレームにおける時間的エネルギー傾向を表す量、または失われたオーディオフレームに先行する適切に復号されたオーディオフレームにおける時間的エネルギー傾向を表す量から導出される減衰値であり得る。値energy
totalは、失われたオーディオフレームに先行する適切に復号されたオーディオフレームの全周波数帯域にわたる総エネルギーとすることができる。値nbOfTotalLinesは、失われたオーディオフレームに先行して適切に復号されたオーディオフレームのスペクトル線の総数とすることができる。
【0082】
本発明の一態様によれば、誤り隠蔽ユニットは、異なるスケーリング係数帯域について異なる減衰係数を使用してフェードアウトを実行するように構成することができる。逆量子化されたスペクトル値をスケーリングするための異なるスケーリング係数は、異なるスケール係数帯域に関連付けることができる。
【0083】
本発明の態様によれば、誤り隠蔽ユニットは、失われたオーディオフレームの隠蔽されたスペクトル表現を導出するために、減衰係数を使用して失われたオーディオフレームに先行するオーディオフレームのスペクトル表現をスケーリングするように構成することができる。
【0084】
本発明の態様によれば、誤り隠蔽ユニットは、失われたオーディオフレームの隠蔽されたスペクトル表現を導出するために、異なる減衰係数を使用して失われたオーディオフレームに先行するオーディオフレームのスペクトル表現の異なる周波数帯域をスケーリングし、それにより異なるフェードアウト速度を有する異なる周波数帯域のスペクトル値をフェードアウトするように構成することができる。
【0085】
従って、音声などの情報を含む帯域が雑音を含む帯域よりも減衰された適切な隠蔽を得ることが可能である。
【0086】
本願発明の一態様によれば、誤り隠蔽ユニットは、
−好ましくはビットストリーム情報に基づいて、または信号解析に基づいて、失われたオーディオフレームに先行して適切に復号化されたオーディオフレームがノイズ状である場合、所与の周波数帯域に関連する減衰係数を、第2の所定値(例えば、約1/2
1/2)より小さい減衰を示す第1の所定値(例えば、0.95と1との間)に設定し、および/または
−好ましくは、ビットストリーム情報に基づいて、または信号解析に基づいて、失われたオーディオフレームに先行して適切に復号化されたオーディオフレームが失われたオーディオフレームに先行する適切に復号されたオーディオフレームで終わらないスピーチ的であると認識された場合、所与の周波数帯域に関連する減衰係数を第2の所定の値に設定し、および/または
−好ましくはビットストリーム情報に基づいて、または信号解析に基づいて、失われたオーディオフレームに先行する適切に復号されたオーディオフレームは、スピーチ的に減衰してスピーチ状であるか、失われたオーディオフレームに先行する適切に復号されたオーディオフレームで終了すると認識された場合、所与の周波数帯域に関連する減衰係数をエネルギー傾向値またはそのスケーリングされたバージョンに基づく値に設定する
ように構成されている。
【0087】
例えば、音声(または音楽などの意図された音声情報)およびノイズを含む情報などの情報を含む帯域を区別することが可能である。意図された音声情報を含む帯域は、雑音を含む帯域よりも速く減衰させることができる。以前に復号されたオーディオフレームが単語の終わり(またはスピーチまたはとにかく意図されたオーディオ情報)を含む場合、減衰は比較的に(例えば、減衰係数を減少させることによって)増加される。
【0088】
本願発明の一態様によれば、誤り隠蔽ユニットは、所与の周波数帯域のエネルギーを閾値と比較するように構成することができる。誤り隠蔽ユニットは、所与の周波数帯域における閾値よりも大きい場合失われた音声フレームに先行する適切に復号された音声フレームの復号された表現の時間的エネルギー傾向に基づいて得られる所与の周波数帯域のエネルギーについてのスケーリング係数を提供するように構成することができる。誤り隠蔽ユニットは、好ましくはビットストリーム情報に基づいて、または信号解析に基づいて、失われたオーディオフレームに先行して適切に復号化されたオーディオフレームが雑音的であると認識され、かつ所定の周波数帯域のエネルギーが閾値よりも小さい場合には、第2の所定の値よりも小さい減衰を示す第1の所定の値に減衰係数を設定するように構成することができる。好ましくはビットストリーム情報に基づいて、またはノイズ的なものではないとの信号解析に基づいて、失われたオーディオフレームに先行して適切に復号されたオーディオフレームが認識される場合、誤り隠蔽ユニットは、減衰係数を第2の所定の値に設定するように構成することができる。
【0089】
本願発明の一態様によれば、誤り隠蔽ユニットは、失われた音声フレームに先行する適切に復号された音声フレームの復号された表現を得るために、スペクトル領域から時間領域への変換を実行するように構成することができる。
【0090】
本願発明の実施形態はまた、符号化されたオーディオ情報内のオーディオフレームの損失を隠蔽するための誤り隠蔽オーディオ情報を提供する方法に関連し、その方法は
−失われたオーディオフレームに先行して適切に復号されたオーディオフレームに基づいて誤り隠蔽オーディオ情報を提供するステップ、および
−異なる周波数帯域について異なる減衰係数を使用してフェードアウトを実行するステップ
を含む。
【0091】
本願発明の方法は、上述した態様のうちの1つ以上を実施することができる。
【0092】
本願発明の実施形態はまた、コンピュータプログラムがコンピュータ上で実行される場合、および/または上述の製品態様を実装する場合に、本願発明の方法を実行するためのコンピュータプログラムに関する。
【0093】
本願発明の実施形態はまた、上述した誤り隠蔽ユニットを含むオーディオデコーダに関する。
【0094】
オーディオデコーダは、異なる減衰係数を使用して、失われたオーディオフレームに先行するオーディオフレームのスペクトル表現の異なる減衰係数帯域のスペクトル値をスケーリングするように構成することができる。
【0095】
上述の態様は、互いに組合せることができる。
【0096】
4.図面の簡単な説明
本願発明の実施形態は、添付の図面を参照して以下に説明される。