(58)【調査した分野】(Int.Cl.,DB名)
前記雑音推定器(105)は、前記複数の周波数帯域のうちの第1のグループの各周波数帯域の前記背景雑音の前記帯域ごとの推定値に応じて、前記複数の周波数帯域のうちの前記第1のグループの第1の背景雑音エネルギーを示す低周波数背景雑音値を判定するように構成されており、
前記雑音推定器(105)は、前記複数の周波数帯域のうちの第2のグループの各周波数帯域の前記背景雑音の前記帯域ごとの推定値に応じて、前記複数の周波数帯域のうちの前記第2のグループの第2の背景雑音エネルギーを示す高周波数背景雑音値を判定するように構成されており、前記第1のグループの少なくとも1つの周波数帯域は、前記第2のグループの少なくとも1つの周波数帯域の中心周波数よりも低い中心周波数を有し、
前記選択器110は、前記低周波数背景雑音値および前記高周波数背景雑音値に応じて前記傾斜を判定するように構成されている、請求項3に記載の装置。
【発明の概要】
【0007】
本発明の目的は、快適雑音生成における改善された概念を提供することである。本発明の目的は、請求項1に記載の装置、請求項10に記載の装置、請求項13に記載のシステム、請求項14に記載の方法、請求項15に記載の方法、および、請求項16に記載のコンピュータプログラムによって達成される。
【0008】
オーディオ情報を符号化するための装置が提供される。オーディオ情報を符号化するための装置は、オーディオ入力信号の背景雑音特性に応じて2つ以上の快適雑音生成モードから快適雑音生成モードを選択するための選択器と、オーディオ情報が、選択されている快適雑音生成モードを示すモード情報を含む、オーディオ情報を符号化するための符号化ユニットとを備える。
【0009】
とりわけ、実施形態は、FD−CNGが、たとえば、自動車の雑音のような高傾斜背景雑音信号に対してより良好な品質を与え、一方で、LP−CNGが、たとえば、オフィスの雑音のような、スペクトル的により平坦な背景雑音信号に対してより良好な品質を与えるという知見に基づく。
【0010】
DTX/CNGシステムから最良の品質を得るためには、実施形態によれば、両方のCNG手法が使用され、背景雑音特性に応じて、それらのうちの一方が選択される。
【0011】
実施形態は、たとえば、LP−CNGまたはFD−CNGのいずれのCNGモードが使用されるべきかを判断する選択器を提供する。
【0012】
一実施形態によれば、選択器は、たとえば、背景雑音特性として、オーディオ入力信号の背景雑音の傾斜を判定するように構成することができる。選択器は、たとえば、判定された傾斜に応じて、2つ以上の快適雑音生成モードから上記快適雑音生成モードを選択するように構成することができる。
【0013】
一実施形態において、装置は、たとえば、複数の周波数帯域の各々について、背景雑音の帯域ごとの推定値を推定するための雑音推定器をさらに備えることができる。選択器は、たとえば、複数の周波数帯域の推定された背景雑音に応じて傾斜を判定するように構成することができる。
【0014】
一実施形態によれば、雑音推定器は、たとえば、複数の周波数帯域の各々の背景雑音のエネルギーを推定することによって、背景雑音の帯域ごとの推定値を推定するように構成することができる。
【0015】
一実施形態において、雑音推定器は、たとえば、複数の周波数帯域のうちの第1のグループの各周波数帯域の背景雑音の帯域ごとの推定値に応じて、複数の周波数帯域のうちの第1のグループの第1の背景雑音エネルギーを示す低周波数背景雑音値を判定するように構成することができる。
【0016】
その上、そのような実施形態において、雑音推定器は、たとえば、複数の周波数帯域のうちの第2のグループの各周波数帯域の背景雑音の帯域ごとの推定値に応じて、複数の周波数帯域のうちの第2のグループの第2の背景雑音エネルギーを示す高周波数背景雑音値を判定するように構成することができる。第1のグループの少なくとも1つの周波数帯域は、たとえば、第2のグループの少なくとも1つの周波数帯域の中心周波数よりも低い中心周波数を有し得る。特定の実施形態において、第1のグループの各周波数帯域は、たとえば、第2のグループの各周波数帯域の中心周波数よりも低い中心周波数を有し得る。
【0017】
さらに、選択器は、たとえば、低周波数背景雑音値および高周波数背景雑音値に応じて傾斜を判定するように構成することができる。
【0018】
一実施形態によれば、雑音推定器は、たとえば、以下の式に従って低周波数背景雑音値Lを判定するように構成することができ、
式中、iは第1の周波数帯域グループのi番目の周波数帯域を示し、I
1は複数の周波数帯域のうちの第1の周波数帯域を示し、I
2は複数の周波数帯域のうちの第2の周波数帯域を示し、N[i]はi番目の周波数帯域の背景雑音エネルギーのエネルギー推定値を示す。
【0019】
一実施形態において、雑音推定器は、たとえば、以下の式に従って高周波数背景雑音値Hを判定するように構成することができ、
式中、iは第2の周波数帯域グループのi番目の周波数帯域を示し、I
3は複数の周波数帯域のうちの第3の周波数帯域を示し、I
4は複数の周波数帯域のうちの第4の周波数帯域を示し、N[i]はi番目の周波数帯域の背景雑音エネルギーのエネルギー推定値を示す。
【0020】
一実施形態によれば、選択器は、たとえば、低周波数背景雑音値Lおよび高周波数背景雑音値Hに応じて傾斜Tを、式
T=L/H
に従って、または、式
T=H/L
に従って、または、式
T=L−H
に従って、または、式
T=H−L
に従って判定するように構成することができる。
【0021】
一実施形態において、選択器は、たとえば、傾斜を、現在の短期傾斜値として判定するように構成することができる。その上、選択器は、たとえば、現在の短期傾斜値および以前の長期傾斜値に応じて現在の長期傾斜値を判定するように構成することができる。さらに、選択器は、たとえば、現在の長期傾斜値に応じて、2つ以上の快適雑音生成モードのうちの1つを選択するように構成することができる。
【0022】
一実施形態によれば、選択器は、たとえば、以下の式に従って現在の長期傾斜値T
cLTを判定するように構成することができる。
T
cLT=αT
pLT+(1−α)T
式中、Tは現在の短期傾斜値であり、T
pLTは上記以前の長期傾斜値であり、αは0<α<1の実数である。
【0023】
一実施形態において、2つ以上の快適雑音生成モードのうちの第1の快適雑音生成モードは、たとえば、周波数領域快適雑音生成モードであってもよい。その上、2つ以上の快適雑音生成モードのうちの第2の快適雑音生成モードは、たとえば、線形予測領域快適雑音生成モードであってもよい。さらに、選択器は、たとえば、選択器によって以前に選択された生成モードが線形予測領域快適雑音生成モードであり、かつ、現在の長期傾斜値が第1の閾値よりも大きい場合、周波数領域快適雑音生成モードを選択するように構成することができる。その上、選択器は、たとえば、選択器によって以前に選択された生成モードが周波数領域快適雑音生成モードであり、かつ、現在の長期傾斜値が第2の閾値よりも小さい場合、線形予測領域快適雑音生成モードを選択するように構成することができる。
【0024】
その上、受信符号化オーディオ情報に基づいてオーディオ出力信号を生成するための装置が提供される。装置は、符号化オーディオ情報内に符号化されているモード情報を得るために符号化オーディオ情報を復号するための復号ユニットを備え、モード情報は、2つ以上の快適雑音生成モードのうちの指示されている快適雑音生成モードを示す。その上、装置は、指示されている快適雑音生成モードに応じて、快適雑音を生成することによって、オーディオ出力信号を生成するための信号プロセッサを備える。
【0025】
一実施形態によれば、2つ以上の快適雑音生成モードのうちの第1の快適雑音生成モードは、たとえば、周波数領域快適雑音生成モードであってもよい。信号プロセッサは、たとえば、指示されている快適雑音生成モードが周波数領域快適雑音生成モードである場合に、周波数領域において生成されている快適雑音の周波数−時間変換を実施することによって、周波数領域において快適雑音を生成するように構成することができる。たとえば、特定の実施形態において、信号プロセッサは、たとえば、指示されている快適雑音生成モードが周波数領域快適雑音生成モードである場合に、周波数領域において不規則雑音を生成すること、周波数領域における不規則雑音を整形して整形済み雑音を得ること、および、整形済み雑音を周波数領域から時間領域へと変換することによって、快適雑音を生成するように構成することができる。
【0026】
一実施形態において、2つ以上の快適雑音生成モードのうちの第2の快適雑音生成モードは、たとえば、線形予測領域快適雑音生成モードであってもよい。信号プロセッサは、たとえば、指示されている快適雑音生成モードが線形予測領域快適雑音生成モードである場合に、線形予測フィルタを利用することによって、快適雑音を生成するように構成することができる。たとえば、特定の実施形態において、信号プロセッサは、たとえば、指示されている快適雑音生成モードが線形予測領域快適雑音生成モードである場合に、不規則励振信号を生成すること、不規則励振信号をスケーリングしてスケーリング済み励振信号を得ること、および、LP逆フィルタを使用してスケーリング済み励振信号を合成することによって、快適雑音を生成するように構成することができる。
【0027】
さらに、システムが提供される。システムは、上述した実施形態のうちの1つによる、オーディオ情報を符号化するための装置と、上述した実施形態のうちの1つによる、受信符号化オーディオ情報に基づいてオーディオ出力信号を生成するための装置とを備える。オーディオ情報を符号化するための装置の選択器は、オーディオ入力信号の背景雑音特性に応じて2つ以上の快適雑音生成モードから快適雑音生成モードを選択するように構成されている。オーディオ情報を符号化するための装置の符号化ユニットは、選択されている快適雑音生成モードを、指示されている快適雑音生成モードとして示すモード情報を含むオーディオ情報を符号化して、符号化オーディオ情報を得るように構成されている。その上、オーディオ出力信号を生成するための装置の復号ユニットは、符号化オーディオ情報を受信するように構成されており、符号化オーディオ情報内に符号化されているモード情報を得るために、符号化オーディオ情報を復号するようにさらに構成されている。オーディオ出力信号を生成するための装置の信号プロセッサは、指示されている快適雑音生成モードに応じて、快適雑音を生成することによって、オーディオ出力信号を生成するように構成されている。
【0028】
その上、オーディオ情報を符号化するための方法が提供される。方法は、以下のステップを含む。
− オーディオ入力信号の背景雑音特性に応じて2つ以上の快適雑音生成モードから快適雑音生成モードを選択するステップ。および
− オーディオ情報を符号化するステップであって、オーディオ情報は、選択されている快適雑音生成モードを示すモード情報を含む、符号化するステップ。
【0029】
さらに、受信符号化オーディオ情報に基づいてオーディオ出力信号を生成するための方法が提供される。方法は、以下のステップを含む。
− 符号化オーディオ情報内に符号化されているモード情報を得るために符号化オーディオ情報を復号するステップであって、モード情報は、2つ以上の快適雑音生成モードのうちの指示されている快適雑音生成モードを示す、復号するステップ。および
− 指示されている快適雑音生成モードに応じて、快適雑音を生成することによって、オーディオ出力信号を生成するステップ。
【0030】
その上、コンピュータまたは信号プロセッサ上で実行されると、上述した方法を実施するためのコンピュータプログラムが提供される。
【0031】
そのため、いくつかの実施形態において、提案されている選択器は、たとえば、主に、背景雑音の傾斜に基づくことができる。たとえば、背景雑音の傾斜が高い場合、FD−CNGが選択され、そうでない場合、LP−CNGが選択される。
【0032】
背景雑音傾斜を平滑化したもの、および、ヒステリシスが、たとえば、1つのモードから別のモードへの頻繁な切り替わりを回避するために使用され得る。
【0033】
背景雑音の傾斜は、たとえば、低周波数における背景雑音エネルギーと、高周波数における背景雑音エネルギーとの比を使用して推定することができる。
【0034】
背景雑音エネルギーは、たとえば、雑音推定器を使用して周波数領域において推定することができる。
【0035】
以下において、本発明の実施形態を、図面を参照しながらより詳細に説明する。
【発明を実施するための形態】
【0037】
図1は、一実施形態によるオーディオ情報を符号化するための装置を示す。
【0038】
オーディオ情報を符号化するための装置は、オーディオ入力信号の背景雑音特性に応じて2つ以上の快適雑音生成モードから快適雑音生成モードを選択するための選択器110を備える。
【0039】
その上、装置は、オーディオ情報を符号化するための符号化ユニット120を備え、オーディオ情報は、選択されている快適雑音生成モードを示すモード情報を含む。
【0040】
たとえば、2つ以上の快適雑音生成モードのうちの第1の快適雑音生成モードは、たとえば、周波数領域快適雑音生成モードであってもよい。かつ/または、たとえば、2つ以上の生成モードのうちの第2の快適雑音生成モードは、たとえば、線形予測領域快適雑音生成モードであってもよい。
【0041】
たとえば、復号器側において、符号化オーディオ情報が受信され、符号化オーディオ情報内に符号化されているモード情報が、選択されている快適雑音生成モードが周波数領域快適雑音生成モードであることを示す場合、復号器側の信号プロセッサは、たとえば、周波数領域において不規則雑音を生成すること、周波数領域における不規則雑音を整形して整形済み雑音を得ること、および、整形済み雑音を周波数領域から時間領域へと変換することによって、快適雑音を生成することができる。
【0042】
一方、たとえば、符号化オーディオ情報内に符号化されているモード情報が、選択されている快適雑音生成モードが線形予測領域快適雑音生成モードであることを示す場合、復号器側の信号プロセッサは、たとえば、不規則励振信号を生成し、不規則励振信号をスケーリングしてスケーリング済み励振信号を得、LP逆フィルタを使用してスケーリング済み励振信号を合成することによって、快適雑音を生成することができる。
【0043】
符号化オーディオ情報内には、快適雑音生成モードに関する情報だけでなく、追加の情報も符号化され得る。たとえば、周波数帯域特有の利得係数も、たとえば、周波数帯域ごとに1つの利得係数で符号化することができる。または、たとえば、1つ以上のLPフィルタ係数、またはLSF係数もしくはISF係数が、たとえば、符号化オーディオ情報内に符号化され得る。符号化オーディオ情報内に符号化されている、選択されている快適雑音生成モードに関する情報および追加の情報はその後、たとえば、SIDフレーム内で復号器側に送信され得る(SID=無音挿入記述子)。
【0044】
選択されている快適雑音生成モードに関する情報は、明示的または黙示的に符号化されてもよい。
【0045】
選択されている快適雑音生成モードを明示的に符号化するとき、1つ以上のビットがたとえば、選択されている快適雑音生成モードが、2つ以上の快適雑音生成モードのうちのいずれであるかを示すために利用され得る。そのような実施形態において、上記1つ以上のビットはこのとき、符号化モード情報である。
【0046】
一方で、他の実施形態において、選択されている快適雑音生成モードは、オーディオ情報内に黙示的に符号化される。たとえば、上述した例において、周波数帯域特有の利得係数および1つ以上のLP(またはLSFもしくはISF)係数は、たとえば、異なるデータフォーマットを有し得、または、たとえば、異なるビット長を有し得る。たとえば、周波数帯域特有の利得係数がオーディオ情報内に符号化されている場合、これは、たとえば、周波数領域快適雑音生成モードが選択されている快適雑音生成モードであることを示し得る。一方、1つ以上のLP(またはLSFもしくはISF)係数がオーディ情報内に符号化されている場合、これは、たとえば、線形予測領域快適雑音生成モードが選択されている快適雑音生成モードであることを示し得る。そのような黙示的符号化が使用されるとき、周波数帯域特有の利得係数または1つ以上のLP(またはLSFもしくはISF)係数が、符号化オーディオ信号内に符号化されているモード情報を表し、このモード情報が、選択されている快適雑音生成モードを示す。
【0047】
一実施形態によれば、選択器110は、たとえば、背景雑音特性として、オーディオ入力信号の背景雑音の傾斜を判定するように構成することができる。選択器110は、たとえば、判定された傾斜に応じて、2つ以上の快適雑音生成モードから上記快適雑音生成モードを選択するように構成することができる。
【0048】
たとえば、低周波数背景雑音値および高周波数背景雑音値を利用することができ、背景雑音の傾斜は、たとえば、低周波数背景雑音値および高周波数背景雑音値に応じて計算することができる。
【0049】
図2は、さらなる実施形態によるオーディオ情報を符号化するための装置を示す。
図2の装置は、たとえば、複数の周波数帯域の各々について、背景雑音の帯域ごとの推定値を推定するための雑音推定器105をさらに備える。選択器110は、たとえば、複数の周波数帯域の推定された背景雑音に応じて傾斜を判定するように構成することができる。
【0050】
一実施形態によれば、雑音推定器105は、たとえば、複数の周波数帯域の各々の背景雑音のエネルギーを推定することによって、背景雑音の帯域ごとの推定値を推定するように構成することができる。
【0051】
一実施形態において、雑音推定器105は、たとえば、複数の周波数帯域のうちの第1のグループの各周波数帯域の背景雑音の帯域ごとの推定値に応じて、複数の周波数帯域のうちの第1のグループの第1の背景雑音エネルギーを示す低周波数背景雑音値を判定するように構成することができる。
【0052】
その上、雑音推定器105は、たとえば、複数の周波数帯域のうちの第2のグループの各周波数帯域の背景雑音の帯域ごとの推定値に応じて、複数の周波数帯域のうちの第2のグループの第2の背景雑音エネルギーを示す高周波数背景雑音値を判定するように構成することができる。第1のグループの少なくとも1つの周波数帯域は、たとえば、第2のグループの少なくとも1つの周波数帯域の中心周波数よりも低い中心周波数を有し得る。特定の実施形態において、第1のグループの各周波数帯域は、たとえば、第2のグループの各周波数帯域の中心周波数よりも低い中心周波数を有し得る。
【0053】
さらに、選択器110は、たとえば、低周波数背景雑音値および高周波数背景雑音値に応じて傾斜を判定するように構成することができる。
【0054】
一実施形態によれば、雑音推定器105は、たとえば、以下の式に従って低周波数背景雑音値Lを判定するように構成することができ、
式中、iは第1の周波数帯域グループのi番目の周波数帯域を示し、I
1は複数の周波数帯域のうちの第1の周波数帯域を示し、I
2は複数の周波数帯域のうちの第2の周波数帯域を示し、N[i]はi番目の周波数帯域の背景雑音エネルギーのエネルギー推定値を示す。
【0055】
同様に、一実施形態において、雑音推定器105は、たとえば、以下の式に従って高周波数背景雑音値Hを判定するように構成することができ、
式中、iは第2の周波数帯域グループのi番目の周波数帯域を示し、I
3は複数の周波数帯域のうちの第3の周波数帯域を示し、I
4は複数の周波数帯域のうちの第4の周波数帯域を示し、N[i]はi番目の周波数帯域の背景雑音エネルギーのエネルギー推定値を示す。
【0056】
一実施形態によれば、選択器110は、たとえば、低周波数背景雑音値Lおよび高周波数背景雑音値Hに応じて傾斜Tを、式
T=L/H
に従って、または、式
T=H/L
に従って、または、式
T=L−H
に従って、または、式
T=H−L
に従って判定するように構成することができる。
【0057】
たとえば、LおよびHが対数領域において表されるとき、上記減算式のうちの一方(たとえば、T=L−HまたはT=H−L)が利用され得る。
【0058】
一実施形態において、選択器110は、たとえば、傾斜を、現在の短期傾斜値として判定するように構成することができる。その上、選択器110は、たとえば、現在の短期傾斜値および以前の長期傾斜値に応じて現在の長期傾斜値を判定するように構成することができる。さらに、選択器110は、たとえば、現在の長期傾斜値に応じて、2つ以上の快適雑音生成モードのうちの1つを選択するように構成することができる。
【0059】
一実施形態によれば、選択器110は、たとえば、以下の式に従って現在の長期傾斜値T
cLTを判定するように構成することができる。
T
cLT=αT
pLT+(1−α)T
式中、Tは現在の短期傾斜値であり、T
pLTは上記以前の長期傾斜値であり、αは0<α<1の実数である。
【0060】
一実施形態において、2つ以上の快適雑音生成モードのうちの第1の快適雑音生成モードは、たとえば、周波数領域快適雑音生成モードFD_CNGであってもよい。その上、2つ以上の快適雑音生成モードのうちの第2の快適雑音生成モードは、たとえば、線形予測領域快適雑音生成モードLP_CNGであってもよい。選択器110は、たとえば、選択器110によって以前に選択された生成モードcng_mode_prevが線形予測領域快適雑音生成モードLP_CNGであり、かつ、現在の長期傾斜値が第1の閾値thr
1よりも大きい場合、周波数領域快適雑音生成モードFD_CNGを選択するように構成することができる。その上、選択器110は、たとえば、選択器110によって以前に選択された生成モードcng_mode_prevが周波数領域快適雑音生成モードFD_CNGであり、かつ、現在の長期傾斜値が第2の閾値thr
2よりも小さい場合、線形予測領域快適雑音生成モードLP_CNGを選択するように構成することができる。
【0061】
いくつかの実施形態において、第1の閾値は第2の閾値に等しい。一方、他のいくつかの実施形態において、第1の閾値は第2の閾値とは異なる。
【0062】
図4は、一実施形態による、受信符号化オーディオ情報に基づいてオーディオ出力信号を生成するための装置を示す。
【0063】
装置は、符号化オーディオ情報内に符号化されているモード情報を得るために、符号化オーディオ情報を復号するための復号ユニット210を備える。モード情報は、2つ以上の快適雑音生成モードのうちの指示されている快適雑音生成モードを示す。
【0064】
その上、装置は、指示されている快適雑音生成モードに応じて、快適雑音を生成することによって、オーディオ出力信号を生成するための信号プロセッサ220を備える。
【0065】
一実施形態によれば、2つ以上の快適雑音生成モードのうちの第1の快適雑音生成モードは、たとえば、周波数領域快適雑音生成モードであってもよい。信号プロセッサ220は、たとえば、指示されている快適雑音生成モードが周波数領域快適雑音生成モードである場合に、周波数領域において生成されている快適雑音の周波数−時間変換を実施することによって、周波数領域において快適雑音を生成するように構成することができる。たとえば、特定の実施形態において、信号プロセッサは、たとえば、指示されている快適雑音生成モードが周波数領域快適雑音生成モードである場合に、周波数領域において不規則雑音を生成すること、周波数領域における不規則雑音を整形して整形済み雑音を得ること、および、整形済み雑音を周波数領域から時間領域へと変換することによって、快適雑音を生成するように構成することができる。
【0066】
たとえば、国際公開第2014/096279号パンフレットに記載されている概念を利用することができる。
【0067】
たとえば、1つ以上の不規則系列を生成することによって、FFT領域および/またはQMF領域内の各個々のスペクトル帯域を励振するために、不規則生成器が適用され得る(FFT=高速フーリエ変換、QMF=直交ミラーフィルタ)。たとえば、生成される快適雑音のスペクトルが、たとえば、例としてオーディオ入力信号を含むビットストリーム内に存在する実際の背景雑音のスペクトルに類似するように、各帯域内の不規則系列の振幅を個々に計算することによって、不規則雑音の整形を行うことができる。したがって、たとえば、不規則系列を、各周波数帯域内の計算された振幅と乗算することによって、計算された振幅を、たとえば、不規則系列に適用することができる。このように、整形済み雑音の、周波数領域から時間領域への変換を利用することができる。
【0068】
一実施形態において、2つ以上の快適雑音生成モードのうちの第2の快適雑音生成モードは、たとえば、線形予測領域快適雑音生成モードであってもよい。信号プロセッサ220は、たとえば、指示されている快適雑音生成モードが線形予測領域快適雑音生成モードである場合に、線形予測フィルタを利用することによって、快適雑音を生成するように構成することができる。たとえば、特定の実施形態において、信号プロセッサは、たとえば、指示されている快適雑音生成モードが線形予測領域快適雑音生成モードである場合に、不規則励振信号を生成すること、不規則励振信号をスケーリングしてスケーリング済み励振信号を得ること、および、LP逆フィルタを使用してスケーリング済み励振信号を合成することによって、快適雑音を生成するように構成することができる。
【0069】
たとえば、G.722.2(ITU−T G.722.2 Annex A参照)および/またはG.718(ITU−T G.718 Sec. 6.12および7.12参照)に記載されているような快適雑音生成が利用されてもよい。不規則励振信号をスケーリングしてスケーリング済み励振信号を得ること、および、LP逆フィルタを使用してスケーリング済み励振信号を合成することによる、不規則励振領域におけるそのような快適雑音生成は、当該技術分野において既知である。
【0070】
図5は、一実施形態によるシステムを示す。システムは、上述した実施形態のうちの1つに従ってオーディオ情報を符号化するための装置100と、上述した実施形態のうちの1つに従って受信符号化オーディオ情報に基づいてオーディオ出力信号を生成するための装置200とを備える。
【0071】
オーディオ情報を符号化するための装置100の選択器110は、オーディオ入力信号の背景雑音特性に応じて2つ以上の快適雑音生成モードから快適雑音生成モードを選択するように構成されている。オーディオ情報を符号化するための装置100の符号化ユニット120は、選択されている快適雑音生成モードを、指示されている快適雑音生成モードとして示すモード情報を含むオーディオ情報を符号化して、符号化オーディオ情報を得るように構成されている。
【0072】
その上、オーディオ出力信号を生成するための装置200の復号ユニット210は、符号化オーディオ情報を受信するように構成されており、符号化オーディオ情報内に符号化されているモード情報を得るために、符号化オーディオ情報を復号するようにさらに構成されている。オーディオ出力信号を生成するための装置200の信号プロセッサ220は、指示されている快適雑音生成モードに応じて、快適雑音を生成することによって、オーディオ出力信号を生成するように構成されている。
【0073】
図3は、一実施形態による快適雑音生成モードを選択するための段階的な手法を示す。
【0074】
ステップ310において、周波数領域における背景雑音エネルギーを推定するために雑音推定器が使用される。これは一般的に、帯域ごとに実施され、帯域ごとに1つのエネルギー推定値が作り出される。
N[i]、ただし0≦i<N、Nは帯域の数(たとえば、N=20)
【0075】
背景雑音エネルギーの帯域ごとの推定値を作り出す任意の雑音推定器が使用されてもよい。一例は、G.718(ITU−T G.718 Sec.6.7)において使用されている雑音推定器である。
【0076】
ステップ320において、以下の式を使用して、低周波数における背景雑音エネルギーが計算される。
ここで、I
1およびI
2は信号帯域幅に依存し得、たとえば、NBについては、I
1=1、I
2=9であり、WBについては、I
1=0、I
2=10である。
【0077】
Lは、上述したような低周波数背景雑音値として考えることができる。
【0078】
ステップ330において、以下の式を使用して高周波数における背景雑音エネルギーが計算される。
ここで、I
3およびI
4は信号帯域幅に依存し得、たとえば、NBについてはI
3=16、I
4=17であり、WBについてはI
3=19、I
4=20である。
【0079】
Hは、上述したような高周波数背景雑音値として考えることができる。
【0080】
ステップ320および330は、たとえば、連続してまたは互いに独立して行われてもよい。
【0081】
ステップ340において、以下の式を使用して背景雑音傾斜が計算される。
T=L/H
【0082】
いくつかの実施形態は、たとえば、ステップ350に従って進行してもよい。ステップ350において、背景雑音傾斜が平滑化され、背景雑音傾斜の長期バージョンが作り出される。
T
LT=αT
LT+(1−α)T
ここで、αは、たとえば、0.9である。この再帰方程式において、等号の左側のT
LTは、上記で言及した現在の長期傾斜値T
cLTであり、等号の右側のT
LTは、上記で言及した上記以前の長期傾斜値T
pLTである。
【0083】
ステップ360において、ヒステリシスを用いる以下の分類子を使用してCNGモードが最終的に選択される。
If(cng_mode_prev==LP_CNG and T
LT>thr
1)then cng_mode=FD_CNG
If(cng_mode_prev==FD_CNG and T
LT<thr
2)then cng_mode=LP_CNG
ここで、thr
1及びthr
2は帯域幅に依存し得、たとえば、NBについては、
thr
1=9,thr
2=2
であり、WBについては、
thr
1=45,thr
2=10
である。
【0084】
cng_modeは、選択器110によって(現在)選択されている快適雑音生成モードである。
【0085】
cng_mode_prevは、選択器110によって以前に選択された(快適雑音)生成モードである。
【0086】
ステップ360の上記の条件がいずれも満たされないときに何が起こるかは、実施態様に依存する。一実施形態において、たとえば、ステップ360の両方の条件のいずれもが満たされない場合、CNGモードは何も変わらず、それによって、以下のようになる。
cng_mode=cng_mode_prev
【0087】
他の実施形態は、他の選択戦略を実装してもよい。
【0088】
図3の実施形態においては、thr
1はthr
2と異なるが、一方、他のいくつかの実施形態においては、thr
1はthr
2に等しい。
【0089】
いくつかの態様が装置の文脈において説明されているが、これらの態様はまた、対応する方法の説明をも表すことは明らかであり、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈において説明されている態様はまた、対応するブロックまたは対応する装置の項目もしくは特徴の説明をも表す。
【0090】
本発明の分解された信号は、デジタル記憶媒体上に記憶することができ、または、インターネットのような、無線伝送媒体もしくは有線伝送媒体のような伝送媒体上で伝送することができる。
【0091】
特定の実施要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアにおいて実装することができる。実装は、それぞれの方法が実施されるようにプログラム可能コンピュータシステムと協働する(または協働することが可能である)、電子可読制御信号を記憶しているデジタル記憶媒体、たとえば、フロッピーディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを使用して実施することができる。
【0092】
本発明によるいくつかの実施形態は、本明細書において記載されている方法のうちの1つが実施されるように、プログラム可能コンピュータシステムと協働することが可能である、電子可読制御信号を有する非一時的データキャリアを含む。
【0093】
一般的に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で作動するときに、本方法のうちの1つを実施するように動作可能である。
プログラムコードは、たとえば、機械可読キャリア上に記憶されてもよい。
【0094】
他の実施形態は、機械可読キャリア上に記憶されている、本明細書において記載されている方法のうちの1つを実施するためのコンピュータプログラムを含む。
【0095】
すなわち、それゆえ、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で作動するときに、本明細書において記載されている方法のうちの1つを実施するためのプログラムコードを有するコンピュータプログラムである。
【0096】
それゆえ、本発明の方法のさらなる実施形態は、本明細書において記載されている方法のうちの1つを実施するためのコンピュータプログラムを記録されて含む、データキャリア(またはデジタル記憶媒体、もしくはコンピュータ可読媒体)である。
【0097】
それゆえ、本発明の方法のさらなる実施形態は、本明細書において記載されている方法のうちの1つを実施するためのコンピュータプログラムを表すデータストリームまたは信号系列である。データストリームまたは信号系列は、たとえば、データ通信接続、たとえば、インターネットを介して転送されるように構成することができる。
【0098】
さらなる実施形態は、本明細書において記載されている方法のうちの1つを実施するように構成または適合されている処理手段、たとえば、コンピュータ、または、プログラム可能な論理装置を含む。
【0099】
さらなる実施形態は、本明細書において記載されている方法のうちの1つを実施するためのコンピュータプログラムをインストールされているコンピュータを含む。
【0100】
いくつかの実施形態において、プログラム可能な論理装置(たとえば、フィールドプログラマブルゲートアレイ FPGA)が、本明細書において説明されている方法の機能の一部またはすべてを実施するために使用されてもよい。いくつかの実施形態において、フィールドプログラマブルゲートアレイは、本明細書において説明されている方法のうちの1つを実施するために、マイクロプロセッサと協働することができる。一般的に、方法は、任意のハードウェア装置によって実施されることが好ましい。
【0101】
上述した実施形態は、本発明の原理の例示にすぎない。本明細書において記載されている構成および詳細の修正および変形は、当該技術分野においては明らかであると理解されたい。それゆえ、迫る特許請求の範囲によってのみ限定されることが意図され、本明細書において実施形態の記述および説明によって示される特定の詳細によっては限定されない。