特許第6180544号(P6180544)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

特許6180544オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成
<>
  • 特許6180544-オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成 図000047
  • 特許6180544-オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成 図000048
  • 特許6180544-オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成 図000049
  • 特許6180544-オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成 図000050
  • 特許6180544-オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成 図000051
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6180544
(24)【登録日】2017年7月28日
(45)【発行日】2017年8月16日
(54)【発明の名称】オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成
(51)【国際特許分類】
   G10L 19/012 20130101AFI20170807BHJP
   G10L 21/0388 20130101ALI20170807BHJP
【FI】
   G10L19/012
   G10L21/0388 100
【請求項の数】19
【全頁数】24
(21)【出願番号】特願2015-548605(P2015-548605)
(86)(22)【出願日】2013年12月19日
(65)【公表番号】特表2016-500452(P2016-500452A)
(43)【公表日】2016年1月12日
(86)【国際出願番号】EP2013077525
(87)【国際公開番号】WO2014096279
(87)【国際公開日】20140626
【審査請求日】2015年7月22日
(31)【優先権主張番号】61/740,857
(32)【優先日】2012年12月21日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】500341779
【氏名又は名称】フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】100085497
【弁理士】
【氏名又は名称】筒井 秀隆
(72)【発明者】
【氏名】ロンバード,アンソニー
(72)【発明者】
【氏名】ディーツ,マルチン
(72)【発明者】
【氏名】ヴィルデ,ステファン
(72)【発明者】
【氏名】ラベリー,エマニュエル
(72)【発明者】
【氏名】ゼチャヴァン,パンジ
(72)【発明者】
【氏名】ムルトルス,マルクス
【審査官】 大野 弘
(56)【参考文献】
【文献】 国際公開第2012/110481(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/012
G10L 21/0388
(57)【特許請求の範囲】
【請求項1】
ビットストリーム(BS)を復号化して、前記ビットストリーム(BS)からオーディオ出力信号(OS)を生成するオーディオ復号器であって、前記ビットストリーム(BS)は少なくとも1つの不活性期へと続く少なくとも1つの活性期を含み、前記ビットストリーム(BS)は、その中に背景ノイズのスペクトル(SBN)を記述する少なくとも1つの符号化された無音挿入記述子フレーム(SI)を有しており、
前記無音挿入記述子フレーム(SI)を復号化して、前記背景ノイズのスペクトル(SBN)を再構成するよう構成された無音挿入記述子復号器(3)と、
活性期間中に前記ビットストリームから前記オーディオ出力信号(OS)を再構成するよう構成された復号化装置(2)と、
前記オーディオ出力信号(OS)のスペクトル(SAS)を決定するよう構成されたスペクトル変換器(4)と、
前記スペクトル変換器(4)によって提供されたオーディオ出力信号(OS)のスペクトル(SAS)に基づいて、前記オーディオ出力信号(OS)のノイズの第1スペクトル(SN1)を決定するよう構成されたノイズ推定装置(5)であって、前記オーディオ出力信号(OS)のノイズの第1スペクトル(SN1)は前記背景ノイズのスペクトル(SBN)よりも高いスペクトル分解能を持つ、ノイズ推定装置(5)と、
前記オーディオ出力信号(OS)のノイズの第1スペクトル(SN1)に基づいて、前記オーディオ出力信号(OS)のノイズの第2スペクトル(SN2)を確定するよう構成された分解能変換器(6)であって、前記オーディオ出力信号(OS)のノイズの第2スペクトル(SN2)は前記背景ノイズのスペクトル(SBN)と同じスペクトル分解能を持つ、分解能変換器(6)と、
前記無音挿入記述子復号器(3)によって提供された前記背景ノイズのスペクトル(SBN)と、前記分解能変換器(6)によって提供された前記オーディオ出力信号(OS)のノイズの第2スペクトル(SN2)とに基づいて、コンフォートノイズ(CN)のスペクトル(SCN)のスケーリングファクタ(SF)を計算するよう構成されたスケーリングファクタ演算装置(7a)と、前記スケーリングファクタ(SF)に基づいてコンフォートノイズ(CN)のスペクトル(SCN)を計算するよう構成されたコンフォートノイズ・スペクトル生成器(7b)と、を含むコンフォートノイズ・スペクトル推定装置(7)と、
前記コンフォートノイズ(CN)のスペクトル(SCN)に基づいて不活性期間中にコンフォートノイズ(CN)を生成するよう構成されたコンフォートノイズ発生器(8)と、
を含むオーディオ復号器。
【請求項2】
前記スペクトル変換器(4)は高速フーリエ変換装置(4)を含む、請求項1に記載のオーディオ復号器。
【請求項3】
前記ノイズ推定装置(5)は、前記オーディオ出力信号(OS)のスペクトル(SAS)を前記オーディオ出力信号(OS)の変換済みスペクトル(CSA)へと変換するよう構成された変換装置(9)を含み、前記変換済みスペクトル(CSA)は、前記オーディオ出力信号(OS)の前記スペクトル(SAS)と同じ又はそれより低いスペクトル分解能を有し、かつ前記背景ノイズのスペクトル(SBN)よりも高いスペクトル分解能を有する、請求項1又は2に記載のオーディオ復号器。
【請求項4】
前記ノイズ推定装置(5)は、前記変換装置(9)によって提供された前記オーディオ出力信号(OS)の変換済みスペクトル(CSA)に基づいて、前記オーディオ出力信号(OS)のノイズの前記第1スペクトル(SN1)を決定するよう構成された、ノイズ推定器(10)を含む、請求項3に記載のオーディオ復号器。
【請求項5】
前記スケーリングファクタ演算装置(7a)は、次式に従ってスケーリングファクタ(SF)を計算するよう構成されており、
ここで、
は前記コンフォートノイズ(CN)の周波数帯域グループiについてのスケーリングファクタ(SF)を示し、
は前記背景ノイズのスペクトル(SBN)の周波数帯域グループiのレベルを示し、
は前記オーディオ出力信号(OS)のノイズの前記第2スペクトル(SN2)の周波数帯域グループiのレベルを示し、i=0,...,LLR−1であり、LLRは前記背景ノイズのスペクトル(SBN)及び前記オーディオ出力信号(OS)のノイズの前記第2スペクトル(SN2)の周波数帯域グループの数である、請求項1乃至4のいずれか1項に記載のオーディオ復号器。
【請求項6】
前記コンフォートノイズ・スペクトル生成器(7b)は、前記スケーリングファクタ(SF)と、前記ノイズ推定装置(5)によって提供された前記オーディオ出力信号(OS)のノイズの前記第1スペクトル(SN1)とに基づいて、前記コンフォートノイズのスペクトル(SCN)を計算するよう構成された、請求項1乃至5のいずれか1項に記載のオーディオ復号器。
【請求項7】
前記コンフォートノイズ・スペクトル生成器(7b)は、次式に従って前記コンフォートノイズのスペクトル(SCN)を計算するよう構成されており、
ここで、
は前記コンフォートノイズ(SCN)のスペクトルの周波数帯域kのレベルを示し、
は前記背景ノイズのスペクトル(SBN)と前記オーディオ出力信号のノイズの前記第2スペクトル(SN2)との周波数帯域グループiのスケーリングファクタ(SF)を示し、
は前記オーディオ出力信号(OS)のノイズの前記第1スペクトル(SN1)の周波数帯域kのレベルを示し、k=bLR(i),...,bLR(i+1)−1であり、bLR(i)は前記周波数帯域グループの1つの第1周波数帯域であり、i=0,...,LLR−1であり、LLRは前記背景ノイズのスペクトル(SBN)及び前記オーディオ出力信号(OS)のノイズの前記第2スペクトル(SN2)の周波数帯域グループの数である、請求項1乃至6のいずれか1項に記載のオーディオ復号器。
【請求項8】
前記分解能変換器(6)は、前記オーディオ出力信号(OS)のノイズの前記第1スペクトル(SN1)に基づいて前記オーディオ出力信号(OS)のノイズの第3スペクトル(SN3)を確定するよう構成された第1変換器ステージ(11)を含み、前記オーディオ出力信号(OS)のノイズの前記第3スペクトル(SN3)のスペクトル分解能は前記オーディオ出力信号(OS)のノイズの前記第1スペクトル(SN1)のスペクトル分解能と同じ又はそれより高く、前記分解能変換器(6)は前記オーディオ出力信号(OS)のノイズの前記第2スペクトル(SN2)を確定するよう構成された第2変換器ステージ(12)を含む、請求項1乃至7のいずれか1項に記載のオーディオ復号器。
【請求項9】
前記コンフォートノイズ・スペクトル生成器(7b)は、前記スケーリングファクタ(SF)と前記分解能変換器(6)の前記第1変換器ステージ(11)によって提供された前記オーディオ出力信号(OS)のノイズの前記第3スペクトル(SN3)とに基づいて、前記コンフォートノイズのスペクトル(SCN)を計算するよう構成されている、請求項8に記載のオーディオ復号器。
【請求項10】
前記コンフォートノイズ・スペクトル生成器(7b)は、次式に従って前記コンフォートノイズのスペクトル(SCN)を計算するよう構成され、
ここで、
は前記コンフォートノイズのスペクトル(SCN)の周波数帯域kのレベルを示し、
は前記背景ノイズのスペクトル(SBN)と前記オーディオ出力信号のノイズの前記第2スペクトル(SN2)との周波数帯域グループiのスケーリングファクタ(SF)を示し、
は前記オーディオ出力信号(OS)のノイズの前記第3スペクトル(SN3)の周波数帯域kのレベルを示し、k=bLR(i),...,bLR(i+1)−1であり、bLR(i)は周波数帯域グループの第1周波数帯域であり、i=0,...,LLR−1であり、LLRは前記背景ノイズのスペクトル(SBN)と前記オーディオ出力信号(OS)のノイズの前記第2スペクトル(SN2)との周波数帯域グループの数である、請求項8又は9に記載のオーディオ復号器。
【請求項11】
前記コンフォートノイズ発生器(8)は、高速フーリエ変換ドメインにおいて前記コンフォートノイズ(CN)の周波数帯域のレベルを調整する第1高速フーリエ変換器(15)と、前記第1高速フーリエ変換器(15)の出力に基づいて前記コンフォートノイズの少なくとも一部を生成する第2高速フーリエ変換器(16)とを備える、請求項1乃至10のいずれか1項に記載のオーディオ復号器。
【請求項12】
前記復号化装置(2)は、活性期間中に前記オーディオ出力信号(OS)を生成するよう構成されたコア復号器(17)を備える、請求項1乃至11のいずれか1項に記載のオーディオ復号器。
【請求項13】
前記復号化装置(2)は、オーディオ信号(AS)を生成するよう構成されたコア復号器(17)と、前記コア復号器(17)によって生成された前記オーディオ信号(AS)に基づいて前記オーディオ出力信号(OS)を生成するよう構成された帯域幅拡張モジュール(20)とを備える、請求項1乃至11のいずれか1項に記載のオーディオ復号器。
【請求項14】
前記帯域幅拡張モジュール(20)は、スペクトル帯域複製復号器(21)、直交ミラーフィルタ分析器(22)、及び/又は直交ミラーフィルタ合成器(23)を備える、請求項13に記載のオーディオ復号器。
【請求項15】
第2高速フーリエ変換器(16)によって生成された前記コンフォートノイズ(CN)は、前記帯域幅拡張モジュール(20)へと供給される、請求項13又は14に記載のオーディオ復号器。
【請求項16】
前記コンフォートノイズ発生器(8)は、直交ミラーフィルタドメインにおいて前記コンフォートノイズ(CN)の周波数帯域のレベルを調整する直交ミラーフィルタ調整装置(24)を備え、前記直交ミラーフィルタ調整装置(24)の出力は前記帯域幅拡張モジュール(20)へと供給される、請求項13乃至15のいずれか1項に記載のオーディオ復号器。
【請求項17】
請求項1乃至16のいずれか1項に従って設計された復号器(1)と、符号器(100)と、を備えるシステム。
【請求項18】
ビットストリーム(BS)を復号化して、前記ビットストリーム(BS)からオーディオ出力信号(OS)を生成する方法であって、前記ビットストリーム(BS)は少なくとも1つの不活性期へと続く少なくとも1つの活性期を含み、前記ビットストリーム(BS)は、その中に背景ノイズのスペクトル(SBN)を記述する少なくとも1つの符号化された無音挿入記述子フレーム(SI)を有しており、
前記無音挿入記述子フレーム(SI)を復号化して、前記背景ノイズのスペクトル(SBN)を再構成するステップと、
活性期間中に前記ビットストリームから前記オーディオ出力信号(OS)を再構成するステップと、
前記オーディオ出力信号(OS)のスペクトル(SAS)を決定するステップと、
前記オーディオ出力信号(OS)の前記スペクトル(SAS)に基づいて、前記オーディオ出力信号(OS)のノイズの第1スペクトル(SN1)を決定するステップであって、前記オーディオ出力信号(OS)のノイズの前記第1スペクトル(SN1)は前記背景ノイズのスペクトル(SBN)よりも高いスペクトル分解能を持つ、ステップと、
前記オーディオ出力信号(OS)のノイズの前記第1スペクトル(SN1)に基づいて、前記オーディオ出力信号(OS)のノイズの第2スペクトル(SN2)を確定するステップであって、前記オーディオ出力信号(OS)のノイズの前記第2スペクトル(SN2)は前記背景ノイズのスペクトル(SBN)と同じスペクトル分解能を持つ、ステップと、
前記背景ノイズのスペクトル(SBN)と、前記オーディオ出力信号(OS)のノイズの前記第2スペクトル(SN2)とに基づいて、コンフォートノイズ(CN)のスペクトル(SCN)のスケーリングファクタ(SF)を計算するステップと、
前記コンフォートノイズ(CN)のスペクトル(SCN)に基づいて不活性期間中に前記コンフォートノイズ(CN)を生成するステップと、
を含む方法。
【請求項19】
コンピュータ又はプロセッサ上で実行された時、請求項18に記載の方法を実行するためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号処理に関し、特にオーディオ信号に対するコンフォートノイズの付加に関するものである。
【背景技術】
【0002】
コンフォートノイズ生成器は、オーディオ信号、特にスピーチを含むオーディオ信号の不連続伝送(DTX)において、通常用いられる。このようなモードでは、オーディオ信号はまず、ボイス活性検出器(VAD)によって活性フレームと不活性フレームとに分類される。VADの結果に基づき、活性スピーチフレームだけが基準ビットレートで符号化され、伝送される。背景ノイズだけが存在するような長い休止期間の間中は、ビットレートが低減されるか又はゼロにされ、無音挿入記述子フレーム(SIDフレーム)を使用して背景ノイズが挿話的にかつパラメトリック的に符号化される。そのため、平均ビットレートは有意に低減される。
【0003】
ノイズは、不活性フレームの期間中にデコーダ側でコンフォートノイズ生成器(CNG)によって生成される。SIDフレームのサイズは、実際上きわめて限定されている。よって、背景ノイズを記述するパラメータの数はできるだけ少数に保たなければならない。この目的のため、ノイズ推定はスベクトル変換の出力において直接的には適用されない。その代わり、例えばバーク尺度に従って、帯域グループの中で入力パワースペクトルを平均化することにより、ノイズ推定は低いスペクトル分解能で適用される。この平均化は算術的又は幾何学的手段のいずれかによって達成され得る。残念ながら、SIDフレーム内で伝送されるパラメータの個数が制限されると、背景ノイズの微細なスペクトル構造を捕捉できなくなる。よって、ノイズの平滑なスペクトル包絡だけがCNGによって再生され得る。VADがCNGフレームをトリガーする際、再生されたコンフォートノイズの平滑なスペクトルと、実際の背景ノイズのスペクトルとの間の不一致は、活性フレーム(信号のノイジーなスピーチ部分の標準的な符号化と復号化とを含む)とCNGフレームとの間の遷移において非常に可聴になり得る。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、オーディオ信号処理の改善された概念を提供することである。より詳しくは、本発明の目的は、オーディオ信号に対するコンフォートノイズの付加についての改善された概念を提供することである。本発明の目的は、請求項1に記載のオーディオ復号器と、請求項17に記載のシステムと、請求項18に記載の方法と、請求項19に記載のコンピュータプログラムとによって達成される。
【課題を解決するための手段】
【0005】
1つの態様において、本発明は、ビットストリームを復号化して、ビットストリームからオーディオ出力信号を生成するオーディオ復号器を提供し、そのビットストリームは少なくとも1つの不活性期へと続く少なくとも1つの活性期を含み、そのビットストリームは、その中に背景ノイズのスペクトルを記述する少なくとも1つの符号化された無音挿入記述子フレームを有する。前記オーディオ復号器は、以下の構成を含む。
無音挿入記述子フレームを復号化して、背景ノイズのスペクトルを再構成するよう構成された無音挿入記述子復号器;
活性期間中にビットストリームからオーディオ出力信号を再構成するよう構成された復号化装置;
オーディオ出力信号のスペクトルを決定するよう構成されたスペクトル変換器;
スペクトル変換器によって提供されたオーディオ出力信号のスペクトルに基づいて、オーディオ出力信号のノイズの第1スペクトルを決定するよう構成されたノイズ推定装置であって、オーディオ出力信号のノイズの第1スペクトルは無音挿入記述子復号器によって提供された背景ノイズのスペクトルよりも高いスペクトル分解能を持つ、ノイズ推定装置;
オーディオ出力信号のノイズの第1スペクトルに基づいて、オーディオ出力信号のノイズの第2スペクトルを確定するよう構成された分解能変換器であって、オーディオ出力信号のノイズの第2スペクトルは無音挿入記述子復号器によって提供された背景ノイズのスペクトルと同じスペクトル分解能を持つ、分解能変換器;
無音挿入記述子復号器によって提供された背景ノイズのスペクトルと、分解能変換器によって提供されたオーディオ出力信号のノイズの第2スペクトルとに基づいて、コンフォートノイズのスペクトルのスケーリングファクタを計算するよう構成されたスケーリングファクタ演算装置と、前記スケーリングファクタに基づいてコンフォートノイズのスペクトルを計算するよう構成されたコンフォートノイズ・スペクトル生成器と、を含むコンフォートノイズ・スペクトル推定装置;
コンフォートノイズのスペクトルに基づいて不活性期間中にコンフォートノイズを生成するよう構成されたコンフォートノイズ発生器。
【0006】
ビットストリームは活性期と不活性期とを含み、活性期はスピーチや音楽などのオーディオ情報の所望の成分を含む期間であり、一方、不活性期はオーディオ情報の如何なる所望の成分を含まない期間である。不活性期は通常は休止中に発生し、そこでは音楽やスピーチなどの所望の成分は存在しない。したがって、不活性期は通常は背景ノイズだけを含む。符号化されたオーディオ信号を含むビットストリーム内の情報は、所謂フレーム内に埋め込まれ、これらフレームの各々は、ある時間を参照するオーディオ情報を含む。活性期間中、所望の信号に関するオーディオ情報を含む活性フレームは、ビットストリーム内で伝送されてもよい。これとは対照的に、不活性期間中、ノイズ情報を含む無音挿入記述子フレームは、活性期の平均ビットレートに比べて低い平均ビットレートでビットストリーム内で伝送されてもよい。
【0007】
無音挿入記述子復号器は、無音挿入記述子フレームを復号化して、背景ノイズのスペクトルを再構成するよう構成されている。しかしながら、背景ノイズのこのスペクトルでは、無音挿入記述子フレーム内で伝送されるパラメータの個数が制限されているため、背景ノイズの微細なスペクトル構造を捕捉することができない。
【0008】
本復号化装置は、オーディオ情報を含むデジタルデータストリームである、オーディオビットストリームを活性期間中に復号化できる装置またはコンピュータプログラムであってもよい。この復号化プロセスは、デジタル復号化済みオーディオ出力信号をもたらしてもよく、この信号はD/A変換器へ供給されてアナログオーディオ信号を生成してもよく、次に可聴信号を生成するためにラウドスピーカに供給されてもよい。
【0009】
スペクトル変換器は、無音挿入記述子復号器によって提供される背景ノイズのスペクトルよりも有意に高いスペクトル分解能を持つオーディオ出力信号のスペクトルを取得してもよい。
【0010】
したがって、ノイズ推定器は、スペクトル変換器によって提供されたオーディオ出力信号のスペクトルに基づいて、オーディオ出力信号のノイズの第1スペクトルを決定してもよく、ここでオーディオ出力信号のノイズの第1スペクトルは無音挿入記述子復号器によって提供される背景ノイズのスペクトルよりも高いスペクトル分解能を持つ。
【0011】
さらに、分解能変換器は、オーディオ出力信号のノイズの第1スペクトルに基づいて、オーディオ出力信号のノイズの第2スペクトルを確定してもよく、ここでオーディオ出力信号のノイズの第2スペクトルは無音挿入記述子復号器によって提供される背景ノイズのスペクトルと同じスペクトル分解能を持つ。
【0012】
無音挿入記述子復号器によって提供される背景ノイズのスペクトルと、分解能変換器によって提供されるオーディオ出力信号のノイズの第2スペクトルとが同じスペクトル分解能を有するので、スケーリングファクタ演算装置は、無音挿入記述子復号器によって提供される背景ノイズのスペクトルと、分解能変換器によって提供されるオーディオ出力信号のノイズの第2スペクトルとに基づいて、コンフォートノイズのスペクトルのスケーリングファクタを容易に計算することができる。
【0013】
コンフォートノイズ・スペクトル生成器は、前記スケーリングファクタと、前記ノイズ推定装置によって提供されたオーディオ出力信号のノイズの第1スペクトルとに基づいて、コンフォートノイズのスペクトルを確定してもよい。
【0014】
さらに、コンフォートノイズ発生器は、前記コンフォートノイズのスペクトルに基づいて、不活性期間中に前記コンフォートノイズを生成してもよい。
【0015】
復号器で取得されたノイズ推定は、背景ノイズのスペクトル構造についての情報を含み、この情報はSIDフレームに含まれた背景ノイズの平滑なスペクトル包絡についての情報に比べて高精度である。しかしながら、ノイズ推定は活性期間中に復号化されたオーディオ出力信号について実行されるので、これら推定は、不活性期間中、更新され得ない。これとは対照的に、SIDフレームは、不活性期間中、スペクトル包絡に関する新たな情報を供給する。本発明にかかる復号器は、情報のこれら2つの資源を結合する。スケーリングファクタは、復号器側でのノイズ推定に依存して活性期間中に更新されてもよく、SIDフレームに含まれたノイズ推定に依存して不活性期間中に更新されてもよい。スケーリングファクタの連続的な更新は、生成されたコンフォートノイズ特性の突発的な変化が生じないことを確実にする。
【0016】
SIDフレーム内に含まれた背景ノイズのスペクトルとオーディオ出力信号のノイズの第2スペクトルとが同じスペクトル分解能を有するので、スケーリングファクタの更新、及びコンフォートノイズの更新は、容易な方法で達成できる。なぜなら、SIDフレームに含まれた背景ノイズのスペクトルの各周波数帯域グループについて、正に1つの周波数帯域グループだけがオーディオ出力信号のノイズの第2スペクトルに存在しているからである。好ましい実施形態では、SIDフレームに含まれた背景ノイズのスペクトルの周波数帯域グループと、オーディオ出力信号のノイズの第2スペクトルの周波数帯域グループとは互いに対応している。
【0017】
さらに、SIDフレームに含まれた背景ノイズのスペクトルとオーディオ出力信号のノイズの第2スペクトルとは同じ周波数分解能を有するので、スケーリングファクタの更新は可聴アーチファクトを全く生じないか、又はごく僅かしか生じない。
【0018】
本発明の好ましい実施形態によれば、スペクトル変換器は高速フーリエ変換装置を含む。高速フーリエ変換(FFT)は離散フーリエ変換(DFT)とその逆とを計算するアルゴリズムであり、非常に低い演算労力しか必要としない。したがって、高速フーリエ変換装置は、オーディオ出力信号のスペクトルを容易な方法で計算できる。
【0019】
本発明の好ましい実施形態によれば、復号器におけるノイズ推定装置は、オーディオ出力信号のスペクトルを一般にかなり低いスペクトル分解能を有するオーディオ出力信号の変換済みスペクトルへと変換するよう構成された変換装置を含む。オーディオ出力信号の変換済みスペクトルを提供することによって、後続の演算ステップの複雑さを低減できる。
【0020】
本発明の好ましい実施形態によれば、ノイズ推定装置は、前記変換装置によって提供されたオーディオ出力信号の変換済みスペクトルに基づいて、オーディオ出力信号のノイズの第1スペクトルを決定するよう構成されたノイズ推定器を含む。オーディオ出力信号の変換済みスペクトルが復号器でのノイズ推定の基礎として用いられた場合には、ノイズ推定の品質を低下させずに演算労力を削減できる。
【0021】
本発明の好ましい実施形態によれば、スケーリングファクタ演算装置は次式に従ってスケーリングファクタを計算するよう構成されており、
ここで、
はコンフォートノイズの周波数帯域グループiについてのスケーリングファクタを示し、
はSIDフレームに含まれた背景ノイズのスペクトルの周波数帯域グループiのレベルを示し、
はオーディオ出力信号のノイズの第2スペクトルの周波数帯域グループiのレベルを示し、i=0,...,LLR−1であり、LLRはSIDフレームに含まれた背景ノイズのスペクトルの周波数帯域グループ及びオーディオ出力信号のノイズの第2スペクトルの周波数帯域グループの数である。これら特徴によって、スケーリングファクタは容易な方法で計算され得る。
【0022】
本発明の好ましい実施形態によれば、コンフォートノイズ・スペクトル生成器は、前記スケーリングファクタと、ノイズ推定装置によって提供されたオーディオ出力信号のノイズの第1スペクトルとに基づいて、コンフォートノイズのスペクトルを計算するよう構成されている。これら特徴によって、コンフォートノイズ・スペクトルは、オーディオ出力信号のノイズの第1スペクトルのスペクトル分解能を持つように計算されてもよく、そのスペクトル分解能はSIDフレームから取得されたスペクトル分解能より一般にずっと高い。
【0023】
本発明の好ましい実施形態によれば、コンフォートノイズ・スペクトル生成器は、次式に従ってコンフォートノイズのスペクトルを計算するよう構成されており、
ここで、
はコンフォートノイズのスペクトルの周波数帯域kのレベルを示し、
はSIDフレームに含まれた背景ノイズのスペクトルとオーディオ出力信号のノイズの第2スペクトルとの周波数帯域グループiのスケーリングファクタを示し、
はオーディオ出力信号のノイズの第1スペクトルの周波数帯域kのレベルを示し、k=bLR(i),...,bLR(i+1)−1であり、bLR(i)は前記周波数帯域グループの1つの第1周波数帯域であり、i=0,...,LLR−1であり、LLRはSIDフレームに含まれた背景ノイズのスペクトルの周波数帯域グループ及びオーディオ出力信号のノイズの第2スペクトルの周波数帯域グループの数である。これら特徴によって、コンフォートノイズのスペクトルは高い分解能で容易に計算され得る。
【0024】
本発明の好ましい実施形態によれば、分解能変換器は、前記オーディオ出力信号のノイズの第1スペクトルに基づいて前記オーディオ出力信号のノイズの第3スペクトルを確定するよう構成された第1変換器ステージを含み、オーディオ出力信号のノイズの第3スペクトルのスペクトル分解能はオーディオ出力信号のノイズの第1スペクトルのスペクトル分解能より高いか又は同じであり、前記分解能変換器はオーディオ出力信号のノイズの第2スペクトルを確定するよう構成された第2変換器ステージを含む。
【0025】
本発明の好ましい実施形態によれば、コンフォートノイズ・スペクトル生成器は、前記スケーリングファクタと前記分解能変換器の第1変換器ステージによって提供されたオーディオ出力信号のノイズの第3スペクトルとに基づいて、コンフォートノイズのスペクトルを計算するよう構成されている。これら特徴により、活性期間中のオーディオ出力信号のノイズの第1スペクトルよりも高いスペクトル分解能を持つコンフォートノイズ・スペクトルが不活性期間中に取得されてもよい。
【0026】
本発明の好ましい実施形態によれば、コンフォートノイズ・スペクトル生成器は、次式に従ってコンフォートノイズのスペクトルを計算するよう構成され、
ここで、
はコンフォートノイズのスペクトルの周波数帯域kのレベルを示し、
はSIDフレームに含まれた背景ノイズのスペクトルとオーディオ出力信号のノイズの第2スペクトルとの周波数帯域グループiのスケーリングファクタを示し、
はオーディオ出力信号のノイズの第3スペクトルの周波数帯域kのレベルを示し、k=bLR(i),...,bLR(i+1)−1であり、bLR(i)は周波数帯域グループの第1周波数帯域であり、i=0,...,LLR−1であり、LLRはSIDフレームに含まれた背景ノイズのスペクトルとオーディオ出力信号のノイズの第2スペクトルとの周波数帯域グループの数である。これら特徴によって、コンフォートノイズのスペクトルは高い分解能で容易に計算され得る。
【0027】
本発明の好ましい実施形態によれば、コンフォートノイズ発生器は、高速フーリエ変換ドメインにおいてコンフォートノイズの周波数帯域のレベルを調整する第1高速フーリエ変換器と、第1高速フーリエ変換器の出力に基づいてコンフォートノイズの少なくとも一部を生成する第2高速フーリエ変換器とを備える。これら特徴により、背景ノイズは容易な方法で生成され得る。
【0028】
本発明の好ましい実施形態によれば、復号化装置は活性期間中にオーディオ出力信号を生成するよう構成されたコア復号器を備える。これら特徴により、狭帯域(NB)及び広帯域(WB)のアプリケーションに好適な簡素な構造の復号器を実現できる。
【0029】
本発明の好ましい実施形態によれば、復号化装置は、オーディオ信号を生成するよう構成されたコア復号器と、コア復号器によって生成されたオーディオ信号に基づいてオーディオ出力信号を生成するよう構成された帯域幅拡張モジュールとを備える。これら特徴により、超広帯域(SWB)アプリケーションに好適な簡素な構造の復号器を実現できる。
【0030】
本発明の好ましい実施形態によれば、前記帯域幅拡張モジュールは、スペクトル帯域複製復号器、直交ミラーフィルタ分析器、及び/又は直交ミラーフィルタ合成器を備える。
【0031】
本発明の好ましい実施形態によれば、前記高速フーリエ変換器によって生成されたコンフォートノイズは前記帯域幅拡張モジュールへと供給される。この特徴により、高速フーリエ変換器によって生成されたコンフォートノイズはより広い帯域幅を持つコンフォートノイズへと変換されてもよい。
【0032】
本発明の好ましい実施形態によれば、コンフォートノイズ発生器は、直交ミラーフィルタドメインにおいてコンフォートノイズの周波数帯域のレベルを調整する直交ミラーフィルタ調整装置を備え、前記直交ミラーフィルタ調整装置の出力は帯域幅拡張モジュールへと供給される。これら特徴により、無音挿入記述子フレームによって伝送され、コア復号器の帯域幅を超えるノイズ周波数に関連したノイズ情報が、コンフォートノイズのさらなる改善のために用いられても良い。
【0033】
さらなる特徴において、本発明は復号器と符号器とを含むシステムに関係し、復号器は本発明に従って設計されたものである。
【0034】
他の態様において、本発明はオーディオビットストリームを復号化して、そこからオーディオ出力信号を生成する方法に関係しており、そのビットストリームは少なくとも1つの不活性期へと続く少なくとも1つの活性期を含み、そのビットストリームは、その中に背景ノイズのスペクトルを記述する少なくとも1つの符号化された無音挿入記述子フレームを有しており、前記方法は、以下のステップを含む。
無音挿入記述子フレームを復号化して、背景ノイズのスペクトルを再構成するステップ;
活性期間中にビットストリームからオーディオ出力信号を再構成するステップ;
オーディオ出力信号のスペクトルを決定するステップ;
前記オーディオ出力信号のスペクトルに基づいて、オーディオ出力信号のノイズの第1スペクトルを決定するステップであって、オーディオ出力信号のノイズの第1スペクトルは背景ノイズのスペクトルよりも高いスペクトル分解能を持つ、ステップ;
オーディオ出力信号のノイズの第1スペクトルに基づいて、オーディオ出力信号のノイズの第2スペクトルを確定するステップであって、オーディオ出力信号のノイズの第2スペクトルは背景ノイズのスペクトルと同じスペクトル分解能を持つ、ステップ;
背景ノイズのスペクトルと、オーディオ出力信号のノイズの第2スペクトルとに基づいて、コンフォートノイズのスペクトルのスケーリングファクタを計算するステップ;
コンフォートノイズのスペクトルに基づいて不活性期間中にコンフォートノイズを生成するステップ。
【0035】
さらなる態様において、本発明はコンピュータ又はプロセッサ上で実行されたとき、前記方法を実行するためのコンピュータプログラムに関係している。
【0036】
本発明の好ましい実施形態を、添付の図面を参照しながら以下に説明する。
【図面の簡単な説明】
【0037】
図1】本発明に係る復号器の第1実施例を示す。
図2】本発明に係る復号器の第2実施例を示す。
図3】本発明に係る復号器の第3実施例を示す。
図4】本発明のシステムに好適な符号器の第1実施例を示す。
図5】本発明のシステムに好適な符号器の第2実施例を示す。
【発明を実施するための形態】
【0038】
図1は、本発明に係る復号器1の第1実施例を示す。図1のオーディオ復号器1は、ビットストリームBSを復号化して、そこからオーディオ出力信号OSを生成するよう構成されたものであり、ビットストリームBSは少なくとも1つの不活性期へと続く少なくとも1つの活性期を含み、そのビットストリームBSは、その中に背景ノイズのスペクトルSBNを記述する少なくとも1つの符号化された無音挿入記述子フレームSIを有しており、オーディオ復号器1は、以下の構成を含む。
活性期間中にビットストリームBSからオーディオ出力信号OSを再構成するよう構成された復号化装置2;
無音挿入記述子フレームSIを復号化して、背景ノイズのスペクトルSBNを再構成するよう構成された無音挿入記述子復号器3;
オーディオ出力信号OSのスペクトルSASを決定するよう構成されたスペクトル変換器4;
スペクトル変換器4によって提供されたオーディオ出力信号OSのスペクトルSASに基づいて、オーディオ出力信号OSのノイズの第1スペクトルSN1を決定するよう構成されたノイズ推定装置5であって、オーディオ出力信号OSのノイズの第1スペクトルSN1は背景ノイズのスペクトルSBNよりも高いスペクトル分解能を持つ、ノイズ推定装置5;
オーディオ出力信号OSのノイズの第1スペクトルSN1に基づいて、オーディオ出力信号OSのノイズの第2スペクトルSN2を確定するよう構成された分解能変換器6であって、オーディオ出力信号OSのノイズの第2スペクトルSN2は背景ノイズのスペクトルSBNと同じスペクトル分解能を持つ、分解能変換器6;
無音挿入記述子復号器3によって提供された背景ノイズのスペクトルSBNと、分解能変換器6によって提供されたオーディオ出力信号OSのノイズの第2スペクトルSN2とに基づいて、コンフォートノイズCNのスペクトルSCNのスケーリングファクタSFを計算するよう構成されたスケーリングファクタ演算装置7aと、前記スケーリングファクタSFに基づいてコンフォートノイズCNのスペクトルSCNを計算するよう構成されたコンフォートノイズ・スペクトル生成器7bと、を含むコンフォートノイズ・スペクトル推定装置7;及び
コンフォートノイズCNのスペクトルSCNに基づいて不活性期間中にコンフォートノイズCNを生成するよう構成されたコンフォートノイズ発生器8。
【0039】
ビットストリームBSは活性期と不活性期とを含み、活性期とはスピーチ又は音楽などのオーディオ情報の所望の成分を含む期間のことであり、一方不活性期とはオーディオ情報の如何なる所望の成分をも含まない期間のことである。不活性期は通常、休止期間中に発生し、そこでは音楽やスピーチ等の所望の成分が存在しない。したがって、不活性期は通常、背景ノイズだけを含む。符号化済みオーディオ信号を含むビットストリームBS内の情報は、所謂フレームに埋め込まれ、これらフレームの夫々はある時間に関するオーディオ情報を含む。活性期間中、所望の信号に関するオーディオ情報を含む活性フレームは、ビットストリームBS内で伝送されてもよい。これとは対照的に、不活性期間中、ノイズ情報を含む無音挿入記述子フレームは、活性期の平均ビットレートに比べて低い平均ビットレートでビットストリーム内で伝送されてもよい。
【0040】
復号化装置2は、オーディオビットストリームBSを復号化できる装置又はコンピュータプログラムであってもよく、このビットストリームは活性期間中のオーディオ情報を含むデジタルデータストリームである。復号化プロセスはデジタル復号化済みオーディオ出力信号OSをもたらし、その出力信号はアナログオーディオ信号を生成するためにD/A変換器へ供給され、次にこのアナログオーディオ信号は可聴信号を生成するためにラウドスピーカへ供給されてもよい。
【0041】
無音挿入記述子復号器3は、背景ノイズのスペクトルSBNを再構成するために無音挿入記述子フレームSIを復号するよう構成されている。しかしながら、背景ノイズのこのスペクトルSBNでは、無音挿入記述子フレームSI内で伝送されるパラメータの限定された個数に起因して、背景ノイズの微細なスペクトル構造を捕捉することができない。
【0042】
スペクトル変換器4は、無音挿入記述子復号器3によって提供される背景ノイズのスペクトルSBNに比べて有意に高いスペクトル分解能を有するオーディオ出力信号OSのスペクトルSASを取得してもよい。
【0043】
従って、ノイズ推定器10は、スペクトル変換器4によって提供されたオーディオ出力信号OSのスペクトルSASに基づいてオーディオ出力信号OSのノイズの第1スペクトルSN1を決定してもよく、オーディオ出力信号OSのノイズの第1スペクトルSN1は背景ノイズSBNのスペクトルよりも高いスペクトル分解能を有する。
【0044】
さらに、分解能変換器6は、オーディオ出力信号OSのノイズの第1スペクトルSN1に基づいて、オーディオ出力信号OSのノイズの第2スペクトルSN2を確定してもよく、オーディオ出力信号OSのノイズの第2スペクトルSN2は背景ノイズのスペクトルSBNと同じスペクトル分解能を有する。
【0045】
背景ノイズのスペクトルSBNとオーディオ出力信号OSのノイズの第2スペクトルSN2とは同じスペクトル分解能を有するので、スケーリングファクタ演算装置7aは、無音挿入記述子復号器3によって提供された背景ノイズのスペクトルSBNと、分解能変換器6によって提供されたオーディオ出力信号OSのノイズの第2スペクトルSN2とに基づいて、コンフォートノイズCNのスペクトルSCNのスケーリングファクタSFを容易に計算することができる。
【0046】
コンフォートノイズ・スペクトル生成器7bは、スケーリングファクタSFに基づいてコンフォートノイズCNについてのスペクトルSCNを確定してもよい。
【0047】
さらに、コンフォートノイズ発生器8は、コンフォートノイズについてのスペクトルSCNに基づいて不活性期間中にコンフォートノイズCNを生成してもよい。
【0048】
復号器1で取得されたノイズ推定は、背景ノイズのスペクトル構造に関する情報を含み、SIDフレームSI内に含まれた背景ノイズのスペクトル構造に関する情報に比べてより高精度である。しかしながら、ノイズ推定は復号化済みオーディオ信号OSに対して実行されるので、これら推定は不活性期間中は適用され得ない。対照的に、SIDフレームは不活性期の間、一定間隔でスペクトル包絡についての新たな情報を供給する。本発明にかかる復号器1は、これら2つの情報源を結合する。スケーリングファクタSFは、活性期間中に復号器側でのノイズ推定に依存して更新されてもよく、不活性期間中にSIDフレームSI内に含まれたノイズ推定に依存して更新されてもよい。スケーリングファクタSFの連続的な更新により、生成されたコンフォートノイズCNの特性の突然の変化が起こらないように保証できる。
【0049】
SIDフレームSIに含まれた背景ノイズのスペクトルSBNとオーディオ出力信号OSのノイズの第2スペクトルSN2とは同じスペクトル分解能を有するので、スケーリングファクタSFの更新、つまりはコンフォートノイズCNの更新は容易な方法で実行され得る。なぜなら、SIDフレームSIに含まれた背景ノイズのスペクトルSBNの各周波数帯グループについて、オーディオ出力信号OSのノイズの第2スペクトルSN2内に必ず1つの周波数帯グループが存在するからである。好ましい実施形態においては、SIDフレームSIに含まれた背景ノイズのスペクトルの周波数帯グループと、オーディオ出力信号OSのノイズの第2スペクトルSN2の周波数帯グループとは、互いに対応している点に注目すべきである。
【0050】
さらに、SIDフレームSIに含まれた背景ノイズのスペクトルSBNとオーディオ出力信号OSのノイズの第2スペクトルSN2とは同じスペクトル分解能を有するので、スケーリングファクタSFの更新は全く又はごく僅かしか可聴アーチファクトを生成しない。
【0051】
本発明の望ましい実施形態によれば、スペクトル変換器4は、高速フーリエ変換装置を含む。高速フーリエ変換(FFT)は離散フーリエ変換(DFT)とその逆とを計算するアルゴリズムであり、非常に低い演算労力しか必要としない。したがって、高速フーリエ変換装置は、オーディオ出力信号OSのスペクトルSASを容易な方法で計算できる。
【0052】
本発明の望ましい実施形態によれば、ノイズ推定装置5はオーディオ出力信号OSのスペクトルSASをオーディオ出力信号OSの変換済みスペクトルCSAに変換するよう構成された変換装置9を含み、この変換済みスペクトルCSAはコア復号器17と同じスペクトル分解能を有する。一般的には、スペクトル変換器4によって取得されたオーディオ出力信号OSのスペクトルSASのスペクトル分解能は、コア復号器17のスペクトル分解能よりもずっと高い。オーディオ出力信号OSの変換済みスペクトルCSAを提供することによって、後続の演算ステップの複雑性を低減できる。
【0053】
本発明の望ましい実施形態によれば、ノイズ推定装置5は変換装置9によって提供されたオーディオ出力信号OSの変換済みスペクトルCSAに基づき、オーディオ出力信号OSのノイズの第1スペクトルSN1を決定するよう構成されたノイズ推定器10を含む。ノイズ推定の基礎として復号器においてオーディオ出力信号OSの変換済みスペクトルCSAが使用された場合、ノイズ推定の品質を低下させずに演算労力が低減され得る。
【0054】
本発明の好ましい実施形態によれば、スケーリングファクタ演算装置7aは次式に従ってスケーリングファクタSFを計算するよう構成されており、
ここで、
はコンフォートノイズCNの周波数帯域グループiについてのスケーリングファクタSFを示し、
は背景ノイズのスペクトルSBNの周波数帯域グループiのレベルを示し、
はオーディオ出力信号のノイズの第2スペクトルSN2の周波数帯域グループiのレベルを示し、i=0,...,LLR−1であり、LLRは背景ノイズのスペクトルSBN及びオーディオ出力信号OSのノイズの第2スペクトルSN2の周波数帯域グループの数である。これら特徴によって、スケーリングファクタSFは容易な方法で計算され得る。
【0055】
本発明の好ましい実施形態によれば、コンフォートノイズ・スペクトル生成器7bは、前記スケーリングファクタSFとノイズ推定装置5によって提供されたオーディオ出力信号OSのノイズの第1スペクトルSN1とに基づいて、コンフォートノイズCNのスペクトルSCNを計算するよう構成されている。これら特徴により、コンフォートノイズ・スペクトルSCNは、オーディオ出力信号OSのノイズの第1スペクトルSN1と同じスペクトル分解能を持つように計算され得る。
【0056】
本発明の好ましい実施形態によれば、コンフォートノイズ・スペクトル生成器7bは、次式に従ってコンフォートノイズCNのスペクトルSCNを計算するよう構成されており、
ここで、
はコンフォートノイズCNのスペクトルSCNの周波数帯域kのレベルを示し、
は背景ノイズのスペクトルSBNとオーディオ出力信号OSのノイズの第2スペクトルSN2との周波数帯域グループiのスケーリングファクタSFを示し、
はオーディオ出力信号OSのノイズの第1スペクトルSN1の周波数帯域kのレベルを示し、k=bLR(i),...,bLR(i+1)−1であり、bLR(i)は前記周波数帯域グループの1つの第1周波数帯域であり、i=0,...,LLR−1であり、LLRは背景ノイズのスペクトルSBNとオーディオ出力信号のノイズの第2スペクトルSN2との周波数帯域グループの数である。これら特徴によって、コンフォートノイズCNのスペクトルSCNは高い分解能で容易に計算され得る。
【0057】
本発明の好ましい実施形態によれば、分解能変換器6は、オーディオ出力信号OSのノイズの第1スペクトルSN1に基づいてオーディオ出力信号OSのノイズの第3スペクトルSN3を確定するよう構成された第1変換器ステージ11を含み、オーディオ出力信号OSのノイズの第3スペクトルSN3のスペクトル分解能は、オーディオ出力信号OSのノイズの第1スペクトルSN1のスペクトル分解能と同等又はそれより高く、分解能変換器6はオーディオ出力信号OSのノイズの第2スペクトルSN2を確定するよう構成された第2変換器ステージ12を含む。
【0058】
本発明の好ましい実施形態によれば、コンフォートノイズ・スペクトル生成器7bは、スケーリングファクタSFと分解能変換器6の第1変換器ステージ11によって提供されたオーディオ出力信号OSのノイズの第3スペクトルSN3とに基づいて、コンフォートノイズCNのスペクトルSCNを計算するよう構成されている。これら特徴により、無音挿入記述子復号器3によって提供された背景ノイズスペクトルSBNよりも高いスペクトル分解能を持つ、コンフォートノイズ・スペクトルSCNが取得され得る。
【0059】
本発明の好ましい実施形態によれば、コンフォートノイズ・スペクトル生成器7bは、次式に従ってコンフォートノイズのスペクトルSCNを計算するよう構成され、
ここで、
はコンフォートノイズCNのスペクトルSCNの周波数帯域kのレベルを示し、
は背景ノイズのスペクトルSCNとオーディオ出力信号OSのノイズの第2スペクトルSN2との周波数帯域グループiのスケーリングファクタSFを示し、
はオーディオ出力信号OSのノイズの第3スペクトルSN3の周波数帯域kのレベルを示し、k=bLR(i),...,bLR(i+1)−1であり、bLR(i)は周波数帯域グループの第1周波数帯域であり、i=0,...,LLR−1であり、LLRは背景ノイズのスペクトルSBNとオーディオ出力信号OSのノイズの第2スペクトルSN2との周波数帯域グループの数である。これら特徴によって、コンフォートノイズのスペクトルSCNは高い分解能で容易に計算され得る。
【0060】
本発明の好ましい実施形態によれば、コンフォートノイズ発生器8は、高速フーリエ変換ドメインにおいてコンフォートノイズCNの周波数帯域のレベルを調整するよう構成された第1高速フーリエ変換器15と、第1高速フーリエ変換器15の出力に基づいてコンフォートノイズCNの少なくとも一部を生成する第2高速フーリエ変換器16とを備える。これら特徴により、背景ノイズは容易な方法で生成され得る。
【0061】
本発明の好ましい実施形態によれば、復号化装置2は活性期間中にオーディオ出力信号OSを生成するよう構成されたコア復号器17を備える。これら特徴により、狭帯域(NB)及び広帯域(WB)のアプリケーションに好適な簡素な構造の復号器を実現できる。
【0062】
本発明の好ましい実施形態によれば、オーディオ復号器1は、活性期と不活性期とを区別するよう構成されたヘッダ読み取り装置18を備える。ヘッダ読み取り装置18はさらに、活性期間中ビットストリームBSをコア復号器17へ供給し、かつ不活性期間中、無音挿入記述子フレームを無音挿入記述子復号器3へと供給するように、スイッチ装置19を切り替えるよう構成されている。追加的に、コンフォートノイズCNの生成をトリガーできるように、不活性期フラグがコンフォートノイズ発生器8へと伝送される。
【0063】
図2は、本発明にかかるオーディオ復号器1の第2実施形態を示す。図2に示す復号器1は、図1の復号器1に基づいている。以下では。相違点についてのみ説明する。本発明の第2実施形態のオーディオ復号器1は、コア復号器17の出力信号が供給される帯域幅拡張モジュール20を備えている。帯域幅拡張モジュール20は、オーディオ出力信号OSに基づいて帯域幅拡張された出力信号EOSを生成するよう構成されている。これら特徴により、超広帯域(SWB)アプリケーションに好適な簡素な構造の復号器1を達成できる。
【0064】
本発明の好ましい実施形態によれば、高速フーリエ変換器16によって出力されたコンフォートノイズCNは帯域幅拡張モジュール20へと供給される。この特徴により、高速フーリエ変換器によって出力されたコンフォートノイズCNはより広い帯域幅を持つコンフォートノイズCNへと変換され得る。
【0065】
本発明の好ましい実施形態によれば、コンフォートノイズ発生器8は、直交ミラーフィルタドメインにおいてコンフォートノイズCNの周波数帯域のレベルを調整するよう構成された直交ミラーフィルタ調整器24を備えており、直交ミラーフィルタ調整器24の出力は追加的なコンフォートノイズCN1として帯域幅拡張モジュール20へと供給される。無音挿入記述子フレームSI内に含まれたQMFレベルは、直交ミラーフィルタ調整器24へと供給されてもよい。これら特徴により、無音挿入記述子フレームSIによって伝送され、かつコア復号器17の帯域幅を超えるノイズ周波数に関連したノイズ情報は、コンフォートノイズCNのさらなる改善のために用いられても良い。
【0066】
本発明の好ましい実施形態によれば、帯域幅拡張モジュール20は、スペクトル帯域複製復号器21と、直交ミラーフィルタ分析器22、及び/又は直交ミラーフィルタ合成器23とを備える。
【0067】
図3は本発明にかかる復号器1の第3実施形態を示す。図3の復号器1は図2の復号器1に基づいている。以下では。相違点についてのみ説明する。
【0068】
本発明の好ましい実施形態によれば、復号化装置2は、オーディオ信号ASを生成するコア復号器17と、コア復号器17によって提供されたオーディオ信号ASに基づいてオーディオ出力信号OSを生成する帯域幅拡張モジュール20とを備えている。これら特徴により、超広帯域(SWB)アプリケーションに好適な簡素な構造の復号器を達成できる。
【0069】
原則として、図3の帯域幅拡張モジュール20は図2の帯域幅拡張モジュール20と同じである。しかしながら、本発明に係るオーディオ復号器1の第3実施形態においては、帯域幅拡張モジュール20はオーディオ出力信号OSを生成するために使用され、このオーディオ出力信号OSはスペクトル変換器4へ供給される。これら特徴により、全帯域幅がコンフォートノイズを生成するために使用され得る。
【0070】
本発明に係るオーディオ復号器の前記3つの実施形態に関して、次の点が追加されてもよい。すなわち、復号器側では、SWBモードについてのQMFドメインだけでなくFFTドメインにおいても個別のスペクトル帯域をそれぞれ励起するためにランダム発生器8が適用されてもよい。このランダムシーケンスの振幅は、生成されたコンフォートノイズCNのスペクトルがビットストリーム内に存在する実際の背景ノイズのスペクトルに似ているように、各帯域で個別に計算されるべきである。
【0071】
復号器1で取得された高分解能のノイズ推定値は、背景ノイズの微細なスペクトル構造についての情報を捕捉する。しかしながら、ノイズ推定は復号化済み信号OSに対して実行されるので、これら推定値は不活性期間中には適応され得ない。対照的に、SIDフレームSIは不活性期間中、一定間隔でスペクトル包絡についての新たな情報を供給する。本発明にかかる復号器1は、活性期間中に存在する背景ノイズから捕捉された微細なスペクトル構造を再構成しようとし、他方では、不活性部分の間はSID情報の助けをかりてコンフォートノイズCNのスペクトル包絡だけを更新しようとする目的で、これら2つの情報源を結合する。
【0072】
この目的を達成するため、図1図3に示すように、追加的なノイズ推定器5が復号器1内で使用される。それ故、ノイズ推定は伝送システムの両側で実行されるが、復号器1側でのスペクトル分解能は符号器100側より高い。復号器1で高いスペクトル分解能を取得する一方法は、符号器100においてと同様に平均化によってそれらスペクトルをグループ化する方法に代えて、各スペクトル帯域を個別に単純に考慮すること(フル分解能)である。代替的に、スペクトル分解能と演算複雑性との妥協点は、復号器1でもスペクトルグループ化を実行し、かつ符号器100に比べてスペクトルグループの数を増加させることで、取得し得る。それにより、復号器において周波数軸のより微細な量子化を達成できる。
【0073】
復号器側のノイズ推定は、復号化済み信号OSに対して実行される点に注意すべきである。DTXベースのシステムでは、ノイズ推定は活性期間中のみ、つまり必然的にクリーンなスピーチ又はノイジーなスピーチのコンテンツ(ノイズだけとは対照的に)に対して実行されることになる。
【0074】
復号器で計算された高分解能(HR)のノイズパワースペクトル
は、フル分解能(FR)のパワースペクトル
を提供するために(例えば線形補間を使用して)第1補間されてもよい。次に、フル分解能(FR)パワースペクトルは、符号器で実行されたようにスペクトルグループ化(即ち平均化)によって低分解能(LR)のパワースペクトル
に変換されてもよい。よって、パワースペクトル
は、SIDフレームSIから得られたノイズレベル
と同じスペクトル分解能を示す。低分解能のノイズスペクトル
を比較して、フル分解能のノイズスペクトル
は最終的にスケールされ、次式のようにフル分解能のパワースペクトルを取得し得る。
ここで、LLRは符号器における低分解能のノイズ推定によって使用されたスペクトルグループの数であり、bLR(i)はi番目(i=0,...,LLR−1)の第1スペクトル帯域を示す。フル分解能のノイズパワースペクトル
は、個別のFFT又はQMF帯域(後者はSWBモードについてのみ)のそれぞれで生成されたコンフォートノイズのレベルを正確に調整するために最終的に使用され得る。
【0075】
図1及び図2において、上述の機構はFFT係数だけに適用される。それ故、SWBシステムについて、上述の機構は、コア復号器によって無視された高周波数コンテンツを捕捉するQMF帯域には適用されない。これら周波数は知覚的には関連性が低いので、これら周波数についてノイズの円滑なスペクトル包絡を再構成するだけで、通常は十分である。
【0076】
SWBモードにおけるコア帯域幅を超える周波数について、QMFドメインにおいて適用されたコンフォートノイズのレベルを調整するために、このシステムはSIDフレームによって伝送された情報だけに依存する。そのため、VADがCNGフレームをトリガーした時、SBRモジュールはバイパスされる。WBモードでは、ブラインド帯域幅拡張が所望の帯域幅を回復するために適用されるので、CNGモジュールはQMF帯域を考慮しない。
【0077】
それにも拘わらず、本発明の方式は、復号器側のノイズ推定器を、コア復号器の出力において適用する代わりに、帯域幅拡張モジュールの出力において適用することによって、全帯域幅をカバーするように容易に拡張され得る。図3に示すように、QMFフィルタバンクによって捕捉された高周波数も同様に考慮されるべきであるから、この拡張は演算複雑性における増大をもたらす。
【0078】
図4は本発明システムに好適な符号器100の第1実施形態を示す。入力オーディオ信号ISは、時間ドメイン信号ISを周波数ドメインへ変換するよう構成された第1スペクトル変換器25へ供給される。第1スペクトル変換器25は直交ミラーフィルタ分析器であってもよい。第1スペクトル変換器25の出力は、その第1スペクトル変換器25の出力をあるドメインへと変換するよう構成された第2スペクトル変換器26へ供給される。第2スペクトル変換器26は直交ミラーフィルタ合成器であってもよい。第2スペクトル変換器26の出力は、高速フーリエ変換装置であってもよい第3スペクトル変換器27へ供給される。第3スペクトル変換器27の出力は、変換装置29とノイズ推定器30とからなるノイズ推定装置28へと供給される。
【0079】
さらに、符号器100は信号活性度検出器31を含み、この信号活性度検出器31は、活性期間中に入力信号がコア符号器33へ供給され、不活性期間中にSIDフレーム内でノイズ推定装置28によって生成されたノイズ推定が無音挿入記述子符号器35へと供給されるように、スイッチ装置32を切り替えるべく構成されている。さらに、不活性期では、不活性フラグがコア更新器34へ供給される。
【0080】
符号器100はビットストリーム生成器36をさらに含み、このビットストリーム生成器36は、無音挿入記述子符号器35から無音挿入記述子フレームSIを受け取ると共に、コア符号器33から符号化済み入力信号ISEを受け取り、それら信号からビットストリームBSを生成する。
【0081】
図5は、第1実施形態の符号器100に基づいた本発明システムに好適な符号器100の第2実施形態を示す。第2実施形態の追加的特徴は、以下に簡単に説明する。第1変換器25の出力はノイズ推定装置28へも供給される。さらに、活性期間中、スペクトル帯域複製符号器37は入力オーディオ信号IS内の高い周波数についての情報を含む強化信号ESを生成する。この強化信号ESはまた、この強化信号ESをビットストリームBSへと埋め込むために、ビットストリーム生成器36へと移送される。
【0082】
図4及び図5に示された符号器に関して、以下の情報が追加されてもよい。すなわち、VADがCNG相をトリガーした場合には、入力背景ノイズについての情報を含むSIDフレームが伝送される。これにより、スペクトル−時間特性の観点から実際の背景ノイズに似ている人工的ノイズを、復号器が生成できるようになる。この目的のため、図4及び図5に示されるように、入力信号IS内に存在する背景ノイズのスペクトル形状を追跡するため、ノイズ推定器28が符号器側に適用される。
【0083】
原則として、ノイズ推定は、十分なスペクトル分解能を提供する限り、時間ドメイン信号を複数のスペクトル帯域へと分解する如何なるスペクトル−時間分析ツールにも適用可能である。本発明のシステムでは、入力信号をコアサンプリングレートへとダウンサンプルするリサンプリングツールとして、QMFフィルタバンクが使用される。このQMFフィルタバンクは、ダウンサンプルされたコア信号へと適用されるFFTに比べて、有意に低いスペクトル分解能を示す。
【0084】
コア符号器33は既に全NB帯域幅をカバーしており、WBモードがブラインド帯域拡張に依存しているので、コア帯域幅を超える周波数は関係がなく、かつNBシステム及びWBシステムについては単に廃棄することができる。対照的に、SWBモードにおいては、これら周波数は高域のQMF帯域によって捕捉され、明確に考慮される必要がある。
【0085】
SIDフレームSIのサイズは、実際上非常に制限される。したがって、背景ノイズを記述するパラメータの数はできるだけ少数に維持しなければならない。この目的で、ノイズ推定はスペクトル変換の出力に直接的には適用されない。それに代えて、帯域グループの中で入力パワースペクトルを平均化することによって、例えばバークスケールによって、より低いスペクトル分解能で適用される。この平均化は、算術的又は幾何学的手段のいずれかによって達成され得る。SWBの場合には、スペクトルグループ化はFFTドメインとQMFドメインとで別々に実行される一方、NBモード及びWBモードはFFTドメインにのみ依存する。
【0086】
スペクトル分解能を低減することは、演算上の複雑さの点でもまた有利であることに注意すべきである。なぜなら、各スペクトル帯域を個別に考慮するのに代えて、ノイズ推定がごく少数のスペクトルグループに適用されるだけでよいからである。
【0087】
推定されたノイズレベル(各スペクトルグループについて1つ)は、ベクトル量子化技術を使用して、合同的にSIDフレームに符号化され得る。NB及びWBモードでは、FFTドメインだけが活用される。対照的に、SWBモードでは、SIDフレームの符号化は、ベクトル量子化を使用しながらFFT及びQMFドメインの両方について合同的に、つまり両方のドメインをカバーする単一のコードブックを用いて実行され得る。
【0088】
これまで装置を説明する文脈で幾つかの態様を示してきたが、これらの態様は対応する方法の説明でもあることは明らかであり、そのブロック又は装置が方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップを説明する文脈で示した態様もまた、対応する装置の対応するブロックもしくは項目又は特徴を表している。方法ステップの幾つか又は全ては、例えばマイクロプロセッサ、プログラム可能なコンピュータ、又は電子回路等のハードウエア装置により(を使用して)実行されても良い。幾つかの実施形態においては、最も重要な方法ステップの内の1つ又は複数のステップはそのような装置によって実行されても良い。
【0089】
所定の構成要件にも依るが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働可能な)、デジタル記憶媒体、例えばフレキシブルディスク,DVD,ブルーレイ,CD,ROM,PROM,EPROM,EEPROM,フラッシュメモリなどの非一時的記憶媒体を使用して実行することができる。従って、そのデジタル記憶媒体はコンピュータ読み取り可能であっても良い。
【0090】
本発明に従う幾つかの実施形態は、上述した方法の1つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有するデータキャリアを含む。
【0091】
一般的に、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として構成することができ、このプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の一つを実行するよう作動する。そのプログラムコードは例えば機械読み取り可能なキャリアに記憶されていても良い。
【0092】
本発明の他の実施形態は、上述した方法の1つを実行するための、機械読み取り可能なキャリアに記憶されたコンピュータプログラムを含む。
【0093】
換言すれば、本発明の方法のある実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0094】
本発明の他の実施形態は、上述した方法の1つを実行するために記録されたコンピュータプログラムを含む、データキャリア(又はデジタル記憶媒体又はコンピュータ読み取り可能な媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は、典型的には有形であり、及び/又は非一時的である。
【0095】
本発明の他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号列である。そのデータストリーム又は信号列は、例えばインターネットを介するデータ通信接続を介して伝送されるよう構成されても良い。
【0096】
他の実施形態は、上述した方法の1つを実行するように構成又は適応された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。
【0097】
他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
【0098】
本発明によるさらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを受信機へと(例えば電子的または光学的に)転送するよう構成された装置またはシステムを含む。受信機は、例えばコンピュータ、携帯デバイス、メモリデバイスなどであってもよい。装置またはシステムは、例えばコンピュータプログラムを受信機へと転送するためのファイルサーバを備えてもよい。
【0099】
幾つかの実施形態においては、(例えば書換え可能ゲートアレイのような)プログラム可能な論理デバイスが、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態では、書換え可能ゲートアレイは、上述した方法の1つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には任意のハードウエア装置によって実行される。
【0100】
上述した実施形態は、本発明の原理を単に例示的に示したにすぎない。本明細書に記載した構成及び詳細について修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではなく、添付した特許請求の範囲によってのみ限定されるべきである。
【符号の説明】
【0101】
1 オーディオ復号器
2 復号化装置
3 無音挿入記述子復号器
4 スペクトル変換器
5 ノイズ推定装置
6 分解能変換器
7 コンフォートノイズ・スペクトル推定装置
7a スケーリングファクタ演算装置
7b コンフォートノイズ・スペクトル生成器
8 コンフォートノイズ発生器
9 変換装置
10 ノイズ推定器
11 第1変換器ステージ
12 第2変換器ステージ
15 第1高速フーリエ変換器
16 第2高速フーリエ変換器
17 コア復号器
18 ヘッダ読み取り装置
19 スイッチ装置
20 帯域幅拡張モジュール
21 スペクトル帯域複製復号器
22 直交ミラーフィルタ分析器
23 直交ミラーフィルタ合成器
24 直交ミラーフィルタ調整装置
25 第1スペクトル変換器
26 第2スペクトル変換器
27 第3スペクトル変換器
28 ノイズ推定変換器
29 変換装置
30 ノイズ推定器
31 信号活性度検出器
32 スイッチ装置
33 コア符号器
34 コア更新器
35 無音挿入記述子符号器
36 ビットストリーム生成器
37 スペクトル帯域複製符号器
100 符号器
BS ビットストリーム
OS オーディオ出力信号
SI 無音挿入記述子フレーム
SBN 背景ノイズのスペクトル
SAS オーディオ信号のスペクトル
SN1 オーディオ信号のノイズの第1スペクトル
SN2 オーディオ信号のノイズの第2スペクトル
SF スケーリングファクタ
SCN コンフォートノイズのスペクトル
CN コンフォートノイズ
AS 出力信号
CSA オーディオ信号の変換済みスペクトル
SN3 オーディオ信号のノイズの第3スペクトル
EOS 帯域幅拡張された出力信号
IS 入力オーディオ信号
ISE 符号化済み入力信号
ES 強化信号
図1
図2
図3
図4
図5