(58)【調査した分野】(Int.Cl.,DB名)
第1の入力チャンネルおよび第2の入力チャンネルを有するステレオ入力信号から第1のサイドチャンネルおよび第2のサイドチャンネルを有するステレオサイド信号を生成するための装置であって、
修正情報を生成するための修正情報ジェネレータ(110;610;710;810;910;1310)であって、前記修正情報ジェネレータ(110;610;710;810;910;1310)は、前記ステレオ入力信号のモノラルミッド信号およびモノラルサイド信号に基づいて第1のスペクトル重み付け係数を生成することによって前記修正情報を生成するためのスペクトル重みジェネレータ(116;615;715;815;915)を含む、修正情報ジェネレータ、および
前記第1のサイドチャンネルを得るために前記修正情報に基づいて前記第1の入力チャンネルを操作するように構成されさらに前記第2のサイドチャンネルを得るために前記修正情報に基づいて前記第2の入力チャンネルを操作するように構成される信号操作器(120;620;720;820;1320)を含む、装置。
前記信号操作器(120;620;720;820;1320)は、前記第2のサイドチャンネルを得るために修正情報として前記第1のスペクトル重み付け係数に基づいて前記第2の入力チャンネルを操作するように構成される、請求項1に記載の装置。
前記修正情報ジェネレータ(110;610;710;810;910;1310)は、前記ステレオ入力信号の前記モノラルミッド信号および前記モノラルサイド信号に基づいて前記第1のスペクトル重み付け係数を生成することによって前記修正情報を生成するための前記スペクトル重みジェネレータ(116;615;715;815;915)を含み、
前記スペクトル重みジェネレータ(116;615;715;815;915)は、前記ステレオ入力信号の前記モノラルミッド信号および前記モノラルサイド信号に基づいて第2のスペクトル重み付け係数を生成するように構成され、
さらに、前記信号操作器(120;620;720;820;1320)は、前記第2のサイドチャンネルを得るために修正情報として前記第2のスペクトル重み付け係数に基づいて前記第2の入力チャンネルを操作するように構成される、請求項1または請求項2に記載の装置。
前記修正情報ジェネレータ(110;610;710;810;910;1310)は、前記ステレオ入力信号の前記モノラルミッド信号および前記モノラルサイド信号に基づいて前記第1のスペクトル重み付け係数を生成することによって前記修正情報を生成するための前記スペクトル重みジェネレータ(116;615;715;815;915)を含み、
前記修正情報ジェネレータ(110;610;710;810;910;1310)は、大きさ決定器(912)をさらに含み、
前記大きさ決定器(912)は、スペクトル領域において表される前記モノラルミッド信号を受信するように構成され、さらに、前記大きさ決定器は、スペクトル領域において表される前記モノラルサイド信号を受信するように構成され、
前記大きさ決定器(912)は、大きさサイド値として前記モノラルサイド信号の大きさ値を決定するように構成され、さらに、前記大きさ決定器(912)は、大きさミッド値として前記モノラルミッド信号の大きさ値を決定するように構成され、
前記大きさ決定器(912)は、前記大きさサイド値および前記大きさミッド値を前記スペクトル重みジェネレータ(116;615;715;815;915)に送るように構成され、さらに
前記スペクトル重みジェネレータ(116;615;715;815;915)は、第1の数の第2の数に対する比率に基づいて前記第1のスペクトル重み付け係数を生成するように構成され、前記第1の数は、前記大きさサイド値に依存し、さらに、前記第2の数は、前記大きさミッド値および前記大きさサイド値に依存する、請求項1ないし請求項3のうちの1つに記載の装置。
前記修正情報ジェネレータ(110;610;710;810;910;1310)は、前記ステレオ入力信号の前記モノラルミッド信号または前記ステレオ入力信号の前記モノラルサイド信号に基づいて前記修正情報を生成するように構成され、前記モノラルミッド信号は、前記第1および前記2の入力チャンネルを加算することから生じる和信号に依存し、さらに、前記モノラルサイド信号は、前記第1の入力チャンネルから前記第2の入力チャンネルを減算することから生じる差分信号に依存する、請求項2ないし請求項5のうちの1つに記載の装置。
前記装置は、チャンネルジェネレータ(561、562)をさらに含み、前記チャンネルジェネレータは、前記第1および第2の入力チャンネルに基づいて前記モノラルミッド信号または前記モノラルサイド信号を生成するように構成される、請求項2ないし請求項6のうちの1つに記載の装置。
第1の入力チャンネルおよび第2の入力チャンネルを有するステレオ入力信号から第1のミッドチャンネルおよび第2のミッドチャンネルを有するステレオミッド信号を生成するための装置であって、
修正情報を生成するための修正情報ジェネレータ(1010)であって、前記修正情報ジェネレータ(1010)は、前記ステレオ入力信号のモノラルミッド信号およびモノラルサイド信号に基づいて第1のスペクトル重み付け係数を生成することによって前記修正情報を生成するためのスペクトル重みジェネレータを含む、修正情報ジェネレータ、および
前記第1のミッドチャンネルを得るために前記修正情報に基づいて前記第1の入力チャンネルを操作するように構成されさらに前記第2のミッドチャンネルを得るために前記修正情報に基づいて前記第2の入力チャンネルを操作するように構成される信号操作器(1020)を含む、装置。
第1の入力チャンネルおよび第2の入力チャンネルを有するステレオ入力信号から第1のサイドチャンネルおよび第2のサイドチャンネルを有するステレオサイド信号を生成するための方法であって、
前記ステレオ入力信号のモノラルミッド信号およびモノラルサイド信号に基づいて第1のスペクトル重み付け係数を生成することによって修正情報を生成するステップ、
前記第1のサイドチャンネルを得るために前記修正情報に基づいて前記第1の入力チャンネルを操作するステップ、および
前記第2のサイドチャンネルを得るために前記修正情報に基づいて前記第2の入力チャンネルを操作するステップを含む、方法。
第1の入力チャンネルおよび第2の入力チャンネルを有するステレオ入力信号から第1のミッドチャンネルおよび第2のミッドチャンネルを有するステレオミッド信号を生成するための方法であって、
前記ステレオ入力信号のモノラルミッド信号およびモノラルサイド信号に基づいて第1のスペクトル重み付け係数を生成することによって修正情報を生成するステップ、
前記第1のミッドチャンネルを得るために前記修正情報に基づいて前記第1の入力チャンネルを操作するステップ、および
前記第2のミッドチャンネルを得るために前記修正情報に基づいて前記第2の入力チャンネルを操作するステップを含む、方法。
【発明を実施するための形態】
【0038】
本発明の好適な実施形態を記載する前に、特にMS処理において、関連した概念が記載され、スペクトル減算およびスペクトル重み付けの基本が説明される。
【0039】
最初に、ミッドサイド処理が、さらに詳細に記載される。ステレオサイドおよびミッド信号が計算される方法を説明するために、従来のMS処理の基本が簡単に見直される。2チャンネルステレオ信号x(t)は、それぞれ、時間インデックスtを有する左右チャンネルのための2つの信号x
l(t)およびx
r(t)によって表すことができる。左右という用語は、最終的には、これらの信号がそれぞれ(ラウドスピーカまたはヘッドホンを用いて)左右の耳に伝えられ、または、それぞれオーディオ再生システムにおいて左右のチャンネルによって再生されることを示す。
【0042】
下付き文字1は、これらの信号がモノラルであることを示すために用いられる。そのようなMS信号は、さまざまなアプリケーションのために有利であり、サイドおよびミッド信号の両方は、別々に、処理され、符号化されまたは伝送される。そのようなアプリケーションは、録音、人工的なステレオイメージエンハンスメント、仮想ラウドスピーカ作製のためのオーディオ符号化、ラウドスピーカを通してのバイノーラル再生および4チャンネル作製である。
【0044】
図18において、MS分解が示される。
【0045】
両方の表現は、同じ情報を含む。式(5)および(6)における正規化重み0.5は任意であり、さらに、他の重みが可能であるが、ここに示される重みは、式(5)〜(8)を適用すると、入力信号と同一である信号を生じることを保証することに留意されたい。他の重みを用いると、同様のまたはスケールされた信号を生じることができる。
【0046】
信号モデルと式(3)および(4)とから、信号s
1(t)は、センターを外れてパンされる信号成分(それらのいくつかが逆位相を有する)だけを含み、さらに、モノラル信号であることになる。ミッド信号m
1(t)は、s
1(t)におけるもの以外のすべての信号を含む。Michael Gerzonの言葉で記載すると、「Mは、ステレオステージの中央に関する情報を含む信号であるが、Sは、サイドに関する情報だけを含む」。両方とも、モノラル信号である。振幅パンされたダイレクトサウンドは、ステレオパノラマにおいてそれらの位置に応じてサイド信号において減衰され、反響および他のアンビエント信号のような無相関の信号成分は、(0相関のために)3dBだけミッド信号において減衰される。これらの減衰は、左右チャンネルにおいてサイド成分間の位相キャンセルによって生じる。
【0047】
以下において、スペクトル減算およびスペクトル重み付けが、さらに詳細に説明される。
【0048】
スペクトル減算は、スピーチエンハンスメントおよびノイズリダクションのためのよく知られた方法である。それは、スピーチ通信において付加ノイズの影響を低減するためにBollによって(おそらく最初に)提案されている[2]。処理は、周波数領域において実行され、入力信号の連続した(おそらく重なる)部分の短いフレームのスペクトルが処理される。
【0049】
基本的な原理は、入力信号の大きさスペクトルから干渉するノイズ信号の大きさスペクトルの推定を減算することであり、それは、所望のスピーチ信号および干渉するノイズ信号の混合であるとみなされる。
【0052】
重みは、それらが高いSN比(SNR)のための大きな大きさおよび小さいSNRのための低い値を有するように、入力信号表現X(f,k)から計算される。重みG(f,k)を計算するために、典型的に時間および周波数に依存するSNRの推定またはN(f,k)若しくはS(f,k)の推定が、必要とされる。スピーチ処理アプリケーションにおいて、ノイズの推定は、非スピーチアクティブの間[2、5]、または最小の統計を用いて[6]、すなわちそれぞれのサブバンドにおいて極小値の追跡に基づいて、またはノイズソースに近い第2のマイクロホンを用いることによって、計算される。
【0053】
重み付け演算Y(f,k)の結果は、出力信号の周波数領域表現である。出力時間信号y(t)は、周波数領域変換の逆処理、例えば逆STFT(Invers STFT)を用いて計算される。
【0056】
スペクトル重み付けを用いるスペクトル減算が、これから説明される。
【0060】
式(15)は、上述のノイズ抑制ルールの一般化された式であり、α=2、β=2は、スペクトル減算に対応し、さらに、α=2、β=1は、ウィーナーフィルタリングに対応する。(エネルギーの代わりに)大きさのスペクトル減算は、α=1、β=1を設定することによって実現される。パラメータγは、ノイズの量を制御し、さらに、ノイズ推定方法の可能なバイアスを占めている。それは、推定されたSNRまたは周波数インデックスに関連するように選択することができる。
【0061】
図20において、典型的なスペクトル重みが、スピーチエンハスメントにおいて用いられるように、SNRの関数として示される。
【0062】
さまざまな他のゲインルールは、重みがサブバンドSNRで単調に増加するという共通の特徴、例えばEphraimおよびMalahの推定器(Ephraim−Malah estimator)[7]または軟決定/可変減衰アルゴリズム(Soft−Decision/Variable Attenuation algorithm(SDVA))[8]で見つけることができる。
【0063】
実用的な実施態様において、スペクトル重みは、アーチファクトを低減するために、ゼロよりも大きい最小値によって典型的に制約される。異なるゲインルールは、異なる周波数範囲において適用することができる[4]。結果として生じるゲインは、アーチファクトを低減するために、時間軸および周波数軸の両方に沿って平滑化することができる。典型的に、1次ローパスフィルタ(漏洩積分器)は、時間軸に沿って平滑化のために用いられ、さらに、ゼロ位相ローパスフィルタは、周波数軸に沿って適用される。
【0065】
図1は、実施形態による第1の入力チャンネルX
l(f)および第2の入力チャンネルX
r(f)を有するステレオ入力信号から第1のサイドチャンネルS
l(f)および第2のサイドチャンネルS
r(f)を有するステレオサイド信号を生成するための装置を示す。装置は、ミッドサイド情報midSideInfに基づいて修正情報modInfを生成するための修正情報ジェネレータ110を含む。さらに、装置は、第1のサイドチャンネルS
l(f)を得るために修正情報modInfに基づいて第1の入力チャンネルX
l(f)を操作するように構成されさらに第2のサイドチャンネルS
r(f)を得るために修正情報modInfに基づいて第2の入力チャンネルX
r(f)を操作するように構成される信号操作器120を含む。
【0066】
例えば、修正情報ジェネレータ110は、ステレオ入力信号のモノラルミッド信号、ステレオ入力信号のモノラルサイド信号および/またはステレオ入力信号のモノラルミッド信号およびモノラルサイド信号間の関係に関連するミッドサイド情報midSideInfに基づいて修正情報modInfを生成するように構成され得る。
【0069】
図1aは、実施形態によるステレオサイド信号を生成するための装置を示し、操作情報ジェネレータ110は、スペクトル減算器115を含む。スペクトル減算器115は、ステレオ入力信号のモノラルミッド信号またはモノラルサイド信号および第1または第2の入力チャンネル間の差分を示す差分値を生成することによって修正情報modInfを生成するように構成される。例えば、スペクトル減算器115は、ステレオ入力信号のモノラルミッド信号またはモノラルサイド信号の大きさ値または重み付けられた大きさ値から第1または第2の入力チャンネルの大きさ値または重み付けられた大きさ値を減算することによって修正情報modInfを生成するように構成され得る。または、スペクトル減算器115は、第1または第2の入力チャンネルの大きさ値または重み付けられた大きさ値からステレオ入力信号のモノラルミッド信号またはモノラルサイド信号の大きさ値または重み付けられた大きさ値を減算することによって修正情報modInfを生成するように構成され得る。
【0070】
図1bは、実施形態によるステレオサイド信号を生成するための装置を示し、修正情報ジェネレータ110は、ステレオ入力信号のモノラルミッド信号およびモノラルサイド信号に基づいて第1のスペクトル重み付け係数を生成することによって修正情報modInfを生成するためのスペクトル重みジェネレータ116を含む。
【0071】
図2は、実施形態によるスペクトル減算器210を示す。第1の入力チャンネルの第1の大きさスペクトル|X
l(f)|、第2の入力チャンネルの第2の大きさスペクトル|X
r(f)|およびステレオ入力信号のモノラルミッド信号の第3の大きさスペクトル|M
1(f)|が、スペクトル減算器210に送られる。
【0076】
チャンネルジェネレータ408は、生成されたミッド信号M
1(f)を、生成されたミッド信号M
1(f)から大きさ値を抽出する第1の大きさ抽出器411に送る。さらに、第1の入力チャンネルX
l(f)は、変換ユニット405によって、第1の入力チャンネルX
l(f)の大きさ値を抽出する第2の大きさ抽出器412に送られる。さらに、変換ユニット405は、第2の入力チャンネルX
r(f)を、第2の入力チャンネルから大きさ値を抽出する第3の大きさ抽出器413に送る。また、変換ユニット405は、第1の入力チャンネルx
l(f)を、第1の入力チャンネルX
l(f)から位相値を抽出する第1の位相抽出器421に送る。さらに、変換ユニット405は、第2の入力チャンネルX
r(f)を、第2の入力チャンネルから位相値を抽出する第2の位相抽出器422に送る。
【0083】
第1の結合器441は、スペクトル領域において表される生成された第1のサイド信号を逆変換ユニット450に送る。逆変換ユニット450は、第1の時間領域サイド信号を得るために、第1のスペクトル領域サイドチャンネルをスペクトル領域から時間領域に変換する。さらに、逆変換ユニット450は、第2の結合器442からスペクトル領域において表される第2のサイドチャンネルを受信する。逆変換ユニット450は、時間領域第2のサイドチャンネルを得るために、第2のスペクトル領域サイドチャンネルをスペクトル領域から時間領域に変換する。
【0087】
ミッド信号が時間信号を減算することによって計算されるという事実は、2つの逆の周波数変換だけが必要とされる。パラメータwは、好ましくは1に近くなるように選択されるが、周波数に依存することができる。
【0088】
図5は、これらの概念を使用する実施形態による装置を示す。
【0089】
装置は、第1のスペクトル領域入力チャンネルX
l(f)を得るために第1の時間領域入力チャンネルx
l(t)を時間領域からスペクトル領域に変換するように構成される第1の変換ユニット501と、第2のスペクトル領域入力チャンネルX
r(f)を得るために第2の時間領域入力チャンネルx
r(t)を時間領域からスペクトル領域に変換するように構成される第2の変換ユニット502とをさらに含む。
【0090】
装置は、チャンネルジェネレータ508と、第1、第2および第3の大きさ抽出器511、512および513と、第1および第2の位相抽出器521および522と、第1および第2の減算ユニット531および532と、第1および第2の結合器541および542とをさらに含み、それぞれ、
図4の装置のチャンネルジェネレータ408と、第1、第2および第3の大きさ抽出器411、412および413と、第1および第2の位相抽出器421および422と、第1および第2の減算ユニット431および432と、第1および第2の結合器441および442とに対応し得る。
【0091】
さらに、装置は、第1の逆変換ユニット551を含む。第1の逆変換ユニット551は、第1の結合器541からスペクトル領域において表される生成された第1のサイドチャンネルを受信する。第1の逆変換ユニット551は、第1の時間領域サイドチャンネルs
l(t)を得るために、生成された第1のスペクトル領域サイドチャンネルS
l(f)をスペクトル領域から時間領域に変換する。
【0092】
さらに、装置は、第2の逆変換ユニット552を含む。第2の逆変換ユニット552は、第2の結合器542からスペクトル領域において表される生成された第2のサイドチャンネルを受信する。第2の逆変換ユニット552は、第2の時間領域サイドチャンネルs
r(t)を得るために、第2のスペクトル領域サイドチャンネルS
r(f)をスペクトル領域から時間領域に変換する。
【0096】
上述の式は、スペクトル減算によって(ただし大部分がスペクトル重みを計算するための分割による大きい計算負荷によって)得られるように実際の重み付けによって同一の結果を生じるにもかかわらず、スペクトル重み付けアプローチは、それが同様の特徴によって異なる結果を導く処理をパラメータ化するためのより多くの可能性を提供するので、以下において記載されるような利点を有する。
【0097】
スペクトル重み付けを用いる信号分解が、これからさらに詳細に説明される。この実施形態による概念の理論的根拠は、左右チャンネル信号x
l(t)およびx
r(t)にスペクトル重み付けを適用することであり、スペクトル重みは、MS成分から導き出される。MS分解の中間結果は、以下においてミッドサイド比率(MSR)と呼ばれる、時間周波数タイルごとのミッドおよびサイド信号の比率である。このMSRは、スペクトル重みを計算するために用いることができるが、重みがMSRの概念なしに代替的に計算することができることに留意されたい。この場合、MSRは、主にその方法の基本的な考え方を説明する目的に役立つ。ステレオミッド信号m(t)=[m
l(t) m
r(t)]を計算するために、重みは、それらがMSRに単調に関連するように選択される。ステレオサイド信号s(t)=[s
l(t) s
r(t)]を計算するために、重みは、それらがMSRの逆に単調に関連するように選択される。
【0098】
実施形態において、修正情報ジェネレータは、スペクトル重みジェネレータを含む。
図6は、そのような実施形態による装置を示す。装置は、修正情報ジェネレータ610および信号操作器620を含む。修正情報ジェネレータは、スペクトル重みジェネレータ615を含む。信号操作器620は、ステレオ信号の第1の入力チャンネルX
l(f)を操作するための第1の操作ユニット621およびステレオ入力信号の第2の入力チャンネルX
r(f)を操作するための第2の操作ユニット622を含む。
図6のスペクトル重みジェネレータ615は、ステレオ入力信号のモノラルミッド信号M
1(f)およびモノラルサイド信号S
1(f)を受信する。スペクトル重みジェネレータ615は、ステレオ入力信号のモノラルミッド信号M
1(f)およびモノラルサイド信号S
1(f)に基づいてスペクトル重み付け係数G
s(f)を決定するように構成される。そして、信号操作器620は、修正情報として生成されたスペクトル重み付け係数G
s(f)を修正情報ジェネレータ620に送る。修正情報ジェネレータ620の第1の修正ユニット621は、ステレオサイド信号の第1のサイドチャンネルS
l(f)を得るために、生成されたスペクトル重み付け係数G
s(f)に基づいてステレオ入力信号の第1の入力チャンネルX
l(f)を操作するように構成される。
【0099】
別の実施形態が、
図7に示される。
図6の装置のように、
図7の装置は、修正情報ジェネレータ710および信号操作器720を含む。修正情報ジェネレータは、スペクトル重みジェネレータ715を含む。信号操作器720は、ステレオ信号の第1の入力チャンネルX
l(f)を操作するための第1の操作ユニット721およびステレオ入力信号の第2の入力チャンネルX
r(f)を操作するための第2の操作ユニット722を含む。
図7の実施形態の信号操作器720は、ステレオサイド信号の第1および第2のサイドチャンネルS
l(f)およびS
r(f)を得るために同じ生成されたスペクトル重み付け係数G
s(f)に基づいて第1の入力チャンネルX
l(f)および第2の入力チャンネルX
r(f)を操作するように構成される。
【0100】
さらなる実施形態が、
図8に示される。
図6の装置のように、
図8の装置は、修正情報ジェネレータ810および信号操作器820を含む。修正情報ジェネレータは、スペクトル重みジェネレータ815を含む。信号操作器820は、ステレオ信号の第1の入力チャンネルX
l(f)を操作するのための第1の操作ユニット821およびステレオ入力信号の第2の入力チャンネルX
r(f)を操作するための第2の操作ユニット822を含む。スペクトル重みジェネレータ815は、2つ以上のスペクトル重み係数を生成するように構成される。さらに、修正情報ジェネレータ820の第1の操作ユニット821は、生成された第1のスペクトル重み付け係数に基づいて第1の入力チャンネルを操作するように構成される。修正情報ジェネレータ820の第2の操作ユニット822は、生成された第2のスペクトル重み付け係数に基づいて第2の入力チャンネルを操作するように構成される。
【0101】
図9は、実施形態による修正情報ジェネレータ910を示す。修正情報ジェネレータ910は、大きさ決定器912およびスペクトル重みジェネレータ915を含む。大きさ決定器912は、スペクトル領域において表されるモノラルミッド信号M
1(f)を受信するように構成される。さらに、大きさ決定器912は、スペクトル領域において表されるモノラルサイド信号S
1(f)を受信するように構成される。大きさ決定器912は、大きさサイド値としてモノラルサイド信号S
1(f)のスペクトル|S
1(f)|の大きさ値を決定するように構成される。さらに、大きさ決定器912は、大きさミッド値としてモノラルミッド信号M
1(f)のスペクトル|M
1(f)|の大きさ値を決定するように構成される。
【0105】
付加的なパラメータδは、分解プロセスにおいてステレオサイド信号成分の影響を制御するために導入される。
【0106】
周波数変換だけが信号ペア[x
l(t) x
r(t)]または[m(t) s(t)]のために計算される必要があり、さらに、上側のペアは式(5)および(6)に従って加算および減算によって導き出されることに留意されたい。
【0108】
図10は、第1の入力チャンネルおよび第2の入力チャンネルを有するステレオ入力信号から第1のミッドチャンネルM
l(f)および第2のミッドチャンネルM
r(f)を有するステレオミッド信号を生成するための装置を示す。装置は、ミッドサイド情報midSideInfに基づいて修正情報modInf2を生成するための修正情報ジェネレータ1010と、第1のミッドチャンネルM
l(f)を得るために修正情報に基づいて第1の入力チャンネルX
l(f)を操作するように構成されさらに第2のミッドチャンネルM
r(f)を得るために修正情報modInfに基づいて第2の入力チャンネルX
r(f)を操作するように構成される信号操作器1020とを含む。
【0109】
図10aは、実施形態によるステレオミッド信号を生成するための装置を示し、操作情報ジェネレータ1010は、スペクトル減算器1015を含む。スペクトル減算器1015は、ステレオ入力信号のモノラルミッド信号またはモノラルサイド信号および第1または第2の入力チャンネル間の差分を示す差分値を生成することによって修正情報modInf2を生成するように構成される。例えば、スペクトル減算器1015は、ステレオ入力信号のモノラルミッド信号またはモノラルサイド信号の大きさ値または重み付けられた大きさ値から第1または第2の入力チャンネルの大きさ値または重み付けられた大きさ値を減算することによって修正情報modInf2を生成するように構成され得る。または、スペクトル減算器1015は、第1または第2の入力チャンネルの大きさ値または重み付けられた大きさ値からステレオ入力信号のモノラルミッド信号またはモノラルサイド信号の大きさ値または重み付けられた大きさ値を減算することによって修正情報modInf2を生成するように構成され得る。
【0110】
図10bは、実施形態によるステレオミッド信号を生成するための装置を示し、修正情報ジェネレータ1010は、ステレオ入力信号のモノラルミッド信号およびモノラルサイド信号に基づいて第1のスペクトル重み付け係数を生成することによって修正情報modInf2を生成するためのスペクトル重みジェネレータ1016を含む。
【0116】
任意に、付加的な一定のスケーリング係数は、減算の前にゲイン関数のうちの1つに適用することができる。
【0118】
スペクトル重みG
s(f)は、最初に計算され、1.5dBだけスケールされる。ステレオミッド信号のためのゲインは、G
m(f)=1―G
s(f)として計算される。
【0119】
ゲイン関数は、
図11においてパニングパラメータaの関数として示される。
図11において、ステレオサイド信号(実線)およびステレオミッド信号(点線)のためのゲイン例が示される。ゲインが相補的であることが示され、すなわち、分離がダウンミックス互換性である。どちらかの一方にパンされる信号成分は、ステレオミッド信号において減衰され、さらに、センターにパンされる信号成分は、ステレオサイド信号において減衰される。間にパンされる信号成分は、両方の信号において現れる。ゲイン関数は、
図12においてパニングパラメータaの関数として示される。
図12は、左チャンネル(実線)および右チャンネル(点線)のステレオサイド信号(上側の図)およびステレオミッド信号(下側の図)のためのスペクトル重み付けの結果を示す。
【0120】
図13は、さらなる実施形態によるステレオサイド信号を生成するための装置を示す。装置は、変換ユニット1203、修正情報ジェネレータ1310、信号操作器1320および逆変換ユニット1325を含む。ステレオ入力信号の第1の入力チャンネルx
l(t)および第2の入力チャンネルx
r(t)とステレオ入力信号のミッド信号m
1(t)およびサイド信号s
1(t)とが、変換ユニット1305に送られる。変換ユニットは、周波数バンドインデックスfおよび時間インデックスkを有する、複数の周波数バンドX(f,k)を有する信号表現を導き出すための短時間フーリエ変換ユニット(STFTユニット)、フィルタバンクまたは他のいかなる手段であってもよい。変換ユニットは、時間領域において表されるミッド信号mid
1(t)、サイド信号s
1(t)、第1の入力チャンネルx
l(t)および第2の入力チャンネルx
r(t)を、スペクトル領域信号に、特に、スペクトル領域ミッド信号M
1(f)、スペクトル領域サイド信号S
1(f)、スペクトル領域第1の入力チャンネルX
l(f)およびスペクトル領域第2の入力チャンネルX
r(f)に変換する。スペクトル領域ミッド信号M
1(f)およびスペクトル領域サイド信号S
1(f)は、ミッドサイド情報として修正情報ジェネレータ1310に送られる。
【0121】
修正情報ジェネレータ1310は、スペクトル領域モノラルミッド信号M
1(f)およびモノラルサイド信号S
1(f)に基づいて修正情報modInfを生成する。
図13の修正情報ジェネレータは、点線の接続線1312および1314によって示されるように、第1の入力チャンネルX
l(f)および/または第2の入力チャンネルX
r(f)を考慮に入れ得る。例えば、修正情報ジェネレータ1310は、モノラルミッド信号M
1(f)、第1の入力チャンネルX
l(f)および第2の入力チャンネルX
r(f)に基づく修正情報を生成し得る。
【0122】
そして、修正ジェネレータ1310は、生成された修正情報modInfを信号操作器1320に伝える。さらに、変換ユニット1305は、第1のスペクトル領域入力チャンネルX
l(f)および第2のスペクトル領域入力チャンネルX
r(f)を信号操作器1320に送る。信号操作器1320は、信号操作器1320によって逆変換ユニット1325に送られる第1のスペクトル領域サイドチャンネルS
l(f)および第2のスペクトル領域サイドチャンネルS
r(f)を得るために修正情報modInfに基づいて第1の入力チャンネルを操作するように構成される。
【0123】
逆変換ユニット1325は、それぞれ、第1の時間領域サイドチャンネルs
l(t)を得るために第1のスペクトル領域サイドチャンネルS
l(f)を時間領域に変換しさらに第2の時間領域サイドチャンネルs
r(t)を得るために第2のスペクトル領域サイドチャンネルS
r(f)を時間領域に変換するように構成される。
【0126】
提案された方法の理論的根拠は、入力信号x(t)=[x
l(t) x
r(t)]を処理し、さらに、m
1(t)およびs
1(t)の周波数領域表現が所望の信号成分を含むという事実の利点をとることによって、所望の信号のすなわちm(t)=[m
l(t) m
r(t)]およびs=[s
l(t) s
r(t)]の大きさスペクトルの推定を計算することである。
【0127】
実施形態において、スペクトル減算が使用される。入力信号のスペクトルは、モノラルミッド信号のスペクトルを用いて修正される。別の実施形態において、スペクトル重み付けが使用され、重みは、モノラルミッド信号およびモノラルサイド信号を用いて導き出される。
【0128】
実施形態によれば、信号は、ミッドおよびサイド信号と同様の特徴によって、しかし信号のそれぞれを別々に聞くときにステレオ信号を失わずに、計算されるべきである。これは、一実施形態におけるスペクトル減算を用いることによってさらに別の実施形態におけるスペクトル重み付けを用いることによって達成される。
【0129】
別の実施形態によれば、アップミキサは、2つのアップミキサ入力チャンネルを有するステレオ信号から少なくとも4つのアップミックスチャンネルを生成するために提供される。
【0130】
アップミキサは、第1のアップミックスチャンネルとして第1のサイドチャンネルを生成しさらに第2のアップミックスチャンネルとして第2のサイドチャンネルを生成するための上述の実施形態のうちの1つによるステレオサイド信号を生成する装置を含む。アップミキサは、第1の結合ユニットおよび第2の結合ユニットをさらに含む。第1の結合ユニットは、第3のアップミキサチャンネルとして第1のミッドチャンネルを得るために第1の入力チャンネルおよび第1のサイドチャンネルを結合するように構成される。さらに、第2の結合ユニットは、第4のアップミキサチャンネルとして第2の入力チャンネルおよび第2のサイドチャンネルを結合するように構成される。
【0133】
ステレオミッド信号M
l(f)の第1のチャンネルおよびステレオミッド信号M
r(f)の第2のチャンネルは、それぞれ、第3および第4のアップミキサチャンネルとして出力される。以上のように、ステレオミッド信号およびステレオサイド信号の存在は、サラウンドサウンドシステムを用いる再生のためのステレオ信号のアップミキシングのアプリケーションのために有利である。ステレオサイドおよびステレオミッド信号の1つの可能なアプリケーションは、
図16に示されるように4チャンネルサウンド再生である。それは、ステレオミッド信号およびステレオサイド信号に送られる4つのチャンネルを含む。
【0134】
上述のように4チャンネル再生の例示的なアプリケーションは、ステレオサイド信号およびステレオミッド信号の特徴のための良好な実例である。記載された処理が4チャンネルよりも異なるフォーマットを有するオーディオ信号を再生するためにさらに拡張することができることに留意されたい。より多くの出力チャンネル信号は、最初にステレオサイド信号およびステレオミッド信号を分離し、さらに、記載された処理をそれらの一方または両方に再び適用することによって計算される。例えば、ITU−R BS.775[1]に従って5チャンネルを用いる再生のための信号は、入力信号としてステレオミッド信号を有する信号分解を繰り返すことによって導き出すことができる。
【0135】
図17は、センターC、左L、右R、サラウンド左SLおよびサラウンド右SRのチャンネルを有する、5チャンネルを有する再生に適しているマルチチャンネル信号を生成する処理のブロック図を示す。
【0136】
上述の方法および装置は、ステレオ入力信号をステレオサイド信号および/またはステレオミッド信号に分解するために示されている。スペクトル減算またはスペクトル重み付けは、スペクトル分離のために適用される。MS分解は、それぞれの時間周波数タイルがステレオサイド信号およびステレオミッド信号のいずれかに貢献する度合いを計算するために必要である方向に基づく情報を生じる。そのような信号は、サラウンドサウンドシステムによって再生のためのステレオ信号のアップミキシングのアプリケーションのために用いられる。
【0137】
いくつかの態様が装置との関連で記載されているにもかかわらず、これらの態様は、対応する方法の説明も表すことが明らかであり、ブロックまたは装置は、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップとの関連で記載されている態様は、対応するブロック若しくはアイテムまたは対応する装置の特徴の説明も表す。
【0138】
本発明の分解された信号は、デジタル記憶媒体に保存することができ、または、例えば無線伝送媒体や例えばインターネットなどの有線伝送媒体などの伝送媒体で伝送することができる。
【0139】
特定の実施要件に応じて、本発明の実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。実施は、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する(または協働することができる)電子的に可読の制御信号が格納される、デジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはFLASHメモリを用いて実行することができる。
【0140】
本発明によるいくつかの実施形態は、ここに記載される方法のうちの1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に可読の制御信号を有する一時的でないデータキャリアを含む。
【0141】
一般的に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実施することができ、そのプログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに、それらの方法のうちの1つを実行するために働く。プログラムコードは、例えば、機械可読のキャリアに格納されてもよい。
【0142】
他の実施形態は、機械可読のキャリアに格納される、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0143】
したがって、換言すれば、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、ここに記載される方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0144】
したがって、本発明の方法のさらなる実施形態は、それに記録される、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムを含むデータキャリア(またはデジタル記憶媒体またはコンピュータ可読の媒体)である。
【0145】
したがって、本発明の方法のさらなる実施形態は、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。データストリームまたは一連の信号は、例えば、データ通信接続を介して、例えばインターネットを介して、転送されるように構成されてもよい。
【0146】
さらなる実施形態は、ここに記載される方法のうちの1つを実行するように構成されまたは適している処理手段、例えばコンピュータまたはプログラム可能な論理デバイスを含む。
【0147】
さらなる実施形態は、ここに記載される方法のうちの1つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。
【0148】
いくつかの実施形態において、プログラム可能な論理デバイス(例えばフィールドプログラム可能なゲートアレイ)は、ここに記載される方法の機能のいくらかまたはすべてを実行するために用いられてもよい。いくつかの実施形態において、フィールドプログラム可能なゲートアレイは、ここに記載される方法のうちの1つを実行するために、マイクロプロセッサと協働してもよい。一般的に、その方法は、好ましくは、いかなるハードウェア装置によっても実行される。
【0149】
上述の実施形態は、本発明の原理のために単に例示するだけである。ここに記載される構成および詳細の修正および変更が他の当業者にとって明らかであるものと理解される。したがって、本発明は、特許請求の範囲によってだけ制限され、ここに実施形態の記述および説明として示される具体的な詳細によって制限されないと意図される。
【0150】
文献
[1] International Telecommunication Union, Radiocommunication Assembly, "Multichannel stereophonic sound system with and without accompanying picture", Recommendation ITU-R.BS.775-2, 2006, Geneva, Switzerland.
[2] S. Boll, "Suppression of acoustic noise in speech using spectral subtraction", IEEE Trans. on Accoustics, Speech, and Signal Processing, vol. 27, no.2, pp. 113-120, 1979
[4] G. Schmidt, "Single-channel noise suppression based on spectral weighting", Eurasip Newsletter, 2004.
[5] M. Berouti, R. Schwartz, and J. Makhoul, "Enhancement of speech corrupted by acoustic noise", in Proc. of the IEEE Int. Conf. On Acoustics, Speech, and Signal Processing, ICASSP, 1979
[6] R. Martin, "Spectral subtraction based on minimum statistics", in Proc. of EUSIPCO, Edinburgh, UK, 1994
[7] Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator", in Proc. of the IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, ICASSP, 1984
[8] E George, "Single-sensor speech enhancement using a soft-decision/variable attenuation algorithm", in Proc. Of the IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, ICASSP, 1995.
[9] C. Avendano and J.-M. Jot, "A frequency-domain approach to multi-channel upmix", J. Audio Eng. Soc., vol. 52, 2004.
[10] C. Faller, "Multiple-loudspeaker playback of stereo signals", J. Audio Eng. Soc., vol. 54, 2006.
[11] C. Uhle, J. Herre, S. Geyersberger, F. Ridderbusch, A. Walter and O. Moser, "Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program", US Patent Applicatin 2009/0080666, 2009.
[12] C. Uhle, J. Herre, A. Walther, O. Hellmuth, and C. Janssen, "Apparatus and method for generating an ambient signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program", US Patent Application 2010/0030563, 2010.
[13] E. Vickers, "Two-to-three channel upmix for center channel derivation", US Patent Application 2010/0296672, 2010.