【解決手段】2つ以上のチャンネルを有するマルチチャンネル信号(12)の少なくとも2つのチャンネルをダウンミックスするためのダウンミキサは、少なくとも2つのチャンネルから部分的ダウンミックス信号(14)を計算するためのプロセッサ(10)と、マルチチャンネル信号(12)から相補信号を計算するための相補信号計算機(20)であって、相補信号(22)は、部分的ダウンミックス信号(14)とは異なる、相補信号計算機(20)と、マルチチャンネル信号のダウンミックス信号(40)を得るために部分的ダウンミックス信号(14)および相補信号(22)を加算するための加算器(30)とを備える。
前記相補信号計算機(20)は、前記相補信号が、前記部分的ダウンミックス信号(14)に関して0.7未満のコヒーレンスインデックスを有するように、前記相補信号(22)を計算するように構成され、0.0のコヒーレンスインデックスは、完全なインコヒーレンスを示し、1.0のコヒーレンスインデックスは、完全なコヒーレンスを示す、請求項1に記載のダウンミキサ。
前記相補信号計算機(20)は、前記相補信号を計算するために、前記マルチチャンネル信号が、前記少なくとも2つのチャンネルよりも多いチャンネル、または無相関化された第1のチャンネル、無相関化された第2のチャンネル、無相関化されたさらなるチャンネル、前記第1のチャンネルおよび前記第2のチャンネルを伴う無相関化された差もしくは無相関化された部分的ダウンミックス信号(14)を有するとき、前記少なくとも2つのチャンネルの第1のチャンネル、前記少なくとも2つのチャンネルの第2のチャンネル、前記第1のチャンネルと前記第2のチャンネルとの間の差、前記第2のチャンネルと前記第1のチャンネルとの間の差、前記マルチチャンネル信号のさらなるチャンネルを含む信号のグループの1つの信号を使用するように構成される、請求項1または2に記載のダウンミキサ。
2つまたは2つよりも多いチャンネルを有するマルチチャンネル信号の少なくとも2つのチャンネルからマルチチャンネルパラメータ(84)を計算するためのパラメータ計算機(82)と、
請求項1から11のいずれか一項に記載のダウンミキサ(80)と、
前記1つもしくは複数のダウンミックス信号(40)および/または前記マルチチャンネルパラメータ(84)を含むエンコードされたマルチチャンネル信号を出力するまたは記憶するための出力インターフェース(86)とを備える、マルチチャンネルエンコーダ。
【背景技術】
【0002】
チャンネルの数を低減することは、低ビットレートにおいてマルチチャンネルコーディングを達成するために必須である。例えば、パラメトリックステレオコーディングスキームは、左および右入力チャンネルからの適切なモノラルダウンミックスに基づいている。そうして得られるモノラル信号は、パラメトリック形式で聴覚情景を記述するサイド情報と一緒にモノラルコーデックによってエンコードされ、伝送されることになる。サイド情報は通常、1つの周波数サブバンドにつきいくつかの空間パラメータから成る。それらは、例えば、
・チャンネル間のレベル差(またはバランス)を測定するチャンネル間レベル差(ILD)と、
・チャンネル間の時間または位相の差を記述するチャンネル間時間差(ITD)またはチャンネル間位相差(IPD)とをそれぞれ含むこともあり得る。
【0003】
しかしながら、ダウンミックス処理は、チャンネル間位相不整列に起因して信号キャンセルおよび着色を生み出す傾向があり、それは、望ましくない品質悪化につながる。一例として、もしチャンネルが、コヒーレントであり、位相の不一致に近いならば、ダウンミックス信号は、コムフィルタの特性などの、知覚できるスペクトルバイアスを示す可能性が高い。
【0004】
ダウンミックス動作は、
m[n] = w
1l[n] + w
2r[n]
によって表されるように、単に左および右チャンネルの合計によって時間領域内で行うことができ、ただし、l[n]およびr[n]は、左および右チャンネルであり、nは、時間インデックスであり、w
1[n]およびw
2[n]は、ミキシングを決定する重みである。もし重みが、時間とともに一定であるならば、我々は、受動的ダウンミックスについて述べる。それは、入力信号にかかわらず不都合を有し、得られるダウンミックス信号の品質は、入力信号特性に大きく依存する。重みを時間につれて適合させることは、この問題をある程度低減することができる。
【0005】
しかしながら、主な問題点を解決するために、能動的ダウンミックスが通常、例えば短期フーリエ変換(STFT)を使用して周波数領域内で行われる。それによって、重みは、周波数インデックスkおよび時間インデックスnに依存させることができ、信号特性に対してより良く適合することができる。ダウンミックス信号はその時、
M[k, n] = W
1[k, n]L[k, n] + W
2[k, n]R[k, n]
と表され、ただしM[k, n]、L[k, n]およびR[k,n]は、周波数インデックスkおよび時間インデックスnにおけるそれぞれダウンミックス信号、左チャンネルおよび右チャンネルのSTFT成分である。重みW
1[k, n]およびW
2[k, n]は、時間および周波数において適応的に調整することができる。それは、コムフィルタ処理効果によって引き起こされるスペクトルバイアスを最小化することによって2つの入力チャンネルの平均エネルギーまたは振幅を保存することを目指す。
【0006】
能動的ダウンミキシングのための最も直接的な方法は、各周波数ビンまたはサブバンドについて2つの入力チャンネルの平均エネルギーをもたらすためにダウンミックス信号のエネルギーを等化することである[1]。
図7bに示されるようなダウンミックス信号はその時、
M[k] = W[k](L[k] + R[k])
と定式化することができ、ただし、
【0007】
【数1】
【0008】
そのような直接的な解決策は、いくつかの欠点を有する。最初に、ダウンミックス信号は、2つのチャンネルが、等しい振幅の位相反転時間-周波数成分を有するときは(ILD = 0dbおよびIPD = π)、定義されない。この特異性は、この場合分母がゼロになることの結果として生じる。簡単な能動的ダウンミキシングの出力は、この場合予測できない。この挙動は、位相が、IPDの関数としてプロットされる、
図7aにおいて様々なチャンネル間レベル差について示される。
【0009】
ILD = 0dBについては、2つのチャンネルの合計は、IPD = πにおいて不連続であり、πラジアンのステップをもたらす。他の条件においては、位相は、2πを法として規則的にかつ連続的に展開する。
【0010】
問題の第2の性質は、そのようなエネルギー等化を達成するための規格化利得の重要な差異から来る。実際、規格化利得は、フレームごとにかつ隣接周波数サブバンド間で大幅に変動する可能性がある。それは、ダウンミックス信号の不自然な着色およびブロック効果につながる。STFTおよび重複加算法のための合成窓の使用は、処理されるオーディオフレーム間の平滑化推移をもたらす。しかしながら、連続するフレーム間での規格化利得の大きい変化はなお、可聴推移アーチファクトにつながる可能性がある。その上、この大幅な等化はまた、ブロック変換の分析窓の周波数応答サイドローブからのエイリアシングに起因して可聴アーチファクトにつながる可能性もある。
【0011】
代替案として、能動的ダウンミックスは、合計信号を計算する前に、2つのチャンネルの位相整列を行うことによって達成することができる[2-4]。2つのチャンネルは、それらを合計する前にすでに同相であるので、新しい合計信号についてなすべきエネルギー等化はその時、制限される。[2]では、左チャンネルの位相は、2つのチャンネルの位相を整列するための基準として使用される。もし左チャンネルの位相が、良く調整されていないならば(例えば、ゼロまたは低レベルノイズチャンネル)、ダウンミックス信号は、直接影響を受ける。[3]では、この重要な問題は、回転前に合計信号の位相を基準として受け取ることによって解決される。なおILD = 0dBおよびIPD = πにおける特異性問題は、取り扱われていない。このため、[4]は、そのような場合に安定性を改善するために、広帯域位相差パラメータを使用することによってその手法を修正する。それでもなお、これらの手法のどれも、不安定性に関連する問題の第2の性質を考慮しなかった。チャンネルの位相回転もまた、入力チャンネルの不自然なミキシングにつながる可能性があり、特に大きい変化が、時間および周波数にわたる処理において起こるとき、深刻な不安定性およびブロック効果を生み出す可能性がある。
【0012】
最後に、[5]および[6]のようなより発展した技法があり、それらは、ダウンミキシング中の信号キャンセルが、2つのチャンネル間でコヒーレントである時間-周波数成分についてのみ生じるという観察に基づいている。[5]では、コヒーレント成分は、入力チャンネルのインコヒーレント部分を合計する前にフィルタ処理で除去される。[6]では、位相整列は、チャンネルを合計する前にコヒーレント成分について計算されるだけである。その上、位相整列は、安定性および不連続性の問題を回避するために時間および周波数にわたって規格化される。[5]では、フィルタ係数が、あらゆるフレームにおいて識別される必要があり、[6]では、チャンネル間の共分散行列が、計算されなければならないので、両方の技法は、計算的に要求が多い。
【発明を実施するための形態】
【0025】
図1は、2つ以上のチャンネルを有するマルチチャンネル信号12の少なくとも2つのチャンネルをダウンミックスするためのダウンミキサを例示する。特に、マルチチャンネル信号は、左チャンネルLおよび右チャンネルRを有するステレオ信号だけとすることができ、またはマルチチャンネル信号は、3つまたはより多くのチャンネルさえ有することができる。チャンネルはまた、オーディオオブジェクトを含むまたはそれらから成ることもできる。ダウンミキサは、マルチチャンネル信号12からの少なくとも2つのチャンネルから部分的ダウンミックス信号14を計算するためのプロセッサ10を備える。さらに、ダウンミキサは、マルチチャンネル信号12から相補信号を計算するための相補信号計算機20を備え、ブロック20によって出力される相補信号22は、ブロック10によって出力される部分的ダウンミックス信号14とは異なる。加えて、ダウンミキサは、マルチチャンネル信号12のダウンミックス信号40を得るために、部分的ダウンミックス信号および相補信号を加算するための加算器30を備える。一般に、ダウンミックス信号40は、単一チャンネルだけを有し、または別法として、1つよりも多いチャンネルを有する。一般に、しかしながら、ダウンミックス信号は、マルチチャンネル信号12に含まれるよりも少ないチャンネルを有する。それ故に、マルチチャンネル信号が、例えば5つのチャンネルを有するとき、ダウンミックス信号は、4つのチャンネル、3つのチャンネル、2つのチャンネルまたは単一チャンネルを有してもよい。1つまたは2つのチャンネルを有するダウンミックス信号は、2つより多いチャンネルを有するダウンミックス信号よりも好ましい。マルチチャンネル信号12として2チャンネル信号の場合、ダウンミックス信号40は、単一チャンネルを有するだけである。
【0026】
一実施形態では、プロセッサ10は、少なくとも2つのチャンネルが、同相であるときは、少なくとも2つのチャンネルと部分的ダウンミックス信号との間の定義済みエネルギー関連または振幅関連の関係が、満たされるように、かつ少なくとも2つのチャンネルが、位相を異にするときは、エネルギー損失が、少なくとも2つのチャンネルに関して部分的ダウンミックス信号内に生み出されるように、部分的ダウンミックス信号14を計算するように構成される。定義済み関係についての実施形態および例は、ダウンミックス信号の振幅が、入力信号の振幅に対してある関係にある、または例えばダウンミックス信号のサブバンド的エネルギーが、入力信号のエネルギーに対して定義済み関係にあるというものである。1つの特に興味深い関係は、全帯域幅にわたるかまたはサブバンド内にあるダウンミックス信号のエネルギーが、2つのダウンミックス信号または2つよりも多いダウンミックス信号の平均エネルギーに等しいということである。それ故に、その関係は、エネルギーに関する、または振幅に関することもある。さらに、
図1の相補信号計算機20は、
図1において14で例示されるような部分的ダウンミックス信号のエネルギー損失が、ダウンミックス信号を得るために
図1の加算器30において部分的ダウンミックス信号14および相補信号22を加算することによって部分的にまたは完全に補償されるように、相補信号22を計算するように構成される。
【0027】
一般に、実施形態は、また入力チャンネルから導かれもする相補信号とミックスされる合計信号の制御されたエネルギーまたは振幅等化に基づいている。
【0028】
実施形態は、また入力チャンネルから導かれもする相補信号とミックスされる合計信号の制御されたエネルギーまたは振幅等化に基づいている。合計信号のエネルギー等化は、特異点における問題を回避するために、しかしまた利得の大きい変動に起因する信号障害を大幅に最小化するためにも制御される。相補信号は、残りのエネルギー損失またはそれの少なくとも一部を補償するためにそこに存在する。新しいダウンミックスの一般形は、
M[k, n] = W
1[k, n](L[k, n] + R[k, n]) + W
2[k, n]S[k, n]
と表すことができ、ただし相補信号S[k, n]は理想的には、できる限り合計信号に対して直交しなければならないが、実際には、
S[k, n] = L[k, n]
または
S[k, n] = R[k, n]
または
S[k, n] = L[k, n] - R[k, n]
と選択することができる。
【0029】
いずれの場合も、ダウンミキシングは、従来の受動的または能動的ダウンミキシング手法で行われると、最初に合計チャンネルL + Rを発生させる。利得W
1[k, n]は、入力チャンネルの平均エネルギーかまたは平均振幅をマッチさせるために合計チャンネルのエネルギーを等化することを目指す。しかしながら、従来の能動的ダウンミキシング手法と異なり、W
1[k, n]は、不安定性問題を回避するためにかつエネルギー関係が、障害のある合計信号に基づいて修復されるということを回避するために制限される。
【0030】
第2のミキシングは、相補信号と行われる。相補信号は、L[k, n]およびR[k, n]が、位相を異にするとき、そのエネルギーが、消滅しないように選択される。W
2[k, n]は、W
1[k, n]に導入される制限に起因するエネルギー等化を補償する。
【0031】
例示されるように、相補信号計算機20は、相補信号が、部分的ダウンミックス信号とは異なるように、相補信号を計算するように構成される。量の面で、相補信号のコヒーレンスインデックスは、部分的ダウンミックス信号に関して0.7未満であることが、好ましい。このスケールでは、0.0のコヒーレンスインデックスは、完全なインコヒーレンスを示し、1.0のコヒーレンスインデックスは、完全なコヒーレンスを示す。それ故に、0.7未満のコヒーレンスインデックスは、部分的ダウンミックス信号および相補信号が、互いに十分に異なるように、有用であると証明されている。しかしながら、0.5未満および0.3未満さえものコヒーレンスインデックスは、より好ましい。
【0032】
図2aは、プロセッサによって行われる手順を例示する。特に、
図2aの項目50に例示されるように、プロセッサは、プロセッサへの入力を表す少なくとも2つのチャンネルに関してエネルギー損失を有する部分的ダウンミックス信号を計算する。さらに、相補信号計算機52は、エネルギー損失を部分的にまたは完全に補償するための
図1の相補信号22を計算する。
【0033】
図2bに例示される一実施形態では、相補信号計算機は、相補信号セレクタまたは相補信号決定器23、重み付け係数計算機24および相補信号22を最終的に得るための重み付け器25を備える。特に相補信号セレクタまたは相補信号決定器23は、相補信号を計算するために、Lなどの第1のチャンネル、Rなどの第2のチャンネル、
図2bにおいてL-Rと示されるような第1のチャンネルと第2のチャンネルとの間の差から成る信号のグループの1つの信号を使用するように構成される。別法として、差はまた、R-Lとすることもできる。相補信号セレクタ23によって使用されるさらなる信号は、マルチチャンネル信号のさらなるチャンネル、すなわち、部分的ダウンミックス信号を計算するためにプロセッサによって選択されないものであるチャンネルとすることができる。このチャンネルは、例えば、センタチャンネル、またはサラウンドチャンネルもしくはオブジェクトを含む任意の他の追加のチャンネルとすることができる。他の実施形態では、相補信号セレクタによって使用される信号は、無相関化された第1のチャンネル、無相関化された第2のチャンネル、無相関化されたさらなるチャンネルまたはプロセッサ10によって計算されるような無相関化された部分的ダウンミックス信号さえでもある。好ましい実施形態では、しかしながら、Lなどの第1のチャンネルかもしくはRなどの第2のチャンネルまたは、より好ましくは、左チャンネルと右チャンネルとの間の差もしくは右チャンネルと左チャンネルとの間の差が、相補信号を計算するために好ましい。
【0034】
相補信号セレクタ23の出力は、重み付け係数計算機24に入力される。重み付け係数計算機は加えて典型的には、プロセッサ10によって結合されるべき2つ以上の信号を受け取り、重み付け係数計算機は、26に例示される重みW
2を計算する。それらの重みは、相補信号セレクタ23によって使用されかつ決定される信号と一緒に、重み付け器25に入力され、重み付け器は次いで、最終的に相補信号22を得るために、ブロック24からの重み付け係数を使用してブロック23から出力される対応する信号に重み付けをする。
【0035】
重み付け係数は、時間におけるあるブロックまたはフレームについて、単一重み付け係数W
2が、計算されるように、時間依存とだけすることができる。他の実施形態では、しかしながら、相補信号のあるブロックまたはフレームについて、この時間ブロックについての単一重み付け係数が、利用できるだけでなく、ブロック23によって生成されるまたは選択される信号の一組の異なる周波数値またはスペクトルビンについて一組の重み付け係数W
2が、利用できるように、時間および周波数依存重み付け係数W
2を使用することが、好ましい。
【0036】
相補信号計算機20の使用のためだけでなく、またプロセッサ10の使用のためでもある時間および周波数依存重み付け係数についての対応する実施形態は、
図3に例示される。
【0037】
特に、
図3は、時間領域入力チャンネルを周波数領域入力チャンネルに変換するための時間-スペクトル変換器60を備える好ましい実施形態でのダウンミキサを例示し、各周波数領域入力チャンネルは、一連のスペクトルを有する。各スペクトルは、別個の時間インデックスnを有し、各スペクトル内では、ある周波数インデックスkは、周波数インデックスと一意的に関連する周波数成分を指す。それ故に、一例では、ブロックが、512のスペクトル値を有するとき、その時周波数インデックスkは、512の異なる周波数インデックスのそれぞれを一意的に識別するために0から511までの値をとる。
【0038】
時間-スペクトル変換器60は、FFTを適用するために、好ましくは、ブロック60によって得られる一連のスペクトルが、入力チャンネルの重複ブロックに関連しているように、重複FFTを適用するために構成される。しかしながら、非重複スペクトル変換アルゴリズムおよびDCTなどのFFTまたはそのようなものから離れた他の変換が、同様に使用されてもよい。
【0039】
特に、
図1のプロセッサ10は、個々のスペクトルインデックスkについての重みW
1またはサブバンドbについての重み付け係数W
1を計算するための第1の重み付け係数計算機15を備え、サブバンドは、周波数に関して1つのスペクトル値よりも広く、典型的には2つ以上のスペクトル値を含む。
【0040】
図1の相補信号計算機20は、重み付け係数W
2を計算する第2の重み付け係数計算機を備える。それ故に、項目24は、
図2bの項目24と同様に構成することができる。
【0041】
さらに、部分的ダウンミックス信号を計算する
図1のプロセッサ10は、入力として重み付け係数W
1を受け取り、加算器30に転送される部分的ダウンミックス信号14を出力するダウンミックス重み付け器16を備える。さらに、
図3に例示される実施形態は加えて、入力として、第2の重み付け係数W
2を受け取る、
図2bに関してすでに述べられた重み付け器25を備える。
【0042】
加算器30は、ダウンミックス信号40を出力する。ダウンミックス信号40は、いくつかの異なる出来事において使用することができる。ダウンミックス信号40を使用する1つの方法は、それを
図3に例示される周波数領域ダウンミックスエンコーダ64に入力することであり、それは、エンコードされたダウンミックス信号を出力する。代替手順は、ブロック62の出力において、時間領域ダウンミックス信号を得るために、ダウンミックス信号40の周波数領域表現をスペクトル-時間変換器62に挿入することである。さらなる実施形態は、ダウンミックス信号40をさらなるダウンミックスプロセッサ66に供給することであり、それは、伝送されるダウンミックスチャンネル、記憶されるダウンミックスチャンネルなどのある種の処理されるダウンミックスチャンネル、またはある種の等価を行ったダウンミックスチャンネル、利得変化等を発生させる。
【0043】
実施形態では、プロセッサ10は、少なくとも2つのチャンネルと少なくとも2つのチャンネルの合計信号との間の定義済みエネルギーまたは振幅関係に従って少なくとも2つのチャンネルの合計に重み付けをするために、
図3においてブロック15によって例示されるように時間または周波数依存重み付け係数W
1を計算するために構成される。さらに、
図4の項目70にまた例示もされるこの手順の後で、プロセッサは、ある周波数インデックスkおよびある時間インデックスnについてまたはあるスペクトルサブバンドbおよびある時間インデックスnについて計算された重み付け係数W
1を
図4のブロック72に示されるように定義済みしきい値と比較するように構成される。この比較は、好ましくは各スペクトルインデックスkについてまたは各サブバンドインデックスbについてまたは各時間インデックスnについて、好ましくは1つのスペクトルインデックスkもしくはbについてかつ各時間インデックスnについて行われる。計算された重み付け係数が、73に例示されるようにしきい値を下回るなどの定義済みしきい値に対して第1の関係にあるとき、その時計算された重み付け係数W
1は、
図4において74で示されるように使用される。しかしながら、計算された重み付け係数が、75に示されるようにしきい値を上回るなどの定義済みしきい値に対して第1の関係とは異なる、定義済みしきい値に対して第2の関係にあるとき、定義済みしきい値は、例えば
図3のブロック16において部分的ダウンミックス信号を計算するために計算された重み付け係数の代わりに使用される。これは、W
1の「ハード」制限である。他の実施形態では、一種の「ソフト制限」が、行われる。この実施形態では、変更された重み付け係数は、変更機能を使用して導かれ、変更機能は、変更された重み付け係数が、計算された重み付け係数よりも定義済みしきい値により近くなるようなものである。
【0045】
さらなる実施形態では、
図4における手順は、ブロック70およびブロック76に関して行われるが、しかしブロック72に関して論じられるようなしきい値との比較は、行われない。ブロック70における計算の後で、変更された重み付け係数は、ブロック76の上記の記述の変更機能を使用して導かれ、変更機能は、変更された重み付け係数が、定義済みエネルギー関係のエネルギーよりも小さい部分的ダウンミックス信号のエネルギーをもたらすようなものである。好ましくは、具体的比較なしに適用される変更機能は、それが、W
1の高い値について、操作されたまたは変更された重み付け係数をある限界に制限する、またはログもしくはln機能(a log or ln function)などの非常に小さい増加を有するだけであるようなもの、またはある値に制限されないけれども、前に論じられたような安定性問題が実質的に回避されるもしくは少なくとも低減されるようにもはや非常に遅い増加を有するだけであるようなものである。
【0046】
図8a〜
図8dに例示される好ましい実施形態では、ダウンミックスは、
M[k, n] = W
1[k, n](L[k, n] + R[k, n]) + W
2[k, n]L[k, n]
によって与えられ、ただし、
【0049】
上記の方程式において、Aは、好ましくは2の平方根に等しい実数値の定数であるが、しかしAは、0.5から5の間の異なる値を同様に有することができる。応用に応じて、上述の値とは異なる値さえ、同様に使用することができる。
【0050】
もし
|L[k, n] + R[k, n]| ≦ |L[k, n]| + |R[k, n]|
ならば、W
1[k, n]およびW
2[k, n]は、常に正であり、W
1[k, n]は、
【0053】
ミキシング利得は、前の公式に記述されるようにSTFTの各インデックスkについてビンのように計算することができ、またはSTFTの一組のインデックスbを寄せ集める各非重複サブバンドについてバンドのように計算することができる。利得は、次の方程式、
【0057】
等化中のエネルギー保存は、ハードな制約ではないので、結果として生じるダウンミックス信号のエネルギーは、入力チャンネルの平均エネルギーと比較して変化する。エネルギー関係は、
図8aに例示されるようにILDおよびIPDに依存する。
【0058】
出力エネルギーと入力チャンネルの平均エネルギーとの間の一定の関係を保存する、簡単な能動的ダウンミキシング法と対照的に、新しいダウンミックス信号は、
図8dに例示されるようにどんな特異性も示さない。実際、
図7aでは、大きさπ(180°)のジャンプが、IP = πおよびILD = 0dBにおいて観察可能であり、一方
図8dでは、ジャンプは、2π(360°)であり、それは、アンラップされた位相領域における連続的な変化に対応する。
【0059】
試聴テスト結果は、新しいダウンミックス法が、広範囲のステレオ信号について、従来の能動的ダウンミキシングよりも著しく少ない不安定性および障害をもたらすことを裏付ける。
【0060】
この文脈において、
図8aは、x-軸に沿って、最初の左チャンネルと最初の右チャンネルとの間のチャンネル間レベル差をdB単位で例示する。さらに、ダウンミックスエネルギーは、相対スケールで0から1.4の間でy-軸に沿って示され、パラメータは、チャンネル間位相差IPDである。特に、結果として生じるダウンミックス信号値のエネルギーは、特にチャンネル間の位相に応じて変化し、π(180°)の位相について、すなわち位相を異にする状況について、エネルギー変化は、少なくとも正のチャンネル間レベル差について、良好な形状にあるように見える。
図8bは、ダウンミックス信号Mを計算するための方程式を例示し、相補信号として、左チャンネルが、選択されることもまた、明らかになる。
図8cは、個々のスペクトルインデックスについてだけでなく、STFTからの一組のインデックス、すなわち少なくとも2つのスペクトル値kが、あるサブバンドを得るために一緒に加算されるサブバンドについての重み付け係数W
1およびW
2を例示する。
【0061】
図7aおよび
図7bに例示される従来技術と比較すると、
図8dが、
図7aと比較されるとき、もはやどんな特異性も、含まれない。
【0062】
図9a〜
図9fは、ダウンミックスが、相補信号のための基礎として左信号Lと右信号Rとの間の差を使用して計算される、さらなる実施形態を例示す。特にこの実施形態では、
M[k, n] = W
1[k, n](L[k, n] + R[k, n]) + W
2[k, n](L[k, n] - R[k, n])
ただし、利得W
1[k, n]およびW
2[k, n]の組は、ダウンミックスされた信号と入力チャンネルとの間のエネルギー関係が、あらゆる条件において持続するように計算される。
【0063】
最初に、利得W
1[k, n]は、所与の限界までエネルギーを等化するために計算され、ただしAは、この場合もやはり、
【0065】
に等しいまたはこの値とは異なる実数値の数であり、
【0068】
結果として、合計信号の利得W
1[k, n]は、
図9aに示されるように範囲[0, 1]に制限される。xについての方程式において、代替実施は、平方根のない分母を使用することである。
【0069】
もし2つのチャンネルが、π/2よりも大きいIPDを有するならば、W
1は、もはやエネルギーの損失を補償することができず、それはその時、利得W
2から来ることになる。W
2は、次の二次方程式、
【0077】
2つの根の1つがその時、選択されてもよい。両方の根について、エネルギー関係は、
図9eに示されるようにすべての条件について保存される。
【0078】
もし2つのチャンネルが、π/2よりも大きいIPDを有するならば、W
1は、もはやエネルギーの損失を補償することができず、それはその時、利得W
2から来ることになる。W
2は、次の二次方程式、
【0086】
2つの根の1つがその時、選択されてもよい。両方の根について、エネルギー関係は、
図9fに示されるようにすべての条件について保存される。
【0087】
好ましくは、最小の絶対値を有する根が、W
2[k, n]について適応的に選択される。そのような適応選択は、ILD = 0dBについて1つの根から別の根への転換をもたらすことになり、それは、もう一度、不連続性を生み出す可能性がある。
【0088】
最先端技術と対照的に、この手法は、どんな特異性も導入することなくダウンミックスのコムフィルタ処理効果およびスペクトルバイアスを解決する。それは、すべの条件においてエネルギー関係を維持するが、しかし好ましい実施形態と比較するとより多くの不安定性を導入する。
【0089】
それ故に、
図9aは、この実施形態の部分的ダウンミックス信号の計算において合計信号の係数W
1によって得られる利得制限の比較を例示する。特に、直線は、
図4のブロック76に関して前に論じられたような値の規格化前または変更前の状況である。そして、重み付け係数W
1の関数として変更機能のために1の値に近づく、もう1つの線である。変更機能の影響は、0.5を上回る値において生じるが、しかしずれは、約0.8以上の値W
1について実際に目に見えるようになるだけであることが、明らかになる。
【0090】
図9bは、この実施形態について
図1のブロック図によって実施される方程式を例示する。
【0091】
さらに、
図9cは、どのように値W
1が計算されるかを例示し、従って、
図9aは、
図9cの機能的状況を例示する。最後に、
図9dは、W
2、すなわち
図1の相補信号発生器20によって使用される重み付け係数の計算を例示する。
【0092】
図9eは、ダウンミックスエネルギーが、常に同じであり、第1のチャンネルと第2のチャンネルとの間のすべての位相差についてかつ第1のチャンネルと第2のチャンネルとの間のすべてのレベル差ALDについて1に等しいということを例示する。
【0093】
しかしながら、
図9fは、
図9dに例示されるpについての方程式およびqについての方程式に0になり得る分母があるという事実に起因して、
図9dのE
Mについての方程式の規則の計算によって被る不連続性を例示する。
【0094】
図10a〜
図10eは、2つの以前に述べられた代替案の間の比較として見ることができるさらなる実施形態を例示する。
【0095】
ダウンミキシングは、
M = W
1[k](L[k] + R[k]) + W
2[k](L[k] - R[k])
によって与えられる。ただし、
【0098】
xについての方程式において、代替実施は、平方根のない分母を使用することである。
【0102】
今回は、利得W
2は、厳密に二次方程式の根の1つとして受け取られず、むしろ、
【0107】
結果として、エネルギー関係は、
図10aに示されるようにその間ずっと保存されることはない。他方では、利得W
2は、
図10eにおいてどんな不連続性も示さず、第2の実施形態と比較して、不安定性問題は、低減される。
【0108】
それ故に、
図10aは、
図10a〜
図10eによって例示されるこの実施形態のエネルギー関係を例示し、そこでは、もう一度、ダウンミックスエネルギーは、y-軸に例示され、チャンネル間レベル差は、x-軸に例示される。
図10bは、
図1によって適用される方程式およびブロック76に関して例示されるように第1の重み付け係数W
1を計算するために行われる手順を例示する。さらに、
図10cは、
図9a〜
図9fの実施形態に関してW
2の代替計算を例示する。特に、pは、
図10cを
図9dにおける同様の方程式と比較するときに現れる絶対値関数に従う。
【0109】
図10dはその時もう一度、pおよびqの計算を示し、
図10dは、
図9dの下部における方程式におおよそ対応する。
【0110】
図10eは、
図10a〜
図10dに例示される実施形態によるこの新しいダウンミキシングのエネルギー関係を例示し、利得W
2だけが、0.5の最大値に近づくように見える。
【0111】
前の記述およびある図は、詳細な方程式を提供するけれども、利点は、方程式が、厳密に計算されないときでさえすでに得られているが、しかし方程式が計算されるとき、結果は、変更されることに留意すべきである。特に、
図3の第1の重み付け係数計算機15および第2の重み付け係数計算機24の機能性は、第1の重み付け係数または第2の重み付け係数が、上で与えられる方程式に基づいて決定される値の±20%の範囲内にある値を有するように行われる。好ましい実施形態では、重み付け係数は、上記の方程式によって決定される値の±10%の範囲内にある値を有するように決定される。より好ましい実施形態では、ずれは、±1%だけであり、最も好ましい実施形態では、方程式の結果は、厳密に受け取られる。しかし、述べられたように、本発明の利点は、上述の方程式からの±20%のずれが、適用されるとき、得られてさえいる。
【0112】
図5は、マルチチャンネルエンコーダの一実施形態を例示し、その場合
図1〜
図4、
図8a〜
図10eに関して前に論じられたような本発明のダウンミキサが、使用されてもよい。特に、マルチチャンネルエンコーダは、2つ以上のチャンネルを有するマルチチャンネル信号12の少なくとも2つのチャンネルからマルチチャンネルパラメータ84を計算するためのパラメータ計算機82を備える。さらに、マルチチャンネルエンコーダは、前に論じられたように実施されてもよくかつ1つまたは複数のダウンミックスチャンネル40を提供するダウンミキサ80を備える。マルチチャンネルパラメータ84および1つまたは複数のダウンミックスチャンネル40は両方とも、1つまたは複数のダウンミックスチャンネルおよび/またはマルチチャンネルパラメータを含むエンコードされたマルチチャンネル信号を出力するための出力インターフェース86に入力される。別法として、出力インターフェースは、エンコードされたマルチチャンネル信号を記憶するまたは例えば
図6に例示されるマルチチャンネルデコーダに伝送するために構成されてもよい。
図6に例示されるマルチチャンネルデコーダは、入力として、エンコードされたマルチチャンネル信号88を受け取る。この信号は、入力インターフェース90に入力され、入力インターフェース90は、一方では、マルチチャンネルパラメータ92を、他方では、1つまたは複数のダウンミックスチャンネル94を出力する。両方のデータ項目、すなわちマルチチャンネルパラメータ92およびダウンミックスチャンネル94は、マルチチャンネル再構成器96に入力され、それは、その出力において、最初の入力チャンネルの近似を再構成し、一般に、出力オーディオオブジェクトをまたは参照番号98によって示されるようなそれに類似の何でも含むまたはそれらから成ることもある出力チャンネルを出力する。特に、
図5におけるマルチチャンネルエンコーダおよび
図6におけるマルチチャンネルデコーダは一緒に、オーディオ処理システムを表し、そこではマルチチャンネルエンコーダは、
図5に関して論じられたように動作可能であり、マルチチャンネルデコーダは、例えば
図6に例示されるように実施され、一般に
図6において98で例示される再構成されたオーディオ信号を得るために、エンコードされたマルチチャンネル信号をデコードするために構成される。それ故に、
図5および
図6に関して例示される手順は加えて、マルチチャンネルエンコーディングの方法およびマルチチャンネルデコーディングの対応する方法を含むオーディオ信号を処理する方法を表す。
【0113】
発明的な方法でエンコードされたオーディオ信号は、デジタル記憶媒体もしくは非一時的記憶媒体上に記憶されてもよくまたは無線伝送媒体などの伝送媒体もしくはインターネットなどの有線伝送媒体上で伝送されてもよい。
【0114】
いくつかの態様が、装置の文脈において述べられたけれども、これらの態様がまた、対応する方法の記述を表し、その場合ブロックまたはデバイスが、方法ステップまたは方法ステップの特徴に対応することは、明らかである。類似的に、方法ステップの文脈において述べられる態様はまた、対応する装置の対応するブロックまたは項目または特徴の記述も表す。
【0115】
ある実施要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実施されてもよい。実施は、その上に記憶された電子的に読み出し可能な制御信号を有するデジタル記憶媒体、例えばフロッピーディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを使用して行われてもよく、それらは、それぞれの方法が行われるようなプログラム可能なコンピュータシステムと協調する(または強調する能力がある)。
【0116】
本発明によるいくつかの実施形態は、本明細書で述べられる方法の1つが、行われるように、プログラム可能なコンピュータシステムと協調する能力がある、電子的に読み出し可能な制御信号を有するデータキャリアを備える。
【0117】
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実施されてもよく、プログラムコードは、コンピュータプログラム製品が、コンピュータ上で動くとき、本方法の1つを行うために動作可能である。プログラムコードは、例えば機械可読キャリア上に記憶されることもある。
【0118】
他の実施形態は、機械可読キャリアまたは非一時的記憶媒体上に記憶される、本明細書で述べられる方法の1つを行うためのコンピュータプログラムを含む。
【0119】
言い換えれば、本発明の方法の一実施形態は、従って、コンピュータプログラムが、コンピュータ上で動くとき、本明細書で述べられる方法の1つを行うためのプログラムコードを有するコンピュータプログラムである。
【0120】
本発明の方法のさらなる実施形態は、従って、本明細書で述べられる方法の1つを行うためのコンピュータプログラムを含み、その上に記録するデータキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。
【0121】
本発明の方法のさらなる実施形態は、従って、本明細書で述べられる方法の1つを行うためのコンピュータプログラムを表すデータストリームまたは一連の信号である。データストリームまたは一連の信号は例えば、データ通信接続部を介して、例えばインターネットを介して転送されるように構成されてもよい。
【0122】
さらなる実施形態は、本明細書で述べられる方法の1つを行うように構成されまたは適合される処理手段、例えばコンピュータ、またはプログラム可能な論理デバイスを備える。
【0123】
さらなる実施形態は、本明細書で述べられる方法の1つを行うためのコンピュータプログラムをその上にインストールしたコンピュータを備える。
【0124】
いくつかの実施形態では、プログラム可能な論理デバイス(例えばフィールドプログラマブルゲートアレイ)が、本明細書で述べられる方法の機能性のいくつかまたはすべてを行うために使用されてもよい。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書で述べられる方法の1つを行うために、マイクロプロセッサと協調してもよい。一般に、本方法は好ましくは、任意のハードウェア装置によって行われる。
【0125】
上述の実施形態は、単に本発明の原理の説明に役立つだけである。本明細書で述べられる配置および詳細の変更および変形が、当業者には明らかとなることは、理解される。従って、差し迫った特許請求項の範囲によってだけ制限され、本明細書の実施形態の記述および説明を通じて提示される具体的詳細によっては制限されないことが、意図することである。
【0126】
<付記>
〔実施例1〕
2つ以上のチャンネルを有するマルチチャンネル信号(12)の少なくとも2つのチャンネルをダウンミックスするためのダウンミキサにおいて、
前記少なくとも2つのチャンネルから部分的ダウンミックス信号(14)を計算するためのプロセッサ(10)と、
前記マルチチャンネル信号(12)から相補信号を計算するための相補信号計算機(20)であって、前記相補信号(22)は、前記部分的ダウンミックス信号(14)とは異なる、相補信号計算機(20)と、
前記マルチチャンネル信号のダウンミックス信号(40)を得るために前記部分的ダウンミックス信号(14)および前記相補信号(22)を加算するための加算器(30)とを備える、少なくとも2つのチャンネルをダウンミックスするためのダウンミキサ。
〔実施例2〕
前記プロセッサ(10)は、前記少なくとも2つのチャンネルが、同相であるときは、前記マルチチャンネル信号(12)の前記少なくとも2つのチャンネルと前記部分的ダウンミックスチャンネルとの間の定義済みエネルギーまたは振幅関係が、満たされるように、かつ前記少なくとも2つのチャンネルが、位相を異にするときは、エネルギー損失が、前記少なくとも2つのチャンネルに関して前記部分的ダウンミックス信号内に生み出されるように、前記部分的ダウンミックス信号(14)を計算する(50)ように構成され、
前記相補信号計算機は、前記部分的ダウンミックス信号(14)の前記エネルギーまたは振幅損失が、前記加算器(30)における前記部分的ダウンミックス信号(14)および前記相補信号(22)の前記加算によって部分的にまたは完全に補償されるように、前記相補信号を計算する(52)ように構成される、実施例1に記載のダウンミキサ。
〔実施例3〕
前記相補信号計算機(20)は、前記相補信号が、前記部分的ダウンミックス信号(14)に関して0.7未満のコヒーレンスインデックスを有するように、前記相補信号(22)を計算するように構成され、0.0のコヒーレンスインデックスは、完全なインコヒーレンスを示し、1.0のコヒーレンスインデックスは、完全なコヒーレンスを示す、実施例1または2に記載のダウンミキサ。
〔実施例4〕
前記相補信号計算機(20)は、前記相補信号を計算するために、前記マルチチャンネル信号が、前記少なくとも2つのチャンネルよりも多いチャンネル、または無相関化された第1のチャンネル、無相関化された第2のチャンネル、無相関化されたさらなるチャンネル、前記第1のチャンネルおよび前記第2のチャンネルを伴う無相関化された差もしくは無相関化された部分的ダウンミックス信号(14)を有するとき、前記少なくとも2つのチャンネルの第1のチャンネル、前記少なくとも2つのチャンネルの第2のチャンネル、前記第1のチャンネルと前記第2のチャンネルとの間の差、前記第2のチャンネルと前記第1のチャンネルとの間の差、前記マルチチャンネル信号のさらなるチャンネルを含む信号のグループの1つの信号を使用するように構成される、実施例1から3のいずれか一つに記載のダウンミキサ。
〔実施例5〕
前記プロセッサ(10)は、
前記少なくとも2つのチャンネルと前記少なくとも2つのチャンネルの合計信号との間の定義済みエネルギーまたは振幅関係に従って前記少なくとも2つのチャンネルの合計に重み付けをするための時間または周波数依存重み付け係数を計算すること(70)、および
計算された重み付け係数を定義済みしきい値と比較すること(72)、および
前記計算された重み付け係数が、定義済みしきい値に対して第1の関係にあるとき、前記部分的ダウンミックス信号(14)を計算するために前記計算された重み付け係数を使用すること(74)、または
前記計算された重み付け係数が、前記定義済みしきい値に対して前記第1の関係とは異なる第2の関係にあるとき、前記部分的ダウンミックス信号(14)を計算するために前記計算された重み付け係数の代わりに前記定義済みしきい値を使用すること(76)、または
前記計算された重み付け係数が、前記定義済みしきい値に対して前記第1の関係とは異なる第2の関係にあるとき、変更機能を使用して(76)変更された重み付け係数を導くことであって、前記変更機能は、前記変更された重み付け係数が、前記計算された重み付け係数よりも前記定義済みしきい値により近いようなものである、変更された重み付け係数を導くことのために構成される、実施例1から4のいずれか一つに記載のダウンミキサ。
〔実施例6〕
前記プロセッサ(10)は、
前記少なくとも2つのチャンネルと前記少なくとも2つのチャンネルの合計信号との間の定義済みエネルギーまたは振幅関係に従って前記少なくとも2つのチャンネルの合計に重み付けをするための時間または周波数依存重み付け係数を計算すること(70)、および
変更機能を使用して変更された重み付け係数を導くことであって、前記変更機能は、変更された重み付け係数が、前記定義済みエネルギー関係によって定義されるようなエネルギーよりも小さい前記部分的ダウンミックス信号のエネルギーをもたらすようなものである、変更された重み付け係数を導くことのために構成される、実施例1から5のいずれか一つに記載のダウンミキサ。
〔実施例7〕
前記プロセッサ(10)は、時間または周波数依存重み付け係数を使用して前記少なくとも2つのチャンネルの合計信号に重み付けをする(16)ように構成され、前記重み付け係数W
1は、前記重み付け係数が、周波数ビンkおよび時間インデックスnについては次の方程式、
【数24】
またはサブバンドbおよび時間インデックスnについては次の方程式、
【数25】
に基づいて決定される値の±20%に範囲内にある値を有するように計算され、
ただしAは、実数値の定数であり、Lは、前記マルチチャンネル信号(12)の前記少なくとも2つのチャンネルの第1のチャンネルを表し、Rは、前記少なくとも2つのチャンネルの第2のチャンネルを表す、実施例1から6のいずれか一つに記載のダウンミキサ。
〔実施例8〕
前記相補信号計算機(20)は、前記少なくとも2つのチャンネルの1つのチャンネルを使用し、時間または周波数依存相補重み付け係数W
2を使用して前記使用されるチャンネルに重み付けをするように構成され、前記相補重み付け係数W
2は、前記相補重み付け係数が、周波数ビンkおよび時間インデックスnについては次の方程式、
【数26】
またはサブバンドbおよび時間インデックスnについては次の方程式、
【数27】
に基づいて決定される値の±20%の範囲内にある値を有するように計算され、
ただしLは、前記マルチチャンネル信号(12)の第1のチャンネルを表し、Rは、第2のチャンネルを表す、実施例1から7のいずれか一つに記載のダウンミキサ。
〔実施例9〕
前記相補信号発生器(20)は、前記マルチチャンネル信号(12)の第1のチャンネルと前記第2のチャンネルとの間の差を使用し、時間および周波数依存相補重み付け係数を使用して前記差信号に重み付けをするように構成され、前記相補重み付け係数は、前記相補重み付け係数が、次の方程式、
【数28】
に基づいて決定される値の±20%の範囲内にある値を有するように計算され、
ただし
【数29】
【数30】
ただしLは、前記マルチチャンネル信号(12)の前記第1のチャンネルであり、Rは、前記第2のチャンネルである、実施例1から7のいずれか一つに記載のダウンミキサ。
〔実施例10〕
前記相補信号発生器(20)は、前記マルチチャンネル信号(12)の第1のチャンネルと前記第2のチャンネルとの間の差を使用し、時間および周波数依存相補重み付け係数を使用して前記差信号に重み付けをするように構成され、前記相補重み付け係数は、前記相補重み付け係数が、次の方程式、
【数31】
に基づいて決定される値の±20%の範囲内にある値を有するように計算され、
ただし
【数32】
【数33】
ただしLは、前記マルチチャンネル信号(12)の前記第1のチャンネルであり、Rは、前記第2のチャンネルである、実施例1から7のいずれか一つに記載のダウンミキサ。
〔実施例11〕
前記プロセッサ(10)は、
前記少なくとも2つのチャンネルから合計信号を計算し、
前記合計信号と前記少なくとも2つのチャンネルとの間の所定の関係に従って前記合計信号に重み付けをするための重み付け係数を計算し(15)、
定義済みしきい値よりも高い計算された重み付け係数を変更し(76)、かつ
前記部分的ダウンミックス信号(14)を得るために前記合計信号に重み付けをするための前記変更された重み付け係数を適用するように構成される、実施例1から10のいずれか一つに記載のダウンミキサ。
〔実施例12〕
前記プロセッサ(10)は、前記定義済みしきい値の±20%の範囲内にあるように前記計算された重み付け係数を変更し、または前記計算された重み付け係数が、次の方程式、
【数34】
に基づいて決定される値の±20%の範囲内にある値を有するように、前記計算された重み付け係数を変更するように構成され、
ただし
【数35】
ただしAは、実数値の定数であり、Lは、前記マルチチャンネル信号(12)の第1のチャンネルであり、Rは、第2のチャンネルである、実施例1から11のいずれか一つに記載のダウンミキサ。
〔実施例13〕
2つ以上のチャンネルを有するマルチチャンネル信号(12)の少なくとも2つのチャンネルをダウンミックスするための方法において、
前記少なくとも2つのチャンネルから部分的ダウンミックス信号(14)を計算するステップと、
前記マルチチャンネル信号(12)から相補信号を計算するステップであって、前記相補信号(22)は、前記部分的ダウンミックス信号(14)とは異なる、ステップと、
前記マルチチャンネル信号のダウンミックス信号(40)を得るために前記部分的ダウンミックス信号(14)および前記相補信号(22)を加算するステップとを含む、少なくとも2つのチャンネルをダウンミックスするための方法。
〔実施例14〕
2つまたは2つよりも多いチャンネルを有するマルチチャンネル信号の少なくとも2つのチャンネルからマルチチャンネルパラメータ(84)を計算するためのパラメータ計算機(82)と、
実施例1から12のいずれか一つに記載のダウンミキサ(80)と、
前記1つもしくは複数のダウンミックスチャンネル(40)および/または前記マルチチャンネルパラメータ(84)を含むエンコードされたマルチチャンネル信号を出力するまたは記憶するための出力インターフェース(86)とを備える、マルチチャンネルエンコーダ。
〔実施例15〕
マルチチャンネル信号をエンコードするための方法であって、
2つまたは2つよりも多いチャンネルを有するマルチチャンネル信号の少なくとも2つのチャンネルからマルチチャンネルパラメータ(84)を計算するステップと、
実施例13に記載の方法に従ってダウンミックスするステップと、
前記1つまたは複数のダウンミックスチャンネル(40)および前記マルチチャンネルパラメータ(84)を含むエンコードされたマルチチャンネル信号(88)を出力するまたは記憶するステップとを含む、マルチチャンネル信号をエンコードするための方法。
〔実施例16〕
エンコードされたマルチチャンネル信号(88)を発生させるための実施例14に記載のマルチチャンネルエンコーダと、
再構成されたオーディオ信号(98)を得るために前記エンコードされたマルチチャンネル信号(88)をデコードするためのマルチチャンネルデコーダとを備えるオーディオ処理システム。
〔実施例17〕
オーディオ信号を処理する方法であって、
実施例15に記載のマルチチャンネルエンコードをするステップと、
再構成されたオーディオ信号(98)を得るためにエンコードされたマルチチャンネル信号をマルチチャンネルデコードするステップとを含む、オーディオ信号を処理する方法。
〔実施例18〕
コンピュータまたはプロセッサ上で動くとき、実施例13、15または17のいずれか一つに記載の方法を行うためのコンピュータプログラム。
【0127】
参考文献
[1] US 7,343,281 B2, “PROCESSING OF MULTI-CHANNEL SIGNALS”, Koninklijke Philips Electronics N.V., Eindhoven (NL)
[2] Samsudin, E. Kurniawati, Ng Boon Poh, F. Sattar, and S. George, “A Stereo to Mono Downmixing Scheme for MPEG-4 Parametric Stereo Encoder,” in IEEE International Conference on Acoustics, Speech and Signal Processing, vol. 5, 2006, pp. 529-532.
[3] T. M. N. Hoang, S. Ragot, B. Kovesi, and P. Scalart, “Parametric Stereo Extension of ITU-T G. 722 Based on a New Downmixing Scheme,” IEEE International Workshop on Multimedia Signal Processing (MMSP) (2010).
[4] W. Wu, L. Miao, Y. Lang, and D. Virette, “Parametric Stereo Coding Scheme with a New Downmix Method and Whole Band Inter Channel Time/Phase Differences,” in IEEE International Conference on Acoustics, Speech and Signal Processing, 2013, pp. 556-560.
[5] Alexander Adami, Emanuel A.P. Habets, Jurgen Herre, “DOWN-MIXING USING COHERENCE SUPPRESSION”, 2014 IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP)
[6] Vilkamo, Juha; Kuntz, Achim; Fug, Simone, “Reduction of Spectral Artifacts in Multichannel Downmixing with Adaptive Phase Alignment”, AES August 22, 2014