特許7343519 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

特許7343519位相値を大きさ値に適用するダウンミキサ、オーディオ符号化装置、方法及びコンピュータプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-09-04

(45)【発行日】2023-09-12

(54)【発明の名称】位相値を大きさ値に適用するダウンミキサ、オーディオ符号化装置、方法及びコンピュータプログラム

(51)【国際特許分類】

G10L 19/008 20130101AFI20230905BHJP

【ＦＩ】

G10L19/008

【請求項の数】 36

(21)【出願番号】P 2020554533

(86)(22)【出願日】2019-04-05

(65)【公表番号】

(43)【公表日】2021-08-12

(86)【国際出願番号】 EP2019058713

(87)【国際公開番号】W WO2019193185

(87)【国際公開日】2019-10-10

【審査請求日】2020-12-01

(31)【優先権主張番号】18166174.5

(32)【優先日】2018-04-06

(33)【優先権主張国・地域又は機関】EP

(73)【特許権者】

【識別番号】500341779

【氏名又は名称】フラウンホーファー－ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン

(74)【代理人】

【識別番号】100134119

【弁理士】

【氏名又は名称】奥町哲行

(72)【発明者】

【氏名】カラペティアン・アレクサンダー

(72)【発明者】

【氏名】ヴォルフ・フェリックス

(72)【発明者】

【氏名】プロクシュティース・ヤン

【審査官】菊池智紀

(56)【参考文献】

【文献】特開２００４－０４８７４１（ＪＰ，Ａ）

【文献】特表２０１３－５４６０１３（ＪＰ，Ａ）

【文献】特表２０１７－５０１４３８（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１２／０３０８０１８（ＵＳ，Ａ１）

【文献】HOANG, Thi Minh Nguyet et al.，"Parametric stereo extension of ITU-T G.722 based on a new downmixing scheme"，Proc. of the 2010 IEEE International Workshop on Multimedia Signal Processing，2010年10月04日，pp.188-193

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１９／００－１９／２６

Ｈ０４Ｓ１／００－７／００

ＩＥＥＥＸｐｌｏｒｅ

(57)【特許請求の範囲】

【請求項1】

【請求項2】

前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ）の前記算定とは別に、前記ダウンミックス信号の前記スペクトル領域値の前記位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ）を算定するように構成される、請求項１に記載のダウンミキサ。

【請求項3】

前記入力信号のスペクトル領域値（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５０１ａ、５０１ｎ）のラウドネス値（５０３ａ、５０３ｂ）を算定するように構成され、
前記入力信号の前記スペクトル領域値の前記ラウドネス値に基づき、前記ダウンミックス信号の前記スペクトル領域値に関連付けられた合計ラウドネス値（５０３ｄ）を導出するように構成され、
前記合計ラウドネス値から前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ、１２２、２２１、２２２、５０５、５０６ａ）を導出するように構成される、請求項１又は請求項２に記載のダウンミキサ。

【請求項4】

前記ダウンミックス信号の前記スペクトル領域値の極座標表現の絶対値として前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ、１２２、２２１、２２２、５０５、５０６ａ）を使用するように、前記ダウンミックス信号の前記スペクトル領域値の前記極座標表現の位相値として前記位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を使用するように、及び前記極座標表現に基づき、前記ダウンミックス信号の前記スペクトル領域値のデカルト複素表現（５１１ａ、５１１ｂ）を得るように構成される、
請求項１から３のいずれか一項に記載のダウンミキサ。

【請求項5】

キャンセル度情報（Ｑ、２３２、６１２ａ）を算定し、前記ダウンミックス信号のスペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ、２２２、５０６ａ）の前記算定において前記キャンセル度情報を考慮するように構成され、
前記キャンセル度情報が、前記入力信号のスペクトル領域値間の建設的又は破壊的干渉の程度を説明し、
前記キャンセル度情報により破壊的干渉が示される場合に、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ、２２２、５０６ａ）を、前記入力信号の前記スペクトル領域値のラウドネス値の合計を表す大きさ値（Ｍ_Ｒ、２２１、５０５）と比較して選択的に低減するように構成される、
請求項１から４のいずれか一項に記載のダウンミキサ。

【請求項6】

異なる配向を有する前記入力信号の前記スペクトル領域値（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５０１ａ、５０１ｎ）の成分に関する別個の合計（ｓｕｍＩｍ＋、ｓｕｍＩｍ－、ｓｕｍＲｅ＋、ｓｕｍＲｅ－）を算定するように構成され、
異なる配向を有する前記入力信号の前記スペクトル領域値の成分に関する前記別個の合計（ｓｕｍＩｍ＋、ｓｕｍＩｍ－、ｓｕｍＲｅ＋、ｓｕｍＲｅ－）に基づき、前記キャンセル度情報（Ｑ）を算定するように構成される、
請求項５に記載のダウンミキサ。

【請求項7】

前記算定された合計のうち、直交する配向に関連付けられており、支配的な合計値として、反対の方向（ｓｕｍＩｍ－及びｓｕｍＲｅ－）に関連付けられている合計以上である２つ（ｓｕｍＩｍ＋及びｓｕｍＲｅ＋）を選択するように構成され、
－第１の支配的な合計値（ｓｕｍＲｅ＋）の配向と反対の配向に関連付けられた第１の非支配的な合計値（ｓｕｍＲｅ－）と、前記第１の支配的な合計値（ｓｕｍＲｅ＋）との間の符号なし比率、及び
－第２の支配的な合計値（ｓｕｍＩｍ＋）の配向と反対の配向に関連付けられた第２の非支配的な合計値（ｓｕｍＩｍ－）と、前記第２の支配的な合計値（ｓｕｍＩｍ＋）との間の符号なし比率に基づき、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ）の選択的な低減を引き起こすスケーリング値（Ｑ、Ｑｍａｐｐｅｄ）を算定するように構成され、
その結果、非支配的な合計値とその関連付けられた支配的な合計値との間で符号なし比率（｜ｓｕｍＲｅ－｜／ｓｕｍＲｅ＋、｜ｓｕｍＩｍ－｜／ｓｕｍＩｍ＋）が増加すると、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ）が低減する、
請求項６に記載のダウンミキサ。

【請求項8】

以下の式に従って前記キャンセル度情報Ｑを計算するように構成され、前記式において、
ｓｕｍＲｅ＋は、前記入力オーディオ信号の複素スペクトル領域値（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５０１ａ、５０１ｎ）の正の実部の合計であり、
ｓｕｍＲｅ－は、前記入力オーディオ信号の複素スペクトル領域値の負の実部の合計であり、
ｓｕｍＩｍ＋は、前記入力オーディオ信号の複素スペクトル領域値の正の虚部の合計であり、
ｓｕｍＩｍ－は、前記入力オーディオ信号の複素スペクトル領域値の負の虚部の合計である、
請求項５から７のいずれか一項に記載のダウンミキサ。
・

及び

の場合：

・

及び

の場合：

・

及び

の場合：

・

及び

の場合：

【請求項9】

前記キャンセル度情報（Ｑ（ｔ））を経時的に追跡するように、また、前記キャンセル度情報の履歴に応じて、前記キャンセル度情報（Ｑ）が前記入力信号間の比較的小さい破壊的干渉を示す時点で、前記基準値（Ｍ_Ｒ）に対して前記大きさ値を選択的にどの程度増加させるかを算定するように構成される、
請求項１から８のいずれか一項に記載のダウンミキサ。

【請求項10】

前ダウンミキサが、前記キャンセル度情報を追跡するために、無限インパルス応答平滑化演算又はスライディング平均平滑化演算を使用して、瞬時キャンセル度情報（Ｑ（ｔ））に基づき、時間的平滑化キャンセル度情報（Ｑｓｍｏｏｔｈ（ｔ））を得るように構成される、請求項１から９のいずれか一項に記載のダウンミキサ。

【請求項11】

前記時間的平滑化キャンセル度情報（Ｑ_{ｓｍｏｏｔｈ}（ｔ））に応じて、瞬時キャンセル度値（Ｑ（ｔ））をマッピングされたキャンセル度値（Ｑ_{ｍａｐｐｅｄ}）にマッピングするように構成され、
それにより、前記大きさ値の低減を示す前記時間的平滑化キャンセル度情報の値が、前記瞬時キャンセル度値を超える前記マッピングされたキャンセル度値の増加をもたらす、請求項１０に記載のダウンミキサ。

【請求項12】

ｐが０＜ｐ＜１の定数である

により、前の平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ－１）に基づき、及び瞬時キャンセル度値Ｑ（ｔ）に基づき、更新された平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ）を得るように構成され、また、
Ｔが０＜Ｔ＜１の定数であり、
Ｑ（ｔ）が０～１の間の範囲であり、前記入力信号間の比較的大きい破壊的干渉には値０を、前記入力信号間の比較的小さい破壊的干渉には値１をとる

により、マッピングされたキャンセル度値Ｑｍａｐｐｅｄ（ｔ）を得るように構成され、
前記マッピングされたキャンセル度値を使用して基準大きさ値（５０５）をスケーリングして、前記大きさ値（５０６ａ）を得るように構成される、
請求項１から１１のいずれか一項に記載のダウンミキサ。

【請求項13】

ｐが０＜＝ｐ＜＝１の定数である

により、前の平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ－１）に基づき、及び瞬時キャンセル度値Ｑ（ｔ）に基づき、更新された平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ）を得るように構成され、
また、Ｇが所定の値又は０．５～２０の間若しくは１～１０の間の定数であり、
ｍ_{ｓｌｏｐｅ}（ｔ）が補助変数であり、
ｍａｘ｛｝が最大演算子であり、
ｍｉｎ｛｝が最小演算子であり、
Ｑ（ｔ）が０～１の間の範囲であり、前記入力信号間の比較的大きい破壊的干渉には値０を、前記入力信号間の比較的小さい破壊的干渉には値１をとる

【請求項14】

キャンセル度値（Ｑ_{ｍａｐｐｅｄ}）を使用して前記入力信号のスペクトル領域値の合計ラウドネスに対応する大きさ値（Ｍ_Ｒ、２２１）をスケーリングして、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ、２２２）を得るように構成される、
請求項１から１３のいずれか一項に記載のダウンミキサ。

【請求項15】

前記入力信号のスペクトル領域値（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５０１ａ、５０１ｎ）の加重和（３９２）を算定して前記入力信号のスペクトル領域値の前記加重和に基づき前記位相値（３９８）を算定するように構成され、
所定の干渉レベルより大きい破壊的干渉を回避するような方法で前記入力信号のスペクトル領域値に重み付けして、前記加重和を得るように構成され、
相対的に大きい大きさを有するスペクトル領域値に、相対的に大きい重みを付ける、
請求項１から１４のいずれか一項に記載のダウンミキサ。

【請求項16】

前記入力信号のスペクトル領域値の加重和（３９２）を算定して、
前記入力信号のスペクトル領域値の前記加重和に基づき前記位相値（３９８）を算定するように構成され、
異なる入力信号におけるそれぞれのスペクトルビンの時間平均強度（３６２、３７２、３８２）に応じて前記入力信号のスペクトル領域値を重み付けして、前記加重和を得るように構成される、
請求項１から１５のいずれか一項に記載のダウンミキサ。

【請求項17】

複数の入力オーディオ信号（１０１０ａ、１０１０ｎ）に基づき、符号化されたオーディオ表現（１０１２）を提供するためのオーディオ符号化装置（１０００）であって、
請求項１から１６のいずれか一項に記載のダウンミキサを含み、
前記ダウンミキサは、前記複数の入力オーディオ信号のスペクトル領域表現に基づきダウンミックス信号（１０２２）を提供するように構成され、
前記符号化されたオーディオ表現（１０１２）を得るために、前記ダウンミックス信号を符号化するように構成される、オーディオ符号化装置。

【請求項18】

複数の入力信号に基づきダウンミックス信号を提供する方法（９００）であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値の大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ）を算定（９１０）することと、
前記ダウンミックス信号のスペクトル領域値の位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ）を算定（９２０）することと、
前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数表現を得るために、前記位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ）を適用（９３０）することと、
前記入力信号の複素スペクトル領域値の合計（５０７ｂ、５０７ｄ）又は加重和（３９２）を算定して、前記入力信号のスペクトル領域値に関する、前記合計の実部及び虚部あるいは前記加重和の実部及び虚部に基づき、前記位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を算定することとを含み、
前記方法により算定されるキャンセル度情報（Ｑ、２３２）が前記入力信号間の比較的大きい破壊的干渉を示す時点で、前記大きさ値（Ｍ^Ｍｏｄ _Ｒ）が基準値（Ｍ_Ｒ、２２１）に対して選択的に低減され、前記入力信号のスペクトル領域値の合計ラウドネスに対応するように、また、
前記キャンセル度情報（Ｑ）が前記入力信号間の比較的小さい破壊的干渉を示す時点で、前記大きさ値が前記基準値（Ｍ_Ｒ）に対して選択的に増やされるように、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ、２２２）を算定することを含む、
方法。

【請求項19】

コンピュータプログラムがコンピュータ上で実行されるときに、請求項１８に記載の方法を実行するためのコンピュータプログラム。

【請求項20】

【請求項21】

複数の入力信号（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５００ａ、５００ｎ、１０１０ａ、１０１０ｎ）に基づきダウンミックス信号（５９２、１０２２）を提供するためのダウンミキサ（１００、５００、６００、８００、１０２０）であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値（１１２、５１１ａ、５１１ｂ）の大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ、１２２、２２１、２２２、５０５、５０６ａ）を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現（１１２、５１１ａ、５１１ｂ）を得るために、前記位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を適用するように構成され、
キャンセル度情報（Ｑ、２３２、６１２ａ）を算定し、前記ダウンミックス信号のスペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ、２２２、５０６ａ）の前記算定において、前記キャンセル度情報を考慮するように構成され、
前記キャンセル度情報は、前記入力信号のスペクトル領域値間の建設的干渉又は破壊的干渉の程度を示し、
前記キャンセル度情報により破壊的干渉が示される場合に、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ、２２２、５０６ａ）を、前記入力信号の前記スペクトル領域値のラウドネス値の合計を表す大きさ値（Ｍ_Ｒ、２２１、５０５）と比較して選択的に低減するように構成され、
相異なる配向を有する前記入力信号の前記スペクトル領域値（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５０１ａ、５０１ｎ）の成分の合計（ｓｕｍＩｍ＋、ｓｕｍＩｍ－、ｓｕｍＲｅ＋、ｓｕｍＲｅ－）を算定するように構成され、
相異なる配向を有する前記入力信号の前記スペクトル領域値の成分の前記合計（ｓｕｍＩｍ＋、ｓｕｍＩｍ－、ｓｕｍＲｅ＋、ｓｕｍＲｅ－）に基づき、前記キャンセル度情報（Ｑ）を算定するように構成され、
直交する配向に関連付けられており、また支配的な合計値として、反対の方向（ｓｕｍＩｍ－、ｓｕｍＲｅ－）に関連付けられている合計以上である前記算定された合計のうち２つ（ｓｕｍＩｍ＋、ｓｕｍＲｅ＋）を選択するように構成され、
－第１の支配的な合計値（ｓｕｍＲｅ＋）の配向と反対の配向に関連付けられた第１の非支配的な合計値（ｓｕｍＲｅ－）と、前記第１の支配的な合計値（ｓｕｍＲｅ＋）との間の符号なし比率、及び
－第２の支配的な合計値（ｓｕｍＩｍ＋）の配向と反対の配向に関連付けられた第２の非支配的な合計値（ｓｕｍＩｍ－）と、前記第２の支配的な合計値（ｓｕｍＩｍ＋）との間の符号なし比率に基づき、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ）の選択的な低減を引き起こすスケーリング値（Ｑ、Ｑｍａｐｐｅｄ）を算定するように構成され、
その結果、非支配的な合計値とその関連付けられた支配的な合計値との間で符号なし比率（｜ｓｕｍＲｅ－｜／ｓｕｍＲｅ＋、｜ｓｕｍＩｍ－｜／ｓｕｍＩｍ＋）が増加すると、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ）が低減する、
ダウンミキサ。

【請求項22】

及び

の場合：

□

及び

の場合：

□

及び

の場合：

□

及び

の場合：

【請求項23】

【請求項24】

により、マッピングされたキャンセル度値Ｑｍａｐｐｅｄ（ｔ）を得るように構成され、
前記マッピングされたキャンセル度値を使用して基準大きさ値（５０５）をスケーリングして、前記大きさ値（５０６ａ）を得るように構成される、ダウンミキサ。

【請求項25】

により、前の平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ－１）に基づき、及び瞬時キャンセル度値Ｑ（ｔ）に基づき、更新された平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ）を得るように構成され、また、
Ｇが所定の値又は０．５～２０の間若しくは１～１０の間の定数であり、
ｍ_{ｓｌｏｐｅ}（ｔ）が補助変数であり、
ｍａｘ｛｝が最大演算子であり、
ｍｉｎ｛｝が最小演算子であり、
Ｑ（ｔ）が０～１の間の範囲であり、前記入力信号間の比較的大きい破壊的干渉には値０を、前記入力信号間の比較的小さい破壊的干渉には値１をとる

【請求項26】

【請求項27】

複数の入力信号（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５００ａ、５００ｎ、１０１０ａ、１０１０ｎ）に基づきダウンミックス信号（５９２、１０２２）を提供するためのダウンミキサ（１００、５００、６００、８００、１０２０）であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値（１１２、５１１ａ、５１１ｂ）の大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ、１２２、２２１、２２２、５０５、５０６ａ）を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現（１１２、５１１ａ、５１１ｂ）を得るために、前記位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を適用するように構成され、
前記入力信号のスペクトル領域値の加重和（３９２）を算定し、
前記入力信号のスペクトル領域値の前記加重和に基づき前記位相値（３９８）を算定するように構成され、
異なる入力信号におけるそれぞれのスペクトルビンの時間平均強度（３６２、３７２、３８２）に応じて、重み付け値を使用して前記入力信号のスペクトル領域値を重み付けして、前記加重和を得るように構成され、
前記入力信号のスペクトル領域値（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５０１ａ、５０１ｎ）のラウドネス値（５０３ａ、５０３ｂ）を算定するように構成され、
前記入力信号の前記スペクトル領域値の前記ラウドネス値に基づき、前記ダウンミックス信号の前記スペクトル領域値に関連付けられた合計ラウドネス値（５０３ｄ）を導出するように構成され、
前記合計ラウドネス値から前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ、１２２、２２１、２２２、５０５、５０６ａ）を導出するように構成され、
同一の周波数及び後続の各時間に関連付けられた前記入力信号のうち第１の入力信号に関する複数のスペクトルビンのスペクトル領域値にわたる平均を形成して、前記重み付け値のうち第１の入力信号に対応する第１の重み付け値（３６２）を得るように構成され、
同一の周波数及び後続の各時間に関連付けられた前記入力信号のうち第２の入力信号に関する複数のスペクトルビンのスペクトル領域値にわたる平均を形成して、前記重み付け値のうち第２の信号に対応する第２の重み付け値（３７２）を得るように構成される、ダウンミキサ。

【請求項28】

【請求項29】

複数の入力信号（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５００ａ、５００ｎ、１０１０ａ、１０１０ｎ）に基づきダウンミックス信号（５９２、１０２２）を提供するための方法であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値（１１２、５１１ａ、５１１ｂ）の大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ、１２２、２２１、２２２、５０５、５０６ａ）を算定することを含み、
前記ダウンミックス信号の前記スペクトル領域値の位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を算定することを含み、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現（１１２、５１１ａ、５１１ｂ）を得るために、前記位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を適用することを含み、
キャンセル度情報（Ｑ、２３２、６１２ａ）を算定し、前記ダウンミックス信号のスペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ、２２２、５０６ａ）の前記算定において、前記キャンセル度情報を考慮することを含み、
前記キャンセル度情報は、前記入力信号のスペクトル領域値間の建設的干渉又は破壊的干渉の程度を示し、
前記キャンセル度情報により破壊的干渉が示される場合に、前記入力信号の前記スペクトル領域値のラウドネス値の合計を表す大きさ値（Ｍ_Ｒ、２２１、５０５）と比較したとき、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ、２２２、５０６ａ）を選択的に低減することを含み、
異なる配向を有する前記入力信号の前記スペクトル領域値（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５０１ａ、５０１ｎ）の成分の合計（ｓｕｍＩｍ＋、ｓｕｍＩｍ－、ｓｕｍＲｅ＋、ｓｕｍＲｅ－）を算定することを含み、
異なる配向を有する前記入力信号の前記スペクトル領域値の成分の前記合計（ｓｕｍＩｍ＋、ｓｕｍＩｍ－、ｓｕｍＲｅ＋、ｓｕｍＲｅ－）に基づき、前記キャンセル度情報（Ｑ）を算定することを含み、
直交する配向に関連付けられており、また支配的な合計値として、反対の方向（ｓｕｍＩｍ－、ｓｕｍＲｅ－）に関連付けられている合計以上である前記算定された合計のうち２つ（ｓｕｍＩｍ＋、ｓｕｍＲｅ＋）を選択することを含み、
－第１の支配的な合計値（ｓｕｍＲｅ＋）の配向と反対の配向に関連付けられた第１の非支配的な合計値（ｓｕｍＲｅ－）と、前記第１の支配的な合計値（ｓｕｍＲｅ＋）との間の符号なし比率、及び
－第２の支配的な合計値（ｓｕｍＩｍ＋）の配向と反対の配向に関連付けられた第２の非支配的な合計値（ｓｕｍＩｍ－）と、前記第２の支配的な合計値（ｓｕｍＩｍ＋）との間の符号なし比率に基づき、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ）の選択的な低減を引き起こすスケーリング値（Ｑ、Ｑｍａｐｐｅｄ）を算定することを含み、
その結果、非支配的な合計値とその関連付けられた支配的な合計値との間で符号なし比率（｜ｓｕｍＲｅ－｜／ｓｕｍＲｅ＋、｜ｓｕｍＩｍ－｜／ｓｕｍＩｍ＋）が増加すると、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ^Ｍｏｄ _Ｒ）が低減する、方法。

【請求項30】

及び

の場合：

・

及び

の場合：

・

及び

の場合：

・

及び

の場合：

【請求項31】

【請求項32】

により、前の平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ－１）に基づき、及び瞬時キャンセル度値Ｑ（ｔ）に基づき、更新された平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ）を得ることと、
Ｔが０＜Ｔ＜１の定数であり、Ｑ（ｔ）が０～１の間の範囲であり、前記入力信号間の比較的大きい破壊的干渉には値０を、前記入力信号間の比較的小さい破壊的干渉には値１をとる

により、マッピングされたキャンセル度値Ｑｍａｐｐｅｄ（ｔ）を得ることと、
前記マッピングされたキャンセル度値を使用して基準大きさ値（５０５）をスケーリングして、前記大きさ値（５０６ａ）を得ることとを含む、方法。

【請求項33】

により、前の平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ－１）に基づき、及び瞬時キャンセル度値Ｑ（ｔ）に基づき、更新された平滑化キャンセル度値Ｑｓｍｏｏｔｈ（ｔ）を得ることと、
Ｇが所定の値又は０．５～２０の間若しくは１～１０の間の定数であり、
ｍ_{ｓｌｏｐｅ}（ｔ）が補助変数であり、
ｍａｘ｛｝が最大演算子であり、
ｍｉｎ｛｝が最小演算子であり、
Ｑ（ｔ）が０～１の間の範囲であり、前記入力信号間の比較的大きい破壊的干渉には値０を、前記入力信号間の比較的小さい破壊的干渉には値１をとる

【請求項34】

【請求項35】

複数の入力信号（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５００ａ、５００ｎ、１０１０ａ、１０１０ｎ）に基づきダウンミックス信号（５９２、１０２２）を提供するための方法であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値（１１２、５１１ａ、５１１ｂ）の大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ、１２２、２２１、２２２、５０５、５０６ａ）を算定することと、
前記ダウンミックス信号の前記スペクトル領域値の位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を算定することと、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現（１１２、５１１ａ、５１１ｂ）を得るために、前記位相値（Ｐ_Ｐ、Ｐ^Ｍｏｄ _Ｐ、１３２、３９８、５０８ａ、５１０ａ）を適用することと、
前記入力信号のスペクトル領域値の加重和（３９２）を算定し、前記入力信号のスペクトル領域値の前記加重和に基づき前記位相値（３９８）を算定することと、
異なる入力信号におけるそれぞれのスペクトルビンの時間平均強度（３６２、３７２、３８２）に応じて、重み付け値を使用して前記入力信号のスペクトル領域値を重み付けして、前記加重和を得ることと、
前記入力信号のスペクトル領域値（１１０ａ、１１０ｂ、２１０ａ、２１０ｂ、５０１ａ、５０１ｎ）のラウドネス値（５０３ａ、５０３ｂ）を算定することと、
前記入力信号の前記スペクトル領域値の前記ラウドネス値に基づき、前記ダウンミックス信号の前記スペクトル領域値に関連付けられた合計ラウドネス値（５０３ｄ）を導出することと、
前記合計ラウドネス値から前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値（Ｍ_Ｒ、Ｍ^Ｍｏｄ _Ｒ、１２２、２２１、２２２、５０５、５０６ａ）を導出することと、
同一の周波数及び後続の各時間に関連付けられた前記入力信号のうち第１の入力信号に関する複数のスペクトルビンのスペクトル領域値にわたる平均を形成して、前記重み付け値のうち第１の入力信号に対応する第１の重み付け値（３６２）を得ることと、
同一の周波数及び後続の各時間に関連付けられた前記入力信号のうち第２の入力信号に関する複数のスペクトルビンのスペクトル領域値にわたる平均を形成して、前記重み付け値のうち第２の信号に対応する第２の重み付け値（３７２）を得ることとを含む、方法。

【請求項36】

コンピュータプログラムがコンピュータ上で実行されるときに、請求項２８から３５のいずれかに記載の方法を実行するための前記コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明による実施形態は、複数の入力信号に基づきダウンミックス信号を提供するためのダウンミキサに関する。

【0002】

本発明によるさらなる実施形態は、複数の入力オーディオ信号に基づき符号化されたオーディオ表現を提供するためのオーディオ符号化装置に関する。

【0003】

本発明によるさらなる実施形態は、複数の入力信号に基づきダウンミックス信号を提供するための方法に関する。

【0004】

本発明によるさらなる実施形態は、コンピュータプログラムに関する。

【背景技術】

【0005】

オーディオ信号処理の分野では、複数のオーディオ信号を単一のオーディオ信号に結合することが望ましい場合がある。例えば、これにより、オーディオ符号化の複雑さが軽減される場合がある。元のオーディオ信号の特性及び／又はダウンミックス処理の特性に関する情報は、例えば、符号化されたオーディオ表現、並びにダウンミックス信号自体に（好ましくは符号化された形式で）含まれ得る。

【0006】

ダウンミキシングは、例えば、複数チャネル構成のプログラムをより少ないチャネルのプログラムに変換する処理である。この問題に関しては、例えば、Ｗｉｋｉｐｅｄｉａにある「ｄｏｗｎｍｉｘｉｎｇ」の定義を参照されたい。

【0007】

特殊な事例は、（耳ごとに）バイノーラルでレンダリングされた複数の信号が１つのチャネルにミックスダウンされるバイノーラルダウンミックスである。従来、マルチチャネル信号のＮチャネルは、単純な加算によって一緒にマージされて、Ｍチャネル信号を形成する（ここで、通常は、Ｎ＞Ｍ）。

【0008】

以下では、いくつかのダウンミックスの問題について説明する。

【0009】

複数のオーディオ信号をミックスダウンすると、望ましくない干渉が結果として生じ得ることが見出された。また、干渉は以下の３つのカテゴリに分類できることも見出された。

【0010】

１．２つの信号（信号は、例えば、大きさ（長さ）と位相（角度）を表すベクトルＳで表すことができる）Ｓ_１とＳ_２が、特定の時点において同様の位相角を確かに有し（例えば、図４ａを参照）、その結果、建設的干渉（例えば、＋３ｄＢのエネルギー加算の代わりに＋６ｄＢの大きさ加算）がある。

【0011】

２．両方のベクトルが特定の時間において異なる方向を指している場合（例えば、図４ｂを参照）、部分的に破壊的干渉がある。

【0012】

３．両方のベクトルが同様の大きさを確かに有し、角度差が約１８０°の場合、強力な破壊的干渉又は完全なキャンセルさえある（例えば、図４ｃを参照）。この場合、結果として生じるベクトルは、誤った位相角を有する。

【0013】

結論として、ダウンミックス処理の実行中に生じ得る３つのタイプの干渉について説明した。これら３つのタイプの干渉を図４に示す。

【0014】

この問題は、広帯域信号においても個々の周波数帯域においても発生する。オーディオ品質に関して、最初の２タイプの干渉は、音色の好ましくない変化、フランジャのような効果、部分的に残響のある印象などをもたらす。一方、３つ目のタイプの干渉は、信号成分のキャンセルをもたらすか、前述のアーチファクトを（知覚的に）増幅する可能性がある。

【0015】

好ましくない音の変化を補正するための１つの手法は、ミックスダウンされた信号のスペクトルを修正することによって実行されることが見出された。個々の周波数帯域におけるエネルギー保存補正を通じて、受動ダウンミックスがスペクトル領域において等化され、所望のスペクトルが（ほぼ）達成されることが見出された。また、好ましくは、エネルギー値は、この方法を使用して経時的に平滑化されるべきであることも見出された。しかし、平滑化することにより、結果として得られる補正値は反応が遅くなり、建設的干渉をさらに増幅したり、破壊的干渉を減衰させたりすることができることが見出された。

【0016】

このような概念は、エネルギー補正されたダウンミックスとして要約できる。

【0017】

米国特許第７，０３９，２０４号明細書は、オーディオミキシングの等化について説明している。Ｎチャネル入力信号をミキシングしてＭチャネル出力信号を生成する間、ミキシングされたチャネル信号は、出力信号の総エネルギー／ラウドネスレベルを入力信号の総エネルギー／ラウドネスレベルに実質的に等しく維持するために等化（例えば、増幅）される。一実施形態では、Ｎ入力チャネル信号は、フレームごとに周波数領域に変換され、Ｎチャネル入力信号の総スペクトルラウドネスが推定される。Ｎ入力チャネル信号のスペクトルを（例えば、加重和を使用して）ミキシングした後、結果として得られるミキシングされたＭチャネル信号の総スペクトルラウドネスも推定される。２つのラウドネス推定値に基づく周波数依存のゲイン係数が、ミキシングされたＭチャネル信号のスペクトル成分に適用されて、等化されミキシングされたＭチャネル信号が生成される。Ｍチャネル出力信号は、等化されミキシングされたＭチャネル信号を時間領域に変換することによって生成される。

【先行技術文献】

【特許文献】

【0018】

【文献】米国特許第７０３９２０４号明細書

【発明の概要】

【発明が解決しようとする課題】

【0019】

しかしながら、従来の概念を考慮すると、オーディオ品質と計算の複雑さとの間のトレードオフを改善するダウンミキシングの概念が必要である。

【課題を解決するための手段】

【0020】

本発明による実施形態は、複数の入力信号（例えば、複素値であり得、例えば、入力オーディオ信号であり得る）に基づきダウンミックス信号を提供するためのダウンミキサを作製する。ダウンミキサは、入力信号のラウドネス情報に基づき（例えば、入力信号の特定のスペクトルビンに関連付けられたラウドネス値に基づき）、（例えば、特定のスペクトルビンに関する）ダウンミックスされた信号のスペクトル領域値の大きさ値を算定する（例えば、計算又は推定する）ように構成される。ダウンミキサは、（例えば、特定のスペクトルビンに関する）ダウンミックス信号のスペクトル領域値の（例えば、スカラ値であり得る）位相値を算定するように構成される。例えば、ダウンミキサは、大きさ値の算定とは別に位相値を算定するように構成され得る。ダウンミキサは、ダウンミックス信号のスペクトル領域値の大きさ値に基づき、（例えば、特定のスペクトルビンに関する）ダウンミックス信号のスペクトル領域値の複素数値表現を得るために位相値を適用するように構成される。

【0021】

本発明によるこの実施形態は、計算の複雑さとオーディオ品質との間の良好なトレードオフが、スカラ値であるダウンミックス信号のスペクトル領域値の大きさ値を計算することによって、また通常は当該大きさ値とは別に計算されるスカラ値である位相値を後続のステップにおいて適用することによって達成され得るという考えに基づく。したがって、ほとんどの処理ステップはスカラ値で動作でき、ダウンミックス信号のスペクトル領域値の複素数値表現は、計算の後期（又は最終）段階でのみ生成される。

【0022】

さらに、入力信号のラウドネス情報に基づきスカラの大きさ値の算定が良好な精度で可能であることが見出された。入力信号のラウドネス情報を使用して大きさ値を得ることにより、大きさ値が破壊的干渉の影響を強く受けることを回避できる。これは、入力信号のラウドネス情報が破壊的干渉の影響を通常受けず、したがって、ラウドネス情報を大きさ値にマッピングすると、通常、数値的に安定した解が得られるという事実による。

【0023】

言い換えれば、主に入力信号のラウドネス情報に基づきスペクトル領域値の大きさ値を算定することによって（キャンセル効果を考慮するために、ラウドネス情報を大きさ値にマッピングした後、任意で補正可能）、複素数値の追加とその後のスケーリングによって引き起こされる可能性のある数値の不安定性とアーチファクトを回避できる。

【0024】

さらに、大きさ値を算定するときに入力信号のラウドネス情報を考慮することにより、建設的干渉の場合に発生する可能性があり、通常はアーチファクトとして認識される６ｄＢの信号増幅を回避できる。むしろ、入力信号のラウドネス情報を考慮することにより、入力信号を表す複素値を単純に加算する場合と比較して、知覚されるラウドネスに対してダウンミックス信号がより良好に適合されることを達成できる。

【0025】

さらに、大きさ値の算定から切り離された別個の位相計算が、高度の柔軟性をもたらすことが見出された。位相計算は良好な精度で行うことができ、破壊的干渉の場合に位相値を算定するために補正を適用することが可能である。位相値は通常スカラ値であり、これは大きさ値が算定されたときにのみ適用されるので、位相値を算定及び補正するための計算の労力は特に小さい。

【0026】

結論として、計算効率と聴覚印象の間の良好なトレードオフは、処理チェーンの最後（すなわち、ダウンミキシングの最後）に、大きさ値と位相値を別々に処理し、これらの値を結合するだけで、ダウンミックス信号のスペクトル領域値の複素数値表現を得ることによって達成できることが見出された。

【0027】

好ましい実施形態では、ダウンミキサは、ダウンミックス信号のスペクトル領域値の大きさ値の算定とは別に、ダウンミックス信号のスペクトル領域値の位相値を算定するように構成される。大きさ値と位相値のそのような別個の処理と算定は、計算上効率的であることが示されている。また、大きさ値を算定するための処理パスにおいて破壊的干渉の制御不能な影響はない。

【0028】

好ましい実施形態では、ダウンミキサは、入力信号のスペクトル領域値のラウドネス値を算定するように構成される。ダウンミキサは、入力信号のスペクトル領域値のラウドネス値に基づき、ダウンミックス信号のスペクトル領域値に関連付けられる合計ラウドネス値を導出するように構成される。ダウンミキサは、合計ラウドネス値からダウンミックス信号のスペクトル領域値の大きさ値（例えば、振幅値）を導出するように構成される。したがって、大きさ値は、知覚されるラウドネスを十分に表す。しかしながら、合計ラウドネスを考慮し、この合計ラウドネス値を大きさ値に変換することにより、ダウンミックス信号のスペクトル領域値の大きさ値（例えば、振幅値）が、入力信号によって建設的干渉が示される場合に、過度のラウドネスを含まないことを達成できる。この場合、ラウドネスの加算だけがあるが、ラウドネスの２次増加はなく、これにより、妥当な聴覚印象がもたらされる。一方、入力信号間に破壊的干渉が存在する場合でも、破壊的干渉も存在せず、したがって、大きさ値の「深い谷」は存在しない。したがって、導出された大きさ値は、さらなる処理によく適している。所望であれば、数値の問題なしに、大きさ値を減衰させること、又は大きさ値を増加させることさえも容易に可能である。具体的には、ラウドネス値に基づきこの大きさ値を導出することには、（合計ラウドネス値を考慮することによって）両方の極端に小さな値が回避され、（振幅の直接加算を回避することによって）過度に大きい値も回避されるので、大きさ値が常に値の妥当な範囲内にあるという利点がある。したがって、そのような処理は大きな利点である。

【0029】

好ましい実施形態では、ダウンミキサは、入力信号のスペクトル領域値の合計又は加重和を算定して、入力信号のスペクトル領域値のその合計又は加重和に基づき、位相値を算定するように構成される。このような位相値の計算を使用することにより、（強力な破壊的干渉の場合はいくつかの誤差が発生する可能性があるが、）多くの状況で正確で信頼できる位相値を得ることができる。

【0030】

好ましい実施形態では、ダウンミキサは、ダウンミックス信号のスペクトル領域値の極座標表現の絶対値としてダウンミックス信号のスペクトル領域値の大きさ値を使用し、ダウンミックス信号のスペクトル領域値の極座標表現の位相値として位相値を使用するように構成される。さらに、ダウンミキサは、極座標表現に基づき、ダウンミックス信号のスペクトル領域値のデカルト複素表現を得るように構成される。したがって、スペクトル領域値のデカルト複素表現は、処理の比較的遅い段階で得られ、先行する処理段階によって絶対値と位相値が別々に算定される。完全な複素値を処理すると、入力信号間の位相関係によっては望ましくないアーチファクトが発生する可能性があるため、このような処理が有利であることが見出された。むしろ、処理の後期段階で（又はダウンミックス信号の算定の最終段階としてさえ）絶対値と位相値を結合するだけで、そのようなアーチファクトが回避される。また、絶対値と位相値の個別処理は、複素値を複数の処理段階で処理するより計算的に容易である。

【0031】

好ましい実施形態では、ダウンミキサは、キャンセル度情報（例えば、Ｑ）を算定（例えば、計算）し、ダウンミックス信号のスペクトル領域値の大きさ値（例えば、

）の算定においてキャンセル度情報を考慮するように構成される。例えば、キャンセル度情報は、入力信号の（例えば、同じスペクトルビンに関連付けられている）スペクトル領域値間の建設的干渉又は破壊的干渉の程度を示す（又は定量的に示す）。さらに、ダウンミキサは、大きさ値（例えば、

）と比較したとき（又はそれに関して）、又はキャンセル度情報が破壊的干渉を示す場合に入力信号のスペクトル領域値のラウドネス値の合計を表す「基準大きさ」と比較したとき（又はそれに関して）、ダウンミックス信号のスペクトル領域値の大きさ値（例えば、

）を選択的に低減（例えば、減衰）するように構成される（ここで、例えば、大きさ値の低減は、キャンセル度情報に応じて連続的に変化してもよい）。強い破壊的干渉が見つかったとき、この場合の位相値は通常信頼できないため、スペクトル領域値の大きさ値を低減することが推奨されることが見出された。言い換えれば、強い破壊的干渉の存在は、通常、位相値を信頼できないものにする、すなわち広い角度範囲で急速に変化させる。このような場合、ダウンミックス信号のスペクトル領域値の大きさ値を低減すると、アーチファクトの低減に役立つ。ただし、入力信号のスペクトル領域値の複素表現を単純に加算する場合と比較して、ダウンミックス信号のスペクトル領域値の大きさ値を適切に制御された方法で低減する方がよいことが見出された。

【0032】

言い換えれば、この概念は、計算効率と（強力な）破壊的干渉の影響の低減との間の特に良好なトレードオフを可能にする。

【0033】

好ましい実施形態では、ダウンミキサは、（例えば、４つの）相異なる配向（例えば、正の虚軸の方向に配向を有する成分、負の虚軸の方向に配向を有する成分、正の実軸の方向に配向を有する成分、及び負の実軸の方向に配向を有する成分、あるいは、入力信号のスペクトル領域値の合計のベクトルによって算定され得る第１の方向に配向を有する成分、当該第１の方向に直交する第２の方向に配向を有する成分、当該第１の方向と反対の第３の方向に配向を有する成分、及び当該第２の方向と反対の第４の方向に配向を有する成分）を有する入力信号のスペクトル領域値の成分の合計（例えば、ｓｕｍＩｍ＋、ｓｕｍＩｍ－、ｓｕｍＲｅ＋、ｓｕｍＲｅ－）を算定するように構成される。さらに、ダウンミキサは、相異なる配向を有する入力信号のスペクトル領域値の成分の合計（例えば、ｓｕｍＩｍ＋、ｓｕｍＩｍ－、ｓｕｍＲｅ＋、ｓｕｍＲｅ－）に基づきキャンセル度情報を算定するように構成される。

【0034】

相異なる配向を有する入力信号のスペクトル領域値の成分の合計を評価することにより、予想されるキャンセル度を効率的に判断できることが見出された。例えば、成分がすべて同じ配向を有する場合（例えば、すべてが正の虚部と正の実部を有する場合）、強いキャンセルはないと予想できる。一方、反対方向の成分の合計が類似しているか、又は同一でさえある場合、高いキャンセル度があると結論付けることができる。言い換えれば、相異なる配向又は方向の成分の合計を比較することにより、ある程度のキャンセルを効率的かつ確実に結論付けることが可能である。したがって、過度のキャンセルが予想される場合（又は同等に、位相情報が信頼できないと予想される場合）、ダウンミックス信号のスペクトル領域値の大きさ値を適応させることが可能である。

【0035】

好ましい実施形態では、ダウンミキサは、算定された合計のうち２つ（例えば、ｓｕｍＩｍ＋及びｓｕｍＲｅ＋）を選択するように構成され、これら合計は、直交する配向又は方向（例えば、正の虚軸に沿って、及び正の実軸に沿って）に関連付けられており、支配的な合計値（例えば、ｓｕｍＩｍ＋及びｓｕｍＲｅ＋）として、反対の配向又は方向（例えば、ｓｕｍＩｍ－及びｓｕｍＲｅ－）に関連付けられている合計以上である。例えば、ダウンミキサは、２つの配向について、算定された合計のどちらが最大の大きさを有するかを判断し、これらの合計を「支配的な合計値」として選択するように構成される。さらに、ダウンミキサは、スケーリング値（例えば、Ｑ又はＱ_{ｍａｐｐｅｄ}）を算定するように構成され、これにより、第１の支配的な合計値（例えば、ｓｕｍＲｅ＋）の配向と反対の方向又は配向に関連付けられた第１の非支配的な合計値（例えば、ｓｕｍＲｅ－）と、当該第１の支配的な合計値（例えば、ｓｕｍＲｅ＋）との間の符号なし比率（すなわち、符号が考慮されていない場合の比率、又は絶対値の比率、又は比率の絶対値）に基づくとともに、第２の支配的な合計値（例えば、ｓｕｍＩｍ＋）の配向（又は方向）と反対の配向（又は方向）に関連付けられた第２の非支配的な合計値（例えば、ｓｕｍＩｍ－）と、当該第２の支配的な合計値（例えば、ｓｕｍＩｍ＋）との間の符号なし比率（例えば、符号が考慮されていない場合の比率、又は絶対値の比率、又は比率の絶対値）にも基づく、ダウンミックス信号のスペクトル領域値の大きさ値（例えば、

）の選択的低減がもたらされ、その結果、非支配的な合計値と、その関連する支配的な合計値との間の符号なし比率（例えば、｜ｓｕｍＲｅ－｜／ｓｕｍＲｅ＋及び｜ｓｕｍＩｍ－｜／ｓｕｍＩｍ＋）の増加によって、ダウンミックス信号のスペクトル領域値の大きさ値（例えば、

）の低減（例えば、スケーリング値Ｑの低減）がもたらされる。この実施形態は、反対方向に関連付けられた合計値間の比率が、負の（破壊的な）干渉の程度についての信頼できる情報を提供するという考えに基づいている。例えば、最初の非支配的な合計値が最初の支配的な合計値よりも大幅に小さい場合、（最初の支配的な合計に関連付けられている）最初の方向と（最初の非支配的な合計に関連付けられている）３番目の方向との間にキャンセルがないか、わずかしかないと結論付けることができる。同様に、第１の非支配的な合計値と、その関連する第１の支配的な合計値との間の符号なし比率（すなわち、符号を考慮しない比率）が大きくなる（例えば、１に近づく）と、（第１の支配的な合計値が関連付けられている）第１の方向と（第１の非支配的な合計値が関連付けられている）第３の方向との間に比較的強いキャンセルがあると結論付けることができる。結論として、非支配的な合計値と支配的な合計値は、入力信号間のキャンセルを認識するために効率的に使用でき、したがって、ダウンミックス信号のスペクトル領域値の大きさ値の低減を制御するために効率的に使用できる。

【0036】

好ましい実施形態では、ダウンミキサは、本明細書に記載の式に従ってキャンセル度情報Ｑを計算するように構成される。この場合、ｓｕｍＲｅ＋は、（例えば、正の実部を有するすべての複素スペクトル領域値が考慮される、考慮下のスペクトルビン内の）入力オーディオ信号の複素スペクトル領域値の正の実部の合計である。ｓｕｍＲｅ－は（例えば、考慮下のスペクトルビン内の）入力オーディオ信号の複素スペクトル領域値の負の実部の合計であり、負の実部を有するすべての複素スペクトル領域値が考慮される。ｓｕｍＩｍ＋は、（例えば、考慮下のスペクトルビン内の）入力オーディオ信号の複素スペクトル領域値の正の虚部の合計である場合があり、正の虚部を有するすべての複素スペクトル領域値が考慮される）。ｓｕｍＩｍ－は、（例えば、考慮下のスペクトルビン内の）入力オーディオ信号の複素スペクトル領域値の負の虚部の合計であり、負の虚部を有するすべての複素スペクトル領域値が考慮される。したがって、上述の考察に従って効率的にキャンセル度情報Ｑを計算することができる。

【0037】

好ましい実施形態では、ダウンミキサは、ダウンミキサにより算定されるキャンセル度情報（例えば、Ｑ）が（例えば、考慮下のスペクトルビンにおける）入力信号間の比較的大きい破壊的干渉を示す時点で、大きさ値（例えば、

）が基準値（例えば、

）に対して選択的に低減され、入力信号のスペクトル領域値の合計ラウドネスに対応するように、また、キャンセル度情報（例えば、Ｑ）が入力信号間の比較的小さい破壊的干渉を示す時点で、大きさ値が基準値（例えば、

）に対して選択的に増やされるように、ダウンミックス信号のスペクトル領域値の大きさ値（例えば、

）を算定するように構成される。キャンセル度情報が比較的大きな破壊的干渉を示す時点でダウンミックス信号のスペクトル領域値の大きさ値を選択的に低減することにより、誤った位相値又は位相値の急速な変化によって引き起こされる可能性のある歪みを回避することができる。一方、キャンセル度情報が入力信号間の比較的小さい破壊的干渉を示す時点でダウンミックス信号のスペクトル領域値の大きさ値を選択的に増加させることによって、大きさ値の低減により引き起こされるエネルギー損失を少なくとも部分的に補償することができる。したがって、全体的な知覚されるラウドネスを維持することができる。ある時点でのダウンミックス信号のスペクトル領域値の大きさの選択的な低減（高い破壊的干渉がある場合）は、歪みのリスクが高くないその他の場合においてダウンミックス信号のスペクトル領域値の大きさの選択的な増加によって（少なくとも部分的に）補償される。したがって、エネルギー損失を少なくとも部分的に補償することができ、ダウンミックス信号の良好な聴覚印象を達成することができる。

【0038】

好ましい実施形態では、ダウンミキサは、キャンセル度情報（例えば、Ｑ（ｔ））を経時的に追跡するように、また、キャンセル度情報の履歴に応じて、キャンセル度情報（例えば、Ｑ）が入力信号間の比較的小さい破壊的干渉を示す時点で、基準大きさ値（例えば、Ｍ_Ｒ）に対して大きさ値（例えば、

）を選択的にどの程度増加させるかを算定するように、構成される。例えば、基準大きさ値に対する大きさ値の選択的増加は、以前に（例えば、時間平均で）大きさ値の比較的強い低減があった場合には、大きさ値が比較的大きい値だけ増加するように、以前に（例えば、時間平均で）大きさ値の比較的小さい低減があった場合には、大きさ値が比較的小さい値だけ増加するように、決定することができる。言い換えれば、基準値に対する大きさ値の選択的な増加の程度は、キャンセル度情報が入力信号間の比較的大きい破壊的干渉を示す時点で大きさ値を選択的に低減することに起因するエネルギーの損失が、キャンセル度情報が比較的小さい破壊的干渉を示す時点で大きさ値を選択的に増加させることによって少なくとも部分的に補償されるように決定することができる。したがって、破壊的干渉が発生する時点での大きさ値の低減によって引き起こされるであろうエネルギー損失を、少なくとも部分的に補償することができ、キャンセル度情報の履歴は、どの程度の補償が適切であるかという信頼できる情報を提供する。

【0039】

好ましい実施形態では、ダウンミキサは、キャンセル度情報を追跡するために、無限インパルス応答平滑化演算又はスライディング平均平滑化演算を使用して、瞬時キャンセル度情報に基づき、時間的平滑化キャンセル度情報を得るように構成される。このような演算は、キャンセル度情報を追跡し、信頼できる結果をもたらすのによく適合していることが見出された。

【0040】

好ましい実施形態では、ダウンミキサは、時間的平滑化キャンセル度情報に応じて、マッピングされたキャンセル度値（例えば、Ｑ_{ｍａｐｐｅｄ}）に瞬時キャンセル度値（例えば、Ｑ（ｔ））をマッピングするように構成され（これによって、例えば、キャンセル度情報Ｑが入力信号間の比較的小さい破壊的干渉を示す時点で、大きさ値

が基準値Ｍ_Ｒに対してどの程度選択的に増やされるかを算定することができ）、その結果、大きさ値の（過去の／前の）低減を示す時間的平滑化キャンセル度情報の値は、（現在の）マッピングされたキャンセル度値の、瞬時の（現在の）キャンセル度値に対する（少なくとも、入力信号間の比較的小さい破壊的干渉を示す瞬時キャンセル度値に対する）増加をもたらす。したがって、キャンセル度情報の以前の展開によく適合するマッピングされたキャンセル度値を導出することが効果的に可能である。

【0041】

好ましい実施形態では、ダウンミキサは、ｐが０＜ｐ＜１の定数であり得る本明細書に記載の式により、前の平滑化キャンセル度値Ｑ_{ｓｍｏｏｔｈ}（ｔ－１）に基づき、及び瞬時の（現在の）キャンセル度値Ｑ（ｔ）に基づき、更新された平滑化キャンセル度値Ｑ_{ｓｍｏｏｔｈ}（ｔ）を得るように構成される。ダウンミキサはまた、Ｔが０＜Ｔ＜１の定数である本明細書に記載の式に従って、マッピングされたキャンセル度値Ｑ_{ｍａｐｐｅｄ}（ｔ）を得るように構成され得る。好ましくは、０．３＜＝Ｔ＜＝０．８の関係が成り立ち得る。さらに、Ｑ（ｔ）は０～１の間の範囲にあり、入力信号間の比較的大きな破壊的干渉については値０をとり、入力信号間の比較的小さい破壊的干渉については値１をとると仮定できる。マッピングされたキャンセル度値のそのような計算は、計算の複雑さを適度に小さく保ちながら、良好な結果をもたらすことが示されている。

【0042】

好ましい実施形態では、ダウンミキサは、キャンセル度値（例えば、Ｑ_{ｍａｐｐｅｄ}）を使用して入力信号のスペクトル領域値の合計ラウドネスに対応する大きさ値（例えば、Ｍ_Ｒに等しくてもよい「基準値」）をスケーリングして、ダウンミックス信号のスペクトル領域値の大きさ値を得るように構成される。したがって、ダウンミックス信号のスペクトル領域値は、干渉のリスクが高いときに（例えば、基準値に対して）低減する可能性があり、干渉のリスクが低いときに（例えば、基準値に対して）増加する可能性がある。したがって、破壊的干渉の可能性が高いときに過剰なアーチファクトを回避することができ、破壊的干渉の可能性が低いときにエネルギー損失を補償することができる。一方、ダウンミックス信号のスペクトル領域値の大きさ値は、建設的干渉の場合における過度のラウドネスの誇張も回避されるように、合理的な範囲内に保たれ得る。さらに、本明細書で説明する概念は、（例えば、破壊的干渉に起因して）ゼロに近い値を強く「アップスケール」することが回避されるため、数値の問題を回避する。

【0043】

好ましい実施形態では、ダウンミキサは、入力信号のスペクトル領域値の加重和を算定し、入力信号のスペクトル領域値のその加重和に基づき位相値を算定するように構成される。例えば、ダウンミキサは、所定の干渉レベルより大きい破壊的干渉を回避するような方法で、入力信号のスペクトル領域値に重み付けするように構成される。言い換えれば、位相値を算定するとき、過度の破壊的干渉を回避するために重み付けが導入され得る。例えば、そのような重み付けを使用することによって、（過去に比較的大きな大きさを有していたスペクトル領域値に比較的増加させた重みを置くなどにより）位相値の信頼性を高めることができる。したがって、位相算定の品質を改善することができる。

【0044】

好ましい実施形態では、ダウンミキサは、入力信号のスペクトル領域値の加重和を算定し、入力信号のスペクトル領域値のその加重和に基づき位相値を算定するように構成される。ダウンミキサは、相異なる入力信号におけるそれぞれのスペクトルビンの時間平均強度（例えば、振幅又はエネルギー又はラウドネス）に応じて、入力信号のスペクトル領域値に重み付けするように構成される。その結果、意味のある重み付けを達成でき、位相値の信頼性を向上させることができる。

【0045】

本発明による実施形態は、複数の入力オーディオ信号に基づき符号化されたオーディオ表現を提供するためのオーディオ符号化装置を作製する。オーディオ符号化装置は、上記のようなダウンミキサを備える。ダウンミキサは、複数の入力オーディオ信号の（好ましくは複素）スペクトル領域表現に基づき、ダウンミックス信号を提供するように構成される。オーディオ符号化装置は、符号化されたオーディオ表現を得るために、ダウンミックス信号を符号化するようにも構成されている。振幅値と位相値の両方の信頼性をダウンミキサによって高めることができるので、オーディオ符号化装置におけるそのようなダウンミキサの使用が特に有利であることが見出された。したがって、ダウンミックス信号は、オーディオ復号化装置の側でのオーディオ信号の再構成、又は直接再生にも適している。特に、本明細書に開示されるダウンミキシングの概念を使用するとアーチファクトが比較的小さいので、オーディオ符号化装置は、比較的「クリーンな」ダウンミックス信号を使用でき、これにより、符号化が容易になり、同時に復号化されたオーディオ信号の品質が向上する。

【0046】

本発明による別の実施形態は、複数の（例えば、入力オーディオ信号であり得る）（例えば、複素）入力信号に基づきダウンミックス信号を提供するための方法を作成する。この方法は、入力信号のラウドネス情報に基づき（例えば、入力信号の特定のスペクトルビンに関連付けられたラウドネス値に基づき）、（例えば、特定のスペクトルビンに関する）ダウンミックス信号のスペクトル領域値の大きさ値（例えば、Ｍ_Ｒ又は

）を算定する（例えば、計算又は推定する）ことを含む。この方法は、例えば、大きさ値の算定とは別に、（例えば、特定のスペクトルビンに関する）ダウンミックス信号のスペクトル領域値の（好ましくはスカラ）位相値（例えば、Ｐ_Ｐ又は

を算定することを含む。この方法はまた、スペクトル領域値の大きさ値に基づき、（例えば、特定のスペクトルビンに関する）ダウンミックス信号のスペクトル領域値の複素数表現を得るために、位相値（例えば、Ｐ_Ｐ又は

）を適用することを含む。この方法は、上記のダウンミキサと同じ考慮事項に基づく。この方法は、対応するダウンミキサに関しても、本明細書に記載の特徴、機能、及び詳細のいずれかによって補足され得ることにも留意されたい。この方法は、そのような特徴、機能、及び詳細を、個別に、又は組み合わせて使用することで補足され得る。

【0047】

本発明による別の実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに方法を実行するためのコンピュータプログラムを作成する。

【0048】

本発明による実施形態を、添付の図面を参照して以下に説明する。

【図面の簡単な説明】

【0049】

【図1】本発明の一実施形態による、ダウンミキサのブロック概略図である。

【図2】本発明の別の実施形態による、ダウンミキサのブロック概略図の抜粋である。

【図3】本発明の一実施形態による、位相値算定のブロック概略図である。

【図4】ダウンミックス処理中の３つのタイプの干渉の概略図である。

【図5】本発明の一実施形態による、ラウドネスを維持するダウンミックスの信号フローチャートである。

【図6】適応する基準大きさを使用したラウドネスダウンミックスの信号フローチャートである。

【図7】複素平面における３つの入力信号のキャンセル度の導出に関する概略図である。

【図8】適応する位相を使用したラウドネスダウンミックスの信号フローチャートである。

【図9】本発明の一実施形態による、ダウンミックス信号を提供する方法のフローチャートである。

【図10】本発明の一実施形態による、オーディオ符号化装置のブロック概略図である。

【図11】本明細書で説明されるラウドネス維持のための様々なマッピング概念を使用して達成できるマッピング曲線の例に関するグラフ表示である。

【発明を実施するための形態】

【0050】

１．図１によるダウンミキサ
図１は、本発明の一実施形態による、ダウンミキサ１００のブロック概略図を示す。

【0051】

ダウンミキサは、複数の入力信号１１０ａ、１１０ｂを受信し、それに基づき、ダウンミックス信号１１２を提供するように構成される。例えば、入力オーディオ信号であり得る第１の入力信号は、例えば、複素数表現であり得る（相異なる周波数又はスペクトルビンに関連付けられた）一連のスペクトル領域値によって表され得る。さらに、第２の入力信号はまた、例えば、複素数表現で表され得る（相異なる周波数又はスペクトルビンに関連付けられた）一連のスペクトル領域値を含み得る。

【0052】

ダウンミックス信号１１２は、ダウンミックス信号のスペクトル領域値によって（又は、一般に、相異なる周波数に関連付けられた複数のスペクトル領域値によって）表され得、これは、複素数表現の形で表され得る。

【0053】

以下では、１つのスペクトルビンのみの処理について考慮する。しかしながら、相異なるスペクトルビンのスペクトル領域値は、例えば、別々に同じ方法で処理され得る。

【0054】

ダウンミキサ１００は、（大きさ値算定部と見なすこともできる）大きさ値算定１２０を含む。大きさ値算定１２０は、入力信号１１０ａ、１１０ｂのラウドネス情報に基づき（例えば、入力信号の特定のスペクトルビンに関連付けられたラウドネス値に基づき）、（例えば、特定のスペクトルビンに関する）ダウンミックス信号のスペクトル領域値１１２の大きさ値１２２を算定するように構成される。例えば、大きさ値の算定は、第１の入力信号１１０ａのスペクトル領域値のラウドネスを算定する第１のラウドネス情報算定（又は算定部）１２４を含む。さらに、大きさ値算定１２０はまた、第２の入力信号１１０ｂのスペクトル領域値のラウドネス情報を算定する第２のラウドネス情報算定（又は算定部）１２６を含む。さらに、大きさ値算定１２０は、通常は、（ダウンミックス信号のスペクトル領域値の大きさ値の算定の基礎となり得る、又はダウンミックス信号のスペクトル領域値の大きさ値としても使用され得る）大きさ値１２２が、第１の入力信号１１０ａのそれぞれのスペクトル領域値及び第２の入力信号１１０ｂのそれぞれのスペクトル領域値の合計ラウドネスに基づくように、大きさ値１２２を算定する。しかしながら、大きさ値１２０は、大きさ値が、状況に応じて、合計ラウドネスよりも小さい又は合計ラウドネスよりも大きいラウドネスに対応するように明確に定義された方法で補正されるように、追加の補正を含み得る。しかしながら、大きさ値は通常、特定のスペクトル領域値に関連付けられた（例えば、特定のスペクトルビンに関連付けられた）１つのスカラ値であることに留意されたい。

【0055】

ダウンミキサ１００はまた、位相値算定（又は位相値算定部）１３０を含む。したがって、ダウンミキサは、（例えば、特定のスペクトルビンに関する）ダウンミックス信号のスペクトル領域値１１２の（スカラ）位相値１３２を算定するように構成される。例えば、位相値算定１３０は、第１の入力信号１１０ａ及び第２の入力信号１１０ｂを、すなわち第１の入力信号１１０ａの（特定のスペクトルビンに関連する）スペクトル領域値及び第２の入力信号１１０ｂの（特定のスペクトル領域に関連する）スペクトル領域値を受け取る。例えば、位相値算定（又は算定部）１３０は、大きさ値１２２の算定とは別に、位相値１３２を算定する。

【0056】

さらに、ダウンミキサはまた、（位相値適用部と見なすこともできる）位相値適用１４０を含む。したがって、ダウンミキサは、ダウンミックス信号のスペクトル領域値の大きさ値１２２に基づき、（例えば、特定のスペクトルビンに関する）ダウンミックス信号のスペクトル領域値１１２の複素数値表現を得るために、位相値１３２を適用するように構成される。

【0057】

一般的に言えば、ダウンミキサ１００は、例えば、大きさ値１１２及び位相値１３２を別々に算定し、その後、最終処理ステップとして、位相値１３２を適用して、ダウンミックス信号のスペクトル領域値の複素数表現を得ることができることに留意されたい。例えば、位相値１３２を使用して、大きさ値に基づき、ダウンミックス信号のスペクトル領域値の同相成分及び直交成分を導出することができ、その結果、ダウンミックス信号の複素スペクトル領域値のデカルト表現（実部及び虚部の表現）が得られる。入力信号のラウドネス情報に基づき（例えば、入力信号の特定のスペクトルビンのラウドネス値に基づき）大きさ値を導出することにより、（例えば、建設的干渉の場合におけるスペクトル領域値の単純な加算によって引き起こされる）過度のラウドネス及び（スペクトル領域値の単純な複素値の加算が実行された場合に破壊的干渉によって引き起こされる）大幅なラウドネスの低下を回避することができる一方で、良好な数値的安定性を得ることができる。また、複素加算された値の強力な事後補正を実行するソリューションから生じる数値の不安定性を回避できる。

【0058】

結論として、図１を参照して説明したダウンミキサは、著しい利点を備え、それは部分的には大きさ値１２２と位相値１３２を別々に処理することから生じ、また大きさ値１２２を算定する際にラウドネス情報を考慮することからも生じる。

【0059】

さらに、図１によるダウンミキサ１００は、本明細書に記載の特徴、機能、及び詳細のいずれかによって、それらを個別に及び組み合わせて使用することで、補足できることに留意されたい。また、ダウンミキサ１００に関して説明された特徴、機能、及び詳細は、個別に及び組み合わせて、他の実施形態に導入することができる。

【0060】

２．図２によるダウンミキサ
図２は、本発明の一実施形態による、ダウンミキサのブロック概略図の抜粋である。

【0061】

具体的には、図２は、（図１を参照して説明した第１の入力信号１１０ａに対応し得る）第１の入力信号２１０ａに基づくとともに、（図１を参照して説明した第２の入力信号１１０ｂに対応し得る）第２の入力信号２１０ｂにも基づく、（図１を参照して説明した大きさ値１２２に対応し得る）大きさ値２２２の導出を表す。

【0062】

また、図２に示す処理ユニット又は機能ブロック２００は、例えば、図１に示す大きさ値算定（大きさ値算定部）１２０の代わりになり得ることにも留意されたい。

【0063】

機能ブロック２００は、基準大きさ値算定又は基準大きさ値算定部２２０を含み、その機能は、一般に、大きさ値算定／大きさ値算定部１２０の機能と同様であり得る。例えば、基準大きさ値算定部２２０は、第１の入力信号２１０ａ及び第２の入力信号２１０ｂに基づき、基準大きさ値２２１を提供するように構成され得る。例えば、基準大きさ値算定２２０は、入力信号２１０ａ、２１０ｂのラウドネス情報に基づき、（未変更の基準と見なされ得る）ダウンミックス信号のスペクトル領域値の基準大きさ値２２１を導出することができる。例えば、基準大きさ値２２１は、ダウンミックス信号の特定のスペクトルビンに関連付けられたスカラ値であり得、第１の入力信号２１０ａの特定のスペクトルビンに関連付けられたラウドネス値及び第２の入力信号２１０ｂの特定のスペクトルビンに関連付けられたラウドネス値に基づくことができる。したがって、スペクトル領域値の基準大きさ値は、例えば、（例えば、入力信号の特定のスペクトルビンの）最小ラウドネス値よりも大きく、通常、入力信号２１０ａ、２１０ｂの特定のスペクトルビンの最大ラウドネス値よりさらに大きいラウドネスに対応し得る。言い換えれば、特定のスペクトルビンが入力信号２１０ａ、２１０ｂの両方において非常に小さい信号強度を含まない限り、基準大きさ２２１は、通常、特に小さくはない。一方、基準大きさ値２２１はまた、すべての入力信号のラウドネス情報に基づくので、通常、過度に大きな値を含まない。好ましくは、基準大きさ値２２１は、基準大きさ値の算定において入力信号の位相が考慮される場合に発生するであろう、入力信号の建設的干渉及び破壊的干渉の影響を受けない。むしろ、基準大きさ値は、例えば、入力信号の考慮下において特定のスペクトルビンにおけるラウドネスの追加を反映し得る。

【0064】

したがって、基準大きさ値２２１は、それが数値的に妥当な範囲内にあり、したがって数値の不安定性を引き起こすことなくダウンスケール及びアップスケールの両方が可能であると想定できるので、可能な補正の良好な基礎である。

【0065】

機能ブロック２００はまた、入力信号２１０ａ、２１０ｂ（又は少なくとも考慮下にある特定のスペクトルビンのスペクトル領域値）を受信するように構成されるキャンセル度計算２３０を含む。キャンセル度計算２３０は、キャンセル度情報２３２を提供し、これは一般に、入力信号の考慮下において（すなわち、それらの位相及び考えられるキャンセル効果の考慮下において）特定のスペクトルビンのスペクトル領域値が複素数として追加された場合にどの程度のキャンセル（破壊的干渉）が生じるかを示す。（現在又は瞬時のキャンセル度情報と見なすことができ、考慮下の特定のスペクトルビンに関連付けることができる）キャンセル度情報２３２を計算するための複数のメカニズムを使用することができる。しかしながら、好ましい手法では、（例えば、考慮下の特定のスペクトルビン内において、）Ｑによっても示されるキャンセル度情報２３２は、高いキャンセル度がある場合にはゼロに近い値を取り、キャンセル度情報Ｑは、低いキャンセル度がある場合には１に近い値をとる。

【0066】

キャンセル度情報２３２は、例えば、スペクトル領域値の（スケーリングされた）大きさ値２２２を導出するために、基準大きさ値２２１をスケーリングするために使用され得る。しかしながら、キャンセル度情報２３２を直接使用して基準大きさ値２２１をスケーリングすることは可能であるが、以下に説明する追加の処理を行うことが好ましい。

【0067】

好ましい実施形態では、機能ブロック２００はまた、マッピング（又はマッパー）２４０を含み、これは、（現在処理される時間ブロックに関連する考慮下の特定のスペクトルビンにおけるキャンセルの程度が示された）（瞬時の／現在の）キャンセル度情報を受け取り、それに基づいて、マッピングされたキャンセル度値（又はマッピングされたキャンセル度情報）２４２を提供する。例えば、マッピングされたキャンセル度値は、スケーリング（又はスケーラ２６０）に提供され、スケーリングは、マッピングされたキャンセル度値２４２に基づき基準大きさ値２２１をスケーリングし、それにより、ダウンミックス信号のスペクトル領域値の大きさ値２２２を導出する。

【0068】

機能ブロック２００は、好ましくは、時間的平滑化／履歴追跡２５０を含み、これは、キャンセル度情報又は時間的平滑化キャンセル度情報２５２を、マッピング／大きさ値調整算定２４０に提供する。言い換えれば、マッピング／大きさ値調整算定２４０は、好ましくは、瞬時（現在）キャンセル度情報２３２及び（例えば、時間的平滑化キャンセル度情報であり得る）キャンセル度履歴情報２５２を受け取る。したがって、マッピング／大きさ値調整算定２４０は、瞬時（現在）キャンセル度情報２３２に基づき、マッピングされたキャンセル度値２４２を提供することができ、瞬時（現在）キャンセル度情報２３２は、キャンセル度履歴情報２５２に応じて選択的に増やされ、それにより、マッピングされたキャンセル度情報２４２を導出することができる。

【0069】

例えば、キャンセル度情報２３２は、０～１の範囲内の値であり得、その結果、キャンセル度情報２３２による基準大きさ値２２１の直接スケーリングは、典型的には、エネルギーの低減をもたらす。しかしながら、基準大きさ値２２１は、（例えば、考慮下のスペクトルビン内の）入力信号２１０ａ、２１０ｂの間に高いキャンセル度がある場合、スケーラ２６０によってスケールダウンされるべきであることが見出された。一方、低いキャンセル度があるときに、基準大きさ値２２１を適度に「スケールアップ」することは問題がないことも見出された。言い換えれば、現在の瞬間に高いキャンセル度がある場合、マッピングされたキャンセル度値２４２は、１より著しく小さく（例えば、０．５より小さく、又はさらに０．３より小さく、又はさらに０．１より小さく）なければならないことが見出された。一方、低いキャンセル度があるときに、マッピングされたキャンセル度値２４２が１よりいくらか大きい場合（例えば、１と１．２の間、又は１と１．５の間、又はさらに１と２の間）は、問題がないことが見出された。したがって、マッピング／大きさ値調整算定２４０は、キャンセル度履歴情報２５２に応じて、瞬時（現在）キャンセル度情報２３２に関して、マッピングされたキャンセル度値２４２を選択的に増加させる。例えば、瞬時キャンセル度情報２３２が一定期間に比較的小さい値をとった場合、マッピング／大きさ値調整算定２４０は、（少なくとも低いキャンセル度がある時点で）瞬時キャンセル度情報２３２に対して、マッピングされたキャンセル度値２４２を（少なくとも低いキャンセル度の存在下で）１より大きくなるように増加させることができ、これにより、比較的小さいキャンセル度情報２３２により引き起こされたエネルギー損失を少なくとも部分的に補償する（これにより、通常、１より著しく小さい、比較的小さいマッピングされたキャンセル度値２４２ももたらされる）。一方、瞬時（現在）キャンセル度情報２３２が１に近い場合、瞬時（現在）キャンセル度情報２３２に対するマッピングされたキャンセル度値２４２の増加は、そのような状況では大きなエネルギー損失を補償する必要がないので、通常は小さい。結論として、マッピングされたキャンセル度値２４２が瞬時（現在）キャンセル度情報に対して増加する程度（又は量）は、キャンセル度履歴情報２５２に依存し、過去に（比較的）大きいエネルギー損失があった場合には増加は比較的大きく、過去に（比較的）小さいエネルギー損失のみであった場合には増加は比較的小さい。

【0070】

典型的には、比較的小さいキャンセル度情報（０に近く、高いキャンセル度を示す）はまた、比較的小さい（１よりも実質的に小さい）マッピングされたキャンセル度値２４２をもたらす。一方、瞬時キャンセル度情報が１に近い（低いキャンセル度を示す）場合、例えば、瞬時キャンセル度情報が以前の一定期間に１より実質的に小さい値をとった場合、マッピングされたキャンセル度値２４２は、１より小さいか、１より大きくなり得る。したがって、スケーラ２６０によって得られるスペクトル領域値の大きさ値２２２は、高いキャンセル度がある場合は、基準大きさ値２２１より通常小さく、低いキャンセル度がある場合、及び以前の一定期間に高いキャンセル度があった場合は、基準大きさ値２２１より通常さらに大きい。

【0071】

上述のように、機能ブロック２００は、例えば、本発明のいくつかの実施形態において、図１の大きさ値算定／算定部１２０を置き換えることができる。

【0072】

さらに、機能ブロック２００は、他の実施形態に関しても、本明細書に記載の特徴、機能性、及び詳細のいずれかによって補足され得ることに留意されたい。そのような特徴、機能、及び詳細は、機能ブロック２００に個別に追加することも、組み合わせて使用することもできる。具体的には、機能ブロック２００の機能を実装するときに、本明細書に記載の、瞬時（現在）キャンセル度情報Ｑの計算、キャンセル度履歴情報Ｑ_{ｓｍｏｏｔｈ}の計算、マッピングされたキャンセル度情報Ｑ_{ｍａｐｐｅｄ}の計算、基準大きさ値Ｍ_Ｒの計算、及び（スケーリングされた）大きさ値（

）の計算で説明された式を、任意で使用できる。ただし、上記の式を１つ以上使用すれば十分であり、これらの式をすべて組み合わせて使用する必要はないことに留意されたい。

【0073】

３．図３による位相値の算定
図３は、本発明の実施形態による、位相値算定の概略図を示す。図３による位相値算定は、その全体が３００で示されている。位相値算定３００は、任意により、図１によるダウンミキサ１００の位相値算定１３０を置き換えられることに留意されたい。位相値算定３００は、任意により、（図１によるダウンミキサ１００のブロック１２０を置き換え得る）機能ブロック２００と組み合わせて使用できることに留意されたい。しかしながら、位相値算定３００は、大きさ値算定１２０と組み合わせて使用することもできる。

【0074】

参照番号３１０では、入力信号（例えば、入力オーディオ信号）の時間－周波数領域表現が示されている。横軸３１２は時間を表し、縦軸３１３は周波数を表す。したがって、時間－周波数ビンが示されている。例えば、３つの時間－周波数ビン３１４ａ、３１４ｂ、３１４ｃが強調表示されているが、これらはすべて周波数（又は周波数範囲、又は周波数ビン）ｆ_４に関連付けられており、時間（又は時間部分、又はフレーム）ｔ_１、ｔ_２、ｔ_３に関連付けられている。

【0075】

同様に、参照番号３２０では、第２の入力信号の時間－周波数領域表現のグラフ表現が示されている。横軸３２２は時間を表し、縦軸３２３は周波数を表す。スペクトルビン３２４ａ、３２４ｂ、３２４ｃが（例えば、周波数ｆ_４及び時間ｔ_１、ｔ_２、ｔ_３で）強調表示されており、ここで、例えば、複素スペクトル領域値は、スペクトルビン３２４ａ、３２４ｂ、３２４ｃのそれぞれに関連付けられている。

【0076】

同様に、参照番号３３０での概略図は、第３の入力信号の時間周波数領域表現を示している。横軸３３２は時間を表し、縦軸３３３は周波数を表す。周波数ｆ_４及び時間ｔ_１、ｔ_２、ｔ_３での３つのスペクトルビン３３４ａ、３３４ｂ、３３４ｃが強調表示されている。

【0077】

以下では、位相値算定（例えば、位相値算定／位相値算定部１３０）によって実行され得る処理について説明する。例えば、第１の平均化（又は第１の平均化部）３６０は、同一の周波数及び後続の各時間に関連付けられた複数のスペクトルビンのスペクトル領域値にわたる（例えば、強度の、又はエネルギーの、又はラウドネスの）平均を形成し得る。平均化は、スライディングウィンドウ平均化でも、再帰的（有限インパルス応答）平均化でもよい。さらに、平均化は、例えば、スペクトル領域値の複素値を平均化することができ、又はスペクトル領域値の大きさ又はラウドネス値を平均化することができることに留意されたい。したがって、平均化部３３０は、重み付け値３６２をもたらす。

【0078】

同様に、第２の平均化（又は第２の平均化部３７０は、第２の入力信号のスペクトルビン３２４ａから３２４ｃに関連付けられたスペクトル領域値の（例えば、強度、エネルギー又はラウドネスの）経時的な平均を算定し、それにより、第２の入力信号の重み付け値３７２が得られる。

【0079】

さらに、第３の平均化（又は第３の平均化部３８０）は、第３の入力信号のスペクトルビン３３４ａから３３４ｃに関連付けられたスペクトル領域値にわたる（例えば、強度の、エネルギーの、又はラウドネスの）経時的な平均を算定し、それにより、第３の入力信号の重み付け値３８２が得られる。

【0080】

言い換えれば、第１の平均化３６０、第２の平均化３７０、及び第３の平均化３８０は、類似又は同一の機能を実行し得るが、相異なる入力信号のスペクトル領域値で動作する。

【0081】

位相値算定３００はまた、第１の入力信号の（又は第１の入力信号から導出された）現在のスペクトル領域値のスケーリング又は重み付け３６４を含み、それにより、第１の入力信号のスケーリングされたスペクトル領域値３６６が得られる。同様に、位相値算定は、第２のスケーリング又は重み付け３７４を含み、（例えば、現在処理されているスペクトルビンに関連付けられた）第２の入力信号の現在のスペクトル領域値は、第２の入力信号から導出された重み付け値３７２を使用してスケーリングされる。したがって、第２の入力信号の重み付けされたスペクトル領域値３７６が得られる。同様に、位相値算定３００は、第３の入力信号の重み付け値３８２を使用して第３の入力信号の現在のスペクトル領域値をスケーリングする第３のスケーリング又は重み付け３８４を含み、それにより、第３の入力信号のスペクトル領域値３８６が得られる。

【0082】

位相値算定３００はまた、第１の入力信号のスケーリングされたスペクトル領域値３６６、第２の入力信号のスケーリングされたスペクトル領域値３７６、及び第３の入力信号のスケーリングされたスペクトル領域値３８６の結合３９０を行う。例えば和結合が実行されるが、（例えば、実数成分と虚数成分を含むデカルト表現における）スケーリングされた複素値が結合されることに留意されたい。したがって、結合３９０の結果として、典型的には複素値であり、典型的には（実数成分及び虚数成分を含む）デカルト表現である加重和３９２が得られる。位相値算定３００はまた、位相計算３９６を含み、ここで、加重和３９２の位相値が計算され、位相値３９８として提供される。位相値３９８は、例えば、図１を参照して説明した位相値１３２に対応することができ、位相値適用１４０によって使用され得る。

【0083】

位相値算定３００は、過去において（例えば、他の入力信号と比較して）比較的強かった（例えば、より早い時間に関連付けられたが、現在のスペクトル領域値と同じ周波数を伴うスペクトルビンにおける）入力の現在のスペクトル領域値が、過去において比較的弱かった（例えば、現在のスペクトル領域値と同じ周波数を有するが、より早い時間に関連付けられたスペクトルビンにおける）１つ又は複数の入力信号のスペクトル領域値と比較した場合、位相計算３９６でより強く重み付けされるべきであるという考えに基づく。位相値３９８が大きな誤差を含む、又は速い変化を含む可能性は、そのような概念によって低減され、結果として、ダウンミックス信号における（可聴）アーチファクトは、そのような位相値算定を使用することによって低減又は回避され得ることが見出された。換言すれば、位相値３９８を得るために実行される位相計算３９６は、相異なる入力信号の現在のスペクトル領域値の均等に重み付けされた結合に基づき実行されるのではなく、（例えば、同じ周波数の過去のスペクトルビンにおける）相異なる入力信号の現在のスペクトル領域値が、強度、エネルギー、又はラウドネスの過去の時間平均に従って重み付けされる。したがって、位相計算の信頼性が向上する。

【0084】

しかしながら、本明細書に記載の特徴、機能、及び詳細のいずれも、例えば、位相値算定に関して、個別に及び組合せにより、位相値算定３００と組み合わせて適用することもできることに留意されたい。さらに、位相値算定３００は、任意により、本明細書に記載の他の実施形態のいずれにも導入できることに留意されたい。

【0085】

４．図５による実施形態
以下では、図５を参照して、ダウンミキサの実施形態について説明する。

【0086】

図５は、本発明の一実施形態による、ダウンミキサ５００のブロック概略図を示す。ダウンミキサは、ｓ_１からｓ_Ｎによっても示される複数の入力信号５００ａから５００ｎを受信するように構成される。

【0087】

さらに、ダウンミキサ５００は、出力信号として、ｓ_{ＬｏｕｄｎｅｓｓＤＭＸ}によっても示されるダウンミックス信号５９２をもたらす。ダウンミキサ５００は、任意により、例えば、分析フィルタバンクである（又は、一般的に言えば、分析を実行するのに役立つ）フィルタバンク５０１を含む。例えば、フィルタバンク５０１は、相異なる入力信号５００ａから５００ｎを別々に分析することができる。例えば、フィルタバンクは、入力信号５００ａから５００ｎのそれぞれに対して複素表現を提供することができる。例えば、フィルタバンク５０１は、第１の入力信号５００ａに基づき第１の複素表現５０１ａを提供し、第ｎの入力信号５００ｎに基づき複素表現５０１ｎを提供する。例えば、第１の複素表現５０１ａは、複数のスペクトル値を、例えば、各スペクトルビンについて１つ含み得る。個々のスペクトル値は複素である場合があり、例えば、（実部と虚部の別個の数値表現による）デカルト形式で表すことができる。

【0088】

以下では、１つのスペクトルビンについてのみ処理を説明する。しかしながら、（相異なる周波数を関連付けた）相異なるスペクトルビンは、例えば、別々に処理され得るが、例えば、同じ概念を使用し得ることに留意されたい。

【0089】

例えば、第１の入力信号の考慮下におけるスペクトルビンのスペクトル領域表現は、Ｒｅ_１（第１の入力信号のスペクトル領域値の実部の数値表現）及びＩｍ_１（第１の入力信号のスペクトル領域値の虚部の数値表現）によって示される。同様に、第ｎの入力信号のスペクトル領域表現は、Ｒｅ_Ｎ（第ｎの入力信号のスペクトル領域値の実部の数値表現）及びＩｍ_Ｎ（第ｎの入力信号のスペクトル値の虚部の数値表現）によって示される。

【0090】

ダウンミキサはまた、ラウドネス推定５０３を含み、ラウドネスは、相異なる入力信号について別々に推定される。例えば、第１の入力信号５００ａのラウドネス値５０３ａは、（考慮下のスペクトルビンの）第１の入力信号のスペクトル領域値の実部の数値表現に基づき、及び第１の入力信号のスペクトル領域値の虚部の数値表現に基づき、計算又は推定される。同様に、第ｎの入力信号のラウドネスは、（考慮下のスペクトルビンの）第ｎの入力信号のスペクトル領域値の数値表現Ｒｅ_Ｎ、Ｉｍ_Ｎに基づき計算又は推定され、それにより、ラウドネス値５０３ｂが得られる。別個のラウドネス推定ブロック又はラウドネス推定部が、５０３によって示されている。

【0091】

さらに、個々の入力信号５００ａから５００ｎのラウドネスを個別に表す個々のラウドネス値５０３ａ、５０３ｂは、結合部５０３ｃにおいて結合（例えば、合計）され、それにより、合計ラウドネス値５０３ｄが得られる。したがって、合計ラウドネス値５０３ｄは、入力信号５０１ａから５０１ｎの合計ラウドネスを表す。ダウンミキサ５００はまた、ラウドネスから大きさへの変換５０４を含み、これは、合計ラウドネス値５０３ｄを受け取り、当該合計ラウドネス値５０３ｄを、基準大きさＭ_Ｒと見なすことができる大きさ値５０５に変換する。基準大きさ値５０５は、合計ラウドネス値５０３ｄによって示される合計ラウドネスを表すスカラ値であり得る（ただし、これは振幅値の領域内にあり得る）。

【0092】

ダウンミキサ５００は、任意により、スケーラ５０６を含み得るが、これは、図５の実施形態では非アクティブであり得る。したがって、変更された（「スケーリングされた」）大きさ値５０６ａは、基準大きさ値５０５と同一であり得る。

【0093】

ダウンミキサ５００はまた、位相計算５０８を含む。位相計算５０８は、スペクトル領域値５０１ａから５０１ｎを結合した複素数合計値の数値表現を受け取ることができる。例えば、スペクトル領域値５０１ａから５０１ｎの実部の数値表現Ｒｅ_１からＲｅ_Ｎを（例えば、合計部又は結合部５０７ａにおいて）合計して、合計値の実部の数値表現５０７ｂ（Ｒｅ_ＤＭＸによっても示される）を得ることができる。同様に、スペクトル領域値５０１ａから５０１ｎの虚部の数値表現Ｉｍ_１からＩｍ_Ｎが（例えば、合計部又は結合部５０７ｃによって）合計されて、合計値の虚部の数値表現５０７ｄ（Ｌｍ_ＤＭＸによっても示される）が得られる。

【0094】

位相計算５０８は、合計値の実部の数値表現５０７ｂに基づき、及び合計値の虚部の数値表現５０７ｄに基づき、位相値５０８ａを計算する。例えば、位相計算は、合計値の実部と虚部の数値表現が配置されている象限間の区別を考慮できる、アーカス正接演算を含むことができる。したがって、位相値５０８ａは、例えば、０～３６０°の間、又は０～２πの間、又は－１８０°～＋１８０°の間、又は－π～＋πの間の範囲を示し得る。

【0095】

ダウンミキサ５００はまた、オプションの位相補正５１０を含み、これは、図５による実施形態では通常非アクティブである。

【0096】

ダウンミキサ５００はまた、位相値適用／数値表現再構成５１１を含む。位相値適用は、（本実施形態における基準大きさ値５０５と同一であり得る）大きさ値５０６ａを受け取り、また、本実施形態における位相値５０８ａと同一であり得る補正位相値５１０ａを受け取る。

【0097】

位相値適用５１１は、ダウンミックス信号のスペクトル領域値の実部（Ｒｅ_{ａｃｔｉｖｅ}）の数値表現を算定し、また、ダウンミックス信号のスペクトル領域値の虚部の数値表現を算定する。したがって、位相値適用５１１は、ダウンミックス信号のスペクトル領域値の実部の数値表現５１１ａと、ダウンミックス信号のスペクトル領域値の虚部の数値表現５１１ｂとを提供する。

【0098】

実部の数値表現と虚部の数値表現５１１ａ、５１１ｂの両方が、合成フィルタバンクであり得る任意によるフィルタバンク５０２に提供される。フィルタバンク５０２は、例えば、（例えば相異なる周波数を関連付けた）複数のスペクトルビンについて、ダウンミックス信号の（複素）スペクトル領域値の数値表現に基づき、ダウンミックス信号の時間領域表現５９２を提供するように構成され得る。

【0099】

したがって、大きさ値と位相値が（例えば、スカラ値として）別々に処理され、スペクトル領域値の複素数値表現が（例えば、時間領域表現の再合成前の）最終処理ステップとしてのみ生成される、ダウンミックス信号を得ることができる。

【0100】

以下では、図５を参照して説明した概念を要約する。以下に記載される概念は、上述の詳細とは別に使用できることに留意されたい。しかしながら、以下に記載される詳細のいずれも、本明細書に記載のいずれの実施形態とも組み合わせて使用することができる。

【0101】

この概念は「ラウドネスを維持するダウンミックス」と見なすことができることに留意されたい。本明細書で説明する新しい手法は、単に入力信号をダウンミックスするのではなく、その後、望ましくない悪影響を補正しようとする。２つの相異なる概念に基づき、所望の（ラウドネスを維持する）大きさと位相情報が互いに別々に計算される。

【0102】

例えば、所望の（基準）大きさが直接計算される。適切な位相情報と結合されると、望ましくない干渉が発生しないため、望ましくないダウンミックス（ＤＭＸ）アーチファクトが発生しない。位相情報は別々に計算され、受動ダウンミックス（ＤＭＸ）から生じる。

【0103】

図５では、本発明の実施形態が、（フィルタバンクの分析５０１と合成５０２の間の）１つの周波数帯域について例示的に示されている。もちろん、様々なバッファサイズが可能である。さらに、図５に示されるキャンセル度計算（アーチファクト防止）及びマッピング（ラウドネス維持）は、図５による実施形態の必須の構成要素ではなく、任意の拡張要素として考慮されるべきであることに留意されたい。同様に、位相補正値計算は任意の補足として考慮する必要がある。

【0104】

以下では、大きさ又は基準大きさ（５０５又は５０６ａ）の計算、及び位相の計算に関して、いくつかの追加の説明を行う。

【0105】

（基準）大きさ
入力信号はラウドネスを維持する方法でミックスダウンされ、大きさＭ_Ｒ５０５を形成し、これは、図５において次のように、赤線／実線によって、又は「大きさ計算」とラベル付けされた線によって示される。

【0106】

１．各入力信号のラウドネスが計算される（ラウドネス推定５０３）。ラウドネスは、人間の聴覚系、エネルギー値、大きさ値などに基づいたラウドネスを表すことができる。

【0107】

２．ラウドネス値が合計される。

【0108】

３．ラウドネスの合計が大きさに変換され（ラウドネスから大きさへの変換５０４）、例えば、平方根がエネルギー値に使用される。

【0109】

４．任意：Ｍ_Ｒ（基準大きさＭ_Ｒ５０５）の重み付けは、（例えば、スケーリング５０６を使用して）変更された（又はスケーリングされた）大きさＭ^Ｍｏｄ _Ｒ５０６ａをもたらし、さらなる詳細は、適応する基準大きさを使用したラウドネスダウンミックスの説明において以下で説明され、このステップは、誤った位相情報によって引き起こされる可能性がある潜在的なアーチファクトを回避するために実行され得る。

【0110】

位相

【0111】

（受動ＤＭＸ位相Ｐ_Ｐとしても示される）位相Ｐ_Ｐ５０８ａは、（例えば、結合部又は追加部５０７ａ、５０７ｃによって得られ、５０７ｂ、５０７ｄで示される）受動ダウンミックスから導出され、ここで、位相の導出は、次のように青線／実線、又は「位相計算」とラベル付けされた線によって示される。

【0112】

１．入力信号は受動的な方法（単純な加算）で、例えば、結合部又は追加部５０７ａ、５０７ｃにおいてミックスダウンされ、任意により、これら結合部又は追加部５０７ａ、５０７ｃにおいて異なる動機のダウンミックスＤＭＸを使用することが可能である。ただし、この場合、以下の「適応する基準大きさを使用したラウドネスダウンミックス」及び「適応する位相を使用したラウドネスダウンミックス」を説明するセクションで説明する追加処理、及びラウドネスの合計の両方が、異なるタイプのダウンミックスの意味で処理すべきで（又は処理される必要が）ある。

【0113】

２．Ｒｅ_ＤＭＸ及びＩｍ_ＤＭＸ（５０７ｂ、５０７ｄ）は、例えば、４象限逆正接関数を使用することによって、（例えば、位相計算５０８を使用して）位相情報を計算するために使用される。

【0114】

３．任意：（受動ＤＭＸ位相Ｐ_Ｐとしても示される）位相Ｐ_Ｐ５０８ａを（例えば、結合部又は加算部５１０を使用して）変更して、補正又は変更された位相値Ｐ^Ｍｏｄ _Ｐ５１０ａを形成することができる。この問題に関する詳細は、以下、例えば、適応する位相を使用したラウドネスダウンミックスを説明するセクションにおいて説明する。このステップは、位相ジャンプを伴わない位相応答を生成するために実行できる。

【0115】

基準大きさＭ_Ｒ（５０５）（又は変更された大きさ値Ｍ_ＭｏｄＲ５０６ａ）及び位相Ｐ_Ｐ（５０８ａ）（又は変更された位相Ｐ^Ｍｏｄ _Ｐ５１０ａ）は、位相値適用５１１において結合され、すなわち、極形式からデカルト形式（又は数値表現）に変換される。

【0116】

５．図６による実施形態
図６は、適応する基準大きさを使用したラウドネスダウンミックスによるダウンミキサのブロック概略図を示す。図６によるダウンミキサ６００は、図５によるダウンミキサ５００に類似しているため、同一の信号、ブロック、特徴、及び機能は再び説明されないことに留意されたい。また、同一の特徴及び信号は、上記の説明が参照されるよう、同一の参照番号で示されることに留意されたい。

【0117】

しかしながら、ダウンミキサ５００に加えて、ダウンミキサ６００は、アーチファクト防止として見なすことができるキャンセル度計算６１２と、ラウドネス維持として見なすことができるマッピング６１３とを含む。例えば、キャンセル度防止６１２は、スペクトル領域値５０１ａから５０１ｎ（又は、より正確には、そのデカルト数値表現）を受け取る。キャンセル度計算６１２は、マッピング６１３に、Ｑによっても示されるゲイン値６１２ａを提供する。

【0118】

マッピング６１３は、ゲイン値６１２（Ｑ）を受け取り、それに基づき、Ｑ_{ｍａｐｐｅｄ}によっても示されるマッピングされたゲイン値６１３ａをスケーラ５０６に提供し、スケーラ５０６は、マッピングされたゲイン値６１３ａを使用して基準大きさ値５０５をスケーリングし、それにより、位相値適用５１１に入力されるスケーリングされた大きさ値５０６ａが得られる。例えば、キャンセル度計算６１２は、高いキャンセル度がある場合にゲイン値６１２ａが比較的小さい値（例えば、ゼロに近い値）をとるように、また、入力信号間に比較的小さいキャンセル度がある場合に（例えば、複素値加算により入力信号の結合を考慮する場合に）比較的大きい値（例えば、１に近い値）をとるようゲイン値６１２ａを算定するように、ゲイン値６１２ａを算定し得る。したがって、ゲイン６１２ａは、高いキャンセル度があるであろうことが見出される（又は予想される）場合は小さくなるよう選択され、これは、位相値の高度な非信頼性又は位相ジャンプのリスクに通じる。一方、小さいキャンセル度があり、すなわち位相値が比較的信頼でき、不適切な位相ジャンプがないことが意味される場合、ゲイン値６１２ａは比較的大きくなるよう選択される。

【0119】

マッピング６１３は、比較的高いキャンセル度がある場合に（スケーリングされた）大きさ値５０６ａを低減することによって引き起こされるであろう（少なくとも特定の時間平均にわたる）エネルギー損失を少なくとも部分的に補償するのに役立つ。例えば、マッピング６１３は、（例えば、比較的小さいキャンセル度があり、以前に比較的小さいゲイン値Ｑによってエネルギー損失が引き起こされた場合に、）マッピングされたゲインが１より大きい場合があるように、また、（例えば、比較的大きいキャンセル度がある場合に、）マッピングされたゲイン値６１３が他の期間において１より著しく小さくなるように、マッピングされたゲイン６１３ａを得ることができる。

【0120】

キャンセル度計算６１２及びマッピング６１３の詳細を以下に説明する。しかしながら、上述の説明も参照され、上述の機能は、任意によりダウンミキサ６００に導入することができる。

【0121】

以下では、いくつかの追加の説明を提供する。特に、ダウンミキサ５００と比較してダウンミキサ６００は、高いキャンセル度がある場合をより適切に処理するために拡張されていることに留意されたい。

【0122】

しかしながら、一般に、図６によるダウンミキサ６００及び図８によるダウンミキサ８００は、特別な場合に対する任意の解決策を提供すると言うことができる。

【0123】

すでに上述したように（例えば、両方のベクトルが同様の大きさと約１８０度の角度差を持っている場合の説明。図４ｃを参照）、入力信号の合計は非常に強いキャンセルにつながり、強い位相ジャンプを生成する可能性がある。その場合、基準大きさＭ_Ｒ５０５と誤った位相情報Ｐ_Ｐ５０８ａとの結合は、可聴アーチファクトを引き起こすであろう。

【0124】

これらの人工的に生成されたアーチファクトを克服するために、２つの解決策が本明細書に提示される（例えば、図６及び図８を参照）。第１の解決策は、基準大きさを低減することによる、可聴閾値を下回るアーチファクトの減衰を含む。これは、「適応する基準大きさを使用したラウドネスダウンミックス」と題するセクションで説明される。第２の解決策は、第１の解決策の代わりに、又はそれに加えて使用することができ、信頼できない位相応答の補正を行うことができる。これは、「適応する位相を使用したラウドネスダウンミックス」と題するセクションで説明される。

【0125】

適応する基準大きさを使用したラウドネスダウンミックス
人工的に生成されたアーチファクトを克服するための１つの可能性は、基準大きさ（例えば、基準大きさ５０５）を、聞こえなくなるまで特定の時点で減衰させることである。このために、図５によるダウンミキサ５００の「左側の翼」がアクティブ化される（これは、例えば、赤線／破線、又は「任意の大きさ変更」とラベル付けされた線タイプによって示される）。

【0126】

この問題に関しては、適応する基準大きさを使用したラウドネスダウンミックスを有するダウンミキサのブロック概略図を示す図６が参照される。

【0127】

キャンセル度計算６１２では、入力信号が分岐され、キャンセル度が計算（又は推定）される。破壊的干渉がない場合、Ｑによっても示されるゲイン値６１２ａは１である。完全なキャンセルの場合、Ｑによっても示されるゲイン値６１２ａは０である。この測定値は、潜在的な誤った位相情報を検出するために使用される。

【0128】

マッピング６１３として示される第２のステップでは、キャンセル度は、ラウドネス維持ゲインＱ_{ｍａｐｐｅｄ}（例えば、マッピングされたゲイン６１３ａ）となるようにマッピングされる。両方のステップ又は機能ブロック又は機能６１２、６１３を以下に説明する。

【0129】

アーチファクト防止／キャンセル度計算６１２
図７は、複素平面における３つの入力信号のキャンセル度の導出に関する概略図を示す。横軸７１０は実部（又は実数成分）を示し、縦軸７１２は虚部（又は虚数成分）を表す。例えば、第１の入力信号のスペクトルビンを表す第１の複素値は、第１のベクトル７２０ａで表され、例えば第２の入力信号のスペクトルビンを表すことができる第２の複素値は、第２のベクトル７２０ｂで表され、例えば第３の入力信号のスペクトルビンを表すことができる第３の複素値は、第３のベクトル７２０ｃで表される。言い換えれば、図７では、１つの潜在的な概念が、複素平面における３つのベクトル７２０ａ、７２０ｂ、７２０ｃによって表される３つの入力信号に基づいて例示的に説明されている。

【0130】

虚軸と実軸のキャンセル度は別々に計算され、エネルギー補正方法において結合される。

【0131】

・３つのベクトルの正の虚部の合計が計算される→ｓｕｍＩｍ^＋
・３つのベクトルの負の虚部の合計が計算される→ｓｕｍＩｍ^－
・３つのベクトルの正の実部の合計が計算される→ｓｕｍＲｅ^＋
・３つのベクトルの負の実部の合計が計算される→ｓｕｍＲｅ^－
・これら４つの合計が、以下の式で結合される。

【0132】

ただし、キャンセル度の計算には、（例えば、受動ダウンミックスＤＭＸの位相角に向けた配向を有する）傾斜軸システムも使用できることに留意されたい。さらに、上記の追加処理は、任意により、代替の式を使用してキャンセル度を計算できることに留意されたい。しかしながら、いくつかの実施形態では、基準大きさを十分に低減するために、強いキャンセル度を正確に計算することが重要である。４つの合計（例えば、正の虚部の合計、負の虚部の合計、正の実部の合計、及び負の実部の合計）は、次式において（又は次式を使用して）結合して、例えばゲイン値６１２ａを導出できることに留意されたい。

【0133】

・

、

・

、

・

、

・

、

これら４つの場合の区別は、Ｑが０と１の間の値を取ることができるように行われる。

【0134】

ラウドネス維持－マッピング６１３－代替１
以下では、エネルギー保存の場合について、（マッピングブロック６１３によって実行され得る）マッピング処理が例示的に計算される。ただし、様々なマッピング式が可能であることに留意されたい。

【0135】

ゲイン値Ｑは、基準大きさに直接適用される場合、そのエネルギーを低減する（例えば、ゲイン値Ｑが０～１の範囲にある場合）。これにより、混合信号の知覚されるラウドネスを低減することができる。

【0136】

したがって、本発明の一態様によれば、エネルギー損失が追跡され、時間遅延により信号にフィードバックされる。この第２のステップ６１３によって、以前に実行された基準大きさ６１２の低減を元に戻さないことが重要である。エネルギーは、基準大きさの低減があまり大きくない場合にのみフィードバックされ得る。具体的には、次のステップが実行される。
－

＝［０－１］で平滑化することにより、経時的なキャンセル度を追跡する。

－Ｑをその値の範囲の上限を超えてマッピングして、１を超える値を可能にして、したがって増幅を可能にする。

ただし、様々な追跡の式及び／又は方法が可能であることに留意されたい。

【0137】

ただし、以下のコメントに留意すべきである。
定数値Ｔ＝０．６により、Ｑの値範囲のマッピングを達成でき、これは平均でエネルギー損失を補償することが見出された。指数Ｔの値は、１２５を超えるオーディオ信号の信号データベースから経験的に決定されたことに留意されたい。この目的のために、基準大きさのエネルギーが（可聴範囲内の）すべての帯域で合計され、Ｑ_{ｍａｐｐｅｄ}で処理された変更された大きさの合計エネルギーと比較され、差分はＴで最小化された。ただし、別のマッピング効果が所望される場合、指数Ｔは引き続き変更可能である。

【0138】

さらに、Ｑが小さいほど、上方へのマッピングが少なくなることに留意されたい。アーチファクトは増幅されない。

【0139】

また、Ｑが大きいほど、上方へマッピングされ、１を超える値に達する可能性がある。

【0140】

いくつかの実施形態では、これは、一度における位相情報の信頼性が高いほど、より多くのエネルギーが信号にフィードバックされることを確実にする。しかしながら、いくつかの実施形態では、過度の増幅を回避するために、フィードバックされるエネルギーの量を制限することが有用であり得る。例えば、Ｑ_{ｍａｐｐｅｄ}は、特定の値、例えば１．２、１．５、１．８、又は２．０に制限され得る。

【0141】

ラウドネス維持－マッピング６１３－代替２
以下では、ラウドネス維持－マッピング６１３の代替の実装について説明する。

【0142】

以下では、エネルギー維持の場合のマッピング処理を例示的に計算する。ただし、様々なマッピング式が可能である。

【0143】

Ｑは、基準大きさに直接適用される場合、そのエネルギーを低減する。これにより、混合信号の知覚されるラウドネスを低減することができる。したがって、エネルギー損失が追跡され、時間遅延により信号にフィードバックされる。（例えば、ブロック６１３における）この第２のステップによって、以前に実行された（例えば、ブロック６１２における）基準大きさの低減を元に戻さないことが重要である。エネルギーは、基準大きさの低減があまり大きくない場合にのみフィードバックされ得る。

【0144】

具体的には、次のステップが実行される。
〇

＝［０－１］で平滑化することにより、経時的なキャンセル度を追跡する。

ただし、様々な追跡の式／方法が可能である。
〇Ｑについて値１に向けて（満足できる）マッピングを行い、したがって基準大きさを増幅しない［２１２］。

一般的に言えば、このタイプのマッピングは元の基準大きさを維持しようとし、より強い破壊的干渉が検出された場合にのみそれを減衰させる。増幅は生じないが、知覚される全体的なラウドネスは変化しない。より強い破壊的干渉による基準大きさの減衰は、信号によってほとんどマスクされる。

【0145】

以下のコメントを考慮することが好ましい。
〇定数ゲイン

は勾配の強度であり、例えば、１～１０（又は０．５～２０）の値を取ることができる。
〇勾配

は、キャンセル度の平均によって異なる。
〇

が小さいほど、潜在的なアーチファクトを増幅しないように、マッピングはより慎重に行われる。
〇

が大きいほど、マッピングはより強力になる。

【0146】

図１１は、本明細書で説明するラウドネス維持のための様々なマッピング概念を使用して達成できるマッピング曲線の例を示す。

【0147】

１番目の代替によるマッピングでは、１より大きい増幅が許可され、したがって、欠落したエネルギーが、Ｑ_{ｍａｐｐｅｄ}により時間遅延方式で信号に導入（フィードバック）される。

【0148】

２番目の代替によるマッピングでは、増幅は許可されない。むしろ、基準大きさを可能な限り維持し、基準大きさをスケールダウン（又は低減）しないように試みる。基準大きさは、強い破壊的干渉が発生した場合にのみ低減又はスケールダウンされる。また、低減（又はスケールダウン）の程度は、Ｑ_{ｓｍｏｏｔｈ}に引き続き依存し、すなわち経時で失われたエネルギーによる。

【0149】

６．図８によるダウンミキサ
図８は、本発明の別の実施形態による、ダウンミキサのブロック概略図を示す。

【0150】

ダウンミキサ８００はダウンミキサ５００に類似しているため、同一の特徴、機能、及び信号はここでは再び説明されない。むしろ、ダウンミキサ５００の説明のように同一の参照番号が使用され、ダウンミキサ５００に関する上記の説明が参照される。

【0151】

しかしながら、ダウンミキサ５００の機能及び／又はブロックに加えて、ダウンミキサ８００はまた、入力信号（又はそのスペクトルビン）の複素表現５０１ａから５０１ｎを受信する位相補正値計算８１４を含む。さらに、位相補正値計算８１４はまた、位相値５０８ａを受け取ることができる。位相補正値計算８１４はまた、位相補正値８１５を結合部５１０に提供し、その結果、結合部５１０は、（Ｗによっても示される）位相補正値８１５を考慮しながら、位相値５０８ａに基づき、変更された位相値５１０ａを導出する。

【0152】

したがって、位相補正値計算８１４は、例えば、上記の単純な位相計算５０８によって得ることができる位相値５０８ａが実際の位相値を強く逸脱するとき、又は位相値５０８ａが過度の位相ジャンプなどを含むときを算定することができる。

【0153】

例えば、位相補正値計算８１４は、位相計算によってもたらされる位相値５０８ａと補正位相値５１０ａとの間に滑らかなフェードオーバーが存在するように、位相補正値８１５を提供することができる。例えば、位相補正値計算８１４は、位相補正値８１５が０から所望の位相補正値に滑らかに遷移するように、位相補正値８１５を提供することができる。

【0154】

しかしながら、いくつかの実施形態では、合計部／結合部５０７ａ、５０７ｃ、位相計算５０８、位相補正値計算８１４、及び結合５１０は、向上した信頼性を有する位相値を一般に計算する、改善された位相値計算によって置き換えられ得ることに留意されたい。

【0155】

例えば、図３に示されるような位相値算定は、要件に応じて、恒久的に使用されてもよく、又は位相補正値８１５の提供のために使用されてもよい。

【0156】

適応する位相を使用したラウドネスダウンミックス
以下では、本発明の一態様に従って使用することができる、適応する位相を使用したラウドネスダウンミックスについて説明する。

【0157】

基準大きさＭ_Ｒを継続的に使用できるようにするためには、「信頼性できる」位相応答が必要である。この目的のために、図５（及び図８）の右側の翼がアクティブ化される（青線／破線、又は「任意の位相変更」とラベル付けされた線で示される）。ステップ又は機能ブロック「位相補正値計算」８１４において、（Ｗによっても示される）位相補正値８１５は、分岐された入力信号に基づき（例えば、数値表現５０１ａから５０１ｎに基づき）計算される。受動ダウンミックスの潜在的な誤った位相、例えば「受動ダウンミックス位相Ｐ_ｐ５０８ａ」は、このように補正されるため、顕著なアーチファクト（位相ジャンプに基づく）が回避される。

【0158】

モジュール（又は機能ブロック、又は機能）「位相補正値計算」８１４は、いくつかのサブモジュールからなることができる。受動ダウンミックス中に入力信号の破壊的干渉がない場合、位相補正値はゼロに近くなる。破壊的干渉／キャンセルが発生するとすぐに、信頼できる位相応答をもたらす値（位相補正値など）が計算される。

【0159】

信頼できる位相応答は、例えば、入力信号の適応的に重み付けされた合計から取得される。例えば、経時的に個々の信号のラウドネス値を追跡する必要がある場合がある。適応的重み付けは、破壊的干渉を妨げることなくＤＭＸ（サブミックス）を生成することを目的としている。サブミックスでは、破壊的干渉をある程度許容できる。これは、個々の入力信号を再重み付けするときに人工的に生成された位相ジャンプを回避するのに役立つ。

【0160】

受動ダウンミックス（ＤＭＸ）とサブミックスを切り替えながらスムーズな移行を保証するために、破壊的干渉／キャンセルが発生していないときに位相補正を適用することもできる。任意により、位相ジャンプをさらに減衰させるために、いくつかの周波数帯域にわたって位相応答を平滑化することが可能である。

【0161】

結論として、図８は、適応する位相を使用したラウドネスダウンミックスを使用するダウンミキサのブロック概略図を示している。

【0162】

例えば、図８による実施形態では、キャンセル度計算６１２及びマッピング６１３は非アクティブ（又は存在しない）であり得るが、位相補正値計算８１４はアクティブであり得る。

【0163】

しかしながら、いくつかの実施形態では、キャンセル度計算６１２及びマッピング６１３、並びに位相補正値計算８１４を同時に使用し、それにより、良好な結果を得ることも可能である。

【0164】

しかしながら、図８による実施形態は、本明細書に開示される特徴、機能、及び詳細のいずれかによって、それらを個別に及び組み合わせて使用することで、補足され得ることに留意されたい。

【0165】

７．結論及び総論
結論として、複数の入力信号に基づきダウンミックス信号を提供するときにアーチファクトを低減するのに役立つ概念が説明されていることに留意されたい。具体的には、キャンセルから生じる問題が解決された。例えば、２つ以上のポインタ（又はフェーザ又はベクトル）が９０°の角度領域の外側に位置するとすぐに、座標系の一方の軸又は両方の軸にキャンセルが生じる。すなわち、ポインタの実数成分又は虚数成分（又はフェーザ又はベクトル）（又は両方）が部分的に又は完全にキャンセルされる。したがって、破壊的干渉／重ね合わせについて述べることができる。したがって、破壊的干渉又は重ね合わせがあるかどうかの問題は、合計ベクトルの長さとは無関係であり、合計ベクトルの長さが２つのベクトルのうち長い方より長いかどうかの問題とも無関係である。

【0166】

さらなる注意点として、処理は通常は周波数領域で行われ、特定の長さの信号バッファが通常は分析されるため、干渉は時間平均でのみ考慮されることに留意されたい。信号バッファ内で（時間信号構造を考慮する場合）、建設的干渉と破壊的干渉が同時に発生する可能性があることに留意されたい。ただし、周波数領域では、バッファ内の重みに対する干渉のタイプのみが分かる。したがって、バッファはそれに応じて分類される。したがって、建設的干渉又は破壊的干渉があるかどうかの問題は、本明細書に記載されているように判断できることに留意されたい。また、例えば、干渉の観点から位相値が信頼できないことが分かった場合、振幅及び／又は位相の適切な補正を行うことができる。

【0167】

８．図９による方法
図９は、本発明の一実施形態による、複数の入力信号に基づきダウンミックス信号を提供する方法９００のフローチャートを示す。

【0168】

方法９００は、入力信号のラウドネス情報に基づき、ダウンミックス信号のスペクトル領域値の大きさ値を算定９１０することを含み、また、
方法９００は、ダウンミックス信号のスペクトル領域値の位相値を算定９２０することを含む。方法９００はまた、スペクトル領域値の大きさ値に基づき、ダウンミックス信号のスペクトル領域値の複素数表現を得るために位相値を適用９３０することを含む。

【0169】

方法９００は、任意により、本明細書に開示される特徴、機能、及び詳細のいずれかによって、それらを個別に及び組み合わせて使用することで、補足できる。

【0170】

また、必要に応じて、ステップ９１０及び９２０も当然並行して実行できることに留意されたい。

【0171】

９．図１０によるオーディオ符号化装置
図１０は、本発明の一実施形態による、オーディオ符号化装置１０００のブロック概略図を示す。

【0172】

オーディオ符号化装置１０００は、複数の入力オーディオ信号１０１０ａから１０１０ｎに基づき、符号化されたオーディオ表現１０１２を提供するように構成される。

【0173】

オーディオ符号化装置は、ダウンミキサ１０２０を含み、これは、上記のダウンミキサのいずれかに対応し得る。ダウンミキサ１０２０は、複数の入力オーディオ信号の（複素）スペクトル領域表現に基づき、ダウンミックス信号１０２２を提供するように構成される。さらに、オーディオ符号化装置は、符号化されたオーディオ表現１０１２を得るために、ダウンミックス信号１０２２を符号化するように構成される。

【0174】

オーディオ符号化装置は、例えば、ＡＡＣタイプの符号化又はＬＰＣベースの符号化のように、ダウンミックス信号を符号化するために、既知の符号化技術のいずれかを使用することができる。また、オーディオ符号化装置は、任意により、ダウンミキシングを説明する追加のサイド情報（例えば、ダウンミックス信号内の入力信号の重み付け）又はオーディオ符号化の分野で既知の他の任意のサイド情報を提供することができる。

【0175】

１０．実装の代替
いくつかの態様が装置の文脈で説明されたが、これらの態様は、対応する方法の説明も表すことは明らかであり、ブロック又は装置は、方法ステップ又は方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明される態様も、対応する装置の対応するブロック又はアイテム又は特徴の説明を表す。方法ステップの一部又はすべては、例えば、マイクロプロセッサ、プログラム可能なコンピュータ、又は電子回路などのハードウェア装置によって（又はそれを使用して）実行することができる。いくつかの実施形態では、最も重要な方法ステップのうち１つ又は複数は、そのような装置によって実行され得る。

【0176】

特定の実装要件に応じて、本発明の実施形態は、ハードウェア又はソフトウェアで実装することができる。実装は、電子的に読み取り可能な制御信号が格納されたデジタル記憶媒体、例えば、フロッピーディスク、ＤＶＤ、ブルーレイ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、又はフラッシュメモリを使用して実行でき、それらは、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する（又は協働することができる）。したがって、デジタル記憶媒体は、コンピュータ可読であり得る。

【0177】

本発明によるいくつかの実施形態は、本明細書に記載の方法の１つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。

【0178】

一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法の１つを実行するように動作する。プログラムコードは、例えば、機械可読キャリアに格納されてもよい。

【0179】

他の実施形態は、機械可読キャリアに格納された、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを含む。

【0180】

言い換えれば、本発明の方法の実施形態は、したがって、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書で説明される方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

【0181】

したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを記録したデータキャリア（又はデジタル記憶媒体、又はコンピュータ可読媒体）である。データキャリア、デジタル記憶媒体、又は記録されたメディアは、典型的には有形及び／又は非遷移性である。

【0182】

したがって、本発明の方法のさらなる実施形態は、本明細書で説明される方法の１つを実行するためのコンピュータプログラムを表すデータストリーム又は信号のシーケンスである。データストリーム又は信号のシーケンスは、例えば、インターネットなどのデータ通信接続を介して転送されるように構成されてもよい。

【0183】

さらなる実施形態は、本明細書に記載の方法の１つを実行するように構成又は適合された処理手段、例えば、コンピュータ又はプログラム可能な論理デバイスを含む。

【0184】

さらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。

【0185】

本発明によるさらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを（例えば、電子的又は光学的に）受信機に転送するように構成された装置又はシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置又はシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを含み得る。

【0186】

いくつかの実施形態では、プログラマブルロジックデバイス（例えば、フィールドプログラマブルゲートアレイ）を使用して、本明細書で説明される方法の機能の一部又はすべてを実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書で説明される方法の１つを実行するために、マイクロプロセッサと協働し得る。一般に、方法は、好ましくは、任意のハードウェア装置によって実行される。

【0187】

本明細書で説明される装置は、ハードウェア装置を使用して、又はコンピュータを使用して、又はハードウェア装置とコンピュータの組合せを使用して実装することができる。

【0188】

本明細書で説明される装置、又は本明細書で説明される装置の任意のコンポーネントは、少なくとも部分的にハードウェア及び／又はソフトウェアで実装され得る。

【0189】

本明細書で説明される方法は、ハードウェア装置を使用して、又はコンピュータを使用して、又はハードウェア装置とコンピュータの組合せを使用して実行することができる。

【0190】

本明細書で説明される方法、又は本明細書で説明される装置の任意の構成要素は、ハードウェア及び／又はソフトウェアによって少なくとも部分的に実行され得る。

【0191】

上記の実施形態は、本発明の原理を単に例示するものである。本明細書に記載の構成及び詳細の変更及び変形は、当業者には明らかであることは理解されよう。したがって、添付の特許請求の範囲によってのみ限定され、本明細書の実施形態の記載及び説明によって提示される特定の詳細によって限定されないことが意図される。

【0192】

１１．さらなる結論
さらに結論として、Ｎチャネル入力信号をダウンミキシングする場合、Ｍチャネル出力信号（Ｎ＞Ｍ）を得るために、望ましくない影響が発生する可能性がある。これらの効果は、音の色付け、雰囲気の操作、音声明瞭度の低下、及びその他のアーチファクトの形で現れる可能性がある。