(58)【調査した分野】(Int.Cl.,DB名)
複数のチャンネルを示しているマルチチャンネル信号に基づいており、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための装置であって、
前記複数のチャンネルの各々について、1対の方向フィルタを含む、複数の方向フィルタ(14)と、
類似性の低減をしていること以外には前記複数のチャンネルに対応する相互類似性を低減されたチャンネルの組(20)を得るために、前記複数のチャンネルのうちの左と右のチャンネル、前記複数のチャンネルのうちのフロントとリアのチャンネル、および、前記複数のチャンネルのうちのセンターチャンネルと非センターチャンネルのうちの少なくとも1つを異なって処理し、それにより類似性を低減するために、前記複数のチャンネルのうちの少なくとも1つと前記方向フィルタの各対との間に接続された非相関装置を含む類似性低減装置(12)と、
前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第1のミキサー(16a)と、
前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第2のミキサー(16b)と、
前記マルチチャンネル信号により示される前記複数のチャンネルのモノラルまたはステレオのダウンミックスを形成するためのダウンミックスジェネレータ(42)と、
前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の室内反射/残響に関連した寄与を生成するためのルームプロセッサ(44)と、
前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するように構成された第1のアダー(116)と、
前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するように構成された第2のアダー(118)と、を含み、
前記複数の方向フィルタ(14)は、前記複数のチャンネルの各々について、前記方向フィルタの各対が、前記相互類似性を低減されたチャンネルの組(20)の対応するチャンネルに関連した仮想音源の位置から、聴取者の各耳道への、前記相互類似性を低減されたチャンネルの組の前記対応するチャンネルの音響伝達をモデル化するために構成されるように、構成されること、を特徴とする、装置。
複数のチャンネルを示しているマルチチャンネル信号に基づいており、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための装置であって、
前記複数のチャンネルの各々について、1対の方向フィルタを含む、複数の方向フィルタ(14)と、
前記相対的な遅延および/または位相および/または振幅修正を実行していること以外には前記複数のチャンネルに対応する相互類似性を低減されたチャンネルの組(20)を得るために、前記複数のチャンネルのうちの少なくとも2つのチャンネル間で、相対的な遅延を生じさせる、および/または、スペクトル的に変化させる意味で、異なって、位相および/または振幅修正を実行するために、前記複数のチャンネルのうちの少なくとも1つと前記方向フィルタの各対との間に接続された非相関装置を含む類似性低減装置(12)と、
前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第1のミキサー(16a)と、
前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第2のミキサー(16b)と、
前記マルチチャンネル信号により示される前記複数のチャンネルのモノラルまたはステレオのダウンミックスを形成するためのダウンミックスジェネレータ(42)と、
前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の室内反射/残響に関連した寄与を生成するためのルームプロセッサ(44)と、
前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するように構成された第1のアダー(116)と、
前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するように構成された第2のアダー(118)と、を含み、
前記複数の方向フィルタ(14)は、前記複数のチャンネルの各々について、前記方向フィルタの各対が、前記相互類似性を低減されたチャンネルの組(20)の対応するチャンネルに関連した仮想音源の位置から、聴取者の各耳道への、前記相互類似性を低減されたチャンネルの組の前記対応するチャンネルの音響伝達をモデル化するために構成されるように、構成されること、を特徴とする、装置。
各チャンネルに関連した仮想音源の位置から、聴取者の耳道への、複数のチャンネルの音響伝達をモデル化するための相互類似性を低減しているHRTFの組を形成するための装置であって、
前記仮想音源の位置の選択または変化に応答して元の複数のHRTFのそれぞれのためのフィルタタップを検索する、または、計算することによって、FIRフィルタとして実行される前記元の複数のHRTFを供給するためのHRTFプロバイダ(32)と、
あらかじめ定められた1対のチャンネルの前記音響伝達をモデル化している前記HRTFのインパルス応答を、互いに比較して遅延させるための、または、スペクトル的に変化させる意味で、その位相および/または振幅応答を異なって修正するための、HRTFプロセッサ(34)であり、前記1対のチャンネルが、前記複数のチャンネルのうちの左と右のチャンネル、前記複数のチャンネルのうちのフロントとリアのチャンネル、および、前記複数のチャンネルのうちのセンターチャンネルと非センターチャンネルのうちの1つである、HRTFプロセッサ(34)と、を含むこと、を特徴とする、装置。
前記フィルタタップの位置を変えることによって、あらかじめ定められた1対のチャンネルの前記音響伝達をモデル化している前記HRTFの前記インパルス応答を、互いに比較して遅延させるように構成された、前記HRTFプロセッサ(34)、を特徴とする、請求項4に記載の装置。
前記HRTFの第1のものの群遅延が、前記HRTFの他のものと比較して、バーク帯域に関して、1サンプルの少なくとも8分の1の標準偏差を示すように、あらかじめ定められた1対のチャンネルの前記音響伝達をモデル化している前記HRTFの前記インパルス応答を、互いに比較して遅延させる、または、スペクトル的に変化させる意味で、その位相および/または振幅応答を異なって修正するように構成された、前記HRTFプロセッサ(34)、を特徴とする、請求項4または請求項5に記載の装置。
前記HRTFプロバイダ(32)は、前記仮想音源の位置およびHRTFパラメータに基づいた前記元の複数のHRTFを供給するように構成されること、を特徴とする、請求項4〜請求項6のいずれかに記載の装置。
前記HRTFプロセッサ(34)は、前記あらかじめ定められた1対のチャンネルの前記インパルス応答を異なって全域通過フィルタにかけるように構成されること、を特徴とする、請求項4〜請求項7のいずれかに記載の装置。
複数のチャンネルを示しているマルチチャンネル信号に基づいており、前記複数のチャンネルの各々について1対の方向フィルタを含む複数の方向フィルタ(14)を用いて、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための方法であって、
相関性の低減をしていること以外には前記複数のチャンネルに対応する相互類似性を低減されたチャンネルの組(20)を得るために、前記複数のチャンネルのうちの左と右のチャンネル、前記複数のチャンネルのうちのフロントとリアのチャンネル、および、前記複数のチャンネルのうちのセンターチャンネルと非センターチャンネルのうちの少なくとも1つを、前記複数のチャンネルのうちの少なくとも1つと前記方向フィルタの各対との間に接続された非相関装置を用いて、異なって処理し、それにより相関性を低減するステップと、
前記複数のチャンネルの各々について、前記方向フィルタの各対が、前記相互類似性を低減されたチャンネルの組の対応するチャンネルに関連した仮想音源の位置から、聴取者の各耳道への、前記相互類似性を低減されたチャンネルの組の前記対応するチャンネルの音響伝達をモデル化するように、複数の方向フィルタ(14)に、前記相互類似性を低減されたチャンネルの組(20)をかけ、
前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
前記マルチチャンネル信号により示される前記複数のチャンネルのモノラルまたはステレオのダウンミックスを形成するステップと、
前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の室内反射/残響に関連した寄与を生成するステップと、
前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するステップと、
前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するステップと、を含むこと、を特徴とする、方法。
複数のチャンネルを示しているマルチチャンネル信号に基づいており、前記複数のチャンネルの各々について1対の方向フィルタを含む複数の方向フィルタ(14)を用いて、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための方法であって、
前記相対遅延および/または位相および/または振幅修正を実行していること以外には前記複数のチャンネルに対応する相互類似性を低減されたチャンネルの組(20)を得るために、前記複数のチャンネルのうちの少なくとも2つのチャンネル間で、スペクトル的に変化させる意味で、前記複数のチャンネルのうちの少なくとも1つと前記方向フィルタの各対との間に接続された非相関装置を用いて、異なって、位相および/または振幅修正を実行するステップと、
前記複数のチャンネルの各々について、前記方向フィルタの各対が、前記相互類似性を低減されたチャンネルの組(20)の対応するチャンネルに関連した仮想音源の位置から、聴取者の各耳道への、前記相互類似性を低減されたチャンネルの組の前記対応するチャンネルの音響伝達をモデル化するように、複数の方向フィルタ(14)に、前記類似性を低減されたチャンネルの組(20)をかけ、
前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
前記マルチチャンネル信号により示される前記複数のチャンネルのモノラルまたはステレオのダウンミックスを形成するステップと、
前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の室内反射/残響に関連した寄与を生成するステップと、
前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するステップと、
前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するステップと、を含むこと、を特徴とする、方法。
前記各チャンネルに関連した仮想音源の位置から、聴取者の耳道への、複数のチャンネルの音響伝達をモデル化するための相互類似性を低減している頭部伝達関数の組を形成するための方法であって、
前記仮想音源の位置の選択または変化に応答して元の複数のHRTFのそれぞれのためのフィルタタップを検索する、または、計算することによって、FIRフィルタとして実行される前記元の複数のHRTFを供給するステップと、
前記HRTFの第1のものの群遅延が、前記HRTFの他のものと比較して、バーク帯域に関して、1サンプルの少なくとも8分の1の標準偏差を示すように、スペクトル的に変化させる意味で、あらかじめ定められた1対のチャンネルの前記音響伝達をモデル化している前記HRTFのインパルス応答の位相および/または振幅応答を異なって修正するステップであって、前記1対のチャンネルが、前記複数のチャンネルのうちの左と右のチャンネル、前記複数のチャンネルのうちのフロントとリアのチャンネル、および、前記複数のチャンネルのうちのセンターチャンネルと非センターチャンネルのうちの1つであるステップと、を含むこと、を特徴とする、方法。
コンピュータ・プログラムがコンピュータ上で動作するときに、請求項9〜請求項11のいずれかに記載の方法を実行するための命令を有する前記コンピュータ・プログラム。
【発明を実施するための形態】
【0016】
図1は、例えば、複数のチャンネルを示しているマルチチャンネル信号に基づいてヘッドホン再生することを目的とし、そして、各チャンネルに関連した仮想音源の位置を有するスピーカ構成によって再生することを目的とするバイノーラル信号を生成するための装置を示す。概して、引用符号10によって示されるその装置は、類似性低減装置12、複数の方向フィルタ14(14a〜14h)、第1のミキサー16aおよび第2のミキサー16bを含む。
【0017】
類似性低減装置12は、複数のチャンネル18a〜18dを示しているマルチチャンネル信号18を相互類似性を低減されたチャンネルの組20(20a〜20d)に変えるように構成される。マルチチャンネル信号18によって示されるチャンネル18a〜18dの数は、2以上でありうる。説明の目的だけのために、4チャンネル18a〜18dは、
図1に明示的に示された。複数のチャンネル18は、例えば、センターチャンネル、フロント左チャンネル、フロント右チャンネル、リア左チャンネルおよびリア右チャンネルを含みうる。各チャンネル18a〜18dに関連した既に定めた仮想音源位置に配置されるスピーカを有するスピーカ・セットアップ(
図1には示されていない)によってチャンネル18a〜18dが再生されるということを仮定し、または、意図して、チャンネル18a〜18dは、例えば個々の楽器、歌声、または他の個々の音源を示している複数の個々のオーディオ信号からサウンドデザイナーによって混合されている。
【0018】
図1の実施形態によれば、複数のチャンネル18a〜18dは、少なくとも、1対の左および右チャンネル、1対のフロントおよびリアチャンネル、または、1対のセンターおよび非センターチャンネル(non−center channel)を含む。もちろん、2以上のちょうど言及された対は、複数のチャンネル18(18a〜18d)内に存在しうる。類似性低減装置12は、相互類似性を低減されたチャンネル20a〜20dの組20を得るために、異なって処理し、そしてそれにより複数のチャンネルの中のチャンネル間に類似性を低減するように構成される。第1の態様によれば、複数のチャンネル18のうち左および右チャンネル、複数チャンネルの18のうちフロントおよびリアチャンネル、複数のチャンネル18のうちセンターおよび非センターチャンネルのうちの少なくとも1つで類似性は、相互類似性を低減されたチャンネル20a〜20dの組20を得るために、類似性低減装置12によって低減されうる。第2の態様によれば、類似性低減装置(12)は、加えて、または、代わりに、スペクトル的に変化させる意味で、相互類似性を低減されたチャンネルの組20を得るために、複数のチャンネルのうち少なくとも2つのチャンネルの間で異なって位相および/または振幅の修正を実行しうる。
【0019】
以下でより詳細に概説されるように、類似性低減装置12は、例えば、各対が互いに比較して遅延させることによって、または、例えば複数の周波数帯域の各々において異なる量の遅延をチャンネルの各対に受けさせ、それにより相互類似性を低減されたチャンネルの組20を得ることによって、異なる処理を成し遂げうる。もちろん、チャンネル間の相関を減少させる他の可能性がある。換言すれば、相関低減装置12は、各チャンネルのスペクトルエネルギー分布が同じ状態のままである伝達関数、すなわち、関連するオーディオスペクトル範囲の1つの振幅と同じ伝達関数を有しうる。しかし、ここで類似性低減装置12はサブバンドまたはその周波数成分の位相を異なって修正する。例えば、相関低減装置12は、ある周波数帯域のための第1のチャンネルの信号が、少なくとも1つのサンプル分、そのチャンネルのうちの別の1つと比較して遅れるように、チャンネル18の全ての、または1つまたはいくつかにおける位相修正を同上が引き起こすように、構成されうる。更に、相関低減装置12は、第1のチャンネルの群遅延が複数の周波数帯域のためのチャンネルのうちの別の1つと比較して1サンプルの少なくとも8分の1の標準偏差を示すように、同上が位相修正を引き起こすように、構成されうる。考慮される周波数帯域は、バーク(Bark)帯域またはそのサブセットまたは他の周波数帯域の再分割でありうる。
【0020】
相関を低減することは、人間の聴覚系の頭内(in―the―head)定位を防ぐ唯一の方法ではない。むしろ、相関は、その使用によって人間の聴覚系が両耳に到着する音の類似性と、こうして音の内側への向きを判断するいくつかのありうる手段のうちの1つである。したがって、類似性低減装置12は、また、例えば、複数の周波数帯域の各々において異なる量のレベル低減をチャンネルの各対に受けさせ、それによりスペクトル的に形成された方法で相互類似性を低減されたチャンネルの組20を得ることによって、異なる処理を成し遂げうる。スペクトル形成は、例えば、耳たぶによって陰になるため、例えばフロントチャンネルの音に対するリアチャンネルの音のために生じている相対的なスペクトルで形成された低減を大きく見せる。したがって、類似性低減装置12は、リアチャンネルに他のチャンネルに対するスペクトル的に変化させているレベル低減を受けさせる。このスペクトル形成において、類似性低減装置12は、位相応答を関連するオーディオスペクトル範囲にわたって一定にさせうる。しかし、ここで類似性低減装置12は、サブバンドまたはその周波数成分の振幅を異なって修正する。
【0021】
マルチチャンネル信号18が複数のチャンネル18a〜18dを示す方法は、原則として、いかなる特定の表現にも制限されない。例えば、マルチチャンネル信号18は、空間オーディオ符号化を使用する、圧縮方法で複数のチャンネル18a〜18dを示すことができる。空間オーディオ符号化によって、複数のチャンネル18a〜18dは、それにより個々のチャンネル18a〜18dがダウンミックスチャンネルに混合されている混合比を明示しているダウンミックス情報を伴った、チャンネルが混合されたことによりいたったダウンミックス信号と、例えば個々のチャンネル18a〜18d間のレベル/強度差、位相差、時間差および/または、相関/干渉性の計測によってマルチチャンネル信号の空間イメージを表している空間パラメータによって示されうる。相関低減装置12の出力は、個々のチャンネル20a〜20dに分割される。後者のチャンネルは、例えば、時間信号として、または、例えばスペクトル的にサブバンドに分解されるようなスペクトログラムとして出力されうる。
【0022】
方向フィルタ14a〜14hは、各チャンネルと関連した仮想音源の位置から聴取者の各耳道までのチャンネル20a〜20dのそれぞれの音響伝達をモデル化するように構成される。
図1において、方向フィルタ14a〜14dは、例えば、左の耳道への音響伝達をモデル化し、一方で、方向フィルタ14e〜14hは、右の耳道への音響伝達をモデル化する。方向フィルタは、室内の仮想音源の位置から聴取者の耳道への音響伝達をモデル化しうるし、時間、レベルおよびスペクトルの修正を実行することによって、このモデリングを実行しうるし、そして、選択的に室内反射および残響を実行しうる。方向フィルタ18a〜18hは、時間または周波数領域において実行されうる。すなわち、方向フィルタは、FIRフィルタのような時間領域フィルタでありうるし、または、チャンネル20a〜20dの各スペクトル値を有する各伝達関数のサンプル値を掛けることにより周波数領域に作用しうる。特に、方向フィルタ14a〜14hは、例えば、人間の頭部、耳、肩での相互作用を含む、各仮想音源の位置から各耳道までの、各チャンネル信号20a〜20dの相互作用を表している各頭部伝達関数をモデル化するように選択されうる。第1のミキサー16aは、バイノーラル出力信号の左チャンネルに寄与する、または、バイノーラル出力信号の左チャンネルでさえあることを目的とした信号22aを得るために聴取者の左の耳道への音響伝達をモデル化する方向フィルタ14a〜14dの出力を混合するように構成される。その一方で、第2のミキサー16bは、信号22bを得るために聴取者の右の耳道への音響伝達をモデル化する方向フィルタ14e〜14hの出力を混合するように構成され、そしてそれは、バイノーラル出力信号の右チャンネルに寄与する、あるいはバイノーラル出力信号の右チャンネルでさえあることを目的とされる。
【0023】
各実施形態に関して以下で詳しく述べるように、室内反射および/または残響を考慮するために、別の寄与は、信号22aおよび22bに追加されうる。この手段によって、方向フィルタ14a〜14hの煩雑性は、低減されうる。
【0024】
図1の装置において、類似性低減装置12は、それぞれ、ミキサー16aおよび16bに入力される相互関係のある信号の総和のマイナスの副作用、それによりバイノーラル出力信号22aおよび22bの低減された空間幅および外在化の欠如が結果として生じるものだが、その副作用を無効にする。類似性低減装置12によって得られるその非相関性(decorrelation)は、これらのマイナスの副作用を低減する。
【0025】
次の実施形態に移る前に、
図1は、換言すれば、例えば、復号マルチチャンネル信号からのヘッドホン出力の生成のための信号の流れを示す。各信号は、1対の方向フィルタによってフィルタにかけられる。例えば、チャンネル18aは、方向フィルタ14a〜14eの1対によってフィルタにかけられる。残念なことに、相関のようなかなり多くの類似性が、典型的なマルチチャンネル音生成のチャンネル18a〜18dの間に存在する。このことはバイノーラル出力信号にマイナスの影響を及ぼすだろう。すなわち、方向フィルタ14a〜14hによってマルチチャンネル信号を処理した後、方向フィルタ14a〜14hによって出力される中間信号は、ヘッドホン出力信号20aおよび20bを形成するために、ミキサー16aおよび16bで加算される。類似/相関している出力信号の総和は、結果として出力信号20aおよび20bの極めて低減された空間幅をもたらし、そして外在化の欠如をもたらす。これは、特に左右の信号およびセンターチャンネルの類似/相関に関して問題を含む。したがって、類似性低減装置12は、これらの信号間の類似性をできるだけ離れるように低減することである。
【0026】
複数のチャンネル18(18a〜18d)のチャンネル間での類似性を低減するために類似性低減装置12によって実行されるほとんどの方法が、音響伝達の上述のモデリングを実行するためだけでなく、ちょうど述べた非相関性のような非類似性を得るために、方向フィルタを同時に変更することに関する類似性低減装置12を取り除くことによっても達成できることは留意する必要がある。したがって、方向フィルタは、例えばHRTFでなく、修正された頭部伝達関数をモデル化するだろう。
【0027】
図2は、例えば、各チャンネルに関連した仮想音源の位置から聴取者の耳道への一組のチャンネルの音響伝達をモデル化するための相互類似性を低減している頭部伝達関数の組を形成するための装置を示す。概して30により示される装置は、HRTFプロセッサ34だけでなく、HRTFプロバイダ32を含む。
【0028】
HRTFプロバイダ32は、元の複数のHRTFを供給するように構成される。ステップ32は、ある音の位置から標準のダミーリスナの耳道までの頭部伝達関数を測定するために、標準のダミーヘッドを使用している測定を含みうる。同様に、HRTFプロバイダ32は、メモリから元のHRTFを単に検索する、または、読み込むように構成されうる。さらに他には、例えば、興味がある仮想音源の位置に応じて、HRTFプロバイダ32は、所定の公式に従ってHRTFを割り出すように構成されうる。したがって、HRTFプロバイダ32は、バイノーラル出力信号ジェネレータを設計するための設計環境において作動するように構成されうるし、または、例えば仮想音源の位置の選択または変更に応答するようにオンラインで元のHRTFを供給するために、この種のバイノーラル出力信号ジェネレータの信号自体の一部でありうる。例えば、装置30は、それらのチャンネルに関連した異なる仮想音源の位置を有する異なるスピーカ構成を目的としているマルチチャンネル信号に適応できるバイノーラル出力信号ジェネレータの一部でもありうる。この場合、HRTFプロバイダ32は、現在意図された仮想音源の位置に適合される方法で元のHRTFを供給するように構成されうる。
【0029】
HRTFプロセッサ34は、次に、少なくとも1対のHRTFのインパルス応答に互いに比較して位置を変えさせるように、または、スペクトル的に変化させる意味で、互いに比較して異なってその位相および/または振幅応答を修正するように、構成される。HRTFの1対は、左および右のチャンネル、フロントおよびリアチャンネル、センターおよび非センターチャンネルのうちの1つの音響伝達をモデル化しうる。実質的に、このことは、マルチチャンネル信号の1つまたはいくつかのチャンネルに適用される以下の技術の1つまたは組み合わせにより達成されうる。すなわち、各チャンネルのHRTFを遅らせ、各HRTFの位相応答を修正し、および/または各HRTFへの全域通過フィルタなどの非相関性フィルタを適用し、それにより、HRTFの相互類似性を低減させた組を得る、および/または、スペクトル的に修正する意味で、各HRTFの振幅応答を修正し、それにより少なくとも相互類似性を低減されたHRTFの組を得る。いずれにせよ、結果として生じる各チャンネル間の非相関性/非類似性は、外部に音源を定位する際に人間の聴覚系をサポートし、それにより頭内(in―the―head)定位が起こるのを防止しうる。例えば、HRTFプロセッサ34は、特定の周波数帯域のための第1のHRTFの群遅延が、少なくとも1つのサンプル分、そのHRTFの他の1つと比較して生じる、または第1のHRTFの特定の周波数帯域が遅れるように、チャンネルHRTFの全てまたは1つまたはいくつかの位相応答の修正を同上が生じさせるように構成できた。更に、HRTFプロセッサ34は、複数の周波数帯域のためのHRTFの他のものに対する第1のHRTFの群遅延が1サンプルの少なくとも8分の1の標準偏差を示すように、位相応答の修正を同上が生じさせるように、構成できた。考慮される周波数帯域は、バーク(Bark)帯域またはそのサブセットまたは他の周波数帯域の再分割でありうる。
【0030】
HRTFプロセッサ34から結果として生じた相互類似性を低減しているHRTFの組は、
図1の装置の方向フィルタ14a〜14hのHRTFを設定するために使用されうる。そこにおいて、類似性低減装置12はある場合もあれば、ない場合もありうる。修正されたHRTFの非類似性という性質のため、バイノーラル出力信号の空間幅および改善された外在化に関する上述の利点は、類似性低減装置12がないときでも、同じように得られる。
【0031】
すでに上述したように、
図1の装置は、入力チャンネル18a〜18dの少なくともいくつかのダウンミックスに基づくバイノーラル出力信号の室内反射および/または残響に関連した寄与を得るように構成された更なる経路によって付随されうる。これは、方向フィルタ14a〜14h上にもたらされた煩雑性を緩和する。この種のバイノーラル出力信号の室内反射および/または残響に関連した寄与を生成するための装置は、
図3において示される。装置40は、ルームプロセッサ44がダウンミックスジェネレータ42の後に続くことで互いに直列に接続されたダウンミックスジェネレータ42とルームプロセッサ44とを含む。装置40は、マルチチャンネル信号18が入力される
図1の装置の入力と、ルームプロセッサ44の左チャンネルの寄与46aが出力22aに追加され、ルームプロセッサ44の右チャンネル出力46bが出力22bに追加されるバイノーラル出力信号の出力との間に接続されうる。ダウンミックスジェネレータ42は、マルチチャンネル信号18のチャンネルからモノラルまたはステレオのダウンミックス48を形成し、そして、プロセッサ44は、モノラルまたはステレオの信号48に基づいて室内反射および/または残響をモデル化することによって、バイノーラル信号の室内反射および/または残響に関連した寄与の左チャンネル46aおよびの右チャンネル46bを生成するように構成される。
【0032】
ルームプロセッサ44の基礎をなしている考えは、例えば一室で生じる室内反射/残響が、マルチチャンネル信号18のチャンネルの単純な加算のようなダウンミックスに基づいた、聴取者にとってトランスペアレントな方法でモデル化されうる。室内反射/残響は、音源から耳道までの直接経路または見通し線に沿って伝わる音よりも後に生じるので、ルームプロセッサのインパルス応答は、
図1に示される方向フィルタのインパルス応答の末端を表し、そして置換する。方向フィルタのインパルス応答は、同様に、直接経路や聴取者の頭部、耳、肩で生じる反射や減弱をモデル化するのに限定されうる。このことにより、方向フィルタのインパルス応答を短くすることを可能にする。もちろん、方向フィルタによりモデル化されたものとルームプロセッサ44によりモデル化されたものの間の境界は、その方向フィルタが、例えば、第1の室内反射/残響をモデル化もしうるように自由に変化しうる。
【0033】
図4aおよび
図4bは、ルームプロセッサの内部構造のための可能性のある実施例を示す。
図4aによれば、ルームプロセッサ44は、モノラルのダウンミックス信号48によって供給されて、そして2つの残響フィルタ50aおよび50bを含む。その方向フィルタに類似して、残響フィルタ50aおよび50bは、時間領域または周波数領域において作動するように実行されうる。両方の入力は、モノラルのダウンミックス信号48を受ける。残響フィルタ50aの出力は、左チャンネル寄与出力46aを供給し、一方で、残響フィルタ50bは右チャンネル寄与信号46bを出力する。
図4bは、ルームプロセッサ44がステレオのダウンミックス信号48を供給されている場合におけるルームプロセッサ44の内部構造の例を示す。この場合、ルームプロセッサは、4つの残響フィルタ50a〜50dを含む。残響フィルタ50aおよび50bの入力は、ステレオのダウンミックス48の第1のチャンネル48aと接続され、一方で、残響フィルタ50cおよび50dの入力は、ステレオのダウンミックス48のもう一方のチャンネル48bと接続される。残響フィルタ50aおよび50cの出力は、アダー(adder)52aの入力と接続され、そして、それの出力は左チャンネル寄与46aを供給する。残響フィルタ50bおよび50dの出力は、別のアダー52bの入力と接続され、そして、それの出力は右チャンネル寄与46bを供給する。
【0034】
ダウンミックスジェネレータ42が、マルチチャンネル信号のチャンネルを、各チャンネルを均等に重み付けして、単純に加算しうることが説明されたが、これは必ずしも
図3の実施形態に関する場合というわけではない。むしろ、
図3のダウンミックスジェネレータ42は、モノラルまたはステレオのダウンミックス48を形成するよう構成され、その結果、複数のチャンネルは、マルチチャンネル信号18の少なくとも2つのチャンネルの間で異なっているレベルでモノラルまたはステレオのダウンミックスに寄与する。この手段により、特定のチャンネルまたはマルチチャンネル信号に混合される音声またはバックグラウンドミュージックのようなマルチチャンネル信号の特定のコンテンツは、ルームプロセッシングの影響を受けることを妨げられうる、または促されうる。そして、それによって、不自然な音を回避する。
【0035】
例えば、マルチチャンネル信号18の複数のチャンネルのセンターチャンネルがマルチチャンネル信号18の他のチャンネルと比較してレベルを低減した方法でモノラルまたはステレオのダウンミックス信号48に寄与するように、
図3のダウンミックスジェネレータ42は、モノラルまたはステレオのダウンミックス48を形成するように構成されうる。例えば、レベルの低減量は、3dBと12dBの間でありうる。レベルの低減は、均一にマルチチャンネル信号18のチャンネルの有効なスペクトル範囲にわたって広がっていることもあり、または、声の信号により一般的に占有されるスペクトル部分のような特定のスペクトル部分に集中するなどの周波数依存であることもある。他のチャンネルに対するレベル低減量は、他の全てのチャンネルで同じでありうる。すなわち、他のチャンネルは、同じレベルでダウンミックス信号48に混合されうる。あるいは、他のチャンネルは、不均一なレベルでダウンミックス信号48に混合されうる。それから、その他のチャンネルに対するレベル低減量は、その他のチャンネルの平均値またはその低減された1つを含むすべてのチャンネルの平均値と比較されうる。その場合は、その他のチャンネルのミキシングウェイトの標準偏差またはすべてのチャンネルのミキシングウェイトの標準偏差は、ちょうど言及した平均値と比較してレベルを減じたチャンネルのミキシングウェイトのレベル低減の66%より小さいこともありうる。
【0036】
センターチャンネルに関するレベル低減の効果は、寄与56aおよび56bを経て得られたバイノーラル出力信号が 、(少なくともより詳細に下で述べられるいくつかの状況では)、レベル低減なしのものよりもより自然に聴取者に知覚される。換言すれば、その他のチャンネルの加重値と比較してセンターチャンネルに関連する加重値が減じられた状態で、ダウンミックスジェネレータ42は、マルチチャンネル信号18のチャンネルの加重和を形成する。
【0037】
センターチャンネルのレベル低減は、特に映画の会話または音楽の音声部分で有利である。これらの音声部分で得られたオーディオの印象の改良は、非音声位相のレベル低減による軽微なペナルティを過分に補償する。しかし、別の実施例によれば、レベル低減は一定でない。むしろ、ダウンミックスジェネレータ42は、レベル低減のスイッチを切ったモードとレベル低減のスイッチを入れたモードとの間で切り替わるように構成されうる。換言すれば、ダウンミックスジェネレータ42は、時間変化する方法でレベル低減量を変化させるように構成されうる。その変化は、ゼロおよび最大値との間で、バイナリまたは類似した種類のものでありうる。ダウンミックスジェネレータ42は、モードスイッチングまたはマルチチャンネル信号18内に含まれる情報に依存しているレベル低減量の変化を実行するように構成されうる。例えば、ダウンミックスジェネレータ42は、音声位相を検出する、または、これらの音声位相と非音声位相を区別するように構成されうるし、あるいは、センターチャンネルの連続したフレームに、少なくとも順序尺度である音声内容を測定する音声内容計測を割り当てうる。例えば、ダウンミックスジェネレータ42は、音声フィルタによってセンターチャンネルの音声の存在を検出し、そして、このフィルタの出力レベルが合計閾値を上回るかどうかに関して判断する。しかし、ダウンミックスジェネレータ42によるセンターチャンネルの音声位相の検出は、レベル低減量変化の前述のモードスイッチングを時間依存させるようにする唯一の方法ではない。例えば、マルチチャンネル信号18は、特に音声位相と非音声位相との間で区別する、または、量的に音声内容を測定することを目的とする、それに関連した補助情報を有しうる。この場合、ダウンミックスジェネレータ42は、この補助情報に応答し作動する。他の可能性は、ジェネレータ42が、例えばセンターチャンネル、左チャンネル、右チャンネルの現在のレベルの間での比較に依存して、前述のモードスイッチングまたはレベル低減量の変化を実行することだろう。センターチャンネルが、左右のチャンネルよりも、個々に、または、その総計と比較して、特定の閾値比以上の差で大きい場合に、ダウンミックスジェネレータ42は、音声位相が現在存在するとみなし、それにしたがって、すなわち、レベル低減を実行することによって動作しうる。同様に、ダウンミックスジェネレータ42は、上述した依存性を実現するために、センター、左および右のチャンネル間のレベル差を使用しうる。
【0038】
この他に、ダウンミックスジェネレータ42は、マルチチャンネル信号18のマルチプルチャンネルの空間イメージを説明するために使用される空間パラメータに応答しうる。これを
図5に示す。
図5は、特別なオーディオ符号化を用いることにより、すなわち、複数のチャンネルがダウンミックスされたダウンミックス信号62および複数のチャンネルの空間イメージを表している空間パラメータ64を用いることにより、マルチチャンネル信号18が複数のチャンネルを示す場合のダウンミックスジェネレータ42の一例を示す。選択的に、マルチチャンネル信号18は、個々のチャンネルがダウンミックス信号62に混合される比を表しているダウンミキシング情報、または、ダウンミックス信号62のダウンミックスチャンネルを含みうる。そのダウンミックスチャンネル62は、例えば、通常のダウンミックス信号62またはステレオのダウンミックス信号62でありうる。
図5のダウンミックスジェネレータ42は、復号器64とミキサー66とを含む。復号器64は、空間オーディオ復号化に従って、特に、センターチャンネル66、そして他のチャンネル68を含んでいる複数のチャンネルを得るために、マルチチャンネル信号18を復号する。ミキサー66は、前述のレベル低減を実行することによって、モノラルまたはステレオの信号48を引き出すためにセンターチャンネル66およびその他の非センターチャンネル68を混合するように構成される。破線70によって示されるように、ミキサー66は、上述したように、変化させられたレベル低減の量に関するレベル低減モードとレベル低減なしのモードとの間で切り替わるために空間パラメータ64を使用するように構成されうる。ミキサー66により用いられた空間パラメータ64は、例えば、センターチャンネル66、左チャンネルまたは右チャンネルがダウンミックス信号62からどのように導き出されうるかを表しているチャンネル予測係数でありうる。そこにおいて、ミキサー66は加えて、それぞれ、フロント左およびリア左チャンネルおよびフロント右およびリア右チャンネルのダウンミックスでありうるちょうど言及された左右のチャンネルとの間で可干渉性または相互相関を示している相互チャンネル可干渉性/相互相関パラメータを使用しうる。例えば、センターチャンネルは、前述のステレオダウンミックス信号62の左チャンネルおよび右チャンネルに固定した比率で混合されうる。この場合、2チャンネル予測係数は、センター、左および右チャンネルがどのようにステレオダウンミックス信号62の2つのチャンネルの各線形結合から導き出されうるか決めるために充分である。例えば、ミキサー66は、音声位相および非音声位相を区別するために、チャンネル予測係数の和と差との間の比率を使用しうる。
【0039】
センターチャンネルに関するレベル低減が、マルチチャンネル信号18の少なくとも2つのチャンネルの間で異なっているレベルのモノラルまたはステレオのダウンミックスに同上が寄与するように、複数のチャンネルの加重和を例証するために説明されたが、この、または、これらのチャンネルに存在するある音源コンテントが、低減/増幅されたレベルではなく、マルチチャンネル信号の他のコンテンツと同じレベルでルームプロセッシングの影響を受ける、または、受けないことになっているので、他のチャンネルが他方の、または、他のチャンネルと比較して、都合よくレベル低減またはレベル増幅された他の例もある。
【0040】
図5は、むしろ、ダウンミックス信号62および空間パラメータ64によって複数の入力チャンネルを示す可能性に関して、概して説明されたものである。
図6に関して、この説明は強められる。
図6に関する説明は、また、
図10から13に関して説明された以下の実施形態を理解することにも使用される。
図6は、スペクトル的に複数のサブバンド82に分解されたダウンミックス信号62を示す。見本となるように、
図6において、周波数領域の矢印84によって示されるように、サブバンド82がサブバンド周波数を底部から上部へ増加して配置された状態で水平に延長するように示される。水平方向への拡張は、時間軸86を意味する。例えば、ダウンミックス信号62は、サブバンド82ごとに一連のスペクトル値88を含む。サブバンド82がサンプル値88によってサンプリングされる時間分解能は、フィルタバンクのスロット90によって定義されうる。このように、タイムスロット90およびサブバンド82は、ある時間/周波数分解能またはグリッドを定める。
図6の破線によって示されるように、より粗い時間/周波数グリッドは時間/周波数のタイル92に隣接したサンプル値88を結合させることによって定められ、そして、これらのタイルが時間/周波数パラメータ解像度またはグリッドを定める。上述した空間パラメータ62は、その時間/周波数パラメータ解像度92において定義される。時間/周波数パラメータ解像度92は、時間で変化しうる。この目的で、マルチチャンネル信号62は、連続したフレーム94に分割されうる。フレームごとに、時間/周波数分解能グリッド92は、個々に設定できる。復号器64が時間領域においてダウンミックスを受けとる場合、復号器64は、
図6に示すようにダウンミックス信号62の表現を導き出すために内部の分析フィルタバンクから成ることもある。あるいは、ダウンミックス信号62は
図6に示すような形式で復号器64に入り、その場合、分析フィルタバンクは復号器64には必要でない。
図5においてすでに述べたように、タイル92ごとに、2つのチャンネル予測係数は、各時間/周波数のタイル92に関して、右および左チャンネルがどのようにステレオのダウンミックス信号62の左右のチャンネルから導き出されうるかを明らかにして存在する。加えて、相互チャンネル可干渉性/相互相関(ICC:inter−channel coherence/cross−correlation)パラメータは、ステレオダウンミックス信号62から導き出されるために左右チャンネル間のICC類似性を指し示しているタイル92のために存在しうる。そこにおいて、ステレオダウンミックス信号62の1本のチャンネルは完全に混合されており、一方で、その他方は、ステレオダウンミックス信号62の他のチャンネルに完全に混合されている。しかし、チャンネルレベル差(CLD:channel level difference)パラメータは、ちょうど言及された左右のチャンネル間のレベル差を示しているタイル92ごとに更に存在する。対数目盛上の均一でない量子化はCLDパラメータに適用されうる。ここで、チャンネル間のレベルにおいて大きな差があるとき、その量子化は0dB付近の高い正確さとより粗い解像度を有する。加えて、別のパラメータは、空間パラメータ64の中に存在しうる。これらのパラメータは、ちょうど言及された、例えばリア左、フロント左、リア右およびフロント右のチャンネルのような左右チャンネルを混合することによって形成するのに役立ったチャンネルに関連するCLDおよびICCを特に定めうる。
【0041】
上述した実施形態が互いに組み合わせられうることは、留意すべきことである。いくつかの組み合わせの可能性は、すでに上に述べた。別の可能性は、
図7から13までの実施形態に関して以下に述べられる。加えて、
図1および5の上述した実施形態は、中間のチャンネル20、66および68が、それぞれ、実際に装置内に存在すると仮定した。しかし、これは必ずしもそうとは限らない。例えば、
図2の装置により導き出されるような修正されたHRTFは、類似性低減装置12を除外することにより
図1の方向フィルタを定めるのに使用されうる。そして、この場合、
図1の装置は、
図5に示されるダウンミックス信号62のようなダウンミックス信号に作用しうる。そして、空間パラメータおよび修正されたHRTFを時間/周波数パラメータ解像度92において最適に組み合わせることによって、複数のチャンネル18a〜18dを示して、それに応じて得られた線形結合係数をバイノーラル信号22aおよび22bを形成するために適用する。
【0042】
同様に、ダウンミックスジェネレータ42は、ルームプロセッサ44への提供を目的とするモノラルまたはステレオのダウンミックス48を得るためにセンターチャンネルのために得られる空間パラメータ64およびレベル低減量を最適に組み合わせるように構成されうる。
図7は、一実施形態に従ったバイノーラル出力信号ジェネレータを示す。概して引用符号100によって示されるジェネレータは、マルチチャンネル復号器102、バイノーラル出力104およびマルチチャンネル復号器102の出力とバイノーラル出力104の間で拡張している2つの経路、すなわち直接経路106と残響経路108とを含む。直接経路において、方向フィルタ110は、マルチチャンネル復号器102の出力に接続される。直接経路は、さらに、アダー112の第1のグループとアダー114の第2のグループを含む。アダー112は、方向フィルタ110の最初の半分の出力信号を計上し、そして、第2のアダー114は方向フィルタ110のもう半分の出力信号を計上する。第1および第2のアダー112および114の合計された出力は、バイノーラル出力信号22aおよび22bの前述の直接経路の寄与を示す。アダー116および118は、寄与信号22aおよび22bを、残響経路108により供給されるバイノーラル寄与信号、すなわち、信号46aおよび46bと結合するために供給される。残響経路108において、ミキサー120およびルームプロセッサ122はマルチチャンネル復号器102の出力およびアダー16および118の各入力との間で直列に接続される。そして、それらアダーの出力は、出力104で出力されるバイノーラル出力信号を定める。
【0043】
図7の装置についての以下の説明の理解を容易にするために、
図1から6において使用された引用符号は、
図1から6で生ずる要素に対応する、または、それら要素の機能の責任を負う、
図7の要素を示すために部分的に使用されている。対応の説明は、後の説明でより明白になるだろう。しかし、以下の説明を容易にするために、以下の実施形態は、類似性低減装置が相関低減を実行すると仮定して説明されたことが留意される。したがって、後者は、以下において、相関低減装置を示す。しかし、上記から明白になったように、下で概説される実施形態は、類似性低減装置が相関に関して以外の類似性の低減を実行するケースに容易に振替え可能である。更に、上記のように、別の実施形態への転用は容易に可能だろうが、以下で概説される実施形態は、ルームプロセッシングのためのダウンミックスを生成するためのミキサーがセンターチャンネルのレベル低減を生成すると仮定して立案されている。
【0044】
図7の装置は、復号化マルチチャンネル信号124からの出力104でのヘッドホン出力の生成のための信号伝達を使用する。復号化されたマルチチャンネル124は、例えば、空間オーディオ復号化などによるビットストリーム入力126でのビットストリーム入力からマルチチャンネル復号器102によって得られる。復号化の後、復号化されたマルチチャンネル信号124の各信号または各チャンネルは、1対の方向フィルタ110によってフィルタにかけられる。例えば、復号化されたマルチチャンネル信号124の第1の(上側の)チャンネルは、方向フィルタ(1,L)および方向フィルタ(1,R)によってフィルタにかけられ、そして、第2の(上から2番目の)信号またはチャンネルは、方向フィルタ(2,L)および方向フィルタ(2,R)などによってフィルタにかけらえる。これらのフィルタ110は、室内の仮想音源から聴取者の耳道への音響伝達、いわゆる両耳室内伝達関数(BRTF:binaural room transfer function)をモデル化しうる。それらは、時間、レベルそしてスペクトルの修正を実行しうる。そして、部分的に室内反射、残響もまたモデル化しうる。方向フィルタ110は、時間または周波数領域において実行されうる。必要な多くのフィルタ110(N×2、Nは復号化されたチャンネル数)があるので、これらの方向フィルタは、室内反射および残響を完全にモデル化する場合、それらフィルタはかなり長くなる、すなわち、フィルタリング処理が計算上、必要とされるだろう場合には、44.1kHzで20000フィルタタップという長さになる。方向フィルタ110は、最小限、いわゆる頭部伝達関数(HRTF)まで都合よく減少させられる。そして共通の処理ブロック122は、室内反射および残響のモデルが使用される。ルームプロセッシングモジュール122は時間または周波数領域の残響算法を実行することができて、1または2のチャンネル入力信号48から作動しうる。ここで、その入力信号はミキサー120内で、混合行列によって復号化マルチチャンネル入力信号124から算出される。ルームプロセッシングブロックは、室内反射および/または残響を実行する。特に距離、および、聴取者の頭の外に知覚されることを意味する外在化に関して、室内反射および残響は音の定位に必要不可欠である。
【0045】
一般的に、支配的な音響エネルギーがフロントチャンネル、すなわち、左フロント、右フロント、センターに含まれるように、マルチチャンネル音は生成される。映画の会話および音楽における声は、一般的にセンターチャンネルに主に混合される。センターチャンネル信号がルームプロセッシングモジュール122に供給される場合、結果として生じる出力は、しばしば不自然に残響し、スペクトル的に不均一に知覚される。したがって、
図7の実施形態によれば、センターチャンネルは、すでに上で記載したように、ミキサー120内でレベル低減が実行され、6dB減衰されたような有意なレベル低減を有するルームプロセッシングモジュール122に供給される。その範囲において、
図7の実施形態は、
図3および5に記載の構造を含む。そこにおいて、
図7の引用符号102、124、120、および122は、
図3および5の引用符号18、64、引用符号66および68の結合、引用符号66および引用符号44にそれぞれ対応する。
【0046】
図8は、別の実施形態に従う他のバイノーラル出力信号ジェネレータを示す。そのジェネレータは、概して引用符号140によって示される。
図8の説明を容易にするために、同じ引用符号が、
図7にあるように使用された。
図3、5および7の実施形態によって示されるような機能、すなわち、センターチャンネルに関してレベル低減を実行する機能を、ミキサー120が必ずしも有するというわけではないことを示すために、引用符号40’は、ブロック102、120および122の配置を示すために使用された。換言すれば、ミキサー122内のレベル低減は、
図8の場合には選択的である。しかし、
図7と異なり、非相関装置(decorrelator)は、方向フィルタ110の各対と復号化されたマルチチャンネル信号124の関連するチャンネルのための復号器102の出力との間にそれぞれ接続される。非相関装置は、引用符号1421、1422などによって示される。非相関装置1421〜1424は、
図1に示す相関低減装置12として働く。
図8に示されるにもかかわらず、非相関装置1421〜1424が復号化されたマルチチャンネル信号124のチャンネルの各々に供給される必要はない。むしろ、1つの非相関装置で充分だろう。非相関装置142は、単に遅延でありうる。好ましくは、遅延1421〜1424の各々によって生じる遅延量は、互いに異なるだろう。他の可能性は、非相関装置1421〜1424が全通過フィルタであるということ、すなわち、ある定常的な大きさの伝達関数を有するが、各チャンネルのスペクトル成分の位相を変えるフィルタであることである。非相関装置1421〜1424によって生じる位相修正は、好ましくは各チャンネルで異なるだろう。他の可能性も、もちろん存在するだろう。例えば、非相関装置1421〜1424は、FIRフィルタ、またはそのようなものとして実行されうる。
【0047】
このように、
図8の実施形態によれば、要素1421〜1424、110、112、および114は、
図1の装置10に従って作動する。
【0048】
図8と同様に、
図9は、
図7のバイノーラル出力信号ジェネレータのバリエーションを示す。このように、
図9も、
図7において用いられているものと同じ引用符号を使用して、以下で説明される。
図8の実施形態と同様に、ミキサー122のレベル低減は単に
図9の場合は選択的である。したがって、
図7の場合のような引用符号40というより、むしろ引用符号40’が
図9にある。
図9の実施形態は、有意な相関がマルチチャンネルの音生成におけるすべてのチャンネルの間に存在するという問題に対処する。方向フィルタ110に関するマルチチャンネル信号の処理後、各フィルタ対の2つのチャンネルの中間信号は、出力104のヘッドホン出力信号を形成するために、アダー112および114によって加算される。アダー112および114による相関した出力信号の和は、結果として出力104の出力信号の極めて低減された空間幅および外在化の欠如をもたらす。これは、復号化されたマルチチャンネル信号124内の左右の信号およびセンターチャンネルの相関に特に問題を含む。
図9の実施形態によれば、方向フィルタは、できるだけ非相関な(decorrelated)出力を有するように構成される。この目的で、
図9の装置は、HRTFの元々の組を基礎として方向フィルタ110により用いられる相互類似性を低減しているHRTFの組を形成するための装置30を含む。上述の通り、装置30は、復号化されたマルチチャンネル信号124の1つまたはいくつかのチャンネルに関連する方向フィルタの対のHRTFに関して、以下の技術の1つまたはいくつかを使用しうる:例えばフィルタタップの位置を変えることによって、各方向フィルタの位相応答を修正することによって、そして、全通過フィルタのような非相関フィルタ(decorrelation filter)を、各チャンネルの各方向フィルタに適用することによって、なされうるそのインパルス応答の位置を変えることによって、方向フィルタまたは各方向フィルタの対を遅延させる。この種の全通過フィルタは、FIRフィルタとして実行することができる。
【0049】
上述の通り、装置30は、ビットストリーム入力126のビットストリームが向くラウドスピーカ構成における変化に応答して作動しうる。
【0050】
図7から9の実施形態は、復号化されたマルチチャンネル信号に関連したものである。以下の実施形態は、ヘッドホンのためのパラメータのマルチチャンネルの復号化に関する。一般的に言って、空間オーディオ符号化は、より高い圧縮率を得るためにマルチチャンネルオーディオ信号の知覚的な相互チャンネルの無関係を活用するマルチチャンネル圧縮技術である。これは、空間的な手がかりまたは空間パラメータ、すなわち、マルチチャンネルのオーディオ信号の空間イメージを表しているパラメータに関して取り込むことができる。空間的な手がかりは、一般的にチャンネル間のレベル/強度の差、位相差および相関/可干渉性の計測を含み、そして極めて簡潔な方法で示すことができる。空間オーディオ符号化の構想は、結果としてMPEGサラウンド標準、すなわち、ISO/IEC23003―1をもたらしたMPEGによって採用された。空間オーディオ符号化において用いられたような空間パラメータは、方向フィルタを説明するためにも用いることができる。そうすることによって、空間オーディオデータを復号化するステップと方向フィルタを適用するステップは、ヘッドホン再生のためのマルチチャンネルオーディオを能率的に復号化し、供給するために組み合わせることができる。
【0051】
ヘッドホン出力のための空間オーディオ復号器の一般の構造は、
図10に与えられる。
図10の復号器は、概して、引用符号200によって示され、そして、ステレオまたはモノラルのダウンミックス信号204のための入力、空間パラメータ206のための他の入力およびバイノーラル出力信号208のための出力を含んでいるバイノーラル空間サブバンド修正器(modifier)202を含む。空間パラメータ206を伴ったダウンミックス信号は、前述のマルチチャンネル信号18を形成して、その複数のチャンネルを示す。
【0052】
内部的に、サブバンド修正器202は、入力されたダウンミックス信号とサブバンド修正器202の出力との間に述べられる順に接続された分析フィルタバンク208、行列化ユニットまたは線形結合器210、および、合成フィルタバンク212を含む。更に、サブバンド修正器202は、空間パラメータ206によって供給されるパラメータ変換装置214および装置30によって得られるようなHRTFの修正された一組を含む。
【0053】
図10では、ダウンミックス信号は、例えばエントロピー符号化を含んで、前もってすでに復号されたと仮定される。バイノーラル空間オーディオ復号器は、ダウンミックス信号204によって供給される。パラメータ変換装置214は、バイノーラルパラメータ218を形成するために、修正されたHRTFパラメータ216の形で、空間パラメータ206および方向フィルタのパラメータ記述を使用する。これらのパラメータ218は、周波数領域において、2×2の行列(ステレオダウンミックス信号の場合)の形で、そして、1×2の行列(モノラルダウンミックス信号204の場合)の形で、分析フィルタバンク208によって出力されるスペクトル値88に行列化ユニット210によって適用される(
図6参照)。換言すれば、バイノーラルパラメータ218は、
図6に示される時間/周波数パラメータ解像度92において変動し、各サンプル値88に適用される。補間は、より粗い時間/周波数パラメータ領域92から分析フィルタバンク208の時間/周波数分解能まで、行列係数およびバイノーラルパラメータ218を、それぞれ、整形するために使用されうる。すなわち、ステレオダウンミックス204の場合、装置210によって実行される行列化により、ダウンミックス信号204の左チャンネルのサンプル値とダウンミックス信号204の対応する右チャンネルのサンプル値の1対あたり2つのサンプル値が結果として生じる。結果として生じる2つのサンプル値は、それぞれ、バイノーラル出力信号208の左右のチャンネルの一部である。モノラルのダウンミックス信号204の場合には、装置210による行列化は、モノラルのダウンミックス信号204、すなわち、バイノーラル出力信号208の左チャンネルのための1つと右チャンネルのための1つのサンプル値ごとに、結果として2つのサンプル値になる。バイノーラルパラメータ218は、ダウンミックス信号204の1つまたは2つのサンプル値からバイノーラル出力信号208のそれぞれの左右のチャンネルサンプル値まで導く行列演算を定める。バイノーラルパラメータ218は、すでに修正されたHRTFパラメータを反映する。このように、それらは、上記のようにマルチチャンネル信号18の入力チャンネルを非相関にする。
【0054】
このように、行列化ユニット210の出力は、
図6で示すような修正されたスペクトログラムである。合成フィルタバンク212は、そこからバイノーラル出力信号208を再構築する。換言すれば、合成フィルタバンク212は、行列化ユニット210により出力される結果として生じる2つのチャンネル信号を時間領域に変換する。これは、もちろん、選択的である。
【0055】
図10の場合には、室内反射および残響の効果は、別途述べられなかった。もしあったとすれば、これらの効果は、HRTF216において考慮されなければならない。
図11は、バイノーラル空間オーディオ復号器200’を別々の室内反射/残響処理と結合しているバイノーラル出力信号ジェネレータを示す。
図11の引用符号200’の中の「’」は、
図11のバイノーラル空間オーディオ復号器200’が修正されていないHRTF、すなわち、
図2に示すような元のHRTFを使用しうることを意味するものとする。しかし、選択的に、
図11のバイノーラル空間オーディオ復号器200’は、
図10に示されるものでありうる。いずれにせよ、概して引用符号230によって示される
図11のバイノーラル出力信号ジェネレータは、バイノーラル空間復号器200’の他に、ダウンミックスオーディオ復号器232、修正された空間オーディオサブバンド修正器234、ルームプロセッサ122および2つのアダー116および118を含む。ダウンミックスオーディオ復号器232は、ビットストリーム入力126およびバイノーラル空間オーディオ復号器200’のバイノーラル空間オーディオサブバンド修正器202との間に接続される。ダウンミックスオーディオ復号器232は、ダウンミックス信号214および空間パラメータ206を導き出すために入力126で入力されるビットストリームを復号するように構成される。両方とも、すなわち修正された空間オーディオサブバンド修正器234だけでなくバイノーラル空間オーディオサブバンド修正器202も、空間パラメータ206に加えてダウンミックス信号204を供給される。修正された空間オーディオサブバンド修正器234は、ダウンミックス信号204から、センターチャンネルのレベル低減の前述の量を反映している修正されたパラメータ236だけでなく空間パラメータ206の使用により、ルームプロセッサ122のための入力として役立つモノラルまたはステレオのダウンミックス48を割り出す。バイノーラル空間オーディオサブバンド修正器202とルームプロセッサ122の両方により出力される寄与は、それぞれ、出力238で結果としてバイノーラル出力信号をもたらすためにアダー116および118においてチャンネルごとに合計される。
【0056】
図12は、
図11のバイノーラルオーディオ復号器200’の機能を説明しているブロック図を示す。
図12は
図11のバイノーラル空間オーディオ復号器200’の実際の内部構造を示さず、バイノーラル空間オーディオ復号器200’によって得られた信号修正を説明するという点には留意する必要がある。バイノーラル空間オーディオ復号器200’の内部構造は、同上が元のHRTFで作動する場合には装置30は切り離しうるということを除いて、通常、
図10に示される構造でコンパイルすることは、想起されることである。加えて、
図12は、マルチチャンネル信号18によって示されるそのわずか3本のチャンネルが、バイノーラル出力信号208を形成するためにバイノーラル空間オーディオ復号器200’によって使用される場合を見本として、バイノーラル空間オーディオ復号器200’の機能を示す。特に、「2 to 3」、すなわち、TTTボックスは、ステレオダウンミックス204の2本のチャンネルからセンターチャンネル242、右チャンネル244および左チャンネル246を導出するために使用される。換言すれば、
図12は、見本として、ダウンミックス204がステレオダウンミックスであると仮定する。TTTボックス248により用いられる空間パラメータ206は、上述のチャンネル予測係数を含む。相関の低減は、
図12のDelayL、DelayRおよびDelayCで示される3つの非相関装置によって達成される。それらは、例えば、
図1および7の場合に導入される非相関性に対応する。しかし、
図12は、実際の構造が
図10に示されたそれに対応するにもかかわらず、単にバイノーラル空間オーディオ復号器200’によってなされる信号修正を示すだけであることがさらにまた想起される。このように、方向フィルタ14を形成しているHRTFと比較して相関低減装置12を形成している遅延は分離した機能として示されるが、相関低減装置12における遅延の存在は、
図12の方向フィルタ14の元のHRTFを形成しているHRTFパラメータの修正として理解されうる。まず、
図12は、単にそれにバイノーラル空間オーディオ復号器200’がヘッドホン再生のためのチャンネルを非相関にする(decorrelate)ことを示すだけである。非相関性は、簡潔な方法によって、すなわち、行列Mのためのパラメータ処理における遅延ブロックとバイノーラル空間オーディオ復号器200’を追加することによって、達成される。このように、バイノーラル空間オーディオ復号器200’は、個々のチャンネルに以下の修正を適用しうる。すなわち、好ましくは少なくとも一つのサンプル分、センターチャンネルを遅延させること、各周波数帯域において、異なる間隔でセンターチャンネルを遅延させること、好ましくは少なくとも一つのサンプル分、左右のチャンネルを遅延させると、および/または各周波数帯域において、異なる間隔で左右のチャンネルを遅延させること、を適用しうる。
【0057】
図13は、
図11の修正された空間オーディオサブバンド修正器の構造のための例を示す。
図13のサブバンド修正器234は、two−to−threeまたはTTTボックス262、重み付けステージ264a〜264e、第1のアダー266aおよび266b、第2のアダー268aおよび268b、ステレオダウンミックス204のための入力、空間パラメータ206のための入力、残差信号270のための更なる入力およびルームプロセッサにより処理され、そして
図13に従えば、ステレオ信号であることを目的としたダウンミックス48のための出力を含む。
【0058】
図13が構造的な意味で修正された空間オーディオサブバンド修正器234のための実施形態を定める際、
図13のTTTボックス262は単にステレオダウンミックス204から空間パラメータ206を使用することによって、センターチャンネル、右チャンネル244、左チャンネル246を再構築するのみである。
図12の場合、チャンネル242〜246が実際は割り出されないことが再度想起される。むしろ、バイノーラル空間オーディオサブバンド修正器は、ステレオダウンミックス信号204がHRTFを反映しているバイノーラル寄与に直接変えられるような方法で、行列Mを修正する。しかし、
図13のTTTボックス262は、実際に再構築を実行する。選択的に、
図13に示すように、上記に示すように、チャンネル予測係数を含み、選択的にICC値を含む、ステレオダウンミックス204および空間パラメータ206に基づいてチャンネル242〜246を再構築するときに、TTTボックス262は予測残差を反映している残差信号270を使用しうる。第1のアダー266aは、ステレオダウンミックス48の左チャンネルを形成するために、チャンネル242〜246を合計するように構成される。特に、加重和はアダー266aおよび266bによって形成される。そこにおいて、加重値は、各チャンネル246から242までに、各加重値EQ
LL、EQ
RLおよびEQ
CLを適用する重み付けステージ264a、264b、264cおよび264eによって定義される。同様に、アダー268aおよび268bは、加重値を形成している加重ステージ264b、264dおよび264eでチャンネル246〜242の加重和を形成する。そして、その加重和はステレオダウンミックス48の右チャンネルを形成する。
【0059】
ステレオダウンミックス48の前述したセンターチャンネルのレベル低減がなされ、上記のように、結果として自然な音感覚に関する効果がもたらされるに、加重ステージ264a〜264eのためのパラメータ270は、上記のように、選択される。
【0060】
このように、換言すれば、
図13は、
図12のバイノーラルパラメータ復号器200’と結合して使用されうるルームプロセッシングモジュールを示す。
図13において、ダウンミックス信号204は、モジュールに供給するために使用される。ダウンミックス信号204は、ステレオ互換性を供給することができるようにマルチチャンネル信号のすべての信号を含む。上記のように、低減されたセンターの信号だけを含んでいる信号をルームプロセッシングモジュールに供給することは、望ましい。
図13の修正された空間オーディオサブバンド修正器は、このレベル低減を実行するのに役立つ。特に、
図13によれば、残差信号270は、センター、左右のチャンネル242〜246を再構築するために使用されうる。
図11には図示されていないが、センターおよび左右のチャンネル242〜246の残差信号は、ダウンミックスオーディオ復号器232によって復号されうる。
【0061】
加重ステージ264a〜264eにより適用されるEQパラメータまたは加重値は、左、右およびセンターチャンネル242〜246のために実数値でありうる。センターチャンネル242のための1つのパラメータの組は、格納され、適用されうる。そして、センターチャンネルは、
図13に従って、ステレオのダウンミックス48の左右両方の出力に例として均等に混合される。修正された空間オーディオサブバンド修正器234に入れられるEQパラメータ270は、以下の性質を有しうる。第1に、センターチャンネル信号は、好ましくは、少なくとも6dB減衰されうる。更に、センターチャンネル信号は、ローパス特性を有しうる。更に、その残りのチャンネルの差分信号は、低周波数で増大させられうる。その他のチャンネル244および246に対してより低いセンターチャンネル242のレベルを補償するために、バイノーラル空間オーディオサブバンド修正器202で使用されるセンターチャンネルのためのHRTFパラメータの利得は、それに応じて、増加しなければならない。
【0062】
EQパラメータの設定の主な目的は、ルームプロセッシングモジュールのための出力におけるセンターチャンネル信号の低減である。しかし、センターチャンネルは、限られた範囲に抑制されなければならないだけである。センターチャンネル信号は、TTTボックス内部で左および右のダウンミックスチャンネルから減算される。センターのレベルが低減される場合、左右のチャンネルのアーチファクトは聞き取れるようになりうる。従って、EQステージにおけるセンターのレベルの低減は、抑制およびアーチファクトの間のトレードオフである。EQパラメータの固定した設定を見つけることは可能であるが、すべての信号に最適であるとは限らない。したがって、実施形態によっては、適合アルゴリズムまたはモジュール274は、1つまたは以下のパラメータの結合によりセンターレベルの低減量を制御するために使用されうる。
【0063】
TTTボックス262の中への左右のダウンミックスチャンネル204からセンターチャンネル242を復号するために使用される空間パラメータ206は、破線276によって示されるように使用されうる。
【0064】
センター、左および右のチャンネルのレベルは、破線278によって示されるように使用されうる。
【0065】
センター、左および右のチャンネル242〜246間のレベル差は、破線278によっても示されるように使用されうる。
【0066】
例えばヴォイス・アクティビティ・ディテクター(VAD:voice activity detector)のようなシングルタイプの検出アルゴリズムの出力は、破線278によっても示されるように使用されうる。
【0067】
最後に、オーディオ内容を表している静的または動的なメタデータは、破線280によって示されるように、センターのレベル低減量を測定するために使用されうる。
【0068】
いくつかの態様が装置の文脈において説明されたが、これらの態様は、また、対応する方法の説明を示しもすることは明らかである。そこにおいて、ブロックまたは装置は、方法のステップまたは方法のステップの特徴に対応する。類似して、方法のステップの文脈においても説明される態様は、対応するブロックまたは項目の説明または例えばASIC、プログラムコードのサブルーチンまたはプログラムされたプログラム可能な論理の一部のような対応する装置の特徴を示す。
【0069】
本発明の符号化されたオーディオ信号は、デジタル記憶媒体に格納できる、または、例えば無線伝送媒体またはインターネットのような有線伝送媒体などの伝送媒体に送信できる。
【0070】
特定の実施要件に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて実施できる。実施例は、例えばフロッピー(登録商標)ディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはFLASHメモリといった、その上に格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体を使用して実行できる。そして、その記憶媒体は、各方法が実行されるように、それはプログラム可能な計算機システムと協動する(または協動することができる)。
【0071】
本発明によるいくつかの実施形態は、プログラム可能な計算機システムと協動可能である、電子的に読み込み可能な制御信号を有するデータキャリアを含む。その結果、ここで説明された方法のうちの1つが実行される。
【0072】
通常、本発明の実施形態は、プログラムコードを有するコンピュータ・プログラム製品として実施できる。そして、コンピュータ・プログラム製品がコンピュータ上で動作するときに、そのプログラムコードは、その方法のうちの1つを実行する働きをする。そのプログラムコードは、例えば、機械読み取り可能なキャリアに格納されうる。
【0073】
他の実施形態は、ここで説明された方法のうちの1つを実行するための、機械読み取り可能キャリアに格納された、コンピュータ・プログラムを含む。
【0074】
したがって、換言すれば、本発明の方法の実施形態は、コンピュータ・プログラムがコンピュータ上で動作するときに、ここに説明された方法のうちの1つを実行するためのプログラムコードを有するコンピュータ・プログラムである。
【0075】
したがって、本発明の方法の別の実施形態は、その上に記録されて、ここに説明された方法のうちの1つを実行するためのコンピュータ・プログラムを含んでいるデータキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)である。
【0076】
したがって、本発明の方法の別の実施形態は、ここにおいて説明された方法のうちの1つを実行するためのコンピュータ・プログラムを示しているデータストリームまたは信号のシーケンスである。例えば、そのデータストリームまたは信号のシーケンスは、データ通信コネクションを介して、例えばインターネットを介して転送されるように構成されうる。
【0077】
別の実施形態は、例えばコンピュータまたはプログラム可能な論理デバイスといった、ここに説明された方法のうちの1つを実行するために構成される、または、適用される処理手段を含む。
【0078】
別の実施形態は、ここに説明された方法のうちの1つを実行するためのコンピュータ・プログラムをその上にインストールしたコンピュータを含む。
【0079】
いくつかの実施形態では、プログラム可能な論理デバイス(例えば論理フィールド・プログラマブル・ゲート・アレイ)は、ここに説明された方法の特徴のいくつかまたは全てを実行するために使用されうる。いくつかの実施形態では、フィールド・プログラマブル・ゲート・アレイは、ここに説明された方法のうちの1つを実行するために、マイクロプロセッサと協動しうる。通常、その方法は、いかなるハードウェア装置によっても好ましくは実行される。
【0080】
上で説明された実施形態は、本発明の原理のために、単に図示しているだけである。ここに説明された装置と詳細の修正および変形は、他の当業者にとって明らかであるものと理解される。したがって、以下の特許請求の範囲のみによって制限され、実施形態の記載および説明の仕方によってここに提示された具体的な詳細によっては制限されないという意図がある。