(58)【調査した分野】(Int.Cl.,DB名)
メタデータが関連付けられた、複数のオーディオソース信号と、バイノーラル空間インパルス応答(BRIR)データベースとを所与として、バイノーラル再生信号を生成する方法であって、
前記複数のオーディオソース信号が、チャンネルベースの信号、オブジェクトベースの信号、または両方の信号の混合であり、
ユーザの位置および向いている方向に対するオーディオソースの相対位置を計算し、
前記オーディオソースの相対位置に応じて前記複数のオーディオソース信号を階層的にグループ化し、
レンダリングに使用されるBRIRをパラメータ化し、
レンダリングされるべき各々のオーディオソース信号を複数のブロックおよびフレームに分割し、
前記パラメータ化されたBRIRシーケンスを平均し、
前記階層的にグループ化されたオーディオソース信号をダウンミックスする、
方法。
前記相対位置は、前記複数のオーディオソースのメタデータおよびユーザ頭部トラッキングデータに基づいて、前記複数のオーディオソース信号の各々の時間フレーム/ブロック毎に計算される、
請求項1に記載の方法。
前記BRIRデータベースにおける各々のBRIRフィルタ信号が、複数のフレームから構成される直接ブロックと、複数の拡散ブロックとに分割され、前記フレームおよびブロックは、それぞれ前記BRIRフィルタ信号のターゲット位置を使用してラベル付けさ
れる、
請求項1に記載の方法。
フレームごとのバイノーラル化処理が、前記オーディオソース信号の現在のブロックのフレームについて、選択されたBRIRフレームを使用して実行され、各々のオーディオソースの前記計算された相対位置に最も近い直近のラベル付けされたBRIRフレームの探索に基づいて各々のBRIRフレームが選択される、
請求項1に記載の方法。
メタデータが関連付けられた複数のオーディオソース信号と、バイノーラル空間インパルス応答(BRIR)データベースとを所与として、バイノーラル再生信号を生成するバイノーラルレンダリング装置であって、
前記複数のオーディオソース信号は、チャンネルベースの信号、オブジェクトベースの信号、または両方の信号の混合であり、
ユーザの位置および向いている方向に対するオーディオソースの相対位置を計算する計算モジュールと、
前記オーディオソースの相対位置に従ってオーディオソース信号を階層的にグループ化するグループ化モジュールと、
レンダリングに使用されるBRIRをパラメータ化する、BRIRパラメータ化モジュールと、
レンダリングされるべき各々のオーディオソース信号をいくつかのブロックおよびフレームに分割し、
前記パラメータ化されたBRIRシーケンスを平均し、
前記階層的なグループ化の結果にて特定される前記分割されたオーディオソース信号をダウンミックスする、バイノーラルレンダラコア部と、を備えた
バイノーラルレンダリング装置。
計算モジュールは、前記相対位置を、前記複数のオーディオソースのメタデータおよびユーザ頭部トラッキングデータに基づいて、前記複数のオーディオソース信号の各々の時間フレーム/ブロック毎に計算する、
請求項9に記載のバイノーラルレンダリング装置。
前記バイノーラルレンダラコア部は、前記オーディオソース信号を、現在のブロックおよび過去のブロックに分割し、前記現在のブロックをさらに複数のフレームに分割する、
請求項9に記載のバイノーラルレンダリング装置。
前記バイノーラルレンダラコア部は、フレームごとのバイノーラル化処理を、前記ソース信号の現在のブロックのフレームについて、選択されたBRIRフレームを使用して実行し、各々のオーディオソースの前記計算された相対位置に最も近い直近のラベル付けされたBRIRフレームの探索に基づいて、各々のBRIRフレームが選択される、
請求項9に記載のバイノーラルレンダリング装置。
【発明を実施するための形態】
【0013】
以下で、図面を参照しつつ、本開示の実施形態における構成および動作を説明する。以下の実施形態は、あくまでも種々の独創的な段階の原理についての例示にすぎない。本明細書に記載される詳細の変形が当業者にとって明らかであることを、理解すべきである。
【0014】
<本開示の基礎を形成する基本的知識>
実際の例としてMPEG−H 3Dオーディオ規格を用いてバイノーラルレンダラが直面する問題を解決する方法を調査した。
【0015】
<問題1:チャンネル/オブジェクト−チャンネル−バイノーラルレンダリングの構成において、仮想スピーカの構成によって空間分解能が制限される>
チャンネルベースおよびオブジェクトベースの入力信号を最初に仮想スピーカ信号に変換し、その後にバイノーラル信号へと変換することによる間接バイノーラルレンダリングは、MPEG−H 3Dオーディオ規格などの3Dオーディオシステムで広く採用されている。しかしながら、そのような構成においては、空間分解能が、レンダリング経路の中間において仮想スピーカの構成によって固定および制限される。例えば、仮想スピーカが5.1または7.1の構成に設定されている場合、空間分解能は、仮想スピーカの少ない数によって制約され、結果として、ユーザは、これらの固定された方向のみから到来するサウンドを知覚することになる。
【0016】
さらに、バイノーラルレンダラ(103)において使用されるBRIRデータベースは、仮想リスニングルームにおける仮想スピーカの配置に関連付けられている。この事実は、BRIRが、そのような情報がデコードされたビットストリームから利用可能であるならば、制作シーンに関連付けられているべきであるという期待される状況から外れている。
【0017】
空間分解能を改善する方法として、スピーカの数を例えば22.2の構成へと増やすことや、オブジェクト−バイノーラル直接レンダリング方式を使用することが挙げられる。しかしながら、これらの方法は、BRIRが使用されるとき、バイノーラル化のための入力信号の数が増加するにつれて、計算が複雑になるという問題につながり得る。計算の複雑さの問題は、次の段落で説明される。
【0018】
<問題2:BRIRを用いたバイノーラルレンダリングにおいては計算が複雑である>BRIRは、一般に、長い一連のインパルスであるという事実ゆえに、BRIRと信号との間の直接の畳み込みは、大量の計算を必要とする。したがって、多くのバイノーラルレンダラは、計算の複雑さと空間品質との間の妥協点を模索している。
図2が、MPEG−H 3Dオーディオにおけるバイノーラルレンダラ(103)の処理の流れをしている。このバイノーラルレンダラは、BRIRを「直接および初期反射(direct&early reflections)」部分および「後期残響(late reverberation)」部分に分割し、これら2つの部分を別々に処理する。「直接および初期反射」部分は、大部分の空間的情報を保持しているため、各々のBRIRのこの部分は、直接
および初期部分の処理(201)において別々に信号と畳み込みされる。
【0019】
他方で、BRIRの「後期残響」部分は、空間的情報をあまり含んでいないため、信号を1つのチャンネルへとダウンミックスし(202)、後期残響の部分の処理(203)においてダウンミックス後のチャンネルと1回だけ畳み込みを実行すればよい。
【0020】
この方法は、後期残響の部分の処理(203)における計算負荷を軽減するが、計算の複雑さは、直接
および初期部分の処理(201)において依然としてきわめて高くなり得る。これは、直接
および初期部分の処理(201)において各々のソース信号が別々に処理され、ソース信号の数が増加するにつれて計算の複雑さも増すからである。
【0021】
<問題3:動きの速いオブジェクトの場合や、頭部トラッキングが有効である場合に、適していない>
バイノーラルレンダラ(103)は、仮想スピーカ信号を入力信号とみなし、バイノーラルレンダリングを、各々の仮想スピーカ信号を対応するバイノーラルインパルス応答のペアと畳み込むことによって実行することができる。頭部関連インパルス応答(HRIR:head related impulse response)およびバイノーラル空間インパルス応答(BRIR)が、インパルス応答として一般的に使用され、後者は、室内残響フィルタ係数からなり、したがってHRIRよりもはるかに長くなる。
【0022】
畳み込みプロセスは、ソースが固定位置にあると暗黙のうちに仮定し、これは仮想スピーカに当てはまる。しかしながら、オーディオソースが移動している多数の場合が存在し得る。一例は、オーディオソースの位置がユーザの頭部のいかなる回転からも不変であるように期待される仮想現実(VR:virtual reality)の用途におけるヘッドマウントディスプレイ(HMD:head mounted display)の使用である。これは、ユーザの頭部の回転の影響がないように、オブジェクトまたは仮想スピーカの位置を逆方向に回転させることによって達成される。もう1つの例は、オブジェクトの直接レンダリングであり、これらのオブジェクトは、メタデータにて指定されるさまざまな位置によって移動することができる。
【0023】
理論的には、移動するソースをレンダリングするための単刀直入な方法は、移動するソースゆえにレンダリングシステムがもはや線形時不変(LTI:linear time invariant)系ではなくなるため、存在しない。しかしながら、ソースを短い期間においては不動であると仮定し、この短い期間においてはLTIの仮定が有効であると、近似することができる。これは、HRIRを使用し、ソースがHRIRのフィルタ長(通常は、ミリ秒の数分の1である)の範囲において不動であると仮定できる場合に当てはまる。したがって、ソース信号フレームを対応するHRIRフィルタと畳み込み、バイノーラルフィードを生成することができる。しかしながら、BRIRが使用される場合には、フィルタ長が通常ははるかに長い(例えば、0.5秒)ために、ソースを、もはやBRIRフィルタ長の期間において不動であると仮定することはできない。追加の処理がBRIRフィルタとの畳み込みに適用されない限り、ソース信号フレームをBRIRフィルタと直接畳み込むことはできない。
【0024】
<問題の解決策>
本開示は、以下を含む。第1に、<問題1>における空間分解能の限界の問題を解決するために、オブジェクトベースおよびチャンネルベースの信号を、仮想スピーカを経ることなくバイノーラルエンドへと直接レンダリングする手段である。第2に、<問題2>における計算の複雑さの問題を取り除くために、互いに近いソースを1つのクラスタにグループ化し、処理の一部を1つのクラスタ内のソースのダウンミックス版へと適用できるようにする手段である。第3に、<問題3>における移動するソースの問題を解決するために、BRIRをいくつかのブロックに分割し、直接ブロック(直接および初期反射に対応する)をいくつかのフレームにさらに分割し、次いで、移動するソースの瞬時位置に従ってBRIRフレームを選択する新たなフレームごとの畳み込み方式によって、バイノーラル化フィルタ処理を実行する手段である。
【0025】
<提案される高速バイノーラルレンダラの概要>
図3が、本開示の概略図を示している。提案される高速バイノーラルレンダラ(306)における入力は、K個のオーディオソース信号と、或る期間にわたるソース位置/移動軌跡を指定するソースメタデータと、指定されたBRIRデータベースとを含む。上述のソース信号は、オブジェクトベースの信号、チャンネルベースの信号(仮想スピーカ信号)、または両者の混合のいずれかであってよく、ソース位置/移動軌跡は、オブジェクトベースのソースにおける或る期間にわたる位置系列またはチャンネルベースのソースにおける不動の仮想スピーカ位置であってよい。
【0026】
加えて、入力は、瞬時のユーザの頭部の向きまたは位置であってよい随意によるユーザ頭部トラッキングデータを、そのような情報が外部のアプリケーションから入手可能であり、レンダリングされたオーディオシーンをユーザの頭部の回転/移動に関して調整する必要がある場合にさらに含む。高速バイノーラルレンダラの出力は、ユーザによって聴き取られる左右のヘッドフォンフィード信号である。
【0027】
出力を得るために、高速バイノーラルレンダラは、第1に、瞬時のソースメタデータおよびユーザ頭部トラッキングデータを取得することによって瞬時のユーザの頭部の向き/位置に対する相対ソース位置を計算する頭部相対ソース位置計算モジュール(301)を備える。次いで、計算された頭部相対ソース位置が、階層的ソースグループ化モジュール(302)において階層的ソースグループ化情報を生成するために使用され、バイノーラルレンダラコア(303)において瞬時のソース位置に従ってパラメータ化BRIRを選択するために使用される。さらに、階層的ソースグループ化モジュール(302)によって生成された階層情報は、計算の複雑さを軽減する目的でバイノーラルレンダラコア(303)において使用される。階層的ソースグループ化モジュール(302)の詳細は、<ソースグループ化>の項で説明される。
【0028】
提案される高速バイノーラルレンダラは、各々のBRIRフィルタをいくつかのブロックに分割するBRIRパラメータ化モジュール(304)をさらに備える。BRIRパラメータ化モジュール(304)は、最初のブロックをフレームにさらに分割し、各々のフレームに対応するBRIRターゲット位置ラベルを添える。BRIRパラメータ化モジュール(304)の詳細は、<BRIRパラメータ化>の項で説明される。
【0029】
提案される高速バイノーラルレンダラが、BRIRをオーディオソースをレンダリングするためのフィルタとみなすことに、注意すべきである。BRIRデータベースが適切でなく、あるいはユーザが高分解能のBRIRデータベースの使用を好む場合、提案される高速バイノーラルレンダラは、近傍のBRIRフィルタに基づいて欠けているターゲット位置についてBRIRフィルタを補間する外部BRIR補間モジュール(305)をサポートする。
【0030】
しかしながら、このような外部モジュールを、本明細書においては指定しない。
【0031】
最後に、提案される高速バイノーラルレンダラは、コア処理ユニットであるバイノーラルレンダラコア(303)を備える。バイノーラルレンダラコア(303)は、上述の個々のソース信号、計算された頭部相対ソース位置、階層的ソースグループ化情報、およびパラメータ化BRIRブロック/フレームを得て、ヘッドフォンフィードを生成する。バイノーラルレンダラコア(303)の詳細は、<バイノーラルレンダラコア>の項および<ソースグループ化ベースのフレームごとのバイノーラルレンダリング>の項で説明される。
【0032】
<ソースグループ化>
図3の階層的ソースグループ化モジュール(302)は、計算された瞬時の頭部相対ソース位置を入力として得て、任意の2つのオーディオソースの間の類似性、例えば相互距離に基づいて、オーディオソースグループ化情報を計算する。そのようなグループ化の決定を、ソースをグループ化するためのP個の層によって階層的に行うことができ、より上位の層がより低い分解能を有する一方で、より下位の層がより高い分解能を有する。p番目の層の0番目のクラスタは、以下のように表される。
【数1】
【0033】
ここで、0はクラスタインデックスであり、pは層インデックスである。
図4は、P=2の場合のこのような階層的ソースグループ化の簡単な例を示している。この図は、上面図として示されており、原点がユーザ(リスナ)の位置を示し、y軸の方向がユーザの向いている方向を示し、ソースが頭部相対ソース位置計算モジュール(301)から計算されたユーザに対するソースの2次元の頭部相対ソース位置に従ってプロットされている。下位層(第1の層:p=1)が、ソースを8つのクラスタにグループ化し、第1のクラスタC
1(1)={1}はソース1を含み、第2のクラスタC
2(1)={2,3}はソース2および3を含み、第3のクラスタC
3(1)={4}はソース4を含み、以下同様である。上位層(第2の層:p=2)は、ソースを4つのクラスタにグループ化し、ソース1、2、および3は、C
1(2)={1,2,3}によって表されるクラスタ1にグループ化され、ソース4および5は、C
2(2)={4,5}によって表されるクラスタ2にグループ化され、ソース6は、C
3(2)={6}によって表されるクラスタ3にグループ化される。
【0034】
層の数Pは、システムの複雑さの要求に応じてユーザによって選択され、2より大きくてもよい。上位層の分解能がより低い適切な階層設計によって、計算の複雑さを下げることができる。ソースをグループ化するために、簡単なやり方は、先の例で示したように、オーディオソースが存在する空間全体をいくつかの小さな領域/エンクロージャに分割することに基づく。
【0035】
したがって、ソースは、どの領域/エンクロージャに属するかに基づいて分類される。より専門的には、オーディオソースを、例えばk平均法やファジーc平均法のアルゴリズムなど、いくつかの特定のクラスタ化アルゴリズムに基づいてグループ化することができる。これらのクラスタ化アルゴリズムは、任意の2つのソースの間の類似度を計算し、それらのソースをクラスタにグループ化する。
【0036】
<BRIRパラメータ化>
この項は、指定されたBRIRデータベースまたは補間されたBRIRデータベースを入力とする
図3のBRIRパラメータ化モジュール(304)における処理手順を説明する。
図5が、BRIRフィルタのうちの1つをブロックおよびフレームへとパラメータ化する手順を示している。一般に、BRIRフィルタは、部屋の反射を含むがゆえに、長くなる可能性があり、例えばホールにおいて0.5秒を超える可能性がある。
【0037】
上述したように、そのような長いフィルタの使用は、直接畳み込みがフィルタとソース信号との間に適用される場合に、計算を複雑にする結果となる。オーディオソースの数が増えると、計算はさらに複雑になると考えられる。計算の複雑さを軽減するために、各々のBRIRフィルタは、直接ブロックおよび拡散ブロックに分割され、<バイノーラルレンダラコア>の項で説明されるような単純化された処理が、拡散ブロックに適用される。BRIRフィルタのブロックへの分割を、各々のBRIRフィルタのエネルギ包絡線と、ペアのフィルタ間の両耳間コヒーレンスとによって決定することができる。エネルギおよび両耳間コヒーレンスは、BRIRにおいて時間の増加と共に減少するため、ブロックを分離するための時点を、既存のアルゴリズムを用いて経験的に導き出すことができる(非特許文献2を参照)。
図5は、BRIRフィルタが直接ブロックおよびW個の拡散ブロックに分割されている例を示している。直接ブロックは、次のように表される。
【数2】
【0038】
ここで、nはサンプルインデックスを表し、上付き文字(0)は直接ブロックを表し、θはこのBRIRフィルタのターゲット位置を表す。同様に、w番目の拡散ブロックは、次のように表される。
【数3】
【0039】
ここで、wは拡散ブロックインデックスである。さらに、
図6に示されるように、
図3のBRIRパラメータ化モジュール(304)の出力である異なるカットオフ周波数f
1、f
2、・・・、f
Wが、BRIRの時間−周波数ドメインにおけるエネルギ分布に基づいて各々のブロックについて計算される。
図3のバイノーラルレンダラコア(303)において、カットオフ周波数f
Wよりも上の周波数(低エネルギ部分)は、計算の複雑さを軽減するために処理されない。拡散ブロックは、方向の情報をあまり含まないため、<バイノーラルレンダラコア>の項で詳述される計算の複雑さを軽減するためにソース信号のダウンミックス版を処理する
図7の後期残響処理モジュール(703)において使用される。
【0040】
他方で、BRIRの直接ブロックは、重要な方向の情報を含んでおり、バイノーラル再生信号における方向キューを生成する。オーディオソースが高速で移動している状況に対応するために、レンダリングを、オーディオソースが短い期間(すなわち、例えば16kHzのサンプリングレートにおいて1024個のサンプルからなる長さの時間枠)の間だけ不動であるという仮定に基づいて実行すべきであり、バイノーラル化は、
図7に示されるソースグループ化ベースのフレームごとのバイノーラル化のモジュール(701)において、フレームごとに処理される。したがって、直接ブロックh
θ(0)(n)は、下記のように表されるフレームに分割される。
【数4】
【0041】
ここで、m=0、・・・、Mはフレームインデックスを表し、Mは直接ブロック内のフレームの総数である。分割されたフレームには、このBRIRフィルタのターゲット位置に対応する位置ラベルθも割り当てられる。
【0042】
<バイノーラルレンダラコア>
この項は、ソース信号、パラメータ化されたBRIRフレーム/ブロック、および計算されたソースグループ化情報を得てヘッドフォンフィードを生成する
図3に示されるようなバイノーラルレンダラコア(303)の詳細を説明する。
図7が、ソース信号の現在のブロックと以前のブロックとを別々に処理するバイノーラルレンダラコア(303)の処理図を示している。第1に、各々のソース信号が、現在のブロックおよびW個の以前のブロックに分割され、ここでWは、<BRIRパラメータ化>の項で定めた拡散BRIRブロックの数である。k番目のソース信号の現在のブロックは、次のように表される。
【数5】
【0043】
w個前のブロックは、次のように表される。
【数6】
【0044】
図7に示されるように、各々のソースの現在のブロックは、BRIRの直接ブロックを使用してフレームごとの高速バイノーラル化モジュール(701)において処理される。このプロセスは、次のように表される。
【数7】
【0045】
ここで、y
(current)は、高速バイノーラル化モジュール(701)の出力を表し、関数β(・)は、
図3の階層的ソースグループ化モジュール(302)から生成された階層的ソースグループ化情報、すべてのソース信号の現在のブロック、および直接ブロック内のBRIRフレームを入力とする高速バイノーラル化モジュール(701)の処理関数を表し、H
(0)は、現在のブロック時間期間におけるすべての瞬時のフレームごとのソース位置に対応する直接ブロックのBRIRフレームの集合を表す。このフレームごとの高速バイノーラル化モジュール(701)の詳細は、<ソースグループ化ベースのフレームごとのバイノーラルレンダリング>の項で説明される。
【0046】
他方で、ソース信号の以前のブロックは、ダウンミックスモジュール(702)において1つのチャンネルにダウンミックスされ、後期残響処理モジュール(703)に渡される。後期残響処理モジュール(703)における後期残響処理は、次のように表される。
【数8】
【0047】
ここで、y
(current−w)は、後期残響処理モジュール(703)の出力を表し、γ(・)は、ソース信号の以前のブロックのダウンミックス版と、BRIRの拡散ブロックとを入力とする後期残響処理モジュール(703)の処理関数を表す。変数θ
aveは、ブロックcurrent−wにおけるK個のすべてのソースの平均位置を表す。
【0048】
この後期残響処理を、畳み込みを使用して時間ドメインにおいて実行できることに注意すべきである。カットオフ周波数f
Wの適用による高速フーリエ変換(FFT)を使用した周波数ドメインにおける乗算によっても実行することが可能である。また、ターゲットシステムの計算の複雑さに応じて、時間ドメインのダウンサンプリングを拡散ブロックについて実行できることにも、注目すべきである。このようなダウンサンプリングは、信号サンプルの数を減らすことができ、したがってFFTドメインにおける乗算の数を減らすことができ、結果として計算の複雑さを軽減することができる。
【0049】
以上に鑑み、バイノーラル再生信号は、最終的に、次のように生成される。
【数9】
【0050】
上記の式に示されるように、各々の拡散ブロックwについて、ダウンミックス処理
【数10】
がソース信号に適用されるがゆえに、後期残響処理γ(・)は1回だけ実行されればよい。そのような処理(フィルタ処理)をK個のソース信号について別々に実行しなければならない典型的な直接畳み込みの手法の場合と比較して、本開示は、計算の複雑さを軽減する。
【0051】
<ソースグループ化ベースのフレームごとのバイノーラルレンダリング>
この項は、ソース信号の現在のブロックを処理する
図7のソースグループ化ベースのフレームごとのバイノーラル化モジュール(701)の詳細を説明する。最初に、k番目のソース信号の現在のブロックs
k(current)(n)が、フレームに分割され、ここで最新のフレームは、s
k(current),lfrm(n)によって表され、m個前のフレームは、s
k(current),lfrm−m(n)によって表される。ソース信号のフレーム長は、BRIRフィルタの直接ブロックのフレーム長と同等である。
【0052】
図8に示されるように、最新のフレームs
k(current),lfrm(n)が、集合H
(0)に含まれるBRIRの直接ブロックの0番目のフレーム
【数11】
と畳み込まれる。このBRIRフレームは、最新のフレームにおけるソースの瞬時の位置θ
k(current),lfrmに最も近いBRIRフレームのラベル付き位置の探索[θ
k(current),lfrm]によって選択され、ここで[θ
k(current),lfrm]は、BRIRデータベース内のラベルの最も近い値を見つけることを意味する。BRIRの0番目のフレームは方向についての情報を最も含んでいるため、畳み込みは、各々のソースの空間キューを保持するために、各々のソース信号と個別に実行される。
図8の(801)に示されるように、畳み込みを、周波数ドメインでの乗算を使用して実行することができる。
【0053】
m≧1である以前のフレームs
k(current),lfrm−m(n)の各々について、畳み込みは、H
(0)に含まれるBRIRの直接ブロックのm番目のフレーム
【数12】
と実行されると仮定され、
ここで[θ
k(current),lfrm−m]は、フレームlfrm−mにおけるソース位置に最も近いそのBRIRフレームのラベル付けされた位置を表す。
【0054】
mが大きくなるにつれて、
【数13】
に含まれる方向についての情報が減少することに、注意すべきである。このため、計算の複雑さを軽減するため、(802)に示されるように、本開示は、s
k(current),lfrm−m(n)(k=1,2,・・・,K、m≧1)について、階層的ソースグループ化の決定C
o(p)(階層的ソースグループ化モジュール(302)から生成され、<ソースグループ化>の項で説明した)に従ってダウンミキシングを適用し、次いでソース信号フレームのこのダウンミックス版と畳み込みを行う。
【0055】
例えば、第2の層のソースグループ化が信号フレームs
k(latest frame−2(n)(すなわち、m=2)について適用され、ソース4および5が第2のクラスタC
2(2)={4,5}にグループ化される場合、ダウンミックスを、ソース信号を(s
4latest frame−2(n)+s
5latest frame−2(n))/2と平均することによって適用することができ、畳み込みが、この平均の信号とそのフレームにおける平均のソース位置を有するBRIRフレームとの間に適用される。
【0056】
フレームについて異なる階層の層を適用できることに、注意すべきである。本質的に、BRIRの早期のフレームについて、空間キューを維持するために高分解能のグループ化が考慮されるべきである一方で、BRIRの後期のフレームについては、計算の複雑さを軽減するために低分解能のグループ化が考慮される。最後に、フレームごとに処理された信号が、バイノーラル化モジュール(701)の出力、すなわちy
(current)を生成するための総和を実行するミキサに渡される。
【0057】
以上の実施形態において、本開示は、上述の例によってハードウェアにて構成されているが、本開示を、ハードウェアとの連携においてソフトウェアによってもたらすことも可能である。
【0058】
加えて、実施形態の説明に用いた機能ブロックは、典型的には、集積回路であるLSIデバイスとして実現される。これらの機能ブロックを、個々のチップとして形成しても、あるいは機能ブロックの一部または全部を単一のチップに統合してもよい。本明細書において、用語「LSI」が使用されるが、集積度に応じて、用語「IC」、「システムLSI」、「スーパーLSI」、または「ウルトラLSI」も同様に使用することができる。
【0059】
また、回路の集積化は、LSIに限定されず、LSI以外の専用回路または汎用プロセッサによって実現されてもよい。LSIの製造後に、プログラム可能なフィールド・プログラマブル・ゲート・アレイ(FPGA)あるいはLSI内の回路セルの接続および設定の構成変更を可能にする構成変更可能なプロセッサを使用することができる。
【0060】
LSIに代わる回路集積技術が、半導体技術またはその技術から派生した他の技術の進歩の結果として現れた場合、そのような技術を使用して機能ブロックの集積が可能である。別の可能性は、バイオテクノロジなどの応用である。