(54)【発明の名称】仮想音源に関連するオーディオ信号に基づいて、スピーカ設備のスピーカの駆動係数を計算する装置および方法、並びにスピーカ設備のスピーカの駆動信号を供給する装置および方法
(58)【調査した分野】(Int.Cl.,DB名)
前記スピーカ決定器(810)は、前記仮想音源の位置(802)と前記所定のリスナー位置(804)との間の距離に基づいて前記可変角度範囲を計算することを特徴とする、請求項1に記載の装置。
前記スピーカ決定器(810)は、前記仮想音源の様々な位置についての様々な関連スピーカのグループ(812)の情報を含むルックアップテーブルを持つ記憶ユニットを備え、前記ルックアップテーブルに含まれる前記情報に基づいて前記関連スピーカのグループ(812)を決定することを特徴とする、請求項1又は2に記載の装置。
前記仮想音源の位置(802)と前記所定のリスナー位置(804)との間の距離が短くなるにつれて、前記可変角度範囲が増大することを特徴とする、請求項1乃至3のいずれか一項に記載の装置。
前記スピーカ設備より内側の領域に位置する仮想音源については、前記可変角度範囲が常に180度以上であることを特徴とする、請求項1乃至4のいずれか一項に記載の装置。
前記仮想音源の位置(802)が前記所定のリスナー位置(804)と同じである場合には、前記可変角度範囲が360度であることを特徴とする、請求項1乃至5のいずれか一項に記載の装置。
前記可変角度範囲は、前記所定のリスナー位置(804、950)を取り囲むリスナー遷移ゾーン(940)の内側では変化し、前記リスナー遷移ゾーン(940)の外側では一定であることを特徴とする、請求項1乃至6のいずれか一項に記載の装置。
前記仮想音源の位置(802)と前記所定のリスナー位置(804)との間の距離が、前記リスナー遷移ゾーン(940)の境界からゼロへと減少するにつれて、前記可変角度範囲が前記最小角度範囲から360度へと線形的に増大することを特徴とする、請求項8に記載の装置。
前記リスナー遷移ゾーン(940)の直径は、前記所定のリスナー位置(950)と当該所定のリスナー位置(950)に最も近いスピーカとの間の距離の10%よりも長いことを特徴とする、請求項8乃至10のいずれか一項に記載の装置。
前記スピーカ決定器(810)は、第2の仮想音源の位置の周囲にある第2の可変角度範囲の中に位置している前記スピーカ設備の第2の関連スピーカのグループ(812)を決定し、前記第2の可変角度範囲は前記第2の仮想音源の位置(802)と前記所定のリスナー位置(804)との間の距離に基づいており、
前記多チャネルレンダラー(820)は、決定された前記第2の関連スピーカのグループ(812)の駆動係数を計算し、更に、前記第2の関連スピーカのグループに対しては計算された前記駆動係数及び前記第2の仮想音源のオーディオ信号に基づいて駆動信号(822)を供給する一方で、前記第2の関連スピーカのグループ(812)以外のスピーカに対しては前記第2の仮想音源の駆動信号を供給せず、あるスピーカが前記それぞれの仮想音源に関連する関連スピーカのグループの中に含まれている場合にだけ、仮想音源の駆動信号(822)をそのスピーカに対して供給することを特徴とする、請求項1乃至11のいずれか一項に記載の装置。
前記仮想音源は可動仮想音源であり、前記可動仮想音源は、第1時刻において前記所定のリスナー位置(804)までの第1距離を持ち、第2時刻において前記所定のリスナー位置(804)までの第2距離を持ち、前記第1距離が前記第2距離よりも長い場合には、前記第2時刻における前記可変角度範囲が第1時刻における前記可変角度範囲よりも大きいことを特徴とする、請求項1乃至12のいずれか一項に記載の装置。
前記多チャネルレンダラー(820)は、複数の異なる所定のリスナー位置(730)に基づいて前記スピーカ設備のスピーカの複数の駆動係数を計算し、前記スピーカの複数の駆動係数を結合することで、スピーカの結合済みの駆動係数を得ることを特徴とする、請求項1乃至13のいずれか一項に記載の装置。
前記多チャネルレンダラー(820)は、前記仮想音源の位置が前記スピーカ遷移ゾーン(530)の外部にある場合には、第1計算規則に基づいて前記スピーカ設備の前記スピーカの駆動係数を計算し、前記仮想音源の位置(802)が前記スピーカ遷移ゾーン(530)の内部にある場合には、第2計算規則に基づいて前記スピーカ設備の前記スピーカの駆動係数を計算し、
前記スピーカ遷移ゾーン(530)の境界は、前記スピーカ設備の1つのスピーカとこのスピーカに隣接するスピーカとの間の距離に依存した、前記スピーカ設備の前記スピーカに対する最短距離を有し、
前記スピーカ設備は隣接するスピーカのペアを少なくとも2組含み、前記スピーカのペアのそれぞれが異なるスピーカ間距離を持つことを特徴とする、請求項1乃至15のいずれか一項に記載の装置。
【背景技術】
【0002】
娯楽用電子機器の分野において、新規な技術および革新的な製品へのニーズが増している。最適な機能または能力を提供することが、新規なマルチメディアシステムの成功のための重要な前提条件であり、そのような機能は、デジタル技術の採用、特にコンピュータ技術の利用によって達成される。例として、より現実に近い聴覚および視覚の印象を提供するアプリケーションが挙げられる。これまでのオーディオシステムでは、自然環境だけでなく、仮想環境の空間サウンド再生の品質においても、かなりの欠点が存在する。
【0003】
オーディオ信号の多チャネルスピーカ再生の方法が、長年に亙って公知となり、標準化されて来た。全ての通常の技法は、スピーカの位置およびリスナーの位置の両方が既に転送フォーマットに組み込まれているという欠点を有している。リスナーに対するスピーカの配置が正しくないと、オーディオ品質が大きく損なわれる。最適なサウンドは、スイートスポットと呼ばれる再生空間の小さな領域においてのみ可能である。
【0004】
より良好な自然空間的印象およびオーディオ再生における更に大きなエンクロージャ又はエンベロープを、新規な技術の助けによって達成することができる。この技術(いわゆる波面合成(WFS))の原理は、デルフト工科大学において研究されており、80年代の後半に非特許文献1において初めて提示されている。
【0005】
この方法は、コンピュータの高い能力と高い伝送レートとを必要とするため、波面合成は、これまでのところ、実際にはほとんど採用されていない。マイクロプロセッサ技術およびオーディオ符号化の分野における進歩だけが、今日において、この技術の具体的なアプリケーションにおける採用を可能にする。
【0006】
WFSの基本的な概念は、波動理論におけるホイヘンスの原理の応用に基づいている。波動によって捕獲される各点が、球または円の様相で伝播する要素波の出発点である。
【0007】
音響学に適用すると、入来波面のあらゆる任意の形状を、隣接して配置された多数のスピーカ(いわゆるスピーカアレイ)によって複製することができる。最も単純な事例(ただ1つの点音源を再現すべくスピーカが線形に配置されている場合)においては、各々のスピーカのオーディオ信号が、個々のスピーカの放射の音場が正しく重なるような時間遅延および振幅スケーリングとともに供給されなければならない。複数の音源の場合には、各音源について、各スピーカへの寄与が別々に計算され、得られた信号が加算される。再生すべき音源が反射壁を有する室内にある場合、反射もスピーカアレイによってさらなる音源として再生されなければならない。従って、演算量が、音源の数、録音室の反射の特性、及びスピーカの数に強く依存する。
【0008】
特に、この技法の利点は、再生空間の広い領域にわたって自然な空間音の印象が再生可能である点にある。公知の技法と対照的に、音源の方向および距離が極めて正確な様相で再現される。ある程度まで、仮想音源を実際のスピーカアレイとリスナーとの間に配置することまで可能である。
【0009】
波面合成は、特性が既知である環境については良好に機能するが、特性が変化する場合や、環境の実際の特性に一致しない環境特性に基づいて波面合成が実行される場合に、異常が生じる。
【0010】
しかしながら、波面合成の技術を、視覚による知覚を対応する空間オーディオ知覚によって補うために都合良く使用することも可能である。これまで、仮想スタジオ内での再現においては、仮想シーンの視覚的印象を正確に伝達することが重視されていた。画像に一致する音響的印象は、通常は、所謂ポストプロダクションにおける手作業の工程によって事後にオーディオ信号に組み込まれるか、あるいは実現に費用および時間がかかり過ぎると判断され、省略されている。このため、通常は個々の感覚の矛盾が生じ、設計された空間すなわち設計されたシーンが、あまり正確でないように知覚される結果となる。
【0011】
非特許文献2には、オーディオビジュアルシステムにおいて空間オーディオ及び二次元ビデオ投影を組み合わせる効果に関する主観的実験が示されている。特に、カメラに対して異なる距離に位置し、かつ互いにほぼ背中合わせに位置している2名の話者が、波面合成の助けによって、互いに背中合わせに位置する2名の者が異なる仮想音源として理解および再現される場合に、観察者によってより良好に理解され得ることが強調されている。この場合に、同時に話している2名の話者を、リスナーがより良好に別個に理解および区別できることが、客観テストによって明らかになっている。
【0012】
非特許文献3において、トーンのポストプロダクション処理を自動化する手法が提示されている。この目的のため、部屋のサイズ、表面のテクスチャ又はカメラ位置、ならびに役者の位置などといった視覚化のために必要な映画のセットのパラメータが、それらの音響的な関連性についてチェックされ、それに基づいて対応する制御データが生成される。次いで、このデータが、カメラまでの距離に応じた話者の音量あるいは部屋のサイズ及び壁のテクスチャに応じた反響時間の調節など、ポストプロダクションに使用される効果およびポストプロダクション処理に対して、自動的に影響する。ここでの目的は、高い臨場感を得るために、仮想シーンの視覚的印象を高めることにある。
【0013】
シーンをよりリアルに見えるようにするために、「カメラの耳によるリスニング」が可能にされるべきである。ここで、映像内のサウンド事象の位置と、周囲の場におけるリスニング事象の位置との間に、可能な限り高い相関が求められる。つまり、音源の位置が常に映像に適合できると想定されている訳である。ズームなどのカメラパラメータも、2つのスピーカL及びRの位置と同様に、トーン設計に取り入れられる。この目的のため、仮想スタジオのトラッキングデータがシステムによって付随の時間コードと一緒にファイルに書き込まれる。同時に、映像、トーン、及び時間コードがMAZ(磁気記録)に記録される。カムダンプ・ファイル(camdump file)がコンピュータに伝送され、そのコンピュータがカムダンプ・ファイルからオーディオワークステーション用の制御データを生成し、MIDIインターフェイスを介してMAZから生成される映像に同期するよう出力する。音場における音源の配置ならびに初期反射および残響の挿入などといった実際のオーディオ処理は、オーディオワークステーションにおいて行われる。信号は、5.1サラウンドのスピーカシステムに合わせて作成される。
【0014】
キャプチャ設定における音源の位置と同様に、カメラ・トラッキング・パラメータを実際の映画セットに記録することができる。このようなデータを、仮想のスタジオで生成することもできる。
【0015】
仮想のスタジオにおいては、役者または発表者が単独でレコーディング室に存在する。特に、役者または発表者がブルーボックス又はブルーパネルとも称されるブルーウォールの前に立つ。このブルーウォールに、青色および水色のストライプからなるパターンが適用される。このパターンの特別な点は、ストライプが異なる幅をもつため、ストライプの多数の組み合わせが生じるということである。ポストプロダクションにおいて、ブルーウォールを仮想背景に置き換える際に、ブルーウォールでのストライプの組み合わせが独特であることから、カメラがどの方向を向いているかを正確に決定することが可能である。この情報を用いて、コンピュータが現在のカメラの視野角に対する背景を決定することができる。さらに、追加的なカメラパラメータを検知して出力するカメラから、センサが評価される。センサによって検知されるカメラの典型的なパラメータは、3つの変位度x、y、z、ロール、チルト、パンとも称される3つの回転角度、ならびに焦点距離またはズーム(カメラの開口角に関する情報と同じ意味)である。
【0016】
カメラの正確な位置を、画像認識および高度なセンサ技術を必要なしに決定できるよう、カメラに取り付けられた赤外線センサの位置を割り出す複数の赤外線カメラで構成されるトラッキングシステムを使用してもよい。このようにして、カメラの位置も割り出される。センサ技術によってもたらされるカメラパラメータ及び画像認識によって評価されるストライプ情報により、現代のリアルタイム・コンピュータは、現時点の映像のための背景を計算することができる。これにより、青色の背景が有する青色の色合いが映像から除去され、仮想の背景が青色の背景の代わりに再生される。
【0017】
多くの場合は、視覚的に感じ取られるシーンの全体としての音響的印象を得ることで充分であるという考え方に従っている。これは画像設計に由来する「フルショット」という用語でうまく表現できる。事物に対する光学的な視角の多くが大きく変化するが、この「フルショット」のサウンドの印象は、シーンの全てのショットにわたってほぼ一定のままである。このように、光学的な詳細は、対応するショットによって強調されるか、あるいは背景に置かれる。ムービーダイアログ設計におけるカウンターショットも、トーンで再現されることがない。
【0018】
従って、視聴者を視聴覚シーンに音響的に埋没させる必要がある。この場合、スクリーン又は画像領域が、視聴者の観察方向および視角を形成する。これは、トーンがシーンの画像に常に一致する形態で画像を追跡することを意味する。特に仮想のスタジオにおいて、例えば発表しているトーンと発表者が実際に存在する環境との間に典型的には相関が存在しないがゆえに、このことはさらに重要になる。シーンの視聴覚的な全体的な印象を得るために、再現された画像に一致する空間的印象がシミュレートされなければならない。このような音声概念における実質的な主観的特性とは、例えば、映像スクリーンの視聴者が知覚する通りの音源位置である。
【0019】
オーディオの分野においては、波面合成(WFS)という技術によって、広範囲のリスナー領域について良好な空間音響を達成することができる。上述のように、波面合成はホイヘンスの原理に基づいており、要素波の重ね合わせによって波面を成形および構築することができる。数学的に厳密な理論的説明に従えば、要素波の生成に、無限に小さい間隔で位置する無限の数の音源を使用しなければならないと考えられる。しかしながら、現実には、互いに有限の小さい間隔で位置する有限数のスピーカが用いられる。WFSの原理によれば、これらのスピーカの各々が、特定の遅延および特定のレベルを有する仮想音源からのオーディオ信号で制御される。レベル及び遅延は、通常は全てのスピーカにおいて異なる。
【0020】
上述のように、波面合成システムは、ホイヘンスの原理に基づいて機能し、例えば再現領域に対し、又は再現領域内のリスナーに対して特定の距離に配置された仮想音源の所定の波形を、複数の個別の波動によって再現する。このように、波面合成アルゴリズムは、スピーカアレイの個々のスピーカの実際の位置についての情報を取得し、この個々のスピーカについて、このスピーカによって最終的に放射されなければならない成分信号を計算し、結果として1つのスピーカからのスピーカ信号が他のアクティブスピーカのスピーカ信号と重なり合うことで、リスナーが多数の個別のスピーカによってではなく、仮想音源の位置にあるただ1つのスピーカによって「サウンドを浴びている」という印象を持つように、再現が実行される。
【0021】
波面合成の設定における複数の仮想音源について、各仮想音源の各スピーカへの寄与(すなわち、第1スピーカのための第1仮想音源の成分信号、第1スピーカのための第2仮想音源の成分信号など)が計算され、その後に成分信号が加算され、実際のスピーカ信号が最終的に得られる。例えば、3つの仮想音源の場合、全てのアクティブスピーカのスピーカ信号がリスナーにおいて重なり合うことで、リスナーは、スピーカの大きなアレイからのサウンドを浴びているという印象を持つのではなく、自身の聞いているサウンドが仮想音源と等しい特別な位置にある3つの音源だけから届いているという印象を持つ。
【0022】
実際には、多くの場合、仮想音源の位置およびスピーカの位置に応じて、所定の時間的瞬間について遅延およびスケーリングファクタが与えられた前記仮想音源に関連したオーディオ信号について、成分信号の計算が行われ、仮想音源の遅延済み及び/又はスケーリング済みのオーディオ信号が取得され、そのオーディオ信号は、仮想音源が1つだけしか存在しない場合にはそのままスピーカ信号を表わし、そうでない場合には考慮されるスピーカの他の仮想音源からの更なる成分信号と加算されてそのスピーカのスピーカ信号に寄与するものである。
【0023】
典型的な波面合成アルゴリズムは、スピーカアレイに何個のスピーカが存在するかに関係なく機能する。波面合成の根底にある理論は、互いに無限に近接配置された無限に多数の個別のスピーカによって、任意のあらゆる音場を正確に再現できるという事実からなる。しかし実際には、無限の多数も、無限に近接した配置も、実現は不可能である。その代わり、有限数のスピーカが特定の互いに所与の間隔を置いて付加的に配置されている。これにより、現実のシステムにおいては常に、仮想音源が実際に存在する場合(すなわち、仮想音源が実在の音源である場合)に生じると考えられる実際の波形の近似しか達成できない。
【0024】
さらに、映画を上映する劇場を考えた場合、スピーカアレイが例えば映画のスクリーンの側にだけ配置されているような、種々の状況が予想される。この場合、波面合成モジュールがこれらのスピーカのためのスピーカ信号を生成し、これらのスピーカのためのスピーカ信号は、例えば映画館のスクリーンが配置された側に延びるスピーカアレイだけでなく、観客室の左方、右方、及び後方にも配置されるスピーカアレイの対応するスピーカのための信号と、通常は同じである。このような「360°」のスピーカアレイは、当然ながら、例えば視聴者の前方に位置する1面だけのアレイよりも正確な音場の良好な近似をもたらす。しかしながら、視聴者の前方に位置するスピーカのためのスピーカ信号は、どちらの場合も同じである。すなわち、波面合成モジュールは、何個のスピーカが存在するのかについてのフィードバックや、一面だけのアレイ、多面のアレイ、又は360°のアレイのいずれであるかについてのフィードバックを、典型的には入手していない。換言すると、波面合成手段は、スピーカのためのスピーカ信号をスピーカの位置に基づいて計算し、さらなるスピーカの有無とは無関係に計算している。
【0025】
例えば特許文献1は、スピーカアレイの一部のスピーカに駆動信号成分を供給しないことでアーチファクトを軽減する波面合成装置を開示している。ここでは、関連するスピーカの決定および関連するスピーカについてのみの駆動信号成分の計算が示されている。
【0026】
一般に、種々の影響によって引き起こされるアーチファクトの軽減または除去が極めて重要である。
【発明を実施するための形態】
【0038】
次に、本発明による実施の形態を、添付の図面を参照して詳しく説明する。
【0039】
以下においては、実施の形態の説明における冗長性を少なくするために、同一又は類似の機能的特性を有する構成および機能ユニットについて同一参照番号を部分的に使用することがあり、一つの図に関するそれらの説明は、他の図にも当てはまる。
【0040】
以下に示す実施の形態は、スピーカの駆動係数を計算し、又は駆動係数に基づいてスピーカの駆動信号を生成する概念を説明するものである。ここで示す駆動係数は、フィルタ係数と称することもできる。スピーカの駆動係数またはフィルタ係数は、スピーカ設備によって再生されるオーディオ信号又はオーディオオブジェクトのスケーリングパラメータ若しくは遅延パラメータであってもよい。例えば、ある仮想音源について、スピーカ設備のあるスピーカのために、スケーリングパラメータが第1の駆動係数として計算され、遅延パラメータが第2の駆動係数として計算されてもよい。このスケーリングパラメータは、振幅パラメータと称することもできる。
【0041】
オーディオオブジェクトとは、例えば車、列車、雨滴または話者などのオーディオソースを表すものであり、オーディオオブジェクトの仮想音源位置は、例えば絶対位置またはスピーカ設備に対する相対位置であってもよい(例えば座標の原点を予め設定できる)。オーディオオブジェクトを、仮想音源位置に位置して球面波を放射する点音源と仮定することができる。スピーカ設備から遠く離れた位置にあるオーディオオブジェクトについては、球面波を平面波によって近似することが可能である。
【0042】
以下の実施の形態においては、多チャネルレンダラーが、スピーカのために駆動係数を計算し、又は駆動信号を生成若しくは供給するために使用される。この目的で、公知の多チャネルレンダラーを、後述される本発明の態様に従って適合させることができる。多チャネルレンダラーは、例えば波面合成レンダラー又はサラウンド・サウンド・レンダラーであってもよい。以下の例の幾つかは、波面合成レンダラーに関して説明されるが、他のアプリケーションにおいて他の多チャネルレンダラーを使用することも可能である。
【0043】
多チャネルレンダラーの例として、波面合成レンダラー(波面合成モジュールとも称される)200を
図2に示す。複数の入力202、204、206、208と、複数の出力210、212、214、216とを備える波面合成モジュールが、波面合成環境の中心である。仮想音源の種々のオーディオ信号が、入力202〜204を介して波面合成モジュールへと供給される。すなわち、入力202が、例えば仮想音源1のオーディオ信号とその仮想音源の関連位置情報とを受信する。例えば、映画館の環境において、オーディオ信号1は、画面の左側から画面の右側へと移動しており、おそらくはさらに観客から遠ざかり、あるいは観客に近付くようにも移動している役者のスピーチであると考えられる。その場合、オーディオ信号1はその役者の実際のスピーチであると考えられる一方で、時間関数としての位置情報は、シーン内の特定の時点におけるその第1の役者のその時点の位置を表わす。対照的に、オーディオ信号nは、例えば第1の役者と同じ又は異なる方法で移動する他の役者のスピーチであると考えられる。オーディオ信号nに関する他の役者の現在位置は、オーディオ信号nに同期した位置情報によって波面合成モジュールへと供給される。実際には、種々の仮想音源が、それらの属性を表すシーンに応じて存在し、各仮想音源のオーディオ信号が、個々のオーディオトラックとして波面合成モジュール200へと供給される。
【0044】
1つの波面合成モジュール200が、スピーカ設備の複数のスピーカLS1、LS2、LS3、LSMに対し、出力210〜216を介してスピーカ信号を個々に出力する。スピーカ設備の各スピーカ位置は、入力206を介して波面合成モジュール200へと供給されている。
【0045】
代替的には、フィルタ係数の計算とオーディオのレンダリングとは、別々に行ってもよい。その場合のレンダラーは、音源およびスピーカの位置を取得し、フィルタパラメータ(駆動係数)を出力することができる。その後に、フィルタ係数の調節が行われ、最後の工程において、フィルタ係数を適用してオーディオを生成することができる。これにより、レンダラーは(波面合成だけでなく)任意のアルゴリズムを使用してフィルタを計算するブラックボックスであってもよい。
【0046】
映画館においては、多数の個別のスピーカが観客の周囲に集められ、好ましくはスピーカが観客の前方、例えばスクリーンの背後と、観客の後方の両方に位置し、さらには観客の右側および左側に位置するように、アレイに配置される。さらには、映画の録音設定における実際の部屋の音響をシミュレートできるように、部屋の音響などについての情報など、他の入力も波面合成モジュール200へと供給することができる。
【0047】
一般に、例えば出力210を介してスピーカLS1へと供給されるスピーカ信号は、スピーカLS1のためのスピーカ信号が仮想音源1から由来する第1の成分、仮想音源2から由来する第2の成分、及び仮想音源nから由来する第nの成分を含む点で、仮想音源の成分信号の重ね合わせ(superposition)である。個々の成分信号を線形的に重ね合わせ、即ち計算後に加算することで、リスナーの耳における線形的重ね合わせを再現しても良く、リスナーは実際の設定内で知覚できる音源の線形的重ね合わせを聴き取ることになる。
【0048】
以下において、波面合成モジュール200の詳細な設計例を
図3を参照しながら説明する。波面合成モジュール200は、各仮想音源のオーディオ信号から出発し、さらに対応する仮想音源の位置情報から出発して、スピーカ設備のスピーカのために、位置情報および考慮されるスピーカの位置に依存する遅延情報V
iとスケーリング係数SF
i(フィルタ係数)とを最初に計算する、極めて並列的な構造を有することができる。仮想音源の位置情報および考慮されるスピーカの位置に基づく遅延情報V
i及びスケーリング係数SF
iの計算は、手段300、302、304、306において実現される公知のアルゴリズムによって実行することができる。
【0049】
スピーカ設備のスピーカの遅延情報V
i(t)及びスケーリング情報SF
i(t)に基づき、さらには個々の仮想音源に関連するオーディオ信号AS
i(t)に基づいて、最終的に得られるスピーカ信号の現在時刻t
aにおける成分信号の離散値AW
i(t
a)が計算される。この計算が、
図3に概略的に示されているように、手段310、312、314、316によって実行される。次いで、個々の成分信号が結合器320によって合計され、スピーカ設備のスピーカのためのスピーカ信号の現在の時刻t
aにおける離散値322が決定され、この離散値をスピーカのための出力(例えば、
図2の出力210、212、214又は216)へと供給することができる。
【0050】
図3から明らかなように、最初にスピーカ設備のスピーカについて、遅延およびスケーリング係数によるスケーリングに基づいて現時点で有効な値AW
iが各々の仮想音源について個別に計算され、次いで1つのスピーカについて、異なる仮想音源に起因する全ての成分信号が合計される。例えば、仮想音源が1つだけしか存在しない場合には、結合器320を省略でき、
図3の結合器320の出力信号は、例えば仮想音源1が単一の仮想音源である場合に手段310によって出力される信号に相当すると考えられる。
【0051】
一般に、スピーカ設備は、例えばそのスピーカ設備のスピーカの位置情報により、即ち互いの相対的位置情報または原点(座標の原点)に対する絶対的位置情報により、表すことができる。この情報は、例えば記憶ユニットに保存し、多チャネルレンダラーへと供給することができる。いくつかの実施の形態において、スピーカ設備に言及する場合、スピーカ設備とはこのような意味を持つものである。
【0052】
図1は、本発明の一実施の形態として、仮想音源に関連するオーディオ信号についてスピーカ設備のスピーカのための駆動係数112を計算する装置100のブロック図を示す。この装置100は多チャネルレンダラー110を備える。この多チャネルレンダラー110は、仮想音源の位置102がスピーカ遷移ゾーン内の内側領域に位置する場合には、第1計算規則に従ってスピーカ設備のスピーカの第1サブ駆動係数を計算し、第2計算規則に従って同じスピーカの第2サブ駆動係数を計算し、第1サブ駆動係数および第2サブ駆動係数に基づいて同じスピーカの駆動係数112を計算する。さらに、多チャネルレンダラー110は、仮想音源の位置102がスピーカ遷移ゾーン内の外側領域に位置する場合には、第2計算規則に従ってスピーカ設備のスピーカの第2サブ駆動係数を計算し、第3計算規則に従って同じスピーカの第3サブ駆動係数を計算し、第2サブ駆動係数および第3サブ駆動係数に基づいて同じスピーカの駆動係数112を計算する。第2計算規則は、第1計算規則および第3計算規則と異なる。さらに、上述のスピーカ遷移ゾーンは、スピーカ設備の内側ゾーンとスピーカ設備の外側ゾーンとを隔てている。スピーカ設備のスピーカはスピーカ遷移ゾーン内に位置している。仮想音源の位置情報102(例えば座標)は、多チャネルレンダラー110へと供給される。
【0053】
多チャネルレンダラー110は、遷移ゾーンにおける仮想音源の位置に依存して駆動係数を計算する。
図4aはスピーカ設備400の概略図を示し、スピーカ遷移ゾーン430を示す。この例では、スピーカ設備のスピーカ410は矩形状に配置されている。スピーカ410の矩形はスピーカ遷移ゾーン430によって取り囲まれている。スピーカ遷移ゾーン430は、スピーカ設備の内側ゾーン420とスピーカ設備の外側ゾーン440とを隔てている。スピーカ遷移ゾーン430のうち、スピーカ設備より内側に位置する部分がスピーカ遷移ゾーン430の内側領域432であり、スピーカ遷移ゾーン430のうち、スピーカ設備より外側に位置する部分がスピーカ遷移ゾーン430の外側領域434である。
【0054】
例えば、波面合成を実現するための方法から、異なる仮想の点音源の合成のために、集中(focused)音源および非集中(non-focused)音源のための異なるモードが存在することが知られている。どちらのモードも、スピーカに対する仮想音源の位置からもたらされる。異なるモードは波面およびサウンドの知覚に関して異なる特性を生じさせるため、両方のモードについて、係数計算の異なる手法を適用しても良い。典型的には、想定されるエンベロープ曲線(スピーカ遷移ゾーンの内側領域と外側領域との間の境界)またはスピーカから形成される領域の内側は、集中モードの適用のために充分な音源位置内に位置している。エンベロープ曲線の外側には、非集中モードの適用が望ましい。特に、スピーカ間の距離が大きい場合には、エンベロープ(スピーカ遷移ゾーンの内側領域と外側領域との間の境界)付近での音源の移動に起因してオーディオ信号処理におけるアーチファクトや音源知覚における変化を生じさせるような、干渉的で不安定な係数セットの変更ではなく、係数変化が安定的かつ連続的なパフォーマンスをもたらすように、前述の2つのタイプの係数計算の間の遷移を実現することが望ましい。この目的で、スピーカ遷移ゾーンが導入される。音源がスピーカ遷移ゾーンに位置する場合、特別な係数計算(例えば、振幅パンニング法)を適用することもできる。従来の構成においては、音源の位置に応じて、これら3つの種類の係数計算の間で急激な切り替えが生じる可能性がある。即ち、音源の係数の小さな変化により、駆動係数の非常にアーチファクトが負荷された変化が生じる可能性がある。
【0055】
本発明の上述の態様によれば、係数計算の3つの種類(3つの計算規則)が急激に切り替えられるのではなく、音源の位置に応じて連続的に変化するよう、遷移ゾーンが初期設定される。この方法でアーチファクトを有意に低減させることができ、オーディオ品質を向上させることができる。
【0056】
第1計算規則は、スピーカ設備の内側ゾーン420についての駆動係数の計算に適したアルゴリズムであってもよく、第2計算規則は、スピーカ遷移ゾーン430における駆動係数の計算に適したアルゴリズムであってもよく、第3計算規則は、スピーカ設備の外側ゾーン440における駆動係数の計算に適したアルゴリズムであってもよい。第1計算規則と第3計算規則とは等しくてもよいが、内側ゾーンの仮想音源(例えば集中仮想音源)と外側ゾーンの仮想音源(例えば非集中仮想音源)との間の相違をより正確に考慮する異なる計算規則に基づいて、スピーカ設備の内側ゾーン420およびスピーカ設備の外側ゾーン440の仮想音源を処理することがさらに望ましい。従って、好適には第1計算規則と第3計算規則とが異なっていてもよい。
【0057】
第1計算規則はスピーカ設備の内側ゾーン420に位置する仮想音源に適することができるため、仮想音源の位置がスピーカ設備の内側ゾーン420に位置する場合には、多チャネルレンダラー110は、第2サブ駆動係数および第3サブ駆動係数を考慮することなく、第1サブ駆動係数をスピーカ設備のスピーカの駆動係数として供給することができる。また、多チャネルレンダラー110は、仮想音源の位置がスピーカ設備の外側ゾーン440に位置する場合には、第1サブ駆動係数および第2サブ駆動係数を考慮することなく、第3サブ駆動係数をスピーカ設備のスピーカの駆動係数として供給することができる。換言すると、スピーカ設備の内側ゾーン420においては、スピーカの駆動係数が第1計算規則に基づいて計算され、スピーカ設備の外側ゾーン440においては、スピーカ設備のスピーカの駆動係数が第3計算規則に基づいて計算される。
【0058】
例えば、多チャネルレンダラー110は、スピーカ遷移ゾーン430の内側領域432については、スピーカの駆動係数112を、第1サブ駆動係数および第2サブ駆動係数の線形結合に基づいて計算することができ、スピーカ遷移ゾーン430の外側領域434については、第2サブ駆動係数および第3サブ駆動係数の線形結合に基づいて計算することができる。
【0059】
インジケータ値に基づく係数の線形結合のための重みの計算の例が、
図4bに示されている。
図4bは、種々の遷移ゾーン・インジケータ値Iについて係数の重みWを示すグラフ450を示している。
図4bは、(例えば内側ゾーン及びスピーカ遷移ゾーンの内側領域のための)第1サブ駆動係数についての係数の重み460、(例えばスピーカ遷移ゾーンのための)第2サブ駆動係数についての係数の重み470、及び(例えば外側ゾーン及びスピーカ遷移ゾーンの外側領域のための)第3サブ駆動係数についての係数の重み480を示している。遷移ゾーン・インジケータ値は、スピーカ遷移ゾーン内のどこに仮想音源が位置するのかを示している。この例では、第1サブ駆動係数についての係数の重み460は、スピーカ遷移ゾーンの内側境界から、スピーカ遷移ゾーンの内側領域432と外側領域434との間の境界へと向かうにつれて、減少している。第2サブ駆動係数についての係数の重み470は、スピーカ遷移ゾーンの内側境界から、スピーカ遷移ゾーンの内側領域432と外側領域434との間の境界へと向かうにつれて増加し、スピーカ遷移ゾーンの内側領域432と外側領域434との間の境界から、スピーカ遷移ゾーンの外側境界へと向かうにつれて減少している。さらに、第3サブ駆動係数についての係数の重み480は、スピーカ遷移ゾーンの内側領域432と外側領域434との間の境界から、スピーカ遷移ゾーンの外側境界へと向かうにつれて増加している。従って、この例では、スピーカ遷移ゾーンの内側領域432に位置する仮想音源について得られる駆動係数は、第1サブ駆動係数および第2サブ駆動係数の一部分だけを含むことができ、スピーカ遷移ゾーンの外側領域434に位置する仮想音源についての駆動係数は、第2サブ駆動係数および第3サブ駆動係数の一部分だけを含むことができる。
【0060】
代案として、第1サブ駆動係数をスピーカ遷移ゾーンの外側領域434においても多少考慮してもよく、及び/又は第3サブ駆動係数をスピーカ遷移ゾーン内の内側領域432において多少考慮してもよい。この例では、多チャネルレンダラー110が、第1サブ駆動係数、第2サブ駆動係数および第3サブ駆動係数に基づいて、仮想音源の位置がスピーカ遷移ゾーンの内側領域432に位置する場合には第1サブ駆動係数の重み係数が第3サブ駆動係数の重み係数よりも大きくなるように、また、仮想音源の位置がスピーカ遷移ゾーンの外側領域434に位置する場合には第3サブ駆動係数の重み係数が第1サブ駆動係数の重み係数よりも大きくなるように、スピーカの駆動係数112の計算を行うことができる。
【0061】
スピーカ遷移ゾーン430の幅は、主としてスピーカ設備に依存することができる。例えば、スピーカ遷移ゾーン430の境界は、スピーカ設備のスピーカに対して、スピーカ設備のあるスピーカと隣のスピーカとの間の距離(例えば、スピーカ設備において最も近くに隣接するスピーカまでの距離、または種々の方向において最も近いスピーカまでの平均距離)の20%(又は10%、50%、若しくはそれ以上)よりも長く、スピーカ設備のスピーカと隣のスピーカとの間の距離または隣接スピーカ間の距離の平均の2倍(又は5倍、1.8倍、1.5倍、若しくはそれ以下)よりも短い最短距離を有することができる。最短距離は、例えば
図4aに示すように、スピーカ設備の全てのスピーカについて同じであってもよい。代案として、最短距離、つまりスピーカ遷移ゾーン430の幅が、スピーカ設備のスピーカ間の距離に応じて異なってもよい。さらなる代案として、最短距離が後述されるようにスピーカ間の距離とは無関係であってもよい。例えば、スピーカ遷移ゾーン430の境界が、スピーカ設備のスピーカに対して、0.2m(又は0.1m、0.5m若しくは1m)よりも長く、2m(又は5m、1.5m若しくはそれ以下)よりも短い最短距離を有することができる。
【0062】
係数セット間の緩やかな遷移は、事前に計算された3つの係数セットの線形結合(重み付き合計)として実現することができる。この例では、重み付けは重み付け関数によって決定されるが、その重み付け関数は、システムのエンベロープ曲線/領域に対する音源の位置に応じ、各係数セットへと掛け算される各重み付けファクターをリターンする。その重み付け関数は、関数の形式や強度に関して変化しても良い。
【0063】
図4bにおける音源の位置を、典型的には、エンベロープに対する音源の相対位置を例えば−1(音源が遷移ゾーンの内側境界上に位置する)と1(音源が遷移ゾーンの外側境界上に位置する)との間の実数として表わす、スカラーインジケータ値として示すことができる。その場合、インジケータ値0は、音源がエンベロープ領域上(スピーカ設備の内側領域と外側領域との間の境界上)に位置することを意味する。このインジケータ値の決定には、基準点(所定のリスナー位置)から見た音源方向とエンベロープとの交点の、この基準点からの距離を用いても良い。この距離と、予め決定された方向に依存する遷移ゾーンのこの位置における目標幅とによって、基準点から音源までの実際の距離に対する比較が可能になり、上述したインジケータ値の割り当てが可能になる。
【0064】
換言すると、例えば多チャネルレンダラー110はインジケータ値を、スピーカ遷移ゾーン内に位置する仮想音源の位置とスピーカ遷移ゾーン内の内側領域とスピーカ遷移ゾーン内の外側領域434との間の境界との間の最短距離と、スピーカ遷移ゾーン430の境界とスピーカ遷移ゾーンの内側領域432とスピーカ遷移ゾーンの外側領域434との間の境界との間の距離と、の間の比に基づいて決定することができる。さらに、多チャネルレンダラー110は、第1サブ駆動係数および第2サブ駆動係数をインジケータ値に基づいて重み付けし、あるいは第2サブ駆動係数および第3サブ駆動係数をインジケータ値に基づいて重み付けすることによって、駆動係数を計算することができる。
【0065】
図4bにおいては、各々の音源位置についてのインジケータ値の決定が重要である。仮想音源が遷移ゾーンに位置する場合には、その位置についてのインジケータ値を、その仮想音源が遷移ゾーンの内側境界または外側境界にどれだけ近く位置するかに応じて割り当てることができる。好適には、インジケータ値は、区間[I(in),I(out)]内の値を有する数字を使用して割り当てられる。区間の端部が、スピーカ遷移ゾーンの境界に対応する。I(tr)は、遷移ゾーンの中心(スピーカ遷移ゾーンの内側領域と外側領域との間の境界)に対応するインジケータ値を表わす。
【0066】
スピーカ設備のスピーカの駆動係数を計算するために、種々の計算規則が知られている。例えば波面合成のアプリケーションに関連した異なる領域のための係数セット(サブ駆動係数)を決定するいくつかの例を、以下で説明する。
【0067】
例えば、スピーカ設備の外側ゾーンにおける波面合成の実現のための係数セットの決定のために、非特許文献4に記載の計算規則を使用することができる。
【0068】
この例では、スピーカアレイの駆動信号を、下記の要素を有するベクトル演算子Yに基づいて得ることができる。
ここで、ζはWFS演算子の幾何学的構成を示し、Z=0に位置する二次のモノポール音源(スピーカ)の線について、基準線の符号付きのz座標と一次音源との間の比を示す。φは二次音源ラインにおける一次音源からの入射角を示し、それはWFS演算子の幾何学的構成を示す。nは二次音源(スピーカ)の指数である。r
nはレンダリングされた仮想音源から二次音源(スピーカ)nまでの距離である。
【0069】
演算子Yのタスクは、M個のフィルタ処理された入力信号からN個の出力信号へと正しい遅延および重み係数を加えることである。入力信号が、次のような音源ベクトルとして記述される場合、
ベクトル演算子Yを、アレイ駆動信号をもたらす行列演算子へと拡張することができ、
ここで*は、時間ドメインの畳み込みを示し、Yの要素は
によって与えられ、重み係数(駆動係数)は
であり、時間遅延(駆動係数)は
である。τは二次音源(スピーカ)nにおいて再生される指数mの一次音源信号について得られる時間遅延を示す。
【0070】
sign(ζ
m)=+1(アレイの前面にある音源)の場合の非因果関係を回避するために、追加の遅延τ
0>0が導入されていることに注意すべきである。遅延の値は、スピーカと仮想音源との間の距離から導出される。重み係数a
nmは、比ζ=Z
R/Z
Sによって基準線Rの位置に依存する。直線的な線形アレイについては、Z=Z
Rにおける基準線が、通常はリスニング領域の中央においてアレイに平行に選択される。例えば矩形のアレイなど、角を有する線形アレイにおいては、ただ1つの平行な基準線を持つことは不可能である。その場合の解決策として、非平行な基準線の使用を可能にする駆動関数を適用することが挙げられる。Δr/r=ζを導入することにより、次式(2.30)と同じ形態が得られる。
【0071】
この方法で、非集中の演算子および集中の演算子を組み合わせることができる。
ここで、ζ=Z
R/Z
Sは、Z=0に位置する二次のモノポール音源の線について、基準線および一次音源のそれぞれの符号付きz座標の間の比である(例えば、Z
R=+ΔZ
0 及びZ
S=+ΔZ
0であるか、又はZ
R=+ΔZ
0及びZ
S=−ΔZ
0である)。ζが、集中の演算子について正であり、非集中の演算子について負であることに注意すべきである。また、集中の演算子については一次音源が二次音源とレシーバ線との間に位置しなければならないため、ζは制限され、即ち0≦ζ≦1が禁止されている。
【0072】
内側ゾーンについては、仮想音源の波面合成の実現のための係数セットの決定を、非特許文献4の集中の演算子についての考察(48頁、数式2.31)において述べられているように実現することができる。
【0073】
駆動係数(重み係数および時間遅延)を、この駆動関数または集中の演算子が得られるように計算することができる。
【0074】
同様に、G(φ)−1において、二次のダイポール音源の線のための駆動関数を見つけることができ、Z=0における二次音源の線の同じ側または他の側の一次モノポール音源に適用できる。
ζ=Z
R/Z
Sについては、二次モノポール音源と同じ考慮事項が当てはまる。
【0075】
スピーカ遷移ゾーンのための第2計算規則は、例えば非特許文献5に記載のベクトルベース振幅パンニングに基づいても良い。
【0076】
二次元のVBAP(ベクトルベース振幅パンニング)法においては、2チャネルのステレオスピーカ構成が、二次元ベクトルベースとして表されている。ベースは、スピーカ1及び2に向かってそれぞれ方向性を持つ単位長のベクトルl
1=[l
11 l
12]
T及びl
2=[l
21 l
22]
Tによって定義される。上付き文字Tは、行列の転置を示す。仮想音源へ向かう方向性を持つ単位長ベクトルp=[p
1 p
2]
Tを、スピーカ・ベクトルの線形結合として取り扱うことができる。
【0077】
式(7)において、g
1及びg
2は、負でないスカラー変数として取扱い可能なゲインファクタである。上述の式を、行列の形態で記述することができ、
ここで、g=[g
1 g
2]及びL
12=[l
1 l
2]
Tである。この式は、逆行列L
12-1が存在する場合に解くことができる。
【0078】
逆行列L
12-1は、L
12L
12-1=Iを満足し、ここで、Iは恒等行列である。L
12-1は、φ
0≠0°かつφ
0≠90°であれば存在し、問題となるどちらの場合も、ほとんど関心の対象とならないステレオスピーカ配置に相当する。そのような場合には、一次元のVBAPを表すことができるが、些細なことであるためここでは検討しない。
【0079】
φ
0 ≠45°の場合、ゲインファクタは次式を使用して正規化することができる。
【0080】
サウンドパワーを一定値Cに設定することができ、結果として以下の近似がもたらされる。
このとき、ゲインファクタg
scaledが上述の式(11)を満足する。
【0081】
非特許文献5にも記載のように、これらのゲインファクタ(駆動係数)は、3つ以上のスピーカについても容易に一般化でき、三次元の事例にも容易に一般化できる。
【0082】
上記提案の手法の代案は、係数セットの間の急激な切り替えであってもよいが、そのような切り替えは干渉的なアーチファクトにつながりかねない。
【0083】
図1に示す実施の形態の説明においては、単一の仮想音源に言及したが、そこで提案した概念を、複数の静止または移動する仮想音源に適用できることが明らかである。そのため、スピーカ設備のスピーカの駆動係数を計算する装置は、
図3の成分信号の合計手段320によって既に示したような、結合器を備えても良い。この場合、多チャネルレンダラー110は、第2の仮想音源(又はさらに多くの仮想音源)についてスピーカ設備のスピーカのための駆動係数を計算することができ、(第1の上述した)仮想音源についての調整されたオーディオ信号および第2の仮想音源についての調整されたオーディオ信号を、各仮想音源について計算した駆動係数および各仮想音源に関連するオーディオ信号に基づいて生成する。つまり、例えば仮想音源に関連するオーディオ信号のスケーリング及び遅延によって、調整されたオーディオ信号を得ることを意味する。次に、結合器が、(第1の)仮想音源の調整済のオーディオ信号と第2の仮想音源の調整済のオーディオ信号とを結合し、スピーカ設備のスピーカのための出力オーディオ信号を得る。換言すると、多チャネルレンダラーが、計算された駆動係数(例えば増幅および遅延)を用いて仮想音源のオーディオ信号を調整し、結合器がスピーカに関係する全ての仮想音源の調整済のオーディオ信号を結合し、そのスピーカのための出力オーディオ信号を得てもよい。次に、この出力オーディオ信号はスピーカ設備のスピーカへと供給されても良い。
【0084】
例えば、本発明の上述の態様が
図2及び
図3に示した基本的な波面合成モジュールにおいて実施される場合、種々のサブ駆動係数の計算を波面合成手段300、302、304、306において実施することができる。
【0085】
多チャネルレンダラー110及び/又は結合器は、独立したハードウェアユニットであっても良く、コンピュータの一部、マイクロコントローラ又はデジタル信号プロセッサであっても良く、更に、コンピュータ、マイクロコントローラ又はデジタル信号プロセッサを作動させるコンピュータプログラムまたはソフトウェア製品であってもよい。
【0086】
図10はスピーカ設備のスピーカの駆動係数を計算するための、本発明の態様の実施の形態に従う方法1000のフロー図を示している。この方法1000は、仮想音源の位置がスピーカ遷移ゾーン内の内側領域に位置する場合に、第1計算規則に従ってスピーカ設備のスピーカのための第1サブ駆動係数を計算するステップ1010と、第2計算規則に従って同じスピーカのための第2サブ駆動係数を計算するステップ1020と、第1サブ駆動係数および第2サブ駆動係数に基づいて同じスピーカのための駆動係数を計算するステップ1030とを含んでいる。さらに、この方法1000は、仮想音源の位置がスピーカ遷移ゾーン内の外側領域に位置する場合に、第2計算規則に従ってスピーカ設備のスピーカのための第2サブ駆動係数を計算するステップ1020と、第3計算規則に従って同じスピーカのための第3サブ駆動係数を計算するステップ1030と、第2サブ駆動係数および第3サブ駆動係数に基づいて同じスピーカのための駆動係数を計算するステップ1040とを含んでいる。第2計算規則は、第1計算規則および第3計算規則と異なる。さらに、スピーカ遷移ゾーンは、スピーカ設備の内側ゾーンとスピーカ設備の外側ゾーンとを隔てている。スピーカ設備のスピーカは、スピーカ遷移ゾーン内に位置している。
【0087】
さらに、この方法1000は、上述して説明した概念の任意の特徴に対応する1つ以上のさらなるステップを含むことができる。
【0088】
図5aは、本発明の別の態様による実施の形態として、仮想音源に関連するオーディオ信号について、スピーカ設備のスピーカのための駆動係数512を計算する装置500のブロック図を示している。この装置500は多チャネルレンダラー510を備えている。多チャネルレンダラー510は、仮想音源の位置がスピーカ遷移ゾーンの外部にある場合に、第1計算規則に基づいてスピーカ設備のスピーカの駆動係数512を計算する。さらに、多チャネルレンダラー510は、仮想音源の位置502がスピーカ遷移ゾーンの内部にある場合に、第2計算規則に基づいてスピーカ設備のスピーカの駆動係数512を計算する。この実施の形態において、スピーカ遷移ゾーンの境界は、スピーカ設備のスピーカに対して、スピーカとこのスピーカに隣接するスピーカとの間の距離に依存する最短距離を有する。さらに、スピーカ設備は、隣接するスピーカからなるスピーカペアであって、各ペアにおけるスピーカ間の距離が異なっている少なくとも2組のスピーカペアを含んでいる。このようにして、例えば仮想音源の位置情報502(例えば座標)が多チャネルレンダラー510へと供給される。
【0089】
上述の概念は、スピーカ設備の隣接スピーカ間の距離の変化につれて、スピーカの周囲のスピーカ遷移ゾーンの幅を変化させることで対処する。例えば、隣接するスピーカ間の距離が増大する場合、それら隣接するスピーカに対するスピーカ遷移ゾーンの境界の最短距離も増大する。このようにして、スピーカ設備のスピーカ間の距離が変化することで引き起こされるアーチファクトを有意に低減でき、オーディオ品質を向上させることができる。従来の実施例は、エンベロープを囲んで一定の幅を有する遷移ゾーンを備えるだけである。
【0090】
スピーカ遷移ゾーンは、スピーカ設備の内側ゾーンとスピーカ設備の外側ゾーンとを隔てており、スピーカ設備の全てのスピーカは、スピーカ遷移ゾーン内に位置している。従って、スピーカ遷移ゾーンは、スピーカ設備の内側ゾーンに対する内側境界と、スピーカ設備の外側ゾーンに対する外側境界とを備えている。最短距離とは、スピーカ遷移ゾーンの内側境界または外側境界からスピーカまでの最短距離を示す。換言すると、スピーカ遷移ゾーンの境界からスピーカまでの最短距離は、スピーカ遷移ゾーンの内側境界からスピーカまで、又はスピーカ遷移ゾーンの外側境界からスピーカまでの距離によって測定することができる。代替的に、スピーカ遷移ゾーンの内側境界およびスピーカ遷移ゾーンの外側境界がスピーカに対して同じ最短距離を有しても良い。スピーカに対するスピーカ遷移ゾーンの境界の最短距離がスピーカとこのスピーカの隣のスピーカとの間の距離に応じて変化するため、スピーカ遷移ゾーンは可変的な幅を有している。
【0091】
スピーカ遷移ゾーンの境界は、スピーカ設備の少なくとも2つのスピーカに対し、異なる最短距離を有しても良い。
【0092】
一般に、スピーカとこのスピーカに隣接するスピーカとの間の距離が増大するにつれて、スピーカに対するスピーカ遷移ゾーンの境界の最短距離も増大しても良い。例えば、隣接スピーカ間の距離が増大するにつれて、その最短距離を線形的に増加させても良い。
【0093】
スピーカ設備のスピーカに対するスピーカ遷移ゾーンの境界の最短距離は、スピーカと最も近い隣接スピーカとの間の距離に乗算係数を掛けたもの、又はスピーカとこのスピーカから異なる方向に位置する少なくとも2つの隣接スピーカとの間の距離の平均に乗算係数を掛けたものに等しくてもよい。例えば、二次元の場合には、通常は各々のスピーカが2つの隣接スピーカ(1つは右側に、1つは左側に)を有する。三次元の場合には、スピーカ設備のスピーカに隣接して3つ以上のスピーカ(例えば、左、右、上、下)が存在しうる。乗算係数は幅広い範囲において選択可能である。例えば、乗算係数は0.1〜5の間(例えば0.1、0.2、0.5、1、2又は5)であっても良い。
【0094】
従って、スピーカ遷移ゾーンの境界は、スピーカ設備のスピーカに対して、スピーカ設備のスピーカと隣のスピーカとの間の距離(又はスピーカと異なる方向に位置する2つ以上の隣のスピーカとの間の距離の平均)の10%よりも長く、スピーカ設備のスピーカと隣のスピーカとの間の距離の5倍よりも短い最短距離を有することができる。スピーカ遷移ゾーンの境界は、スピーカ設備の1個、2個、幾つか又は各スピーカに対し、各スピーカと各スピーカの隣のスピーカとの間の距離に応じて、個別の最短距離を有することができる。
【0095】
可変幅を有するスピーカ遷移ゾーン530の一例500が
図5bに示されている。この概略図は、複数のスピーカ550が遷移ゾーン530によって囲まれており、隣接するスピーカ550の間の距離の変化に応じて遷移ゾーン550の幅(又は最短距離)が変化することを示している。上述したように、遷移ゾーン530が、スピーカ設備の内側ゾーン520とスピーカ設備の外側ゾーン540とを隔てている。
【0096】
換言すると、スピーカの配置に依存した広がりを有する遷移ゾーンの実現が示されている。このような遷移ゾーンは、典型的には、遷移ゾーンの幅がスピーカ間の距離に依存することで生じる。他に、スピーカシステムにおける遷移ゾーンの幅を、システムにおけるスピーカの密度が変わる場合に変化させてもよい。例えば、密に配置されたスピーカの領域が狭い遷移ゾーンによって囲まれる一方で、スピーカ距離が長い場合の領域は幅の広い遷移ゾーンを有する。換言すると、スピーカ遷移ゾーンがスピーカ設備のスピーカに対して、そのスピーカの周囲の所定のサイズの領域におけるスピーカの密度を示すスピーカ密度値に応じた最短距離を有することができる。スピーカ密度値は、例えば1メートル当たりのスピーカの数として測定することができる。計算のために、典型的なリスナー位置(以下では基準点と称される)または所定のリスナー位置を仮定することができる。
【0097】
音源位置の全ての方向について遷移ゾーンの幅を決定するために、例えば以下の方法が提案される。実際の係数計算の前に、各スピーカについて、スピーカ遷移ゾーンの幅として処理することができる設定値(configuration value)が決定される。この値は、このスピーカから、基準点から見て最も近い隣接スピーカとしてこのスピーカを囲む複数のスピーカまでの距離から計算される。2次元の場合には、隣接スピーカとは2個の他のスピーカを意味し、3次元の場合には、3個(又は4個以上)の他のスピーカを意味する。幅設定値を決定するために、例えば他のスピーカまでの平均距離を推定することもできる。同様に、他の指標(例えば、最長距離、最短距離)も使用可能であると考えられる。関連スピーカの方向における遷移ゾーンの幅に係る前記設定値は、係数の決定をシステムの要件に適合させる目的で、(例えばあるファクタによる乗算などの)適用に先立ってさらに変更が加えられても良い。
【0098】
全てのスピーカについて得られた遷移ゾーンの幅設定値を用いて、音源の各々の位置について、遷移ゾーンの幅の値を以下のように決定することができる。まず、基準点(予め定義されたリスナー位置)から見て、音源位置の方向に関して隣接し取り囲むスピーカが決定される。次に、1セットのファクタが計算され、このファクタのセットは、線形結合を用いて、決定されたスピーカの正規化ベクトルから音源位置の正規化ベクトルをもたらす(各ベクトルは基準点から出発する)。これらのファクタを取得し、幅設定値の合計の重み付けにこれらのファクタを使用することで、音源の方向の遷移ゾーンの所望の幅を決定することができる。この場合の加算は、さまざまな形態で実行することができる。
【0099】
図5bはインジケータ値の構成を示す。重み付けファクタを決定するためのインジケータ値の計算および適用は、
図4bに関して説明した方法と同様に行うことができる。
【0100】
図5bは、遷移ゾーンの幅がどのように局所的にスピーカの距離に依存するのかを概略的に示している。
【0101】
スピーカ遷移ゾーンの境界の最短距離は、スピーカ設備のスピーカについて上述の装置によって決定することができる。換言すれば、この装置は、ルックアップテーブルに含まれる情報に基づいて第1計算規則または第2計算規則のどちらを使用するかを決定することができる。例えば、多チャネルレンダラー510は、仮想音源の位置502がスピーカ遷移ゾーンの内部または外部のどちらに位置するのかについての情報を含むルックアップテーブルを有する記憶ユニットを備え、多チャネルレンダラー510が、このルックアップテーブルに含まれる情報に基づいて、仮想音源の位置502について第1計算規則または第2計算規則を使用しても良い。換言すると、そのルックアップテーブルは、仮想音源について考えられる離散的な位置について、その位置がスピーカ遷移ゾーンの内部または外部のどちらであるかを示す情報を含むことができる。従って、多チャネルレンダラーは、離散的な位置に関するルックアップテーブルに含まれる情報から、例えば仮想音源の位置502に最も近い情報を決定するだけで良く、又は、仮想音源の位置502に最も近い2つの離散的な位置に関する情報の(例えば線形的)補間を行うだけで良い。
【0102】
代替的に、
図6に示すように、仮想音源に関連するオーディオ信号についてスピーカ設備のスピーカの駆動係数を計算する装置600が、スピーカ遷移ゾーン決定器620を備えてもよい。スピーカ遷移ゾーン決定器620は、多チャネルレンダラー510に接続され、スピーカとこのスピーカに隣接するスピーカとの間の距離に基づいて、スピーカ設備のスピーカからスピーカ遷移ゾーンの境界までの最短距離622を決定するように構成される。この決定は、前記最短距離を計算することにより実行可能であり、又は、スピーカ設備の隣接するスピーカ間について考えられる複数の異なる離散的な距離についての最短距離を含むルックアップテーブルから、前記最短距離を取得することにより実行可能である。
【0103】
多チャネルレンダラー510及び/又はスピーカ遷移ゾーン決定器620は、独立したハードウェアユニットであっても良く、コンピュータの一部、マイクロコントローラ又はデジタル信号プロセッサであっても良く、更に、コンピュータ、マイクロコントローラ又はデジタル信号プロセッサを作動させるコンピュータプログラムまたはソフトウェア製品であってもよい。
【0104】
上述したように、本発明のこの態様も、1つの仮想音源に関して説明されているが、複数のオーディオオブジェクトまたは仮想音源を、上述の概念によって取り扱うことができる。例えば、多チャネルレンダラー510は、第2の(又は複数の)仮想音源についてスピーカ設備のスピーカのための駆動係数を計算しても良い。さらに、多チャネルレンダラー510は、(上述した第1の)仮想音源についての調整済みのオーディオ信号および第2の仮想音源についての調整済みのオーディオ信号を、各仮想音源について計算された駆動係数および各仮想音源に関連するオーディオ信号に基づいて、生成することができる。次に、結合器(例えば上述しかつ
図3に示す信号成分を合計する手段320)が、(第1の)仮想音源の調整済みのオーディオ信号および第2の仮想音源の調整済みのオーディオ信号を結合し、スピーカ設備のスピーカのための出力オーディオ信号を取得しても良い。この方法で、異なる仮想音源から生じたオーディオ信号の部分を、スピーカ設備のスピーカによって同時に再現することができる。
【0105】
第1計算規則は、スピーカ設備の内側ゾーン及び/又は外側ゾーンについて駆動係数を決定するために適したアルゴリズムであってもよい。例えば、第1計算規則は、
図1、
図4a及び
図4bに示した本発明の態様に関して述べた第1計算規則または第3計算規則と同様または同一であってもよい。さらに、第2計算規則は、遷移ゾーンにおける駆動係数を計算するのに適したアルゴリズムであってもよい。例えば、第2計算規則は、
図1、
図4a及び
図4bに示した本発明の態様に関して述べた第2計算規則と同様または同一であってもよい。
【0106】
図11は、仮想音源に関連するオーディオ信号についてスピーカ設備のスピーカの駆動係数を計算する、本発明の実施の形態に従う方法1100のフロー図を示す。この方法1100は、仮想音源の位置がスピーカ遷移ゾーンの外部に位置する場合に第1計算規則に基づいてスピーカ設備のスピーカの駆動係数を計算するステップ1110と、仮想音源の位置がスピーカ遷移ゾーンの内部に位置する場合に第2計算規則に基づいてスピーカ設備のスピーカの駆動係数を計算するステップ1120とを含んでいる。スピーカ遷移ゾーンの境界は、スピーカ設備のスピーカに対して、スピーカとこのスピーカに隣接するスピーカとの間の距離に応じた最短距離を有している。さらに、スピーカ設備は、隣接するスピーカからなるスピーカペアであって、各ペアにおけるスピーカ間の距離が異なる少なくとも2組のスピーカペアを含んでいる。
【0107】
加えて、この方法1100は、上述の概念の1つ以上の任意の特徴を表わす1つ以上のさらなるステップを含むことができる。
【0108】
図8は、本発明のさらなる態様の実施の形態として、仮想音源に関連するオーディオ信号に基づいてスピーカ設備のスピーカの駆動信号822を供給する装置800のブロック図を示している。この装置800は、多チャネルレンダラー820へと接続されたスピーカ決定器810を備えている。スピーカ決定器810は、仮想音源の位置802を中心とする可変角度範囲内に位置するスピーカ設備の関連スピーカ812のグループを決定する。可変角度範囲は、仮想音源の位置802と所定のリスナー位置804との間の距離に基づく。多チャネルレンダラー820は、決定された関連スピーカ812のグループについて駆動係数を計算する。さらに、多チャネルレンダラー820は、計算された駆動係数および仮想音源のオーディオ信号806に基づいて、関連スピーカ812のグループに対しては駆動信号822を供給するが、関連スピーカ812のグループのスピーカ以外のスピーカに対しては、仮想音源に関する駆動信号822を供給しない。このため、例えば仮想音源の位置情報802(例えば座標)及び所定のリスナー位置の位置情報804がスピーカ決定器810へと供給され、仮想音源のオーディオ信号806が多チャネルレンダラー820へと供給される。
【0109】
仮想音源の位置802と所定のリスナー位置804との間の距離に応じて、仮想音源の位置802を中心とするアクティブスピーカの角度範囲を調整することにより、所定のリスナー位置804の近傍を移動する仮想音源のためのアクティブスピーカが高速で変化することに起因するアーチファクトを、有意に低減させることができ、従ってオーディオ品質を向上させることができる。
【0110】
詳しくは、特に移動している仮想音源または所定のリスナー位置804までの距離が異なる種々の仮想音源について、可変角度範囲が、仮想音源の位置802と所定のリスナー位置804との間の第1距離について第1角度を有し、仮想音源の位置802と所定のリスナー位置804との間の第2距離について第2角度を有する。第1距離と第2距離とが異なる場合、同じ仮想音源または異なる仮想音源の少なくとも2つの位置について、第1角度および第2角度は異なる。
【0111】
図8に示した本発明の上述の態様は、スピーカ設備の内側領域内に位置する集中仮想音源についてのみ使用することができる。スピーカ設備の内側領域とは、スピーカ設備のスピーカによって囲まれた領域である。
【0112】
換言すると、仮想音源は移動する仮想音源であってもよく、その移動する仮想音源が、所定のリスナー位置804に対し、第1時点においては第1距離を有し、第2時点においては第2距離を有する。この場合、第1距離が第2距離よりも長い場合には、可変角度範囲は第2時点において第1時点よりも大きくてもよい。
【0113】
例えば、仮想音源の位置と所定のリスナー位置との間の距離が短くなるにつれて、可変角度範囲が大きくなる。この法則は、1つの仮想音源の少なくとも2つの異なる位置について有効であってもよい。可変角度範囲は、0よりも大きいスピーカの振幅係数を有する振幅ウインドウの可変の角度を示すことができる。
【0114】
可変角度範囲は、所定のリスナー位置804から仮想音源の位置802へと延びる線の両側(例えば二次元のスピーカ配置の場合)又は周囲(例えば三次元のスピーカ配置の場合)に、対称的に配置されても良く、更に、仮想音源の位置802に関して所定のリスナー位置804とは反対側の領域を包含しても良い。換言すると、関連スピーカは、主として所定のリスナー位置804に位置するリスナーから見て仮想音源の背後に位置する。例えば、仮想音源の位置が所定のリスナー位置に近付くように移動する場合、所定のリスナー位置804に位置するリスナーの左側および右側のより多数のスピーカが関連するように、可変角度範囲は増大しても良い。三次元のスピーカ配置の場合には、可変角度範囲は球の一部分の開口角度を示す。
【0115】
可変角度範囲は、常に最小の可変角度範囲に等しくてもよく、あるいは最小の可変角度範囲より大きくてもよい。最小の可変角度範囲は、例えば180°、それ以上またはそれ以下であってもよい。さらに、可変角度範囲は、仮想音源の位置802が所定のリスナー位置804に等しい場合には、360°に等しくてよい。
【0116】
所定のリスナー位置は、スピーカ設備の内側ゾーン内の基準点であってもよい。上述の概念によれば、そのような所定のリスナー位置804に位置するリスナーにとっても、オーディオ品質を向上させることができる。
【0117】
移動する仮想音源のためのアクティブスピーカが高速で変化することに起因するアーチファクトは、仮想音源が所定のリスナー位置に近い場合にだけ発生する可能性もある。従って、可変角度範囲を、所定のリスナー位置の周囲にあるリスナー遷移ゾーン内においては変化させる一方で、リスナー遷移ゾーンの外部においては一定に維持することができる。この例では、可変角度範囲が、リスナー遷移ゾーンの外側において最小角度範囲を有することができる。この最小角度範囲は、上述したように、例えば180°あるいはそれ以上またはそれ以下であってもよい。リスナー遷移ゾーンの内側においては、可変角度範囲を、仮想音源の位置と所定のリスナー位置804との距離がリスナー遷移ゾーンの境界からゼロへと減少するときに、最小角度範囲から360°へと線形的に増加させることができる。
【0118】
スピーカ遷移ゾーンは、所定のリスナー位置の周囲の円であってもよいが、他の幾何学形状も可能である。リスナー遷移ゾーンの直径は、2m(又は5m、1m、それ以下)よりも小さく、0.2m(又は0.1m、0.5m、それ以上)よりも大きくてもよい。代替的あるいは追加的に、リスナー遷移ゾーンの直径は、所定のリスナー位置804とスピーカ設備の最も近いスピーカとの間の距離の10%(又は1%、20%、それ以上)よりも長くてもよい。
【0119】
図9は、所定のリスナー位置950までの仮想音源の異なる距離について、仮想音源の周囲の異なる角度範囲を示す概略
図900である。この例では、スピーカ設備のスピーカ910が所定のリスナー位置950の周りに正方形状に配置されており、この例では、その所定のリスナー位置950は、(例えば仮想音源の位置情報802及び所定のリスナーの位置情報804のための)座標の原点でもある。さらに、リスナー遷移ゾーン940が所定のリスナー位置950の周囲に破線の円によって示されている。リスナー遷移ゾーン940は集中音源遷移ゾーンとも称することができる。さらに、仮想音源の3つの異なる位置920について、振幅ウインドウセグメントとも称される角度範囲930が示されている。
図9から分かるように、可変角度範囲930は、リスナー遷移ゾーン940の境界における最小角度範囲(この例では180°)から、仮想音源の位置920が所定のリスナー位置950にほぼ到達するときのほぼ360°まで増大する。換言すると、
図9は、基準点(所定のリスナー位置)の近くの集中音源(スピーカ設備の内側領域内に位置する仮想音源)のための振幅ウインドウの構成(可変角度範囲の決定)の例を示している。
【0120】
スピーカ決定器810は、それ自身で可変角度範囲を計算することができ、又は、仮想音源の位置と所定のリスナー位置との間の種々の距離および方向(より一般的には仮想音源の種々の位置)について、関連スピーカの種々のグループについての情報を含むルックアップテーブルを有する記憶ユニットを備えることができる。この場合、スピーカ決定器は、ルックアップテーブルに含まれる情報に基づいて関連スピーカを決定することができる。ルックアップテーブルは、仮想音源について考えられる複数の種々の離散的な位置(又は距離および方向)について、スピーカ設備の関連スピーカのグループを含むことができる。従って、スピーカ決定器は、例えば仮想音源の位置に最も近い離散的な位置を決定し、この最も近い離散的な位置に関連してルックアップテーブルに保存された関連スピーカのグループを取得するだけでよい。
【0121】
波面合成の従来の実施例における集中音源のための係数の計算は、システムの基準点を含みかつ基準点から音源位置へと延びる法線ベクトルを有する分割線/面を構成することで、平面/空間を2つの部分へと分割することによって振幅係数を決定する。音源を含む部分においては、スピーカが関連スピーカと見なされ、0よりも大きい振幅ファクタによってサウンドの再生に関与する。残りの部分に位置するスピーカはアクティブに維持される。ここで、急激な振幅ウインドウの変化(アクティブスピーカの変化)につながるような、基準点付近における音源の移動に注目すべきである。
【0122】
本発明が提案する概念は、基準点付近における係数分布の緩やかな変化をもたらす。この手法は、上述の法線(ベクトル)と音源からスピーカへのベクトルとの間の角度を考慮することに基づいている。この角度が音源位置に応じた臨界角度(可変角度範囲)よりも小さい場合、それらのスピーカは関連すると判断され、0よりも大きい振幅係数を受け取る。この臨界角度が常に直角であるならば、この方法は、波面合成の現状の構成に相当する。本発明が提案する変更によれば、臨界角度は以下のように音源位置に依存する。音源が設定可能な臨界距離または限界距離(リスナー遷移ゾーンの境界)よりも基準点から遠く離れている場合には、臨界角度は直角となる。音源が限界距離未満に位置する場合には、距離が小さくなるにつれて限界角度が360°へと増大する。つまり、音源が基準点に位置する場合には、全てのスピーカが関連し、アクティブになる。角度の増加の形態によって、この概念の性能を調整することができる。
【0123】
上述した概念は、例えばシステムの基準点(所定のリスナー位置)に近い集中音源(集中仮想音源)の安定した性能を実現するための手段を提供する。
【0124】
図9に示す再生システム(スピーカ設備)の基準点(所定のリスナー位置、原点)の周囲に、特定の半径を有する円940を構成することができる。この円940の外側では、所定の可変角度範囲を有する振幅ウインドウを有する集中音源を決定しても良い。振幅ウインドウは、音源の位置に関して、音源の位置を含んで円の半径方向に対して直角に引かれる直線の片側に広がる。ハッチングされた領域が、音源位置に関してアクティブスピーカの方向を示している。この領域が、3つの音源の位置のうちの最も外側の位置によって図示されている。音源920が、円940の境界上に位置している。ハッチングされた半円が、その構成を示している。この半円は、現実的には、開口角度を表わす。音源が原点にさらに接近すると、直線ではなく、原点までの距離が小さくなるにつれて次第に閉じるような角度セグメントが平面を分割する。つまり、振幅ウインドウが広がるという結果をもたらす(閉じようとする円セグメントを参照)。原点において、円の閉じた領域が結果として生じ、ここでは全てのスピーカがアクティブと考えられる。2つの閉じようとする円セグメントが、この傾向を示している。このようにして、スピーカ分布の全体が急に切り換わることを回避することができる。この方法で、音源920と原点950との間の距離に依存した開口角度(可変角度範囲)の変化の例が定性的に示される。
【0125】
上述したように、この実施の形態も、1つの仮想音源に関して説明されているが、複数の仮想音源も、本発明のこの態様に従って処理することが可能である。例えば、スピーカ決定器は、第2(又は各)仮想音源の位置を中心とする第2可変角度範囲(又は複数の異なる可変角度範囲)に位置する、スピーカ設備の関連スピーカの第2(又は複数の)グループを決定しても良い。第2可変角度範囲は、第2仮想音源の位置と所定のリスナー位置との間の距離に基づいており、多チャネルレンダラー820は、関連スピーカの第2グループのための駆動係数を計算し、計算した駆動係数および第2仮想音源のオーディオ信号に基づいて、関連スピーカの第2グループへと駆動信号を供給する一方で、関連スピーカの第2グループのスピーカ以外の他のスピーカに対しては、第2仮想音源の駆動信号を供給しない。この場合、仮想音源の駆動信号は、スピーカがそれぞれの仮想音源に関する関連スピーカのグループに含まれる場合に限り、そのスピーカへと供給される。例えば、スピーカが、関連スピーカの(上述した第1)グループ及び関連スピーカの第2グループに含まれる場合には、多チャネルレンダラー820は、(第1)仮想音源および第2仮想音源の駆動信号を供給する。同様に、スピーカが両グループのうちの一方にだけ含まれる場合には、関連する駆動信号だけがスピーカへと供給され、スピーカが関連スピーカのグループのいずれにも含まれない場合には、いかなる駆動信号もこのスピーカには供給されない。
【0126】
多チャネルレンダラー820及び/又はスピーカ決定器810は、独立したハードウェアユニットであっても良く、コンピュータの一部、マイクロコントローラ又はデジタル信号プロセッサであっても良く、更に、コンピュータ、マイクロコントローラ又はデジタル信号プロセッサを作動させるコンピュータプログラムまたはソフトウェア製品であってもよい。
【0127】
図12は、仮想音源に関連するオーディオ信号に基づいてスピーカ設備のスピーカの駆動信号を供給する、本発明の実施の形態による方法1200のフロー図を示している。この方法1200は、仮想音源の位置を中心とする可変角度範囲に位置するスピーカ設備の関連スピーカのグループを決定するステップ1210を含んでいる。可変角度範囲は、仮想音源の位置と所定のリスナー位置との間の距離に基づく。さらに、この方法は、決定された関連スピーカのグループのための駆動係数を計算するステップ1220と、計算した駆動係数および仮想音源のオーディオ信号に基づいて、関連スピーカのグループへと駆動信号を供給する一方で、関連スピーカのグループのスピーカ以外の他のスピーカには、仮想音源の駆動信号を供給しないステップ1230を含んでいる。
【0128】
さらに、この方法1200は、上述して説明した概念の任意の特徴に対応する1つ以上のさらなるステップを含むことができる。
【0129】
本発明の別の態様によれば、複数の異なる所定のリスナー位置が、スピーカの駆動係数の計算において考慮される。この例では、所定のリスナー位置の各々について、スピーカの駆動係数が計算され、この複数の駆動係数が(例えば線形結合によって)結合され、スピーカのための結合された駆動係数が得られる。
【0130】
複数の所定のリスナー位置に関して駆動係数を考慮することにより、1つの所定のリスナー位置についてのみオーディオ品質が最適化されるのではなく、全リスナー領域についてオーディオ品質を改善することができる。
【0131】
この方法で、例えば非集中仮想音源によるサウンド再生のために適切な振幅ウインドウをリスナーに応じて決定する手段を構成することができる。
【0132】
入力信号を再生システムの種々のスピーカへと導くための振幅値の選択は、結果として得られるサウンド事象の局所的な知覚に特に影響を及ぼす。特に、リスナーについて複数の位置が考えられる場合、即ちリスナー領域(リスナーゾーン)が広い場合には、正確な方向性を持つサウンド事象の定位を可能にするために、より広い範囲のスピーカに再生すべき信号を供給しなければならない。
【0133】
この前提のもとで、所定のリスナー領域を考慮して振幅係数を決定するための概念が提案される。リスナー位置としてのシステムの基準点がリスナー領域から決定され、その基準点はリスナーゾーンのサンプリングの目的のために変化させることができるる。この基準点に基づいて、以下の振幅ウインドウの計算が実行される。
【0134】
この方法の基礎は、基準点、音源位置及びスピーカ位置の相対位置からスピーカの部分振幅係数を計算するために使用される、所定の形式を持つモデル振幅ウインドウである。ここではまず、基準点から見た全てのスピーカの位置および音源位置の間の角度が決定される。上述のウインドウ関数が、これらの角度の各々について相対的な振幅値を与える。典型的には、基準点から見てまさに音源方向に位置するスピーカが、全てのスピーカのうちの最高の部分振幅値を受け取る。モデルウインドウの形式によるが、このウインドウ処理により、基準点に基づいた円(2D)または球(3D)の一部分がもたらされ、このウィンドウ処理では、スピーカの位置に応じた部分振幅係数がスピーカへと割り当てられる。所定のリスナー範囲をサンプリングすることによって、同種類の一連の計算が異なる基準点について実行され、各々が全てのスピーカ(又は関連する全てのスピーカ)についての部分振幅係数(駆動係数)のセットをもたらす。これらのセットを加算することで、結果としての振幅分布が得られ、この振幅分布が、後続の処理工程を経て、さらなるオーディオ再生に使用される。
【0135】
リスナーの範囲、モデル振幅ウインドウ及びサンプリングパラメータの選択によって、異なる要件に対して再現方法をパラメトリックに適合させることができる。使用可能なモデル振幅ウインドウは様々であるが、特に修正コサイン関数に基づいても良い。
【0136】
図7は、スピーカ設備のスピーカ710の概略
図700を示しており、スピーカ設備の内側のリスナー領域720内に3つの異なる所定のリスナー位置730が存在する。仮想音源740とスピーカ設備のスピーカ710との間の角度(d1、d2、d3)が所定の異なるリスナー位置730の各々において異なるため、同じスピーカについて計算される部分振幅係数(駆動係数)は、所定の異なる各リスナー位置730において異なる。
【0137】
一般に、本発明の種々の態様が、互いに独立して説明されているが、それらの1つ以上を組み合わせることも可能である。
【0138】
例えば、
図1において、仮想音源に関連するオーディオ信号についてスピーカ設備のスピーカのための駆動係数を計算する装置100の説明の中で上述したスピーカ遷移ゾーンは、スピーカ設備のスピーカに対してスピーカとこのスピーカに隣接するスピーカとの間の距離に応じた最短距離を有するような、境界を備えることができる。さらに、スピーカ設備は、隣接するスピーカからなるスピーカペアであって、各ペアにおけるスピーカの間の距離が異なる少なくとも2組のスピーカペアを含むことができる。この例では、スピーカ遷移ゾーン内に位置する仮想音源についての異なる計算規則に従うサブ駆動係数の考慮と、可変幅を有するスピーカ遷移ゾーンの考慮とが組み合わせられる。従って、移動する仮想音源について、スピーカ設備の内側ゾーンとスピーカ遷移ゾーンとの間、スピーカ遷移ゾーンの内側領域とスピーカ遷移ゾーンの外側領域との間、及びスピーカ遷移ゾーンとスピーカ設備の外側ゾーンとの間の遷移を、極めて滑らかに実現することができ、オーディオ品質を有意に向上させることができる。
【0139】
そのため、例えば仮想音源の位置を記述する安定したインジケータを決定する手段と、可変幅の遷移ゾーンを実現する手段とを設けても良い。
【0140】
追加的又は代替的に、
図1に示す装置100が、仮想音源の位置を中心とする可変角度範囲内に位置するスピーカ設備の関連スピーカのグループを決定するスピーカ決定器を備えてもよい。可変角度範囲は、仮想音源の位置と所定のリスナー位置との間の距離に基づく。さらに、多チャネルレンダラーが、計算された駆動係数および仮想音源のオーディオ信号に基づいて、関連スピーカのグループへと駆動信号を供給する一方で、関連スピーカのグループのスピーカ以外のスピーカに対しては、仮想音源に関する駆動信号を供給しなくても良い。この方法で、内側ゾーン、遷移ゾーン及び外側ゾーンの間の遷移に起因するアーチファクトと、所定のリスナー位置の近傍を移動する仮想音源のためのスピーカの急激な活性化に起因するアーチファクトとを軽減でき、オーディオ品質を有意に向上させることができる。
【0141】
さらに追加的又は代替的に、
図1に示す装置100は、複数の異なる所定のリスナー位置に基づいてスピーカ設備のスピーカについて複数の駆動係数を計算しても良く、スピーカのそれら複数の駆動係数を結合してそのスピーカの結合済みの駆動係数を取得しても良い。
【0142】
さらに、
図5aに示す装置500を出発点にしてもよい。この場合、仮想音源に関連するオーディオ信号についてスピーカ設備のスピーカのための駆動係数を計算する装置500は、仮想音源の位置がスピーカ遷移ゾーン内の内側領域に位置する場合には、第1計算規則に従って計算される駆動係数と第2計算規則に従って計算される駆動係数とに基づいて、スピーカ設備のスピーカのための駆動係数を計算する多チャネルレンダラー510を備えることができる。さらに、この多チャネルレンダラー510は、仮想音源の位置がスピーカ遷移ゾーン内の外側領域に位置する場合には、第2計算規則に従って計算される駆動係数と第3計算規則に従って計算される駆動係数とに基づいて、同じスピーカのための駆動係数を計算する。
【0143】
追加的又は代替的に、
図5aに示した装置500は、仮想音源の位置を中心とする可変角度範囲内に位置するスピーカ設備の関連スピーカのグループを決定する、スピーカ決定器を備えてもよい。可変角度範囲は、仮想音源の位置と所定のリスナー位置との間の距離に基づく。さらに、多チャネルレンダラー510は、計算された駆動係数および仮想音源のオーディオ信号に基づいて関連スピーカのグループへと駆動信号を供給する一方で、関連スピーカのグループのスピーカ以外のスピーカに対しては仮想音源の駆動信号を供給しなくても良い。この方法で、スピーカ設備のスピーカ間の距離の相違に起因し、所定のリスナー位置の近傍を移動する仮想音源についてのアクティブスピーカの急激な変化に起因するアーチファクトを軽減することができ、オーディオ品質を有意に向上させることができる。
【0144】
さらに追加的又は代替的に、装置200は、複数の異なる所定のリスナー位置に基づいてスピーカ設備のスピーカについて複数の駆動係数を計算しかつスピーカの複数の駆動係数を結合してスピーカの結合済み駆動係数を得る、多チャネルレンダラー510を備えることができる。
【0145】
さらに、
図8に示す装置800も、本発明の種々の態様の組み合わせの出発点とすることができる。例えば、
図8に示す装置800は、仮想音源の位置がスピーカ遷移ゾーン内の内側領域に位置する場合には、第1計算規則に従ってスピーカ設備のスピーカの第1サブ駆動係数を計算し、第2計算規則に従って同じスピーカの第2サブ駆動係数を計算し、かつ第1サブ駆動係数および第2サブ駆動係数に基づいて同じスピーカの駆動係数を計算する、多チャネルレンダラー820を備えることができる。さらに、その多チャネルレンダラー820は、仮想音源の位置がスピーカ遷移ゾーン内の外側領域に位置する場合には、第2計算規則に従ってスピーカ設備のスピーカの第2サブ駆動係数を計算し、第3計算規則に従って同じスピーカの第3サブ駆動係数を計算し、かつ第2サブ駆動係数および第3サブ駆動係数に基づいて同じスピーカの駆動係数を計算できる。スピーカ遷移ゾーンはスピーカ設備の内側ゾーンとスピーカ設備の外側ゾーンとを隔てており、スピーカ設備のスピーカはこの遷移ゾーン内に位置している。さらに、第2計算規則は、第1計算規則および第3計算規則と異なる。この場合、移動する仮想音源がスピーカ設備の内側ゾーン、スピーカ遷移ゾーン、及びスピーカ設備の外側ゾーンの間を遷移することに起因するアーチファクト、並びに所定のリスナー位置の近傍を仮想音源が移動することに起因するアーチファクトを軽減することができ、オーディオ品質を有意に改善することができる。
【0146】
追加的又は代替的に、装置800は、仮想音源がスピーカ遷移ゾーンの外部に位置する場合には第1計算規則に基づいてスピーカ設備のスピーカの駆動係数を計算し、仮想音源がスピーカ遷移ゾーンの内部に位置する場合には第2計算規則に基づいてスピーカ設備のスピーカの駆動係数を計算する、多チャネルレンダラー820を備えることができる。スピーカ遷移ゾーンの境界は、スピーカ設備のスピーカに対して、スピーカとこのスピーカに隣接するスピーカとの間の距離に応じた最短距離を有する。さらに、スピーカ設備は、隣接するスピーカからなるスピーカペアであって、各ペアにおけるスピーカの間の距離が異なっている少なくとも2組のスピーカペアを含んでいる。
【0147】
さらに追加的又は代替的に、装置800は、複数の所定のリスナー位置に基づいてスピーカ設備のスピーカについて複数の駆動係数を計算し、かつスピーカの複数の駆動係数を結合してスピーカの結合済み駆動係数を得る、多チャネルレンダラー820を備えることができる。
【0148】
本発明のいくつかの実施の形態は、オーディオシーンのオブジェクト指向の再生のためのスケーラブルなサウンド再生方法の構成要素に関する。
【0149】
上述した構成要素を、オーディオシーンのオブジェクト指向の再生に適したオーディオ再生方法の構成要素として使用することができる。ここで、オーディオシーンとは、音源の特徴、即ち音源の位置および音源の他の特別な特徴(例えばマニュアル信号ひずみ、仮想音源の種類、再生レベル等)のオブジェクト指向の記述が割り当てられた、一連のオーディオ信号の組み合わせである(波面合成の実際の実現化における仮想音源の特徴と同じ原理)。
【0150】
ここで言及するサウンド再生の概念は、特に、複数のスピーカを持つシステムを、信号処理手段に対する適切な信号によって制御する方法に関連する。この制御方法は、スピーカの設定の記述とオーディオシーンのオブジェクト指向の記述とを処理するシステムによってもたらされる。この処理の結果は、最も単純な場合には信号ひずみ値と振幅重み付けファクタ(レベル変化)とのペアとして表現できるフィルタ係数(いわゆる駆動係数)の表である。信号処理システムにおいて、入来するオーディオ信号に対してこれらの係数を処理のマトリクスの中で適用し、出力システムの各々のスピーカを制御できるようにしても良い。
【0151】
ここで述べるサウンド再生方法のスケーラビリティは、この方法によって制御できるスピーカ設定の多様性に関連する。所定のリスナーの位置または領域が、制御されるスピーカによって囲まれるという条件で、スピーカを様々な間隔で配置することができる(即ち、制御されるスピーカの数は広範囲に変化できる)。囲むという条件により、2Dの場合におけるスピーカの理論上の最小配置としては少なくとも3つのスピーカからなるリングが考えられる一方で、2Dの場合の上限としては、数百のスピーカを備える典型的な波面合成再生システムが考えられる。3Dの場合には、上述の条件から見て、理論的に考えられる最小のシステムは、スピーカが角に配置された四面体タイプとなる。この3Dの場合にも、エンベロープ表面のスピーカの数を格段に増加させることができる。この意味で、スケーラビリティは、所定の境界の条件下でのスピーカ数の多様性に繋がる。
【0152】
以下に説明する手法は適切な駆動係数の計算に言及し、ここでは、遅延値および振幅重み付け値の形式を持つ係数の簡単化された事例を説明する。
【0153】
上述の概念のいくつかの態様は装置の文脈において説明したが、これらの態様は対応する方法の説明をも表すものであり、そこではブロックまたは装置が、方法の各ステップまたは方法の各ステップの特徴に相当することが明らかである。同様に、方法の各ステップの文脈において説明した態様は、対応する装置の対応するブロック、項目又は特徴の説明をも表すものである。
【0154】
所定の構成要件にも依るが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働可能な)、デジタル記憶媒体、例えばフレキシブルディスク,DVD,ブルーレイ,CD,ROM,PROM,EPROM,EEPROM,フラッシュメモリなどを使用して実行することができる。従って、そのデジタル記憶媒体はコンピュータ読み取り可能であっても良い。
【0155】
本発明に従う実施形態の幾つかは、上述した方法の1つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有するデータキャリアを含んでも良い。
【0156】
一般的に、本発明の実施例は、コンピュータプログラム製品として構成することができ、このプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法を実行するよう作動する。そのプログラムコードは例えば機械読み取り可能なキャリアに記憶されても良い。
【0157】
本発明の他の実施形態は、上述した方法の1つを実行するための、機械読み取り可能なキャリアに記憶されたコンピュータプログラムを含む。
【0158】
換言すれば、本発明の方法のある実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の1つを実行するためのプログラムコードを有する、コンピュータプログラムである。
【0159】
本発明の他の実施形態は、上述した方法の1つを実行するために記憶されたプログラムコードを含む、データキャリア(又はデジタル記憶媒体又はコンピュータ読み取り可能な媒体)である。
【0160】
本発明の他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号シーケンスである。そのデータストリーム又は信号シーケンスは、例えばインターネットを介するデータ通信接続を介して伝送されるように構成されても良い。
【0161】
他の実施形態は、上述した方法の1つを実行するように構成又は適用された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。
【0162】
他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムをインストールされたコンピュータを含む。
【0163】
幾つかの実施形態においては、(例えば書換え可能ゲートアレイのような)プログラム可能な論理デバイスが、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態では、書換え可能ゲートアレイは、上述した方法の1つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には任意のハードウエア装置によって実行される。
【0164】
上述した実施の形態は、本発明の原理を単に例示的に示したにすぎない。本明細書に記載した構成及び詳細について、修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではなく、添付した特許請求の範囲によってのみ限定されるべきである。