IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェラインの特許一覧

特表2023-518199離散曲面を含むサウンドシーンをレンダリングするための装置および方法
<>
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図1
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図2
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図3
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図4
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図5
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図6
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図7
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図8
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図9
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図10
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図11
  • 特表-離散曲面を含むサウンドシーンをレンダリングするための装置および方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-04-28
(54)【発明の名称】離散曲面を含むサウンドシーンをレンダリングするための装置および方法
(51)【国際特許分類】
   H04S 1/00 20060101AFI20230421BHJP
【FI】
H04S1/00 200
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022555050
(86)(22)【出願日】2021-03-12
(85)【翻訳文提出日】2022-11-09
(86)【国際出願番号】 EP2021056362
(87)【国際公開番号】W WO2021180937
(87)【国際公開日】2021-09-16
(31)【優先権主張番号】20163151.2
(32)【優先日】2020-03-13
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】500341779
【氏名又は名称】フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
(74)【代理人】
【識別番号】100134119
【弁理士】
【氏名又は名称】奥町 哲行
(72)【発明者】
【氏名】ボース・クリスチャン
(72)【発明者】
【氏名】ヴェファース・フランク
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA07
5D162BA07
5D162CA11
5D162CA22
(57)【要約】
音源位置に反射オブジェクトおよび音源を有するサウンドシーンをレンダリングするための装置は、サウンドシーンの反射オブジェクトの分析を提供して、第1の多角形(2)、および第1の多角形の第1の像源位置(62)と第2の多角形の第2の像源位置(63)とに関連付けられた第2の隣接する多角形(3)によって表される反射オブジェクトを決定するための幾何学的データプロバイダ(10)であって、第1および第2の像源位置が、第1の像源位置(62)に関連する第1の可視ゾーン(72)、不可視ゾーン(80)、および第2の像源位置(63)に関連する第2の可視ゾーン(73)を含むシーケンスをもたらす、幾何学的データプロバイダと、追加の像源位置(90)が第1の像源位置と第2の像源位置との間に配置されるように、追加の像源位置(90)を生成するための像源位置生成器(20)と、音源位置において音源をレンダリングするためのサウンドレンダラ(30)であって、さらに、聴取者位置(130)が第1の可視ゾーン内に位置する場合、第1の像源位置に音源をレンダリングするための、聴取者位置が不可視ゾーン(80)内に位置する場合、追加の像源位置(90)に音源をレンダリングするための、または聴取者位置が第2の可視ゾーン内に位置する場合、第2の像源位置に音源をレンダリングするための、サウンドレンダラと、を備える。

【特許請求の範囲】
【請求項1】
音源位置に反射オブジェクトおよび音源を有するサウンドシーンをレンダリングするための装置であって、
前記サウンドシーンの前記反射オブジェクトの分析を提供して、第1の多角形(2)、および前記第1の多角形の第1の像源位置(62)と前記第2の多角形の第2の像源位置(63)とに関連付けられた第2の隣接する多角形(3)によって表される反射オブジェクトを決定するための幾何学的データプロバイダ(10)であって、前記第1および第2の像源位置が、前記第1の像源位置(62)に関連する第1の可視ゾーン(72)、不可視ゾーン(80)、および前記第2の像源位置(63)に関連する第2の可視ゾーン(73)を含むシーケンスをもたらす、幾何学的データプロバイダと、
追加の像源位置(90)が前記第1の像源位置と前記第2の像源位置との間に配置されるように、前記追加の像源位置(90)を生成するための像源位置生成器(20)と、
前記音源位置において前記音源をレンダリングするためのサウンドレンダラ(30)であって、さらに、
聴取者位置(130)が前記第1の可視ゾーン内に位置する場合、前記第1の像源位置に前記音源をレンダリングするための、
前記聴取者位置が前記不可視ゾーン(80)内に位置する場合、前記追加の像源位置(90)に前記音源をレンダリングするための、または
前記聴取者位置が前記第2の可視ゾーン内に位置する場合、前記第2の像源位置に前記音源をレンダリングするための、サウンドレンダラと、を備える、装置。
【請求項2】
前記幾何学的データプロバイダ(10)が、初期化段階中に記憶された前記反射オブジェクトに関する予め記憶された情報を取得するように構成され、前記像源位置生成器(20)が、前記反射オブジェクトを示す前記予め記憶された情報に応答して前記追加の像源位置(90)を生成するように構成される、請求項1に記載の装置。
【請求項3】
前記幾何学的データプロバイダ(10)が、ランタイム中または初期化段階中に、コンピュータ付加設計(CAD)アプリケーションによって送出された前記サウンドシーン上の幾何学的データを使用して、前記反射オブジェクトを検出するように構成される、請求項1または2に記載の装置。
【請求項4】
前記幾何学的データプロバイダ(10)が、ランタイム中または初期化段階中に、前記反射オブジェクトとして、丸い幾何学的形状、湾曲した幾何学的形状、またはスプライン補間から導出された幾何学的形状を有するオブジェクトを検出するように構成される、請求項1から3のいずれか一項に記載の装置。
【請求項5】
前記幾何学的データプロバイダ(10)が、
反射オブジェクトの2つの隣接する多角形間の角度を計算し、前記角度が閾値を下回るとき、前記2つの隣接する多角形を特定の多角形の対としてマークすることと、
前記反射オブジェクトの2つのさらなる隣接する多角形間のさらなる角度を計算し、前記さらなる角度が前記閾値を下回る場合、前記2つのさらなる隣接する多角形をさらなる特定の多角形の対としてマークすることと、
前記さらなる隣接する多角形と前記隣接する多角形とが共通のエッジを有するか、または同じコーナーに属する場合に、前記反射オブジェクトを検出することと、を行うように構成される、請求項1または2のいずれか一項に記載の装置。
【請求項6】
前記像源位置生成器(20)が、前記聴取者位置(130)が前記不可視ゾーン(80)にあるかどうかを分析し、前記聴取者位置(130)が前記不可視ゾーン(80)に位置する場合にのみ前記追加の像源位置(90)を生成するように構成される、
請求項1から5のいずれか一項に記載の装置。
【請求項7】
前記像源位置生成器(20)が、前記第1の多角形に関連付けられた第1の幾何学的範囲もしくは前記第2の多角形に関連付けられた第2の幾何学的範囲、または前記第1の幾何学的範囲と前記第2の幾何学的範囲との間の第3の幾何学的範囲を決定するように構成され、
前記第1の幾何学的範囲が前記第1の可視ゾーンを決定し、または前記第2の幾何学的範囲が前記第2の可視ゾーンを決定し、または前記第3の幾何学的範囲が前記不可視ゾーン(80)を決定し、
第1の幾何学的ゾーンまたは第2の幾何学的ゾーン内の位置に対して、前記源位置から前記第1の多角形または前記第2の多角形への入射角が前記第1の多角形または前記第2の多角形からの反射角に等しいという条件が満たされるように、前記第1の幾何学的範囲または前記第2の幾何学的範囲が決定され、または
前記第3の幾何学的範囲が、前記不可視ゾーン(80)内の位置に対して前記入射角に等しい反射角の条件が満たされないように決定される、請求項6に記載の装置。
【請求項8】
前記像源位置生成器(20)が、前記第1の多角形についての第1の錐台を計算し(26)、前記聴取者位置が前記第1の錐台内に位置するかどうかを決定する(27)ように構成されるか、または
前記像源位置生成器(20)が、前記第2の多角形についての第2の錐台を計算し(26)、前記聴取者位置(130)が前記第2の錐台内に位置するかどうかを決定する(27)ように構成されるか、または
前記像源位置生成器(20)が、不可視ゾーン錐台を計算し(26)、前記聴取者が前記不可視ゾーン錐台内に位置するかどうかを決定する(27)ように構成される、
請求項6または7に記載の装置。
【請求項9】
前記像源位置生成器(20)が、前記第1の錐台、前記第2の錐台、または前記不可視ゾーン錐台の内側を指す法線ベクトルを有する4つの平面を画定するように構成され、
前記像源位置生成器(20)が、各平面に対する前記聴取者位置(130)の距離が0以上であるかどうかを決定し(27)、前記各平面に対する前記聴取者の距離が0以上である場合に、前記聴取者が前記第1の錐台、前記第2の錐台、または前記不可視ゾーン錐台のうちの錐台内に位置することを検出するように構成される、請求項8に記載の装置。
【請求項10】
前記像源位置生成器(20)が、前記追加の像源位置(90)を、前記第1の像源位置(62)と前記第2の像源位置(63)との間の位置として計算するように構成される、
請求項1から9のいずれか一項に記載の装置。
【請求項11】
前記像源位置生成器(20)が、前記第1の像源位置(62)と前記第2の像源位置(63)との間の接続線(91)上の前記追加の像源位置(90)を計算するように構成される、請求項10に記載の装置。
【請求項12】
前記像源位置生成器(20)が、前記追加の像源位置(90)を、反射点(92)を中心とする半径r1の円弧上の位置として計算するように構成され、r1が、前記源位置(100)と前記反射点(92)との間の距離を示す、請求項10に記載の装置。
【請求項13】
前記像源位置生成器(20)が、前記追加の像源位置(90)と前記第2の像源位置(63)との間の距離が前記聴取者位置(130)の前記第2の可視ゾーン(73)までの距離に比例するように、または前記追加の像源位置(90)と前記第1の像源位置(62)との間の距離が前記聴取者位置(130)の前記第1の可視ゾーン(72)までの距離に比例するように、前記追加の像源位置(90)を計算するように構成される、請求項10または11または12に記載の装置。
【請求項14】
前記像源位置生成器(20)が、前記第1の多角形(2)もしくは前記第2の多角形(3)、または前記第1の多角形(2)と前記第2の多角形(3)との間の前記隣接するエッジに対する、前記音源位置(100)についての前記ベクトルの正射影および前記聴取者位置(130)についての前記ベクトルの正射影を使用して反射点(92)を決定するか、または前記第1の多角形(2)と前記第2の多角形(3)とが互いに接続されている点を前記反射点(92)として決定するように構成され、
前記像源位置生成器(20)が、前記聴取者位置(130)と前記反射点(92)とを接続する線(93)と、前記第1の像源位置(62)と前記第2の像源位置(63)との間の前記接続線(91)との交点を、前記追加の像源位置(90)として決定するように構成される、
請求項11または12または13に記載の装置。
【請求項15】
前記像源位置生成器(20)が、前記第1の多角形によって画定される平面(2)において前記音源位置(100)をミラーリングすることによって前記第1の像源位置(62)を計算するように構成されるか、または
前記像源位置生成器(20)が、前記第2の多角形によって画定される平面(3)において前記音源位置(100)をミラーリングすることによって前記第2の像源位置(63)を計算するように構成される、
請求項1から14のいずれか一項に記載の装置。
【請求項16】
前記サウンドレンダラ(30)が、対応する像音源位置から前記聴取者位置までの距離と、前記距離によって生じる遅延時間、および前記第1の多角形もしくは前記第2の多角形に関連付けられた吸収係数もしくは反射係数、または前記第1の多角形もしくは前記第2の多角形に関連付けられた周波数選択的吸収もしくは反射特性のうちの少なくとも1つによって画定されるレンダリングフィルタ(31、32、33)を使用して音源信号がフィルタリングされるように、前記音源をレンダリングするように構成される、
請求項1から15のいずれか一項に記載の装置。
【請求項17】
前記サウンドレンダラ(30)が、直接サウンドフィルタ段(31)を使用して、前記音源信号および前記音源位置(100)ならびに前記聴取者位置を使用して前記音源をレンダリングし、一次反射フィルタ段における一次反射として、前記音源信号および対応する追加の音源位置ならびに前記聴取者位置(130)を使用して前記音源をレンダリングするように構成され、前記対応する像音源位置が、前記第1の像音源位置、または前記第2の像音源位置もしくは前記追加の像音源位置(90)を含む、
請求項1から16のいずれか一項に記載の装置。
【請求項18】
音源位置に反射オブジェクトおよび音源を有するサウンドシーンをレンダリングする方法であって、
前記サウンドシーンの前記反射オブジェクトの分析を提供して、第1の多角形(2)、および前記第1の多角形の第1の像源位置(62)と前記第2の多角形の第2の像源位置(63)とに関連付けられた第2の隣接する多角形(3)によって表される反射オブジェクトを決定することであって、前記第1および第2の像源位置が、前記第1の像源位置(62)に関連する第1の可視ゾーン(72)、不可視ゾーン(80)、および前記第2の像源位置(63)に関連する第2の可視ゾーン(73)を含むシーケンスをもたらす、ことと、
追加の像源位置(90)が前記第1の像源位置と前記第2の像源位置との間に配置されるように、前記追加の像源位置(90)を生成することと、
前記音源位置において前記音源をレンダリングすることであって、さらに、
聴取者位置(130)が前記第1の可視ゾーン内に位置する場合、前記第1の像源位置に前記音源をレンダリングし、
前記聴取者位置が前記不可視ゾーン(80)内に位置する場合、前記追加の像源位置(90)に前記音源をレンダリングし、または
前記聴取者位置が前記第2の可視ゾーン内に位置する場合、前記第2の像源位置に前記音源をレンダリングすることと、を含む、方法。
【請求項19】
コンピュータまたはプロセッサ上で実行されると、請求項18に記載の方法を実行するためのコンピュータプログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ処理に関し、特に、幾何音響学の分野における像源によってモデル化された反射を含むサウンドシーンをレンダリングするためのオーディオ信号処理に関する。
【背景技術】
【0002】
幾何音響学は、聴覚化、すなわち聴覚シーンおよび環境のリアルタイムおよびオフラインオーディオレンダリングに適用される[1、2]。これは、MPEG-I 6-DoFオーディオレンダラのような仮想現実(VR)および拡張現実(AR)システムを含む。6自由度(DoF)を有する複雑なオーディオシーンをレンダリングするために、幾何音響学の分野が適用され、サウンドデータの伝播は、レイトレーシングなどの光学系から知られているモデルによってモデル化される。特に、壁における反射は、光学系から導出されたモデルに基づいてモデル化され、壁において反射される光線の入射角は、入射角に等しい反射角をもたらす。
【0003】
仮想現実(VR)または拡張現実(AR)システムのオーディオレンダラのようなリアルタイム聴覚化システムは、通常、反射環境の幾何学的データに基づいて早期の鏡面反射をレンダリングする[1、2]。次に、反射したサウンドの有効な伝播経路を見つけるために、レイトレーシング[3]または像源法[4]のような幾何音響学法が使用される。これらの方法は、反射平面が入射サウンドの波長に比べて大きい場合に有効である[1]。さらにまた、反射面の境界に対する表面上の反射点の距離もまた、入射サウンドの波長と比較して大きくなければならない。
【0004】
幾何学的データが曲面を三角形または長方形によって近似している場合、従来の幾何音響学法はもはや有効ではなく、アーチファクトが聞こえるようになる。得られた「ディスコボール効果」を図6に示す。移動する聴取者または移動する音源の場合、像源の可視性は、可視と不可視との間で交互になり、その結果、定位、音色、および音量の恒久的な切り替えをもたらす。
【0005】
古典的な像源モデルが使用される場合、通常、所与の問題に適用される軽減技術はない[5]。鏡面反射に加えて拡散反射がモデル化される場合、これは、効果をさらに減少させるが、これを解決することはできない。要約すると、この問題に対する解決策は、最先端技術には記載されていない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の目的は、幾何音響学におけるディスコボール効果を緩和するための概念を提供すること、または改善されたオーディオ品質を提供するサウンドシーンをレンダリングする概念を提供することである。
【課題を解決するための手段】
【0007】
この目的は、請求項1に記載のサウンドシーンをレンダリングするための装置、請求項18に記載のサウンドシーンをレンダリングする方法、または請求項19に記載のコンピュータプログラムによって達成される。
【0008】
本発明は、反射する幾何学的オブジェクトが可視ゾーンおよび不可視ゾーンをもたらすかどうかを決定するために、幾何音響学におけるいわゆるディスコボール効果に関連する問題が、幾何学的オブジェクトをサウンドシーンに反射させる分析を実行することによって対処されることができるという知見に基づいている。不可視ゾーンの場合、像源位置生成器は、追加の像源位置が、隣接する可視ゾーンに関連する2つの像源位置の間に配置されるように、追加の像源位置を生成する。さらにまた、サウンドレンダラは、直接経路のオーディオ印象を取得するために音源位置において音源をレンダリングし、さらに、聴取者位置が可視ゾーン内に位置するか不可視ゾーン内に位置するかに応じて、音源位置または追加の音源位置において音源をレンダリングするように構成される。この手順により、幾何音響学におけるディスコボール効果が緩和される。この手順は、聴覚シーンおよび環境をレンダリングするリアルタイムおよびオフラインオーディオなどの聴覚化に適用されることができる。
【0009】
好ましい実施形態では、本発明は、いくつかのコンポーネントを提供し、1つのコンポーネントは、「丸いエッジ」または「丸いコーナー」などの曲面を検出する幾何学的データプロバイダまたは幾何学的プリプロセッサを備える。さらにまた、好ましい実施形態は、識別された曲面、すなわち「丸いエッジ」または「丸いコーナー」に対して拡張像源モデルを適用する像源位置生成器に関する。
【0010】
特に、エッジは面の境界線であり、コーナーは2つ以上の収束線が交わる点である。丸いエッジは、三角形または多角形によって丸い連続面に近似する2つの平坦面の間の境界線である。丸いコーナーまたは丸みを帯びたコーナーは、三角形または多角形によって丸い連続面に近似するいくつかの平坦面の共通の頂点である点である。特に、例えば仮想現実シーンが広告ピラーまたは広告柱を含む場合、この広告ピラーまたは広告柱は、三角形または他の多角形の平面などの多角形の平面によって近似されることができ、多角形の平面は無限に小さくないため、可視ゾーン間に不可視ゾーンが発生する可能性がある。
【0011】
通常、意図的なエッジまたはコーナー、すなわち、音響的にそのまま表現されるべきオーディオシーン内のオブジェクトが存在し、音響処理に起因して生じる任意の効果が意図される。しかしながら、丸みを帯びたまたは丸いコーナーまたはエッジは、オーディオシーン内の幾何学的オブジェクトであり、その結果、ディスコボールのアーチファクトをもたらし、換言すれば、聴取者が固定音源に対して可視ゾーンから不可視ゾーンに移動するとき、または固定聴取者が移動音源を聴取するとき、オーディオ品質を低下させる不可視ゾーンをもたらし、その結果、ユーザは、不可視ゾーン、次いで可視ゾーン、次いで不可視ゾーンに入る。あるいは、聴取者と源の双方が移動する場合、聴取者は、ある時点では可視ゾーン内にあり、別の時点では、適用された幾何音響学モデルのみに起因する不可視ゾーン内にあるが、サウンドシーンをレンダリングするための装置または対応する方法によって可能な限り近似されるべき現実世界の音響シーンとは無関係であることが可能である。
【0012】
本発明は、球および円柱または他の曲面上に高品質のオーディオ反射を生成するため有利である。拡張像源モデルは、円柱、球、または他の曲面を近似する多角形などのプリミティブに特に有用である。とりわけ、本発明は、特に反射をモデル化するための像源ツールに依存する、一次反射を計算するための迅速に収束する反復アルゴリズムをもたらす。好ましくは、典型的には反射体の直径に依存するハイパスフィルタである周波数選択反射特性を考慮する物質等化器に加えて、特定の周波数選択性等化器が適用される。さらにまた、好ましい実施形態では、距離減衰、伝播時間、および周波数選択性壁吸収または壁反射が考慮される。好ましくは、追加の像源位置生成の本発明の適用は、暗いゾーンまたは不可視ゾーンを「照らす」。丸みを帯びたエッジおよびコーナーについての追加の反射モデルは、多角形平面に関連する古典的な像源に加えて、この追加の像源の生成に依存する。好ましくは、「暗い」または不可視ゾーンへの像源の連続的な外挿は、好ましくは一次反射を計算する目的で錐台追跡の技術を使用して実行される。他の実施形態では、この技術はまた、二次以上の反射処理に拡張されることもできる。しかしながら、一次反射の計算を適用するために本発明を実行することは、既に高いオーディオ品質をもたらし、より高次の反射計算を実行することは可能であるが、追加的に得られたオーディオ品質を考慮して追加の処理要件を必ずしも正当化しないことが見出された。本発明は、本発明の適用なしでは不可視ゾーンに悩まされるであろう問題のあるまたは特定の反射オブジェクトを有する複雑なサウンドシーンにおける反射をモデル化するための堅牢で実装が比較的容易であるが強力なツールを提供する。
本発明の好ましい実施形態は、添付の図面に関して以下に説明される。
【図面の簡単な説明】
【0013】
図1】サウンドシーンをレンダリングするための装置の実施形態のブロック図を示している。
図2】実施形態における像源位置生成器の実装のためのフローチャートを示している。
図3】像源位置生成器のさらなる実装を示している。
図4】像源位置生成器の別の好ましい実装を示している。
図5】幾何音響学における像源の構成を示している。
図6】可視ゾーンおよび不可視ゾーンをもたらす特定のオブジェクトを示している。
図7】不可視ゾーンを「照らす」ために追加の像源が追加の像源位置に配置された特定の反射オブジェクトを示している。
図8】幾何学的データプロバイダによって適用される手順を示している。
図9】音源位置において音源をレンダリングし、さらに聴取者の位置に応じて音源位置または追加の音源位置において音源をレンダリングするためのサウンドレンダラの実装を示している。
図10】エッジ上の反射点Rの構成を示している。
図11】丸みを帯びたコーナーに関連する静穏ゾーンを示している。
図12】例えば図10の丸みを帯びたエッジに関連する静穏ゾーンまたは静穏錐台を示している。
【発明を実施するための形態】
【0014】
図1は、音源位置に反射オブジェクトおよび音源を有するサウンドシーンをレンダリングするための装置を示している。特に、音源は、例えばモノラルまたはステレオ信号とすることができる音源信号によって表され、サウンドシーンでは、音源信号は音源位置において放射される。さらにまた、サウンドシーンは、通常、聴取者位置に関する情報を有し、聴取者位置は、一方では、例えば3次元空間内の聴取者位置を含むか、または聴取者位置は、他方では、3次元空間内の聴取者の頭部の特定の向きを生じる。聴取者は、自分の耳に対して、3次元をもたらす3次元空間内の特定の位置に配置されることができ、聴取者はまた、頭を3つの異なる軸の周りで回転させることができ、その結果、追加の3次元をもたらし、6自由度の仮想現実または拡張現実の状況が処理されることができる。サウンドシーンをレンダリングするための装置は、好ましい実施形態において、幾何学的データプロバイダ10と、像源位置生成器20と、サウンドレンダラ30とを備える。幾何学的データプロバイダは、実際のランタイムの前に特定の動作を実行するためのプリプロセッサとして実装されることができ、または幾何学的データプロバイダは、ランタイムにおいてもその動作を実行する幾何学的プロセッサとして実装されることができる。しかしながら、幾何学的データプロバイダの計算を予め、すなわち、実際の仮想現実または拡張現実レンダリングの前に実行することは、処理プラットフォームが対応する幾何学的プリプロセッサタスクから解放される。
【0015】
像源位置生成器は、源位置および聴取者位置に依存し、特に聴取者位置がランタイムで変化するという事実により、像源位置生成器はランタイムで動作する。同じことが、音源データ、聴取者位置を使用し、必要に応じて像源位置および追加の像源位置をさらに使用して、すなわち、ユーザが本発明にしたがって像源位置生成器によって決定された追加の像源によって「照らされ」なければならない不可視ゾーンに配置されている場合に、ランタイムにおいてさらに動作するサウンドレンダラ30にも当てはまる。
【0016】
好ましくは、幾何学的データプロバイダ10は、サウンドシーンの反射オブジェクトの分析を提供して、第1の多角形および第2の隣接する多角形によって表される特定の反射オブジェクトを決定するように構成される。第1の多角形は、第1の像源位置に関連付けられており、第2の多角形は、第2の像源位置に関連付けられており、これらの像源位置は、例えば、図5に示すように構成される。これらの像源は、特定の壁においてミラーリングされる「古典的な像源」である。しかしながら、第1および第2の像源位置は、例えば、図6または図7に示すように、第1の像源位置に関連する第1の可視ゾーン、第2の像源位置に関連する第2の可視ゾーン、および第1の可視ゾーンと第2の可視ゾーンとの間に配置された不可視ゾーンを含むシーケンスをもたらす。像源位置生成器は、追加の像源位置に位置する追加の像源が第1の像源位置と第2の像源位置との間に配置されるように、追加の像源位置を生成するように構成される。好ましくは、像源位置生成器は、古典的な方法で、すなわち、例えば特定のミラーリング壁においてミラーリングすることによって、第1の像源および第2の像源をさらに生成するか、または図6または図7の場合のように、反射壁が小さく、源の矩形投影が壁と交差する壁点を含まない場合、対応する壁は、像源構成の目的のためにのみ拡張される。
【0017】
サウンドレンダラ30は、聴取者位置において直接サウンドを取得するために、音源位置において音源をレンダリングするように構成される。さらに、反射もレンダリングするために、聴取者位置が第1の可視ゾーン内に位置するとき、音源は、第1の像源位置にレンダリングされる。この状況では、聴取者位置は、ディスコボール効果によるいかなるアーチファクトも全く発生しないようなものであるため、像源位置生成器は、追加の像源位置を生成する必要はない。同じことが、聴取者位置が第2の像源に関連付けられた第2の可視ゾーン内に位置する場合にも当てはまる。しかしながら、聴取者が不可視ゾーン内に位置する場合、サウンドレンダラは、追加の像源位置を使用し、第1の像源位置および第2の像源位置を使用しない。第1および第2の隣接する多角形における反射をモデル化する「古典的な」像源の代わりに、サウンドレンダラは、反射レンダリングの目的のために、不可視ゾーンをサウンドによって満たすかまたは照らすために本発明にしたがって生成された追加の像源位置のみをレンダリングする。そうでなければ定位、音色および音量の永続的な切り替えをもたらすであろう任意のアーチファクトは、第1の像源位置と第2の像源位置との間の追加の像源を生成する像源位置生成器を使用する本発明の処理によって回避される。
【0018】
図6は、いわゆるディスコボール効果を示している。特に、反射面は黒色で描かれており、1、2、3、4、5、6、7、8によって示されている。各反射面または多角形1、2、3、4、5、6、7、8はまた、対応する面に対する法線方向の図6に示す法線ベクトルによって表される。さらにまた、各反射面は、可視ゾーンに関連付けられている。源位置100における源Sおよび反射面または多角形1に関連する可視ゾーンは、71で示されている。さらにまた、他の多角形または表面2、3、4、5、6、7、8の対応する可視ゾーンは、例えば、参照符号72、73、74、75、76、77、78によって図6に示されている。可視ゾーンは、特定の多角形に関連付けられた可視ゾーン内でのみ、入射角が音源Sによって放射されたサウンドの反射角に等しいという条件が満たされるように生成される。例えば、多角形1は、多角形1の延長部が非常に小さく、反射角に等しい入射角が小さい可視ゾーン71内の反射角に対してのみ満たされることができるため、非常に小さい可視ゾーン71を有する。
【0019】
さらにまた、図6はまた、聴取者位置130に位置している聴取者Lを有する。聴取者Lが多角形番号4に関連付けられた可視ゾーン74内に配置されているという事実により、聴取者Lについてのサウンドは、S/4に示される像源64を使用してレンダリングされる。図6の64において示されるこの像源S/4は、反射面または多角形4における反射をモデル化する役割を担い、聴取者Lは、特定の壁の像源に関連付けられた可視ゾーン74内に位置するため、アーチファクトは発生しない。しかしながら、可視ゾーン73と74との間の静穏ゾーン内、または可視ゾーン74と75との間の不可視ゾーン内への聴取者の移動によって、すなわち、聴取者が上または下に移動すると、古典的なレンダラは、像源S/4を使用したレンダリングを停止し、聴取者は、像源S/3 63またはS/565に関連付けられた可視ゾーン73または可視ゾーン75に位置しないため、レンダラは、本発明なしでは反射をレンダリングしない。
【0020】
図6では、ディスコボール効果が示されており、反射面は黒色で描かれており、グレー領域は、n番目の像源「Sn」が見える領域をマークし、Sは源位置における源をマークし、Lは聴取者位置130の聴取者をマークする。特定の反射オブジェクトである図6の反射オブジェクトは、例えば、上から見た広告ピラーまたは広告柱とすることができ、音源は、例えば、広告色に対して固定された特定の位置に位置する自動車とすることができ、聴取者は、例えば、広告ピラーの上にあるものを見るために広告ピラーの周りを歩いている人間であろう。聴取する人間は、典型的には、自動車から、すなわち位置100から人間の位置130までの直接サウンドを聞くことになり、さらに、広告ピラーにおける反射を聞くことになる。
【0021】
図5は、像源の構成を示している。特に、図6に関して、図5の状況は、像源S/4の構成を示している。しかしながら、図6の壁または多角形4は、源位置100と像源位置64との間の直接接続まで到達しない。源100に基づいて像源120を生成するための鏡面であるとして図5に示されている壁140は、源100と像源120との間の直接接続において図6には存在しない。しかしながら、像源を構成する目的で、図6の多角形4などの特定の壁は、壁に源をミラーリングするための鏡面を有するように拡張される。さらにまた、古典的な像源処理では、無限壁に加えて、源が平面波を放射すると仮定される。しかしながら、この仮定は本発明にとって重要ではなく、壁をミラーリングする目的で、実際には基礎となる数学的モデルを説明するためにのみ無限壁が必要であるため、壁の無限大についても同じことが当てはまる。
【0022】
さらにまた、図5は、壁への入射角と壁からの反射角とが同じ条件を示している。さらにまた、源から受信機への伝播経路の経路長が維持される。源から受信機までの経路長は、像源から受信機までの経路長、すなわちr+rと全く同じであり、伝播時間は、総経路長と音速cとの商に等しい。さらにまた、1/rに比例する音圧pの距離減衰、または1/rに比例するサウンドエネルギーの距離減衰は、通常、像源をレンダリングするレンダラによってモデル化される。
【0023】
さらにまた、壁吸収/反射挙動は、壁吸収または反射係数αによってモデル化される。好ましくは、係数αは周波数に依存し、すなわち周波数選択吸収または反射曲線H(k)を表し、典型的にはハイパス特性を有し、すなわち高周波数は低周波数よりも良好に反射される。この挙動は、好ましい実施形態において考慮される。像源アプリケーションの強度は、像源の構成および伝播時間、距離減衰および壁吸収に関する像源の記述の後、壁140がサウンドシーンから完全に除去され、像源120によってのみモデル化されることである。
【0024】
図7は、第1の像源位置S/2 62と関連付けられた第1の多角形2と、第2の像源位置63またはS/3と関連付けられた第2の多角形3とが、間に短い角度で配置され、聴取者130が、第1の像源62と関連付けられた第1の可視ゾーン72と、第2の像源S/3 63と関連付けられた第2の可視ゾーン73との間の不可視ゾーンに配置される問題のある状況を示している。図7に示す不可視ゾーン80を「照らす」ために、第1の像源位置62と第2の像源位置63との間に位置する追加の像源位置90が生成される。古典的な手順のために図5に示すように構成された像源63または像源62によって反射をモデル化する代わりに、ここでは、好ましくは少なくとも特定の許容範囲内で反射点まで同じ距離を有する追加の像源位置90を使用して反射がモデル化される。
【0025】
追加の像源位置90では、不可視ゾーン80において一次反射をレンダリングする目的で、同じ経路長、伝播時間、距離減衰および壁吸収が使用される。好ましい実施形態では、反射点92が決定される。反射点92は、上方から見たときに第1の多角形と第2の多角形との間の接合部にあり、典型的には、例えば聴取者130の高さおよび源100の高さによって決定される広告ピラーの例では、垂直位置にある。好ましくは、追加の像源位置90は、聴取者130と反射点92とを接続する線上に配置され、この線は93で示される。さらにまた、好ましい実施形態における追加の音源90の正確な位置は、不可視ゾーン80に隣接する可視ゾーンを有する像源位置62および63を接続する線93と接続線91との交点にある。
【0026】
しかしながら、図7の実施形態は、追加の像源位置の経路が正確に計算される最も好ましい実施形態のみを示している。さらにまた、聴取者位置130に応じて、接続線92上の追加の音源位置の特定の位置も正確に計算される。聴取者Lが可視ゾーン73に近い場合、音源90は、古典像源位置63に近く、その逆も同様である。しかしながら、追加の音源位置を像音源62と63との間の任意の場所に配置することは、単に不可視ゾーンに悩まされている場合と比較して、可聴印象全体を既に非常に改善する。図7は、追加の音源位置の正確な位置を有する好ましい実施形態を示しているが、別の手順は、反射が不可視ゾーン80内でレンダリングされるように、隣接する音源位置62と63との間の任意の場所に追加の音源を配置することである。
【0027】
さらにまた、正確な経路長に応じて伝播時間を正確に計算することが好ましいが、他の実施形態は、像源位置63の修正された経路長、または他の隣接する像源位置62の修正された経路長に応じた経路長の推定に依存する。さらにまた、壁吸収または壁反射モデリングに関して、追加の音源位置90をレンダリングする目的で、隣接する多角形の一方の壁吸収が使用されることができ、またはそれらが互いに異なる場合の双方の吸収係数の平均値が使用されることができ、聴取者がどの可視ゾーンに近いかに応じて加重平均が適用されることさえできるため、ユーザがより近くに位置する可視ゾーンを有する壁の特定の壁吸収データは、聴取者位置からより遠く離れている可視ゾーンを有する他の隣接する壁の吸収/反射データと比較して、加重加算においてより高い重み値を受け取る。
【0028】
図2は、図1の像源位置生成器20の手順の好ましい実装を示している。ステップ21において、聴取者が図7の72および73などの可視ゾーンにいるか、または不可視ゾーン80にいるかが決定される。ユーザが可視ゾーンにいると決定された場合、ユーザがゾーン72にいるときのS/2 62、またはユーザが可視ゾーン73にいるときの像源位置63またはS/3などの像源位置が決定される。次に、ステップ23に示すように、像源位置に関する情報が図1のレンダラ30に送信される。
【0029】
あるいは、ステップ21が、ユーザが不可視ゾーン80内に配置されていると決定すると、図7の追加の像源位置90が決定され、ステップ24に示すようにそれが決定されるとすぐに、追加の像源位置に関するこの情報、および該当する場合には、ステップ25に示すようにレンダラにも送信される、経路長、伝播時間、距離減衰、または壁吸収/反射情報などの他の属性が決定される。
【0030】
図3は、ステップ21の好ましい実装、すなわち、特定の実施形態において、聴取者が可視ゾーンにあるか不可視ゾーンにあるかを決定する方法を示している。この目的のために、2つの基本的な手順が想定される。1つの基本手順では、2つの隣接する可視ゾーン72および73は、源位置100および対応する多角形に基づいて錐台として計算され、次いで、聴取者がそれらの可視錐台のうちの1つにいるかどうかが決定される。ステップ26に示されるように、聴取者が錐台のうちの一方の中に位置していないと決定されると、ユーザは、不可視ゾーンにいるという結論が下される。あるいは、図7の可視ゾーン72および73を記述する2つの錐台を計算する代わりに、別の手順は、不可視ゾーン80を記述する不可視錐台を実際に決定することであり、不可視錐台が決定された場合には、聴取者が静穏錐台内に配置されたときに、聴取者が不可視ゾーン80内にいると決定される。図3のステップ27およびステップ26の結果のように、聴取者が不可視ゾーンにいると決定された場合、図2のステップ24または図3のステップ24に示すように、追加の音源位置が計算される。
【0031】
図4は、好ましい実施形態における追加の像源位置90を計算するための像源位置生成器の好ましい実装を示している。ステップ41において、第1および第2の多角形の像源位置、すなわち図7の像源位置62および63が古典的または標準的な手順で計算される。さらにまた、ステップ42に示すように、幾何学的データプロバイダ10によって「丸みを帯びた」エッジまたはコーナーであると決定されたエッジまたはコーナー上の反射点が決定される。図7の反射点92の決定は、例えば、2つの多角形2と多角形3との交線上であり、垂直方向の寸法においても正確にレンダリングする場合、ステップ42において、反射点の垂直方向の寸法は、聴取者の高さおよび音源の高さ、ならびに反射点または線92からの聴取者の距離および音源の距離などの他の属性に応じて決定される。さらにまた、ブロック43に示されるように、サウンド線は、聴取者位置130と反射点92とを接続し、ブロック41において決定された像源位置が位置する領域にこの線をさらに外挿することによって決定される。このサウンド線は、図7において参照符号93によって示されている。ステップ44において、ブロック41によって決定された標準像源間の接続線が計算され、次いで、ブロック45に示すように、サウンド線93と接続線91との交点が追加の音源位置であると決定される。図4に示すステップの順序は必須ではないことに留意されたい。ステップ41の結果はステップ44の前にのみ必要とされるため、ステップ42および43は、ステップ41などを計算する前に既に計算されることができる。唯一の要件は、例えば、サウンド線が確立されることができるように、例えば、ステップ43の前にステップ42が実行されなければならないことである。
【0032】
続いて、追加の像源位置を計算するさらなる手順を示すために、さらなる手順が与えられる。拡張像源モデルは、反射体の「暗いゾーン」、すなわち像源が見える「明るいゾーン」間の領域における像源位置を外挿する必要がある(図1を参照)。この方法の第1の実施形態では、各丸いエッジに対して錐台が作成され、聴取者がこの錐台内に位置するかどうかがチェックされる。錐台は、以下のように作成される:エッジの2つの隣接する平面、すなわち左平面および右平面について、左平面および右平面上の源をミラーリングすることによって像源SおよびSを計算する。これらの点から、エッジの開始点および終了点とともに、法線ベクトル
が錐台の内側を向いているヘッセ標準形における4つの平面
を定義することができる。
. (1)
距離が以下である場合
(2)
【0033】
4つ全ての平面について0以上である場合、聴取者は、所与の丸いエッジのモデルのカバレッジエリアを定義する錐台内に位置する。不可視ゾーン錐台は、図12に示されており、源位置100と、それぞれの多角形1および2に属する像源61および62とをさらに示している。錐台は、多角形1と2との間のエッジで始まり、源位置に向かって図面平面から図面平面内に開いている。
【0034】
この場合、丸いエッジ上の反射点を以下のように決定することができる:
源位置
のエッジへの正射影を
とし、聴取者位置
のエッジへの正射影を
とする。これは、以下のように反射点
を生み出す:
(3)
(4)
(5)
反射点の構成は、聴取者位置L、源位置S、投影PsおよびPl、ならびに結果として生じる反射点を示す図10に示されている。
【0035】
丸いコーナーのカバレッジエリアの計算は、非常に類似している。ここで、k個の隣接する平面は、コーナーの位置とともにk個の平面によって境界付けられた錐台をもたらすk個の像源をもたらす。ここでも、これらの平面に対する聴取者の距離が全て0以上である場合、聴取者は、丸いコーナーのカバレッジエリア内に位置する。反射点
は、コーナー点自体によって与えられる。
【0036】
この状況、すなわち不可視錐台または丸いコーナーは、4つの多角形または平面1、2、3、4に属する4つの像源61、62、63、64を示す図11に示されている。図11では、源は、可視ゾーン内に位置し、不可視ゾーン内には位置せず、その先端はコーナーで始まり、4つの多角形から離れて開いている。
【0037】
より高次の反射の場合、この方法を、表面、丸いエッジ、または丸いコーナーに当たるたびに各錐台を副錐台に分割する錐台追跡法にしたがって拡張することができる。
【0038】
図8は、幾何学的データプロバイダのさらに好ましい実装を示している。好ましくは、幾何学的データプロバイダは、オブジェクトが一連の可視ゾーンとその間の不可視ゾーンとを有する特定の反射オブジェクトであることを示すために、ランタイム中にオブジェクト上に予め記憶されたデータを生成する真のデータプロバイダとして動作する。幾何学的データプロバイダは、聴取者または源位置に依存しないため、初期化中に1回実行される幾何学的プリプロセッサを使用して実装されることができる。これに対して、像源位置生成器によって適用される拡張像源モデルは、ランタイムで実行され、聴取者および源位置に応じてエッジ反射およびコーナー反射を決定する。
【0039】
幾何学的データプロバイダは、曲面検出を適用することができる。幾何学的プロセッサとも呼ばれる幾何学的データプロバイダは、初期化手順またはランタイムにおいて、特定の反射オブジェクト決定を予め計算する。例えば、CADソフトウェアが使用されて幾何学的データをエクスポートする場合、できるだけ多くの曲率に関する情報が幾何学的データプロバイダによって使用されることが好ましい。例えば、表面が球または円柱のような丸い幾何学的プリミティブから、またはスプライン補間から構成される場合、幾何学的プリプロセッサ/幾何学的データプロバイダは、好ましくはCADソフトウェアのエクスポートルーチン内に実装され、CADソフトウェアからの情報を検出して使用する。
【0040】
表面曲率に関する事前知識が利用できない場合、幾何学的プリプロセッサまたはデータプロバイダは、三角形または多角形メッシュのみを使用して丸いエッジおよび丸いコーナーの検出器を実装する必要がある。例えば、これは、図8に示すように、隣接する2つの三角形1、2または1a、2aの間の角度Φを計算することによって行うことができる。特に、角度は、図8において「面角」と決定され、図8の左部は正の面角を示し、図8の右部は負の面角を示す。さらにまた、図8において、小矢印は面法線を示している。面角が特定の閾値を下回る場合、エッジを形成する双方の隣接する多角形の隣接するエッジは、曲面部分を表すと見なされ、そのようにマークされる。コーナーに接続している全てのエッジが丸いものとしてマークされている場合、コーナーも丸いものとしてマークされ、このコーナーがサウンドレンダリングに関連するようになるとすぐに、追加の像源位置を生成するための像源位置生成器の機能がアクティブ化される。しかしながら、ある反射オブジェクトが特定の反射オブジェクトではなく真っ直ぐなオブジェクトであると決定され、いかなるアーチファクトもサウンドシーン生成器によって予想されず、または意図されていない場合、像源位置生成器は、古典像源位置を決定するためにのみ使用されるが、本発明にかかる追加の像源位置の決定は、そのような反射オブジェクトに対しては非アクティブ化される。
【0041】
図9は、図1のサウンドレンダラ30の好ましい実施形態を示している。サウンドレンダラ30は、好ましくは、直接サウンドフィルタ段31と、一次反射フィルタ段32と、任意に、二次反射フィルタ段と、おそらくは1つ以上の高次反射フィルタ段とを備える。
【0042】
さらにまた、サウンドレンダラ30によって必要とされる出力形式に応じて、すなわち、サウンドレンダラがヘッドフォンを介して出力するか、スピーカを介して出力するか、または単に記憶または特定の形式における送信のためのものであるかに応じて、左加算器34、右加算器35および中央加算器36などの特定の数の出力加算器、およびおそらくは左サラウンド出力チャネル用または右サラウンド出力チャネル用の他の加算器などが設けられる。左および右加算器34および35は、仮想現実アプリケーションのヘッドフォン再生の目的で使用されることが好ましいが、例えば、特定の出力形式におけるスピーカ出力を目的とする他の任意の加算器も使用されることができる。例えば、ヘッドフォンを介した出力が必要な場合、直接サウンドフィルタ段31は、音源位置100および聴取者位置130に応じて頭部関連伝達関数を適用する。一次反射フィルタ段の目的のために、対応する頭部関連伝達関数が適用されるが、ここでは、一方では聴取者位置130に対して、他方では追加の音源位置90に対して適用される。さらにまた、任意の特定の伝播遅延、経路減衰、または反射効果もまた、一次反射フィルタ段32内の頭部関連伝達関数内に含まれる。より高次の反射フィルタ段の目的のために、他の追加の音源も同様に適用される。
【0043】
出力がスピーカ設定用である場合、直接サウンドフィルタ段は、例えば、ベクトルベースの振幅パンニングを実行するフィルタなど、頭部関連伝達関数とは異なる他のフィルタを適用する。いずれの場合も、直接サウンドフィルタ段31、一次反射フィルタ段32および二次反射フィルタ段33のそれぞれは、図示のように加算段34、35、36のそれぞれについて成分を計算した後、左加算器34が左ヘッドフォンスピーカ用の出力信号を計算し、右加算器35が右ヘッドフォンスピーカ用のヘッドフォン信号を計算するなどである。ヘッドフォンとは異なる出力形式の場合、左加算器34が左スピーカ用の出力信号を送出し、右加算器35が右スピーカ用の出力を送出してもよい。2スピーカ環境に2つのスピーカしか存在しない場合、中央加算器32は不要である。
【0044】
本発明の方法は、離散三角形メッシュによって近似される曲面が古典的な像音源技術[3、4]を使用して聴覚化されるときに生じるディスコボール効果を回避する。新規技術は、不可視ゾーンを回避し、反射を常に可聴にする。この手順では、曲面の近似を閾値面角度によって識別する必要がある。新規技術は、曲率の表現として識別された特別な処理面を有する元のモデルの拡張である。
【0045】
古典的な像音源技術[3、4]は、所与の幾何学的形状が曲面に(部分的に)近似することができることを考慮していない。これは、暗いゾーン(静寂)を、隣接する面のエッジ点からキャスティングさせる(図1を参照)。このような面に沿って移動する聴取者は、自身が位置する場所(照らされるゾーン/不可視ゾーン)に応じてオン/オフが切り替えられる反射を観察する。これは、不快な可聴アーチファクトを引き起こし、また、リアリズム、したがって没入度を低下させる。本質的に、古典的な像源技術は、そのようなシーンを現実的にレンダリングすることができない。
【0046】
参考文献
[1] Vorlaender, M. “Auralization: fundamentals of acoustics, modelling, simulation, algorithms and acoustic virtual reality.” Springer Science & Business Media, 2007.
【0047】
[2] Savioja, L., and Svensson, U. P. “Overview of geometrical room acoustic modeling techniques.” The Journal of the Acoustical Society of America 138.2 (2015): 708-730.
【0048】
[3] Krokstad, A., Strom, S., and Sφrsdal, S. "Calculating the acoustical room response by the use of a ray tracing technique." Journal of Sound and Vibration 8.1 (1968): 118-125.
【0049】
[4] Allen, J. B., and Berkley, D. A. "Image method for efficiently simulating small room acoustics." The Journal of the Acoustical Society of America 65.4 (1979): 943-950.
【0050】
[5] Borish, J. "Extension of the image model to arbitrary polyhedra." The Journal of the Acoustical Society of America 75.6 (1984): 1827-1836.
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【国際調査報告】