(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-10
(45)【発行日】2024-04-18
(54)【発明の名称】仮想現実のための効率的な空間的にヘテロジーニアスなオーディオ要素
(51)【国際特許分類】
H04S 7/00 20060101AFI20240411BHJP
【FI】
H04S7/00 330
(21)【出願番号】P 2021538732
(86)(22)【出願日】2019-12-20
(86)【国際出願番号】 EP2019086877
(87)【国際公開番号】W WO2020144062
(87)【国際公開日】2020-07-16
【審査請求日】2021-08-27
(32)【優先日】2019-01-08
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】598036300
【氏名又は名称】テレフオンアクチーボラゲット エルエム エリクソン(パブル)
(74)【代理人】
【識別番号】100109726
【氏名又は名称】園田 吉隆
(74)【代理人】
【識別番号】100161470
【氏名又は名称】冨樫 義孝
(74)【代理人】
【識別番号】100194294
【氏名又は名称】石岡 利康
(74)【代理人】
【識別番号】100194320
【氏名又は名称】藤井 亮
(74)【代理人】
【識別番号】100150670
【氏名又は名称】小梶 晴美
(72)【発明者】
【氏名】ファルク, トミ
(72)【発明者】
【氏名】カールソン, エルレンドゥル
(72)【発明者】
【氏名】チャン, メンチウ
(72)【発明者】
【氏名】ヤンソン トフゴード, トマス
(72)【発明者】
【氏名】デ ブルーイン, ウェルネル
【審査官】佐久 聖子
(56)【参考文献】
【文献】国際公開第2018/197748(WO,A1)
【文献】米国特許出願公開第2018/0109901(US,A1)
【文献】米国特許出願公開第2018/0068664(US,A1)
【文献】国際公開第2018/150774(WO,A1)
【文献】国際公開第2017/110882(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 1/00- 7/00
(57)【特許請求の範囲】
【請求項1】
ユーザのために空間的にヘテロジーニアスなオーディオ要素をレンダリングするための方法(1100)であって、
前記空間的にヘテロジーニアスなオーディオ要素を表す2つ以上のオーディオ信号を取得する(s1102)ことであって、前記オーディオ信号の組合せが前記空間的にヘテロジーニアスなオーディオ要素の空間像を提供する、2つ以上のオーディオ信号を取得する(s1102)ことと、
前記空間的にヘテロジーニアスなオーディオ要素に関連付けられたメタデータを取得する(s1104)ことであって、当該メタデータが前記空間的にヘテロジーニアスなオーディオ要素の空間的広がりを示す空間的広がり情報を含み、前記空間的広がりは、前記空間的にヘテロジーニアスなオーディオ要素
の物理的次
元を表す、メタデータを取得する(s1104)ことと、
前記空間的にヘテロジーニアスなオーディオ要素の空間的広がりと、前記空間的にヘテロジーニアスなオーディオ要素に対する前記ユーザの位置および/または向きを示す位置情報を使用して、前記空間的にヘテロジーニアスなオーディオ要素の
修正された空間的広がりを導き出すことと、
i)
取得された前記2つ以上のオーディオ信号と、ii)導き出された
、前記修正された空間的広がりと、
iii)前記空間的にヘテロジーニアスなオーディオ要素に対する前記ユーザの位置および/または向きを示す前記位置情報と、を使用して前記空間的にヘテロジーニアスなオーディオ要素をレンダリングする(s1106)ことと、
を含む、方法(1100)。
【請求項2】
前記空間的にヘテロジーニアスなオーディオ要素の前記空間的広がりが、前記空間的にヘテロジーニアスなオーディオ要素に対する第1の仮想位置または第1の仮想向きにおいて知覚される1つまたは複数の次元における前記空間的にヘテロジーニアスなオーディオ要素の知覚されるサイズに対応する、請求項1に記載の方法。
【請求項3】
前記空間的にヘテロジーニアスなオーディオ要素をレンダリングすることが、前記空間的にヘテロジーニアスなオーディオ要素に対する前記ユーザの前記位置、および/または前記空間的にヘテロジーニアスなオーディオ要素の方向ベクトルに対する前記ユーザの前記向きに基づいて、前記2つ以上のオーディオ信号のうちの少なくとも1つを修正することを含む、請求項1または2に記載の方法。
【請求項4】
前記メタデータが、
i)前記2つ以上のオーディオ信号を取得するマイクロフォン間の間隔、デフォルト軸に対する前記マイクロフォンの向き、および前記マイクロフォンのタイプのうちの少なくとも1つを示すマイクロフォンセットアップ情報、
ii)前記マイクロフォンと前記空間的にヘテロジーニアスなオーディオ要素との間の距離、および前記空間的にヘテロジーニアスなオーディオ要素の軸に対する仮想マイクロフォンの向きのうちの少なくとも1つを示す第1の関係情報、ならびに
iii)前記空間的にヘテロジーニアスなオーディオ要素に対するデフォルトの位置、および前記デフォルトの位置と前記空間的にヘテロジーニアスなオーディオ要素との間の距離のうちの少なくとも1つを示す第2の関係情報、
のうちの少なくとも1つをさらに含む、請求項1から3のいずれか一項に記載の方法。
【請求項5】
導き出された
、前記修正された空間的広がりは、RE*f(d,D)によって決定され、REは前記メタデータから取得された空間的広がりであり、dは空間的にヘテロジーニアスなオーディオ要素と前記ユーザの現在の位置との間の距離であり、Dは空間的にヘテロジーニアスなオーディオ要素と前記メタデータで指定されたデフォルト位置との間の距離である、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記空間的にヘテロジーニアスなオーディオ要素をレンダリングすることは、前記ユーザが移行領域にいるときに、前記2つ以上のオーディオ信号のうちの少なくとも1つに非相関信号を追加することによって、前記2つ以上のオーディオ信号のうちの少なくとも1つを修正することをさらに含む、請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記メタデータは、前記空間的にヘテロジーニアスなオーディオ要素に対する前記ユーザの位置および/または向きの変化に基づいて、前記空間的にヘテロジーニアスなオーディオ要素の空間幅を変更するかどうか、前記ユーザが前記空間的にヘテロジーニアスなオーディオ要素の一方の側から前記空間的にヘテロジーニアスなオーディオ要素の反対側に移動するときに左右のオーディオチャネルを交換するかどうか、および、単一次元に沿って
、前記空間的にヘテロジーニアスなオーディオ要素の前
記空間的広がりを修正するかどうか、の少なくとも1つを示す空間的広がり修正情報をさらに含む、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記空間的にヘテロジーニアスなオーディオ要素をレンダリングすることが、修正されたオーディオ信号を生成することを含み、
前記2つ以上のオーディオ信号が、前記空間的にヘテロジーニアスなオーディオ要素に対する第1の仮想位置および/または第1の仮想向きで知覚される前記空間的にヘテロジーニアスなオーディオ要素を表し、
前記修正されたオーディオ信号が、前記空間的にヘテロジーニアスなオーディオ要素に対する第2の仮想位置および/または第2の仮想向きで知覚される前記空間的にヘテロジーニアスなオーディオ要素を表すために使用され、
前記ユーザの前記位置が前記第2の仮想位置に対応し、および/または前記ユーザの前記向きが前記第2の仮想向きに対応する、
請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記2つ以上のオーディオ信号が左オーディオ信号(L)および右オーディオ信号(R)を含み、
前記空間的にヘテロジーニアスなオーディオ要素をレンダリングすることが、修正された左信号(L’)および修正された右信号(R’)を生成することを含み、
[L’R’]^T=H×[LR]^Tであり、ここで、Hは変換行列であり、
前記変換行列が、前記取得したメタデータおよび前記位置情報に基づいて決定される、
請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記空間的にヘテロジーニアスなオーディオ要素をレンダリングすることが、
第1の出力信号(EL)および第2の出力信号(ER)を生成することを含み、ここで、
EL=L’*HRTFLであり、HRTFLが左耳の頭部伝達関数であり、
ER=R’*HRTFRであり、HRTFRが右耳の頭部伝達関数である、
請求項9に記載の方法。
【請求項11】
前記空間的にヘテロジーニアスなオーディオ要素に関連付けられた前記メタデータが、
前記空間的にヘテロジーニアスなオーディオ要素の空間中心、および
前記空間的にヘテロジーニアスなオーディオ要素の方向ベクトル、
のうちの少なくとも1つを指定する、請求項1から10のいずれか一項に記載の方法。
【請求項12】
前記空間的にヘテロジーニアスなオーディオ要素をレンダリングするステップが、
1つまたは複数の修正されたオーディオ信号を生成することと、
前記修正されたオーディオ信号を含む前記オーディオ信号のバイノーラルレンダリングを行うことと、
を含む、請求項1から11のいずれか一項に記載の方法。
【請求項13】
前記空間的にヘテロジーニアスなオーディオ要素をレンダリングするステップが、
1つまたは複数の修正されたオーディオ信号を生成することと、
前記修正されたオーディオ信号を含む前記オーディオ信号を物理的なラウドスピーカ上にレンダリングすることと、
を含む、請求項1から11のいずれか一項に記載の方法。
【請求項14】
前記修正されたオーディオ信号を含む前記オーディオ信号が仮想スピーカとしてレンダリングされ、
前記仮想スピーカの位置は、前記仮想スピーカ間の角度が前記空間的にヘテロジーニアスなオーディオ要素の導き出された前記
修正された空間的広がりに対応するように、前記空間的にヘテロジーニアスなオーディオ要素に対する前記ユーザの位置および/または向きの変化を検出することに応答して動的に更新される、
請求項12または13に記載の方法。
【請求項15】
ユーザのために空間的にヘテロジーニアスなオーディオ要素をレンダリングするための装置(1200)であって、
コンピュータ可読記憶媒体(1242)と、
前記コンピュータ可読記憶媒体に結合された処理回路(1202)であって、前記装置に、
前記空間的にヘテロジーニアスなオーディオ要素を表す2つ以上のオーディオ信号を取得することであって、前記オーディオ信号の組合せが前記空間的にヘテロジーニアスなオーディオ要素の空間像を提供する、2つ以上のオーディオ信号を取得することと、
前記空間的にヘテロジーニアスなオーディオ要素に関連付けられたメタデータを取得することであって、当該メタデータが前記オーディオ要素の空間的広がりを示す空間的広がり情報を含み、前記空間的広がりは、前記空間的にヘテロジーニアスなオーディオ要素
の物理的次
元を表す、メタデータを取得することと、
前記空間的にヘテロジーニアスなオーディオ要素の空間的広がりと、前記空間的にヘテロジーニアスなオーディオ要素に対する前記ユーザの位置および/または向きを示す位置情報を使用して、前記空間的にヘテロジーニアスなオーディオ要素の
修正された空間的広がりを導き出すことと、
i)
取得された前記2つ以上のオーディオ信号と、ii)導き出された
、前記修正された空間的広がりと、
iii)前記空間的にヘテロジーニアスなオーディオ要素に対する前記ユーザの位置および/または向きを示す前記位置情報と、を使用して、前記空間的にヘテロジーニアスなオーディオ要素をレンダリングすることと、
を行わせるように設定されている処理回路(1202)と、
を備える、装置(1200)。
【請求項16】
請求項2から14のいずれか一項に記載の方法を実行するように設定された、請求項15に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
空間的にヘテロジーニアスなオーディオ要素のレンダリングに関する実施形態が開示される。
【背景技術】
【0002】
人々は、しばしば、ある特定の表面上にまたはある特定の体積/面積内に位置する様々な音源から生成された音波の和である音を知覚する。このような表面または体積/面積は、概念的には、空間的にヘテロジーニアスな性質を有する単一のオーディオ要素(すなわち、空間的広がり内に、ある特定の量の空間的な音源変動を有するオーディオ要素)と考えることができる。
【0003】
以下は、空間的にヘテロジーニアスなオーディオ要素の例のリストである。
【0004】
群衆の音:規定された体積の空間内で互いに近接して立っている多くの個人によって生成され、リスナの両耳に届く音声の和。
【0005】
川の音:川の表面から生成され、リスナの両耳に届く水跳ね音の和。
【0006】
ビーチの音:ビーチの海岸線に当たる海の波によって生成され、リスナの両耳に届く音の和。
【0007】
噴水音:噴水の表面に当たる水流によって生成され、リスナの両耳に届く音の和。
【0008】
混雑した高速道路の音:多くの車によって生成され、リスナの両耳に届く音の和。
【0009】
これらの空間的にヘテロジーニアスなオーディオ要素の中には、3次元(3D)空間のある特定の経路に沿ってあまり変化しない、知覚される空間的にヘテロジーニアスな性質のものがある。例えば、川のそばを歩いているリスナが知覚する川の音の性質は、リスナが川のそばを歩いても大きくは変化しない。同様に、ビーチフロントに沿って歩いているリスナによって知覚されるビーチの音の性質、または群衆の周りを歩いているリスナによって知覚される群衆の音の性質は、リスナがビーチフロントに沿って歩いても、または群衆の周りを歩いてもあまり変化しない。
【0010】
ある特定の空間的広がりを有するオーディオ要素を表現する既存の方法が存在するが、結果として得られる表現は、オーディオ要素の空間的にヘテロジーニアスな性質を維持するものではない。そのような既存の方法の1つは、モノラルオーディオオブジェクトの周囲の位置にモノラルオーディオオブジェクトの複数の複製を作成することである。モノラルオーディオオブジェクトの周囲にモノラルオーディオオブジェクトの複数の複製があると、特定のサイズを有する空間的に均質なオーディオオブジェクトの知覚が作成される。この概念は、MPEG-H 3Dオーディオ規格の「オブジェクト拡散」および「オブジェクト発散」機能、ならびにEBUオーディオ定義モデル(ADM)規格の「オブジェクト発散」機能において使用されている。
【0011】
モノラルオーディオオブジェクトを使用して空間的広がりを有するオーディオ要素を表現する別のやり方は、オーディオ要素の空間的にヘテロジーニアスな性質を維持するわけではないが、2016年1月に発行された「Efficient HRTF-based Spatial Audio for Area and Volumetric Sources」と題されたIEEE Transactions on Visualization and Computer Graphics 22(4):1-1に記載されており、その全体が参照により本明細書に組み込まれる。具体的には、モノラルオーディオオブジェクトを使用して、リスナの周りの球体上にサウンドオブジェクトの面積-体積状の幾何学的形状を投影し、一対の頭部関連(HR)フィルタを用いて、球体上のサウンドオブジェクトの幾何学的投影をカバーするすべてのHRフィルタの積分として評価される音をリスナにレンダリングすることによって、空間的広がりを有するオーディオ要素を表現することができる。球体体積音源の場合、この積分は、解析解を有するが、任意の面積-体積状音源の幾何学的形状の場合、積分は、いわゆるモンテカルロ光線サンプリングを使用して、球体上に投影された音源表面をサンプリングすることによって評価される。
【0012】
既存の方法の別の1つは、モノラルオーディオ信号に加えて空間的に拡散した成分をレンダリングして、空間的に拡散した成分とモノラルオーディオ信号との組合せが幾分拡散したオブジェクトの知覚を作成するようにすることである。単一のモノラルオーディオオブジェクトとは対照的に、拡散オブジェクトには明確なピンポイントの位置はない。この概念は、MPEG-H 3Dオーディオ規格の「オブジェクト拡散性」機能およびEBU ADMの「オブジェクト拡散性」機能において使用されている。
【0013】
既存の方法の組合せも知られている。例えば、EBU ADMの「オブジェクト広がり」機能は、モノラルオーディオオブジェクトのコピーを複数作成するという概念と、拡散成分を追加するという概念と、を組み合わせている。
【発明の概要】
【0014】
上述したように、オーディオ要素を表現するための様々な技法が知られている。しかしながら、これらの既知の技法の大部分は、空間的に均質な性質(すなわち、オーディオ要素内に空間的な変化がない)または空間的に拡散した性質のいずれかを有するオーディオ要素しかレンダリングするができず、これは、説得力のあるやり方で上記の例のいくつかをレンダリングするには限界が多すぎる。言い換えれば、これらの既知の技法では、明確な空間的にヘテロジーニアスな性質を有するオーディオ要素をレンダリングすることはできない。
【0015】
空間的にヘテロジーニアスなオーディオ要素の概念を作成する1つのやり方は、複数の個々のモノラルオーディオオブジェクト(基本的には個々のオーディオソース)の空間的に分散されたクラスタを作成し、複数の個々のモノラルオーディオオブジェクトを何らかのより高いレベルで(例えば、シーングラフまたはその他のグループ化メカニズムを使用して)一緒にリンクすることによるものである。しかしながら、これは、多くの場合、特に高度にヘテロジーニアスなオーディオ要素(すなわち、上記の例などの、多くの個々の音源を含むオーディオ要素)については、効率的なソリューションではない。さらに、レンダリングされるべきオーディオ要素がライブキャプチャされたコンテンツである場合、オーディオ要素を形成する複数のオーディオソースのそれぞれを別々に録音することは実現不可能または非現実的である場合もある。
【0016】
したがって、空間的にヘテロジーニアスなオーディオ要素の効率的な表現、および空間的にヘテロジーニアスなオーディオ要素の効率的な動的な6自由度(6DoF)レンダリングを提供するための改善された方法が必要とされている。特に、リスナによって知覚されるオーディオ要素のサイズ(例えば、幅または高さ)を、異なる聴取位置および/または向きに対応させること、および知覚される空間的性質を知覚されるサイズ内に維持することが望ましい。
【0017】
本開示の実施形態は、空間的にヘテロジーニアスなオーディオ要素の効率的な表現、および効率的かつ動的な6DoFレンダリングを可能にし、オーディオ要素のリスナに、リスナがいる仮想環境と空間的および概念的に一致した現実に近いサウンド体感を提供する。
【0018】
空間的にヘテロジーニアスなオーディオ要素のこの効率的かつ動的な表現および/またはレンダリングは、コンテンツ作成者にとって非常に有用であり、コンテンツ作成者は、仮想現実(VR)、拡張現実(AR)、または複合現実(MR)アプリケーションのために非常に効率的なやり方で空間的に豊富なオーディオ要素を6DoFシナリオに組み込むことができるであろう。
【0019】
本開示の一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素は、組み合わされてオーディオ要素の空間像を提供する少数(例えば、2以上であるが一般に6以下)のオーディオ信号のグループとして表される。例えば、空間的にヘテロジーニアスなオーディオ要素は、関連付けられたメタデータを有するステレオ音響信号として表現されてもよい。
【0020】
さらに、本開示の一部の実施形態では、レンダリングメカニズムは、空間的にヘテロジーニアスなオーディオ要素のヘテロジーニアスな空間的特性を保持しながら、空間的にヘテロジーニアスなオーディオ要素のリスナの位置および/または向きが変化するにつれ、オーディオ要素の知覚される空間的広がりが制御されたやり方で修正されるように、空間的にヘテロジーニアスなオーディオ要素の動的な6DoFレンダリングを可能にすることができる。空間的広がりのこの修正は、空間的にヘテロジーニアスなオーディオ要素のメタデータと、空間的にヘテロジーニアスなオーディオ要素に対するリスナの位置および/または向きと、に依存してもよい。
【0021】
一態様では、ユーザのために空間的にヘテロジーニアスなオーディオ要素をレンダリングするための方法が存在する。一部の実施形態では、本方法は、空間的にヘテロジーニアスなオーディオ要素を表す2つ以上のオーディオ信号を取得することを含み、オーディオ信号の組合せが、空間的にヘテロジーニアスなオーディオ要素の空間像を提供する。本方法はまた、空間的にヘテロジーニアスなオーディオ要素に関連付けられたメタデータを取得することを含む。メタデータは、空間的にヘテロジーニアスなオーディオ要素の空間的広がりを指定する空間的広がり情報を含むことができる。本方法は、i)空間的広がり情報と、ii)空間的にヘテロジーニアスなオーディオ要素に対するユーザの位置(例えば、仮想位置)および/または向きを示す位置情報と、を使用してオーディオ要素をレンダリングすることをさらに含む。
【0022】
別の態様では、コンピュータプログラムが提供される。コンピュータプログラムは、処理回路によって実行されると、処理回路に上述した方法を実行させる命令を含む。別の態様では、キャリアが提供され、このキャリアには、コンピュータプログラムが含まれている。キャリアは、電子信号、光信号、無線信号、およびコンピュータ可読記憶媒体のうちの1つである。
【0023】
別の態様では、ユーザのために空間的にヘテロジーニアスなオーディオ要素をレンダリングするための装置が提供される。装置は、空間的にヘテロジーニアスなオーディオ要素を表す2つ以上のオーディオ信号を取得することであって、オーディオ信号の組合せが空間的にヘテロジーニアスなオーディオ要素の空間像を提供する、オーディオ信号を取得することと、空間的にヘテロジーニアスなオーディオ要素に関連付けられたメタデータであって、空間的にヘテロジーニアスなオーディオ要素の空間的広がりを示す空間的広がり情報を含む、メタデータを取得することと、i)空間的広がり情報と、ii)空間的にヘテロジーニアスなオーディオ要素に対するユーザの位置(例えば、仮想位置)および/または向きを示す位置情報と、を使用して、空間的にヘテロジーニアスなオーディオ要素をレンダリングすることと、を行うように設定されている。
【0024】
一部の実施形態では、装置は、コンピュータ可読記憶媒体と、コンピュータ可読記憶媒体に結合された処理回路であって、装置に本明細書に記載された方法を実行させるように設定された、処理回路と、を備える。
【0025】
本開示の実施形態は、少なくとも以下の2つの利点を提供する。
【0026】
関連付けられた「サイズ」、「拡散」、または「拡散性」パラメータを使用してモノラルオーディオオブジェクトの「サイズ」を拡張して、結果として空間的に均質なオーディオ要素をもたらす既知のソリューションと比較して、本開示の実施形態は、明確な空間的にヘテロジーニアスな性質を有するオーディオ要素の表現および6DoFレンダリングを可能にする。
【0027】
空間的にヘテロジーニアスなオーディオ要素を個々のモノラルオーディオオブジェクトのクラスタとして表現する既知のソリューションと比較して、本開示の実施形態に基づく空間的にヘテロジーニアスなオーディオ要素の表現は、表現、トランスポート、およびレンダリングの複雑さに関してより効率的である。
【0028】
本明細書に組み込まれ、本明細書の一部を形成する添付の図面は、様々な実施形態を示す。
【図面の簡単な説明】
【0029】
【
図1】一部の実施形態による、空間的にヘテロジーニアスなオーディオ要素の表現を示す図である。
【
図2】一部の実施形態による、空間的にヘテロジーニアスなオーディオ要素の表現の修正を示す図である。
【
図3A-C】一部の実施形態による、空間的にヘテロジーニアスなオーディオ要素の空間的広がりを修正する方法を示す図である。
【
図4】一部の実施形態による、空間的にヘテロジーニアスなオーディオ要素をレンダリングするためのシステムを示す図である。
【
図5A-B】一部の実施形態による仮想現実(VR)システムを示す図である。
【
図6A-B】一部の実施形態による、リスナの向きを決定する方法を示す図である。
【
図7A-B】仮想スピーカの配置を修正する方法を示す図である。
【
図8】仮想スピーカの配置を修正する方法を示す図である。
【
図9】頭部伝達関数(HRTF)フィルタのパラメータを示す図である。
【
図10】空間的にヘテロジーニアスなオーディオ要素をレンダリングするプロセスの概要を示す図である。
【
図11】一部の実施形態によるプロセスを示す流れ図である。
【
図12】一部の実施形態による装置のブロック図である。
【発明を実施するための形態】
【0030】
図1は、空間的にヘテロジーニアスなオーディオ要素101の表現を示す。一実施形態では、空間的にヘテロジーニアスなオーディオ要素は、ステレオオブジェクトとして表すことができる。ステレオオブジェクトは、2チャンネルステレオ(例えば、左右の)信号および関連付けられたメタデータを含むことができる。ステレオ信号は、ステレオ音響マイクのセットアップを使用した現実のオーディオ要素(例えば、群衆、混雑した高速道路、ビーチ)の実際のステレオ録音から、または個々の(録音または生成された)オーディオ信号をミキシング(例えば、ステレオパニング)することによって人工的に作成したものから取得することができる。
【0031】
関連付けられたメタデータは、空間的にヘテロジーニアスなオーディオ要素101およびその表現に関する情報を提供することができる。
図1に示すように、メタデータは、以下の情報のうちの少なくとも1つまたは複数を含むことができる。すなわち、
【0032】
(1)空間的にヘテロジーニアスなオーディオ要素の概念的な空間中心の位置P1と、
【0033】
(2)空間的にヘテロジーニアスなオーディオ要素の空間的広がり(例えば、空間幅W)と、
【0034】
(3)空間的にヘテロジーニアスなオーディオ要素を録音するために使用されるマイクロフォン102および103(仮想マイクロフォンまたは実マイクロフォンのいずれか)のセットアップ(例えば、間隔Sおよび向きα)と、
【0035】
(4)マイクロフォン102および103のタイプ(例えば、オムニ、カーディオイド、8の字)と、
【0036】
(5)マイクロフォン102および103と空間的にヘテロジーニアスなオーディオ要素101との間の関係、例えば、オーディオ要素101の表記上の中心の位置P1とマイクロフォン102および103の位置P2との間の距離d、ならびに空間的にヘテロジーニアスなオーディオ要素101の基準軸(例えば、Y軸)に対するマイクロフォン102および103の向き(例えば、向きα)と、
【0037】
(6)デフォルトの聴取位置(例えば、位置P2)と、
【0038】
(7)P1とP2の関係(例えば、距離d)と、である。
【0039】
空間的にヘテロジーニアスなオーディオ要素101の空間的広がりは、絶対サイズ(例えば、メートル単位)として、または相対サイズ(例えば、キャプチャ位置またはデフォルトの観察位置などの参照位置に対する角度幅)として提供されてもよい。また、空間的広がりは、(例えば、単一の次元で空間的広がりを指定するか、またはすべての次元に対して使用される空間的広がりを指定する)単一の値として、あるいは(例えば、異なる次元に対して別々の空間的広がりを指定する)複数の値として指定されてもよい。
【0040】
一部の実施形態では、空間的広がりは、空間的にヘテロジーニアスなオーディオ要素101(例えば、噴水)の実際の物理的サイズ/寸法であってもよい。他の実施形態では、空間的広がりは、リスナによって知覚される空間的広がりを表してもよい。例えば、オーディオ要素が海または川である場合、リスナは、海または川の全体的な幅/寸法を知覚することができず、リスナに近い海または川の一部のみを知覚することができる。このような場合、リスナは、海または川のある特定の空間部分のみから音を聞くことになるため、オーディオ要素は、リスナが知覚する空間幅として表現されてもよい。
【0041】
図2は、リスナ104の位置の動的変化に基づく、空間的にヘテロジーニアスなオーディオ要素101の表現の修正を示す。
図2では、リスナ104は、最初は仮想位置Aおよび最初の仮想向き(例えば、リスナ104から空間的にヘテロジーニアスなオーディオ要素101への垂直方向)に位置している。位置Aは、空間的にヘテロジーニアスなオーディオ要素101に対してメタデータで指定されたデフォルトの位置であってもよい(同様に、リスナ104の初期の向きは、メタデータで指定されたデフォルトの向きと等しくてもよい)。リスナの初期位置および向きがデフォルトと一致すると仮定すると、空間的にヘテロジーニアスなオーディオ要素101を表すステレオ信号は、いかなる修正もなしにリスナ104に提供され得て、したがって、リスナ104は、空間的にヘテロジーニアスなオーディオ要素101のデフォルトの空間的オーディオ表現を体感することになる。
【0042】
リスナ104が仮想位置Aから空間的にヘテロジーニアスなオーディオ要素101に近い仮想位置Bに移動した場合、リスナ104の位置の変化に基づいて、リスナ104によって知覚されるオーディオ体感を変化させることが望ましい。したがって、位置Bにおいてリスナ104によって知覚される空間的にヘテロジーニアスなオーディオ要素101の空間幅WBを、仮想位置Aにおいてリスナ104によって知覚されるオーディオ要素101の空間幅WAよりも広くなるように指定することが望ましい。同様に、位置Cにおいてリスナ104によって知覚されるオーディオ要素101の空間幅WCを、空間幅WAよりも狭くなるように指定することが望ましい。
【0043】
したがって、一部の実施形態では、リスナによって知覚される空間的にヘテロジーニアスなオーディオ要素の空間的広がりは、空間的にヘテロジーニアスなオーディオ要素に対するリスナの位置および/または向き、ならびに空間的にヘテロジーニアスなオーディオ要素のメタデータ(例えば、空間的にヘテロジーニアスなオーディオ要素に対するデフォルトの位置および/または向きを示す情報)に基づいて更新される。上で説明したように、空間的にヘテロジーニアスなオーディオ要素のメタデータは、空間的にヘテロジーニアスなオーディオ要素のデフォルトの空間的広がりに関する空間的広がり情報、空間的にヘテロジーニアスなオーディオ要素の概念的な中心の位置、ならびにデフォルトの位置および/または向きを含むことができる。修正された空間的広がりは、デフォルトの位置およびデフォルトの向きに対するリスナの位置および向きの変化の検出に基づいて、デフォルトの空間的広がりを修正することによって取得することができる。
【0044】
他の実施形態では、空間的にヘテロジーニアスな広がりのあるオーディオ要素(例えば、川、海)の表現は、空間的にヘテロジーニアスな広がりのあるオーディオ要素の知覚可能な部分のみを表す。そのような実施形態では、デフォルトの空間的広がりは、
図3A~
図3Cに示すように、異なるやり方で修正されてもよい。
図3Aおよび
図3Bに示すように、リスナ104が空間的にヘテロジーニアスな広がりのあるオーディオ要素301と一緒に移動するにつれ、空間的にヘテロジーニアスな広がりのあるオーディオ要素301の表現は、リスナ104と共に移動することができる。したがって、リスナ104にレンダリングされるオーディオは、基本的に、特定の軸(例えば、
図3Aの水平軸)に対するリスナ104の位置とは無関係である。この場合、
図3Cに示すように、リスナ104によって知覚される空間的広がりは、リスナ104と空間的にヘテロジーニアスな広がりのあるオーディオ要素301との間の垂直距離dと、リスナ104と空間的にヘテロジーニアスな広がりのあるオーディオ要素301との間の基準垂直距離Dとの比較にのみ基づいて修正されてもよい。基準垂直距離Dは、空間的にヘテロジーニアスな広がりのあるオーディオ要素301のメタデータから取得することができる。
【0045】
例えば、
図3Cを参照すると、リスナ104によって知覚される修正された空間的広がりは、SE=RE
*f(d,D)の関数に従って決定することができ、ここで、SEは修正された空間的広がりであり、REは空間的にヘテロジーニアスな広がりのあるオーディオ要素301のメタデータから得られるデフォルト(または基準)の空間的広がりであり、dは空間的にヘテロジーニアスな広がりのあるオーディオ要素301とリスナ104の現在の位置との間の垂直距離であり、Dは空間的にヘテロジーニアスな広がりのあるオーディオ要素301とメタデータで指定されたデフォルトの位置との間の垂直距離であり、fはdおよびDをパラメータとして有する曲線を規定する関数である。関数fは、線形関係または非線形曲線などの多くの形状をとることができる。曲線の例を
図3Aに示す。
【0046】
曲線は、空間的にヘテロジーニアスな広がりのあるオーディオ要素301の空間的広がりが、空間的にヘテロジーニアスな広がりのあるオーディオ要素301から非常に遠い距離ではゼロに近く、ゼロに近い距離では180度に近いことを示すことができる。
図3Aに示すように、空間的にヘテロジーニアスな広がりのあるオーディオ要素301が海などの非常に大きな現実の要素を表す場合、曲線は、リスナが海に近づくにつれ空間的広がりが徐々に増加する(リスナが海岸に到着したときに180度に達する)ようなものであってもよい。空間的にヘテロジーニアスな広がりのあるオーディオ要素301が噴水などのより小さな現実の要素を表す場合、曲線は、空間的にヘテロジーニアスな広がりのあるオーディオ要素301から遠い距離では空間的広がりが非常に狭くなるが、空間的にヘテロジーニアスな広がりのあるオーディオ要素301の近くでは非常に急速に広くなるように、強く非線形であってもよい。
【0047】
関数fはまた、特に空間的にヘテロジーニアスな広がりのあるオーディオ要素301が小さい場合、オーディオ要素のリスナの観察角度に依存してもよい。
【0048】
曲線は、空間的にヘテロジーニアスな広がりのあるオーディオ要素301のメタデータの一部として提供されてもよく、またはオーディオレンダラに記憶または提供されてもよい。空間的にヘテロジーニアスな広がりのあるオーディオ要素301の空間的広がりの修正を実施することを望むコンテンツ作成者は、空間的にヘテロジーニアスな広がりのあるオーディオ要素301の所望のレンダリングに基づいて、曲線の様々な形状間の選択が与えられ得る。
【0049】
図4は、一部の実施形態による、空間的にヘテロジーニアスなオーディオ要素をレンダリングするためのシステム400を示す。システム400は、コントローラ401と、左オーディオ信号451用の信号修正器402と、右オーディオ信号452用の信号修正器403と、左オーディオ信号451用のスピーカ404と、右オーディオ信号452用のスピーカ405と、を含む。左オーディオ信号451および右オーディオ信号452は、デフォルトの位置およびデフォルトの向きにおける空間的にヘテロジーニアスなオーディオ要素を表す。
図4には、2つのオーディオ信号、2つの修正器、および2つのスピーカのみが示されているが、これは、例示のみを目的としており、本開示の実施形態を決して限定するものではない。さらに、
図4は、システム400が左オーディオ信号451および右オーディオ信号452を別々に受信および修正することを示しているものの、システム400は、左オーディオ信号451および右オーディオ信号452の内容を含む単一のステレオ信号を受信し、左オーディオ信号451および右オーディオ信号452を別々に修正することなく、ステレオ信号を修正することができる。
【0050】
コントローラ401は、1つまたは複数のパラメータを受信し、修正器402および403をトリガして、受信したパラメータに基づいて左右のオーディオ信号451および452に対して修正を実行するように設定されていてもよい。
図4に示す実施形態では、受信されるパラメータは、(1)空間的にヘテロジーニアスなオーディオ要素のリスナの位置および/または向きに関する情報453と、(2)空間的にヘテロジーニアスなオーディオ要素のメタデータ454と、である。
【0051】
本開示の一部の実施形態では、情報453は、
図5Aに示す仮想現実(VR)システム500に含まれる1つまたは複数のセンサから提供されてもよい。
図5Aに示すように、VRシステム500は、ユーザによって着用されるように設定されている。
図5Bに示すように、VRシステム500は、向き検知ユニット501と、位置検知ユニット502と、システム400のコントローラ401に結合された処理ユニット503と、を備えることができる。向き検知ユニット501は、リスナの向きの変化を検出するように設定され、検出された変化に関する情報を処理ユニット503に提供する。一部の実施形態では、処理ユニット503は、向き検知ユニット501によって検出された向きの検出された変化が与えられると、(何らかの座標系に対する)絶対向きを決定する。向きおよび位置を決定するための異なるシステム、例えば灯台トラッカ(ライダ)を使用するHTC Viveシステムも存在し得る。一実施形態では、向き検知ユニット501は、検出された向きの変化が与えられると、(何らかの座標系に対する)絶対向きを決定することができる。この場合、処理ユニット503は、向き検知ユニット501からの絶対向きデータと、位置検知ユニット502からの絶対位置データとを単純に多重化することができる。一部の実施形態では、向き検知ユニット501は、1つまたは複数の加速度計および/または1つまたは複数のジャイロスコープを備えることができる。
【0052】
図6Aおよび
図6Bは、リスナの向きを決定する例示的な方法を示す。
【0053】
図6Aでは、リスナ104のデフォルトの向きは、X軸の方向である。リスナ104がX-Y平面に対して頭を持ち上げると、向き検知ユニット501は、X-Y平面に対する角度θを検出する。向き検知ユニット501はまた、異なる軸に対するリスナ104の向きの変化を検出することができる。例えば、
図6Bにおいて、リスナ104がX軸に対して頭を回転させると、向き検知ユニット501は、X軸に対する角度φを検出する。同様に、リスナがX軸の周りに頭を回転させたときに得られるY-Z平面に対する角度ψが、向き検知ユニット501によって検出され得る。向き検知ユニット501によって検出されたこれらの角度θ、φ、およびψは、リスナ104の向きを表す。
【0054】
図5Bに戻ると、向き検知ユニット501に加えて、VRシステム500は、位置検知ユニット502をさらに備えることができる。位置検知ユニット502は、
図2に示すようにリスナ104の位置を決定する。例えば、位置検知ユニット502は、リスナ104の位置を検出することができ、検出された位置を示す位置情報は、リスナ104が位置Aから位置Bに移動した場合に、空間的にヘテロジーニアスなオーディオ要素101の中心とリスナ104との間の距離がコントローラ401によって決定され得るように、位置検知ユニット502を介してコントローラ401に提供することができる。
【0055】
それに応じて、向き検知ユニット501によって検出された角度θ、φ、およびψ、ならびに位置検知ユニット502によって検出されたリスナ104の位置がVRシステム500の処理ユニット503に提供されてもよい。処理ユニット503は、検出された角度および検出された位置に関する情報をシステム400のコントローラ401に提供することができる。1)空間的にヘテロジーニアスなオーディオ要素101の絶対位置および向きと、2)空間的にヘテロジーニアスなオーディオ要素101の空間的広がりと、3)リスナ104の絶対位置と、が与えられると、リスナ104から空間的にヘテロジーニアスなオーディオ要素101までの距離ならびにリスナ104によって知覚される空間幅を評価することができる。
【0056】
図4に戻ると、メタデータ454は、様々な情報を含むことができる。メタデータ454に含まれる情報の例は、上で提供されている。情報453およびメタデータ454を受信すると、コントローラ401は、修正器402および403をトリガして、左オーディオ信号451および右オーディオ信号452を修正する。修正器402および403は、コントローラ401から提供される情報に基づいて左オーディオ信号451および右オーディオ信号452を修正し、リスナが空間的にヘテロジーニアスなオーディオ要素の修正された空間的広がりを知覚するように、修正されたオーディオ信号をスピーカ404および405に出力する。
【0057】
空間的にヘテロジーニアスなオーディオ要素のレンダリング
【0058】
空間的にヘテロジーニアスなオーディオ要素をレンダリングする多くのやり方が存在する。空間的にヘテロジーニアスなオーディオ要素をレンダリングする1つのやり方は、オーディオチャネルのそれぞれを仮想スピーカとして表現し、仮想スピーカをバイノーラルでリスナにレンダリングするか、またはパニング技法などを使用して物理的ラウドスピーカ上にレンダリングすることである。例えば、空間的にヘテロジーニアスなオーディオ要素を表す2つのオーディオ信号は、それらが、固定位置にある2つの仮想ラウドスピーカから出力されるかのように生成することができる。しかしながら、このような設定では、2つの固定ラウドスピーカからリスナへの音響伝達時間は、リスナが移動するにつれ変化する。2つの固定ラウドスピーカから出力される2つのオーディオ信号間の相関関係および時間的関係のために、このような音響伝達時間の変化は、空間的にヘテロジーニアスなオーディオ要素の空間像の深刻な色付けおよび/または歪みをもたらす。
【0059】
したがって、
図7Aに示す実施形態では、リスナ104が位置Aから位置Bに移動するにつれ、仮想ラウドスピーカ701および702をリスナ104から等距離に維持しながら、仮想ラウドスピーカ701および702を動的に更新する。この概念は、仮想ラウドラウドスピーカ701および702によってレンダリングされたオーディオが、リスナ104の視点から見て空間的にヘテロジーニアスなオーディオ要素101の位置および空間的広がりに一致するように、リスナ104によって知覚されることを可能にする。
図7Aに示すように、仮想ラウドラウドスピーカ701と702との間の角度は、リスナ104の視点から見て空間的にヘテロジーニアスなオーディオ要素101の空間的広がり(例えば、空間幅)に常に対応するように制御することができる。言い換えれば、位置Bでの仮想ラウドスピーカ701および702とリスナ104との間の距離が、位置Aでの仮想ラウドスピーカ701および702とリスナ104との間の距離と同じであったとしても、リスナが位置Aから位置Bに移動するにつれ、仮想ラウドスピーカ701と702との間の角度は、θ
Aからθ
Bに変化する。この角度の変化がリスナ104によって知覚される空間幅の減少に対応する。
【0060】
仮想ラウドラウドスピーカ701および702の位置ならびに向きはまた、リスナ104の頭の姿勢に基づいて制御されてもよい。
図8は、仮想ラウドラウドスピーカ701および702が、リスナ104の頭の姿勢に基づいてどのように制御され得るかの一例を示す。
図8に示す実施形態では、リスナ104が頭を傾けると、仮想ラウドラウドスピーカ701および702の位置は、ステレオ信号のステレオ幅が空間的にヘテロジーニアスなオーディオ要素101の高さまたは幅に対応し得るように制御される。
【0061】
本開示の他の実施形態では、仮想ラウドスピーカ701と702との間の角度は、特定の角度(例えば、+または-30度の標準ステレオ角度)に固定されている場合があり、リスナ104によって知覚される空間的にヘテロジーニアスなオーディオ要素101の空間幅は、仮想ラウドスピーカ701および702から放出される信号を修正することによって変化してもよい。例えば、
図7Bにおいて、リスナ104が位置Aから位置Bに移動した場合であっても、仮想ラウドスピーカ701と702との間の角度は同じままである。したがって、仮想ラウドスピーカ701と702との間の角度は、リスナ104の修正された視点から見た空間的にヘテロジーニアスなオーディオ要素101の空間的広がりにはもはや対応しない。しかしながら、仮想ラウドスピーカ701および702から放出されるオーディオ信号が修正されるため、空間的にヘテロジーニアスなオーディオ要素101の空間的広がりは、位置Bにおいてリスナ104によって異なって知覚されることになる。本方法は、リスナの位置の変化に起因して空間的にヘテロジーニアスなオーディオ要素101の知覚される空間的広がりが変化するときに(例えば、空間的にヘテロジーニアスなオーディオ要素101に近づくかまたは遠ざかるときに、あるいはメタデータが異なる観察角度に対して空間的にヘテロジーニアスなオーディオ要素に対して異なる空間的広がりを指定するときに)、望ましくないアーチファクトが生じないという利点を有する。
【0062】
図7Bに示す実施形態では、リスナ104によって知覚される空間的にヘテロジーニアスなオーディオ要素101の空間的広がりは、オーディオ要素101の左右のオーディオ信号にリミックス操作を施すことによって制御されてもよい。例えば、修正された左右のオーディオ信号は、以下のように表すことができる。
L’=H
LLL+H
LRRおよびR’=H
RLL+H
RRR、または
行列表記では(L’ R’)
T=H
*(L R)
T
ここで、LおよびRは、デフォルト表現におけるオーディオ要素101についてのデフォルトの左および右のオーディオ信号であり、L’およびR’は、リスナ104の修正された位置および/または向きにおいて知覚されるオーディオ要素101に対する修正された左および右のオーディオ信号である。Hは、デフォルトの左右のオーディオ信号を修正された左右のオーディオ信号に変換するための変換行列である。
【0063】
変換行列Hは、空間的にヘテロジーニアスなオーディオ要素101に対するリスナ104の位置および/または向きに依存してもよい。さらに、変換行列Hはまた、空間的にヘテロジーニアスなオーディオ要素101のメタデータに含まれる情報(例えば、オーディオ信号を録音するために使用されるマイクロフォンのセットアップに関する情報)に基づいて決定されてもよい。
【0064】
変換行列Hを実施するために、多くの異なる混合アルゴリズムおよびそれらの組合せを使用することができる。一部の実施形態では、変換行列Hは、ステレオ信号のステレオ像を広げるおよび/または狭めるために既知のアルゴリズムのうちの1つまたは複数によって実施されてもよい。アルゴリズムは、空間的にヘテロジーニアスなオーディオ要素のリスナが空間的にヘテロジーニアスなオーディオ要素に近づくか、または遠ざかるときに、空間的にヘテロジーニアスなオーディオ要素の知覚されるステレオ幅を修正するのに適している可能性がある。
【0065】
このようなアルゴリズムの一例は、ステレオ信号を和信号と差信号(「ミッド」信号と「サイド」信号とも呼ばれる)に分解し、これら2つの信号のバランスを変化させて、オーディオ要素のステレオ像の制御可能な幅を達成することである。一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素の元のステレオ表現は、すでに和差(またはミッド-サイド)フォーマットである場合があり、その場合は、上述した分解ステップは、必要でない場合がある。
【0066】
例えば、
図2を参照すると、参照位置Aにおいて、和信号と差信号を等しい割合で混合することができ(左右の信号において差信号の極性を逆にして)、結果としてデフォルトの左および右の信号が得られる。しかしながら、位置Aよりも空間的にヘテロジーニアスなオーディオ要素101に近い位置Bでは、和信号よりも差信号により多くの重みを与えることで、結果として、デフォルトのものよりも広い空間像が得られる。一方、位置Aよりも空間的にヘテロジーニアスなオーディオ要素101から離れている位置Cでは、差信号よりも和信号により多くの重みを与えることで、結果として、より狭い空間像が得られる。したがって、知覚される空間幅は、和信号と差信号との間のバランスを制御することによって、リスナ104と空間的にヘテロジーニアスなオーディオ要素101との間の距離の変化に応じて制御することができる。
【0067】
前述した技法はまた、リスナと空間的にヘテロジーニアスなオーディオ要素との間の相対角度が変化したときに、すなわち、リスナの観察角度が変化したときに、空間的にヘテロジーニアスなオーディオ要素の空間幅を修正するために使用されてもよい。
図2は、空間的にヘテロジーニアスなオーディオ要素101から参照位置Aと同じ距離にあるが、異なる角度にあるユーザ104の位置Dを示す。
図2に示すように、位置Dでは、位置Aよりも狭い空間像が予想され得る。この異なる空間像は、和信号と差信号の相対的な比率を変化させることによってレンダリングすることができる。具体的には、位置Dに対してより少ない差信号が使用されて、結果としてより狭い像が得られる。
【0068】
本開示の一部の実施形態では、その全体が参照により本明細書に組み込まれる米国特許第7,440,575号、米国特許出願公開第2010/0040243A1号、およびWIPO特許公開第2009102750A1号に記載されているように、非相関技法を使用して、ステレオ信号の空間幅を増大させることができる。
【0069】
本開示の他の実施形態では、その全体が参照により本明細書に組み込まれる米国特許第8,660,271号、米国特許出願公開第2011/0194712号、米国特許第6,928,168号、米国特許第5,892,830号、米国特許出願公開第2009/0136066号、米国特許第9,398,391B2号、米国特許第7,440,575号、および独国特許公開第3840766A1号に記載されているように、ステレオ像を広げるおよび/または狭める異なる技法を使用することができる。
【0070】
リミックス処理(上述した例示的なアルゴリズムを含む)にはフィルタリング操作が含まれる場合があるため、一般に変換行列Hは、複雑で、周波数に依存することに留意されたい。変換は、変換領域信号に対して、潜在的なフィルタリング操作(畳み込み)を含む時間領域において適用されてもよく、あるいは同様の形態で、変換領域、例えば離散フーリエ変換(DFT)または変形離散コサイン変換(MDCT)領域において適用されてもよい。
【0071】
一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素は、単一の頭部伝達関数(HRTF)フィルタ対を使用してレンダリングされてもよい。
図9は、HRTFフィルタの方位角(φ)および仰角(θ)パラメータを示す。上述したように、空間的にヘテロジーニアスなオーディオ要素が左信号Lおよび右信号Rによって表される場合、リスナの向きおよび/または位置の変化に基づいて修正された左および右の信号は、修正された左信号L’および修正された右信号R’として表すことができ、ここで、(L’ R’)
T=H
*(L R)
Tであり、Hは変換行列である。これらの実施形態では、HRTFフィルタリングは、左耳オーディオ信号E
Lおよび右耳オーディオ信号E
Rがリスナに出力され得るように、修正された左信号L’および修正された右信号R’に適用される。E
LおよびE
Rは、以下のように表すことができる。
【0072】
EL(φ,θ,x,y,z)=L’(x,y,z)*HRTFL(φL,θL)
【0073】
ER(φ,θ,x,y,z)=R’(x,y,z)*HRTFR(φR,θR)
【0074】
HRTFLは、オーディオソースのリスナに対して特定の方位角(φL)および特定の仰角(θL)に位置する仮想点オーディオソースに対応した左耳HRTFフィルタである。同様に、HRTFRは、オーディオソースのリスナに対して特定の方位角(φR)および特定の仰角(θR)に位置する仮想点オーディオソースに対応する右耳HRTFフィルタである。x、y、zは、デフォルトの位置(別名「デフォルト観察位置」)に対するリスナの位置を表す。特定の一実施形態では、修正された左信号L’および修正された右信号R’は、同じ位置でレンダリングされ、すなわち、φR=φLおよびθR=θLである。
【0075】
一部の実施形態では、アンビソニックスフォーマットが、特定の仮想ラウドスピーカセットアップのためのバイノーラルレンダリングまたはマルチチャネルフォーマットへの変換の前に、あるいはその一部として、中間フォーマットとして使用されてもよい。例えば、上述した実施形態では、修正された左および右のオーディオ信号L’およびR’は、アンビソニックス領域に変換され、次いでバイノーラルにまたはラウドスピーカ用にレンダリングされてもよい。空間的にヘテロジーニアスなオーディオ要素は、様々なやり方でアンビソニックス領域に変換されてもよい。例えば、空間的にヘテロジーニアスなオーディオ要素は、それぞれが点音源として扱われる仮想ラウドスピーカを使用してレンダリングすることができる。このような場合、仮想ラウドスピーカのそれぞれは、既知の方法を使用してアンビソニックス領域に変換され得る。
【0076】
一部の実施形態では、2016年1月に発行された「Efficient HRTF-based Spatial Audio for Area and Volumetric Sources」と題されたIEEE Transactions on Visualization and Computer Graphics 22(4):1-1に記載されているように、より高度な技法を使用してHRTFを計算することができる。
【0077】
本開示の一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素は、環境要素(例えば、海もしくは川)、またはシーン内のある領域を占有する複数の物理的なエンティティから構成された概念的なエンティティ(例えば、群衆)の代わりに、複数の音源を備える単一の物理的なエンティティ(例えば、エンジン音源および排気音源を有する車)を表してもよい。上述した空間的にヘテロジーニアスなオーディオ要素をレンダリングする方法は、複数の音源を含み、明確な空間的レイアウトを有するそのような単一の物理的なエンティティにも適用可能であってもよい。例えば、リスナが車両の運転席側で車両に向かって立っていて、車両が、リスナの左側で第1の音(例えば、車両の前側からのエンジン音)およびリスナの右側で第2の音(例えば、車両の後側からの排気音)を生成した場合、リスナは、第1および第2の音に基づいて、車両の明確な空間的オーディオレイアウトを知覚することができる。このような場合に、リスナが車両の周りを移動して、車両の反対側(例えば、車両の助手席側)から観察した場合でも、リスナが明確な空間的レイアウトを知覚できるようにすることが望ましい。したがって、本開示の一部の実施形態では、リスナが一方の側(例えば、車両の運転席側)から反対側(例えば、車両の助手席側)に移動すると、左オーディオチャネルと右オーディオチャネルが入れ替わる。言い換えれば、リスナが一方の側から反対側に移動するにつれ、空間的にヘテロジーニアスなオーディオ要素の空間的表現が車両の軸の周りにミラーリングされる。
【0078】
しかしながら、リスナが一方の側から反対側に移動する瞬間に左右のチャネルが瞬時に入れ替わる場合、リスナは、空間的にヘテロジーニアスなオーディオ要素の空間像の不連続性を知覚する可能性がある。したがって、一部の実施形態では、リスナが2つの側の間の小さな遷移領域にいる間に、少量の非相関信号が修正されたステレオミックスに追加されてもよい。
【0079】
本開示の一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素のレンダリングがモノラルに崩れてしまうのを防止する追加の機能が提供される。例えば、
図2を参照すると、空間的にヘテロジーニアスなオーディオ要素101が、単一の方向(例えば、
図2の水平方向)にのみ空間的広がりを有する1次元オーディオ要素である場合、空間的にヘテロジーニアスなオーディオ要素101のレンダリングは、リスナ104が位置Eに移動すると、位置Eには空間的にヘテロジーニアスなオーディオ要素101の知覚される空間的広がりがないため、モノラルに崩れてしまう。これは、モノラルがリスナ104にとって不自然に聞こえる可能性があるため、望ましくない可能性がある。この崩壊を防止するために、本開示の実施形態では、規定された小さな領域内での空間的広がりの修正が防止されるように、位置Eの周りの空間幅または規定された小さな領域に下限を設けている。代替的または追加的に、この崩壊は、小さな遷移領域において、レンダリングされたオーディオ信号に少量の非相関信号を追加することによって防止することができる。これにより、モノラルへの不自然な崩壊が確実に生じなくなる。
【0080】
本開示の一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素のメタデータはまた、リスナの位置および/または向きが変化したときに、ステレオ像の異なるタイプの修正を適用すべきかどうかを示す情報を含むことができる。具体的には、特定のタイプの空間的にヘテロジーニアスなオーディオ要素については、リスナの位置および/または向きの変化に基づいて空間的にヘテロジーニアスなオーディオ要素の空間幅を変化させること、あるいはリスナが空間的にヘテロジーニアスなオーディオ要素の一方の側から空間的にヘテロジーニアスなオーディオ要素の反対側に移動するときに左右のチャネルを入れ替えることは望ましくない場合がある。また、特定のタイプのオーディオ要素については、空間的にヘテロジーニアスなオーディオ要素の空間的広がりを1つの次元だけに沿って修正することが望ましい場合がある。
【0081】
例えば、群集は、直線に沿って並ぶのではなく、通常は2D空間を占有する。したがって、空間的広がりが1次元でしか指定されていない場合、ユーザが群集の周りを移動するときに、群集の空間的にヘテロジーニアスなオーディオ要素のステレオ幅が著しく狭められるとすれば、極めて不自然になる。また、群集から来る空間的および時間的情報は、典型的にはランダムであり、あまり向き特有ではないため、群集の単一のステレオ録音は、任意の相対的なユーザ角度で群集を表現するのに完全に適している可能性がある。したがって、群集の空間的にヘテロジーニアスなオーディオ要素のためのメタデータには、群集の空間的にヘテロジーニアスなオーディオ要素のリスナの相対位置に変化があっても、群集の空間的にヘテロジーニアスなオーディオ要素のステレオ幅の修正を無効にすべきであることを示す情報が含まれていてもよい。代替的または追加的に、メタデータにはまた、リスナの相対位置に変化があった場合に、ステレオ幅の特定の修正を適用すべきであることを示す情報が含まれていてもよい。前述の情報はまた、高速道路、海、川などの巨大な現実の要素の知覚可能な部分のみを表す空間的にヘテロジーニアスなオーディオ要素のメタデータに含まれていてもよい。
【0082】
本開示の他の実施形態では、特定のタイプの空間的にヘテロジーニアスなオーディオ要素のメタデータには、空間的にヘテロジーニアスなオーディオ要素の空間的広がりを指定する位置依存、方向依存、または距離依存の情報が含まれていてもよい。例えば、群衆の音を表す空間的にヘテロジーニアスなオーディオ要素については、空間的にヘテロジーニアスなオーディオ要素のメタデータは、空間的にヘテロジーニアスなオーディオ要素のリスナが第1の基準点に位置するときの空間的にヘテロジーニアスなオーディオ要素の第1の特定の空間幅と、空間的にヘテロジーニアスなオーディオ要素のリスナが第1の基準点とは異なる第2の基準点に位置するときの空間的にヘテロジーニアスなオーディオ要素の第2の特定の空間幅と、を指定する情報を含むことができる。このようにして、観察角度特有の聴覚イベントはないが、観察角度特有の幅を有する空間的にヘテロジーニアスなオーディオ要素を効率的に表現することができる。
【0083】
前の段落で説明した本開示の実施形態は、1次元または2次元に沿って空間的にヘテロジーニアスな特性を有する空間的にヘテロジーニアスなオーディオ要素を使用して説明されているが、本開示の実施形態は、追加の次元のための対応するステレオ信号およびメタデータを追加することによって、3つ以上の次元に沿って空間的にヘテロジーニアスな特性を有する空間的にヘテロジーニアスなオーディオ要素に等しく適用可能である。言い換えれば、本開示の実施形態は、マルチチャネルステレオ音響信号、すなわち、ステレオ音響パニング技法を使用するマルチチャネル信号(したがって、ステレオ、5.1、7.x、22.2、VBAPなどを含む全スペクトル)によって表される空間的にヘテロジーニアスなオーディオ要素に適用可能である。追加的または代替的に、空間的にヘテロジーニアスなオーディオ要素は、1次アンビソニックスBフォーマット表現で表されてもよい。
【0084】
本開示のさらなる実施形態では、空間的にヘテロジーニアスなオーディオ要素を表すステレオ音響信号は、信号の冗長性が、例えば、ジョイントステレオ符号化技法を使用することによって利用されるように符号化される。この機能は、空間的にヘテロジーニアスなオーディオ要素を複数の個々のオブジェクトのクラスタとして符号化する場合と比較して、さらなる利点を提供する。
【0085】
本開示の実施形態では、表現されるべき空間的にヘテロジーニアスなオーディオ要素は、空間的に豊富であるが、空間的にヘテロジーニアスなオーディオ要素内の様々なオーディオソースの正確な位置決めは重要ではない。しかしながら、本開示の実施形態は、1つまたは複数の重要なオーディオソースを含む空間的にヘテロジーニアスなオーディオ要素を表現するために使用することもできる。そのような場合、重要なオーディオソースは、空間的にヘテロジーニアスなオーディオ要素のレンダリングにおいて、空間的にヘテロジーニアスなオーディオ要素に重ね合わされた個々のオブジェクトとして明示的に表現されてもよい。そのような場合の例は、ある声または音が一貫して目立つ群衆(例えば、誰かがメガホンで話している)あるいは犬が吠えているビーチのシーンである。
【0086】
図10は、一部の実施形態による、空間的にヘテロジーニアスなオーディオ要素をレンダリングするプロセス1000を示す。ステップs1002は、ユーザの現在の位置および/または現在の向きを取得することを含む。ステップs1004は、空間的にヘテロジーニアスなオーディオ要素の空間的な特性付けに関する情報を取得することを含む。ステップs1006は、ユーザの現在の位置および/または現在の向きにおいて、以下の情報、すなわち、空間的にヘテロジーニアスなオーディオ要素への方向および距離、空間的にヘテロジーニアスなオーディオ要素の知覚される空間的広がり、ならびに/あるいはユーザに対する仮想オーディオソースの位置を評価することを含む。ステップs1008は、仮想オーディオソースのレンダリングパラメータを評価することを含む。レンダリングパラメータは、ヘッドホンに配信するときの仮想オーディオソースのそれぞれについてのHRフィルタの設定情報、およびラウドスピーカ設定を介して配信するときの仮想オーディオソースのそれぞれについてのラウドスピーカパニング係数を含むことができる。ステップs1010は、マルチチャネルオーディオ信号を取得することを含む。ステップs1012は、マルチチャネルオーディオ信号およびレンダリングパラメータに基づいて仮想オーディオソースをレンダリングすること、およびヘッドホンまたはラウドスピーカ信号を出力することを含む。
【0087】
図11は、一実施形態によるプロセス1100を示す流れ図である。プロセス1100は、ステップs1102で開始することができる。
【0088】
ステップs1102は、空間的にヘテロジーニアスなオーディオ要素を表す2つ以上のオーディオ信号を取得することを含み、オーディオ信号の組合せが空間的にヘテロジーニアスなオーディオ要素の空間像を提供する。ステップs1104は、空間的にヘテロジーニアスなオーディオ要素に関連付けられたメタデータを取得することを含み、メタデータは、空間的にヘテロジーニアスなオーディオ要素の空間的広がりを示す空間的広がり情報を含む。ステップs1106は、i)空間的広がり情報と、ii)空間的にヘテロジーニアスなオーディオ要素に対するユーザの位置(例えば、仮想位置)および/または向きを示す位置情報と、を使用して空間的にヘテロジーニアスなオーディオ要素をレンダリングすることを含む。
【0089】
一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素の空間的広がりは、空間的にヘテロジーニアスなオーディオに対して第1の仮想位置または第1の仮想向きで知覚される、1つまたは複数の次元における空間的にヘテロジーニアスなオーディオ要素のサイズに対応する。
【0090】
一部の実施形態では、空間的広がり情報は、空間的にヘテロジーニアスなオーディオ要素の物理的サイズまたは知覚されるサイズを指定する。
【0091】
一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素をレンダリングすることは、空間的にヘテロジーニアスなオーディオ要素に対する(例えば、空間的にヘテロジーニアスなオーディオ要素の概念的な空間中心に対する)ユーザの位置および/または空間的にヘテロジーニアスなオーディオ要素の方向ベクトルに対するユーザの向きに基づいて、2つ以上のオーディオ信号のうちの少なくとも1つを修正することを含む。
【0092】
一部の実施形態では、メタデータは、i)マイクロフォン(例えば、仮想マイクロフォン)間の間隔、デフォルトの軸に対するマイクロフォンの向き、および/またはマイクロフォンのタイプを示すマイクロフォンセットアップ情報、ii)マイクロフォンと空間的にヘテロジーニアスなオーディオ要素との間の距離(例えば、マイクロフォンと空間的にヘテロジーニアスなオーディオ要素の概念的な空間中心との間の距離)および/または空間的にヘテロジーニアスなオーディオ要素の軸に対する仮想マイクロフォンの向きを示す第1の関係情報、ならびに/あるいはiii)空間的にヘテロジーニアスなオーディオ要素に対する(例えば、空間的にヘテロジーニアスなオーディオ要素の概念的な空間中心に対する)デフォルトの位置および/またはデフォルトの位置と空間的にヘテロジーニアスなオーディオ要素との間の距離を示す第2の関係情報をさらに含む。
【0093】
一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素をレンダリングすることは、修正されたオーディオ信号を生成することを含み、2つ以上のオーディオ信号は、オーディオ要素に対する第1の仮想位置および/または第1の仮想向きにおいて知覚される空間的にヘテロジーニアスなオーディオ要素を表し、修正されたオーディオ信号は、空間的にヘテロジーニアスなオーディオ要素に対する第2の仮想位置および/または第2の仮想向きにおいて知覚される空間的にヘテロジーニアスなオーディオ要素を表すために使用され、ユーザの位置が第2の仮想位置に対応し、および/またはユーザの向きが第2の仮想向きに対応する。
【0094】
一部の実施形態では、2つ以上のオーディオ信号は、左オーディオ信号(L)および右オーディオ信号(R)を含み、オーディオ要素をレンダリングすることは、修正された左信号(L’)および修正された右信号(R’)を生成することを含み、[L’R’]^T=H×[LR]^Tであり、ここで、Hは変換行列であり、変換行列は、取得したメタデータおよび位置情報に基づいて決定される。
【0095】
一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素をレンダリングするステップは、1つまたは複数の修正されたオーディオ信号を生成することと、修正されたオーディオ信号のうちの少なくとも1つを含むオーディオ信号のバイノーラルレンダリングと、を含む。
【0096】
一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素をレンダリングすることは、第1の出力信号(EL)および第2の出力信号(ER)を生成することを含み、ここで、EL=L’*HRTFLであり、HRTFLは、左耳に対する頭部伝達関数(または対応するインパルス応答)であり、ER=R’*HRTFRであり、HRTFRは、右耳に対する頭部伝達関数(または対応するインパルス応答)である。2つの出力信号の生成は、インパルス応答を使用したフィルタリング演算(畳み込み)による時間領域で、またはHRTFの適用による離散フーリエ変換(DFT)領域などの任意の変換領域で行うことができる。
【0097】
一部の実施形態では、2つ以上のオーディオ信号を取得することは、複数のオーディオ信号を取得することと、複数のオーディオ信号をアンビソニックスフォーマットに変換することと、変換された複数のオーディオ信号に基づいて2つ以上のオーディオ信号を生成することと、をさらに含む。
【0098】
一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素に関連付けられたメタデータは、空間的にヘテロジーニアスなオーディオ要素の概念的な空間中心、および/または空間的にヘテロジーニアスなオーディオ要素の方向ベクトルを指定する。
【0099】
一部の実施形態では、空間的にヘテロジーニアスなオーディオ要素をレンダリングするステップは、1つまたは複数の修正されたオーディオ信号を生成することと、修正されたオーディオ信号のうちの少なくとも1つを含むオーディオ信号を物理的なラウドスピーカ上にレンダリングすることと、を含む。
【0100】
一部の実施形態では、少なくとも1つの修正されたオーディオ信号を含むオーディオ信号は、仮想スピーカとしてレンダリングされる。
【0101】
図12は、一部の実施形態による、
図4に示すシステム400を実装するための装置1200のブロック図である。
図12に示すように、装置1200は、1つまたは複数のプロセッサ(P)1255(例えば、汎用マイクロプロセッサ、および/または特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)などの1つもしくは複数の他のプロセッサ)を含むことができる処理回路(PC)1202であって、これらのプロセッサが、単一のハウジング内または単一のデータセンタ内で同じ場所に位置してもよく、あるいは地理的に分散されていてもよい、処理回路(PC)1202と、装置1200が、ネットワークインターフェース1248が接続されたネットワーク110(例えば、インターネットプロトコル(IP)ネットワーク)に接続された他のノードとの間でデータを送受信することを可能にするための送信機(Tx)1245および受信機(Rx)1247を備えるネットワークインターフェース1248と、1つもしくは複数の不揮発性記憶デバイスおよび/または1つもしくは複数の揮発性記憶デバイスを含むことができるローカル記憶ユニット(別名「データ記憶システム」)1208と、を備えることができる。PC1202がプログラム可能なプロセッサを含む実施形態では、コンピュータプログラム製品(CPP)1241が提供されてもよい。CPP1241は、コンピュータ可読命令(CRI)1244を含むコンピュータプログラム(CP)1243を記憶するコンピュータ可読媒体(CRM)1242を含む。CRM1242は、磁気媒体(例えば、ハードディスク)、光媒体、メモリデバイス(例えば、ランダムアクセスメモリ、フラッシュメモリ)などの非一時的なコンピュータ可読媒体であってもよい。一部の実施形態では、コンピュータプログラム1243のCRI1244は、PC1202によって実行されると、CRIが装置1200に本明細書に記載されたステップ(例えば、流れ図を参照して本明細書に記載されたステップ)を実行させるように設定されている。他の実施形態では、装置1200は、コードを必要とせずに、本明細書に記載されたステップを実行するように設定されてもよい。すなわち、例えば、PC1202は、1つまたは複数のASICのみで構成されてもよい。したがって、本明細書に記載された実施形態の特徴は、ハードウェアおよび/またはソフトウェアで実施することができる。
【0102】
実施形態の概要
【0103】
A1.ユーザのために空間的にヘテロジーニアスなオーディオ要素をレンダリングするための方法であって、空間的にヘテロジーニアスなオーディオ要素を表す2つ以上のオーディオ信号を取得することであって、オーディオ信号の組合せが空間的にヘテロジーニアスなオーディオ要素の空間像を提供する、2つ以上のオーディオ信号を取得することと、空間的にヘテロジーニアスなオーディオ要素に関連付けられたメタデータを取得することであって、メタデータが空間的にヘテロジーニアスなオーディオ要素の空間的広がりを示す空間的広がり情報を含む、メタデータを取得することと、i)空間的広がり情報と、ii)空間的にヘテロジーニアスなオーディオ要素に対するユーザの位置(例えば、仮想位置)および/または向きを示す位置情報と、を使用してオーディオ信号のうちの少なくとも1つを修正し、それによって少なくとも1つの修正されたオーディオ信号を生成することと、修正されたオーディオ信号を使用して、空間的にヘテロジーニアスなオーディオ要素をレンダリングすることと、を含む、方法。
【0104】
A2.空間的にヘテロジーニアスなオーディオ要素の空間的広がりが、空間的にヘテロジーニアスなオーディオ要素に対する第1の仮想位置または第1の仮想向きにおいて知覚される1つまたは複数の次元における空間的にヘテロジーニアスなオーディオ要素のサイズに対応する、実施形態A1に記載の方法。
【0105】
A3.空間的広がり情報が、空間的にヘテロジーニアスなオーディオ要素の物理的サイズまたは知覚されるサイズを指定する、実施形態A1またはA2に記載の方法。
【0106】
A4.オーディオ信号のうちの少なくとも1つを修正することが、空間的にヘテロジーニアスなオーディオ要素に対する(例えば、空間的にヘテロジーニアスなオーディオ要素の概念的な空間中心に対する)ユーザの位置および/または空間的にヘテロジーニアスなオーディオ要素の方向ベクトルに対するユーザの向きに基づいて、オーディオ信号のうちの少なくとも1つを修正することを含む、実施形態A3に記載の方法。
【0107】
A5.メタデータが、i)マイクロフォン(例えば、仮想マイクロフォン)間の間隔、デフォルトの軸に対するマイクロフォンの向き、および/またはマイクロフォンのタイプを示すマイクロフォン設定情報、ii)マイクロフォンと空間的にヘテロジーニアスなオーディオ要素との間の距離(例えば、マイクロフォンと空間的にヘテロジーニアスなオーディオ要素の概念的な空間中心との間の距離)および/または空間的にヘテロジーニアスなオーディオ要素の軸に対する仮想マイクロフォンの向きを示す第1の関係情報、ならびに/あるいはiii)空間的にヘテロジーニアスなオーディオ要素に対する(例えば、空間的にヘテロジーニアスなオーディオ要素の概念的な空間中心に対する)デフォルトの位置、および/またはデフォルトの位置と空間的にヘテロジーニアスなオーディオ要素との間の距離を示す第2の関係情報をさらに含む、実施形態A1からA4のいずれか一項に記載の方法。
【0108】
A6.2つ以上のオーディオ信号が、空間的にヘテロジーニアスなオーディオ要素に対する第1の仮想位置および/または第1の仮想向きにおいて知覚される空間的にヘテロジーニアスなオーディオ要素を表し、修正されたオーディオ信号が、空間的にヘテロジーニアスなオーディオ要素に対する第2の仮想位置および/または第2の仮想向きにおいて知覚される空間的にヘテロジーニアスなオーディオ要素を表すために使用され、ユーザの位置が第2の仮想位置に対応し、および/またはユーザの向きが第2の仮想向きに対応する、実施形態A1からA5のいずれか一項に記載の方法。
【0109】
A7.2つ以上のオーディオ信号が左オーディオ信号(L)および右オーディオ信号(R)を含み、修正されたオーディオ信号が修正された左信号(L’)および修正された右信号(R’)を含み、[L’ R’]T=H×[L R]Tであり、ここでHは変換行列であり、変換行列が、取得したメタデータおよび位置情報に基づいて決定される、実施形態A1からA6のいずれか一項に記載の方法。
【0110】
A8.空間的にヘテロジーニアスなオーディオ要素をレンダリングすることが、第1の出力信号(EL)および第2の出力信号(ER)を生成することを含み、ここで、EL=L’*HRTFLであり、HRTFLは左耳の頭部伝達関数(または対応するインパルス応答)であり、ER=R’*HRTFRであり、HRTFRは右耳の頭部伝達関数(または対応するインパルス応答)である、実施形態A7に記載の方法。
【0111】
A9.2つ以上のオーディオ信号を取得することが、複数のオーディオ信号を取得することと、複数のオーディオ信号をアンビソニックスフォーマットに変換することと、変換された複数のオーディオ信号に基づいて2つ以上のオーディオ信号を生成することと、をさらに含む、実施形態A1からA8のいずれか一項に記載の方法。
【0112】
A10.空間的にヘテロジーニアスなオーディオ要素に関連付けられたメタデータが、オーディオ要素の概念的な空間中心および/または空間的にヘテロジーニアスなオーディオ要素の方向ベクトルを指定する、実施形態A1からA9のいずれか一項に記載の方法。
【0113】
A11.空間的にヘテロジーニアスなオーディオ要素をレンダリングするステップが、少なくとも1つの修正されたオーディオ信号を含むオーディオ信号のバイノーラルレンダリングを含む、実施形態A1からA10のいずれか一項に記載の方法。
【0114】
A12.空間的にヘテロジーニアスなオーディオ要素をレンダリングするステップが、少なくとも1つの修正されたオーディオ信号を含むオーディオ信号を物理的なラウドスピーカ上にレンダリングすることを含む、実施形態A1からA10のいずれか一項に記載の方法。
【0115】
A13.少なくとも1つの修正されたオーディオ信号を含むオーディオ信号が仮想スピーカとしてレンダリングされる、実施形態A11またはA12に記載の方法。
【0116】
本開示の様々な実施形態が本明細書に記載されているが(付録がある場合はそれも含む)、それらは限定ではなく、単なる例として提示されていることを理解されたい。したがって、本開示の広さおよび範囲は、上述した例示的な実施形態のいずれによっても限定されるべきではない。さらに、本明細書で別段の指示がない限り、さもなければ文脈によって明らかに矛盾しない限り、上述した要素のすべての可能な変形形態における任意の組合せは、本開示によって包含される。
【0117】
さらに、上述され、図面に示されたプロセスは、一連のステップとして示されているが、これは単に説明のために行われたものである。したがって、いくつかのステップが追加されてもよく、いくつかのステップが省略されてもよく、ステップの順序が並び替えられてもよく、いくつかのステップが並行して実行されてもよいことが企図される。