(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-26
(54)【発明の名称】オーディオ要素のレンダリング
(51)【国際特許分類】
H04S 7/00 20060101AFI20240918BHJP
【FI】
H04S7/00 320
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024517180
(86)(22)【出願日】2022-10-11
(85)【翻訳文提出日】2024-05-15
(86)【国際出願番号】 EP2022078174
(87)【国際公開番号】W WO2023061972
(87)【国際公開日】2023-04-20
(32)【優先日】2021-10-11
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】598036300
【氏名又は名称】テレフオンアクチーボラゲット エルエム エリクソン(パブル)
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】モラディ, アシュール チャムラン
(72)【発明者】
【氏名】ファルク, トミー
(72)【発明者】
【氏名】デ ブルーイン, ウェルナー
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA07
5D162AA11
5D162CA01
5D162CD25
5D162DA04
5D162EG04
(57)【要約】
オーディオ要素(例えば、空間的に異種のオーディオ要素)をレンダリングするための方法であって、前記オーディオ要素はある範囲を有し、中央仮想スピーカを備える仮想スピーカのセットを用いて表される、方法。この方法は、リスナーの位置に基づいて、中央仮想スピーカの位置を選択すること、および/または中央仮想スピーカの減衰係数を計算することを含む。
【選択図】
図8
【特許請求の範囲】
【請求項1】
オーディオ要素をレンダリングするための方法(800)であって、前記オーディオ要素は、範囲(200)を有し、中央仮想スピーカ(203)を含む仮想スピーカ(202、203、204)のセットを用いて表現され、前記方法は、
リスナーの位置に基づいて、前記中央仮想スピーカの位置を選択するステップ、および、前記中央仮想スピーカの減衰係数を計算するステップ、のうちの少なくともいずれかを含む(s802)、方法。
【請求項2】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の端点、または、ii)第1の仮想スピーカ、の位置とに基づいて、第1の角度を決定するステップと、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の、第2の端点、または、ii)第2の仮想スピーカ、の位置、とに基づいて、第2の角度を決定するステップと、
前記第1の角度および前記第2の角度を用いて前記中央仮想スピーカの第1の座標Mxを計算するステップであって、前記中央仮想スピーカの前記選択された位置が、前記計算された第1の座標によって少なくとも部分的に指定されるステップと、
を含む、請求項1に記載の方法。
【請求項3】
前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の第3の端点の、位置、またはii)第3の仮想スピーカ、とに基づいて、第3の角度を決定するステップと、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の、第4の端点、またはii)第4の仮想スピーカ、の位置とに基づいて、第4の角度を決定するステップと、
前記第3の角度および前記第4の角度を用いて前記中央仮想スピーカの第2の座標Myを計算するステップであって、前記選択された位置は、前記計算された第1の座標および第2の座標によって少なくとも部分的に指定されるステップと、
を更に含む、請求項2に記載の方法。
【請求項4】
前記第1の角度および前記第2の角度を用いて前記中央仮想スピーカの前記第1の座標Mxを計算するステップは、
前記第1の角度および前記第2の角度を用いて前記第1の係数α1を決定するステップと、
前記第1の端点と前記第2の端点との間、または前記第1の仮想スピーカと前記第2の仮想スピーカとの間、に延びる直線上の、決定されたアンカーポイントの位置を指定する際に使用される座標をAx、前記直線の中点を指定する際に使用される座標をMPxとするとき、Mx=(α1*Ax)+((1-α1)*MPx)を計算するステップと、
を含む、請求項2または3に記載の方法。
【請求項5】
前記第1の角度および前記第2の角度を用いてα1を決定するステップは、
前記第1の角度および前記第2の角度を用いて第1の重みxm_wを計算するステップと、前記第1の角度および前記第2の角度を用いて第2の重みzm_wを計算するステップと、xm_wおよびzm_wに基づいてα1を求めるステップと、を含む、請求項4に記載の方法。
【請求項6】
xm_wおよびzm_wに基づいてα1を求めるステップは、
所定の係数をdとするとき、d*xm_w*zm_wが1未満であるかを判定するステップと、
d*xm_w*zm_wが1未満でなければα1を1に設定し、そうでなければα1をd*xm_w*zm_wに設定するステップと、
含む、請求項5に記載の方法。
【請求項7】
前記第1の角度をλ、前記第2の角度をβとするとき、
前記第1の角度および前記第2の角度を用いてxm_wを計算するステップは、
xm_w=sin(λ)/sin(β)またはxm_w=sin(β)/sin(λ)
を計算するステップを含む、請求項5または6に記載の方法。
【請求項8】
前記第1の角度および前記第2の角度を用いてzm_wを計算するステップは、
zm_w=sin((λ+β)/2)
を計算するステップを含む、請求項5、6または7に記載の方法。
【請求項9】
前記第3の角度および前記第4の角度を用いて前記中央仮想スピーカの前記第2の座標Myを計算するステップは、
前記第3の角度および前記第4の角度を用いて第2の係数α2を求めるステップと、
前記第3の端点と前記第4の端点との間、または前記第3の仮想スピーカと前記第4の仮想スピーカとの間、に延びる直線上の決定されたアンカーポイントの位置を指定する際に使用される座標をAy、前記直線の中点を指定する際に使用される座標をMPyとするとき、
My=(α2*Ay)+((1-α2)*MPy)
を計算するステップと、
を含む、請求項3に記載の方法。
【請求項10】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
1)前記オーディオ要素の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の点と、前記オーディオ要素の、または前記範囲の、第2の点との間、または、2)第1の仮想スピーカと第2の仮想スピーカとの間、の第1の直線上の位置点を選択するステップであって、
i)前記リスナーの前記位置から前記第1の点または前記第1の仮想スピーカまで延びる第2の直線と、ii)前記リスナーの前記位置から前記第1の直線上の前記選択された位置点まで延びる第3の直線との間の角度が、i)前記リスナーの前記位置から前記第2の点または前記第2の仮想スピーカまで延びる第4の直線と、ii)前記第3の直線との間の角度に等しくなるように、前記位置点を選択するステップ、
を含む、請求項1に記載の方法。
【請求項11】
前記位置点を選択するステップは、
前記第2の直線の長さをv、
前記第3の直線の長さをw、
前記第1の点または前記第1の仮想スピーカの座標をRe、
前記第2の点または前記第2の仮想スピーカの座標をLe、
とするとき、
M=(v*Re+w*Le)/(v+w)、
を計算することによって、前記位置点の座標Mを計算するステップを含む、請求項10に記載の方法。
【請求項12】
前記選択された位置点に前記中央仮想スピーカを配置するステップを更に有する、請求項10または11に記載の方法。
【請求項13】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの減衰係数を計算するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの減衰係数を計算するステップは、
前記リスナーの前記位置と、i)前記オーディオ要素の第1の端点の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、位置、または、ii)第1の仮想スピーカの位置とに基づいて、第1の角度を決定するステップと、
前記リスナーの前記位置と、前記オーディオ要素の、または前記範囲の第2の端点の、位置、または、ii)第2の仮想スピーカの位置とに基づいて、第2の角度を決定するステップと、
前記第1の角度をλ、前記第2の角度をβ、前記減衰係数をεとするとき、ε=sin(λ)/sin(β)またはε=sin(β)/sin(λ)を計算するステップと、
を含む、請求項1から12のいずれか1項に記載の方法。
【請求項14】
前記中央仮想スピーカの信号Xを修正して、X’=ε*Xとなるように、修正された中央仮想スピーカ信号X’を生成するステップと、前記修正された中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングするステップを更に有する、請求項13に記載の方法。
【請求項15】
前記仮想スピーカのセットは、
前記第1の端点に配置された第1の仮想スピーカと、前記第2の端点に配置された第2の仮想スピーカとを更に含み、前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に有する、
請求項2から14のいずれか1項に記載の方法。
【請求項16】
前記仮想スピーカのセットは、
前記第1の端点に配置された第1の仮想スピーカと、前記第2の端点に配置された第2の仮想スピーカと、前記第3の端点に配置された第3の仮想スピーカと、前記第4の端点に配置された第4の仮想スピーカとを更に含み、前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に有する、
請求項3または9に記載の方法。
【請求項17】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
前記リスナーの前記位置から前記オーディオ要素の位置までの距離を求めるステップと、
前記求められた距離がしきい値より大きいかを判定するステップと、
前記求められた距離が前記しきい値よりも大きいと判定した結果として、前記オーディオ要素の中点または前記オーディオ要素の前記範囲に基づいて決定された範囲の中点の位置を選択するステップと、
を含む、請求項1に記載の方法。
【請求項18】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
i)前記リスナーの座標を示すリスナー情報を取得するステップと、
ii)前記オーディオ要素に関連する第1の点と前記オーディオ要素に関連する第2の点との間の中点の座標を示す中点情報を取得するステップと、
iii)前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップと、
を含む、請求項1に記載の方法。
【請求項19】
前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
i)アンカーポイントの座標を決定するステップと、
ii)前記中点情報と、前記決定された前記アンカーポイントの座標を示すアンカー情報とに基づいて、前記中央仮想スピーカの前記位置を選択するステップと、
を含む、請求項18に記載の方法。
【請求項20】
i)前記中点情報は前記中点の前記座標を示す中点値MPを含み、ii)前記アンカー情報は前記アンカーポイントの前記座標を示すアンカー値Aを含み、iii)前記中点情報と前記アンカー情報とに基づいて前記中央仮想スピーカの前記位置を選択するステップは、MPおよびAを用いて前記中央スピーカの座標値Mを計算するステップを含む、請求項19に記載の方法。
【請求項21】
前記アンカー値Aは、前記リスナーの前記示された座標に依存する、請求項20に記載の方法。
【請求項22】
前記リスナーの前記示された座標をLとするとき、A=Lである、請求項21に記載の方法。
【請求項23】
前記リスナーの前記示された座標に依存する係数をαとするとき、MPおよびAを用いてMを計算するステップはM=α*A+(1-α)*MPを計算するステップを含む、請求項20、21、または22に記載の方法。
【請求項24】
前記リスナー情報は前記リスナーの第2の座標を更に示し、前記中点情報は前記中点の第2の座標を更に示し、前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップは、前記リスナーの前記第2の座標と前記中点の前記第2の座標とに基づいて前記中央仮想スピーカの第2の座標を決定するステップを更に含む、請求項18から23のいずれか1項に記載の方法。
【請求項25】
第1の仮想スピーカが前記第1の点に配置され、第2の仮想スピーカが前記第2の点に配置され、
前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に含む、請求項10または18から24のいずれか1項に記載の方法。
【請求項26】
前記中央仮想スピーカの前記位置に基づいて、前記中央仮想スピーカの中央仮想スピーカ信号を生成するステップと、
前記中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングするステップと、
を更に含む、請求項1から25のいずれか1項に記載の方法。
【請求項27】
オーディオレンダラ(1400)の処理回路(1402)によって実行されると、前記オーディオレンダラに請求項1から26のいずれか1項に記載の方法を実行させる命令(1444)を含む、コンピュータプログラム(1443)。
【請求項28】
請求項27に記載のコンピュータプログラムを含むキャリアであって、前記キャリアは、電気信号、光信号、無線信号、およびコンピュータ読取り可能な記憶媒体(1442)のうちの1つである、キャリア。
【請求項29】
オーディオ要素をレンダリングするためのオーディオレンダリング装置(1400)であって、前記オーディオ要素は、範囲(200)を有し、中央仮想スピーカ(203)を含む仮想スピーカ(202、203、204)のセットを用いて表現され、
リスナーの位置に基づいて、前記中央仮想スピーカの位置を選択するステップ、および、前記中央仮想スピーカの減衰係数を計算するステップ、のうちの少なくともいずれかを行う(s802)、ように構成されている、オーディオレンダリング装置。
【請求項30】
前記オーディオレンダリング装置は、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の端点、または、ii)第1の仮想スピーカ、の位置とに基づいて、第1の角度を決定するステップと、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の、第2の端点、または、ii)第2の仮想スピーカ、の位置、とに基づいて、第2の角度を決定するステップ、
前記第1の角度および前記第2の角度を用いて前記中央仮想スピーカの第1の座標Mxを計算するステップであって、前記中央仮想スピーカの前記選択された位置が、前記計算された第1の座標によって少なくとも部分的に指定されるステップと、
によって、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択する、ように構成されている、請求項29に記載のオーディオレンダリング装置。
【請求項31】
前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の第3の端点の、位置、またはii)第3の仮想スピーカ、とに基づいて、第3の角度を決定するステップと、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の、第4の端点、またはii)第4の仮想スピーカ、の位置とに基づいて、第4の角度を決定するステップと、
前記第3の角度および前記第4の角度を用いて前記中央仮想スピーカの第2の座標Myを計算するステップであって、前記選択された位置は、前記計算された第1の座標および第2の座標によって少なくとも部分的に指定される、ステップと、
を更に含む、請求項30に記載のオーディオレンダリング装置。
【請求項32】
前記第1の角度および前記第2の角度を用いて前記中央仮想スピーカの前記第1の座標Mxを計算するステップは、
前記第1の角度および前記第2の角度を用いて前記第1の係数α1を決定するステップと、
前記第1の端点と前記第2の端点との間、または前記第1の仮想スピーカと前記第2の仮想スピーカとの間、に延びる直線上の、決定されたアンカーポイントの位置を指定する際に使用される座標をAx、前記直線の中点を指定する際に使用される座標をMPxとするとき、Mx=(α1*Ax)+((1-α1)*MPx)を計算するステップと、
を含む、請求項30または31に記載のオーディオレンダリング装置。
【請求項33】
前記第1の角度および前記第2の角度を用いてα1を決定するステップは、
前記第1の角度および前記第2の角度を用いて第1の重みxm_wを計算するステップと、前記第1の角度および前記第2の角度を用いて第2の重みzm_wを計算するステップと、xm_wおよびzm_wに基づいてα1を求めるステップと、を含む、請求項32に記載のオーディオレンダリング装置。
【請求項34】
xm_wおよびzm_wに基づいてα1を求めるステップは、
所定の係数をdとするとき、d*xm_w*zm_wが1未満であるかを判定するステップと、
d*xm_w*zm_wが1未満でなければα1を1に設定し、そうでなければα1をd*xm_w*zm_wに設定するステップと、
を含む、請求項33に記載のオーディオレンダリング装置。
【請求項35】
前記第1の角度をλ、前記第2の角度をβとするとき、
前記第1の角度および前記第2の角度を用いてxm_wを計算するステップは、
xm_w=sin(λ)/sin(β)またはxm_w=sin(β)/sin(λ)
を計算するステップを含む、請求項33または34に記載のオーディオレンダリング装置。
【請求項36】
前記第1の角度および前記第2の角度を用いてzm_wを計算するステップは、
zm_w=sin((λ+β)/2)
を計算するステップを含む、請求項33、34または35に記載のオーディオレンダリング装置。
【請求項37】
前記第3の角度および前記第4の角度を用いて前記中央仮想スピーカの前記第2の座標Myを計算するステップは、
前記第3の角度および前記第4の角度を用いて第2の係数α2を求めるステップと、
前記第3の端点と前記第4の端点との間、または前記第3の仮想スピーカと前記第4の仮想スピーカとの間、に延びる直線上の決定されたアンカーポイントの位置を指定する際に使用される座標をAy、前記直線の中点を指定する際に使用される座標をMPyとするとき、
My=(α2*Ay)+((1-α2)*MPy)
を計算するステップと、
を含む、請求項31に記載のオーディオレンダリング装置。
【請求項38】
1)前記オーディオ要素の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の点と、前記オーディオ要素の、または前記範囲の、第2の点との間、または、2)第1の仮想スピーカと第2の仮想スピーカとの間、の第1の直線上の位置点を選択するステップであって、
i)前記リスナーの前記位置から前記第1の点または前記第1の仮想スピーカまで延びる第2の直線と、ii)前記リスナーの前記位置から前記第1の直線上の前記選択された位置点まで延びる第3の直線との間の角度が、i)前記リスナーの前記位置から前記第2の点または前記第2の仮想スピーカまで延びる第4の直線と、ii)前記第3の直線との間の角度に等しくなるように、前記位置点を選択するステップ、
を行うことにより、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するように構成されている、請求項29に記載のオーディオレンダリング装置。
【請求項39】
前記位置点を選択するステップは、
前記第2の直線の長さをv、
前記第3の直線の長さをw、
前記第1の点または前記第1の仮想スピーカの座標をRe、
前記第2の点または前記第2の仮想スピーカの座標をLe、
とするとき、
M=(v*Re+w*Le)/(v+w)、
を計算することによって、前記位置点の座標Mを計算するステップを含む、請求項38に記載のオーディオレンダリング装置。
【請求項40】
前記オーディオレンダリング装置は、前記選択された位置点に前記中央仮想スピーカが位置するように更に構成されている、請求項38または39に記載のオーディオレンダリング装置。
【請求項41】
前記リスナーの前記位置と、i)前記オーディオ要素の第1の端点の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、位置、または、ii)第1の仮想スピーカの位置とに基づいて、第1の角度を決定するステップと、
前記リスナーの前記位置と、前記オーディオ要素の、または前記範囲の第2の端点の、位置、または、ii)第2の仮想スピーカの位置とに基づいて、第2の角度を決定するステップと、
前記第1の角度をλ、前記第2の角度をβ、前記減衰係数をεとするとき、ε=sin(λ)/sin(β)またはε=sin(β)/sin(λ)を計算するステップと、
を行うことにより、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記減衰係数を計算する、ように構成されている、請求項29から40のいずれか1項に記載のオーディオレンダリング装置。
【請求項42】
前記中央仮想スピーカの信号Xを修正して、X’=ε*Xとなるように、修正された中央仮想スピーカ信号X’を生成し、前記修正された中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングする、ように更に構成されている、請求項41に記載のオーディオレンダリング装置。
【請求項43】
前記仮想スピーカのセットは、
前記第1の端点に配置された第1の仮想スピーカと、前記第2の端点に配置された第2の仮想スピーカとを更に含み、前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に有する、請求項30から42のいずれか1項に記載のオーディオレンダリング装置。
【請求項44】
前記仮想スピーカのセットは、
前記第1の端点に配置された第1の仮想スピーカと、前記第2の端点に配置された第2の仮想スピーカと、前記第3の端点に配置された第3の仮想スピーカと、前記第4の端点に配置された第4の仮想スピーカとを更に含み、前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に有する、
請求項31または37に記載のオーディオレンダリング装置。
【請求項45】
前記リスナーの前記位置から前記オーディオ要素の位置までの距離を求めるステップと、
前記求められた距離がしきい値より大きいかを判定するステップと、
前記求められた距離が前記しきい値よりも大きいと判定した結果として、前記オーディオ要素の中点または前記オーディオ要素の前記範囲に基づいて決定された範囲の中点の位置を選択するステップと、
を行うことにより、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択する、ように構成されている、請求項29に記載のオーディオレンダリング装置。
【請求項46】
i)前記リスナーの座標を示すリスナー情報を取得するステップと、
ii)前記オーディオ要素に関連する第1の点と前記オーディオ要素に関連する第2の点との間の中点の座標を示す中点情報を取得するステップと、
iii)前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップと、
を行うことにより、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択する、ように構成されている、請求項29に記載のオーディオレンダリング装置。
【請求項47】
前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
i)アンカーポイントの座標を決定するステップと、
ii)前記中点情報と、前記決定された前記アンカーポイントの座標を示すアンカー情報とに基づいて、前記中央仮想スピーカの前記位置を選択するステップと、
を含む、請求項46に記載のオーディオレンダリング装置。
【請求項48】
i)前記中点情報は前記中点の前記座標を示す中点値MPを含み、ii)前記アンカー情報は前記アンカーポイントの前記座標を示すアンカー値Aを含み、iii)前記中点情報と前記アンカー情報とに基づいて前記中央仮想スピーカの前記位置を選択するステップは、MPおよびAを用いて前記中央スピーカの座標値Mを計算するステップを含む、請求項47に記載のオーディオレンダリング装置。
【請求項49】
前記アンカー値Aは、前記リスナーの前記示された座標に依存する、請求項48に記載のオーディオレンダリング装置。
【請求項50】
前記リスナーの前記示された座標をLとするとき、A=Lである、請求項49に記載のオーディオレンダリング装置。
【請求項51】
前記リスナーの前記示された座標に依存する係数をαとするとき、MPおよびAを用いてMを計算するステップはM=α*A+(1-α)*MPを計算するステップを含む、請求項48、49、または50に記載のオーディオレンダリング装置。
【請求項52】
前記リスナー情報は前記リスナーの第2の座標を更に示し、前記中点情報は前記中点の第2の座標を更に示し、前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップは、前記リスナーの前記第2の座標と前記中点の前記第2の座標とに基づいて前記中央仮想スピーカの第2の座標を決定するステップを更に含む、請求項46から51のいずれか1項に記載のオーディオレンダリング装置。
【請求項53】
第1の仮想スピーカが前記第1の点に配置され、第2の仮想スピーカが前記第2の点に配置され、
前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に含む、請求項38または46から51のいずれか1項に記載のオーディオレンダリング装置。
【請求項54】
前記中央仮想スピーカの前記位置に基づいて、前記中央仮想スピーカの中央仮想スピーカ信号を生成し、
前記中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングする、
ように更に構成されている、請求項29から53のいずれか1項に記載のオーディオレンダリング装置。
【発明の詳細な説明】
【技術分野】
【0001】
オーディオ要素のレンダリングに関する実施形態が開示される。
【背景技術】
【0002】
空間オーディオレンダリングは、エクステンデッドリアリティ(XR)シーン(例えば、仮想現実(VR)、拡張現実(AR)、複合現実(MR)シーン)内にオーディオを提示するために使用されるプロセスであり、特定の位置においてシーン内の物理的な音源から音が到来し、かつ、特定のサイズおよび形状(すなわち、範囲(extent))を有するかのような印象をリスナーに与える。提示は、ヘッドフォンスピーカまたはその他のスピーカを介して行われうる。提示がヘッドフォンスピーカを介して行われる場合、使用される処理は、バイノーラルレンダリングと呼ばれ、どの方向から音が到来しているかを特定することを可能にする人間の空間的聴力の空間的手がかり(spatial cues)を使用する。手がかりは、両耳間時間遅延(ITD)、両耳間レベル差(ILD)、および/またはスペクトル差を伴う。
【0003】
空間オーディオレンダリングの最も一般的な形態は、各音源が1つの特定の点から音を発するものと定義される点音源の概念に基づくものである。各音源は、1つの特定の点から音を発するように定義されるので、音源はいかなるサイズや形状を有しない。範囲(サイズおよび形状)を有する音源をレンダリングするために、異なる方法が開発されている。
【0004】
1つのそのような既知の方法は、オーディオ要素の周りの位置にモノラルオーディオ要素の複数のコピーを作成することである。この構成は、特定のサイズを有する空間的に均質な物体の知覚を作り出す。この概念は例えば、MPEG-H 3D Audio標準規格(参考文献[1]および[2]を参照)の「オブジェクト拡散(object spread)」および「オブジェクト発散(object divergence)」特徴、ならびにEBU Audio Definition Model(ADM)標準規格(参考文献[4]を参照)の「オブジェクト発散」特徴において使用される。モノラルオーディオ音源を使用するこのアイデアは、参考文献[7]に記載されているようにさらなる開発がされており、そこではサウンドオブジェクトの面積体積ジオメトリがリスナーの周りの球上に投射され、球上のオブジェクトの幾何学的投射をカバーする全てのHRフィルタの積分として評価される一対の頭部関連(HR)フィルタを用いて、サウンドがリスナーにレンダリングされる。球状体積音源の場合、この積分は分析解を有する。しかしながら、任意の面積体積音源ジオメトリの場合、積分は、いわゆるモンテカルロ光線サンプリングを用いて、球上の投影された音源表面をサンプリングすることによって評価される。
【0005】
別のレンダリング方法は、モノラルオーディオ信号に加えて空間的に拡散する成分をレンダリングするものであり、それは、原モノラルオーディオ要素とは対照的に、別個のピンポイント位置を有さない、幾分拡散するオブジェクトの知覚を作り出す。この概念は、例えば、MPEG-H 3D Audio標準規格の「オブジェクト拡散性(object diffuseness)」特徴(参考文献[3]参照)およびEBU ADMの「オブジェクト拡散性」特徴(参考文献[5]参照)において使用される。
【0006】
上記の2つの方法の組合せも知られている。例えば、EBU ADMの「オブジェクト範囲(object extent)」特徴は、モノラルオーディオ要素の複数のコピーの作成を、拡散成分の追加と組み合わせる(参考文献[6]参照)。
【0007】
多くの場合、オーディオ要素の実際の形状は基本的な形状(例えば、球体またはボックス)で十分に説明することができる。しかし、実際の形状はより複雑であり、より詳細な形式(例えば、メッシュ構造またはパラメトリック記述形式)で記述される必要がある場合がある。
【0008】
しかしながら、これらの方法は、別個の空間的に不均一な特性を有するオーディオ要素、すなわち、その空間的範囲内にある量の空間音源変動を有するオーディオ要素のレンダリングを可能にはしない。多くの場合、これらの音源は、多数の音源(例えば、森の音または歓声を上げる群衆の音)の総和で構成される。これらの既知の解決策の大部分は、空間的に均質な(すなわち、要素内に空間的な変動がない)、または空間的に拡散した特徴を有するオブジェクトを作成することができるだけであり、空間的に拡散した特徴は、説得力のある方法で上記の例のいくつかをレンダリングするにはあまりにも限られている。
【0009】
異種オーディオ要素の場合、参照文献[8]に記載されているように、オーディオ要素はその範囲にわたる空間変動を記述するために、少なくとも2つのオーディオチャネル(すなわち、オーディオ信号)を含む。これらの異種オーディオ要素をレンダリングするための技法が存在し、オーディオ要素はマルチチャネルオーディオ記録によって表され、レンダリングはいくつかの仮想スピーカを用いて、オーディオ要素およびその中の空間的変動を表す。オーディオ要素の範囲に対応する位置に仮想スピーカを配置することによって、オーディオ要素から発せられるオーディオの錯覚を伝えることができる。
【0010】
空間的異種オーディオ要素の妥当な空間的レンダリングを達成するために必要とされる仮想スピーカの個数は、オーディオ要素の範囲に依存する。空間的異種オーディオ要素が小さいか、またはリスナーからある距離にある場合、2スピーカセットアップで十分な場合がある。しかしながら、
図1に示されるように、リスナーに大きく及び/又は近いオーディオ要素については、2スピーカセットアップがあまりに疎であり、スピーカが遠く離れて配置されるので、左スピーカ(SP-L)と右スピーカ(SP-R)との間に心理音響ホール(psychoacoustical hole)を引き起こす可能性がある。3台目のセンタースピーカを追加することは、この効果を改善するのに役立つ。このため、ほとんどの標準化されたマルチチャネルスピーカセットアップではセンタースピーカが使用される。空間的異種オーディオ要素をレンダリングする最も簡単な方法はそのオーディオチャネルの各々を仮想スピーカとして表すことによるものであるが、スピーカの数はオーディオチャネルの数よりも少なくてもよいし多くてもよい。仮想スピーカの個数がオーディオチャネルの個数よりも少ない場合、各仮想スピーカの信号を導出するために、ダウンミキシングステップが必要とされる。仮想スピーカの個数がオーディオチャネルの個数よりも多い場合、各仮想スピーカの信号を導出するために、アップミキシングステップが必要とされる。1つの実装は、固定位置で2つの仮想スピーカを単に使用することである。
【発明の概要】
【発明が解決しようとする課題】
【0011】
現在、いくつかの課題が存在する。例えば、空間的異種オーディオ要素をレンダリングすることは、通常、いくつかの仮想スピーカを使用することを必要とする。多数のスピーカを使用することは範囲の均等に分散されたオーディオ表現を有するために有益でありうるが、音源信号が限られた数のチャネル(例えば、ステレオ信号)を有するとき、多数のスピーカへアップサンプリングすることは、より多くのスピーカを用いても空間品質が増加しない問題を引き起こしうる。また、多数の仮想スピーカを使用することは、望ましくない高い複雑さをもたらす。一方、あまりに少ない仮想スピーカを使用すると、オーディオ要素の空間特性が著しく損なわれ、レンダリングはもはや対応するオーディオ要素を良好に表すことができなくなる可能性がある。したがって、空間的異種オーディオ要素をレンダリングするために仮想スピーカの個数を選択することは、複雑さと品質との間のトレードオフである。
【0012】
2つのスピーカ間の心理音響ホールの前述の問題は周知であり、リスナーがスピーカのスイートスポットに正確に位置していない場合に特に問題となる。例えば、ホームシアターの使用のために設計された典型的なマルチスピーカセットアップは、リスナーがスイートスポットの周囲のどこかに位置するという前提のもとに構築される。これらのシステムでは左右のフロントスピーカの中央にセンタースピーカが配置されることが多いが、XRのオーディオレンダリングの場合、リスナーが6自由度で自由に動き回ることができるとき、静的スピーカセットアップは理想的ではない。特に、リスナーが音源の範囲に近づくと、心理音響ホールの問題が強調されうる。
【0013】
したがって、限られた数のスピーカで、どのようなリスニング位置でも機能する良好な空間表現を提供する静的スピーカセットアップを設計することには問題がある。
【課題を解決するための手段】
【0014】
したがって、一態様では、オーディオ要素(たとえば、空間的異種オーディオ要素)をレンダリングするための方法が提供される。オーディオ要素は、範囲を有し、中央仮想スピーカを含む仮想スピーカのセットを用いて表現される。方法は、リスナーの位置に基づいて、中央仮想スピーカの位置を選択するステップ、および、中央仮想スピーカの減衰係数を計算するステップ、のうちの少なくともいずれかを含む。
【0015】
別の態様では、オーディオレンダラの処理回路によって実行されると、オーディオレンダラに上述の方法を実行させる命令を含むコンピュータプログラムが提供される。一実施形態では、コンピュータプログラムを含むキャリアが提供される。キャリアは、電気信号、光信号、無線信号、およびコンピュータ読取り可能な記憶媒体のうちの1つである。別の態様では、上述の方法を実行するように構成されたレンダリング装置が提供される。レンダリング装置は、メモリと、メモリに結合された処理回路とを含みうる。
【0016】
本明細書に開示される実施形態の利点はそれらが、ある範囲を有する空間的異種オーディオ要素をレンダリングするための仮想スピーカの配置のための適応方法を提供することである。実施形態は、範囲にわたる空間分布が少数の仮想スピーカを用いて保存されるように、範囲の中央を表す仮想スピーカの位置を現在のリスナー位置に適応させることを可能にする。オーディオ要素の範囲にわたってスピーカを均等に分配するより単純な方法と比較して、実施形態は、多数の仮想スピーカを使用することなく、すべての聴取位置に対して機能するより効率的な解決策を提供する。
【図面の簡単な説明】
【0017】
本明細書に組み込まれ、本明細書の一部を形成する添付の図面は、様々な実施形態を示す。
【0018】
【0019】
【
図2A】例示的な仮想スピーカセットアップを示す図。
【0020】
【
図2B】心理音響ホールを生じうる例示的な仮想スピーカセットアップを示す図。
【0021】
【
図3】例示的な仮想スピーカセットアップを示す図。
【0022】
【
図4】中央スピーカが端部スピーカの近くに配置される例示的な仮想スピーカセットアップを示す図。
【0023】
【
図5】中央スピーカの好ましい位置がどのように決定されうるかの一実施形態を示す図。
【0024】
【
図6】中央スピーカの好ましい位置がどのように決定されうるかの別の実施形態を示す図。
【0025】
【
図7】オーディオ要素範囲が矩形形状であるときに、中央スピーカの好ましい位置がどのように決定されうるかの一実施形態を示す図。
【0026】
【
図8】いくつかの実施形態による処理を示すフローチャート。
【0027】
【
図9】いくつかの実施形態による処理を示すフローチャート。
【0028】
【
図10】いくつかの実施形態による処理を示すフローチャート。
【0029】
【
図11A】いくつかの実施形態によるシステムを示す図。
【
図11B】いくつかの実施形態によるシステムを示す図。
【0030】
【
図12】いくつかの実施形態によるシステムを示す図。
【0031】
【
図13】は、一実施形態による信号修正器を示す図。
【0032】
【
図14】いくつかの実施形態による装置のブロック図。
【発明を実施するための形態】
【0033】
本開示はとりわけ、範囲を有するオーディオ要素(たとえば、あるサイズおよび形状を有する空間的に異種のオーディオ要素)を表すために使用される仮想ラウドスピーカ(または略して「スピーカ」)の位置を適応させるための様々な方法を提案する。いくつかの(例えば、2つ以上の)スピーカを用いてオーディオ要素の外側端部を表し、オーディオ要素の端部またはオーディオ要素を表す簡略化された形状の端部の間に適応的に配置された少なくとも1つのスピーカ(以下、「中央スピーカ(middle speaker)」)を使用することによって、少数のスピーカを用いてオーディオ要素の範囲にわたって知覚的に均等に分配されたオーディオエネルギーを用いて最適化されたレンダリングを達成することができる。さらに、余分な中央スピーカおよびサイドスピーカのうちの1つとのオーバーラップに起因する望ましくない過剰エネルギーの潜在的な問題に対処する。
【0034】
概要
【0035】
目的は、どの聴取位置に対しても、音が範囲にわたって均等に分散されたようにリスナーによって知覚されるように、範囲を有するオーディオ要素をレンダリングすることである。実施形態は、可能な限り少ないスピーカを使用して心理音響ホールの問題を回避または低減する。
【0036】
いくつかの実施形態では、オーディオ要素の端部を表すスピーカのセットと、オーディオ要素の中央を表すように適応的に配置される中央スピーカとが、オーディオ要素をレンダリングするために使用され、中央スピーカの配置および/または中央スピーカの減衰係数(例えば、利得係数)は、リスニング位置(例えば、オーディオ要素に対する仮想空間内のリスナーの位置)を考慮に入れる。
【0037】
そのようなレンダリングセットアップの一例が
図2Aに示されており、これは、オーディオ要素を表す範囲200を示す。オーディオ要素を表す範囲200は、オーディオ要素の範囲であってもよいし(すなわち、範囲200はオーディオ要素の実際の範囲と同じサイズおよび形状を有する)、オーディオ要素の範囲(例えば、線または長方形)から導出される簡略化された範囲であってもよい。国際特許出願WO2021180820号は、そのような簡略化された範囲を生成するためのさまざまな方法を記載している。
【0038】
図2Aは、左スピーカ202が範囲200の左端点212に位置し、右スピーカ204が範囲の右端点214に位置し、中央スピーカ203が左端点と右端点との間のどこかに位置することをさらに示す。
【0039】
有利には、一実施形態では、リスナーがオーディオ要素から少なくともある距離(D)にあるとき、範囲の第1の端点と第2の端点との間の中点(MP)220またはその近くに中央スピーカ203が配置されるように、中央スピーカ203の位置決めが制御される。距離Dは、典型的には範囲200のサイズに依存する。
【0040】
図2Bに示されるように、リスナーがオーディオ要素の近くに移動するとき、中央スピーカ203を中点220またはその付近に維持することは、心理音響ホール240に関する問題につながり得る。したがって、この状況では、中央スピーカ203が
図3に示されるように、新しい位置に移動され、その結果、均一な空間分布が維持される。
【0041】
中央スピーカの適応配置
【0042】
本明細書のいくつかの実施形態は、リスナーの位置に基づいて、中央スピーカ203を適応的に位置決めする。多くの状況において、目的はオーディオ要素のための選択された「アンカーポイント」上に中央スピーカを配置することであり、このアンカーポイントは、リスナーと共に移動することができる。例えば、一実施形態では、アンカーポイントは、リスナーに最も近い範囲200の点である。しかし、他の実施形態では、アンカーポイントは異なるように定義することができる。国際特許出願WO2021180820は、オーディオ要素のためのアンカーポイントを選択するための異なる方法を記載している。しかしながら、中央スピーカをアンカーポイント上に配置することは有利とは言えない状況がある。
【0043】
例えば、リスナーがオーディオ要素の端部の1つに近いとき、中央スピーカがアンカーポイント上に配置された場合、中央スピーカおよび対応するサイドスピーカは重なり合い、
図4に示されるように、対応するサイドからのエネルギーの望ましくない増加をもたらす。この状況では、より均等に分散されたオーディオエネルギーを有するために、中央スピーカを、左右の端点(例えば、左右のスピーカの位置)の間の中点により近く配置することが有利である。
【0044】
別の例として、リスナーとオーディオ要素との間の距離がしきい値(このしきい値はオーディオ要素の範囲に依存し得る)よりも大きいとき、実験は、中央スピーカを中点220により近く配置することが知覚的により重要な出力を与えることを示す。
【0045】
要約すると、リスナーが範囲に近いが範囲の端部の1つには接近していなければ、通常は、中央スピーカをアンカーポイントに配置することが好ましい。他のリスニング位置において、好ましい中央スピーカ位置は、中点220またはその付近である。
【0046】
したがって、提案する実施形態は、現在の聴取位置に応じて位置を最適化する、中央スピーカの適応配置を提供する。
【0047】
より具体的には、一実施形態では、アンカー位置が端部スピーカのうちの1つに近いとき、中央スピーカをアンカーポイントに配置することが回避される。したがって、アンカーポイント(A)590(
図5参照)を考慮することに加えて、中央スピーカ203の位置決めは、中点(MP)220にも依存し得る。
【0048】
一実施形態では、線599上の、範囲200の1つの端点(例えば、左端点212)から範囲200の別の端点(例えば、右端点214)に向かう、「M」591で示される中央スピーカ203の好ましい位置では、式(1)を用いて計算される。
M=α*A+(1-α)*MP (式1)
ここで、Aは線599上のアンカーポイントの位置であり、MPは線599上の中点の位置であり、α∈[0,1]は、線599上の中央スピーカの位置決めにおけるアンカーポイントおよび中点の重みを制御する係数である。
【0049】
αの値は、リスナーが範囲に近く、範囲の端部に近くないとき、Mはアンカーポイントの近くまたは上にあり(α→1)、リスナーが範囲200の端部に近いまたは範囲から遠いとき、Mは中点の近くまたは上にある(α→0)ようなものである。したがって、αは、同時に、x方向およびz方向の両方におけるリスナーの動きを考慮に入れる。点M591が決定されると、中央スピーカ203は、点Mに「配置」されうる。すなわち、中央スピーカ203の位置は点Mに設定される。
【0050】
一実施形態において、αは、xm_wおよびzm_wの2つの変数の関数である。すなわち、
α=f(xm_w、zm_w) (式2)
【0051】
第1の変数xm_wは、リスナーのx方向の動きを反映する重みであり、zm_w、リスナーのz方向の動きを反映する重みである。
図5に示すパラメータβおよびλは、xm_wおよびzm_wの値を設定するために使用される。
【0052】
一実施形態において、xm_wは、λおよびβの関数である。すなわち、
【数1】
【0053】
式3および
図5から、範囲200のいずれかの端部に向かってリスナーが移動すると、λ→0またはβ→0となり、したがって、xm_w→0であることがわかる。同様に、リスナーが中央に向かって移動すると、λおよびβは互いに近づき、xm_wは1に近づく。
【0054】
Z方向の重みzm_wも、λおよびβの関数である。すなわち、
zm_w=f2(λ,β)=sin((λ+β)/2) (式4)
【0055】
式(4)および
図5から、リスナーが範囲に近づくほどλおよびβが大きくなり、非常に近い距離では、λ+βが180度に近づき、したがってzm_wは1に近づき、リスナーが範囲から遠ざかるほどλおよびβが小さくなり、したがってzm_wが0に近づくことがわかる。
【0056】
一実施形態において、αは次式により定義される。
α=f3(xm_w,zm_w)=min(1,d*xm_w*zm_w) (式5)
【0057】
ここで、d∈(0,+∞)は、ファクタαを制御するチューニングファクタである。実験によれば、d≒2.2が望ましい結果が得られる。上記のαの導出は、範囲に対するリスナーの相対位置を表す情報を用いる単なる1つの方法である。λおよびβを用いる他の方法(例えば、λおよびβのコサインまたはタンジェント)、または、範囲に対するリスナーの相対位置を反映することができる他のパラメータ(例えば、リスナー、中点、アンカーポイント、範囲の左右端、の座標)を使用してαを導出してもよい。
【0058】
リスナーがオーディオ要素の端にいるときの過剰なエネルギーに対処するための別のアプローチは、その位置を変更する代わりに、中央スピーカを通して再生される信号のエネルギーを減衰させることでありうる。すなわち、中央スピーカ203はアンカーポイントに配置されるが、中央スピーカ203のためのオーディオ信号はリスナーがオーディオ要素の端部に近づくときに減衰される。そうするために、
図5に記載の角度は、以下のように使用されうる。
【数2】
【0059】
ここで、Xは中央スピーカ203のオリジナルの時間ドメインオーディオ信号であり、X’は中央スピーカ203によって再生される時間ドメイン信号である。このアプローチによれば、過剰エネルギー問題が軽減されるものの、オーディオ要素の空間的知覚は改善されない場合がある。
【0060】
等角度に基づく中央スピーカの適応配置
【0061】
別の実施形態において、中央スピーカの配置が左右の端点に対する角度によってのみ制御される。
図6において、これらの角度は、それぞれφ=λ+θおよびΦ=β-θである。一実施形態において、Φ=φとなるように点M591が選択される。リスナーとアンカーポイントとの間の距離(dA)が既知である場合、点M591から点212までの距離(dM)は、dM=dA*(tan(λ)+tan(θ))を計算することによって求めることができ、したがって、点Mのx座標は、左端点212+dMのx座標に等しい。
【0062】
dAは未知であるが、v(リスナーと左端点212との距離)およびw(リスナーと右端点214との間の距離)が既知である場合、点Mの位置は、M=(v*Re+w*Le)/(v+w)を計算することによって求めることができる。ただし、Reは右端点214のx座標、Leは左端点212のx座標である。
【0063】
中央スピーカの2次元における適応配置
【0064】
上で提供された例は、1次元のオーディオ要素範囲を示すものであった。上述の技法は例えば、
図7に示される範囲700のような2次元のオーディオ要素範囲にも適用される。この例では、範囲700が矩形形状を有し、4つの端点、すなわち、上端点701、右端点702、下端点703、および左端点704が定義される。この例では、各端点について、端点は、その端点が位置する辺の中点に位置する。したがって、左端点704は範囲700の左上隅と左下隅との間のちょうど中間、右端点702は範囲700の右上隅と右下隅との間のちょうど中間、上端点701は範囲700の左上隅と右上隅との間のちょうど中間、下端点703は範囲700の左下隅と右下隅との間のちょうど中間、の位置にある。
【0065】
一実施形態において、それぞれ定義された端点701~704について、スピーカをその点に配置することができる。したがって、一実施形態では、4つのスピーカがこの2次元平面700の上端、下端、左端、および右端を表すために使用される。別の実施形態では、スピーカが平面700の各隅点に配置される。
【0066】
加えて、中央スピーカを使用することもでき、既に説明したのと同じ原理を用いて中央スピーカを配置することができる。すなわち、以下を計算することにより、中央スピーカの座標(Mx,My)を求めることができる。
Mx=αx*A1x+(1-αx)*MPx、
My=αy*A2y+(1-αy)*MPy
ただし、αx=f3(xm_w,zm1_w)、αy=f3(ym_w,zm2_w)、A1xはアンカーポイントA1のx座標、A2yはアンカーポイントA2のy座標、MPxは中点のx座標、MPyは中点のy座標、xm_w=f1(λx,βx)、ym_w=f1(λy,βy)、zm1_w=f2(λx,βx)、zm2_w=f2(λy,βy)である。
【0067】
図8は、オーディオ要素(例えば、空間的に異種のオーディオ要素)をレンダリングするための、一実施形態による処理800を示すフローチャートである。オーディオ要素は、範囲を有し、中央仮想スピーカを含む仮想スピーカのセットを用いて表される。処理800は、ステップs802で開始される。ステップs802は、リスナーの位置に基づいて、中央仮想スピーカの位置を選択すること、および/または、中央仮想スピーカの減衰係数を計算することを含む。
【0068】
図9は、オーディオ要素(例えば、空間的に異種のオーディオ要素)をレンダリングするための、一実施形態による処理900を示すフローチャートである。オーディオ要素は、範囲を有し、中央仮想スピーカを含む仮想スピーカのセットを用いて表される。処理900は、ステップs902で開始される。
【0069】
ステップs902は、オーディオ要素のアンカーポイントを選択することを含む。典型的には、アンカーポイントは、オーディオ要素に関連する範囲の第1の端点(例えば、オーディオ要素の実際の範囲またはオーディオ要素の簡略化された範囲)を通過する直線上にあり、範囲の第2の端点およびアンカーポイントはリスナーの位置に依存する。オーディオ要素が複雑な範囲を有するいくつかの実施形態では、アンカーポイントを選択することはリスナー位置およびオーディオ要素の範囲に基づいてオーディオ要素の簡略化された範囲を作成するためのプロセスの一部である。
【0070】
ステップs904は、第1のスピーカ(例えば、右スピーカ)を配置するステップと、第2のスピーカ(例えば、左スピーカ)を配置するステップとを含む。すなわち、第1および第2のスピーカの位置が決定される。一実施形態において、スピーカが範囲の対向する端部に配置される。すなわち、左スピーカは範囲の左端点に位置し、右スピーカは範囲の右端点に位置する。オーディオ要素に関連付けられた範囲が長方形である実施形態では、スピーカは長方形の各隅に配置される。
【0071】
ステップs906は、2つのスピーカ間の中点を決定することを含む。
【0072】
ステップs908は、リスナーからアンカーポイントまでの直線とリスナーから左スピーカまでの直線との間の第1の角度(λ)と、リスナーからアンカーポイントまでの直線とリスナーから右スピーカまでの直線との間の第2の角度(β)とを求めることを含む(λおよびβの例を
図5に示す)。
【0073】
ステップs910は、x重み値(xm_w)およびz重み値(zm_w)を求めること(例えば、xm_w=f1(λ,β)およびzm_w=f2(λ,β)を計算すること)を含む。
【0074】
ステップs912は、xm_wおよびzm_wに基づいて係数(α)を決定することを含む。すなわち、αはxm_wとzm_wの関数である(例えば、α=f3(xm_w,zm_w))。
【0075】
ステップs914は、M=α*A+(1-α)*MPを計算することを含む。ここで、Mは中央スピーカの好ましい位置のx座標、Aはアンカーポイントのx座標、MPは左右のスピーカ間の中点のx座標である。
【0076】
図10は、オーディオ要素(例えば、空間的に異種のオーディオ要素)をレンダリングするための、一実施形態による処理1000を示すフローチャートである。オーディオ要素は、範囲を有し、中央仮想スピーカを含む仮想スピーカのセットを用いて表される。処理1000は、ステップs1002で開始される。
【0077】
ステップs1002は、オーディオ要素のアンカーポイントを選択することを含む(上記のステップs902を参照)。
【0078】
ステップs1004は、第1のスピーカ(例えば、右スピーカ)を配置するステップと、第2のスピーカ(例えば、左スピーカ)を配置するステップとを含む。すなわち、第1および第2のスピーカの位置が決定される(上記のステップs904を参照)。
【0079】
ステップs1006は、リスナーからアンカーポイントまでの直線とリスナーから左スピーカまでの直線との間の第1の角度(λ)と、リスナーからアンカーポイントまでの直線とリスナーから右スピーカまでの直線との間の第2の角度(β)とを求めることを含む(λおよびβの例を
図5に示す)。
【0080】
ステップs1008は、λおよびβを用いてゲインファクタ(g)を計算することを含む。例えば、g=f4(λ,β)である。
【0081】
ステップs1010は、ゲインファクタ(g)を用いて中央スピーカの信号(X)を処理して、修正信号X’を生成することを含む。例えば、X’=g*Xである。
【0082】
使用例
【0083】
図11Aは、本明細書に開示される実施形態が適用されうるXRシステム1100を示す。XRシステム1100は、スピーカ1104および1105(リスナーによって装着されるヘッドホンのスピーカでありうる)と、画像をユーザに表示するためのディスプレイを含み、いくつかの実施形態ではリスナーによって装着されるように構成されるXRデバイス1110とを含む。図示のXRシステム1100において、XRデバイス1110は、ディスプレイを有しユーザの頭部に装着されるように設計されたものであり、一般にヘッドマウントディスプレイ(HMD)と呼ばれる。
【0084】
図11Bに示されるように、XRデバイス1110は、出力オーディオ信号(例えば、図示されるように、左スピーカのための左オーディオ信号1181および右スピーカのための右オーディオ信号1182)を生成するためにオーディオレンダ1151に(直接または間接的に)結合された、方位検知部1101と、位置検知部1102と、処理部1103とを備えうる。
【0085】
方位検知部1101は、リスナーの向きの変化を検出し、検出された変化に関する情報を処理部1103に提供するように構成される。いくつかの実施形態では、処理1103は、方位検知部1101によって検出された向きの検出された変化を考慮して、(いくつかの座標系に関して)絶対方位を決定する。また、例えば、ライトハウス(lighthouse)トラッカー(ライダー)を使用するシステムなど、向きおよび位置を判定するための異なるシステムが存在しうる。一実施形態では、方位検知部1101は、検出された向きの変化が与えられた場合、(ある座標系に関連して)絶対方位を決定することができる。この場合、処理部1103は、方位検知部1101からの絶対方位データと位置検知部1102からの位置データとを単に多重化することができる。いくつかの実施形態では、方位検知部1101は、1つ以上の加速度計および/または1つ以上のジャイロスコープを備えうる。
【0086】
オーディオレンダラ1151は、入力オーディオ信号1161と、リスナーが経験しているXRシーンに関するメタデータ1162と、リスナーの位置および向きに関する情報1163とに基づいて、オーディオ出力信号を生成する。XRシーンのためのメタデータ1162は、XRシーンに含まれる各オブジェクトおよびオーディオ要素のためのメタデータを含み、オブジェクトのためのメタデータは、オブジェクトの次元に関する情報を含みうる。メタデータ1162はまた、残響時間値、残響レベル値、吸収パラメータなどのうちの少なくともいずれかの制御情報を含みうる。オーディオレンダラ1151は、XRデバイス1110の構成要素であってもよいし、XRデバイス1110に対してリモートにあってもよい(例えば、オーディオレンダラ1151またはその構成要素がいわゆる「クラウド」に実装されうる)。
【0087】
図12は、XRシーンのためのサウンドを生成するためのオーディオレンダラ1151の例示的な実装形態を示す。オーディオレンダラ1151は、コントローラ1201と、コントローラ1201からの制御情報1210に基づいてオーディオ信号1161(例えば、マルチチャネルオーディオ要素のオーディオ信号)を修正するための信号修正器1202とを含む。コントローラ1201は、1つ以上のパラメータを受信し、受信されたパラメータに基づいてオーディオ信号1161の修正を実行する(例えば、音量レベルを増減させる)ように信号修正器1202をトリガするように構成されうる。受信されたパラメータは、リスナーの位置および/または方位(例えば、オーディオ要素に対する方向および距離)に関する情報1163と、XRシーン内のオーディオ要素(例えば、範囲200)に関するメタデータ1162とを含む(いくつかの実施形態では、コントローラ1201それ自体がメタデータ1162を生成する)。メタデータおよび位置/方向情報を用いて、コントローラ1201は本明細書で説明するように、XRシーン内のオーディオ要素の1つ以上のゲインファクタ(g)(減衰ファクタとしても知られる)を計算することができる。
【0088】
図13は、一実施形態による信号修正器1202の例示的な実装を示す。信号修正器1202は、方向ミキサー1304と、ゲイン調整器1306と、スピーカ信号生成器1308とを含む。
【0089】
方向ミキサーは、オーディオ入力1161を受信し、この例では、オーディオ要素(例えば、範囲200または700に関連付けられたオーディオ要素)に関連付けられた一対のオーディオ信号1301および1302を含み、オーディオ入力および制御情報1391に基づいて、k個の仮想スピーカ信号(VS1、VS2、…、VSk)のセットを生成する。一実施形態において、各仮想スピーカの信号が例えば、オーディオ入力1161を含む信号の適切な混合によって導出されうる。例えば、VS1=α×L+β×Rである。ただし、Lは入力オーディオ信号1301、Rは入力オーディオ信号1302、αおよびβは例えば、オーディオ要素に対するリスナーの位置およびVS1が対応する仮想スピーカの位置に依存する係数である。
【0090】
ゲイン調整器1306は、コントローラ1301によって計算された上述のゲインファクタを含みうる制御情報1392に基づいて、仮想スピーカ信号のうちの任意の1つ以上のゲインを調整することができる。すなわち、例えば、中央スピーカ203が別のスピーカ(例えば、
図4に示す左スピーカ202)の近くに配置されるとき、コントローラ1301は、ゲイン調整器1306に上述のように計算されたゲインファクタを与えることによって、中央スピーカ203に対する仮想スピーカ信号のゲインを調整するようにゲイン調整器1306を制御しうる。
【0091】
仮想スピーカ信号VS1、VS2、…、VSkを用いて、スピーカ信号生成器1308は、スピーカ(例えば、ヘッドホンスピーカまたは他のスピーカ)を駆動するための出力信号(例えば、出力信号1181および出力信号1182)を生成する。スピーカがヘッドホンスピーカである一実施形態では、スピーカ信号生成器1308は、出力信号を生成するために従来のバイノーラルレンダリングを実行することができる。スピーカがヘッドホンスピーカではない実施形態では、スピーカ信号生成器は、出力信号を生成するために従来のスピーカパンニングを実行することができる。
【0092】
図14は、いくつかの実施形態による、本明細書に開示される方法を実行するための、オーディオレンダリング装置1400のブロック図である(例えば、オーディオレンダラ1151は、オーディオレンダリング装置1400を用いて実装されうる)。
図14に示すように、オーディオレンダリング装置1400は、処理回路(PC)1402を備える。処理回路(PC)1402は、1つ以上のプロセッサ(P)1455(例えば、汎用マイクロプロセッサおよび/または特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)などの1つ以上の他のプロセッサ)を含みうる。複数のプロセッサは、単一の筐体内または単一のデータセンタ内に共同配置されてもよいし、地理的に分散されてもよい(すなわち、オーディオレンダリング装置1400は分散コンピューティング装置でありうる)。オーディオレンダリング装置1400は、少なくとも1つのネットワークインタフェース1448を備える。少なくとも1つのネットワークインタフェース1448は、ネットワークインタフェース1448が(直接的または間接的に)接続されるネットワーク110(例えば、インターネットプロトコル(IP)ネットワーク)に接続された他のノードにデータを送受信することを可能にするための、送信機(Tx)1445および受信機(Rx)1447を備えうる。その場合、ネットワークインターフェース1448は、ネットワーク110にワイヤレスに接続されうる。ネットワークインタフェース1448は、アンテナ装置と、1つ以上の不揮発性記憶装置および/または1つ以上の揮発性記憶装置を含みうる記憶部(「データ記憶システム」とも呼ばれる)1408とに接続される。PC1402がプログラマブルプロセッサを含む実施形態では、コンピュータ読取り可能な記憶媒体(CRM)1442が提供されうる。CRM1442は、コンピュータ読取り可能な命令(CRI)1444を含むコンピュータプログラム(CP)1443を格納する。CRM1442は、磁気媒体(例えば、ハードディスク)、光媒体、メモリデバイス(例えば、ランダムアクセスメモリ、フラッシュメモリ)などの非一時的コンピュータ読取り可能な記憶媒体でありうる。いくつかの実施形態では、コンピュータプログラム1443のCRI1444がPC1402によって実行されるとCRIがオーディオレンダリング装置1400に、本明細書で説明するステップ(例えば、フローチャートを参照して本明細書で説明するステップ)を実行させるように構成される。他の実施形態では、オーディオレンダリング装置1400がコードを必要とせずに、本明細書で説明するステップを実行するように構成されうる。すなわち、例えば、PC1402は、1つ以上のASICのみから構成されうる。したがって、本明細書で説明される実施形態の特徴は、ハードウェアおよびソフトウェアの少なくともいずれかによって実装されうる。
【0093】
様々な実施形態の概要
【0094】
A1.オーディオ要素(例えば、空間的に異種のオーディオ要素)をレンダリングするための方法であって、前記オーディオ要素は、範囲を有し、中央仮想スピーカを含む仮想スピーカのセットを用いて表現され、前記方法は、リスナーの位置に基づいて、前記中央仮想スピーカの位置を選択するステップ、および、前記中央仮想スピーカの減衰係数を計算するステップ、のうちの少なくともいずれかを含む、方法。
【0095】
A2.前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の端点、または、ii)第1の仮想スピーカ、の位置とに基づいて、第1の角度を決定するステップと、前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の、第2の端点、または、ii)第2の仮想スピーカ、の位置、とに基づいて、第2の角度を決定するステップと、前記第1の角度および前記第2の角度を用いて前記中央仮想スピーカの第1の座標Mxを計算するステップであって、前記中央仮想スピーカの前記選択された位置が、前記計算された第1の座標によって少なくとも部分的に特定されるステップ、とを含む、実施形態A1の方法。
【0096】
A3.前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の第3の端点の、位置、またはii)第3の仮想スピーカ、とに基づいて、第3の角度を決定するステップと、前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の、第4の端点、またはii)第4の仮想スピーカ、の位置とに基づいて、第4の角度を決定するステップと、 記第3の角度および前記第4の角度を用いて、前記中央仮想スピーカの第2の座標Myを計算するするステップであって、前記選択された位置は、前記計算された第1および第2の座標によって少なくとも部分的に指定されるステップと、を更に含む、実施形態A2に記載の方法。
【0097】
A4.前記第1の角度および前記第2の角度を用いて前記中央仮想スピーカの前記第1の座標Mxを計算するステップは、前記第1の角度および前記第2の角度を用いて前記第1の係数α1を決定するステップと、前記第1の端点と前記第2の端点との間、または前記第1の仮想スピーカと前記第2の仮想スピーカとの間、に延びる直線上の、決定されたアンカーポイントの位置を指定する際に使用される座標をAx、前記直線の中点を指定する際に使用される座標をMPxとするとき、Mx=(α1*Ax)+((1-α1)*MPx)を計算するステップと、を含む、実施形態A2またはA3に記載の方法。
【0098】
A5.前記第1の角度および前記第2の角度を用いてα1を決定するステップは、前記第1の角度および前記第2の角度を用いて第1の重みxm_wを計算するステップと、前記第1の角度および前記第2の角度を用いて第2の重みzm_wを計算するステップと、xm_wおよびzm_wに基づいてα1を求めるステップと、を含む、実施形態A4に記載の方法。
【0099】
A6.xm_wおよびzm_wに基づいてα1を求めるステップは、所定の係数をdとするとき、d*xm_w*zm_wが1未満であるかを判定するステップと、d*xm_w*zm_wが1未満でなければα1を1に設定し、そうでなければα1をd*xm_w*zm_wに設定するステップと、含む、実施形態A5に記載の方法。
【0100】
A7.前記第1の角度をλ、前記第2の角度をβとするとき、前記第1の角度および前記第2の角度を用いてxm_wを計算するステップは、xm_w=sin(λ)/sin(β)またはxm_w=sin(β)/sin(λ)を計算するステップを含む、実施形態A5またはA6に記載の方法。
【0101】
A8.前記第1の角度および前記第2の角度を用いてzm_wを計算するステップは、zm_w=sin((λ+β)/2)を計算するステップを含む、実施形態A5、A6またはA7に記載の方法。
【0102】
A9.前記第3の角度および前記第4の角度を用いて前記中央仮想スピーカの前記第2の座標Myを計算するステップは、前記第3の角度および前記第4の角度を用いて第2の係数α2を求めるステップと、前記第3の端点と前記第4の端点との間(または前記第3の仮想スピーカと前記第4の仮想スピーカとの間)に延びる直線上の決定されたアンカーポイントの位置を指定する際に使用される座標をAy、前記直線の中点を指定する際に使用される座標をMPyとするとき、My=(α2*Ay)+((1-α2)*MPy)を計算するステップと、を含む、実施形態A3に記載の方法。
【0103】
A10.前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、1)前記オーディオ要素の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の点(例えば、第1の端点)と、前記オーディオ要素の、または前記範囲の、第2の点(例えば、第2の端点)との間、または、2)第1の仮想スピーカと第2の仮想スピーカとの間、の第1の直線上の位置点を選択するステップであって、i)前記リスナーの前記位置から前記第1の点(または前記第1の仮想スピーカ)まで延びる第2の直線と、ii)前記リスナーの前記位置から前記第1の直線上の前記選択された位置点まで延びる第3の直線との間の角度が、i)前記リスナーの前記位置から前記第2の点(または前記第2の仮想スピーカ)まで延びる第4の直線と、ii)前記第3の直線との間の角度に等しくなるように、前記位置点を選択するステップ、を含む、実施形態A1の方法。
【0104】
A11.前記位置点を選択するステップは、前記第2の直線の長さをv、前記第3の直線の長さをw、前記第1の点または前記第1の仮想スピーカの座標をRe、前記第2の点または前記第2の仮想スピーカの座標をLe、とするとき、M=(v*Re+w*Le)/(v+w)、を計算することによって、前記位置点の座標Mを計算するステップを含む、実施形態A10に記載の方法。
【0105】
A12.前記選択された位置点に前記中央仮想スピーカを配置するステップを更に有する、実施形態A10またはA11に記載の方法。
【0106】
A13.前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの減衰係数を計算するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの減衰係数を計算するステップは、前記リスナーの前記位置と、i)前記オーディオ要素の第1の端点の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、位置、または、ii)第1の仮想スピーカの位置とに基づいて、第1の角度を決定するステップと、前記リスナーの前記位置と、前記オーディオ要素の、または前記範囲の第2の端点、の位置、または、ii)第2の仮想スピーカの位置とに基づいて、第2の角度を決定するステップと、前記第1の角度をλ、前記第2の角度をβ、前記減衰係数をεとするとき、ε=sin(λ)/sin(β)またはε=sin(β)/sin(λ)を計算するステップと、を含む、実施形態A1~A12のいずれか1つに記載の方法。
【0107】
A14.前記中央仮想スピーカの信号Xを修正して、X’=ε*Xとなるように、修正された中央仮想スピーカ信号X’を生成するステップと、前記修正された中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングする(例えば、前記中央仮想スピーカ信号を用いて出力信号を生成する)ステップを更に有する、実施形態A13に記載の方法。
【0108】
A15.前記仮想スピーカのセットは、前記第1の端点に配置された第1の仮想スピーカと、前記第2の端点に配置された第2の仮想スピーカとを更に含み、前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に有する、実施形態A2~A14のいずれか1つに記載の方法。
【0109】
A16.前記仮想スピーカのセットは、前記第1の端点(例えば、第1の隅点、または隅点の第1の対の間の中点である第1の点)に配置された第1の仮想スピーカと、前記第2の端点(例えば、第2の隅点、または隅点の別の対の間の中点である第2の点)に配置された第2の仮想スピーカと、前記第3の端点(例えば、第3の隅点、または隅点の別の対の間の中点である第3の点)に配置された第3の仮想スピーカと、前記第4の端点(例えば、第4の隅点、または隅点の別の対の間の中点である第4の点)に配置された第4の仮想スピーカとを更に含み、前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に有する、実施形態A3またはA9に記載の方法。
【0110】
A17.前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、前記リスナーの前記位置から前記オーディオ要素の位置までの距離を求めるステップと、前記求められた距離がしきい値より大きいかを判定するステップと、前記求められた距離が前記しきい値よりも大きいと判定した結果として、前記オーディオ要素の中点または前記オーディオ要素の前記範囲に基づいて決定された範囲の中点の位置を選択するステップと、を含む、実施形態A1に記載の方法。
【0111】
A18.前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、i)前記リスナーの座標(例えば、x座標)を示すリスナー情報を取得するステップと、ii)前記オーディオ要素に関連する第1の点(例えば、前記オーディオ要素に関連付けられた範囲の第1の端点)と前記オーディオ要素に関連する第2の点(例えば、前記範囲の第2の端点)との間の中点の座標(例えば、x座標)を示す中点情報を取得するステップと、iii)前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップと、を含む、実施形態A1の方法。
【0112】
A19.前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップは、i)アンカーポイントの座標を決定するステップと、ii)前記中点情報と、前記決定された前記アンカーポイントの座標を示すアンカー情報とに基づいて、前記中央仮想スピーカの前記位置を選択するステップと、を含む、実施形態A18に記載の方法。
【0113】
A20.i)前記中点情報は前記中点の前記座標を示す中点値MPを含み、ii)前記アンカー情報は前記アンカーポイントの前記座標を示すアンカー値Aを含み、iii)前記中点情報と前記アンカー情報とに基づいて前記中央仮想スピーカの前記位置を選択するステップは、MPおよびAを用いて前記中央スピーカの座標値Mを計算するステップを含む、実施形態A19に記載の方法。
【0114】
A21.前記アンカー値Aは、前記リスナーの前記示された座標に依存する、実施形態A20に記載の方法。
【0115】
A22.前記リスナーの前記示された座標(
図5及び
図6に示すように、座標系は前記範囲がx軸に沿って延びるように、前記範囲に対して定義されうる)をLとするとき、A=Lである、実施形態A21の方法。
【0116】
A23.前記リスナーの前記示された座標に依存する係数をαとするとき、MPおよびAを用いてMを計算するステップはM=α*A+(1-α)*MPを計算するステップを含む、実施形態A20、A21、またはA22に記載の方法。
【0117】
A24.前記リスナー情報は前記リスナーの第2の座標(例えば、y座標)を更に示し、前記中点情報は前記中点の第2の座標(例えば、y座標)を更に示し、前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップは、前記リスナーの前記第2の座標と前記中点の前記第2の座標とに基づいて前記中央仮想スピーカの第2の座標を決定するステップを更に含む、実施形態A18~A23のいずれか1つに記載の方法。
【0118】
A25.第1の仮想スピーカが前記第1の点に配置され、第2の仮想スピーカが前記第2の点に配置され、前記方法は、前記仮想スピーカの前記位置を識別する情報を用いて前記オーディオ要素をレンダリングするステップを更に含む、実施形態A10またはA18~A24のいずれか1つに記載の方法。
【0119】
A26.前記中央仮想スピーカの前記位置に基づいて、前記中央仮想スピーカの中央仮想スピーカ信号を生成するステップと、前記中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングする(例えば、前記中央仮想スピーカ信号を用いて出力信号を生成する)ステップと、を更に含む、実施形態A1~A25のいずれか1つに記載の方法。
【0120】
B1.オーディオレンダラの処理回路によって実行されると、前記オーディオレンダラに上記実施形態のいずれか1つに記載の方法を実行させる命令を含む、コンピュータプログラム。
【0121】
B2.前記コンピュータプログラムを含むキャリアであって、前記キャリアは、電気信号、光信号、無線信号、およびコンピュータ読取り可能な記憶媒体のうちの1つである、キャリア。
【0122】
C1.上記実施形態のいずれか1つの方法を実行するように構成された、オーディオレンダリング装置。
【0123】
C2.前記オーディオレンダリング装置は、メモリと、前記メモリに結合された処理回路とを備える、実施形態C1に記載のオーディオレンダリング装置。
【0124】
様々な実施形態が本明細書に記載されているがそれらは、限定ではなく単なる例として提示されていることを理解されたい。したがって、本開示の幅および範囲は、上述の例示的な実施形態のいずれによって限定されるべきではない。さらに、本明細書に別段の指示がない限り、または文脈によって明らかに矛盾しない限り、そのすべての可能な変形形態における上記の目的の任意の組合せが、本開示によって包含される。
【0125】
加えて、上で説明され、図面に示された処理は、一連の工程として示されているが、これは単に例示のために行われたものである。したがって、何らかの工程が追加されてもよいし、いくつかの工程が省略されてもよいし、工程の順序が再配置されてもよいし、いくつかの工程が並行して実行されてもよい。
【0126】
参考文献
【0127】
[1]MPEG-H 3D オーディオ、第8.4.4.7節:「Spreading」
【0128】
[2]MPEG-H 3D オーディオ、第18.1節:「Element Metadata Preprocessing」
【0129】
[3]MPEG-H 3D オーディオ、第18.11節:「Diffuseness Rendering」
【0130】
[4]EBU ADM Renderer Tech 3388、第7.3.6節:「Divergence」
【0131】
[5]EBU ADM Renderer Tech 3388、Clause 7.4:「Decorrelation Filters」
【0132】
[6]EBU ADM Renderer Tech 3388、Clause 7.3.7:「Extent Panner」
【0133】
[7]Efficient HRTF-based Spatial Audio for Area and Volumetric Sources、 IEEE Transactions on Visualization and Computer Graphics 22(4):1-1 January 2016
【0134】
[8]特許公開WO2020144062「Efficient spatially-heterogeneous audio elements for Virtual Reality」
【0135】
[9]特許公開WO2021180820「Rendering of Audio Objects with a Complex Shape」
【手続補正書】
【提出日】2024-05-15
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
オーディオ要素をレンダリングするための方法(800)であって、前記オーディオ要素は、範囲(200)を有し、中央仮想スピーカ(203)を含む仮想スピーカ(202、203、204)のセットを用いて表現され、前記方法は、
リスナーの位置に基づいて、前記中央仮想スピーカの位置を選択するステップ、および、前記中央仮想スピーカの減衰係数を計算するステップ、のうちの少なくともいずれかを含む(s802)、方法。
【請求項2】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の端点、または、ii)第1の仮想スピーカ、の位置とに基づいて、第1の角度を決定するステップと、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の、第2の端点、または、ii)第2の仮想スピーカ、の位置、とに基づいて、第2の角度を決定するステップと、
前記第1の角度および前記第2の角度を用いて前記中央仮想スピーカの第1の座標Mxを計算するステップであって、前記中央仮想スピーカの前記選択された位置が、前記計算された第1の座標によって少なくとも部分的に指定されるステップと、
を含む、請求項1に記載の方法。
【請求項3】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
1)前記オーディオ要素の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の点と、前記オーディオ要素の、または前記範囲の、第2の点との間、または、2)第1の仮想スピーカと第2の仮想スピーカとの間、の第1の直線上の位置点を選択するステップであって、
i)前記リスナーの前記位置から前記第1の点または前記第1の仮想スピーカまで延びる第2の直線と、ii)前記リスナーの前記位置から前記第1の直線上の前記選択された位置点まで延びる第3の直線との間の角度が、i)前記リスナーの前記位置から前記第2の点または前記第2の仮想スピーカまで延びる第4の直線と、ii)前記第3の直線との間の角度に等しくなるように、前記位置点を選択するステップ、
を含む、請求項1に記載の方法。
【請求項4】
前記位置点を選択するステップは、
前記第2の直線の長さをv、
前記第3の直線の長さをw、
前記第1の点または前記第1の仮想スピーカの座標をRe、
前記第2の点または前記第2の仮想スピーカの座標をLe、
とするとき、
M=(v*Re+w*Le)/(v+w)、
を計算することによって、前記位置点の座標Mを計算するステップを含む、請求項
3に記載の方法。
【請求項5】
前記選択された位置点に前記中央仮想スピーカを配置するステップを更に有する、請求項
3に記載の方法。
【請求項6】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの減衰係数を計算するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの減衰係数を計算するステップは、
前記リスナーの前記位置と、i)前記オーディオ要素の第1の端点の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、位置、または、ii)第1の仮想スピーカの位置とに基づいて、第1の角度を決定するステップと、
前記リスナーの前記位置と、
i)前記オーディオ要素の、または前記範囲の第2の端点の、位置、または、ii)第2の仮想スピーカの位置とに基づいて、第2の角度を決定するステップと、
前記第1の角度をλ、前記第2の角度をβ、前記減衰係数をεとするとき、ε=sin(λ)/sin(β)またはε=sin(β)/sin(λ)を計算するステップと、
を含む、請求項1
に記載の方法。
【請求項7】
前記中央仮想スピーカの信号Xを修正して、X’=ε*Xとなるように、修正された中央仮想スピーカ信号X’を生成するステップと、前記修正された中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングするステップを更に有する、請求項
6に記載の方法。
【請求項8】
前記方法は、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップを有し、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
i)前記リスナーの座標を示すリスナー情報を取得するステップと、
ii)前記オーディオ要素に関連する第1の点と前記オーディオ要素に関連する第2の点との間の中点の座標を示す中点情報を取得するステップと、
iii)前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップと、
を含む、請求項1に記載の方法。
【請求項9】
前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
i)アンカーポイントの座標を決定するステップと、
ii)前記中点情報と、前記決定された前記アンカーポイントの座標を示すアンカー情報とに基づいて、前記中央仮想スピーカの前記位置を選択するステップと、
を含む、請求項
8に記載の方法。
【請求項10】
i)前記中点情報は前記中点の前記座標を示す中点値MPを含み、ii)前記アンカー情報は前記アンカーポイントの前記座標を示すアンカー値Aを含み、iii)前記中点情報と前記アンカー情報とに基づいて前記中央仮想スピーカの前記位置を選択するステップは、MPおよびAを用いて前記中央
仮想スピーカの座標値Mを計算するステップを含む、請求項
9に記載の方法。
【請求項11】
前記中央仮想スピーカの前記位置に基づいて、前記中央仮想スピーカの中央仮想スピーカ信号を生成するステップと、
前記中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングするステップと、
を更に含む、請求項1から
10のいずれか1項に記載の方法。
【請求項12】
オーディオ要素をレンダリングするためのオーディオレンダリング装置(1400)であって、前記オーディオ要素は、範囲(200)を有し、中央仮想スピーカ(203)を含む仮想スピーカ(202、203、204)のセットを用いて表現され、
リスナーの位置に基づいて、前記中央仮想スピーカの位置を選択するステップ、および、前記中央仮想スピーカの減衰係数を計算するステップ、のうちの少なくともいずれかを行う(s802)、ように構成されている、オーディオレンダリング装置。
【請求項13】
前記オーディオレンダリング装置は、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の端点、または、ii)第1の仮想スピーカ、の位置とに基づいて、第1の角度を決定するステップと、
前記リスナーの前記位置と、i)前記オーディオ要素のまたは前記範囲の、第2の端点、または、ii)第2の仮想スピーカ、の位置、とに基づいて、第2の角度を決定するステップ、
前記第1の角度および前記第2の角度を用いて前記中央仮想スピーカの第1の座標Mxを計算するステップであって、前記中央仮想スピーカの前記選択された位置が、前記計算された第1の座標によって少なくとも部分的に指定されるステップと、
によって、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択する、ように構成されている、請求項
12に記載のオーディオレンダリング装置。
【請求項14】
1)前記オーディオ要素の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、第1の点と、前記オーディオ要素の、または前記範囲の、第2の点との間、または、2)第1の仮想スピーカと第2の仮想スピーカとの間、の第1の直線上の位置点を選択するステップであって、
i)前記リスナーの前記位置から前記第1の点または前記第1の仮想スピーカまで延びる第2の直線と、ii)前記リスナーの前記位置から前記第1の直線上の前記選択された位置点まで延びる第3の直線との間の角度が、i)前記リスナーの前記位置から前記第2の点または前記第2の仮想スピーカまで延びる第4の直線と、ii)前記第3の直線との間の角度に等しくなるように、前記位置点を選択するステップ、
を行うことにより、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択するように構成されている、請求項
12に記載のオーディオレンダリング装置。
【請求項15】
前記位置点を選択するステップは、
前記第2の直線の長さをv、
前記第3の直線の長さをw、
前記第1の点または前記第1の仮想スピーカの座標をRe、
前記第2の点または前記第2の仮想スピーカの座標をLe、
とするとき、
M=(v*Re+w*Le)/(v+w)、
を計算することによって、前記位置点の座標Mを計算するステップを含む、請求項
14に記載のオーディオレンダリング装置。
【請求項16】
前記オーディオレンダリング装置は、前記選択された位置点に前記中央仮想スピーカが位置するように更に構成されている、請求項
14に記載のオーディオレンダリング装置。
【請求項17】
前記リスナーの前記位置と、i)前記オーディオ要素の第1の端点の、または前記オーディオ要素の前記範囲に基づいて決定された範囲の、位置、または、ii)第1の仮想スピーカの位置とに基づいて、第1の角度を決定するステップと、
前記リスナーの前記位置と、前記オーディオ要素の、または前記範囲の第2の端点の、位置、または、ii)第2の仮想スピーカの位置とに基づいて、第2の角度を決定するステップと、
前記第1の角度をλ、前記第2の角度をβ、前記減衰係数をεとするとき、ε=sin(λ)/sin(β)またはε=sin(β)/sin(λ)を計算するステップと、
を行うことにより、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記減衰係数を計算する、ように構成されている、請求項
12に記載のオーディオレンダリング装置。
【請求項18】
前記中央仮想スピーカの信号Xを修正して、X’=ε*Xとなるように、修正された中央仮想スピーカ信号X’を生成し、前記修正された中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングする、ように更に構成されている、請求項
17に記載のオーディオレンダリング装置。
【請求項19】
i)前記リスナーの座標を示すリスナー情報を取得するステップと、
ii)前記オーディオ要素に関連する第1の点と前記オーディオ要素に関連する第2の点との間の中点の座標を示す中点情報を取得するステップと、
iii)前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップと、
を行うことにより、前記リスナーの前記位置に基づいて前記中央仮想スピーカの前記位置を選択する、ように構成されている、請求項
12に記載のオーディオレンダリング装置。
【請求項20】
前記中点情報および前記リスナー情報に基づいて前記中央仮想スピーカの前記位置を選択するステップは、
i)アンカーポイントの座標を決定するステップと、
ii)前記中点情報と、前記決定された前記アンカーポイントの座標を示すアンカー情報とに基づいて、前記中央仮想スピーカの前記位置を選択するステップと、
を含む、請求項
19に記載のオーディオレンダリング装置。
【請求項21】
i)前記中点情報は前記中点の前記座標を示す中点値MPを含み、ii)前記アンカー情報は前記アンカーポイントの前記座標を示すアンカー値Aを含み、iii)前記中点情報と前記アンカー情報とに基づいて前記中央仮想スピーカの前記位置を選択するステップは、MPおよびAを用いて前記中央
仮想スピーカの座標値Mを計算するステップを含む、請求項
20に記載のオーディオレンダリング装置。
【請求項22】
前記中央仮想スピーカの前記位置に基づいて、前記中央仮想スピーカの中央仮想スピーカ信号を生成し、
前記中央仮想スピーカ信号を用いて前記オーディオ要素をレンダリングする、
ように更に構成されている、請求項
12から
20のいずれか1項に記載のオーディオレンダリング装置。
【国際調査報告】