IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー・インターナショナル・アーベーの特許一覧

特表2024-521689仮想現実環境においてオーディオソースの指向性を制御するための方法およびシステム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-04
(54)【発明の名称】仮想現実環境においてオーディオソースの指向性を制御するための方法およびシステム
(51)【国際特許分類】
   H04S 7/00 20060101AFI20240528BHJP
【FI】
H04S7/00 300
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023571739
(86)(22)【出願日】2022-05-10
(85)【翻訳文提出日】2024-01-16
(86)【国際出願番号】 EP2022062543
(87)【国際公開番号】W WO2022243094
(87)【国際公開日】2022-11-24
(31)【優先権主張番号】21174024.6
(32)【優先日】2021-05-17
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】63/189,269
(32)【優先日】2021-05-17
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】510185767
【氏名又は名称】ドルビー・インターナショナル・アーベー
(74)【代理人】
【識別番号】100101683
【弁理士】
【氏名又は名称】奥田 誠司
(74)【代理人】
【識別番号】100155000
【弁理士】
【氏名又は名称】喜多 修市
(74)【代理人】
【識別番号】100188813
【弁理士】
【氏名又は名称】川喜田 徹
(74)【代理人】
【識別番号】100202197
【弁理士】
【氏名又は名称】村瀬 成康
(72)【発明者】
【氏名】テレンティブ,レオン
(72)【発明者】
【氏名】ファーシュ,クリストフ
(72)【発明者】
【氏名】セティアワン,パンジー
(72)【発明者】
【氏名】フィッシャー,ダニエル
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA11
5D162BA01
5D162BA14
5D162EG02
(57)【要約】
仮想現実レンダリング環境(180)におけるオーディオソース(211、212、213)のオーディオ信号をレンダリングするための方法(700)を記載する。方法(700)は、仮想現実レンダリング環境(180)内の聴取者(181)の聴取状況に対して、オーディオソース(211、212、213)の指向性パターン(232)が考慮されるべきであるかどうかを判断する工程(701)を含む。さらに、方法(700)は、聴取者(181)の聴取状況に対して、オーディオソース(211、212、213)の指向性パターン(232)が考慮されるべきでないと判断された場合、オーディオソース(211、212、213)の指向性パターン(232)を考慮せずに、オーディオソース(211、212、213)のオーディオ信号をレンダリングする工程(702)を含む。他方、方法(700)は、聴取者(181)の聴取状況に対して、指向性パターン(232)が考慮されるべきであると判断された場合、オーディオソース(211、212、213)の指向性パターン(232)に依存して、オーディオソース(211、212、213)のオーディオ信号をレンダリングする工程(703)を含む。
【選択図】図7
【特許請求の範囲】
【請求項1】
仮想現実レンダリング環境におけるオーディオソースのオーディオ信号をレンダリングするための方法であって、前記方法は、
前記仮想現実レンダリング環境内の聴取者の聴取位置からの前記オーディオソースのソース位置の距離を決定する工程と、
前記距離に基づいて、前記仮想現実レンダリング環境内の前記聴取者の聴取状況に対して、前記オーディオソースの指向性パターンが考慮されるべきであるかどうかを判断する工程と、
前記聴取者の前記聴取状況に対して、前記オーディオソースの前記指向性パターンが考慮されるべきでないと判断された場合、前記オーディオソースの前記指向性パターンを考慮せずに、前記オーディオソースのオーディオ信号をレンダリングする工程と、
前記聴取者の前記聴取状況に対して、前記指向性パターンが考慮されるべきであると判断された場合、前記オーディオソースの前記指向性パターンに依存して、前記オーディオソースの前記オーディオ信号をレンダリングする工程と、
を包含する、方法。
【請求項2】
前記方法は、
前記聴取状況を記述する1つまたは複数のパラメータを決定する工程と、
前記1つまたは複数のパラメータに基づいて、前記オーディオソースの前記指向性パターンが考慮されるべきであるかどうかを判断する工程と、
を包含する、請求項1に記載の方法。
【請求項3】
前記1つまたは複数のパラメータは、
前記オーディオソースの前記ソース位置と前記聴取者の前記聴取位置との間の前記距離、
前記オーディオ信号の周波数、
前記オーディオ信号がレンダリングされるべき時刻、
前記仮想現実レンダリング環境内の前記オーディオソースに関にする、前記聴取者の向きおよび/または視線方向および/または軌跡、
前記オーディオ信号をレンダリングするためのレンダラの条件、特に計算リソースに関する条件、および/または、
前記仮想現実レンダリング環境に関する前記聴取者の動作、
を含む、請求項2に記載の方法。
【請求項4】
前記方法は、
前記聴取位置からの前記オーディオソースの前記ソース位置の前記距離が近距離場閾値よりも小さいと判断する工程、および、
これに反応して、前記オーディオソースの前記指向性パターンが考慮されるべきでないと判断する工程、および/または、
前記聴取位置からの前記オーディオソースの前記ソース位置の前記距離が前記近距離場閾値よりも大きいと判断する工程、および
これに反応して、前記オーディオソースの前記指向性パターンが考慮されるべきであると判断する工程、
を包含する、請求項1から3のいずれかに記載の方法。
【請求項5】
前記方法は、
前記聴取位置からの前記オーディオソースの前記ソース位置の前記距離が遠距離場閾値よりも大きいと判断する工程、および、
これに反応して、前記オーディオソースの前記指向性パターンが考慮されるべきでないと判断する工程、および/または、
前記聴取位置からの前記オーディオソースの前記ソース位置の前記距離が前記遠距離場閾値よりも小さいと判断する工程、および、
これに反応して、前記オーディオソースの前記指向性パターンが考慮されるべきであると判断する工程、
を包含する、請求項1から4のいずれかに記載の方法。
【請求項6】
前記近接場閾値および/または前記遠隔場閾値は、指向性制御関数に依存し、
前記指向性制御関数は、前記距離の関数としての制御値を与え、かつ、
前記制御値は、前記指向性パターンが考慮されるべき程度を示す、請求項1から5のいずれかに記載の方法。
【請求項7】
前記方法は、
指向性制御関数に基づいて、前記聴取状況に対する制御値を決定する工程であって、前記指向性制御関数は、異なる聴取状況に対して異なる制御値を与える、工程と、
前記制御値に基づいて、前記オーディオソースの前記指向性パターンが考慮されるべきであるかどうかを判断する工程と、
を包含する、請求項1から6のいずれかに記載の方法。
【請求項8】
前記方法は、
前記制御値を制御閾値と比較する工程と、
前記比較に基づいて、特に前記制御値が前記制御閾値よりも大きいか、または、小さいかの何れであるかに依存して、前記オーディオソースの前記指向性パターンが考慮されるべきであるかどうかを判断する工程と、
を包含する、請求項7に記載の方法。
【請求項9】
前記指向性制御関数は、最小値と最大値との間の制御値を与えるように構成され、
特に、前記最小値は、0であり、および/または、前記最大値は、1であり、
前記制御閾値は、前記最小値と前記最大値との間に存在し、かつ、
前記方法は、
前記聴取状況に対する前記制御値が前記制御閾値よりも小さい場合、前記オーディオソースの前記指向性パターンが考慮されるべきでないと判断する工程、および/または、
前記聴取状況に対する前記制御値が前記制御閾値よりも大きい場合、前記オーディオソースの前記指向性パターンが考慮されるべきであると判断する工程、
を包含する、請求項8に記載の方法。
【請求項10】
前記指向性制御関数は、
前記聴取者の前記聴取位置からの前記オーディオソースの前記ソース位置の前記距離が近接場閾値よりも小さい、および/または、
前記聴取者の前記聴取位置からの前記オーディオソースの前記ソース位置の前記距離が遠隔場閾値よりも大きい、
ような聴取状況において、前記制御閾値未満の制御値を与えるように構成される、請求項9に記載の方法。
【請求項11】
前記方法は、
指向性制御関数に基づいて、前記聴取状況に対する制御値を決定する工程であって、前記指向性制御関数は、異なる聴取状況に対して異なる制御値を与え、前記制御値は、前記指向性パターンが考慮されるべき程度を示す、工程と、
前記制御値に依存して、前記オーディオソースの前記指向性パターンを調節する工程と、
前記オーディオソースの調節された前記指向性パターンに依存して、前記オーディオソースの前記オーディオ信号をレンダリングする工程と、
を包含する、請求項1から10のいずれかに記載の方法。
【請求項12】
前記オーディオソースの前記指向性パターンを調節する工程は、前記オーディオソースの前記指向性パターンの重み付け和を一様な指向性パターンを用いて決定する工程を包含し、かつ、
前記重み付け和を決定するための重みは、前記制御値に依存する、請求項11に記載の方法。
【請求項13】
前記オーディオソースの前記指向性パターンは、基準聴取状況、特に、前記オーディオソースの前記ソース位置と前記聴取者の前記聴取位置との間の基準距離に適用可能であり、かつ、
前記指向性制御関数は、
前記聴取状況が前記基準聴取状況に対応する場合、前記指向性パターンが調節されず、および/または、
特に、前記指向性パターンが前記聴取状況の前記基準聴取状況からのずれが大きくなるにつれて一様な指向性パターンに漸進的に向かうように、前記指向性パターンの調節の程度が前記聴取状況の前記基準聴取状況からのずれが大きくなるにつれて大きくなる、
ような関数である、請求項11または12に記載の方法。
【請求項14】
前記オーディオソースの前記指向性パターンは、前記オーディオ信号の異なる方向の強度を示し、および/または、
前記指向性パターンは、前記オーディオ信号をレンダリングするために前記オーディオ信号に適用されるべき方向依存性指向性ゲインを示す、請求項1から13のいずれかに記載の方法。
【請求項15】
前記指向性パターンは、指向性ゲイン関数を示し、かつ、
前記指向性ゲイン関数は、前記オーディオソースの前記ソース位置と前記聴取者の前記聴取位置との間の指向性角の関数として指向性ゲインを示す、請求項13に記載の方法。
【請求項16】
前記オーディオソースの前記指向性パターンに依存して、前記オーディオソースの前記オーディオ信号をレンダリングする工程は、
前記指向性パターンに基づいて、かつ、前記オーディオソースの前記ソース位置と前記聴取者の前記聴取位置との指向性角に基づいて、指向性ゲインを決定する工程と、
前記指向性ゲインに依存して、前記オーディオ信号をレンダリングする工程と、
を包含する、請求項1から15のいずれかに記載の方法。
【請求項17】
前記方法は、
前記オーディオソースのソース位置と前記聴取者の聴取位置との間の距離に依存して、減衰ゲインを、前記減衰ゲインを前記距離の関数として示す減衰関数を使用して決定する工程と、
前記減衰ゲインに依存して、前記オーディオ信号をレンダリングする工程と、
を包含する、請求項1から16のいずれかに記載の方法。
【請求項18】
仮想現実レンダリング環境内の聴取者に対して、第1のオーディオソースのオーディオ信号をレンダリングするための方法であって、前記方法は、
前記仮想現実レンダリング環境内の前記聴取者の聴取状況に対する制御値を、指向性制御関数に基づいて決定する工程であって、前記指向性制御関数は、異なる聴取状況に対して異なる制御値を与え、前記制御値は、前記第1のオーディオソースの位置と前記聴取者の聴取位置との間の距離の関数であり、かつ、前記制御値は、オーディオソースの指向性が考慮されるべき程度を示す、工程と、
前記制御値に依存して、前記第1のオーディオソースの指向性パターンを調節する工程と、
前記仮想現実レンダリング環境内の前記聴取者に対して、前記第1のオーディオソースの調節された前記指向性パターンに依存して、前記第1のオーディオソースの前記オーディオ信号をレンダリングする工程と、
を包含する、方法。
【請求項19】
仮想現実レンダリング環境内のオーディオソースのオーディオ信号をレンダリングするための仮想現実オーディオレンダラであって、前記オーディオレンダラは、
前記仮想現実レンダリング環境内の聴取者の聴取位置からの前記オーディオソースのソース位置の距離を決定し、
前記距離に基づいて、前記仮想現実レンダリング環境内の前記聴取者の聴取状況に対して、前記オーディオソースの指向性パターンが考慮されるべきであるかどうかを判断し、
前記聴取者の前記聴取状況に対して、前記オーディオソースの前記指向性パターンが考慮されるべきでないと判断された場合、前記オーディオソースの前記指向性パターンを考慮せずに、前記オーディオソースのオーディオ信号をレンダリングし、かつ、
前記聴取者の前記聴取状況に対して、前記指向性パターンが考慮されるべきであると判断された場合、前記オーディオソースの前記指向性パターンに依存して、前記オーディオソースの前記オーディオ信号をレンダリングする、
ように構成された、仮想現実オーディオレンダラ。
【請求項20】
仮想現実レンダリング環境内の聴取者に対して、第1のオーディオソースのオーディオ信号をレンダリングするための仮想現実オーディオレンダラであって、前記オーディオレンダラは、
前記仮想現実レンダリング環境内の前記聴取者の聴取状況に対する制御値を、指向性制御関数に基づいて決定し、前記指向性制御関数は、異なる聴取状況に対して異なる制御値を与え、前記制御値は、前記第1のオーディオソースの聴取位置と前記聴取者の位置との間の距離の関数であり、前記制御値は、オーディオソースの指向性が考慮されるべき程度を示し、
前記制御値に依存して、前記第1のオーディオソースの指向性パターンを調節し、かつ、
前記仮想現実レンダリング環境内の前記聴取者に対して、前記第1のオーディオソースの前記調節された指向性パターンに依存して、前記第1のオーディオソースの前記オーディオ信号をレンダリングする、
ように構成された、仮想現実オーディオレンダラ。
【請求項21】
仮想現実レンダリング環境内の少なくとも1つのオーディオソースのソース位置と、
前記少なくとも1つのオーディオソースの指向性パターンと、
前記仮想現実レンダリング環境内の聴取者の聴取状況に依存して、前記少なくとも1つのオーディオソースのオーディオ信号をレンダリングするための前記指向性パターンの使用を制御するための指向性制御関数であって、前記指向性制御関数は、前記ソース位置と前記聴取者の聴取位置との距離の関数として制御値を与えるように構成された、指向性制御関数と、
を示すビットストリームを生成するように構成されたオーディオエンコーダ。
【請求項22】
仮想現実レンダリング環境内の少なくとも1つのオーディオソースのソース位置と、
前記少なくとも1つのオーディオソースの指向性パターンと、
前記仮想現実レンダリング環境内の聴取者の聴取状況に依存して、前記少なくとも1つのオーディオソースのオーディオ信号をレンダリングするための前記指向性パターンの使用を制御するための指向性制御関数であって、前記指向性制御関数は、前記ソース位置と前記聴取者の聴取位置との距離の関数として制御値を与えるように構成された、指向性制御関数と、
を示す、ビットストリーム。
【請求項23】
ビットストリームを生成するための方法であって、前記方法は、
少なくとも1つのオーディオソースのオーディオ信号を決定する工程と、
前記少なくとも1つのオーディオソースの仮想現実レンダリング環境内のソース位置を決定する工程と、
前記少なくとも1つのオーディオソースの指向性パターンを決定する工程と、
前記仮想現実レンダリング環境内の聴取者の聴取状況に依存して、前記少なくとも1つのオーディオソースの前記オーディオ信号をレンダリングするための前記指向性パターンの使用を制御するための指向性制御関数を決定する工程であって、前記指向性制御関数は、前記ソース位置と前記聴取者の聴取位置との距離の関数として制御値を与えるように構成された、工程と、
前記オーディオ信号、前記ソース位置、前記指向性パターンおよび前記指向性制御関数に関するデータを前記ビットストリーム内に挿入する工程と、
を包含する、方法。
【請求項24】
コンピュータによって実行されるときに、前記コンピュータに請求項1から18および23のいずれかに記載の方法を実施させる命令を備えた、コンピュータ読み取り可能な記憶媒体。
【請求項25】
コンピュータプログラム製品であって、前記プログラムがコンピュータによって実行されるときに、前記コンピュータに請求項1から18および23のいずれかに記載の方法を実施させる命令を備えた、コンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は、以下の優先出願、すなわち、2021年5月17日付け出願の米国仮出願第63/189,269号(参照番号:D21027USP1)および2021年5月17日付け出願の欧州出願第21174024.6号(参照番号:D21027EP)の優先権を主張するものであり、これらを本願に援用する。
【0002】
本明細書は、仮想現実(VR)レンダリング環境におけるオーディオソースの指向性の効率的かつ一貫した扱いに関する。
【背景技術】
【0003】
仮想現実(VR)、拡張現実(AR)および/または複合現実(MR)アプリケーションは、異なる視点および/または観点や異なる聴取位置(listening positions)から楽しむことができるオーディオソースおよびシーンの音響モデルがますます洗練されるなど、急速に進化している。例えば、VRアプリケーションに対して、2つの異なるクラスのフレキシブルオーディオ表現、すなわち、音場表現およびオブジェクトベース表現が採用され得る。音場表現は、聴取位置での入射波面を符号化する物理ベースの手法である。例えば、Bフォーマットまたは高次アンビソニックス(HOA)などの手法は、球面調和関数分解を使用して空間的な波面を表現する。オブジェクトベース手法は、複雑な聴覚シーンを、オーディオ波形またはオーディオ信号および関連のパラメータまたはメタデータ(おそらくは経時変化する)を含む個々の要素の集合として表現する。
【0004】
VR、ARおよび/またはMRアプリケーションを楽しむことは、ユーザが異なる聴覚的な視点または観点を体験することを含み得る。例えば、室内ベースの仮想現実は、6自由度(degrees of freedom:DoF)を使用する機構に基づいて提供され得る。6DoFインタラクションは、平行移動(前/後、上/下および左/右)および回転移動(ピッチ、ヨーおよびロール)を含み得る。頭部の回転に限定された3DoF球状映像体験と異なり、6DoFインタラクションのために生成されたコンテンツは、頭部の回転に加えて、仮想環境内でのナビゲーション(例えば、室内での物理的な歩行)も可能にする。これは、位置トラッカ(例えば、カメラベース)および向きトラッカ(例えば、ジャイロスコープおよび/または加速度計)に基づいて達成できる。6DoFトラッキング技術は、デスクトップVRシステム(例えば、PlayStation(登録商標)VR、Oculus Rift、HTC Vive)および移動型VRプラットフォーム(例えば、Google Tango)上で利用可能であり得る。サウンドまたはオーディオソースの方向性および空間的な広がりのユーザの体験が6DoF体験のリアル感に対して重要であり、特にシーンを介するナビゲーションおよび仮想オーディオソース周辺のナビゲーションの体験に対して重要である。
【0005】
既存のオーディオレンダリングシステム(MPEG-H 3Dオーディオレンダラなど)は、典型的には、3DoF(すなわち、聴取者(listener)の頭部の移動によって生じるオーディオシーンの回転移動)または3DoF+のレンダリングに限定される。3DoF+は、聴取者の聴取位置の小さな平行移動変化(translational change)を加えるが、指向性またはオクルージョン(occlusion)などの効果を考慮しない。聴取者の聴取位置のより大きな平行移動変化や関連のDoFは、典型的には、それらのレンダラによっては扱われ得ない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本明細書は、オーディオレンダリングに関して、平行移動を扱うためのリソース効率のよい方法およびシステムを提供する技術課題に関する。特に、本明細書は、オーディオソースの指向性を6DoFオーディオレンダリング内でリソース効率的かつ一貫した方法で扱うという技術課題に対処する。
【課題を解決するための手段】
【0007】
概要
一態様によれば、仮想現実レンダリング環境におけるオーディオソースのオーディオ信号をレンダリングするための方法が記載される。方法は、仮想現実レンダリング環境内の聴取者の(現在の)聴取状況(listening situation)に対して、オーディオソースの指向性パターンが考慮されるべきであるかどうかを判断する工程を含む。さらに、方法は、聴取者の聴取状況に対して、オーディオソースの指向性パターンが考慮されるべきでないと判断された場合、オーディオソースの指向性パターンを考慮せずに、オーディオソースのオーディオ信号をレンダリングする工程を含む。加えて、方法は、聴取者の聴取状況に対して、指向性パターンが考慮されるべきであると判断された場合、オーディオソースの指向性パターンに依存して、オーディオソースのオーディオ信号をレンダリングする工程を含む。
【0008】
さらなる態様によれば、仮想現実レンダリング環境内の聴取者に対して、第1のオーディオソースのオーディオ信号をレンダリングするための方法が記載される。なお、仮想現実レンダリング環境という用語は、拡張および/または複合現実レンダリング環境も含むべきである。方法は、仮想現実レンダリング環境内の聴取者の聴取状況に対する制御値を、指向性制御関数に基づいて決定する工程を含む。さらに、方法は、制御値に依存して、第1のオーディオソースの指向性パターン、特に、指向性ゲインを調節する工程を含む。加えて、方法は、仮想現実レンダリング環境内の聴取者に対して、第1のオーディオソースの調節された指向性パターンに依存して、特に、調節された指向性ゲインに依存して、第1のオーディオソースのオーディオ信号をレンダリングする工程を含む。
【0009】
さらなる態様によれば、仮想現実レンダリング環境内のオーディオソースのオーディオ信号をレンダリングするための仮想現実オーディオレンダラが記載される。オーディオレンダラは、仮想現実レンダリング環境内の聴取者の聴取状況に対して、オーディオソースの指向性パターンが考慮されるべきであるかどうかを判断するように構成される。加えて、オーディオレンダラは、聴取者の聴取状況に対して、オーディオソースの指向性パターンが考慮されるべきでないと判断された場合、オーディオソースの指向性パターンを考慮せずに、オーディオソースのオーディオ信号をレンダリングするように構成される。さらに、オーディオレンダラは、聴取者の聴取状況に対して、指向性パターンが考慮されるべきであると判断された場合、オーディオソースの指向性パターンに依存して、オーディオソースのオーディオ信号をレンダリングするように構成される。
【0010】
別の態様によると、仮想現実レンダリング環境内の聴取者に対して、第1のオーディオソースのオーディオ信号をレンダリングするための仮想現実オーディオレンダラが記載される。オーディオレンダラは、仮想現実レンダリング環境内の聴取者の聴取状況に対する制御値を、指向性制御関数(例えば、ビットストリーム内に提供される)に基づいて決定するように構成される。さらに、オーディオレンダラは、制御値に依存して、第1のオーディオソースの指向性パターン(例えば、ビットストリーム内に提供される)を調節するように構成される。さらに、オーディオレンダラは、仮想現実レンダリング環境内の聴取者に対して、第1のオーディオソースの調節された指向性パターンに依存して、第1のオーディオソースのオーディオ信号をレンダリングするように構成される。
【0011】
さらなる態様によれば、ビットストリームを生成するための方法が記載される。方法は、少なくとも1つのオーディオソースのオーディオ信号を決定する工程と、少なくとも1つのオーディオソースの仮想現実レンダリング環境内のソース位置を決定する工程と、を含む。加えて、方法は、少なくとも1つのオーディオソースの(一様でない)指向性パターンを決定する工程と、仮想現実レンダリング環境内の聴取者の聴取状況に依存して、少なくとも1つのオーディオソースのオーディオ信号をレンダリングするための指向性パターンの使用を制御するための指向性制御関数を決定する工程と、を含む。さらに、方法は、オーディオ信号、ソース位置、指向性パターンおよび指向性制御関数に関するデータをビットストリーム内に挿入する工程を含む。
【0012】
さらなる態様によれば、ビットストリームを生成するように構成されたオーディオエンコーダが記載される。ビットストリームは、少なくとも1つのオーディオソースのオーディオ信号、および/または、少なくとも1つのオーディオソースの仮想現実レンダリング環境内のソース位置を示し得る。さらに、ビットストリームは、少なくとも1つのオーディオソースの指向性パターン、および/または、仮想現実レンダリング環境内の聴取者の聴取状況に依存して、少なくとも1つのオーディオソースのオーディオ信号をレンダリングするための指向性パターンの使用を制御するための指向性制御関数を示し得る。
【0013】
別の態様によると、ビットストリームおよび/またはビットストリームのためのシンタックスが記載される。ビットストリームは、少なくとも1つのオーディオソースのオーディオ信号、および/または、少なくとも1つのオーディオソースの仮想現実レンダリング環境内のソース位置を示し得る。さらに、ビットストリームは、少なくとも1つのオーディオソースの指向性パターン、および/または、仮想現実レンダリング環境内の聴取者の聴取状況に依存して、少なくとも1つのオーディオソースのオーディオ信号をレンダリングするための指向性パターンの使用を制御するための指向性制御関数を示し得る。ビットストリームは、上記情報に関するデータを含む1つまたは複数のデータ要素を含み得る。
【0014】
さらなる態様によれば、ソフトウェアプログラムが記載される。ソフトウェアプログラムは、プロセッサ上で実行されるように構成され得、かつ、プロセッサ上で実施されるときに本明細書で概説される方法工程を行うように構成され得る。
【0015】
別の態様によれば、コンピュータ読み取り可能な記憶媒体が記載される。コンピュータ読み取り可能な記憶媒体は、プロセッサ(または、コンピュータ)上で実行されるように構成され、かつ、プロセッサ上で実施されるときに本明細書で概説される方法工程を行うように構成されたソフトウェアプログラムを備え得る。
【0016】
さらなる態様によれば、コンピュータプログラム製造物が記載される。コンピュータプログラムは、コンピュータ上で実行されるときに本明細書で概説される方法工程を行うための実行可能命令を備え得る。
【0017】
なお、本特許出願において概説される好ましい実施形態を含む方法およびシステムは、単独で使用されてもよく、または、本明細書に開示される他の方法およびシステムと組み合わせて使用されてもよい。さらに、本特許出願において概説される方法およびシステムのすべての態様は、任意に組み合わされてもよい。特に、特許請求の範囲の特徴は、任意の方法で互いに組み合わされてもよい。
【図面の簡単な説明】
【0018】
本発明は、添付の図面を参照して例示的な方法で下記に説明される。
【0019】
図1a図1aは、6DoFオーディオを提供するための例示のオーディオ処理システムを図示する。
図1b図1bは、6DoFオーディオおよび/またはレンダリング環境内の例示の状況を図示する。
図2図2は、例示のオーディオシーンを図示する。
図3a図3aは、オーディオシーン内の聴取位置の変化に反応したオーディオソースのリマッピングを図示する。
図3b図3bは、例示の距離関数を図示する。
図4a図4aは、一様でない指向性パターンを有するオーディオソースを図示する。
図4b図4bは、オーディオソースの例示の指向性関数を図示する。
図5a図5aは、指向性パターンを測定するための例示のセットアップを図示する。
図5b図5bは、仮想オーディオソースを通り過ぎる際の例示の指向性ゲインを図示する。
図6a図6aは、例示の指向性制御関数を図示する。
図6b図6bは、例示の減衰関数を図示する。
図7a図7aは、オーディオシーン内のオーディオソースの3Dオーディオ信号をレンダリングするための例示の方法のフローチャートを図示する。
図7b図7bは、オーディオシーン内のオーディオソースの3Dオーディオ信号をレンダリングするための例示の方法のフローチャートを図示する。
図7c図7cは、仮想現実オーディオシーンに対してビットストリームを生成するための例示の方法のフローチャートを図示する。
【発明を実施するための形態】
【0020】
詳細な説明
上記に概説したように、本明細書は、3D(3次元)オーディオ環境において6DoFを効率的かつ一貫して提供することに関する。図1aは、例示のオーディオ処理システム100のブロック図を図示する。スタジアムなどの音響環境110は、様々に異なるオーディオソース113を備え得る。スタジアム内の例示のオーディオソース113は、個々の観客、スタジアムスピーカ、フィールド上の演奏者などである。音響環境110は、異なるオーディオシーン111、112に細分化され得る。例として、第1のオーディオシーン111は、ホームチームの応援ブロックに対応し、第2のオーディオシーン112は、ゲストチームの応援ブロックに対応し得る。聴取者がオーディオ環境内のどの位置に存在するかに依存して、聴取者は、第1のオーディオシーン111からのオーディオソース113、または、第2のオーディオシーン112からのオーディオソース113のいずれかを知覚することになる。
【0021】
オーディオ環境110の異なるオーディオソース113は、オーディオセンサ120、特に、マイクロフォンアレイを使用してキャプチャされ得る。オーディオ環境110の1つまたは複数のオーディオシーン111、112は、マルチチャネルオーディオ信号、1つまたは複数のオーディオオブジェクトおよび/または高次アンビソニックス(HOA)および/または1次アンビソニックス信号を使用して記述され得る。以下では、オーディオソース113は、1つまたは複数のオーディオセンサ120によってキャプチャされたオーディオデータに関連付けられていると仮定される。ここで、オーディオデータは、オーディオ信号(オーディオソース113によって送信される)およびオーディオソース113の位置を時間の関数として(特定のサンプリングレート、例えば、20msで)示す。
【0022】
MPEG-H 3Dオーディオレンダラなどの3Dオーディオレンダラは、典型的には、聴取者181がオーディオシーン111、112内の特定の(固定した)聴取位置182に位置するものと仮定する。オーディオシーン111、112の異なるオーディオソース113に対するオーディオデータは、典型的には、聴取者181がこの特定の聴取位置182に位置すると仮定して提供される。オーディオエンコーダ130は、オーディオ環境110の1つまたは複数のオーディオシーン111、112の1つまたは複数のオーディオソース113のオーディオデータを符号化するように構成された3Dオーディオエンコーダ131を備え得る。
【0023】
さらに、聴取者181がオーディオシーン111、112内で聴取位置182を変更すること、および/または、異なるオーディオシーン111、112間で移動することを可能にするVR(仮想現実)メタデータが提供され得る。エンコーダ130は、VRメタデータを符号化するように構成されたメタデータエンコーダ132を備え得る。オーディオソース113の符号化VRメタデータおよび符号化オーディオデータは、合成部133において合成されて、オーディオデータおよびVRメタデータを示すビットストリーム140を提供し得る。VRメタデータは、例えば、オーディオ環境110の音響性を記述する環境データを含み得る。
【0024】
ビットストリーム140は、デコーダ150を使用して復号化され、(復号化)オーディオデータおよび(復号化)VRメタデータを提供し得る。6DoFを可能にするレンダリング環境180内のオーディオをレンダリングするためのオーディオレンダラ160は、前処理部161と、(従来の)3Dオーディオレンダラ162(MPEG-H 3Dオーディオレンダラなど)とを備え得る。前処理部161は、聴取者181の聴取環境180内での聴取位置182を決定するように構成され得る。聴取位置182は、聴取者181が位置するオーディオシーン111を示し得る。さらに、聴取位置182は、オーディオシーン111内での正確な位置を示し得る。前処理部161は、さらに、(復号化)オーディオデータに基づいて、および、おそらくは(復号化)VRメタデータに基づいて、現在の聴取位置182に対する3Dオーディオ信号を決定するように構成され得る。次いで、3Dオーディオ信号は、3Dオーディオレンダラ162を使用してレンダリングされ得る。3Dオーディオ信号は、オーディオシーン111の1つまたは複数のオーディオソース113のオーディオ信号を含み得る。
【0025】
なお、本明細書に記載の概念および手法は、周波数変動的で特定されてもよく、グローバル的またはオブジェクト/媒体依存的のいずれで定義されてもよく、スペクトル領域または時間領域において直接適用されてもよく、および/または、VRレンダラ160にハードコードされてもよく、または、対応する入力インタフェースを介して特定されてもよい。
【0026】
図1bは、例示的なレンダリング環境180を示す。聴取者181は、遷移元(origin)オーディオシーン111内に位置し得る。レンダリング目的において、オーディオソース113、194は、聴取者181の周辺、特に、聴取位置182の周辺の(単位(unity))球114上の異なるレンダリング位置に配置されると仮定され得る。異なるオーディオソース113、194のレンダリング位置は、時間とともに(所与のサンプリングレートに従って)変化し得る。異なるオーディオソース113、194の位置は、VRメタデータ内で示され得る。VRレンダリング環境180内で、異なる状況が起こり得る。聴取者181は、遷移元オーディオシーン111から遷移先(destination)オーディオシーン112へのグローバル遷移191を行い得る。あるいは、または加えて、聴取者181は、同じオーディオシーン111内の異なる聴取位置182へのローカル遷移192を行い得る。あるいは、または加えて、オーディオシーン111は、音響的に関係する環境特性(properties)(例えば、壁)を示し得る。これは、環境データ193を使用して記述され得、聴取位置182に変化が生じたときに考慮されるべきである。環境データ193は、VRメタデータとして提供され得る。あるいは、または加えて、オーディオシーン111は、1つまたは複数の周囲オーディオソース194(例えば、背景ノイズについて)を含み得る。これは、聴取位置182に変化が生じたときに考慮されるべきである。
【0027】
図2は、同じオーディオシーン111内での遷移元聴取位置B 201から遷移先聴取位置C 202への例示的なローカル遷移192を示している。オーディオシーン111は、異なるオーディオソースまたはオブジェクト211、212、213を含む。異なるオーディオソースまたはオブジェクト211、212、213は、異なる指向性プロフィール232(本明細書において指向性パターンとも称する)を有し得る。1つまたは複数のオーディオソースまたはオブジェクト211、212、213の指向性プロフィール232は、VRメタデータとして示され得る。さらに、オーディオシーン111は、オーディオシーン111内でのオーディオの伝搬に対して影響を与える環境特性、特に、1つまたは複数の障害物を有し得る。環境特性は、環境データ193を使用して記述され得る。加えて、オーディオオブジェクト211から異なる聴取位置182、201、202までの相対距離221、222は、既知であり得る(例えば、VRレンダラ160の1つまたは複数のセンサ(ジャイロスコープまたは加速度計など)に基づく)。
【0028】
図3aおよび3bは、異なるオーディオソースまたはオブジェクト211、212、213の強度に対するローカル遷移192の効果を扱うための手法を例示する。上記概説のように、オーディオシーン111のオーディオソース211、212、213は、典型的には、聴取位置201の周辺の球114上に位置していると3Dオーディオレンダラ162に仮定される。よって、ローカル遷移192の開始時に、オーディオソース211、212、213は、遷移元聴取位置201の周辺の遷移元球114上に配置され得、ローカル遷移192の終了時に、オーディオソース211、212、213は、遷移先聴取位置202の周辺の遷移先球114上に配置され得る。オーディオソース211、212、213は、遷移元球114から遷移先球114に再マッピングされ得る。そうするために、遷移先聴取位置202から遷移元球114上のオーディオソース211、212、213のソース位置に向かう射線(ray)が考慮され得る。オーディオソース211、212、213は、射線と遷移先球114との交点上に配置され得る。
【0029】
遷移先球114上のオーディオソース211、212、213の強度Fは、典型的には、遷移元球114上の強度と異なる。強度Fは、聴取位置182、201、202からのオーディオソース211、212、213の距離320の関数として距離ゲイン310(本明細書において、減衰ゲインとも称す)を与える強度ゲイン関数または距離関数315(本明細書において、減衰関数とも称す)を使用して変更され得る。距離関数315は、典型的にはカットオフ距離321を示し、カットオフ距離321を超えるところではゼロの距離ゲイン310が適用される。オーディオソース211から遷移元聴取位置201までの遷移元距離221は、遷移元ゲイン311を与える。さらに、オーディオソース211から遷移先聴取位置202までの遷移先距離222は、遷移先ゲイン312を与える。オーディオソース211の強度Fは、遷移元ゲイン311および遷移先ゲイン312を使用して再スケーリングされ、それにより遷移先球114上のオーディオソース211の強度Fを与え得る。特に、遷移元球114上のオーディオソース211の遷移元オーディオ信号の強度Fを遷移元ゲイン311で除算し、かつ、遷移先ゲイン322を乗算して、遷移先球114上のオーディオソース211の遷移先オーディオ信号の強度Fを与え得る。
【0030】
よって、ローカル遷移192後のオーディオソース211の位置は、C=source_remap_function(B,C)として決定され得る(例えば、幾何学的変換を使用して)。さらに、ローカル遷移192後のオーディオソース211の強度は、F(C)=F(B)*distance_function(B,C,C)として決定され得る。したがって、距離減衰は、距離関数315によって与えられる対応の強度ゲイン315によってモデル化され得る。
【0031】
図4aおよび4bは、非一様な指向性プロフィール232を有するオーディオソース212を例示する。指向性プロフィールは、異なる方向または指向性角420に対するゲイン値を示す指向性ゲイン410を使用して定義され得る。特に、オーディオソース212の指向性プロフィール232は、指向性ゲイン410を指向性角420(角420は、0°~360°の範囲であり得る)の関数として示す指向性ゲイン関数415を使用して定義され得る。なお、3Dオーディオソース212に対して、指向性角420は、典型的には、方位角および仰角を含む2次元の角である。よって、指向性ゲイン関数415は、典型的には、二次遷移元指向性角420の2次元関数である。
【0032】
オーディオソース212の指向性プロフィール232は、ローカル遷移192に関して、オーディオソース212と遷移元聴取位置201との間の遷移元射線の遷移元指向性角421(オーディオソース212が遷移元聴取位置201の周辺の遷移元球114上に配置されている状態)と、オーディオソース212と遷移先聴取位置202との間の遷移先射線の遷移先指向性角422(オーディオ源212が遷移先聴取位置202の周辺の遷移先球114上に配置されている状態)とを決定することによって考慮され得る。オーディオソース212の指向性ゲイン関数415を使用して、遷移元指向性ゲイン411および遷移先指向性ゲイン412は、それぞれ遷移元指向性角421および遷移先指向性角422に対する指向性ゲイン関数415の関数値として決定され得る(図4bを参照のこと)。次いで、遷移元聴取位置201におけるオーディオソース212の強度Fは、遷移元指向性ゲイン411で除算され、かつ、遷移先指向性ゲイン412を乗算されて、遷移先聴取位置202でのオーディオソース212の強度Fが決定され得る。
【0033】
よって、サウンドソース指向性は、指向性ゲイン関数415によって示される指向性因子またはゲイン410によってパラメータ化され得る。指向性ゲイン関数415は、規定の距離におけるオーディオソース212の強度を、聴取位置182、201、202に対する角420の関数として示し得る。指向性ゲイン410は、同じ距離にあり、すべての方向に一様に放射される全パワーが同じであるオーディオソース212のゲインに対する比として定義され得る。指向性プロフィール232は、オーディオソース212の中心を起点にし、かつ、オーディオソース212の中心まわりの単位球上に分布した点を終点とするベクトルに対応する1セットのゲイン410によってパラメータ化され得る。
【0034】
遷移先聴取位置202におけるオーディオソース212の上記のように得られたオーディオ強度は、F(C)=F(B)*Distance_function()*Directivity_gain_function(C,C,Directivity_parametrization)として推定され得る。ここで、Directivity_gain_functionは、オーディオソース212の指向性プロフィール232に依存する。Distance_function()は、聴取位置201、202の遷移によるオーディオソース212の距離321、322の変化によって変更された強度を考慮する。
【0035】
図5aは、所与の距離320におけるオーディオソース211の指向性プロフィール232を測定するための例示のセットアップを示す。この目的のために、オーディオセンサ120、特に、マイクロフォンがオーディオソース211を中心とする円周上に配置され得る。ここで、当該円周は、所与の距離320に対応する半径を有する。オーディオ信号の強度または大きさは、当該円周上の異なる角420に対して測定されることにより、距離D 320に対する指向性パターンP(D) 232が与えられ得る。そのような指向性パターンまたはプロフィールは、複数の異なる距離値D 320に対して決定され得る。
【0036】
指向性パターンデータは、以下を表し得る。
・オーディオソースまたはオブジェクト211が音場を生成することによって生じるサウンド出射特性、
・近接の障害物によって生じ、音場に影響を与えるローカルサウンドオクルージョン(occlusion)の効果、および/または
・コンテンツ作成者の意図。
指向性パターンデータは、典型的には、図5aに例示するように、オーディオソース211からの特定の距離範囲に対して測定される(および有効なだけである)。
【0037】
指向性パターン232からの指向性ゲインがレンダリングされたオーディオ信号に直接適用される場合、1つ以上の問題が生じ得る。指向性の考慮は、オーディオオブジェクト211から相対的に遠隔の聴取位置182、201、202には知覚的に関係しないことが多くあり得る。その理由は、以下であり得る。
・相対的に低い全オブジェクトサウンドエネルギー(例えば、支配的な距離減衰効果による)、
・音響心理学的マスキング効果(聴取位置201により近接の1つまたは複数の他のオーディオソース212、213のよって生じるか、残響性(reverberance)によって生じるか、および/または初期反射によって生じる)、
・聴取者の注意に対するオーディオオブジェクト211の相対的に低い主観的な重要性、および/または、
・オーディオオブジェクト211の指向性に対応するオブジェクト211の向きを示す明確な視覚指示の欠如。
【0038】
さらなる問題は、図5bに例示されるように、指向性を適用した結果、オーディオソース211の原点500(すなわち、ソース位置)においてサウンド強度の不連続性が生じることであり得る。この音響アーチファクトは、聴取者が仮想オーディオシーン111内のオーディオソース211(特に、体積オブジェクトによって表されるオーディオソース211)の原点500を通り過ぎる際に知覚され得る。ユーザは、そのような仮想オブジェクトを通り過ぎながら、オーディオソース211の中心点500において、唐突なサウンドレベルの変化を知覚し得る。これを図5bに例示する。図5bは、前からオーディオソース211の中心点500へ近寄る際のサウンドレベル501、および、オーディオソース211の後ろ側で中心点500から遠ざかる際のサウンドレベル502を示す。図5bでは、中心点500においてサウンドレベル501、502に不連続性が生じていることが分かる。
【0039】
所与のオーディオソース211について、1セットのN個の音響ソース指向性パターンP=P(D)(ここで、i∈{1,…,N})が、サウンド出射オブジェクト211の中心500からの異なる距離Dに対して利用可能であり得る(ここで、Nは、1以上、2以上、または3以上)。これらの指向性パターン間のすべての距離D、すなわちmin(D)≦D≦max(D)、について、球面補間手法を適用して、特定の距離Dに対する指向性パターンを決定し得る。例として、線形補間が使用され得る。
【0040】
本明細書において、オーディオソース211の原点500からの相対的に小さい距離(D<min(D))(すなわち、オーディオソース中心500と指向性パターンが利用可能な最短の距離との距離320)に対して、外挿された(およびおそらくは最適化された)指向性ゲイン値P=P(D)を決定するための手法が記載される。さらに、相対的に大きい距離(D>max(D))(すなわち、指向性パターンが存在する最も大きい距離を超える)に対して、外挿された(およびおそらくは最適化された)指向性ゲイン値P=P(D)を決定するための手法が記載される。
【0041】
本明細書において記載の手法は、原点500、すなわち、D=0におけるサウンドレベルの不連続性を防止し、および/または、相対的に大きい距離、すなわち、D→∞に対して、音場の知覚に関係のない変化を生じさせる指向性ゲイン計算を回避するように構成される。D→0および/またはD>D(ここで、Dは、規定の距離閾値)に対して、指向性を適用する効果は、無視できるほど小さいと仮定し得る。
【0042】
特定の聴取状況に対して、指向性制御値(directivity_control_gain)が計算され得る。指向性制御値は、聴取者181の特定の聴取状況に対して、対応する指向性データの関連性を示し得る。指向性制御値は、指向性(例えば、min(D)またはmax(D)であり得る)に対して、ユーザ-オブジェクト間距離D(距離)320の値に基づいて、かつ、所与の基準距離D(reference_distance)に基づいて決定され得る。基準距離Dは、指向性パターン232が利用可能である距離Dであり得る。指向性制御値(本明細書において、指向性制御ゲインとも称する)は、指向性制御関数(図6aに示す)、すなわち、
directivity_control_gain = get_directivity_control_gain(distance, reference_distance)
を使用して決定され得る。
【0043】
指向性制御値(directivity_control_gain)の値は、所定の指向性制御値閾値D(directivity_control_threshold)と比較され得る。指向性制御値が閾値Dよりも大きい場合、(距離に依存しない)指向性ゲイン値(directivity_gain_tmp)が指向性パターン232に基づいて決定され得、そして、指向性ゲイン値は、指向性制御値(directivity_control_gain)に応じて変更され得る。指向性ゲイン値の変更は、以下の疑似コードによって示されるように行われ得る。
if directivity_control_gain > directivity_control_threshold
directivity_gain_tmp = get_directivity_gain();
directivity_gain = directivity_control_gain*(directivity_gain_tmp - 1) + 1;
else
directivity_gain = 1;
end
【0044】
上記疑似コードに示すように、指向性データの適用は、指向性制御値が閾値D未満の場合、省略され得る。
【0045】
上記得られた(距離に依存する)指向性ゲイン(directivity_gain)は、以下のように、対応する距離減衰ゲインに適用され得る。
distance_attenuation_gain = get_attenuation_gain();
gain = directivity_gain*distance_attenuation_gain;
【0046】
図6aは、例示の指向性制御関数600 get_directivity_control_gain()を示す。指向性効果の最も重要な(すなわち、客観的関連性(subjective relevance))点は、マークされた位置または基準距離610(reference_distance)の周辺の領域に位置する。基準距離610は、指向性パターン232が測定された距離320であり得る。指向性効果は、基準距離610よりも小さい値から始まり、かつ、基準距離610を超える相対的に大きい距離に対して消滅していく。指向性の適用に関する計算は、指向性制御値が閾値値Dよりも大きい距離320に対してのみ行われる。よって、指向性は、原点500の近傍および/または原点500からの遠隔においては適用されない。
【0047】
図6aは、指向性制御関数600がどのように(「s」形状の)関数602の組み合わせに基づいて決定され得るかを例示する。関数602は、相対的に小さい距離に対して0に向かって単調に低減し、基準距離610以上に対して1の近くにとどまる(原点500での不連続性問題に対処するため)。別の関数601は、相対的に大きい距離320に対して0に向かって単調に低減し得、基準距離610において最大値を有し得る(知覚関連性の問題に対処するため)。両方の関数601、602の乗算を表す関数600は、両方の問題を同時に考慮し、そして、指向性制御関数として使用され得る。
【0048】
図6bは、例示の距離減衰関数650 get_attenuation_gain()を示す。距離減衰関数650は、距離ゲイン651を距離320の関数として示し、かつ、オーディオ信号211によって出射されたオーディオ信号の減衰を表す。距離減衰関数650は、図3bに関して記載された距離関数315と同一であり得る。
【0049】
指向性適用制御に対して、異なるタイプの指向性制御関数600および/または距離減衰関数650が考慮、定義および適用され得る。それらの形状および値は、物理的検討、測定データおよび/またはコンテンツ作成者の意図から導かれ得る。指向性制御関数600は、聴取者181に対する特定の聴取状況に依存し得る。聴取状況は、以下のパラメータのうちの1つ以上によって記述され得る、すなわち、指向性制御関数600は、以下のパラメータのうちの1つ以上に依存し得る。
・オーディオソース211によって出射されるオーディオ信号の周波数、
・当該オーディオ信号がレンダリングされる時点、
・聴取者-オブジェクト向き、聴取者ビュー(listener-view)方向および/または聴取者181の軌跡、
・ユーザインタラクション、他の条件および/またはシーンイベント、および/または
・システム関連条件(例えば、レンダリング作業負荷)。
【0050】
本明細書に記載の手法によれば、特に、オーディオソース211の原点500に近接のオーディオボリュームにおける不連続性を回避することによって、3Dオーディオレンダリングの品質を向上させることが可能になる。さらに、特に、知覚的に関係のないところでオブジェクト指向性の適用を回避することによって、指向性適用の複雑性が低減され得る。加えて、エンコーダ130の構成を介して指向性適用を制御する可能性が提供される。
【0051】
本明細書において、6DoFオーディオレンダリング品質を上げ、計算複雑性を軽減し、かつ、ビットストリーム140を介する(指向性データ自体を変更せず)指向性適用制御を達成するための一般的な手法が記載される。さらに、デコーダ150、160が本明細書に概説する指向性関連処理を行うことを可能にするためのデコーダインタフェースが記載される。さらに、ビットストリーム140が指向性制御データを搬送することを可能にするためのビットストリームシンタックスが記載される。指向性制御データ、特に、指向性制御関数600は、パラメータ化およびサンプリングされた方法で、および/または、所定の関数として提供され得る。
【0052】
図7aは、仮想現実レンダリング環境180におけるオーディオソース211、212、213のオーディオ信号をレンダリングするための例示の方法700のフローチャートを示す。方法700は、VRオーディオレンダラ160によって実行され得る。
【0053】
方法700は、オーディオソース211、212、213の指向性パターン232が仮想現実レンダリング環境180内の聴取者181の聴取状況に対して考慮されるべきかどうかを判断する工程701を含み得る。聴取状況は、聴取者181がオーディオソース211、212、213のオーディオ信号を知覚するコンテキスト(context)を記述し得る。コンテキストは、オーディオソース211、212、213と聴取者181との間の距離に依存し得る。あるいは、または加えて、コンテキストは、聴取者181がオーディオソース211、212、213の方に向いているかどうか、または、聴取者181がオーディオソース211、212、213に背を向けているかどうかに依存し得る。あるいは、または加えて、コンテキストは、仮想現実レンダリング環境180内、特に、レンダリングされるべきオーディオシーン111内の聴取者181の聴取位置182、201、202に依存し得る。
【0054】
特に、聴取状況は、1つまたは複数のパラメータによって記述され得る。ここで、異なる聴取状況は、当該1つまたは複数のパラメータのうちの少なくとも1つについて異なり得る。パラメータの例は、
・仮想現実レンダリング環境180内、特に、オーディオシーン111内の聴取者181の聴取位置182、201、202、
・オーディオソース211、212、213のソース位置500(特に、中心点)と、仮想現実レンダリング環境180内、特に、オーディオシーン111内の聴取者181の聴取位置182、201、202との間の距離320、
・オーディオ信号の周波数および/またはスペクトル構成、
・オーディオ信号がレンダリングされるべき時刻、
・仮想現実レンダリング環境180内(すなわち、仮想オーディオシーン111内)のオーディオソース211、212、213に対する聴取者181の向きおよび/または視線方向および/または移動軌跡、例として、聴取状況は、聴取者181がオーディオソース211、212、213に対して近づくか、または、遠ざかるかの何れであるかに依存して、異なり得る、
・オーディオ信号をレンダリングするためのレンダラ160の条件、特に、(利用可能な)計算リソースに対する条件、および/または
・聴取者181の仮想現実レンダリング環境180に対する動作
【0055】
方法700は、聴取状況を記述する1つまたは複数のパラメータに基づいて、オーディオソース211、212、213の指向性パターン232が考慮されるべきかどうかを判断する工程701を含み得る。この目的のために、(所定の)指向性制御関数600が使用され得る。ここで、指向性制御関数600は、異なる聴取状況に対して(特に、1つまたは複数のパラメータの異なる組み合わせに対して)、オーディオソース211、212、213の指向性パターン232が考慮されるべきかどうかを示すように構成され得る。特に、指向性制御関数600は、オーディオソース211、212、213の指向性が知覚的に関係しないか、および/または、オーディオソース211、212、213の指向性が知覚アーチファクトを招き得る聴取状況を特定するように構成され得る。
【0056】
さらに、方法700は、聴取者181の聴取状況に対してオーディオソース211、212、213の指向性パターン232が考慮されるべきでないと判断された場合、オーディオソース211、212、213の指向性パターン232を考慮せずに、オーディオソース211、212、213のオーディオ信号をレンダリングする工程702を含む。これにより、指向性パターン232は、レンダラ160によって無視され得る。特に、レンダラ160は、指向性パターン232に基づく指向性ゲイン410の計算を省略し得る。さらに、レンダラ160は、オーディオ信号をレンダリングするために指向性ゲイン410をオーディオ信号に適用することを省略し得る。これにより、知覚品質に影響を与えずに、オーディオ信号のリソース効率的レンダリングが達成され得る。
【0057】
他方、方法700は、聴取者181の聴取状況に対して指向性パターン232が考慮されるべきであると判断された場合、オーディオソース211、212、213の指向性パターン232に依存して、オーディオソース211、212、213のオーディオ信号をレンダリングする工程703を含む。この場合、レンダラ160は、オーディオ信号に適用されるべき指向性ゲイン410を決定し得る(オーディオソース211、212、213のソース位置500と聴取者181の聴取位置182、201、202との間の指向性角420に基づいて)。指向性ゲイン410は、オーディオ信号をレンダリングする前にオーディオ信号に適用され得る。これにより、オーディオ信号は、高い知覚品質でレンダリングされ得る(指向性が関係する聴取状況において)。
【0058】
このように、レンダリングのためにオーディオ信号を処理する前に、(例えば、指向性制御関数600を使用して)指向性の使用が聴取者181の現在の聴取状況において関係するかどうか、および/または、知覚的に有利かどうかを前もって確認する方法700が記載される。指向性は、指向性の使用が関係し、および/または、知覚的に有利であると判断された場合に計算および適用されるのみである。これにより、オーディオ信号の高知覚品質のリソース効率的レンダリングが達成される。
【0059】
オーディオソース211、212、213の指向性パターン232は、オーディオ信号の異なる方向における強度を示し得る。あるいは、または加えて、指向性パターン232は、オーディオ信号をレンダリングするためにオーディオ信号に適用すべき方向依存性指向性ゲイン410を示し得る(図4aおよび4bに関して概説)。
【0060】
特に、指向性パターン232は、指向性ゲイン関数415を示し得る。指向性ゲイン関数415は、指向性ゲイン410を、オーディオソース211、212、213のソース位置500と聴取者181の聴取位置182、201、202との間の指向性角420の関数として示し得る。指向性角420は、聴取位置182、201、202がソース位置500の周辺を(円周上を)移動する際に0°~360°で変化し得る。一様でない指向性パターン232の場合、指向性ゲイン410は、指向性角420の関数として変化する(例えば、図4bに示す)。
【0061】
オーディオソース211、212、213の指向性パターン232に依存して、オーディオソース211、212、213のオーディオ信号をレンダリングする工程703は、指向性パターン232に基づいて、かつ、オーディオソース211、212、213のソース位置500と聴取者181の聴取位置182、201、202との間の指向性角420に基づいて、指向性ゲイン410を決定する工程(特定の聴取状況においてオーディオ信号をレンダリングするための)を含み得る(図4aおよび4bに関して概説)。次いで、オーディオ信号は、指向性ゲイン410に依存して、レンダリングされ得る(特に、レンダリングの前に指向性ゲイン410をオーディオ信号に適用することによって)。これにより、仮想現実レンダリング環境180内で高い知覚品質が達成され得る(レンダリング環境180内を聴取者181が動き回ることによって、聴取状況が変更される場合)。
【0062】
なお、本明細書に記載の方法700は、典型的には、1シーケンスの時間インスタンスにおいて繰り返される(例えば、20ms毎などの何らかの繰り返しレートで周期的に)。各時刻において、現在有効な聴取状況が決定される(例えば、聴取状況を記述するための1つまたは複数のパラメータに対する現在値を決定することによって)。さらに、各時刻において、オーディオソース211、212、213の指向性パターン232が考慮されるべきかどうかが判断される。さらに、各時間インスタンスにおいて、上記決定に依存して、オーディオ信号のレンダリングが行われる。これにより、オーディオ信号の仮想現実レンダリング環境180内での連続したレンダリングが達成され得る。
【0063】
さらに、なお、典型的には、複数の異なるオーディオソース211、212、213からの複数のオーディオ信号が仮想現実レンダリング環境180内で同時にレンダリングされる(例えば、図3aおよび3bに関して概説)。方法700は、異なるオーディオ信号および/またはオーディオソース211、212、213のそれぞれに対して実行され得る。聴取状況を記述するためのさらなるパラメータは、仮想現実レンダリング環境180内でアクティブな異なるオーディオソース211、212、213(特定の時刻における)の数、位置および/または強度であり得る。
【0064】
方法700は、オーディオソース211、212、213のソース位置500と聴取者181の聴取位置182、201、202との間の距離320に依存して、減衰または距離ゲイン310、651を決定する工程を含み得る。減衰または距離ゲイン310、651は、減衰または距離ゲイン310、651を距離320の関数として示す減衰または距離関数315、650を使用して決定され得る。オーディオ信号は、減衰または距離ゲイン310、651に依存にしてレンダリングされることによって(図3aおよび3bに関して記載)、知覚品質がさらに増大され得る。
【0065】
上記のように、仮想現実レンダリング環境180内における聴取者181の聴取位置182、201、202からのオーディオソース211、212、213のソース位置500の距離320が決定され得る(聴取者181の聴取状況を決定する際に)。
【0066】
方法700は、決定された距離320に基づいて、オーディオソース211、212、213の指向性パターン232が考慮されるべきかどうかを判断する工程701を含み得る。この目的のために、所定の指向性制御関数600が使用され得る。指向性制御関数600は、特にソース位置500と聴取位置182、201、202との現在の距離320に対して、現在の聴取状況内のオーディオソース211、212、213の指向性を使用することの関係性および/または妥当性を示すように構成される。ソース位置500と聴取位置182、201、202との間の距離320は、聴取状況の特に重要なパラメータであり、その結果、オーディオソース211、212、213のオーディオ信号をレンダリングする際に、リソース効率および/または知覚品質に特に大きな影響を与える。
【0067】
聴取位置182、201、202からのオーディオソース211、212、213のソース位置500の距離320が近距離場(near field distance)閾値よりも小さいと判断され得る。これに基づいて、オーディオソース211、212、213の指向性パターン232が考慮されるべきでないと判断され得る。他方、聴取位置182、201、202からのオーディオソース211、212、213のソース位置500の距離320が近距離場閾値よりも大きいと判断され得る。これに基づいて、オーディオソース211、212、213の指向性パターン232が考慮されるべきであると判断され得る。近距離場閾値は、例えば、0.5m以下であり得る。相対的に小さい距離における指向性の使用を抑制することによって、聴取者181が仮想現実レンダリング環境180内の(仮想)オーディオソース211、212、213を横切る場合に、知覚アーチファクトが防止され得る。
【0068】
さらに、聴取位置182、201、202からのオーディオソース211、212、213のソース位置500の距離320が遠距離場(far field distance)閾値(近距離場閾値よりも大きい)よりも大きいと判断され得る。これに基づいて、オーディオソース211、212、213の指向性パターン232が考慮されるべきでないと判断され得る。他方、聴取位置182、201、202からのオーディオソース211、212、213のソース位置500の距離320が遠距離場閾値よりも小さいと判断され得る。これに基づいて、オーディオソース211、212、213の指向性パターン232が考慮されるべきであると判断され得る。遠距離場閾値は、5m以上であり得る。相対的に大きい距離における指向性の使用を抑制することによって、レンダラ160のリソース効率は、知覚品質に影響を与えずに、向上され得る。
【0069】
近接場閾値および/または遠隔場閾値は、指向性制御関数600に依存し得る。指向性制御関数600は、制御値を、ソース位置500と聴取位置182、201、202との間の距離320の関数として与えるように構成され得る。制御値は、指向性パターン232が考慮されるべき程度を示し得る。特に、制御値は、指向性パターン232が考慮されるべきであるかどうかを示し得る(例えば、制御値が制御閾値
よりも大きいか、または、小さいかに依存して)。指向性制御関数600を使用することによって、指向性パターン232の適用は、効率的かつ信頼性良く制御され得る。
【0070】
方法700は、指向性制御関数600に基づいて、聴取状況に対する制御値を決定する工程を含み得る。指向性制御関数600は、異なる聴取状況に対して(特に、ソース位置500と聴取位置182、201、202との間の異なる距離320に対して)異なる制御値を提供するよう構成され得る。次いで、制御値に基づいて、オーディオソース211、212、213の指向性パターン232が考慮されるべきかどうかが信頼性良く判断され得る。
【0071】
特に、方法700は、制御値を制御閾値
と比較する工程を含み得る。指向性制御関数600は、最小値(例えば、0)と最大値(例えば、1)との間の制御値を与えるように構成され得る。制御閾値は、最小値と最大値との間に存在し得る(例えば、0.5)。次いで、上記比較に基づいて、特に制御値が制御閾値よりも大きいか、または、小さいかの何れであるかに依存して、オーディオソース211、212、213の指向性パターン232が考慮されるべきであるかどうかが信頼性良く判断され得る。特に、方法700は、聴取状況に対する制御値が制御閾値よりも小さい場合、オーディオソース211、212、213の指向性パターン232が考慮されるべきでないと判断する工程を含み得る。あるいは、または加えて、方法700は、聴取状況に対する制御値が制御閾値よりも大きい場合、オーディオソース211、212、213の指向性パターン232が考慮されるべきであると判断する工程を含み得る。
【0072】
指向性制御関数600は、聴取者181の聴取位置182、201、202からのオーディオソース211、212、213のソース位置500の距離320が近接場閾値よりも小さい聴取状況において制御閾値よりも低い制御値を与えるように構成され得る(それにより、ユーザが仮想現実レンダリング環境180内で仮想オーディオソース211、212、213を横切る場合の知覚アーチファクトを防止する)。あるいは、または加えて、指向性制御関数600は、聴取者181の聴取位置182、201、202からのオーディオソース211、212、213のソース位置500の距離320が遠隔場閾値よりも大きい聴取状況において制御閾値よりも低い制御値を与えるように構成され得る(それにより、知覚品質に影響を与えずに、レンダラ160のリソース効率を増大させる)。
【0073】
よって、方法700は、指向性制御関数600に基づいて、聴取状況に対する制御値を決定する工程を含み得る。ここで、指向性制御関数600は、仮想現実レンダリング環境180内の聴取者181の異なる聴取状況に対して異なる制御値を与え得る。上記のように、制御値は、指向性パターン232が考慮されるべき程度を示し得る。
【0074】
さらに、方法700は、オーディオソース211、212、213の指向性パターン232、特に、指向性パターン232の指向性ゲイン410を、制御値に依存して、調節する工程(特に、指向性パターン232が考慮されるべきであると判断した場合)を含み得る。次いで、オーディオソース211、212、213のオーディオ信号は、オーディオソース211、212、213の調節された指向性パターン232に依存して、特に、調節された指向性ゲイン410に依存して、レンダリングされ得る。よって(指向性パターン232を使用するかどうかの判断に加えて)、指向性制御関数600を使用して、オーディオ信号をレンダリングする際の指向性を考慮する程度を制御し得る。当該程度は、聴取者181の聴取状況に依存して(特に、ソース位置500と聴取位置182、201、202との間の距離320に依存して)、変化(連続的に)し得る。こうすることによって、仮想現実レンダリング環境180内でのオーディオレンダリングの知覚品質をさらに向上させ得る。
【0075】
オーディオソース211、212、213の指向性パターン232を調節する(制御値に依存して)工程は、一様な指向性パターンを用いて、オーディオソース211、212、213の(一様でない)指向性パターン232の重み付け和を決定する工程を含み得る。ここで、重み付け和を決定するための重みは、制御値に依存し得る。調節された指向性パターンは、重み付け和であり得る。特に、調節された指向性ゲインは、遷移元指向性ゲイン410および一様なゲイン(典型的には、1または0dB)の重み付け和として決定され得る。近接場閾値または遠隔場閾値に近づく距離320に対して指向性パターン232を調節する(平滑に)ことによって、指向性パターン232の適用と抑制との間の平滑な遷移が達成され得るので、知覚品質がさらに向上し得る。
【0076】
オーディオソース211、212、213の指向性パターン232は、基準聴取状況に、特に、オーディオソース211、212、213のソース位置500と聴取者181の聴取位置との間の基準距離610に適用可能であり得る。特に、指向性パターン232は、基準聴取状況に対して、特に、基準距離610に対して測定および/または設計されていてもよい。
【0077】
指向性制御関数600は、聴取状況が基準聴取状況に対応する場合(特に、距離320が基準距離610に対応する場合)に、指向性パターン232、特に、指向性ゲイン410が調節されないような関数であり得る。例として、指向性制御関数600は、聴取状況が基準聴取状況に対応する場合に、制御値(例えば、1)に対して最大値を与え得る。
【0078】
さらに、指向性制御関数600は、聴取状況が基準聴取状況から逸脱するほど(特に、距離320が基準距離610から逸脱するうちに)指向性パターン232の調節の程度が増大するような関数であり得る。特に、指向性制御関数600は、聴取状況が基準聴取状況から逸脱するほど(特に、距離320が基準距離610から逸脱するうちに)指向性パターン232が漸進的に一様な指向性パターンに向かう(すなわち、指向性ゲイン410が漸進的に1または0dBに向かう)ような関数であり得る。これにより、知覚品質は、さらに増大され得る。
【0079】
図7bは、仮想現実レンダリング環境180内の聴取者181に対して、第1のオーディオソース211のオーディオ信号をレンダリングするための例示の方法710のフローチャートを示す。方法710は、レンダラ160によって実行され得る。なお、本明細書に、特に方法700に関して、記載したすべての態様は、方法710にも適用可能である(単独で、または、組み合わせて)。
【0080】
方法710は、指向性制御関数600に基づいて、仮想現実レンダリング環境180内の聴取者181の聴取状況に対する制御値を決定する工程711を含む。上記のように、指向性制御関数600は、異なる聴取状況に対して異なる制御値を与え得る。ここで、制御値は、オーディオソース211、212、213の指向性が考慮されるべき程度を示し得る。
【0081】
方法710は、制御値に依存して、第1のオーディオソース211、212、213の指向性パターン232、特に、指向性ゲイン410を調節する工程712をさらに含み得る。加えて、方法710は、仮想現実レンダリング環境180内の聴取者181に対して、第1のオーディオソース211、212、213の調節された指向性パターン232に依存して、特に、指向性ゲイン410に依存して、第1のオーディオソース211、212、213のオーディオ信号をレンダリングする工程713を含む。現在の聴取状況に依存して、指向性の適用の程度を調節することによって、仮想現実レンダリング環境180内のオーディオレンダリングの知覚品質が増大され得る。
【0082】
図1aに関して概説したように、仮想現実レンダリング環境内のオーディオ信号をレンダリングするためのデータは、エンコーダ130によってビットストリーム140内に与えられ得る。図7cは、ビットストリーム140を生成するための例示の方法720のフローチャートを示す。方法720は、エンコーダ130によって実行され得る。なお、本明細書に記載の特徴は、方法720に適用され得る(単独で、および/または、組み合わせて)。
【0083】
方法720は、少なくとも1つのオーディオソース211、212、213のオーディオ信号を決定する工程721、当該少なくとも1つのオーディオソース211、212、213の仮想現実レンダリング環境180内のソース位置500を決定する工程722、および/または、当該少なくとも1つのオーディオソース211、212、213の指向性パターン232を決定する工程723を含む。さらに、方法720は、仮想現実レンダリング環境180内の聴取者181の聴取状況に依存して、当該少なくとも1つのオーディオソース211、212、213のオーディオ信号をレンダリングするための指向性パターン232の使用を制御するための指向性制御関数600を決定する工程724を含む。加えて、方法720は、オーディオ信号、ソース位置500、指向性パターン232および/または指向性制御関数600に関するデータをビットストリーム140中に挿入する工程725を含む。
【0084】
よって、仮想現実環境の作成者には、1つまたは複数のオーディオソース211、212、213の指向性を柔軟かつ正確に制御するための手段が与えられる。
【0085】
さらに、仮想現実レンダリング環境180におけるオーディオソース211、212、213のオーディオ信号をレンダリングするための仮想現実オーディオレンダラ160が記載される。オーディオレンダラ160は、方法700および/または方法710の方法工程を実行するように構成され得る。
【0086】
加えて、ビットストリーム140を生成するように構成されたオーディオエンコーダ130が記載される。オーディオエンコーダ130は、方法720の方法工程を実行するように構成され得る。
【0087】
さらに、ビットストリーム140が記載される。ビットストリーム140は、少なくとも1つのオーディオソース211、212、213のオーディオ信号、および/または、当該少なくとも1つのオーディオソース211、212、213の仮想現実レンダリング環境180内(すなわち、オーディオシーン111内)のソース位置500を示し得る。さらに、ビットストリーム140は、当該少なくとも1つのオーディオソース211、212、213の指向性パターン232、および/または、仮想現実レンダリング環境180内の聴取者181の聴取状況に依存して、当該少なくとも1つのオーディオソース211、212、213のオーディオ信号をレンダリングするための指向性パターン232の使用を制御するための指向性制御関数600を示し得る。指向性制御関数600は、パラメータ化および/またはサンプリングされた方法で示され得る。指向性パターン232および/または指向性制御関数600は、ビットストリーム140内にVRメタデータとして与えられ得る(図1aに関して概説)。
【0088】
本明細書に記載される方法およびシステムは、ソフトウェア、ファームウェアおよび/またはハードウェアとして実装され得る。ある種のコンポーネントは、例えば、デジタル信号プロセッサまたはマイクロプロセッサ上で動作するソフトウェアとして実装されてもよい。他のコンポーネントは、例えば、ハードウェアとして、および/または、特定用途向け集積回路として実装されてもよい。上述の方法およびシステムに現れる信号は、ランダムアクセスメモリまたは光記憶媒体などの媒体に格納されてもよい。それらは、無線ネットワーク、衛星ネットワーク、ワイヤレスネットワークまたは有線ネットワーク、例えば、インターネットなどのネットワークを介して転送されてもよい。本明細書に記載される方法およびシステムを利用する典型的なデバイスは、オーディオ信号を格納および/またはレンダリングするために使用される携帯型電子デバイスまたは他の民生用装置である。
【0089】
本発明の様々な態様は、以下に列挙する例示の実施形態(enumerated example embodiments:EEE)から理解され得る。
【0090】
1)仮想現実レンダリング環境(180)におけるオーディオソース(211、212、213)のオーディオ信号をレンダリングするための方法(700)であって、前記方法(700)は、
前記仮想現実レンダリング環境(180)内の聴取者(181)の聴取状況に対して、前記オーディオソース(211、212、213)の指向性パターン(232)が考慮されるべきであるかどうかを判断する工程(701)と、
前記聴取者(181)の前記聴取状況に対して、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきでないと判断された場合、前記オーディオソース(211、212、213)の前記指向性パターン(232)を考慮せずに、前記オーディオソース(211、212、213)のオーディオ信号をレンダリングする工程(702)と、
前記聴取者(181)の前記聴取状況に対して、前記指向性パターン(232)が考慮されるべきであると判断された場合、前記オーディオソース(211、212、213)の前記指向性パターン(232)に依存して、前記オーディオソース(211、212、213)の前記オーディオ信号をレンダリングする工程(703)と、
を包含する、
方法(700)。
【0091】
2)前記方法(700)は、
前記聴取状況を記述する1つまたは複数のパラメータを決定する工程と、
前記1つまたは複数のパラメータに基づいて、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきであるかどうかを判断する工程(701)と、
を包含する、
EEE1に記載の方法(700)。
【0092】
3)前記1つまたは複数のパラメータは、
前記オーディオソース(211、212、213)のソース位置(500)と前記聴取者(181)の聴取位置(182、201、202)との間の距離(320)、
前記オーディオ信号の周波数、
前記オーディオ信号がレンダリングされるべき時刻、
前記仮想現実レンダリング環境(180)内の前記オーディオソース(211、212、213)に関にする、前記聴取者(181)の向きおよび/または視線方向および/または軌跡、
前記オーディオ信号をレンダリングするためのレンダラ(160)の条件、特に計算リソースに関する条件、および/または、
前記仮想現実レンダリング環境(180)に関する前記聴取者(181)の動作、
を含む、
EEE2に記載の方法(700)。
【0093】
4)前記方法(700)は、
前記仮想現実レンダリング環境(180)内の前記聴取者(181)の聴取位置(182、201、202)からの前記オーディオソース(211、212、213)のソース位置(500)の距離(320)を決定する工程と、
前記距離(320)に基づいて、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきであるかどうかを判断する工程(701)と、
を包含する、
先行するEEEのいずれかに記載の方法(700)。
【0094】
5)前記方法(700)は、
前記聴取位置(182、201、202)からの前記オーディオソース(211、212、213)の前記ソース位置(500)の前記距離(320)が近距離場閾値よりも小さいと判断する工程、および、
これに反応して、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきでないと判断する工程、および/または、
前記聴取位置(182、201、202)からの前記オーディオソース(211、212、213)の前記ソース位置(500)の前記距離(320)が前記近距離場閾値よりも大きいと判断する工程、および
これに反応して、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきであると判断する工程、
を包含する、
EEE4に記載の方法(700)。
【0095】
6)前記方法(700)は、
前記聴取位置(182、201、202)からの前記オーディオソース(211、212、213)の前記ソース位置(500)の前記距離(320)が遠距離場閾値よりも大きいと判断する工程、および、
これに反応して、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきでないと判断する工程、および/または、
前記聴取位置(182、201、202)からの前記オーディオソース(211、212、213)の前記ソース位置(500)の前記距離(320)が前記遠距離場閾値よりも小さいと判断する工程、および、
これに反応して、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきであると判断する工程、
を包含する、
EEE4または5に記載の方法(700)。
【0096】
7)前記近接場閾値および/または前記遠隔場閾値は、指向性制御関数(600)に依存し、
前記指向性制御関数(600)は、前記距離(320)の関数としての制御値を与え、かつ、
前記制御値は、前記指向性パターン(232)が考慮されるべき程度を示す、
EEE5または6に記載の方法(700)。
【0097】
8)前記方法(700)は、
指向性制御関数(600)に基づいて、前記聴取状況に対する制御値を決定する工程であって、前記指向性制御関数(600)は、異なる聴取状況に対して異なる制御値を与える、工程と、
前記制御値に基づいて、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきであるかどうかを判断する工程と、
を包含する、
先行するEEEのいずれかに記載の方法(700)。
【0098】
9)前記方法(700)は、
前記制御値を制御閾値と比較する工程と、
前記比較に基づいて、特に前記制御値が前記制御閾値よりも大きいか、または、小さいかの何れであるかに依存して、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきであるかどうかを判断する工程と、
を包含する、
EEE8に記載の方法(700)。
【0099】
10)前記指向性制御関数(600)は、最小値と最大値との間の制御値を与えるように構成され、
特に、前記最小値は、0であり、および/または、前記最大値は、1であり、
前記制御閾値は、前記最小値と前記最大値との間に存在し、かつ、
前記方法(700)は、
前記聴取状況に対する前記制御値が前記制御閾値よりも小さい場合、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきでないと判断する工程、および/または、
前記聴取状況に対する前記制御値が前記制御閾値よりも大きい場合、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきであると判断する工程、
を包含する、
EEE9に記載の方法(700)。
【0100】
11)前記指向性制御関数(600)は、
前記聴取者(181)の聴取位置(182、201、202)からの前記オーディオソース(211、212、213)のソース位置(500)の距離(320)が近接場閾値よりも小さい、および/または、
前記聴取者(181)の前記聴取位置(182、201、202)からの前記オーディオソース(211、212、213)の前記ソース位置(500)の前記距離(320)が遠隔場閾値よりも大きい、
ような聴取状況において、前記制御閾値未満の制御値を与えるように構成される、
EEE10に記載の方法(700)。
【0101】
12)前記方法(700)は、
指向性制御関数(600)に基づいて、前記聴取状況に対する制御値を決定する工程であって、前記指向性制御関数(600)は、異なる聴取状況に対して異なる制御値を与え、前記制御値は、前記指向性パターン(232)が考慮されるべき程度を示す、工程と、
前記制御値に依存して、前記オーディオソース(211、212、213)の前記指向性パターン(232)を調節する工程と、
前記オーディオソース(211、212、213)の前記調節された指向性パターン(232)に依存して、前記オーディオソース(211、212、213)の前記オーディオ信号をレンダリングする工程(703)と、
を包含する、
先行するEEEのいずれかに記載の方法(700)。
【0102】
13)前記オーディオソース(211、212、213)の前記指向性パターン(232)を調節する工程は、前記オーディオソース(211、212、213)の前記指向性パターン(232)の重み付け和を一様な指向性パターンを用いて決定する工程を包含し、かつ、
前記重み付け和を決定するための重みは、前記制御値に依存する、
EEE12に記載の方法(700)。
【0103】
14)前記オーディオソース(211、212、213)の前記指向性パターン(232)は、基準聴取状況、特に、前記オーディオソース(211、212、213)のソース位置(500)と前記聴取者(181)の聴取位置との間の基準距離(610)に適用可能であり、かつ、
前記指向性制御関数(600)は、
前記聴取状況が前記基準聴取状況に対応する場合、前記指向性パターン(232)が調節されず、および/または、
特に、前記指向性パターン(232)が前記聴取状況の前記基準聴取状況からのずれが大きくなるにつれて一様な指向性パターンに漸進的に向かうように、前記指向性パターン(232)の調節の程度が前記聴取状況の前記基準聴取状況からのずれが大きくなるにつれて大きくなる、
ような関数である、
EEE12または13に記載の方法(700)。
【0104】
15)前記オーディオソース(211、212、213)の前記指向性パターン(232)は、前記オーディオ信号の異なる方向の強度を示し、および/または、
前記指向性パターン(232)は、前記オーディオ信号をレンダリングするために前記オーディオ信号に適用されるべき方向依存性指向性ゲイン(410)を示す、
先行するEEEのいずれかに記載の方法(700)。
【0105】
16)前記指向性パターン(232)は、指向性ゲイン関数(415)を示し、かつ、
前記指向性ゲイン関数(415)は、前記オーディオソース(211、212、213)のソース位置(500)と前記聴取者(181)の聴取位置(182、201、202)との間の指向性角(420)の関数として指向性ゲイン(410)を示す、
EEE14に記載の方法(700)。
【0106】
17)前記オーディオソース(211、212、213)の前記指向性パターン(232)に依存して、前記オーディオソース(211、212、213)の前記オーディオ信号をレンダリングする工程(703)は、
前記指向性パターン(232)に基づいて、かつ、前記オーディオソース(211、212、213)のソース位置(500)と前記聴取者(181)の聴取位置(182、201、202)との指向性角(420)に基づいて、指向性ゲイン(410)を決定する工程と、
前記指向性ゲイン(410)に依存して、前記オーディオ信号をレンダリングする工程と、
を包含する、
先行するEEEのいずれかに記載の方法(700)。
【0107】
18)前記方法(700)は、
前記オーディオソース(211、212、213)のソース位置(500)と前記聴取者(181)の聴取位置(182、201、202)との間の距離(320)に依存して、減衰ゲイン(651)を、前記減衰ゲイン(651)を前記距離(320)の関数として示す減衰関数(650)を使用して決定する工程と、
前記減衰ゲイン(651)に依存して、前記オーディオ信号をレンダリングする工程と、
を包含する、
先行するEEEのいずれかに記載の方法(700)。
【0108】
19)仮想現実レンダリング環境(180)内の聴取者(181)に対して、第1のオーディオソース(211)のオーディオ信号をレンダリングするための方法(710)であって、前記方法(710)は、
前記仮想現実レンダリング環境(180)内の前記聴取者(181)の聴取状況に対する制御値を、指向性制御関数(600)に基づいて決定する工程(711)であって、前記指向性制御関数(600)は、異なる聴取状況に対して異なる制御値を与え、前記制御値は、オーディオソース(211、212、213)の指向性が考慮されるべき程度を示す、工程(711)と、
前記制御値に依存して、前記第1のオーディオソース(211、212、213)の指向性パターン(232)を調節する工程(712)と、
前記仮想現実レンダリング環境(180)内の前記聴取者(181)に対して、前記第1のオーディオソース(211、212、213)の前記調節された指向性パターン(232)に依存して、前記第1のオーディオソース(211、212、213)の前記オーディオ信号をレンダリングする工程(713)と、
を包含する、
方法(710)。
【0109】
20)仮想現実レンダリング環境(180)内のオーディオソース(211、212、213)のオーディオ信号をレンダリングするための仮想現実オーディオレンダラ(160)であって、前記オーディオレンダラ(160)は、
前記仮想現実レンダリング環境(180)内の聴取者(181)の聴取状況に対して、前記オーディオソース(211、212、213)の指向性パターン(232)が考慮されるべきであるかどうかを判断し、
前記聴取者(181)の前記聴取状況に対して、前記オーディオソース(211、212、213)の前記指向性パターン(232)が考慮されるべきでないと判断された場合、前記オーディオソース(211、212、213)の前記指向性パターン(232)を考慮せずに、前記オーディオソース(211、212、213)のオーディオ信号をレンダリングし、かつ、
前記聴取者(181)の前記聴取状況に対して、前記指向性パターン(232)が考慮されるべきであると判断された場合、前記オーディオソース(211、212、213)の前記指向性パターン(232)に依存して、前記オーディオソース(211、212、213)の前記オーディオ信号をレンダリングする、
ように構成された、
仮想現実オーディオレンダラ(160)。
【0110】
21)仮想現実レンダリング環境(180)内の聴取者(181)に対して、第1のオーディオソース(211)のオーディオ信号をレンダリングするための仮想現実オーディオレンダラ(160)であって、前記オーディオレンダラ(160)は、
前記仮想現実レンダリング環境(180)内の前記聴取者(181)の聴取状況に対する制御値を、指向性制御関数(600)に基づいて決定し、前記指向性制御関数(600)は、異なる聴取状況に対して異なる制御値を与え、前記制御値は、オーディオソース(211、212、213)の指向性が考慮されるべき程度を示し、
前記制御値に依存して、前記第1のオーディオソース(211、212、213)の指向性パターン(232)を調節し、かつ、
前記仮想現実レンダリング環境(180)内の前記聴取者(181)に対して、前記第1のオーディオソース(211、212、213)の前記調節された指向性パターン(232)に依存して、前記第1のオーディオソース(211、212、213)の前記オーディオ信号をレンダリングする、
ように構成された、
仮想現実オーディオレンダラ(160)。
【0111】
22)少なくとも1つのオーディオソース(211、212、213)のオーディオ信号と、
前記少なくとも1つのオーディオソース(211、212、213)の仮想現実レンダリング環境(180)内のソース位置(500)と、
前記少なくとも1つのオーディオソース(211、212、213)の指向性パターン(232)と、
前記仮想現実レンダリング環境(180)内の聴取者(181)の聴取状況に依存して、前記少なくとも1つのオーディオソース(211、212、213)の前記オーディオ信号をレンダリングするための前記指向性パターン(232)の使用を制御するための指向性制御関数(600)と、
を示すビットストリーム(140)を生成するように構成されたオーディオエンコーダ(130)。
【0112】
23)少なくとも1つのオーディオソース(211、212、213)のオーディオ信号と、
前記少なくとも1つのオーディオソース(211、212、213)の仮想現実レンダリング環境(180)内のソース位置(500)と、
前記少なくとも1つのオーディオソース(211、212、213)の指向性パターン(232)と、
前記仮想現実レンダリング環境(180)内の聴取者(181)の聴取状況に依存して、前記少なくとも1つのオーディオソース(211、212、213)の前記オーディオ信号をレンダリングするための前記指向性パターン(232)の使用を制御するための指向性制御関数(600)と、
を示すビットストリーム(140)。
【0113】
24)ビットストリーム(140)を生成するための方法(720)であって、前記方法(720)は、
少なくとも1つのオーディオソース(211、212、213)のオーディオ信号を決定する工程(721)と、
前記少なくとも1つのオーディオソース(211、212、213)の仮想現実レンダリング環境(180)内のソース位置(500)を決定する工程(722)と、
前記少なくとも1つのオーディオソース(211、212、213)の指向性パターン(232)を決定する工程(723)と、
前記仮想現実レンダリング環境(180)内の聴取者(181)の聴取状況に依存して、前記少なくとも1つのオーディオソース(211、212、213)の前記オーディオ信号をレンダリングするための前記指向性パターン(232)の使用を制御するための指向性制御関数(600)を決定する工程(724)と、
前記オーディオ信号、前記ソース位置(500)、前記指向性パターン(232)および前記指向性制御関数(600)に関するデータを前記ビットストリーム(140)内に挿入する工程(725)と、
を包含する、
方法(720)。
図1a
図1b
図2
図3a
図3b
図4a
図4b
図5a
図5b
図6a
図6b
図7a
図7b
図7c
【国際調査報告】