(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-16
(45)【発行日】2023-05-24
(54)【発明の名称】見かけのサイズをもつオーディオ・オブジェクトの任意のラウドスピーカー・レイアウトへのレンダリング
(51)【国際特許分類】
H04S 7/00 20060101AFI20230517BHJP
【FI】
H04S7/00 300
【外国語出願】
(21)【出願番号】P 2021074974
(22)【出願日】2021-04-27
(62)【分割の表示】P 2019191956の分割
【原出願日】2014-03-10
【審査請求日】2021-04-27
(32)【優先日】2013-03-28
(33)【優先権主張国・地域又は機関】ES
(32)【優先日】2013-06-11
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(73)【特許権者】
【識別番号】510185767
【氏名又は名称】ドルビー・インターナショナル・アーベー
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】マテオス ソレ,アントニオ
(72)【発明者】
【氏名】ツインゴス,ニコラス アール
【審査官】堀 洋介
(56)【参考文献】
【文献】国際公開第2013/006330(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 5/00- 7/00
G10L 19/00-19/008
(57)【特許請求の範囲】
【請求項1】
少なくとも一つのオーディオ・オブジェクトおよび関連したメタデータを含む入力オーディオをレンダリングする方法であって
、当該方法は:
前記オーディオ・オブジェクトについてのオーディオ・オブジェクト・メタデータを受領する段階であって、前記オーディオ・オブジェクト・メタデータは、前記オーディオ・オブジェクトに関連するオーディオ・オブジェクト
位置メタデータおよび
サイズ・メタデータを
含む、段階と;
複数の仮想源利得値を決定する段階であって、前記複数の仮想源利得値はセットアップ・プロセスの間に決定される、段階と;
前記
オーディオ・オブジェクト・メタデータおよび前記仮想源利得値の部分集合に基づいて、前記
入力オーディ
オを、一つまたは複数のスピーカー・フィードにレンダリングする段階とを含み、
前記仮想源利得値の前記部分集合に含まれる前記仮想源利得値について、各仮想源位置が前記オーディオ・オブジェクト・メタデータによって定義される領域または体積内であり;
各仮想源位置について
、複数の出力チャネルのそれぞれについての仮想源利得値
が計算
されており、前記複数の仮想源利得値を与えている、
方法。
【請求項2】
決定された仮想源利得値をメモリ・システムに記憶する段階をさらに含む、請求項1に記載の方法。
【請求項3】
再生環境データを受領する段階をさらに含み、前記再生環境データは再生環境境界データを含み、
前記オーディオ・オブジェクト・サイズ・メタデータが、再生環境境界の外の外側領域または体積を含むことを判別する段階と;
少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を適用する段階とをさらに含む、
請求項1に記載の方法。
【請求項4】
前
記オーディオ・オブジェクトがある再生環境境界から閾値距離以内であることを判別することと;
前記再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないことをさらに含む、
請求項
3に記載の方法。
【請求項5】
請求項1に記載の方法を
コンピュータに実行
させるための命令を含むソフトウェアを記憶している非一時的な媒体。
【請求項6】
少なくとも一つのオーディオ・オブジェクトおよび関連したメタデータを含む入力オーディオをレンダリングするための装置であって
、当該装置は:
前記オーディオ・オブジェクトについてのオーディオ・オブジェクト・メタデータを受領するよう構成された受領器であって、前記オーディオ・オブジェクト・メタデータは、前記オーディオ・オブジェクトに関連するオーディオ・オブジェクト
位置メタデータおよび
サイズ・メタデータを
含む、受領器と;
複数の仮想源利得値を決定するように構成された第一のプロセッサであって、前記複数の仮想源利得値はセットアップ・プロセスの間に決定される、第一のプロセッサと;
前記
オーディオ・オブジェクト・メタデータおよび前記仮想源利得値の部分集合に基づいて、前記
入力オーディ
オを、一つまたは複数のスピーカー・フィードにレンダリングするレンダラ
ーとを有しており、
前記仮想源利得値の前記部分集合に含まれる前記仮想源利得値について、各仮想源位置が前記オーディオ・オブジェクト・メタデータによって定義される領域または体積内であり;
各仮想源位置について
、複数の出力チャネルのそれぞれについての仮想源利得値
が計算
されており、前記複数の仮想源利得値を与えている、
装置。
【請求項7】
前記第
一のプロセッサが、
決定された仮想源利得値をメモリ・システムに記憶するようにさらに構成されている、請求項
6に記載の装置。
【請求項8】
再生環境データを受領するように構成された第
二のプロセッサをさらに有しており、前記再生環境データは再生環境境界データを含み、
前記オーディオ・オブジェクト・サイズ・メタデータが、再生環境境界の外の外側領域または体積を含むことを判別する段階と;
少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を適用する段階とをさらに含む、
請求項
6に記載の装置。
【請求項9】
前記第
二のプロセッサが:
あるオーディオ・オブジェクトがある再生環境境界から閾値距離以内であることを判別し;
前記再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないようにさらに構成されている、
請求項
8に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は2013年3月28日に出願されたスペイン特許出願第P201330461号および2013年6月11日に出願された米国仮特許出願第61/833,581号の優先権を主張するものである。各出願の内容はここに参照によりその全体において組み込まれる。
【0002】
技術分野
本開示は、オーディオ再生データのオーサリングおよびレンダリングに関する。特に、本開示は映画館サウンド再生システムのような再生環境のためのオーディオ再生データをオーサリングおよびレンダリングすることに関する。
【背景技術】
【0003】
1927年に映画に音声が導入されて以来、映画サウンドトラックの芸術的な意図を捉えてそれを映画館環境で再現するために使われる技術は着実に進歩を遂げてきた。1930年代にはディスク上の同期されたサウンドはフィルム上の可変領域サウンドに取って代わられ、それは1940年代にはさらに、劇場の音響の考察および改善されたスピーカー設計により改善された。それとともにマルチトラック録音および方向制御可能な再生(音を動かすために制御トーンを使う)の早期の導入があった。1950年代および1960年代には、フィルムの磁気ストライプにより劇場での多チャネル再生が可能になり、サラウンド・チャネル、高級なシアターでは5つのスクリーン・チャネルまでを導入した。
【0004】
1970年代には、ドルビーは、ポストプロダクションおよびフィルム上の両方におけるノイズ削減を、3つのスクリーン・チャネルおよびモノのサラウンド・チャネルとの混合をエンコードおよび配布するコスト効率のよい手段とともに、導入した。映画館サウンドの品質は1980年代には、ドルビー・スペクトラル・レコーディング(SR: Spectral Recording)ノイズ削減およびTHXのような認証プログラムによってさらに改善された。ドルビーは1990年代に、離散的な左、中央および右スクリーン・チャネル、左および右のサラウンド・アレイおよび低域効果のためのサブウーファー・チャネルを与える5.1チャネル・フォーマットをもって映画館にデジタル・サウンドをもたらした。2010年に導入されたドルビー・サラウンド7.1は、既存の左および右サラウンド・チャネルを四つの「ゾーン」に分割することによって、サラウンド・チャネルの数を増やした。
【0005】
チャネル数が増え、スピーカー・レイアウトが平面的な二次元(2D)アレイから高さを含む三次元(3D)アレイに遷移するにつれ、サウンドをオーサリングおよびレンダリングするタスクはますます複雑になる。改善された方法および装置が望ましいであろう。
【先行技術文献】
【非特許文献】
【0006】
【文献】V. Pulkki、Compensating Displacement of Amplitude-Panned Virtual Sources、Audio Engineering Society (AES) International Conference on Virtual, Synthetic and Entertainment Audio
【文献】D. de Vries、Wave Field Synthesis、AES Monograph 1999
【発明の概要】
【課題を解決するための手段】
【0007】
本開示に記載される主題のいくつかの側面は、いかなる特定の再生環境をも参照することなく生成されるオーディオ・オブジェクトを含むオーディオ再生データをレンダリングするためのツールにおいて実装されることができる。本稿での用法では、用語「オーディオ・オブジェクト」は、オーディオ信号および関連するメタデータのストリームを指してもよい。メタデータは、少なくともオーディオ・オブジェクトの位置および見かけのサイズを示してもよい。しかしながら、メタデータは、レンダリング制約条件データ、コンテンツ型データ(たとえばダイアログ、効果など)、利得データ、軌跡データなども示してもよい。いくつかのオーディオ・オブジェクトは静的であってもよく、一方、他のオーディオ・オブジェクトは時間変化するメタデータを有していてもよい:そのようなオーディオ・オブジェクトは、動いてもよく、サイズを変えてもよく、および/または時間とともに変化する他の属性を有していてもよい。
【0008】
オーディオ・オブジェクトが再生環境においてモニタリングまたは再生されるとき、オーディオ・オブジェクトは、少なくとも位置およびサイズのメタデータに従ってレンダリングされてもよい。レンダリング・プロセスは、出力チャネルの集合の各チャネルについての一組のオーディオ・オブジェクト利得値を計算することに関わっていてもよい。各出力チャネルは、再生環境の一つまたは複数の再生スピーカーに対応していてもよい。
【0009】
本稿に記載されるいくつかの実装は、何らかの特定のオーディオ・オブジェクトをレンダリングするのに先立って行なわれうる「セットアップ」プロセスに関わる。本稿で第一段またはステージ1とも称されることがあるこのセットアップ・プロセスは、オーディオ・オブジェクトが動くことができる体積内で複数の仮想源位置を定義することに関わっていてもよい。本稿での用法では、「仮想源位置」は、静的な点源の位置である。そのような実装によれば、セットアップ・プロセスは、再生スピーカー位置データを受領し、再生スピーカー位置データおよび仮想源位置に従って仮想源のそれぞれについて仮想源利得値を事前計算することに関わっていてもよい。本稿での用法では、「スピーカー位置データ」は、再生環境のスピーカーの一部または全部の位置を示す位置データを含んでいてもよい。位置データは、再生スピーカー位置の絶対座標、たとえばデカルト座標、球面座標などとして与えられてもよい。代替的または追加的に、位置データは、再生環境の音響的な「スイートスポット」のような他の再生環境位置に対する座標(たとえばデカルト座標または角座標)として与えられてもよい。
【0010】
いくつかの実装では、仮想源利得値は、オーディオ再生データが再生環境のスピーカーのためにレンダリングされる「ランタイム」の間に、記憶され、使用されてもよい。ランタイムの間に、各オーディオ・オブジェクトについて、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域または体積内の仮想源位置からの寄与が計算されてもよい。仮想源位置からの寄与を計算するプロセスは、オーディオ・オブジェクトのサイズおよび位置によって定義されるオーディオ・オブジェクト領域または体積内にある仮想源位置についてセットアップ・プロセスの間に決定された複数の事前計算された仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。再生環境の各出力チャネルについての一組のオーディオ・オブジェクト利得値が、少なくとも部分的には、計算された仮想源寄与に基づいて計算されてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。
【0011】
よって、本稿に記載されるいくつかの方法は、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領することに関わる。オーディオ・オブジェクトはオーディオ信号および関連するメタデータを含んでいてもよい。メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含んでいてもよい。これらの方法は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算することに関わっていてもよい。これらの方法は、複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を、少なくとも部分的には、計算された寄与に基づいて計算することに関わっていてもよい。たとえば、再生環境は映画館サウンド・システム環境であってもよい。
【0012】
仮想源からの寄与を計算するプロセスは、オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。重み付けされた平均のための重みは、オーディオ・オブジェクトの位置、オーディオ・オブジェクトのサイズおよび/またはオーディオ・オブジェクト領域または体積内の各仮想源位置に依存してもよい。
【0013】
これらの方法は、再生スピーカー位置データを含む再生環境データを受領することにも関わっていてもよい。これらの方法は、再生環境データに従って複数の仮想源位置を定義し、各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算することにも関わっていてもよい。いくつかの実装では、仮想源位置のそれぞれは、再生環境内のある位置に対応していてもよい。しかしながら、いくつかの実装では、仮想源位置の少なくともいくつかは、再生環境の外の位置に対応していてもよい。
【0014】
いくつかの実装では、仮想源位置はx、y、z軸に沿って一様に離間されていてもよい。しかしながら、いくつかの実装では、離間はすべての方向において同じでなくてもよい。たとえば、仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間を有していてもよい。前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するプロセスは、x、y、z軸に沿った仮想源からの寄与の独立した計算に関わっていてもよい。代替的な実装では、仮想源位置は非一様に離間されていてもよい。
【0015】
いくつかの実装では、前記複数の出力チャネルのそれぞれについてのオーディオ・オブジェクト利得値を計算するプロセスは、位置x
o,y
o,z
oにおいてレンダリングされるべきサイズ(s)のオーディオ・オブジェクトについての利得値(g
l(x
o,y
o,z
o;s))を決定することに関わっていてもよい。たとえば、オーディオ・オブジェクト利得値(g
l(x
o,y
o,z
o;s))は
【数1】
と表わされてもよい。ここで、(x
vs,y
vs,z
vs)は仮想源(virtual source)位置を表わし、g
l(x
vs,y
vs,z
vs)は仮想源位置x
vs,y
vs,z
vsについてのチャネルlについての利得値を表わし、w(x
vs,y
vs,z
vs;x
o,y
o,z
o;s)は、少なくとも部分的には、オーディオ・オブジェクトの位置(x
o,y
o,z
o)、オーディオ・オブジェクトのサイズ(s)および仮想源位置(x
vs,y
vs,z
vs)に基づいて決定されるg
l(x
vs,y
vs,z
vs)についての一つまたは複数の重み関数を表わす。
【0016】
いくつかのそのような実装によれば、gl(xvs,yvs,zvs)=gl(xvs)gl(yvs)gl(zvs)であり、ここで、gl(xvs)、gl(yvs)およびgl(zvs)はx、yおよびzの独立な利得関数を表わす。いくつかのそのような実装では、重み関数は次のように因子分解されてもよい。
【0017】
w(xvs,yvs,zvs;xo,yo,zo;s)=wx(xvs;xo;s)wy(yvs;yo;s)wz(zvs;zo;s)
ここで、wx(xvs;xo;s)、wy(yvs;yo;s)およびwz(zvs;zo;s)はxvs、yvsおよびzvsの独立な重み関数を表わす。いくつかのそのような実装によれば、pはオーディオ・オブジェクト・サイズ(s)の関数であってもよい。
【0018】
いくつかのそのような方法は、計算された仮想源利得値をメモリ・システムに記憶することに関わっていてもよい。オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算するプロセスは、メモリ・システムから、オーディオ・オブジェクト位置およびサイズに対応する計算された仮想源利得値を取り出し、計算された仮想源利得値の間を補間することに関わっていてもよい。計算された仮想源利得値の間を補間するプロセスは:オーディオ・オブジェクト位置の近くの複数の近隣の仮想源位置を決定し;前記近隣の仮想源位置のそれぞれについて計算された仮想源利得値を決定し;前記オーディオ・オブジェクト位置と前記近隣の仮想源位置のそれぞれとの間の複数の距離を決定し;前記複数の距離に従って、計算された仮想源利得値の間を補間することに関わっていてもよい。
【0019】
いくつかの実装では、再生環境データは、再生環境境界データを含んでいてもよい。前記方法は、オーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別し、少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を適用することに関わっていてもよい。いくつかの方法は、オーディオ・オブジェクトがある再生環境境界から閾値距離以内であってもよいことを判別し、再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないことに関わっていてもよい。いくつかの実装では、オーディオ・オブジェクト領域または体積は、長方形、直方体、円、球、楕円および/または楕円体であってもよい。
【0020】
いくつかの方法は、オーディオ再生データの少なくとも一部を脱相関することに関わっていてもよい。たとえば、それらの方法は、ある閾値を超えるオーディオ・オブジェクト・サイズをもつオーディオ・オブジェクトについてのオーディオ再生データを脱相関することに関わっていてもよい。
【0021】
代替的な諸方法が本稿に記載される。いくつかのそのような方法は、再生スピーカー位置データおよび再生環境境界データを含む再生環境データを受領し、一つまたは複数のオーディオ・オブジェクトおよび関連したメタデータを含むオーディオ再生データを受領することに関わる。メタデータは、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含んでいてもよい。これらの方法は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別し、少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を決定することに関わっていてもよい。それらの方法は、少なくとも部分的には前記関連したメタデータおよび前記フェードアウト因子に基づいて複数の出力チャネルのそれぞれについて一組の利得値を計算することに関わっていてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応していてもよい。
【0022】
これらの方法は、オーディオ・オブジェクトがある再生環境境界から閾値距離以内であってもよいことを判別し、再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないことに関わっていてもよい。
【0023】
これらの方法は、オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算することに関わっていてもよい。これらの方法は、再生環境データに従って複数の仮想源位置を定義し、該仮想源位置のそれぞれについて、複数の出力チャネルのそれぞれについての仮想源利得を計算することに関わっていてもよい。仮想源位置は、具体的な実装に依存して、一様に離間されていてもいなくてもよい。
【0024】
いくつかの実装は、ソフトウェアが記憶されている一つまたは複数の非一時的媒体において具現されてもよい。ソフトウェアは、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領するために一つまたは複数の装置を制御するための命令を含んでいてもよい。オーディオ・オブジェクトは、オーディオ信号および関連したメタデータを含んでいてもよい。メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含んでいてもよい。ソフトウェアは、前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域または体積内の仮想源からの寄与を計算し、少なくとも部分的には計算された寄与に基づいて複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するための命令を含んでいてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。
【0025】
いくつかの実装では、仮想源からの寄与を計算するプロセスは、オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。重み付けされた平均のための重みは、オーディオ・オブジェクトの位置、オーディオ・オブジェクトのサイズおよび/またはオーディオ・オブジェクト領域または体積内の各仮想源位置に依存してもよい。
【0026】
前記ソフトウェアは、再生スピーカー位置データを含む再生環境データを受領するための命令を含んでいてもよい。前記ソフトウェアは、再生環境データに従って複数の仮想源位置を定義し、各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算するための命令を含んでいてもよい。仮想源位置のそれぞれは、再生環境内のある位置に対応していてもよい。いくつかの実装では、仮想源位置の少なくともいくつかは、再生環境の外の位置に対応していてもよい。
【0027】
いくつかの実装によれば、仮想源位置は一様に離間されていてもよい。いくつかの実装では、仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間を有していてもよい。前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するプロセスは、x、y、z軸に沿った仮想源からの寄与の独立した計算に関わっていてもよい。
【0028】
さまざまなデバイスおよび装置が本稿に記載される。いくつかのそのような装置は、インターフェース・システムおよび論理システムを含んでいてもよい。インターフェース・システムは、ネットワーク・インターフェースを含んでいてもよい。いくつかの実装では、前記装置は、メモリ・デバイスを含んでいてもよい。インターフェース・システムは、前記論理システムと前記メモリ・デバイスとの間のインターフェースを含んでいてもよい。
【0029】
前記論理システムは、前記インターフェース・システムから、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領するよう適応されていてもよい。オーディオ・オブジェクトは、オーディオ信号および関連したメタデータを含んでいてもよい。メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含んでいてもよい。前記論理システムは、前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算するよう適応されていてもよい。前記論理システムは、少なくとも部分的には計算された寄与に基づいて複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するよう適応されていてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。
【0030】
仮想源からの寄与を計算するプロセスは、オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。重み付けされた平均のための重みは、オーディオ・オブジェクトの位置、オーディオ・オブジェクトのサイズおよび/またはオーディオ・オブジェクト領域または体積内の各仮想源位置に依存してもよい。前記論理システムは、前記インターフェース・システムから、再生スピーカー位置データを含む再生環境データを受領するよう適応されていてもよい。
【0031】
前記論理システムは、再生環境データに従って複数の仮想源位置を定義し、各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算するよう適応されていてもよい。仮想源位置のそれぞれは、再生環境内のある位置に対応していてもよい。しかしながら、いくつかの実装では、仮想源位置の少なくともいくつかは、再生環境の外の位置に対応していてもよい。具体的な実装に依存して、仮想源位置は一様に離間されていてもいなくてもよい。いくつかの実装では、仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間を有していてもよい。前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するプロセスは、x、y、z軸に沿った仮想源からの寄与の独立した計算に関わっていてもよい。
【0032】
前記装置は、ユーザー・インターフェースを含んでいてもよい。前記論理システムは、前記ユーザー・インターフェースを介して、オーディオ・オブジェクト・サイズ・データのようなユーザー入力を受領するよう適応されていてもよい。何らかの実装では、前記論理システムは、入力オーディオ・オブジェクト・サイズ・データをスケーリングするよう適応されていてもよい。
【0033】
本明細書に記載される主題の一つまたは複数の実装の詳細は、付属の図面および以下の説明において記載される。他の特徴、側面および利点が該説明、図面および請求項から明白となるであろう。以下の図面の相対的な寸法は縮尺通りに描かれていないことがあることを注意しておく。
【図面の簡単な説明】
【0034】
【
図1】ドルビー・サラウンド5.1配位をもつ再生環境の例を示す図である。
【
図2】ドルビー・サラウンド7.1配位をもつ再生環境の例を示す図である。
【
図3】浜崎22.2サラウンド・サウンド配位をもつ再生環境の例を示す図である。
【
図4A】仮想再生環境におけるさまざまな高さにおけるスピーカー・ゾーンを描くグラフィカル・ユーザー・インターフェース(GUI)の例を示す図である。
【
図5A】オーディオ処理方法の概観を与える流れ図である。
【
図5B】セットアップ・プロセスの例を与える流れ図である。
【
図5C】仮想源位置についての事前計算された利得値に従って受領されたオーディオ・オブジェクトについての利得値を計算するランタイム・プロセスの例を与える流れ図である。
【
図6A】再生環境に対する仮想源位置の例を示す図である。
【
図6B】再生環境に対する仮想源位置の代替例を示す図である。
【
図6C】種々の位置にあるオーディオ・オブジェクトに近距離場および遠距離場パン技法を適用する例を示す図である。
【
図6D】種々の位置にあるオーディオ・オブジェクトに近距離場および遠距離場パン技法を適用する例を示す図である。
【
図6E】種々の位置にあるオーディオ・オブジェクトに近距離場および遠距離場パン技法を適用する例を示す図である。
【
図6F】種々の位置にあるオーディオ・オブジェクトに近距離場および遠距離場パン技法を適用する例を示す図である。
【
図6G】1に等しい辺長をもつ正方形の各隅に一つのスピーカーをもつ再生環境の例を示す図である。
【
図7】オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域内の仮想源からの寄与の例を示す図である。
【
図8】AおよびBは、あるオーディオ・オブジェクトを再生環境内の二つの位置において示す図である。
【
図9】少なくとも部分的には、オーディオ・オブジェクトの領域または体積のうちのどのくらいが再生環境の境界外に広がるかに基づいて、フェードアウト因子を決定する方法を概説する流れ図である。
【
図10】オーサリングおよび/またはレンダリング装置のコンポーネントの例を与えるブロック図である。
【
図11】Aは、オーディオ・コンテンツ生成のために使用されうるいくつかのコンポーネントを表すブロック図であり、Bは再生環境におけるオーディオ再生のために使用されうるいくつかのコンポーネントを表すブロック図である。 さまざまな図面における同様の参照番号および符号は同様の要素を指示する。
【発明を実施するための形態】
【0035】
以下の記述は、本開示のいくつかの斬新な側面およびこれら斬新な側面が実装されうるコンテキストの例を記述する目的のためのある種の実装に向けられる。しかしながら、本稿の教示はさまざまな異なる仕方で適用されることができる。たとえば、さまざまな実装が具体的な再生環境を使って記述されているが、本稿の教示は他の既知の再生環境および将来導入されうる再生環境に広く適用可能である。同様に、記載される実装はさまざまなオーサリングおよび/またはレンダリング・ツールにおいて実装されてもよく、それらは多様なハードウェア、ソフトウェア、ファームウェア等で実装されてもよい。したがって、本開示の教示は、図面に示されるおよび/または本稿で記述される実装に限定されることは意図されておらず、むしろ広い適用可能性をもつものである。
【0036】
図1は、ドルビー・サラウンド5.1配位をもつ再生環境の例を示している。ドルビー・サラウンド5.1は1990年代に開発されたが、この配位はいまだ広く映画館サウンド・システム環境に配備されている。プロジェクター105は、たとえば映画のためのビデオ画像をスクリーン150に投影するよう構成されていてもよい。オーディオ再生データは、該ビデオ画像と同期され、サウンド・プロセッサ110によって処理されてもよい。電力増幅器115はスピーカー・フィード信号を再生環境100のスピーカーに与えてもよい。
【0037】
ドルビー・サラウンド5.1配位は、左サラウンド・アレイ120、右サラウンド・アレイ125を含み、そのそれぞれは単一チャネルによって集団駆動されるスピーカーの群を含む。ドルビー・サラウンド5.1配位は左スクリーン・チャネル130、中央スクリーン・チャネル135および右スクリーン・チャネル140についての別個のチャネルをも含む。サブウーファー145についての別個のチャネルが低域効果(LFE: low-frequency effects)のために提供される。
【0038】
2010年に、ドルビーはドルビー・サラウンド7.1を導入することによってデジタル映画館サウンドに対する向上を提供した。
図2は、ドルビー・サラウンド7.1配位をもつ再生環境の例を示している。デジタル・プロジェクター205はデジタル・ビデオ・データを受領し、ビデオ画像をスクリーン150上に投影するよう構成されていてもよい。オーディオ再生データは、サウンド・プロセッサ210によって処理されてもよい。電力増幅器215がスピーカー・フィード信号を再生環境200のスピーカーに提供してもよい。
【0039】
ドルビー・サラウンド7.1配位は、左側方サラウンド・アレイ220および右側方サラウンド・アレイ225を含み、そのそれぞれは単一チャネルによって駆動されてもよい。ドルビー・サラウンド5.1と同様に、ドルビー・サラウンド7.1配位は左スクリーン・チャネル230、中央スクリーン・チャネル235、右スクリーン・チャネル240およびサブウーファー245のための別個のチャネルを含む。しかしながら、ドルビー・サラウンド7.1は、ドルビー・サラウンド5.1の左および右のサラウンド・チャネルを四つのゾーンに分割することによって、サラウンド・チャネルの数を増している。すなわち、左側方サラウンド・アレイ220および右側方サラウンド・アレイ225に加えて、左後方サラウンド・スピーカー224および右後方サラウンド・スピーカー226のために別個のチャネルが含まれる。再生環境200内のサラウンド・ゾーンの数を増すことは、音の定位を著しく改善できる。
【0040】
より没入的な環境を生成しようとする努力において、いくつかの再生環境は、増加した数のチャネルによって駆動される増加した数のスピーカーをもって構成されることがある。さらに、いくつかの再生環境は、さまざまな高さに配備されるスピーカーを含むことがあり、そのような高さの一部は再生環境の座席領域より上方であることがある。
【0041】
図3は、浜崎22.2サラウンド・サウンド配位をもつ再生環境の例を示している。浜崎22.2は日本のNHK放送技術研究所において、超高精細度テレビジョンのサラウンド・サウンド・コンポーネントとして開発された。浜崎22.2は24個のスピーカー・チャネルを提供し、それらは三層に配置されたスピーカーを駆動するために使用されうる。再生環境300の上スピーカー層310は9チャネルによって駆動されうる。中スピーカー層320は10チャネルによって駆動されうる。下スピーカー層330は5チャネルによって駆動されうるが、そのうち2チャネルはサブウーファー345aおよび345b用である。
【0042】
よって、現在のトレンドは、より多くのスピーカーおよびより多くのチャネルを含めるだけでなく、異なる高さのスピーカーをも含めるものである。チャネルの数が増し、スピーカー・レイアウトが2Dアレイから3Dアレイに遷移するにつれて、サウンドを位置決めし、レンダリングするタスクはますます難しくなる。よって、本願の譲受人は、3Dオーディオ・サウンド・システムのための機能を高めるおよび/またはオーサリング複雑さを軽減するさまざまなツールおよび関係するユーザー・インターフェースを開発した。これらのツールのいくつかは、2012年4月20日に出願され、「向上した3Dオーディオ作成および表現のためのシステムおよびツール」と題する米国仮特許出願第61/636,102号(「作成および表現」出願)の
図5A~
図19Dを参照して詳細に記述されている。同出願の内容はここに参照により組み込まれる。
【0043】
図4Aは、仮想再生環境におけるさまざまな高さにあるスピーカー・ゾーンを描くグラフィカル・ユーザー・インターフェース(GUI)の例を示している。GUI 400はたとえば、論理システムからの命令、ユーザー入力装置から受領される信号などに従って、表示装置上に表示されてもよい。そのようないくつかの装置は
図10を参照して後述する。
【0044】
仮想再生環境404のような仮想再生環境への言及に関する本稿での用法では、用語「スピーカー・ゾーン」は概括的に、実際の再生環境の再生スピーカーと一対一対応があってもなくてもよい論理的な構造体を指す。たとえば、「スピーカー・ゾーン位置」は、映画館再生環境の特定の再生スピーカー位置に対応してもしなくてもよい。その代わり、用語「スピーカー・ゾーン位置」は概括的に、仮想再生環境のゾーンを指してもよい。いくつかの実装では、仮想再生環境のスピーカー・ゾーンは、たとえば、二チャネル・ステレオ・ヘッドホンの組を使ってリアルタイムに仮想サラウンド・サウンド環境を生成するドルビー・ヘッドホン(商標)(時にモバイル・サラウンド(商標)と称される)のような仮想化技術の使用を通じて、仮想スピーカーに対応してもよい。GUI 400には、第一の高さに七つのスピーカー・ゾーン402aがあり、第二の高さに二つのスピーカー・ゾーン402bがあり、仮想再生環境404内のスピーカー・ゾーンは合計九つとなっている。この例では、スピーカー・ゾーン1~3は仮想再生環境404の前方領域405にある。前方領域405はたとえば、映画館再生環境の、スクリーン150が位置する領域、家庭の、テレビジョン・スクリーンが位置する領域などに対応してもよい。
【0045】
ここで、スピーカー・ゾーン4は概括的には左領域410のスピーカーに対応し、スピーカー・ゾーン5は仮想再生環境404の右領域415のスピーカーに対応する。スピーカー・ゾーン6は左後方領域412に対応し、スピーカー・ゾーン7は仮想再生環境404の右後方領域414に対応する。スピーカー・ゾーン8は上領域420aのスピーカーに対応し、スピーカー・ゾーン9は上領域420bのスピーカーに対応し、これは
図5Dおよび5Eに示される仮想天井520の領域のような仮想天井領域であってもよい。したがって、「作成および表現」出願でより詳細に述べたように、
図4Aに示されるスピーカー・ゾーン1~9の位置は実際の再生環境の再生スピーカーの位置に対応してもしなくてもよい。さらに、他の実装はより多数またはより少数のスピーカー・ゾーンおよび/または高さを含んでいてもよい。
【0046】
「作成および表現」出願に記載されるさまざまな実装において、GUI 400のようなユーザー・インターフェースが、オーサリング・ツールおよび/またはレンダリング・ツールの一部として使用されてもよい。いくつかの実装では、オーサリング・ツールおよび/またはレンダリング・ツールは、一つまたは複数の非一時的な媒体上に記憶されるソフトウェアを介して実装されてもよい。オーサリング・ツールおよび/またはレンダリング・ツールは、(少なくとも部分的には)
図10を参照して後述する論理システムおよび他の装置のようなハードウェア、ファームウェアなどによって実装されてもよい。いくつかのオーサリング実装では、関連するオーサリング・ツールが関連するオーディオ・データについてのメタデータを生成するために使用されてもよい。メタデータは、たとえば、三次元空間におけるオーディオ・オブジェクトの位置および/または軌跡を示すデータ、スピーカー・ゾーン制約条件データなどを含んでいてもよい。メタデータは、実際の再生環境の特定のスピーカー・レイアウトに関してではなく、仮想再生環境404のスピーカー・ゾーン402に関して生成されてもよい。レンダリング・ツールは、オーディオ・データおよび関連するメタデータを受領してもよく、再生環境のためのオーディオ利得およびスピーカー・フィード信号を計算してもよい。そのようなオーディオ利得およびスピーカー・フィード信号は、振幅パン・プロセスに従って計算されてもよい。振幅パン・プロセスは、音が再生環境中の位置Pから来ているような知覚を創り出すことができるものである。たとえば、スピーカー・フィード信号は、次式
x
i(t)=g
ix(t) i=1,…,N (式1)
に従って再生環境の再生スピーカー1ないしNに与えられてもよい。
【0047】
式(1)において、xi(t)はスピーカーiに加えられるスピーカー・フィード信号を表し、giは対応するチャネルの利得因子を表し、x(t)はオーディオ信号を表し、tは時間を表す。利得因子はたとえばここに参照により組み込まれる非特許文献1のSection 2、pp.3-4に記載される振幅パン方法(amplitude panning methods)に従って決定されてもよい。いくつかの実装では、利得は周波数依存であってもよい。いくつかの実装では、x(t)をx(t-Δt)で置き換えることによって時間遅延が導入されてもよい。
【0048】
いくつかのレンダリング実装では、スピーカー・ゾーン402を参照して生成されたオーディオ再生データは、ドルビー・サラウンド5.1配位、ドルビー・サラウンド7.1配位、浜崎22.2配位または他の配位であってもよい幅広い範囲の再生環境のスピーカー位置にマッピングされうる。たとえば、
図2を参照するに、レンダリング・ツールは、スピーカー・ゾーン4および5についてのオーディオ再生データを、ドルビー・サラウンド7.1配位をもつ再生環境の左側方サラウンド・アレイ220および右側方サラウンド・アレイ225にマッピングしてもよい。スピーカー・ゾーン1、2および3についてのオーディオ再生データは、それぞれ左スクリーン・チャネル230、右スクリーン・チャネル240および中央スクリーン・チャネル235にマッピングされてもよい。スピーカー・ゾーン6および7についてのオーディオ再生データは、左後方サラウンド・スピーカー224および右後方サラウンド・スピーカー226にマッピングされてもよい。
【0049】
図4Bは、別の再生環境の例を示している。いくつかの実装では、レンダリング・ツールは、スピーカー・ゾーン1、2および3についてのオーディオ再生データを再生環境450の対応するスクリーン・スピーカー455にマッピングしてもよい。レンダリング・ツールは、スピーカー・ゾーン4および5についてのオーディオ再生データを、左側方サラウンド・アレイ460および右側方サラウンド・アレイ465にマッピングしてもよく、スピーカー・ゾーン8および9についてのオーディオ再生データを、左頭上スピーカー470aおよび右頭上スピーカー470bにマッピングしてもよい。スピーカー・ゾーン6および7についてのオーディオ再生データは、左後方サラウンド・スピーカー480aおよび右後方サラウンド・スピーカー480bにマッピングされてもよい。
【0050】
いくつかのオーサリング実装では、オーサリング・ツールは、オーディオ・オブジェクトについてのメタデータを生成するために使われてもよい。本稿での用法では、用語「オーディオ・オブジェクト(audio object)」はオーディオ・データおよび関連するメタデータのストリームを指してもよい。メタデータは、オーディオ・オブジェクトの3D位置、オーディオ・オブジェクトの見かけのサイズ、レンダリング制約条件およびコンテンツ型(たとえばダイアログ、効果など)を指示してもよい。実装に依存して、メタデータは、利得データ、軌跡データなどの他の型のデータを含んでいてもよい。いくつかのオーディオ・オブジェクトは静的であってもよく、一方、他のオーディオ・オブジェクトは動いてもよい。オーディオ・オブジェクトの詳細は、所与の時点における三次元空間内でのオーディオ・オブジェクトの位置などを示しうる関連するメタデータに従ってオーサリングまたはレンダリングされてもよい。オーディオ・オブジェクトが再生環境においてモニタリングまたは再生されるとき、オーディオ・オブジェクトは、再生環境の再生スピーカー・レイアウトに従って、その位置およびサイズのメタデータに従ってレンダリングされうる。
【0051】
図5Aは、オーディオ処理方法の概観を与える流れ図である。より詳細な例は
図5B以下を参照して後述する。これらの方法は、図示され本稿で記載されるよりも多数または少数のブロックを含んでいてもよく、必ずしも本稿に示される順序で実行されない。これらの方法は、少なくとも部分的には、
図10~
図11に示され、後述されるような装置によって実行されてもよい。ソフトウェアは、本稿に記載される方法を実行するよう一つまたは複数の装置を制御するための命令を含んでいてもよい。
【0052】
図5Aに示される例では、方法500は、ある特定の再生環境に対する仮想源位置についての仮想源利得値を決定するセットアップ・プロセスをもって始まる(ステップ505)。
図6Aは、再生環境に対する仮想源位置の例を示している。たとえば、ブロック505は、再生環境600aの再生スピーカー位置625に対する仮想源位置605の仮想源利得値を決定することに関わっていてもよい。仮想源位置605および再生スピーカー位置625は単に例である。
図6Aに示される例では、仮想源位置605はx、y、z軸に沿って一様に離間している。しかしながら、代替的な実装では、仮想源位置605は異なる仕方で離間されていてもよい。たとえば、いくつかの実装では、仮想源位置605はx軸およびy軸に沿っての第一の一様な離間およびz軸に沿って第二の一様な離間を有していてもよい。他の実装では、仮想源位置605は非一様に離間されていてもよい。
【0053】
図6Aに示される例では、再生環境600aおよび仮想源体積602aは同一の広がりをもち、そのため仮想源位置605のそれぞれは再生環境600a内の位置に対応する。しかしながら、代替的な実装では、再生環境600と仮想源体積602は同一の広がりでなくてもよい。たとえば、仮想源位置605の少なくともいくつかが再生環境600の外の位置に対応してもよい。
【0054】
図6Bは、再生環境に対する仮想源位置の代替的な例を示している。この例では、仮想源体積602bは、再生環境600bの外側に広がる。
【0055】
図5Aに戻ると、この例では、ブロック505のセットアップ・プロセスは、何らかの特定のオーディオ・オブジェクトをレンダリングする前に行なわれる。いくつかの実装では、ブロック505において決定された仮想源利得値は記憶システムに記憶されてもよい。記憶された仮想源利得値は、仮想源利得値の少なくともいくつかに従って受領されたオーディオ・オブジェクトについてのオーディオ・オブジェクト利得値を計算する「ランタイム」プロセスの間に使用されてもよい(ブロック510)。たとえば、ブロック510は、少なくとも部分的には、オーディオ・オブジェクト領域または体積内にある仮想源位置に対応する仮想源利得値に基づいてオーディオ・オブジェクト利得値を計算することに関わっていてもよい。
【0056】
いくつかの実装では、方法500は、オーディオ・データを脱相関することに関わる任意的なブロック515を含んでいてもよい。ブロック515は、ランタイム・プロセスの一部であってもよい。いくつかのそのような実装では、ブロック515は、周波数領域における畳み込みに関わっていてもよい。たとえば、ブロック515は、各スピーカー・フィード信号について有限インパルス応答(「FIR」)フィルタを適用することに関わっていてもよい。
【0057】
いくつかの実装では、ブロック515のプロセスは、オーディオ・オブジェクト・サイズおよび/または作者の芸術的意図に依存して、実行されてもされなくてもよい。いくつかのそのような実装によれば、オーディオ・オブジェクト・サイズがあるサイズ閾値以上であるときには脱相関がオンにされるべきであり、オーディオ・オブジェクト・サイズが前記サイズ閾値未満であれば脱相関がオフにされるべきであることを(たとえば関連したメタデータに含まれる脱相関フラグを介して)示すことによって、オーサリング・ツールが、オーディオ・オブジェクト・サイズを脱相関とリンクさせてもよい。いくつかの実装では、脱相関は、サイズ閾値に関するユーザー入力および/または他の入力値に従って制御(たとえば増大、減少または無効化)されてもよい。
【0058】
図5Bは、セットアップ・プロセスの例を与える流れ図である。よって、
図5Bに示されるブロックはすべて、
図5Aのブロック505において実行されてもよいプロセスの例である。ここで、セットアップ・プロセスは、再生環境データの受領をもって始まる(ブロック520)。再生環境データは、再生スピーカー位置データを含んでいてもよい。再生環境データは、壁、天井などといった再生環境の境界を表わすデータを含んでいてもよい。再生環境が映画館である場合、再生環境データは映画スクリーン位置の指示をも含んでいてもよい。
【0059】
再生環境データは、出力チャネルの、再生環境の再生スピーカーとの相関を示すデータをも含んでいてもよい。たとえば、再生環境は、
図2に示され、上記したドルビー・サラウンド7.1配位を有していてもよい。よって、再生環境データは、Lssチャネルと左側方サラウンド・スピーカー220との間、Lrsチャネルと左後方サラウンド・スピーカー224との間などの相関を示すデータをも含んでいてもよい。
【0060】
この例では、ブロック525は、再生環境データに従って仮想源位置605を定義することに関わる。仮想源位置605は仮想源体積内で定義されてもよい。いくつかの実装では、仮想源体積は、オーディオ・オブジェクトがその中で動くことのできる体積と対応していてもよい。
図6Aおよび6Bに示されるように、いくつかの実装では、仮想源体積602は再生環境600の体積と同じ広がりであってもよいが、一方、他の実装では、仮想源位置605の少なくとも一部が再生環境600の外の位置に対応していてもよい。
【0061】
さらに、仮想源位置605は、具体的な実装に依存して、仮想源体積602内で一様に離間されていてもいなくてもよい。いくつかの実装では、仮想源位置605は、すべての方向において一様に離間されていてもよい。たとえば、仮想源位置605は、NxかけるNyかけるNzの仮想源位置605の長方形格子を形成してもよい。いくつかの実装では、Nの値は5ないし100の範囲であってもよい。Nの値は少なくとも部分的には、再生環境中の再生スピーカーの数に依存してもよい:各再生スピーカー位置の間に二つ以上の仮想源位置605を含めることが望ましいことがある。
【0062】
他の実装では、仮想源位置605は、x軸およびy軸に沿った第一の一様な離間およびz軸に沿った第二の一様な離間を有していてもよい。仮想源位置605は、NxかけるNyかけるMzの仮想源位置605の長方形格子を形成してもよい。たとえば、いくつかの実装では、x軸またはy軸に沿ってよりも、z軸に沿ってより少数の仮想源位置605があってもよい。いくつかのそのような実装では、Nの値は10ないし100の範囲であってもよく、一方、Mの値は5ないし10の範囲であってもよい。
【0063】
この例では、ブロック530は、仮想源位置605のそれぞれについて仮想源利得値を計算することに関わる。いくつかの実装では、ブロック530は、各仮想源位置605について、再生環境の複数の出力チャネルの各チャネルについて仮想源利得値を計算することに関わる。いくつかの実装では、ブロック530は、各仮想源位置605に位置される点源についての利得値を計算するために、ベクトル・ベースの振幅パン(VBAP: vector-based amplitude panning)アルゴリズム、対ごとのパン・アルゴリズム(pairwise panning algorithm)または同様のアルゴリズムを適用することに関わっていてもよい。他の実装では、ブロック530は、各仮想源位置605に位置される点源についての利得値を計算するために、分離可能なアルゴリズムを適用することに関わっていてもよい。本稿での用法では、「分離可能な」アルゴリズムは、所与のスピーカーの利得が、仮想源位置の各座標について別個に計算されうる二つ以上の因子の積として表現できるものである。例は、Pro Tools(商標)ソフトウェアおよびAMS Neveによって提供されるデジタル・フィルム・コンソールにおいて実装されるパンナーを含むがそれに限られないさまざまな既存のミキシング・コンソール・パンナーにおいて実装されるアルゴリズムを含む。いくつかの二次元の例を後に与える。
【0064】
図6C~6Fは、種々の位置におけるオーディオ・オブジェクトへの近距離場および遠距離場パン技法の適用の例を示している。まず
図6Cを参照するに、オーディオ・オブジェクトは実質的に仮想再生環境400aの外である。したがって、一つまたは複数の遠距離場パン方法がこの例では適用される。いくつかの実装では、遠距離場パン方法は、当業者に既知のベクトル・ベースの振幅パン(VBAP: vector-based amplitude panning)の式に基づいていてもよい。たとえば、遠距離場パン方法は、ここに参照によって組み込まれる非特許文献1のp.4、Section 2.3に記載されるVBAPの式に基づいていてもよい。代替的な実装では、遠距離場および近距離場のオーディオ・オブジェクトをパンするために他の方法、たとえば対応する音響平面または球面波の合成に関わる方法が使用されてもよい。ここに参照によって組み込まれる非特許文献2が関連する方法を記述している。
【0065】
ここで
図6Dを参照するに、オーディオ・オブジェクト610は仮想再生環境400aの内部である。したがって、一つまたは複数の近距離場パン方法がこの例では適用される。いくつかのそのような近距離場パン方法は、仮想再生環境400a内のオーディオ・オブジェクト610を囲むいくつかのスピーカー・ゾーンを使う。
【0066】
図6Gは、1に等しい辺長をもつ正方形の各隅に一つのスピーカーをもつ再生環境の例を示している。この例では、x-y軸の原点(0,0)は左(L)スクリーン・スピーカー130と一致する。よって、右(R)スクリーン・スピーカー140は座標(1,0)をもち、左サラウンド(Ls)スピーカー120は座標(0,1)をもち、右サラウンド(Rs)スピーカー125は座標(1,1)をもつ。オーディオ・オブジェクト位置615(x,y)はLスピーカーよりx単位右、スクリーン150よりy単位のところである。この例では、四つのスピーカーのそれぞれは、x軸およびy軸に沿ってそれらの距離に比例する因子cos/sinを受領する。いくつかの実装によれば、利得は次のようにして計算されてもよい。
【0067】
G_l(x)=cos(pi/2*x) l=L,Lsの場合
G_l(x)=sin(pi/2*x) l=R,Rsの場合
G_l(x)=cos(pi/2*y) l=L,Rの場合
G_l(x)=sin(pi/2*y) l=Ls,Rsの場合
。
【0068】
全体的な利得は積:G_l(x,y)=G_l(x)G_l(y)となる。一般に、これらの関数はすべてのスピーカーのすべての座標に依存する。しかしながら、G_l(x)は源のy位置に依存せず、G_l(y)はそのx位置に依存しない。簡単な計算を例解するために、オーディオ・オブジェクト位置615が(0,0)、つまりLスピーカーの位置であるとする。G_L(x)=cos(0)=1であり、G_L(y)=cos(0)=1である。全体的な利得は積G_L(x,y)=G_L(x)G_L(y)=1となる。同様の計算によりG_Ls=G_Rs=G_R=0が得られる。
【0069】
オーディオ・オブジェクトが仮想再生環境400aにはいるまたは仮想再生環境400aを出る際に異なるパン・モードの間でブレンドすることが望ましいことがある。たとえば、オーディオ・オブジェクト610が
図6Cに示されるオーディオ・オブジェクト位置615から
図6Dに示されるオーディオ・オブジェクト位置615にまたはその逆に動くとき、近距離場パン方法および遠距離場パン方法に従って計算された利得のブレンドが適用されてもよい。いくつかの実装では、対ごとのパン則(pair-wise panning law)(たとえばエネルギーを保存する正弦または冪乗則)が、近距離場パン方法および遠距離場パン方法に従って計算された利得の間でブレンドするために使われてもよい。代替的な実装では、ペアごとのパン則は、エネルギーを保存するのではなく、振幅を保存してもよい。よって、平方和が1に等しくなるのではなく、和が1に等しくなる。たとえば両方のパン方法を独立に使ってオーディオ信号を処理し、二つの結果として得られるオーディオ信号をクロスフェードするよう、結果的な処理された信号をブレンドすることも可能である。
【0070】
ここで
図5Bに戻ると、ブロック530において使われるアルゴリズムによらず、結果として得られる利得値は、ランタイム動作の間に使うために、メモリ・システムに記憶されてもよい(ブロック535)。
【0071】
図5Cは、仮想源位置についての事前計算された利得値に従って、受領されたオーディオ・オブジェクトについての利得値を計算するランタイム・プロセスの例を与える流れ図である。
図5Cに示されるブロックのすべては、
図5Aのブロック510において実行されてもよいプロセスの例である。
【0072】
この例では、ランタイム・プロセスは、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データの受領とともに始まる(ブロック540)オーディオ・オブジェクトはオーディオ信号と、この例では少なくともオーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む関連するメタデータとを含む。
図6Aを参照するに、たとえば、オーディオ・オブジェクト610は、少なくとも部分的には、オーディオ・オブジェクト位置615およびオーディオ・オブジェクト体積620aによって定義される。この例では、受領されるオーディオ・オブジェクト・サイズ・データは、オーディオ・オブジェクト体積620aが直方体の体積に対応することを示す。しかしながら、
図6Bに示される例では、受領されるオーディオ・オブジェクト・サイズ・データはオーディオ・オブジェクト体積620bが球の体積に対応することを示す。これらのサイズおよび形状は単に例である。代替的な実装では、オーディオ・オブジェクトは多様な他のサイズおよび/または形状を有していてもよい。いくつかの代替的な例では、オーディオ・オブジェクトの領域または体積は、長方形、円、楕円、楕円体または球扇形であってもよい。
【0073】
この実装では、ブロック545は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域または体積内の仮想源からの寄与を計算することに関わる。
図6Aおよび6Bに示される例では、ブロック545は、オーディオ・オブジェクト体積620aまたはオーディオ・オブジェクト体積620b内である仮想源位置605における仮想源からの寄与を計算することに関わっていてもよい。オーディオ・オブジェクトのメタデータが時間的に変化する場合、ブロック545は新たなメタデータ値に従って再び実行されてもよい。たとえば、オーディオ・オブジェクト・サイズおよび/またはオーディオ・オブジェクト位置が変化する場合、異なる仮想源位置605がオーディオ・オブジェクト体積620内にはいることがあり、および/または以前の計算において使われた仮想オブジェクト位置605がオーディオ・オブジェクト位置615から異なる距離であることがある。ブロック545では、新たなオブジェクト・サイズおよび/または位置に従って対応する仮想源寄与が計算される。
【0074】
いくつかの例では、ブロック545は、メモリ・システムから、オーディオ・オブジェクト位置およびサイズに対応する仮想源位置についての計算された仮想源利得値を取り出し、計算された仮想源利得値の間を補間することに関わっていてもよい。計算された仮想源利得値の間を補間するプロセスは、オーディオ・オブジェクト位置の近くの複数の近隣の仮想源位置を決定し、前記近隣の仮想源位置のそれぞれについて、計算された仮想源利得値を決定し、前記オーディオ・オブジェクト位置と前記近隣の仮想源位置のそれぞれとの間の複数の距離を決定し、前記複数の距離に従って、計算された仮想源利得値の間を補間することに関わっていてもよい。
【0075】
仮想源からの寄与を計算するプロセスは、オーディオ・オブジェクトのサイズによって定義される領域または体積内の仮想源位置について、計算された仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。重み付けされた平均のための重みはたとえば、オーディオ・オブジェクトの位置、オーディオ・オブジェクトのサイズおよび前記領域または体積内の各仮想源位置に依存してもよい。
【0076】
図7は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義された領域内の仮想源からの寄与の例を示している。
図7は、オーディオ環境200aの、z軸に垂直に取った断面を描いている。よって、
図7は、z軸に沿ってオーディオ環境200aを見下ろす観察者の視点から描かれている。この例では、オーディオ環境200aは、
図2に示され、上記したドルビー・サラウンド7.1配位を有する映画館サウンド・システム環境である。よって、再生環境200aは、左側方サラウンド・スピーカー220、左後方サラウンド・スピーカー224、右側方サラウンド・スピーカー225、右後方サラウンド・スピーカー226、左スクリーン・チャネル230、中央スクリーン・チャネル235、右スクリーン・チャネル240およびサブウーファー245を含む。
【0077】
オーディオ・オブジェクト610は、オーディオ・オブジェクト体積620bによって示されるサイズをもつ。該体積の長方形の断面領域が
図7に示されている。
図7に描かれる時点でのオーディオ・オブジェクト位置615を与えられると、xy平面においてオーディオ・オブジェクト体積620bによって包含される領域には12個の仮想源位置605が含まれる。z方向におけるオーディオ・オブジェクト体積620bの広がりおよびz軸に沿った仮想源位置605の間隔に依存して、追加的な仮想源位置605がオーディオ・オブジェクト体積620b内に包含されてもされなくてもよい。
【0078】
図7は、オーディオ・オブジェクト610のサイズによって定義される領域または体積内の仮想源位置605からの寄与を示している。この例では、仮想源位置605のそれぞれを描くために使われる円の直径が、対応する仮想源位置605からの寄与と対応する。オーディオ・オブジェクト位置615に最も近い諸仮想源位置605aが最も大きく示されており、対応する仮想源からの最大の寄与を示している。二番目に大きい寄与は、オーディオ・オブジェクト位置615に二番目に近い仮想源位置605bにある仮想源からのものである。オーディオ・オブジェクト位置615からさらに遠いがそれでもオーディオ・オブジェクト体積620b内にある仮想源位置605cによって、より小さな寄与がなされる。オーディオ・オブジェクト体積620bの外にある仮想源位置605dは最も小さく示されている。そのことは、この例では、対応する仮想源が寄与をしないことを示す。
【0079】
図5Cを参照するに、この例では、ブロック550は、少なくとも部分的には計算された寄与に基づいて、複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算することに関わる。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。ブロック550は、結果として得られるオーディオ・オブジェクト利得値を規格化することに関わっていてもよい。
図7に示される実装のためには、たとえば、各出力チャネルは単一のスピーカーまたはスピーカーの群に対応してもよい。
【0080】
前記複数の出力チャネルのそれぞれについてオーディオ・オブジェクト利得値を計算するプロセスは、位置xo,yo,zoにおいてレンダリングされるサイズ(s)のオーディオ・オブジェクトについて利得値(gl
size(xo,yo,zo;s))を決定することに関わっていてもよい。このオーディオ・オブジェクト利得値は本稿では時に「オーディオ・オブジェクト・サイズ寄与」と称されることがある。いくつかの実装によれば、オーディオ・オブジェクト利得値(gl
size(xo,yo,zo;s))は次式のように表現されてもよい。
【0081】
【数2】
式(2)において、(x
vs,y
vs,z
vs)は仮想源位置を表わし、g
l(x
vs,y
vs,z
vs)は仮想源位置x
vs,y
vs,z
vsについてのチャネルlについての利得値を表わし、w(x
vs,y
vs,z
vs;x
o,y
o,z
o;s)は、少なくとも部分的には、オーディオ・オブジェクトの位置(x
o,y
o,z
o)、オーディオ・オブジェクトのサイズ(s)および仮想源位置(x
vs,y
vs,z
vs)に基づいて決定されるg
l(x
vs,y
vs,z
vs)についての重みを表わす。
【0082】
いくつかの例では、指数pは1から10までの間の値を有していてもよい。いくつかの実装では、pはオーディオ・オブジェクト・サイズsの関数であってもよい。たとえば、sが相対的により大きい場合、いくつかの実装では、pは相対的により小さくなってもよい。いくつかのそのような実装によれば、pは次のように決定されてもよい。
【0083】
p=6 s≦0.5の場合
p=6+(-4)(s-0.5)/(smax-0.5) s>0.5の場合
ここで、smaxは内部的なスケールアップされたサイズsinternal(後述)の最大値に対応し、オーディオ・オブジェクト・サイズs=1は、再生環境の境界の一つの長さに等しい(たとえば、再生環境の一つの壁面の長さに等しい)サイズ(たとえば直径)をもつオーディオ・オブジェクトと対応していてもよい。
【0084】
部分的には仮想源利得値を計算するために使われるアルゴリズム(単数または複数)に依存して、仮想源位置がある軸に沿って一様に分布している場合および重み関数および利得関数がたとえば上記のように分離可能である場合、式(2)を単純化することが可能であることがある。これらの条件が満たされる場合には、gl(xvs,yvs,zvs)はglx(xvs)gly(yvs)glz(zvs)と表現されてもよい。ここで、glx(xvs)、gly(yvs)およびglz(zvs)は仮想源の位置についてのx、yおよびz座標の独立な利得関数を表わす。
【0085】
同様に、w(x
vs,y
vs,z
vs;x
o,y
o,z
o;s)はw
x(x
vs;x
o;s)w
y(y
vs;y
o;s)w
z(z
vs;z
o;s)と因子分解されてもよい。ここで、w
x(x
vs;x
o;s)、w
y(y
vs;y
o;s)およびw
z(z
vs;z
o;s)は仮想源の位置についてのx
、yおよびz座標の独立な重み関数を表わす。一つのそのような例が
図7に示されている。この例では、w
x(x
vs;x
o;s)と表わされる重み関数710は、w
y(y
vs;y
o;s)と表わされる重み関数720から独立に計算されてもよい。いくつかの実装では、重み関数710および720はガウス関数であってもよく、一方、重み関数w
z(z
vs;z
o;s)は余弦とガウス関数の積であってもよい。
【0086】
w(xvs,yvs,zvs;xo,yo,zo;s)がwx(xvs;xo;s)wy(yvs;yo;s)wz(zvs;zo;s)と因子分解できるとき、式(2)は次のように単純化される。
【0087】
【数3】
これらの関数fは、仮想源に関して必要とされる情報すべてを含んでいてもよい。可能なオブジェクト位置が各軸に沿って離散化されている場合には、各関数fを行列として表現できる。各関数fは、ブロック505のセットアップ・プロセス(
図5A参照)の間に事前計算されて、たとえば行列またはルックアップテーブルとしてメモリ・システムに記憶されてもよい。ランタイム(ブロック510)には、ルックアップテーブルまたは行列がメモリ・システムから取り出されてもよい。ランタイム・プロセスは、オーディオ・オブジェクトの位置およびサイズを与えられて、これらの行列の最も近い対応する値の間で補間することに関わっていてもよい。いくつかの実装では、補間は線形であってもよい。
【0088】
いくつかの実装では、オーディオ・オブジェクト・サイズ寄与gl
sizeは、オーディオ・オブジェクト位置についての「オーディオ・オブジェクト・ニア利得(neargain)」と組み合わされてもよい。本稿での用法では、「オーディオ・オブジェクト・ニア利得」は、オーディオ・オブジェクト位置615に基づく計算された利得である。利得計算は、仮想源利得値のそれぞれを計算するために使われた同じアルゴリズムを使ってなされてもよい。いくつかのそのような実装によれば、オーディオ・オブジェクト・サイズ寄与とオーディオ・オブジェクト・ニア利得結果との間で、たとえばオーディオ・オブジェクト・サイズの関数として、クロスフェード計算が実行されてもよい。そのような実装は、オーディオ・オブジェクトのなめらかなパンおよびなめらかな成長を提供してもよく、最小および最大のオーディオ・オブジェクト・サイズの間でなめらかな遷移を許容しうる。あるそのような実装では、次のようになる。
【0089】
【数4】
ここで、チルダ付きのg
l
sizeは前に計算されたg
l
sizeの規格化されたバージョンを表わす。いくつかのそのような実装では、s
xfade=0.2である。しかしながら、代替的な実装では、sxfadeは他の値を有していてもよい。
【0090】
いくつかの実装によれば、オーディオ・オブジェクト・サイズ値は、その可能な値の範囲の過半な部分(the larger portion)においてスケールアップされてもよい。いくつかのオーサリング実装では、たとえば、ユーザーはオーディオ・オブジェクト・サイズ値suser∈[0,1]を呈されてもよく、これはアルゴリズムによって使用される実際のサイズに、より大きな範囲に、たとえば範囲[0,smax]にマッピングされる。ここで、smax>1である。このマッピングは、ユーザーによってサイズが最大に設定されるときに、利得が真にオブジェクトの位置とは独立になることを保証しうる。いくつかのそのような実装によれば、そのようなマッピングは、点の諸対(suser,sinternal)を接続する区分線形関数に従ってなされてもよい。ここで、suserはユーザー選択されたオーディオ・オブジェクト・サイズを表わし、sinternalは、アルゴリズムによって決定される対応するオーディオ・オブジェクト・サイズを表わす。いくつかのそのような実装によれば、マッピングは、点の諸対(0,0),(0.2,0.3),(0.5,0.9),(0.75,1.5)および(1,smax)を接続する区分線形関数に従ってなされてもよい。一つのそのような実装では、smax=2.8である。
【0091】
図8のAおよびBは、オーディオ・オブジェクトを、再生環境内の二つの位置において示している。これらの例では、オーディオ・オブジェクト体積620bは、再生環境200aの長さまたは幅の半分未満の半径をもつ球である。再生環境200aは、ドルビー7.1に従って構成されている。
図8のAに描かれる時点では、オーディオ・オブジェクト位置615は、再生環境200aの中央に対して相対的により近い。
図8のBに描かれる時点では、オーディオ・オブジェクト位置615は、再生環境200aの境界近くに動いている。この例では、境界は映画館の左の壁であり、左側方サラウンド・スピーカー220の位置と一致する。
【0092】
審美的な理由のため、再生環境の境界に近づきつつあるオーディオ・オブジェクトについてのオーディオ・オブジェクト利得計算を修正することが望ましいことがありうる。
図8のAおよびBではたとえば、オーディオ・オブジェクト位置615が再生環境の左の境界805からある閾値距離以内であるときは、再生環境の反対側の境界にあるスピーカー(ここでは、右側方サラウンド・スピーカー225)にはスピーカー・フィード信号が与えられない。
図8Bに示した例では、オーディオ・オブジェクト位置615が再生環境の左の境界805からある閾値距離(これは異なる閾値距離であってもよい)以内であるときは、オーディオ・オブジェクト位置615がさらにスクリーンからある閾値距離より遠ければ、左スクリーン・チャネル230、中央スクリーン・チャネル235、右スクリーン・チャネル240またはサブウーファー245にはスピーカー・フィード信号が与えられない。
【0093】
図8のBに示したこの例では、オーディオ・オブジェクト体積620bは左の境界805の外の領域または体積を含む。いくつかの実装によれば、利得計算のためのフェードアウト因子は、少なくとも部分的には、左境界805のうちのどのくらいがオーディオ・オブジェクト体積620b内にあるかおよび/またはオーディオ・オブジェクトの領域または体積のうちどのくらいがそのような境界の外に広がっているかに基づいていてもよい。
【0094】
図9は、少なくとも部分的には、オーディオ・オブジェクトの領域または体積のうちどのくらいが再生環境の境界の外に広がっているかに基づいて、フェードアウト因子を決定する方法を概説する流れ図である。ブロック905では、再生環境データが受領される。この例では、再生環境データは、再生スピーカー位置データおよび再生環境境界データを含む。ブロック910は、一つまたは複数のオーディオ・オブジェクトおよび関連するメタデータを含むオーディオ再生データを受領することに関わる。メタデータは、この例では、少なくともオーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む。
【0095】
この実装では、ブロック915は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別することに関わる。ブロック915は、オーディオ・オブジェクト領域または体積のどのくらいの割合が再生環境境界の外にあるかを決定することにも関わっていてもよい。
【0096】
ブロック920では、フェードアウト因子が決定される。この例では、フェードアウト因子は、少なくとも部分的には前記外側領域に基づいていてもよい。たとえば、フェードアウト因子は前記外側領域に比例してもよい。
【0097】
ブロック925では、少なくとも部分的には前記関連したメタデータ(この例ではオーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データ)および前記フェードアウト因子に基づいて複数の出力チャネルのそれぞれについて一組のオーディオ・オブジェクト利得値が計算されてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応していてもよい。
【0098】
いくつかの実装では、オーディオ・オブジェクト利得計算は、オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算することに関わっていてもよい。仮想源は、再生環境データを参照して定義されうる複数の仮想源位置と対応してもよい。仮想源位置は一様に離間していてもいなくてもよい。仮想源位置のそれぞれについて、前記複数の出力チャネルのそれぞれについて仮想源利得値が計算されてもよい。上記のように、いくつかの実装では、これらの仮想源利得値は、セットアップ・プロセスの間に計算され、記憶され、ランタイム動作の間に使うために取り出されてもよい。
【0099】
いくつかの実装では、フェードアウト因子(fade-out factor)は、再生環境内の諸仮想源位置に対応するすべての仮想源利得値に適用されてもよい。いくつかの実装では、gl
sizeは次のように修正されてもよい。
【0100】
【数5】
ここで、d
boundはオーディオ・オブジェクト位置と再生環境の境界(boundary)との間の最小距離を表わし、g
l
boundは境界に沿った諸仮想源の寄与を表わす。たとえば、
図8のBを参照するに、g
l
boundは、オーディオ・オブジェクト体積620b内であり境界805に隣接する諸仮想源の寄与を表わしてもよい。この例では、
図6Aの例のように、再生環境の外に位置される仮想源はない。
【0101】
代替的な実装では、gl
sizeは次のように修正されてもよい。
【0102】
【数6】
ここで、g
l
outsideは再生環境の外に位置するがオーディオ・オブジェクト領域または体積内である諸仮想源に基づく諸オーディオ・オブジェクト利得を表わす。たとえば、
図8のBを参照するに、g
l
outsideはオーディオ・オブジェクト体積620b内であり境界805の外である諸仮想源の寄与を表わしてもよい。この例では、
図6Bの例と同様に、再生環境の内部および外部両方に仮想源がある。
【0103】
図10は、オーサリングおよび/またはレンダリング装置のコンポーネントの例を与えるブロック図である。この例では、装置1000はインターフェース・システム1005を含む。インターフェース・システム1005は、無線ネットワーク・インターフェースのようなネットワーク・インターフェースを含んでいてもよい。代替的または追加的に、インターフェース・システム1005はユニバーサル・シリアル・バス(USB)インターフェースまたは他のそのようなインターフェースを含んでいてもよい。
【0104】
装置1000は論理システム1010を含む。論理システム1010は、汎用の単一チップまたは複数チップ・プロセッサのようなプロセッサを含んでいてもよい。論理システム1010は、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)または他のプログラム可能型論理デバイス、離散的なゲートもしくはトランジスタ論理または離散的なハードウェア・コンポーネントまたはそれらの組み合わせを含んでいてもよい。論理システム1010は、装置1000の他のコンポーネントを制御するよう構成されていてもよい。装置1000のコンポーネントの間のインターフェースは
図10には示されていないが、論理システム1010は、他のコンポーネントとの通信のためのインターフェースをもつよう構成されていてもよい。他のコンポーネントは、適宜、互いとの通信のために構成されていてもいなくてもよい。
【0105】
論理システム1010は、本稿に記載される型のオーディオ・オーサリングおよび/またはレンダリング機能を含むがこれに限られないオーディオ・オーサリングおよび/またはレンダリング機能を実行するよう構成されていてもよい。いくつかのそのような実装では、論理システム1010は、(少なくとも部分的には)一つまたは複数の非一時的媒体に記憶されたソフトウェアに従って動作するよう構成されていてもよい。非一時的媒体は、ランダム・アクセス・メモリ(RAM)および/または読み出し専用メモリ(ROM)のような、論理システム1010に付随するメモリを含んでいてもよい。非一時的媒体は、メモリ・システム1015のメモリを含んでいてもよい。メモリ・システム1015は、フラッシュメモリ、ハードドライブなどの、一つまたは複数の好適な型の非一時的な記憶媒体を含んでいてもよい。
【0106】
表示システム1030は、装置1000の具現に依存して、一つまたは複数の好適な型のディスプレイを含んでいてもよい。たとえば、表示システム1030は液晶ディスプレイ、プラズマ・ディスプレイ、双安定ディスプレイなどを含んでいてもよい。
【0107】
ユーザー入力システム1035は、ユーザーからの入力を受け入れるよう構成された一つまたは複数の装置を含んでいてもよい。いくつかの実装では、ユーザー入力システム1035は、表示システム1030のディスプレイにかぶさるタッチスクリーンを含んでいてもよい。ユーザー入力システム1035はマウス、トラックボール、ジェスチャー検出システム、ジョイスティック、一つまたは複数のGUIおよび/または表示システム1030上に呈示されるメニュー、ボタン、キーボード、スイッチなどを含んでいてもよい。いくつかの実装では、ユーザー入力システム1035は、マイクロホン1025を含んでいてもよい:ユーザーは、マイクロホン1025を介して装置1000についての音声コマンドを提供してもよい。論理システムは、音声認識のために、そしてそのような音声コマンドに従って装置1000の少なくともいくつかの動作を制御するために構成されていてもよい。
【0108】
電力システム1040は、ニッケル‐カドミウム電池またはリチウム・イオン電池のような一つまたは複数の好適なエネルギー蓄積装置を含んでいてもよい。電力システム1040は電気コンセントから電力を受領するよう構成されていてもよい。
【0109】
図11のAは、オーディオ・コンテンツ生成のために使用されてもよいいくつかの構成要素を表すブロック図である。システム1100はたとえば、ミキシング・スタジオおよび/またはダビング・ステージにおけるオーディオ・コンテンツ生成のために使われてもよい。この例では、システム1100は、オーディオおよびメタデータ・オーサリング・ツール1105およびレンダリング・ツール1110を含む。この実装では、オーディオおよびメタデータ・オーサリング・ツール1105およびレンダリング・ツール1110は、それぞれオーディオ接続インターフェース1107および1112を含み、該オーディオ接続インターフェースはAES/EBU、MADI、アナログなどを介した通信のために構成されていてもよい。オーディオおよびメタデータ・オーサリング・ツール1105およびレンダリング・ツール1110は、それぞれネットワーク・インターフェース1109および1117を含み、該ネットワーク・インターフェースはTCP/IPまたは他の任意の好適なプロトコルを介してメタデータを送受信するよう構成されていてもよい。インターフェース1120はオーディオ・データをスピーカーに出力するよう構成されている。
【0110】
システム1100はたとえば、Pro Tools(商標)システムのような、プラグインとしてメタデータ生成ツール(すなわち、本稿に記載されたパン手段〔パンナー〕のような)を走らせる既存のオーサリング・システムを含んでいてもよい。パン手段は、レンダリング・ツール1110に接続されたスタンドアローン・システム(たとえばPCまたはミキシング・コンソール)上で走ることもでき、あるいはレンダリング・ツール1110と同じ物理装置上で走ることもできる。後者の場合、パン手段およびレンダラーは、たとえば共有メモリを通じた、ローカルな接続を使うことができる。パン手段GUIは、タブレット装置、ラップトップなどの上で提供されることもできる。レンダリング・ツール1110は、
図5A~Cおよび
図9に記載されるもののようなレンダリング方法を実行するよう構成されたサウンド・プロセッサを含むレンダリング・システムを有していていもよい。レンダリング・システムはたとえば、オーディオ入出力のためのインターフェースおよび適切な論理システムを含むパーソナル・コンピュータ、ラップトップなどを含んでいてもよい。
【0111】
図11Bは、再生環境(たとえば映画シアター)におけるオーディオ再生のために使用されうるいくつかのコンポーネントを表しているブロック図である。システム1150は、この例では、映画館サーバー1155およびレンダリング・システム1160を含む。映画館サーバー1155およびレンダリング・システム1160は、それぞれネットワーク・インターフェース1157および1162を含み、該ネットワーク・インターフェースはTCP/IPまたは他の任意の好適なプロトコルを介してオーディオ・オブジェクトを送受信するよう構成されていてもよい。インターフェース1164はオーディオ・データをスピーカーに出力するよう構成されている。
【0112】
本開示に記載される実装へのさまざまな修正が、当業者にはすぐに明白となりうる。本稿において定義される一般的な原理は、本開示の精神または範囲から外れることなく、他の実装に適用されてもよい。このように、特許請求の範囲は、本稿に示される実装に限定されることは意図されておらず、本稿に開示される開示、原理および新規な特徴と整合する最も広い範囲を与えられるべきものである。
【0113】
いくつかの付番実施例を記載しておく。
〔付番実施例1〕
一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領する工程であって、前記オーディオ・オブジェクトはオーディオ信号および関連するメタデータを含み、前記メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む、工程と;
前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、前記オーディオ・オブジェクト位置データおよび前記オーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する工程と;
複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を、少なくとも部分的には、計算された前記寄与に基づいて計算する工程であって、各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応する、工程とを含む、
方法。
〔付番実施例2〕
仮想源からの寄与を計算する工程は、前記オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することを含む、付番実施例1記載の方法。
〔付番実施例3〕
前記重み付けされた平均のための重みは、前記オーディオ・オブジェクトの位置、前記オーディオ・オブジェクトのサイズおよび前記オーディオ・オブジェクト領域または体積内の各仮想源位置に依存する、付番実施例2記載の方法。
〔付番実施例4〕
再生スピーカー位置データを含む再生環境データを受領する工程をさらに含む、
付番実施例1記載の方法。
〔付番実施例5〕
前記再生環境データに従って複数の仮想源位置を定義し;
各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算することを含む、
付番実施例4記載の方法。
〔付番実施例6〕
各仮想源位置は、前記再生環境内の位置に対応する、付番実施例5記載の方法。
〔付番実施例7〕
前記仮想源位置の少なくともいくつかが前記再生環境の外の位置に対応する、付番実施例5記載の方法。
〔付番実施例8〕
前記仮想源位置はx、y、z軸に沿って一様に離間されている、付番実施例5記載の方法。
〔付番実施例9〕
前記仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間をもつ、付番実施例5記載の方法。
〔付番実施例10〕
前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する工程は、x、y、z軸に沿った仮想源からの寄与の独立した計算を含む、付番実施例8または9記載の方法。
〔付番実施例11〕
前記仮想源位置は非一様に離間されている、付番実施例5記載の方法。
〔付番実施例12〕
前記複数の出力チャネルのそれぞれについてのオーディオ・オブジェクト利得値を計算する工程は、位置x
o,y
o,z
oにおいてレンダリングされるべきサイズ(s)のオーディオ・オブジェクトについての利得値(g
l(x
o,y
o,z
o;s))を決定することを含み、利得値(g
l(x
o,y
o,z
o;s))は
【数7】
と表わされ、(x
vs,y
vs,z
vs)は仮想源位置を表わし、g
l(x
vs,y
vs,z
vs)は仮想源位置x
vs,y
vs,z
vsについてのチャネルlについての利得値を表わし、w(x
vs,y
vs,z
vs;x
o,y
o,z
o;s)は、少なくとも部分的には、前記オーディオ・オブジェクトの位置(x
o,y
o,z
o)、前記オーディオ・オブジェクトのサイズ(s)および前記仮想源位置(x
vs,y
vs,z
vs)に基づいて決定されるg
l(x
vs,y
vs,z
vs)についての一つまたは複数の重み関数を表わす、付番実施例5記載の方法。
〔付番実施例13〕
g
l(x
vs,y
vs,z
vs)=g
l(x
vs)g
l(y
vs)g
l(z
vs)であり、ここで、g
l(x
vs)、g
l(y
vs)およびg
l(z
vs)はx、yおよびzの独立な利得関数を表わす、付番実施例12記載の方法。
〔付番実施例14〕
前記重み関数は
w(x
vs,y
vs,z
vs;x
o,y
o,z
o;s)=w
x(x
vs;x
o;s)w
y(y
vs;y
o;s)w
z(z
vs;z
o;s)
と因子分解され、w
x(x
vs;x
o;s)、w
y(y
vs;y
o;s)およびw
z(z
vs;z
o;s)はx
vs、y
vsおよびz
vsの独立な重み関数を表わす、付番実施例12記載の方法。
〔付番実施例15〕
pはオーディオ・オブジェクト・サイズ(s)の関数である、付番実施例12記載の方法。
〔付番実施例16〕
計算された仮想源利得値をメモリ・システムに記憶する工程をさらに含む、付番実施例4記載の方法。
〔付番実施例17〕
前記オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する工程は:
前記メモリ・システムから、オーディオ・オブジェクト位置およびサイズに対応する計算された仮想源利得値を取り出し;
計算された仮想源利得値の間を補間することを含む、
付番実施例16記載の方法。
〔付番実施例18〕
計算された仮想源利得値の間を補間する工程は:
前記オーディオ・オブジェクト位置の近くの複数の近隣の仮想源位置を決定し;
前記近隣の仮想源位置のそれぞれについて、計算された仮想源利得値を決定し;
前記オーディオ・オブジェクト位置と前記近隣の仮想源位置のそれぞれとの間の複数の距離を決定し;
前記複数の距離に従って、計算された仮想源利得値の間を補間することを含む、
付番実施例17記載の方法。
〔付番実施例19〕
前記オーディオ・オブジェクト領域または体積は、長方形、直方体、円、球、楕円または楕円体のうちの少なくとも一つである、付番実施例1記載の方法。
〔付番実施例20〕
前記再生環境は映画館サウンド・システム環境である、付番実施例1記載の方法。
〔付番実施例21〕
前記オーディオ再生データの少なくとも一部を脱相関する工程をさらに含む、付番実施例1記載の方法。
〔付番実施例22〕
ある閾値を超えるオーディオ・オブジェクト・サイズをもつオーディオ・オブジェクトについてのオーディオ再生データを脱相関する工程をさらに含む、付番実施例1記載の方法。
〔付番実施例23〕
前記再生環境データは再生環境境界データを含み、
前記オーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別する工程と;
少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を適用する工程とをさらに含む、
付番実施例1記載の方法。
〔付番実施例24〕
オーディオ・オブジェクトがある再生環境境界から閾値距離以内であることを判別することと;
前記再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないことをさらに含む、
付番実施例23記載の方法。
〔付番実施例25〕
再生スピーカー位置データおよび再生環境境界データを含む再生環境データを受領する工程と;
一つまたは複数のオーディオ・オブジェクトおよび関連したメタデータを含むオーディオ再生データを受領する工程であって、前記メタデータは、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む、工程と;
前記オーディオ・オブジェクト位置データおよび前記オーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別する工程と;
少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を決定する工程と;
少なくとも部分的には前記関連したメタデータおよび前記フェードアウト因子に基づいて複数の出力チャネルのそれぞれについて一組の利得値を計算する工程であって、各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応する、工程とを含む、
方法。
〔付番実施例26〕
前記フェードアウト因子が前記外側領域に比例する、付番実施例25記載の方法。
〔付番実施例27〕
オーディオ・オブジェクトがある再生環境境界から閾値距離以内であることを判別することと;
前記再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないこととを含む、
付番実施例25記載の方法。
〔付番実施例28〕
前記オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する工程をさらに含む、
付番実施例25記載の方法。
〔付番実施例29〕
前記再生環境データに従って複数の仮想源位置を定義する工程と;
前記仮想源位置のそれぞれについて、複数の出力チャネルのそれぞれについての仮想源利得を計算する工程とをさらに含む、
付番実施例28記載の方法。
〔付番実施例30〕
前記仮想源位置は一様に離間されている、付番実施例29記載の方法。
〔付番実施例31〕
ソフトウェアが記憶されている非一時的媒体であって、前記ソフトウェアは:
一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領する動作であって、前記オーディオ・オブジェクトは、オーディオ信号および関連したメタデータを含み、前記メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む、動作と;
前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、前記オーディオ・オブジェクト位置データおよび前記オーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する動作と;
少なくとも部分的には計算された前記寄与に基づいて複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する動作であって、各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応する、動作とを実行するよう少なくとも一つの装置を制御するための命令を含む、
非一時的媒体。
〔付番実施例32〕
仮想源からの寄与を計算する工程は、前記オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することを含む、付番実施例31記載の非一時的媒体。
〔付番実施例33〕
前記重み付けされた平均のための重みは、前記オーディオ・オブジェクトの位置、前記オーディオ・オブジェクトのサイズおよび/または前記オーディオ・オブジェクト領域または体積内の各仮想源位置に依存する、付番実施例32記載の非一時的媒体。
〔付番実施例34〕
前記ソフトウェアは、再生スピーカー位置データを含む再生環境データを受領するための命令を含む、付番実施例31記載の非一時的媒体。
〔付番実施例35〕
前記ソフトウェアは:
前記再生環境データに従って複数の仮想源位置を定義し;
各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算するための命令を含む、
付番実施例34記載の非一時的媒体。
〔付番実施例36〕
各仮想源位置は、前記再生環境内の位置に対応する、付番実施例35記載の非一時的媒体。
〔付番実施例37〕
前記仮想源位置の少なくともいくつかは、前記再生環境の外の位置に対応する、付番実施例36記載の非一時的媒体。
〔付番実施例38〕
前記仮想源位置はx、y、z軸に沿って一様に離間されている、付番実施例35記載の非一時的媒体。
〔付番実施例39〕
前記仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間をもつ、付番実施例35記載の非一時的媒体。
〔付番実施例40〕
前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する工程は、x、y、z軸に沿った仮想源からの寄与の独立した計算を含む、付番実施例38または39記載の非一時的媒体。
〔付番実施例41〕
インターフェース・システムおよび論理システムを有する装置であって、
前記論理システムは:
前記インターフェース・システムから、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領する工程であって、前記オーディオ・オブジェクトは、オーディオ信号および関連したメタデータを含み、前記メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む、工程と;
前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、前記オーディオ・オブジェクト位置データおよび前記オーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する工程と;
少なくとも部分的には計算された前記寄与に基づいて複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する工程であって、各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応する、工程とを実行するよう適応されている、
装置。
〔付番実施例42〕
仮想源からの寄与を計算する工程は、前記オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することを含む、付番実施例41記載の装置。
〔付番実施例43〕
前記重み付けされた平均のための重みは、前記オーディオ・オブジェクトの位置、前記オーディオ・オブジェクトのサイズおよび前記オーディオ・オブジェクト領域または体積内の各仮想源位置に依存する、付番実施例42記載の装置。
〔付番実施例44〕
前記論理システムは、前記インターフェース・システムから、再生スピーカー位置データを含む再生環境データを受領するよう適応されている、付番実施例41記載の装置。
〔付番実施例45〕
前記論理システムは:
前記再生環境データに従って複数の仮想源位置を定義し;
各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算するよう適応されている、
付番実施例44記載の装置。
〔付番実施例46〕
各仮想源位置は、前記再生環境内の位置に対応する、付番実施例45記載の装置。
〔付番実施例47〕
前記仮想源位置の少なくともいくつかは、前記再生環境の外の位置に対応する、付番実施例45記載の装置。
〔付番実施例48〕
前記仮想源位置はx、y、z軸に沿って一様に離間されている、付番実施例45記載の装置。
〔付番実施例49〕
前記仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間をもつ、付番実施例45記載の装置。
〔付番実施例50〕
前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する工程は、x、y、z軸に沿った仮想源からの寄与の独立した計算を含む、付番実施例48または49記載の装置。
〔付番実施例51〕
メモリ・デバイスをさらに有しており、前記インターフェース・システムが、前記論理システムと前記メモリ・デバイスとの間のインターフェースを有する、付番実施例51記載の装置。
〔付番実施例52〕
前記インターフェース・システムがネットワーク・インターフェースを有する、付番実施例51記載の装置。
〔付番実施例53〕
ユーザー・インターフェースをさらに有しており、前記論理システムは、前記ユーザー・インターフェースを介して、入力オーディオ・オブジェクト・サイズ・データを含むがそれに限定されないユーザー入力を受領するよう適応されている、付番実施例51記載の装置。
〔付番実施例54〕
前記論理システムは、前記入力オーディオ・オブジェクト・サイズ・データをスケーリングするよう適応されている、付番実施例53記載の装置。