特開2023-100966 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ドルビー　ラボラトリーズ　ライセンシング　コーポレイションの特許一覧 ▶ ドルビー・インターナショナル・アーベーの特許一覧

特開2023-100966見かけのサイズをもつオーディオ・オブジェクトの任意のラウドスピーカー・レイアウトへのレンダリング

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
5A
5B
5C
6A
6B
6C
6D
6E
6F
6G
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023100966

(43)【公開日】2023-07-19

(54)【発明の名称】見かけのサイズをもつオーディオ・オブジェクトの任意のラウドスピーカー・レイアウトへのレンダリング

(51)【国際特許分類】

H04S 7/00 20060101AFI20230711BHJP

【ＦＩ】

H04S7/00 300

【審査請求】有

【請求項の数】3

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023079069

(22)【出願日】2023-05-12

(62)【分割の表示】P 2021074974の分割

【原出願日】2014-03-10

(31)【優先権主張番号】P201330461

(32)【優先日】2013-03-28

(33)【優先権主張国・地域又は機関】ES

(31)【優先権主張番号】61/833,581

(32)【優先日】2013-06-11

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】507236292

【氏名又は名称】ドルビーラボラトリーズライセンシングコーポレイション

(71)【出願人】

【識別番号】510185767

【氏名又は名称】ドルビー・インターナショナル・アーベー

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100135079

【弁理士】

【氏名又は名称】宮崎修

(72)【発明者】

【氏名】マテオスソレ，アントニオ

(72)【発明者】

【氏名】ツインゴス，ニコラスアール

(57)【要約】（修正有）

【課題】見かけのサイズをもつオーディオ・オブジェクトの任意のラウドスピーカー・レイアウトへのレンダリングを提供する。
【解決手段】オーディオ・オブジェクトおよびメタデータを含む入力オーディオをレンダリングするための方法は、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領するステップと、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域または体積内の仮想源からの寄与を計算するステップと、少なくとも部分的には計算された寄与に基づいて、複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するステップと、を含む。
【選択図】図５Ｃ

【特許請求の範囲】

【請求項1】

オーディオ・オブジェクトおよびメタデータを含む入力オーディオをレンダリングする方法であって、前記メタデータは前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト・サイズ・メタデータおよびオーディオ・オブジェクト位置メタデータを含み、当該方法は：
前記オーディオ・オブジェクト・サイズ・メタデータおよび前記オーディオ・オブジェクト位置メタデータを受領する段階と；
一つまたは複数のスピーカー・フィードについてのゾーン制約条件に関するゾーン・メタデータを受領する段階と；
前記入力オーディオ、前記オーディオ・オブジェクト・サイズ・メタデータおよび前記オーディオ・オブジェクト位置メタデータに基づいて、前記少なくとも一つの仮想オーディオ・オブジェクトを決定する段階と；
前記少なくとも一つの仮想オーディオ・オブジェクトの位置を、前記オーディオ・オブジェクト・サイズ・メタデータおよび前記オーディオ・オブジェクト位置メタデータの少なくとも一方に基づいて決定する段階と；
前記少なくとも一つの仮想オーディオ・オブジェクトの位置および前記仮想オーディオ・オブジェクトの利得に基づいて、前記オーディオ・オブジェクトを、前記一つまたは複数のスピーカー・フィードにレンダリングする段階であって、前記レンダリングはさらに前記ゾーン・メタデータに基づく、段階とを含む、
方法。

【請求項2】

請求項１に記載の方法を実行するための命令を含むソフトウェアを記憶している非一時的な媒体。

【請求項3】

オーディオ・オブジェクトおよびメタデータを含む入力オーディオをレンダリングするための装置であって、前記メタデータは前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト・サイズ・メタデータおよびオーディオ・オブジェクト位置メタデータを含み、当該装置は：
前記オーディオ・オブジェクト・サイズ・メタデータおよび前記オーディオ・オブジェクト位置メタデータを受領するように構成された受領器であって、該受領器は、一つまたは複数のスピーカー・フィードについてのゾーン制約条件に関するゾーン・メタデータを受領するようにさらに構成されている、受領器と；
前記入力オーディオ、前記オーディオ・オブジェクト・サイズ・メタデータおよび前記オーディオ・オブジェクト位置メタデータに基づいて、前記少なくとも一つの仮想オーディオ・オブジェクトを決定するための第一のプロセッサと；
前記少なくとも一つの仮想オーディオ・オブジェクトの位置を、前記オーディオ・オブジェクト・サイズ・メタデータおよび前記オーディオ・オブジェクト位置メタデータの少なくとも一方に基づいて決定するための第二のプロセッサと；
前記少なくとも一つの仮想オーディオ・オブジェクトの位置および前記仮想オーディオ・オブジェクトの利得に基づいて、前記オーディオ・オブジェクトを、一つまたは複数のスピーカー・フィードにレンダリングするレンダラーであって、前記レンダリングはさらに前記ゾーン・メタデータに基づく、レンダラーとを有する、
装置。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願への相互参照
本願は2013年3月28日に出願されたスペイン特許出願第P201330461号および2013年6月11日に出願された米国仮特許出願第61/833,581号の優先権を主張するものである。各出願の内容はここに参照によりその全体において組み込まれる。

【0002】

技術分野
本開示は、オーディオ再生データのオーサリングおよびレンダリングに関する。特に、本開示は映画館サウンド再生システムのような再生環境のためのオーディオ再生データをオーサリングおよびレンダリングすることに関する。

【背景技術】

【0003】

1927年に映画に音声が導入されて以来、映画サウンドトラックの芸術的な意図を捉えてそれを映画館環境で再現するために使われる技術は着実に進歩を遂げてきた。1930年代にはディスク上の同期されたサウンドはフィルム上の可変領域サウンドに取って代わられ、それは1940年代にはさらに、劇場の音響の考察および改善されたスピーカー設計により改善された。それとともにマルチトラック録音および方向制御可能な再生（音を動かすために制御トーンを使う）の早期の導入があった。1950年代および1960年代には、フィルムの磁気ストライプにより劇場での多チャネル再生が可能になり、サラウンド・チャネル、高級なシアターでは５つのスクリーン・チャネルまでを導入した。

【0004】

1970年代には、ドルビーは、ポストプロダクションおよびフィルム上の両方におけるノイズ削減を、３つのスクリーン・チャネルおよびモノのサラウンド・チャネルとの混合をエンコードおよび配布するコスト効率のよい手段とともに、導入した。映画館サウンドの品質は1980年代には、ドルビー・スペクトラル・レコーディング（SR: Spectral Recording）ノイズ削減およびTHXのような認証プログラムによってさらに改善された。ドルビーは1990年代に、離散的な左、中央および右スクリーン・チャネル、左および右のサラウンド・アレイおよび低域効果のためのサブウーファー・チャネルを与える５．１チャネル・フォーマットをもって映画館にデジタル・サウンドをもたらした。2010年に導入されたドルビー・サラウンド７．１は、既存の左および右サラウンド・チャネルを四つの「ゾーン」に分割することによって、サラウンド・チャネルの数を増やした。

【0005】

チャネル数が増え、スピーカー・レイアウトが平面的な二次元（2D）アレイから高さを含む三次元（3D）アレイに遷移するにつれ、サウンドをオーサリングおよびレンダリングするタスクはますます複雑になる。改善された方法および装置が望ましいであろう。

【先行技術文献】

【非特許文献】

【0006】

【非特許文献1】V. Pulkki、Compensating Displacement of Amplitude-Panned Virtual Sources、Audio Engineering Society (AES) International Conference on Virtual, Synthetic and Entertainment Audio

【非特許文献2】D. de Vries、Wave Field Synthesis、AES Monograph 1999

【発明の概要】

【課題を解決するための手段】

【0007】

本開示に記載される主題のいくつかの側面は、いかなる特定の再生環境をも参照することなく生成されるオーディオ・オブジェクトを含むオーディオ再生データをレンダリングするためのツールにおいて実装されることができる。本稿での用法では、用語「オーディオ・オブジェクト」は、オーディオ信号および関連するメタデータのストリームを指してもよい。メタデータは、少なくともオーディオ・オブジェクトの位置および見かけのサイズを示してもよい。しかしながら、メタデータは、レンダリング制約条件データ、コンテンツ型データ（たとえばダイアログ、効果など）、利得データ、軌跡データなども示してもよい。いくつかのオーディオ・オブジェクトは静的であってもよく、一方、他のオーディオ・オブジェクトは時間変化するメタデータを有していてもよい：そのようなオーディオ・オブジェクトは、動いてもよく、サイズを変えてもよく、および／または時間とともに変化する他の属性を有していてもよい。

【0008】

オーディオ・オブジェクトが再生環境においてモニタリングまたは再生されるとき、オーディオ・オブジェクトは、少なくとも位置およびサイズのメタデータに従ってレンダリングされてもよい。レンダリング・プロセスは、出力チャネルの集合の各チャネルについての一組のオーディオ・オブジェクト利得値を計算することに関わっていてもよい。各出力チャネルは、再生環境の一つまたは複数の再生スピーカーに対応していてもよい。

【0009】

本稿に記載されるいくつかの実装は、何らかの特定のオーディオ・オブジェクトをレンダリングするのに先立って行なわれうる「セットアップ」プロセスに関わる。本稿で第一段またはステージ１とも称されることがあるこのセットアップ・プロセスは、オーディオ・オブジェクトが動くことができる体積内で複数の仮想源位置を定義することに関わっていてもよい。本稿での用法では、「仮想源位置」は、静的な点源の位置である。そのような実装によれば、セットアップ・プロセスは、再生スピーカー位置データを受領し、再生スピーカー位置データおよび仮想源位置に従って仮想源のそれぞれについて仮想源利得値を事前計算することに関わっていてもよい。本稿での用法では、「スピーカー位置データ」は、再生環境のスピーカーの一部または全部の位置を示す位置データを含んでいてもよい。位置データは、再生スピーカー位置の絶対座標、たとえばデカルト座標、球面座標などとして与えられてもよい。代替的または追加的に、位置データは、再生環境の音響的な「スイートスポット」のような他の再生環境位置に対する座標（たとえばデカルト座標または角座標）として与えられてもよい。

【0010】

いくつかの実装では、仮想源利得値は、オーディオ再生データが再生環境のスピーカーのためにレンダリングされる「ランタイム」の間に、記憶され、使用されてもよい。ランタイムの間に、各オーディオ・オブジェクトについて、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域または体積内の仮想源位置からの寄与が計算されてもよい。仮想源位置からの寄与を計算するプロセスは、オーディオ・オブジェクトのサイズおよび位置によって定義されるオーディオ・オブジェクト領域または体積内にある仮想源位置についてセットアップ・プロセスの間に決定された複数の事前計算された仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。再生環境の各出力チャネルについての一組のオーディオ・オブジェクト利得値が、少なくとも部分的には、計算された仮想源寄与に基づいて計算されてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。

【0011】

よって、本稿に記載されるいくつかの方法は、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領することに関わる。オーディオ・オブジェクトはオーディオ信号および関連するメタデータを含んでいてもよい。メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含んでいてもよい。これらの方法は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算することに関わっていてもよい。これらの方法は、複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を、少なくとも部分的には、計算された寄与に基づいて計算することに関わっていてもよい。たとえば、再生環境は映画館サウンド・システム環境であってもよい。

【0012】

仮想源からの寄与を計算するプロセスは、オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。重み付けされた平均のための重みは、オーディオ・オブジェクトの位置、オーディオ・オブジェクトのサイズおよび／またはオーディオ・オブジェクト領域または体積内の各仮想源位置に依存してもよい。

【0013】

これらの方法は、再生スピーカー位置データを含む再生環境データを受領することにも関わっていてもよい。これらの方法は、再生環境データに従って複数の仮想源位置を定義し、各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算することにも関わっていてもよい。いくつかの実装では、仮想源位置のそれぞれは、再生環境内のある位置に対応していてもよい。しかしながら、いくつかの実装では、仮想源位置の少なくともいくつかは、再生環境の外の位置に対応していてもよい。

【0014】

いくつかの実装では、仮想源位置はx、y、z軸に沿って一様に離間されていてもよい。しかしながら、いくつかの実装では、離間はすべての方向において同じでなくてもよい。たとえば、仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間を有していてもよい。前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するプロセスは、x、y、z軸に沿った仮想源からの寄与の独立した計算に関わっていてもよい。代替的な実装では、仮想源位置は非一様に離間されていてもよい。

【0015】

いくつかの実装では、前記複数の出力チャネルのそれぞれについてのオーディオ・オブジェクト利得値を計算するプロセスは、位置x_o,y_o,z_oにおいてレンダリングされるべきサイズ（s）のオーディオ・オブジェクトについての利得値（g_l(x_o,y_o,z_o;s)）を決定することに関わっていてもよい。たとえば、オーディオ・オブジェクト利得値（g_l(x_o,y_o,z_o;s)）は

【数1】

と表わされてもよい。ここで、(x_vs,y_vs,z_vs)は仮想源（virtual source）位置を表わし、g_l(x_vs,y_vs,z_vs)は仮想源位置x_vs,y_vs,z_vsについてのチャネルlについての利得値を表わし、w(x_vs,y_vs,z_vs;x_o,y_o,z_o;s)は、少なくとも部分的には、オーディオ・オブジェクトの位置(x_o,y_o,z_o)、オーディオ・オブジェクトのサイズ（s）および仮想源位置(x_vs,y_vs,z_vs)に基づいて決定されるg_l(x_vs,y_vs,z_vs)についての一つまたは複数の重み関数を表わす。

【0016】

いくつかのそのような実装によれば、g_l(x_vs,y_vs,z_vs)＝g_l(x_vs)g_l(y_vs)g_l(z_vs)であり、ここで、g_l(x_vs)、g_l(y_vs)およびg_l(z_vs)はx、yおよびzの独立な利得関数を表わす。いくつかのそのような実装では、重み関数は次のように因子分解されてもよい。

【0017】

w(x_vs,y_vs,z_vs;x_o,y_o,z_o;s)＝w_x(x_vs;x_o;s)w_y(y_vs;y_o;s)w_z(z_vs;z_o;s)
ここで、w_x(x_vs;x_o;s)、w_y(y_vs;y_o;s)およびw_z(z_vs;z_o;s)はx_vs、y_vsおよびz_vsの独立な重み関数を表わす。いくつかのそのような実装によれば、pはオーディオ・オブジェクト・サイズ（s）の関数であってもよい。

【0018】

いくつかのそのような方法は、計算された仮想源利得値をメモリ・システムに記憶することに関わっていてもよい。オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算するプロセスは、メモリ・システムから、オーディオ・オブジェクト位置およびサイズに対応する計算された仮想源利得値を取り出し、計算された仮想源利得値の間を補間することに関わっていてもよい。計算された仮想源利得値の間を補間するプロセスは：オーディオ・オブジェクト位置の近くの複数の近隣の仮想源位置を決定し；前記近隣の仮想源位置のそれぞれについて計算された仮想源利得値を決定し；前記オーディオ・オブジェクト位置と前記近隣の仮想源位置のそれぞれとの間の複数の距離を決定し；前記複数の距離に従って、計算された仮想源利得値の間を補間することに関わっていてもよい。

【0019】

いくつかの実装では、再生環境データは、再生環境境界データを含んでいてもよい。前記方法は、オーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別し、少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を適用することに関わっていてもよい。いくつかの方法は、オーディオ・オブジェクトがある再生環境境界から閾値距離以内であってもよいことを判別し、再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないことに関わっていてもよい。いくつかの実装では、オーディオ・オブジェクト領域または体積は、長方形、直方体、円、球、楕円および／または楕円体であってもよい。

【0020】

いくつかの方法は、オーディオ再生データの少なくとも一部を脱相関することに関わっていてもよい。たとえば、それらの方法は、ある閾値を超えるオーディオ・オブジェクト・サイズをもつオーディオ・オブジェクトについてのオーディオ再生データを脱相関することに関わっていてもよい。

【0021】

代替的な諸方法が本稿に記載される。いくつかのそのような方法は、再生スピーカー位置データおよび再生環境境界データを含む再生環境データを受領し、一つまたは複数のオーディオ・オブジェクトおよび関連したメタデータを含むオーディオ再生データを受領することに関わる。メタデータは、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含んでいてもよい。これらの方法は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別し、少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を決定することに関わっていてもよい。それらの方法は、少なくとも部分的には前記関連したメタデータおよび前記フェードアウト因子に基づいて複数の出力チャネルのそれぞれについて一組の利得値を計算することに関わっていてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応していてもよい。

【0022】

これらの方法は、オーディオ・オブジェクトがある再生環境境界から閾値距離以内であってもよいことを判別し、再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないことに関わっていてもよい。

【0023】

これらの方法は、オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算することに関わっていてもよい。これらの方法は、再生環境データに従って複数の仮想源位置を定義し、該仮想源位置のそれぞれについて、複数の出力チャネルのそれぞれについての仮想源利得を計算することに関わっていてもよい。仮想源位置は、具体的な実装に依存して、一様に離間されていてもいなくてもよい。

【0024】

いくつかの実装は、ソフトウェアが記憶されている一つまたは複数の非一時的媒体において具現されてもよい。ソフトウェアは、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領するために一つまたは複数の装置を制御するための命令を含んでいてもよい。オーディオ・オブジェクトは、オーディオ信号および関連したメタデータを含んでいてもよい。メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含んでいてもよい。ソフトウェアは、前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域または体積内の仮想源からの寄与を計算し、少なくとも部分的には計算された寄与に基づいて複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するための命令を含んでいてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。

【0025】

いくつかの実装では、仮想源からの寄与を計算するプロセスは、オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。重み付けされた平均のための重みは、オーディオ・オブジェクトの位置、オーディオ・オブジェクトのサイズおよび／またはオーディオ・オブジェクト領域または体積内の各仮想源位置に依存してもよい。

【0026】

前記ソフトウェアは、再生スピーカー位置データを含む再生環境データを受領するための命令を含んでいてもよい。前記ソフトウェアは、再生環境データに従って複数の仮想源位置を定義し、各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算するための命令を含んでいてもよい。仮想源位置のそれぞれは、再生環境内のある位置に対応していてもよい。いくつかの実装では、仮想源位置の少なくともいくつかは、再生環境の外の位置に対応していてもよい。

【0027】

いくつかの実装によれば、仮想源位置は一様に離間されていてもよい。いくつかの実装では、仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間を有していてもよい。前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するプロセスは、x、y、z軸に沿った仮想源からの寄与の独立した計算に関わっていてもよい。

【0028】

さまざまなデバイスおよび装置が本稿に記載される。いくつかのそのような装置は、インターフェース・システムおよび論理システムを含んでいてもよい。インターフェース・システムは、ネットワーク・インターフェースを含んでいてもよい。いくつかの実装では、前記装置は、メモリ・デバイスを含んでいてもよい。インターフェース・システムは、前記論理システムと前記メモリ・デバイスとの間のインターフェースを含んでいてもよい。

【0029】

前記論理システムは、前記インターフェース・システムから、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領するよう適応されていてもよい。オーディオ・オブジェクトは、オーディオ信号および関連したメタデータを含んでいてもよい。メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含んでいてもよい。前記論理システムは、前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算するよう適応されていてもよい。前記論理システムは、少なくとも部分的には計算された寄与に基づいて複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するよう適応されていてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。

【0030】

【0031】

前記論理システムは、再生環境データに従って複数の仮想源位置を定義し、各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算するよう適応されていてもよい。仮想源位置のそれぞれは、再生環境内のある位置に対応していてもよい。しかしながら、いくつかの実装では、仮想源位置の少なくともいくつかは、再生環境の外の位置に対応していてもよい。具体的な実装に依存して、仮想源位置は一様に離間されていてもいなくてもよい。いくつかの実装では、仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間を有していてもよい。前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算するプロセスは、x、y、z軸に沿った仮想源からの寄与の独立した計算に関わっていてもよい。

【0032】

前記装置は、ユーザー・インターフェースを含んでいてもよい。前記論理システムは、前記ユーザー・インターフェースを介して、オーディオ・オブジェクト・サイズ・データのようなユーザー入力を受領するよう適応されていてもよい。何らかの実装では、前記論理システムは、入力オーディオ・オブジェクト・サイズ・データをスケーリングするよう適応されていてもよい。

【0033】

本明細書に記載される主題の一つまたは複数の実装の詳細は、付属の図面および以下の説明において記載される。他の特徴、側面および利点が該説明、図面および請求項から明白となるであろう。以下の図面の相対的な寸法は縮尺通りに描かれていないことがあることを注意しておく。

【図面の簡単な説明】

【0034】

【図1】ドルビー・サラウンド５．１配位をもつ再生環境の例を示す図である。

【図2】ドルビー・サラウンド７．１配位をもつ再生環境の例を示す図である。

【図3】浜崎２２．２サラウンド・サウンド配位をもつ再生環境の例を示す図である。

【図4A】仮想再生環境におけるさまざまな高さにおけるスピーカー・ゾーンを描くグラフィカル・ユーザー・インターフェース（GUI）の例を示す図である。

【図4B】別の再生環境の例を示す図である。

【図5A】オーディオ処理方法の概観を与える流れ図である。

【図5B】セットアップ・プロセスの例を与える流れ図である。

【図5C】仮想源位置についての事前計算された利得値に従って受領されたオーディオ・オブジェクトについての利得値を計算するランタイム・プロセスの例を与える流れ図である。

【図6A】再生環境に対する仮想源位置の例を示す図である。

【図6B】再生環境に対する仮想源位置の代替例を示す図である。

【図6C】種々の位置にあるオーディオ・オブジェクトに近距離場および遠距離場パン技法を適用する例を示す図である。

【図6D】種々の位置にあるオーディオ・オブジェクトに近距離場および遠距離場パン技法を適用する例を示す図である。

【図6E】種々の位置にあるオーディオ・オブジェクトに近距離場および遠距離場パン技法を適用する例を示す図である。

【図6F】種々の位置にあるオーディオ・オブジェクトに近距離場および遠距離場パン技法を適用する例を示す図である。

【図6G】1に等しい辺長をもつ正方形の各隅に一つのスピーカーをもつ再生環境の例を示す図である。

【図7】オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域内の仮想源からの寄与の例を示す図である。

【図8】ＡおよびＢは、あるオーディオ・オブジェクトを再生環境内の二つの位置において示す図である。

【図9】少なくとも部分的には、オーディオ・オブジェクトの領域または体積のうちのどのくらいが再生環境の境界外に広がるかに基づいて、フェードアウト因子を決定する方法を概説する流れ図である。

【図10】オーサリングおよび／またはレンダリング装置のコンポーネントの例を与えるブロック図である。

【図11】Ａは、オーディオ・コンテンツ生成のために使用されうるいくつかのコンポーネントを表すブロック図であり、Ｂは再生環境におけるオーディオ再生のために使用されうるいくつかのコンポーネントを表すブロック図である。さまざまな図面における同様の参照番号および符号は同様の要素を指示する。

【発明を実施するための形態】

【0035】

以下の記述は、本開示のいくつかの斬新な側面およびこれら斬新な側面が実装されうるコンテキストの例を記述する目的のためのある種の実装に向けられる。しかしながら、本稿の教示はさまざまな異なる仕方で適用されることができる。たとえば、さまざまな実装が具体的な再生環境を使って記述されているが、本稿の教示は他の既知の再生環境および将来導入されうる再生環境に広く適用可能である。同様に、記載される実装はさまざまなオーサリングおよび／またはレンダリング・ツールにおいて実装されてもよく、それらは多様なハードウェア、ソフトウェア、ファームウェア等で実装されてもよい。したがって、本開示の教示は、図面に示されるおよび／または本稿で記述される実装に限定されることは意図されておらず、むしろ広い適用可能性をもつものである。

【0036】

図１は、ドルビー・サラウンド５．１配位をもつ再生環境の例を示している。ドルビー・サラウンド５．１は1990年代に開発されたが、この配位はいまだ広く映画館サウンド・システム環境に配備されている。プロジェクター１０５は、たとえば映画のためのビデオ画像をスクリーン１５０に投影するよう構成されていてもよい。オーディオ再生データは、該ビデオ画像と同期され、サウンド・プロセッサ１１０によって処理されてもよい。電力増幅器１１５はスピーカー・フィード信号を再生環境１００のスピーカーに与えてもよい。

【0037】

ドルビー・サラウンド５．１配位は、左サラウンド・アレイ１２０、右サラウンド・アレイ１２５を含み、そのそれぞれは単一チャネルによって集団駆動されるスピーカーの群を含む。ドルビー・サラウンド５．１配位は左スクリーン・チャネル１３０、中央スクリーン・チャネル１３５および右スクリーン・チャネル１４０についての別個のチャネルをも含む。サブウーファー１４５についての別個のチャネルが低域効果（LFE: low-frequency effects）のために提供される。

【0038】

2010年に、ドルビーはドルビー・サラウンド７．１を導入することによってデジタル映画館サウンドに対する向上を提供した。図２は、ドルビー・サラウンド７．１配位をもつ再生環境の例を示している。デジタル・プロジェクター２０５はデジタル・ビデオ・データを受領し、ビデオ画像をスクリーン１５０上に投影するよう構成されていてもよい。オーディオ再生データは、サウンド・プロセッサ２１０によって処理されてもよい。電力増幅器２１５がスピーカー・フィード信号を再生環境２００のスピーカーに提供してもよい。

【0039】

ドルビー・サラウンド７．１配位は、左側方サラウンド・アレイ２２０および右側方サラウンド・アレイ２２５を含み、そのそれぞれは単一チャネルによって駆動されてもよい。ドルビー・サラウンド５．１と同様に、ドルビー・サラウンド７．１配位は左スクリーン・チャネル２３０、中央スクリーン・チャネル２３５、右スクリーン・チャネル２４０およびサブウーファー２４５のための別個のチャネルを含む。しかしながら、ドルビー・サラウンド７．１は、ドルビー・サラウンド５．１の左および右のサラウンド・チャネルを四つのゾーンに分割することによって、サラウンド・チャネルの数を増している。すなわち、左側方サラウンド・アレイ２２０および右側方サラウンド・アレイ２２５に加えて、左後方サラウンド・スピーカー２２４および右後方サラウンド・スピーカー２２６のために別個のチャネルが含まれる。再生環境２００内のサラウンド・ゾーンの数を増すことは、音の定位を著しく改善できる。

【0040】

より没入的な環境を生成しようとする努力において、いくつかの再生環境は、増加した数のチャネルによって駆動される増加した数のスピーカーをもって構成されることがある。さらに、いくつかの再生環境は、さまざまな高さに配備されるスピーカーを含むことがあり、そのような高さの一部は再生環境の座席領域より上方であることがある。

【0041】

図３は、浜崎２２．２サラウンド・サウンド配位をもつ再生環境の例を示している。浜崎２２．２は日本のNHK放送技術研究所において、超高精細度テレビジョンのサラウンド・サウンド・コンポーネントとして開発された。浜崎２２．２は24個のスピーカー・チャネルを提供し、それらは三層に配置されたスピーカーを駆動するために使用されうる。再生環境３００の上スピーカー層３１０は9チャネルによって駆動されうる。中スピーカー層３２０は10チャネルによって駆動されうる。下スピーカー層３３０は5チャネルによって駆動されうるが、そのうち2チャネルはサブウーファー３４５ａおよび３４５ｂ用である。

【0042】

よって、現在のトレンドは、より多くのスピーカーおよびより多くのチャネルを含めるだけでなく、異なる高さのスピーカーをも含めるものである。チャネルの数が増し、スピーカー・レイアウトが2Dアレイから3Dアレイに遷移するにつれて、サウンドを位置決めし、レンダリングするタスクはますます難しくなる。よって、本願の譲受人は、3Dオーディオ・サウンド・システムのための機能を高めるおよび／またはオーサリング複雑さを軽減するさまざまなツールおよび関係するユーザー・インターフェースを開発した。これらのツールのいくつかは、2012年4月20日に出願され、「向上した3Dオーディオ作成および表現のためのシステムおよびツール」と題する米国仮特許出願第61/636,102号（「作成および表現」出願）の図５Ａ～図１９Ｄを参照して詳細に記述されている。同出願の内容はここに参照により組み込まれる。

【0043】

図４Ａは、仮想再生環境におけるさまざまな高さにあるスピーカー・ゾーンを描くグラフィカル・ユーザー・インターフェース（GUI）の例を示している。GUI ４００はたとえば、論理システムからの命令、ユーザー入力装置から受領される信号などに従って、表示装置上に表示されてもよい。そのようないくつかの装置は図１０を参照して後述する。

【0044】

仮想再生環境４０４のような仮想再生環境への言及に関する本稿での用法では、用語「スピーカー・ゾーン」は概括的に、実際の再生環境の再生スピーカーと一対一対応があってもなくてもよい論理的な構造体を指す。たとえば、「スピーカー・ゾーン位置」は、映画館再生環境の特定の再生スピーカー位置に対応してもしなくてもよい。その代わり、用語「スピーカー・ゾーン位置」は概括的に、仮想再生環境のゾーンを指してもよい。いくつかの実装では、仮想再生環境のスピーカー・ゾーンは、たとえば、二チャネル・ステレオ・ヘッドホンの組を使ってリアルタイムに仮想サラウンド・サウンド環境を生成するドルビー・ヘッドホン（商標）（時にモバイル・サラウンド（商標）と称される）のような仮想化技術の使用を通じて、仮想スピーカーに対応してもよい。GUI ４００には、第一の高さに七つのスピーカー・ゾーン４０２ａがあり、第二の高さに二つのスピーカー・ゾーン４０２ｂがあり、仮想再生環境４０４内のスピーカー・ゾーンは合計九つとなっている。この例では、スピーカー・ゾーン１～３は仮想再生環境４０４の前方領域４０５にある。前方領域４０５はたとえば、映画館再生環境の、スクリーン１５０が位置する領域、家庭の、テレビジョン・スクリーンが位置する領域などに対応してもよい。

【0045】

ここで、スピーカー・ゾーン４は概括的には左領域４１０のスピーカーに対応し、スピーカー・ゾーン５は仮想再生環境４０４の右領域４１５のスピーカーに対応する。スピーカー・ゾーン６は左後方領域４１２に対応し、スピーカー・ゾーン７は仮想再生環境４０４の右後方領域４１４に対応する。スピーカー・ゾーン８は上領域４２０ａのスピーカーに対応し、スピーカー・ゾーン９は上領域４２０ｂのスピーカーに対応し、これは図５Ｄおよび５Ｅに示される仮想天井５２０の領域のような仮想天井領域であってもよい。したがって、「作成および表現」出願でより詳細に述べたように、図４Ａに示されるスピーカー・ゾーン１～９の位置は実際の再生環境の再生スピーカーの位置に対応してもしなくてもよい。さらに、他の実装はより多数またはより少数のスピーカー・ゾーンおよび／または高さを含んでいてもよい。

【0046】

「作成および表現」出願に記載されるさまざまな実装において、GUI ４００のようなユーザー・インターフェースが、オーサリング・ツールおよび／またはレンダリング・ツールの一部として使用されてもよい。いくつかの実装では、オーサリング・ツールおよび／またはレンダリング・ツールは、一つまたは複数の非一時的な媒体上に記憶されるソフトウェアを介して実装されてもよい。オーサリング・ツールおよび／またはレンダリング・ツールは、（少なくとも部分的には）図１０を参照して後述する論理システムおよび他の装置のようなハードウェア、ファームウェアなどによって実装されてもよい。いくつかのオーサリング実装では、関連するオーサリング・ツールが関連するオーディオ・データについてのメタデータを生成するために使用されてもよい。メタデータは、たとえば、三次元空間におけるオーディオ・オブジェクトの位置および／または軌跡を示すデータ、スピーカー・ゾーン制約条件データなどを含んでいてもよい。メタデータは、実際の再生環境の特定のスピーカー・レイアウトに関してではなく、仮想再生環境４０４のスピーカー・ゾーン４０２に関して生成されてもよい。レンダリング・ツールは、オーディオ・データおよび関連するメタデータを受領してもよく、再生環境のためのオーディオ利得およびスピーカー・フィード信号を計算してもよい。そのようなオーディオ利得およびスピーカー・フィード信号は、振幅パン・プロセスに従って計算されてもよい。振幅パン・プロセスは、音が再生環境中の位置Pから来ているような知覚を創り出すことができるものである。たとえば、スピーカー・フィード信号は、次式
x_i(t)＝g_ix(t) i＝1,…,N (式1)
に従って再生環境の再生スピーカー１ないしNに与えられてもよい。

【0047】

式(1)において、x_i(t)はスピーカーiに加えられるスピーカー・フィード信号を表し、g_iは対応するチャネルの利得因子を表し、x(t)はオーディオ信号を表し、tは時間を表す。利得因子はたとえばここに参照により組み込まれる非特許文献１のSection 2、pp.3-4に記載される振幅パン方法（amplitude panning methods）に従って決定されてもよい。いくつかの実装では、利得は周波数依存であってもよい。いくつかの実装では、x(t)をx(t－Δt)で置き換えることによって時間遅延が導入されてもよい。

【0048】

いくつかのレンダリング実装では、スピーカー・ゾーン４０２を参照して生成されたオーディオ再生データは、ドルビー・サラウンド５．１配位、ドルビー・サラウンド７．１配位、浜崎２２．２配位または他の配位であってもよい幅広い範囲の再生環境のスピーカー位置にマッピングされうる。たとえば、図２を参照するに、レンダリング・ツールは、スピーカー・ゾーン４および５についてのオーディオ再生データを、ドルビー・サラウンド７．１配位をもつ再生環境の左側方サラウンド・アレイ２２０および右側方サラウンド・アレイ２２５にマッピングしてもよい。スピーカー・ゾーン１、２および３についてのオーディオ再生データは、それぞれ左スクリーン・チャネル２３０、右スクリーン・チャネル２４０および中央スクリーン・チャネル２３５にマッピングされてもよい。スピーカー・ゾーン６および７についてのオーディオ再生データは、左後方サラウンド・スピーカー２２４および右後方サラウンド・スピーカー２２６にマッピングされてもよい。

【0049】

図４Ｂは、別の再生環境の例を示している。いくつかの実装では、レンダリング・ツールは、スピーカー・ゾーン１、２および３についてのオーディオ再生データを再生環境４５０の対応するスクリーン・スピーカー４５５にマッピングしてもよい。レンダリング・ツールは、スピーカー・ゾーン４および５についてのオーディオ再生データを、左側方サラウンド・アレイ４６０および右側方サラウンド・アレイ４６５にマッピングしてもよく、スピーカー・ゾーン８および９についてのオーディオ再生データを、左頭上スピーカー４７０ａおよび右頭上スピーカー４７０ｂにマッピングしてもよい。スピーカー・ゾーン６および７についてのオーディオ再生データは、左後方サラウンド・スピーカー４８０ａおよび右後方サラウンド・スピーカー４８０ｂにマッピングされてもよい。

【0050】

いくつかのオーサリング実装では、オーサリング・ツールは、オーディオ・オブジェクトについてのメタデータを生成するために使われてもよい。本稿での用法では、用語「オーディオ・オブジェクト（audio object）」はオーディオ・データおよび関連するメタデータのストリームを指してもよい。メタデータは、オーディオ・オブジェクトの3D位置、オーディオ・オブジェクトの見かけのサイズ、レンダリング制約条件およびコンテンツ型（たとえばダイアログ、効果など）を指示してもよい。実装に依存して、メタデータは、利得データ、軌跡データなどの他の型のデータを含んでいてもよい。いくつかのオーディオ・オブジェクトは静的であってもよく、一方、他のオーディオ・オブジェクトは動いてもよい。オーディオ・オブジェクトの詳細は、所与の時点における三次元空間内でのオーディオ・オブジェクトの位置などを示しうる関連するメタデータに従ってオーサリングまたはレンダリングされてもよい。オーディオ・オブジェクトが再生環境においてモニタリングまたは再生されるとき、オーディオ・オブジェクトは、再生環境の再生スピーカー・レイアウトに従って、その位置およびサイズのメタデータに従ってレンダリングされうる。

【0051】

図５Ａは、オーディオ処理方法の概観を与える流れ図である。より詳細な例は図５Ｂ以下を参照して後述する。これらの方法は、図示され本稿で記載されるよりも多数または少数のブロックを含んでいてもよく、必ずしも本稿に示される順序で実行されない。これらの方法は、少なくとも部分的には、図１０～図１１に示され、後述されるような装置によって実行されてもよい。ソフトウェアは、本稿に記載される方法を実行するよう一つまたは複数の装置を制御するための命令を含んでいてもよい。

【0052】

図５Ａに示される例では、方法５００は、ある特定の再生環境に対する仮想源位置についての仮想源利得値を決定するセットアップ・プロセスをもって始まる（ステップ５０５）。図６Ａは、再生環境に対する仮想源位置の例を示している。たとえば、ブロック５０５は、再生環境６００ａの再生スピーカー位置６２５に対する仮想源位置６０５の仮想源利得値を決定することに関わっていてもよい。仮想源位置６０５および再生スピーカー位置６２５は単に例である。図６Ａに示される例では、仮想源位置６０５はx、y、z軸に沿って一様に離間している。しかしながら、代替的な実装では、仮想源位置６０５は異なる仕方で離間されていてもよい。たとえば、いくつかの実装では、仮想源位置６０５はx軸およびy軸に沿っての第一の一様な離間およびz軸に沿って第二の一様な離間を有していてもよい。他の実装では、仮想源位置６０５は非一様に離間されていてもよい。

【0053】

図６Ａに示される例では、再生環境６００ａおよび仮想源体積６０２ａは同一の広がりをもち、そのため仮想源位置６０５のそれぞれは再生環境６００ａ内の位置に対応する。しかしながら、代替的な実装では、再生環境６００と仮想源体積６０２は同一の広がりでなくてもよい。たとえば、仮想源位置６０５の少なくともいくつかが再生環境６００の外の位置に対応してもよい。

【0054】

図６Ｂは、再生環境に対する仮想源位置の代替的な例を示している。この例では、仮想源体積６０２ｂは、再生環境６００ｂの外側に広がる。

【0055】

図５Ａに戻ると、この例では、ブロック５０５のセットアップ・プロセスは、何らかの特定のオーディオ・オブジェクトをレンダリングする前に行なわれる。いくつかの実装では、ブロック５０５において決定された仮想源利得値は記憶システムに記憶されてもよい。記憶された仮想源利得値は、仮想源利得値の少なくともいくつかに従って受領されたオーディオ・オブジェクトについてのオーディオ・オブジェクト利得値を計算する「ランタイム」プロセスの間に使用されてもよい（ブロック５１０）。たとえば、ブロック５１０は、少なくとも部分的には、オーディオ・オブジェクト領域または体積内にある仮想源位置に対応する仮想源利得値に基づいてオーディオ・オブジェクト利得値を計算することに関わっていてもよい。

【0056】

いくつかの実装では、方法５００は、オーディオ・データを脱相関することに関わる任意的なブロック５１５を含んでいてもよい。ブロック５１５は、ランタイム・プロセスの一部であってもよい。いくつかのそのような実装では、ブロック５１５は、周波数領域における畳み込みに関わっていてもよい。たとえば、ブロック５１５は、各スピーカー・フィード信号について有限インパルス応答（「FIR」）フィルタを適用することに関わっていてもよい。

【0057】

いくつかの実装では、ブロック５１５のプロセスは、オーディオ・オブジェクト・サイズおよび／または作者の芸術的意図に依存して、実行されてもされなくてもよい。いくつかのそのような実装によれば、オーディオ・オブジェクト・サイズがあるサイズ閾値以上であるときには脱相関がオンにされるべきであり、オーディオ・オブジェクト・サイズが前記サイズ閾値未満であれば脱相関がオフにされるべきであることを（たとえば関連したメタデータに含まれる脱相関フラグを介して）示すことによって、オーサリング・ツールが、オーディオ・オブジェクト・サイズを脱相関とリンクさせてもよい。いくつかの実装では、脱相関は、サイズ閾値に関するユーザー入力および／または他の入力値に従って制御（たとえば増大、減少または無効化）されてもよい。

【0058】

図５Ｂは、セットアップ・プロセスの例を与える流れ図である。よって、図５Ｂに示されるブロックはすべて、図５Ａのブロック５０５において実行されてもよいプロセスの例である。ここで、セットアップ・プロセスは、再生環境データの受領をもって始まる（ブロック５２０）。再生環境データは、再生スピーカー位置データを含んでいてもよい。再生環境データは、壁、天井などといった再生環境の境界を表わすデータを含んでいてもよい。再生環境が映画館である場合、再生環境データは映画スクリーン位置の指示をも含んでいてもよい。

【0059】

再生環境データは、出力チャネルの、再生環境の再生スピーカーとの相関を示すデータをも含んでいてもよい。たとえば、再生環境は、図２に示され、上記したドルビー・サラウンド７．１配位を有していてもよい。よって、再生環境データは、Lssチャネルと左側方サラウンド・スピーカー２２０との間、Lrsチャネルと左後方サラウンド・スピーカー２２４との間などの相関を示すデータをも含んでいてもよい。

【0060】

この例では、ブロック５２５は、再生環境データに従って仮想源位置６０５を定義することに関わる。仮想源位置６０５は仮想源体積内で定義されてもよい。いくつかの実装では、仮想源体積は、オーディオ・オブジェクトがその中で動くことのできる体積と対応していてもよい。図６Ａおよび６Ｂに示されるように、いくつかの実装では、仮想源体積６０２は再生環境６００の体積と同じ広がりであってもよいが、一方、他の実装では、仮想源位置６０５の少なくとも一部が再生環境６００の外の位置に対応していてもよい。

【0061】

さらに、仮想源位置６０５は、具体的な実装に依存して、仮想源体積６０２内で一様に離間されていてもいなくてもよい。いくつかの実装では、仮想源位置６０５は、すべての方向において一様に離間されていてもよい。たとえば、仮想源位置６０５は、N_xかけるN_yかけるN_zの仮想源位置６０５の長方形格子を形成してもよい。いくつかの実装では、Nの値は5ないし100の範囲であってもよい。Nの値は少なくとも部分的には、再生環境中の再生スピーカーの数に依存してもよい：各再生スピーカー位置の間に二つ以上の仮想源位置６０５を含めることが望ましいことがある。

【0062】

他の実装では、仮想源位置６０５は、x軸およびy軸に沿った第一の一様な離間およびz軸に沿った第二の一様な離間を有していてもよい。仮想源位置６０５は、N_xかけるN_yかけるM_zの仮想源位置６０５の長方形格子を形成してもよい。たとえば、いくつかの実装では、x軸またはy軸に沿ってよりも、z軸に沿ってより少数の仮想源位置６０５があってもよい。いくつかのそのような実装では、Nの値は10ないし100の範囲であってもよく、一方、Mの値は5ないし10の範囲であってもよい。

【0063】

この例では、ブロック５３０は、仮想源位置６０５のそれぞれについて仮想源利得値を計算することに関わる。いくつかの実装では、ブロック５３０は、各仮想源位置６０５について、再生環境の複数の出力チャネルの各チャネルについて仮想源利得値を計算することに関わる。いくつかの実装では、ブロック５３０は、各仮想源位置６０５に位置される点源についての利得値を計算するために、ベクトル・ベースの振幅パン（VBAP: vector-based amplitude panning）アルゴリズム、対ごとのパン・アルゴリズム（pairwise panning algorithm）または同様のアルゴリズムを適用することに関わっていてもよい。他の実装では、ブロック５３０は、各仮想源位置６０５に位置される点源についての利得値を計算するために、分離可能なアルゴリズムを適用することに関わっていてもよい。本稿での用法では、「分離可能な」アルゴリズムは、所与のスピーカーの利得が、仮想源位置の各座標について別個に計算されうる二つ以上の因子の積として表現できるものである。例は、Pro Tools（商標）ソフトウェアおよびAMS Neveによって提供されるデジタル・フィルム・コンソールにおいて実装されるパンナーを含むがそれに限られないさまざまな既存のミキシング・コンソール・パンナーにおいて実装されるアルゴリズムを含む。いくつかの二次元の例を後に与える。

【0064】

図６Ｃ～６Ｆは、種々の位置におけるオーディオ・オブジェクトへの近距離場および遠距離場パン技法の適用の例を示している。まず図６Ｃを参照するに、オーディオ・オブジェクトは実質的に仮想再生環境４００ａの外である。したがって、一つまたは複数の遠距離場パン方法がこの例では適用される。いくつかの実装では、遠距離場パン方法は、当業者に既知のベクトル・ベースの振幅パン（VBAP: vector-based amplitude panning）の式に基づいていてもよい。たとえば、遠距離場パン方法は、ここに参照によって組み込まれる非特許文献１のp.4、Section 2.3に記載されるVBAPの式に基づいていてもよい。代替的な実装では、遠距離場および近距離場のオーディオ・オブジェクトをパンするために他の方法、たとえば対応する音響平面または球面波の合成に関わる方法が使用されてもよい。ここに参照によって組み込まれる非特許文献２が関連する方法を記述している。

【0065】

ここで図６Ｄを参照するに、オーディオ・オブジェクト６１０は仮想再生環境４００ａの内部である。したがって、一つまたは複数の近距離場パン方法がこの例では適用される。いくつかのそのような近距離場パン方法は、仮想再生環境４００ａ内のオーディオ・オブジェクト６１０を囲むいくつかのスピーカー・ゾーンを使う。

【0066】

図６Ｇは、1に等しい辺長をもつ正方形の各隅に一つのスピーカーをもつ再生環境の例を示している。この例では、x-y軸の原点(0,0)は左（L）スクリーン・スピーカー１３０と一致する。よって、右（R）スクリーン・スピーカー１４０は座標(1,0)をもち、左サラウンド（Ls）スピーカー１２０は座標(0,1)をもち、右サラウンド（Rs）スピーカー１２５は座標(1,1)をもつ。オーディオ・オブジェクト位置６１５(x,y)はLスピーカーよりx単位右、スクリーン１５０よりy単位のところである。この例では、四つのスピーカーのそれぞれは、x軸およびy軸に沿ってそれらの距離に比例する因子cos/sinを受領する。いくつかの実装によれば、利得は次のようにして計算されてもよい。

【0067】

G_l(x)＝cos(pi/2*x) l＝L,Lsの場合
G_l(x)＝sin(pi/2*x) l＝R,Rsの場合
G_l(x)＝cos(pi/2*y) l＝L,Rの場合
G_l(x)＝sin(pi/2*y) l＝Ls,Rsの場合
。

【0068】

全体的な利得は積：G_l(x,y)＝G_l(x)G_l(y)となる。一般に、これらの関数はすべてのスピーカーのすべての座標に依存する。しかしながら、G_l(x)は源のy位置に依存せず、G_l(y)はそのx位置に依存しない。簡単な計算を例解するために、オーディオ・オブジェクト位置６１５が(0,0)、つまりLスピーカーの位置であるとする。G_L(x)＝cos(0)＝1であり、G_L(y)＝cos(0)＝1である。全体的な利得は積G_L(x,y)＝G_L(x)G_L(y)＝1となる。同様の計算によりG_Ls＝G_Rs＝G_R＝0が得られる。

【0069】

オーディオ・オブジェクトが仮想再生環境４００ａにはいるまたは仮想再生環境４００ａを出る際に異なるパン・モードの間でブレンドすることが望ましいことがある。たとえば、オーディオ・オブジェクト６１０が図６Ｃに示されるオーディオ・オブジェクト位置６１５から図６Ｄに示されるオーディオ・オブジェクト位置６１５にまたはその逆に動くとき、近距離場パン方法および遠距離場パン方法に従って計算された利得のブレンドが適用されてもよい。いくつかの実装では、対ごとのパン則（pair-wise panning law）（たとえばエネルギーを保存する正弦または冪乗則）が、近距離場パン方法および遠距離場パン方法に従って計算された利得の間でブレンドするために使われてもよい。代替的な実装では、ペアごとのパン則は、エネルギーを保存するのではなく、振幅を保存してもよい。よって、平方和が1に等しくなるのではなく、和が1に等しくなる。たとえば両方のパン方法を独立に使ってオーディオ信号を処理し、二つの結果として得られるオーディオ信号をクロスフェードするよう、結果的な処理された信号をブレンドすることも可能である。

【0070】

ここで図５Ｂに戻ると、ブロック５３０において使われるアルゴリズムによらず、結果として得られる利得値は、ランタイム動作の間に使うために、メモリ・システムに記憶されてもよい（ブロック５３５）。

【0071】

図５Ｃは、仮想源位置についての事前計算された利得値に従って、受領されたオーディオ・オブジェクトについての利得値を計算するランタイム・プロセスの例を与える流れ図である。図５Ｃに示されるブロックのすべては、図５Ａのブロック５１０において実行されてもよいプロセスの例である。

【0072】

この例では、ランタイム・プロセスは、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データの受領とともに始まる（ブロック５４０）オーディオ・オブジェクトはオーディオ信号と、この例では少なくともオーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む関連するメタデータとを含む。図６Ａを参照するに、たとえば、オーディオ・オブジェクト６１０は、少なくとも部分的には、オーディオ・オブジェクト位置６１５およびオーディオ・オブジェクト体積６２０ａによって定義される。この例では、受領されるオーディオ・オブジェクト・サイズ・データは、オーディオ・オブジェクト体積６２０ａが直方体の体積に対応することを示す。しかしながら、図６Ｂに示される例では、受領されるオーディオ・オブジェクト・サイズ・データはオーディオ・オブジェクト体積６２０ｂが球の体積に対応することを示す。これらのサイズおよび形状は単に例である。代替的な実装では、オーディオ・オブジェクトは多様な他のサイズおよび／または形状を有していてもよい。いくつかの代替的な例では、オーディオ・オブジェクトの領域または体積は、長方形、円、楕円、楕円体または球扇形であってもよい。

【0073】

この実装では、ブロック５４５は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域または体積内の仮想源からの寄与を計算することに関わる。図６Ａおよび６Ｂに示される例では、ブロック５４５は、オーディオ・オブジェクト体積６２０ａまたはオーディオ・オブジェクト体積６２０ｂ内である仮想源位置６０５における仮想源からの寄与を計算することに関わっていてもよい。オーディオ・オブジェクトのメタデータが時間的に変化する場合、ブロック５４５は新たなメタデータ値に従って再び実行されてもよい。たとえば、オーディオ・オブジェクト・サイズおよび／またはオーディオ・オブジェクト位置が変化する場合、異なる仮想源位置６０５がオーディオ・オブジェクト体積６２０内にはいることがあり、および／または以前の計算において使われた仮想オブジェクト位置６０５がオーディオ・オブジェクト位置６１５から異なる距離であることがある。ブロック５４５では、新たなオブジェクト・サイズおよび／または位置に従って対応する仮想源寄与が計算される。

【0074】

いくつかの例では、ブロック５４５は、メモリ・システムから、オーディオ・オブジェクト位置およびサイズに対応する仮想源位置についての計算された仮想源利得値を取り出し、計算された仮想源利得値の間を補間することに関わっていてもよい。計算された仮想源利得値の間を補間するプロセスは、オーディオ・オブジェクト位置の近くの複数の近隣の仮想源位置を決定し、前記近隣の仮想源位置のそれぞれについて、計算された仮想源利得値を決定し、前記オーディオ・オブジェクト位置と前記近隣の仮想源位置のそれぞれとの間の複数の距離を決定し、前記複数の距離に従って、計算された仮想源利得値の間を補間することに関わっていてもよい。

【0075】

仮想源からの寄与を計算するプロセスは、オーディオ・オブジェクトのサイズによって定義される領域または体積内の仮想源位置について、計算された仮想源利得値の重み付けされた平均を計算することに関わっていてもよい。重み付けされた平均のための重みはたとえば、オーディオ・オブジェクトの位置、オーディオ・オブジェクトのサイズおよび前記領域または体積内の各仮想源位置に依存してもよい。

【0076】

図７は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義された領域内の仮想源からの寄与の例を示している。図７は、オーディオ環境２００ａの、z軸に垂直に取った断面を描いている。よって、図７は、z軸に沿ってオーディオ環境２００ａを見下ろす観察者の視点から描かれている。この例では、オーディオ環境２００ａは、図２に示され、上記したドルビー・サラウンド７．１配位を有する映画館サウンド・システム環境である。よって、再生環境２００ａは、左側方サラウンド・スピーカー２２０、左後方サラウンド・スピーカー２２４、右側方サラウンド・スピーカー２２５、右後方サラウンド・スピーカー２２６、左スクリーン・チャネル２３０、中央スクリーン・チャネル２３５、右スクリーン・チャネル２４０およびサブウーファー２４５を含む。

【0077】

オーディオ・オブジェクト６１０は、オーディオ・オブジェクト体積６２０ｂによって示されるサイズをもつ。該体積の長方形の断面領域が図７に示されている。図７に描かれる時点でのオーディオ・オブジェクト位置６１５を与えられると、xy平面においてオーディオ・オブジェクト体積６２０ｂによって包含される領域には12個の仮想源位置６０５が含まれる。z方向におけるオーディオ・オブジェクト体積６２０ｂの広がりおよびz軸に沿った仮想源位置６０５の間隔に依存して、追加的な仮想源位置６０５がオーディオ・オブジェクト体積６２０ｂ内に包含されてもされなくてもよい。

【0078】

図７は、オーディオ・オブジェクト６１０のサイズによって定義される領域または体積内の仮想源位置６０５からの寄与を示している。この例では、仮想源位置６０５のそれぞれを描くために使われる円の直径が、対応する仮想源位置６０５からの寄与と対応する。オーディオ・オブジェクト位置６１５に最も近い諸仮想源位置６０５ａが最も大きく示されており、対応する仮想源からの最大の寄与を示している。二番目に大きい寄与は、オーディオ・オブジェクト位置６１５に二番目に近い仮想源位置６０５ｂにある仮想源からのものである。オーディオ・オブジェクト位置６１５からさらに遠いがそれでもオーディオ・オブジェクト体積６２０ｂ内にある仮想源位置６０５ｃによって、より小さな寄与がなされる。オーディオ・オブジェクト体積６２０ｂの外にある仮想源位置６０５ｄは最も小さく示されている。そのことは、この例では、対応する仮想源が寄与をしないことを示す。

【0079】

図５Ｃを参照するに、この例では、ブロック５５０は、少なくとも部分的には計算された寄与に基づいて、複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算することに関わる。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。ブロック５５０は、結果として得られるオーディオ・オブジェクト利得値を規格化することに関わっていてもよい。図７に示される実装のためには、たとえば、各出力チャネルは単一のスピーカーまたはスピーカーの群に対応してもよい。

【0080】

前記複数の出力チャネルのそれぞれについてオーディオ・オブジェクト利得値を計算するプロセスは、位置x_o,y_o,z_oにおいてレンダリングされるサイズ（s）のオーディオ・オブジェクトについて利得値（g_l ^size(x_o,y_o,z_o;s)）を決定することに関わっていてもよい。このオーディオ・オブジェクト利得値は本稿では時に「オーディオ・オブジェクト・サイズ寄与」と称されることがある。いくつかの実装によれば、オーディオ・オブジェクト利得値（g_l ^size(x_o,y_o,z_o;s)）は次式のように表現されてもよい。

【0081】

【数2】

式(2)において、(x_vs,y_vs,z_vs)は仮想源位置を表わし、g_l(x_vs,y_vs,z_vs)は仮想源位置x_vs,y_vs,z_vsについてのチャネルlについての利得値を表わし、w(x_vs,y_vs,z_vs;x_o,y_o,z_o;s)は、少なくとも部分的には、オーディオ・オブジェクトの位置(x_o,y_o,z_o)、オーディオ・オブジェクトのサイズ（s）および仮想源位置(x_vs,y_vs,z_vs)に基づいて決定されるg_l(x_vs,y_vs,z_vs)についての重みを表わす。

【0082】

いくつかの例では、指数pは1から10までの間の値を有していてもよい。いくつかの実装では、pはオーディオ・オブジェクト・サイズsの関数であってもよい。たとえば、sが相対的により大きい場合、いくつかの実装では、pは相対的により小さくなってもよい。いくつかのそのような実装によれば、pは次のように決定されてもよい。

【0083】

p＝6 s≦0.5の場合
p＝6＋(－4)(s－0.5)/(s_max－0.5) s＞0.5の場合
ここで、s_maxは内部的なスケールアップされたサイズs_internal（後述）の最大値に対応し、オーディオ・オブジェクト・サイズs＝1は、再生環境の境界の一つの長さに等しい（たとえば、再生環境の一つの壁面の長さに等しい）サイズ（たとえば直径）をもつオーディオ・オブジェクトと対応していてもよい。

【0084】

部分的には仮想源利得値を計算するために使われるアルゴリズム（単数または複数）に依存して、仮想源位置がある軸に沿って一様に分布している場合および重み関数および利得関数がたとえば上記のように分離可能である場合、式(2)を単純化することが可能であることがある。これらの条件が満たされる場合には、g_l(x_vs,y_vs,z_vs)はg_lx(x_vs)g_ly(y_vs)g_lz(z_vs)と表現されてもよい。ここで、g_lx(x_vs)、g_ly(y_vs)およびg_lz(z_vs)は仮想源の位置についてのx、yおよびz座標の独立な利得関数を表わす。

【0085】

同様に、w(x_vs,y_vs,z_vs;x_o,y_o,z_o;s)はw_x(x_vs;x_o;s)w_y(y_vs;y_o;s)w_z(z_vs;z_o;s)と因子分解されてもよい。ここで、w_x(x_vs;x_o;s)、w_y(y_vs;y_o;s)およびw_z(z_vs;z_o;s)は仮想源の位置についてのx_、yおよびz座標の独立な重み関数を表わす。一つのそのような例が図７に示されている。この例では、w_x(x_vs;x_o;s)と表わされる重み関数７１０は、w_y(y_vs;y_o;s)と表わされる重み関数７２０から独立に計算されてもよい。いくつかの実装では、重み関数７１０および７２０はガウス関数であってもよく、一方、重み関数w_z(z_vs;z_o;s)は余弦とガウス関数の積であってもよい。

【0086】

w(x_vs,y_vs,z_vs;x_o,y_o,z_o;s)がw_x(x_vs;x_o;s)w_y(y_vs;y_o;s)w_z(z_vs;z_o;s)と因子分解できるとき、式(2)は次のように単純化される。

【0087】

【数3】

これらの関数fは、仮想源に関して必要とされる情報すべてを含んでいてもよい。可能なオブジェクト位置が各軸に沿って離散化されている場合には、各関数fを行列として表現できる。各関数fは、ブロック５０５のセットアップ・プロセス（図５Ａ参照）の間に事前計算されて、たとえば行列またはルックアップテーブルとしてメモリ・システムに記憶されてもよい。ランタイム（ブロック５１０）には、ルックアップテーブルまたは行列がメモリ・システムから取り出されてもよい。ランタイム・プロセスは、オーディオ・オブジェクトの位置およびサイズを与えられて、これらの行列の最も近い対応する値の間で補間することに関わっていてもよい。いくつかの実装では、補間は線形であってもよい。

【0088】

いくつかの実装では、オーディオ・オブジェクト・サイズ寄与g_l ^sizeは、オーディオ・オブジェクト位置についての「オーディオ・オブジェクト・ニア利得（neargain）」と組み合わされてもよい。本稿での用法では、「オーディオ・オブジェクト・ニア利得」は、オーディオ・オブジェクト位置６１５に基づく計算された利得である。利得計算は、仮想源利得値のそれぞれを計算するために使われた同じアルゴリズムを使ってなされてもよい。いくつかのそのような実装によれば、オーディオ・オブジェクト・サイズ寄与とオーディオ・オブジェクト・ニア利得結果との間で、たとえばオーディオ・オブジェクト・サイズの関数として、クロスフェード計算が実行されてもよい。そのような実装は、オーディオ・オブジェクトのなめらかなパンおよびなめらかな成長を提供してもよく、最小および最大のオーディオ・オブジェクト・サイズの間でなめらかな遷移を許容しうる。あるそのような実装では、次のようになる。

【0089】

【数4】

ここで、チルダ付きのg_l ^sizeは前に計算されたg_l ^sizeの規格化されたバージョンを表わす。いくつかのそのような実装では、s_xfade＝0.2である。しかしながら、代替的な実装では、sxfadeは他の値を有していてもよい。

【0090】

いくつかの実装によれば、オーディオ・オブジェクト・サイズ値は、その可能な値の範囲の過半な部分（the larger portion）においてスケールアップされてもよい。いくつかのオーサリング実装では、たとえば、ユーザーはオーディオ・オブジェクト・サイズ値s_user∈[0,1]を呈されてもよく、これはアルゴリズムによって使用される実際のサイズに、より大きな範囲に、たとえば範囲[0,s_max]にマッピングされる。ここで、s_max＞1である。このマッピングは、ユーザーによってサイズが最大に設定されるときに、利得が真にオブジェクトの位置とは独立になることを保証しうる。いくつかのそのような実装によれば、そのようなマッピングは、点の諸対（s_user,s_internal）を接続する区分線形関数に従ってなされてもよい。ここで、s_userはユーザー選択されたオーディオ・オブジェクト・サイズを表わし、s_internalは、アルゴリズムによって決定される対応するオーディオ・オブジェクト・サイズを表わす。いくつかのそのような実装によれば、マッピングは、点の諸対(0,0),(0.2,0.3),(0.5,0.9),(0.75,1.5)および(1,s_max)を接続する区分線形関数に従ってなされてもよい。一つのそのような実装では、s_max＝2.8である。

【0091】

図８のＡおよびＢは、オーディオ・オブジェクトを、再生環境内の二つの位置において示している。これらの例では、オーディオ・オブジェクト体積６２０ｂは、再生環境２００ａの長さまたは幅の半分未満の半径をもつ球である。再生環境２００ａは、ドルビー７．１に従って構成されている。図８のＡに描かれる時点では、オーディオ・オブジェクト位置６１５は、再生環境２００ａの中央に対して相対的により近い。図８のＢに描かれる時点では、オーディオ・オブジェクト位置６１５は、再生環境２００ａの境界近くに動いている。この例では、境界は映画館の左の壁であり、左側方サラウンド・スピーカー２２０の位置と一致する。

【0092】

審美的な理由のため、再生環境の境界に近づきつつあるオーディオ・オブジェクトについてのオーディオ・オブジェクト利得計算を修正することが望ましいことがありうる。図８のＡおよびＢではたとえば、オーディオ・オブジェクト位置６１５が再生環境の左の境界８０５からある閾値距離以内であるときは、再生環境の反対側の境界にあるスピーカー（ここでは、右側方サラウンド・スピーカー２２５）にはスピーカー・フィード信号が与えられない。図８Ｂに示した例では、オーディオ・オブジェクト位置６１５が再生環境の左の境界８０５からある閾値距離（これは異なる閾値距離であってもよい）以内であるときは、オーディオ・オブジェクト位置６１５がさらにスクリーンからある閾値距離より遠ければ、左スクリーン・チャネル２３０、中央スクリーン・チャネル２３５、右スクリーン・チャネル２４０またはサブウーファー２４５にはスピーカー・フィード信号が与えられない。

【0093】

図８のＢに示したこの例では、オーディオ・オブジェクト体積６２０ｂは左の境界８０５の外の領域または体積を含む。いくつかの実装によれば、利得計算のためのフェードアウト因子は、少なくとも部分的には、左境界８０５のうちのどのくらいがオーディオ・オブジェクト体積６２０ｂ内にあるかおよび／またはオーディオ・オブジェクトの領域または体積のうちどのくらいがそのような境界の外に広がっているかに基づいていてもよい。

【0094】

図９は、少なくとも部分的には、オーディオ・オブジェクトの領域または体積のうちどのくらいが再生環境の境界の外に広がっているかに基づいて、フェードアウト因子を決定する方法を概説する流れ図である。ブロック９０５では、再生環境データが受領される。この例では、再生環境データは、再生スピーカー位置データおよび再生環境境界データを含む。ブロック９１０は、一つまたは複数のオーディオ・オブジェクトおよび関連するメタデータを含むオーディオ再生データを受領することに関わる。メタデータは、この例では、少なくともオーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む。

【0095】

この実装では、ブロック９１５は、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別することに関わる。ブロック９１５は、オーディオ・オブジェクト領域または体積のどのくらいの割合が再生環境境界の外にあるかを決定することにも関わっていてもよい。

【0096】

ブロック９２０では、フェードアウト因子が決定される。この例では、フェードアウト因子は、少なくとも部分的には前記外側領域に基づいていてもよい。たとえば、フェードアウト因子は前記外側領域に比例してもよい。

【0097】

ブロック９２５では、少なくとも部分的には前記関連したメタデータ（この例ではオーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データ）および前記フェードアウト因子に基づいて複数の出力チャネルのそれぞれについて一組のオーディオ・オブジェクト利得値が計算されてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応していてもよい。

【0098】

いくつかの実装では、オーディオ・オブジェクト利得計算は、オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算することに関わっていてもよい。仮想源は、再生環境データを参照して定義されうる複数の仮想源位置と対応してもよい。仮想源位置は一様に離間していてもいなくてもよい。仮想源位置のそれぞれについて、前記複数の出力チャネルのそれぞれについて仮想源利得値が計算されてもよい。上記のように、いくつかの実装では、これらの仮想源利得値は、セットアップ・プロセスの間に計算され、記憶され、ランタイム動作の間に使うために取り出されてもよい。

【0099】

いくつかの実装では、フェードアウト因子（fade-out factor）は、再生環境内の諸仮想源位置に対応するすべての仮想源利得値に適用されてもよい。いくつかの実装では、g_l ^sizeは次のように修正されてもよい。

【0100】

【数5】

ここで、d_boundはオーディオ・オブジェクト位置と再生環境の境界（boundary）との間の最小距離を表わし、g_l ^boundは境界に沿った諸仮想源の寄与を表わす。たとえば、図８のＢを参照するに、g_l ^boundは、オーディオ・オブジェクト体積６２０ｂ内であり境界８０５に隣接する諸仮想源の寄与を表わしてもよい。この例では、図６Ａの例のように、再生環境の外に位置される仮想源はない。

【0101】

代替的な実装では、g_l ^sizeは次のように修正されてもよい。

【0102】

【数6】

ここで、g_l ^outsideは再生環境の外に位置するがオーディオ・オブジェクト領域または体積内である諸仮想源に基づく諸オーディオ・オブジェクト利得を表わす。たとえば、図８のＢを参照するに、g_l ^outsideはオーディオ・オブジェクト体積６２０ｂ内であり境界８０５の外である諸仮想源の寄与を表わしてもよい。この例では、図６Ｂの例と同様に、再生環境の内部および外部両方に仮想源がある。

【0103】

図１０は、オーサリングおよび／またはレンダリング装置のコンポーネントの例を与えるブロック図である。この例では、装置１０００はインターフェース・システム１００５を含む。インターフェース・システム１００５は、無線ネットワーク・インターフェースのようなネットワーク・インターフェースを含んでいてもよい。代替的または追加的に、インターフェース・システム１００５はユニバーサル・シリアル・バス（USB）インターフェースまたは他のそのようなインターフェースを含んでいてもよい。

【0104】

装置１０００は論理システム１０１０を含む。論理システム１０１０は、汎用の単一チップまたは複数チップ・プロセッサのようなプロセッサを含んでいてもよい。論理システム１０１０は、デジタル信号プロセッサ（DSP）、特定用途向け集積回路（ASIC）、フィールド・プログラマブル・ゲート・アレイ（FPGA）または他のプログラム可能型論理デバイス、離散的なゲートもしくはトランジスタ論理または離散的なハードウェア・コンポーネントまたはそれらの組み合わせを含んでいてもよい。論理システム１０１０は、装置１０００の他のコンポーネントを制御するよう構成されていてもよい。装置１０００のコンポーネントの間のインターフェースは図１０には示されていないが、論理システム１０１０は、他のコンポーネントとの通信のためのインターフェースをもつよう構成されていてもよい。他のコンポーネントは、適宜、互いとの通信のために構成されていてもいなくてもよい。

【0105】

論理システム１０１０は、本稿に記載される型のオーディオ・オーサリングおよび／またはレンダリング機能を含むがこれに限られないオーディオ・オーサリングおよび／またはレンダリング機能を実行するよう構成されていてもよい。いくつかのそのような実装では、論理システム１０１０は、（少なくとも部分的には）一つまたは複数の非一時的媒体に記憶されたソフトウェアに従って動作するよう構成されていてもよい。非一時的媒体は、ランダム・アクセス・メモリ（RAM）および／または読み出し専用メモリ（ROM）のような、論理システム１０１０に付随するメモリを含んでいてもよい。非一時的媒体は、メモリ・システム１０１５のメモリを含んでいてもよい。メモリ・システム１０１５は、フラッシュメモリ、ハードドライブなどの、一つまたは複数の好適な型の非一時的な記憶媒体を含んでいてもよい。

【0106】

表示システム１０３０は、装置１０００の具現に依存して、一つまたは複数の好適な型のディスプレイを含んでいてもよい。たとえば、表示システム１０３０は液晶ディスプレイ、プラズマ・ディスプレイ、双安定ディスプレイなどを含んでいてもよい。

【0107】

ユーザー入力システム１０３５は、ユーザーからの入力を受け入れるよう構成された一つまたは複数の装置を含んでいてもよい。いくつかの実装では、ユーザー入力システム１０３５は、表示システム１０３０のディスプレイにかぶさるタッチスクリーンを含んでいてもよい。ユーザー入力システム１０３５はマウス、トラックボール、ジェスチャー検出システム、ジョイスティック、一つまたは複数のGUIおよび／または表示システム１０３０上に呈示されるメニュー、ボタン、キーボード、スイッチなどを含んでいてもよい。いくつかの実装では、ユーザー入力システム１０３５は、マイクロホン１０２５を含んでいてもよい：ユーザーは、マイクロホン１０２５を介して装置１０００についての音声コマンドを提供してもよい。論理システムは、音声認識のために、そしてそのような音声コマンドに従って装置１０００の少なくともいくつかの動作を制御するために構成されていてもよい。

【0108】

電力システム１０４０は、ニッケル‐カドミウム電池またはリチウム・イオン電池のような一つまたは複数の好適なエネルギー蓄積装置を含んでいてもよい。電力システム１０４０は電気コンセントから電力を受領するよう構成されていてもよい。

【0109】

図１１のＡは、オーディオ・コンテンツ生成のために使用されてもよいいくつかの構成要素を表すブロック図である。システム１１００はたとえば、ミキシング・スタジオおよび／またはダビング・ステージにおけるオーディオ・コンテンツ生成のために使われてもよい。この例では、システム１１００は、オーディオおよびメタデータ・オーサリング・ツール１１０５およびレンダリング・ツール１１１０を含む。この実装では、オーディオおよびメタデータ・オーサリング・ツール１１０５およびレンダリング・ツール１１１０は、それぞれオーディオ接続インターフェース１１０７および１１１２を含み、該オーディオ接続インターフェースはAES/EBU、MADI、アナログなどを介した通信のために構成されていてもよい。オーディオおよびメタデータ・オーサリング・ツール１１０５およびレンダリング・ツール１１１０は、それぞれネットワーク・インターフェース１１０９および１１１７を含み、該ネットワーク・インターフェースはTCP/IPまたは他の任意の好適なプロトコルを介してメタデータを送受信するよう構成されていてもよい。インターフェース１１２０はオーディオ・データをスピーカーに出力するよう構成されている。

【0110】

システム１１００はたとえば、Pro Tools（商標）システムのような、プラグインとしてメタデータ生成ツール（すなわち、本稿に記載されたパン手段〔パンナー〕のような）を走らせる既存のオーサリング・システムを含んでいてもよい。パン手段は、レンダリング・ツール１１１０に接続されたスタンドアローン・システム（たとえばPCまたはミキシング・コンソール）上で走ることもでき、あるいはレンダリング・ツール１１１０と同じ物理装置上で走ることもできる。後者の場合、パン手段およびレンダラーは、たとえば共有メモリを通じた、ローカルな接続を使うことができる。パン手段GUIは、タブレット装置、ラップトップなどの上で提供されることもできる。レンダリング・ツール１１１０は、図５Ａ～Ｃおよび図９に記載されるもののようなレンダリング方法を実行するよう構成されたサウンド・プロセッサを含むレンダリング・システムを有していていもよい。レンダリング・システムはたとえば、オーディオ入出力のためのインターフェースおよび適切な論理システムを含むパーソナル・コンピュータ、ラップトップなどを含んでいてもよい。

【0111】

図１１Ｂは、再生環境（たとえば映画シアター）におけるオーディオ再生のために使用されうるいくつかのコンポーネントを表しているブロック図である。システム１１５０は、この例では、映画館サーバー１１５５およびレンダリング・システム１１６０を含む。映画館サーバー１１５５およびレンダリング・システム１１６０は、それぞれネットワーク・インターフェース１１５７および１１６２を含み、該ネットワーク・インターフェースはTCP/IPまたは他の任意の好適なプロトコルを介してオーディオ・オブジェクトを送受信するよう構成されていてもよい。インターフェース１１６４はオーディオ・データをスピーカーに出力するよう構成されている。

【0112】

本開示に記載される実装へのさまざまな修正が、当業者にはすぐに明白となりうる。本稿において定義される一般的な原理は、本開示の精神または範囲から外れることなく、他の実装に適用されてもよい。このように、特許請求の範囲は、本稿に示される実装に限定されることは意図されておらず、本稿に開示される開示、原理および新規な特徴と整合する最も広い範囲を与えられるべきものである。

【0113】

いくつかの付番実施例を記載しておく。
〔付番実施例１〕
一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領する工程であって、前記オーディオ・オブジェクトはオーディオ信号および関連するメタデータを含み、前記メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む、工程と；
前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、前記オーディオ・オブジェクト位置データおよび前記オーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する工程と；
複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を、少なくとも部分的には、計算された前記寄与に基づいて計算する工程であって、各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応する、工程とを含む、
方法。
〔付番実施例２〕
仮想源からの寄与を計算する工程は、前記オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することを含む、付番実施例１記載の方法。
〔付番実施例３〕
前記重み付けされた平均のための重みは、前記オーディオ・オブジェクトの位置、前記オーディオ・オブジェクトのサイズおよび前記オーディオ・オブジェクト領域または体積内の各仮想源位置に依存する、付番実施例２記載の方法。
〔付番実施例４〕
再生スピーカー位置データを含む再生環境データを受領する工程をさらに含む、
付番実施例１記載の方法。
〔付番実施例５〕
前記再生環境データに従って複数の仮想源位置を定義し；
各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算することを含む、
付番実施例４記載の方法。
〔付番実施例６〕
各仮想源位置は、前記再生環境内の位置に対応する、付番実施例５記載の方法。
〔付番実施例７〕
前記仮想源位置の少なくともいくつかが前記再生環境の外の位置に対応する、付番実施例５記載の方法。
〔付番実施例８〕
前記仮想源位置はx、y、z軸に沿って一様に離間されている、付番実施例５記載の方法。
〔付番実施例９〕
前記仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間をもつ、付番実施例５記載の方法。
〔付番実施例１０〕
前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する工程は、x、y、z軸に沿った仮想源からの寄与の独立した計算を含む、付番実施例８または９記載の方法。
〔付番実施例１１〕
前記仮想源位置は非一様に離間されている、付番実施例５記載の方法。
〔付番実施例１２〕
前記複数の出力チャネルのそれぞれについてのオーディオ・オブジェクト利得値を計算する工程は、位置x_o,y_o,z_oにおいてレンダリングされるべきサイズ（s）のオーディオ・オブジェクトについての利得値（g_l(x_o,y_o,z_o;s)）を決定することを含み、利得値（g_l(x_o,y_o,z_o;s)）は

【数7】

と表わされ、(x_vs,y_vs,z_vs)は仮想源位置を表わし、g_l(x_vs,y_vs,z_vs)は仮想源位置x_vs,y_vs,z_vsについてのチャネルlについての利得値を表わし、w(x_vs,y_vs,z_vs;x_o,y_o,z_o;s)は、少なくとも部分的には、前記オーディオ・オブジェクトの位置(x_o,y_o,z_o)、前記オーディオ・オブジェクトのサイズ（s）および前記仮想源位置(x_vs,y_vs,z_vs)に基づいて決定されるg_l(x_vs,y_vs,z_vs)についての一つまたは複数の重み関数を表わす、付番実施例５記載の方法。
〔付番実施例１３〕
g_l(x_vs,y_vs,z_vs)＝g_l(x_vs)g_l(y_vs)g_l(z_vs)であり、ここで、g_l(x_vs)、g_l(y_vs)およびg_l(z_vs)はx、yおよびzの独立な利得関数を表わす、付番実施例１２記載の方法。
〔付番実施例１４〕
前記重み関数は
w(x_vs,y_vs,z_vs;x_o,y_o,z_o;s)＝w_x(x_vs;x_o;s)w_y(y_vs;y_o;s)w_z(z_vs;z_o;s)
と因子分解され、w_x(x_vs;x_o;s)、w_y(y_vs;y_o;s)およびw_z(z_vs;z_o;s)はx_vs、y_vsおよびz_vsの独立な重み関数を表わす、付番実施例１２記載の方法。
〔付番実施例１５〕
pはオーディオ・オブジェクト・サイズ（s）の関数である、付番実施例１２記載の方法。
〔付番実施例１６〕
計算された仮想源利得値をメモリ・システムに記憶する工程をさらに含む、付番実施例４記載の方法。
〔付番実施例１７〕
前記オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する工程は：
前記メモリ・システムから、オーディオ・オブジェクト位置およびサイズに対応する計算された仮想源利得値を取り出し；
計算された仮想源利得値の間を補間することを含む、
付番実施例１６記載の方法。
〔付番実施例１８〕
計算された仮想源利得値の間を補間する工程は：
前記オーディオ・オブジェクト位置の近くの複数の近隣の仮想源位置を決定し；
前記近隣の仮想源位置のそれぞれについて、計算された仮想源利得値を決定し；
前記オーディオ・オブジェクト位置と前記近隣の仮想源位置のそれぞれとの間の複数の距離を決定し；
前記複数の距離に従って、計算された仮想源利得値の間を補間することを含む、
付番実施例１７記載の方法。
〔付番実施例１９〕
前記オーディオ・オブジェクト領域または体積は、長方形、直方体、円、球、楕円または楕円体のうちの少なくとも一つである、付番実施例１記載の方法。
〔付番実施例２０〕
前記再生環境は映画館サウンド・システム環境である、付番実施例１記載の方法。
〔付番実施例２１〕
前記オーディオ再生データの少なくとも一部を脱相関する工程をさらに含む、付番実施例１記載の方法。
〔付番実施例２２〕
ある閾値を超えるオーディオ・オブジェクト・サイズをもつオーディオ・オブジェクトについてのオーディオ再生データを脱相関する工程をさらに含む、付番実施例１記載の方法。
〔付番実施例２３〕
前記再生環境データは再生環境境界データを含み、
前記オーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別する工程と；
少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を適用する工程とをさらに含む、
付番実施例１記載の方法。
〔付番実施例２４〕
オーディオ・オブジェクトがある再生環境境界から閾値距離以内であることを判別することと；
前記再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないことをさらに含む、
付番実施例２３記載の方法。
〔付番実施例２５〕
再生スピーカー位置データおよび再生環境境界データを含む再生環境データを受領する工程と；
一つまたは複数のオーディオ・オブジェクトおよび関連したメタデータを含むオーディオ再生データを受領する工程であって、前記メタデータは、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む、工程と；
前記オーディオ・オブジェクト位置データおよび前記オーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積が再生環境境界の外の外側領域または体積を含むことを判別する工程と；
少なくとも部分的には前記外側領域または体積に基づいてフェードアウト因子を決定する工程と；
少なくとも部分的には前記関連したメタデータおよび前記フェードアウト因子に基づいて複数の出力チャネルのそれぞれについて一組の利得値を計算する工程であって、各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応する、工程とを含む、
方法。
〔付番実施例２６〕
前記フェードアウト因子が前記外側領域に比例する、付番実施例２５記載の方法。
〔付番実施例２７〕
オーディオ・オブジェクトがある再生環境境界から閾値距離以内であることを判別することと；
前記再生環境の向かい側の境界上の再生スピーカーにスピーカー・フィード信号を与えないこととを含む、
付番実施例２５記載の方法。
〔付番実施例２８〕
前記オーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する工程をさらに含む、
付番実施例２５記載の方法。
〔付番実施例２９〕
前記再生環境データに従って複数の仮想源位置を定義する工程と；
前記仮想源位置のそれぞれについて、複数の出力チャネルのそれぞれについての仮想源利得を計算する工程とをさらに含む、
付番実施例２８記載の方法。
〔付番実施例３０〕
前記仮想源位置は一様に離間されている、付番実施例２９記載の方法。
〔付番実施例３１〕
ソフトウェアが記憶されている非一時的媒体であって、前記ソフトウェアは：
一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領する動作であって、前記オーディオ・オブジェクトは、オーディオ信号および関連したメタデータを含み、前記メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む、動作と；
前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、前記オーディオ・オブジェクト位置データおよび前記オーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する動作と；
少なくとも部分的には計算された前記寄与に基づいて複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する動作であって、各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応する、動作とを実行するよう少なくとも一つの装置を制御するための命令を含む、
非一時的媒体。
〔付番実施例３２〕
仮想源からの寄与を計算する工程は、前記オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することを含む、付番実施例３１記載の非一時的媒体。
〔付番実施例３３〕
前記重み付けされた平均のための重みは、前記オーディオ・オブジェクトの位置、前記オーディオ・オブジェクトのサイズおよび／または前記オーディオ・オブジェクト領域または体積内の各仮想源位置に依存する、付番実施例３２記載の非一時的媒体。
〔付番実施例３４〕
前記ソフトウェアは、再生スピーカー位置データを含む再生環境データを受領するための命令を含む、付番実施例３１記載の非一時的媒体。
〔付番実施例３５〕
前記ソフトウェアは：
前記再生環境データに従って複数の仮想源位置を定義し；
各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算するための命令を含む、
付番実施例３４記載の非一時的媒体。
〔付番実施例３６〕
各仮想源位置は、前記再生環境内の位置に対応する、付番実施例３５記載の非一時的媒体。
〔付番実施例３７〕
前記仮想源位置の少なくともいくつかは、前記再生環境の外の位置に対応する、付番実施例３６記載の非一時的媒体。
〔付番実施例３８〕
前記仮想源位置はx、y、z軸に沿って一様に離間されている、付番実施例３５記載の非一時的媒体。
〔付番実施例３９〕
前記仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間をもつ、付番実施例３５記載の非一時的媒体。
〔付番実施例４０〕
前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する工程は、x、y、z軸に沿った仮想源からの寄与の独立した計算を含む、付番実施例３８または３９記載の非一時的媒体。
〔付番実施例４１〕
インターフェース・システムおよび論理システムを有する装置であって、
前記論理システムは：
前記インターフェース・システムから、一つまたは複数のオーディオ・オブジェクトを含むオーディオ再生データを受領する工程であって、前記オーディオ・オブジェクトは、オーディオ信号および関連したメタデータを含み、前記メタデータは、少なくとも、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データを含む、工程と；
前記一つまたは複数のオーディオ・オブジェクトからのオーディオ・オブジェクトについて、前記オーディオ・オブジェクト位置データおよび前記オーディオ・オブジェクト・サイズ・データによって定義されるオーディオ・オブジェクト領域または体積内の仮想源からの寄与を計算する工程と；
少なくとも部分的には計算された前記寄与に基づいて複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する工程であって、各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応する、工程とを実行するよう適応されている、
装置。
〔付番実施例４２〕
仮想源からの寄与を計算する工程は、前記オーディオ・オブジェクト領域または体積内の仮想源からの仮想源利得値の重み付けされた平均を計算することを含む、付番実施例４１記載の装置。
〔付番実施例４３〕
前記重み付けされた平均のための重みは、前記オーディオ・オブジェクトの位置、前記オーディオ・オブジェクトのサイズおよび前記オーディオ・オブジェクト領域または体積内の各仮想源位置に依存する、付番実施例４２記載の装置。
〔付番実施例４４〕
前記論理システムは、前記インターフェース・システムから、再生スピーカー位置データを含む再生環境データを受領するよう適応されている、付番実施例４１記載の装置。
〔付番実施例４５〕
前記論理システムは：
前記再生環境データに従って複数の仮想源位置を定義し；
各仮想源位置について、前記複数の出力チャネルのそれぞれについての仮想源利得値を計算するよう適応されている、
付番実施例４４記載の装置。
〔付番実施例４６〕
各仮想源位置は、前記再生環境内の位置に対応する、付番実施例４５記載の装置。
〔付番実施例４７〕
前記仮想源位置の少なくともいくつかは、前記再生環境の外の位置に対応する、付番実施例４５記載の装置。
〔付番実施例４８〕
前記仮想源位置はx、y、z軸に沿って一様に離間されている、付番実施例４５記載の装置。
〔付番実施例４９〕
前記仮想源位置は、x軸およびy軸に沿っての第一の一様な離間と、z軸に沿っての第二の一様な離間をもつ、付番実施例４５記載の装置。
〔付番実施例５０〕
前記複数の出力チャネルのそれぞれについての一組のオーディオ・オブジェクト利得値を計算する工程は、x、y、z軸に沿った仮想源からの寄与の独立した計算を含む、付番実施例４８または４９記載の装置。
〔付番実施例５１〕
メモリ・デバイスをさらに有しており、前記インターフェース・システムが、前記論理システムと前記メモリ・デバイスとの間のインターフェースを有する、付番実施例５１記載の装置。
〔付番実施例５２〕
前記インターフェース・システムがネットワーク・インターフェースを有する、付番実施例５１記載の装置。
〔付番実施例５３〕
ユーザー・インターフェースをさらに有しており、前記論理システムは、前記ユーザー・インターフェースを介して、入力オーディオ・オブジェクト・サイズ・データを含むがそれに限定されないユーザー入力を受領するよう適応されている、付番実施例５１記載の装置。
〔付番実施例５４〕
前記論理システムは、前記入力オーディオ・オブジェクト・サイズ・データをスケーリングするよう適応されている、付番実施例５３記載の装置。

【図1】