特表2022-543728 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ オキュラス　ブイアール，エルエルシーの特許一覧

特表2022-543728オペレーティングシステムのためのオーディオサービス設計

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-10-14

(54)【発明の名称】オペレーティングシステムのためのオーディオサービス設計

(51)【国際特許分類】

H04S 7/00 20060101AFI20221006BHJP

G06F 3/01 20060101ALI20221006BHJP

【ＦＩ】

H04S7/00 300

H04S7/00 340

H04S7/00 360

G06F3/01 510

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2021572866

(86)(22)【出願日】2020-07-29

(85)【翻訳文提出日】2022-02-04

(86)【国際出願番号】 US2020043923

(87)【国際公開番号】W WO2021030051

(87)【国際公開日】2021-02-18

(31)【優先権主張番号】16/538,638

(32)【優先日】2019-08-12

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＢＬＵＥＴＯＯＴＨ

(71)【出願人】

【識別番号】515046968

【氏名又は名称】メタプラットフォームズテクノロジーズ，リミテッドライアビリティカンパニー

【氏名又は名称原語表記】ＭＥＴＡＰＬＡＴＦＯＲＭＳＴＥＣＨＮＯＬＯＧＩＥＳ，ＬＬＣ

(74)【代理人】

【識別番号】110002974

【氏名又は名称】弁理士法人ＷｏｒｌｄＩＰ

(72)【発明者】

【氏名】サレム，マークイハーブ

(72)【発明者】

【氏名】カマット，スミット

【テーマコード（参考）】

5D162

5E555

【Ｆターム（参考）】

5D162AA13

5D162CA26

5D162CC06

5D162CC18

5D162CC19

5D162CC36

5D162CD01

5D162CD07

5D162CD25

5D162DA02

5D162DA16

5D162EG02

5D162EG06

5D162EG08

5E555AA64

5E555BA17

5E555BA38

5E555BA88

5E555BB16

5E555BB38

5E555BC13

5E555CA41

5E555FA00

(57)【要約】

１つの実施形態において、コンピューティングデバイス上で実行しているオーディオサービスは、１つまたは複数のアプリケーションから、いくつかの世界固定オーディオオブジェクトを受信することであって、世界固定オーディオオブジェクトの各々は、三次元環境内の座標と関連付けられる、受信することと、世界固定オーディオオブジェクトの第１のサブセットおよび世界固定オーディオオブジェクトの第２のサブセットを識別することであって、第１のサブセットはいくつかの世界固定オーディオオブジェクトを含み、第２のサブセットは、第１のサブセットから除外されている世界固定オーディオオブジェクトのうちの１つまたは複数を含む、世界固定オーディオオブジェクトの第１のサブセットおよび世界固定オーディオオブジェクトの第２のサブセットを識別することと、世界固定オーディオオブジェクトの第２のサブセットおよび世界固定オーディオオブジェクトの関連する座標に基づいて、球面調和オブジェクトを生成することと、同時出力のためにオーディオをレンダリングするように構成されたオーディオドライバに、世界固定オーディオオブジェクトの第１のサブセットおよび球面調和オブジェクトと関連付けられるデータを送信することとを含む、方法を実施する。
【選択図】図２

【特許請求の範囲】

【請求項1】

コンピューティングデバイス上で実行しているオーディオサービスによって、
１つまたは複数のアプリケーションから、いくつかの世界固定オーディオオブジェクトを受信することであって、前記世界固定オーディオオブジェクトの各々は、三次元環境内の座標と関連付けられる、受信することと、
前記世界固定オーディオオブジェクトの第１のサブセットおよび前記世界固定オーディオオブジェクトの第２のサブセットを識別することであって、前記第１のサブセットはいくつかの世界固定オーディオオブジェクトを含み、前記第２のサブセットは、前記第１のサブセットから除外されている前記世界固定オーディオオブジェクトのうちの１つまたは複数を含む、前記世界固定オーディオオブジェクトの第１のサブセットおよび前記世界固定オーディオオブジェクトの第２のサブセットを識別することと、
前記世界固定オーディオオブジェクトの第２のサブセットおよび前記世界固定オーディオオブジェクトの関連する座標に基づいて、球面調和オブジェクトを生成することと、
同時出力のためにオーディオをレンダリングするように構成されたオーディオドライバに、前記世界固定オーディオオブジェクトの第１のサブセットおよび前記球面調和オブジェクトと関連付けられるデータを送信することと
を含む、方法。

【請求項2】

前記球面調和オブジェクトを前記生成することは、ヘッドセット関連伝達関数、前記三次元環境に対するユーザのロケーション、または姿勢のうちの少なくとも１つにさらに基づく、請求項１に記載の方法。

【請求項3】

前記三次元環境内の前記座標は、オーディオ源ロケーションを規定する、請求項１または２に記載の方法。

【請求項4】

前記世界固定オーディオオブジェクトの第１のサブセットと関連付けられる前記データは、直接伝播インパルス応答、残響インパルス応答、およびモノラルオーディオストリームを含み、前記方法は、好ましくは、
ヘッドセット関連伝達関数、前記三次元環境に対するユーザのロケーション、または姿勢のうちの少なくとも１つに基づいて、前記直接伝播インパルス応答および前記残響インパルス応答を生成することをさらに含み、好ましくは、前記直接伝播インパルス応答および前記残響インパルス応答を前記生成することは、前記三次元環境の少なくとも一部分の三次元モデルにさらに基づく、請求項１から３のいずれか一項に記載の方法。

【請求項5】

前記方法は、１つまたは複数の追加の球面調和オブジェクトを受信することをさらに含み、
前記球面調和オブジェクトを前記生成することは、前記１つまたは複数の追加の球面調和オブジェクトにさらに基づく、請求項１から４のいずれか一項に記載の方法。

【請求項6】

前記方法は、１つまたは複数の頭部固定オーディオオブジェクトを受信することをさらに含み、
前記世界固定オーディオオブジェクトの第１のサブセットおよび前記球面調和オブジェクトと関連付けられる前記データは、前記１つまたは複数の頭部固定オーディオオブジェクトとさらに関連付けられる、請求項１から５のいずれか一項に記載の方法。

【請求項7】

前記コンピューティングデバイスのオペレーティングシステムは、前記オーディオサービスを備える、請求項１から６のいずれか一項に記載の方法。

【請求項8】

前記１つまたは複数のアプリケーションおよび前記オーディオドライバは各々、同期クロック基準に結合される、請求項１から７のいずれか一項に記載の方法。

【請求項9】

ソフトウェアを具現化する１つまたは複数のコンピュータ可読非一時的記憶媒体であって、前記ソフトウェアは、クライアントデバイスによって実行されると、
１つまたは複数のアプリケーションから、いくつかの世界固定オーディオオブジェクトを受信することであって、前記世界固定オーディオオブジェクトの各々は、三次元環境内の座標と関連付けられる、受信することと、
前記世界固定オーディオオブジェクトの第１のサブセットおよび前記世界固定オーディオオブジェクトの第２のサブセットを識別することであって、前記第１のサブセットはいくつかの世界固定オーディオオブジェクトを含み、前記第２のサブセットは、前記第１のサブセットから除外されている前記世界固定オーディオオブジェクトのうちの１つまたは複数を含む、前記世界固定オーディオオブジェクトの第１のサブセットおよび前記世界固定オーディオオブジェクトの第２のサブセットを識別することと、
前記世界固定オーディオオブジェクトの第２のサブセットおよび前記世界固定オーディオオブジェクトの関連する座標に基づいて、球面調和オブジェクトを生成することと、
出力のためにオーディオをレンダリングするように構成されたオーディオドライバに、前記世界固定オーディオオブジェクトの第１のサブセットおよび前記球面調和オブジェクトと関連付けられるデータを送信することと
を行うように動作可能である、１つまたは複数のコンピュータ可読非一時的記憶媒体。

【請求項10】

前記三次元環境内の前記座標は、オーディオ源ロケーションを規定する、請求項９に記載の媒体。

【請求項11】

前記世界固定オーディオオブジェクトの第１のサブセットと関連付けられる前記データは、直接伝播インパルス応答、残響インパルス応答、およびモノラルオーディオストリームを含む、請求項９または１０に記載の媒体。

【請求項12】

前記ソフトウェアは、前記クライアントデバイスによって実行されると、
１つまたは複数の追加の球面調和オブジェクトを受信することを行うようにさらに動作可能であり、
前記球面調和オブジェクトを前記生成することは、前記１つまたは複数の追加の球面調和オブジェクトにさらに基づく、請求項９から１１のいずれか一項に記載の媒体。

【請求項13】

前記ソフトウェアは、前記クライアントデバイスによって実行されると、
前記世界固定オーディオオブジェクトと同時に出力される１つまたは複数の頭部固定オーディオオブジェクトを受信することを行うようにさらに動作可能であり、
前記世界固定オーディオオブジェクトの第１のサブセットおよび前記球面調和オブジェクトと関連付けられる前記データは、前記１つまたは複数の頭部固定オーディオオブジェクトとさらに関連付けられる、請求項９から１２のいずれか一項に記載の媒体。

【請求項14】

クライアントデバイスであって、
１つまたは複数のプロセッサと、
前記１つまたは複数のプロセッサのうちの１つまたは複数に結合されており、命令を含む１つまたは複数のコンピュータ可読非一時的記憶媒体と
を備え、前記命令は、前記１つまたは複数のプロセッサのうちの１つまたは複数によって実行されると、前記クライアントデバイスに、
１つまたは複数のアプリケーションから、いくつかの世界固定オーディオオブジェクトを受信することであって、前記世界固定オーディオオブジェクトの各々は、三次元環境内の座標と関連付けられる、受信することと、
前記世界固定オーディオオブジェクトの第１のサブセットおよび前記世界固定オーディオオブジェクトの第２のサブセットを識別することであって、前記第１のサブセットはいくつかの世界固定オーディオオブジェクトを含み、前記第２のサブセットは、前記第１のサブセットから除外されている前記世界固定オーディオオブジェクトのうちの１つまたは複数を含む、前記世界固定オーディオオブジェクトの第１のサブセットおよび前記世界固定オーディオオブジェクトの第２のサブセットを識別することと、
前記世界固定オーディオオブジェクトの第２のサブセットおよび前記世界固定オーディオオブジェクトの関連する座標に基づいて、球面調和オブジェクトを生成することと、
出力のためにオーディオをレンダリングするように構成されたオーディオドライバに、前記世界固定オーディオオブジェクトの第１のサブセットおよび前記球面調和オブジェクトと関連付けられるデータを送信することと
を行わせるように動作可能である、クライアントデバイス。

【請求項15】

前記世界固定オーディオオブジェクトの各々と関連付けられる前記三次元環境内の前記座標は、前記三次元環境内のオーディオ源ロケーションを規定し、および／または、好ましくは、前記世界固定オーディオオブジェクトの第１のサブセットと関連付けられる前記データは、直接伝播インパルス応答、残響インパルス応答、およびモノラルオーディオストリームを含み、および／または、好ましくは、前記命令は、前記１つまたは複数のプロセッサによって実行されると、
１つまたは複数の追加の球面調和オブジェクトを受信することを行うようにさらに動作可能であり、
前記球面調和オブジェクトを前記生成することは、前記１つまたは複数の追加の球面調和オブジェクトにさらに基づき、および／または、好ましくは、前記命令は、前記１つまたは複数のプロセッサによって実行されると、
１つまたは複数の頭部固定オーディオオブジェクトを受信することを行うようにさらに動作可能であり、
前記世界固定オーディオオブジェクトの第１のサブセットおよび前記球面調和オブジェクトと関連付けられる前記データは、前記１つまたは複数の頭部固定オーディオオブジェクトとさらに関連付けられる、請求項１４に記載のクライアントデバイス。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、概して、人工現実ソリューションのためのオーディオサービスアーキテクチャに関する。

【背景技術】

【0002】

人工現実ソリューションは、コンピューティングシステム（「ステージ」）と対になった人工現実デバイスを含み得る。人工現実デバイスは、限定ではなく、ヘッドセットまたは眼鏡を含み得る。ステージは、コンピュータシステムまたは任意の適切なコンピューティングデバイスであり得る。人工現実ソリューションのためのオーディオアーキテクチャは、限定ではないが、短い待ち時間、低電力消費、データプライバシ、およびデータセキュリティに対する１つまたは複数の要件と組み合わさった、オーディオ記録サポートおよびオーディオレンダリングサポートを含む、複数の制約に基づく設計を必要とし得る。例えば、人工現実デバイスは、ヘッドセットが、１回の充電でより長期間使用され、再充電の頻度を低減し、および／または、ヘッドセットの電池交換の頻度を低減することを可能にする、消費電力の低いオーディオアーキテクチャを必要とし得る。限定ではなく付加的な例において、人工現実デバイスは、１つまたは複数のドライバおよび１つまたは複数のアプリケーションへの応答待ち時間の短いオーディオアーキテクチャを必要とし得る。

【発明の概要】

【0003】

コンピューティングデバイス上で実行しているオーディオサービスによって、１つまたは複数のアプリケーションから、いくつかの世界固定オーディオオブジェクトを受信することであって、世界固定オーディオオブジェクトの各々は、三次元環境内の座標と関連付けられる、受信することと、世界固定オーディオオブジェクトの第１のサブセットおよび世界固定オーディオオブジェクトの第２のサブセットを識別することであって、第１のサブセットはいくつかの世界固定オーディオオブジェクトを含み、第２のサブセットは、第１のサブセットから除外されている世界固定オーディオオブジェクトのうちの１つまたは複数を含む、世界固定オーディオオブジェクトの第１のサブセットおよび世界固定オーディオオブジェクトの第２のサブセットを識別することと、世界固定オーディオオブジェクトの第２のサブセットおよび世界固定オーディオオブジェクトの関連する座標に基づいて、球面調和オブジェクトを生成することと、同時出力のためにオーディオをレンダリングするように構成されたオーディオドライバに、世界固定オーディオオブジェクトの第１のサブセットおよび球面調和オブジェクトと関連付けられるデータを送信することとを含む、方法が、本明細書において説明される。

【0004】

本方法の特定の実施形態において、球面調和オブジェクトを生成することは、ヘッドセット関連伝達関数、三次元環境に対するユーザのロケーション、または姿勢のうちの少なくとも１つにさらに基づく。本方法の特定の実施形態において、三次元環境内の座標は、オーディオ源ロケーションを規定する。本方法の特定の実施形態において、世界固定オーディオオブジェクトの第１のサブセットと関連付けられるデータは、直接伝播インパルス応答、残響インパルス応答、およびモノラルオーディオストリームを含む。本方法の特定の実施形態において、本方法は、ヘッドセット関連伝達関数、三次元環境に対するユーザのロケーション、または姿勢のうちの少なくとも１つに基づいて、直接伝播インパルス応答および残響インパルス応答を生成することをさらに含む。本方法の特定の実施形態において、直接伝播インパルス応答および残響インパルス応答を生成することは、三次元環境の少なくとも一部分の三次元モデルにさらに基づく。本方法の特定の実施形態において、本方法は、１つまたは複数の追加の球面調和オブジェクトを受信することをさらに含み、球面調和オブジェクトを生成することは、１つまたは複数の追加の球面調和オブジェクトにさらに基づく。本方法の特定の実施形態において、本方法は、１つまたは複数の頭部固定オーディオオブジェクトを受信することをさらに含み、世界固定オーディオオブジェクトの第１のサブセットおよび球面調和オブジェクトと関連付けられるデータは、１つまたは複数の頭部固定オーディオオブジェクトとさらに関連付けられる。本方法の特定の実施形態において、コンピューティングデバイスのオペレーティングシステムは、オーディオサービスを備える。本方法の特定の実施形態において、１つまたは複数のアプリケーションおよびオーディオドライバは各々、同期クロック基準に結合されている。

【0005】

ソフトウェアを具現化する１つまたは複数のコンピュータ可読非一時的記憶媒体であって、ソフトウェアは、クライアントデバイスによって実行されると、１つまたは複数のアプリケーションから、いくつかの世界固定オーディオオブジェクトを受信することであって、世界固定オーディオオブジェクトの各々は、三次元環境内の座標と関連付けられる、受信することと、世界固定オーディオオブジェクトの第１のサブセットおよび世界固定オーディオオブジェクトの第２のサブセットを識別することであって、第１のサブセットはいくつかの世界固定オーディオオブジェクトを含み、第２のサブセットは、第１のサブセットから除外されている世界固定オーディオオブジェクトのうちの１つまたは複数を含む、世界固定オーディオオブジェクトの第１のサブセットおよび世界固定オーディオオブジェクトの第２のサブセットを識別することと、世界固定オーディオオブジェクトの第２のサブセットおよび世界固定オーディオオブジェクトの関連する座標に基づいて、球面調和オブジェクトを生成することと、出力のためにオーディオをレンダリングするように構成されたオーディオドライバに、世界固定オーディオオブジェクトの第１のサブセットおよび球面調和オブジェクトと関連付けられるデータを送信することとを行うように動作可能である、１つまたは複数のコンピュータ可読非一時的記憶媒体が、本明細書において説明される。

【0006】

クライアントデバイスによって実行されるように動作可能であるソフトウェアを具現化する１つまたは複数のコンピュータ可読非一時的記憶媒体の特定の実施形態において、三次元環境内の座標は、オーディオ源ロケーションを規定する。クライアントデバイスによって実行されるように動作可能であるソフトウェアを具現化する１つまたは複数のコンピュータ可読非一時的記憶媒体の特定の実施形態において、世界固定オーディオオブジェクトの第１のサブセットと関連付けられるデータは、直接伝播インパルス応答、残響インパルス応答、およびモノラルオーディオストリームを含む。クライアントデバイスによって実行されるように動作可能であるソフトウェアを具現化する１つまたは複数のコンピュータ可読非一時的記憶媒体の特定の実施形態において、ソフトウェアは、クライアントデバイスによって実行されると、１つまたは複数の追加の球面調和オブジェクトを受信することを行うようにさらに動作可能であり、球面調和オブジェクトを生成することは、１つまたは複数の追加の球面調和オブジェクトにさらに基づく。クライアントデバイスによって実行されるように動作可能であるソフトウェアを具現化する１つまたは複数のコンピュータ可読非一時的記憶媒体の特定の実施形態において、ソフトウェアは、クライアントデバイスによって実行されると、世界固定オーディオオブジェクトと同時に出力される１つまたは複数の頭部固定オーディオオブジェクトを受信することを行うようにさらに動作可能であり、世界固定オーディオオブジェクトの第１のサブセットおよび球面調和オブジェクトと関連付けられるデータは、１つまたは複数の頭部固定オーディオオブジェクトとさらに関連付けられる。

【0007】

クライアントデバイスであって、１つまたは複数のプロセッサと、１つまたは複数のプロセッサのうちの１つまたは複数に結合されており、命令を含む１つまたは複数のコンピュータ可読非一時的記憶媒体とを備え、命令は、１つまたは複数のプロセッサのうちの１つまたは複数によって実行されると、クライアントデバイスに、１つまたは複数のアプリケーションから、いくつかの世界固定オーディオオブジェクトを受信することであって、世界固定オーディオオブジェクトの各々は、三次元環境内の座標と関連付けられる、受信することと、世界固定オーディオオブジェクトの第１のサブセットおよび世界固定オーディオオブジェクトの第２のサブセットを識別することであって、第１のサブセットはいくつかの世界固定オーディオオブジェクトを含み、第２のサブセットは、第１のサブセットから除外されている世界固定オーディオオブジェクトのうちの１つまたは複数を含む、世界固定オーディオオブジェクトの第１のサブセットおよび世界固定オーディオオブジェクトの第２のサブセットを識別することと、世界固定オーディオオブジェクトの第２のサブセットおよび世界固定オーディオオブジェクトの関連する座標に基づいて、球面調和オブジェクトを生成することと、出力のためにオーディオをレンダリングするように構成されたオーディオドライバに、世界固定オーディオオブジェクトの第１のサブセットおよび球面調和オブジェクトと関連付けられるデータを送信することとを行わせるように動作可能である、クライアントデバイスが、本明細書において説明される。

【0008】

クライアントデバイスの特定の実施形態において、三次元環境内の座標は、世界固定オーディオオブジェクトの各々と関連付けられ、三次元環境内のオーディオ源ロケーションを規定する。クライアントデバイスの特定の実施形態において、世界固定オーディオオブジェクトの第１のサブセットと関連付けられるデータは、直接伝播インパルス応答、残響インパルス応答、およびモノラルオーディオストリームを含む。クライアントデバイスの特定の実施形態において、命令は、１つまたは複数のプロセッサによって実行されると、１つまたは複数の追加の球面調和オブジェクトを受信することを行うようにさらに動作可能であり、球面調和オブジェクトを生成することは、１つまたは複数の追加の球面調和オブジェクトにさらに基づく。クライアントデバイスの特定の実施形態において、命令は、１つまたは複数のプロセッサによって実行されると、１つまたは複数の頭部固定オーディオオブジェクトを受信することを行うようにさらに動作可能であり、世界固定オーディオオブジェクトの第１のサブセットおよび球面調和オブジェクトと関連付けられるデータは、１つまたは複数の頭部固定オーディオオブジェクトとさらに関連付けられる。

【0009】

本明細書において開示されている実施形態は例に過ぎず、本開示の範囲は当該実施形態に限定されない。特定の実施形態は、本明細書において開示されている実施形態の構成要素、要素、特徴、機能、動作、またはステップのすべてを含んでもよく、一部を含んでもよく、または、いずれも含まなくてもよい。本発明による実施形態は、特に、方法、記憶媒体、システムおよびコンピュータプログラム製品を対象とする添付の特許請求の範囲に開示されており、例えば、方法など、１つの請求項分類において言及されている任意の特徴は、例えば、システムなどの別の請求項分類においても特許請求することができる。添付の特許請求の範囲における後方への従属関係または参照は、形式的な理由でのみ選択されている。しかしながら、任意の先行する請求項に戻る意図的な参照（特に、複数の従属関係）から生じる任意の主題も特許請求することができ、結果、請求項および請求項の特徴の任意の組み合わせが開示され、添付の特許請求の範囲において選択されている従属関係にかかわらず、特許請求することができる。特許請求され得る主題は、添付の特許請求の範囲において記載されている特徴の組み合わせだけでなく、特許請求の範囲内の特徴の任意の他の組み合わせも含み、特許請求の範囲において言及されている各特徴は、特許請求の範囲内の任意の他の特徴または他の特徴の組み合わせと組み合わせることができる。さらに、本明細書において記載または図示されている実施形態および特徴のいずれかは、別個の請求項において、および／あるいは、本明細書において記載もしくは図示されている任意の実施形態もしくは特徴、または、添付の特許請求の範囲の特徴のいずれかとの任意の組み合わせにおいて特許請求することができる。

【図面の簡単な説明】

【0010】

【図1】オーディオ配布のためのハードウェアおよびソフトウェアアーキテクチャを備える例示的なオーディオアーキテクチャを示す図である。

【図2】オーディオ配布のためのハードウェアおよびソフトウェアアーキテクチャを備える例示的なオーディオアーキテクチャを示す図である。

【図3】オーディオをレンダリングするための例示的なオーディオアーキテクチャを示す図である。

【図4】オーディオをレンダリングするための例示的な方法を示す図である。

【図5】オーディオを記録するための例示的なオーディオアーキテクチャを示す図である。

【図6】オーディオを記録するための例示的な方法を示す図である。

【図7】例示的な伝搬ルータアーキテクチャを示す図である。

【図8】例示的なコンピュータシステムを示す図である。

【発明を実施するための形態】

【0011】

図１は、オーディオ配布のためのハードウェアおよびソフトウェアアーキテクチャを備える例示的なオーディオアーキテクチャを示す。例示的なオーディオサービスアーキテクチャは、人工現実デバイスのオペレーティングシステム上で動作する、オーディオを配布するためのオーディオサービスを備えることができる。限定ではなく一例として、人工現実デバイスは、ユーザ１０１によって装着されるヘッドセット１３５であってもよい。例示的なオーディオアーキテクチャは、１つまたは複数のアプリケーションと１つまたは複数のオーディオドライバとの間でオーディオレンダリング要求とオーディオ記録要求とを協調させるためのオーディオサービスを備えることができる。例示的なオーディオサービスは、オーディオの信号処理が、オーディオと関連付けられるデータを生成または修正することを可能にすることができる。ヘッドセットは、コンピューティングデバイス１３０、すなわち、「ステージ」から、オーディオデータを受信することができ、ステージは、接続１５０を介してネットワーク１１０に結合することができる。限定ではなく一例として、ステージ１３０は、接続１５０を介して企業内部ネットワーク１６０および外部ネットワーク１７０に結合することができる。

【0012】

ヘッドセット１３０は、ユーザの左耳付近でオーディオをレンダリングするように方向付けられた１つまたは複数のスピーカと、ユーザの右耳付近でオーディオをレンダリングするように方向付けられた１つまたは複数のスピーカとを備えることができる。ヘッドセットは、１つまたは複数のマイクロフォンをさらに備えることができ、典型的には、２つ以上のマイクロフォンを備えることができる。特定の実施形態において、アプリケーションは、すべてのマイクロフォンから同時にオーディオを受信するのではなく、特定の方向に向けて配置されている特定の１つまたは複数のマイクロフォンを使用して、当該特定の方向からのオーディオを受信することを選択することが可能であり得る。当該選択を可能にすることは、ビームフォーミングして参照される場合がある。

【0013】

例示的な人工現実デバイスは、人工現実ユーザ指向オーディオ、すなわち、「頭部固定オーディオ」、および、環境指向オーディオ、すなわち、「世界固定オーディオ」をサポートすることができる。特定の実施形態において、例示的なオーディオアーキテクチャは、１つまたは複数の世界固定オーディオオブジェクト、１つまたは複数の頭部固定オーディオオブジェクト、および、１つまたは複数の球面調和オブジェクトのうちの１つまたは複数の組み合わせを組み込むことができる。頭部固定オーディオは、ユーザがヘッドセットをどのように動かしまたは回転させるかにかかわらず、同じようにヘッドセット内でレンダリングされるオーディオであり得る。限定ではなく一例として、ユーザのヘッドセット位置またはユーザの環境にかかわらず、特定の頭部固定通知が、ユーザの右耳付近でスピーカにおいてレンダリングされ得る。特定の実施形態において、頭部固定オーディオは、システム通知および／または背景音楽に有用であり得る。頭部固定オーディオは、２つのチャネルに制限され得、結果、すべての頭部固定オーディオストリームが、オーディオ生成のためのステレオオーディオ信号として混合され、提供される。

【0014】

対照的に、世界固定オーディオは、ユーザの環境の３Ｄ空間内の特定の点において生成されるオーディオをシミュレートするためにレンダリングされ得、結果、オーディオは、ユーザが自身の頭部を動かしてヘッドセットを動かすにつれて、左側スピーカと右側スピーカとの間でパンすることができる。すなわち、パンは、オーディオ源がユーザの正面の点に固定されているという印象をユーザに与えるように、ユーザの耳が見掛け上の音源のより近くに動くときにオーディオの音量を増大させ、ユーザの耳が見掛け上の音源から遠ざかるときに音量を低減することを含むことができる。限定ではなく一例として、オーディオがほぼ同じ音量で左側スピーカと右側スピーカの両方においてレンダリングされ、ただし、ユーザが自身の頭部を旋回させて一方の耳を見掛け上の音源のより近くに動かすとき、オーディオがユーザの動きに基づいてパンすることができるように、見掛け上、ユーザの真正面の点から発生するように、特定の世界固定オーディオをレンダリングすることができる。特定の実施形態において、世界固定オーディオは、３Ｄ環境内にある現実または仮想物体からオーディオを提供するのに有用であり得る。

【0015】

球面調和オーディオは、一般化された形態のマルチチャネルサラウンド音声である。球面調和オーディオは、特定の実世界または仮想のロケーションと関連付けられないオーディオに使用することができる。球面調和オーディオは、限定ではなく、周囲雑音、例えば、限定ではなく、競技場の群衆の叫び声および背景音楽と関連付けられるオーディオを含んでもよい。より提示の球面調和オーディオ（すなわち、チャネルがより少ない球面調和オーディオ）は、オブジェクトに基づくオーディオよりも品質の低いオーディオとしてユーザによって知覚され得る。例えば、限定ではなく、優先度のより低い頭部固定オーディオオブジェクトなどの、特定のオーディオオブジェクトを球面調和オーディオとして処理することによって、例示的なオーディオアーキテクチャは、限定ではなく、より短い待ち時間、より低い電力消費、より高い品質の物体ベースのオーディオオブジェクトに対するより高いオーディオ品質、およびユーザ構成可能設定を含む様々な設計制約を同時にサポートしながら、１つまたは複数のアプリケーションによって提供されるオーディオオブジェクトをサポートすることができる。

【0016】

特定の実施形態において、世界固定オーディオオブジェクトは、球面調和および頭部固定オーディオオブジェクトよりも計算的に多くを要求し得る。したがって、限定ではなく、待ち時間、電力消費、オーディオ品質制限、およびユーザ構成可能設定を含む１つまたは複数の制限に基づいて、世界固定オーディオオブジェクトの数を制限することが有益であり得る。限定ではなく一例として、世界固定オーディオオブジェクトは、限定ではなく、環境メタデータおよびヘッドセット位置データを含む、メタデータの処理を必要とし得る。

【0017】

特定の実施形態において、例示的なオーディオアーキテクチャは、１つまたは複数のオーディオオブジェクトの優先度を設定する役割を担い得る。オーディオオブジェクトの優先度は、優先度のより低いオーディオオブジェクトが球面調和オーディオとして処理され、生成される一方で、世界固定オーディオオブジェクトの処理を優先度のより高いいくつかのオーディオオブジェクトに制限するために使用することができる。限定ではなく一例として、オーディオサービスは、複数の世界固定オーディオオブジェクトを受信することができ、複数の世界固定オーディオオブジェクトを、世界固定オーディオとしてレンダリングするための優先度のより高いオブジェクトの第１のサブセットと、球面調和オーディオとしてレンダリングするための、第１のサブセットからのオーディオオブジェクトを一切含まない、優先度のより低いオーディオオブジェクトの第２のサブセットとに分離することができる。

【0018】

特定の実施形態において、オーディオオブジェクトは、メタデータと関連付けることができる。限定ではなく一例として、メタデータは、オーディオ源ロケーションを規定する三次元空間内の座標を含むことができる。オーディオ源ロケーションは、世界固定オーディオオブジェクトの空間的「発生源」、すなわち、現実または仮想空間内でオーディオが発生するロケーションを含むことができる。メタデータは、オーディオ源、および、三次元環境内の任意の実世界または仮想物体に対するユーザの向きに基づいてオーディオをレンダリングすることを可能にすることができる。

【0019】

特定の実施形態において、ステージは、特定の周波数においてヘッドセットにオーディオオブジェクトを提供することができ、ヘッドセットは、ステージからの順次的なオーディオオブジェクトの受信の間に適切なオーディオをレンダリングおよび出力する役割を担い得る。例えば、ステージは、規則的な時間間隔をおいたフレーム、すなわち、オーディオデータブロックにおいて、ヘッドセットにオーディオオブジェクトを提供することができる。規則的な時間間隔は、フレームレート、すなわち、フレームが受信される速度に対応することができる。ヘッドセットは、当該フレームレートに基づいてオーディオをレンダリングする役割を担うことができ、サブフレームについてオーディオをレンダリングする役割をさらに担うことができる。限定ではなく一例として、ステージが３０Ｈｚにおいてオーディオオブジェクトを提供する場合、ヘッドセットは、ユーザにとってより円滑なオーディオ体験を提供するために、例えば、補間を使用して、１２０Ｈｚにおいてオーディオを提供することができる。特定の実施形態において、ステージからオーディオが受信される周波数よりも大きい周波数においてオーディオをレンダリングすることは、高品質のユーザ体験を保証するために重要であり得る。これは、ヘッドセットがオーディオフレーム間で動くときに特に重要であり得、サブフレームにおいてオーディオをレンダリングすることによって、オーディオが見掛け上、三次元空間にわたって飛ぶのを防止することができる。同様に、ヘッドセットは、例えば、限定ではなく、自己位置推定とマッピングの同時実行（ＳＬＡＭ）および慣性計測装置（ＩＭＵ）データならびにユーザを取り巻く実世界および／または仮想環境の世界マップに基づいて、ヘッドセットと各オーディオ源との間の相対位置を考慮に入れて、適切な空間的手掛かりを用いてオーディオをレンダリングするすることができる。

【0020】

特定の実施形態において、人工現実オーディオアーキテクチャは、アプリケーションおよび／またはユーザに、待ち時間、電力、オーディオ品質、および他の要件を管理するとともに、複数の世界固定および／または頭部固定オーディオオブジェクトの複雑度を管理するオプションを提供することができる。特定の実施形態において、オーディオアーキテクチャは、データプライバシおよびセキュリティを可能にするために、オーディオドライバからのアプリケーションによるオーディオ生成および／またはオーディオ記録を隔離するための追加の処理を必要とする場合がある。限定ではなく一例として、オーディオアーキテクチャは、１つまたは複数のフィルタリング技法を利用して、オーディオデータがアプリケーション間で漏洩することを防止することができる。

【0021】

特定の実施形態において、世界固定オーディオオブジェクトは、アプリケーションによって提供されるロケーションメタデータおよびモノラルオーディオストリームに少なくとも部分的に基づいて生成することができる。世界固定オーディオオブジェクトのロケーションメタデータを、ＳＬＡＭ／ＩＭＵによって生成される世界メッシュデータとともに使用して、直接伝播インパルス応答および残響インパルス応答を生成することができる。直接電波インパルス応答および残響インパルス応答（ＩＲ）を、ヘッドセット関連伝達関数（ＨＲＴＦ）、ユーザロケーション、およびユーザ姿勢（同じくＳＬＡＭ／ＩＭＵによって提供される）とともに使用して、正確な空間オーディオデータを作成することができる。

【0022】

本明細書において言及されているように、特定の世界固定オーディオオブジェクトを優先度付けすることができ、優先度のより低い世界固定オーディオオブジェクトは、球面調和オーディオとして処理することができる。特定の実施形態において、球面調和オーディオは、少なくとも忠実度要件および計算要件に応じて包含的に８～３２チャネルを含む、マルチチャネルオーディオとして生成することができる。球面調和オーディオの１つの利点は、ヘッドセットとステージとの間の帯域幅を、球面調和オーディオ源の数に基づいて拡張しなくてもよいことである。加えて、ヘッドセット計算要件も、球面調和オーディオ源の数に基づいて拡張しなくてもよい。しかしながら、計算要件および帯域幅要件は、オーディオチャネルの数とともに増大し得る。特定の実施形態において、世界空間内のすべてのオーディオは、最大３２チャネルにおいてレンダリングされ得る。オーディオのチャネルの最大数を設定することによって、球面調和オーディオは良好にスケーリングすることができ、背景オーディオの有益なフォーマットを提供することができる。

【0023】

特定の実施形態において、ステージ１３０は、ハードウェア、ソフトウェア、もしくは内蔵論理構成要素、または、適切な機能を実行することが可能な２つ以上の構成要素の組み合わせを含む、電子デバイスであってもよい。限定ではなく一例として、ステージ１３０は、デスクトップコンピュータ、ノートブックもしくはラップトップコンピュータ、ネットブック、タブレットコンピュータ、電子書籍リーダ、ＧＰＳデバイス、カメラ、個人情報端末（ＰＤＡ）、手持ち式電子デバイス、携帯電話、スマートフォン、人工／仮想現実デバイス、他の適切な電子デバイス、または、人工／仮想現実デバイスと通信するための上記の任意の適切な組み合わせなどの、コンピュータシステムを含んでもよい。本開示は、任意の適切なステージを企図する。ステージ１３０は、ステージ１３０を使用するネットワークユーザが、ネットワーク１５０にアクセスすることを可能にすることができる。

【0024】

リンク１５０は、ステージ１３０をネットワーク１１０に接続することができる。特定の実施形態において、ステージ１３０は、リンク１５０およびネットワーク１１０を介して内部ネットワーク１６０に結合することができる。特定の実施形態において、ステージ１３０は、リンク１５０およびネットワーク１１０を介して外部ネットワーク１７０に結合することができる。本開示は、任意の適切なリンク１５０を企図する。特定の実施形態において、１つまたは複数のリンク１５０は、１つまたは複数の有線（例えば、デジタル加入者線（ＤＳＬ）またはケーブルによるデータサービスインターフェース標準（ＤＯＣＳＩＳ）など）リンク、無線（例えば、Ｗｉ－Ｆｉまたは世界規模相互運用マイクロ波アクセス（ＷｉＭＡＸ）など）リンク、または光学（例えば、同期型光ネットワーク（ＳＯＮＥＴ）または同期デジタル階層（ＳＤＨ）など）リンクを含んでもよい。特定の実施形態において、１つまたは複数のリンク１５０は各々、アドホックネットワーク、イントラネット、エクストラネット、ＶＰＮ、ＬＡＮ、ＷＬＡＮ、ＷＡＮ、ＷＷＡＮ、ＭＡＮ、インターネットの一部、ＰＳＴＮの一部、セルラ技術ベースのネットワーク、衛星通信技術ベースのネットワーク、限定ではなくリンク１５０を含む別のリンク、または、２つ以上のそのようなリンク１５０の組み合わせを含んでもよい。リンク１５０は、必ずしもネットワーク環境１１０全体を通じて同じでなくてもよい。１つまたは複数の第１のリンク１５０は、１つまたは複数の事項において、１つまたは複数の第２のリンク１５０とは異なり得る。

【0025】

特定の実施形態において、内部ネットワーク１６０および／または外部ネットワーク１７０の各々は、１つまたは複数のタイプのサーバ、１つまたは複数のデータストア、限定ではないがＡＰＩを含む１つまたは複数のインターフェース、１つまたは複数のウェブサービス、１つまたは複数のコンテンツソース、１つまたは複数のネットワーク、または任意の他の適切な構成要素を含んでもよい。内部ネットワーク１６０および／または外部ネットワーク１７０は、異なるエンティティによって動作され得る。しかしながら、特定の実施形態において、内部ネットワーク１６０および／または外部ネットワーク１７０は、ユーザにサービスを提供するために互いに連動して動作することができる。

【0026】

図２は、オーディオ配布のためのハードウェアおよびソフトウェアアーキテクチャを備える例示的なオーディオサービスアーキテクチャを示す。図２は、１つまたは複数のアプリケーション２２０、２２２、２２４、２２６、オーディオサービス２１０、および１つまたは複数のドライバ２３０を備える例示的なオーディオアーキテクチャ２００を示す。概して、オーディオサービス２１０は、アプリケーション２２０、２２２、２２４、２２６と、ドライバ２３０との間の仲介者として作用することができる。特定の実施形態において、ドライバ２３０は、デジタル信号プロセッサ（ＤＳＰ）（図示せず）に結合することができる。オーディオサービス２１０は、アプリケーション２２０、２２２、２２４、２２６からのオーディオデータを、ドライバ２３０に配布する前に処理することができる。限定ではなく一例として、オーディオサービス２１０は、ステレオオーディオストリームを処理して、１つまたは複数の球面調和オーディオオブジェクトを生成することができ、１つまたは複数の世界固定オーディオオブジェクトを処理して、１つまたは複数の直接インパルス応答および１つまたは複数の残響インパルス応答のうちの１つまたは複数を生成することができる。

【0027】

１つまたは複数のアプリケーション２２０、２２２、２２４、２２６は、オーディオサービス２１０に結合することができ、オーディオサービス２１０は、１つまたは複数のドライバ２３０に結合することができる。オーディオサービス２１０は、１つまたは複数のアプリケーション２２０、２２２、２２４、２２６から１つまたは複数のアプリケーションオーディオオブジェクトを受信することができる。特定の実施形態において、オーディオサービス２１０はまた、限定ではないがメタデータを含む、１つまたは複数のアプリケーションオーディオオブジェクトと関連付けられるメタデータも受信することができる。オーディオサービスは、特定の１つまたは複数のオーディオオブジェクトを処理して、１つまたは複数のオーディオドライバに提供することができる単一の球面調和オーディオオブジェクトを生成することができる。同様に、オーディオサービス２１０は、１つまたは複数のオーディオオブジェクトを処理して、１つまたは複数のオーディオドライバ２３０に提供することができる単一の頭部固定オーディオオブジェクトを生成することができる。加えて、オーディオサービス２１０は、１つまたは複数のオーディオオブジェクトを処理して、すべて１つまたは複数のオーディオドライバ２３０に提供することができる、１つまたは複数のモノラルオーディオストリーム、１つまたは複数の直接インパルス応答、および１つまたは複数の残響インパルス応答のうちの１つまたは複数を生成することができる。オーディオサービス２１０はまた、ＩＭＵサービスおよび／またはＳＬＡＭサービス２４０から、限定ではないがメタデータを含むデータを受信することもできる。ＳＬＡＭ／ＩＭＵデータは、１つもしくは複数の世界固定オーディオオブジェクトおよび／または１つもしくは複数のインパルス応答の処理の一部として組み込むことができる。

【0028】

特定の実施形態において、オーディオサービス２１０は、伝搬ルータ２１２を備えることができる。伝搬ルータ２１２は、１つまたは複数のソフトウェアミキサ２１４を備えることができる。限定ではなく一例として、伝搬ルータ２１２は、１つまたは複数のアプリケーションから受信されるオーディオデータを混合して、１つまたは複数の頭部固定オーディオオブジェクトオブジェクト２５４を生成することができる。図２において、伝搬ルータ２１２は、アプリケーション２２０、２２２から受信されるオーディオデータを混合する（アプリケーション２２０からのオーディオデータおよびアプリケーション２２２からのオーディオデータをミキサ２１４において合成することによって示されている）。伝搬ルータ２１２は、ＳＬＡＭサービス、ＩＭＵサービス２４０のうちの１つまたは複数からのデータ、および／またはロケーションメタデータに少なくとも部分的に基づいて、世界固定オーディオ２５０に対応する直接インパルス応答２７２、残響インパルス応答２７４、および、モノラルオーディオストリーム２７０を含むデータを生成することができる。特定の実施形態において、伝搬ルータ２１２は、オーディオオブジェクトを混合し、および／または、オーディオオブジェクトをオーディオドライバ２３０に配布する役割を担うことができる。限定ではなく一例として、伝搬ルータ２１２は、単一の世界固定オーディオオブジェクトを作成するために同様の世界ロケーションを占有する２つの別個のオブジェクトから発するオーディオデータを混合することができる。

【0029】

特定の実施形態において、世界固定オーディオオブジェクトの数が、オーディオサービス２１０の１つまたは複数の構成設定によって許容される世界固定オーディオオブジェクトの最大数を超える場合、伝搬ルータ２１２は、特定のアプリケーションオーディオオブジェクトのみを処理して、１つまたは複数のオーディオドライバ２３０に配布するための世界固定オーディオ２５０をレンダリングすることができる。残りの優先度のより低いアプリケーションオーディオオブジェクトは、代わりに、球面調和オーディオ２５２として処理することができる。限定ではなく一例として、アプリケーション２２０によって提供される優先度の高いアプリケーションオーディオオブジェクトは、伝搬ルータ２１２に提供され、処理されて、世界固定オーディオ２５０をレンダリングするためにドライバ２３０に提供することができる、直接ＩＲ２７２、残響ＩＲ２７４、およびモノラルオーディオ２７０を含むデータを生成することができる。対照的に、アプリケーション２２０からの優先度のより低いアプリケーションオーディオオブジェクトは、ドライバ２３０に提供される前に、伝搬ルータ２１２によってソフトウェアミキサ２１４にルーティングされて、アプリケーション２２２などの１つまたは複数の他のアプリケーションからのアプリケーションオーディオオブジェクトと組み合わされて、球面調和オーディオ２５２を生成することができる。

【0030】

１つまたは複数のアプリケーション２２０、２２２、２２４、２２６はまた、ドライバ２３０によってキャプチャされ、記録を可能にするためにオーディオサービス２１０によって渡されるオーディオデータを受信することもできる。オーディオサービス２１０は、１つまたは複数のドライバ２３０からのオーディオ記録データの受信と、１つまたは複数のアプリケーション２２０、２２２、２２４、２２６へのオーディオ記録データの配布とを協調させることができる。特定の実施形態において、オーディオサービス２１０は、例えば、限定ではなく、アプリケーション２２６に提供されるオーディオ記録データのために図２に示すようにオーディオデータをビームフォーミングすることによって、オーディオ記録データを処理することができる。１つまたは複数のドライバ２３０は、限定ではなく、発話デバイス２６０、ボイスオーバＩＰ（ＶｏＩＰ）デバイス２６２、および一般記録デバイス２６４を含む、様々な記録タイプを記録するための１つまたは複数のデバイスを暴露することができる。特定の実施形態において、発話デバイス２６０およびＶｏＩＰデバイス２６２は、モノラルデバイスまたはステレオデバイスであってもよく、一方、一般記録デバイス２６４は、モノラルデバイスとしてビームフォーミングされたオーディオを有効化するためにオーディオサービス２１０に提供されるマルチチャネルデバイス（例えば、８チャネルデバイス）であってもよい。限定ではなく一例として、アプリケーション２２６は、追加の処理を行わずにオーディオデータを受信するアプリケーション２２８とは異なり、モノラルオーディオデータストリームを受信するために複数のマイクロフォンを特定のロケーションへとビームフォーミングすることを、オーディオサービスに要求することができるが、ビームフォーミングおよび他の処理は、待ち時間を増大させ、追加の計算リソースを必要とする場合がある。

【0031】

ドライバ２３０に結合されているＤＳＰ（図示せず）は、規則的な時間間隔をおいてフレームを受信することを期待し得る。規則的な時間間隔は、ＤＳＰフレームレートに対応することができる。ＤＳＰフレームレートは、オーディオサービス２１０が、ダイレクトメモリアクセス、「ドアベル／メールボックス」転送、または当該技術分野において知られている他のタイプの転送を介してドライバ２３０への転送を開始する速度であり得る。ドライバ２３０は、１つまたは複数のＤＳＰフレームの待ち時間に遭遇し得る。限定ではなく一例として、待ち時間は、チューニングの結果として発生し得る。ドライバ２３０はまた、伝搬ルータ２１２の混合時間と関連付けられる待ち時間にも遭遇し得る。ＤＳＰフレームレート、および対応するＤＳＰフレーム時間は、ドライババッファ内の各フレームのサイズに対応し得る。

【0032】

図３は、オーディオデータをレンダリングするための例示的なオーディオサービスアーキテクチャを示す。例示的なオーディオサービスアーキテクチャは、アプリケーション３２０、オーディオサービス３１０、およびドライバ３３０を備えることができる。アプリケーション３２０は、ヘッダキュー３２２、パラメータキュー３２４、およびオーディオバッファ３４０を備えることができ、キュー３２２、３２４は、オーディオサービス３１０と共有することができ、オーディオバッファ３４０は、オーディオサービス３１０とドライバ３３０の両方と共有することができる。共有される要素は、図３に、アプリケーション３２０、オーディオサービス３１０、およびドライバ３３０の重なり合うドメインを示す陰影として示されている。ドライバ３３０は、２つのオーディオバッファ３３２、３４０を備えることができ、混合ＩＯバッファ３３２は、ドライバ３３０およびオーディオサービス３１０と共有することができ、アプリケーションＩＯバッファ３４０は、オーディオサービス３１０とアプリケーション３２０の両方と共有することができる。ドライバ３３０は、両方ともオーディオサービスと共有することができる、直接インパルス応答バッファ３３４および残響インパルス応答バッファ３３６をさらに備えることができる。共有アーキテクチャ要素に加えて、オーディオサービス３１０は、伝搬ルータ３１２をさらに備えることができる。伝搬ルータ３１２は、インパルス応答生成器３１４を備えることができる。図３に示すようにアーキテクチャ構成要素の間でバッファを共有することによって、仮想メモリオブジェクト（ＶＭＯ）を使用することで、待ち時間をより短くし、電力消費をより低くすることを可能にすることができるゼロデータ転送および／または他のデータ転送を可能にすることが可能になり得る。

【0033】

頭部固定オーディオおよび球面調和オーディオデバイスは、単一のアプリケーションによって排他的に使用されず、パケットサイズは、システムによってロックされ得る。特定の実施形態において、すべてのアプリケーションは、所定のタイムスタンプを使用してシステムによって設定されるパケットサイズを参照し得る。タイムスタンプは、オーディオの提示時間を調整するために使用することができる。特定の実施形態において、アプリケーションは、オーディオパケットにタイムスタンプを付して、オーディオ提示の精細な制御を可能にすることができる。特定の実施形態において、オーディオサービスは、１つまたは複数のアプリケーションの代わりにオーディオパケットにタイムスタンプを付すことができる。

【0034】

図４は、オーディオをレンダリングするための例示的な方法４００を示す。方法４００は、ステップ４１０において開始することができ、ドライバ３３０およびオーディオサービス３１０が初期化され得る。初期化中、ドライバ３３０およびオーディオサービス３１０は、共有混合オーディオデータバッファ３３２、直接インパルス応答バッファ３３４および残響インパルス応答バッファ３３６を構成することができる。混合オーディオバッファ３３２は、所定のサイズに割り当てることができ、ＤＳＰフレームサイズの倍数にさらにチャンクすることができる。

【0035】

ステップ４１５において、アプリケーション３２０は、ヘッダおよびパラメータキュー３２２、３２４を共有することを可能にするために、オーディオサービス３１０に登録することによって、オーディオデータを提供する準備をすることができる。加えて、アプリケーション３２０、オーディオサービス３１０、およびドライバ３３０によってアクセス可能であるオーディオバッファ３４０を割り当てることができる。単純にするために、当該オーディオバッファ３４０は、オーディオバッファ３３２の整数の倍数であり得る。アプリケーションＶＭＯは、動作モードに基づいてオーディオバッファ３４０をパケットにチャンクすることができ、チャンクは、単純にするためにＤＳＰフレーム時間の倍数に対応することができる。限定ではなく一例として、図３に示すパケットおよびフレームのサイズは同一である。オーディオパケットは、ペイロードまたはオーディオデータのブロックを含むことができる。特定の実施形態において、オーディオパケットは、オーディオデータの複数のフレームを含むことができる。限定ではなく一例として、１つのオーディオフレームは、ｎ個のオーディオサンプルを含むことができ、オーディオパケットは、ｍ個のフレームを含むことができ、ｎおよびｍは特定の整数値を表し、ｍおよびｎは等しい値であってもよく、または、等しい値でなくてもよい。

【0036】

ステップ４２０において、アプリケーション３２０は、オーディオデータをストリーミングする準備ができ、または、安定ストリーミング状態にあり、オーディオデータを、オーディオバッファ３３２に記憶することができるパケットにコピーすることができる。オーディオデータがバッファ３３２に記憶されると、オーディオサービス３１０とドライバ３３０の両方が、必要に応じてオーディオデータにアクセスすることができる。

【0037】

ステップ４２５において、アプリケーション３２０は、ヘッダキュー３２２内の特定のインデックスにおいてヘッダを作成し、同じインデックスにおいてパラメータキュー３２４に任意のパラメータを追加することができる。特定の実施形態において、パラメータキュー３２４内のパラメータが変化しない場合、当該インデックスにおけるパラメータキュー３２４は、パラメータに変化が無いことを示す所定の変数に設定することができる。

【0038】

ステップ４３０において、アプリケーション３２０は、パケットの準備ができたときにオーディオサービス３１０に通知することができる。限定ではなく一例として、人工現実デバイスは、通知は、通知／ドアベルを通じて行うことができる。特定の実施形態において、通知後、アプリケーション３２０は、ヘッダキュー３２２内のヘッダ、パラメータキュー３２４内のパラメータ、または、オーディオバッファ３４０のオーディオパケット内のオーディオデータを変更しなくてもよい。

【0039】

ステップ４３５において、オーディオサービス３１０は、アプリケーション３２０から受信されるオーディオデータおよびパラメータを伝搬ルータ３１２に提供して、ＩＲ生成器３１４を使用したインパルス応答の処理を可能にすることができる。オーディオサービス３１０は、ＤＳＰフレーム間は低電力モードにすることができる。オーディオサービス３１０は、アプリケーション３２０による通知を受けて当該低電力モードを脱し、現在のＤＳＰフレーム時間と次のＤＳＰフレーム時間との間の提示時間を用いてオーディオデータの処理を開始することができる。特定の実施形態において、伝搬ルータ３１２は、オーディオデータがドライバ３３０によって直接アクセスされるべきであるか否か、オーディオデータが別のアプリケーションのオーディオと混合されるべきであるか否か、または、オーディオデータが、世界固定オーディオオブジェクトの数および／もしくはオーディオデータ優先度に基づいて球面調和オーディオとして処理されるべきであるか否かを判定することができる。オーディオデータが混合または処理されるべきである場合、オーディオサービス３１０は、混合または処理されたオーディオデータをオーディオバッファ３３２にコピーすることができるように、これらのトランザクションを優先度付けすることができる。オーディオを処理および／または混合することによって、待ち時間が導入され得る。

【0040】

ステップ４４０において、オーディオサービス３１０は、伝搬ルータからのＩＲ係数を、図３に示す直接ＩＲバッファ３３４および残響ＩＲバッファ３３６に即座にコピーすることができる。ＩＲ係数を即座にデータ転送することによって、待ち時間を低減することができる。

【0041】

ステップ４４５において、オーディオサービス３１０は、ダイレクトメモリアクセスを介して、または、ドアベル／メールボックスメカニズムを介して、混合オーディオバッファ３３２またはアプリケーションオーディオバッファ３４０からのオーディオデータの転送を、ドライバ３３０に通知することができる。この時点において、オーディオサービス３１０および／または伝搬ルータ３１２は、オーディオバッファ３３２内のオーディオデータを変更しなくてもよい。

【0042】

ステップ４５０において、オーディオサービス３１０からドライバ３３０へのデータ転送が完了し、オーディオサービス３１０は、オーディオデータが記憶されたオーディオバッファ３３２内のロケーションに安全に書き込むことができるという通知を受信することができる。

【0043】

ステップ４５５において、オーディオサービス３１０は、オーディオサービス３１０が十分な通知を受信したときにオーディオデータの転送に成功したことをアプリケーション３２０に通知することができる。特定の実施形態において、２つ以上の通知を使用することによって、様々なパケットサイズをサポートすることができる。限定ではなく一例として、アプリケーション、サービス、またはドライバのうちの１つまたは複数が、アプリケーション、サービス、またはドライバ内で設定されているオプションまたは要件に基づいて、異なるパケットサイズを使用することが有益であり得る。特定の実施形態において、パケットサイズをより大きくすることによって、アプリケーション、サービス、またはドライバが、例えば、限定ではなく、より長い期間にわたって低電力モードにおいて動作することを可能にし、以て電力消費を低減するために、より低い頻度でより大きいオーディオパケットとインタラクトすることが可能になり得る。特定の実施形態において、パケットサイズをより小さくすることによって、アプリケーション、サービス、またはドライバが、例えば、限定ではなく、ユーザのより応答性の高いオーディオ体験を可能にするために、より高い頻度でより小さいオーディオパケットとインタラクトすることが可能になり得る。例えば、アプリケーションは、１０Ｘのパケットサイズを使用し得、一方で、オーディオサービスは５Ｘのパケットサイズを使用し得、オーディオドライバはＸのパケットサイズを使用し得る。当該例において、オーディオドライバは、応答性オーディオを保証するために各パケットを処理するように連続的に動作することができ、一方で、アプリケーションは、オーディオドライバが１０個のオーディオパケットを処理するまで、低電力モードにおいて動作することによって、電力消費を低減することができる。特定の実施形態において、オーディオデータの所有者（オーディオバッファ３３２についてはドライバ３３０であり得、オーディオバッファ３４０についてはオーディオサービス３１０であり得る）は、フレーム／パケットをゼロ化すると期待される。

【0044】

アプリケーション３２０が、オーディオデータをドライバに転送するのに成功したことを通知された後、アプリケーション３２０は、ステップ４２０に戻って、レンダリングのための追加のオーディオデータを提供することができる。安定状態において、アプリケーション３２０は、オーディオパケットを充填し、パケットが処理されるまで待ち、次いで、再生されるオーディオデータをパケットに再充填することができる。

【0045】

特定の実施形態は、適切な場合に、図４の方法の１つまたは複数のステップを繰り返すことができる。本開示は、図４の方法の特定のステップを、特定の順序で行われるものとして記載および例示しているが、本開示は、図４の方法の任意の適切なステップが、任意の適切な順序で行われることを企図している。さらに、本開示は、図４の方法の特定のステップを含む、オーディオをレンダリングするための例示的な方法を記載および例示しているが、本開示は、適切な場合に、図４の方法のステップのすべてを含み得るか、一部を含み得るか、一切含み得ない、任意の適切なステップを含む、オーディオをレンダリングするための任意の適切な方法を企図している。さらに、本開示は、図４の方法の特定のステップを実行する特定の構成要素、デバイス、またはシステムを記載および例示しているが、本開示は、図４の方法の任意の適切なステップを実行する任意の適切な構成要素、デバイス、またはシステムの任意の適切な組み合わせを企図している。

【0046】

球面調和オーディオについて、伝搬ルータは、ストリームを球面調和オーディオに変換すること、および、オーディオデータを他の球面調和オーディオストリームと混合することを担い得る。頭部固定オーディオについて、伝搬ルータは、任意のアクティブなステレオストリーム、球面調和オーディオストリーム（ＨＲＴＦの適用後）、およびオブジェクトベースのストリーム（空間レンダリングおよびＨＲＴＦの適用後）を混合することができる。伝搬ルータはまた、混合後の頭部固定オーディオを混合ＩＯバッファにコピーすることもできる。さらに、伝搬ルータは、複数のストリームを混合して単一のストリームにして、オーディオドライバに提示されるオーディオストリームの数を限定することができる。パケットサイズがフレームサイズの整数の倍数であり、オーディオサービス３１０およびドライバ３３０によって暴露される待ち時間が単一のフレーム時間を超えるとき、ストリームを混合するのに十分なデータがあり得る。直接インパルス応答および残響インパルス応答バッファは、頭部固定オーディオには使用されなくてもよいことに留意されたい。

【0047】

図５は、オーディオデータを記録するための例示的なオーディオサービスアーキテクチャを示す。例示的なオーディオサービスアーキテクチャは、アプリケーション５２０、５２５、オーディオサービス５１０、およびドライバ５３０を備える。第１のアプリケーション５２０は、第１のオーディオバッファ５２２を備え、第１のオーディオバッファ５２２は、オーディオサービス５１０と共有され、第２のアプリケーション５２５は、第２のオーディオバッファ５２７を備え、第２のオーディオバッファ５２７は、オーディオサービス５１０と共有される。ドライバ５３０およびオーディオサービス５１０は、第３のオーディオバッファ５３２を共有することができる。図５に示すようにアーキテクチャ構成要素の間でバッファを共有することによって、ＶＭＯを使用することで、待ち時間をより短くし、電力消費をより低くすることを可能にすることができるゼロデータ転送および／または他のデータ転送を可能にすることが可能になり得る。

【0048】

図６は、オーディオを記録するための例示的な方法６００を示す。方法６００は、ステップ６１０において開始することができ、初期化中、ドライバ５３０は、オーディオバッファ５３２を、ＶＭＯにマッピングすることができるオーディオデータに割り当てることができる。オーディオバッファ５３２は、オーディオサービス５１０と共有することができることに留意されたい。当該バッファ５３２は、ＤＳＰフレームサイズに対応するフレームにチャンクすることができる。

【0049】

ステップ６１５において、アプリケーション５２０は、オーディオの記録を開始する準備ができ得、オーディオサービス５１０に登録して、オーディオサービス５１０と共有することができる、ＶＭＯにマッピングすることができるオーディオデータのためのオーディオバッファ５２２を作成する。各アプリケーションは、アプリケーションにとって許容できる待ち時間に少なくとも部分的に基づいて、アプリケーション自体のオーディオバッファサイズを指定することができる。特定の実施形態において、アプリケーションは、ＤＳＰフレームサイズの整数の倍数であるバッファサイズを割り当てることができる。図５において、アプリケーション５２０は、より大きいバッファ５２２をあり当てられており、一方、アプリケーション５２５は、より小さいバッファ５２７を割り当てられている。限定ではなく一例として、より大きいバッファは、アプリケーションが、より長い期間にわたって低電力モードにおいて動作し、低電力モードに戻る前に寄り多くのオーディオデータを処理することを可能にすることによって、電力消費を低減することを可能にすることができ、一方で、より小さいバッファは、オーディオ処理の待ち時間を短くすることができる。

【0050】

ステップ６２０において、オーディオサービス５１０は、少なくとも１つのアプリケーション５２０、５２５がオーディオサービス５１０に登録して、オーディオデータの記録を可能にした後に、ドライバ５３０を用いてフレームを待ち行列に入れることを開始することができる。図５に示すように、アプリケーション５２０、５２５の両方が、オーディオサービス５１０と共有されるように構成されたオーディオバッファ５２２、５２７によって示されるように、オーディオサービス５１０にともに登録されている。

【0051】

ステップ６２５において、オーディオサービス５１０は、ドライババッファ５３２がオーディオデータの全フレームを受信したときに、通知を受信することができる。

【0052】

ステップ６３０において、オーディオサービス５１０は、オーディオバッファ５３２がドライバ５３０によって充填されたことを受けて、すべてのデータがキャプチャされることを保証するために、次のフレームを待ち行列に入れることができる。特定の実施形態において、オーディオサービス５１０が待ち行列に入れることは、オーディオデータ損失を防止するために即座に行うことができる。

【0053】

ステップ６３５において、オーディオサービス５１０は、オーディオバッファ５３２からアプリケーションバッファ５２２、５２７の両方にデータを転送することができる。

【0054】

ステップ６４０において、オーディオサービス５１０は、アプリケーションバッファ５２２、５２７にドライババッファ５３２からのオーディオデータが充填されたときに、アプリケーション５２０、５２５に通知することができる。オーディオデータがアプリケーションバッファ５２０、５２５に転送されたことを受けて、アプリケーション５２０、５２５は、オーディオデータを所望に応じて処理して、記録を生成することができる。特定の実施形態において、アプリケーション５２０、５２５は、一般記録のために記録されたオーディオデータをビームフォーミングして、特定のオーディオ源を他よりも強調することを試みることを可能にすることができる。限定ではなく一例として、デフォルト記録オプションは、３６０度のオーディオデータをキャプチャすることを含むことができ、一方で、ビームフォーミングされたオーディオの記録は、例えば、車両の交通などの背景オーディオよりも優先して、例えば、鳥の鳴き声などの単一のオーディオ源からのオーディオをキャプチャすることを試みることができる。ビームフォーマは、アプリケーションのコンテキストにおいて作動しているものであり得、ヘルパー機能として作用することができる。

【0055】

特定の実施形態は、適切な場合に、図６の方法の１つまたは複数のステップを繰り返すことができる。本開示は、図６の方法の特定のステップを、特定の順序で行われるものとして記載および例示しているが、本開示は、図６の方法の任意の適切なステップが、任意の適切な順序で行われることを企図している。さらに、本開示は、図６の方法の特定のステップを含む、オーディオをレンダリングするための例示的な方法を記載および例示しているが、本開示は、適切な場合に、図６の方法のステップのすべてを含み得るか、一部を含み得るか、一切含み得ない、任意の適切なステップを含む、オーディオをレンダリングするための任意の適切な方法を企図している。さらに、本開示は、図６の方法の特定のステップを実行する特定の構成要素、デバイス、またはシステムを記載および例示しているが、本開示は、図６の方法の任意の適切なステップを実行する任意の適切な構成要素、デバイス、またはシステムの任意の適切な組み合わせを企図している。

【0056】

特定の実施形態において、各記録モードは、アプリケーションにとって利用可能なデータに対する高レベルの理解および制御を可能にするための独立した許可および／または機能を有し得る。特定の実施形態において、特定のアプリケーションは、ＶｏＩＰおよび発話記録モードを使用することを可能にされ得、一方、他のアプリケーションは当該モードの使用を可能にされない。特定の実施形態において、特定のアプリケーションが、適切な許可によって、ＶｏＩＰおよび発話記録モードを使用することを可能にされ得る。

【0057】

複数のマイクロフォンが、限定ではなく、発話記録、ＶｏＩＰ記録、環境記録、および一般記録を含む、複数の記録モードをサポートすることができる。発話記録は、自動発話認識をサポートし、モノラル低ビットレートオーディオデータを含むことができ、ヘッドセット上でのビームフォーミングを可能にすることができる。ＶｏＩＰ記録は、ヘッドセット上での最適化された音声通信およびビームフォーミングをサポートすることができる。環境記録は、記録中のエコーキャンセルをサポートすることができ、ユーザの音声が記録されない記録を可能にすることができる。一般記録は、複数のマイクロフォンおよびループバックを使用することを含むことができ、より高いビットレートを可能にすることができ、ソフトウェアにおいて適用される１つまたは複数のサブモードを含むことができる。サブモードは、マルチチャネル生オーディオ記録、ループバックへのアクセス、固定および／またはアプリケーション定義のビームフォーミング、ならびに、球面調和オーディオ記録および／または空間オーディオ記録を含むことができる。マルチチャネル生オーディオ記録は、内部環境および工場較正に有益であり得る。ループバックへのアクセスは、内部開発、工場較正、およびエコー排除に有益であり得る。特定の実施形態において、オーディオアーキテクチャは、限定ではなく、ノイズキャンセル、視標追跡ビームフォーミングとして実施される「スーパーヒューマンヒアリング」を含む、ルーティングのみの設定を可能にすることができる。

【0058】

例示的なオーディオアーキテクチャは、様々なオーディオストリームを記録およびレンダリングすることが可能であり得る。限定ではなく一例として、オーディオストリームは、生マイクロフォンオーディオ、装着者発話ビームフォーマ出力、ＶｏＩＰ、および／または自動発話認識に最適化されたオーディオデータ、環境球面調和オーディオ記録、環境ビームフォーミングオーディオ記録、エコー参照および／またはレンダループバック、物体ベースのオーディオレンダストリーム、球面調和オーディオレンダリングストリーム、頭部固定オーディオストリーム、ならびに世界固定オーディオストリームを含むことができる。

【0059】

特定の実施形態において、オーディオアーキテクチャは、複数の分散された処理構成要素によって共有される同期クロック基準および時間を含むことができる。特定の実施形態において、ＶＭＯは、同期クロック基準に少なくとも部分的に基づいて、アプリケーション、オーディオサービス、およびドライバの間でデータ転送を協調させることができる。オーディオアーキテクチャによるオーディオレンダリングは、実世界要素と同期することができる。特定の実施形態において、オーディオデータには、実世界要素との同期、および、複数のセンサまたは複数のアプリケーションからのオーディオデータ間の同期を可能にするために、提示または記録時間によってタイムスタンプを付すことができる。特定の実施形態において、記録オーディオデータとレンダオーディオデータの両方は、限定ではなく、ストリームＩＤ、提示または記録時間、連続番号、および、例えば、限定ではなく、無音フレームフラグなどの１つまたは複数のフラグを含むヘッダメタデータを有するアーキテクチャ構成要素の間で進行し得る。特定の実施形態において、レンダオーディオパケットは、限定ではなく、ゲインおよびピッチシフトパラメータを含む１つまたは複数のパラメータを含むことができる。

【0060】

オーディオサービスは、限定ではなく、セキュリティ、グローバルゲイン、およびオーディオデータルーティングを含むオーディオポリシを設定および施行することを担い得る。特定の実施形態において、オーディオサービスは、限定ではなく、オーディオ再生、ユーザの高品質（ＶｏＩＰ／人間の聴き手）オーディオ記録、環境の高品質オーディオ記録、ユーザの高品質（ＡＳＲ／機械の聴き手）、エコー参照オーディオストリーム、およびデバッグオーディオストリームのための許可および／または機能を含む、１つまたは複数の精細な許可および機能を提供することができる。特定の実施形態において、環境の高品質オーディオ記録、ユーザの高品質（ＡＳＲ／機械の聴き手）発話記録は、レンダリングされたオーディオコンテンツエコーを含み得る。特定の実施形態において、エコー参照ストリームを使用して、ＡＳＲ結果を改善することができる。特定の実施形態において、デバッグストリームは、生マイクロフォンオーディオデータ、エコー参照、および様々なデバッグタップ点のうちの１つまたは複数を含むことができる。

【0061】

セキュリティポリシを適用した後、オーディオサービスは、依然として、複数のアプリケーションがオーディオデータを記録することを可能にすることができる。限定ではなく一例として、マイクロフォンを使用して、第２のアプリケーションによるＶｏＩＰ呼び出しのための音声トリガを可能にするためのオーディオを同時に記録しながら、１つのアプリケーションの音声ＩＤを処理するためのオーディオを記録することができる。セキュリティ目的で、アプリケーションは、最終的な混合オーディオデータが、１つまたは複数の他のアプリケーションによって提供されるオーディオデータを含む可能性があるとき、ドライバに提供される最終的な混合オーディオデータを見ることを可能にされないことができる。この制限は、セキュアまたはプライベートなオーディオデータがアプリケーション間で漏洩するのを防止することができる。

【0062】

オーディオデータは、オーディオサービスアプリケーションプログラムインターフェース（ＡＰＩ）によって推奨されるパケットサイズに従ってチャンクすることができる。オーディオアーキテクチャのための電力は、オーディオサービスの始動間隔に影響を与え得る、オーディオバッファに記憶されるパケットの数、すなわち、バッファ深度、および、パケットサイズの関数であり得る。特定の実施形態において、オーディオサービスＡＰＩは、限定ではなく、バッファサイズ要件および使用事例を含む考慮事項に基づいて、最小および最大チャンクサイズに関する案内を提供することができる。限定ではなく一例として、当該ＡＰＩは、一般目的使用、最小待ち時間、および最小電力消費のための最適化されたチャンクプリセットを識別することができる。オーディオサービスＡＰＩはまた、バッファ深度およびパケットサイズがバッファリング遅延に及ぼす影響の指標を提供することもできる。限定ではなく一例として、ＡＰＩは、当該構成パラメータに基づいて、アプリケーションによるオーディオデータの提示と、ドライバにおけるオーディオデータの再生との間の遅延の指標を提供することができる。

【0063】

限定ではなく一例として、オーディオサービスは、他のセンサ入力と同期されたオーディオなどの、非常に応答性の高いアプリケーションに対するオーディオの不調を回避する最小バッファリング構成を推奨することができる。限定ではなく一例として、オーディオサービスは、終日の音楽再生をサポートするための低電力消費を可能にするために、より長い間隔にわたってデューティサイクルを小さくすることによって、再生パケットをより大きくし、オーディオサービス始動間の時間をより長くすることを推奨することができる。限定ではなく別の例として、オーディオサービスは、頭部固定オーディオデータおよび球面調和オーディオデータなどの非排他的なオーディオデータをサポートするための、電力と待ち時間の両方に関する妥協をサポートするために、固定パケットサイズを推奨することができる。

【0064】

記録シナリオについて、オーディオサービスは、より低レベルのタイムスタンプを付された活動の検出、および、任意選択的にタイムスタンプを付された加速度計データを有する信頼度データを活用することができる。オーディオサービスは、計算要件を追加して信頼度データを改善するか、または、より低レベルのタイムスタンプを付された活動の検出、信頼度データ、および、任意選択のタイムスタンプを付された加速度計データを破棄するオプションを、アプリケーションにさらに提供することができる。

【0065】

本明細書において言及されているように、オーディオアーキテクチャは、ＶＭＯを利用して、ゼロデータ転送、および／または他のデータ転送を可能にすることができる。当該オーディオアーキテクチャの１つの利点は、オーディオポリシを施行しながら、オーディオおよび他のデータの冗長なコピーおよび処理が制限されることであり得る。オーディオおよび他のデータに対してタイムスタンプを一貫して使用することによって、性能をさらに改善するために、再処理されるのではなく、処理が再使用されることが可能になり得る。

【0066】

特定の実施形態において、オーディオアーキテクチャは、データを処理するためにＨＲＴＦを使用することができる。ＨＲＴＦは、限定ではなく、ユーザの耳および／または頭部の３Ｄモデルを含む、ユーザに関する個人データを含む場合があるため、オーディオアーキテクチャは、ＨＲＴＦを、バイオメトリックデータ、および、追加のセキュリティ予防策、ポリシ、および手順を必要とし得る、個人を特定できる情報として扱い得る。

【0067】

本明細書において言及されているように、オーディオアーキテクチャは、待ち時間および電力要件における適切な性能を保証するために、世界固定オーディオオブジェクトの数を、８個または１６個の世界固定オーディオオブジェクトなどの、特定の数に制限することを含むことができる。当該オーディオサービスアーキテクチャの利点は、各々がオーディオのレンダリングを試みる複数のアプリケーションをサポートすることができる。オーディオアーキテクチャは、さらに、オーディオの記録を試みる多数のアプリケーションをサポートすることができ、リアルタイムオーディオ記録をサポートすることができる。オーディオアーキテクチャは、多数のアプリケーションへのオーディオデータの転送、および、データ転送成功を受けたアプリケーションへの通知の提供もサポートすることができる。

【0068】

図７は、例示的な伝搬ルータアーキテクチャを示す。オーディオアーキテクチャの特定の実施形態において、ドライバ７３０は、世界固定オーディオをレンダリングするためのモノラルオーディオストリーム７７０、直接伝播インパルス応答７７２、および残響インパルス応答７７４を受信することができる。伝搬ルータ７１２は、オーディオ源７２２の世界固定ロケーションを、ＳＬＡＭ／ＩＭＵによって生成されるメッシュ７２０とともに使用して、ドライバ７３０に提供するための直接伝播インパルス応答７７２および残響インパルス応答７７４を生成することができる。特定の実施形態において、ロケーションデータは、アプリケーションによって提供され得る。インパルス応答７７２、７７４は、正確な空間オーディオを作成するために、ユーザロケーションおよびユーザ姿勢（同じくＳＬＡＭ／ＩＭＵから受信される）ならびにＨＲＴＦと組み合わせることができる。世界固定オーディオオブジェクトと関連付けられる空間オーディオの生成は、計算集約的であり得る。したがって、本明細書において言及されているように、世界固定オーディオオブジェクトの数が制限され得る。

【0069】

図８は、例示的なコンピュータシステム８００を示す。特定の実施形態において、１つまたは複数のコンピュータシステム８００は、本明細書において記載または例示されている１つまたは複数の方法の１つまたは複数のステップを実施する。特定の実施形態において、１つまたは複数のコンピュータシステム８００は、本明細書において記載または例示されている機能を提供する。特定の実施形態において、１つまたは複数のコンピュータシステム８００上で作動しているソフトウェアは、本明細書において記載もしくは例示されている１つまたは複数の方法の１つまたは複数のステップを実施するか、または、本明細書において記載もしくは例示されている機能を提供する。特定の実施形態は、１つまたは複数のコンピュータシステム８００の１つまたは複数の部分を含む。本明細書において、適切な場合、コンピュータシステムへの参照は、コンピューティングデバイスを包含し得、逆も真である。さらに、適切な場合、コンピュータシステムへの参照は、１つまたは複数のコンピューティングシステムを包含し得る。

【0070】

本開示は、任意の適切な数のコンピュータシステム８００を企図する。本開示は、任意の適切な物理的形態をとるコンピュータシステム８００を企図する。限定ではなく一例として、コンピュータシステム８００は、内蔵コンピュータシステム、システムオンチップ（ＳＯＣ）、シングルボードコンピュータシステム（ＳＢＣ）（例えば、コンピュータオンモジュール（ＣＯＭ）またはシステムオンモジュール（ＳＯＭ）など）、デスクトップコンピュータシステム、ラップトップもしくはノートブックコンピュータシステム、対話型キオスク、メインフレーム、コンピュータシステムのメッシュ、携帯電話、個人情報端末（ＰＤＡ）、サーバ、タブレットコンピュータシステム、人工／仮想現実デバイス、または、上記のうちの２つ以上の組み合わせであってもよい。適切な場合、コンピュータシステム８００は、１つまたは複数のコンピュータシステム８００を含んでもよく、単一もしくは分散されてもよく、複数のロケーションにまたがってもよく、複数の機械にまたがってもよく、複数のデータセンターにまたがってもよく、または、１つまたは複数のネットワーク内の１つまたは複数のクラウド構成要素を含み得るクラウド内に存在してもよい。適切な場合、１つまたは複数のコンピュータシステム８００は、実質的な空間的または時間的制限なしに、本明細書において記載または例示されている１つまたは複数の方法の１つまたは複数のステップを実施することができる。限定ではなく一例として、１つまたは複数のコンピュータシステム８００は、本明細書において記載または例示されている１つまたは複数の方法の１つまたは複数のステップを、リアルタイムでまたはバッチモードにおいて実施することができる。１つまたは複数のコンピュータシステム８００は、適切な場合、本明細書において記載または例示されている１つまたは複数の方法の１つまたは複数のステップを、異なる時点においてまたは異なるロケーションにおいて実施することができる。

【0071】

特定の実施形態において、コンピュータシステム８００は、プロセッサ８０２、メモリ８０４、記憶装置８０６、入出力（Ｉ／Ｏ）インターフェース８０８、通信インターフェース８１０、およびバス８１２を含む。本開示は、特定の構成にある特定の数の特定の構成要素を有する特定のコンピュータシステムを記載および例示しているが、本開示は、任意の適切な構成にある任意の適切な数の任意の適切な構成要素を有する任意の適切なコンピュータシステムを企図している。

【0072】

特定の実施形態において、プロセッサ８０２は、コンピュータプログラムを構成する命令などの命令を実行するためのハードウェアを含む。限定ではなく一例として、命令を実行するために、プロセッサ８０２は、内部レジスタ、内部キャッシュ、メモリ８０４、または記憶装置８０６から命令を取り出し（またはフェッチし）、命令を復号および実行し、次いで、１つまたは複数の結果を内部レジスタ、内部キャッシュ、メモリ８０４、または記憶装置８０６に書き込むことができる。特定の実施形態において、プロセッサ８０２は、データ、命令、またはアドレスのための１つまたは複数の内部キャッシュを含むことができる。本開示は、適切な場合、任意の適切な数の任意の適切な内部キャッシュを含むプロセッサ８０２を企図している。限定ではなく一例として、プロセッサ８０２は、１つまたは複数の命令キャッシュ、１つまたは複数のデータキャッシュ、および１つまたは複数のトランスレーションルックアサイドバッファ（ＴＬＢ）を含むことができる。命令キャッシュ内の命令は、メモリ８０４または記憶装置８０６内の命令のコピーとすることができ、命令キャッシュは、プロセッサ８０２による当該命令の取り出しを加速させることができる。プロセッサ８０２において実行する命令が、プロセッサ８０２において実行する後続の命令によるアクセスまたはメモリ８０４もしくは記憶装置８０６への書き込みのための、プロセッサ８０２において実行されている以前の命令の結果、あるいは、他の適切なデータに対して動作するために、データキャッシュ内のデータは、メモリ８０４または記憶装置８０６内のデータのコピーとすることができる。データキャッシュは、プロセッサ８０２による読み出しまたは書き込み動作を加速させることができる。ＴＬＢは、プロセッサ８０２の仮想アドレス変換を加速させることができる。特定の実施形態において、プロセッサ８０２は、データ、命令、またはアドレスのための１つまたは複数の内部レジスタを含むことができる。本開示は、適切な場合、任意の適切な数の任意の適切な内部レジスタを含むプロセッサ８０２を企図している。適切な場合、プロセッサ８０２は、１つまたは複数の算術論理演算ユニット（ＡＬＵ）を含んでもよく、マルチコアプロセッサであってもよく、または、１つまたは複数のプロセッサ８０２を含んでもよい。本開示は、特定のプロセッサを記載および例示しているが、本開示は、任意の適切なプロセッサを企図している。

【0073】

特定の実施形態において、メモリ８０４は、プロセッサ８０２が実行するための命令またはプロセッサ８０２が動作するためのデータを記憶するための主記憶装置を含む。限定ではなく一例として、コンピュータシステム８００は、記憶装置８０６または別のソース（例えば、別のコンピュータシステム８００など）からメモリ８０４へと命令をロードすることができる。次いで、プロセッサ８０２は、メモリ８０４から内部レジスタまたは内部キャッシュへと命令をロードすることができる。命令を実行するために、プロセッサ８０２は、内部レジスタまたは内部キャッシュから命令を取り出し、命令を復号することができる。命令の実行中または実行後、プロセッサ８０２は、１つまたは複数の結果（中間または最終結果であり得る）を内部レジスタまたは内部キャッシュに書き込むことができる。次いで、プロセッサ８０２は、当該結果のうちの１つまたは複数をメモリ８０４に書き込むことができる。特定の実施形態において、プロセッサ８０２は、１つまたは複数の内部レジスタもしくは内部キャッシュまたはメモリ８０４内の（記憶装置８０６または他の場所とは対照的に）命令のみを実行し、１つまたは複数の内部レジスタもしくは内部キャッシュまたはメモリ８０４内の（記憶装置８０６または他の場所とは対照的に）データに対してのみ動作する。１つまたは複数のメモリバス（各々がアドレスバスおよびデータバスを含み得る）は、プロセッサ８０２をメモリ８０４に結合することができる。バス８１２は、後述するように、１つまたは複数のメモリバスを含んでもよい。特定の実施形態において、１つまたは複数のメモリ管理ユニット（ＭＭＵ）が、プロセッサ８０２とメモリ８０４との間に存在し、プロセッサ８０２似よって要求されるメモリ８０４へのアクセスを容易にする。特定の実施形態において、メモリ８０４は、ランダムアクセスメモリ（ＲＡＭ）を含む。当該ＲＡＭは、適切な場合、揮発性メモリであってもよい。適切な場合、当該ＲＡＭは、ダイナミックＲＡＭ（ＤＲＡＭ）またはスタティックＲＡＭ（ＳＲＡＭ）であってもよい。さらに、適切な場合、当該ＲＡＭは、シングルポートまたはマルチポートＲＡＭであってもよい。本開示は、任意の適切なＲＡＭを企図する。メモリ８０４は、適切な場合、１つまたは複数のメモリ８０４を含んでもよい。本開示は、特定のメモリを記載および例示しているが、本開示は、任意の適切なメモリを企図している。

【0074】

特定の実施形態において、記憶装置８０６は、データまたは命令のための大容量記憶装置を含む。限定ではなく一例として、記憶装置８０６は、ハードディスクドライブ（ＨＤＤ）、フロッピーディスク（商標）ドライブ、フラッシュメモリ、光ディスク、磁気光ディスク、磁気テープ、もしくはユニバーサルシリアルバス（ＵＳＢ）ドライブまたは上記のうちの２つ以上の組み合わせを含んでもよい。記憶装置８０６は、適切な場合、取り外し可能または取り外し不能（または固定）媒体を含んでもよい。記憶装置８０６は、適切な場合、コンピュータシステム８００の内部または外部にあってもよい。特定の実施形態において、記憶装置８０６は、不揮発性ソリッドステートメモリである。特定の実施形態において、記憶装置８０６は、読み出し専用メモリ（ＲＯＭ）を含む。適切な場合、当該ＲＯＭは、マスクプログラムＲＯＭ、プラグラム可能ＲＯＭ（ＰＲＯＭ）、消去可能ＰＲＯＭ（ＥＰＲＯＭ）、電気的消去可能ＰＲＯＭ（ＥＥＰＲＯＭ）、電気的消去再書き込みＲＯＭ（ＥＡＲＯＭ）、もしくはフラッシュメモリまたは上記のうちの２つ以上の組み合わせであってもよい。本開示は、任意の適切な物理的形態をとる大容量記憶装置８０６を企図する。記憶装置８０６は、適切な場合、プロセッサ８０２と記憶装置８０６との間の通信を容易にする１つまたは複数の記憶装置制御ユニットを含んでもよい。適切な場合、記憶装置８０６は、１つまたは複数の記憶装置８０６を含んでもよい。本開示は、特定の記憶装置を記載および例示しているが、本開示は、任意の適切な記憶装置を企図している。

【0075】

特定の実施形態において、Ｉ／Ｏインターフェース８０８は、コンピュータシステム８００と１つまたは複数のＩ／Ｏデバイスとの間の通信のための１つまたは複数のインターフェースを提供するハードウェア、ソフトウェア、または両方を含む。コンピュータシステム８００は、適切な場合、当該Ｉ／Ｏデバイスのうちの１つまたは複数を含んでもよい。当該Ｉ／Ｏデバイスのうちの１つまたは複数は、人間とコンピュータシステム８００との間の通信を可能にすることができる。限定ではなく一例として、Ｉ／Ｏデバイスは、キーボード、キーパッド、マイクロフォン、モニタ、マウス、プリンタ、スキャナ、スピーカ、静止カメラ、スタイラス、タブレット、タッチスクリーン、トラックボール、ビデオカメラ、別の適切なＩ／Ｏデバイスまたは上記のうちの２つ以上の組み合わせを含んでもよい。Ｉ／Ｏデバイスは１つまたは複数のセンサを含むことができる。本開示は、任意の適切なＩ／Ｏデバイスおよび当該デバイスのための任意の適切なＩ／Ｏインターフェース８０８を企図している。適切な場合、Ｉ／Ｏインターフェース８０８は、プロセッサ８０２が当該Ｉ／Ｏデバイスのうちの１つまたは複数を駆動することを可能にする１つまたは複数のデバイスまたはソフトウェアドライバを含むことができる。Ｉ／Ｏインターフェース８０８は、適切な場合、１つまたは複数のＩ／Ｏインターフェース８０８を含んでもよい。本開示は、特定のＩ／Ｏインターフェースを記載および例示しているが、本開示は、任意の適切なＩ／Ｏインターフェースを企図している。

【0076】

特定の実施形態において、通信インターフェース８１０は、コンピュータシステム８００と１つもしくは複数の他のコンピュータシステム８００または１つもしくは複数のネットワークとの間の通信（例えば、パケットベースの通信など）のための１つもしくは複数のインターフェースを提供するハードウェア、ソフトウェア、または両方を含む。限定ではなく一例として、通信インターフェース８１０は、イーサネットもしくは他の有線ベースのネットワークと通信するためのネットワークインターフェースコントローラ（ＮＩＣ）もしくはネットワークアダプタ、または、Ｗｉ－Ｆｉネットワークなどの無線ネットワークと通信するための無線ＮＩＣ（ＷＮＩＣ）もしくは無線アダプタを含んでもよい。本開示は、任意の適切なネットワークおよび当該ネットワークのための任意の適切な通信インターフェース８１０を企図している。限定ではなく一例として、コンピュータシステム８００は、アドホックネットワーク、パーソナルエリアネットワーク（ＰＡＮ）、ローカルエリアネットワーク（ＬＡＮ）、広域ネットワーク（ＷＡＮ）、都市規模ネットワーク（ＭＡＮ）、またはインターネットの１つもしくは複数の部分、または、上記のうちの２つ以上の組み合わせと通信することができる。１つまたは複数の上記ネットワークの１つまたは複数の部分は、有線または無線であってもよい。一例として、コンピュータシステム８００は、無線ＰＡＮ（ＷＰＡＮ）（例えば、ＢＬＵＥＴＯＯＴＨＷＰＡＮなど）、Ｗｉ－Ｆｉネットワーク、ＷｉＭＡＸネットワーク、携帯電話回線網（例えば、汎欧州デジタル移動電話方式（ＧＳＭ）ネットワークなど）、もしくは他の適切な無線ネットワーク、または、上記のうちの２つ以上の組み合わせと通信することができる。コンピュータシステム８００は、適切な場合、上記ネットワークのうちのいずれかのための任意の適切な通信インターフェース８１０を含むことができる。通信インターフェース８１０は、適切な場合、１つまたは複数の通信インターフェース８１０を含んでもよい。本開示は、特定の通信インターフェースを記載および例示しているが、本開示は、任意の適切な通信インターフェースを企図している。

【0077】

特定の実施形態において、バス８１２は、コンピュータシステム８００の構成要素を互いに結合するハードウェア、ソフトウェア、または両方を含む。限定ではなく一例として、バス８１２は、アクセラレーテッドグラフィックスポート（ＡＧＰ）もしくは他のグラフィックスバス、拡張業界標準アーキテクチャ（ＥＩＳＡ）バス、フロントサイドバス（ＦＳＢ）、ＨＹＰＥＲＴＲＡＮＳＰＯＲＴ（ＨＴ）相互接続、業界標準アーキテクチャ（ＩＳＡ）バス、ＩＮＦＩＮＩＢＡＮＤ相互接続、低ピン数（ＬＰＣ）バス、メモリバス、マイクロチャネルアーキテクチャ（ＭＣＡ）バス、周辺構成要素相互接続（ＰＣＩ）バス、ＰＣＩ－Ｅｘｐｒｅｓｓ（ＰＣＩｅ）バス、シリアルアドバンスドテクノロジーアタッチメント（ＳＡＴＡ）バス、ビデオエレクトロニクススタンダードアソシエーションローカル（ＶＬＢ）バス、もしくは別の適切なバス、または、上記のうちの２つ以上の組み合わせを含んでもよい。バス８１２は、適切な場合、１つまたは複数のバス８１２を含んでもよい。本開示は、特定のバスを記載および例示しているが、本開示は、任意の適切なバスまたは相互接続を企図している。

【0078】

本明細書において、１つまたは複数のコンピュータ可読非一時的記憶媒体は、適切な場合、１つもしくは複数の半導体ベースのもしくは他の集積回路（ＩＣ）（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）または特定用途向けＩＣ（ＡＳＩＣ）など）、ハードディスクドライブ（ＨＤＤ）、ハイブリッドハードドライブ（ＨＨＤ）、光ディスク、光ディスクドライブ（ＯＤＤ）、磁気光ディスク、磁気光ドライブ、フロッピーディスク（商標）ディスケット、フロッピーディスク（商標）ドライブ（ＦＤＤ）、磁気テープ、ソリッドステートドライブ（ＳＳＤ）、ＲＡＭドライブ、ＳＥＣＵＲＥＤＩＧＩＴＡＬカードもしくはドライブ、任意の他の適切なコンピュータ可読非一時的記憶媒体、または、上記のうちの２つ以上の任意の適切な組み合わせを含んでもよい。コンピュータ可読非一時的記憶媒体は、適切な場合、揮発性、不揮発性、または揮発性と不揮発性との組み合わせであってもよい。

【0079】

本発明の実施形態は、人工現実システムを含んでもよく、または、人工現実システムと併せて実施されてもよい。人工現実は、例えば、仮想現実（ＶＲ）、人工現実（ＡＲ）、複合現実（ＭＲ）、ハイブリッド現実、またはそれらの何らかの組み合わせおよび／もしくは派生形を含むことができ、ユーザにて維持される前に何らかの様式で調整されている現実感の一形態である。人工現実コンテンツは、全体が生成されているコンテンツ、または、キャプチャされたコンテンツ（例えば、実世界の写真）と組み合わされた、生成されているコンテンツを含み得る。人工現実コンテンツは、ビデオ、オーディオ、触覚フィードバック、またはそれらの何らかの組み合わせを含むことができ、それらのいずれかは、単一のチャネルまたは複数のチャネル（受け手に対して三次元効果を生成するステレオビデオなど）において提示することができる。付加的に、いくつかの実施形態において、人工現実は、例えば、人工現実内のコンテンツを生成するために使用され、および／または、人工現実において使用される（例えば、人工現実における活動を実施する）ために使用される、アプリケーション、製品、アクセサリ、サービス、またはそれらの何らかの組み合わせと関連付けることができる。人工現実コンテンツを提供する人工現実システムは、ホストコンピュータシステムに接続されているヘッドマウントディスプレイ（ＨＭＤ）、独立型ＨＭＤ、モバイルデバイスもしくはコンピューティングシステム、または、１人もしくは複数の受け手に人工現実コンテンツを提供することが可能な任意の他のハードウェアプラットフォームを含む、様々なプラットフォーム上に実装することができる。

【0080】

本明細書において、明示的に別途示されていない限り、または、文脈によって別途示されていない限り、「または」は包含的であって排他的ではない。したがって、本明細書において、明示的に別途示されていない限り、または、文脈によって別途示されていない限り、「ＡまたはＢ」は、「Ａ、Ｂ、または両方」を意味する。さらに、本明細書において、明示的に別途示されていない限り、または、文脈によって別途示されていない限り、「および」は合同と個別の両方である。したがって、本明細書において、明示的に別途示されていない限り、または、文脈によって別途示されていない限り、「ＡおよびＢ」は、合同でまたは個別に「ＡおよびＢ」を意味する。

【0081】

本開示の範囲は、当業者が把握する、本明細書において記載または例示されている例示的な実施形態に対するすべての変化、置換、変形、改変、および修正を包含する。本開示の範囲は、本明細書において記載または例示されている例示的な実施形態に限定されない。さらに、本開示は、本明細書におけるそれぞれの実施形態を、特定の構成要素、要素、特徴、機能、動作、またはステップを含むものとして記載および例示しているが、当該実施形態はいずれも、当業者が把握する、本明細書のいずれかの箇所に記載または例示されている構成要素、要素、特徴、機能、動作、またはステップの任意の組み合わせまたは配列を含んでもよい。さらに、特定の機能を実施するように適合されている、実施するように配置構成されている、実施することが可能である、実施するように動作可能である、または実施するように動作する、装置もしくはシステムまたは装置もしくはシステムの構成要素に対する添付の特許請求の範囲における参照は、装置、システム、または構成要素がそのように適合されている、そのように配置構成されている、それが可能である、そのように構成されている、それを可能にされている、そのように動作可能である、またはそのように動作する限り、装置、システム、構成要素またはその特定の機能が起動されているか、オンにされているか、または、ロック解除されているか否かにかかわらず、その装置、システム、構成要素を包含する。加えて、本開示は、特定の実施形態を、特定の利点を提供するものとして記載または例示しているが、特定の実施形態は、当該利点を一切提供しなくてもよく、一部を提供してもよく、またはすべて提供してもよい。

【図1】