(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-03-22
(54)【発明の名称】頭部伝達関数へのヘッドセットの影響を補償すること
(51)【国際特許分類】
H04S 7/00 20060101AFI20220314BHJP
H04S 1/00 20060101ALI20220314BHJP
【FI】
H04S7/00 340
H04S1/00 500
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021531108
(86)(22)【出願日】2020-01-14
(85)【翻訳文提出日】2021-07-29
(86)【国際出願番号】 US2020013539
(87)【国際公開番号】W WO2020159697
(87)【国際公開日】2020-08-06
(32)【優先日】2019-01-30
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-09-06
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】515046968
【氏名又は名称】フェイスブック・テクノロジーズ・リミテッド・ライアビリティ・カンパニー
【氏名又は名称原語表記】FACEBOOK TECHNOLOGIES, LLC
(74)【代理人】
【識別番号】110002974
【氏名又は名称】特許業務法人World IP
(72)【発明者】
【氏名】アロン, デイヴィッド ルー
(72)【発明者】
【氏名】クエバス ロドリゲス, マリア
(72)【発明者】
【氏名】メーラ, ラビッシュ
(72)【発明者】
【氏名】ロビンソン, フィリップ
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA07
5D162AA09
5D162AA18
5D162BA07
5D162CA26
5D162CC19
5D162CD07
5D162CD25
5D162DA02
5D162DA04
5D162EA05
5D162EG06
(57)【要約】
オーディオシステムが、ユーザによって装着されるヘッドセットのマイクロフォンを通してテスト音のオーディオデータをキャプチャする。テスト音は外部スピーカーによって再生され、オーディオデータは、外部スピーカーに対するヘッドセットの種々の配向についてキャプチャされるオーディオデータを含む。頭部伝達関数(HRTF)のセットが、ヘッドセットの種々の配向におけるテスト音のオーディオデータに少なくとも部分的に基づいて算出される。HRTFの中間セットを作成するために、HRTFのセットの一部分が廃棄される。ヘッドセットを装着することに部分的に基づく1つまたは複数のひずみ領域に対応する廃棄される部分。ユーザについてのHRTFの個別化されたセットを作成するために、HRTFの中間セットのうちの少なくとも一部を使用して、廃棄される部分に対応する1つまたは複数のHRTFが生成される。
【選択図】
図6
【特許請求の範囲】
【請求項1】
ユーザによって装着されるヘッドセットのマイクロフォンを通してテスト音のオーディオデータをキャプチャすることであって、前記テスト音が外部スピーカーによって再生され、前記オーディオデータが、前記外部スピーカーに対する前記ヘッドセットの種々の配向についてキャプチャされるオーディオデータを含む、オーディオデータをキャプチャすることと、
前記ヘッドセットの前記種々の配向における前記テスト音の前記オーディオデータに少なくとも部分的に基づいて、頭部伝達関数(HRTF:head-related transfer function)のセットを算出することであって、HRTFのセットが、前記ヘッドセットを装着している間のユーザに対して個別化される、頭部伝達関数(HRTF)のセットを算出することと、
HRTFの中間セットを作成するためにHRTFの前記セットの一部分を廃棄することであって、前記廃棄される部分が、前記ヘッドセットを装着することに部分的に基づく1つまたは複数のひずみ領域に対応する、HRTFの前記セットの一部分を廃棄することと、
前記ユーザについてのHRTFの個別化されたセットを作成するために、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する1つまたは複数のHRTFを生成することと
を含む、方法。
【請求項2】
前記廃棄される部分が、前記1つまたは複数のひずみ領域を識別するひずみマッピングを使用して決定され、前記ひずみマッピングが、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較に部分的に基づく、請求項1に記載の方法。
【請求項3】
前記廃棄される部分は、前記外部スピーカーからの音が前記ユーザの耳道に達するより前に前記ヘッドセットに入射した、前記ヘッドセットの配向に対応する少なくとも一部のHRTFを含む、請求項1に記載の方法。
【請求項4】
HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する前記1つまたは複数のHRTFを前記生成することが、
前記廃棄される部分に対応する前記1つまたは複数のHRTFを生成するためにHRTFの前記中間セットのうちの少なくとも一部を補間すること
を含む、請求項1に記載の方法。
【請求項5】
前記外部スピーカーに対する前記ヘッドセットの種々の配向について前記オーディオデータをキャプチャすることは、
仮想空間の座標においてインジケータを生成することであって、前記インジケータが、外部スピーカーに対する、前記ユーザによって装着される前記ヘッドセットの特定の配向に対応する、インジケータを生成することと、
前記ヘッドセットのディスプレイ上に、前記仮想空間中の前記座標の前記インジケータを提示することと、
前記外部スピーカーに対する前記ヘッドセットの第1の配向が前記特定の配向であると決定することと、
前記ヘッドセットが前記第1の配向にある間にテスト音を再生するように前記外部スピーカーに命令することと、
前記マイクロフォンから前記オーディオデータを取得することと
をさらに含む、請求項1に記載の方法。
【請求項6】
HRTFシステムにHRTFの前記個別化されたセットをアップロードすることであって、前記HRTFシステムが、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較から生成されるひずみマッピングを更新するために、HRTFの前記個別化されたセットのうちの少なくとも一部を使用する、HRTFの前記個別化されたセットをアップロードすること
をさらに含む、請求項1に記載の方法。
【請求項7】
実行可能コンピュータプログラム命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令は、
ユーザによって装着されるヘッドセットのマイクロフォンを通してテスト音のオーディオデータをキャプチャすることであって、前記テスト音が外部スピーカーによって再生され、前記オーディオデータが、前記外部スピーカーに対する前記ヘッドセットの種々の配向についてキャプチャされるオーディオデータを含む、オーディオデータをキャプチャすることと、
前記ヘッドセットの前記種々の配向における前記テスト音の前記オーディオデータに少なくとも部分的に基づいて、頭部伝達関数(HRTF)のセットを算出することであって、HRTFの前記セットが、前記ヘッドセットを装着している間のユーザに対して個別化される、頭部伝達関数(HRTF)のセットを算出することと、
HRTFの中間セットを作成するためにHRTFの前記セットの一部分を廃棄することであって、前記廃棄される部分が、前記ヘッドセットを装着することに部分的に基づく1つまたは複数のひずみ領域に対応する、HRTFの前記セットの一部分を廃棄することと、
前記ユーザについてのHRTFの個別化されたセットを作成するために、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する1つまたは複数のHRTFを生成することと
を含むステップを実施するために実行可能である、非一時的コンピュータ可読記憶媒体。
【請求項8】
前記廃棄される部分が、前記1つまたは複数のひずみ領域を識別するひずみマッピングを使用して決定され、前記ひずみマッピングが、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較に部分的に基づく、請求項7に記載の非一時的コンピュータ可読記憶媒体。
【請求項9】
前記廃棄される部分は、前記外部スピーカーからの音が前記ユーザの耳道に達するより前に前記ヘッドセットに入射した、前記ヘッドセットの配向に対応する少なくとも一部のHRTFを含む、請求項7に記載の非一時的コンピュータ可読記憶媒体。
【請求項10】
HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する前記1つまたは複数のHRTFを前記生成することが、
前記廃棄される部分に対応する前記1つまたは複数のHRTFを生成するためにHRTFの前記中間セットのうちの少なくとも一部を補間すること
を含む、請求項7に記載の非一時的コンピュータ可読記憶媒体。
【請求項11】
前記外部スピーカーに対する前記ヘッドセットの種々の配向について前記オーディオデータをキャプチャすることは、
仮想空間の座標においてインジケータを生成することであって、前記インジケータが、外部スピーカーに対する、前記ユーザによって装着されるヘッドセットの特定の配向に対応する、インジケータを生成することと、
前記ヘッドセットのディスプレイ上に、前記仮想空間中の前記座標の前記インジケータを提示することと、
前記外部スピーカーに対する前記ヘッドセットの第1の配向が前記特定の配向であると決定することと、
前記ヘッドセットが前記第1の配向にある間にテスト音を再生するように前記外部スピーカーに命令することと、
前記マイクロフォンから前記オーディオデータを取得することと
をさらに含む、請求項7に記載の非一時的コンピュータ可読記憶媒体。
【請求項12】
HRTFシステムにHRTFの前記個別化されたセットをアップロードすることであって、前記HRTFシステムが、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較から生成されるひずみマッピングを更新するために、HRTFの前記個別化されたセットのうちの少なくとも一部を使用する、HRTFの前記個別化されたセットをアップロードすること
をさらに含む、請求項7に記載の非一時的コンピュータ可読記憶媒体。
【請求項13】
1つまたは複数のテスト音を再生するように構成された外部スピーカーと、
前記1つまたは複数のテスト音のオーディオデータをキャプチャするように構成されたマイクロフォンアセンブリと、
ユーザによって装着されるように構成され、オーディオコントローラを備えるヘッドセットと
を備えるシステムであって、前記オーディオコントローラは、
前記テスト音の前記オーディオデータと前記ヘッドセットの複数の異なる配向とに少なくとも部分的に基づいて、頭部伝達関数(HRTF)のセットを算出することであって、HRTFの前記セットが、前記ヘッドセットを装着している間のユーザに対して個別化される、頭部伝達関数(HRTF)のセットを算出することと、
HRTFの中間セットを作成するためにHRTFの前記セットの一部分を廃棄することであって、前記部分が、前記ヘッドセットを装着することに部分的に基づく1つまたは複数のひずみ領域に対応する、HRTFの前記セットの一部分を廃棄することと、
前記ユーザについてのHRTFの個別化されたセットを作成するために、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する1つまたは複数のHRTFを生成することと
を行うように構成された、システム。
【請求項14】
前記廃棄される部分が、前記1つまたは複数のひずみ領域を識別するひずみマッピングを使用して決定され、前記ひずみマッピングが、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較に部分的に基づく、請求項13に記載のシステム。
【請求項15】
前記廃棄される部分は、前記外部スピーカーからの音が前記ユーザの耳道に達するより前に前記ヘッドセットに入射した、前記ヘッドセットの配向に対応する少なくとも一部のHRTFを含む、請求項13に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、その全体が参照により本明細書に組み込まれる、2019年1月30日に出願された米国仮出願第62/798,813号および2019年9月6日に出願された米国非仮出願第16/562,616号の利益および優先権を主張する。
【0002】
本開示は、一般に頭部伝達関数(HRTF:head-related transfer function)に関し、詳細には、HRTFへのヘッドセットの影響を補償することに関する。
【背景技術】
【0003】
従来、人に対する多くの(たとえば、典型的には100超の)異なるソースロケーションについて、頭部伝達関数(HRTF)が、消音室(sound dampening chamber)において決定される。決定されたHRTFは、次いで、空間化されたオーディオコンテンツを人に提供するために使用され得る。その上、誤差を低減するために、各ソースロケーション(すなわち、各スピーカーが複数の個別音を生成している)について複数のHRTFを決定することは、一般的である。したがって、オーディオコンテンツの高品質空間化の場合、多くの異なるスピーカーロケーションについて決定される複数のHRTFがあるとき、HRTFを決定するのに比較的長い時間(たとえば、1時間超)がかかる。さらに、良質のサラウンド音のために十分なHRTFを測定するためのインフラストラクチャは、かなり複雑である(たとえば、消音室、1つまたは複数のスピーカーアレイなど)。したがって、HRTFを取得するための従来の手法は、必要とされるハードウェアリソースおよび/または時間に関して非効率的である。
【発明の概要】
【0004】
実施形態は、ユーザについてのHRTFの個別化されたセットを取得するためのシステムおよび方法に関する。一実施形態では、HRTFシステムはひずみ領域のセットを決定し、ひずみ領域は、ヘッドセットの存在によって音が一般的にひずませられる部分HRTFである。HRTFシステムは、ヘッドセットを着けているテストユーザと、ヘッドセットを外しているテストユーザの両方の母集団についてのオーディオテストデータをキャプチャする。オーディオテストデータは、HRTFのセットを決定するために使用される。テストユーザの母集団について、ヘッドセットを着けているテストユーザのHRTFのセットとヘッドセットを着けていないテストユーザのHRTFのセットとを分析し、比較することは、テストユーザの母集団について一般的であるひずんだHRTFの周波数依存領域および方向的依存領域を決定する。
【0005】
人工現実システムのオーディオシステムは、ひずみ領域をなくすことによってHRTFのセットのひずみを補償する。ユーザは、ユーザの耳道中の音をキャプチャするための手段(すなわち、マイクロフォン)を装備したヘッドセットを装着する。オーディオシステムは、外部スピーカーを通してテスト音を再生し、外部スピーカーに対する種々の方向的配向についてユーザの耳の中でテスト音がどのようにキャプチャされるかのオーディオデータを記録する。各測定された方向について、初期HRTFが算出され、これは、HRTFの初期セットを形成する。ひずみ領域に対応するHRTFの初期セットの部分は、廃棄される。廃棄された領域は、ヘッドセットひずみを補償するHRTFの個別化されたセットを算出するために補間される。
【0006】
上記で説明された問題は、以下の請求項のうちの少なくとも1つに従って、本発明によって解決される。
【0007】
本発明のいくつかの実装形態によれば、方法は、ユーザによって装着されるヘッドセットのマイクロフォンを通してテスト音のオーディオデータをキャプチャするステップであって、前記テスト音が外部スピーカーによって再生され、前記オーディオデータが、前記外部スピーカーに対する前記ヘッドセットの種々の配向についてキャプチャされるオーディオデータを含む、オーディオデータをキャプチャするステップと、前記ヘッドセットの種々の配向におけるテスト音の前記オーディオデータに少なくとも部分的に基づいて、頭部伝達関数(HRTF)のセットを算出するステップであって、HRTFの前記セットが、前記ヘッドセットを装着している間のユーザに対して個別化される、頭部伝達関数(HRTF)のセットを算出するステップと、HRTFの中間セットを作成するためにHRTFの前記セットの一部分を廃棄するステップであって、前記廃棄される部分が、前記ヘッドセットを装着することに部分的に基づく1つまたは複数のひずみ領域に対応する、HRTFの前記セットの一部分を廃棄するステップと、前記ユーザについてのHRTFの個別化されたセットを作成するために、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する1つまたは複数のHRTFを生成するステップとを含む。
【0008】
本発明の1つの可能な実装形態によれば、前記廃棄される部分は、前記1つまたは複数のひずみ領域を識別するひずみマッピングを使用して決定され、前記ひずみマッピングは、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較に部分的に基づく。
【0009】
本発明の1つの可能な実装形態によれば、前記ひずみマッピングは、異なる物理的特性に各々関連する複数のひずみマッピングのうちの1つであり、前記方法は、前記ユーザの特性に基づくクエリを生成することであって、前記クエリが、前記ひずみマッピングに関連する特性に対応する前記ユーザの前記特性に基づいて前記ひずみマッピングを識別するために使用される、クエリを生成することをさらに含む。
【0010】
本発明の1つの可能な実装形態によれば、前記廃棄される部分は、前記外部スピーカーからの音が前記ユーザの耳道に達するより前に前記ヘッドセットに入射した、前記ヘッドセットの配向に対応する少なくとも一部のHRTFを含む。
【0011】
本発明の1つの可能な実装形態によれば、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する前記1つまたは複数のHRTFを生成する前記ステップは、前記廃棄される部分に対応する前記1つまたは複数のHRTFを生成するためにHRTFの前記中間セットのうちの少なくとも一部を補間することを含む。
【0012】
本発明の1つの可能な実装形態によれば、前記外部スピーカーに対する前記ヘッドセットの種々の配向について前記オーディオデータをキャプチャする前記ステップは、仮想空間の座標においてインジケータを生成することであって、前記インジケータが、外部スピーカーに対する、前記ユーザによって装着される前記ヘッドセットの特定の配向に対応する、インジケータを生成することと、前記ヘッドセットのディスプレイ上に、前記仮想空間中の前記座標の前記インジケータを提示することと、前記外部スピーカーに対する前記ヘッドセットの第1の配向が特定の配向であると決定することと、前記ヘッドセットが第1の配向にある間にテスト音を再生するように前記外部スピーカーに命令することと、前記マイクロフォンから前記オーディオデータを取得することとをさらに含む。
【0013】
本発明の1つの可能な実装形態によれば、前記方法は、HRTFシステムにHRTFの前記個別化されたセットをアップロードするステップであって、前記HRTFシステムが、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較から生成されるひずみマッピングを更新するために、HRTFの前記個別化されたセットのうちの少なくとも一部を使用する、HRTFの前記個別化されたセットをアップロードするステップをさらに含む。
【0014】
本発明のいくつかの実装形態によれば、実行可能コンピュータプログラム命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令は、ユーザによって装着されるヘッドセットのマイクロフォンを通してテスト音のオーディオデータをキャプチャするステップであって、前記テスト音が外部スピーカーによって再生され、前記オーディオデータが、前記外部スピーカーに対する前記ヘッドセットの種々の配向についてキャプチャされるオーディオデータを含む、オーディオデータをキャプチャするステップと、前記ヘッドセットの前記種々の配向における前記テスト音の前記オーディオデータに少なくとも部分的に基づいて、頭部伝達関数(HRTF)のセットを算出するステップであって、HRTFのセットが、前記ヘッドセットを装着している間のユーザに対して個別化される、頭部伝達関数(HRTF)のセットを算出するステップと、HRTFの中間セットを作成するためにHRTFのセットの一部分を廃棄するステップであって、前記廃棄される部分が、前記ヘッドセットを装着することに部分的に基づく1つまたは複数のひずみ領域に対応する、HRTFのセットの一部分を廃棄するステップと、前記ユーザについてのHRTFの個別化されたセットを作成するために、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する1つまたは複数のHRTFを生成するステップとを含むステップを実施するために実行可能である、非一時的コンピュータ可読記憶媒体。
【0015】
本発明の1つの可能な実装形態によれば、前記廃棄される部分は、前記1つまたは複数のひずみ領域を識別するひずみマッピングを使用して決定され、前記ひずみマッピングは、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較に部分的に基づく。
【0016】
本発明の1つの可能な実装形態によれば、前記ひずみマッピングは、異なる物理的特性に各々関連する複数のひずみマッピングのうちの1つであり、方法は、前記ユーザの特性に基づくクエリを生成することであって、前記クエリが、前記ひずみマッピングに関連する特性に対応する前記ユーザの前記特性に基づいて前記ひずみマッピングを識別するために使用される、クエリを生成することをさらに含む。
【0017】
本発明の1つの可能な実装形態によれば、前記廃棄される部分は、前記外部スピーカーからの音が前記ユーザの耳道に達するより前に前記ヘッドセットに入射した、前記ヘッドセットの配向に対応する少なくとも一部のHRTFを含む。
【0018】
本発明の1つの可能な実装形態によれば、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する前記1つまたは複数のHRTFを生成する前記ステップは、前記廃棄される部分に対応する前記1つまたは複数のHRTFを生成するためにHRTFの前記中間セットのうちの少なくとも一部を補間することを含む。
【0019】
本発明の1つの可能な実装形態によれば、前記外部スピーカーに対する前記ヘッドセットの種々の配向について前記オーディオデータをキャプチャする前記ステップは、仮想空間の座標においてインジケータを生成することであって、前記インジケータが、外部スピーカーに対する、前記ユーザによって装着されるヘッドセットの特定の配向に対応する、インジケータを生成することと、前記ヘッドセットのディスプレイ上に、前記仮想空間中の前記座標の前記インジケータを提示することと、前記外部スピーカーに対する前記ヘッドセットの第1の配向が特定の配向であると決定することと、前記ヘッドセットが第1の配向にある間にテスト音を再生するように前記外部スピーカーに命令することと、前記マイクロフォンから前記オーディオデータを取得することとをさらに含む。
【0020】
本発明の1つの可能な実装形態によれば、前記命令は、HRTFシステムにHRTFの前記個別化されたセットをアップロードするステップであって、前記HRTFシステムが、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較から生成されるひずみマッピングを更新するために、HRTFの前記個別化されたセットのうちの少なくとも一部を使用する、HRTFの前記個別化されたセットをアップロードするステップをさらに含む。
【0021】
本発明のいくつかの実装形態によれば、1つまたは複数のテスト音を再生するように構成された外部スピーカーと、1つまたは複数のテスト音のオーディオデータをキャプチャするように構成されたマイクロフォンアセンブリと、ユーザによって装着されるように構成され、オーディオコントローラを備えるヘッドセットとを備えるシステムであって、オーディオコントローラは、前記テスト音の前記オーディオデータと前記ヘッドセットの複数の異なる配向とに少なくとも部分的に基づいて、頭部伝達関数(HRTF)のセットを算出することであって、HRTFのセットが、前記ヘッドセットを装着している間のユーザに対して個別化される、頭部伝達関数(HRTF)のセットを算出することと、HRTFの中間セットを作成するためにHRTFのセットの一部分を廃棄することであって、その部分が、前記ヘッドセットを装着することに部分的に基づく1つまたは複数のひずみ領域に対応する、HRTFのセットの一部分を廃棄することと、前記ユーザについてのHRTFの個別化されたセットを作成するために、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する1つまたは複数のHRTFを生成することとを行うように構成された、システム。
【0022】
本発明の1つの可能な実装形態によれば、前記廃棄される部分は、前記1つまたは複数のひずみ領域を識別するひずみマッピングを使用して決定され、前記ひずみマッピングは、テストヘッドセットを装着している少なくとも1つのテストユーザに関して測定されるHRTFのセットと、前記テストヘッドセットを装着していない前記少なくとも1つのテストユーザに関して測定されるHRTFのセットとの間の比較に部分的に基づく。
【0023】
本発明の1つの可能な実装形態によれば、前記ひずみマッピングは、異なる物理的特性に各々関連する複数のひずみマッピングのうちの1つであり、前記ヘッドセットのオーディオシステムは、サーバに、前記ユーザの特性に基づくクエリを送ることであって、前記クエリが、前記ひずみマッピングに関連する特性に対応する前記ユーザの前記特性に基づいて前記ひずみマッピングを識別するために使用される、クエリを送ることと、前記サーバから、前記ひずみマッピングを受信することとを行うようにさらに構成される。
【0024】
本発明の1つの可能な実装形態によれば、前記廃棄される部分は、前記外部スピーカーからの音が前記ユーザの耳道に達するより前に前記ヘッドセットに入射した、前記ヘッドセットの配向に対応する少なくとも一部のHRTFを含む。
【0025】
本発明の1つの可能な実装形態によれば、前記オーディオコントローラが、HRTFの前記中間セットのうちの少なくとも一部を使用して、前記廃棄される部分に対応する前記1つまたは複数のHRTFを生成することは、前記廃棄される部分に対応する前記1つまたは複数のHRTFを生成するためにHRTFの前記中間セットのうちの少なくとも一部を補間することを含む。
【0026】
本発明の1つの可能な実装形態によれば、前記ヘッドセットは、仮想空間の座標においてインジケータを生成することであって、前記インジケータが、外部スピーカーに対する、前記ユーザによって装着されるヘッドセットの特定の配向に対応する、インジケータを生成することと、前記ヘッドセットのディスプレイ上に、前記仮想空間中の前記座標の前記インジケータを提示することと、前記外部スピーカーに対する前記ヘッドセットの第1の配向が前記特定の配向であると決定することと、前記ヘッドセットが前記第1の配向にある間にテスト音を再生するように前記外部スピーカーに命令することと、前記マイクロフォンから前記オーディオデータを取得することとを行うようにさらに構成される。
【図面の簡単な説明】
【0027】
【
図1A】1つまたは複数の実施形態による、ヘッドセットを装着しているテストユーザに関連するオーディオデータを取得するための音測定システム(SMS)の図である。
【
図1B】1つまたは複数の実施形態による、ヘッドセットを装着していないテストユーザに関連するオーディオデータを取得するように構成された
図1AのSMSの図である。
【
図2】1つまたは複数の実施形態による、HRTFシステムのブロック図である。
【
図3】1つまたは複数の実施形態による、ひずみ領域のセットを決定するためのプロセスを示すフローチャートである。
【
図4A】1つまたは複数の実施形態による、外部スピーカーと生成された仮想空間とを使用して、ヘッドセットを装着しているユーザに関連するオーディオデータを取得するための例示的な人工現実システムの図である。
【
図4B】1つまたは複数の実施形態による、整合プロンプトとインジケータとがヘッドセットによって表示され、ユーザの頭部が正しい配向にない、ディスプレイの図である。
【
図4C】1つまたは複数の実施形態による、ユーザの頭部が正しい配向にある、
図4Bのディスプレイの図である。
【
図5】1つまたは複数の実施形態による、ユーザについての個別化されたHRTFを決定するためのシステムのシステム環境のブロック図である。
【
図6】1つまたは複数の実施形態による、ユーザについての個別化されたHRTFのセットを取得するプロセスを示すフローチャートである。
【
図7A】1つまたは複数の実施形態による、アイウェアデバイスとして実装されるヘッドセットの斜視図である。
【
図7B】1つまたは複数の実施形態による、HMDとして実装されるヘッドセットの斜視図である。
【
図8】1つまたは複数の実施形態による、ヘッドセットとコンソールとを含むシステム環境のブロック図である。
【0028】
図は、単に説明の目的で本開示の実施形態を示す。本明細書で説明される開示の原理またはうたわれている利益から逸脱することなく、本明細書で示される構造および方法の代替実施形態が採用され得ることを、当業者は以下の説明から容易に認識されよう。
【発明を実施するための形態】
【0029】
本開示の実施形態は、人工現実システムを含むか、または人工現実システムとともに実装され得る。人工現実は、ユーザへの提示の前に何らかの様式で調整された形式の現実であり、これは、たとえば、仮想現実(VR)、拡張現実(AR)、複合現実(MR)、ハイブリッド現実、あるいはそれらの何らかの組合せおよび/または派生物を含み得る。人工現実コンテンツは、完全に生成されたコンテンツ、またはキャプチャされた(たとえば、現実世界の)コンテンツと組み合わせられた生成されたコンテンツを含み得る。人工現実コンテンツは、ビデオ、オーディオ、触覚フィードバック、またはそれらの何らかの組合せを含み得、それらのいずれも、単一のチャネルまたは複数のチャネルにおいて提示され得る(観察者に3次元効果をもたらすステレオビデオなど)。さらに、いくつかの実施形態では、人工現実は、たとえば、人工現実におけるコンテンツを作成するために使用される、および/または人工現実において別様に使用される(たとえば、人工現実におけるアクティビティを実施する)アプリケーション、製品、アクセサリ、サービス、またはそれらの何らかの組合せにも関連付けられ得る。人工現実コンテンツを提供する人工現実システムは、ヘッドセット、ホストコンピュータシステムに接続されたヘッドセット、独立型ヘッドセット、モバイルデバイスまたはコンピューティングシステム、あるいは、1人または複数の観察者に人工現実コンテンツを提供することが可能な任意の他のハードウェアプラットフォームを含む、様々なプラットフォーム上に実装され得る。
【0030】
概観
本明細書のHRTFシステムは、ヘッドセットの存在によってひずませられるHRTFの一般的な部分を決定するためにオーディオテストデータを収集するために使用される。HRTFシステムは、ヘッドセットを装着しているテストユーザと、ヘッドセットを着けていないテストユーザの両方に関して、音響室(acoustic chamber)中でテストユーザの耳道においてオーディオテストデータをキャプチャする。オーディオテストデータは、個別化されたHRTFへのヘッドセットの存在の影響を決定するために分析され、比較される。オーディオテストデータは、テストユーザの母集団について収集され、HRTFがヘッドセットの存在によって一般的にひずませられるひずみ領域のセットを決定するために使用される。
【0031】
ヘッドセットのオーディオシステムは、HRTFへのヘッドセットの影響を補償する個別化されたHRTFのセットをユーザについて算出するために、HRTFシステムからの情報を使用する。ユーザはヘッドセットを装着し、オーディオシステムは、外部スピーカーから発せられるテスト音のオーディオデータをキャプチャする。外部スピーカーは、たとえば、ヘッドセットおよびオーディオシステムとは物理的に別個であり得る。オーディオシステムは、ヘッドセットの種々の配向におけるテスト音のオーディオデータに少なくとも部分的に基づいて、初期HRTFのセットを算出する。オーディオシステムは、HRTFの中間セットを作成するために初期HRTFのセットの(HRTFサーバによって決定されたひずみ領域のうちの少なくともいくつかに部分的に基づく)一部分を廃棄する。HRTFの中間セットは、HRTFのセットのうちの廃棄されていないHRTFから形成される。HRTFのセットのうちの廃棄される部分は、ヘッドセットの存在によって引き起こされる1つまたは複数のひずみ領域に対応する。オーディオシステムは、セットの廃棄される部分に対応する1つまたは複数のHRTFを(たとえば、補間を介して)生成し、その1つまたは複数のHRTFは、ユーザについての個別化されたHRTFのセットを作成するために、HRTFの中間セットのうちの少なくとも一部と組み合わせられる。個別化されたHRTFのセットは、ヘッドセットを装着することによって引き起こされるHRTFの誤差が緩和されるようにユーザに対してカスタマイズされ、それにより、ヘッドセットを着けていないユーザの実際のHRTFを模倣する。オーディオシステムは、空間化されたオーディオコンテンツをユーザに提示するために、個別化されたHRTFのセットを使用し得る。空間化されたオーディオコンテンツは、それが3次元空間中の特定のポイントに配置されたかのように提示され得るオーディオである。たとえば、仮想環境中で、ヘッドセットによって表示されている仮想オブジェクトに関連するオーディオは、その仮想オブジェクトから発生しているように思われ得る。
【0032】
このようにして、オーディオシステムは効果的に、ユーザがヘッドセットを装着していても、ユーザについてのHRTFの個別化されたセットを生成することが可能であることに留意されたい。これは、カスタマイズされた消音室中でユーザの実際のHRTFを測定する従来の方法よりもはるかに速く、容易で、安価である。
【0033】
例示的なひずみマッピングシステム
図1Aは、1つまたは複数の実施形態による、ヘッドセット120を装着しているテストユーザ110に関連するオーディオテストデータを取得するための音測定システム(SMS)100の図である。音測定システム100は、(たとえば、
図2に関して以下で説明されるような)HRTFシステムの一部である。SMS100は、スピーカーアレイ130と、バイノーラルマイクロフォン140a、140bとを含む。図示の実施形態では、テストユーザ110は、(たとえば、
図7Aおよび
図7Bに関してより詳細に説明されるような)ヘッドセット120を装着している。ヘッドセット110は、テストヘッドセットと呼ばれることがある。SMS100は、テストユーザ110についてのHRTFのセットを決定するためにオーディオテストデータを測定するために使用される。SMS100は、音響的に処理された室(acoustically treated chamber)中に格納される。特定の一実施形態では、SMS100は、約500ヘルツ(Hz)の周波数まで無響である。
【0034】
いくつかの実施形態では、テストユーザ110は人間である。これらの実施形態では、多数の異なる人々についてのオーディオテストデータを収集することが有用である。人々は、異なる年齢、異なるサイズ、異なる性別の人々である、異なる毛の長さを有する、などであり得る。このようにして、オーディオテストデータは、大きい母集団にわたって収集され得る。他の実施形態では、テストユーザ110はマネキンである。マネキンは、たとえば、平均的な人を表す身体的特徴(たとえば、耳の形状、サイズなど)を有し得る。
【0035】
スピーカーアレイ130は、SMS100のコントローラからの命令に従ってテスト音を発する。テスト音は、HRTFを決定するために使用され得るスピーカーによって送信される可聴信号である。テスト音は、送信の周波数、ボリューム、および長さなど、1つまたは複数の指定された特性を有し得る。テスト音は、たとえば、一定の周波数における連続正弦波、チャープ(chirp)、何らかの他のオーディオコンテンツ(たとえば、音楽)、またはそれらの何らかの組合せを含み得る。チャープは、時間期間の間、周波数が上方または下方へスイープされる信号である。スピーカーアレイ130は、ターゲットエリアに音を投影するために配置される、スピーカー150を含む複数のスピーカーを備える。ターゲットエリアは、SMS100の動作中にテストユーザ110が位置する場所である。複数のスピーカーの各スピーカーは、ターゲットエリア中のテストユーザ110に対する異なるロケーション中にある。スピーカーアレイ130は
図1aおよび
図1bにおいて2次元で示されているが、スピーカーアレイ130は他のロケーションおよび/または次元における(たとえば、3次元に広がる)スピーカーを含むこともできることに留意されたい。いくつかの実施形態では、スピーカーアレイ130中のスピーカーは、各スピーカー150間の9°~10°の間隔で、-66°~+85°の仰角で広がって配置され、完全な球体の周りで方位角の10°ごとで広がる。すなわち、36個の方位角および17個の仰角が、テストユーザ110に関してスピーカー150の合計612個の異なる角度を作成する。いくつかの実施形態では、スピーカーアレイ130の1つまたは複数のスピーカーは、ターゲットエリアに対するそれらの位置を(たとえば、方位角および/または仰角において)動的に変更し得る。上記の説明において、テストユーザ110は静止している(すなわち、ターゲットエリア内の耳の位置は実質的に不変のままである)ことに留意されたい。
【0036】
バイノーラルマイクロフォン140a、140b(「140」と総称される)は、スピーカーアレイ130によって発せられたテスト音をキャプチャする。キャプチャされたテスト音は、オーディオテストデータと呼ばれる。バイノーラルマイクロフォン140は、各々、テストユーザの耳道中に置かれる。図示のように、バイノーラルマイクロフォン140aはユーザの右耳の耳道中に置かれ、マイクロフォン140bはユーザの左耳の耳道中に置かれる。いくつかの実施形態では、マイクロフォン140は、テストユーザ110によって装着されるフォームイヤプラグ中に組み込まれる。
図2に関して以下で詳細に説明されるように、オーディオテストデータは、HRTFのセットを決定するために使用され得る。たとえば、スピーカーアレイ130のスピーカー150によって発せられたテスト音は、オーディオテストデータとしてバイノーラルマイクロフォン140によってキャプチャされる。スピーカー150は、テストユーザ110の耳に対する特定のロケーションを有し、したがって、関連するオーディオテストデータを使用して決定され得る各耳のための特定のHRTFがある。
【0037】
図1Bは、1つまたは複数の実施形態による、ヘッドセットを装着していないテストユーザ110に関連するオーディオテストデータを取得するように構成された
図1AのSMS100の図である。図示の実施形態では、SMS100は、
図1B中のテストユーザ110がヘッドセットを装着していないことを除いて、
図1Aに関して上記で説明された同じやり方でオーディオテストデータを収集する。したがって、収集されたオーディオテストデータは、ヘッドセット140を装着することによって導入されるひずみを含まないテストユーザ110の実際のHRTFを決定するために使用され得る。
【0038】
図2は、1つまたは複数の実施形態による、HRTFシステム200のブロック図である。HRTFシステム200は、オーディオテストデータをキャプチャし、ヘッドセットによって一般的にひずませられるHRTFの部分を決定する。HRTFシステム200は、音測定システム210とシステムコントローラ240とを含む。いくつかの実施形態では、システムコントローラ240の機能の一部または全部がSMS210によって共有されおよび/または実施され得る。
【0039】
SMS210は、ひずみ領域のマッピングを決定するためにHRTFシステム200によって使用されるべきオーディオテストデータをキャプチャする。特に、SMS210は、テストユーザのHRTFを決定するために使用されるオーディオテストデータをキャプチャするために使用される。SMS210は、スピーカーアレイ220とマイクロフォン230とを含む。いくつかの実施形態では、SMS210は、
図1Aおよび
図1Bに関して説明されたSMS100である。キャプチャされたオーディオデータは、HRTFデータストア245に記憶される。
【0040】
スピーカーアレイ220は、システムコントローラ240からの命令に従ってテスト音を発する。スピーカーアレイ130によって送信されたテスト音は、たとえば、チャープ(時間期間の間、周波数が上方または下方へスイープされる信号)、HRTF決定のために使用され得る何らかの他のオーディオ信号、またはそれらの何らかの組合せを含み得る。スピーカーアレイ220は、ターゲットエリア(すなわち、テストユーザが位置するロケーション)に音を投影するために配置される1つまたは複数のスピーカーを備える。いくつかの実施形態では、スピーカーアレイ220は複数のスピーカーを含み、複数のスピーカーの各スピーカーは、ターゲットエリア中のテストユーザに対する異なるロケーション中にある。いくつかの実施形態では、複数のスピーカーのうちの1つまたは複数のスピーカーは、ターゲットエリアに対するそれらの位置を(たとえば、方位角および/または仰角において)動的に変更し得る。いくつかの実施形態では、複数のスピーカーのうちの1つまたは複数のスピーカーは、テストユーザの頭部を回転するようにテストユーザに命令することによって、テストユーザに対するそれらの位置を(たとえば、方位角および/または仰角において)変更し得る。スピーカーアレイ130は、スピーカーアレイ220の一実施形態である。
【0041】
マイクロフォン230は、スピーカーアレイ220によって発せられたテスト音をキャプチャする。キャプチャされたテスト音は、オーディオテストデータと呼ばれる。マイクロフォン230は、各耳道のためのバイノーラルマイクロフォンを含み、追加のマイクロフォンを含み得る。追加のマイクロフォンは、たとえば、耳の周りのエリア中に、ヘッドセットの異なる部分に沿ってなど、置かれ得る。バイノーラルマイクロフォン140は、マイクロフォン230の一実施形態である。
【0042】
システムコントローラ240は、HRTFシステム200の制御構成要素を生成する。システムコントローラ240は、HRTFデータストア245と、HRTFモジュール250と、ひずみ識別モジュール255とを含む。システムコントローラ240のいくつかの実施形態は、本明細書で説明される構成要素以外の他の構成要素を含み得る。同様に、構成要素の機能は、ここで説明されるのと異なって分散され得る。たとえば、いくつかの実施形態では、HRTFモジュール250の機能性の一部または全部は、SMS210の一部であり得る。
【0043】
HRTFデータストア245は、HRTFシステム200に関係するデータを記憶する。HRTFデータストア245は、たとえば、テストユーザに関連するオーディオテストデータ、ヘッドセットを装着しているテストユーザについてのHRTF、ヘッドセットを装着していないテストユーザについてのHRTF、1つまたは複数のテストユーザについてのひずみ領域のセットを含むひずみマッピング、テストユーザの1つまたは複数の母集団のためのひずみ領域のセットを含むひずみマッピング、テストユーザの身体的特性に関連するパラメータ、HRTFシステム200に関係する他のデータ、またはそれらの何らかの組合せを記憶し得る。テストユーザの身体的特性に関連するパラメータは、性別、年齢、身長、耳の幾何学的形状、頭部の幾何学的形状、およびオーディオがユーザによってどのように知覚されるかに影響を及ぼす他の身体的特性を含み得る。
【0044】
HRTFモジュール250は、スピーカーアレイ220のための命令を生成する。命令は、スピーカーアレイ220が、マイクロフォン230においてキャプチャされ得るテスト音を発するようなものである。いくつかの実施形態では、命令は、スピーカーアレイ220の各スピーカーが1つまたは複数のそれぞれのテスト音を再生するようなものである。また、各テスト音は、時間の指定された長さ、指定されたボリューム、指定された開始時間、指定された停止時間、および指定された波形(たとえば、チャープ、周波数トーンなど)のうちの1つまたは複数を有し得る。たとえば、命令は、スピーカーアレイ220の1つまたは複数のスピーカーが、順次、94デシベルの音圧レベル(dB SPL)の音レベルで、48kHzのサンプリング周波数において周波数が200Hzから20kHzに及ぶ、1秒対数正弦スイープ(1-second logarithmic sine sweep)を再生するようなものであり得る。いくつかの実施形態では、スピーカーアレイ220の各スピーカーは、ターゲットエリアに対する異なる位置に関連し、したがって、各スピーカーは、ターゲットエリアに対する特定の方位角および仰角に関連する。いくつかの実施形態では、スピーカーアレイ220の1つまたは複数のスピーカーは、複数の位置に関連し得る。たとえば、1つまたは複数のスピーカーは、ターゲットエリアに対する位置を変更し得る。これらの実施形態では、生成された命令は、スピーカーアレイ220中のスピーカーの一部または全部の動きをも制御し得る。いくつかの実施形態では、スピーカーアレイ220の1つまたは複数のスピーカーは、複数の位置に関連し得る。たとえば、1つまたは複数のスピーカーは、ターゲットユーザの頭部を回転するようにターゲットユーザに命令することによって、テストユーザに対する位置を変更し得る。これらの実施形態では、生成された命令はまた、テストユーザに提示され得る。HRTFモジュール250は、生成された命令をスピーカーアレイ220および/またはSMS210に提供する。
【0045】
HRTFモジュール250は、マイクロフォン230を介してキャプチャされたオーディオテストデータを使用して、テストユーザについてのHRTFを決定する。いくつかの実施形態では、知られている仰角および方位角においてスピーカーアレイ220のスピーカーによって再生される各テスト音について、マイクロフォン230は、(たとえば、マイクロフォン230としてバイノーラルマイクロフォンを使用して)右耳におけるテスト音のオーディオテストデータと左耳におけるオーディオテストデータとをキャプチャする。HRTFモジュール250は、丁重に、右耳HRTFと左耳HRTFとを決定するために、右耳についてのオーディオテストデータと左耳についてのオーディオテストデータとを使用する。右耳HRTFと左耳HRTFとは、スピーカーアレイ220中のそれぞれのスピーカーの異なるロケーションに各々対応する複数の異なる方向(仰角および方位角)について決定される。
【0046】
HRTFの各セットは、特定のテストユーザについてのキャプチャされたオーディオテストデータから算出される。いくつかの実施形態では、オーディオテストデータは頭部インパルス応答(HRIR:head-related impulse response)であり、ここで、テスト音はインパルスである。HRIRは、音源(すなわち、スピーカーアレイ220中の特定のスピーカー)のロケーションをテストユーザの耳道のロケーション(すなわち、マイクロフォン230のロケーション)に関係付ける。HRTFは、各対応するHRIRのフーリエ変換をとることによって決定される。いくつかの実施形態では、HRTFの誤差は、自由場インパルス応答データを使用して緩和される。自由場インパルス応答データは、スピーカーアレイ220およびマイクロフォン230の個々の周波数応答を除去するためにHRIRから畳み込み解除され得る。
【0047】
HRTFは、(たとえば、
図1Aに示されているような)ヘッドセット120を装着しているテストユーザと(たとえば、
図1Bに示されているような)ヘッドセットを装着していないテストユーザの両方に関して、各方向において決定される。たとえば、(
図1Aに示されているような)ヘッドセット120を装着しているテストユーザに関して各仰角および方位角においてHRTFが決定され、次いで、ヘッドセット120が取り外され、(
図1Bに示されているような)ヘッドセット120を装着していないユーザに関して各仰角および方位角においてHRTFが測定される。ヘッドセット120を着けている場合と着けていない場合の両方に関する、各スピーカー方向におけるオーディオテストデータが、テストユーザの母集団(たとえば、数百、数千など)についてキャプチャされ得る。テストユーザの母集団は、異なる年齢、サイズ、性別、毛の長さ、頭部の幾何学的形状、耳の幾何学的形状、HRTFに影響を及ぼすことがある何らかの他のファクタ、またはそれらの何らかの組合せの個人を含み得る。各テストユーザについて、ヘッドセット120を着けている場合の個別化されたHRTFのセットと、ヘッドセット120を着けていない場合の個別化されたHRTFのセットとがある。
【0048】
ひずみ識別モジュール255は、ヘッドセットを装着しているテストユーザのHRTFのセットのうちの1つまたは複数を、ヘッドセットを装着していないテストユーザのHRTFのセットのうちの1つまたは複数と比較する。一実施形態では、比較は、スペクトル差誤差(SDE:spectral difference error)分析を使用するHRTFの2つのセットの評価と、両耳間時間差(ITD:interaural time difference)の不一致を決定することとを伴う。
【0049】
特定のテストユーザについての、ヘッドセットを着けていない場合のHRTFのセットとヘッドセットを着けている場合のHRTFのセットとの間のSDEは、以下の式に基づいて算出される。
【0050】
ここで、Ωは方向角(方位角および仰角)であり、fはテスト音の周波数であり、HRTFWO(Ω,f)は、方向Ωおよび周波数fについての、ヘッドセットを着けていない場合のHRTFであり、HRTFHeadset(Ω,f)は、方向Ωおよび周波数fについての、ヘッドセットを着けている場合のHRTFである。SDEは、特定の周波数および方向において、ヘッドセットを着けている場合および着けていない場合のHRTFの各ペアについて算出される。SDEは、各周波数および方向において両方の耳について算出される。
【0051】
一実施形態では、ITD誤差はまた、右HRIRと左HRIRとの間の相関の結果が最大値に達した時間を決定することによって推定される。各測定されたテストユーザについて、ITD誤差は、各方向についての、ヘッドセットを着けていない場合のHRTFのITDとヘッドセットを着けている場合のHRTFのITDとの間の差の絶対値として算出され得る。
【0052】
いくつかの実施形態では、ヘッドセットを装着しているテストユーザのHRTFのセットとヘッドセットを装着していないテストユーザのHRTFのセットとの比較は、追加の主観的分析を含む。一実施形態では、ヘッドセットを着けている場合と着けていない場合に関してHRTFを測定された各テストユーザは、客観的分析の結果を補強するために、隠れ基準およびアンカーをもつ複数刺激(MUSHRA:Multiple Stimuli with Hidden Reference and Anchor)リスニングテストに参加する。特に、MUSHRAテストは、ヘッドセットを着けていない場合の一般化されたHRTFのセットと、ヘッドセットを着けている場合の一般化されたHRTFのセットと、ヘッドセットを着けていない場合のHRTFのテストユーザの個別化されたセットと、ヘッドセットを着けている場合のHRTFのテストユーザの個別化されたセットとからなり、ヘッドセットを着けていない場合の個別化されたHRTFのセットは、隠れ基準であり、アンカーはない。
【0053】
ひずみ識別モジュール255は、テストユーザの母集団にわたる平均的な比較を決定する。平均的な比較を決定するために、各テストユーザについてのSDE
WO-Headset(Ω,f)が、各周波数および方向においてテストユーザの母集団にわたって平均化され、これは、
によって示される。
【0054】
ここで、Nは、ユーザの母集団中のテストユーザの総数である。代替実施形態では、
は、代替算出によって決定され得る。
【0055】
一実施形態では、決定は、測定された周波数のスパン(たとえば、0~16kHz)にわたって平均化することをさらに含み、これは、
によって示される。SDEは、概して、より高い周波数においてより高くなることがわかる。すなわち、高い周波数では波長がヘッドセットのフォームファクタに対して大きいということにより、ヘッドセットを着けている場合のHRTFはヘッドセットを着けていない場合のHRTFとは、より高い周波数においてより劇的に異なる。SDEがより高い周波数においてより大きいという一般的傾向のために、すべての周波数にわたって平均化することは、ヘッドセットによるひずみがより極端である特定の方位角および仰角の決定を可能にする。
【0056】
テストユーザの母集団にわたる平均的なITD誤差、
が、以下の式に基づいて算出される。
【0057】
ここで、Nは、テストユーザの母集団中のテストユーザの総数であり、
は、ユーザiの方向Ωにおける、ヘッドセットを着けていない場合のHRTFの最大ITDであり、
は、ユーザiの方向Ωにおける、ヘッドセットを着けている場合のHRTFの最大ITDである。
【0058】
ひずみ識別モジュール255は、テストユーザの母集団にわたって一般的にひずませられるHRTFの部分に基づいて1つまたは複数のひずみ領域のセットを識別するひずみマッピングを決定する。
を使用して、ヘッドセットの存在に基づくHRTFのひずみの方向的依存が決定され得る。
の両方は、誤差の大きさが最も大きい特定の方位角および仰角を決定するために2次元でプロットされ得る。一実施形態では、最も大きい誤差をもつ方向は、SDEおよび/またはITDの特定のしきい値によって決定される。最も大きい誤差の決定された方向は、1つまたは複数のひずみ領域のセットである。
【0059】
一例では、しきい値は、4dBのSDEよりも大きい、反対側の方向における高い誤差である。この例では、左HRTFについての
に基づいて、方位角[-80°,-10°]および仰角[-30°,40°]の領域と方位角[-120°,-100°]および仰角[-30°,0°]の領域とが、SDEしきい値を上回る。それにより、これらの領域はひずみ領域であると決定される。
【0060】
別の例では、しきい値は
である。この例では、方位角[-115°,-100°]および仰角[-15°,0°]、方位角[-60°,-30°]および仰角[0°,30°]、方位角[30°,60°]および仰角[0°,30°]、ならびに方位角[100°,-115°]および仰角[-15°,0°]の領域に対応する方向が、ITDしきい値を上回る。それにより、これらの領域はひずみ領域であると決定される。
【0061】
SDEおよびITD分析およびしきい値は、種々のひずみ領域を決定し得る。特に、ITD分析は、SDE分析よりも小さいひずみ領域を生じ得る。異なる実施形態では、SDE分析とITD分析とは、互いから独立して使用されるか、または、一緒に使用され得る。
【0062】
ひずみマッピングはテストユーザの母集団について決定されたHRTFに基づくことに留意されたい。いくつかの実施形態では、母集団は単一のマネキンであり得る。しかし、他の実施形態では、母集団は、異なる身体的特性の大きい断面(cross section)を有する複数のテストユーザを含み得る。いくつかの実施形態では、ひずみマップは、1つまたは複数の一般的な身体的特性(たとえば、年齢、性別、サイズなど)を有する母集団について決定されることに留意されたい。このようにして、ひずみ識別モジュール255は、1つまたは複数の特定の身体的特性に各々インデックス付けされる複数のひずみマッピングを決定し得る。たとえば、あるひずみマッピングは、ひずみ領域の第1のセットを識別する大人に固有であり得、別個のひずみマップは、ひずみ領域の第1のセットとは異なるひずみ領域の第2のセットを識別し得る子供に固有であり得る。
【0063】
HRTFシステム200は、1つまたは複数のヘッドセットおよび/またはコンソールと通信し得る。いくつかの実施形態では、HRTFシステム200は、ヘッドセットおよび/またはコンソールからひずみ領域についてのクエリを受信するように構成される。いくつかの実施形態では、クエリは、ひずみ領域のセットを決定するためにひずみ識別モジュール255によって使用される、ヘッドセットのユーザに関するパラメータを含み得る。たとえば、クエリは、身長、体重、年齢、性別、耳の寸法、および/または装着されているヘッドセットのタイプなど、ユーザに関する特定のパラメータを含み得る。ひずみ識別モジュール255は、ひずみ領域のセットを決定するためにパラメータのうちの1つまたは複数を使用することができる。すなわち、ひずみ識別モジュール255は、同様の特性をもつテストユーザからキャプチャされたオーディオテストデータからひずみ領域のセットを決定するために、ヘッドセットおよび/またはコンソールによって提供されるパラメータを使用する。HRTFサーバ200は、ひずみ領域の決定されたセットを要求元のヘッドセットおよび/またはコンソールに提供する。いくつかの実施形態では、HRTFサーバ200は、(たとえば、ネットワークを介して)ヘッドセットから、情報(たとえば、ユーザに関するパラメータ、個別化されたHRTFのセット、ヘッドセットおよび/またはコンソールからのユーザがヘッドセットを装着している間に測定されるHRTF、あるいはそれらの何らかの組合せ)を受信する。HRTFサーバ200は、1つまたは複数のひずみマッピングを更新するためにこの情報を使用し得る。
【0064】
いくつかの実施形態では、HRTFシステム200は、音測定システム210からリモートにあり、および/または、音測定システム210とは別個であり得る。たとえば、音測定システム210は、ネットワーク(たとえば、ローカルエリアネットワーク、インターネットなど)を介してHRTFシステム200に通信可能に結合され得る。同様に、HRTFシステム200は、
図5および
図8に関して以下でより詳細に説明されるように、ネットワークを介して他の構成要素に接続し得る。
【0065】
図3は、1つまたは複数の実施形態による、ひずみ領域のセットを取得するプロセス300を示すフローチャートである。一実施形態では、プロセス300は、HRTFシステム200によって実施される。他の実施形態では、他のエンティティ(たとえば、サーバ、ヘッドセット、他の接続されたデバイス)がプロセス300のステップの一部または全部を実施し得る。同様に、実施形態は、異なるおよび/または追加のステップを含むか、あるいは異なる順序でステップを実施し得る。
【0066】
HRTFシステム200は、ヘッドセットを装着しているテストユーザについてのHRTFのセットと、ヘッドセットを装着していないテストユーザについてのHRTFのセットとを決定する310。オーディオテストデータは、テストユーザの耳道にあるかまたはその近くにある1つまたは複数のマイクロフォンによってキャプチャされる。オーディオテストデータは、ヘッドセットを装着しているテストユーザとヘッドセットを装着していないユーザの両方に関して、様々な配向から再生されるテスト音についてキャプチャされる。オーディオテストデータは、ヘッドセットを着けている事例とヘッドセットを着けていない事例とについてオーディオテストデータが比較され得るように、ヘッドセットを着けている場合と着けていない場合の両方に関して各配向において収集される。一実施形態では、これは、
図1Aおよび
図1Bに関して上記で説明されたプロセスによって行われる。
【0067】
オーディオテストデータは、オーディオテストデータが測定された1つまたは複数のテストユーザを含むテストユーザの母集団にわたってキャプチャされ得ることに留意されたい。いくつかの実施形態では、テストユーザの母集団は、1人または複数の人々であり得る。1人または複数の人々は、性別、年齢、耳の幾何学的形状、頭部寸法、テストユーザについてのHRTFに影響を及ぼすことがある何らかの他のファクタ、またはそれらの何らかの組合せなど、異なる身体的特性に基づいて、母集団のサブセットにさらに分割され得る。他の実施形態では、テストユーザはマネキン頭部であり得る。いくつかの実施形態では、第1のマネキン頭部は平均的な身体的特性を有し得、他のマネキンは、異なる身体的特性を有し、その身体的特性に基づいて、同様にサブセットに再分割され得る。
【0068】
HRTFシステム200は、ヘッドセットを装着しているテストユーザについてのHRTFのセットと、ヘッドセットを装着していないテストユーザについてのHRTFのセットとを比較する320。一実施形態では、比較320は、
図2のHRTFモジュール250および式(1)に関して前に説明されたように、SDE分析および/またはITDを使用して実施される。比較320は、テストユーザの母集団について繰り返され得る。HRTFのセットと、対応するオーディオテストデータとは、テストユーザの母集団の身体的特性に基づいてグループ化され得る。
【0069】
HRTFシステム200は、テストユーザの母集団にわたって一般的にひずませられるHRTFの部分に基づいてひずみ領域のセットを決定する330。いくつかの実施形態では、テストユーザの母集団は、テストユーザの前に説明された母集団のサブセットである。特に、ひずみ領域は、身体的特性に基づく1つまたは複数のパラメータを満たすテストユーザの総母集団のサブセットであるテストユーザの母集団について決定され得る。一実施形態では、HRTFシステム200は、
図2のひずみ識別モジュール255ならびに式(2)および式(3)に関して前に説明されたように、SDEの平均とITDの平均とを使用して決定する330。
【0070】
HRTFの個別化されたセットを算出するための例示的なシステム
オーディオシステムは、ヘッドセットの影響を補償する個別化されたHRTFのセットを決定するために、HRTFシステムからの情報と、ヘッドセットのユーザがヘッドセットを装着している間に算出されたHRTFとを使用する。オーディオシステムは、ヘッドセットを装着しているユーザについてのオーディオデータを収集する。オーディオシステムは、ヘッドセットを装着しているユーザについてのHRTFを決定し、および/または、HRTF決定のために、別個のシステム(たとえば、HRTFシステムおよび/またはコンソール)にオーディオデータを提供し得る。いくつかの実施形態では、オーディオシステムは、HRTFシステムによって前にキャプチャされたオーディオテストデータに基づいてひずみ領域のセットを要求し、ユーザについてのHRTFの個別化されたセットを決定するためにひずみ領域のセットを使用する。
【0071】
図4Aは、1つまたは複数の実施形態による、外部スピーカー430と生成された仮想空間440とを使用して、ヘッドセット420を装着しているユーザ410に関連するオーディオデータを取得するための例示的な人工現実システム400の図である。人工現実システム400によって取得されたオーディオデータは、ヘッドセット420の存在によってひずませられ、これは、ひずみを補償する、ユーザ410についてのHRTFの個別化されたセットを算出するために、オーディオシステムによって使用される。人工現実システム400は、
図1A~
図3において前に説明されたSMS100、210など、無響室を使用しない、ユーザ410についての個別化されたHRTFの測定を可能にするために、人工現実を使用する。
【0072】
ユーザ410は、
図1Aおよび
図1Bのテストユーザ110とは別の個人である。ユーザ410は、人工現実システム400のエンドユーザである。ユーザ410は、ヘッドセット420によって引き起こされるHRTFのひずみを補償する個別化されたHRTFのセットを作成するために人工現実システム400を使用し得る。ユーザ410は、ヘッドセット420と、マイクロフォン450a、450b(「450」と総称される)のペアとを装着する。ヘッドセット420は、
図7Aおよび
図7Bに関してより詳細に説明されるように、ヘッドセット120と同じタイプ、モデル、または形状であり得る。マイクロフォン450は、
図1Aに関して説明されたようなバイノーラルマイクロフォン140、または
図2に関して説明されたようなマイクロフォン230と同じプロパティを有することができる。特に、マイクロフォン450は、ユーザ410の耳道への入口に位置するかまたはその近くに位置する。
【0073】
外部スピーカー430は、ユーザ410に音(たとえば、テスト音)を送信するように構成されたデバイスである。たとえば、外部スピーカー430は、スマートフォン、タブレット、ラップトップ、デスクトップコンピュータのスピーカー、スマートスピーカー、または音を再生することが可能な任意の他の電子デバイスであり得る。いくつかの実施形態では、外部スピーカー430は、ワイヤレス接続を介してヘッドセット420によって駆動される。他の実施形態では、外部スピーカー430はコンソールによって駆動される。一態様では、外部スピーカー430は、1つの位置において固定され、HRTFを較正するために、マイクロフォン450が受信することができるテスト音を送信する。たとえば、外部スピーカー430は、SMS100、210のスピーカーアレイ130、220によって再生されるものと同じであるテスト音を再生し得る。別の態様では、外部スピーカー430は、ヘッドセット420上に提示される画像に従って、オーディオ特徴づけ構成に基づいてユーザ410が最適に聞くことができる周波数のテスト音を提供する。
【0074】
仮想空間440は、個別化されたHRTFを測定しながらユーザ410の頭部の配向を指示するために人工現実システム400によって生成される。ユーザ410は、ヘッドセット420のディスプレイを通して仮想空間440を観察する。「仮想空間」440という用語は、限定するものではない。いくつかの様々な実施形態では、仮想現実空間440は、仮想現実、拡張現実、複合現実、または人工現実の何らかの他の形態を含み得る。
【0075】
図示の実施形態では、仮想現実空間440はインジケータ460を含む。インジケータ460は、ユーザ410の頭部の配向を指示するためにヘッドセット420のディスプレイ上に提示される。インジケータ460は、光、またはヘッドセット420のディスプレイ上に提示されるマーキングであり得る。ヘッドセット420の位置は、インジケータ460が所望の頭部配向と整合されるかどうかを確認するために、(
図7Aおよび
図7Bにおいて示される)イメージングデバイスおよび/またはIMUを通して追跡され得る。
【0076】
一例では、ユーザ410は、インジケータ460を観察するように促される。たとえば十字線に対するHMD420上に表示されるインジケータ460のロケーションに基づいて、インジケータ460が頭部配向と整合されることを確認した後に、外部スピーカー430はテスト音を生成する。各耳について、対応するマイクロフォン450a、450bが、受信されたテスト音をオーディオデータとしてキャプチャする。
【0077】
マイクロフォン450がオーディオデータを正常にキャプチャした後に、ユーザ410は、それらの配向を、仮想空間440中の異なるロケーションにおける新しいインジケータ470のほうへ向けるように促される。インジケータ460においてオーディオデータをキャプチャするプロセスが、インジケータ470においてオーディオデータをキャプチャするために繰り返される。インジケータ460、470は、ユーザ410の種々の頭部配向におけるHRTFを決定するために使用されるべきオーディオデータをキャプチャするために、仮想空間440中の異なるロケーションにおいて生成される。仮想空間440中の異なるロケーションにおける各インジケータ460、470は、異なる方向(仰角および方位角)におけるHRTFの測定を可能にする。新しいインジケータが生成され、オーディオデータをキャプチャするプロセスが、仮想空間440内の仰角および方位角に十分に及ぶように繰り返される。外部スピーカー430と、ヘッドセット420を介して表示される仮想空間440内のインジケータ460、470の表示との使用は、比較的好都合な測定、ユーザ410についての個別化されたHRTFの測定を可能にする。すなわち、ユーザ410は、無響室の必要なしに、人工現実システム400を用いてユーザ410自身の自宅において、ユーザ410の都合の良いときにこれらのステップを実施することができる。
【0078】
図4Bは、1つまたは複数の実施形態による、整合プロンプト490とインジケータ460とがヘッドセットによって表示され、ユーザの頭部が正しい配向にない、ディスプレイ480の図である。
図4Bに示されているように、ディスプレイ480は、ディスプレイ480の中心上に、またはディスプレイ480の1つまたは複数の所定のピクセルにおいて、整合プロンプト490を提示する。この実施形態では、整合プロンプト490は十字線である。ただし、より一般的には、整合プロンプト490は、ユーザの頭部が、表示されたインジケータ460に対する正しい配向にあるかどうかをユーザに示す任意のテキストおよび/またはグラフィカルインターフェースである。一態様では、整合プロンプト490は現在の頭部配向を反映し、インジケータ460はターゲット頭部配向を反映する。正しい配向は、インジケータ460が整合プロンプト490の中心にあるとき、発生する。
図4Bに示されている例では、インジケータ460は、整合プロンプト490上にではなく、ディスプレイ480の左上コーナーに配置される。したがって、頭部配向は正しい配向にない。その上、インジケータ460と整合プロンプト490とは整合されていないので、ユーザの頭部が適切な配向にないことは、ユーザにとって明らかである。
【0079】
図4Cは、1つまたは複数の実施形態による、ユーザの頭部が正しい配向にある、
図4Bのディスプレイの図である。
図4C上のディスプレイ480は、インジケータ460が現在十字線490上に表示されていることを除いて、
図4Bのディスプレイ480と実質的に同様である。したがって、頭部配向がインジケータ460と適切に整合され、ユーザのHRTFがその頭部配向について測定されると決定される。すなわち、テスト音が、外部スピーカー430によって再生され、マイクロフォン450においてオーディオデータとしてキャプチャされる。オーディオデータに基づいて、HRTFが、現在の配向において各耳について決定される。
図4Bおよび
図4Cに関して説明されたプロセスは、外部スピーカー430に対するユーザ410の頭部の複数の異なる配向について繰り返される。ユーザ410についてのHRTFのセットは、各測定された頭部配向におけるHRTFを含む。
【0080】
図5は、1つまたは複数の実施形態による、ユーザについての個別化されたHRTFを決定するためのシステムのシステム環境500のブロック図である。システム環境500は、外部スピーカー505と、HRTFシステム200と、ネットワーク510と、ヘッドセット515とを備える。外部スピーカー505と、HRTFシステム200と、ヘッドセット515とは、すべて、ネットワーク510を介して接続される。
【0081】
外部スピーカー505は、ユーザに音を送信するように構成されたデバイスである。一実施形態では、外部スピーカー505は、ヘッドセット515からのコマンドに従って動作される。他の実施形態では、外部スピーカー505は外部コンソールによって動作される。外部スピーカー505は、1つの位置において固定され、テスト音を送信する。外部スピーカー505によって送信されたテスト音は、たとえば、一定の周波数における連続正弦波、またはチャープを含む。いくつかの実施形態では、外部スピーカー505は、
図4Aの外部スピーカー430である。
【0082】
ネットワーク510は、ヘッドセット515および/または外部スピーカー505をHRTFシステム200に結合する。ネットワーク510は、追加の構成要素をHRTFシステム200に結合し得る。ネットワーク510は、ワイヤレス通信システムおよび/またはワイヤード通信システムの両方を使用する、ローカルエリアネットワークおよび/またはワイドエリアネットワークの任意の組合せを含み得る。たとえば、ネットワーク510は、インターネット、ならびに携帯電話網を含み得る。一実施形態では、ネットワーク510は、標準通信技術および/またはプロトコルを使用する。したがって、ネットワーク510は、イーサネット、802.11、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセス(WiMAX)、2G/3G/4Gモバイル通信プロトコル、デジタル加入者回線(DSL)、非同期転送モード(ATM)、InfiniBand、PCI Expressアドバンストスイッチングなどの技術を使用するリンクを含み得る。同様に、ネットワーク510上で使用されるネットワーキングプロトコルは、マルチプロトコルラベルスイッチング(MPLS)、伝送制御プロトコル/インターネットプロトコル(TCP/IP)、ユーザデータグラムプロトコル(UDP)、ハイパーテキストトランスポートプロトコル(HTTP)、簡易メール転送プロトコル(SMTP)、ファイル転送プロトコル(FTP)などを含むことができる。ネットワーク510を介して交換されるデータは、2進形式(たとえばポータブルネットワークグラフィックス(PNG))の画像データ、ハイパーテキストマークアップ言語(HTML)、拡張可能マークアップ言語(XML)などを含む、技術および/またはフォーマットを使用して表され得る。さらに、リンクの全部または一部は、セキュアソケットレイヤ(SSL)、トランスポートレイヤセキュリティ(TLS)、仮想プライベートネットワーク(VPN)、インターネットプロトコルセキュリティ(IPsec)など、従来の暗号化技術を使用して暗号化され得る。
【0083】
ヘッドセット515は、ユーザにメディアを提示する。ヘッドセット515によって提示されるメディアの例は、1つまたは複数の画像、ビデオ、オーディオ、またはそれらの任意の組合せを含む。ヘッドセット515は、ディスプレイアセンブリ520とオーディオシステム525とを備える。いくつかの実施形態では、ヘッドセット515は、
図4Aのヘッドセット420である。ヘッドセット515の実施形態の特定の例は、
図7Aおよび
図7Bに関して説明される。
【0084】
ディスプレイアセンブリ520は、ヘッドセット515を装着しているユーザに視覚コンテンツを表示する。特に、ディスプレイアセンブリ520は、ユーザに2Dまたは3D画像またはビデオを表示する。ディスプレイアセンブリ520は、1つまたは複数のディスプレイ要素を使用してコンテンツを表示する。ディスプレイ要素は、たとえば、電子ディスプレイであり得る。様々な実施形態では、ディスプレイアセンブリ520は、単一のディスプレイ要素または複数のディスプレイ要素(たとえば、ユーザの各眼のためのディスプレイ)を備える。ディスプレイ要素の例は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、マイクロ発光ダイオード(μLED)ディスプレイ、有機発光ダイオード(OLED)ディスプレイ、アクティブマトリックス有機発光ダイオードディスプレイ(AMOLED)、導波路ディスプレイ、何らかの他のディスプレイ、またはそれらの何らかの組合せを含む。いくつかの実施形態では、ディスプレイアセンブリ520は、少なくとも部分的に透明である。いくつかの実施形態では、ディスプレイアセンブリ520は、
図4Bおよび
図4Cのディスプレイ480である。
【0085】
オーディオシステム525は、ヘッドセット515を装着しているユーザについての個別化されたHRTFのセットを決定する。一実施形態では、オーディオシステム525は、1つまたは複数のマイクロフォン530およびスピーカーアレイ535、ならびにオーディオコントローラ540を含む、ハードウェアを備える。オーディオシステム525のいくつかの実施形態は、
図5に関して説明されるものとは異なる構成要素を有する。同様に、以下でさらに説明される機能は、ここで説明されるものとは異なる様式でオーディオシステム525の構成要素の間で分散され得る。いくつかの実施形態では、以下で説明される機能のうちのいくつかは、他のエンティティ(たとえば、HRTFシステム200)によって実施され得る。
【0086】
マイクロフォンアセンブリ530は、外部スピーカー505によって発せられたテスト音のオーディオデータをキャプチャする。ある実施形態では、マイクロフォンアセンブリ530は、ユーザの耳道に位置するかまたはその近くに位置する1つまたは複数のマイクロフォン530である。他の実施形態では、マイクロフォンアセンブリ530は、ヘッドセット515から外部にあり、ネットワーク510を介してヘッドセット515によって制御される。マイクロフォンアセンブリ530は、
図4Aのマイクロフォン450のペアであり得る。
【0087】
スピーカーアレイ535は、オーディオコントローラ540からの命令に従ってユーザのためにオーディオを再生する。スピーカーアレイ535によってユーザのために再生されるオーディオは、1つまたは複数のマイクロフォン530によるテスト音オーディオのキャプチャを容易にすることに対する命令を含み得る。スピーカーアレイ535は、外部スピーカー505とは別である。
【0088】
オーディオコントローラ540は、オーディオシステム525の構成要素を制御する。いくつかの実施形態では、オーディオコントローラ540は、外部スピーカー505をも制御し得る。オーディオコントローラ540は、測定モジュール550と、HRTFモジュール555と、ひずみモジュール560と、補間モジュール565とを含む複数のモジュールを含む。代替実施形態では、オーディオコントローラ540のモジュールの一部または全部は、他のエンティティ(たとえば、HRTFシステム200)によって(完全にまたは部分的に)実施され得ることに留意されたい。オーディオコントローラ540は、オーディオシステム525の他の構成要素に結合される。いくつかの実施形態では、オーディオコントローラ540は、通信結合(たとえば、ワイヤードまたはワイヤレス通信結合)を介して、外部スピーカー505またはシステム環境500の他の構成要素にも結合される。オーディオコントローラ540は、マイクロフォンアセンブリ530から取得されたデータまたは他の受信されたデータの初期処理を実施し得る。オーディオコントローラ540は、ヘッドセット515およびシステム環境500中の他の構成要素に受信されたデータを通信する。
【0089】
測定モジュール550は、外部スピーカー505によって再生されたテスト音のオーディオデータのキャプチャを構成する。測定モジュール550は、ヘッドセット525を介して、特定の方向にユーザの頭部を配向するようにとの命令をユーザに提供する。測定モジュール505は、1つまたは複数のテスト音を再生するためにネットワーク510を介して外部スピーカー505に信号を送る。測定モジュール550は、テスト音のオーディオデータをキャプチャするように1つまたは複数のマイクロフォン530に命令する。測定モジュール550は、頭部配向の所定のスパンについてこのプロセスを繰り返す。いくつかの実施形態では、測定モジュール550は、
図4A~
図4Cに関して説明されたプロセスを使用する。
【0090】
一実施形態では、測定モジュール550は、スピーカーアレイ535を使用して、特定の方向にユーザの頭部を配向するようにとの命令をユーザに送る。スピーカーアレイ535は、言葉の命令をもつオーディオ、または特定の頭部配向を示すための他のオーディオを再生し得る。他の実施形態では、測定モジュール550は、ユーザの頭部を配向するための視覚キューをユーザに提供するために、ディスプレイアセンブリ520を使用する。測定モジュール550は、
図4Aの仮想空間440およびインジケータ460など、インジケータをもつ仮想空間を生成し得る。ディスプレイアセンブリ520を介してユーザに提供される視覚キューは、
図480のディスプレイ480上のプロンプト490と同様であり得る。
【0091】
測定モジュール550が、ユーザが所望の頭部配向を有することを確認したとき、測定モジュール550は、テスト音を再生するように外部スピーカー505に命令する。測定モジュール550は、周波数、長さ、タイプ(たとえば、正弦波、チャープなど)など、テスト音の特性を指定する。テスト音をキャプチャするために、測定モジュール550は、オーディオデータを記録するように1つまたは複数のマイクロフォン530に命令する。各マイクロフォンは、各マイクロフォンのそれぞれのロケーションにおいてテスト音のオーディオデータ(たとえば、HRIR)をキャプチャする。
【0092】
測定モジュール550は、複数の方位角および仰角に及ぶ頭部配向の所定のセットについて、上記で説明されたステップを通して反復する。一実施形態では、配向の所定のセットは、
図1Aに関して説明された612個の方向に及ぶ。別の実施形態では、配向の所定のセットは、音測定システム100によって測定される方向のセットのサブセットに及ぶ。測定モジュール550によって実施されるプロセスは、HRTFの個別化されたセットの決定のためのオーディオデータの好都合で比較的容易な測定を可能にする。
【0093】
HRTFモジュール555は、ヘッドセット515を装着しているユーザについての、測定モジュール550によってキャプチャされるオーディオデータについてのHRTFの初期セットを算出する。HRTFモジュール555によって決定されたHRTFの初期セットは、ヘッドセット515の存在によってひずませられる1つまたは複数のHRTFを含む。すなわち、1つまたは複数の特定の方向(たとえば、仰角および方位角の範囲)のHRTFは、ヘッドセットの存在によってひずませられ、したがって、そのHRTFを伴って再生される音は、(たとえば、VR体験の一部として、ユーザがヘッドセットを装着していないという印象をユーザに与えることに対して)ユーザがヘッドセットを装着しているという印象を与える。測定モジュール550がHRIRの形態のオーディオデータをキャプチャする一実施形態では、HRTFモジュール555は、各対応するHRIRのフーリエ変換をとることによってHRTFの初期セットを決定する。いくつかの実施形態では、HRTFの初期セット中の各HRTFは、方向的依存、H(Ω)であり、ここで、Ωは方向である。方向は、仰角θと方位角φとをさらに備え、Ω=(θ,φ)として表される。すなわち、各測定された方向(仰角および方位角)に対応するHRTFが算出される。他の実施形態では、各HRTFは、周波数依存および方向的依存、H(Ω,f)であり、ここで、fは周波数である。
【0094】
いくつかの実施形態では、HRTFモジュール555は、HRTFの初期セットを算出するために、個別化されたHRTFのセットまたはHRTFの一般化されたセットのデータを利用する。データは、いくつかの実施形態では、ヘッドセット515上にプリロードされ得る。他の実施形態では、データは、HRTFシステム200からネットワーク510を介してヘッドセット515によってアクセスされ得る。いくつかの実施形態では、HRTFモジュール555は、
図2のSMS210と実質的に同様のプロセスおよび計算を使用し得る。
【0095】
ひずみモジュール560は、ヘッドセット515の存在によってひずませられた部分を除去し、HRTFの中間セットを作成するために、HRTFモジュール555によって算出されたHRTFの初期セットを修正する。ひずみモジュール560は、ひずみマッピングについてのクエリを生成する。
図2に関して上記で説明されたように、ひずみマッピングは、1つまたは複数のひずみ領域のセットを含む。クエリは、性別、年齢、身長、耳の幾何学的形状、頭部の幾何学的形状など、ユーザの身体的特徴に対応する1つまたは複数のパラメータを含み得る。いくつかの実施形態では、ひずみモジュール560は、クエリをヘッドセットのローカルストレージに送る。他の実施形態では、クエリは、ネットワークを介してHRTFシステム200に送られる。ひずみモジュール560は、1つまたは複数のひずみ領域のセットを識別するひずみマッピングの一部または全部を受信する。いくつかの実施形態では、ひずみマッピングは、クエリ中のパラメータの一部または全部と共通する1つまたは複数の身体的特性を有するテストユーザの母集団に固有であり得る。1つまたは複数のひずみ領域のセットは、ヘッドセットによって一般的にひずませられるHRTFの方向(たとえば、ヘッドセットに対する方位角および仰角)を含む。
【0096】
いくつかの実施形態では、ひずみモジュール560は、1つまたは複数のひずみ領域のセットに対応するHRTFの初期セットの部分を廃棄し、これは、HRTFの中間セットを生じる。いくつかの実施形態では、ひずみモジュール560は、1つまたは複数のひずみ領域のセットの特定の方向(すなわち、方位角および仰角)に対応する方向的依存HRTFの部分を廃棄する。他の実施形態では、ひずみモジュール560は、ひずみ領域のセットの特定の方向および周波数に対応する周波数依存および方向的依存HRTFの部分を廃棄する。
【0097】
たとえば、1つまたは複数のひずみ領域のセットは、方位角[-80°,-10°]および仰角[-30°,40°]の領域と方位角[-120°,-100°]および仰角[-30°,0°]の領域とを備える。これらの領域中に備えられる方向に対応するHRTFの初期セット中のHRTFは、HRTFのセットから除去され、これは、HRTFの中間セットを作成する。たとえば、HRTF H(Ω=(0°,-50°))は、ひずみ領域のうちの1つ内にあり、ひずみモジュール560によってHRTFのセットから除去される。HRTF H(Ω=(0°,50°))は、ひずみ領域のセット中に備えられる方向の外にあり、HRTFの中間セット中に含まれる。ひずみ領域が特定の周波数をさらに備えるとき、同様のプロセスに従う。
【0098】
補間モジュール565は、ヘッドセット515の存在を補償するHRTFの個別化されたセットを生成するために、HRTFの中間セットを使用し得る。補間モジュール565は、中間セットの一部または全部を補間して、補間されたHRTFのセットを生成する。たとえば、補間モジュール565は、廃棄された部分からある角度範囲内にあるHRTFを選択し、補間と選択されたHRTFとを使用して、補間されたHRTFのセットを生成し得る。HRTFの中間セットと組み合わせられた補間されたHRTFのセットは、ヘッドセットひずみを緩和する個別化されたHRTFの完全セットを作り出す。
【0099】
いくつかの実施形態では、ヘッドセットによって引き起こされるひずみを補償するHRTFの生成された個別化されたセットは、記憶される。いくつかの実施形態では、HRTFの生成された個別化されたセットは、ヘッドセットのローカルストレージ上で維持され、ユーザによって将来において使用され得る。他の実施形態では、HRTFの生成された個別化されたセットは、HRTFシステム200にアップロードされる。
【0100】
ヘッドセットによって引き起こされるひずみを補償する個別化されたHRTFのセットを作り出すことは、ユーザの仮想現実体験を改善する。たとえば、ユーザは、ヘッドセット515を装着しており、ビデオベースの仮想現実環境を体験している。ビデオベースの仮想現実環境は、ユーザに、ビデオ品質とオーディオ品質の両方に関して現実が仮想であることを忘れさせることが意図される。ヘッドセット515は、ユーザがヘッドセット515を装着しているという、ユーザへのクエ(視覚および聴覚)を除去することによって、これを行う。ヘッドセット515は、ユーザのHRTFを測定するための容易で好都合なやり方を提供する。しかしながら、ユーザによって装着されているヘッドセット515に関して測定されるHRTFは、ヘッドセット515の存在によって引き起こされる固有のひずみを有する。ひずんだHRTFを使用してオーディオを再生することは、ヘッドセットが装着されているという、ユーザへの聴覚クエを維持し、ヘッドセットがユーザによって装着されていないかのようなものとなるVR体験と整合しない。また、上記で例示されたように、オーディオシステム525は、測定されたHRTFとひずみマッピングとを使用してHRTFの個別化されたセットを生成する。オーディオシステム525は、次いで、オーディオ体験が、ユーザがヘッドセットを装着していないかのようなものであり、それにより、ヘッドセットがユーザによって装着されていないかのようなものとなるVR体験と整合するような様式で、個別化されたHRTFを使用してユーザにオーディオコンテンツを提示することができる。
【0101】
図6は、1つまたは複数の実施形態による、ユーザについての個別化されたHRTFのセットを取得するプロセス600を示すフローチャートである。一実施形態では、プロセス600は、ヘッドセット515によって実施される。他の実施形態では、他のエンティティ(たとえば、外部スピーカー505、またはHTRFサーバ200)がプロセス600のステップの一部または全部を実施し得る。同様に、実施形態は、異なるおよび/または追加のステップを含むか、あるいは異なる順序でステップを実施し得る。
【0102】
ヘッドセット515は、種々の配向におけるテスト音のオーディオデータをキャプチャする610。ヘッドセット515は、ヘッドセット515を装着しながら特定の方向にユーザの頭部を配向するようにユーザに促す。ヘッドセット515は、テスト音を再生するようにスピーカー(たとえば、外部スピーカー505)に命令し、テスト音のオーディオデータは、ユーザの耳道においてまたはその近くで1つまたは複数のマイクロフォン(たとえば、マイクロフォン530)によってキャプチャされる610。キャプチャすること610は、ユーザの複数の異なる頭部配向について繰り返される。
図4A~
図4Cは、オーディオデータのキャプチャ610の一実施形態を示す。
図5の測定モジュール550は、いくつかの実施形態に従って、キャプチャすること610を実施する。
【0103】
ヘッドセット515は、種々の配向におけるオーディオデータに基づいてHRTFのセットを決定する620。いくつかの実施形態では、HRTFモジュール(たとえば、HRTFモジュール555)が、オーディオデータを使用してHRTFのセットを算出する。ヘッドセット515は、ヘッドセットに対する特定のロケーションから発信したオーディオデータを使用してHRTFを算出するための従来の方法を使用し得る。他の実施形態では、ヘッドセットは、HRTFのセットを算出するために、外部デバイス(たとえば、コンソールおよび/またはHRTFシステム)にオーディオデータを提供し得る。
【0104】
ヘッドセット515は、HRTFの中間セットを作成するために、ひずみ領域のセットに対応するHRTFの部分を廃棄する630。ヘッドセット515は、ひずみ領域のセットについてのクエリを生成する。いくつかの実施形態では、ヘッドセット515は、クエリをヘッドセット515のローカルストレージに送る(たとえば、ひずみ領域はプリロードされる)。他の実施形態では、ヘッドセット515は、ネットワーク510を介してHRTFシステム200にクエリを送り、その場合、ひずみ領域は外部システム(たとえばHRTFシステム200)によって決定される。ひずみ領域のセットは、テストユーザの母集団のHRTFに基づいて、またはマネキンに基づいて、決定され得る。クエリに応答して、ヘッドセット515は、ひずみ領域のセットを受信し、ひずみ領域のセット内に備えられる1つまたは複数の方向に対応するHRTFのセットの部分を廃棄する。いくつかの実施形態によれば、
図5のひずみモジュール560が、廃棄すること630を実施する。
【0105】
ヘッドセット515は、HRTFの中間セットのうちの少なくとも一部を使用して、HRTFの個別化されたセットを生成する640。消失した部分は、HRTFの中間セットと、いくつかの実施形態では、ひずみ領域に関連するHRTFのひずみマッピングとに基づいて、補間される。いくつかの実施形態では、
図5の補間モジュール565が、生成すること640を実施する。他の実施形態では、ヘッドセット515が、HRTFの個別化されたセットを生成する640。
【0106】
いくつかの実施形態では、HRTFシステム200は、プロセスのステップのうちの少なくともいくつかを実施する。すなわち、HRTFシステム200は、種々の配向におけるテスト音のオーディオデータをキャプチャする610ようにとの命令を、ヘッドセット515および外部スピーカー505に提供する。HRTFシステム200は、オーディオデータについてのクエリをヘッドセット515に送り、オーディオデータを受信する。HRTFシステム200は、種々の配向におけるオーディオデータに基づいてHRTFのセットを算出し620、HRTFの中間セットを作成するために、ひずみ領域に対応するHRTFの部分を廃棄する630。HRTFシステム200は、HRTFの中間セットのうちの少なくとも一部を使用して、HRTFの個別化されたセットを生成し640、使用のために、HRTFの個別化されたセットをヘッドセット515に提供する。
【0107】
図7Aは、1つまたは複数の実施形態による、アイウェアデバイスとして実装されるヘッドセット700の斜視図である。いくつかの実施形態では、アイウェアデバイスは、ニアアイディスプレイ(NED)である。概して、ヘッドセット700は、コンテンツ(たとえば、メディアコンテンツ)が、
図5のディスプレイアセンブリ520などのディスプレイアセンブリ、および/または
図5のオーディオシステム525などのオーディオシステムを使用して提示されるように、ユーザの顔に装着され得る。しかしながら、ヘッドセット700はまた、メディアコンテンツが異なる様式でユーザに提示されるように使用され得る。ヘッドセット700によって提示されるメディアコンテンツの例は、1つまたは複数の画像、ビデオ、オーディオ、またはそれらの何らかの組合せを含む。ヘッドセット700は、フレームを含み、構成要素の中でも、1つまたは複数のディスプレイ要素720を含むディスプレイアセンブリと、深度カメラアセンブリ(DCA)と、オーディオシステムと、位置センサー790とを含み得る。
図7Aは、ヘッドセット700上の例示的なロケーションにおけるヘッドセット700の構成要素を示すが、構成要素は、ヘッドセット700上の他の場所に、ヘッドセット700とペアリングされた周辺デバイス上に、またはそれらの何らかの組合せに、位置し得る。同様に、
図7Aに示されているものよりも多いまたは少ない構成要素がヘッドセット700上にあり得る。
【0108】
フレーム710は、ヘッドセット700の他の構成要素を保持する。フレーム710は、1つまたは複数のディスプレイ要素720を保持する前面部分と、ユーザの頭部に付けるためのエンドピース(たとえば、テンプル)とを含む。フレーム710の前面部分は、ユーザの鼻の上をまたいでいる。エンドピースの長さは、種々のユーザにフィットするように調整可能(たとえば、調整可能なテンプルの長さ)であり得る。エンドピースはまた、ユーザの耳の後ろ側で湾曲する部分(たとえば、テンプルの先端、イヤピース)を含み得る。
【0109】
1つまたは複数のディスプレイ要素720は、ヘッドセット700を装着しているユーザに光を提供する。1つまたは複数のディスプレイ要素は、
図5のディスプレイアセンブリ520の一部であり得る。図示のように、ヘッドセットは、ユーザの各眼のためのディスプレイ要素720を含む。いくつかの実施形態では、ディスプレイ要素720は、ヘッドセット700のアイボックスに提供される画像光を生成する。アイボックスは、ヘッドセット700を装着している間にユーザの眼が占有する空間中のロケーションである。たとえば、ディスプレイ要素720は導波路ディスプレイであり得る。導波路ディスプレイは、光源(たとえば、2次元ソース、1つまたは複数の線光源、1つまたは複数の点光源など)と、1つまたは複数の導波路とを含む。光源からの光は、1つまたは複数の導波路中に内部結合され(in-coupled)、1つまたは複数の導波路は、ヘッドセット700のアイボックス中に瞳孔の複製があるような様式で光を出力する。1つまたは複数の導波路からの光の内部結合(in-coupling)および/または外部結合(outcoupling)が、1つまたは複数の回折格子を使用して行われ得る。いくつかの実施形態では、導波路ディスプレイは、光源からの光が1つまたは複数の導波路中に内部結合されるときにその光を走査する走査要素(たとえば、導波路、ミラーなど)を含む。いくつかの実施形態では、ディスプレイ要素720の一方または両方が不透明であり、ヘッドセット700の周りのローカルエリアからの光を透過しないことに留意されたい。ローカルエリアは、ヘッドセット700の周囲のエリアである。たとえば、ローカルエリアは、ヘッドセット700を装着しているユーザが中にいる部屋であり得、または、ヘッドセット700を装着しているユーザは外にいることがあり、ローカルエリアは外のエリアである。このコンテキストでは、ヘッドセット700はVRコンテンツを生成する。代替的に、いくつかの実施形態では、ARおよび/またはMRコンテンツを作り出すために、ローカルエリアからの光が1つまたは複数のディスプレイ要素からの光と組み合わせられ得るように、ディスプレイ要素720の一方または両方は少なくとも部分的に透明である。
【0110】
いくつかの実施形態では、ディスプレイ要素720は、画像光を生成せず、代わりに、ローカルエリアからの光をアイボックスに透過するレンズである。たとえば、ディスプレイ要素720の一方または両方は、補正なしのレンズ(非処方)であるか、または、ユーザの視力の欠損を補正するのを助けるための処方レンズ(たとえば、単焦点、二焦点、および三焦点、または累進多焦点(progressive))であり得る。いくつかの実施形態では、ディスプレイ要素720は、太陽からユーザの眼を保護するために、偏光および/または色付けされ得る。
【0111】
いくつかの実施形態では、ディスプレイ要素720は追加の光学ブロック(図示せず)を含み得ることに留意されたい。光学ブロックは、ディスプレイ要素720からの光をアイボックスに向ける1つまたは複数の光学要素(たとえば、レンズ、フレネルレンズなど)を含み得る。光学ブロックは、たとえば、画像コンテンツの一部または全部における収差を補正するか、画像の一部または全部を拡大するか、あるいはそれらの何らかの組合せを行い得る。
【0112】
DCAは、ヘッドセット700の周囲のローカルエリアの一部分についての深度情報を決定する。DCAは、1つまたは複数のイメージングデバイス730と、DCAコントローラ(
図7Aに図示せず)とを含み、照明器740をも含み得る。いくつかの実施形態では、照明器740は、ローカルエリアの一部分を光で照明する。光は、たとえば、赤外線(IR)における構造化光(たとえば、ドットパターン、バーなど)、飛行時間についてのIRフラッシュなどであり得る。いくつかの実施形態では、1つまたは複数のイメージングデバイス730は、照明器740からの光を含むローカルエリアの一部分の画像をキャプチャする。図示のように、
図7Aは、単一の照明器740と2つのイメージングデバイス730とを示す。代替実施形態では、照明器740がなく、少なくとも2つのイメージングデバイス730がある。
【0113】
DCAコントローラは、キャプチャされた画像と1つまたは複数の深度決定技法とを使用して、ローカルエリアの一部分についての深度情報を計算する。深度決定技法は、たとえば、直接飛行時間(ToF)深度検知、間接ToF深度検知、構造化光、パッシブステレオ分析、アクティブステレオ分析(照明器740からの光によってシーンに追加されたテクスチャを使用する)、シーンの深度を決定するための何らかの他の技法、またはそれらの何らかの組合せであり得る。
【0114】
オーディオシステムはオーディオコンテンツを提供する。オーディオシステムは、
図5のオーディオシステム525の一実施形態であり得る。一実施形態では、オーディオシステムは、トランスデューサアレイと、センサーアレイと、オーディオコントローラ750とを含む。ただし、他の実施形態では、オーディオシステムは、異なるおよび/または追加の構成要素を含み得る。同様に、いくつかの場合には、オーディオシステムの構成要素に関して説明される機能性は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コントローラの機能の一部または全部が、HRTFシステム200など、リモートサーバによって実施され得る。
【0115】
トランスデューサアレイは、ユーザに音を提示する。トランスデューサアレイは、複数のトランスデューサを含む。トランスデューサは、スピーカー760または組織トランスデューサ770(たとえば、骨伝導トランスデューサまたは軟骨伝導トランスデューサ)であり得る。スピーカー760はフレーム710の外部に示されているが、スピーカー760はフレーム710に囲まれ得る。いくつかの実施形態では、各耳のための個々のスピーカーの代わりに、ヘッドセット700は、提示されたオーディオコンテンツの方向性を改善するためにフレーム710に一体化された複数のスピーカーを備える、
図5のスピーカーアレイ535などのスピーカーアレイを含む。組織トランスデューサ770は、ユーザの頭部に結合し、ユーザの組織(たとえば、骨または軟骨)を直接振動させて、音を生成する。トランスデューサの数および/またはロケーションは、
図7Aに示されているものとは異なり得る。
【0116】
センサーアレイは、ヘッドセット700のローカルエリア内の音を検出する。センサーアレイは、複数の音響センサー780を含む。音響センサー780は、ローカルエリア(たとえば、部屋)中の1つまたは複数の音源から発せられた音をキャプチャする。各音響センサーは、音を検出し、検出された音を電子フォーマット(アナログまたはデジタル)にコンバートするように構成される。音響センサー780は、音響波センサー、マイクロフォン、音トランスデューサ、または音を検出するのに適した同様のセンサーであり得る。
【0117】
いくつかの実施形態では、1つまたは複数の音響センサー780は、各耳の耳道中に置かれ得る(たとえば、バイノーラルマイクロフォン、または
図5のマイクロフォンアセンブリ530として働く)。いくつかの実施形態では、音響センサー780は、ヘッドセット700の外面上に置かれるか、ヘッドセット700の内面上に置かれるか、ヘッドセット700とは別個(たとえば、何らかの他のデバイスの一部)であるか、またはそれらの何らかの組合せであり得る。音響センサー780の数および/またはロケーションは、
図7Aに示されているものとは異なり得る。たとえば、収集されたオーディオ情報の量ならびにその情報の感度および/または精度を増加させるために、音響検出ロケーションの数が増加され得る。音響検出ロケーションは、マイクロフォンが、ヘッドセット700を装着しているユーザの周囲の広範囲の方向における音を検出することが可能であるように、配向され得る。
【0118】
オーディオコントローラ750は、センサーアレイによって検出された音を表す、センサーアレイからの情報を処理する。オーディオコントローラ750は、プロセッサとコンピュータ可読記憶媒体とを備え得る。オーディオコントローラ750は、到来方向(DOA)推定値を生成するか、音響伝達関数(たとえば、アレイ伝達関数および/または頭部伝達関数)を生成するか、音源のロケーションを追跡するか、音源の方向にビームを形成するか、音源を分類するか、スピーカー760のための音フィルタを生成するか、またはそれらの何らかの組合せを行うように構成され得る。オーディオコントローラ750は、
図5のオーディオコントローラ540の一実施形態である。
【0119】
位置センサー790は、ヘッドセット700の動きに応答して1つまたは複数の測定信号を生成する。位置センサー790は、ヘッドセット700のフレーム710の一部分に位置し得る。位置センサー790は、慣性測定ユニット(IMU)を含み得る。位置センサー790の例は、1つまたは複数の加速度計、1つまたは複数のジャイロスコープ、1つまたは複数の磁力計、動きを検出する別の好適なタイプのセンサー、IMUの誤差補正のために使用されるタイプのセンサー、またはそれらの何らかの組合せを含む。位置センサー790は、IMUの外部に、IMUの内部に、またはそれらの何らかの組合せで位置し得る。
【0120】
いくつかの実施形態では、ヘッドセット700は、ヘッドセット700の位置のための同時位置特定およびマッピング(SLAM)と、ローカルエリアのモデルの更新とを提供し得る。たとえば、ヘッドセット700は、カラー画像データを生成するパッシブカメラアセンブリ(PCA)を含み得る。PCAは、ローカルエリアの一部または全部の画像をキャプチャする1つまたは複数のRGBカメラを含み得る。いくつかの実施形態では、DCAのイメージングデバイス730の一部または全部が、PCAとしても機能し得る。PCAによってキャプチャされた画像と、DCAによって決定された深度情報とは、ローカルエリアのパラメータを決定するか、ローカルエリアのモデルを生成するか、ローカルエリアのモデルを更新するか、またはそれらの何らかの組合せを行うために使用され得る。さらに、位置センサー790は、部屋内のヘッドセット700の位置(たとえば、ロケーションおよび姿勢)を追跡する。ヘッドセット700の構成要素に関する追加の詳細は、
図8に関して以下で説明される。
【0121】
図7Bは、1つまたは複数の実施形態による、HMDとして実装されるヘッドセット705の斜視図である。ARシステムおよび/またはMRシステムについて説明する実施形態では、HMDの前側の部分は、可視帯域(約380nm~750nm)内で少なくとも部分的に透明であり、HMDの前側とユーザの眼との間にあるHMDの部分は、少なくとも部分的に透明である(たとえば、部分的に透明な電子ディスプレイ)。HMDは、前面剛体715とバンド775とを含む。ヘッドセット705は、
図7Aを参照しながら上記で説明された同じ構成要素の多くを含むが、HMDフォームファクタと一体化するように修正される。たとえば、HMDは、ディスプレイアセンブリと、DCAと、オーディオシステム(たとえば、オーディオシステム525の一実施形態)と、位置センサー790とを含む。
図7Bは、照明器740と、複数のスピーカー760と、複数のイメージングデバイス730と、複数の音響センサー780と、位置センサー790とを示す。
【0122】
図8は、1つまたは複数の実施形態による、ヘッドセット515を含むシステム800である。いくつかの実施形態では、ヘッドセット515は、
図7Aのヘッドセット700または
図7Bのヘッドセット705であり得る。システム800は、人工現実環境(たとえば、仮想現実環境、拡張現実環境、混合現実環境、またはそれらの何らかの組合せ)において動作し得る。
図8によって示されているシステム800は、ヘッドセット515と、コンソール815に結合された入出力(I/O)インターフェース810と、ネットワーク510と、HRTFシステム200とを含む。
図8は、1つのヘッドセット515と1つのI/Oインターフェース810とを含む例示的なシステム800を示しているが、他の実施形態では、任意の数のこれらの構成要素が、システム800中に含まれ得る。たとえば、各々が、関連するI/Oインターフェース810を有する、複数のヘッドセットがあり得、各ヘッドセットおよびI/Oインターフェース810はコンソール815と通信する。代替構成では、異なるおよび/または追加の構成要素が、システム800中に含まれ得る。さらに、
図8に示されている構成要素のうちの1つまたは複数に関して説明される機能性は、いくつかの実施形態では、
図8に関して説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コンソール815の機能性の一部または全部がヘッドセット515によって提供され得る。
【0123】
ヘッドセット515は、ディスプレイアセンブリ520と、オーディオシステム525と、光学ブロック835と、1つまたは複数の位置センサー840と、深度カメラアセンブリ(DCA)845とを含む。ヘッドセット515のいくつかの実施形態は、
図8に関して説明されるものとは異なる構成要素を有する。さらに、
図8に関して説明される様々な構成要素によって提供される機能性は、他の実施形態ではヘッドセット515の構成要素の間で別様に分散されるか、またはヘッドセット515からリモートにある別個のアセンブリにおいて取り込まれ得る。
【0124】
一実施形態では、ディスプレイアセンブリ520は、コンソール815から受信されたデータに従ってユーザにコンテンツを表示する。ディスプレイアセンブリ520は、1つまたは複数のディスプレイ要素(たとえば、ディスプレイ要素720)を使用してコンテンツを表示する。ディスプレイ要素は、たとえば、電子ディスプレイであり得る。様々な実施形態では、ディスプレイアセンブリ520は、単一のディスプレイ要素または複数のディスプレイ要素(たとえば、ユーザの各眼のためのディスプレイ)を備える。電子ディスプレイの例は、液晶ディスプレイ(LCD)、有機発光ダイオード(OLED)ディスプレイ、アクティブマトリックス有機発光ダイオードディスプレイ(AMOLED)、導波路ディスプレイ、何らかの他のディスプレイ、またはそれらの何らかの組合せを含む。いくつかの実施形態では、ディスプレイ要素720は光学ブロック835の機能性の一部または全部をも含み得ることに留意されたい。
【0125】
光学ブロック835は、電子ディスプレイから受光された画像光を拡大し、画像光に関連する光学誤差を補正し、補正された画像光をヘッドセット515の一方または両方のアイボックスに提示する。様々な実施形態では、光学ブロック835は、1つまたは複数の光学要素を含む。光学ブロック835中に含まれる例示的な光学要素は、アパーチャ、フレネルレンズ、凸レンズ、凹レンズ、フィルタ、反射面、または画像光に影響を及ぼす任意の他の好適な光学要素を含む。その上、光学ブロック835は、異なる光学要素の組合せを含み得る。いくつかの実施形態では、光学ブロック835中の光学要素のうちの1つまたは複数は、部分反射コーティングまたは反射防止コーティングなど、1つまたは複数のコーティングを有し得る。
【0126】
光学ブロック835による画像光の拡大および集束は、電子ディスプレイが、物理的により小さくなり、重さが減じ、より大きいディスプレイよりも少ない電力を消費することを可能にする。さらに、拡大は、電子ディスプレイによって提示されるコンテンツの視野を増加させ得る。たとえば、表示されるコンテンツの視野は、表示されるコンテンツが、ユーザの視野のほとんどすべて(たとえば、対角約110度)、およびいくつかの場合にはすべてを使用して提示されるようなものである。さらに、いくつかの実施形態では、拡大の量は、光学要素を追加することまたは取り外すことによって調整され得る。
【0127】
いくつかの実施形態では、光学ブロック835は、1つまたは複数のタイプの光学誤差を補正するように設計され得る。光学誤差の例は、たる形ひずみまたは糸巻き形ひずみ、縦色収差、あるいは横色収差を含む。他のタイプの光学誤差は、球面収差、色収差、またはレンズ像面湾曲による誤差、非点収差、または任意の他のタイプの光学誤差をさらに含み得る。いくつかの実施形態では、表示のために電子ディスプレイに提供されるコンテンツは予歪され、光学ブロック835が、そのコンテンツに基づいて生成された画像光を電子ディスプレイから受光したとき、光学ブロック835はそのひずみを補正する。
【0128】
位置センサー840は、ヘッドセット515の位置を示すデータを生成する電子デバイスである。位置センサー840は、ヘッドセット515の動きに応答して1つまたは複数の測定信号を生成する。位置センサー790は、位置センサー840の一実施形態である。位置センサー840の例は、1つまたは複数のIMU、1つまたは複数の加速度計、1つまたは複数のジャイロスコープ、1つまたは複数の磁力計、動きを検出する別の好適なタイプのセンサー、またはそれらの何らかの組合せを含む。位置センサー840は、並進運動(前/後、上/下、左/右)を測定するための複数の加速度計と、回転運動(たとえば、ピッチ、ヨー、ロール)を測定するための複数のジャイロスコープとを含み得る。いくつかの実施形態では、IMUは、測定信号を迅速にサンプリングし、サンプリングされたデータからヘッドセット515の推定位置を算出する。たとえば、IMUは、加速度計から受信された測定信号を経時的に積分して速度ベクトルを推定し、その速度ベクトルを経時的に積分して、ヘッドセット515上の基準点の推定位置を決定する。基準点は、ヘッドセット515の位置を表すために使用され得る点である。基準点は、概して空間中の点として定義され得るが、実際には、基準点は、ヘッドセット515内の点として定義される。
【0129】
DCA845は、ローカルエリアの一部分についての深度情報を生成する。DCAは、1つまたは複数のイメージングデバイスとDCAコントローラとを含む。DCA845は照明器をも含み得る。DCA845の動作および構造は、
図7Aに関して上記で説明された。
【0130】
オーディオシステム525は、ヘッドセット515のユーザにオーディオコンテンツを提供する。オーディオシステム525は、1つまたは音響センサーと、1つまたは複数のトランスデューサと、オーディオコントローラ540とを備え得る。オーディオシステム525は、空間化されたオーディオコンテンツをユーザに提供し得る。いくつかの実施形態では、オーディオシステム525は、ネットワーク510を介してHRTFシステム200にひずみマッピングを要求し得る。
図5および
図6に関して上記で説明されたように、オーディオシステムは、テスト音を発するように外部スピーカー505に命令し、マイクロフォンアセンブリを使用してテスト音のオーディオデータをキャプチャする。オーディオシステム525は、ヘッドセット515の種々の配向におけるテスト音のオーディオデータに少なくとも部分的に基づいて、初期HRTFのセットを算出する。オーディオシステム525は、HRTFの中間セットを作成するために初期HRTFのセットの(HRTFサーバによって決定されたひずみ領域のうちの少なくともいくつかに部分的に基づく)一部分を廃棄する。HRTFの中間セットは、HRTFのセットのうちの廃棄されていないHRTFから形成される。オーディオシステム525は、セットの廃棄される部分に対応する1つまたは複数のHRTFを(たとえば、補間を介して)生成し、その1つまたは複数のHRTFは、ユーザについての個別化されたHRTFのセットを作成するために、HRTFの中間セットのうちの少なくとも一部と組み合わせられる。個別化されたHRTFのセットは、ヘッドセット525を装着することによって引き起こされるHRTFの誤差が緩和されるようにユーザに対してカスタマイズされ、それにより、ヘッドセットを着けていないユーザの実際のHRTFを模倣する。オーディオシステム525は、個別化されたHRTFを使用して1つまたは複数の音フィルタを生成し、音フィルタを使用して、空間化されたオーディオコンテンツをユーザに提供し得る。
【0131】
I/Oインターフェース810は、ユーザがアクション要求を送り、コンソール815から応答を受信することを可能にするデバイスである。アクション要求は、特定のアクションを実施するための要求である。たとえば、アクション要求は、画像データまたはビデオデータのキャプチャを開始または終了するための命令、あるいはアプリケーション内で特定のアクションを実施するための命令であり得る。I/Oインターフェース810は、1つまたは複数の入力デバイスを含み得る。例示的な入力デバイスは、キーボード、マウス、ゲームコントローラ、またはアクション要求を受信し、そのアクション要求をコンソール815に通信するための任意の他の好適なデバイスを含む。I/Oインターフェース810によって受信されたアクション要求は、コンソール815に通信され、コンソール815は、そのアクション要求に対応するアクションを実施する。いくつかの実施形態では、I/Oインターフェース810は、I/Oインターフェース810の初期位置に対するI/Oインターフェース810の推定位置を示す較正データをキャプチャするIMUを含む。いくつかの実施形態では、I/Oインターフェース810は、コンソール815から受信された命令に従って、ユーザに触覚フィードバックを提供し得る。たとえば、アクション要求が受信されたときに触覚フィードバックが提供されるか、または、コンソール815がアクションを実施するときに、コンソール815が、I/Oインターフェース810に命令を通信して、I/Oインターフェース810が触覚フィードバックを生成することを引き起こす。
【0132】
コンソール815は、DCA845とヘッドセット515とI/Oインターフェース810とのうちの1つまたは複数から受信された情報に従って処理するためのコンテンツをヘッドセット515に提供する。
図8に示されている例では、コンソール815は、外部スピーカー505と、アプリケーションストア855と、追跡モジュール860と、エンジン865とを含む。コンソール815のいくつかの実施形態は、
図8に関して説明されるものとは異なるモジュールまたは構成要素を有する。特に、外部スピーカー505は、いくつかの実施形態ではコンソール815から独立している。同様に、以下でさらに説明される機能は、
図8に関して説明されるものとは異なる様式でコンソール815の構成要素の間で分散され得る。いくつかの実施形態では、コンソール815に関して本明細書で説明される機能性は、ヘッドセット515、またはリモートシステムにおいて実装され得る。
【0133】
外部スピーカー505は、オーディオシステム525からの命令に応答してテスト音を再生する。他の実施形態では、外部スピーカー505は、コンソール815から、特に、以下でより詳細に説明されるようにエンジン865から、命令を受信する。
【0134】
アプリケーションストア855は、コンソール815が実行するための1つまたは複数のアプリケーションを記憶する。アプリケーションは、プロセッサによって実行されたとき、ユーザへの提示のためのコンテンツを生成する命令のグループである。アプリケーションによって生成されたコンテンツは、ヘッドセット515またはI/Oインターフェース810の移動を介してユーザから受信された入力に応答したものであり得る。アプリケーションの例は、ゲームアプリケーション、会議アプリケーション、ビデオ再生アプリケーション、または他の好適なアプリケーションを含む。
【0135】
追跡モジュール860は、DCA845からの情報、1つまたは複数の位置センサー840からの情報、またはそれらの何らかの組合せを使用して、ヘッドセット515またはI/Oインターフェース810の移動を追跡する。たとえば、追跡モジュール860は、ヘッドセット515からの情報に基づいて、ローカルエリアのマッピングにおいてヘッドセット515の基準点の位置を決定する。追跡モジュール860は、オブジェクトまたは仮想オブジェクトの位置をも決定し得る。さらに、いくつかの実施形態では、追跡モジュール860は、ヘッドセット515の将来のロケーションを予測するために、位置センサー840からのヘッドセット515の位置を示すデータの部分ならびにDCA845からのローカルエリアの表現を使用し得る。追跡モジュール860は、ヘッドセット515またはI/Oインターフェース810の推定または予測された将来の位置をエンジン865に提供する。
【0136】
エンジン865は、アプリケーションを実行し、追跡モジュール860から、ヘッドセット515の位置情報、加速度情報、速度情報、予測された将来の位置、またはそれらの何らかの組合せを受信する。受信された情報に基づいて、エンジン865は、ユーザへの提示のためにヘッドセット515に提供すべきコンテンツを決定する。たとえば、受信された情報が、ユーザが左を見ていることを示す場合、エンジン865は、仮想ローカルエリアにおいて、またはローカルエリアを追加のコンテンツで拡張するローカルエリアにおいて、ユーザの移動をミラーリングする、ヘッドセット515のためのコンテンツを生成する。さらに、いくつかの実施形態では、ユーザがユーザの頭部を特定の配向に配置したことを示す受信された情報に応答して、エンジン865は、テスト音を再生するようにとの命令を外部スピーカー505に提供する。さらに、エンジン865は、I/Oインターフェース810から受信されたアクション要求に応答して、コンソール815上で実行しているアプリケーション内でアクションを実施し、そのアクションが実施されたというフィードバックをユーザに提供する。提供されるフィードバックは、ヘッドセット515を介した視覚または可聴フィードバック、あるいはI/Oインターフェース810を介した触覚フィードバックであり得る。
【0137】
ネットワーク510は、ヘッドセット515および/またはコンソール815をHRTFシステム200に結合する。ネットワーク510は、追加のまたはより少数の構成要素をHRTFシステム510に結合し得る。ネットワーク510は、
図5に関してさらに詳細に説明された。
【0138】
追加の構成情報
【0139】
本開示の実施形態の上記の説明は、説明の目的で提示されており、網羅的であること、または開示される正確な形態に本開示を限定することは意図されない。当業者は、上記の開示に照らして多くの修正および変形が可能であることを諒解することができる。
【0140】
本明細書のいくつかの部分は、情報に関する動作のアルゴリズムおよび記号表現に関して本開示の実施形態について説明する。これらのアルゴリズム説明および表現は、データ処理技術分野の当業者が、他の当業者に自身の仕事の本質を効果的に伝えるために通常使用される。これらの動作は、機能的に、計算量的に、または論理的に説明されるが、コンピュータプログラムまたは等価な電気回路、マイクロコードなどによって実装されることが理解される。さらに、一般性の喪失なしに、動作のこれらの仕組みをモジュールと呼ぶことが時々好都合であることも証明された。説明される動作およびそれらの関連するモジュールは、ソフトウェア、ファームウェア、ハードウェア、またはそれらの任意の組合せにおいて具現され得る。
【0141】
本明細書で説明されるステップ、動作、またはプロセスのいずれも、1つまたは複数のハードウェアまたはソフトウェアモジュールで、単独でまたは他のデバイスとの組合せで実施または実装され得る。一実施形態では、ソフトウェアモジュールは、コンピュータプログラムコードを含んでいるコンピュータ可読媒体を備えるコンピュータプログラム製品で実装され、コンピュータプログラムコードは、説明されるステップ、動作、またはプロセスのいずれかまたはすべてを実施するためにコンピュータプロセッサによって実行され得る。
【0142】
本開示の実施形態はまた、本明細書の動作を実施するための装置に関し得る。この装置は、必要とされる目的のために特別に構築され得、および/あるいは、この装置は、コンピュータに記憶されたコンピュータプログラムによって選択的にアクティブ化または再構成される汎用コンピューティングデバイスを備え得る。そのようなコンピュータプログラムは、非一時的有形コンピュータ可読記憶媒体、または電子命令を記憶するのに好適な任意のタイプの媒体に記憶され得、それらの媒体はコンピュータシステムバスに結合され得る。さらに、本明細書で言及される任意のコンピューティングシステムは、単一のプロセッサを含み得るか、または増加された計算能力のために複数のプロセッサ設計を採用するアーキテクチャであり得る。
【0143】
本開示の実施形態はまた、本明細書で説明されるコンピューティングプロセスによって製造される製品に関し得る。そのような製品は、コンピューティングプロセスから生じる情報を備え得、その情報は、非一時的有形コンピュータ可読記憶媒体に記憶され、本明細書で説明されるコンピュータプログラム製品または他のデータ組合せの任意の実施形態を含み得る。
【0144】
最終的に、本明細書において使用される言い回しは、主に読みやすさおよび教育目的で選択されており、本明細書において使用される言い回しは、本発明の主題を定めるかまたは制限するように選択されていないことがある。したがって、本開示の範囲はこの詳細な説明によって限定されるのではなく、むしろ、本明細書に基づく出願に関して生じる請求項によって限定されることが意図される。したがって、実施形態の開示は、以下の特許請求の範囲に記載される本開示の範囲を例示するものであり、限定するものではない。
【国際調査報告】